KR20230002681A - 대형 아데노바이러스 페이로드의 통합 - Google Patents
대형 아데노바이러스 페이로드의 통합 Download PDFInfo
- Publication number
- KR20230002681A KR20230002681A KR1020227039575A KR20227039575A KR20230002681A KR 20230002681 A KR20230002681 A KR 20230002681A KR 1020227039575 A KR1020227039575 A KR 1020227039575A KR 20227039575 A KR20227039575 A KR 20227039575A KR 20230002681 A KR20230002681 A KR 20230002681A
- Authority
- KR
- South Korea
- Prior art keywords
- lcr
- genome
- transposon
- payload
- cell
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000010354 integration Effects 0.000 title claims description 73
- 241000701161 unidentified adenovirus Species 0.000 title claims description 48
- 239000013598 vector Substances 0.000 claims abstract description 153
- 108090000623 proteins and genes Proteins 0.000 claims description 265
- 210000004027 cell Anatomy 0.000 claims description 208
- 230000014509 gene expression Effects 0.000 claims description 156
- 150000007523 nucleic acids Chemical group 0.000 claims description 104
- 102000004169 proteins and genes Human genes 0.000 claims description 99
- 238000000034 method Methods 0.000 claims description 87
- 102100021519 Hemoglobin subunit beta Human genes 0.000 claims description 67
- 108091005904 Hemoglobin subunit beta Proteins 0.000 claims description 65
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 claims description 54
- 239000003795 chemical substances by application Substances 0.000 claims description 53
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 51
- 102000039446 nucleic acids Human genes 0.000 claims description 50
- 108020004707 nucleic acids Proteins 0.000 claims description 50
- 240000007019 Oxalis corniculata Species 0.000 claims description 49
- 230000001225 therapeutic effect Effects 0.000 claims description 46
- 108020004414 DNA Proteins 0.000 claims description 43
- 102000018120 Recombinases Human genes 0.000 claims description 33
- 108010091086 Recombinases Proteins 0.000 claims description 33
- 201000010099 disease Diseases 0.000 claims description 29
- 102000008579 Transposases Human genes 0.000 claims description 24
- 108010020764 Transposases Proteins 0.000 claims description 24
- 101000961414 Homo sapiens Membrane cofactor protein Proteins 0.000 claims description 19
- 102100039373 Membrane cofactor protein Human genes 0.000 claims description 19
- 238000004519 manufacturing process Methods 0.000 claims description 19
- 230000001965 increasing effect Effects 0.000 claims description 16
- 101150042248 Mgmt gene Proteins 0.000 claims description 14
- 208000024891 symptom Diseases 0.000 claims description 13
- 210000000234 capsid Anatomy 0.000 claims description 12
- 108060003196 globin Proteins 0.000 claims description 12
- 238000004806 packaging method and process Methods 0.000 claims description 12
- 208000002903 Thalassemia Diseases 0.000 claims description 10
- 230000000925 erythroid effect Effects 0.000 claims description 10
- 210000003958 hematopoietic stem cell Anatomy 0.000 claims description 10
- DLGOEMSEDOSKAD-UHFFFAOYSA-N Carmustine Chemical compound ClCCNC(=O)N(N=O)CCCl DLGOEMSEDOSKAD-UHFFFAOYSA-N 0.000 claims description 9
- 108010038853 gamma-Globins Proteins 0.000 claims description 9
- 102000053602 DNA Human genes 0.000 claims description 8
- 108010054218 Factor VIII Proteins 0.000 claims description 8
- 102000001690 Factor VIII Human genes 0.000 claims description 8
- 102000018146 globin Human genes 0.000 claims description 8
- 241000894007 species Species 0.000 claims description 8
- 108010017080 Granulocyte Colony-Stimulating Factor Proteins 0.000 claims description 5
- 239000000556 agonist Substances 0.000 claims description 5
- 229960000301 factor viii Drugs 0.000 claims description 5
- 230000005945 translocation Effects 0.000 claims description 5
- 102100028989 C-X-C chemokine receptor type 2 Human genes 0.000 claims description 4
- 108010018951 Interleukin-8B Receptors Proteins 0.000 claims description 4
- 239000002576 chemokine receptor CXCR4 antagonist Substances 0.000 claims description 4
- 229940121384 cxc chemokine receptor type 4 (cxcr4) antagonist Drugs 0.000 claims description 4
- 208000031220 Hemophilia Diseases 0.000 claims description 3
- 208000009292 Hemophilia A Diseases 0.000 claims description 3
- 238000002955 isolation Methods 0.000 claims description 3
- 230000001131 transforming effect Effects 0.000 claims description 3
- 101001069913 Bos taurus Growth-regulated protein homolog beta Proteins 0.000 claims description 2
- 102100039398 C-X-C motif chemokine 2 Human genes 0.000 claims description 2
- 108010046276 FLP recombinase Proteins 0.000 claims description 2
- 229960002169 plerixafor Drugs 0.000 claims description 2
- YIQPUIGJQJDJOS-UHFFFAOYSA-N plerixafor Chemical group C=1C=C(CN2CCNCCCNCCNCCC2)C=CC=1CN1CCCNCCNCCCNCC1 YIQPUIGJQJDJOS-UHFFFAOYSA-N 0.000 claims description 2
- 102000004269 Granulocyte Colony-Stimulating Factor Human genes 0.000 claims 2
- 238000001415 gene therapy Methods 0.000 abstract description 32
- 108091026890 Coding region Proteins 0.000 description 124
- 230000027455 binding Effects 0.000 description 117
- 239000002773 nucleotide Substances 0.000 description 94
- 125000003729 nucleotide group Chemical group 0.000 description 94
- 241000282414 Homo sapiens Species 0.000 description 90
- 235000018102 proteins Nutrition 0.000 description 76
- 239000012634 fragment Substances 0.000 description 71
- 108010019670 Chimeric Antigen Receptors Proteins 0.000 description 68
- 235000001014 amino acid Nutrition 0.000 description 68
- 108091008874 T cell receptors Proteins 0.000 description 66
- 102000016266 T-Cell Antigen Receptors Human genes 0.000 description 66
- 150000001413 amino acids Chemical class 0.000 description 56
- 206010020751 Hypersensitivity Diseases 0.000 description 53
- 229940024606 amino acid Drugs 0.000 description 50
- 238000011144 upstream manufacturing Methods 0.000 description 46
- 230000000694 effects Effects 0.000 description 41
- 102100027685 Hemoglobin subunit alpha Human genes 0.000 description 40
- 108091005886 Hemoglobin subunit gamma Proteins 0.000 description 39
- 241000699670 Mus sp. Species 0.000 description 39
- 210000001744 T-lymphocyte Anatomy 0.000 description 39
- -1 ABLI Proteins 0.000 description 38
- 102100038617 Hemoglobin subunit gamma-2 Human genes 0.000 description 38
- 210000003743 erythrocyte Anatomy 0.000 description 38
- 230000000875 corresponding effect Effects 0.000 description 37
- 125000005647 linker group Chemical group 0.000 description 37
- 239000000427 antigen Substances 0.000 description 33
- 102000036639 antigens Human genes 0.000 description 33
- 108091007433 antigens Proteins 0.000 description 33
- 238000001727 in vivo Methods 0.000 description 32
- 101000934346 Homo sapiens T-cell surface antigen CD2 Proteins 0.000 description 31
- 108010019476 Immunoglobulin Heavy Chains Proteins 0.000 description 31
- 102100025237 T-cell surface antigen CD2 Human genes 0.000 description 31
- 239000004055 small Interfering RNA Substances 0.000 description 31
- 238000011282 treatment Methods 0.000 description 31
- 102100029361 Aromatase Human genes 0.000 description 30
- 108090000765 processed proteins & peptides Proteins 0.000 description 30
- 206010028980 Neoplasm Diseases 0.000 description 29
- 125000003275 alpha amino acid group Chemical group 0.000 description 29
- 238000010586 diagram Methods 0.000 description 29
- 239000000203 mixture Substances 0.000 description 29
- 101000716102 Homo sapiens T-cell surface glycoprotein CD4 Proteins 0.000 description 28
- 108020004459 Small interfering RNA Proteins 0.000 description 28
- 102100038803 Somatotropin Human genes 0.000 description 28
- 102100036011 T-cell surface glycoprotein CD4 Human genes 0.000 description 28
- 108700019146 Transgenes Proteins 0.000 description 28
- 230000001105 regulatory effect Effects 0.000 description 28
- 239000013603 viral vector Substances 0.000 description 28
- 101710169336 5'-deoxyadenosine deaminase Proteins 0.000 description 27
- 102000055025 Adenosine deaminases Human genes 0.000 description 27
- 102100033421 Keratin, type I cytoskeletal 18 Human genes 0.000 description 27
- 108010066327 Keratin-18 Proteins 0.000 description 27
- 210000000349 chromosome Anatomy 0.000 description 27
- 102000004196 processed proteins & peptides Human genes 0.000 description 27
- 102000005962 receptors Human genes 0.000 description 27
- 238000006467 substitution reaction Methods 0.000 description 27
- 102220605874 Cytosolic arginine sensor for mTORC1 subunit 2_D10A_mutation Human genes 0.000 description 26
- 101710163270 Nuclease Proteins 0.000 description 26
- 210000003719 b-lymphocyte Anatomy 0.000 description 26
- 230000000295 complement effect Effects 0.000 description 26
- 108020003175 receptors Proteins 0.000 description 26
- 102100036912 Desmin Human genes 0.000 description 25
- 108010044052 Desmin Proteins 0.000 description 25
- 102000006496 Immunoglobulin Heavy Chains Human genes 0.000 description 25
- 210000005045 desmin Anatomy 0.000 description 25
- 208000035475 disorder Diseases 0.000 description 25
- 108010078554 Aromatase Proteins 0.000 description 24
- 102000004127 Cytokines Human genes 0.000 description 24
- 108090000695 Cytokines Proteins 0.000 description 24
- 239000002771 cell marker Substances 0.000 description 24
- 239000013612 plasmid Substances 0.000 description 24
- 229920001184 polypeptide Polymers 0.000 description 23
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 22
- 108010051696 Growth Hormone Proteins 0.000 description 22
- 241000725303 Human immunodeficiency virus Species 0.000 description 22
- 201000011510 cancer Diseases 0.000 description 22
- 210000004369 blood Anatomy 0.000 description 21
- 239000008280 blood Substances 0.000 description 21
- 239000012636 effector Substances 0.000 description 21
- 239000000122 growth hormone Substances 0.000 description 21
- 238000010361 transduction Methods 0.000 description 21
- 230000026683 transduction Effects 0.000 description 21
- 102100029470 Apolipoprotein E Human genes 0.000 description 20
- 101710095339 Apolipoprotein E Proteins 0.000 description 20
- 108091033409 CRISPR Proteins 0.000 description 20
- 108091005902 Hemoglobin subunit alpha Proteins 0.000 description 20
- 101001009007 Homo sapiens Hemoglobin subunit alpha Proteins 0.000 description 20
- 102000005604 Myosin Heavy Chains Human genes 0.000 description 20
- 102000010175 Opsin Human genes 0.000 description 20
- 108050001704 Opsin Proteins 0.000 description 20
- 108010051583 Ventricular Myosins Proteins 0.000 description 20
- 239000000049 pigment Substances 0.000 description 20
- 125000006850 spacer group Chemical group 0.000 description 20
- 230000000007 visual effect Effects 0.000 description 20
- 102100040202 Apolipoprotein B-100 Human genes 0.000 description 18
- 102000004407 Lactalbumin Human genes 0.000 description 18
- 108090000942 Lactalbumin Proteins 0.000 description 18
- 102100025825 Methylated-DNA-protein-cysteine methyltransferase Human genes 0.000 description 18
- 102100024952 Protein CBFA2T1 Human genes 0.000 description 18
- 102100021487 Protein S100-B Human genes 0.000 description 18
- 210000001185 bone marrow Anatomy 0.000 description 18
- 108040008770 methylated-DNA-[protein]-cysteine S-methyltransferase activity proteins Proteins 0.000 description 18
- 235000021241 α-lactalbumin Nutrition 0.000 description 18
- 238000003780 insertion Methods 0.000 description 17
- 230000037431 insertion Effects 0.000 description 17
- 230000003834 intracellular effect Effects 0.000 description 17
- 102100028967 HLA class I histocompatibility antigen, alpha chain G Human genes 0.000 description 16
- 108010091938 HLA-B7 Antigen Proteins 0.000 description 16
- 102000043129 MHC class I family Human genes 0.000 description 16
- 108091054437 MHC class I family Proteins 0.000 description 16
- ZWJKVFAYPLPCQB-UNQGMJICSA-N Phe-Arg-Thr Chemical group C[C@@H](O)[C@H](NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)Cc1ccccc1)C(O)=O ZWJKVFAYPLPCQB-UNQGMJICSA-N 0.000 description 16
- 238000012217 deletion Methods 0.000 description 16
- 230000037430 deletion Effects 0.000 description 16
- 108020004999 messenger RNA Proteins 0.000 description 16
- 102000040430 polynucleotide Human genes 0.000 description 16
- 108091033319 polynucleotide Proteins 0.000 description 16
- 239000002157 polynucleotide Substances 0.000 description 16
- 239000000047 product Substances 0.000 description 16
- 230000003612 virological effect Effects 0.000 description 16
- 241000699666 Mus <mouse, genus> Species 0.000 description 15
- 238000012228 RNA interference-mediated gene silencing Methods 0.000 description 15
- 230000006870 function Effects 0.000 description 15
- 230000009368 gene silencing by RNA Effects 0.000 description 15
- 230000035772 mutation Effects 0.000 description 15
- 239000003814 drug Substances 0.000 description 14
- 241000700605 Viruses Species 0.000 description 13
- 230000004068 intracellular signaling Effects 0.000 description 13
- 230000004044 response Effects 0.000 description 13
- 101710095342 Apolipoprotein B Proteins 0.000 description 12
- 102000052575 Proto-Oncogene Human genes 0.000 description 12
- 108700020978 Proto-Oncogene Proteins 0.000 description 12
- 102100029215 Signaling lymphocytic activation molecule Human genes 0.000 description 12
- 108091027967 Small hairpin RNA Proteins 0.000 description 12
- 230000001086 cytosolic effect Effects 0.000 description 12
- 230000003993 interaction Effects 0.000 description 12
- 229920000642 polymer Polymers 0.000 description 12
- 230000011664 signaling Effects 0.000 description 12
- 238000002560 therapeutic procedure Methods 0.000 description 12
- 108060003951 Immunoglobulin Proteins 0.000 description 11
- 241001465754 Metazoa Species 0.000 description 11
- 230000004913 activation Effects 0.000 description 11
- 230000001413 cellular effect Effects 0.000 description 11
- 238000003776 cleavage reaction Methods 0.000 description 11
- 230000001419 dependent effect Effects 0.000 description 11
- 210000003917 human chromosome Anatomy 0.000 description 11
- 102000018358 immunoglobulin Human genes 0.000 description 11
- 230000007017 scission Effects 0.000 description 11
- 239000000126 substance Substances 0.000 description 11
- 210000001519 tissue Anatomy 0.000 description 11
- 108091032955 Bacterial small RNA Proteins 0.000 description 10
- 108020005004 Guide RNA Proteins 0.000 description 10
- 210000004185 liver Anatomy 0.000 description 10
- 210000000952 spleen Anatomy 0.000 description 10
- 230000008685 targeting Effects 0.000 description 10
- 230000035897 transcription Effects 0.000 description 10
- 238000013518 transcription Methods 0.000 description 10
- 108091079001 CRISPR RNA Proteins 0.000 description 9
- 108010008532 Deoxyribonuclease I Proteins 0.000 description 9
- 102000007260 Deoxyribonuclease I Human genes 0.000 description 9
- 102000004190 Enzymes Human genes 0.000 description 9
- 108090000790 Enzymes Proteins 0.000 description 9
- 102100030378 Hemoglobin subunit theta-1 Human genes 0.000 description 9
- 102000043280 Hemoglobin, zeta Human genes 0.000 description 9
- 108010054147 Hemoglobins Proteins 0.000 description 9
- 102000001554 Hemoglobins Human genes 0.000 description 9
- 101000843063 Homo sapiens Hemoglobin subunit theta-1 Proteins 0.000 description 9
- 101000843058 Homo sapiens Hemoglobin subunit zeta Proteins 0.000 description 9
- 102100032816 Integrin alpha-6 Human genes 0.000 description 9
- 108091081021 Sense strand Proteins 0.000 description 9
- 230000000692 anti-sense effect Effects 0.000 description 9
- 229940124597 therapeutic agent Drugs 0.000 description 9
- 102000040650 (ribonucleotides)n+m Human genes 0.000 description 8
- 101100118093 Drosophila melanogaster eEF1alpha2 gene Proteins 0.000 description 8
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 8
- 101100166144 Staphylococcus aureus cas9 gene Proteins 0.000 description 8
- 208000015181 infectious disease Diseases 0.000 description 8
- 210000000265 leukocyte Anatomy 0.000 description 8
- 210000004698 lymphocyte Anatomy 0.000 description 8
- 230000002829 reductive effect Effects 0.000 description 8
- 102100021809 Chorionic somatomammotropin hormone 1 Human genes 0.000 description 7
- 101001078158 Homo sapiens Integrin alpha-1 Proteins 0.000 description 7
- 101000994375 Homo sapiens Integrin alpha-4 Proteins 0.000 description 7
- 101000935040 Homo sapiens Integrin beta-2 Proteins 0.000 description 7
- 101000598987 Homo sapiens Medium-wave-sensitive opsin 1 Proteins 0.000 description 7
- 101000633786 Homo sapiens SLAM family member 6 Proteins 0.000 description 7
- 102100025323 Integrin alpha-1 Human genes 0.000 description 7
- 102100032818 Integrin alpha-4 Human genes 0.000 description 7
- 102100025390 Integrin beta-2 Human genes 0.000 description 7
- 102100037812 Medium-wave-sensitive opsin 1 Human genes 0.000 description 7
- 108010016790 RNA-Induced Silencing Complex Proteins 0.000 description 7
- 102000000574 RNA-Induced Silencing Complex Human genes 0.000 description 7
- 102100029197 SLAM family member 6 Human genes 0.000 description 7
- 102100028785 Tumor necrosis factor receptor superfamily member 14 Human genes 0.000 description 7
- 238000004458 analytical method Methods 0.000 description 7
- 210000000601 blood cell Anatomy 0.000 description 7
- 230000015271 coagulation Effects 0.000 description 7
- 238000005345 coagulation Methods 0.000 description 7
- 230000007423 decrease Effects 0.000 description 7
- 230000005782 double-strand break Effects 0.000 description 7
- 238000000684 flow cytometry Methods 0.000 description 7
- 102000037865 fusion proteins Human genes 0.000 description 7
- 108020001507 fusion proteins Proteins 0.000 description 7
- 239000000546 pharmaceutical excipient Substances 0.000 description 7
- 208000030507 AIDS Diseases 0.000 description 6
- 108010079649 APOBEC-1 Deaminase Proteins 0.000 description 6
- 102100040397 C->U-editing enzyme APOBEC-1 Human genes 0.000 description 6
- 102100031633 Chorionic somatomammotropin hormone-like 1 Human genes 0.000 description 6
- 101710118951 Chorionic somatomammotropin hormone-like 1 Proteins 0.000 description 6
- 108010047041 Complementarity Determining Regions Proteins 0.000 description 6
- 102100036717 Growth hormone variant Human genes 0.000 description 6
- 101710191157 Growth hormone variant Proteins 0.000 description 6
- 101000889953 Homo sapiens Apolipoprotein B-100 Proteins 0.000 description 6
- 101000919395 Homo sapiens Aromatase Proteins 0.000 description 6
- 101000895818 Homo sapiens Chorionic somatomammotropin hormone 1 Proteins 0.000 description 6
- 101000994365 Homo sapiens Integrin alpha-6 Proteins 0.000 description 6
- 101001046687 Homo sapiens Integrin alpha-E Proteins 0.000 description 6
- 101000971538 Homo sapiens Killer cell lectin-like receptor subfamily F member 1 Proteins 0.000 description 6
- 101000633780 Homo sapiens Signaling lymphocytic activation molecule Proteins 0.000 description 6
- 102100022341 Integrin alpha-E Human genes 0.000 description 6
- 102100021458 Killer cell lectin-like receptor subfamily F member 1 Human genes 0.000 description 6
- 102100038082 Natural killer cell receptor 2B4 Human genes 0.000 description 6
- 102100027744 Semaphorin-4D Human genes 0.000 description 6
- 108010074687 Signaling Lymphocytic Activation Molecule Family Member 1 Proteins 0.000 description 6
- 108050007673 Somatotropin Proteins 0.000 description 6
- 125000000539 amino acid group Chemical group 0.000 description 6
- 230000015572 biosynthetic process Effects 0.000 description 6
- 210000004899 c-terminal region Anatomy 0.000 description 6
- 150000001875 compounds Chemical class 0.000 description 6
- 238000009472 formulation Methods 0.000 description 6
- 230000002068 genetic effect Effects 0.000 description 6
- 238000004128 high performance liquid chromatography Methods 0.000 description 6
- 238000000338 in vitro Methods 0.000 description 6
- 239000003112 inhibitor Substances 0.000 description 6
- 230000000977 initiatory effect Effects 0.000 description 6
- 239000003446 ligand Substances 0.000 description 6
- 239000003550 marker Substances 0.000 description 6
- 239000000463 material Substances 0.000 description 6
- 230000001404 mediated effect Effects 0.000 description 6
- 102100027207 CD27 antigen Human genes 0.000 description 5
- 206010053138 Congenital aplastic anaemia Diseases 0.000 description 5
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 5
- 201000004939 Fanconi anemia Diseases 0.000 description 5
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 5
- 101000914511 Homo sapiens CD27 antigen Proteins 0.000 description 5
- 101000935043 Homo sapiens Integrin beta-1 Proteins 0.000 description 5
- 101000598981 Homo sapiens Medium-wave-sensitive opsin 2 Proteins 0.000 description 5
- 101000598986 Homo sapiens Medium-wave-sensitive opsin 3 Proteins 0.000 description 5
- 102100025304 Integrin beta-1 Human genes 0.000 description 5
- 108010064548 Lymphocyte Function-Associated Antigen-1 Proteins 0.000 description 5
- 102100037817 Medium-wave-sensitive opsin 2 Human genes 0.000 description 5
- 102100037816 Medium-wave-sensitive opsin 3 Human genes 0.000 description 5
- 208000002678 Mucopolysaccharidoses Diseases 0.000 description 5
- 108010079855 Peptide Aptamers Proteins 0.000 description 5
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 5
- 108091028113 Trans-activating crRNA Proteins 0.000 description 5
- 108091023040 Transcription factor Proteins 0.000 description 5
- 102000040945 Transcription factor Human genes 0.000 description 5
- 230000003321 amplification Effects 0.000 description 5
- 238000002869 basic local alignment search tool Methods 0.000 description 5
- 230000015556 catabolic process Effects 0.000 description 5
- 238000012937 correction Methods 0.000 description 5
- 238000006731 degradation reaction Methods 0.000 description 5
- 238000011161 development Methods 0.000 description 5
- 230000018109 developmental process Effects 0.000 description 5
- 230000004069 differentiation Effects 0.000 description 5
- 239000003937 drug carrier Substances 0.000 description 5
- 230000002209 hydrophobic effect Effects 0.000 description 5
- 210000000987 immune system Anatomy 0.000 description 5
- 230000001939 inductive effect Effects 0.000 description 5
- 239000004615 ingredient Substances 0.000 description 5
- 239000002523 lectin Substances 0.000 description 5
- 230000004048 modification Effects 0.000 description 5
- 238000012986 modification Methods 0.000 description 5
- 206010028093 mucopolysaccharidosis Diseases 0.000 description 5
- 238000003199 nucleic acid amplification method Methods 0.000 description 5
- 239000008194 pharmaceutical composition Substances 0.000 description 5
- 210000001995 reticulocyte Anatomy 0.000 description 5
- 238000010186 staining Methods 0.000 description 5
- 230000002103 transcriptional effect Effects 0.000 description 5
- NFGXHKASABOEEW-UHFFFAOYSA-N 1-methylethyl 11-methoxy-3,7,11-trimethyl-2,4-dodecadienoate Chemical compound COC(C)(C)CCCC(C)CC=CC(C)=CC(=O)OC(C)C NFGXHKASABOEEW-UHFFFAOYSA-N 0.000 description 4
- QTBSBXVTEAMEQO-UHFFFAOYSA-N Acetic acid Chemical compound CC(O)=O QTBSBXVTEAMEQO-UHFFFAOYSA-N 0.000 description 4
- 102100024222 B-lymphocyte antigen CD19 Human genes 0.000 description 4
- 108010074708 B7-H1 Antigen Proteins 0.000 description 4
- 241000894006 Bacteria Species 0.000 description 4
- 101150013553 CD40 gene Proteins 0.000 description 4
- 108010062802 CD66 antigens Proteins 0.000 description 4
- 108020001738 DNA Glycosylase Proteins 0.000 description 4
- 102000028381 DNA glycosylase Human genes 0.000 description 4
- 230000004543 DNA replication Effects 0.000 description 4
- 239000004471 Glycine Substances 0.000 description 4
- WZUVPPKBWHMQCE-UHFFFAOYSA-N Haematoxylin Chemical compound C12=CC(O)=C(O)C=C2CC2(O)C1C1=CC=C(O)C(O)=C1OC2 WZUVPPKBWHMQCE-UHFFFAOYSA-N 0.000 description 4
- 101000980825 Homo sapiens B-lymphocyte antigen CD19 Proteins 0.000 description 4
- 101000899111 Homo sapiens Hemoglobin subunit beta Proteins 0.000 description 4
- 101001035237 Homo sapiens Integrin alpha-D Proteins 0.000 description 4
- 101001043809 Homo sapiens Interleukin-7 receptor subunit alpha Proteins 0.000 description 4
- 101001109501 Homo sapiens NKG2-D type II integral membrane protein Proteins 0.000 description 4
- 102100039904 Integrin alpha-D Human genes 0.000 description 4
- 102100022338 Integrin alpha-M Human genes 0.000 description 4
- 102100022297 Integrin alpha-X Human genes 0.000 description 4
- 102100034170 Interferon-induced, double-stranded RNA-activated protein kinase Human genes 0.000 description 4
- 101710089751 Interferon-induced, double-stranded RNA-activated protein kinase Proteins 0.000 description 4
- 102100021593 Interleukin-7 receptor subunit alpha Human genes 0.000 description 4
- 108091092195 Intron Proteins 0.000 description 4
- XEEYBQQBJWHFJM-UHFFFAOYSA-N Iron Chemical compound [Fe] XEEYBQQBJWHFJM-UHFFFAOYSA-N 0.000 description 4
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 4
- 108010061593 Member 14 Tumor Necrosis Factor Receptors Proteins 0.000 description 4
- 101000989934 Mus musculus Hemoglobin subunit alpha Proteins 0.000 description 4
- 102100022680 NKG2-D type II integral membrane protein Human genes 0.000 description 4
- 102100024216 Programmed cell death 1 ligand 1 Human genes 0.000 description 4
- 102000014128 RANK Ligand Human genes 0.000 description 4
- 108010025832 RANK Ligand Proteins 0.000 description 4
- 206010037742 Rabies Diseases 0.000 description 4
- 108010083644 Ribonucleases Proteins 0.000 description 4
- 102000006382 Ribonucleases Human genes 0.000 description 4
- 102100027208 T-cell antigen CD7 Human genes 0.000 description 4
- 102100022153 Tumor necrosis factor receptor superfamily member 4 Human genes 0.000 description 4
- 102100040245 Tumor necrosis factor receptor superfamily member 5 Human genes 0.000 description 4
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 4
- 230000009471 action Effects 0.000 description 4
- 229960003767 alanine Drugs 0.000 description 4
- 235000004279 alanine Nutrition 0.000 description 4
- 208000026935 allergic disease Diseases 0.000 description 4
- 230000000735 allogeneic effect Effects 0.000 description 4
- 229950001537 amatuximab Drugs 0.000 description 4
- 229960003852 atezolizumab Drugs 0.000 description 4
- 229950002916 avelumab Drugs 0.000 description 4
- 230000009286 beneficial effect Effects 0.000 description 4
- 230000008901 benefit Effects 0.000 description 4
- UCMIRNVEIXFBKS-UHFFFAOYSA-N beta-alanine Chemical compound NCCC(O)=O UCMIRNVEIXFBKS-UHFFFAOYSA-N 0.000 description 4
- 230000002759 chromosomal effect Effects 0.000 description 4
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 4
- 238000009826 distribution Methods 0.000 description 4
- 229940079593 drug Drugs 0.000 description 4
- 239000003623 enhancer Substances 0.000 description 4
- 230000010437 erythropoiesis Effects 0.000 description 4
- 230000001738 genotoxic effect Effects 0.000 description 4
- 229960002449 glycine Drugs 0.000 description 4
- 230000036541 health Effects 0.000 description 4
- 230000011132 hemopoiesis Effects 0.000 description 4
- 230000009610 hypersensitivity Effects 0.000 description 4
- 230000036039 immunity Effects 0.000 description 4
- 230000001976 improved effect Effects 0.000 description 4
- 125000002496 methyl group Chemical group [H]C([H])([H])* 0.000 description 4
- 210000005087 mononuclear cell Anatomy 0.000 description 4
- 230000008707 rearrangement Effects 0.000 description 4
- 230000001177 retroviral effect Effects 0.000 description 4
- 208000011580 syndromic disease Diseases 0.000 description 4
- 238000003786 synthesis reaction Methods 0.000 description 4
- 238000013519 translation Methods 0.000 description 4
- 238000002054 transplantation Methods 0.000 description 4
- NOIRDLRUNWIUMX-UHFFFAOYSA-N 2-amino-3,7-dihydropurin-6-one;6-amino-1h-pyrimidin-2-one Chemical compound NC=1C=CNC(=O)N=1.O=C1NC(N)=NC2=C1NC=N2 NOIRDLRUNWIUMX-UHFFFAOYSA-N 0.000 description 3
- 108020005345 3' Untranslated Regions Proteins 0.000 description 3
- FFKUHGONCHRHPE-UHFFFAOYSA-N 5-methyl-1h-pyrimidine-2,4-dione;7h-purin-6-amine Chemical compound CC1=CNC(=O)NC1=O.NC1=NC=NC2=C1NC=N2 FFKUHGONCHRHPE-UHFFFAOYSA-N 0.000 description 3
- SLXKOJJOQWFEFD-UHFFFAOYSA-N 6-aminohexanoic acid Chemical compound NCCCCCC(O)=O SLXKOJJOQWFEFD-UHFFFAOYSA-N 0.000 description 3
- 102000015081 Blood Coagulation Factors Human genes 0.000 description 3
- 108010039209 Blood Coagulation Factors Proteins 0.000 description 3
- 108010056102 CD100 antigen Proteins 0.000 description 3
- 108010017009 CD11b Antigen Proteins 0.000 description 3
- 102100024263 CD160 antigen Human genes 0.000 description 3
- 102100038077 CD226 antigen Human genes 0.000 description 3
- 102100027217 CD82 antigen Human genes 0.000 description 3
- 101710139831 CD82 antigen Proteins 0.000 description 3
- 101150069031 CSN2 gene Proteins 0.000 description 3
- 102100024533 Carcinoembryonic antigen-related cell adhesion molecule 1 Human genes 0.000 description 3
- 102000014914 Carrier Proteins Human genes 0.000 description 3
- 102100022641 Coagulation factor IX Human genes 0.000 description 3
- 108010031325 Cytidine deaminase Proteins 0.000 description 3
- 230000008265 DNA repair mechanism Effects 0.000 description 3
- 230000004568 DNA-binding Effects 0.000 description 3
- 102100025137 Early activation antigen CD69 Human genes 0.000 description 3
- 108010076282 Factor IX Proteins 0.000 description 3
- 102000018233 Fibroblast Growth Factor Human genes 0.000 description 3
- 108050007372 Fibroblast Growth Factor Proteins 0.000 description 3
- 102100039619 Granulocyte colony-stimulating factor Human genes 0.000 description 3
- 102100031573 Hematopoietic progenitor cell antigen CD34 Human genes 0.000 description 3
- 241000282412 Homo Species 0.000 description 3
- 101000761938 Homo sapiens CD160 antigen Proteins 0.000 description 3
- 101000884298 Homo sapiens CD226 antigen Proteins 0.000 description 3
- 101000934374 Homo sapiens Early activation antigen CD69 Proteins 0.000 description 3
- 101000777663 Homo sapiens Hematopoietic progenitor cell antigen CD34 Proteins 0.000 description 3
- 101001046683 Homo sapiens Integrin alpha-L Proteins 0.000 description 3
- 101001046668 Homo sapiens Integrin alpha-X Proteins 0.000 description 3
- 101001015037 Homo sapiens Integrin beta-7 Proteins 0.000 description 3
- 101001109503 Homo sapiens NKG2-C type II integral membrane protein Proteins 0.000 description 3
- 101000589305 Homo sapiens Natural cytotoxicity triggering receptor 2 Proteins 0.000 description 3
- 101000873418 Homo sapiens P-selectin glycoprotein ligand 1 Proteins 0.000 description 3
- 101000692259 Homo sapiens Phosphoprotein associated with glycosphingolipid-enriched microdomains 1 Proteins 0.000 description 3
- 101001012157 Homo sapiens Receptor tyrosine-protein kinase erbB-2 Proteins 0.000 description 3
- 101000633778 Homo sapiens SLAM family member 5 Proteins 0.000 description 3
- 101000633784 Homo sapiens SLAM family member 7 Proteins 0.000 description 3
- 101000946860 Homo sapiens T-cell surface glycoprotein CD3 epsilon chain Proteins 0.000 description 3
- 101000934341 Homo sapiens T-cell surface glycoprotein CD5 Proteins 0.000 description 3
- 101000596234 Homo sapiens T-cell surface protein tactile Proteins 0.000 description 3
- 101000795169 Homo sapiens Tumor necrosis factor receptor superfamily member 13C Proteins 0.000 description 3
- 101000648507 Homo sapiens Tumor necrosis factor receptor superfamily member 14 Proteins 0.000 description 3
- 101000801234 Homo sapiens Tumor necrosis factor receptor superfamily member 18 Proteins 0.000 description 3
- 101000679857 Homo sapiens Tumor necrosis factor receptor superfamily member 3 Proteins 0.000 description 3
- 102100034349 Integrase Human genes 0.000 description 3
- 102100022339 Integrin alpha-L Human genes 0.000 description 3
- 108010041100 Integrin alpha6 Proteins 0.000 description 3
- 108010030465 Integrin alpha6beta1 Proteins 0.000 description 3
- 102100033016 Integrin beta-7 Human genes 0.000 description 3
- 108010064593 Intercellular Adhesion Molecule-1 Proteins 0.000 description 3
- 102100037877 Intercellular adhesion molecule 1 Human genes 0.000 description 3
- 208000015439 Lysosomal storage disease Diseases 0.000 description 3
- 102000003735 Mesothelin Human genes 0.000 description 3
- 108090000015 Mesothelin Proteins 0.000 description 3
- 101100494762 Mus musculus Nedd9 gene Proteins 0.000 description 3
- 102100038895 Myc proto-oncogene protein Human genes 0.000 description 3
- 102100022683 NKG2-C type II integral membrane protein Human genes 0.000 description 3
- 108010004217 Natural Cytotoxicity Triggering Receptor 1 Proteins 0.000 description 3
- 108010004222 Natural Cytotoxicity Triggering Receptor 3 Proteins 0.000 description 3
- 102100032870 Natural cytotoxicity triggering receptor 1 Human genes 0.000 description 3
- 102100032851 Natural cytotoxicity triggering receptor 2 Human genes 0.000 description 3
- 102100032852 Natural cytotoxicity triggering receptor 3 Human genes 0.000 description 3
- 101710141230 Natural killer cell receptor 2B4 Proteins 0.000 description 3
- 102100034925 P-selectin glycoprotein ligand 1 Human genes 0.000 description 3
- 102100026066 Phosphoprotein associated with glycosphingolipid-enriched microdomains 1 Human genes 0.000 description 3
- DNIAPMSPPWPWGF-UHFFFAOYSA-N Propylene glycol Chemical compound CC(O)CO DNIAPMSPPWPWGF-UHFFFAOYSA-N 0.000 description 3
- 102100030086 Receptor tyrosine-protein kinase erbB-2 Human genes 0.000 description 3
- 102100029216 SLAM family member 5 Human genes 0.000 description 3
- 102100029198 SLAM family member 7 Human genes 0.000 description 3
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 3
- 208000012827 T-B+ severe combined immunodeficiency due to gamma chain deficiency Diseases 0.000 description 3
- 102100035794 T-cell surface glycoprotein CD3 epsilon chain Human genes 0.000 description 3
- 102100025244 T-cell surface glycoprotein CD5 Human genes 0.000 description 3
- 102100035268 T-cell surface protein tactile Human genes 0.000 description 3
- 102100040247 Tumor necrosis factor Human genes 0.000 description 3
- 102100029690 Tumor necrosis factor receptor superfamily member 13C Human genes 0.000 description 3
- 102100033728 Tumor necrosis factor receptor superfamily member 18 Human genes 0.000 description 3
- 102100033733 Tumor necrosis factor receptor superfamily member 1B Human genes 0.000 description 3
- 101710187830 Tumor necrosis factor receptor superfamily member 1B Proteins 0.000 description 3
- 102100022156 Tumor necrosis factor receptor superfamily member 3 Human genes 0.000 description 3
- 101710165473 Tumor necrosis factor receptor superfamily member 4 Proteins 0.000 description 3
- 108091023045 Untranslated Region Proteins 0.000 description 3
- 108010073929 Vascular Endothelial Growth Factor A Proteins 0.000 description 3
- 102000005789 Vascular Endothelial Growth Factors Human genes 0.000 description 3
- 108010019530 Vascular Endothelial Growth Factors Proteins 0.000 description 3
- 108020005202 Viral DNA Proteins 0.000 description 3
- 201000007146 X-linked severe combined immunodeficiency Diseases 0.000 description 3
- 108010017070 Zinc Finger Nucleases Proteins 0.000 description 3
- 239000002253 acid Substances 0.000 description 3
- 238000013459 approach Methods 0.000 description 3
- 108091008324 binding proteins Proteins 0.000 description 3
- 239000003114 blood coagulation factor Substances 0.000 description 3
- 238000010322 bone marrow transplantation Methods 0.000 description 3
- 239000000872 buffer Substances 0.000 description 3
- 239000000969 carrier Substances 0.000 description 3
- 210000000170 cell membrane Anatomy 0.000 description 3
- 230000036755 cellular response Effects 0.000 description 3
- 229940105774 coagulation factor ix Drugs 0.000 description 3
- 229940105778 coagulation factor viii Drugs 0.000 description 3
- 238000002648 combination therapy Methods 0.000 description 3
- 101150055601 cops2 gene Proteins 0.000 description 3
- 229940126864 fibroblast growth factor Drugs 0.000 description 3
- 238000013467 fragmentation Methods 0.000 description 3
- 238000006062 fragmentation reaction Methods 0.000 description 3
- 230000004927 fusion Effects 0.000 description 3
- 230000030279 gene silencing Effects 0.000 description 3
- 231100000024 genotoxic Toxicity 0.000 description 3
- 102000006602 glyceraldehyde-3-phosphate dehydrogenase Human genes 0.000 description 3
- 108020004445 glyceraldehyde-3-phosphate dehydrogenase Proteins 0.000 description 3
- 210000002865 immune cell Anatomy 0.000 description 3
- 230000028993 immune response Effects 0.000 description 3
- 239000012678 infectious agent Substances 0.000 description 3
- 206010022000 influenza Diseases 0.000 description 3
- 239000007788 liquid Substances 0.000 description 3
- 230000007774 longterm Effects 0.000 description 3
- 210000004962 mammalian cell Anatomy 0.000 description 3
- 238000005259 measurement Methods 0.000 description 3
- 230000007246 mechanism Effects 0.000 description 3
- 239000012528 membrane Substances 0.000 description 3
- 210000000440 neutrophil Anatomy 0.000 description 3
- 210000000056 organ Anatomy 0.000 description 3
- 230000002093 peripheral effect Effects 0.000 description 3
- 238000002823 phage display Methods 0.000 description 3
- 150000004713 phosphodiesters Chemical class 0.000 description 3
- 125000004437 phosphorous atom Chemical group 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 102000027426 receptor tyrosine kinases Human genes 0.000 description 3
- 108091008598 receptor tyrosine kinases Proteins 0.000 description 3
- 230000002441 reversible effect Effects 0.000 description 3
- 229960001153 serine Drugs 0.000 description 3
- 208000007056 sickle cell anemia Diseases 0.000 description 3
- 238000007619 statistical method Methods 0.000 description 3
- 210000000130 stem cell Anatomy 0.000 description 3
- 230000004936 stimulating effect Effects 0.000 description 3
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 3
- MTCFGRXMJLQNBG-REOHCLBHSA-N (2S)-2-Amino-3-hydroxypropansäure Chemical compound OC[C@H](N)C(O)=O MTCFGRXMJLQNBG-REOHCLBHSA-N 0.000 description 2
- VBICKXHEKHSIBG-UHFFFAOYSA-N 1-monostearoylglycerol Chemical compound CCCCCCCCCCCCCCCCCC(=O)OCC(O)CO VBICKXHEKHSIBG-UHFFFAOYSA-N 0.000 description 2
- 239000013607 AAV vector Substances 0.000 description 2
- 108010052875 Adenine deaminase Proteins 0.000 description 2
- GUBGYTABKSRVRQ-XLOQQCSPSA-N Alpha-Lactose Chemical compound O[C@@H]1[C@@H](O)[C@@H](O)[C@@H](CO)O[C@H]1O[C@@H]1[C@@H](CO)O[C@H](O)[C@H](O)[C@H]1O GUBGYTABKSRVRQ-XLOQQCSPSA-N 0.000 description 2
- 102100038080 B-cell receptor CD22 Human genes 0.000 description 2
- 102000036365 BRCA1 Human genes 0.000 description 2
- 108700020463 BRCA1 Proteins 0.000 description 2
- 101150072950 BRCA1 gene Proteins 0.000 description 2
- 102000052609 BRCA2 Human genes 0.000 description 2
- 108700020462 BRCA2 Proteins 0.000 description 2
- 101150008921 Brca2 gene Proteins 0.000 description 2
- 208000011691 Burkitt lymphomas Diseases 0.000 description 2
- 102100038078 CD276 antigen Human genes 0.000 description 2
- 101710185679 CD276 antigen Proteins 0.000 description 2
- 102100035793 CD83 antigen Human genes 0.000 description 2
- 102100037904 CD9 antigen Human genes 0.000 description 2
- 238000010453 CRISPR/Cas method Methods 0.000 description 2
- 101150018129 CSF2 gene Proteins 0.000 description 2
- 102100025064 Cellular tumor antigen p53 Human genes 0.000 description 2
- 108010077544 Chromatin Proteins 0.000 description 2
- 206010053567 Coagulopathies Diseases 0.000 description 2
- 108020004705 Codon Proteins 0.000 description 2
- 208000035473 Communicable disease Diseases 0.000 description 2
- 102100028233 Coronin-1A Human genes 0.000 description 2
- RGSFGYAAUTVSQA-UHFFFAOYSA-N Cyclopentane Chemical compound C1CCCC1 RGSFGYAAUTVSQA-UHFFFAOYSA-N 0.000 description 2
- 102100026846 Cytidine deaminase Human genes 0.000 description 2
- 102100025621 Cytochrome b-245 heavy chain Human genes 0.000 description 2
- 102000000311 Cytosine Deaminase Human genes 0.000 description 2
- 108010080611 Cytosine Deaminase Proteins 0.000 description 2
- 102100027816 Cytotoxic and regulatory T-cell molecule Human genes 0.000 description 2
- 102100040263 DNA dC->dU-editing enzyme APOBEC-3A Human genes 0.000 description 2
- 102000052510 DNA-Binding Proteins Human genes 0.000 description 2
- 108700020911 DNA-Binding Proteins Proteins 0.000 description 2
- 241000702421 Dependoparvovirus Species 0.000 description 2
- 108700022150 Designed Ankyrin Repeat Proteins Proteins 0.000 description 2
- 102100035102 E3 ubiquitin-protein ligase MYCBP2 Human genes 0.000 description 2
- LYCAIKOWRPUZTN-UHFFFAOYSA-N Ethylene glycol Chemical compound OCCO LYCAIKOWRPUZTN-UHFFFAOYSA-N 0.000 description 2
- 108091029865 Exogenous DNA Proteins 0.000 description 2
- 108700024394 Exon Proteins 0.000 description 2
- 102100035139 Folate receptor alpha Human genes 0.000 description 2
- 102000003688 G-Protein-Coupled Receptors Human genes 0.000 description 2
- 108090000045 G-Protein-Coupled Receptors Proteins 0.000 description 2
- 241000287828 Gallus gallus Species 0.000 description 2
- 108010010803 Gelatin Proteins 0.000 description 2
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 2
- 102100041003 Glutamate carboxypeptidase 2 Human genes 0.000 description 2
- 206010018464 Glycogen storage disease type I Diseases 0.000 description 2
- 208000009329 Graft vs Host Disease Diseases 0.000 description 2
- 208000031886 HIV Infections Diseases 0.000 description 2
- 208000037357 HIV infectious disease Diseases 0.000 description 2
- 102100029360 Hematopoietic cell signal transducer Human genes 0.000 description 2
- 208000018565 Hemochromatosis Diseases 0.000 description 2
- 102100030826 Hemoglobin subunit epsilon Human genes 0.000 description 2
- 108010017480 Hemosiderin Proteins 0.000 description 2
- 108090000100 Hepatocyte Growth Factor Proteins 0.000 description 2
- 102100021866 Hepatocyte growth factor Human genes 0.000 description 2
- 101000884305 Homo sapiens B-cell receptor CD22 Proteins 0.000 description 2
- 101100220044 Homo sapiens CD34 gene Proteins 0.000 description 2
- 101000946856 Homo sapiens CD83 antigen Proteins 0.000 description 2
- 101000738354 Homo sapiens CD9 antigen Proteins 0.000 description 2
- 101000860852 Homo sapiens Coronin-1A Proteins 0.000 description 2
- 101000964378 Homo sapiens DNA dC->dU-editing enzyme APOBEC-3A Proteins 0.000 description 2
- 101000851181 Homo sapiens Epidermal growth factor receptor Proteins 0.000 description 2
- 101001023230 Homo sapiens Folate receptor alpha Proteins 0.000 description 2
- 101000892862 Homo sapiens Glutamate carboxypeptidase 2 Proteins 0.000 description 2
- 101000990188 Homo sapiens Hematopoietic cell signal transducer Proteins 0.000 description 2
- 101001083591 Homo sapiens Hemoglobin subunit epsilon Proteins 0.000 description 2
- 101000962530 Homo sapiens Hyaluronidase-1 Proteins 0.000 description 2
- 101100127356 Homo sapiens KLRD1 gene Proteins 0.000 description 2
- 101001047640 Homo sapiens Linker for activation of T-cells family member 1 Proteins 0.000 description 2
- 101000623901 Homo sapiens Mucin-16 Proteins 0.000 description 2
- 101000934338 Homo sapiens Myeloid cell surface antigen CD33 Proteins 0.000 description 2
- 101001103036 Homo sapiens Nuclear receptor ROR-alpha Proteins 0.000 description 2
- 101000712958 Homo sapiens Ras association domain-containing protein 1 Proteins 0.000 description 2
- 101000738771 Homo sapiens Receptor-type tyrosine-protein phosphatase C Proteins 0.000 description 2
- 101000809875 Homo sapiens TYRO protein tyrosine kinase-binding protein Proteins 0.000 description 2
- 101000851376 Homo sapiens Tumor necrosis factor receptor superfamily member 8 Proteins 0.000 description 2
- 101001103033 Homo sapiens Tyrosine-protein kinase transmembrane receptor ROR2 Proteins 0.000 description 2
- 241000701085 Human alphaherpesvirus 3 Species 0.000 description 2
- 102100039283 Hyaluronidase-1 Human genes 0.000 description 2
- 206010061218 Inflammation Diseases 0.000 description 2
- 108010061833 Integrases Proteins 0.000 description 2
- 102000000589 Interleukin-1 Human genes 0.000 description 2
- 108010002352 Interleukin-1 Proteins 0.000 description 2
- 108090000176 Interleukin-13 Proteins 0.000 description 2
- 102000003816 Interleukin-13 Human genes 0.000 description 2
- 108010002350 Interleukin-2 Proteins 0.000 description 2
- 102000000588 Interleukin-2 Human genes 0.000 description 2
- 108090000978 Interleukin-4 Proteins 0.000 description 2
- 108010002616 Interleukin-5 Proteins 0.000 description 2
- 108090001005 Interleukin-6 Proteins 0.000 description 2
- 241000710842 Japanese encephalitis virus Species 0.000 description 2
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 2
- GUBGYTABKSRVRQ-QKKXKWKRSA-N Lactose Natural products OC[C@H]1O[C@@H](O[C@H]2[C@H](O)[C@@H](O)C(O)O[C@@H]2CO)[C@H](O)[C@@H](O)[C@H]1O GUBGYTABKSRVRQ-QKKXKWKRSA-N 0.000 description 2
- 102100024032 Linker for activation of T-cells family member 1 Human genes 0.000 description 2
- 108700018351 Major Histocompatibility Complex Proteins 0.000 description 2
- 201000005505 Measles Diseases 0.000 description 2
- 108010052285 Membrane Proteins Proteins 0.000 description 2
- 102100023123 Mucin-16 Human genes 0.000 description 2
- 101100490139 Mus musculus Acer3 gene Proteins 0.000 description 2
- 101100236305 Mus musculus Ly9 gene Proteins 0.000 description 2
- 101710135898 Myc proto-oncogene protein Proteins 0.000 description 2
- 102100025243 Myeloid cell surface antigen CD33 Human genes 0.000 description 2
- GXCLVBGFBYZDAG-UHFFFAOYSA-N N-[2-(1H-indol-3-yl)ethyl]-N-methylprop-2-en-1-amine Chemical compound CN(CCC1=CNC2=C1C=CC=C2)CC=C GXCLVBGFBYZDAG-UHFFFAOYSA-N 0.000 description 2
- 102100035488 Nectin-2 Human genes 0.000 description 2
- 101100385413 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) csm-3 gene Proteins 0.000 description 2
- 108010011536 PTEN Phosphohydrolase Proteins 0.000 description 2
- 102000014160 PTEN Phosphohydrolase Human genes 0.000 description 2
- 108091007412 Piwi-interacting RNA Proteins 0.000 description 2
- 208000007452 Plasmacytoma Diseases 0.000 description 2
- 108010038512 Platelet-Derived Growth Factor Proteins 0.000 description 2
- 102000010780 Platelet-Derived Growth Factor Human genes 0.000 description 2
- 239000002202 Polyethylene glycol Substances 0.000 description 2
- WCUXLLCKKVVCTQ-UHFFFAOYSA-M Potassium chloride Chemical compound [Cl-].[K+] WCUXLLCKKVVCTQ-UHFFFAOYSA-M 0.000 description 2
- 101710089372 Programmed cell death protein 1 Proteins 0.000 description 2
- 102100040678 Programmed cell death protein 1 Human genes 0.000 description 2
- 101710120463 Prostate stem cell antigen Proteins 0.000 description 2
- 102100036735 Prostate stem cell antigen Human genes 0.000 description 2
- 102000004022 Protein-Tyrosine Kinases Human genes 0.000 description 2
- 108090000412 Protein-Tyrosine Kinases Proteins 0.000 description 2
- 102100033243 Ras association domain-containing protein 1 Human genes 0.000 description 2
- 241000700159 Rattus Species 0.000 description 2
- 102100037422 Receptor-type tyrosine-protein phosphatase C Human genes 0.000 description 2
- 241000725643 Respiratory syncytial virus Species 0.000 description 2
- 241000702670 Rotavirus Species 0.000 description 2
- 108020003224 Small Nucleolar RNA Proteins 0.000 description 2
- 102000042773 Small Nucleolar RNA Human genes 0.000 description 2
- 229920002472 Starch Polymers 0.000 description 2
- CZMRCDWAGMRECN-UGDNZRGBSA-N Sucrose Chemical compound O[C@H]1[C@H](O)[C@@H](CO)O[C@@]1(CO)O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1 CZMRCDWAGMRECN-UGDNZRGBSA-N 0.000 description 2
- 229930006000 Sucrose Natural products 0.000 description 2
- 102100038717 TYRO protein tyrosine kinase-binding protein Human genes 0.000 description 2
- RYYWUUFWQRZTIU-UHFFFAOYSA-N Thiophosphoric acid Chemical class OP(O)(S)=O RYYWUUFWQRZTIU-UHFFFAOYSA-N 0.000 description 2
- 108700009124 Transcription Initiation Site Proteins 0.000 description 2
- 101710150448 Transcriptional regulator Myc Proteins 0.000 description 2
- 101800001690 Transmembrane protein gp41 Proteins 0.000 description 2
- 102100036857 Tumor necrosis factor receptor superfamily member 8 Human genes 0.000 description 2
- 102100039616 Tyrosine-protein kinase transmembrane receptor ROR2 Human genes 0.000 description 2
- 108700020467 WT1 Proteins 0.000 description 2
- 230000002159 abnormal effect Effects 0.000 description 2
- 230000005856 abnormality Effects 0.000 description 2
- 239000013543 active substance Substances 0.000 description 2
- 230000033289 adaptive immune response Effects 0.000 description 2
- 238000011467 adoptive cell therapy Methods 0.000 description 2
- 125000003342 alkenyl group Chemical group 0.000 description 2
- 125000000304 alkynyl group Chemical group 0.000 description 2
- 206010002026 amyotrophic lateral sclerosis Diseases 0.000 description 2
- 230000006907 apoptotic process Effects 0.000 description 2
- 238000003556 assay Methods 0.000 description 2
- 208000036556 autosomal recessive T cell-negative B cell-negative NK cell-negative due to adenosine deaminase deficiency severe combined immunodeficiency Diseases 0.000 description 2
- 230000001580 bacterial effect Effects 0.000 description 2
- 210000003651 basophil Anatomy 0.000 description 2
- 239000011324 bead Substances 0.000 description 2
- WQZGKKKJIJFFOK-VFUOTHLCSA-N beta-D-glucose Chemical compound OC[C@H]1O[C@@H](O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-VFUOTHLCSA-N 0.000 description 2
- 239000011230 binding agent Substances 0.000 description 2
- 239000001055 blue pigment Substances 0.000 description 2
- 210000002798 bone marrow cell Anatomy 0.000 description 2
- 210000004556 brain Anatomy 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 2
- 108020001778 catalytic domains Proteins 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 235000013330 chicken meat Nutrition 0.000 description 2
- 210000003483 chromatin Anatomy 0.000 description 2
- 239000013611 chromosomal DNA Substances 0.000 description 2
- 208000016532 chronic granulomatous disease Diseases 0.000 description 2
- 108010072917 class-I restricted T cell-associated molecule Proteins 0.000 description 2
- 230000035602 clotting Effects 0.000 description 2
- 230000001332 colony forming effect Effects 0.000 description 2
- 230000003750 conditioning effect Effects 0.000 description 2
- 230000002596 correlated effect Effects 0.000 description 2
- 229940104302 cytosine Drugs 0.000 description 2
- 230000006378 damage Effects 0.000 description 2
- 230000008021 deposition Effects 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 239000003085 diluting agent Substances 0.000 description 2
- 238000010494 dissociation reaction Methods 0.000 description 2
- 230000005593 dissociations Effects 0.000 description 2
- 230000034431 double-strand break repair via homologous recombination Effects 0.000 description 2
- 230000011559 double-strand break repair via nonhomologous end joining Effects 0.000 description 2
- 230000009977 dual effect Effects 0.000 description 2
- 239000012039 electrophile Substances 0.000 description 2
- YQGOJNYOYNNSMM-UHFFFAOYSA-N eosin Chemical compound [Na+].OC(=O)C1=CC=CC=C1C1=C2C=C(Br)C(=O)C(Br)=C2OC2=C(Br)C(O)=C(Br)C=C21 YQGOJNYOYNNSMM-UHFFFAOYSA-N 0.000 description 2
- 210000003979 eosinophil Anatomy 0.000 description 2
- 150000002148 esters Chemical class 0.000 description 2
- 235000019441 ethanol Nutrition 0.000 description 2
- MMXKVMNBHPAILY-UHFFFAOYSA-N ethyl laurate Chemical compound CCCCCCCCCCCC(=O)OCC MMXKVMNBHPAILY-UHFFFAOYSA-N 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 230000001747 exhibiting effect Effects 0.000 description 2
- 239000012530 fluid Substances 0.000 description 2
- BTCSSZJGUNDROE-UHFFFAOYSA-N gamma-aminobutyric acid Chemical compound NCCCC(O)=O BTCSSZJGUNDROE-UHFFFAOYSA-N 0.000 description 2
- 239000000499 gel Substances 0.000 description 2
- 239000008273 gelatin Substances 0.000 description 2
- 229920000159 gelatin Polymers 0.000 description 2
- 235000019322 gelatine Nutrition 0.000 description 2
- 235000011852 gelatine desserts Nutrition 0.000 description 2
- 238000010362 genome editing Methods 0.000 description 2
- 239000008103 glucose Substances 0.000 description 2
- 235000011187 glycerol Nutrition 0.000 description 2
- 201000004541 glycogen storage disease I Diseases 0.000 description 2
- 208000024908 graft versus host disease Diseases 0.000 description 2
- 230000012010 growth Effects 0.000 description 2
- 208000034737 hemoglobinopathy Diseases 0.000 description 2
- 229940088597 hormone Drugs 0.000 description 2
- 239000005556 hormone Substances 0.000 description 2
- 208000033519 human immunodeficiency virus infectious disease Diseases 0.000 description 2
- 230000003463 hyperproliferative effect Effects 0.000 description 2
- 230000001506 immunosuppresive effect Effects 0.000 description 2
- 230000008676 import Effects 0.000 description 2
- 230000004054 inflammatory process Effects 0.000 description 2
- 238000007852 inverse PCR Methods 0.000 description 2
- 229910052742 iron Inorganic materials 0.000 description 2
- 239000008101 lactose Substances 0.000 description 2
- 208000032839 leukemia Diseases 0.000 description 2
- 208000036546 leukodystrophy Diseases 0.000 description 2
- 150000002632 lipids Chemical class 0.000 description 2
- 210000003712 lysosome Anatomy 0.000 description 2
- 230000001868 lysosomic effect Effects 0.000 description 2
- 210000002540 macrophage Anatomy 0.000 description 2
- 238000012423 maintenance Methods 0.000 description 2
- 230000001394 metastastic effect Effects 0.000 description 2
- 206010061289 metastatic neoplasm Diseases 0.000 description 2
- 210000001616 monocyte Anatomy 0.000 description 2
- 125000004573 morpholin-4-yl group Chemical group N1(CCOCC1)* 0.000 description 2
- 208000022018 mucopolysaccharidosis type 2 Diseases 0.000 description 2
- 208000011045 mucopolysaccharidosis type 3 Diseases 0.000 description 2
- 201000006417 multiple sclerosis Diseases 0.000 description 2
- 108700024542 myc Genes Proteins 0.000 description 2
- 210000004165 myocardium Anatomy 0.000 description 2
- 239000013642 negative control Substances 0.000 description 2
- 231100000252 nontoxic Toxicity 0.000 description 2
- 230000003000 nontoxic effect Effects 0.000 description 2
- 230000008520 organization Effects 0.000 description 2
- 230000000144 pharmacologic effect Effects 0.000 description 2
- 229910052698 phosphorus Inorganic materials 0.000 description 2
- 229920001481 poly(stearyl methacrylate) Polymers 0.000 description 2
- 229920000728 polyester Polymers 0.000 description 2
- 229920001223 polyethylene glycol Polymers 0.000 description 2
- 208000028529 primary immunodeficiency disease Diseases 0.000 description 2
- 230000035755 proliferation Effects 0.000 description 2
- 238000009163 protein therapy Methods 0.000 description 2
- 102000016914 ras Proteins Human genes 0.000 description 2
- 108010014186 ras Proteins Proteins 0.000 description 2
- 230000008439 repair process Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 108091008146 restriction endonucleases Proteins 0.000 description 2
- 230000000717 retained effect Effects 0.000 description 2
- 238000012552 review Methods 0.000 description 2
- 201000005404 rubella Diseases 0.000 description 2
- 150000003839 salts Chemical class 0.000 description 2
- 208000002491 severe combined immunodeficiency Diseases 0.000 description 2
- 108091006024 signal transducing proteins Proteins 0.000 description 2
- 102000034285 signal transducing proteins Human genes 0.000 description 2
- 210000002027 skeletal muscle Anatomy 0.000 description 2
- 210000003491 skin Anatomy 0.000 description 2
- 239000011780 sodium chloride Substances 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- 239000000243 solution Substances 0.000 description 2
- 239000002904 solvent Substances 0.000 description 2
- 235000019698 starch Nutrition 0.000 description 2
- 239000005720 sucrose Substances 0.000 description 2
- 235000000346 sugar Nutrition 0.000 description 2
- 230000020382 suppression by virus of host antigen processing and presentation of peptide antigen via MHC class I Effects 0.000 description 2
- 230000004083 survival effect Effects 0.000 description 2
- 201000000596 systemic lupus erythematosus Diseases 0.000 description 2
- 239000000454 talc Substances 0.000 description 2
- 229910052623 talc Inorganic materials 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 238000001890 transfection Methods 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 238000011830 transgenic mouse model Methods 0.000 description 2
- 230000024540 transposon integration Effects 0.000 description 2
- 238000011269 treatment regimen Methods 0.000 description 2
- 238000007492 two-way ANOVA Methods 0.000 description 2
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 2
- 229940035893 uracil Drugs 0.000 description 2
- 229960005486 vaccine Drugs 0.000 description 2
- 238000005406 washing Methods 0.000 description 2
- 125000000008 (C1-C10) alkyl group Chemical group 0.000 description 1
- 102100031599 2-(3-amino-3-carboxypropyl)histidine synthase subunit 1 Human genes 0.000 description 1
- QZDDFQLIQRYMBV-UHFFFAOYSA-N 2-[3-nitro-2-(2-nitrophenyl)-4-oxochromen-8-yl]acetic acid Chemical compound OC(=O)CC1=CC=CC(C(C=2[N+]([O-])=O)=O)=C1OC=2C1=CC=CC=C1[N+]([O-])=O QZDDFQLIQRYMBV-UHFFFAOYSA-N 0.000 description 1
- BGFTWECWAICPDG-UHFFFAOYSA-N 2-[bis(4-chlorophenyl)methyl]-4-n-[3-[bis(4-chlorophenyl)methyl]-4-(dimethylamino)phenyl]-1-n,1-n-dimethylbenzene-1,4-diamine Chemical compound C1=C(C(C=2C=CC(Cl)=CC=2)C=2C=CC(Cl)=CC=2)C(N(C)C)=CC=C1NC(C=1)=CC=C(N(C)C)C=1C(C=1C=CC(Cl)=CC=1)C1=CC=C(Cl)C=C1 BGFTWECWAICPDG-UHFFFAOYSA-N 0.000 description 1
- MZZYGYNZAOVRTG-UHFFFAOYSA-N 2-hydroxy-n-(1h-1,2,4-triazol-5-yl)benzamide Chemical compound OC1=CC=CC=C1C(=O)NC1=NC=NN1 MZZYGYNZAOVRTG-UHFFFAOYSA-N 0.000 description 1
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 1
- 108020003589 5' Untranslated Regions Proteins 0.000 description 1
- 102100025915 5' exonuclease Apollo Human genes 0.000 description 1
- 102100022464 5'-nucleotidase Human genes 0.000 description 1
- KBDWGFZSICOZSJ-UHFFFAOYSA-N 5-methyl-2,3-dihydro-1H-pyrimidin-4-one Chemical compound N1CNC=C(C1=O)C KBDWGFZSICOZSJ-UHFFFAOYSA-N 0.000 description 1
- 101150052384 50 gene Proteins 0.000 description 1
- NALREUIWICQLPS-UHFFFAOYSA-N 7-imino-n,n-dimethylphenothiazin-3-amine;hydrochloride Chemical compound [Cl-].C1=C(N)C=C2SC3=CC(=[N+](C)C)C=CC3=NC2=C1 NALREUIWICQLPS-UHFFFAOYSA-N 0.000 description 1
- 102100031585 ADP-ribosyl cyclase/cyclic ADP-ribose hydrolase 1 Human genes 0.000 description 1
- 108010004483 APOBEC-3G Deaminase Proteins 0.000 description 1
- 102100024643 ATP-binding cassette sub-family D member 1 Human genes 0.000 description 1
- 241000093740 Acidaminococcus sp. Species 0.000 description 1
- 241001588186 Acidaminococcus sp. BV3L6 Species 0.000 description 1
- 208000031261 Acute myeloid leukaemia Diseases 0.000 description 1
- 229930024421 Adenine Natural products 0.000 description 1
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 1
- 229920001817 Agar Polymers 0.000 description 1
- 102100035028 Alpha-L-iduronidase Human genes 0.000 description 1
- 102100034561 Alpha-N-acetylglucosaminidase Human genes 0.000 description 1
- 102100026882 Alpha-synuclein Human genes 0.000 description 1
- 208000024827 Alzheimer disease Diseases 0.000 description 1
- 208000031277 Amaurotic familial idiocy Diseases 0.000 description 1
- 102100022749 Aminopeptidase N Human genes 0.000 description 1
- 108091093088 Amplicon Proteins 0.000 description 1
- 101100449747 Aneurinibacillus migulanus gsp gene Proteins 0.000 description 1
- 235000002198 Annona diversifolia Nutrition 0.000 description 1
- 108020005544 Antisense RNA Proteins 0.000 description 1
- 102000013918 Apolipoproteins E Human genes 0.000 description 1
- 108010025628 Apolipoproteins E Proteins 0.000 description 1
- 101100281515 Arabidopsis thaliana FOX1 gene Proteins 0.000 description 1
- 241000203069 Archaea Species 0.000 description 1
- 241000712891 Arenavirus Species 0.000 description 1
- 102000004452 Arginase Human genes 0.000 description 1
- 108700024123 Arginases Proteins 0.000 description 1
- 108010014223 Armadillo Domain Proteins Proteins 0.000 description 1
- 102100022146 Arylsulfatase A Human genes 0.000 description 1
- 102100031491 Arylsulfatase B Human genes 0.000 description 1
- BSYNRYMUTXBXSQ-UHFFFAOYSA-N Aspirin Chemical compound CC(=O)OC1=CC=CC=C1C(O)=O BSYNRYMUTXBXSQ-UHFFFAOYSA-N 0.000 description 1
- 241000416162 Astragalus gummifer Species 0.000 description 1
- 102100022717 Atypical chemokine receptor 1 Human genes 0.000 description 1
- 241000589941 Azospirillum Species 0.000 description 1
- 102000006942 B-Cell Maturation Antigen Human genes 0.000 description 1
- 108010008014 B-Cell Maturation Antigen Proteins 0.000 description 1
- 102100027205 B-cell antigen receptor complex-associated protein alpha chain Human genes 0.000 description 1
- 102100027203 B-cell antigen receptor complex-associated protein beta chain Human genes 0.000 description 1
- 102100025218 B-cell differentiation antigen CD72 Human genes 0.000 description 1
- 102100022005 B-lymphocyte antigen CD20 Human genes 0.000 description 1
- 241000606125 Bacteroides Species 0.000 description 1
- 208000023328 Basedow disease Diseases 0.000 description 1
- 102100026189 Beta-galactosidase Human genes 0.000 description 1
- 102100026031 Beta-glucuronidase Human genes 0.000 description 1
- 102100037674 Bis(5'-adenosyl)-triphosphatase Human genes 0.000 description 1
- 208000019838 Blood disease Diseases 0.000 description 1
- 208000018240 Bone Marrow Failure disease Diseases 0.000 description 1
- 206010065553 Bone marrow failure Diseases 0.000 description 1
- 101100284398 Bos taurus BoLA-DQB gene Proteins 0.000 description 1
- 108090000715 Brain-derived neurotrophic factor Proteins 0.000 description 1
- 102000004219 Brain-derived neurotrophic factor Human genes 0.000 description 1
- 206010006187 Breast cancer Diseases 0.000 description 1
- 208000026310 Breast neoplasm Diseases 0.000 description 1
- 101150111062 C gene Proteins 0.000 description 1
- 102100031151 C-C chemokine receptor type 2 Human genes 0.000 description 1
- 101710149815 C-C chemokine receptor type 2 Proteins 0.000 description 1
- 102100024167 C-C chemokine receptor type 3 Human genes 0.000 description 1
- 101710149862 C-C chemokine receptor type 3 Proteins 0.000 description 1
- 102100035875 C-C chemokine receptor type 5 Human genes 0.000 description 1
- 101710149870 C-C chemokine receptor type 5 Proteins 0.000 description 1
- 102100036305 C-C chemokine receptor type 8 Human genes 0.000 description 1
- 102100025074 C-C chemokine receptor-like 2 Human genes 0.000 description 1
- 108090000342 C-Type Lectins Proteins 0.000 description 1
- 102000003930 C-Type Lectins Human genes 0.000 description 1
- 102100031650 C-X-C chemokine receptor type 4 Human genes 0.000 description 1
- 102100025618 C-X-C chemokine receptor type 6 Human genes 0.000 description 1
- 102100026094 C-type lectin domain family 12 member A Human genes 0.000 description 1
- 101710188619 C-type lectin domain family 12 member A Proteins 0.000 description 1
- 102000002086 C-type lectin-like Human genes 0.000 description 1
- 108050009406 C-type lectin-like Proteins 0.000 description 1
- 102100024217 CAMPATH-1 antigen Human genes 0.000 description 1
- 108010049990 CD13 Antigens Proteins 0.000 description 1
- 102000017420 CD3 protein, epsilon/gamma/delta subunit Human genes 0.000 description 1
- 108050005493 CD3 protein, epsilon/gamma/delta subunit Proteins 0.000 description 1
- 108010065524 CD52 Antigen Proteins 0.000 description 1
- 108091008048 CMVpp65 Proteins 0.000 description 1
- 108010040467 CRISPR-Associated Proteins Proteins 0.000 description 1
- 101150053778 CSF1R gene Proteins 0.000 description 1
- 229940045513 CTLA4 antagonist Drugs 0.000 description 1
- 101150110592 CTS1 gene Proteins 0.000 description 1
- 101100364669 Caenorhabditis elegans lin-18 gene Proteins 0.000 description 1
- 101100476210 Caenorhabditis elegans rnt-1 gene Proteins 0.000 description 1
- 102100039319 Calcium release-activated calcium channel protein 1 Human genes 0.000 description 1
- 241000589876 Campylobacter Species 0.000 description 1
- 108090000565 Capsid Proteins Proteins 0.000 description 1
- 102100025466 Carcinoembryonic antigen-related cell adhesion molecule 3 Human genes 0.000 description 1
- 208000005623 Carcinogenesis Diseases 0.000 description 1
- 108700004991 Cas12a Proteins 0.000 description 1
- 102100024965 Caspase recruitment domain-containing protein 11 Human genes 0.000 description 1
- 108090000994 Catalytic RNA Proteins 0.000 description 1
- 102000053642 Catalytic RNA Human genes 0.000 description 1
- 102100028914 Catenin beta-1 Human genes 0.000 description 1
- 108010036867 Cerebroside-Sulfatase Proteins 0.000 description 1
- 102100023321 Ceruloplasmin Human genes 0.000 description 1
- 108091007741 Chimeric antigen receptor T cells Proteins 0.000 description 1
- 101710165135 Chorionic somatomammotropin hormone 1 Proteins 0.000 description 1
- 101710178046 Chorismate synthase 1 Proteins 0.000 description 1
- 102100038215 Chromodomain-helicase-DNA-binding protein 7 Human genes 0.000 description 1
- 108010005939 Ciliary Neurotrophic Factor Proteins 0.000 description 1
- 102100031614 Ciliary neurotrophic factor Human genes 0.000 description 1
- 108700010070 Codon Usage Proteins 0.000 description 1
- 206010010099 Combined immunodeficiency Diseases 0.000 description 1
- 108700040183 Complement C1 Inhibitor Proteins 0.000 description 1
- 102000055157 Complement C1 Inhibitor Human genes 0.000 description 1
- 102100025680 Complement decay-accelerating factor Human genes 0.000 description 1
- 206010010144 Completed suicide Diseases 0.000 description 1
- 206010062759 Congenital dyskeratosis Diseases 0.000 description 1
- 108010024682 Core Binding Factor Alpha 1 Subunit Proteins 0.000 description 1
- 102000015775 Core Binding Factor Alpha 1 Subunit Human genes 0.000 description 1
- 229920002261 Corn starch Polymers 0.000 description 1
- 101710139375 Corneodesmosin Proteins 0.000 description 1
- 241000711573 Coronaviridae Species 0.000 description 1
- 241000699800 Cricetinae Species 0.000 description 1
- 101150074775 Csf1 gene Proteins 0.000 description 1
- 241001559589 Cullen Species 0.000 description 1
- 102100024458 Cyclin-dependent kinase inhibitor 2A Human genes 0.000 description 1
- 108010076010 Cystathionine beta-lyase Proteins 0.000 description 1
- 102100031620 Cysteine and glycine-rich protein 3 Human genes 0.000 description 1
- 101710152695 Cysteine synthase 1 Proteins 0.000 description 1
- 201000003883 Cystic fibrosis Diseases 0.000 description 1
- 241000701022 Cytomegalovirus Species 0.000 description 1
- 102100039498 Cytotoxic T-lymphocyte protein 4 Human genes 0.000 description 1
- FBPFZTCFMRRESA-FSIIMWSLSA-N D-Glucitol Natural products OC[C@H](O)[C@H](O)[C@@H](O)[C@H](O)CO FBPFZTCFMRRESA-FSIIMWSLSA-N 0.000 description 1
- FBPFZTCFMRRESA-KVTDHHQDSA-N D-Mannitol Chemical compound OC[C@@H](O)[C@@H](O)[C@H](O)[C@H](O)CO FBPFZTCFMRRESA-KVTDHHQDSA-N 0.000 description 1
- FBPFZTCFMRRESA-JGWLITMVSA-N D-glucitol Chemical compound OC[C@H](O)[C@@H](O)[C@H](O)[C@H](O)CO FBPFZTCFMRRESA-JGWLITMVSA-N 0.000 description 1
- 208000025939 DNA Repair-Deficiency disease Diseases 0.000 description 1
- 102100038076 DNA dC->dU-editing enzyme APOBEC-3G Human genes 0.000 description 1
- 102100033195 DNA ligase 4 Human genes 0.000 description 1
- 102100029094 DNA repair endonuclease XPF Human genes 0.000 description 1
- 102100034484 DNA repair protein RAD51 homolog 3 Human genes 0.000 description 1
- 102100027830 DNA repair protein XRCC2 Human genes 0.000 description 1
- 102100020986 DNA-binding protein RFX5 Human genes 0.000 description 1
- 102100021044 DNA-binding protein RFXANK Human genes 0.000 description 1
- 102100022204 DNA-dependent protein kinase catalytic subunit Human genes 0.000 description 1
- 241000289632 Dasypodidae Species 0.000 description 1
- 108010053770 Deoxyribonucleases Proteins 0.000 description 1
- 102000016911 Deoxyribonucleases Human genes 0.000 description 1
- 208000002699 Digestive System Neoplasms Diseases 0.000 description 1
- 108010049959 Discoidins Proteins 0.000 description 1
- 101100261976 Drosophila melanogaster trk gene Proteins 0.000 description 1
- 102100025682 Dystroglycan 1 Human genes 0.000 description 1
- 108010071885 Dystroglycans Proteins 0.000 description 1
- 108010069091 Dystrophin Proteins 0.000 description 1
- 102000001039 Dystrophin Human genes 0.000 description 1
- 102100035813 E3 ubiquitin-protein ligase CBL Human genes 0.000 description 1
- 108050002772 E3 ubiquitin-protein ligase Mdm2 Proteins 0.000 description 1
- 102000012199 E3 ubiquitin-protein ligase Mdm2 Human genes 0.000 description 1
- 102100022822 E3 ubiquitin-protein ligase RFWD3 Human genes 0.000 description 1
- 102100022207 E3 ubiquitin-protein ligase parkin Human genes 0.000 description 1
- 102000001301 EGF receptor Human genes 0.000 description 1
- 102000012545 EGF-like domains Human genes 0.000 description 1
- 108050002150 EGF-like domains Proteins 0.000 description 1
- 101150029707 ERBB2 gene Proteins 0.000 description 1
- LVGKNOAMLMIIKO-UHFFFAOYSA-N Elaidinsaeure-aethylester Natural products CCCCCCCCC=CCCCCCCCC(=O)OCC LVGKNOAMLMIIKO-UHFFFAOYSA-N 0.000 description 1
- 241000196324 Embryophyta Species 0.000 description 1
- 206010014596 Encephalitis Japanese B Diseases 0.000 description 1
- 102100031780 Endonuclease Human genes 0.000 description 1
- 108010042407 Endonucleases Proteins 0.000 description 1
- 101710126487 Envelope glycoprotein B Proteins 0.000 description 1
- 101800001466 Envelope glycoprotein E1 Proteins 0.000 description 1
- 101000585551 Equus caballus Pregnancy-associated glycoprotein Proteins 0.000 description 1
- 102100031690 Erythroid transcription factor Human genes 0.000 description 1
- 101001065501 Escherichia phage MS2 Lysis protein Proteins 0.000 description 1
- 102100029951 Estrogen receptor beta Human genes 0.000 description 1
- 239000001856 Ethyl cellulose Substances 0.000 description 1
- ZZSNKZQZMQGXPY-UHFFFAOYSA-N Ethyl cellulose Chemical compound CCOCC1OC(OC)C(OCC)C(OCC)C1OC1C(O)C(O)C(OC)C(CO)O1 ZZSNKZQZMQGXPY-UHFFFAOYSA-N 0.000 description 1
- 241000186394 Eubacterium Species 0.000 description 1
- 101710196289 Eukaryotic translation initiation factor 2-alpha kinase 1 Proteins 0.000 description 1
- 208000024720 Fabry Disease Diseases 0.000 description 1
- 108010067741 Fanconi Anemia Complementation Group N protein Proteins 0.000 description 1
- 102100034553 Fanconi anemia group J protein Human genes 0.000 description 1
- 108010021468 Fc gamma receptor IIA Proteins 0.000 description 1
- 108090000386 Fibroblast Growth Factor 1 Proteins 0.000 description 1
- 102100031706 Fibroblast growth factor 1 Human genes 0.000 description 1
- 102100024785 Fibroblast growth factor 2 Human genes 0.000 description 1
- 108090000379 Fibroblast growth factor 2 Proteins 0.000 description 1
- 241000178967 Filifactor Species 0.000 description 1
- 241000710831 Flavivirus Species 0.000 description 1
- 241000589565 Flavobacterium Species 0.000 description 1
- 102100023416 G-protein coupled receptor 15 Human genes 0.000 description 1
- 102100021197 G-protein coupled receptor family C group 5 member D Human genes 0.000 description 1
- 102100022360 GATOR complex protein NPRL2 Human genes 0.000 description 1
- 102100022086 GRB2-related adapter protein 2 Human genes 0.000 description 1
- 101150000435 GSS gene Proteins 0.000 description 1
- 102100037948 GTP-binding protein Di-Ras3 Human genes 0.000 description 1
- 102100029974 GTPase HRas Human genes 0.000 description 1
- 102100039788 GTPase NRas Human genes 0.000 description 1
- 108010001515 Galectin 4 Proteins 0.000 description 1
- 102100039556 Galectin-4 Human genes 0.000 description 1
- 208000015872 Gaucher disease Diseases 0.000 description 1
- 108700028146 Genetic Enhancer Elements Proteins 0.000 description 1
- 208000034951 Genetic Translocation Diseases 0.000 description 1
- 238000002738 Giemsa staining Methods 0.000 description 1
- 108090000495 Glia Maturation Factor Proteins 0.000 description 1
- 241000032681 Gluconacetobacter Species 0.000 description 1
- 102000009127 Glutaminase Human genes 0.000 description 1
- 108010073324 Glutaminase Proteins 0.000 description 1
- VXKCPBPQEKKERH-IUCAKERBSA-N Gly-Arg-Pro Chemical compound NC(N)=NCCC[C@H](NC(=O)CN)C(=O)N1CCC[C@H]1C(O)=O VXKCPBPQEKKERH-IUCAKERBSA-N 0.000 description 1
- BCCRXDTUTZHDEU-VKHMYHEASA-N Gly-Ser Chemical compound NCC(=O)N[C@@H](CO)C(O)=O BCCRXDTUTZHDEU-VKHMYHEASA-N 0.000 description 1
- 208000032007 Glycogen storage disease due to acid maltase deficiency Diseases 0.000 description 1
- 208000032003 Glycogen storage disease due to glucose-6-phosphatase deficiency Diseases 0.000 description 1
- 206010053185 Glycogen storage disease type II Diseases 0.000 description 1
- 102000003886 Glycoproteins Human genes 0.000 description 1
- 108090000288 Glycoproteins Proteins 0.000 description 1
- 229920002683 Glycosaminoglycan Polymers 0.000 description 1
- 229940113491 Glycosylase inhibitor Drugs 0.000 description 1
- 108010017213 Granulocyte-Macrophage Colony-Stimulating Factor Proteins 0.000 description 1
- 102100039620 Granulocyte-macrophage colony-stimulating factor Human genes 0.000 description 1
- 208000015023 Graves' disease Diseases 0.000 description 1
- 102100031249 H/ACA ribonucleoprotein complex subunit DKC1 Human genes 0.000 description 1
- 208000031856 Haemosiderosis Diseases 0.000 description 1
- 101710154606 Hemagglutinin Proteins 0.000 description 1
- 102100038614 Hemoglobin subunit gamma-1 Human genes 0.000 description 1
- 241000711549 Hepacivirus C Species 0.000 description 1
- 102100039991 Heparan-alpha-glucosaminide N-acetyltransferase Human genes 0.000 description 1
- 206010019695 Hepatic neoplasm Diseases 0.000 description 1
- 208000005176 Hepatitis C Diseases 0.000 description 1
- 208000028782 Hereditary disease Diseases 0.000 description 1
- 208000009889 Herpes Simplex Diseases 0.000 description 1
- 208000007514 Herpes zoster Diseases 0.000 description 1
- 102100022132 High affinity immunoglobulin epsilon receptor subunit gamma Human genes 0.000 description 1
- 102100026122 High affinity immunoglobulin gamma Fc receptor I Human genes 0.000 description 1
- 102100021628 Histatin-3 Human genes 0.000 description 1
- 102100022103 Histone-lysine N-methyltransferase 2A Human genes 0.000 description 1
- 101000866191 Homo sapiens 2-(3-amino-3-carboxypropyl)histidine synthase subunit 1 Proteins 0.000 description 1
- 101000720953 Homo sapiens 5' exonuclease Apollo Proteins 0.000 description 1
- 101000678236 Homo sapiens 5'-nucleotidase Proteins 0.000 description 1
- 101000777636 Homo sapiens ADP-ribosyl cyclase/cyclic ADP-ribose hydrolase 1 Proteins 0.000 description 1
- 101000924577 Homo sapiens Adenomatous polyposis coli protein Proteins 0.000 description 1
- 101001019502 Homo sapiens Alpha-L-iduronidase Proteins 0.000 description 1
- 101000834898 Homo sapiens Alpha-synuclein Proteins 0.000 description 1
- 101000929928 Homo sapiens Angiotensin-converting enzyme 2 Proteins 0.000 description 1
- 101000923070 Homo sapiens Arylsulfatase B Proteins 0.000 description 1
- 101000678879 Homo sapiens Atypical chemokine receptor 1 Proteins 0.000 description 1
- 101000914489 Homo sapiens B-cell antigen receptor complex-associated protein alpha chain Proteins 0.000 description 1
- 101000914491 Homo sapiens B-cell antigen receptor complex-associated protein beta chain Proteins 0.000 description 1
- 101000934359 Homo sapiens B-cell differentiation antigen CD72 Proteins 0.000 description 1
- 101000897405 Homo sapiens B-lymphocyte antigen CD20 Proteins 0.000 description 1
- 101000765010 Homo sapiens Beta-galactosidase Proteins 0.000 description 1
- 101000933465 Homo sapiens Beta-glucuronidase Proteins 0.000 description 1
- 101000716063 Homo sapiens C-C chemokine receptor type 8 Proteins 0.000 description 1
- 101000922348 Homo sapiens C-X-C chemokine receptor type 4 Proteins 0.000 description 1
- 101000856683 Homo sapiens C-X-C chemokine receptor type 6 Proteins 0.000 description 1
- 101100005238 Homo sapiens CARTPT gene Proteins 0.000 description 1
- 101100382122 Homo sapiens CIITA gene Proteins 0.000 description 1
- 101000914337 Homo sapiens Carcinoembryonic antigen-related cell adhesion molecule 3 Proteins 0.000 description 1
- 101000914324 Homo sapiens Carcinoembryonic antigen-related cell adhesion molecule 5 Proteins 0.000 description 1
- 101000914321 Homo sapiens Carcinoembryonic antigen-related cell adhesion molecule 7 Proteins 0.000 description 1
- 101000761179 Homo sapiens Caspase recruitment domain-containing protein 11 Proteins 0.000 description 1
- 101000956228 Homo sapiens Chorionic somatomammotropin hormone 2 Proteins 0.000 description 1
- 101000883739 Homo sapiens Chromodomain-helicase-DNA-binding protein 7 Proteins 0.000 description 1
- 101000856022 Homo sapiens Complement decay-accelerating factor Proteins 0.000 description 1
- 101000889276 Homo sapiens Cytotoxic T-lymphocyte protein 4 Proteins 0.000 description 1
- 101000927810 Homo sapiens DNA ligase 4 Proteins 0.000 description 1
- 101001132271 Homo sapiens DNA repair protein RAD51 homolog 3 Proteins 0.000 description 1
- 101000649306 Homo sapiens DNA repair protein XRCC2 Proteins 0.000 description 1
- 101001075432 Homo sapiens DNA-binding protein RFX5 Proteins 0.000 description 1
- 101001075464 Homo sapiens DNA-binding protein RFXANK Proteins 0.000 description 1
- 101000619536 Homo sapiens DNA-dependent protein kinase catalytic subunit Proteins 0.000 description 1
- 101000756779 Homo sapiens E3 ubiquitin-protein ligase RFWD3 Proteins 0.000 description 1
- 101000619542 Homo sapiens E3 ubiquitin-protein ligase parkin Proteins 0.000 description 1
- 101001066268 Homo sapiens Erythroid transcription factor Proteins 0.000 description 1
- 101001010910 Homo sapiens Estrogen receptor beta Proteins 0.000 description 1
- 101000848171 Homo sapiens Fanconi anemia group J protein Proteins 0.000 description 1
- 101000829794 Homo sapiens G-protein coupled receptor 15 Proteins 0.000 description 1
- 101001040713 Homo sapiens G-protein coupled receptor family C group 5 member D Proteins 0.000 description 1
- 101000900690 Homo sapiens GRB2-related adapter protein 2 Proteins 0.000 description 1
- 101000951235 Homo sapiens GTP-binding protein Di-Ras3 Proteins 0.000 description 1
- 101000584633 Homo sapiens GTPase HRas Proteins 0.000 description 1
- 101000744505 Homo sapiens GTPase NRas Proteins 0.000 description 1
- 101000844866 Homo sapiens H/ACA ribonucleoprotein complex subunit DKC1 Proteins 0.000 description 1
- 101001031977 Homo sapiens Hemoglobin subunit gamma-1 Proteins 0.000 description 1
- 101001031961 Homo sapiens Hemoglobin subunit gamma-2 Proteins 0.000 description 1
- 101001035092 Homo sapiens Heparan-alpha-glucosaminide N-acetyltransferase Proteins 0.000 description 1
- 101000824104 Homo sapiens High affinity immunoglobulin epsilon receptor subunit gamma Proteins 0.000 description 1
- 101000913074 Homo sapiens High affinity immunoglobulin gamma Fc receptor I Proteins 0.000 description 1
- 101000898505 Homo sapiens Histatin-3 Proteins 0.000 description 1
- 101001045846 Homo sapiens Histone-lysine N-methyltransferase 2A Proteins 0.000 description 1
- 101000962526 Homo sapiens Hyaluronidase-2 Proteins 0.000 description 1
- 101000840540 Homo sapiens Iduronate 2-sulfatase Proteins 0.000 description 1
- 101000606465 Homo sapiens Inactive tyrosine-protein kinase 7 Proteins 0.000 description 1
- 101000599951 Homo sapiens Insulin-like growth factor I Proteins 0.000 description 1
- 101001046686 Homo sapiens Integrin alpha-M Proteins 0.000 description 1
- 101001002634 Homo sapiens Interleukin-1 alpha Proteins 0.000 description 1
- 101001076418 Homo sapiens Interleukin-1 receptor type 1 Proteins 0.000 description 1
- 101001055144 Homo sapiens Interleukin-2 receptor subunit alpha Proteins 0.000 description 1
- 101000998120 Homo sapiens Interleukin-3 receptor subunit alpha Proteins 0.000 description 1
- 101000777628 Homo sapiens Leukocyte antigen CD37 Proteins 0.000 description 1
- 101001064870 Homo sapiens Lon protease homolog, mitochondrial Proteins 0.000 description 1
- 101000878605 Homo sapiens Low affinity immunoglobulin epsilon Fc receptor Proteins 0.000 description 1
- 101000917858 Homo sapiens Low affinity immunoglobulin gamma Fc region receptor III-A Proteins 0.000 description 1
- 101000917839 Homo sapiens Low affinity immunoglobulin gamma Fc region receptor III-B Proteins 0.000 description 1
- 101001051093 Homo sapiens Low-density lipoprotein receptor Proteins 0.000 description 1
- 101001137987 Homo sapiens Lymphocyte activation gene 3 protein Proteins 0.000 description 1
- 101001090688 Homo sapiens Lymphocyte cytosolic protein 2 Proteins 0.000 description 1
- 101001014572 Homo sapiens MARCKS-related protein Proteins 0.000 description 1
- 101001012669 Homo sapiens Melanoma inhibitory activity protein 2 Proteins 0.000 description 1
- 101000583811 Homo sapiens Mitotic spindle assembly checkpoint protein MAD2B Proteins 0.000 description 1
- 101001030211 Homo sapiens Myc proto-oncogene protein Proteins 0.000 description 1
- 101001066305 Homo sapiens N-acetylgalactosamine-6-sulfatase Proteins 0.000 description 1
- 101000829992 Homo sapiens N-acetylglucosamine-6-sulfatase Proteins 0.000 description 1
- 101000651201 Homo sapiens N-sulphoglucosamine sulphohydrolase Proteins 0.000 description 1
- 101000998623 Homo sapiens NADH-cytochrome b5 reductase 3 Proteins 0.000 description 1
- 101001109508 Homo sapiens NKG2-A/NKG2-B type II integral membrane protein Proteins 0.000 description 1
- 101000578059 Homo sapiens Non-homologous end-joining factor 1 Proteins 0.000 description 1
- 101100351324 Homo sapiens PDPN gene Proteins 0.000 description 1
- 101001124867 Homo sapiens Peroxiredoxin-1 Proteins 0.000 description 1
- 101000801640 Homo sapiens Phospholipid-transporting ATPase ABCA3 Proteins 0.000 description 1
- 101000617725 Homo sapiens Pregnancy-specific beta-1-glycoprotein 2 Proteins 0.000 description 1
- 101000617536 Homo sapiens Presenilin-1 Proteins 0.000 description 1
- 101000617546 Homo sapiens Presenilin-2 Proteins 0.000 description 1
- 101000738940 Homo sapiens Proline-rich nuclear receptor coactivator 1 Proteins 0.000 description 1
- 101001105486 Homo sapiens Proteasome subunit alpha type-7 Proteins 0.000 description 1
- 101000876829 Homo sapiens Protein C-ets-1 Proteins 0.000 description 1
- 101000898093 Homo sapiens Protein C-ets-2 Proteins 0.000 description 1
- 101000585703 Homo sapiens Protein L-Myc Proteins 0.000 description 1
- 101000720958 Homo sapiens Protein artemis Proteins 0.000 description 1
- 101000695187 Homo sapiens Protein patched homolog 1 Proteins 0.000 description 1
- 101000702132 Homo sapiens Protein spinster homolog 1 Proteins 0.000 description 1
- 101001086862 Homo sapiens Pulmonary surfactant-associated protein B Proteins 0.000 description 1
- 101000612671 Homo sapiens Pulmonary surfactant-associated protein C Proteins 0.000 description 1
- 101001100327 Homo sapiens RNA-binding protein 45 Proteins 0.000 description 1
- 101001061518 Homo sapiens RNA-binding protein FUS Proteins 0.000 description 1
- 101001075466 Homo sapiens Regulatory factor X-associated protein Proteins 0.000 description 1
- 101000632270 Homo sapiens Semaphorin-3B Proteins 0.000 description 1
- 101001059454 Homo sapiens Serine/threonine-protein kinase MARK2 Proteins 0.000 description 1
- 101000605835 Homo sapiens Serine/threonine-protein kinase PINK1, mitochondrial Proteins 0.000 description 1
- 101000595531 Homo sapiens Serine/threonine-protein kinase pim-1 Proteins 0.000 description 1
- 101000884271 Homo sapiens Signal transducer CD24 Proteins 0.000 description 1
- 101000702606 Homo sapiens Structure-specific endonuclease subunit SLX4 Proteins 0.000 description 1
- 101000914496 Homo sapiens T-cell antigen CD7 Proteins 0.000 description 1
- 101000800488 Homo sapiens T-cell leukemia homeobox protein 1 Proteins 0.000 description 1
- 101000738413 Homo sapiens T-cell surface glycoprotein CD3 gamma chain Proteins 0.000 description 1
- 101000738335 Homo sapiens T-cell surface glycoprotein CD3 zeta chain Proteins 0.000 description 1
- 101000946843 Homo sapiens T-cell surface glycoprotein CD8 alpha chain Proteins 0.000 description 1
- 101000914484 Homo sapiens T-lymphocyte activation antigen CD80 Proteins 0.000 description 1
- 101000800312 Homo sapiens TERF1-interacting nuclear factor 2 Proteins 0.000 description 1
- 101000658622 Homo sapiens Testis-specific Y-encoded-like protein 2 Proteins 0.000 description 1
- 101000837626 Homo sapiens Thyroid hormone receptor alpha Proteins 0.000 description 1
- 101000891649 Homo sapiens Transcription elongation factor A protein-like 1 Proteins 0.000 description 1
- 101000813738 Homo sapiens Transcription factor ETV6 Proteins 0.000 description 1
- 101000636213 Homo sapiens Transcriptional activator Myb Proteins 0.000 description 1
- 101000611183 Homo sapiens Tumor necrosis factor Proteins 0.000 description 1
- 101000659267 Homo sapiens Tumor suppressor candidate 2 Proteins 0.000 description 1
- 101000912503 Homo sapiens Tyrosine-protein kinase Fgr Proteins 0.000 description 1
- 101001022129 Homo sapiens Tyrosine-protein kinase Fyn Proteins 0.000 description 1
- 101000934996 Homo sapiens Tyrosine-protein kinase JAK3 Proteins 0.000 description 1
- 101001054878 Homo sapiens Tyrosine-protein kinase Lyn Proteins 0.000 description 1
- 101000818543 Homo sapiens Tyrosine-protein kinase ZAP-70 Proteins 0.000 description 1
- 101001135589 Homo sapiens Tyrosine-protein phosphatase non-receptor type 22 Proteins 0.000 description 1
- 101000837581 Homo sapiens Ubiquitin-conjugating enzyme E2 T Proteins 0.000 description 1
- 101001061851 Homo sapiens V(D)J recombination-activating protein 2 Proteins 0.000 description 1
- 101000740759 Homo sapiens Voltage-dependent calcium channel subunit alpha-2/delta-2 Proteins 0.000 description 1
- 101000621371 Homo sapiens WD and tetratricopeptide repeats protein 1 Proteins 0.000 description 1
- 238000012450 HuMAb Mouse Methods 0.000 description 1
- 101000892274 Human adenovirus C serotype 2 Adenovirus death protein Proteins 0.000 description 1
- 241000701041 Human betaherpesvirus 7 Species 0.000 description 1
- 102100039285 Hyaluronidase-2 Human genes 0.000 description 1
- 102100031612 Hypermethylated in cancer 1 protein Human genes 0.000 description 1
- 101710133850 Hypermethylated in cancer 1 protein Proteins 0.000 description 1
- 206010062767 Hypophysitis Diseases 0.000 description 1
- 102000026633 IL6 Human genes 0.000 description 1
- 102100029199 Iduronate 2-sulfatase Human genes 0.000 description 1
- 108010003381 Iduronidase Proteins 0.000 description 1
- 102000004627 Iduronidase Human genes 0.000 description 1
- 108010054477 Immunoglobulin Fab Fragments Proteins 0.000 description 1
- 102000001706 Immunoglobulin Fab Fragments Human genes 0.000 description 1
- 108010021625 Immunoglobulin Fragments Proteins 0.000 description 1
- 102000008394 Immunoglobulin Fragments Human genes 0.000 description 1
- 102000016844 Immunoglobulin-like domains Human genes 0.000 description 1
- 108050006430 Immunoglobulin-like domains Proteins 0.000 description 1
- 102100039813 Inactive tyrosine-protein kinase 7 Human genes 0.000 description 1
- 208000026350 Inborn Genetic disease Diseases 0.000 description 1
- 208000022559 Inflammatory bowel disease Diseases 0.000 description 1
- 102000003781 Inhibitor of growth protein 1 Human genes 0.000 description 1
- 108090000191 Inhibitor of growth protein 1 Proteins 0.000 description 1
- 229930010555 Inosine Natural products 0.000 description 1
- UGQMRVRMYYASKQ-KQYNXXCUSA-N Inosine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C2=NC=NC(O)=C2N=C1 UGQMRVRMYYASKQ-KQYNXXCUSA-N 0.000 description 1
- 108010001127 Insulin Receptor Proteins 0.000 description 1
- 102100036721 Insulin receptor Human genes 0.000 description 1
- 102100037852 Insulin-like growth factor I Human genes 0.000 description 1
- 102000004289 Interferon regulatory factor 1 Human genes 0.000 description 1
- 108090000890 Interferon regulatory factor 1 Proteins 0.000 description 1
- 102000006992 Interferon-alpha Human genes 0.000 description 1
- 108010047761 Interferon-alpha Proteins 0.000 description 1
- 102000003996 Interferon-beta Human genes 0.000 description 1
- 108090000467 Interferon-beta Proteins 0.000 description 1
- 102000008070 Interferon-gamma Human genes 0.000 description 1
- 108010074328 Interferon-gamma Proteins 0.000 description 1
- 102000014150 Interferons Human genes 0.000 description 1
- 108010050904 Interferons Proteins 0.000 description 1
- 108010066719 Interleukin Receptor Common gamma Subunit Proteins 0.000 description 1
- 102100026016 Interleukin-1 receptor type 1 Human genes 0.000 description 1
- 102000003814 Interleukin-10 Human genes 0.000 description 1
- 108090000174 Interleukin-10 Proteins 0.000 description 1
- 108090000177 Interleukin-11 Proteins 0.000 description 1
- 102000003815 Interleukin-11 Human genes 0.000 description 1
- 108010065805 Interleukin-12 Proteins 0.000 description 1
- 102000013462 Interleukin-12 Human genes 0.000 description 1
- 102100026878 Interleukin-2 receptor subunit alpha Human genes 0.000 description 1
- 108010002386 Interleukin-3 Proteins 0.000 description 1
- 102000000646 Interleukin-3 Human genes 0.000 description 1
- 102100033493 Interleukin-3 receptor subunit alpha Human genes 0.000 description 1
- 102000000743 Interleukin-5 Human genes 0.000 description 1
- 102000004889 Interleukin-6 Human genes 0.000 description 1
- 108090001007 Interleukin-8 Proteins 0.000 description 1
- 102000004890 Interleukin-8 Human genes 0.000 description 1
- 108010002335 Interleukin-9 Proteins 0.000 description 1
- 102000000585 Interleukin-9 Human genes 0.000 description 1
- 201000005807 Japanese encephalitis Diseases 0.000 description 1
- 101150069255 KLRC1 gene Proteins 0.000 description 1
- 238000012449 Kunming mouse Methods 0.000 description 1
- 102000017578 LAG3 Human genes 0.000 description 1
- 108091008555 LTK receptors Proteins 0.000 description 1
- 241000689670 Lachnospiraceae bacterium ND2006 Species 0.000 description 1
- 241000186660 Lactobacillus Species 0.000 description 1
- 241000282838 Lama Species 0.000 description 1
- 108010000851 Laminin Receptors Proteins 0.000 description 1
- 102000002297 Laminin Receptors Human genes 0.000 description 1
- 241000589248 Legionella Species 0.000 description 1
- 208000007764 Legionnaires' Disease Diseases 0.000 description 1
- 108010006444 Leucine-Rich Repeat Proteins Proteins 0.000 description 1
- 108010020246 Leucine-Rich Repeat Serine-Threonine Protein Kinase-2 Proteins 0.000 description 1
- 102100032693 Leucine-rich repeat serine/threonine-protein kinase 2 Human genes 0.000 description 1
- 206010024291 Leukaemias acute myeloid Diseases 0.000 description 1
- 102100031586 Leukocyte antigen CD37 Human genes 0.000 description 1
- 102000019298 Lipocalin Human genes 0.000 description 1
- 108050006654 Lipocalin Proteins 0.000 description 1
- 102100038007 Low affinity immunoglobulin epsilon Fc receptor Human genes 0.000 description 1
- 102100029204 Low affinity immunoglobulin gamma Fc region receptor II-a Human genes 0.000 description 1
- 102100029185 Low affinity immunoglobulin gamma Fc region receptor III-B Human genes 0.000 description 1
- 102100024640 Low-density lipoprotein receptor Human genes 0.000 description 1
- 102100034709 Lymphocyte cytosolic protein 2 Human genes 0.000 description 1
- 206010025323 Lymphomas Diseases 0.000 description 1
- 102100033448 Lysosomal alpha-glucosidase Human genes 0.000 description 1
- 102100026371 MHC class II transactivator Human genes 0.000 description 1
- 108700002010 MHC class II transactivator Proteins 0.000 description 1
- 108700012912 MYCN Proteins 0.000 description 1
- 101150022024 MYCN gene Proteins 0.000 description 1
- 101100404845 Macaca mulatta NKG2A gene Proteins 0.000 description 1
- 206010050183 Macrocephaly Diseases 0.000 description 1
- 241000124008 Mammalia Species 0.000 description 1
- 229930195725 Mannitol Natural products 0.000 description 1
- 101710085938 Matrix protein Proteins 0.000 description 1
- 241000712079 Measles morbillivirus Species 0.000 description 1
- 208000005767 Megalencephaly Diseases 0.000 description 1
- 102100029778 Melanoma inhibitory activity protein 2 Human genes 0.000 description 1
- 108010049137 Member 1 Subfamily D ATP Binding Cassette Transporter Proteins 0.000 description 1
- 101710127721 Membrane protein Proteins 0.000 description 1
- 108700011259 MicroRNAs Proteins 0.000 description 1
- 102100030955 Mitotic spindle assembly checkpoint protein MAD2B Human genes 0.000 description 1
- 102100025751 Mothers against decapentaplegic homolog 2 Human genes 0.000 description 1
- 102100025725 Mothers against decapentaplegic homolog 4 Human genes 0.000 description 1
- 206010073148 Multiple endocrine neoplasia type 2A Diseases 0.000 description 1
- 208000034578 Multiple myelomas Diseases 0.000 description 1
- 241000699660 Mus musculus Species 0.000 description 1
- 101100437777 Mus musculus Bmpr1a gene Proteins 0.000 description 1
- 101100240347 Mus musculus Nectin2 gene Proteins 0.000 description 1
- 101000596402 Mus musculus Neuronal vesicle trafficking-associated protein 1 Proteins 0.000 description 1
- 101100364671 Mus musculus Ryk gene Proteins 0.000 description 1
- 101000800539 Mus musculus Translationally-controlled tumor protein Proteins 0.000 description 1
- 101100268066 Mus musculus Zap70 gene Proteins 0.000 description 1
- 241000204031 Mycoplasma Species 0.000 description 1
- 208000033776 Myeloid Acute Leukemia Diseases 0.000 description 1
- 101001055320 Myxine glutinosa Insulin-like growth factor Proteins 0.000 description 1
- 108700026495 N-Myc Proto-Oncogene Proteins 0.000 description 1
- 102100031688 N-acetylgalactosamine-6-sulfatase Human genes 0.000 description 1
- 102100023282 N-acetylglucosamine-6-sulfatase Human genes 0.000 description 1
- 102100030124 N-myc proto-oncogene protein Human genes 0.000 description 1
- 102100027661 N-sulphoglucosamine sulphohydrolase Human genes 0.000 description 1
- 102100033153 NADH-cytochrome b5 reductase 3 Human genes 0.000 description 1
- 102100022682 NKG2-A/NKG2-B type II integral membrane protein Human genes 0.000 description 1
- 108010077854 Natural Killer Cell Receptors Proteins 0.000 description 1
- 102000010648 Natural Killer Cell Receptors Human genes 0.000 description 1
- 102100023064 Nectin-1 Human genes 0.000 description 1
- 101710043845 Nectin-1 Proteins 0.000 description 1
- 241000588653 Neisseria Species 0.000 description 1
- 102000048850 Neoplasm Genes Human genes 0.000 description 1
- 108700019961 Neoplasm Genes Proteins 0.000 description 1
- 206010029098 Neoplasm skin Diseases 0.000 description 1
- 108010025020 Nerve Growth Factor Proteins 0.000 description 1
- 108010006232 Neuraminidase Proteins 0.000 description 1
- 102000005348 Neuraminidase Human genes 0.000 description 1
- 101100462611 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) prr-1 gene Proteins 0.000 description 1
- 108090000742 Neurotrophin 3 Proteins 0.000 description 1
- 241000135938 Nitratifractor Species 0.000 description 1
- 102100028156 Non-homologous end-joining factor 1 Human genes 0.000 description 1
- 230000005913 Notch signaling pathway Effects 0.000 description 1
- 101150074217 Nprl2 gene Proteins 0.000 description 1
- 102000011931 Nucleoproteins Human genes 0.000 description 1
- 108010061100 Nucleoproteins Proteins 0.000 description 1
- 108700027851 ORAI1 Proteins 0.000 description 1
- 108700026244 Open Reading Frames Proteins 0.000 description 1
- 101710131036 Opsin-1 Proteins 0.000 description 1
- 241000713112 Orthobunyavirus Species 0.000 description 1
- 241000150452 Orthohantavirus Species 0.000 description 1
- 241000283973 Oryctolagus cuniculus Species 0.000 description 1
- 240000007594 Oryza sativa Species 0.000 description 1
- 235000007164 Oryza sativa Nutrition 0.000 description 1
- 101710093908 Outer capsid protein VP4 Proteins 0.000 description 1
- 101710135467 Outer capsid protein sigma-1 Proteins 0.000 description 1
- 206010033128 Ovarian cancer Diseases 0.000 description 1
- 206010061535 Ovarian neoplasm Diseases 0.000 description 1
- 229910019142 PO4 Inorganic materials 0.000 description 1
- 206010061902 Pancreatic neoplasm Diseases 0.000 description 1
- 241001631646 Papillomaviridae Species 0.000 description 1
- 208000018737 Parkinson disease Diseases 0.000 description 1
- 102100037499 Parkinson disease protein 7 Human genes 0.000 description 1
- 102100040884 Partner and localizer of BRCA2 Human genes 0.000 description 1
- 241001386753 Parvibaculum Species 0.000 description 1
- 108010071083 Patched-2 Receptor Proteins 0.000 description 1
- 235000019483 Peanut oil Nutrition 0.000 description 1
- 108010067902 Peptide Library Proteins 0.000 description 1
- 208000031845 Pernicious anaemia Diseases 0.000 description 1
- 102000011755 Phosphoglycerate Kinase Human genes 0.000 description 1
- 102100033623 Phospholipid-transporting ATPase ABCA3 Human genes 0.000 description 1
- ABLZXFCXXLZCGV-UHFFFAOYSA-N Phosphorous acid Chemical class OP(O)=O ABLZXFCXXLZCGV-UHFFFAOYSA-N 0.000 description 1
- 108091000080 Phosphotransferase Proteins 0.000 description 1
- 241000709664 Picornaviridae Species 0.000 description 1
- 206010035226 Plasma cell myeloma Diseases 0.000 description 1
- 102100037265 Podoplanin Human genes 0.000 description 1
- 208000000474 Poliomyelitis Diseases 0.000 description 1
- 239000004952 Polyamide Substances 0.000 description 1
- 229920002732 Polyanhydride Polymers 0.000 description 1
- 239000004698 Polyethylene Substances 0.000 description 1
- 102100022019 Pregnancy-specific beta-1-glycoprotein 2 Human genes 0.000 description 1
- 102100022033 Presenilin-1 Human genes 0.000 description 1
- 102100022036 Presenilin-2 Human genes 0.000 description 1
- 101710101148 Probable 6-oxopurine nucleoside phosphorylase Proteins 0.000 description 1
- 101710121972 Prolactin-3D1 Proteins 0.000 description 1
- 102100038277 Prostaglandin G/H synthase 1 Human genes 0.000 description 1
- 108050003243 Prostaglandin G/H synthase 1 Proteins 0.000 description 1
- 206010060862 Prostate cancer Diseases 0.000 description 1
- 208000000236 Prostatic Neoplasms Diseases 0.000 description 1
- 102100021201 Proteasome subunit alpha type-7 Human genes 0.000 description 1
- 101710176177 Protein A56 Proteins 0.000 description 1
- 102100035251 Protein C-ets-1 Human genes 0.000 description 1
- 102100021890 Protein C-ets-2 Human genes 0.000 description 1
- 108010032428 Protein Deglycase DJ-1 Proteins 0.000 description 1
- 102100032831 Protein ITPRID2 Human genes 0.000 description 1
- 102100030128 Protein L-Myc Human genes 0.000 description 1
- 101710192141 Protein Nef Proteins 0.000 description 1
- 102100028588 Protein ZNRD2 Human genes 0.000 description 1
- 102100025918 Protein artemis Human genes 0.000 description 1
- 102100028680 Protein patched homolog 1 Human genes 0.000 description 1
- 102100036894 Protein patched homolog 2 Human genes 0.000 description 1
- 102100024267 Proton-coupled folate transporter Human genes 0.000 description 1
- 241000125945 Protoparvovirus Species 0.000 description 1
- 241000709748 Pseudomonas phage PRR1 Species 0.000 description 1
- 102100032617 Pulmonary surfactant-associated protein B Human genes 0.000 description 1
- 102100040971 Pulmonary surfactant-associated protein C Human genes 0.000 description 1
- 102000030764 Purine-nucleoside phosphorylase Human genes 0.000 description 1
- 108020005115 Pyruvate Kinase Proteins 0.000 description 1
- 102000013009 Pyruvate Kinase Human genes 0.000 description 1
- 108700014121 Pyruvate Kinase Deficiency of Red Cells Proteins 0.000 description 1
- 102000001195 RAD51 Human genes 0.000 description 1
- 102000001183 RAG-1 Human genes 0.000 description 1
- 108060006897 RAG1 Proteins 0.000 description 1
- 108020005067 RNA Splice Sites Proteins 0.000 description 1
- 230000021839 RNA stabilization Effects 0.000 description 1
- 102100038823 RNA-binding protein 45 Human genes 0.000 description 1
- 102100028469 RNA-binding protein FUS Human genes 0.000 description 1
- 108090000292 RNA-binding protein FUS Proteins 0.000 description 1
- 102000003890 RNA-binding protein FUS Human genes 0.000 description 1
- 108010092799 RNA-directed DNA polymerase Proteins 0.000 description 1
- 238000011529 RT qPCR Methods 0.000 description 1
- 108010068097 Rad51 Recombinase Proteins 0.000 description 1
- 101001039269 Rattus norvegicus Glycine N-methyltransferase Proteins 0.000 description 1
- 101100517381 Rattus norvegicus Ntrk1 gene Proteins 0.000 description 1
- 101000820656 Rattus norvegicus Seminal vesicle secretory protein 4 Proteins 0.000 description 1
- 108091005682 Receptor kinases Proteins 0.000 description 1
- 108020004511 Recombinant DNA Proteins 0.000 description 1
- 102100021043 Regulatory factor X-associated protein Human genes 0.000 description 1
- 241000702263 Reovirus sp. Species 0.000 description 1
- 102100038042 Retinoblastoma-associated protein Human genes 0.000 description 1
- 108010000605 Ribosomal Proteins Proteins 0.000 description 1
- 241000605947 Roseburia Species 0.000 description 1
- 241000714474 Rous sarcoma virus Species 0.000 description 1
- 241000710799 Rubella virus Species 0.000 description 1
- 108091007566 SLC46A1 Proteins 0.000 description 1
- 101150019443 SMAD4 gene Proteins 0.000 description 1
- 102000001332 SRC Human genes 0.000 description 1
- 108060006706 SRC Proteins 0.000 description 1
- 235000019485 Safflower oil Nutrition 0.000 description 1
- 101000999689 Saimiriine herpesvirus 2 (strain 11) Transcriptional regulator ICP22 homolog Proteins 0.000 description 1
- 101100379247 Salmo trutta apoa1 gene Proteins 0.000 description 1
- 101000781972 Schizosaccharomyces pombe (strain 972 / ATCC 24843) Protein wos2 Proteins 0.000 description 1
- 101100537955 Schizosaccharomyces pombe (strain 972 / ATCC 24843) trk1 gene Proteins 0.000 description 1
- 206010054979 Secondary immunodeficiency Diseases 0.000 description 1
- 102100027979 Semaphorin-3B Human genes 0.000 description 1
- 102100028904 Serine/threonine-protein kinase MARK2 Human genes 0.000 description 1
- 102100038376 Serine/threonine-protein kinase PINK1, mitochondrial Human genes 0.000 description 1
- 102100036077 Serine/threonine-protein kinase pim-1 Human genes 0.000 description 1
- 208000000859 Sickle cell trait Diseases 0.000 description 1
- 102100038081 Signal transducer CD24 Human genes 0.000 description 1
- VYPSYNLAJGMNEJ-UHFFFAOYSA-N Silicium dioxide Chemical compound O=[Si]=O VYPSYNLAJGMNEJ-UHFFFAOYSA-N 0.000 description 1
- 241000700584 Simplexvirus Species 0.000 description 1
- 208000000453 Skin Neoplasms Diseases 0.000 description 1
- 108700032504 Smad2 Proteins 0.000 description 1
- 101150102611 Smad2 gene Proteins 0.000 description 1
- 108700031298 Smad4 Proteins 0.000 description 1
- 102000039471 Small Nuclear RNA Human genes 0.000 description 1
- 101001039853 Sonchus yellow net virus Matrix protein Proteins 0.000 description 1
- 102100032889 Sortilin Human genes 0.000 description 1
- 241000949716 Sphaerochaeta Species 0.000 description 1
- 241000191940 Staphylococcus Species 0.000 description 1
- 108091081024 Start codon Proteins 0.000 description 1
- 108010090804 Streptavidin Proteins 0.000 description 1
- 241000194017 Streptococcus Species 0.000 description 1
- 241000193996 Streptococcus pyogenes Species 0.000 description 1
- 241000194020 Streptococcus thermophilus Species 0.000 description 1
- 108090000532 Stromal Interaction Molecule 1 Proteins 0.000 description 1
- 102000004094 Stromal Interaction Molecule 1 Human genes 0.000 description 1
- 102100031003 Structure-specific endonuclease subunit SLX4 Human genes 0.000 description 1
- 108010021188 Superoxide Dismutase-1 Proteins 0.000 description 1
- 102100038836 Superoxide dismutase [Cu-Zn] Human genes 0.000 description 1
- 101710137302 Surface antigen S Proteins 0.000 description 1
- 241000123710 Sutterella Species 0.000 description 1
- 230000006044 T cell activation Effects 0.000 description 1
- 108700042076 T-Cell Receptor alpha Genes Proteins 0.000 description 1
- 102100033111 T-cell leukemia homeobox protein 1 Human genes 0.000 description 1
- 102100037911 T-cell surface glycoprotein CD3 gamma chain Human genes 0.000 description 1
- 102100037906 T-cell surface glycoprotein CD3 zeta chain Human genes 0.000 description 1
- 102100034922 T-cell surface glycoprotein CD8 alpha chain Human genes 0.000 description 1
- 102100027222 T-lymphocyte activation antigen CD80 Human genes 0.000 description 1
- 102100040347 TAR DNA-binding protein 43 Human genes 0.000 description 1
- 101150014554 TARDBP gene Proteins 0.000 description 1
- 102100033085 TERF1-interacting nuclear factor 2 Human genes 0.000 description 1
- 241001365914 Taira Species 0.000 description 1
- 101001051488 Takifugu rubripes Neural cell adhesion molecule L1 Proteins 0.000 description 1
- 102100034917 Testis-specific Y-encoded-like protein 2 Human genes 0.000 description 1
- 206010043395 Thalassaemia sickle cell Diseases 0.000 description 1
- 101001099217 Thermotoga maritima (strain ATCC 43589 / DSM 3109 / JCM 10099 / NBRC 100826 / MSB8) Triosephosphate isomerase Proteins 0.000 description 1
- 208000007536 Thrombosis Diseases 0.000 description 1
- 108060008245 Thrombospondin Proteins 0.000 description 1
- 102000002938 Thrombospondin Human genes 0.000 description 1
- 102000006601 Thymidine Kinase Human genes 0.000 description 1
- 108020004440 Thymidine kinase Proteins 0.000 description 1
- 102100028702 Thyroid hormone receptor alpha Human genes 0.000 description 1
- 102100030951 Tissue factor pathway inhibitor Human genes 0.000 description 1
- 101001009610 Toxoplasma gondii Dense granule protein 5 Proteins 0.000 description 1
- 229920001615 Tragacanth Polymers 0.000 description 1
- 102100040250 Transcription elongation factor A protein-like 1 Human genes 0.000 description 1
- 102100039580 Transcription factor ETV6 Human genes 0.000 description 1
- 102100030780 Transcriptional activator Myb Human genes 0.000 description 1
- 108050008367 Transmembrane emp24 domain-containing protein 7 Proteins 0.000 description 1
- 102100021728 Transmembrane reductase CYB561D2 Human genes 0.000 description 1
- 241000589886 Treponema Species 0.000 description 1
- 108010023649 Tripartite Motif Proteins Proteins 0.000 description 1
- 108010030743 Tropomyosin Proteins 0.000 description 1
- 102000005937 Tropomyosin Human genes 0.000 description 1
- 102000018252 Tumor Protein p73 Human genes 0.000 description 1
- 108010091356 Tumor Protein p73 Proteins 0.000 description 1
- 108700025716 Tumor Suppressor Genes Proteins 0.000 description 1
- 102000044209 Tumor Suppressor Genes Human genes 0.000 description 1
- 108010078814 Tumor Suppressor Protein p53 Proteins 0.000 description 1
- 102100036129 Tumor suppressor candidate 2 Human genes 0.000 description 1
- 102100026150 Tyrosine-protein kinase Fgr Human genes 0.000 description 1
- 102100035221 Tyrosine-protein kinase Fyn Human genes 0.000 description 1
- 102100025387 Tyrosine-protein kinase JAK3 Human genes 0.000 description 1
- 102100026857 Tyrosine-protein kinase Lyn Human genes 0.000 description 1
- 102100021125 Tyrosine-protein kinase ZAP-70 Human genes 0.000 description 1
- 102100037236 Tyrosine-protein kinase receptor UFO Human genes 0.000 description 1
- 102100033138 Tyrosine-protein phosphatase non-receptor type 22 Human genes 0.000 description 1
- 102100028705 Ubiquitin-conjugating enzyme E2 T Human genes 0.000 description 1
- 101710172430 Uracil-DNA glycosylase inhibitor Proteins 0.000 description 1
- 102100029591 V(D)J recombination-activating protein 2 Human genes 0.000 description 1
- 241000700647 Variola virus Species 0.000 description 1
- 108010059722 Viral Fusion Proteins Proteins 0.000 description 1
- 108700005077 Viral Genes Proteins 0.000 description 1
- 108010067390 Viral Proteins Proteins 0.000 description 1
- 108020000999 Viral RNA Proteins 0.000 description 1
- 102100037058 Voltage-dependent calcium channel subunit alpha-2/delta-2 Human genes 0.000 description 1
- 102000040856 WT1 Human genes 0.000 description 1
- 101150084041 WT1 gene Proteins 0.000 description 1
- 208000000260 Warts Diseases 0.000 description 1
- 241000710886 West Nile virus Species 0.000 description 1
- 102000013814 Wnt Human genes 0.000 description 1
- 108050003627 Wnt Proteins 0.000 description 1
- 230000004156 Wnt signaling pathway Effects 0.000 description 1
- 208000023940 X-Linked Combined Immunodeficiency disease Diseases 0.000 description 1
- 101001038499 Yarrowia lipolytica (strain CLIB 122 / E 150) Lysine acetyltransferase Proteins 0.000 description 1
- 230000001594 aberrant effect Effects 0.000 description 1
- 239000000370 acceptor Substances 0.000 description 1
- 229960000583 acetic acid Drugs 0.000 description 1
- 235000011054 acetic acid Nutrition 0.000 description 1
- DPXJVFZANSGRMM-UHFFFAOYSA-N acetic acid;2,3,4,5,6-pentahydroxyhexanal;sodium Chemical compound [Na].CC(O)=O.OCC(O)C(O)C(O)C(O)C=O DPXJVFZANSGRMM-UHFFFAOYSA-N 0.000 description 1
- 125000002015 acyclic group Chemical group 0.000 description 1
- 150000001266 acyl halides Chemical class 0.000 description 1
- 238000007792 addition Methods 0.000 description 1
- 238000011374 additional therapy Methods 0.000 description 1
- 229960000643 adenine Drugs 0.000 description 1
- 201000009628 adenosine deaminase deficiency Diseases 0.000 description 1
- 230000001919 adrenal effect Effects 0.000 description 1
- 239000008272 agar Substances 0.000 description 1
- 238000000246 agarose gel electrophoresis Methods 0.000 description 1
- 235000010443 alginic acid Nutrition 0.000 description 1
- 239000000783 alginic acid Substances 0.000 description 1
- 229920000615 alginic acid Polymers 0.000 description 1
- 229960001126 alginic acid Drugs 0.000 description 1
- 150000004781 alginic acids Chemical class 0.000 description 1
- 125000001931 aliphatic group Chemical group 0.000 description 1
- 125000000217 alkyl group Chemical group 0.000 description 1
- 150000001350 alkyl halides Chemical class 0.000 description 1
- 125000005600 alkyl phosphonate group Chemical group 0.000 description 1
- 108010009380 alpha-N-acetyl-D-glucosaminidase Proteins 0.000 description 1
- 201000008333 alpha-mannosidosis Diseases 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- WNROFYMDJYEPJX-UHFFFAOYSA-K aluminium hydroxide Chemical compound [OH-].[OH-].[OH-].[Al+3] WNROFYMDJYEPJX-UHFFFAOYSA-K 0.000 description 1
- 150000001408 amides Chemical class 0.000 description 1
- 150000001412 amines Chemical class 0.000 description 1
- 238000004873 anchoring Methods 0.000 description 1
- 208000007502 anemia Diseases 0.000 description 1
- 238000000137 annealing Methods 0.000 description 1
- 230000001093 anti-cancer Effects 0.000 description 1
- 230000000890 antigenic effect Effects 0.000 description 1
- 125000003118 aryl group Chemical group 0.000 description 1
- 150000001502 aryl halides Chemical class 0.000 description 1
- 210000001130 astrocyte Anatomy 0.000 description 1
- 125000004429 atom Chemical group 0.000 description 1
- QVGXLLKOCUKJST-UHFFFAOYSA-N atomic oxygen Chemical compound [O] QVGXLLKOCUKJST-UHFFFAOYSA-N 0.000 description 1
- 230000002238 attenuated effect Effects 0.000 description 1
- 229940000635 beta-alanine Drugs 0.000 description 1
- 201000006486 beta-mannosidosis Diseases 0.000 description 1
- 230000002457 bidirectional effect Effects 0.000 description 1
- 230000031018 biological processes and functions Effects 0.000 description 1
- 230000033228 biological regulation Effects 0.000 description 1
- 230000008512 biological response Effects 0.000 description 1
- 108010005713 bis(5'-adenosyl)triphosphatase Proteins 0.000 description 1
- 238000004820 blood count Methods 0.000 description 1
- 239000007853 buffer solution Substances 0.000 description 1
- 239000006227 byproduct Substances 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000036952 cancer formation Effects 0.000 description 1
- 125000001369 canonical nucleoside group Chemical group 0.000 description 1
- 125000002837 carbocyclic group Chemical group 0.000 description 1
- 150000001720 carbohydrates Chemical class 0.000 description 1
- 229910052799 carbon Inorganic materials 0.000 description 1
- 239000001768 carboxy methyl cellulose Substances 0.000 description 1
- 231100000504 carcinogenesis Toxicity 0.000 description 1
- 230000003197 catalytic effect Effects 0.000 description 1
- 230000020411 cell activation Effects 0.000 description 1
- 230000003915 cell function Effects 0.000 description 1
- 230000004663 cell proliferation Effects 0.000 description 1
- 230000005859 cell recognition Effects 0.000 description 1
- 108091092328 cellular RNA Proteins 0.000 description 1
- 230000002032 cellular defenses Effects 0.000 description 1
- 239000001913 cellulose Substances 0.000 description 1
- 229920002678 cellulose Polymers 0.000 description 1
- 229920002301 cellulose acetate Polymers 0.000 description 1
- 238000002512 chemotherapy Methods 0.000 description 1
- 230000001684 chronic effect Effects 0.000 description 1
- RAURUSFBVQLAPW-DNIKMYEQSA-N clocinnamox Chemical compound N1([C@@H]2CC3=CC=C(C=4O[C@@H]5[C@](C3=4)([C@]2(CCC5=O)NC(=O)\C=C\C=2C=CC(Cl)=CC=2)CC1)O)CC1CC1 RAURUSFBVQLAPW-DNIKMYEQSA-N 0.000 description 1
- 238000010367 cloning Methods 0.000 description 1
- 108700032673 cocaine- and amphetamine-regulated transcript Proteins 0.000 description 1
- 229940110456 cocoa butter Drugs 0.000 description 1
- 235000019868 cocoa butter Nutrition 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 230000001010 compromised effect Effects 0.000 description 1
- 238000002591 computed tomography Methods 0.000 description 1
- 238000007596 consolidation process Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000011109 contamination Methods 0.000 description 1
- 235000005687 corn oil Nutrition 0.000 description 1
- 239000002285 corn oil Substances 0.000 description 1
- 239000008120 corn starch Substances 0.000 description 1
- 230000000139 costimulatory effect Effects 0.000 description 1
- 235000012343 cottonseed oil Nutrition 0.000 description 1
- 239000002385 cottonseed oil Substances 0.000 description 1
- 239000013078 crystal Substances 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 125000000113 cyclohexyl group Chemical group [H]C1([H])C([H])([H])C([H])([H])C([H])(*)C([H])([H])C1([H])[H] 0.000 description 1
- 102000003675 cytokine receptors Human genes 0.000 description 1
- 108010057085 cytokine receptors Proteins 0.000 description 1
- 230000009615 deamination Effects 0.000 description 1
- 238000006481 deamination reaction Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 101150060629 def gene Proteins 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000001934 delay Effects 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 239000005547 deoxyribonucleotide Substances 0.000 description 1
- 125000002637 deoxyribonucleotide group Chemical group 0.000 description 1
- 230000000779 depleting effect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- ANCLJVISBRWUTR-UHFFFAOYSA-N diaminophosphinic acid Chemical compound NP(N)(O)=O ANCLJVISBRWUTR-UHFFFAOYSA-N 0.000 description 1
- 229910003460 diamond Inorganic materials 0.000 description 1
- 239000010432 diamond Substances 0.000 description 1
- BABWHSBPEIVBBZ-UHFFFAOYSA-N diazete Chemical compound C1=CN=N1 BABWHSBPEIVBBZ-UHFFFAOYSA-N 0.000 description 1
- 235000005911 diet Nutrition 0.000 description 1
- 230000037213 diet Effects 0.000 description 1
- NAGJZTKCGNOGPW-UHFFFAOYSA-N dithiophosphoric acid Chemical class OP(O)(S)=S NAGJZTKCGNOGPW-UHFFFAOYSA-N 0.000 description 1
- 238000012377 drug delivery Methods 0.000 description 1
- 208000009356 dyskeratosis congenita Diseases 0.000 description 1
- 230000008482 dysregulation Effects 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 230000008519 endogenous mechanism Effects 0.000 description 1
- 108700004025 env Genes Proteins 0.000 description 1
- 238000002641 enzyme replacement therapy Methods 0.000 description 1
- 102000012803 ephrin Human genes 0.000 description 1
- 108060002566 ephrin Proteins 0.000 description 1
- 210000002919 epithelial cell Anatomy 0.000 description 1
- 210000000267 erythroid cell Anatomy 0.000 description 1
- 235000019325 ethyl cellulose Nutrition 0.000 description 1
- 229920001249 ethyl cellulose Polymers 0.000 description 1
- LVGKNOAMLMIIKO-QXMHVHEDSA-N ethyl oleate Chemical compound CCCCCCCC\C=C/CCCCCCCC(=O)OCC LVGKNOAMLMIIKO-QXMHVHEDSA-N 0.000 description 1
- 229940093471 ethyl oleate Drugs 0.000 description 1
- 230000029142 excretion Effects 0.000 description 1
- 238000013401 experimental design Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 239000000945 filler Substances 0.000 description 1
- 235000013312 flour Nutrition 0.000 description 1
- 239000007850 fluorescent dye Substances 0.000 description 1
- 102000006815 folate receptor Human genes 0.000 description 1
- 108020005243 folate receptor Proteins 0.000 description 1
- 108700004026 gag Genes Proteins 0.000 description 1
- 229960003692 gamma aminobutyric acid Drugs 0.000 description 1
- 210000004475 gamma-delta t lymphocyte Anatomy 0.000 description 1
- 239000007789 gas Substances 0.000 description 1
- 210000001035 gastrointestinal tract Anatomy 0.000 description 1
- 238000012226 gene silencing method Methods 0.000 description 1
- 102000034356 gene-regulatory proteins Human genes 0.000 description 1
- 108091006104 gene-regulatory proteins Proteins 0.000 description 1
- 208000016361 genetic disease Diseases 0.000 description 1
- 238000010353 genetic engineering Methods 0.000 description 1
- 231100000025 genetic toxicology Toxicity 0.000 description 1
- 210000004602 germ cell Anatomy 0.000 description 1
- YQEMORVAKMFKLG-UHFFFAOYSA-N glycerine monostearate Natural products CCCCCCCCCCCCCCCCCC(=O)OC(CO)CO YQEMORVAKMFKLG-UHFFFAOYSA-N 0.000 description 1
- SVUQHVRAGMNPLW-UHFFFAOYSA-N glycerol monostearate Natural products CCCCCCCCCCCCCCCCC(=O)OCC(O)CO SVUQHVRAGMNPLW-UHFFFAOYSA-N 0.000 description 1
- 201000004502 glycogen storage disease II Diseases 0.000 description 1
- 150000002334 glycols Chemical class 0.000 description 1
- 230000009931 harmful effect Effects 0.000 description 1
- 210000003128 head Anatomy 0.000 description 1
- 210000003709 heart valve Anatomy 0.000 description 1
- 239000000185 hemagglutinin Substances 0.000 description 1
- 208000014951 hematologic disease Diseases 0.000 description 1
- 208000019691 hematopoietic and lymphoid cell neoplasm Diseases 0.000 description 1
- 208000018706 hematopoietic system disease Diseases 0.000 description 1
- 208000006454 hepatitis Diseases 0.000 description 1
- 231100000283 hepatitis Toxicity 0.000 description 1
- 208000005252 hepatitis A Diseases 0.000 description 1
- 208000002672 hepatitis B Diseases 0.000 description 1
- DMEGYFMYUHOHGS-UHFFFAOYSA-N heptamethylene Natural products C1CCCCCC1 DMEGYFMYUHOHGS-UHFFFAOYSA-N 0.000 description 1
- 229940022353 herceptin Drugs 0.000 description 1
- 125000001072 heteroaryl group Chemical group 0.000 description 1
- 102000048657 human ACE2 Human genes 0.000 description 1
- 102000045108 human EGFR Human genes 0.000 description 1
- 102000057310 human KLRC1 Human genes 0.000 description 1
- 210000005260 human cell Anatomy 0.000 description 1
- 238000009396 hybridization Methods 0.000 description 1
- 125000002887 hydroxy group Chemical group [H]O* 0.000 description 1
- WGCNASOHLSPBMP-UHFFFAOYSA-N hydroxyacetaldehyde Natural products OCC=O WGCNASOHLSPBMP-UHFFFAOYSA-N 0.000 description 1
- 239000012216 imaging agent Substances 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 230000001900 immune effect Effects 0.000 description 1
- 230000002163 immunogen Effects 0.000 description 1
- 230000005847 immunogenicity Effects 0.000 description 1
- 230000016784 immunoglobulin production Effects 0.000 description 1
- 238000002513 implantation Methods 0.000 description 1
- 230000002779 inactivation Effects 0.000 description 1
- 238000010348 incorporation Methods 0.000 description 1
- 239000007924 injection Substances 0.000 description 1
- 238000002347 injection Methods 0.000 description 1
- 208000014674 injury Diseases 0.000 description 1
- 230000015788 innate immune response Effects 0.000 description 1
- 229960003786 inosine Drugs 0.000 description 1
- 239000012212 insulator Substances 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 229940079322 interferon Drugs 0.000 description 1
- 229960003130 interferon gamma Drugs 0.000 description 1
- 229960001388 interferon-beta Drugs 0.000 description 1
- 108090000237 interleukin-24 Proteins 0.000 description 1
- 102000003898 interleukin-24 Human genes 0.000 description 1
- 230000000968 intestinal effect Effects 0.000 description 1
- 210000000936 intestine Anatomy 0.000 description 1
- 150000002540 isothiocyanates Chemical class 0.000 description 1
- 229940039696 lactobacillus Drugs 0.000 description 1
- 231100000518 lethal Toxicity 0.000 description 1
- 230000001665 lethal effect Effects 0.000 description 1
- 210000004901 leucine-rich repeat Anatomy 0.000 description 1
- 108020001756 ligand binding domains Proteins 0.000 description 1
- 230000000670 limiting effect Effects 0.000 description 1
- 108010013555 lipoprotein-associated coagulation inhibitor Proteins 0.000 description 1
- 208000014018 liver neoplasm Diseases 0.000 description 1
- 230000004807 localization Effects 0.000 description 1
- 210000003563 lymphoid tissue Anatomy 0.000 description 1
- 230000002132 lysosomal effect Effects 0.000 description 1
- VTHJTEIRLNZDEV-UHFFFAOYSA-L magnesium dihydroxide Chemical compound [OH-].[OH-].[Mg+2] VTHJTEIRLNZDEV-UHFFFAOYSA-L 0.000 description 1
- 239000000347 magnesium hydroxide Substances 0.000 description 1
- 229910001862 magnesium hydroxide Inorganic materials 0.000 description 1
- 238000002595 magnetic resonance imaging Methods 0.000 description 1
- 230000003211 malignant effect Effects 0.000 description 1
- 208000015486 malignant pancreatic neoplasm Diseases 0.000 description 1
- 210000005075 mammary gland Anatomy 0.000 description 1
- 239000000594 mannitol Substances 0.000 description 1
- 235000010355 mannitol Nutrition 0.000 description 1
- 230000013011 mating Effects 0.000 description 1
- 210000003593 megakaryocyte Anatomy 0.000 description 1
- 108091070501 miRNA Proteins 0.000 description 1
- 239000002679 microRNA Substances 0.000 description 1
- 210000000274 microglia Anatomy 0.000 description 1
- 238000010369 molecular cloning Methods 0.000 description 1
- 239000000178 monomer Substances 0.000 description 1
- 201000002273 mucopolysaccharidosis II Diseases 0.000 description 1
- 208000005340 mucopolysaccharidosis III Diseases 0.000 description 1
- 208000025919 mucopolysaccharidosis type 7 Diseases 0.000 description 1
- 206010051747 multiple endocrine neoplasia Diseases 0.000 description 1
- 210000003205 muscle Anatomy 0.000 description 1
- 201000006938 muscular dystrophy Diseases 0.000 description 1
- 210000000066 myeloid cell Anatomy 0.000 description 1
- 239000002105 nanoparticle Substances 0.000 description 1
- 229940031182 nanoparticles iron oxide Drugs 0.000 description 1
- 238000003333 near-infrared imaging Methods 0.000 description 1
- 238000007857 nested PCR Methods 0.000 description 1
- 210000002569 neuron Anatomy 0.000 description 1
- 230000003472 neutralizing effect Effects 0.000 description 1
- 108091027963 non-coding RNA Proteins 0.000 description 1
- 102000042567 non-coding RNA Human genes 0.000 description 1
- 230000000683 nonmetastatic effect Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 239000012038 nucleophile Substances 0.000 description 1
- 239000003921 oil Substances 0.000 description 1
- 235000019198 oils Nutrition 0.000 description 1
- 239000004006 olive oil Substances 0.000 description 1
- 235000008390 olive oil Nutrition 0.000 description 1
- 238000001543 one-way ANOVA Methods 0.000 description 1
- 101150060735 orai1 gene Proteins 0.000 description 1
- 239000001301 oxygen Substances 0.000 description 1
- 229910052760 oxygen Inorganic materials 0.000 description 1
- 238000006213 oxygenation reaction Methods 0.000 description 1
- 201000002528 pancreatic cancer Diseases 0.000 description 1
- 208000008443 pancreatic carcinoma Diseases 0.000 description 1
- 230000036961 partial effect Effects 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 230000037361 pathway Effects 0.000 description 1
- 239000000312 peanut oil Substances 0.000 description 1
- 229960002621 pembrolizumab Drugs 0.000 description 1
- 108010011903 peptide receptors Proteins 0.000 description 1
- 210000005259 peripheral blood Anatomy 0.000 description 1
- 239000011886 peripheral blood Substances 0.000 description 1
- 210000003819 peripheral blood mononuclear cell Anatomy 0.000 description 1
- 230000002688 persistence Effects 0.000 description 1
- 101150079312 pgk1 gene Proteins 0.000 description 1
- 239000008177 pharmaceutical agent Substances 0.000 description 1
- 229940124531 pharmaceutical excipient Drugs 0.000 description 1
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 description 1
- 239000010452 phosphate Substances 0.000 description 1
- 150000008298 phosphoramidates Chemical class 0.000 description 1
- 102000020233 phosphotransferase Human genes 0.000 description 1
- 230000010399 physical interaction Effects 0.000 description 1
- 230000006461 physiological response Effects 0.000 description 1
- 210000003635 pituitary gland Anatomy 0.000 description 1
- 230000003169 placental effect Effects 0.000 description 1
- 108700004029 pol Genes Proteins 0.000 description 1
- 229920002647 polyamide Polymers 0.000 description 1
- 229920000515 polycarbonate Polymers 0.000 description 1
- 239000004417 polycarbonate Substances 0.000 description 1
- 229920000573 polyethylene Polymers 0.000 description 1
- 102000054765 polymorphisms of proteins Human genes 0.000 description 1
- 229920005862 polyol Polymers 0.000 description 1
- 150000003077 polyols Chemical class 0.000 description 1
- 229920001282 polysaccharide Polymers 0.000 description 1
- 239000005017 polysaccharide Substances 0.000 description 1
- 150000004804 polysaccharides Chemical class 0.000 description 1
- 239000001103 potassium chloride Substances 0.000 description 1
- 235000011164 potassium chloride Nutrition 0.000 description 1
- 229920001592 potato starch Polymers 0.000 description 1
- 239000003755 preservative agent Substances 0.000 description 1
- 230000002265 prevention Effects 0.000 description 1
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 1
- QQONPFPTGQHPMA-UHFFFAOYSA-N propylene Natural products CC=C QQONPFPTGQHPMA-UHFFFAOYSA-N 0.000 description 1
- 125000004805 propylene group Chemical group [H]C([H])([H])C([H])([*:1])C([H])([H])[*:2] 0.000 description 1
- 230000005180 public health Effects 0.000 description 1
- 210000003456 pulmonary alveoli Anatomy 0.000 description 1
- 238000000746 purification Methods 0.000 description 1
- 239000000700 radioactive tracer Substances 0.000 description 1
- 108700015048 receptor decoy activity proteins Proteins 0.000 description 1
- 238000010188 recombinant method Methods 0.000 description 1
- 230000006798 recombination Effects 0.000 description 1
- 238000005215 recombination Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000022532 regulation of transcription, DNA-dependent Effects 0.000 description 1
- 230000002629 repopulating effect Effects 0.000 description 1
- 230000000241 respiratory effect Effects 0.000 description 1
- 230000004043 responsiveness Effects 0.000 description 1
- 210000000964 retinal cone photoreceptor cell Anatomy 0.000 description 1
- 206010039073 rheumatoid arthritis Diseases 0.000 description 1
- 210000003705 ribosome Anatomy 0.000 description 1
- 125000000548 ribosyl group Chemical group C1([C@H](O)[C@H](O)[C@H](O1)CO)* 0.000 description 1
- 108091092562 ribozyme Proteins 0.000 description 1
- 235000009566 rice Nutrition 0.000 description 1
- 235000005713 safflower oil Nutrition 0.000 description 1
- 239000003813 safflower oil Substances 0.000 description 1
- 210000003296 saliva Anatomy 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 210000002966 serum Anatomy 0.000 description 1
- 239000008159 sesame oil Substances 0.000 description 1
- 235000011803 sesame oil Nutrition 0.000 description 1
- 230000019491 signal transduction Effects 0.000 description 1
- 239000000741 silica gel Substances 0.000 description 1
- 229910002027 silica gel Inorganic materials 0.000 description 1
- 230000005783 single-strand break Effects 0.000 description 1
- 235000020183 skimmed milk Nutrition 0.000 description 1
- 201000010153 skin papilloma Diseases 0.000 description 1
- 201000002859 sleep apnea Diseases 0.000 description 1
- 108091029842 small nuclear ribonucleic acid Proteins 0.000 description 1
- 210000002460 smooth muscle Anatomy 0.000 description 1
- 230000008410 smoothened signaling pathway Effects 0.000 description 1
- 235000019812 sodium carboxymethyl cellulose Nutrition 0.000 description 1
- 229920001027 sodium carboxymethylcellulose Polymers 0.000 description 1
- RYYKJJJTJZKILX-UHFFFAOYSA-M sodium octadecanoate Chemical compound [Na+].CCCCCCCCCCCCCCCCCC([O-])=O RYYKJJJTJZKILX-UHFFFAOYSA-M 0.000 description 1
- 210000001082 somatic cell Anatomy 0.000 description 1
- 235000010356 sorbitol Nutrition 0.000 description 1
- 239000000600 sorbitol Substances 0.000 description 1
- 229960002920 sorbitol Drugs 0.000 description 1
- 239000003549 soybean oil Substances 0.000 description 1
- 235000012424 soybean oil Nutrition 0.000 description 1
- 230000009870 specific binding Effects 0.000 description 1
- 206010041823 squamous cell carcinoma Diseases 0.000 description 1
- 239000003381 stabilizer Substances 0.000 description 1
- 230000000087 stabilizing effect Effects 0.000 description 1
- 239000008107 starch Substances 0.000 description 1
- 239000000021 stimulant Substances 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
- 150000008163 sugars Chemical class 0.000 description 1
- 239000000829 suppository Substances 0.000 description 1
- 230000001629 suppression Effects 0.000 description 1
- 239000004094 surface-active agent Substances 0.000 description 1
- 238000013268 sustained release Methods 0.000 description 1
- 239000012730 sustained-release form Substances 0.000 description 1
- 210000004243 sweat Anatomy 0.000 description 1
- 230000008961 swelling Effects 0.000 description 1
- 210000001138 tear Anatomy 0.000 description 1
- 108010057210 telomerase RNA Proteins 0.000 description 1
- 230000033863 telomere maintenance Effects 0.000 description 1
- 150000003573 thiols Chemical class 0.000 description 1
- RYYWUUFWQRZTIU-UHFFFAOYSA-K thiophosphate Chemical compound [O-]P([O-])([O-])=S RYYWUUFWQRZTIU-UHFFFAOYSA-K 0.000 description 1
- 229940113082 thymine Drugs 0.000 description 1
- 210000002105 tongue Anatomy 0.000 description 1
- 239000003053 toxin Substances 0.000 description 1
- 231100000765 toxin Toxicity 0.000 description 1
- 108700012359 toxins Proteins 0.000 description 1
- 235000010487 tragacanth Nutrition 0.000 description 1
- 239000000196 tragacanth Substances 0.000 description 1
- 229940116362 tragacanth Drugs 0.000 description 1
- 230000005030 transcription termination Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 230000009261 transgenic effect Effects 0.000 description 1
- 238000003146 transient transfection Methods 0.000 description 1
- 230000014621 translational initiation Effects 0.000 description 1
- 102000035160 transmembrane proteins Human genes 0.000 description 1
- 108091005703 transmembrane proteins Proteins 0.000 description 1
- 229960000575 trastuzumab Drugs 0.000 description 1
- 230000008733 trauma Effects 0.000 description 1
- 230000004614 tumor growth Effects 0.000 description 1
- 238000002604 ultrasonography Methods 0.000 description 1
- 241001529453 unidentified herpesvirus Species 0.000 description 1
- 241001515965 unidentified phage Species 0.000 description 1
- 241001430294 unidentified retrovirus Species 0.000 description 1
- 210000002700 urine Anatomy 0.000 description 1
- NQPDZGIKBAWPEJ-UHFFFAOYSA-N valeric acid Chemical group CCCCC(O)=O NQPDZGIKBAWPEJ-UHFFFAOYSA-N 0.000 description 1
- 239000003981 vehicle Substances 0.000 description 1
- 108700026220 vif Genes Proteins 0.000 description 1
- 230000029812 viral genome replication Effects 0.000 description 1
- 210000002845 virion Anatomy 0.000 description 1
- 230000001018 virulence Effects 0.000 description 1
- 210000001260 vocal cord Anatomy 0.000 description 1
- 239000001993 wax Substances 0.000 description 1
- 108010073629 xeroderma pigmentosum group F protein Proteins 0.000 description 1
- 238000001086 yeast two-hybrid system Methods 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/85—Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
- C12N15/86—Viral vectors
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P31/00—Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
- A61P31/12—Antivirals
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P7/00—Drugs for disorders of the blood or the extracellular fluid
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P7/00—Drugs for disorders of the blood or the extracellular fluid
- A61P7/04—Antihaemorrhagics; Procoagulants; Haemostatic agents; Antifibrinolytic agents
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P7/00—Drugs for disorders of the blood or the extracellular fluid
- A61P7/06—Antianaemics
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/005—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from viruses
- C07K14/01—DNA viruses
- C07K14/075—Adenoviridae
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/745—Blood coagulation or fibrinolysis factors
- C07K14/755—Factors VIII, e.g. factor VIII C (AHF), factor VIII Ag (VWF)
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/795—Porphyrin- or corrin-ring-containing peptides
- C07K14/805—Haemoglobins; Myoglobins
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/87—Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
- C12N15/90—Stable introduction of foreign DNA into chromosome
- C12N15/902—Stable introduction of foreign DNA into chromosome using homologous recombination
- C12N15/907—Stable introduction of foreign DNA into chromosome using homologous recombination in mammalian cells
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N5/00—Undifferentiated human, animal or plant cells, e.g. cell lines; Tissues; Cultivation or maintenance thereof; Culture media therefor
- C12N5/06—Animal cells or tissues; Human cells or tissues
- C12N5/0602—Vertebrate cells
- C12N5/0634—Cells from the blood or the immune system
- C12N5/0647—Haematopoietic stem cells; Uncommitted or multipotent progenitors
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
- C12N9/12—Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
- C12N9/1241—Nucleotidyltransferases (2.7.7)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2710/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA dsDNA viruses
- C12N2710/00011—Details
- C12N2710/10011—Adenoviridae
- C12N2710/10311—Mastadenovirus, e.g. human or simian adenoviruses
- C12N2710/10341—Use of virus, viral particle or viral elements as a vector
- C12N2710/10343—Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2800/00—Nucleic acids vectors
- C12N2800/30—Vector systems comprising sequences for excision in presence of a recombinase, e.g. loxP or FRT
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2800/00—Nucleic acids vectors
- C12N2800/90—Vectors containing a transposable element
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Genetics & Genomics (AREA)
- Organic Chemistry (AREA)
- Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Zoology (AREA)
- General Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Wood Science & Technology (AREA)
- Biotechnology (AREA)
- Biochemistry (AREA)
- Molecular Biology (AREA)
- General Engineering & Computer Science (AREA)
- Medicinal Chemistry (AREA)
- Biophysics (AREA)
- Hematology (AREA)
- Microbiology (AREA)
- Gastroenterology & Hepatology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Virology (AREA)
- Plant Pathology (AREA)
- Physics & Mathematics (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Public Health (AREA)
- Cell Biology (AREA)
- Veterinary Medicine (AREA)
- Chemical Kinetics & Catalysis (AREA)
- General Chemical & Material Sciences (AREA)
- Animal Behavior & Ethology (AREA)
- Pharmacology & Pharmacy (AREA)
- Diabetes (AREA)
- Toxicology (AREA)
- Developmental Biology & Embryology (AREA)
- Immunology (AREA)
- Mycology (AREA)
- Oncology (AREA)
- Communicable Diseases (AREA)
- Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
Abstract
본 개시내용은 대형 트랜스포손 페이로드, 예를 들어 최대 40 kb의 트랜스포손 페이로드를 수용할 수 있거나 또는 이를 함유하는 재조합 아데노바이러스 벡터 및 아데노바이러스 게놈을 제공한다. 아데노바이러스 벡터 및 게놈은, 예를 들어 유전자 요법을 위해 대형 트랜스포손 페이로드를 표적 게놈 내로 전달할 수 있다.
Description
관련 출원에 대한 상호 참조
본 출원은 2020년 4월 13일에 출원된 미국 가출원 번호 63/009,298의 보다 이른 출원일에 대한 우선권 및 그의 이익을 주장하며, 이는 그 전문이 본원에 참조로 포함된다.
연방 후원 연구 또는 개발에 관한 진술
본 발명은 국립 보건원에 의해 수여된 승인 번호 HL128288 및 HL136135 하에 정부 지원으로 이루어졌다. 정부는 본 발명에 특정 권리를 갖는다.
개시내용의 분야
본 개시내용은 특히, 대형 트랜스포손 페이로드, 예를 들어 최대 40 kb의 트랜스포손 페이로드를 수용할 수 있거나 또는 이를 함유하는 재조합 아데노바이러스 벡터 및 아데노바이러스 게놈을 제공한다. 특정 아데노바이러스 벡터 및 게놈은, 예를 들어 유전자 요법을 위해 대형 트랜스포손 페이로드를 표적 게놈 내로 전달할 수 있다.
유전자 요법은 많은 도전과제를 제시한다. 바이러스 벡터는 유전자 요법의 한 수단이다. 유전자 요법을 위한 바이러스 벡터의 개발에서 다양한 도전과제는, 일부 경우에, 벡터 페이로드 용량, 표적 세포 게놈 내로의 트랜스진 통합의 효율, 트랜스진 발현의 세포 유형 특이성, 트랜스진 발현의 수준, 및 통합의 위치 효과를 포함한다. 바이러스 벡터를 사용하는 유전자 요법의 다양한 방법은 대상체로부터 세포를 떼어내고 대상체에게 투여하기 전 생체외에서 세포를 조작 및/또는 확장하는 자원-소모 단계를 필요로 한다. 적어도 이들 이유로 인해, 특히 바이러스 벡터를 이용하는 요법의 수가 증가하고 있다는 관점에서, 개선된 바이러스 벡터 설계에 대한 큰 필요가 존재한다.
혈색소병증은 전세계적으로 가장 보편적인 유전 장애 중 하나이며, 특히 저개발 국가에서 태어난 환자의 경우 유의하게 감소된 생존율을 갖는다. 혈색소병증의 예는 겸상 적혈구 질환 및 지중해빈혈을 포함한다. 환자-특이적 혈액 줄기/전구 세포 (HSPC) 유전자 요법은 혈색소병증을 치료하는 큰 잠재력을 갖는다.
추가로, 세계 보건 기구에 의하면 80종 초과의 1차 면역 결핍 질환이 인식된다. 이들 질환은, 일부 경우에, 신체가 감염에 대한 임의의 또는 충분한 항체를 생산할 수 없는 면역계에서의 내인성 결함을 특징으로 한다. 다른 경우에, 감염과 싸우기 위한 세포 방어가 적절하게 작용하지 못한다. 전형적으로, 1차 면역 결핍은 유전성 장애이다.
2차 또는 후천성 면역 결핍은 유전성 유전자 이상의 결과가 아니라, 면역계가 면역계 외부의 인자에 의해 손상된 개체에서 발생한다. 예는 외상, 바이러스, 화학요법, 독소, 및 오염을 포함한다. 후천성 면역결핍 증후군 (AIDS)은 바이러스, 인간 면역결핍 바이러스 (HIV)에 의해 유발된 2차 면역 결핍 장애의 예이며, 여기서 T 림프구의 고갈은 신체가 감염과 싸울 수 없게 만든다.
X-연관 중증 복합 면역결핍 (SCID-X1)은 공통 감마 쇄 유전자 (γC)에서의 돌연변이에 의해 유발되는 세포성 및 체액성 면역 고갈 둘 다이며, 이는 T 및 자연 킬러 (NK) 림프구의 부재 및 비기능적 B 림프구의 존재를 야기한다. SCID-X1은, 면역계가 예를 들어 골수 이식 (BMT) 또는 유전자 요법을 통해 재구성되지 않는 한, 생후 첫 2년 내에 치명적이다.
대부분의 개체는 BMT 또는 비-자가 유전자 요법을 위한 매칭 공여자가 부족하기 때문에, 성숙 T 세포가 고갈된 홑배수동종 모 골수가 종종 사용되지만; 합병증으로 이식편 대 숙주 질환 (GVHD), 적절한 항체 제조 실패, 그에 따른 장기간 이뮤노글로불린 대체의 필요, 조혈 줄기 및 전구 세포 (HSPC) 생착 실패로 인한 후기 T 세포 손실, 만성 사마귀, 및 림프구 조절이상을 포함한다.
판코니 빈혈 (FA)은 골수 부전으로 이어지는 유전성 혈액 장애이다. 이는, 부분적으로, 결핍된 DNA-복구 메카니즘을 특징으로 한다. FA를 갖는 환자의 적어도 20%에서 암, 예컨대 급성 골수성 백혈병, 및 피부암, 간암, 위장관암, 및 부인과계암이 발생한다. 피부 및 위장 종양은 통상적으로 편평 세포 암종이다. 암이 발생한 환자의 평균 연령은 백혈병의 경우 15세, 간 종양의 경우 16세, 및 다른 종양의 경우 23세이다.
바이러스 벡터를 환자에게 직접 전달하는 것을 포함하는 생체내 유전자 요법을 사용하는 치료가 연구되었다. 생체내 유전자 요법은 어떠한 유전자독성 조건화도 필요로 하지 않을 수 있고 (또는 보다 적은 유전자독성 조건화를 필요로 할 수 있음) 또한 생체외 세포 프로세싱도 필요로 하지 않을 수 있기 때문에 간단하고 매력적인 접근법이며, 백신의 전달을 위해 전세계적으로 이미 행해지고 있는 것과 유사하게 요법이 주사를 통해 투여될 수 있기 때문에 개발도상국의 기관을 포함한 전세계의 많은 기관에서 채택될 수 있었다.
아데노바이러스는 그의 중간 크기 게놈, 조작의 용이성, 높은 역가, 넓은 표적-세포 범위 및 높은 감염성으로 인해 유전자 전달 벡터로서 사용하기에 특히 적합하다. 바이러스 게놈의 양쪽 단부는 바이러스 DNA 복제 및 패키징에 필요한 시스 요소인 100-200개 염기쌍의 역전된 반복부 (ITR)를 함유한다. 게놈의 초기 (E) 및 후기 (L) 영역은 바이러스 DNA 복제의 개시에 의해 나누어지는 상이한 전사 단위를 함유한다. E1 영역 (E1A 및 E1B)은 바이러스 게놈 및 소수의 세포 유전자의 전사 조절을 담당하는 단백질을 코딩한다. E2 영역 (E2A 및 E2B)의 발현은 바이러스 DNA 복제를 위한 단백질의 합성을 발생시킨다. 이들 단백질은 DNA 복제, 후기 유전자 발현 및 숙주 세포 억제에 수반된다. 대부분의 바이러스 캡시드 단백질을 비롯한 후기 유전자의 생성물은 주요 후기 프로모터 (MLP)에 의해 발생되는 단일 1차 전사체의 유의한 프로세싱 후에만 발현된다. MLP는 감염 후기 동안 특히 효율적이고, 이러한 프로모터로부터 발생되는 모든 mRNA는 번역을 위해 mRNA를 선호하게 만드는 5'-3부 리더 (TPL) 서열을 보유한다.
성공적인 유전자 요법을 위해서는, 통합의 위치 효과 및 전사 침묵 없이, 전달된 유전자는 목적하는 조직 또는 세포에서 높은 수준으로 발현되어야 한다. 유전자좌 제어 영역 (LCR)은, LCR이 연결된 유전자의 발현을 이소성 염색질 부위에서 조직-특이적 및 카피수-의존적 방식으로 생리학적 수준으로 증진시키는 그의 능력을 특징으로 하기 때문에, 이러한 작업에 특히 적합하다. LCR의 성분은 통상적으로 발현 세포의 염색질 내 DNAse I 과민성 (HS) 부위에 공동국재화된다. 개별 HS에서의 핵심 결정인자는 다중 편재성 및 계통-특이적 전사 인자-결합 부위의 어레이로 구성된다.
본 개시내용은 특히 아데노바이러스 벡터 및 아데노바이러스 게놈, 본 개시내용의 2개 이상의 아데노바이러스 벡터 및/또는 아데노바이러스 게놈을 포함하는 시스템, 및 이러한 아데노바이러스 벡터, 아데노바이러스 게놈, 및 시스템의 용도를 포함한다. 특정 실시양태에서, 본 발명은 예를 들어 1 kb 내지 40 kb의 트랜스포손 페이로드를 포함하는 아데노바이러스 벡터 및/또는 아데노바이러스 게놈을 포함한다. 본 개시내용의 특정 실시양태에서, 트랜스포사제는 예를 들어 최대 40 kb의 트랜스포손 페이로드의 표적 세포의 게놈 내로의 통합을 유발할 수 있다. 따라서, 본 개시내용은 특히 아데노바이러스 공여자 벡터에 존재하는 최대 40 kb의 페이로드의 표적 세포 게놈 내로의 통합을 가능하게 하는 벡터, 게놈, 및 시스템을 포함한다. 관련 기술분야의 통상의 기술자가 인지할 바와 같이, 벡터 통합 용량은 그 자체로 유전자 요법 시스템의 결정적으로 중요한 특색 중 하나이며, 이는 적어도 부분적으로 통합 용량이 치료 페이로드의 길이 및/또는 복잡성을 제한하기 때문이다.
본 개시내용에서 인식되는 긴 및/또는 복합 핵산 페이로드의 특정 예는 긴 유전자좌 제어 영역을 포함하는 페이로드를 포함한다. 그의 길이로 인해, 긴 유전자좌 제어 영역은 역사적으로 아데노바이러스 페이로드에 포함되기에 부적합하였지만, 긴 유전자좌 제어 영역을 포함하는 긴 및/또는 복합 핵산 페이로드를 포함하나 이에 제한되지는 않는 긴 및/또는 복합 핵산 페이로드는 본원에 개시된 벡터, 게놈, 및 시스템에 따라 표적 세포 게놈 내로 통합될 수 있다.
따라서, 한 실시양태에서, (a) 아데노바이러스 캡시드; 및 (b) (i) 적어도 10 kb의 트랜스포손 페이로드; (ii) 트랜스포손 페이로드에 플랭킹된 트랜스포손 역전된 반복부 (IR); 및 (iii) 트랜스포손 역전된 반복부에 플랭킹된 레콤비나제 직접 반복부 (DR)를 포함하는 선형, 이중-가닥 DNA 게놈을 포함하는 아데노바이러스 공여자 벡터가 제공된다.
또 다른 실시양태는 (a) 적어도 10 kb의 트랜스포손 페이로드; (b) 트랜스포손 페이로드에 플랭킹된 트랜스포손 역전된 반복부 (IR); 및 (c) 트랜스포손 역전된 반복부에 플랭킹된 레콤비나제 직접 반복부 (DR)를 포함하는 아데노바이러스 공여자 게놈이다.
또한, (a) 본원에 기재된 바와 같은 아데노바이러스 공여자 벡터; 및 (b) (i) 아데노바이러스 캡시드; 및 (ii) 트랜스포사제를 코딩하는 핵산 서열을 포함하는 아데노바이러스 지지 게놈을 포함하는 아데노바이러스 지지 벡터를 포함하는 아데노바이러스 전위 시스템이 제공된다.
또 다른 실시양태는 (a) 본원에 기재된 바와 같은 아데노바이러스 공여자 게놈; 및 (b) 트랜스포사제를 코딩하는 핵산 서열을 포함하는 아데노바이러스 지지 게놈을 포함하는 아데노바이러스 전위 시스템이다.
또한, (a) 본원에 기재된 바와 같은 아데노바이러스 공여자 게놈을 포함하는 핵산; 및 (b) 조건부 패키징 요소를 포함하는 아데노바이러스 헬퍼 게놈을 포함하는 핵산을 포함하는 아데노바이러스 생산 시스템이 제공된다.
추가 실시양태는 본원에 기재된 다양한 실시양태 중 어느 하나에 따른 벡터, 게놈, 또는 시스템을 포함하는 세포 (예를 들어, 조혈 줄기 세포)이다.
또한, 본원에 기재된 임의의 실시양태의 트랜스포손 페이로드를 그의 게놈에 포함하는 세포(들) (예를 들어, 조혈 줄기 세포)가 기재되며, 여기서 세포의 게놈에 존재하는 트랜스포손 페이로드는 트랜스포손 역전된 반복부에 플랭킹된다.
또 다른 실시양태는 본원에 기재된 실시양태 중 어느 하나에 따른 아데노바이러스 생산 시스템을 포함하는 아데노바이러스-생산 세포로서, 임의로 여기서 세포는 HEK293 세포이다.
세포를 변형시키는 방법으로서, 세포를 본원에 기재된 실시양태 중 어느 하나에 따른 벡터, 게놈, 또는 시스템과 접촉시키는 것을 포함하는 방법.
또 다른 실시양태는 대상체의 세포를 변형시키는 방법이며, 방법은 대상체에게 본원에 기재된 실시양태 중 어느 하나에 따른 벡터, 게놈, 또는 시스템을 투여하는 것을 포함한다.
또 다른 실시양태는 대상체로부터의 세포의 단리 없이 대상체의 세포를 변형시키는 방법이며, 방법은 대상체에게 본원에 기재된 실시양태 중 어느 하나에 따른 벡터, 게놈, 또는 시스템을 투여하는 것을 포함한다.
또한, 질환 또는 상태의 치료를 필요로 하는 대상체에서 질환 또는 상태를 치료하는 방법이 제공되며, 방법은 대상체에게 본원에 기재된 실시양태 중 어느 하나에 따른 벡터, 게놈, 또는 시스템을 투여하는 것을 포함한다.
적어도 한 측면에서, 본 개시내용은 (a) 아데노바이러스 캡시드; 및 (b) (i) 적어도 10 kb의 트랜스포손 페이로드; (ii) 트랜스포손 페이로드에 플랭킹된 트랜스포손 역전된 반복부 (IR); 및 (iii) 트랜스포손 역전된 반복부에 플랭킹된 레콤비나제 직접 반복부 (DR)를 포함하는 선형, 이중-가닥 DNA 게놈을 포함하는 아데노바이러스 공여자 벡터를 제공한다.
적어도 한 측면에서, 본 개시내용은 (a) 적어도 10 kb의 트랜스포손 페이로드; (b) 트랜스포손 페이로드에 플랭킹된 트랜스포손 역전된 반복부 (IR); 및 (c) 트랜스포손 역전된 반복부에 플랭킹된 레콤비나제 직접 반복부 (DR)를 포함하는 아데노바이러스 공여자 게놈을 제공한다.
적어도 한 측면에서, 본 개시내용은 (a) 실시양태 1의 아데노바이러스 공여자 벡터; 및 (b) (i) 아데노바이러스 캡시드; 및 (ii) 트랜스포사제를 코딩하는 핵산 서열을 포함하는 아데노바이러스 지지 게놈을 포함하는 아데노바이러스 지지 벡터를 포함하는 아데노바이러스 전위 시스템을 제공한다.
적어도 한 측면에서, 본 개시내용은 (a) 실시양태 2의 아데노바이러스 공여자 게놈; 및 (b) 트랜스포사제를 코딩하는 핵산 서열을 포함하는 아데노바이러스 지지 게놈을 포함하는 아데노바이러스 전위 시스템을 제공한다.
적어도 한 측면에서, 본 개시내용은 (a) 실시양태 2의 아데노바이러스 공여자 게놈을 포함하는 핵산; 및 (b) 조건부 패키징 요소를 포함하는 아데노바이러스 헬퍼 게놈을 포함하는 핵산을 포함하는 아데노바이러스 생산 시스템을 제공한다.
다양한 실시양태에서, 트랜스포손 페이로드는 긴 LCR을 포함하고, 임의로 여기서 긴 LCR은 β-글로빈 LCR HS1 내지 HS5를 포함하는 β-글로빈 긴 LCR이다. 다양한 실시양태에서, 긴 LCR은 길이가 적어도 27 kb이다. 다양한 실시양태에서, 트랜스포손 페이로드는 표 1에 제시된 LCR을 포함한다. 다양한 실시양태에서, 트랜스포손 페이로드는 적어도 15 kb, 적어도 16 kb, 적어도 17 kb, 적어도 18 kb, 적어도 19 kb, 적어도 20 kb, 적어도 21 kb, 적어도 22 kb, 적어도 23 kb, 적어도 24 kb, 적어도 25 kb, 적어도 30 kb, 적어도 35 kb, 적어도 38 kb, 또는 적어도 40 kb의 길이를 갖는다. 다양한 실시양태에서, 트랜스포손 페이로드는 10 kb-35 kb, 10 kb-30 kb, 15 kb-35 kb, 15 kb-30 kb, 20 kb-35 kb, 또는 20 kb-30 kb의 길이를 갖는다. 다양한 실시양태에서, 트랜스포손 페이로드는 10 kb-32.4 kb, 15 kb-32.4 kb, 또는 20 kb-32.4 kb의 길이를 갖는다.
다양한 실시양태에서, 트랜스포손 페이로드는 단백질을 코딩하는 핵산 서열을 포함하고, 임의로 여기서 단백질은 치료 단백질이다. 다양한 실시양태에서, 단백질은 β 글로빈 대체 단백질 및 γ-글로빈 대체 단백질로 이루어진 군으로부터 선택된다. 다양한 실시양태에서, 단백질은 인자 VIII 대체 단백질이다. 다양한 실시양태에서, 단백질을 코딩하는 핵산 서열은 프로모터와 작동가능하게 연결되고, 임의로 여기서 프로모터는 β 글로빈 프로모터이다.
다양한 실시양태에서, 트랜스포손 역전된 반복부는 슬리핑 뷰티 (SB) 역전된 반복부이고, 임의로 여기서 SB 역전된 반복부는 pT4 역전된 반복부이다. 다양한 실시양태에서, 트랜스포사제는 슬리핑 뷰티 (SB) 트랜스포사제이고, 임의로 여기서 트랜스포사제는 슬리핑 뷰티 100x (SB100x)이다. 다양한 실시양태에서, 레콤비나제 직접 반복부는 FRT 부위이다. 다양한 실시양태에서, 아데노바이러스 지지 게놈은 레콤비나제를 코딩하는 핵산을 포함한다. 다양한 실시양태에서, 레콤비나제는 FLP 레콤비나제이다. 다양한 실시양태에서, 트랜스포손 페이로드는 β-글로빈 긴 LCR을 포함하고, 트랜스포손 페이로드는 β-글로빈 프로모터와 작동가능하게 연결된 β-글로빈을 코딩하는 핵산 서열을 포함하고, 역전된 반복부는 SB 역전된 반복부이고, 레콤비나제 직접 반복부는 FRT 부위이다.
다양한 실시양태에서, 트랜스포손 페이로드는 선택 카세트를 포함하고, 임의로 여기서 선택 카세트는 mgmtP140K를 코딩하는 핵산 서열을 포함한다.
다양한 실시양태에서, 아데노바이러스 캡시드는 CD46에 대한 증가된 친화도를 위해 변형되고, 임의로 여기서 아데노바이러스 캡시드는 Ad35++ 캡시드이다.
다양한 실시양태에서, 아데노바이러스 헬퍼 게놈 조건부 패키징 요소는 레콤비나제 직접 반복부에 플랭킹된 패키징 서열을 포함한다.
다양한 실시양태에서, 조건부 패키징 요소의 패키징 서열에 플랭킹된 레콤비나제 직접 반복부는 LoxP 부위이다.
다양한 실시양태에서, 본 개시내용은 본 개시내용에 따른 벡터, 게놈, 또는 시스템을 포함하는 세포를 제공한다.
다양한 실시양태에서, 본 개시내용은 본 개시내용에 따른 트랜스포손 페이로드를 그의 게놈에 포함하는 세포를 제공하며, 여기서 세포의 게놈에 존재하는 트랜스포손 페이로드는 트랜스포손 역전된 반복부에 플랭킹된다.
다양한 실시양태에서, 세포는 조혈 줄기 세포이다.
다양한 실시양태에서, 본 개시내용은 본 개시내용에 따른 아데노바이러스 생산 시스템을 포함하는 아데노바이러스-생산 세포를 제공하며, 임의로 여기서 세포는 HEK293 세포이다.
다양한 실시양태에서, 본 개시내용은 세포를 변형시키는 방법을 제공하며, 방법은 세포를 본 개시내용에 따른 벡터, 게놈, 또는 시스템과 접촉시키는 것을 포함한다.
다양한 실시양태에서, 본 개시내용은 대상체의 세포를 변형시키는 방법을 제공하며, 방법은 대상체에게 본 개시내용에 따른 벡터, 게놈, 또는 시스템을 투여하는 것을 포함한다.
다양한 실시양태에서, 본 개시내용은 대상체로부터의 세포의 단리 없이 대상체의 세포를 변형시키는 방법을 제공하며, 방법은 대상체에게 본 개시내용에 따른 벡터, 게놈, 또는 시스템을 투여하는 것을 포함한다.
다양한 실시양태에서, 본 개시내용은 질환 또는 상태의 치료를 필요로 하는 대상체에서 질환 또는 상태를 치료하는 방법을 제공하며, 방법은 대상체에게 본 개시내용에 따른 벡터, 게놈, 또는 시스템을 투여하는 것을 포함한다.
다양한 실시양태에서, 아데노바이러스 공여자 벡터는 대상체에게 정맥내로 투여된다.
다양한 실시양태에서, 방법은 대상체에게 가동화 작용제를 투여하는 것을 포함하며, 임의로 여기서 가동화 작용제는 과립구-콜로니 자극 인자 (G-CSF), CXCR4 길항제, 및 CXCR2 효능제 중 1종 이상을 포함한다. 다양한 실시양태에서, CXCR4 길항제는 AMD3100이다. 다양한 실시양태에서, CXCR2 효능제는 GRO-β이다.
다양한 실시양태에서, 트랜스포손 페이로드는 선택 카세트를 포함하며, 방법은 대상체에게 선택제를 투여하는 것을 포함한다. 다양한 실시양태에서, 선택 카세트는 mgmtP140K를 코딩하고, 선택제는 O6BG/BCNU이다.
다양한 실시양태에서, 방법은 CD46을 발현하는 세포의 적어도 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 또는 95%에서 트랜스포손 페이로드의 적어도 1개의 카피의 통합 및/또는 발현을 유발한다. 다양한 실시양태에서, 방법은 조혈 줄기 세포 및/또는 적혈구 Ter119+ 세포의 적어도 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 또는 95%에서 트랜스포손 페이로드의 적어도 1개의 카피의 통합 및/또는 발현을 유발한다. 다양한 실시양태에서, 방법은 트랜스포손 페이로드의 적어도 1개의 카피를 포함하는 세포의 게놈에서 트랜스포손 페이로드의 평균 적어도 2개의 카피의 통합을 유발한다. 다양한 실시양태에서, 방법은 트랜스포손 페이로드의 적어도 1개의 카피를 포함하는 세포의 게놈에서 트랜스포손 페이로드의 평균 적어도 2.5개의 카피의 통합을 유발한다. 다양한 실시양태에서, 방법은 트랜스포손 페이로드에 의해 코딩된 단백질의 발현을 참조 수준의 적어도 약 20%인 수준으로 유발하고, 임의로 여기서 참조는 대상체 또는 참조 집단에서의 내인성 참조 단백질의 발현이다. 다양한 실시양태에서, 방법은 트랜스포손 페이로드에 의해 코딩된 단백질의 발현을 참조 수준의 적어도 약 25%인 수준으로 유발하고, 임의로 여기서 참조는 대상체 또는 참조 집단에서의 내인성 참조 단백질의 발현이다.
다양한 실시양태에서, 대상체는 중간성 지중해빈혈을 앓고 있는 대상체이며, 여기서 트랜스포사제 페이로드는 β-글로빈 LCR HS1 내지 HS5를 포함하는 β-글로빈 긴 LCR 및 β 글로빈 프로모터와 작동가능하게 연결된 β 글로빈 대체 단백질 및/또는 γ-글로빈 대체 단백질을 코딩하는 핵산 서열을 포함한다. 다양한 실시양태에서, 대상체는 혈우병을 앓고 있는 대상체이며, 여기서 트랜스포사제 페이로드는 β-글로빈 LCR HS1 내지 HS5를 포함하는 β-글로빈 긴 LCR 및 β 글로빈 프로모터와 작동가능하게 연결된 인자 VIII 대체 단백질을 코딩하는 핵산 서열을 포함한다. 다양한 실시양태에서, 대상체에서의 단백질의 발현은 중간성 지중해빈혈의 적어도 1종의 증상을 감소시키고/거나 중간성 지중해빈혈을 치료한다.
정의
관사: 본원에 사용된 관사는 하나 또는 하나 초과 (즉, 적어도 하나)의 관사의 문법적 대상을 지칭한다. 예로서, "요소"는 정확히 하나의 요소의 실시양태 및 하나 초과의 요소를 포함하는 실시양태를 개시한다.
약: 본원에 사용된 용어 "약"은, 값의 언급에서 사용되는 경우에, 언급된 값과 관련하여 유사한 값을 지칭한다. 일반적으로, 문맥에 익숙한 관련 기술분야의 통상의 기술자는 그러한 문맥에서 "약"에 의해 포괄되는 관련 변동 정도를 인지할 것이다. 예를 들어, 일부 실시양태에서, 용어 "약"은 언급된 값의 25%, 20%, 19%, 18%, 17%, 16%, 15%, 14%, 13%, 12%, 11%, 10%, 9%, 8%, 7%, 6%, 5%, 4%, 3%, 2%, 1%, 또는 그 미만 이내인 값의 범위를 포괄할 수 있다.
투여: 본원에 사용된 용어 "투여"는 전형적으로 조성물이거나 또는 조성물에 포함된 작용제의 전달을 달성하기 위해 대상체 또는 시스템에게 조성물을 투여하는 것을 지칭한다.
입양 세포 요법: 본원에 사용된 "입양 세포 요법" 또는 "ACT"는 치료 활성을 갖는 세포를 대상체, 예를 들어 상태, 장애, 또는 질환에 대한 치료를 필요로 하는 대상체 내로 전달하는 것을 수반한다. 일부 실시양태에서, ACT는 세포의 생체외 및/또는 시험관내 조작 및/또는 확장 후에 세포를 대상체 내로 전달하는 것을 포함한다.
친화도: 본원에 사용된 "친화도"는 특정한 결합제 (예를 들어, 바이러스 벡터) 및/또는 그의 결합 모이어티와 결합 표적 (예를 들어, 세포) 사이의 비-공유 상호작용의 총 합계의 강도를 지칭한다. 달리 나타내지 않는 한, 본원에 사용된 "결합 친화도"는 결합제와 그의 결합 표적 (예를 들어, 바이러스 벡터와 바이러스 벡터의 표적 세포) 사이의 1:1 상호작용을 지칭한다. 관련 기술분야의 통상의 기술자는 친화도의 변화가 참조와의 비교에 의해 기재될 수 있거나 (예를 들어, 참조에 비해 증가 또는 감소됨), 또는 수치상 기재될 수 있음을 인지한다. 친화도는 평형 해리 상수 (KD) 및/또는 평형 회합 상수 (KA)를 포함하나 이에 제한되지는 않는 관련 기술분야에 공지된 다수의 방식으로 측정 및/또는 표현될 수 있다. KD는 k오프/k온의 몫인 반면, KA는 k온/k오프의 몫이며, 여기서 k온은 예를 들어 바이러스 벡터와 표적 세포의 회합률 상수를 지칭하고, k오프는 예를 들어 표적 세포로부터의 바이러스 벡터의 해리를 지칭한다. k온 및 k오프는 관련 기술분야의 통상의 기술자에게 공지된 기술에 의해 결정될 수 있다.
작용제: 본원에 사용된 용어 "작용제"는 원자, 분자, 화합물, 아미노산, 폴리펩티드, 뉴클레오티드, 핵산, 단백질, 단백질 복합체, 액체, 용액, 사카라이드, 폴리사카라이드, 지질, 또는 그의 조합 또는 복합체 중 어느 하나 이상을 포함하나 이에 제한되지는 않는 임의의 화학 물질을 지칭할 수 있다.
동종: 본원에 사용된 용어 "동종"은 하나의 대상체로부터 유래된 다음 또 다른 대상체에게 도입되는 임의의 물질, 예를 들어 동종 T 세포 이식을 지칭한다.
사이 또는 로부터: 본원에 사용된 용어 "사이"는 경계를 포함하여, 나타낸 상한 및 하한, 또는 제1 및 제2 경계 사이에 속하는 내용을 지칭한다. 유사하게, 용어 "로부터"는, 값의 범위와 관련하여 사용되는 경우에, 범위가 경계를 포함하여 나타낸 상한 및 하한, 또는 제1 및 제2 경계 사이에 속하는 내용을 포함한다는 것을 나타낸다.
결합: 본원에 사용된 용어 "결합"은 2종 이상의 작용제 사이의 또는 그 중에서의 비-공유 회합을 지칭한다. "직접" 결합은 작용제 사이의 물리적 접촉을 수반하고; 간접 결합은 1종 이상의 중간 작용제와의 물리적 접촉에 의한 물리적 상호작용을 수반한다. 2종 이상의 작용제 사이의 결합은 상호작용 작용제가 단리되어 또는 보다 복잡한 시스템의 문맥에서 (예를 들어, 담체 작용제와 공유적으로 또는 달리 회합되어 있는 동안 및/또는 생물학적 시스템 또는 세포에서) 연구되는 경우를 포함한 임의의 다양한 문맥에서 발생하고/거나 평가될 수 있다.
암: 본원에 사용된 용어 "암"은 세포가 비교적 비정상, 비제어, 및/또는 자율 성장을 나타내어 세포 증식의 제어의 유의한 상실을 특징으로 하는 비정상적으로 상승된 증식 속도 및/또는 이상 성장 표현형을 보이는 상태, 장애, 또는 질환을 지칭한다. 일부 실시양태에서, 암은 1개 이상의 종양을 포함할 수 있다. 일부 실시양태에서, 암은 전암성 (예를 들어, 양성), 악성, 전-전이성, 전이성, 및/또는 비-전이성인 세포일 수 있거나 또는 그를 포함할 수 있다. 일부 실시양태에서, 암은 고형 종양일 수 있거나 또는 그를 포함할 수 있다. 일부 실시양태에서, 암은 혈액 종양일 수 있거나 또는 그를 포함할 수 있다.
키메라 항원 수용체: 본원에 사용된 "키메라 항원 수용체" 또는 "CAR"은 (i) 표적 항원에 결합하는 모이어티를 포함하는 세포외 도메인; (ii) 막횡단 도메인; 및 (iii) CAR이 세포외 결합 모이어티와 표적 항원의 결합에 의해 자극될 때 활성화 신호를 전송하는 세포내 신호전달 도메인을 포함하는 조작된 단백질을 지칭한다. 키메라 항원 수용체를 발현하도록 유전자 조작된 T 세포는 CAR T 세포로 지칭될 수 있다. 따라서, 예를 들어, 특정 CAR이 T 세포에 의해 발현되는 경우에, CAR 세포외 결합 모이어티와 표적 항원의 결합은 T 세포를 활성화시킬 수 있다. CAR은 또한 키메라 T 세포 수용체 또는 키메라 면역수용체로 공지되어 있다.
조합 요법: 본원에 사용된 용어 "조합 요법"은 2종 이상의 작용제 또는 요법이 함께 대상체의 상태, 장애, 또는 질환을 치료하도록 2종 이상의 작용제 또는 요법을 대상체에게 투여하는 것을 지칭한다. 일부 실시양태에서, 2종 이상의 치료제 또는 요법은 동시에, 순차적으로, 또는 중첩 투여 요법으로 투여될 수 있다. 관련 기술분야의 통상의 기술자는 조합 요법이 2종의 작용제 또는 요법이 단일 조성물로 함께 투여되거나 또는 동시에 투여되는 것을 포함하나, 이를 필요로 하는 것은 아님을 인지할 것이다.
제어 발현 또는 활성: 본원에 사용된 제1 요소 (예를 들어, 단백질, 예컨대 전사 인자, 또는 핵산 서열, 예컨대 프로모터)는, 제2 요소 (예를 들어, 단백질, 또는 단백질과 같은 작용제를 코딩하는 핵산)의 발현 또는 활성이 적어도 1 세트의 조건 하에 제1 요소의 상태 (예를 들어, 존재, 부재, 입체형태, 화학적 변형, 상호작용, 또는 다른 활성)에 전적으로 또는 부분적으로 의존적인 경우에, 제2 요소의 발현 또는 활성을 "제어" 또는 "구동"한다. 발현 또는 활성의 제어는, 예를 들어 제1 요소의 상태에서의 변화가 적어도 1 세트의 조건 하에 참조 대조군과 비교하여 제2 요소의 발현 또는 활성에서 적어도 10% (예를 들어, 적어도 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 100%, 2-배, 3-배, 4-배, 5-배, 10-배, 20-배, 30-배, 40-배, 50-배, 100-배)의 변화를 발생시킬 수 있다는 점에서 실질적 제어 또는 활성일 수 있다.
상응하는: 본원에 사용된 용어 "상응하는"은 적절한 참조 화합물 또는 조성물과의 비교를 통해 화합물 또는 조성물에서 구조적 요소의 위치/정체를 지정하는데 사용될 수 있다. 예를 들어, 일부 실시양태에서, 중합체 내의 단량체 잔기 (예를 들어, 폴리펩티드 내의 아미노산 잔기 또는 폴리뉴클레오티드 내의 핵산 잔기)는 적절한 참조 중합체 내의 잔기에 "상응하는" 것으로 확인될 수 있다. 예를 들어, 관련 기술분야의 통상의 기술자는 제공된 폴리펩티드 또는 폴리뉴클레오티드 서열 내의 잔기가 종종 관련 참조 서열의 스킴에 따라 지정 (예를 들어, 넘버링 또는 라벨링)된다는 것을 인지한다 (예를 들어, 이러한 지정이 제공된 서열의 문자 넘버링을 반영하지 않더라도). 예시로서, 참조 서열이 위치 100-110에서 특정한 아미노산 모티프를 포함하고, 제2 관련 서열이 위치 110-120에서 동일한 모티프를 포함하는 경우에, 제2 관련 서열의 모티프 위치는 참조 서열의 위치 100-110"에 상응하는" 것으로 언급될 수 있다. 관련 기술분야의 통상의 기술자는 상응하는 위치가, 예를 들어 서열의 정렬에 의해 용이하게 확인될 수 있고, 이러한 정렬은 소프트웨어 프로그램, 예컨대 예를 들어 BLAST, CS-BLAST, CUDASW++, DIAMOND, FASTA, GGSEARCH/GLSEARCH, Genoogle, HMMER, HHpred/HHsearch, IDF, Infernal, KLAST, USEARCH, parasail, PSI-BLAST, PSI-Search, ScalaBLAST, Sequilab, SAM, SSEARCH, SWAPHI, SWAPHI-LS, SWIMM, 또는 SWIPE를 포함하나 이에 제한되지는 않는 다양한 공지된 도구, 전략, 및/또는 알고리즘 중 임의의 것에 의해 통상적으로 달성된다는 것을 인지한다.
투여 요법: 본원에 사용된 용어 "투여 요법"은, 전형적으로 각각의 복수의 단위 용량 투여가 다른 것의 투여와 소정 기간 분리되어 있는 것을 포함하는, 대상체에게 투여되는 1개 이상의 동일하거나 상이한 단위 용량의 세트를 지칭할 수 있다. 다양한 실시양태에서, 투여 요법의 하나 이상의 또는 모든 단위 용량은 동일할 수 있거나 또는 달라질 수 있다 (예를 들어, 시간 경과에 따라 증가하거나, 시간 경과에 따라 감소하거나, 또는 대상체 및/또는 의료 진료의의 결정에 따라 조정될 수 있음). 다양한 실시양태에서, 각각의 용량 사이의 기간 중 하나 이상 또는 모두는 동일할 수 있거나 또는 달라질 수 있다 (예를 들어, 시간 경과에 따라 증가하거나, 시간 경과에 따라 감소하거나, 또는 대상체 및/또는 의료 진료의의 결정에 따라 조정될 수 있음). 일부 실시양태에서, 주어지는 치료제는 1회 이상의 용량을 수반할 수 있는 권장 투여 요법을 갖는다. 전형적으로, 시판 약물의 적어도 하나의 권장 투여 요법은 관련 기술분야의 통상의 기술자에게 공지되어 있다. 일부 실시양태에서, 투여 요법은 관련 집단에 걸쳐 투여되는 경우에 목적하는 또는 유익한 결과와 상관된다 (즉, 치료 투여 요법임).
하류 및 상류: 본원에 사용된 용어 "하류"는 제1 DNA 영역이 제2 DNA 영역에 비해 제1 DNA 영역 및 제2 DNA 영역을 포함하는 핵산의 C-말단에 더 근접하다는 것을 의미한다. 본원에 사용된 용어 "상류"는 제1 DNA 영역이 제2 DNA 영역에 비해 제1 DNA 영역 및 제2 DNA 영역을 포함하는 핵산의 N-말단에 더 근접하다는 것을 의미한다.
조작된: 본원에 사용된 용어 "조작된"은 인간의 손에 의해 다루어진 측면을 지칭한다. 예를 들어, 폴리뉴클레오티드는 자연에서 그 순서로 함께 연결되지 않은 2개 이상의 서열이 조작된 폴리뉴클레오티드에서 서로 직접적으로 연결되도록 인간의 손에 의해 다루어진 경우에 "조작된" 것으로 간주된다. 관련 기술분야의 통상의 기술자는 "조작된" 핵산 또는 아미노산 서열이 재조합 핵산 또는 아미노산 서열일 수 있음을 인지할 것이다. 일부 실시양태에서, 조작된 폴리뉴클레오티드는, 자연에서 제1 서열과 작동가능하게 연결되어 발견되지만 자연에서 제2 서열과는 작동가능하게 연결되어 발견되지 않는 코딩 서열 및/또는 조절 서열을 인간의 손에 의해 제2 서열과 작동가능하게 연결된 상태로 조작된 폴리뉴클레오티드에 포함한다. 일부 실시양태에서, 세포 또는 유기체는 그의 유전자 정보가 변경되도록 다루어진 경우에 (예를 들어, 이전에 존재하지 않는 새로운 유전 물질이, 예를 들어 형질전환, 교배, 체세포 혼성화, 형질감염, 형질도입, 또는 다른 메카니즘에 의해 도입되었거나, 또는 이전에 존재하는 유전 물질이, 예를 들어 치환, 결실, 또는 교배에 의해 변경 또는 제거됨) "조작된" 것으로 간주된다. 관례와 같이, 그리고 관련 기술분야의 통상의 기술자에 의해 이해되는 바와 같이, 조작된 폴리뉴클레오티드 또는 세포의 완전한 또는 불완전한 자손 또는 카피는 직접 조작이 선행 실체에 대한 것일지라도 전형적으로 여전히 "조작된" 것으로 지칭된다.
부형제: 본원에 사용된 "부형제"는, 예를 들어 목적하는 점조도 또는 안정화 효과를 제공하거나 또는 이에 기여하기 위해 제약 조성물에 포함될 수 있는 비-치료제를 지칭한다. 일부 실시양태에서, 적합한 제약 부형제는, 예를 들어 전분, 글루코스, 락토스, 수크로스, 젤라틴, 맥아, 벼, 밀가루, 백악, 실리카 겔, 스테아르산나트륨, 글리세롤 모노스테아레이트, 활석, 염화나트륨, 건조 탈지유, 글리세롤, 프로필렌, 글리콜, 물, 에탄올 등을 포함할 수 있다.
발현: 본원에 사용된 "발현"은 핵산 서열로부터 코딩된 작용제, 예컨대 단백질의 생산을 발생시키는 1종 이상의 생물학적 과정을 개별적으로 및/또는 누적적으로 지칭한다. 발현은 구체적으로 전사 및 번역 중 하나 또는 둘 다를 포함한다.
단편: 본원에 사용된 "단편"은 참조 작용제 (때때로 "모" 작용제로 지칭됨)의 별개의 부분을 포함하고/거나 그로 이루어진 구조를 지칭한다. 일부 실시양태에서, 단편은 참조 작용제에서 발견되는 1개 이상의 모이어티가 결여되어 있다. 일부 실시양태에서, 단편은 참조 작용제에서 발견되는 1개 이상의 모이어티를 포함하거나 또는 그로 이루어진다. 일부 실시양태에서, 참조 작용제는 중합체, 예컨대 폴리뉴클레오티드 또는 폴리펩티드이다. 일부 실시양태에서, 중합체의 단편은 참조 중합체의 적어도 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 100, 110, 120, 130, 140, 150, 160, 170, 180, 190, 200, 210, 220, 230, 240, 250, 275, 300, 325, 350, 375, 400, 425, 450, 475, 500개 또는 그 초과의 단량체 단위 (예를 들어, 잔기)를 포함하거나 또는 그로 이루어진다. 일부 실시양태에서, 중합체의 단편은 참조 중합체에서 발견되는 단량체 단위 (예를 들어, 잔기)의 적어도 약 5%, 10%, 15%, 20%, 25%, 30%, 25%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 그 초과를 포함하거나 또는 그로 이루어진다. 참조 중합체의 단편은 참조 중합체의 상응하는 부분과 반드시 동일하지는 않다. 예를 들어, 참조 중합체의 단편은 참조 중합체에 대해 적어도 약 5%, 10%, 15%, 20%, 25%, 30%, 25%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 그 초과의 동일성을 갖는 잔기의 서열을 갖는 중합체일 수 있다. 단편은 참조 작용제의 물리적 단편화에 의해 생성될 수 있거나 또는 생성되지 않을 수 있다. 일부 경우에, 단편은 참조 작용제의 물리적 단편화에 의해 생성된다. 일부 경우에, 단편은 참조 작용제의 물리적 단편화에 의해 생성되지 않고, 대신에, 예를 들어 신생 합성 또는 다른 수단에 의해 생산될 수 있다.
유전자, 트랜스진: 본원에 사용된 용어 "유전자"는 임의로 코딩 서열의 발현을 제어하는 조절 서열의 일부 또는 전부와 함께, 코딩 서열이거나 또는 그를 포함하는 DNA 서열 (즉, 발현 생성물, 예컨대 RNA 생성물 및/또는 폴리펩티드 생성물을 코딩하는 DNA 서열)을 지칭한다. 일부 실시양태에서, 유전자는 비-코딩 서열, 예컨대 제한 없이 인트론을 포함한다. 일부 실시양태에서, 유전자는 코딩 (예를 들어, 엑손) 및 비-코딩 (예를 들어, 인트론) 서열 둘 다를 포함할 수 있다. 일부 실시양태에서, 유전자는 프로모터인 조절 서열을 포함한다. 일부 실시양태에서, 유전자는 (i) 공급원 게놈과 같은 참조 콘텍스트에서 코딩 서열의 상류에서 미리 결정된 수의 뉴클레오티드를 연장하는 DNA 뉴클레오티드, 및 (ii) 공급원 게놈과 같은 참조 콘텍스트에서 코딩 서열의 하류에서 미리 결정된 수의 뉴클레오티드를 연장하는 DNA 뉴클레오티드 중 하나 또는 둘 다를 포함한다. 다양한 실시양태에서, 미리 결정된 수의 뉴클레오티드는 500 bp, 1 kb, 2 kb, 3 kb, 4 kb, 5 kb, 10 kb, 20 kb, 30 kb, 40 kb, 50 kb, 75 kb, 또는 100 kb일 수 있다. 본원에 사용된 "트랜스진"은 유전자가 존재하거나 또는 유전자가 조작에 의해 배치될 수 있는 참조 콘텍스트에 대해 내인성 또는 천연이 아닌 유전자를 지칭한다.
유전자 생성물 또는 발현 생성물: 본원에 사용된 용어 "유전자 생성물" 또는 "발현 생성물"은 일반적으로 유전자로부터 전사된 RNA (프로세싱 전 및/또는 후), 또는 유전자로부터 전사된 RNA에 의해 코딩된 폴리펩티드 (변형 전 및/또는 후)를 지칭한다.
숙주 세포, 표적 세포: 본원에 사용된 "숙주 세포"는 외인성 DNA (재조합 또는 다른 것), 예컨대 트랜스진이 도입된 세포를 지칭한다. 관련 기술분야의 통상의 기술자는 "숙주 세포"가 외인성 DNA가 초기에 도입된 세포 및/또는 그의 완전한 또는 불완전한 자손 또는 카피일 수 있음을 인지한다. 일부 실시양태에서, 숙주 세포는 1종 이상의 바이러스 유전자 또는 트랜스진을 포함한다. 일부 실시양태에서, 의도된 또는 잠재적 숙주 세포는 표적 세포로 지칭될 수 있다.
동일성: 본원에 사용된 용어 "동일성"은 중합체 분자 사이, 예를 들어 핵산 분자 (예를 들어, DNA 분자 및/또는 RNA 분자) 사이 및/또는 폴리펩티드 분자 사이의 전체 관련성을 지칭한다. 2개의 제공된 서열 사이의 퍼센트 동일성의 계산 방법은 관련 기술분야에 공지되어 있다. 2개의 핵산 또는 폴리펩티드 서열의 퍼센트 동일성의 계산은, 예를 들어 최적 비교 목적을 위해 2개의 서열 (또는 하나 또는 둘 다의 서열의 상보체)을 정렬함으로써 수행될 수 있다 (예를 들어, 최적 정렬을 위해 제1 및 제2 서열 중 하나 또는 둘 다에 갭이 도입될 수 있고, 비-동일 서열은 비교 목적을 위해 무시될 수 있음). 이어서, 상응하는 위치의 뉴클레오티드 또는 아미노산이 비교된다. 제1 서열에서의 위치가 제2 서열에서의 상응하는 위치와 동일한 잔기 (예를 들어, 뉴클레오티드 또는 아미노산)에 의해 점유되는 경우에, 분자는 그 위치에서 동일하다. 2개의 서열 사이의 퍼센트 동일성은, 임의로 2개의 서열의 최적 정렬을 위해 도입될 필요가 있을 수 있는 갭의 수 및 각각의 갭의 길이를 고려한, 서열에 의해 공유되는 동일한 위치의 수의 함수이다. 서열의 비교 및 2개의 서열 사이의 퍼센트 동일성의 결정은 컴퓨터 알고리즘, 예컨대 BLAST (베이직 로컬 얼라인먼트 서치 툴)를 사용하여 달성될 수 있다.
"개선시키다", "증가시키다", "억제하다" 또는 "감소시키다": 본원에 사용된 용어 "개선시키다", "증가시키다", "억제하다" 및 "감소시키다" 및 그의 문법적 등가물은 참조로부터의 정성적 또는 정량적 차이를 나타낸다.
단리된: 본원에 사용된 "단리된"은 (1) (자연에서든 및/또는 실험 설정에서든) 초기에 생산되었을 때 그와 회합된 성분 중 적어도 일부로부터 분리되고/거나, (2) 인간의 손에 의해 설계, 생산, 제조, 및/또는 제작된 물질 및/또는 실체를 지칭한다. 단리된 물질 및/또는 실체는 초기에 회합된 다른 성분의 약 10%, 약 20%, 약 30%, 약 40%, 약 50%, 약 60%, 약 70%, 약 80%, 약 90%, 약 91%, 약 92%, 약 93%, 약 94%, 약 95%, 약 96%, 약 97%, 약 98%, 약 99%, 또는 약 99% 초과로부터 분리될 수 있다. 일부 실시양태에서, 단리된 작용제는 약 80%, 약 85%, 약 90%, 약 91%, 약 92%, 약 93%, 약 94%, 약 95%, 약 96%, 약 97%, 약 98%, 약 99%, 또는 약 99% 초과로 순수하다. 본원에 사용된 바와 같이, 물질은 다른 성분이 실질적으로 없는 경우에 "순수"하다. 일부 실시양태에서, 관련 기술분야의 통상의 기술자에 의해 이해되는 바와 같이, 물질은 특정 다른 성분, 예컨대 예를 들어 1종 이상의 담체 또는 부형제 (예를 들어, 완충제, 용매, 물 등)와 조합된 후에도 여전히 "단리된" 또는 심지어 "순수한" 것으로 간주될 수 있고; 이러한 실시양태에서, 물질의 퍼센트 단리 또는 순도는 이러한 담체 또는 부형제를 포함하지 않고 계산된다. 하나의 예를 제공하자면, 일부 실시양태에서, 자연 발생 생물학적 중합체, 예컨대 폴리펩티드 또는 폴리뉴클레오티드는 a) 그의 기원 또는 유래 공급원에 의해 자연에서 그의 천연 상태에서 동반되는 성분의 일부 또는 전부와 회합되지 않은 경우; b) 자연에서 그를 생산하는 종으로부터의 동일한 종의 다른 폴리펩티드 또는 핵산이 실질적으로 없는 경우; c) 자연에서 그를 생산하는 종이 아닌 세포 또는 다른 발현 시스템으로부터의 성분에 의해 발현되거나 또는 달리 그와 회합되는 경우, "단리된" 것으로 간주된다. 따라서, 예를 들어, 일부 실시양태에서, 화학적으로 합성되거나 또는 자연에서 그를 생산하는 것과 상이한 세포 시스템에서 합성된 폴리펩티드는 "단리된" 폴리펩티드인 것으로 간주된다. 대안적으로 또는 추가적으로, 일부 실시양태에서, 1종 이상의 정제 기술에 적용된 폴리펩티드는 a) 자연에서 회합된 다른 성분; 및/또는 b) 초기에 생산될 때 회합된 다른 성분으로부터 분리된 정도로 "단리된" 폴리펩티드인 것으로 간주될 수 있다.
작동가능하게 연결된: 본원에 사용된 "작동가능하게 연결된"은 적어도 제1 요소 및 제2 요소가 그의 의도된 방식으로 기능하도록 허용하는 관계에 있도록 구성 요소가 회합된 것을 지칭한다. 예를 들어, 핵산 조절 서열은 조절 서열 및 코딩 서열이 조절 서열에 의한 코딩 서열의 발현의 제어를 허용하는 방식으로 회합된 경우에 핵산 코딩 서열에 "작동가능하게 연결된"다. 일부 실시양태에서, "작동가능하게 연결된" 조절 서열은 코딩 서열과 직접적으로 또는 간접적으로 공유 회합된다 (예를 들어, 단일 핵산에서). 일부 실시양태에서, 조절 서열은 코딩 서열의 발현을 트랜스로 제어하고, 코딩 서열과 동일한 핵산에 조절 서열이 포함되는 것은 작동가능한 연결의 요건이 아니다.
제약상 허용되는: 본원에 개시된 바와 같은 조성물의 제제를 위한 1종 이상의 또는 모든 성분(들)에 적용되는, 본원에 사용된 용어 "제약상 허용되는"은, 각각의 성분이 조성물의 다른 성분과 상용성이어야 하고 그의 수용자에게 유해하지 않아야 함을 의미한다.
제약상 허용되는 담체: 본원에 사용된 용어 "제약상 허용되는 담체"는 작용제 (예를 들어, 제약 작용제)의 제제화를 용이하게 하거나, 작용제의 생체이용률을 변형시키거나, 또는 대상체의 하나의 기관 또는 부분으로부터 또 다른 기관 또는 부분으로의 작용제의 수송을 용이하게 하는 제약상 허용되는 물질, 조성물, 또는 비히클, 예컨대 액체 또는 고체 충전제, 희석제, 부형제, 또는 용매 캡슐화 물질을 지칭한다. 제약상 허용되는 담체로서의 역할을 할 수 있는 물질의 일부 예는 당, 예컨대 락토스, 글루코스 및 수크로스; 전분, 예컨대 옥수수 전분 및 감자 전분; 셀룰로스 및 그의 유도체, 예컨대 소듐 카르복시메틸 셀룰로스, 에틸 셀룰로스 및 셀룰로스 아세테이트; 분말화 트라가칸트; 맥아; 젤라틴; 활석; 부형제, 예컨대 코코아 버터 및 좌제 왁스; 오일, 예컨대 땅콩 오일, 목화씨 오일, 홍화 오일, 참깨 오일, 올리브 오일, 옥수수 오일 및 대두 오일; 글리콜, 예컨대 프로필렌 글리콜; 폴리올, 예컨대 글리세린, 소르비톨, 만니톨 및 폴리에틸렌 글리콜; 에스테르, 예컨대 에틸 올레에이트 및 에틸 라우레이트; 한천; 완충제, 예컨대 수산화마그네슘 및 수산화알루미늄; 알긴산; 발열원 무함유 물; 등장성 염수; 링거액; 에틸 알콜; pH 완충 용액; 폴리에스테르, 폴리카르보네이트 및/또는 폴리무수물; 및 제약 제제에 사용되는 다른 비-독성 상용성 물질을 포함한다.
제약 조성물: 본원에 사용된 용어 "제약 조성물"은 활성제가 1종 이상의 제약상 허용되는 담체와 함께 제제화된 조성물을 지칭한다.
프로모터: 본원에 사용된 "프로모터" 또는 "프로모터 서열"은 코딩 서열의 전사의 개시 및/또는 진행성에 직접적으로 또는 간접적으로 (예를 들어, 프로모터-결합된 단백질 또는 물질을 통해) 참여하는 DNA 조절 영역일 수 있다. 프로모터는, 적합한 조건 하에, 1개 이상의 전사 인자 및/또는 조절 모이어티와 프로모터의 결합 시 코딩 서열의 전사를 개시할 수 있다. 코딩 서열의 전사의 개시에 참여하는 프로모터는 코딩 서열에 "작동가능하게 연결"될 수 있다. 특정 경우에, 프로모터는 전사 개시 부위로부터 (그의 3' 말단에서) 상류 (5' 방향) 위치로 연장되어 그렇게 지정된 서열이 전사 사건을 개시하는데 필요한 최소 개수의 염기 또는 요소 중 하나 또는 둘 다를 포함하도록 한 DNA 조절 영역일 수 있거나 또는 그를 포함할 수 있다. 프로모터는 발현 제어 서열, 예컨대 인핸서 및 리프레서 서열일 수 있거나, 그를 포함할 수 있거나, 또는 그와 작동가능하게 회합될 수 있거나, 또는 그에 작동가능하게 연결될 수 있다. 일부 실시양태에서, 프로모터는 유도성일 수 있다. 일부 실시양태에서, 프로모터는 구성적 프로모터일 수 있다. 일부 실시양태에서, 조건부 (예를 들어, 유도성) 프로모터는 단방향성 또는 양방향성일 수 있다. 프로모터는 특정한 종의 게놈에서 발생하는 것으로 공지된 서열과 동일한 서열일 수 있거나 또는 그를 포함할 수 있다. 일부 실시양태에서, 프로모터는 전사 조절 영역을 함유하는 서열이 하나의 공급원으로부터 수득될 수 있고 전사 개시 영역을 함유하는 서열이 제2 공급원으로부터 수득될 수 있는 것인 하이브리드 프로모터일 수 있거나 또는 그를 포함할 수 있다. 제어 요소를 트랜스진 내의 코딩 서열에 연결시키기 위한 시스템은 관련 기술분야에 널리 공지되어 있다 (일반적인 분자 생물학적 및 재조합 DNA 기술은 문헌 [Sambrook, Fritsch, and Maniatis, Molecular Cloning: A Laboratory Manual, Second Edition, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY, 1989]에 기재되어 있음).
참조: 본원에 사용된 "참조"는 비교가 수행되는 표준물 또는 대조군을 지칭한다. 예를 들어, 일부 실시양태에서, 작용제, 샘플, 서열, 대상체, 동물, 또는 개체, 또는 그의 집단, 또는 그의 측정값 또는 그를 나타내는 특징을 참조, 작용제, 샘플, 서열, 대상체, 동물, 또는 개체, 또는 그의 집단, 또는 그의 측정값 또는 그를 나타내는 특징과 비교한다. 일부 실시양태에서, 참조는 측정된 값이다. 일부 실시양태에서, 참조는 확립된 표준물 또는 예상 값이다. 일부 실시양태에서, 참조는 과거 참조이다. 참조는 정량적 또는 정성적일 수 있다. 전형적으로, 관련 기술분야의 통상의 기술자에 의해 이해되는 바와 같이, 참조 및 그와 비교되는 값은 대등한 조건 하의 측정값을 나타낸다. 관련 기술분야의 통상의 기술자는 충분한 유사성이 존재하여 의존 및/또는 비교를 정당화하는 경우를 인지할 것이다. 일부 실시양태에서, 적절한 참조는, 예를 들어 1종 이상의 특정한 변수 (예를 들어, 작용제 또는 조건의 존재 또는 부재), 또는 그의 측정값 또는 그를 나타내는 특징을 평가하기 위한 목적으로, 관련 기술분야의 통상의 기술자가 대등한 것으로 인식할 조건 하의 작용제, 샘플, 서열, 대상체, 동물, 또는 개체, 또는 그의 집단일 수 있다.
조절 서열: 핵산 코딩 서열의 발현과 관련하여 본원에 사용된 조절 서열은 코딩 서열의 발현을 제어하는 핵산 서열이다. 일부 실시양태에서, 조절 서열은 유전자 발현 (예를 들어, 세포-유형-특이적 발현, 유도성 발현 등)의 1종 이상의 측면을 제어하거나 또는 그에 영향을 미칠 수 있다.
대상체: 본원에 사용된 용어 "대상체"는 유기체, 전형적으로 포유동물 (예를 들어, 인간, 래트 또는 마우스)을 지칭한다. 일부 실시양태에서, 대상체는 질환, 장애 또는 상태를 앓고 있다. 일부 실시양태에서, 대상체는 질환, 장애 또는 상태에 대해 감수성이다. 일부 실시양태에서, 대상체는 질환, 장애 또는 상태의 1종 이상의 증상 또는 특징을 나타낸다. 일부 실시양태에서, 대상체는 질환, 장애 또는 상태를 앓고 있지 않다. 일부 실시양태에서, 대상체는 질환, 장애 또는 상태의 어떠한 증상 또는 특징도 나타내지 않는다. 일부 실시양태에서, 대상체는 질환, 장애, 또는 상태에 대한 감수성 또는 그의 위험에 특징적인 1종 이상의 특색을 갖는다. 일부 실시양태에서, 대상체는 질환, 장애, 또는 상태에 대해 시험되고/거나 요법이 투여된 대상체이다. 일부 경우에, 인간 대상체는 "환자" 또는 "개체"로서 상호교환가능하게 지칭될 수 있다.
치료제: 본원에 사용된 용어 "치료제"는 대상체에게 투여되는 경우에 목적하는 약리학적 효과를 도출하는 임의의 작용제를 지칭한다. 일부 실시양태에서, 작용제는 적절한 집단에 걸쳐 통계적으로 유의한 효과를 입증하는 경우에 치료제인 것으로 간주된다. 일부 실시양태에서, 적절한 집단은 모델 유기체 집단 또는 인간 집단일 수 있다. 일부 실시양태에서, 적절한 집단은 다양한 기준, 예컨대 특정 연령 군, 성별, 유전적 배경, 기존 임상 상태 등에 의해 규정될 수 있다. 일부 실시양태에서, 치료제는 질환, 장애, 또는 상태의 치료에 사용될 수 있는 물질이다. 일부 실시양태에서, 치료제는 인간에게 투여하기 위해 시판될 수 있기 전에 정부 기관에 의해 승인받았거나 또는 승인될 것이 요구되는 작용제이다. 일부 실시양태에서, 치료제는 인간에게 투여하기 위해 의료 처방이 요구되는 작용제이다.
치료 유효량: 본원에 사용된 "치료 유효량"은 그것이 투여되어 목적하는 효과를 생성하는 양을 지칭한다. 일부 실시양태에서, 상기 용어는 치료 투여 요법에 따라 질환, 장애, 및/또는 상태를 앓고 있거나 또는 그에 대해 감수성인 집단에게 투여되는 경우에 질환, 장애, 및/또는 상태를 치료하기에 충분한 양을 지칭한다. 일부 실시양태에서, 치료 유효량은 질환, 장애, 및/또는 상태의 1종 이상의 증상의 발생률 및/또는 중증도를 감소시키고/거나 그의 발병을 지연시키는 양이다. 관련 기술분야의 통상의 기술자는 용어 "치료 유효량"이 실제로 특정한 개체에서 달성되는 성공적인 치료를 요구하지 않는다는 것을 인지할 것이다. 오히려, 치료 유효량은 이러한 치료를 필요로 하는 환자에게 투여되는 경우에 유의한 수의 대상체에서 특정한 목적하는 약리학적 반응을 제공하는 양일 수 있다. 일부 실시양태에서, 치료 유효량에 대한 언급은 1종 이상의 특정 조직 (예를 들어, 질환, 장애 또는 상태에 걸린 조직) 또는 유체 (예를 들어, 혈액, 타액, 혈청, 땀, 눈물, 소변 등)에서 측정된 바와 같은 양에 대한 언급일 수 있다. 관련 기술분야의 통상의 기술자는, 일부 실시양태에서, 특정한 작용제 또는 요법의 치료 유효량이 단일 용량으로 제제화 및/또는 투여될 수 있다는 것을 인지할 것이다. 일부 실시양태에서, 치료상 유효한 작용제는, 예를 들어 투여 요법의 일부로서 복수의 용량으로 제제화 및/또는 투여될 수 있다.
치료: 본원에 사용된 용어 "치료" (또한 "치료하다" 또는 "치료하는")는 특정한 질환, 장애, 또는 상태의 1종 이상의 증상, 특색, 및/또는 원인을 부분적으로 또는 완전히 완화시키고/거나, 호전시키고/거나, 경감시키고/거나, 억제하고/거나, 그의 발병을 지연시키고/거나, 그의 중증도를 감소시키고/거나, 그의 발생률을 감소시키거나, 또는 임의의 이러한 결과를 달성하기 위한 목적으로 투여되는 요법의 투여를 지칭한다. 일부 실시양태에서, 이러한 치료는 관련 질환, 장애, 또는 상태의 징후를 나타내지 않는 대상체 및/또는 질환, 장애, 또는 상태의 초기 징후만을 나타내는 대상체의 치료일 수 있다. 대안적으로 또는 추가적으로, 이러한 치료는 관련 질환, 장애 및/또는 상태의 1종 이상의 확립된 징후를 나타내는 대상체의 치료일 수 있다. 일부 실시양태에서, 치료는 관련 질환, 장애, 및/또는 상태를 앓는 것으로 진단된 대상체의 치료일 수 있다. 일부 실시양태에서, 치료는 관련 질환, 장애, 또는 상태의 발생 위험의 증가와 통계적으로 상관관계가 있는 1종 이상의 감수성 인자를 갖는 것으로 공지된 대상체의 치료일 수 있다.
단위 용량: 본원에 사용된 용어 "단위 용량"은 제약 조성물의 단일 용량으로서 및/또는 물리적 이산 단위로 투여되는 양을 지칭한다. 많은 실시양태에서, 단위 용량은 활성제의 미리 결정된 양, 예를 들어 미리 결정된 바이러스 역가 (주어진 부피 중 바이러스, 비리온, 또는 바이러스 입자의 수)를 함유한다. 일부 실시양태에서, 단위 용량은 작용제의 전체 단일 용량을 함유한다. 일부 실시양태에서, 1개 초과의 단위 용량이 투여되어 총 단일 용량을 달성한다. 일부 실시양태에서, 의도된 효과를 달성하기 위해 다중 단위 용량의 투여가 요구되거나 또는 요구될 것으로 예상된다. 단위 용량은, 예를 들어 미리 결정된 양의 1종 이상의 치료 모이어티를 함유하는 소정 부피의 액체 (예를 들어, 허용되는 담체), 고체 형태의 미리 결정된 양의 1종 이상의 치료 모이어티, 미리 결정된 양의 1종 이상의 치료 모이어티를 함유하는 지속 방출 제제 또는 약물 전달 장치 등일 수 있다. 단위 용량은 치료 모이어티(들)에 더하여 임의의 다양한 성분을 포함하는 제제 중에 존재할 수 있는 것으로 인지될 것이다. 예를 들어, 허용되는 담체 (예를 들어, 제약상 허용되는 담체), 희석제, 안정화제, 완충제, 보존제 등이 포함될 수 있다. 관련 기술분야의 통상의 기술자는, 많은 실시양태에서, 특정한 치료제의 총 적절한 1일 투여량은 일부의 또는 복수의 단위 용량을 포함할 수 있고, 이는 예를 들어 타당한 의학적 판단의 범주 내에서 의료 진료의에 의해 결정될 수 있음을 인지할 것이다. 일부 실시양태에서, 임의의 특정한 대상체 또는 유기체에 대한 구체적 유효 용량 수준은 치료될 장애 및 장애의 중증도; 사용되는 구체적 활성 화합물의 활성; 사용되는 구체적 조성물; 대상체의 연령, 체중, 전반적 건강, 성별, 및 식이; 투여 시간, 및 사용되는 구체적 활성 화합물의 배출 속도; 치료 지속기간; 이용되는 구체적 화합물(들)과 조합되어 또는 동시에 사용되는 약물 및/또는 추가의 요법, 및 의학 기술분야에 널리 공지된 기타 인자를 포함한 다양한 인자에 좌우될 수 있다.
본원에 제출된 도면 중 1개 이상은 컬러로 더 잘 이해된다. 본 출원인은 도면의 컬러 버전을 원래의 제출의 일부로 간주하고, 이후의 진행에서 도면의 컬러 영상을 제시할 권리를 보유한다.
도 1a-1d. HDAd-긴-LCR을 사용한 생체외 HSPC 형질도입 연구. (도 1a) 벡터 구조. 21.5 kb β-글로빈 LCR의 제어 하의 γ-글로빈 유전자, 1.6 kb β-글로빈 프로모터 및 또한 β-글로빈 유전자좌로부터 유래된 3'HS1 영역. 적혈구 세포에서의 RNA 안정화를 위해, β-글로빈 유전자 UTR을 γ-글로빈 유전자의 3' 단부에 연결시켰다. 벡터는 또한 형질도입된 HSPC 및 HSPC 자손의 생체내 선택을 가능하게 하는 mgmtP140K에 대한 발현 카세트를 함유한다. γ-글로빈 및 mgmt 발현 카세트는 닭 글로빈 HS4 인슐레이터에 의해 분리된다. 32.4 kb LCR-γ-글로빈/mgtm 트랜스포손은 SB100x에 의해 인식되는 역전된 반복부 (IR) 및 Flpe 레콤비나제에 의한 트랜스포손의 원형화를 가능하게 하는 ftr 부위에 플랭킹된다. (도 1b) 실험 요법. CD46-트랜스제닉 마우스로부터의 골수 Lin- 세포를 HDAd-긴-LCR 및 HDAd-SB로 500 vp/세포의 총 MOI로 형질도입하였다. 배양 1일 후, 1x106개의 형질도입된 세포/마우스를 치사 방사선조사된 C57Bl/6 마우스에 이식하였다. 제4주에, O6BG/BCNU 처리를 시작하고, 2주마다 4회 반복하였다. 각각의 사이클에서, BCNU 농도를 5 mg/kg에서 7.5 mg/kg으로, 10 mg/kg (2회)으로 증가시켰다. 제20주에, 마우스를 희생시켰다. (도 1c) 유동 세포측정법에 의해 측정된 인간 γ-글로빈-양성 말초 적혈구 (RBC)의 백분율. 각각의 기호는 개별 동물이다. (도 1d) 이식 후 제20주에 적혈구 (Ter119+) 골수 세포 (하부 패널)에서의 인간 γ-글로빈-발현을 보여주는 대표적인 유동 세포측정 데이터. 상부 패널은 모의-형질도입된 세포가 이식된 마우스를 보여준다.
도 2a-2c. 이식 후 제20주에 동물로부터의 골수 세포에서의 벡터/염색체 접합부의 iPCR 분석. (도 2a) iPCR 분석의 개략도. 5 마이크로그램의 게놈 DNA를 SacI로 소화시키고, 재-라이게이션하고, 표시된 프라이머를 사용한 네스티드, 역 PCR에 적용하였다 (물질 및 방법 참조). (도 2b) 통합 접합부를 함유하는 클로닝된 플라스미드의 아가로스 겔 전기영동. 표시된 밴드를 절제하고 서열분석하였다. 염색체 통합 부위가 겔 아래에 제시된다. (도 2c) 접합부 서열의 예: 5' 단부 벡터 서열, 슬리핑 뷰티 IR/DR 서열, 통합 접합부 (chr15, 6805206) 서열식별번호(SEQ ID NO): 1; 5' 단부 벡터 서열, 슬리핑 뷰티 IR/DR 서열, 통합 접합부 (chrX, 16897322) 서열식별번호: 2; 3' 단부 벡터 서열, 슬리핑 뷰티 IR/DR 서열, 통합 접합부 (chr4, 10207667) 서열식별번호: 3. 벡터 바디 및 IR/DR 서열은 각각 기본 문자 및 밑줄로 지정된다. 염색체 서열은 볼드체 문자로 지정된다. IR 및 염색체 DNA의 접합부에서 SB100x에 의해 사용되는 TA 디뉴클레오티드는 괄호표시된다.
도 3a-3e. 32.4 kb 트랜스포손을 함유하는 HDAd-긴-LCR 및 11.8 kb 트랜스포손을 함유하는 HDAd-짧은-LCR로의 생체내 HSPC 형질도입. (도 3a) 21.5 kb HS1-HS5 LCR 및 3'HS1 (도 1a HDAd-짧은-LCR) 대신에, 이 벡터는 DNase 과민성 부위 (HS) 1 내지 4의 코어 영역을 포함하는 4.3 kb 미니-LCR을 함유한다. (도 3b) 처리 요법. hCD46tg 마우스를 가동화하고, HDAd-짧은-LCR + HDAd-SB 또는 HDAd-긴-LCR +HDAd-SB를 IV 주사하였다 (2회, 각각 둘 다의 바이러스의 1:1 혼합물의 4x1010 vp). 5주 후, O6BG/BCNU 처리를 시작하였다. 각각의 사이클에서, BCNU 농도를 2.5 mg/kg에서 7.5 mg/kg, 및 10 mg/kg으로 증가시켰다. O6BG 농도는 모든 3가지 처리에서 30 mg/kg이었다. 분석 및 2차 수용자 내로의 Lin- 세포 이식을 위해 동물을 희생시킨 경우에 제20주까지 마우스를 추적하였다. 이어서, 2차 수용자를 16주 동안 추적하였다. 생체내 HSPC 형질도입된 동물은 인간 γ-글로빈 및 mgtm 단백질에 대한 면역 반응을 방지하기 위해 면역억제 (IS) 약물을 제공받았다. (도 3c) 유동 세포측정법에 의해 측정된 말초 적혈구 (RBC)에서의 인간 γ-글로빈-양성 세포의 백분율. 각각의 기호는 개별 동물이다. 모의-형질도입된 마우스에서, 0.1% 미만의 세포가 γ-글로빈-양성이었다. (도 3d) 생체내 HSPC 형질도입 후 제20주에 RBC에서 HPLC에 의해 측정된 γ-글로빈 단백질 쇄 수준. 인간 γ-글로빈 대 마우스 α-글로빈 단백질 쇄의 백분율이 제시된다. (도 3e) 생체내 HSPC 형질도입 후 제20주에 총 혈액에서 qRT-PCR에 의해 측정된 γ-글로빈 mRNA 수준. 인간 γ-글로빈 mRNA 대 마우스 α-글로빈 mRNA의 백분율이 제시된다.
도 4. 생체내 HSPC 형질도입 후 제20주에 수거된 골수 MNC에서의 세포당 벡터 카피수. 2개의 군 사이의 차이는 유의하지 않다.
도 5a-5d. 생체내 HSPC 형질도입 후 제20주에서의 혈액 파라미터. (도 5a) 백혈구 (WBC), 호중구 (NE), 백혈구 (LY), 단핵구 (MO), 호산구 (EO), 및 호염기구 (BA). (도 5b) 적혈구생성 파라미터. RBC: 적혈구, Hb: 헤모글로빈, MCV: 평균 적혈구 부피, MCH: 평균 적혈구 헤모글로빈, MCHC: 평균 적혈구 헤모글로빈 농도, RDW: 적혈구 분포 폭. 3개의 군 사이의 차이는 유의하지 않았다. (도 5c) 세포 골수 조성. (도 5d) 골수 Lin- 세포의 콜로니-형성 잠재력. 군 사이의 차이는 도 5a-5d에서 유의하지 않았다. 도 5의 패널에서의 데이터는 HDAd 짧은-LCR 및/또는 긴-LCR 벡터에 의한 생체내 HSPC 형질도입이 골수에서 조혈 및 세포 분포에 영향을 미치지 않는다는 것을 보여준다.
도 6. 슬리핑 뷰티 역전된 반복부 (IR)와 관련하여 HDAd-글로빈 벡터에서의 NheI 및 KpnI 부위의 국재화가 표시된다. 이들 효소는 SB IR/DR과 근접하지만 그의 외부를 절단하며, 비통합된 벡터의 배경을 감소시키는데 사용된다. 골수 Lin- 세포로부터의 나머지 게놈 DNA를 NheI 및 KpnI로 소화시키고, 열 불활성화 후에 추가로 NlaIII으로 소화시켰다. NlaIII는 4-커터이고, 작은 DNA 단편을 생성할 것이다. 이어서, 소화된 DNA를 공지된 서열 및 소화된 NlaIII 단편에 대한 상용성 단부를 갖는 이중 가닥 올리고와 라이게이션하였다. 열-불활성화 및 세정 후, 링커-라이게이션된 생성물을 선형 증폭에 사용하였고, 이는 SB 좌측 아암으로부터 프라이밍된 단일 가닥 (ss) DNA 집단을 생성한다. 프라이머는 비오티닐화되어, ssDNA는 스트렙타비딘 비드로 수집될 수 있다. 광범위한 세척 후에, ssDNA를 비드로부터 용리시키고, 2 라운드의 네스티드 PCR에 의한 추가의 증폭에 적용하였다. PCR 앰플리콘을 겔 정제하고, 클로닝하고, 서열분석하고, 마우스 게놈 서열에 맵핑하여 통합 부위를 마킹하였다.
도 7a-7d. HSPC에서의 벡터 통합 부위의 분석. HDAd-긴-LCR +HDAd-SB로의 생체내 형질도입 후 제20주에 수거된 골수 Lin- 세포로부터 단리된 게놈 DNA. (도 7aa, 도 7ab) 통합 부위의 염색체 분포. 게놈-전반 슬리핑 뷰티 통합. 통합 부위는 수직선에 의해 마킹된다. (도 7b) 접합부 서열의 예: 슬리핑 뷰티 IR/DR 서열, 통합 접합부 (chr7, 79796094) 서열식별번호: 4; 슬리핑 뷰티 IR/DR 서열, 통합 접합부 (반복부 영역) 서열식별번호: 5. IR/DR 서열은 밑줄 및 볼드체 문자로 지정된다. 염색체 서열은 기본 문자로 지정된다. IR 및 염색체 DNA의 접합부에서 SB100x에 의해 사용되는 TA 디뉴클레오티드는 볼드체표시된다. (도 7c) RefSeq 주석과 관련된 게놈-전반 슬리핑 뷰티 통합. 통합 부위를 마우스 게놈에 맵핑하고, 유전자에 대한 그의 위치를 분석하였다. 1 kb 상류 전사 개시 부위, 엑손의 3'UTR, 단백질 코딩 서열, 인트론, 3'UTR, 3'UTR로부터 1 kb 하류, 및 유전자간에 발생한 통합 사건의 백분율이 제시된다. (도 7d) 무작위화된 대조군과 비교한 슬리핑 뷰티 통합 패턴. 마우스 게놈 윈도우에서의 통합 패턴. 연속 게놈 윈도우 및 무작위화된 마우스 게놈 윈도우와 중첩되는 통합의 수 및 크기를 비교하였다. 이는 통합 패턴이 연속 및 무작위 윈도우에서 유사하다는 것을 보여준다. 임의의 주어진 윈도우에서 최대 통합의 수는 3 이하이고; 윈도우당 1 통합이 보다 높은 발생률을 갖는다. 값은 평균 ± s.d.를 나타낸다. 도 7의 패널의 데이터는 유전자에 대한 선호도 없이 근-무작위 통합 패턴을 보여준다.
도 8a-8e. 2차 수용자의 분석. 생체내 형질도입된 CD46tg 마우스로부터 제20주에 수거한 골수 Lin- 세포를 치사 방사선조사된 C57Bl/6 마우스에 이식하였다. 2차 수용자를 16주 동안 추적하였다. (도 8a) CD46-양성 PBMC의 백분율에 기초한 생착률. 2개의 군 사이의 차이는 유의하지 않았다. (도 8b) 유동 세포측정법에 의해 측정된 γ-글로빈-발현 말초 혈액 RBC의 백분율. 2개의 군 사이의 차이는 유의하지 않다. (도 8c) 2차 수용자의 RBC에서 HPLC에 의한 인간 γ-글로빈 쇄의 분석. 이식 후 제4주, 제8주, 제12주, 및 제16주의 인간 γ-글로빈 대 성체 마우스 α 글로빈의 백분율이 제시된다. * p<0.0001. 통계적 분석을 이원 ANOVA를 사용하여 수행하였다. (도 8d) 총 혈액 세포에서의 γ-글로빈 mRNA 수준. 인간 γ-글로빈 mRNA 대 마우스 α 및 β-주요 글로빈 mRNA의 백분율이 제시된다. (도 8e) p.t. 제16주의 γ-글로빈 mRNA 수준 골수 MNC. 인간 γ-글로빈 m-RNA 대 마우스 α 및 β-주요 글로빈 mRNA의 백분율이 제시된다. 도 8 및 9의 패널은, 개별적으로 또는 함께, "32.4" kb 트랜스포손의 통합이 장기 재증식 세포에서 일어났고; 긴 LCR을 갖는 벡터로부터의 γ-글로빈 발현 수준이 짧은 LCR을 갖는 벡터와 비교하여 시간 경과에 따라 증가하였고, 긴 LCR을 갖는 벡터가 γ-글로빈 발현의 보다 엄격한 적혈구 특이성을 제공하였음을 보여준다.
도 9a-9c. 2차 수용자의 골수에서의 γ-글로빈 발현의 적혈구 특이성 (이식 후 제16주). (도 9a) 모든 골수 MNC에서의 γ-글로빈 발현 적혈구 (Ter119+ 세포)의 백분율. (도 9b) 적혈구 특이성. 적혈구 (Ter119+) 및 비-적혈구 (Ter119-) 세포에서의 γ-글로빈+ 세포의 백분율. (도 9c) 생체내 HSPC 형질도입 후 제20주에 수거한 골수 MNC에서의 세포당 벡터 카피수 (VCN). 2개의 군 사이의 차이는 유의하지 않다.
도 10a-10d. 이식 후 제16주에 2차 수용자에서의 혈액 파라미터. (도 10a) 백혈구. (도 10b) 적혈구생성 파라미터. RBC: 적혈구, Hb: 헤모글로빈, MCV: 평균 적혈구 부피, MCH: 평균 적혈구 헤모글로빈, MCHC: 평균 적혈구 헤모글로빈 농도, RDW: 적혈구 분포 폭. 3개의 군 사이의 차이는 유의하지 않았다. (도 10c) 세포 골수 조성. (도 10d) 골수 Lin- 세포의 콜로니-형성 잠재력.
도 11a-11c. 인간 CD34+ 세포를 사용한 시험관내 연구. (도 11a) 실험의 개략도. CD34+ 세포를 HDAd-긴-LCR + HD-SB 또는 HDAd-짧은-LCR + HDAd-SB로 형질도입하고, 적혈구 분화 (ED)에 적용하였다. O6BG-BCNU로의 시험관내 선택을 ED의 제5일에 시작하였다. 제18일에 세포를 유동 세포측정법 (도 11b) 및 HPLC (도 11c)에 의해 분석하였다. 도 11의 패널은 인간 세포 시스템에서 HDAd 긴-LCR 벡터가 형질도입된 인간 HSC/CD34+ 세포의 적혈구 분화 후에 보다 높은 γ-글로빈 발현을 제공한다는 것을 보여준다.
도 12a-12b. 마우스에서의 벡터 hCD46tg로의 생체내 HSC 형질도입: "긴" vs "짧은" 벡터 LCR. (도 12a) HDAd-긴-LCR-γ-글로빈/mgmt. 벡터 및 HDAd-짧은-LCR-γ-글로빈/mgmt. 벡터. (도 12b) 마우스에서 벡터 Hbbth3/CD46의 생체내 형질도입. 군 1은 7마리의 마우스에서의 HDAd-긴-LCR-γ-글로빈/mgmt 플러스 HDAd-SB/Flpe의 생체내 형질도입을 보여준다. 군 2는 3마리의 마우스에서의 HDAd-짧은-LCRγ-글로빈/mgmt 플러스 HDAd-SB/Flpe의 생체내 형질도입을 보여준다. O6BG, BCNU를 위해 단지 3회의 선택 사이클이 필요하였다.
도 13. Thbb 마우스 시험 (W6). 그래프 결과는 긴 LCR 벡터 대 짧은 LCR 벡터로 형질도입되었을 때 마우스 사이에서 차이가 없고 인간 γ-글로빈 발현이 거의 없음을 보여준다. 2개의 페이지.
도 14. Thbb 마우스 시험 (W8). 그래프 결과는 긴 LCR 벡터 대 짧은 LCR 벡터로 형질도입되었을 때 마우스 사이의 차이를 보여주지만, 짧은 LCR 바이러스가 마우스에서 사멸되었는지는 불명확하다. 2개의 페이지.
도 15. 마우스에서 인간 γ-글로빈 발현 RBC의 백분율을 보여주는 그래프 도면. 그래프는 단지 3회 사이클의 생체내 선택 후의 100% 마킹을 예시한다.
도 16. 마우스 HBA에 대한 상대적인 인간 γ-글로빈을 보여주는 HPLC의 그래프 도면 (제10주). 그래프는 짧은 LCR과 비교하여 긴 LCR에 대해 유의하게 더 높은 γ-글로빈 수준을 보여준다.
도 17. 긴 LCR 벡터를 함유하는 마우스 #57의 예시적인 제10주 혈액 HPLC의 그래프 도면.
도 18a-18d. HDAd-짧은-LCR 및 HDAd-긴-LCR을 사용한 Hbbth3/CD46 마우스의 생체내 HSC 유전자 요법 후의 인간 γ-글로빈 발현. (도 18a) 치료 요법. 도 3a-3e와 대조적으로, 도 18a-18d는 지중해빈혈 Hbbth3/CD46 마우스에서의 결과를 보여준다. (도 18b) 유동 세포측정법에 의해 측정된 말초 적혈구 (RBC)에서의 인간 γ-글로빈-양성 세포의 백분율. 각각의 기호는 개별 동물이다. (도 18c) 생체내 HSPC 형질도입 후 제18주에 RBC에서 HPLC에 의해 측정된 γ-글로빈 단백질 쇄 수준. 인간 γ-글로빈 대 마우스 α-글로빈 단백질 쇄의 백분율이 제시된다. (도 18d) 비처리 Hbbth3/CD46 마우스 (좌측 패널) 및 처리 후 제21주의 마우스의 대표적인 크로마토그램. 마우스 α- 및 β-쇄뿐만 아니라 부가된 인간 γ-글로빈이 표시된다. 도 18의 패널의 데이터는 긴-LCR HDAd 벡터에 의하면 100% GRP 마킹이 보다 덜 강렬하고/거나 보다 적은 라운드 및/또는 보다 낮은 용량의 생체내 선택으로 달성될 수 있다는 것을 보여준다. γ-글로빈 발현 수준은 효과적인 요법을 제공할 것으로 예상되는 범위 내 (20% 이상)이다.
도 19. 처리 전 및 긴 LCR 처리 후 제10주에 C57BL6 (정상 마우스) 및 타운즈 SCA 마우스의 정규화된 적혈구 형태를 보여주는 현미경사진.
도 20. 처리 전 타운즈 마우스 및 처리 (긴 LCR) 후 제10주의 타운즈 마우스에 대한 정규화된 적혈구생성 (망상적혈구 계수)을 보여주는 현미경사진.
도 21a-21c. 표현형 교정. (도 21a, 21b) 혈액 세포 형태로, 좌측 패널은 김사 염색으로 염색된 혈액 도말표본을 나타내고, 우측 패널은 메이-그륀발트 염색으로 염색된 혈액 도말표본을 나타낸다. 망상적혈구 내의 핵 및 세포질의 잔류물은 자주색 염색을 발생시킨다. (도 21a) 이전 및 제14주의 비교. (도 21b) CD46tg, 이전의 Hbbth3/CD46 마우스, 제18주의 HDAd-긴-LCR을 갖는 Hbbth3/CD46 마우스, 및 제21주의 HDAd-긴-LCR을 갖는 Hbbth3/CD46 마우스에 대한 김사 염색 및 망상적혈구의 비교. (도 21c) 골수 시토스핀. 처리된 것에서 전적모구 우세를 갖는 적혈구생성의 역-이동이 관찰된다. 축척 막대는 20 μm이다. 도 21의 패널의 데이터는 혈액 세포 형태가 HDAd 긴-LCR 벡터에 의한 생체내 HSC 유전자 요법 후에 정규화된다는 것을 보여준다.
도 22. Hbbth3/CD46+ 마우스의 생체내 HSC 유전자 요법 전 및 후의 혈액 파라미터. Hbbth3/CD46+ 마우스는 중간성 지중해빈혈 표현형을 나타낸다. 마우스를 특히 긴 LCR 또는 짧은 LCR에 작동가능하게 연결된 γ-글로빈 핵산 서열을 포함하는 아데노바이러스 공여자 벡터로 처리하였다. 처리 후 제1주 및 제10주에 마우스를 샘플링하였다. 도 22는 제1주 (상부 패널) 및 제10주 (하부 패널)의, 긴 LCR 벡터로 처리된 마우스, 짧은 LCR 벡터로 처리된 마우스, 및 대조군 CD46tg로부터의 샘플로부터의 WBC, RBC, Hb, HCT, MCV, MCH, MCHC, 및 RDW의 정규화된 적혈구 파라미터의 그래프 도면을 보여준다.
도 23a, 23b. Hbbth3/CD46+ 마우스의 생체내 HSC 유전자 요법 전 및 후의 혈액 파라미터. Hbbth3/CD46+ 마우스는 중간성 지중해빈혈 표현형을 나타낸다. 마우스를 특히 긴 LCR 또는 짧은 LCR에 작동가능하게 연결된 γ-글로빈 핵산 서열을 포함하는 아데노바이러스 공여자 벡터로 처리하였다. 처리 후 제18주에, 마우스를 희생시키고 샘플링하였다. 망상적혈구의 백분율을 혈액 도말표본 상에서 계수하였다 (도 23a; 망상적혈구 계수). 생체내 형질도입 후 제18주의 혈액 파라미터는 그의 대조군 CD46tg 대응물과 구별불가능하였으며, 이는 백혈구 및 적혈구 계수뿐만 아니라 적혈구 특색 (Hb, HCT, MHCH, 및 RDW)에서의 정규화를 포함하여, 완전한 표현형 교정을 시사한다 (도 23b; 혈액 파라미터).
도 24a, 24b. 비장 및 간에서의 골수외 조혈의 표현형 교정. (도 24a) 희생 시 (제21주)의 비장 크기. 상부 2개의 패널은 대표적인 비장 영상을 보여준다. 하부 패널은 이들 결과를 요약한 도트 플롯이다. 각각의 기호는 개별 동물을 나타낸다. 데이터는 평균 ± 평균의 표준 오차 (SEM)로서 제시된다. * p ≤ 0.05. 통계적 분석은 일원 ANOVA를 사용하여 수행하였다. (도 24b) 간 및 비장 절편에서의 헤마톡실린/에오신 염색에 의한 골수외 조혈. Hbbth3/CD46 마우스의 간에서의 적혈모구 및 비장에서의 거핵구 클러스터가 흑색 화살표로 표시된다. 축척 막대는 20 μm이다.
도 25. 비장 및 간에서의 혈철증의 표현형 교정. 철 침착은 펄 염색에 의해 비장 및 간 절편에서 헤모시데린의 세포질 청색 안료로서 제시된다. 축척 막대는 20 μm이다. (Exp: 2.24ms, 획득: 4.1x, 포화도: 1.50, 감마: 0.60).
도 26a-26c. 희생 시 (제21주) 골수의 분석. Hbbth3/CD46tg 마우스의 생체내 HSC 형질도입 후 제21주에 골수를 수거하였다. (도 26a) 골수 MNC에서의 세포당 벡터 카피수. 2개의 군 사이의 차이는 유의하지 않지만, 보다 큰 샘플 크기로 분석할 경우 유의해질 수 있다. (도 26b, 26c) γ-글로빈 발현의 적혈구 특이성. (도 26B) γ-글로빈 발현 적혈구 (Ter119+) 및 비-적혈구 (Ter119-) 세포의 백분율. *p<0.05. 통계적 분석은 이원 ANOVA를 사용하여 수행하였다.
도 27. 아데노바이러스 공여자 벡터의 투여 전 CD46tg 및 CD46+/+/Hbbth-3 마우스로부터의 간 및 비장 절편에서의 헤마톡실린/에오신 염색에 의한 골수외 조혈. 철 침착은 펄 염색에 의해 비장에서 헤모시데린의 세포질 청색 안료로서 제시된다.
도 28. 상이한 역전된 반복부 (IR)를 사용한 통합 SB100x 트랜스포사제 효능의 비교를 위한 실험 설계의 개략도. mgmt./GFP 트랜스포손 페이로드가 (i) pT0 ITR; (ii) pT2 ITR; 또는 (iii) pT4 ITR에 플랭킹된 3개의 플라스미드를 사용하였고, 플라스미드는 그 외에는 동일하였다. 293 세포를 mgmt./GFP 트랜스포손 페이로드를 포함하는 3개의 플라스미드로, pSB100x를 코딩하는 지지 플라스미드의 존재 또는 부재 하에 형질감염시켰다. 세포를 선택의 존재 또는 부재 하에 17일 동안 배양하였다. 선택 하에 있지 않은 세포에 대해서는 제3일, 제12일, 및 제17일에, 및 선택 하에 있는 세포에 대해서는 제3일의 50 μM O6BG/BCNU의 단일 첨가에 의해 제17일에 배양 샘플을 채취하였다.
도 29. 각각의 T0, T2, 및 T4 플라스미드에 대한 SB100x 플라스미드의 존재 또는 부재 하에 배양된 세포에 대한 배양 제12일 및 제17일의 GFP-발현 293 세포의 백분율.
도 30. 각각의 T0, T2, 및 T4 플라스미드에 대한 SB100x 플라스미드의 존재 또는 부재 하에 배양된 세포에 대해 O6BG/BCNU로의 선택 하의 세포에 대한 배양 제17일의 GFP-발현 293 세포의 백분율.
도 31. 31.776 kb 트랜스포손 페이로드 (통합 카세트)를 포함하는 핵산 (pWEAd5-PT4-LCR-글로빈-mgmt)의 개략도. 개략도는 제시의 용이성을 위해 2개의 중첩 부분으로 나뉘며, 이들 부분의 관계는 관련 기술분야의 통상의 기술자에게 명백할 것이다. 개략도는 원형화된 플라스미드 콘텍스트에서 트랜스포손 페이로드를 제공한다. 관련 기술분야의 통상의 기술자는 트랜스포손 페이로드가 분자 생물학의 기술을 사용하여, 다른 콘텍스트에서, 예를 들어 바이러스 벡터 게놈에서 용이하게 이용될 수 있다는 것을 인지할 것이다. 트랜스포손 페이로드는 트랜스포손 IR (특히 슬리핑 뷰티 IR)에 플랭킹되고, 이는 다시 레콤비나제 직접 반복부 (DR, 특히 FRT DR)에 플랭킹된다. 트랜스포손은 (i) 베타 프로모터, HS1-HS5를 포함하는 긴 LCR, 및 3'HS1과 작동가능하게 연결된 감마-글로빈 코딩 서열 및 (ii) MGMTP140K 코딩 서열이 Ef1a 프로모터와 작동가능하게 연결된 MGMTP140K 선택 카세트를 포함한다.
도 32. 31.772 kb 트랜스포손 페이로드 (통합 카세트)를 포함하는 핵산 (HDAd5-PT4-긴 LCR 글로빈-rhMGMT)의 개략도. 개략도는 제시의 용이성을 위해 2개의 중첩 부분으로 나뉘며, 이들 부분의 관계는 관련 기술분야의 통상의 기술자에게 명백할 것이다. 개략도는 원형화된 플라스미드 콘텍스트에서 트랜스포손 페이로드를 제공한다. 관련 기술분야의 통상의 기술자는 트랜스포손 페이로드가 분자 생물학의 기술을 사용하여, 다른 콘텍스트에서, 예를 들어 바이러스 벡터 게놈에서 용이하게 이용될 수 있다는 것을 인지할 것이다. 트랜스포손 페이로드는 트랜스포손 IR (특히 슬리핑 뷰티 IR)에 플랭킹되고, 이는 다시 레콤비나제 DR (특히 FRT DR)에 플랭킹된다. 트랜스포손은 (i) 베타 프로모터, HS1-HS5를 포함하는 긴 LCR, 및 3'HS1과 작동가능하게 연결된 감마-글로빈 코딩 서열 및 (ii) MGMTP140K 코딩 서열이 Ef1a 프로모터와 작동가능하게 연결된 MGMTP140K 선택 카세트를 포함한다.
도 33. 13.173 kb 트랜스포손 페이로드 (통합 카세트)를 포함하는 핵산 (HDAd-Ad5-PT4-LCR-hACE2/mgmt)의 개략도. 개략도는 제시의 용이성을 위해 2개의 중첩 부분으로 나뉘며, 이들 부분의 관계는 관련 기술분야의 통상의 기술자에게 명백할 것이다. 개략도는 원형화된 플라스미드 콘텍스트에서 트랜스포손 페이로드를 제공한다. 관련 기술분야의 통상의 기술자는 트랜스포손 페이로드가 분자 생물학의 기술을 사용하여, 다른 콘텍스트에서, 예를 들어 바이러스 벡터 게놈에서 용이하게 이용될 수 있다는 것을 인지할 것이다. 트랜스포손 페이로드는 트랜스포손 IR (특히 슬리핑 뷰티 IR)에 플랭킹되고, 이는 다시 레콤비나제 DR (특히 FRT DR)에 플랭킹된다. 트랜스포손은 (i) 베타 프로모터 및 HS1-HS4를 포함하는 긴 LCR과 작동가능하게 연결된 재조합 인간 ACE2 코딩 서열 및 (ii) MGMTP140K 코딩 서열이 Ef1a 프로모터와 작동가능하게 연결된 MGMTP140K 선택 카세트를 포함한다.
도 34. 12.169 kb 트랜스포손 페이로드 (통합 카세트)를 포함하는 핵산 (pWEHCB-마이크로LCR-글로빈/mgmt)의 개략도. 개략도는 원형화된 플라스미드 콘텍스트에서 트랜스포손 페이로드를 제공한다. 관련 기술분야의 통상의 기술자는 트랜스포손 페이로드가 분자 생물학의 기술을 사용하여, 다른 콘텍스트에서, 예를 들어 바이러스 벡터 게놈에서 용이하게 이용될 수 있다는 것을 인지할 것이다. 트랜스포손 페이로드는 트랜스포손 IR (특히 슬리핑 뷰티 IR)에 플랭킹되고, 이는 다시 레콤비나제 DR (특히 FRT DR)에 플랭킹된다. 트랜스포손은 (i) 베타 프로모터 및 HS1-HS4를 포함하는 긴 LCR과 작동가능하게 연결된 감마 글로빈 코딩 서열 및 (ii) MGMTP140K 코딩 서열이 Ef1a 프로모터와 작동가능하게 연결된 MGMTP140K 선택 카세트를 포함한다.
도 35. 9.382 kb 트랜스포손 페이로드 (통합 카세트)를 포함하는 핵산 (pWEHCA-파코니-GFP)의 개략도. 개략도는 원형화된 플라스미드 콘텍스트에서 트랜스포손 페이로드를 제공한다. 관련 기술분야의 통상의 기술자는 트랜스포손 페이로드가 분자 생물학의 기술을 사용하여, 다른 콘텍스트에서, 예를 들어 바이러스 벡터 게놈에서 용이하게 이용될 수 있다는 것을 인지할 것이다. 트랜스포손 페이로드는 트랜스포손 IR (특히 슬리핑 뷰티 IR)에 플랭킹되고, 이는 다시 레콤비나제 DR (특히 FRT DR)에 플랭킹된다. 트랜스포손은 (i) pgk 프로모터와 작동가능하게 연결된 FancA 코딩 서열 및 (ii) Ef1a 프로모터와 작동가능하게 연결된 GFP 코딩 서열을 포함한다.
도 36. 5.490 kb 트랜스포손 페이로드 (통합 카세트)를 포함하는 핵산 (pHCA-T4-rhMGMT-GFP)의 개략도. 개략도는 원형화된 플라스미드 콘텍스트에서 트랜스포손 페이로드를 제공한다. 관련 기술분야의 통상의 기술자는 트랜스포손 페이로드가 분자 생물학의 기술을 사용하여, 다른 콘텍스트에서, 예를 들어 바이러스 벡터 게놈에서 용이하게 이용될 수 있다는 것을 인지할 것이다. 트랜스포손 페이로드는 트랜스포손 역전된 반복부 (IR, 특히 슬리핑 뷰티 IR)에 플랭킹되고, 이는 다시 레콤비나제 직접 반복부 (DR, 특히 FRT DR)에 플랭킹된다. 트랜스포손은 (i) PGK 프로모터와 작동가능하게 연결된 GFP 코딩 서열 및 (ii) MGMTP140K 코딩 서열이 EF1a 프로모터와 작동가능하게 연결된 MGMTP140K 선택 카세트를 포함한다.
도 37. 3.797 kb 트랜스포손 페이로드 (통합 카세트)를 포함하는 핵산의 개략도. 개략도는 원형화된 플라스미드 콘텍스트에서 트랜스포손 페이로드를 제공한다. 관련 기술분야의 통상의 기술자는 트랜스포손 페이로드가 분자 생물학의 기술을 사용하여, 다른 콘텍스트에서, 예를 들어 바이러스 벡터 게놈에서 용이하게 이용될 수 있다는 것을 인지할 것이다. 트랜스포손 페이로드는 트랜스포손 역전된 반복부 (IR, 특히 슬리핑 뷰티 IR)에 플랭킹되고, 이는 다시 레콤비나제 직접 반복부 (DR, 특히 FRT DR)에 플랭킹된다. 트랜스포손은 EF1a 프로모터와 작동가능하게 연결된 (i) GFP 코딩 서열 및 (ii) MGMTP140K 코딩 서열을 포함한다.
도 38. 3.709 kb 트랜스포손 페이로드 (통합 카세트)를 포함하는 핵산 (pBHCA-PT0-EF1a-mgmt/GFP)의 개략도. 개략도는 제시의 용이성을 위해 2개의 중첩 부분으로 나뉘며, 이들 부분의 관계는 관련 기술분야의 통상의 기술자에게 명백할 것이다. 개략도는 원형화된 플라스미드 콘텍스트에서 트랜스포손 페이로드를 제공한다. 관련 기술분야의 통상의 기술자는 트랜스포손 페이로드가 분자 생물학의 기술을 사용하여, 다른 콘텍스트에서, 예를 들어 바이러스 벡터 게놈에서 용이하게 이용될 수 있다는 것을 인지할 것이다. 트랜스포손 페이로드는 트랜스포손 역전된 반복부 (IR, 특히 슬리핑 뷰티 IR)에 플랭킹되고, 이는 다시 레콤비나제 직접 반복부 (DR, 특히 FRT DR)에 플랭킹된다. 트랜스포손은 EF1a 프로모터와 작동가능하게 연결된 (i) eGFP 코딩 서열 및 (ii) MGMTP140K 코딩 서열을 포함한다.
도 39. 3.547 kb 트랜스포손 페이로드 (통합 카세트)를 포함하는 핵산 (pHCA(Ad35)-PT4-EF1a-mgmt/GFP)의 개략도. 개략도는 제시의 용이성을 위해 2개의 중첩 부분으로 나뉘며, 이들 부분의 관계는 관련 기술분야의 통상의 기술자에게 명백할 것이다. 개략도는 원형화된 플라스미드 콘텍스트에서 트랜스포손 페이로드를 제공한다. 관련 기술분야의 통상의 기술자는 트랜스포손 페이로드가 분자 생물학의 기술을 사용하여, 다른 콘텍스트에서, 예를 들어 바이러스 벡터 게놈에서 용이하게 이용될 수 있다는 것을 인지할 것이다. 트랜스포손 페이로드는 트랜스포손 역전된 반복부 (IR, 특히 슬리핑 뷰티 IR)에 플랭킹되고, 이는 다시 레콤비나제 직접 반복부 (DR, 특히 FRT DR)에 플랭킹된다. 트랜스포손은 EF1a 프로모터와 작동가능하게 연결된 (i) GFP 코딩 서열 및 (ii) MGMTP140K 코딩 서열을 포함한다.
도 40. 3.543 kb 트랜스포손 페이로드 (통합 카세트)를 포함하는 핵산 (pHCA-Ad5-PT4-Ef1a-mgmt/GFP)의 개략도. 개략도는 제시의 용이성을 위해 2개의 중첩 부분으로 나뉘며, 이들 부분의 관계는 관련 기술분야의 통상의 기술자에게 명백할 것이다. 개략도는 원형화된 플라스미드 콘텍스트에서 트랜스포손 페이로드를 제공한다. 관련 기술분야의 통상의 기술자는 트랜스포손 페이로드가 분자 생물학의 기술을 사용하여, 다른 콘텍스트에서, 예를 들어 바이러스 벡터 게놈에서 용이하게 이용될 수 있다는 것을 인지할 것이다. 트랜스포손 페이로드는 트랜스포손 역전된 반복부 (IR, 특히 슬리핑 뷰티 IR)에 플랭킹되고, 이는 다시 레콤비나제 직접 반복부 (DR, 특히 FRT DR)에 플랭킹된다. 트랜스포손은 EF1a 프로모터와 작동가능하게 연결된 (i) GFP 코딩 서열 및 (ii) MGMTP140K 코딩 서열을 포함한다.
도 41. 2.781 kb 트랜스포손 페이로드 (통합 카세트)를 포함하는 핵산 (pHCA(Ad35)-PT4-EF1a-mgmt)의 개략도. 개략도는 제시의 용이성을 위해 2개의 중첩 부분으로 나뉘며, 이들 부분의 관계는 관련 기술분야의 통상의 기술자에게 명백할 것이다. 개략도는 원형화된 플라스미드 콘텍스트에서 트랜스포손 페이로드를 제공한다. 관련 기술분야의 통상의 기술자는 트랜스포손 페이로드가 분자 생물학의 기술을 사용하여, 다른 콘텍스트에서, 예를 들어 바이러스 벡터 게놈에서 용이하게 이용될 수 있다는 것을 인지할 것이다. 트랜스포손 페이로드는 트랜스포손 역전된 반복부 (IR, 특히 슬리핑 뷰티 IR)에 플랭킹되고, 이는 다시 레콤비나제 직접 반복부 (DR, 특히 FRT DR)에 플랭킹된다. 트랜스포손은 MGMTP140K 코딩 서열이 EF1a 프로모터와 작동가능하게 연결된 MGMTP140K 선택 카세트를 포함한다.
도 42. 2.777 kb 트랜스포손 페이로드 (통합 카세트)를 포함하는 핵산 (pHCA-T4-Ef1a-rhMGMT)의 개략도. 개략도는 원형화된 플라스미드 콘텍스트에서 트랜스포손 페이로드를 제공한다. 관련 기술분야의 통상의 기술자는 트랜스포손 페이로드가 분자 생물학의 기술을 사용하여, 다른 콘텍스트에서, 예를 들어 바이러스 벡터 게놈에서 용이하게 이용될 수 있다는 것을 인지할 것이다. 트랜스포손 페이로드는 트랜스포손 역전된 반복부 (IR, 특히 슬리핑 뷰티 IR)에 플랭킹되고, 이는 다시 레콤비나제 직접 반복부 (DR, 특히 FRT DR)에 플랭킹된다. 트랜스포손은 MGMTP140K 코딩 서열이 EF1a 프로모터와 작동가능하게 연결된 MGMTP140K 선택 카세트를 포함한다.
도 43. 2.751 kb 트랜스포손 페이로드 (통합 카세트)를 포함하는 핵산 (pHCA-Ad5-PT4-Ef1a-mgmt)의 개략도. 개략도는 제시의 용이성을 위해 2개의 중첩 부분으로 나뉘며, 이들 부분의 관계는 관련 기술분야의 통상의 기술자에게 명백할 것이다. 개략도는 원형화된 플라스미드 콘텍스트에서 트랜스포손 페이로드를 제공한다. 관련 기술분야의 통상의 기술자는 트랜스포손 페이로드가 분자 생물학의 기술을 사용하여, 다른 콘텍스트에서, 예를 들어 바이러스 벡터 게놈에서 용이하게 이용될 수 있다는 것을 인지할 것이다. 트랜스포손 페이로드는 트랜스포손 역전된 반복부 (IR, 특히 슬리핑 뷰티 IR)에 플랭킹되고, 이는 다시 레콤비나제 직접 반복부 (DR, 특히 FRT DR)에 플랭킹된다. 트랜스포손은 MGMTP140K 코딩 서열이 EF1a 프로모터와 작동가능하게 연결된 MGMTP140K 선택 카세트를 포함한다.
도 1a-1d. HDAd-긴-LCR을 사용한 생체외 HSPC 형질도입 연구. (도 1a) 벡터 구조. 21.5 kb β-글로빈 LCR의 제어 하의 γ-글로빈 유전자, 1.6 kb β-글로빈 프로모터 및 또한 β-글로빈 유전자좌로부터 유래된 3'HS1 영역. 적혈구 세포에서의 RNA 안정화를 위해, β-글로빈 유전자 UTR을 γ-글로빈 유전자의 3' 단부에 연결시켰다. 벡터는 또한 형질도입된 HSPC 및 HSPC 자손의 생체내 선택을 가능하게 하는 mgmtP140K에 대한 발현 카세트를 함유한다. γ-글로빈 및 mgmt 발현 카세트는 닭 글로빈 HS4 인슐레이터에 의해 분리된다. 32.4 kb LCR-γ-글로빈/mgtm 트랜스포손은 SB100x에 의해 인식되는 역전된 반복부 (IR) 및 Flpe 레콤비나제에 의한 트랜스포손의 원형화를 가능하게 하는 ftr 부위에 플랭킹된다. (도 1b) 실험 요법. CD46-트랜스제닉 마우스로부터의 골수 Lin- 세포를 HDAd-긴-LCR 및 HDAd-SB로 500 vp/세포의 총 MOI로 형질도입하였다. 배양 1일 후, 1x106개의 형질도입된 세포/마우스를 치사 방사선조사된 C57Bl/6 마우스에 이식하였다. 제4주에, O6BG/BCNU 처리를 시작하고, 2주마다 4회 반복하였다. 각각의 사이클에서, BCNU 농도를 5 mg/kg에서 7.5 mg/kg으로, 10 mg/kg (2회)으로 증가시켰다. 제20주에, 마우스를 희생시켰다. (도 1c) 유동 세포측정법에 의해 측정된 인간 γ-글로빈-양성 말초 적혈구 (RBC)의 백분율. 각각의 기호는 개별 동물이다. (도 1d) 이식 후 제20주에 적혈구 (Ter119+) 골수 세포 (하부 패널)에서의 인간 γ-글로빈-발현을 보여주는 대표적인 유동 세포측정 데이터. 상부 패널은 모의-형질도입된 세포가 이식된 마우스를 보여준다.
도 2a-2c. 이식 후 제20주에 동물로부터의 골수 세포에서의 벡터/염색체 접합부의 iPCR 분석. (도 2a) iPCR 분석의 개략도. 5 마이크로그램의 게놈 DNA를 SacI로 소화시키고, 재-라이게이션하고, 표시된 프라이머를 사용한 네스티드, 역 PCR에 적용하였다 (물질 및 방법 참조). (도 2b) 통합 접합부를 함유하는 클로닝된 플라스미드의 아가로스 겔 전기영동. 표시된 밴드를 절제하고 서열분석하였다. 염색체 통합 부위가 겔 아래에 제시된다. (도 2c) 접합부 서열의 예: 5' 단부 벡터 서열, 슬리핑 뷰티 IR/DR 서열, 통합 접합부 (chr15, 6805206) 서열식별번호(SEQ ID NO): 1; 5' 단부 벡터 서열, 슬리핑 뷰티 IR/DR 서열, 통합 접합부 (chrX, 16897322) 서열식별번호: 2; 3' 단부 벡터 서열, 슬리핑 뷰티 IR/DR 서열, 통합 접합부 (chr4, 10207667) 서열식별번호: 3. 벡터 바디 및 IR/DR 서열은 각각 기본 문자 및 밑줄로 지정된다. 염색체 서열은 볼드체 문자로 지정된다. IR 및 염색체 DNA의 접합부에서 SB100x에 의해 사용되는 TA 디뉴클레오티드는 괄호표시된다.
도 3a-3e. 32.4 kb 트랜스포손을 함유하는 HDAd-긴-LCR 및 11.8 kb 트랜스포손을 함유하는 HDAd-짧은-LCR로의 생체내 HSPC 형질도입. (도 3a) 21.5 kb HS1-HS5 LCR 및 3'HS1 (도 1a HDAd-짧은-LCR) 대신에, 이 벡터는 DNase 과민성 부위 (HS) 1 내지 4의 코어 영역을 포함하는 4.3 kb 미니-LCR을 함유한다. (도 3b) 처리 요법. hCD46tg 마우스를 가동화하고, HDAd-짧은-LCR + HDAd-SB 또는 HDAd-긴-LCR +HDAd-SB를 IV 주사하였다 (2회, 각각 둘 다의 바이러스의 1:1 혼합물의 4x1010 vp). 5주 후, O6BG/BCNU 처리를 시작하였다. 각각의 사이클에서, BCNU 농도를 2.5 mg/kg에서 7.5 mg/kg, 및 10 mg/kg으로 증가시켰다. O6BG 농도는 모든 3가지 처리에서 30 mg/kg이었다. 분석 및 2차 수용자 내로의 Lin- 세포 이식을 위해 동물을 희생시킨 경우에 제20주까지 마우스를 추적하였다. 이어서, 2차 수용자를 16주 동안 추적하였다. 생체내 HSPC 형질도입된 동물은 인간 γ-글로빈 및 mgtm 단백질에 대한 면역 반응을 방지하기 위해 면역억제 (IS) 약물을 제공받았다. (도 3c) 유동 세포측정법에 의해 측정된 말초 적혈구 (RBC)에서의 인간 γ-글로빈-양성 세포의 백분율. 각각의 기호는 개별 동물이다. 모의-형질도입된 마우스에서, 0.1% 미만의 세포가 γ-글로빈-양성이었다. (도 3d) 생체내 HSPC 형질도입 후 제20주에 RBC에서 HPLC에 의해 측정된 γ-글로빈 단백질 쇄 수준. 인간 γ-글로빈 대 마우스 α-글로빈 단백질 쇄의 백분율이 제시된다. (도 3e) 생체내 HSPC 형질도입 후 제20주에 총 혈액에서 qRT-PCR에 의해 측정된 γ-글로빈 mRNA 수준. 인간 γ-글로빈 mRNA 대 마우스 α-글로빈 mRNA의 백분율이 제시된다.
도 4. 생체내 HSPC 형질도입 후 제20주에 수거된 골수 MNC에서의 세포당 벡터 카피수. 2개의 군 사이의 차이는 유의하지 않다.
도 5a-5d. 생체내 HSPC 형질도입 후 제20주에서의 혈액 파라미터. (도 5a) 백혈구 (WBC), 호중구 (NE), 백혈구 (LY), 단핵구 (MO), 호산구 (EO), 및 호염기구 (BA). (도 5b) 적혈구생성 파라미터. RBC: 적혈구, Hb: 헤모글로빈, MCV: 평균 적혈구 부피, MCH: 평균 적혈구 헤모글로빈, MCHC: 평균 적혈구 헤모글로빈 농도, RDW: 적혈구 분포 폭. 3개의 군 사이의 차이는 유의하지 않았다. (도 5c) 세포 골수 조성. (도 5d) 골수 Lin- 세포의 콜로니-형성 잠재력. 군 사이의 차이는 도 5a-5d에서 유의하지 않았다. 도 5의 패널에서의 데이터는 HDAd 짧은-LCR 및/또는 긴-LCR 벡터에 의한 생체내 HSPC 형질도입이 골수에서 조혈 및 세포 분포에 영향을 미치지 않는다는 것을 보여준다.
도 6. 슬리핑 뷰티 역전된 반복부 (IR)와 관련하여 HDAd-글로빈 벡터에서의 NheI 및 KpnI 부위의 국재화가 표시된다. 이들 효소는 SB IR/DR과 근접하지만 그의 외부를 절단하며, 비통합된 벡터의 배경을 감소시키는데 사용된다. 골수 Lin- 세포로부터의 나머지 게놈 DNA를 NheI 및 KpnI로 소화시키고, 열 불활성화 후에 추가로 NlaIII으로 소화시켰다. NlaIII는 4-커터이고, 작은 DNA 단편을 생성할 것이다. 이어서, 소화된 DNA를 공지된 서열 및 소화된 NlaIII 단편에 대한 상용성 단부를 갖는 이중 가닥 올리고와 라이게이션하였다. 열-불활성화 및 세정 후, 링커-라이게이션된 생성물을 선형 증폭에 사용하였고, 이는 SB 좌측 아암으로부터 프라이밍된 단일 가닥 (ss) DNA 집단을 생성한다. 프라이머는 비오티닐화되어, ssDNA는 스트렙타비딘 비드로 수집될 수 있다. 광범위한 세척 후에, ssDNA를 비드로부터 용리시키고, 2 라운드의 네스티드 PCR에 의한 추가의 증폭에 적용하였다. PCR 앰플리콘을 겔 정제하고, 클로닝하고, 서열분석하고, 마우스 게놈 서열에 맵핑하여 통합 부위를 마킹하였다.
도 7a-7d. HSPC에서의 벡터 통합 부위의 분석. HDAd-긴-LCR +HDAd-SB로의 생체내 형질도입 후 제20주에 수거된 골수 Lin- 세포로부터 단리된 게놈 DNA. (도 7aa, 도 7ab) 통합 부위의 염색체 분포. 게놈-전반 슬리핑 뷰티 통합. 통합 부위는 수직선에 의해 마킹된다. (도 7b) 접합부 서열의 예: 슬리핑 뷰티 IR/DR 서열, 통합 접합부 (chr7, 79796094) 서열식별번호: 4; 슬리핑 뷰티 IR/DR 서열, 통합 접합부 (반복부 영역) 서열식별번호: 5. IR/DR 서열은 밑줄 및 볼드체 문자로 지정된다. 염색체 서열은 기본 문자로 지정된다. IR 및 염색체 DNA의 접합부에서 SB100x에 의해 사용되는 TA 디뉴클레오티드는 볼드체표시된다. (도 7c) RefSeq 주석과 관련된 게놈-전반 슬리핑 뷰티 통합. 통합 부위를 마우스 게놈에 맵핑하고, 유전자에 대한 그의 위치를 분석하였다. 1 kb 상류 전사 개시 부위, 엑손의 3'UTR, 단백질 코딩 서열, 인트론, 3'UTR, 3'UTR로부터 1 kb 하류, 및 유전자간에 발생한 통합 사건의 백분율이 제시된다. (도 7d) 무작위화된 대조군과 비교한 슬리핑 뷰티 통합 패턴. 마우스 게놈 윈도우에서의 통합 패턴. 연속 게놈 윈도우 및 무작위화된 마우스 게놈 윈도우와 중첩되는 통합의 수 및 크기를 비교하였다. 이는 통합 패턴이 연속 및 무작위 윈도우에서 유사하다는 것을 보여준다. 임의의 주어진 윈도우에서 최대 통합의 수는 3 이하이고; 윈도우당 1 통합이 보다 높은 발생률을 갖는다. 값은 평균 ± s.d.를 나타낸다. 도 7의 패널의 데이터는 유전자에 대한 선호도 없이 근-무작위 통합 패턴을 보여준다.
도 8a-8e. 2차 수용자의 분석. 생체내 형질도입된 CD46tg 마우스로부터 제20주에 수거한 골수 Lin- 세포를 치사 방사선조사된 C57Bl/6 마우스에 이식하였다. 2차 수용자를 16주 동안 추적하였다. (도 8a) CD46-양성 PBMC의 백분율에 기초한 생착률. 2개의 군 사이의 차이는 유의하지 않았다. (도 8b) 유동 세포측정법에 의해 측정된 γ-글로빈-발현 말초 혈액 RBC의 백분율. 2개의 군 사이의 차이는 유의하지 않다. (도 8c) 2차 수용자의 RBC에서 HPLC에 의한 인간 γ-글로빈 쇄의 분석. 이식 후 제4주, 제8주, 제12주, 및 제16주의 인간 γ-글로빈 대 성체 마우스 α 글로빈의 백분율이 제시된다. * p<0.0001. 통계적 분석을 이원 ANOVA를 사용하여 수행하였다. (도 8d) 총 혈액 세포에서의 γ-글로빈 mRNA 수준. 인간 γ-글로빈 mRNA 대 마우스 α 및 β-주요 글로빈 mRNA의 백분율이 제시된다. (도 8e) p.t. 제16주의 γ-글로빈 mRNA 수준 골수 MNC. 인간 γ-글로빈 m-RNA 대 마우스 α 및 β-주요 글로빈 mRNA의 백분율이 제시된다. 도 8 및 9의 패널은, 개별적으로 또는 함께, "32.4" kb 트랜스포손의 통합이 장기 재증식 세포에서 일어났고; 긴 LCR을 갖는 벡터로부터의 γ-글로빈 발현 수준이 짧은 LCR을 갖는 벡터와 비교하여 시간 경과에 따라 증가하였고, 긴 LCR을 갖는 벡터가 γ-글로빈 발현의 보다 엄격한 적혈구 특이성을 제공하였음을 보여준다.
도 9a-9c. 2차 수용자의 골수에서의 γ-글로빈 발현의 적혈구 특이성 (이식 후 제16주). (도 9a) 모든 골수 MNC에서의 γ-글로빈 발현 적혈구 (Ter119+ 세포)의 백분율. (도 9b) 적혈구 특이성. 적혈구 (Ter119+) 및 비-적혈구 (Ter119-) 세포에서의 γ-글로빈+ 세포의 백분율. (도 9c) 생체내 HSPC 형질도입 후 제20주에 수거한 골수 MNC에서의 세포당 벡터 카피수 (VCN). 2개의 군 사이의 차이는 유의하지 않다.
도 10a-10d. 이식 후 제16주에 2차 수용자에서의 혈액 파라미터. (도 10a) 백혈구. (도 10b) 적혈구생성 파라미터. RBC: 적혈구, Hb: 헤모글로빈, MCV: 평균 적혈구 부피, MCH: 평균 적혈구 헤모글로빈, MCHC: 평균 적혈구 헤모글로빈 농도, RDW: 적혈구 분포 폭. 3개의 군 사이의 차이는 유의하지 않았다. (도 10c) 세포 골수 조성. (도 10d) 골수 Lin- 세포의 콜로니-형성 잠재력.
도 11a-11c. 인간 CD34+ 세포를 사용한 시험관내 연구. (도 11a) 실험의 개략도. CD34+ 세포를 HDAd-긴-LCR + HD-SB 또는 HDAd-짧은-LCR + HDAd-SB로 형질도입하고, 적혈구 분화 (ED)에 적용하였다. O6BG-BCNU로의 시험관내 선택을 ED의 제5일에 시작하였다. 제18일에 세포를 유동 세포측정법 (도 11b) 및 HPLC (도 11c)에 의해 분석하였다. 도 11의 패널은 인간 세포 시스템에서 HDAd 긴-LCR 벡터가 형질도입된 인간 HSC/CD34+ 세포의 적혈구 분화 후에 보다 높은 γ-글로빈 발현을 제공한다는 것을 보여준다.
도 12a-12b. 마우스에서의 벡터 hCD46tg로의 생체내 HSC 형질도입: "긴" vs "짧은" 벡터 LCR. (도 12a) HDAd-긴-LCR-γ-글로빈/mgmt. 벡터 및 HDAd-짧은-LCR-γ-글로빈/mgmt. 벡터. (도 12b) 마우스에서 벡터 Hbbth3/CD46의 생체내 형질도입. 군 1은 7마리의 마우스에서의 HDAd-긴-LCR-γ-글로빈/mgmt 플러스 HDAd-SB/Flpe의 생체내 형질도입을 보여준다. 군 2는 3마리의 마우스에서의 HDAd-짧은-LCRγ-글로빈/mgmt 플러스 HDAd-SB/Flpe의 생체내 형질도입을 보여준다. O6BG, BCNU를 위해 단지 3회의 선택 사이클이 필요하였다.
도 13. Thbb 마우스 시험 (W6). 그래프 결과는 긴 LCR 벡터 대 짧은 LCR 벡터로 형질도입되었을 때 마우스 사이에서 차이가 없고 인간 γ-글로빈 발현이 거의 없음을 보여준다. 2개의 페이지.
도 14. Thbb 마우스 시험 (W8). 그래프 결과는 긴 LCR 벡터 대 짧은 LCR 벡터로 형질도입되었을 때 마우스 사이의 차이를 보여주지만, 짧은 LCR 바이러스가 마우스에서 사멸되었는지는 불명확하다. 2개의 페이지.
도 15. 마우스에서 인간 γ-글로빈 발현 RBC의 백분율을 보여주는 그래프 도면. 그래프는 단지 3회 사이클의 생체내 선택 후의 100% 마킹을 예시한다.
도 16. 마우스 HBA에 대한 상대적인 인간 γ-글로빈을 보여주는 HPLC의 그래프 도면 (제10주). 그래프는 짧은 LCR과 비교하여 긴 LCR에 대해 유의하게 더 높은 γ-글로빈 수준을 보여준다.
도 17. 긴 LCR 벡터를 함유하는 마우스 #57의 예시적인 제10주 혈액 HPLC의 그래프 도면.
도 18a-18d. HDAd-짧은-LCR 및 HDAd-긴-LCR을 사용한 Hbbth3/CD46 마우스의 생체내 HSC 유전자 요법 후의 인간 γ-글로빈 발현. (도 18a) 치료 요법. 도 3a-3e와 대조적으로, 도 18a-18d는 지중해빈혈 Hbbth3/CD46 마우스에서의 결과를 보여준다. (도 18b) 유동 세포측정법에 의해 측정된 말초 적혈구 (RBC)에서의 인간 γ-글로빈-양성 세포의 백분율. 각각의 기호는 개별 동물이다. (도 18c) 생체내 HSPC 형질도입 후 제18주에 RBC에서 HPLC에 의해 측정된 γ-글로빈 단백질 쇄 수준. 인간 γ-글로빈 대 마우스 α-글로빈 단백질 쇄의 백분율이 제시된다. (도 18d) 비처리 Hbbth3/CD46 마우스 (좌측 패널) 및 처리 후 제21주의 마우스의 대표적인 크로마토그램. 마우스 α- 및 β-쇄뿐만 아니라 부가된 인간 γ-글로빈이 표시된다. 도 18의 패널의 데이터는 긴-LCR HDAd 벡터에 의하면 100% GRP 마킹이 보다 덜 강렬하고/거나 보다 적은 라운드 및/또는 보다 낮은 용량의 생체내 선택으로 달성될 수 있다는 것을 보여준다. γ-글로빈 발현 수준은 효과적인 요법을 제공할 것으로 예상되는 범위 내 (20% 이상)이다.
도 19. 처리 전 및 긴 LCR 처리 후 제10주에 C57BL6 (정상 마우스) 및 타운즈 SCA 마우스의 정규화된 적혈구 형태를 보여주는 현미경사진.
도 20. 처리 전 타운즈 마우스 및 처리 (긴 LCR) 후 제10주의 타운즈 마우스에 대한 정규화된 적혈구생성 (망상적혈구 계수)을 보여주는 현미경사진.
도 21a-21c. 표현형 교정. (도 21a, 21b) 혈액 세포 형태로, 좌측 패널은 김사 염색으로 염색된 혈액 도말표본을 나타내고, 우측 패널은 메이-그륀발트 염색으로 염색된 혈액 도말표본을 나타낸다. 망상적혈구 내의 핵 및 세포질의 잔류물은 자주색 염색을 발생시킨다. (도 21a) 이전 및 제14주의 비교. (도 21b) CD46tg, 이전의 Hbbth3/CD46 마우스, 제18주의 HDAd-긴-LCR을 갖는 Hbbth3/CD46 마우스, 및 제21주의 HDAd-긴-LCR을 갖는 Hbbth3/CD46 마우스에 대한 김사 염색 및 망상적혈구의 비교. (도 21c) 골수 시토스핀. 처리된 것에서 전적모구 우세를 갖는 적혈구생성의 역-이동이 관찰된다. 축척 막대는 20 μm이다. 도 21의 패널의 데이터는 혈액 세포 형태가 HDAd 긴-LCR 벡터에 의한 생체내 HSC 유전자 요법 후에 정규화된다는 것을 보여준다.
도 22. Hbbth3/CD46+ 마우스의 생체내 HSC 유전자 요법 전 및 후의 혈액 파라미터. Hbbth3/CD46+ 마우스는 중간성 지중해빈혈 표현형을 나타낸다. 마우스를 특히 긴 LCR 또는 짧은 LCR에 작동가능하게 연결된 γ-글로빈 핵산 서열을 포함하는 아데노바이러스 공여자 벡터로 처리하였다. 처리 후 제1주 및 제10주에 마우스를 샘플링하였다. 도 22는 제1주 (상부 패널) 및 제10주 (하부 패널)의, 긴 LCR 벡터로 처리된 마우스, 짧은 LCR 벡터로 처리된 마우스, 및 대조군 CD46tg로부터의 샘플로부터의 WBC, RBC, Hb, HCT, MCV, MCH, MCHC, 및 RDW의 정규화된 적혈구 파라미터의 그래프 도면을 보여준다.
도 23a, 23b. Hbbth3/CD46+ 마우스의 생체내 HSC 유전자 요법 전 및 후의 혈액 파라미터. Hbbth3/CD46+ 마우스는 중간성 지중해빈혈 표현형을 나타낸다. 마우스를 특히 긴 LCR 또는 짧은 LCR에 작동가능하게 연결된 γ-글로빈 핵산 서열을 포함하는 아데노바이러스 공여자 벡터로 처리하였다. 처리 후 제18주에, 마우스를 희생시키고 샘플링하였다. 망상적혈구의 백분율을 혈액 도말표본 상에서 계수하였다 (도 23a; 망상적혈구 계수). 생체내 형질도입 후 제18주의 혈액 파라미터는 그의 대조군 CD46tg 대응물과 구별불가능하였으며, 이는 백혈구 및 적혈구 계수뿐만 아니라 적혈구 특색 (Hb, HCT, MHCH, 및 RDW)에서의 정규화를 포함하여, 완전한 표현형 교정을 시사한다 (도 23b; 혈액 파라미터).
도 24a, 24b. 비장 및 간에서의 골수외 조혈의 표현형 교정. (도 24a) 희생 시 (제21주)의 비장 크기. 상부 2개의 패널은 대표적인 비장 영상을 보여준다. 하부 패널은 이들 결과를 요약한 도트 플롯이다. 각각의 기호는 개별 동물을 나타낸다. 데이터는 평균 ± 평균의 표준 오차 (SEM)로서 제시된다. * p ≤ 0.05. 통계적 분석은 일원 ANOVA를 사용하여 수행하였다. (도 24b) 간 및 비장 절편에서의 헤마톡실린/에오신 염색에 의한 골수외 조혈. Hbbth3/CD46 마우스의 간에서의 적혈모구 및 비장에서의 거핵구 클러스터가 흑색 화살표로 표시된다. 축척 막대는 20 μm이다.
도 25. 비장 및 간에서의 혈철증의 표현형 교정. 철 침착은 펄 염색에 의해 비장 및 간 절편에서 헤모시데린의 세포질 청색 안료로서 제시된다. 축척 막대는 20 μm이다. (Exp: 2.24ms, 획득: 4.1x, 포화도: 1.50, 감마: 0.60).
도 26a-26c. 희생 시 (제21주) 골수의 분석. Hbbth3/CD46tg 마우스의 생체내 HSC 형질도입 후 제21주에 골수를 수거하였다. (도 26a) 골수 MNC에서의 세포당 벡터 카피수. 2개의 군 사이의 차이는 유의하지 않지만, 보다 큰 샘플 크기로 분석할 경우 유의해질 수 있다. (도 26b, 26c) γ-글로빈 발현의 적혈구 특이성. (도 26B) γ-글로빈 발현 적혈구 (Ter119+) 및 비-적혈구 (Ter119-) 세포의 백분율. *p<0.05. 통계적 분석은 이원 ANOVA를 사용하여 수행하였다.
도 27. 아데노바이러스 공여자 벡터의 투여 전 CD46tg 및 CD46+/+/Hbbth-3 마우스로부터의 간 및 비장 절편에서의 헤마톡실린/에오신 염색에 의한 골수외 조혈. 철 침착은 펄 염색에 의해 비장에서 헤모시데린의 세포질 청색 안료로서 제시된다.
도 28. 상이한 역전된 반복부 (IR)를 사용한 통합 SB100x 트랜스포사제 효능의 비교를 위한 실험 설계의 개략도. mgmt./GFP 트랜스포손 페이로드가 (i) pT0 ITR; (ii) pT2 ITR; 또는 (iii) pT4 ITR에 플랭킹된 3개의 플라스미드를 사용하였고, 플라스미드는 그 외에는 동일하였다. 293 세포를 mgmt./GFP 트랜스포손 페이로드를 포함하는 3개의 플라스미드로, pSB100x를 코딩하는 지지 플라스미드의 존재 또는 부재 하에 형질감염시켰다. 세포를 선택의 존재 또는 부재 하에 17일 동안 배양하였다. 선택 하에 있지 않은 세포에 대해서는 제3일, 제12일, 및 제17일에, 및 선택 하에 있는 세포에 대해서는 제3일의 50 μM O6BG/BCNU의 단일 첨가에 의해 제17일에 배양 샘플을 채취하였다.
도 29. 각각의 T0, T2, 및 T4 플라스미드에 대한 SB100x 플라스미드의 존재 또는 부재 하에 배양된 세포에 대한 배양 제12일 및 제17일의 GFP-발현 293 세포의 백분율.
도 30. 각각의 T0, T2, 및 T4 플라스미드에 대한 SB100x 플라스미드의 존재 또는 부재 하에 배양된 세포에 대해 O6BG/BCNU로의 선택 하의 세포에 대한 배양 제17일의 GFP-발현 293 세포의 백분율.
도 31. 31.776 kb 트랜스포손 페이로드 (통합 카세트)를 포함하는 핵산 (pWEAd5-PT4-LCR-글로빈-mgmt)의 개략도. 개략도는 제시의 용이성을 위해 2개의 중첩 부분으로 나뉘며, 이들 부분의 관계는 관련 기술분야의 통상의 기술자에게 명백할 것이다. 개략도는 원형화된 플라스미드 콘텍스트에서 트랜스포손 페이로드를 제공한다. 관련 기술분야의 통상의 기술자는 트랜스포손 페이로드가 분자 생물학의 기술을 사용하여, 다른 콘텍스트에서, 예를 들어 바이러스 벡터 게놈에서 용이하게 이용될 수 있다는 것을 인지할 것이다. 트랜스포손 페이로드는 트랜스포손 IR (특히 슬리핑 뷰티 IR)에 플랭킹되고, 이는 다시 레콤비나제 직접 반복부 (DR, 특히 FRT DR)에 플랭킹된다. 트랜스포손은 (i) 베타 프로모터, HS1-HS5를 포함하는 긴 LCR, 및 3'HS1과 작동가능하게 연결된 감마-글로빈 코딩 서열 및 (ii) MGMTP140K 코딩 서열이 Ef1a 프로모터와 작동가능하게 연결된 MGMTP140K 선택 카세트를 포함한다.
도 32. 31.772 kb 트랜스포손 페이로드 (통합 카세트)를 포함하는 핵산 (HDAd5-PT4-긴 LCR 글로빈-rhMGMT)의 개략도. 개략도는 제시의 용이성을 위해 2개의 중첩 부분으로 나뉘며, 이들 부분의 관계는 관련 기술분야의 통상의 기술자에게 명백할 것이다. 개략도는 원형화된 플라스미드 콘텍스트에서 트랜스포손 페이로드를 제공한다. 관련 기술분야의 통상의 기술자는 트랜스포손 페이로드가 분자 생물학의 기술을 사용하여, 다른 콘텍스트에서, 예를 들어 바이러스 벡터 게놈에서 용이하게 이용될 수 있다는 것을 인지할 것이다. 트랜스포손 페이로드는 트랜스포손 IR (특히 슬리핑 뷰티 IR)에 플랭킹되고, 이는 다시 레콤비나제 DR (특히 FRT DR)에 플랭킹된다. 트랜스포손은 (i) 베타 프로모터, HS1-HS5를 포함하는 긴 LCR, 및 3'HS1과 작동가능하게 연결된 감마-글로빈 코딩 서열 및 (ii) MGMTP140K 코딩 서열이 Ef1a 프로모터와 작동가능하게 연결된 MGMTP140K 선택 카세트를 포함한다.
도 33. 13.173 kb 트랜스포손 페이로드 (통합 카세트)를 포함하는 핵산 (HDAd-Ad5-PT4-LCR-hACE2/mgmt)의 개략도. 개략도는 제시의 용이성을 위해 2개의 중첩 부분으로 나뉘며, 이들 부분의 관계는 관련 기술분야의 통상의 기술자에게 명백할 것이다. 개략도는 원형화된 플라스미드 콘텍스트에서 트랜스포손 페이로드를 제공한다. 관련 기술분야의 통상의 기술자는 트랜스포손 페이로드가 분자 생물학의 기술을 사용하여, 다른 콘텍스트에서, 예를 들어 바이러스 벡터 게놈에서 용이하게 이용될 수 있다는 것을 인지할 것이다. 트랜스포손 페이로드는 트랜스포손 IR (특히 슬리핑 뷰티 IR)에 플랭킹되고, 이는 다시 레콤비나제 DR (특히 FRT DR)에 플랭킹된다. 트랜스포손은 (i) 베타 프로모터 및 HS1-HS4를 포함하는 긴 LCR과 작동가능하게 연결된 재조합 인간 ACE2 코딩 서열 및 (ii) MGMTP140K 코딩 서열이 Ef1a 프로모터와 작동가능하게 연결된 MGMTP140K 선택 카세트를 포함한다.
도 34. 12.169 kb 트랜스포손 페이로드 (통합 카세트)를 포함하는 핵산 (pWEHCB-마이크로LCR-글로빈/mgmt)의 개략도. 개략도는 원형화된 플라스미드 콘텍스트에서 트랜스포손 페이로드를 제공한다. 관련 기술분야의 통상의 기술자는 트랜스포손 페이로드가 분자 생물학의 기술을 사용하여, 다른 콘텍스트에서, 예를 들어 바이러스 벡터 게놈에서 용이하게 이용될 수 있다는 것을 인지할 것이다. 트랜스포손 페이로드는 트랜스포손 IR (특히 슬리핑 뷰티 IR)에 플랭킹되고, 이는 다시 레콤비나제 DR (특히 FRT DR)에 플랭킹된다. 트랜스포손은 (i) 베타 프로모터 및 HS1-HS4를 포함하는 긴 LCR과 작동가능하게 연결된 감마 글로빈 코딩 서열 및 (ii) MGMTP140K 코딩 서열이 Ef1a 프로모터와 작동가능하게 연결된 MGMTP140K 선택 카세트를 포함한다.
도 35. 9.382 kb 트랜스포손 페이로드 (통합 카세트)를 포함하는 핵산 (pWEHCA-파코니-GFP)의 개략도. 개략도는 원형화된 플라스미드 콘텍스트에서 트랜스포손 페이로드를 제공한다. 관련 기술분야의 통상의 기술자는 트랜스포손 페이로드가 분자 생물학의 기술을 사용하여, 다른 콘텍스트에서, 예를 들어 바이러스 벡터 게놈에서 용이하게 이용될 수 있다는 것을 인지할 것이다. 트랜스포손 페이로드는 트랜스포손 IR (특히 슬리핑 뷰티 IR)에 플랭킹되고, 이는 다시 레콤비나제 DR (특히 FRT DR)에 플랭킹된다. 트랜스포손은 (i) pgk 프로모터와 작동가능하게 연결된 FancA 코딩 서열 및 (ii) Ef1a 프로모터와 작동가능하게 연결된 GFP 코딩 서열을 포함한다.
도 36. 5.490 kb 트랜스포손 페이로드 (통합 카세트)를 포함하는 핵산 (pHCA-T4-rhMGMT-GFP)의 개략도. 개략도는 원형화된 플라스미드 콘텍스트에서 트랜스포손 페이로드를 제공한다. 관련 기술분야의 통상의 기술자는 트랜스포손 페이로드가 분자 생물학의 기술을 사용하여, 다른 콘텍스트에서, 예를 들어 바이러스 벡터 게놈에서 용이하게 이용될 수 있다는 것을 인지할 것이다. 트랜스포손 페이로드는 트랜스포손 역전된 반복부 (IR, 특히 슬리핑 뷰티 IR)에 플랭킹되고, 이는 다시 레콤비나제 직접 반복부 (DR, 특히 FRT DR)에 플랭킹된다. 트랜스포손은 (i) PGK 프로모터와 작동가능하게 연결된 GFP 코딩 서열 및 (ii) MGMTP140K 코딩 서열이 EF1a 프로모터와 작동가능하게 연결된 MGMTP140K 선택 카세트를 포함한다.
도 37. 3.797 kb 트랜스포손 페이로드 (통합 카세트)를 포함하는 핵산의 개략도. 개략도는 원형화된 플라스미드 콘텍스트에서 트랜스포손 페이로드를 제공한다. 관련 기술분야의 통상의 기술자는 트랜스포손 페이로드가 분자 생물학의 기술을 사용하여, 다른 콘텍스트에서, 예를 들어 바이러스 벡터 게놈에서 용이하게 이용될 수 있다는 것을 인지할 것이다. 트랜스포손 페이로드는 트랜스포손 역전된 반복부 (IR, 특히 슬리핑 뷰티 IR)에 플랭킹되고, 이는 다시 레콤비나제 직접 반복부 (DR, 특히 FRT DR)에 플랭킹된다. 트랜스포손은 EF1a 프로모터와 작동가능하게 연결된 (i) GFP 코딩 서열 및 (ii) MGMTP140K 코딩 서열을 포함한다.
도 38. 3.709 kb 트랜스포손 페이로드 (통합 카세트)를 포함하는 핵산 (pBHCA-PT0-EF1a-mgmt/GFP)의 개략도. 개략도는 제시의 용이성을 위해 2개의 중첩 부분으로 나뉘며, 이들 부분의 관계는 관련 기술분야의 통상의 기술자에게 명백할 것이다. 개략도는 원형화된 플라스미드 콘텍스트에서 트랜스포손 페이로드를 제공한다. 관련 기술분야의 통상의 기술자는 트랜스포손 페이로드가 분자 생물학의 기술을 사용하여, 다른 콘텍스트에서, 예를 들어 바이러스 벡터 게놈에서 용이하게 이용될 수 있다는 것을 인지할 것이다. 트랜스포손 페이로드는 트랜스포손 역전된 반복부 (IR, 특히 슬리핑 뷰티 IR)에 플랭킹되고, 이는 다시 레콤비나제 직접 반복부 (DR, 특히 FRT DR)에 플랭킹된다. 트랜스포손은 EF1a 프로모터와 작동가능하게 연결된 (i) eGFP 코딩 서열 및 (ii) MGMTP140K 코딩 서열을 포함한다.
도 39. 3.547 kb 트랜스포손 페이로드 (통합 카세트)를 포함하는 핵산 (pHCA(Ad35)-PT4-EF1a-mgmt/GFP)의 개략도. 개략도는 제시의 용이성을 위해 2개의 중첩 부분으로 나뉘며, 이들 부분의 관계는 관련 기술분야의 통상의 기술자에게 명백할 것이다. 개략도는 원형화된 플라스미드 콘텍스트에서 트랜스포손 페이로드를 제공한다. 관련 기술분야의 통상의 기술자는 트랜스포손 페이로드가 분자 생물학의 기술을 사용하여, 다른 콘텍스트에서, 예를 들어 바이러스 벡터 게놈에서 용이하게 이용될 수 있다는 것을 인지할 것이다. 트랜스포손 페이로드는 트랜스포손 역전된 반복부 (IR, 특히 슬리핑 뷰티 IR)에 플랭킹되고, 이는 다시 레콤비나제 직접 반복부 (DR, 특히 FRT DR)에 플랭킹된다. 트랜스포손은 EF1a 프로모터와 작동가능하게 연결된 (i) GFP 코딩 서열 및 (ii) MGMTP140K 코딩 서열을 포함한다.
도 40. 3.543 kb 트랜스포손 페이로드 (통합 카세트)를 포함하는 핵산 (pHCA-Ad5-PT4-Ef1a-mgmt/GFP)의 개략도. 개략도는 제시의 용이성을 위해 2개의 중첩 부분으로 나뉘며, 이들 부분의 관계는 관련 기술분야의 통상의 기술자에게 명백할 것이다. 개략도는 원형화된 플라스미드 콘텍스트에서 트랜스포손 페이로드를 제공한다. 관련 기술분야의 통상의 기술자는 트랜스포손 페이로드가 분자 생물학의 기술을 사용하여, 다른 콘텍스트에서, 예를 들어 바이러스 벡터 게놈에서 용이하게 이용될 수 있다는 것을 인지할 것이다. 트랜스포손 페이로드는 트랜스포손 역전된 반복부 (IR, 특히 슬리핑 뷰티 IR)에 플랭킹되고, 이는 다시 레콤비나제 직접 반복부 (DR, 특히 FRT DR)에 플랭킹된다. 트랜스포손은 EF1a 프로모터와 작동가능하게 연결된 (i) GFP 코딩 서열 및 (ii) MGMTP140K 코딩 서열을 포함한다.
도 41. 2.781 kb 트랜스포손 페이로드 (통합 카세트)를 포함하는 핵산 (pHCA(Ad35)-PT4-EF1a-mgmt)의 개략도. 개략도는 제시의 용이성을 위해 2개의 중첩 부분으로 나뉘며, 이들 부분의 관계는 관련 기술분야의 통상의 기술자에게 명백할 것이다. 개략도는 원형화된 플라스미드 콘텍스트에서 트랜스포손 페이로드를 제공한다. 관련 기술분야의 통상의 기술자는 트랜스포손 페이로드가 분자 생물학의 기술을 사용하여, 다른 콘텍스트에서, 예를 들어 바이러스 벡터 게놈에서 용이하게 이용될 수 있다는 것을 인지할 것이다. 트랜스포손 페이로드는 트랜스포손 역전된 반복부 (IR, 특히 슬리핑 뷰티 IR)에 플랭킹되고, 이는 다시 레콤비나제 직접 반복부 (DR, 특히 FRT DR)에 플랭킹된다. 트랜스포손은 MGMTP140K 코딩 서열이 EF1a 프로모터와 작동가능하게 연결된 MGMTP140K 선택 카세트를 포함한다.
도 42. 2.777 kb 트랜스포손 페이로드 (통합 카세트)를 포함하는 핵산 (pHCA-T4-Ef1a-rhMGMT)의 개략도. 개략도는 원형화된 플라스미드 콘텍스트에서 트랜스포손 페이로드를 제공한다. 관련 기술분야의 통상의 기술자는 트랜스포손 페이로드가 분자 생물학의 기술을 사용하여, 다른 콘텍스트에서, 예를 들어 바이러스 벡터 게놈에서 용이하게 이용될 수 있다는 것을 인지할 것이다. 트랜스포손 페이로드는 트랜스포손 역전된 반복부 (IR, 특히 슬리핑 뷰티 IR)에 플랭킹되고, 이는 다시 레콤비나제 직접 반복부 (DR, 특히 FRT DR)에 플랭킹된다. 트랜스포손은 MGMTP140K 코딩 서열이 EF1a 프로모터와 작동가능하게 연결된 MGMTP140K 선택 카세트를 포함한다.
도 43. 2.751 kb 트랜스포손 페이로드 (통합 카세트)를 포함하는 핵산 (pHCA-Ad5-PT4-Ef1a-mgmt)의 개략도. 개략도는 제시의 용이성을 위해 2개의 중첩 부분으로 나뉘며, 이들 부분의 관계는 관련 기술분야의 통상의 기술자에게 명백할 것이다. 개략도는 원형화된 플라스미드 콘텍스트에서 트랜스포손 페이로드를 제공한다. 관련 기술분야의 통상의 기술자는 트랜스포손 페이로드가 분자 생물학의 기술을 사용하여, 다른 콘텍스트에서, 예를 들어 바이러스 벡터 게놈에서 용이하게 이용될 수 있다는 것을 인지할 것이다. 트랜스포손 페이로드는 트랜스포손 역전된 반복부 (IR, 특히 슬리핑 뷰티 IR)에 플랭킹되고, 이는 다시 레콤비나제 직접 반복부 (DR, 특히 FRT DR)에 플랭킹된다. 트랜스포손은 MGMTP140K 코딩 서열이 EF1a 프로모터와 작동가능하게 연결된 MGMTP140K 선택 카세트를 포함한다.
본 개시내용은 특히 아데노바이러스 벡터, 아데노바이러스 벡터 게놈, 및 그의 조합 및 용도를 포함한다. 본 개시내용의 아데노바이러스 벡터 및 아데노바이러스 벡터 게놈은 최대, 예를 들어 20, 25, 30, 또는 심지어 30 kb 초과의 트랜스포손 페이로드를 포함할 수 있고, 또한 다양한 실시양태에서 이러한 대형 트랜스포손 페이로드를 숙주 세포의 게놈 내로 성공적으로 통합시킬 수 있다. 관련 기술분야의 통상의 기술자가 인지할 바와 같이, 벡터 통합 용량은 그 자체로 유전자 요법 시스템의 결정적으로 중요한 특색 중 하나이며, 이는 적어도 부분적으로 통합 용량이 치료 페이로드의 길이 및/또는 복잡성을 제한하기 때문이다. 따라서, 본원에 제공된 방법 및 조성물은, 특히, 예를 들어 20, 25, 30, 또는 심지어 30 kb 초과의 핵산 페이로드의 숙주 세포 게놈 내로의 전위 통합을 허용하는 아데노바이러스 벡터를 사용한 효과적인 유전자 요법을 위한 플랫폼을 제공한다. 관련 기술분야의 통상의 기술자가 본 개시내용으로부터 인지할 바와 같이, 그리고 본원의 다양한 실시양태에 의해 예시된 바와 같이, 이러한 통합 용량은 다양한 이전 시스템에 의해 가능한 것보다 더 큰 복잡성 및 다양성으로 치료 페이로드를 조작하는 것을 허용한다.
본 개시내용의 방법 및 조성물은 통합 용량에 대한 특정의 이전에 이해되었던 제약을 극복한다. 특정의 이러한 제약은 바이러스 벡터 유형과 연관된다. 예를 들어, 렌티바이러스 벡터 페이로드 용량은 약 9 kb이고, 레트로바이러스 페이로드 용량은 약 8 kb이고, 아데노-연관 바이러스 (AAV) 페이로드 용량은 약 5 kb이다. 다른 이러한 제약은 이전에는 전위에 고유한 것으로 이해되었다. 예를 들어, 연구는 트랜스포손의 통합이 길이 의존적이라는 것을 보여주었으며-- 길이가 증가함에 따라 전위하는 능력은 신속하게 감소하고, 이러한 현상은 때때로 관련 기술분야에서 "길이-의존성"으로 언급된다. 이들 현존하는 예상의 관점에서, 본원에 개시된 조성물 및 방법이 이전에 이해되었던 아데노바이러스 전위 통합 용량의 제한을 파괴한다는 발견은 본원에 제공된 본 개시내용 및 실시예에 의해 밝혀진 놀라운 결과였다. 본 발명자들의 지식으로, 본 작업은 본원에 제공된 바와 같은 방법 및 조성물이 본원에 개시된 다양한 특정 크기의 트랜스포손 페이로드를 통합시킬 수 있다는 제1 입증을 나타낸다. 이러한 발견은, 예를 들어 개선된 트랜스진 발현을 위한 대형 조절 영역 (유전자좌 제어 영역, 또는 "LCR")을 포함하는 트랜스포손 페이로드의 통합에 의해 예시된다. 그러나, 어떠한 의심도 피하기 위해, 관련 기술분야의 통상의 기술자는 이러한 예시가 본원에 제공된 아데노바이러스 조성물 및 방법의 높은 전위 통합 용량의 보다 일반적인 발견, 및 특히 유전자 요법 분야를 포함한 다양한 분야에서의 그의 유의성을 대표한다는 것을 인지할 것이다.
본 개시내용의 측면은 이제 하기와 같이 보다 뒷받침되어 상세하게 기재된다: (I) 표적 세포 게놈 내로의 바이러스 벡터 페이로드 통합; (II) 대형 페이로드의 유형; (III) 긴 LCR; (IV) 긴 LCR과 작동가능하게 연결된 코딩 서열; (V) 트랜스포사제; (VI) 조절 성분; (VII) 벡터; (VIII) 제제; (IX) 적용; (X) 예시적 실시양태; (XI) 실험 실시예(들); 및 (XII) 닫는 단락.
(I) 표적 세포 게놈 내로의 바이러스 벡터 페이로드 통합
유전자 요법은 종종 목적하는 핵산 페이로드의 표적 세포의 게놈 내로의 통합을 필요로 한다. 다양한 유전자 요법에 의해 치료될 수 있는 상태의 다양성을 고려하여, 핵산 페이로드의 설계를 위한 많은 전략이 고안되었다. 그러나, 실제로, 치료 페이로드의 전달은 대형 페이로드를 표적 세포 게놈 내로 통합시키는 것의 어려움에 의해 많은 콘텍스트에서 제한되었다. 예를 들어, 렌티바이러스 벡터 페이로드 용량은 약 9 kb이고, 레트로바이러스 페이로드 용량은 약 8 kb이고, 아데노-연관 바이러스 (AAV) 페이로드 용량은 약 5 kb이다. 대형 유전자를 발현하고/거나, 대형 인간 조절 서열을 이용하고/거나, 다중 유전자를 발현할 수 있는 페이로드에 대한 기존의 관심을 고려하면, 이들은 실질적인 제한이다. 더욱이, 관련 기술분야의 통상의 기술자에 의해 널리 인지되는 바와 같이, 각각의 바이러스 플랫폼은 다양한 용도에 각각 고유하게 더 적합하게 또는 덜 적합하게 하는 다양한 상이한 특징과 연관되며, 이러한 인자는, 비제한적으로, 수용자 면역 반응 (예를 들어, 염증 및/또는 기존 항체와의 상호작용), 벡터 생산의 어려움, 세포 형질도입의 효능, 페이로드 통합의 효능, 트랜스진 발현 특징, 표적화된 세포 유형, 유전자독성의 위험 (예를 들어, 종양발생) 등을 포함할 수 있고, 이들 중 임의의 것 또는 모두는 연구원 및 의료 진료의에 의해 다양한 문맥에서 고유하게 가중치가 매겨질 수 있다. 본 개시내용은 하나 이상의 시스템에서 특정의 공지된 조성물 및 방법을 사용한 트랜스포손 페이로드 통합의 효율이 표적 세포 유형, 플라스미드 백본, 및/또는 트랜스포손 길이 중 1종 이상에 의존적이고, 특정의 이러한 의존성은 적어도 본 개시내용의 특정 조성물 및 방법, 예를 들어 SB 역전된 반복부에 플랭킹된 트랜스포손 페이로드를 포함하는 아데노바이러스 게놈을 포함하는 조성물 및 방법에서 (예를 들어 인간 대상체 세포, 예를 들어 조혈 줄기 세포에서 및/또는 생체내 요법에서, 예를 들어 SB100x 트랜스포사제 또는 또 다른 SB 트랜스포사제에 의한 전위의 경우) 감소되거나 제거된다는 것을 인식한다.
아데노바이러스 벡터는 가장 통상적으로 이용되는 유전자 요법 벡터 중 하나이다. 예를 들어, 적어도 일부의 보고에 따르면, 아데노바이러스 벡터는 암 유전자 요법을 위해 가장 통상적으로 사용되는 벡터이다. 실제로, 예를 들어 백신 용도, 치료적 트랜스진 도입, 및/또는 암 치료를 위해, 400종 초과의 유전자 요법 시험이 인간 Ad 벡터를 사용하여 개시되고/거나 완료되었다. 유전자 요법에서 아데노바이러스 벡터의 보급에 기여하고/거나 적어도 부분적으로 그의 원인이 된 아데노바이러스 벡터의 다양한 이점이 관련 기술분야에 공지되어 있다. 그럼에도 불구하고, 심지어 통상적으로 사용되는 벡터로도, 유전자 요법은 적어도 부분적으로 장기간의 표현형 교정이 치료 트랜스진의 충분히 효율적이고 충분히 안정한 통합 및 발현을 필요로 하기 때문에 어려운 도전과제로 남아있다.
일부 아데노바이러스 벡터가 최대 약 36-37 kb의 높은 클로닝 용량을 갖는 것으로 공지되어 있지만, 대형 페이로드를 보유하는 벡터를 물리적으로 생성하는 능력은 페이로드의 표적 세포 게놈 내로의 통합을 효율적으로 매개하는 그러한 벡터의 능력을 반영하지 않는다. 실제로, 전형적으로 26-45 kb (예를 들어, Ad5의 경우 약 36 kb)의 선형 이중 가닥 DNA 게놈인 아데노바이러스 벡터 게놈은 전형적으로 숙주 세포 게놈 내로 자연적으로 통합되지 않는다. 반대로, 아데노바이러스 벡터는 숙주 세포에서 바이러스 게놈의 에피솜 유지를 특징으로 한다. 에피솜 유지는 삽입 효과의 위험을 최소화하지만, 에피솜 게놈은 종종 관련 기술분야의 통상의 기술자에게 공지된 다른 어려움 중에서도 표적 세포 및 표적 세포 자손에 의해 불충분하게 보유된다. 적어도 이들 이유로, 그의 천연 대응물과 달리 숙주 세포 게놈 내로의 통합을 위해 조작된 아데노바이러스 벡터를 생산하기 위한 노력이 이루어져 왔다. 이들 접근법도 또한 도전과제가 없지 않았다. 예를 들어, 특정 통합 아데노바이러스 벡터가 갖는 하나의 문제는 유전자독성 효과를 특징으로 하는 통합 부위 선호도였다.
페이로드를 숙주 세포 게놈 내로 통합시키는 아데노바이러스 벡터를 조작하는 하나의 수단은 통합 바이러스 하이브리드 벡터를 생산하는 것이었다. 통합 바이러스 하이브리드 벡터는 표적 세포를 효율적으로 형질도입하는 벡터의 유전 요소를 그의 벡터 페이로드를 안정하게 통합하는 벡터의 유전 요소와 조합한다. 예를 들어 아데노바이러스 벡터와 조합하여 사용하기 위한 관심 통합 요소는 박테리오파지 인테그라제 PHiC31, 레트로트랜스포손, 레트로바이러스 (예를 들어, LTR-매개 또는 레트로바이러스 통합-매개), 아연-핑거 뉴클레아제, DNA-결합 도메인-레트로바이러스 인테그라제 융합 단백질, AAV (예를 들어, AAV-ITR 또는 AAV-Rep 단백질-매개), 및 슬리핑 뷰티 (SB) 트랜스포사제의 것을 포함하였다.
벡터 그 자체와 같이, 통합 바이러스 하이브리드 벡터의 통합 시스템은 특징적인 위치 통합 패턴 및 페이로드 용량을 비롯한 그 자체의 고유한 이점 및 단점을 겪는다. 예를 들어, 연구는 트랜스포손의 통합이 길이 의존적이라는 것을 보여주었으며; 길이가 증가함에 따라 전위하는 능력은 신속하게 감소하고, 이러한 현상은 때때로 관련 기술분야에서 "길이-의존성"으로 언급된다. SB 트랜스포사제의 경우에, 연구는 SB 트랜스포손 효능이 각각의 부가된 1 kb의 트랜스포손 (페이로드) 길이마다 30% 감소하고, 약 9 kb 초과 시 완전히 상실되었음을 보여주었다. 일부 연구는 작은 분율의 SB 트랜스포손 통합이 적어도 약 10 kb까지는 보유되었음을 나타내었지만, 증거는 보다 큰 SB 트랜스포손이 보다 작은 대응물에 비해 효율적으로 통합되지 않음을 입증하였다. 통합 효능을 증진시키기 위해 변형된 특정 SB 시스템도 또한 실질적으로 감소된 트랜스포손 통합 수준을 갖는 유의한 길이-의존성 효과를 겪었다 (Turchiano et al., PLOS One, 9: e112712, 2014).
본 개시내용은, 특히, 적어도 약 30 kb 내지 약 35 kb까지의 트랜스포손 페이로드가 치료 용도에 충분한 효능으로 숙주 세포 게놈 내로 통합될 수 있다는 본 발명자들의 놀라운 발견을 제공한다. 다양한 실시양태에서, 본 개시내용은 SB 역전된 반복부에 플랭킹되고 이어서 레콤비나제의 존재 하에 트랜스포손 페이로드를 포함하는 게놈 또는 그의 부분이 원형화되도록 하는 FRT 재조합 부위에 플랭킹된 트랜스포손 페이로드를 포함하는 아데노바이러스 게놈을 포함하는 대형 페이로드 (예를 들어, 적어도 약 30 kb 내지 약 35 kb까지)의 통합을 위한 벡터, 게놈, 및 시스템을 제공하며, 본 발명자들이 발견한 것은 SB 트랜스포사제의 존재 하에 표적 세포 게놈 내로 대형 트랜스포손 페이로드를 통합시킬 수 있다. 본 개시내용은 추가로, 이러한 조성물이 생체내 요법을 달성하기에, 예를 들어 통합 및 트랜스진 발현을 위해 충분히 효율적이라는 것을 제공한다. 길이 의존성 및 통합 효능의 이전 개념과 뚜렷하게 대조되는 이들 주목할 만한 발견은 이전에 달성불가능한 것으로 생각되었던 아데노바이러스 벡터의 치료 및 연구 용도를 가능하게 한다.
(II) 대형 페이로드의 유형
특정한 실시양태에서, 본원에 개시된 발명은 대형 트랜스포손 페이로드의 전달 및 통합을 용이하게 한다. 대형 페이로드는 예를 들어 본원에 기재된 것을 포함한, 긴 LCR에 연결된 코딩 서열을 포함한다. 특정한 실시양태에서, 페이로드는 적어도 10 kb이다. 특정한 실시양태에서, 페이로드는 적어도 10 kb, 15 kb, 20 kb, 25 kb, 30 kb, 35 kb, 40 kb, 또는 그 초과이다. 특정한 실시양태에서, 페이로드는 10 kb-35 kb, 10 kb-30 kb, 15 kb-35 kb, 15 kb-30 kb, 20 kb-35 kb, 또는 20 kb-30 kb의 길이를 갖는다. 특정한 실시양태에서, 페이로드는 10 kb-32.4 kb, 15 kb-32.4 kb, 또는 20 kb-32.4 kb의 길이를 갖는다. 특정한 실시양태에서, 페이로드는 단일의 긴 (대형) 단백질을 코딩한다. 특정한 실시양태에서, 페이로드는 다중 단백질; 예를 들어 2종 이상의 단백질, 예컨대 2, 3, 4, 또는 5종 또는 그 초과의 단백질을 코딩한다. 페이로드가 다중 단백질을 코딩하는 실시양태에서, 그렇게 코딩된 임의의 개별 단백질이 독립적으로 "대형" 또는 "긴" 것으로 간주될 필요는 없으며; 오히려, 아데노바이러스 벡터에 의해 보유된 전체 페이로드는 다수의 보다 작은 개별 단백질 코딩 서열을 함유하더라도 "대형"인 것으로 이해된다. 특정한 실시양태에서, 페이로드는 긴 LCR을 포함한다.
(III) 긴 LCR
대형 페이로드를 숙주 세포 게놈 내로 통합시키는 능력은 이전에 효과적인 치료 용도를 위해 너무 대형인 것으로 생각되었던 구축물의 통합을 가능하게 한다. 대형 페이로드를 통합할 수 있는 즉각적으로 명백한 일반적 유용성을 넘어서, 대형 페이로드의 하나의 카테고리는 긴 유전자좌 제어 영역 (또는 긴 LCR)을 포함하는 페이로드를 포함한다. 일부 경우에, 유전자 요법을 위한 적어도 특정의 기존 벡터 시스템, 예컨대 렌티바이러스 및 AAV 시스템에 의해 수용되는 것보다 더 큰 조절 영역은 페이로드로부터 치료상 유효한 트랜스진 발현을 달성하고/거나 발현의 수준 (예를 들어, 트랜스진 발현 생성물을 코딩하는 mRNA의 생산 및/또는 트랜스진에 의해 코딩된 트랜스진 발현 생성물의 수 또는 빈도) 및/또는 발현의 특이성 (예를 들어, 발현의 시기 및/또는 발현의 세포 또는 조직 특이성)을 증가시키는데 유용하다.
어떠한 특정한 과학적 이론에 얽매이는 것을 원하지는 않지만, 인간 게놈은 예를 들어 루프 형성을 통한 조절 영역 (예컨대 전사 인자 결합 부위 및 이들이 발현을 제어하는 코딩 영역) 사이의 긴-범위의 직접 및/또는 간접 상호작용을 포함하는 3차원 구조로 조직화된다. 많은 경우에, 이들 긴-범위의 상호작용은 위상학적 회합 도메인 (TAD)의 콘텍스트에서 발생한다. TAD는 인핸서와 다른 조절 영역의 상호작용을 용이하게 하여 전사를 제어할 수 있는 염색체 조직화의 기능적 단위로 간주된다. TAD는 경계에 의해 구분되며, 경계는 인핸서 및 프로모터의 검색 공간을 제한하고 원치 않는 조절 접촉이 형성되는 것을 방지하는 것으로 생각된다. 이들 도메인의 양측의 TAD 경계는 상이한 포유동물 세포 유형 사이에서, 심지어 종에 걸쳐 보존된다.
게놈에서의 그의 중요한 역할 및 특히 유전자 및 트랜스진 발현에 기여하는 핵산 서열 및 단백질을 조직화하는데 있어서의 그의 역할로 인해, TAD는 유전자 요법의 안전성 및/또는 효능을 증가시키는데 사용될 수 있다. TAD 그 자체는 임의의 기존 바이러스 벡터에 포함되기에 너무 크다. TAD의 중앙 크기는 880 kb이다. 그러나, TAD의 유전자 또는 트랜스진 발현 효과의 일부 또는 전부를 포괄하는 TAD 내에 존재하는 특정 기능적 요소가 확인되었고, 이는 본원에 개시된 아데노바이러스 벡터에 포함되기에 적합한 크기이지만, 많은 경우에 특정의 다른 벡터, 예컨대 렌티바이러스 및 AAV 벡터에 포함되기에는 너무 크다. 일부 경우에, TAD의 1개 이상의 핵산 서열을 포함하는 조절 서열은 LCR로 지칭될 수 있다. LCR은 다양한 길이를 갖도록, 예를 들어 일부 경우에 비교적 작은 페이로드 용량을 갖는 벡터, 예컨대 렌티바이러스 또는 AAV 벡터에 포함시키기 위해 비교적 짧은 길이를 갖도록 조작되었다. 그러나, 어떠한 특정한 이론에 얽매이는 것을 원하지는 않지만, 관련 기술분야의 통상의 기술자는 보다 긴 서열이, 전체적으로 또는 부분적으로 이들이 유래되거나 또는 전체적으로 또는 부분적으로 그의 서열이 기초로 하는 내인성 서열의 유리한 발현 효과를 연관된 유전자 또는 트랜스진에 부여하는 보다 큰 용량을 갖는다는 것을 인지한다. 따라서, 일부 LCR은 예를 들어 5 kb 이하, 6 kb 이하, 7 kb 이하, 8 kb 이하, 또는 9 kb 이하의 비교적 짧은 길이를 갖도록 조작되었다. 대조적으로, 본 개시내용은 긴 LCR (예를 들어, 9 kb 이상, 10 kb 이상, 11 kb 이상, 12 kb 이상, 13 kb 이상, 14 kb 이상, 15 kb 이상, 20 kb 이상, 25 kb 이상, 또는 30 kb 이상의 조절 서열)이 본원에 제공된 벡터, 게놈, 및 방법을 사용하여 숙주 세포 게놈 내로 통합될 수 있다는 것을 인식한다. 다양한 실시양태에서, 긴 LCR은 5 kb, 6 kb, 7 kb, 8 kb, 9 kb, 10 kb, 11 kb, 12 kb, 13 kb, 14 kb, 15 kb, 16 kb, 17 kb, 18 kb, 19 kb, 20 kb, 21 kb, 22 kb, 23 kb, 24 kb, 25 kb, 26 kb, 27 kb, 28 kb, 29 kb, 및 30 kb 중 임의의 것으로부터 선택된 하한 및 30 kb, 31 kb, 32 kb, 33 kb, 34 kb, 35 kb, 36 kb, 37 kb, 38 kb, 39 kb, 및 40 kb 중 임의의 것으로부터 선택된 상한을 갖는 길이의 범위를 갖는 조절 서열을 포함한다. 긴 LCR은 또한 본원에 제공된 임의의 LCR의 임의의 길이를 가질 수 있으며, 이러한 길이는 다양한 실시양태에서 하한 또는 상한으로서 간주될 수 있다.
LCR의 예는 표 1에 제시된 것을 포함한다. 달리 나타내거나 또는 관련 기술분야의 통상의 기술자에게 명백할 것을 제외하고, 참조 게놈은 GRCh38 참조 게놈, 예컨대 GRCH38/hg38 또는 GRCh38.p13이다.
표 1:
β-글로빈 LCR은 적어도 몇몇 측면에서 예시적인 적어도 일부 LCR이다. 예를 들어, 많은 다른 LCR과 같이, β-글로빈 LCR은 작동가능하게 연결된 유전자 또는 트랜스진의 발현을 증진시키고 (예를 들어, 증가된 전사, 증가된 번역, 및/또는 증가된 세포 또는 조직 특이성), LCR의 발현 효과를 매개하는 것으로 관련 기술분야의 통상의 기술자에 의해 이해되는 DNAse 과민성 (HS) 영역을 포함한다. 또한, 많은 다른 LCR과 같이, β-글로빈 LCR은, 예를 들어 모든 β-글로빈 LCR HS 영역 (HS1-HS5)을 포함하거나 또는 β-글로빈 LCR HS 영역의 하위세트 (예를 들어, HS1-HS4)를 포함하는 β-글로빈 LCR 서열을 포함하는 핵산에 이용될 수 있다는 점에서, 전체적으로 또는 부분적으로 이용될 수 있다.
염색체 11 상의 호모 사피엔스(Homo sapiens) β-글로빈 영역에 대한 예시적인 핵산 서열은 진뱅크(GenBank) 수탁 번호 NG_000007로 제공된다. β-글로빈 긴 LCR은, 일부 경우에, 유전자좌에서 제1 (배아) 글로빈 유전자에 대해 5'의 6 내지 22 kb에 위치하는 서열일 수 있거나 또는 그를 포함할 수 있다. β-글로빈 긴 LCR은 5개의 DNAse I 과민성 부위, 5'HS 1 내지 5를 포함할 수 있다. 문헌 [Li et al., Blood, 100(9):3077-3086, 2002]. NG_000007은 유전자좌 제어 영역 내의 DNAse I 과민성 부위 HS1, HS2, HS3, 및 HS4를 서술하는 제한 부위 (예를 들어, HS2의 SnaBI 및 BstXI 제한 부위, HS3의 HindIII 및 BamHI 제한 부위, 및 HS4의 BamHI 및 BanII 제한 부위)의 위치를 제공하며, 이는 그 전문 및 특히 과민성 부위 위치와 관련하여 본원에 참조로 포함된다. HS1의 서열 및 위치는, 예를 들어 문헌 [Pasceri et al., Ann NY Acad. Sci. 1998; 850:377-381; Pasceri et al., Blood. 92:653-663, 1998; 및 Milot et al., Cell. 87:105-114, 1996]에 기재되어 있다. 특정한 실시양태에서, HS2 영역은 유전자좌 제어 영역의 위치 16,671에서 17,058까지 연장된다. HS2의 SnaBI 및 BstXI 제한 부위는 각각 위치 17,093 및 16,240에 위치한다. HS3 영역은 유전자좌 제어 영역의 위치 12,459에서 13,097까지 연장된다. HS3의 BamHI 및 HindIII 제한 부위는 각각 위치 12,065 및 13,360에 위치한다. HS4 영역은 유전자좌 제어 영역의 위치 9,048에서 9,713까지 연장된다. HS4의 BamHI 및 BanII 제한 부위는 각각 위치 8,496 및 9,576에 위치한다.
본원에 개시된 특정한 실시양태는 β-글로빈 LCR의 미니-부분을 이용한다. LCR이 β-글로빈 LCR의 모든 5개의 절편을 포함하지 않는 한, 미니-부분은 모든 5개 미만의 HS 영역, 예컨대 HS1, HS2, HS3, HS4, 및/또는 HS5를 포함한다. 본 개시내용의 실시예 1에서 사용된 4.3 kb HS1-HS4 LCR은 미니-LCR의 한 예를 제공한다. 다른 미니-LCR은, 예를 들어 HS1, HS2, 및 HS3; HS2, HS3, 및 HS4; HS3, HS4, 및 HS5; HS1, HS3, 및 HS5; HS1, HS2, 및 HS5; 및 HS1, HS4, 및 HS5를 포함할 수 있다. 미니-LCR의 추가의 예에 대해, 문헌 [Sadelain et al., Proc. Nat. Acad. Sci. (USA) 92: 6728-6732, 1995; 및 Lebouich et al., EMBO J. 13: 3065-3076, 1994]을 참조한다. 특정한 실시양태는 β-글로빈 프로모터와 조합된 미니-β-글로빈 LCR을 이용할 수 있다. 특정한 실시양태에서, 이러한 조합은 5.9 kb LCR-프로모터 조합을 생성한다. LCR과 관련하여, "미니" 및 "마이크로"는 본원에서 상호교환가능하게 사용된다.
본원에 개시된 특정한 실시양태는 유전자좌 제어 영역 (LCR)의 긴 부분을 이용한다. 긴 β-글로빈 LCR은 HS1, HS2, HS3, HS4, 및 HS5를 포함할 수 있다. 특정한 실시양태에서, 긴 LCR은 β-글로빈 LCR의 HS1, HS2, HS3, HS4, 및 HS5를 포함하는 대략 21.5 kb 서열을 포함한다. 긴 β-글로빈 LCR은 β-글로빈 프로모터와 커플링되어 높은 단백질 발현 수준을 구동할 수 있다.
특정한 실시양태는 GRCH38/hg38에 열거된 바와 같은 인간 염색체 11의 긴 β-글로빈 LCR 위치 5292319-5270789 (21,531 bp) (서열식별번호: 6)를 포함할 수 있다. 다양한 실시양태에서, 긴 LCR은 18 kb, 18.5 kb, 19 kb, 19.5 kb, 20 kb, 20.5 kb, 21 kb, 21.5 kb, 또는 21.531 kb 이상의 총 길이를 가질 수 있다. 다양한 실시양태에서, 긴 LCR은 서열식별번호: 6의 길이의 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 이상의 총 길이를 가질 수 있다. 다양한 실시양태에서, 긴 LCR은 서열식별번호: 6의 적어도 18 kb, 18.5 kb, 19 kb, 19.5 kb, 20 kb, 20.5 kb, 21 kb, 또는 21.5 kb를 포함할 수 있다. 본원에 제공된 다양한 실시양태 중 임의의 것에서, 긴 LCR은 서열식별번호: 6의 상응하는 인접 부분과 적어도 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 동일성을 갖는 핵산일 수 있거나 또는 그를 포함할 수 있다. 다양한 실시양태에서, 긴 LCR은 1개 이상의 제한 부위, 예컨대 XhoI 제한 부위를 포함한다는 점에서 천연 게놈 서열과 상이할 수 있다 (예를 들어 서열식별번호: 98 참조, 여기서 예시적인 XhoI 부위 (이탤릭체)가 위치 10655-10661에 제공됨). 본원에 제공된 다양한 실시양태 중 임의의 것에서, 긴 LCR은 HS1, HS2, HS3, HS4, 및 HS5를 포함할 수 있다.
다양한 실시양태에서, Ad35 벡터 시스템은 예를 들어 β-글로빈 프로모터로서 GRCh38에 열거된 바와 같은 인간 염색체 11의 위치 5228631-5227018 (1614 bp)을 포함하는 전위가능한 트랜스진 삽입물 (서열식별번호: 7)을 포함할 수 있다. 다양한 실시양태에서, β-글로빈 프로모터는 예를 들어 1.0 kb, 1.1. kb, 1.2 kb, 1.3 kb, 1.4 kb, 1.5 kb, 1.6 kb, 또는 1.609 kb 이상의 총 길이를 가질 수 있다. 다양한 실시양태에서, β-글로빈 프로모터는 서열식별번호: 7의 적어도 1.0 kb, 1.1 kb, 1.2 kb, 1.3 kb, 1.4 kb, 1.5 kb, 1.6 kb, 또는 1.609 kb를 포함할 수 있다. 다양한 실시양태에서, β-글로빈 프로모터는 엡실론 (HBE1), G-감마 (HBG2), A-감마 (HBG1), 델타 (HBD), 및 베타 (HBB) 글로빈 유전자 및/또는 헤모글로빈 β 유전자좌 (11:5,225,463-5,227,070, 상보체)에 존재하는 하나 이상의 유전자 중 임의의 것을 포함하나 이에 제한되지는 않는, 그의 발현이 β-글로빈 LCR에 의해 조절되는 유전자의 상류, 예를 들어 그의 제1 코딩 뉴클레오티드의 바로 상류에, 예를 들어 100 bp, 200 bp, 300 bp, 400 bp, 500 bp, 1 kb, 1.5 kb, 2 kb, 2.5 kb, 3 kb, 4 kb, 또는 5 kb 이상의 총 길이의 핵산 서열을 포함할 수 있다. 다양한 실시양태에서, β-글로빈 프로모터는 염색체 11 NC_000011.10 위치 5227021의 상류, 예를 들어 바로 상류에, 예를 들어 100 bp, 200 bp, 300 bp, 400 bp, 500 bp, 1 kb, 1.5 kb, 2 kb, 2.5 kb, 3 kb, 4 kb, 또는 5 kb 이상의 총 길이의 핵산 서열을 포함할 수 있다. 다양한 실시양태에서, β-글로빈 프로모터는 서열식별번호: 7의 길이의 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 이상의 총 길이를 가질 수 있다. 본원에 제공된 다양한 실시양태 중 임의의 것에서, β-글로빈 프로모터는 참조 게놈에 존재하는 β-글로빈 프로모터 서열의 상응하는 인접 부분과 적어도 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 동일성을 갖는 서열을 갖는 핵산일 수 있거나 또는 그를 포함할 수 있으며, 임의로 여기서 β-글로빈 프로모터는 서열식별번호: 7의 서열을 포함한다.
다양한 실시양태에서, β-글로빈 LCR, 예컨대 긴 β-글로빈 LCR은 적혈구에서 작동가능하게 연결된 코딩 서열의 발현을 유발한다. 다양한 실시양태에서, 작동가능하게 연결된 코딩 서열은 본원에 제시되거나 또는 관련 기술분야에 달리 공지된 바와 같이 β-글로빈 프로모터와 또한 작동가능하게 연결된다.
이뮤노글로불린 중쇄 유전자좌 B 세포 LCR은 작동가능하게 연결된 코딩 서열의 발현을 증진시키는 (예를 들어, 전사를 증가시키고/거나, 번역을 증가시키고/거나, 세포 또는 조직 특이성을 증가시키는) 예시적인 LCR이다. 코딩 서열의 발현은 완전한 이뮤노글로불린 중쇄 유전자좌 B 세포 LCR 서열을 포함하고/거나 그의 발현-조절 단편을 포함하는 이뮤노글로불린 중쇄 유전자좌 B 세포 LCR과 작동가능하게 연결된 경우에 증진될 수 있다. 이뮤노글로불린 중쇄 유전자좌 B 세포 LCR은 이뮤노글로불린 중쇄 유전자좌 B 세포 LCR의 발현-증진 효과의 적어도 일부를 매개하는 것으로 관련 기술분야의 통상의 기술자에 의해 이해되는 DNAse 과민성 부위 (HS)를 포함한다. 이뮤노글로불린 중쇄 유전자좌 B 세포 LCR은 인핸서-유전자좌 제어 영역 (LCR)으로서 기능하는 이뮤노글로불린 중쇄 (IgH) 유전자좌의 3'Cα 영역에 4개의 DNase I-과민성 부위 (HS1, HS2, HS3, 및 HS4)를 포함한다. 따라서, 이뮤노글로불린 중쇄 유전자좌 B 세포 LCR은 모든 HS1-HS4를 포함하는 완전한 이뮤노글로불린 중쇄 유전자좌 B 세포 LCR일 수 있거나, 또는 과민성 부위 HS1-HS4의 하위세트를 포함하는 그의 발현-조절 단편일 수 있다. 이들 HS 부위는 약 10-30 kb의 IgH C 유전자에 맵핑되고, 일시적 형질감염 검정에서 림프성 세포-특이적 및 발생적으로 조절되는 인핸서 요소를 유발할 수 있다. 이러한 핵산 서열은 버킷 림프종 및 형질세포종 세포주에서 c-myc 유전자에 연결된 경우에 유사한 발현 패턴을 지시할 수 있는 것으로 관찰되었다. 버킷 림프종 및 형질세포종에서, B-세포 LCR에 의한 c-myc의 제어는 c-myc 유전자가 IgH 서열과 병치되게 하여 비정상적인 c-myc 전사를 야기하는 특징적인 염색체 전위로 인해 발생한다. B 세포 LCR에 관한 추가의 설명은 예를 들어 문헌 [Madisen et al., Mol Cell Biol. 18(11):6281-92, 1998; Giannini et al., J. Immunol. 150:1772-1780, 1993; Madisen & Groudine, Genes Dev. 8:2212-2226, 1994; 및 Michaelson et al., Nucleic Acids Res. 23:975-981, 1995]에서 찾아볼 수 있다.
특정한 실시양태는 이뮤노글로불린 중쇄 유전자좌 B 세포 LCR 위치 염색체 14 - NC_000014.9 (105586437-106879844, 상보체) (1,293,408 bp) 또는 그의 발현-조절 단편을 포함할 수 있다. 다양한 실시양태에서, 이뮤노글로불린 중쇄 유전자좌 B 세포 LCR은 이뮤노글로불린 중쇄 유전자좌 B 세포 LCR 위치 105586437-106879844의 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 이상의 총 길이를 가질 수 있다. 다양한 실시양태에서, 이뮤노글로불린 중쇄 유전자좌 B 세포 LCR은 이뮤노글로불린 중쇄 유전자좌 B 세포 LCR 위치 105586437-106879844의 적어도 10 kb, 15 kb, 16 kb, 17 kb, 18 kb, 19 kb, 20 kb, 21 kb, 22 kb, 23 kb, 24 kb, 25 kb, 26 kb, 27 kb, 28 kb, 29 kb, 또는 30 kb를 포함할 수 있다. 본원에 제공된 다양한 실시양태 중 임의의 것에서, 긴 LCR은 이뮤노글로불린 중쇄 유전자좌 B 세포 LCR 위치 105586437-106879844의 상응하는 인접 부분과 적어도 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 동일성을 갖는 핵산일 수 있거나 또는 그를 포함할 수 있다.
다양한 실시양태에서, Ad35 벡터는 본원에 제공된 바와 같은 이뮤노글로불린 중쇄 유전자좌 B 세포 LCR을, 예를 들어 이뮤노글로불린 중쇄 유전자좌 B 세포 LCR 및 임의로 인간 게놈에서 이뮤노글로불린 중쇄 유전자좌 B 세포 LCR과 전형적으로 작동가능하게 연결된 유전자의 프로모터를 포함하는 페이로드에 포함할 수 있다. 다양한 실시양태에서, 이뮤노글로불린 중쇄 유전자좌 B 세포 LCR과 작동가능하게 연결된 유전자는 이뮤노글로불린 중쇄 유전자이다. 다양한 실시양태에서, 이뮤노글로불린 중쇄 유전자 프로모터는 100 bp, 200 bp, 300 bp, 400 bp, 500 bp, 1.0 kb, 1.5 kb, 2.0 kb, 2.5 kb, 3.0 kb, 4.0 kb, 또는 5.0 kb 이상의 총 길이를 가질 수 있다. 다양한 실시양태에서, 이뮤노글로불린 중쇄 유전자 프로모터는, 예를 들어 참조 게놈에서 이뮤노글로불린 중쇄 유전자의 상류, 예를 들어 그의 제1 코딩 뉴클레오티드의 바로 상류인 상응하는 핵산 서열과 적어도 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 동일성을 갖는 적어도 100 bp, 200 bp, 300 bp, 400 bp, 500 bp, 1.0 kb, 1.5 kb, 2.0 kb, 2.5 kb, 3.0 kb, 4.0 kb, 또는 5.0 kb를 포함한다. 일부 실시양태에서, 인간 게놈에서 이뮤노글로불린 중쇄 유전자좌 B 세포 LCR과 전형적으로 작동가능하게 연결된 유전자의 코딩 서열의 제1 코딩 뉴클레오티드는 이뮤노글로불린 중쇄 유전자의 제1 코딩 뉴클레오티드이다.
다양한 실시양태에서, 이뮤노글로불린 중쇄 유전자좌 B 세포 LCR, 예컨대 긴 이뮤노글로불린 중쇄 유전자좌 B 세포 LCR은 B 세포에서 작동가능하게 연결된 코딩 서열의 발현을 유발한다. 다양한 실시양태에서, 작동가능하게 연결된 코딩 서열은 본원에 제시되거나 또는 관련 기술분야에 달리 공지된 바와 같이 이뮤노글로불린 중쇄 유전자 프로모터와 또한 작동가능하게 연결된다.
또 다른 예시적인 LCR은 작동가능하게 연결된 코딩 서열의 발현을 증진시키는 T 세포 수용체 알파/델타 유전자좌의 T 세포 LCR이다. T 세포 수용체 (TCR) 알파/델타 유전자좌에서, LCR은 차등 조직 및 발생 발현 및 TCR 알파 및 델타 유전자의 재배열을 조절할 수 있다. 코딩 서열의 발현은 T 세포 수용체 알파/델타 유전자좌 LCR 서열의 완전한 T 세포 LCR을 포함하고/거나 그의 발현-조절 단편을 포함하는 T 세포 수용체 알파/델타 유전자좌 LCR의 T 세포 LCR과 작동가능하게 연결된 경우에 증진될 수 있다. T 세포 수용체 알파/델타 유전자좌 LCR의 T 세포 LCR은 T 세포 수용체 알파/델타 유전자좌 LCR의 T 세포 LCR의 발현-증진 효과의 적어도 일부를 매개하는 것으로 관련 기술분야의 통상의 기술자에 의해 이해되는 DNAse 과민성 부위 (HS)를 포함한다. T 세포 LCR은 8개의 T 세포-특이적 뉴클레아제 과민성 도메인 (HS-1 내지 HS-8)을 포함하는 TCR 알파/델타 유전자좌의 3' 영역으로서 확인되었다. 따라서, T 세포 수용체 알파/델타 유전자좌 LCR의 T 세포 LCR은 모든 HS1-HS8를 포함하는 T 세포 수용체 알파/델타 유전자좌 LCR의 완전한 T 세포 LCR일 수 있거나, 또는 과민성 부위 HS1-HS8의 하위세트를 포함하는 그의 발현-조절 단편일 수 있다. 트랜스제닉 마우스에서, 이러한 영역에 연결된 TCR 알파 유전자가 통합 부위에 비의존적으로 높은 수준으로 발현되고 이는 유전자 카피수와 상관된다는 것이 관찰되었다. 이러한 트랜스진은 알파 베타에서는 발현되었지만 감마 델타 T 세포 하위세트에서는 발현되지 않았고, 발생 동안 적절한 시기에 활성화되었다. LCR 기능은 적어도 HS-2 내지 HS-6을 필요로 한다. B 세포 LCR에 관한 추가의 설명은 예를 들어 문헌 [Diaz et al., Immunity 1(3):207-17, 1994]에서 찾아볼 수 있다.
다양한 실시양태에서, Ad35 벡터는 본원에 제공된 바와 같은 T 세포 수용체 알파/델타 유전자좌 LCR의 T 세포 LCR을, 예를 들어 T 세포 수용체 알파/델타 유전자좌 LCR의 T 세포 LCR 및 임의로 인간 게놈에서 T 세포 수용체 알파/델타 유전자좌 LCR의 T 세포 LCR과 전형적으로 작동가능하게 연결된 유전자의 프로모터를 포함하는 페이로드에 포함할 수 있다. 다양한 실시양태에서, T 세포 수용체 알파/델타 유전자좌 LCR의 T 세포 LCR과 작동가능하게 연결된 유전자는 염색체 14, NC_000014.9 (21621904..22552132) 상의 TCR 알파 또는 염색체 14, NC_000014.9 (22422546..22466577) 상의 TCR 델타 유전자좌이다. 다양한 실시양태에서, TCR 알파 또는 TCR 델타 프로모터는 100 bp, 200 bp, 300 bp, 400 bp, 500 bp, 1.0 kb, 1.5 kb, 2.0 kb, 2.5 kb, 3.0 kb, 4.0 kb, 또는 5.0 kb 이상의 총 길이를 가질 수 있다. 다양한 실시양태에서, TCR 알파 또는 TCR 델타 프로모터는, 예를 들어 참조 게놈에서 TCR 알파 또는 TCR 델타의 상류, 예를 들어 그의 제1 코딩 뉴클레오티드의 바로 상류인 상응하는 핵산 서열과 적어도 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 동일성을 갖는 적어도 100 bp, 200 bp, 300 bp, 400 bp, 500 bp, 1.0 kb, 1.5 kb, 2.0 kb, 2.5 kb, 3.0 kb, 4.0 kb, 또는 5.0 kb를 포함한다. 일부 실시양태에서, 인간 게놈에서 T 세포 수용체 알파/델타 유전자좌 LCR의 T 세포 LCR과 전형적으로 작동가능하게 연결된 유전자의 코딩 서열의 제1 코딩 뉴클레오티드는 TCR 알파 또는 TCR 델타의 제1 코딩 뉴클레오티드이다.
다양한 실시양태에서, T 세포 수용체 알파/델타 유전자좌 LCR의 T 세포 LCR, 예컨대 T 세포 수용체 알파/델타 유전자좌 LCR의 긴 T 세포 LCR은 T 세포에서 작동가능하게 연결된 코딩 서열의 발현을 유발한다. 다양한 실시양태에서, 작동가능하게 연결된 코딩 서열은 본원에 제시되거나 또는 관련 기술분야에 달리 공지된 바와 같이 TCR 알파 또는 TCR 델타 프로모터와 또한 작동가능하게 연결된다.
아데노신 데아미나제 LCR은 작동가능하게 연결된 코딩 서열의 발현을 증진시키는 예시적인 LCR이다. 코딩 서열의 발현은 완전한 아데노신 데아미나제 LCR 서열을 포함하고/거나 그의 발현-조절 단편을 포함하는 아데노신 데아미나제 LCR과 작동가능하게 연결된 경우에 증진될 수 있다. 아데노신 데아미나제 LCR은 아데노신 데아미나제 LCR의 발현-증진 효과의 적어도 일부를 매개하는 것으로 관련 기술분야의 통상의 기술자에 의해 이해되는 DNAse 과민성 부위 (HS)를 포함한다. 아데노신 데아미나제 LCR은 과민성 부위 1-6을 포함한다. 따라서, 아데노신 데아미나제 LCR은 모든 HS1-HS6을 포함하는 완전한 아데노신 데아미나제 LCR일 수 있거나, 또는 과민성 부위 HS1-HS6의 하위세트를 포함하는 그의 발현-조절 단편일 수 있다.
특정한 실시양태는 인간 염색체 20의 아데노신 데아미나제 LCR 위치 NC_000020.11 44629004-44651567 (22,564 bp) 또는 그의 발현-조절 단편을 포함할 수 있다. 다양한 실시양태에서, 아데노신 데아미나제 LCR은 아데노신 데아미나제 LCR 위치 44629004-44651567의 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 이상의 총 길이를 가질 수 있다. 다양한 실시양태에서, 아데노신 데아미나제 LCR은 아데노신 데아미나제 LCR 위치 44629004-44651567의 적어도 10 kb, 15 kb, 16 kb, 17 kb, 18 kb, 19 kb, 20 kb, 21 kb, 또는 22 kb를 포함할 수 있다. 본원에 제공된 다양한 실시양태 중 임의의 것에서, 긴 LCR은 아데노신 데아미나제 LCR 위치 44629004-44651567의 상응하는 인접 부분과 적어도 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 동일성을 갖는 핵산일 수 있거나 또는 그를 포함할 수 있다.
다양한 실시양태에서, Ad35 벡터는 본원에 제공된 바와 같은 아데노신 데아미나제 LCR을, 예를 들어 아데노신 데아미나제 LCR 및 임의로 인간 게놈에서 아데노신 데아미나제 LCR과 전형적으로 작동가능하게 연결된 유전자의 프로모터를 포함하는 페이로드에 포함할 수 있다. 다양한 실시양태에서, 아데노신 데아미나제 LCR과 작동가능하게 연결된 유전자는 아데노신 데아미나제 (20:44,619,518-44,651,757, 상보체)이다. 다양한 실시양태에서, 아데노신 데아미나제 프로모터는 100 bp, 200 bp, 300 bp, 400 bp, 500 bp, 1.0 kb, 1.5 kb, 2.0 kb, 2.5 kb, 3.0 kb, 4.0 kb, 또는 5.0 kb 이상의 총 길이를 가질 수 있다. 다양한 실시양태에서, 아데노신 데아미나제 프로모터는, 예를 들어 참조 게놈에서 아데노신 데아미나제의 상류, 예를 들어 그의 제1 코딩 뉴클레오티드의 바로 상류인 상응하는 핵산 서열과 적어도 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 동일성을 갖는 적어도 100 bp, 200 bp, 300 bp, 400 bp, 500 bp, 1.0 kb, 1.5 kb, 2.0 kb, 2.5 kb, 3.0 kb, 4.0 kb, 또는 5.0 kb를 포함한다. 일부 실시양태에서, 인간 게놈에서 아데노신 데아미나제 LCR과 전형적으로 작동가능하게 연결된 유전자의 코딩 서열의 제1 코딩 뉴클레오티드는 염색체 20 - NC_000020.11 44651607에서의 아데노신 데아미나제의 제1 코딩 뉴클레오티드이다.
다양한 실시양태에서, 아데노신 데아미나제 LCR, 예컨대 긴 아데노신 데아미나제 LCR은 혈액, 장, 및 림프성 조직 중 1종 이상에서 작동가능하게 연결된 코딩 서열의 발현을 유발한다. 다양한 실시양태에서, 작동가능하게 연결된 코딩 서열은 본원에 제시되거나 또는 관련 기술분야에 달리 공지된 바와 같이 아데노신 데아미나제 프로모터와 또한 작동가능하게 연결된다.
아포지단백질 E/C LCR은 작동가능하게 연결된 코딩 서열의 발현을 증진시키는 예시적인 LCR이다. 코딩 서열의 발현은 완전한 아포지단백질 E/C LCR 서열을 포함하고/거나 그의 발현-조절 단편을 포함하는 아포지단백질 E/C LCR과 작동가능하게 연결된 경우에 증진될 수 있다. 아포지단백질 E/C LCR은 아포지단백질 E/C LCR의 발현-증진 효과의 적어도 일부를 매개하는 것으로 관련 기술분야의 통상의 기술자에 의해 이해되는 DNAse 과민성 부위 (HS)를 포함한다. 아포지단백질 E/C LCR은 과민성 부위 1-6을 포함한다. 따라서, 아포지단백질 E/C LCR은 모든 HS1-HS6을 포함하는 완전한 아포지단백질 E/C LCR일 수 있거나, 또는 과민성 부위 HS1-HS6의 하위세트를 포함하는 그의 발현-조절 단편일 수 있다.
다양한 실시양태에서, Ad35 벡터는 본원에 제공된 바와 같은 아포지단백질 E/C LCR을, 예를 들어 아포지단백질 E/C LCR 및 임의로 인간 게놈에서 아포지단백질 E/C LCR과 전형적으로 작동가능하게 연결된 유전자의 프로모터를 포함하는 페이로드에 포함할 수 있다. 다양한 실시양태에서, 아포지단백질 E/C LCR과 작동가능하게 연결된 유전자는 아포지단백질 E (19:44,905,795-44,909,394)이다. 다양한 실시양태에서, 아포지단백질 E 프로모터는 100 bp, 200 bp, 300 bp, 400 bp, 500 bp, 1.0 kb, 1.5 kb, 2.0 kb, 2.5 kb, 3.0 kb, 4.0 kb, 또는 5.0 kb 이상의 총 길이를 가질 수 있다. 다양한 실시양태에서, 아포지단백질 E 프로모터는, 예를 들어 참조 게놈에서 아포지단백질 E의 상류, 예를 들어 그의 제1 코딩 뉴클레오티드의 바로 상류인 상응하는 핵산 서열과 적어도 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 동일성을 갖는 적어도 100 bp, 200 bp, 300 bp, 400 bp, 500 bp, 1.0 kb, 1.5 kb, 2.0 kb, 2.5 kb, 3.0 kb, 4.0 kb, 또는 5.0 kb를 포함한다. 일부 실시양태에서, 인간 게놈에서 아포지단백질 E/C LCR과 전형적으로 작동가능하게 연결된 유전자의 코딩 서열의 제1 코딩 뉴클레오티드는 염색체 19 - NC_000019.10 (44906625)에서의 아포지단백질 E의 제1 코딩 뉴클레오티드이다.
다양한 실시양태에서, 아포지단백질 E/C LCR, 예컨대 긴 아포지단백질 E/C LCR은 적혈구에서 작동가능하게 연결된 코딩 서열의 발현을 유발한다. 다양한 실시양태에서, 작동가능하게 연결된 코딩 서열은 본원에 제시되거나 또는 관련 기술분야에 달리 공지된 바와 같이 아포지단백질 E/C 프로모터와 또한 작동가능하게 연결된다.
Th2 시토카인 LCR은 작동가능하게 연결된 코딩 서열의 발현을 증진시키는 예시적인 LCR이다. 코딩 서열의 발현은 완전한 Th2 시토카인 LCR 서열을 포함하고/거나 그의 발현-조절 단편을 포함하는 Th2 시토카인 LCR과 작동가능하게 연결된 경우에 증진될 수 있다. Th2 시토카인 LCR은 Th2 시토카인 LCR의 발현-증진 효과의 적어도 일부를 매개하는 것으로 관련 기술분야의 통상의 기술자에 의해 이해되는 DNAse 과민성 부위 (HS)를 포함한다. Th2 시토카인 LCR은 과민성 부위 RHS5-RHS7을 포함한다. 따라서, Th2 시토카인 LCR은 모든 RHS5-RHS7을 포함하는 완전한 Th2 시토카인 LCR일 수 있거나, 또는 과민성 부위 RHS5-RHS7의 하위세트를 포함하는 그의 발현-조절 단편일 수 있다.
특정한 실시양태는 인간 염색체 5의 Th2 시토카인 LCR 위치 NC_000005.10 (132629263-132642195) (12,933 bp) 또는 그의 발현-조절 단편을 포함할 수 있다. 다양한 실시양태에서, Th2 시토카인 LCR은 Th2 시토카인 LCR 위치 132629263-132642195의 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 이상의 총 길이를 가질 수 있다. 다양한 실시양태에서, Th2 시토카인 LCR은 Th2 시토카인 LCR 위치 132629263-132642195의 적어도 1 kb, 2 kb, 3 kb, 4 kb, 5 kb, 6 kb, 7 kb, 8 kb, 9 kb, 10 kb, 11 kb, 또는 12 kb를 포함할 수 있다. 본원에 제공된 다양한 실시양태 중 임의의 것에서, 긴 LCR은 Th2 시토카인 LCR 위치 132629263-132642195의 상응하는 인접 부분과 적어도 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 동일성을 갖는 핵산일 수 있거나 또는 그를 포함할 수 있다.
다양한 실시양태에서, Ad35 벡터는 본원에 제공된 바와 같은 Th2 시토카인 LCR을, 예를 들어 Th2 시토카인 LCR 및 임의로 인간 게놈에서 Th2 시토카인 LCR과 전형적으로 작동가능하게 연결된 유전자의 프로모터를 포함하는 페이로드에 포함할 수 있다. 다양한 실시양태에서, Th2 시토카인 LCR과 작동가능하게 연결된 유전자는 Th2 시토카인, 예를 들어 IL-4, IL-13, 또는 IL-5이다. 다양한 실시양태에서, Th2 시토카인 프로모터는 100 bp, 200 bp, 300 bp, 400 bp, 500 bp, 1.0 kb, 1.5 kb, 2.0 kb, 2.5 kb, 3.0 kb, 4.0 kb, 또는 5.0 kb 이상의 총 길이를 가질 수 있다. 다양한 실시양태에서, Th2 시토카인 프로모터는, 예를 들어 참조 게놈에서 Th2 시토카인의 상류, 예를 들어 그의 제1 코딩 뉴클레오티드의 바로 상류인 상응하는 핵산 서열과 적어도 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 동일성을 갖는 적어도 100 bp, 200 bp, 300 bp, 400 bp, 500 bp, 1.0 kb, 1.5 kb, 2.0 kb, 2.5 kb, 3.0 kb, 4.0 kb, 또는 5.0 kb를 포함한다.
다양한 실시양태에서, Th2 시토카인 LCR, 예컨대 긴 Th2 시토카인 LCR은 T 세포에서 작동가능하게 연결된 코딩 서열의 발현을 유발한다. 다양한 실시양태에서, 작동가능하게 연결된 코딩 서열은 본원에 제시되거나 또는 관련 기술분야에 달리 공지된 바와 같이 Th2 시토카인 프로모터와 또한 작동가능하게 연결된다.
CD2 LCR은 작동가능하게 연결된 코딩 서열의 발현을 증진시키는 예시적인 LCR이다. 코딩 서열의 발현은 완전한 CD2 LCR 서열을 포함하고/거나 그의 발현-조절 단편을 포함하는 CD2 LCR과 작동가능하게 연결된 경우에 증진될 수 있다. CD2 LCR은 CD2 LCR의 발현-증진 효과의 적어도 일부를 매개하는 것으로 관련 기술분야의 통상의 기술자에 의해 이해되는 DNAse 과민성 부위 (HS)를 포함한다. CD2 LCR은 과민성 부위 1-3을 포함한다. 따라서, CD2 LCR은 모든 HS1-HS3을 포함하는 완전한 CD2 LCR일 수 있거나, 또는 과민성 부위 HS1-HS3의 하위세트를 포함하는 그의 발현-조절 단편일 수 있다.
특정한 실시양태는 인간 염색체 1의 CD2 LCR 위치 NC_000001.11 116769217-116774826 (5,610 bp) 또는 그의 발현-조절 단편을 포함할 수 있다. 다양한 실시양태에서, CD2 LCR은 CD2 LCR 위치 116769217-116774826의 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 이상의 총 길이를 가질 수 있다. 다양한 실시양태에서, CD2 LCR은 CD2 LCR 위치 116769217-116774826의 적어도 1 kb, 2 kb, 3 kb, 4 kb, 또는 5 kb를 포함할 수 있다. 본원에 제공된 다양한 실시양태 중 임의의 것에서, 긴 LCR은 CD2 LCR 위치 116769217-116774826의 상응하는 인접 부분과 적어도 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 동일성을 갖는 핵산일 수 있거나 또는 그를 포함할 수 있다.
다양한 실시양태에서, Ad35 벡터는 본원에 제공된 바와 같은 CD2 LCR을, 예를 들어 CD2 LCR 및 임의로 인간 게놈에서 CD2 LCR과 전형적으로 작동가능하게 연결된 유전자의 프로모터를 포함하는 페이로드에 포함할 수 있다. 다양한 실시양태에서, CD2 LCR과 작동가능하게 연결된 유전자는 CD2 (1:116,754,429-116,769,228)이다. 다양한 실시양태에서, CD2 프로모터는 100 bp, 200 bp, 300 bp, 400 bp, 500 bp, 1.0 kb, 1.5 kb, 2.0 kb, 2.5 kb, 3.0 kb, 4.0 kb, 또는 5.0 kb 이상의 총 길이를 가질 수 있다. 다양한 실시양태에서, CD2 프로모터는, 예를 들어 참조 게놈에서 CD2의 상류, 예를 들어 그의 제1 코딩 뉴클레오티드의 바로 상류인 상응하는 핵산 서열과 적어도 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 동일성을 갖는 적어도 100 bp, 200 bp, 300 bp, 400 bp, 500 bp, 1.0 kb, 1.5 kb, 2.0 kb, 2.5 kb, 3.0 kb, 4.0 kb, 또는 5.0 kb를 포함한다. 일부 실시양태에서, 인간 게놈에서 CD2 LCR과 전형적으로 작동가능하게 연결된 유전자의 코딩 서열의 제1 코딩 뉴클레오티드는 염색체 1 - NC_000001.11 (116754493)에서의 CD2의 제1 코딩 뉴클레오티드이다.
다양한 실시양태에서, CD2 LCR, 예컨대 긴 CD2 LCR은 T 세포에서 작동가능하게 연결된 코딩 서열의 발현을 유발한다. 다양한 실시양태에서, 작동가능하게 연결된 코딩 서열은 본원에 제시되거나 또는 관련 기술분야에 달리 공지된 바와 같이 CD2 프로모터와 또한 작동가능하게 연결된다.
S100β LCR은 작동가능하게 연결된 코딩 서열의 발현을 증진시키는 예시적인 LCR이다. 코딩 서열의 발현은 완전한 S100β LCR 서열을 포함하고/거나 그의 발현-조절 단편을 포함하는 S100β LCR과 작동가능하게 연결된 경우에 증진될 수 있다. S100β LCR은 S100β LCR의 발현-증진 효과의 적어도 일부를 매개하는 것으로 관련 기술분야의 통상의 기술자에 의해 이해되는 DNAse 과민성 부위 (HS)를 포함한다.
다양한 실시양태에서, Ad35 벡터는 본원에 제공된 바와 같은 S100β LCR을, 예를 들어 S100β LCR 및 임의로 인간 게놈에서 S100β LCR과 전형적으로 작동가능하게 연결된 유전자의 프로모터를 포함하는 페이로드에 포함할 수 있다. 다양한 실시양태에서, S100β LCR과 작동가능하게 연결된 유전자는 S100β (21:46,598,603-46,605,242, 상보체)이다. 다양한 실시양태에서, S100β 프로모터는 100 bp, 200 bp, 300 bp, 400 bp, 500 bp, 1.0 kb, 1.5 kb, 2.0 kb, 2.5 kb, 3.0 kb, 4.0 kb, 또는 5.0 kb 이상의 총 길이를 가질 수 있다. 다양한 실시양태에서, S100β 프로모터는, 예를 들어 참조 게놈에서 S100β의 상류, 예를 들어 그의 제1 코딩 뉴클레오티드의 바로 상류인 상응하는 핵산 서열과 적어도 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 동일성을 갖는 적어도 100 bp, 200 bp, 300 bp, 400 bp, 500 bp, 1.0 kb, 1.5 kb, 2.0 kb, 2.5 kb, 3.0 kb, 4.0 kb, 또는 5.0 kb를 포함한다. 일부 실시양태에서, 인간 게놈에서 S100β LCR과 전형적으로 작동가능하게 연결된 유전자의 코딩 서열의 제1 코딩 뉴클레오티드는 S100β (염색체 21 - NC_000021.9 (46602415))의 제1 코딩 뉴클레오티드이다.
다양한 실시양태에서, S100β LCR, 예컨대 긴 S100β LCR은 뇌 성상세포에서 작동가능하게 연결된 코딩 서열의 발현을 유발한다. 다양한 실시양태에서, 작동가능하게 연결된 코딩 서열은 본원에 제시되거나 또는 관련 기술분야에 달리 공지된 바와 같이 S100β 프로모터와 또한 작동가능하게 연결된다.
성장 호르몬 LCR은 작동가능하게 연결된 코딩 서열의 발현을 증진시키는 예시적인 LCR이다. 코딩 서열의 발현은 완전한 성장 호르몬 LCR 서열을 포함하고/거나 그의 발현-조절 단편을 포함하는 성장 호르몬 LCR과 작동가능하게 연결된 경우에 증진될 수 있다. 성장 호르몬 LCR은 성장 호르몬 LCR의 발현-증진 효과의 적어도 일부를 매개하는 것으로 관련 기술분야의 통상의 기술자에 의해 이해되는 DNAse 과민성 부위 (HS)를 포함한다. 성장 호르몬 LCR은 과민성 부위 1-5를 포함한다. 따라서, 성장 호르몬 LCR은 모든 HS1-HS5를 포함하는 완전한 성장 호르몬 LCR일 수 있거나, 또는 과민성 부위 HS1-HS5의 하위세트를 포함하는 그의 발현-조절 단편일 수 있다.
특정한 실시양태는 인간 염색체 17의 성장 호르몬 LCR 위치 NC_000017.11 (63917193-63958852) (41,660 bp) 또는 그의 발현-조절 단편을 포함할 수 있다. 다양한 실시양태에서, 성장 호르몬 LCR은 성장 호르몬 LCR 위치 63917193-63958852의 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 이상의 총 길이를 가질 수 있다. 다양한 실시양태에서, 성장 호르몬 LCR은 성장 호르몬 LCR 위치 63917193-63958852의 적어도 10 kb, 15 kb, 16 kb, 17 kb, 18 kb, 19 kb, 20 kb, 21 kb, 22 kb, 23 kb, 24 kb, 25 kb, 26 kb, 27 kb, 28 kb, 29 kb, 또는 30 kb를 포함할 수 있다. 본원에 제공된 다양한 실시양태 중 임의의 것에서, 긴 LCR은 성장 호르몬 LCR 위치 63917193-63958852의 상응하는 인접 부분과 적어도 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 동일성을 갖는 핵산일 수 있거나 또는 그를 포함할 수 있다.
다양한 실시양태에서, Ad35 벡터는 본원에 제공된 바와 같은 성장 호르몬 LCR을, 예를 들어 성장 호르몬 LCR 및 임의로 인간 게놈에서 성장 호르몬 LCR과 전형적으로 작동가능하게 연결된 유전자의 프로모터를 포함하는 페이로드에 포함할 수 있다. 다양한 실시양태에서, 성장 호르몬 LCR과 작동가능하게 연결된 유전자는 GH1 (성장 호르몬 1), CSHL1 (융모성 소마토맘모트로핀 호르몬-유사 1), CSH1 (융모성 소마토맘모트로핀 호르몬 1 (태반 락토겐)), GH2 (성장 호르몬 2), 또는 CSH2 (융모성 소마토마모트로핀 호르몬 2)이다. 다양한 실시양태에서, GH1, CSHL1, CSH1, GH2, 또는 CSH2 프로모터는 100 bp, 200 bp, 300 bp, 400 bp, 500 bp, 1.0 kb, 1.5 kb, 2.0 kb, 2.5 kb, 3.0 kb, 4.0 kb, 또는 5.0 kb 이상의 총 길이를 가질 수 있다. 다양한 실시양태에서, GH1, CSHL1, CSH1, GH2, 또는 CSH2 프로모터는, 예를 들어 참조 게놈에서 GH1, CSHL1, CSH1, GH2, 또는 CSH2의 상류, 예를 들어 그의 제1 코딩 뉴클레오티드의 바로 상류인 상응하는 핵산 서열과 적어도 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 동일성을 갖는 적어도 100 bp, 200 bp, 300 bp, 400 bp, 500 bp, 1.0 kb, 1.5 kb, 2.0 kb, 2.5 kb, 3.0 kb, 4.0 kb, 또는 5.0 kb를 포함한다. 일부 실시양태에서, 인간 게놈에서 성장 호르몬 LCR과 전형적으로 작동가능하게 연결된 유전자의 코딩 서열의 제1 코딩 뉴클레오티드는 성장 호르몬 (17:63,917,202-63,918,838, 상보체) 위치 NC_000017.11 (63918776)의 제1 코딩 뉴클레오티드이다.
다양한 실시양태에서, 성장 호르몬 LCR, 예컨대 긴 성장 호르몬 LCR은 뇌하수체에서 작동가능하게 연결된 코딩 서열의 발현을 유발한다. 다양한 실시양태에서, 작동가능하게 연결된 코딩 서열은 본원에 제시되거나 또는 관련 기술분야에 달리 공지된 바와 같이 GH1, CSHL1, CSH1, GH2, 또는 CSH2 프로모터와 또한 작동가능하게 연결된다.
아포지단백질 B LCR은 작동가능하게 연결된 코딩 서열의 발현을 증진시키는 예시적인 LCR이다. 코딩 서열의 발현은 완전한 아포지단백질 B LCR 서열을 포함하고/거나 그의 발현-조절 단편을 포함하는 아포지단백질 B LCR과 작동가능하게 연결된 경우에 증진될 수 있다. 아포지단백질 B LCR은 아포지단백질 B LCR의 발현-증진 효과의 적어도 일부를 매개하는 것으로 관련 기술분야의 통상의 기술자에 의해 이해되는 DNAse 과민성 부위 (HS)를 포함한다.
다양한 실시양태에서, Ad35 벡터는 본원에 제공된 바와 같은 아포지단백질 B LCR을, 예를 들어 아포지단백질 B LCR 및 임의로 인간 게놈에서 아포지단백질 B LCR과 전형적으로 작동가능하게 연결된 유전자의 프로모터를 포함하는 페이로드에 포함할 수 있다. 다양한 실시양태에서, 아포지단백질 B LCR과 작동가능하게 연결된 유전자는 APOB (2:21,001,428-21,044,072, 상보체)이다. 다양한 실시양태에서, APOB 프로모터는 100 bp, 200 bp, 300 bp, 400 bp, 500 bp, 1.0 kb, 1.5 kb, 2.0 kb, 2.5 kb, 3.0 kb, 4.0 kb, 또는 5.0 kb 이상의 총 길이를 가질 수 있다. 다양한 실시양태에서, APOB 프로모터는, 예를 들어 참조 게놈에서 APOB의 상류, 예를 들어 그의 제1 코딩 뉴클레오티드의 바로 상류인 상응하는 핵산 서열과 적어도 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 동일성을 갖는 적어도 100 bp, 200 bp, 300 bp, 400 bp, 500 bp, 1.0 kb, 1.5 kb, 2.0 kb, 2.5 kb, 3.0 kb, 4.0 kb, 또는 5.0 kb를 포함한다. 일부 실시양태에서, 인간 게놈에서 아포지단백질 B LCR과 전형적으로 작동가능하게 연결된 유전자의 코딩 서열의 제1 코딩 뉴클레오티드는 위치 염색체 2 - NC_000002.12 (21043945)에서의 APOB의 제1 코딩 뉴클레오티드이다.
다양한 실시양태에서, 아포지단백질 B LCR, 예컨대 긴 아포지단백질 B LCR은 장 및/또는 간에서 작동가능하게 연결된 코딩 서열의 발현을 유발한다. 다양한 실시양태에서, 작동가능하게 연결된 코딩 서열은 본원에 제시되거나 또는 관련 기술분야에 달리 공지된 바와 같이 APOB 프로모터와 또한 작동가능하게 연결된다.
β 미오신 중쇄 LCR은 작동가능하게 연결된 코딩 서열의 발현을 증진시키는 예시적인 LCR이다. 코딩 서열의 발현은 완전한 β 미오신 중쇄 LCR 서열을 포함하고/거나 그의 발현-조절 단편을 포함하는 β 미오신 중쇄 LCR과 작동가능하게 연결된 경우에 증진될 수 있다. β 미오신 중쇄 LCR은 β 미오신 중쇄 LCR의 발현-증진 효과의 적어도 일부를 매개하는 것으로 관련 기술분야의 통상의 기술자에 의해 이해되는 DNAse 과민성 부위 (HS)를 포함한다. β 미오신 중쇄 LCR은 과민성 부위 1 및 2를 포함한다. 따라서, β 미오신 중쇄 LCR은 HS1 및 HS2 둘 다를 포함하는 완전한 β 미오신 중쇄 LCR일 수 있거나, 또는 과민성 부위의 하위세트 (HS1 또는 HS2)를 포함하는 그의 발현-조절 단편일 수 있다.
다양한 실시양태에서, Ad35 벡터는 본원에 제공된 바와 같은 β 미오신 중쇄 LCR을, 예를 들어 β 미오신 중쇄 LCR 및 임의로 인간 게놈에서 β 미오신 중쇄 LCR과 전형적으로 작동가능하게 연결된 유전자의 프로모터를 포함하는 페이로드에 포함할 수 있다. 다양한 실시양태에서, β 미오신 중쇄 LCR과 작동가능하게 연결된 유전자는 β 미오신 중쇄 (14:23,412,739-23,435,676, 상보체)이다. 다양한 실시양태에서, β 미오신 중쇄 프로모터는 100 bp, 200 bp, 300 bp, 400 bp, 500 bp, 1.0 kb, 1.5 kb, 2.0 kb, 2.5 kb, 3.0 kb, 4.0 kb, 또는 5.0 kb 이상의 총 길이를 가질 수 있다. 다양한 실시양태에서, β 미오신 중쇄 프로모터는, 예를 들어 참조 게놈에서 β 미오신 중쇄의 상류, 예를 들어 그의 제1 코딩 뉴클레오티드의 바로 상류인 상응하는 핵산 서열과 적어도 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 동일성을 갖는 적어도 100 bp, 200 bp, 300 bp, 400 bp, 500 bp, 1.0 kb, 1.5 kb, 2.0 kb, 2.5 kb, 3.0 kb, 4.0 kb, 또는 5.0 kb를 포함한다. 일부 실시양태에서, 인간 게놈에서 β 미오신 중쇄 LCR과 전형적으로 작동가능하게 연결된 유전자의 코딩 서열의 제1 코딩 뉴클레오티드는 염색체 14 - NC_000014.9 (23433732)에서의 β 미오신 중쇄의 제1 코딩 뉴클레오티드이다.
다양한 실시양태에서, β 미오신 중쇄 LCR, 예컨대 긴 β 미오신 중쇄 LCR은 심장 근육 및/또는 골격근에서 작동가능하게 연결된 코딩 서열의 발현을 유발한다. 다양한 실시양태에서, 작동가능하게 연결된 코딩 서열은 본원에 제시되거나 또는 관련 기술분야에 달리 공지된 바와 같이 β 미오신 중쇄 프로모터와 또한 작동가능하게 연결된다.
MHC 부류 I HLA-B7 LCR은 작동가능하게 연결된 코딩 서열의 발현을 증진시키는 예시적인 LCR이다. 코딩 서열의 발현은 완전한 MHC 부류 I HLA-B7 LCR 서열을 포함하고/거나 그의 발현-조절 단편을 포함하는 MHC 부류 I HLA-B7 LCR과 작동가능하게 연결된 경우에 증진될 수 있다. MHC 부류 I HLA-B7 LCR은 MHC 부류 I HLA-B7 LCR의 발현-증진 효과의 적어도 일부를 매개하는 것으로 관련 기술분야의 통상의 기술자에 의해 이해되는 DNAse 과민성 부위 (HS)를 포함한다.
다양한 실시양태에서, Ad35 벡터는 본원에 제공된 바와 같은 MHC 부류 I HLA-B7 LCR을, 예를 들어 MHC 부류 I HLA-B7 LCR 및 임의로 인간 게놈에서 MHC 부류 I HLA-B7 LCR과 전형적으로 작동가능하게 연결된 유전자의 프로모터를 포함하는 페이로드에 포함할 수 있다. 다양한 실시양태에서, MHC 부류 I HLA-B7 LCR과 작동가능하게 연결된 유전자는 MHC 부류 I HLA-B7이다. 다양한 실시양태에서, MHC 부류 I HLA-B7 프로모터는 100 bp, 200 bp, 300 bp, 400 bp, 500 bp, 1.0 kb, 1.5 kb, 2.0 kb, 2.5 kb, 3.0 kb, 4.0 kb, 또는 5.0 kb 이상의 총 길이를 가질 수 있다. 다양한 실시양태에서, MHC 부류 I HLA-B7 프로모터는, 예를 들어 참조 게놈에서 MHC 부류 I HLA-B7의 상류, 예를 들어 그의 제1 코딩 뉴클레오티드의 바로 상류인 상응하는 핵산 서열과 적어도 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 동일성을 갖는 적어도 100 bp, 200 bp, 300 bp, 400 bp, 500 bp, 1.0 kb, 1.5 kb, 2.0 kb, 2.5 kb, 3.0 kb, 4.0 kb, 또는 5.0 kb를 포함한다.
다양한 실시양태에서, MHC 부류 I HLA-B7 LCR, 예컨대 긴 MHC 부류 I HLA-B7 LCR은 많은 세포 유형에서 또는 편재적으로 작동가능하게 연결된 코딩 서열의 발현을 유발한다. 다양한 실시양태에서, 작동가능하게 연결된 코딩 서열은 본원에 제시되거나 또는 관련 기술분야에 달리 공지된 바와 같이 MHC 부류 I HLA-B7 프로모터와 또한 작동가능하게 연결된다.
MHC 부류 I HLA-G LCR은 작동가능하게 연결된 코딩 서열의 발현을 증진시키는 예시적인 LCR이다. 코딩 서열의 발현은 완전한 MHC 부류 I HLA-G LCR 서열을 포함하고/거나 그의 발현-조절 단편을 포함하는 MHC 부류 I HLA-G LCR과 작동가능하게 연결된 경우에 증진될 수 있다. MHC 부류 I HLA-G LCR은 MHC 부류 I HLA-G LCR의 발현-증진 효과의 적어도 일부를 매개하는 것으로 관련 기술분야의 통상의 기술자에 의해 이해되는 DNAse 과민성 부위 (HS)를 포함한다.
다양한 실시양태에서, Ad35 벡터는 본원에 제공된 바와 같은 MHC 부류 I HLA-G LCR을, 예를 들어 MHC 부류 I HLA-G LCR 및 임의로 인간 게놈에서 MHC 부류 I HLA-G LCR과 전형적으로 작동가능하게 연결된 유전자의 프로모터를 포함하는 페이로드에 포함할 수 있다. 다양한 실시양태에서, MHC 부류 I HLA-G LCR과 작동가능하게 연결된 유전자는 MHC 부류 I HLA-G이다. 다양한 실시양태에서, MHC 부류 I HLA-G 프로모터는 100 bp, 200 bp, 300 bp, 400 bp, 500 bp, 1.0 kb, 1.5 kb, 2.0 kb, 2.5 kb, 3.0 kb, 4.0 kb, 또는 5.0 kb 이상의 총 길이를 가질 수 있다. 다양한 실시양태에서, MHC 부류 I HLA-G 프로모터는, 예를 들어 참조 게놈에서 MHC 부류 I HLA-G의 상류, 예를 들어 그의 제1 코딩 뉴클레오티드의 바로 상류인 상응하는 핵산 서열과 적어도 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 동일성을 갖는 적어도 100 bp, 200 bp, 300 bp, 400 bp, 500 bp, 1.0 kb, 1.5 kb, 2.0 kb, 2.5 kb, 3.0 kb, 4.0 kb, 또는 5.0 kb를 포함한다.
다양한 실시양태에서, MHC 부류 I HLA-G LCR, 예컨대 긴 MHC 부류 I HLA-G LCR은 많은 세포 유형에서 또는 편재적으로 작동가능하게 연결된 코딩 서열의 발현을 유발한다. 다양한 실시양태에서, 작동가능하게 연결된 코딩 서열은 본원에 제시되거나 또는 관련 기술분야에 달리 공지된 바와 같이 MHC 부류 I HLA-G 프로모터와 또한 작동가능하게 연결된다.
케라틴 18 LCR은 작동가능하게 연결된 코딩 서열의 발현을 증진시키는 예시적인 LCR이다. 코딩 서열의 발현은 완전한 케라틴 18 LCR 서열을 포함하고/거나 그의 발현-조절 단편을 포함하는 케라틴 18 LCR과 작동가능하게 연결된 경우에 증진될 수 있다. 케라틴 18 LCR은 케라틴 18 LCR의 발현-증진 효과의 적어도 일부를 매개하는 것으로 관련 기술분야의 통상의 기술자에 의해 이해되는 DNAse 과민성 부위 (HS)를 포함한다. 케라틴 18 LCR은 과민성 부위 1-4를 포함한다. 따라서, 케라틴 18 LCR은 모든 HS1-HS4를 포함하는 완전한 케라틴 18 LCR일 수 있거나, 또는 과민성 부위 HS1-HS4의 하위세트를 포함하는 그의 발현-조절 단편일 수 있다.
특정한 실시양태는 인간 염색체 12의 케라틴 18 LCR 위치 NC_000012.12 (52948039-52956706) (8,668 bp) 또는 그의 발현-조절 단편을 포함할 수 있다. 다양한 실시양태에서, 케라틴 18 LCR은 케라틴 18 LCR 위치 52948039-52956706의 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 이상의 총 길이를 가질 수 있다. 다양한 실시양태에서, 케라틴 18 LCR은 케라틴 18 LCR 위치 52948039-52956706의 적어도 1 kb, 2 kb, 3 kb, 4 kb, 5 kb, 6 kb, 7 kb, 또는 8 kb를 포함할 수 있다. 본원에 제공된 다양한 실시양태 중 임의의 것에서, 긴 LCR은 케라틴 18 LCR 위치 52948039-52956706의 상응하는 인접 부분과 적어도 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 동일성을 갖는 핵산일 수 있거나 또는 그를 포함할 수 있다.
다양한 실시양태에서, Ad35 벡터는 본원에 제공된 바와 같은 케라틴 18 LCR을, 예를 들어 케라틴 18 LCR 및 임의로 인간 게놈에서 케라틴 18 LCR과 전형적으로 작동가능하게 연결된 유전자의 프로모터를 포함하는 페이로드에 포함할 수 있다. 다양한 실시양태에서, 케라틴 18 LCR과 작동가능하게 연결된 유전자는 케라틴 18 (12:52,948,870-52,952,905)이다. 다양한 실시양태에서, 케라틴 18 프로모터는 100 bp, 200 bp, 300 bp, 400 bp, 500 bp, 1.0 kb, 1.5 kb, 2.0 kb, 2.5 kb, 3.0 kb, 4.0 kb, 또는 5.0 kb 이상의 총 길이를 가질 수 있다. 다양한 실시양태에서, 케라틴 18 프로모터는, 예를 들어 참조 게놈에서 케라틴 18의 상류, 예를 들어 그의 제1 코딩 뉴클레오티드의 바로 상류인 상응하는 핵산 서열과 적어도 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 동일성을 갖는 적어도 100 bp, 200 bp, 300 bp, 400 bp, 500 bp, 1.0 kb, 1.5 kb, 2.0 kb, 2.5 kb, 3.0 kb, 4.0 kb, 또는 5.0 kb를 포함한다. 일부 실시양태에서, 인간 게놈에서 케라틴 18 LCR과 전형적으로 작동가능하게 연결된 유전자의 코딩 서열의 제1 코딩 뉴클레오티드는 염색체 12 - NC_000012.12 (52949174)에서의 케라틴 18의 제1 코딩 뉴클레오티드이다.
다양한 실시양태에서, 케라틴 18 LCR, 예컨대 긴 케라틴 18 LCR은 상피 세포에서 작동가능하게 연결된 코딩 서열의 발현을 유발한다. 다양한 실시양태에서, 작동가능하게 연결된 코딩 서열은 본원에 제시되거나 또는 관련 기술분야에 달리 공지된 바와 같이 케라틴 18 프로모터와 또한 작동가능하게 연결된다.
보체 성분 C4A/B LCR은 작동가능하게 연결된 코딩 서열의 발현을 증진시키는 예시적인 LCR이다. 코딩 서열의 발현은 완전한 보체 성분 C4A/B LCR 서열을 포함하고/거나 그의 발현-조절 단편을 포함하는 보체 성분 C4A/B LCR과 작동가능하게 연결된 경우에 증진될 수 있다. 보체 성분 C4A/B LCR은 보체 성분 C4A/B LCR의 발현-증진 효과의 적어도 일부를 매개하는 것으로 관련 기술분야의 통상의 기술자에 의해 이해되는 DNAse 과민성 부위 (HS)를 포함한다.
다양한 실시양태에서, Ad35 벡터는 본원에 제공된 바와 같은 보체 성분 C4A/B LCR을, 예를 들어 보체 성분 C4A/B LCR 및 임의로 인간 게놈에서 보체 성분 C4A/B LCR과 전형적으로 작동가능하게 연결된 유전자의 프로모터를 포함하는 페이로드에 포함할 수 있다. 다양한 실시양태에서, 보체 성분 C4A/B LCR과 작동가능하게 연결된 유전자는 C4A (6:31,982,056-32,002,680)이다. 다양한 실시양태에서, C4A 프로모터는 100 bp, 200 bp, 300 bp, 400 bp, 500 bp, 1.0 kb, 1.5 kb, 2.0 kb, 2.5 kb, 3.0 kb, 4.0 kb, 또는 5.0 kb 이상의 총 길이를 가질 수 있다. 다양한 실시양태에서, C4A 프로모터는, 예를 들어 참조 게놈에서 C4A의 상류, 예를 들어 그의 제1 코딩 뉴클레오티드의 바로 상류인 상응하는 핵산 서열과 적어도 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 동일성을 갖는 적어도 100 bp, 200 bp, 300 bp, 400 bp, 500 bp, 1.0 kb, 1.5 kb, 2.0 kb, 2.5 kb, 3.0 kb, 4.0 kb, 또는 5.0 kb를 포함한다. 일부 실시양태에서, 인간 게놈에서 보체 성분 C4A/B LCR과 전형적으로 작동가능하게 연결된 유전자의 코딩 서열의 제1 코딩 뉴클레오티드는 염색체 6 - NC_000006.12 (31982108)에서의 C4A의 제1 코딩 뉴클레오티드이다.
다양한 실시양태에서, 보체 성분 C4A/B LCR, 예컨대 긴 보체 성분 C4A/B LCR은 간에서 작동가능하게 연결된 코딩 서열의 발현을 유발한다. 다양한 실시양태에서, 작동가능하게 연결된 코딩 서열은 본원에 제시되거나 또는 관련 기술분야에 달리 공지된 바와 같이 C4A 프로모터와 또한 작동가능하게 연결된다.
적색 및 녹색 시각 색소 (옵신) LCR은 작동가능하게 연결된 코딩 서열의 발현을 증진시키는 예시적인 LCR이다. 코딩 서열의 발현은 완전한 적색 및 녹색 시각 색소 (옵신) LCR 서열을 포함하고/거나 그의 발현-조절 단편을 포함하는 적색 및 녹색 시각 색소 (옵신) LCR과 작동가능하게 연결된 경우에 증진될 수 있다. 적색 및 녹색 시각 색소 (옵신) LCR은 적색 및 녹색 시각 색소 (옵신) LCR의 발현-증진 효과의 적어도 일부를 매개하는 것으로 관련 기술분야의 통상의 기술자에 의해 이해되는 DNAse 과민성 부위 (HS)를 포함한다. 적색 및 녹색 시각 색소 (옵신) LCR은 과민성 부위 1-3을 포함한다. 따라서, 적색 및 녹색 시각 색소 (옵신) LCR은 모든 HS1-HS3을 포함하는 완전한 적색 및 녹색 시각 색소 (옵신) LCR일 수 있거나, 또는 과민성 부위 HS1-HS3의 하위세트를 포함하는 그의 발현-조절 단편일 수 있다.
특정한 실시양태는 인간 염색체 X의 적색 및 녹색 시각 색소 (옵신) LCR 위치 NC_000023.11 (154137727-154144286) (6,560 bp) 또는 그의 발현-조절 단편을 포함할 수 있다. 다양한 실시양태에서, 적색 및 녹색 시각 색소 (옵신) LCR은 적색 및 녹색 시각 색소 (옵신) LCR 위치 154137727-154144286의 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 이상의 총 길이를 가질 수 있다. 다양한 실시양태에서, 적색 및 녹색 시각 색소 (옵신) LCR은 적색 및 녹색 시각 색소 (옵신) LCR 위치 154137727-154144286의 적어도 1 kb, 2 kb, 3 kb, 4 kb, 5 kb, 또는 6 kb를 포함할 수 있다. 본원에 제공된 다양한 실시양태 중 임의의 것에서, 긴 LCR은 적색 및 녹색 시각 안료 (옵신) LCR 위치 154137727-154144286의 상응하는 인접 부분과 적어도 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 동일성을 갖는 핵산일 수 있거나 또는 그를 포함할 수 있다.
다양한 실시양태에서, Ad35 벡터는 본원에 제공된 바와 같은 적색 및 녹색 시각 색소 (옵신) LCR을, 예를 들어 적색 및 녹색 시각 색소 (옵신) LCR 및 임의로 인간 게놈에서 적색 및 녹색 시각 색소 (옵신) LCR과 전형적으로 작동가능하게 연결된 유전자의 프로모터를 포함하는 페이로드에 포함할 수 있다. 다양한 실시양태에서, 적색 및 녹색 시각 색소 (옵신) LCR과 작동가능하게 연결된 유전자는 옵신 1 (X:154,144,242-154,159,031), 장파-감수성 (OPN1LW), 옵신 1, 중간파-감수성 (OPN1MW), OPN1MW2, 또는 OPN1MW3이다. 다양한 실시양태에서, OPN1LW, OPN1MW, OPN1MW2, 또는 OPN1MW3 프로모터는 100 bp, 200 bp, 300 bp, 400 bp, 500 bp, 1.0 kb, 1.5 kb, 2.0 kb, 2.5 kb, 3.0 kb, 4.0 kb, 또는 5.0 kb 이상의 총 길이를 가질 수 있다. 다양한 실시양태에서, OPN1LW, OPN1MW, OPN1MW2, 또는 OPN1MW3 프로모터는, 예를 들어 참조 게놈에서 OPN1LW, OPN1MW, OPN1MW2, 또는 OPN1MW3의 상류, 예를 들어 그의 제1 코딩 뉴클레오티드의 바로 상류인 상응하는 핵산 서열과 적어도 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 동일성을 갖는 적어도 100 bp, 200 bp, 300 bp, 400 bp, 500 bp, 1.0 kb, 1.5 kb, 2.0 kb, 2.5 kb, 3.0 kb, 4.0 kb, 또는 5.0 kb를 포함한다. 일부 실시양태에서, 인간 게놈에서 적색 및 녹색 시각 색소 (옵신) LCR과 전형적으로 작동가능하게 연결된 유전자의 코딩 서열의 제1 코딩 뉴클레오티드는 염색체 X - NC_000023.11 (154144284)에서의 OPN1LW 또는 염색체 X - NC_000023.11 (154182678)에서의 OPN1MW의 제1 코딩 뉴클레오티드이다.
다양한 실시양태에서, 적색 및 녹색 시각 색소 (옵신) LCR, 예컨대 긴 적색 및 녹색 시각 색소 (옵신) LCR은 원추 광수용체에서 작동가능하게 연결된 코딩 서열의 발현을 유발한다. 다양한 실시양태에서, 작동가능하게 연결된 코딩 서열은 본원에 제시되거나 또는 관련 기술분야에 달리 공지된 바와 같이 OPN1LW, OPN1MW, OPN1MW2, 또는 OPN1MW3 프로모터와 또한 작동가능하게 연결된다.
α-글로빈 LCR은 작동가능하게 연결된 코딩 서열의 발현을 증진시키는 예시적인 LCR이다. 코딩 서열의 발현은 완전한 α-글로빈 LCR 서열을 포함하고/거나 그의 발현-조절 단편을 포함하는 α-글로빈 LCR과 작동가능하게 연결된 경우에 증진될 수 있다. α-글로빈 LCR은 α-글로빈 LCR의 발현-증진 효과의 적어도 일부를 매개하는 것으로 관련 기술분야의 통상의 기술자에 의해 이해되는 DNAse 과민성 부위 (HS)를 포함한다. α-글로빈 LCR은 과민성 부위 MCS-R1 내지 MCS-R4를 포함한다. 따라서, α-글로빈 LCR은 모든 MCS-R1 내지 MCS-R4를 포함하는 완전한 α-글로빈 LCR일 수 있거나, 또는 과민성 부위 MCS-R1 내지 MCS-R4의 하위세트를 포함하는 그의 발현-조절 단편일 수 있다.
특정한 실시양태는 인간 염색체 16의 α-글로빈 LCR 위치 NC_000016.10 (87808-152854) (65,047 bp) 또는 그의 발현-조절 단편을 포함할 수 있다. 다양한 실시양태에서, α-글로빈 LCR은 α-글로빈 LCR 위치 87808-152854의 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 이상의 총 길이를 가질 수 있다. 다양한 실시양태에서, α-글로빈 LCR은 α-글로빈 LCR 위치 87808-152854의 적어도 10 kb, 15 kb, 16 kb, 17 kb, 18 kb, 19 kb, 20 kb, 21 kb, 22 kb, 23 kb, 24 kb, 25 kb, 26 kb, 27 kb, 28 kb, 29 kb, 또는 30 kb를 포함할 수 있다. 본원에 제공된 다양한 실시양태 중 임의의 것에서, 긴 LCR은 α-글로빈 LCR 위치 87808-152854의 상응하는 인접 부분과 적어도 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 동일성을 갖는 핵산일 수 있거나 또는 그를 포함할 수 있다.
다양한 실시양태에서, Ad35 벡터는 본원에 제공된 바와 같은 α-글로빈 LCR을, 예를 들어 α-글로빈 LCR 및 임의로 인간 게놈에서 α-글로빈 LCR과 전형적으로 작동가능하게 연결된 유전자의 프로모터를 포함하는 페이로드에 포함할 수 있다. 다양한 실시양태에서, α-글로빈 LCR과 작동가능하게 연결된 유전자는 알파-글로빈 유전자 클러스터 (주요 α-글로빈 유전자좌: 16:172,875-173,709) 내의 HBZ (헤모글로빈, 제타), HBA2 (헤모글로빈, 알파 2), HBA1 (헤모글로빈, 알파 1), 또는 HBQ1 (헤모글로빈, 세타 1)이다. 다양한 실시양태에서, HBZ (헤모글로빈, 제타), HBA2 (헤모글로빈, 알파 2), HBA1 (헤모글로빈, 알파 1), 또는 HBQ1 (헤모글로빈, 세타 1) 프로모터는 100 bp, 200 bp, 300 bp, 400 bp, 500 bp, 1.0 kb, 1.5 kb, 2.0 kb, 2.5 kb, 3.0 kb, 4.0 kb, 또는 5.0 kb 이상의 총 길이를 가질 수 있다. 다양한 실시양태에서, HBZ (헤모글로빈, 제타), HBA2 (헤모글로빈, 알파 2), HBA1 (헤모글로빈, 알파 1), 또는 HBQ1 (헤모글로빈, 세타 1) 프로모터는, 예를 들어 참조 게놈에서 HBZ (헤모글로빈, 제타), HBA2 (헤모글로빈, 알파 2), HBA1 (헤모글로빈, 알파 1), 또는 HBQ1 (헤모글로빈, 세타 1)의 상류, 예를 들어 그의 제1 코딩 뉴클레오티드의 바로 상류인 상응하는 핵산 서열과 적어도 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 동일성을 갖는 적어도 100 bp, 200 bp, 300 bp, 400 bp, 500 bp, 1.0 kb, 1.5 kb, 2.0 kb, 2.5 kb, 3.0 kb, 4.0 kb, 또는 5.0 kb를 포함한다. 일부 실시양태에서, 인간 게놈에서 α-글로빈 LCR과 전형적으로 작동가능하게 연결된 유전자의 코딩 서열의 제1 코딩 뉴클레오티드는 HBA1 염색체 16 - NC_000016.10 (176717), HBA2 염색체 16 - NC_000016.10 (172913), HBZ 염색체 16 - NC_000016.10 (152910), 또는 HBQ1 염색체 16 - NC_000016.10 (180487)의 제1 코딩 뉴클레오티드이다.
다양한 실시양태에서, α-글로빈 LCR, 예컨대 긴 α-글로빈 LCR은 적혈구에서 작동가능하게 연결된 코딩 서열의 발현을 유발한다. 다양한 실시양태에서, 작동가능하게 연결된 코딩 서열은 본원에 제시되거나 또는 관련 기술분야에 달리 공지된 바와 같이 프로모터와 또한 작동가능하게 연결된다.
데스민 LCR은 작동가능하게 연결된 코딩 서열의 발현을 증진시키는 예시적인 LCR이다. 코딩 서열의 발현은 완전한 데스민 LCR 서열을 포함하고/거나 그의 발현-조절 단편을 포함하는 데스민 LCR과 작동가능하게 연결된 경우에 증진될 수 있다. 데스민 LCR은 데스민 LCR의 발현-증진 효과의 적어도 일부를 매개하는 것으로 관련 기술분야의 통상의 기술자에 의해 이해되는 DNAse 과민성 부위 (HS)를 포함한다. 데스민 LCR은 과민성 부위 1-5를 포함한다. 따라서, 데스민 LCR은 모든 HS1-HS5를 포함하는 완전한 데스민 LCR일 수 있거나, 또는 과민성 부위 HS1-HS5의 하위세트를 포함하는 그의 발현-조절 단편일 수 있다.
특정한 실시양태는 인간 염색체 2의 데스민 LCR 위치 NC_000002.12 (219399709-219418452) (18,743 bp) 또는 그의 발현-조절 단편을 포함할 수 있다. 다양한 실시양태에서, 데스민 LCR은 데스민 LCR 위치 219399709-219418452의 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 이상의 총 길이를 가질 수 있다. 다양한 실시양태에서, 데스민 LCR은 데스민 LCR 위치 219399709-219418452의 적어도 10 kb, 15 kb, 16 kb, 17 kb, 또는 18 kb를 포함할 수 있다. 본원에 제공된 다양한 실시양태 중 임의의 것에서, 긴 LCR은 데스민 LCR 위치 219399709-219418452의 상응하는 인접 부분과 적어도 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 동일성을 갖는 핵산일 수 있거나 또는 그를 포함할 수 있다.
다양한 실시양태에서, Ad35 벡터는 본원에 제공된 바와 같은 데스민 LCR을, 예를 들어 데스민 LCR 및 임의로 인간 게놈에서 데스민 LCR과 전형적으로 작동가능하게 연결된 유전자의 프로모터를 포함하는 페이로드에 포함할 수 있다. 다양한 실시양태에서, 데스민 LCR과 작동가능하게 연결된 유전자는 데스민 (2:219,418,376-219,426,733)이다. 다양한 실시양태에서, 데스민 프로모터는 100 bp, 200 bp, 300 bp, 400 bp, 500 bp, 1.0 kb, 1.5 kb, 2.0 kb, 2.5 kb, 3.0 kb, 4.0 kb, 또는 5.0 kb 이상의 총 길이를 가질 수 있다. 다양한 실시양태에서, 데스민 프로모터는, 예를 들어 참조 게놈에서 데스민의 상류, 예를 들어 그의 제1 코딩 뉴클레오티드의 바로 상류인 상응하는 핵산 서열과 적어도 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 동일성을 갖는 적어도 100 bp, 200 bp, 300 bp, 400 bp, 500 bp, 1.0 kb, 1.5 kb, 2.0 kb, 2.5 kb, 3.0 kb, 4.0 kb, 또는 5.0 kb를 포함한다. 일부 실시양태에서, 인간 게놈에서 데스민 LCR과 전형적으로 작동가능하게 연결된 유전자의 코딩 서열의 제1 코딩 뉴클레오티드는 염색체 2 - NC_000002.12 (21941863)에서의 데스민의 제1 코딩 뉴클레오티드이다.
다양한 실시양태에서, 데스민 LCR, 예컨대 긴 데스민 LCR은 심장 근육, 골격근, 및/또는 평활근에서 작동가능하게 연결된 코딩 서열의 발현을 유발한다. 다양한 실시양태에서, 작동가능하게 연결된 코딩 서열은 본원에 제시되거나 또는 관련 기술분야에 달리 공지된 바와 같이 데스민 프로모터와 또한 작동가능하게 연결된다.
핵 인자, 적혈구 2 유사 1 (NFE2L1) LCR은 작동가능하게 연결된 코딩 서열의 발현을 증진시키는 예시적인 LCR이다. 코딩 서열의 발현은 완전한 NFE2L1 LCR 서열을 포함하고/거나 그의 발현-조절 단편을 포함하는 NFE2L1 LCR과 작동가능하게 연결된 경우에 증진될 수 있다. NFE2L1 LCR은 NFE2L1 LCR의 발현-증진 효과의 적어도 일부를 매개하는 것으로 관련 기술분야의 통상의 기술자에 의해 이해되는 DNAse 과민성 부위 (HS)를 포함한다.
특정한 실시양태는 인간 염색체 17의 NFE2L1 LCR 위치 NC_000017.11 (48048359-48061545) (13, 186 bp) 또는 그의 발현-조절 단편을 포함할 수 있다. 다양한 실시양태에서, NFE2L1 LCR은 NFE2L1 LCR 위치 48048359-48061545의 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 이상의 총 길이를 가질 수 있다. 다양한 실시양태에서, NFE2L1 LCR은 NFE2L1 LCR 위치 48048359-48061545의 적어도 10 kb, 11 kb, 12 kb, 또는 13 kb를 포함할 수 있다. 본원에 제공된 다양한 실시양태 중 임의의 것에서, 긴 LCR은 NFE2L1 LCR 위치 48048359-48061545의 상응하는 인접 부분과 적어도 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 동일성을 갖는 핵산일 수 있거나 또는 그를 포함할 수 있다.
다양한 실시양태에서, Ad35 벡터는 본원에 제공된 바와 같은 NFE2L1 LCR을, 예를 들어 NFE2L1 LCR 및 임의로 인간 게놈에서 NFE2L1 LCR과 전형적으로 작동가능하게 연결된 유전자의 프로모터를 포함하는 페이로드에 포함할 수 있다. 다양한 실시양태에서, NFE2L1 LCR과 작동가능하게 연결된 유전자는 NFE2L1 (17:48,048,358-48,061,544)이다. 다양한 실시양태에서, NFE2L1 프로모터는 100 bp, 200 bp, 300 bp, 400 bp, 500 bp, 1.0 kb, 1.5 kb, 2.0 kb, 2.5 kb, 3.0 kb, 4.0 kb, 또는 5.0 kb 이상의 총 길이를 가질 수 있다. 다양한 실시양태에서, NFE2L1 프로모터는, 예를 들어 참조 게놈에서 NFE2L1의 상류, 예를 들어 그의 제1 코딩 뉴클레오티드의 바로 상류인 상응하는 핵산 서열과 적어도 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 동일성을 갖는 적어도 100 bp, 200 bp, 300 bp, 400 bp, 500 bp, 1.0 kb, 1.5 kb, 2.0 kb, 2.5 kb, 3.0 kb, 4.0 kb, 또는 5.0 kb를 포함한다. 일부 실시양태에서, 인간 게놈에서 NFE2L1 LCR과 전형적으로 작동가능하게 연결된 유전자의 코딩 서열의 제1 코딩 뉴클레오티드는 염색체 17 - NC_000017.11 (48051119)에서의 NFE2L1의 제1 코딩 뉴클레오티드이다.
다양한 실시양태에서, NFE2L1 LCR, 예컨대 긴 NFE2L1 LCR은 적혈구에서 작동가능하게 연결된 코딩 서열의 발현을 유발한다. 다양한 실시양태에서, 작동가능하게 연결된 코딩 서열은 본원에 제시되거나 또는 관련 기술분야에 달리 공지된 바와 같이 NFE2L1 프로모터와 또한 작동가능하게 연결된다.
CD4 LCR은 작동가능하게 연결된 코딩 서열의 발현을 증진시키는 예시적인 LCR이다. 코딩 서열의 발현은 완전한 CD4 LCR 서열을 포함하고/거나 그의 발현-조절 단편을 포함하는 CD4 LCR과 작동가능하게 연결된 경우에 증진될 수 있다. CD4 LCR은 CD4 LCR의 발현-증진 효과의 적어도 일부를 매개하는 것으로 관련 기술분야의 통상의 기술자에 의해 이해되는 DNAse 과민성 부위 (HS)를 포함한다. CD4 LCR은 최대 17개의 과민성 부위 DH1-DH17을 포함한다. 따라서, CD4 LCR은 모든 DH1-DH17을 포함하는 완전한 CD4 LCR일 수 있거나, 또는 과민성 부위 DH1-DH17의 하위세트를 포함하는 그의 발현-조절 단편일 수 있다.
다양한 실시양태에서, Ad35 벡터는 본원에 제공된 바와 같은 CD4 LCR을, 예를 들어 CD4 LCR 및 임의로 인간 게놈에서 CD4 LCR과 전형적으로 작동가능하게 연결된 유전자의 프로모터를 포함하는 페이로드에 포함할 수 있다. 다양한 실시양태에서, CD4 LCR과 작동가능하게 연결된 유전자는 CD4 (12:6,789,527-6,820,809)이다. 다양한 실시양태에서, CD4 프로모터는 100 bp, 200 bp, 300 bp, 400 bp, 500 bp, 1.0 kb, 1.5 kb, 2.0 kb, 2.5 kb, 3.0 kb, 4.0 kb, 또는 5.0 kb 이상의 총 길이를 가질 수 있다. 다양한 실시양태에서, CD4 프로모터는, 예를 들어 참조 게놈에서 CD4의 상류, 예를 들어 그의 제1 코딩 뉴클레오티드의 바로 상류인 상응하는 핵산 서열과 적어도 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 동일성을 갖는 적어도 100 bp, 200 bp, 300 bp, 400 bp, 500 bp, 1.0 kb, 1.5 kb, 2.0 kb, 2.5 kb, 3.0 kb, 4.0 kb, 또는 5.0 kb를 포함한다. 일부 실시양태에서, 인간 게놈에서 CD4 LCR과 전형적으로 작동가능하게 연결된 유전자의 코딩 서열의 제1 코딩 뉴클레오티드는 염색체 12 - NC_000012.12 (6800139)에서의 CD4의 제1 코딩 뉴클레오티드이다.
다양한 실시양태에서, CD4 LCR, 예컨대 긴 CD4 LCR은 CD4+ T 세포에서 작동가능하게 연결된 코딩 서열의 발현을 유발한다. 다양한 실시양태에서, 작동가능하게 연결된 코딩 서열은 본원에 제시되거나 또는 관련 기술분야에 달리 공지된 바와 같이 CD4 프로모터와 또한 작동가능하게 연결된다.
α-락트알부민 LCR은 작동가능하게 연결된 코딩 서열의 발현을 증진시키는 예시적인 LCR이다. 코딩 서열의 발현은 완전한 α-락트알부민 LCR 서열을 포함하고/거나 그의 발현-조절 단편을 포함하는 α-락트알부민 LCR과 작동가능하게 연결된 경우에 증진될 수 있다. α-락트알부민 LCR은 α-락트알부민 LCR의 발현-증진 효과의 적어도 일부를 매개하는 것으로 관련 기술분야의 통상의 기술자에 의해 이해되는 DNAse 과민성 부위 (HS)를 포함한다.
다양한 실시양태에서, Ad35 벡터는 본원에 제공된 바와 같은 α-락트알부민 LCR을, 예를 들어 α-락트알부민 LCR 및 임의로 인간 게놈에서 α-락트알부민 LCR과 전형적으로 작동가능하게 연결된 유전자의 프로모터를 포함하는 페이로드에 포함할 수 있다. 다양한 실시양태에서, α-락트알부민 LCR과 작동가능하게 연결된 유전자는 α-락트알부민 (12:48,567,683-48,571,882)이다. 다양한 실시양태에서, α-락트알부민 프로모터는 100 bp, 200 bp, 300 bp, 400 bp, 500 bp, 1.0 kb, 1.5 kb, 2.0 kb, 2.5 kb, 3.0 kb, 4.0 kb, 또는 5.0 kb 이상의 총 길이를 가질 수 있다. 다양한 실시양태에서, α-락트알부민 프로모터는, 예를 들어 참조 게놈에서 α-락트알부민의 상류, 예를 들어 그의 제1 코딩 뉴클레오티드의 바로 상류인 상응하는 핵산 서열과 적어도 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 동일성을 갖는 적어도 100 bp, 200 bp, 300 bp, 400 bp, 500 bp, 1.0 kb, 1.5 kb, 2.0 kb, 2.5 kb, 3.0 kb, 4.0 kb, 또는 5.0 kb를 포함한다. 일부 실시양태에서, 인간 게놈에서 α-락트알부민 LCR과 전형적으로 작동가능하게 연결된 유전자의 코딩 서열의 제1 코딩 뉴클레오티드는 염색체 12 - NC_000012.12 (48570020)에서의 α-락트알부민의 제1 코딩 뉴클레오티드이다.
다양한 실시양태에서, α-락트알부민 LCR, 예컨대 긴 α-락트알부민 LCR은 유선에서 작동가능하게 연결된 코딩 서열의 발현을 유발한다. 다양한 실시양태에서, 작동가능하게 연결된 코딩 서열은 본원에 제시되거나 또는 관련 기술분야에 달리 공지된 바와 같이 α-락트알부민 프로모터와 또한 작동가능하게 연결된다.
CYP19/아로마타제 LCR은 작동가능하게 연결된 코딩 서열의 발현을 증진시키는 예시적인 LCR이다. 코딩 서열의 발현은 완전한 CYP19/아로마타제 LCR 서열을 포함하고/거나 그의 발현-조절 단편을 포함하는 CYP19/아로마타제 LCR과 작동가능하게 연결된 경우에 증진될 수 있다. CYP19/아로마타제 LCR은 CYP19/아로마타제 LCR의 발현-증진 효과의 적어도 일부를 매개하는 것으로 관련 기술분야의 통상의 기술자에 의해 이해되는 DNAse 과민성 부위 (HS)를 포함한다.
다양한 실시양태에서, Ad35 벡터는 본원에 제공된 바와 같은 CYP19/아로마타제 LCR을, 예를 들어 CYP19/아로마타제 LCR 및 임의로 인간 게놈에서 CYP19/아로마타제 LCR과 전형적으로 작동가능하게 연결된 유전자의 프로모터를 포함하는 페이로드에 포함할 수 있다. 다양한 실시양태에서, CYP19/아로마타제 LCR과 작동가능하게 연결된 유전자는 CYP19A1 (15:51,208,056-51,338,595)이다. 다양한 실시양태에서, CYP19A1 프로모터는 100 bp, 200 bp, 300 bp, 400 bp, 500 bp, 1.0 kb, 1.5 kb, 2.0 kb, 2.5 kb, 3.0 kb, 4.0 kb, 또는 5.0 kb 이상의 총 길이를 가질 수 있다. 다양한 실시양태에서, CYP19A1 프로모터는, 예를 들어 참조 게놈에서 CYP19A1의 상류, 예를 들어 그의 제1 코딩 뉴클레오티드의 바로 상류인 상응하는 핵산 서열과 적어도 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 동일성을 갖는 적어도 100 bp, 200 bp, 300 bp, 400 bp, 500 bp, 1.0 kb, 1.5 kb, 2.0 kb, 2.5 kb, 3.0 kb, 4.0 kb, 또는 5.0 kb를 포함한다. 일부 실시양태에서, 인간 게놈에서 CYP19/아로마타제 LCR과 전형적으로 작동가능하게 연결된 유전자의 코딩 서열의 제1 코딩 뉴클레오티드는 염색체 15 - NC_000015.10 (51242912)에서의 CYP19A1의 제1 코딩 뉴클레오티드이다.
다양한 실시양태에서, CYP19/아로마타제 LCR, 예컨대 긴 CYP19/아로마타제 LCR은 다수의 다양한 조직에서 작동가능하게 연결된 코딩 서열의 발현을 유발한다. 다양한 실시양태에서, 작동가능하게 연결된 코딩 서열은 본원에 제시되거나 또는 관련 기술분야에 달리 공지된 바와 같이 CYP19A1 프로모터와 또한 작동가능하게 연결된다.
C-fes 원종양유전자 LCR은 작동가능하게 연결된 코딩 서열의 발현을 증진시키는 예시적인 LCR이다. 코딩 서열의 발현은 완전한 C-fes 원종양유전자 LCR 서열을 포함하고/거나 그의 발현-조절 단편을 포함하는 C-fes 원종양유전자 LCR과 작동가능하게 연결된 경우에 증진될 수 있다. C-fes 원종양유전자 LCR은 C-fes 원종양유전자 LCR의 발현-증진 효과의 적어도 일부를 매개하는 것으로 관련 기술분야의 통상의 기술자에 의해 이해되는 DNAse 과민성 부위 (HS)를 포함한다.
다양한 실시양태에서, Ad35 벡터는 본원에 제공된 바와 같은 C-fes 원종양유전자 LCR을, 예를 들어 C-fes 원종양유전자 LCR 및 임의로 인간 게놈에서 C-fes 원종양유전자 LCR과 전형적으로 작동가능하게 연결된 유전자의 프로모터를 포함하는 페이로드에 포함할 수 있다. 다양한 실시양태에서, C-fes 원종양유전자 LCR과 작동가능하게 연결된 유전자는 FES (15:90,884,420-90,895,775)이다. 다양한 실시양태에서, FES 프로모터는 100 bp, 200 bp, 300 bp, 400 bp, 500 bp, 1.0 kb, 1.5 kb, 2.0 kb, 2.5 kb, 3.0 kb, 4.0 kb, 또는 5.0 kb 이상의 총 길이를 가질 수 있다. 다양한 실시양태에서, FES 프로모터는, 예를 들어 참조 게놈에서 FES의 상류, 예를 들어 그의 제1 코딩 뉴클레오티드의 바로 상류인 상응하는 핵산 서열과 적어도 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 동일성을 갖는 적어도 100 bp, 200 bp, 300 bp, 400 bp, 500 bp, 1.0 kb, 1.5 kb, 2.0 kb, 2.5 kb, 3.0 kb, 4.0 kb, 또는 5.0 kb를 포함한다. 일부 실시양태에서, 인간 게놈에서 C-fes 원종양유전자 LCR과 전형적으로 작동가능하게 연결된 유전자의 코딩 서열의 제1 코딩 뉴클레오티드는 염색체 15 - NC_000015.10 (90885046)에서의 FES의 제1 코딩 뉴클레오티드이다.
다양한 실시양태에서, C-fes 원종양유전자 LCR, 예컨대 긴 C-fes 원종양유전자 LCR은 대식세포 및 호중구를 포함한 골수 세포에서 작동가능하게 연결된 코딩 서열의 발현을 유발한다. 다양한 실시양태에서, 작동가능하게 연결된 코딩 서열은 본원에 제시되거나 또는 관련 기술분야에 달리 공지된 바와 같이 FES 프로모터와 또한 작동가능하게 연결된다.
(IV) 긴 LCR과 작동가능하게 연결된 코딩 서열
(IV-b) 단백질 요법, 예를 들어 단백질/효소 대체 요법
특정한 실시양태에서, 긴 LCR과 작동가능하게 연결된 코딩 서열은 치료 단백질을 코딩하는 트랜스진을 포함한다. 코딩 서열은 본원에 기재된 바와 같은 1종 이상의 치료 단백질을 코딩하는 핵산 서열 (폴리뉴클레오티드 또는 뉴클레오티드 서열과 상호교환가능하게 사용됨)을 지칭한다. 이러한 정의는 다양한 서열 다형성, 돌연변이, 및/또는 서열 변이체를 포함하며, 여기서 이러한 변경은 코딩된 1종 이상의 치료 단백질의 기능에 실질적으로 영향을 미치지 않는다. 코딩 서열 또는 "유전자"는 코딩 서열뿐만 아니라 조절 영역, 예컨대 프로모터, 인핸서, 및 종결 영역을 포함할 수 있다. 상기 용어는 mRNA 전사체로부터 스플라이싱된 모든 인트론 및 다른 DNA 서열을, 대안적 스플라이스 부위로부터 생성된 변이체와 함께 추가로 포함할 수 있다. 분자를 코딩하는 유전자 서열은 1종 이상의 치료 단백질의 발현을 지시하는 DNA 또는 RNA일 수 있다. 이들 핵산 서열은 RNA로 전사되는 DNA 가닥 서열 또는 단백질로 번역되는 RNA 서열일 수 있다. 핵산 서열은 전장 핵산 서열뿐만 아니라 전장 단백질로부터 유래된 비-전장 서열 둘 다를 포함한다. 서열은 또한 특정 세포 유형에서 코돈 선호도를 제공하기 위해 도입될 수 있는 천연 서열 또는 서열들의 축중성 코돈을 포함할 수 있다.
1종 이상의 치료 단백질을 코딩하는 유전자 서열은 관련 아미노산 서열로부터 합성 또는 재조합 방법에 의해 용이하게 제조될 수 있다. 특정한 실시양태에서, 이들 서열 중 임의의 것을 코딩하는 유전자 서열은 또한 서열을 코딩하는 유전자 서열의 용이한 절제 및 상이한 서열을 코딩하는 또 다른 유전자 서열로의 대체를 제공하기 위해 코딩 서열의 5' 및/또는 3' 단부에 1개 이상의 제한 효소 부위를 가질 수 있다. 특정한 실시양태에서, 서열을 코딩하는 유전자 서열은 포유동물 세포에서의 발현을 위해 코돈 최적화될 수 있다. 치료 단백질에 대한 코딩 서열은 본원에서 치료 유전자로 지칭된다.
치료 유전자는, 특정한 실시양태에서, 유전되는 상태에 대해 치료상 유효한 반응을 제공하도록 선택될 수 있다. 특정한 실시양태에서, 상태는 그레이브스병, 류마티스 관절염, 악성 빈혈, 다발성 경화증 (MS), 염증성 장 질환, 전신 홍반성 루푸스 (SLE), 아데노신 데아미나제 결핍 (ADA-SCID) 또는 중증 복합 면역결핍 질환 (SCID), 비스코트-알드리치 증후군 (WAS), 만성 육아종성 질환 (CGD), 판코니 빈혈 (FA), 배튼병, 부신백질이영양증 (ALD) 또는 이염성 백질이영양증 (MLD), 근육 이영양증, 폐포 단백증 (PAP), 피루베이트 키나제 결핍, 슈바크만-다이아몬드-블랙판 빈혈, 선천성 이상각화증, 낭성 섬유증, 파킨슨병, 알츠하이머병 또는 근위축성 측삭 경화증 (루게릭병)일 수 있다. 특정한 실시양태에서, 상태에 따라, 치료 유전자는 단백질을 코딩하는 유전자 및/또는 기능이 중단된 유전자일 수 있다.
예시적인 치료 유전자 및 유전자 생성물은 CD4, CD5, CD7, CD52 등에 대한 항체; 항체; IL1, IL2, IL6에 대한 항체; 자가반응성 T 세포 상에 특이적으로 존재하는 TCR에 대한 항체; IL4; IL10; IL12; IL13; IL1Ra; sIL1RI; sIL1RII; TNF에 대한 항체; ABCA3; ABCD1; ADA; AK2; APP; 아르기나제; 아릴술파타제 A; A1AT; CD3D; CD3E; CD3G; CD3Z; CFTR; CHD7; 키메라 항원 수용체 (CAR); CIITA; CLN3; 보체 인자, CORO1A; CTLA; C1 억제제; C9ORF72; DCLRE1B; DCLRE1C; 디코이 수용체; DKC1; DRB1*1501/DQB1*0602; 디스트로핀; 효소; 인자 VIII, FANC 패밀리 유전자 (FancA, FancB, FancC, FancD1 (BRCA2), FancD2, FancE, FancF, FancG, FancI, FancJ (BRIP1), FancL, FancM, FancN (PALB2), FancO (RAD51C), FancP (SLX4), FancQ (ERCC4), FancR (RAD51), FancS (BRCA1), FancT (UBE2T), FancU (XRCC2), FancV (MAD2L2), 및 FancW (RFWD3)); Fas L; FUS; GATA1; 글로빈 패밀리 유전자 (즉 γ-글로빈); F8; 글루타미나제; HBA1; HBA2; HBB; IL7RA; JAK3; LCK; LIG4; LRRK2; NHEJ1; NLX2.1; 중화 항체; ORAI1; PARK2; PARK7; phox; PINK1; PNP; PRKDC; PSEN1; PSEN2; PTPN22; PTPRC; P53; 피루베이트 키나제; RAG1; RAG2; RFXANK; RFXAP; RFX5; RMRP; 리보솜 단백질 유전자; SFTPB; SFTPC; SOD1; 가용성 CD40; STIM1; sTNFRI; sTNFRII; SLC46A1; SNCA; TDP43; TERT; TERC; TINF2; 유비퀼린 2; WAS; WHN; ZAP70; γC; 및 본원에 기재된 다른 치료 유전자를 포함한다.
치료 유효량은 면역 및 다른 혈액 세포 및/또는 소교 세포에 기능을 제공할 수 있거나, 또는 대안적으로-치료되는 상태에 따라-림프구 활성화를 억제하고/거나, 림프구에서 아폽토시스를 유도하고/거나, 림프구의 다양한 하위세트를 제거하고/거나, T 세포 활성화를 억제하고/거나, 자가반응성 T 세포를 제거 또는 억제하고/거나, Th-2 또는 Th-1 림프구 활성을 억제하고/거나, IL-1 또는 TNF를 길항하고/거나, 염증을 감소시키고/거나, 자극제에 대한 선택적 관용을 유도하고/거나, 면역-매개 상태를 감소 또는 제거하고/거나; 면역-매개된 상태의 증상을 감소 또는 제거할 수 있다. 치료 유효량은 또한 기능적 DNA 복구 메카니즘; 계면활성제 단백질 발현; 텔로미어 유지; 리소솜 기능; 지질 또는 다른 단백질, 예컨대 아밀로이드의 분해를 제공할 수 있고/거나; 리보솜 기능을 허용할 수 있고/거나; 그렇지 않으면 다른 백혈구 유형의 대식세포와 같이 발생하지 않을 성숙 혈액 세포 계통의 발생을 허용할 수 있다.
또 다른 예로서, 치료 유전자는 적혈구 및 응고와 관련된 질환에 대한 치료상 유효한 반응을 제공하도록 선택될 수 있다. 특정한 실시양태에서, 질환은 지중해빈혈과 같은 혈색소병증, 또는 겸상 적혈구 질환/형질이다. 치료 유전자는, 예를 들어 헤모글로빈의 생산을 유도 또는 증가시키거나; β-글로빈, γ-글로빈, 또는 α-글로빈의 생산을 유도 또는 증가시키거나; 또는 신체 내 세포에 대한 산소의 이용가능성을 증가시키는 유전자일 수 있다. 치료 유전자는 예를 들어 HBB 또는 CYB5R3일 수 있다. 예시적인 유효 치료는, 예를 들어 환자에서 혈액 세포 수를 증가시키거나, 혈액 세포 기능을 개선시키거나, 또는 세포의 산소화를 증가시킬 수 있다. 또 다른 특정한 실시양태에서, 질환은 혈우병이다. 치료 유전자는, 예를 들어 응고/응고 인자 VIII 또는 응고/응고 인자 IX의 생산을 증가시키는 유전자, 응고 인자 VIII 또는 응고 인자 IX의 정상 버전의 생산을 유발하는 유전자, 응고/응고 인자 VIII 또는 응고/응고 인자 IX에 대한 항체의 생산을 감소시키는 유전자, 또는 혈병의 적절한 형성을 유발하는 유전자일 수 있다. 예시적인 치료 유전자는 F8 및 F9를 포함한다. 예시적인 유효 치료는, 예를 들어 응고/응고 인자 VIII 및 IX의 생산을 증가 또는 유도하거나; 응고/응고 인자 VIII 및 IX의 기능을 개선시키거나, 또는 대상체에서 응고 시간을 감소시킬 수 있다.
하기 참고문헌은 기능적 글로빈 유전자의 특정한 예시적인 서열을 기재한다. 참고문헌 1-4는 α-유형 글로빈 서열에 관한 것이고, 참고문헌 4-12는 β-유형 글로빈 서열 (β 및 γ 글로빈 서열 포함)에 관한 것이다: (1) 진뱅크 수탁 번호 Z84721 (1997년 3월 19일); (2) 진뱅크 수탁 번호 NM_000517 (2000년 10월 31일); (3) Hardison et al., J. Mol. Biol. 222(2):233-249, 1991; (4) A Syllabus of Human Hemoglobin Variants (1996), by Titus et al., published by The Sickle Cell Anemia Foundation in Augusta, GA (온라인 globin.cse.psu.edu에서 이용가능함); (5) 진뱅크 수탁 번호 J00179 (1993년 8월 26일); (6) Tagle et al., Genomics 13(3):741-760, 1992; (7) Grovsfeld et al., Cell 51(6):975-985, 1987; (8) Li et al., Blood 93(7):2208-2216, 1999; (9) Gorman et al., J. Biol. Chem .275(46):35914-35919, 2000; (10) Slightom et al., Cell 21(3):627-638, 1980; (11) Fritsch et al., Cell 19(4): 959-972, 1980; (12) Marotta et al., J. Biol. Chem. 252(14):5040-5053, 1977. 글로빈을 코딩하는 유전자의 추가의 코딩 및 비-코딩 영역에 대해서는, 예를 들어 문헌 [Marotta et al., Prog. Nucleic Acid Res. Mol. Biol. 19, 165-175, 1976, Lawn et al., Cell 21 (3), 647-651, 1980, 및 Sadelain et al., PNAS. 92:6728-6732, 1995]을 참조한다.
헤모글로빈 서브유닛 β의 예시적인 아미노산 서열은 예를 들어 NCBI 수탁 번호 P68871에 제공된다. β-글로빈에 대한 예시적인 아미노산 서열은 예를 들어 NCBI 수탁 번호 NP_000509에 제공된다.
또 다른 예로서, 치료 유전자는 리소솜 축적 장애에 대한 치료상 유효한 반응을 제공하도록 선택될 수 있다. 특정한 실시양태에서, 리소솜 축적 장애는 뮤코폴리사카라이드증 (MPS), 유형 I; MPS II 또는 헌터 증후군; MPS III 또는 산필리포 증후군; MPS IV 또는 모르키오 증후군; MPS V; MPS VI 또는 마로토-라미 증후군; MPS VII 또는 슬라이 증후군; α-만노시드축적증; β-만노시드축적증; GSDI, 폰 기에르케병, 또는 테이 삭스로도 공지된 글리코겐 축적 질환 유형 I; 폼페병; 고셔병; 파브리병이다. 치료 유전자는, 예를 들어 효소를 코딩하거나 또는 그의 생산을 유도하거나, 또는 달리 리소솜에서 뮤코폴리사카라이드의 분해를 유발하는 유전자일 수 있다. 예시적인 치료 유전자는 IDUA 또는 이두로니다제, IDS, GNS, HGSNAT, SGSH, NAGLU, GUSB, GALNS, GLB1, ARSB, 및 HYAL1을 포함한다. 리소솜 축적 장애에 대한 예시적인 유효 유전자 요법은, 예를 들어 리소솜에서 다양한 물질의 분해를 담당하는 효소를 코딩하거나 또는 그의 생산을 유도할 수 있고; 머리 (예를 들어, 대두증), 간, 비장, 혀, 또는 성대를 포함한 다양한 기관에서 종창을 감소, 제거, 방지, 또는 지연시킬 수 있고; 뇌 내의 유체를 감소시킬 수 있고; 심장 판막 이상을 감소시킬 수 있고; 기도 협착을 방지 또는 확장시킬 수 있고, 관련 상부 호흡기 상태 예컨대 감염 및 수면 무호흡을 방지할 수 있고; 뉴런의 파괴 및/또는 관련 증상을 감소, 제거, 방지, 또는 지연시킬 수 있다.
또 다른 예로서, 치료 유전자는 과다증식성 질환에 대한 치료상 유효한 반응을 제공하도록 선택될 수 있다. 특정한 실시양태에서, 과다증식성 질환은 암이다. 치료 유전자는, 예를 들어 종양 억제 유전자, 아폽토시스를 유도하는 유전자, 효소를 코딩하는 유전자, 항체를 코딩하는 유전자, 또는 호르몬을 코딩하는 유전자일 수 있다. 예시적인 치료 유전자 및 유전자 생성물은 (본원의 다른 곳에 열거된 것에 더하여) 101F6, 123F2 (RASSF1), 53BP2, abl, ABLI, ADP, aFGF, APC, ApoAI, ApoAIV, ApoE, ATM, BAI-1, BDNF, 베타*(BLU), bFGF, BLC1, BLC6, BRCA1, BRCA2, CBFA1, CBL, C-CAM, CNTF, COX-1, CSFIR, CTS-1, 시토신 데아미나제, DBCCR-1, DCC, Dp, DPC-4, E1A, E2F, EBRB2, erb, ERBA, ERBB, ETS1, ETS2, ETV6, Fab, FCC, FGF, FGR, FHIT, fms, FOX, FUS1, FYN, G-CSF, GDAIF, 유전자 21 (NPRL2), 유전자 26 (CACNA2D2), GM-CSF, GMF, gsp, HCR, HIC-1, HRAS, hst, IGF, IL-1, IL-2, IL-3, IL-5, IL-6, IL-7, IL-8, IL-9, IL-11, ING1, 인터페론 α, 인터페론 β, 인터페론 γ, IRF-1, JUN, KRAS, LUCA-1 (HYAL1), LUCA-2 (HYAL2), LYN, MADH4, MADR2, MCC, mda7, MDM2, MEN-I, MEN-II, MLL, MMAC1, MYB, MYC, MYCL1, MYCN, neu, NF-1, NF-2, NGF, NOEY1, NOEY2, NRAS, NT3, NT5, OVCA1, p16, p21, p27, p57, p73, p300, PGS, PIM1, PL6, PML, PTEN, raf, Rap1A, ras, Rb, RB1, RET, rks-3, ScFv, scFV ras, SEM A3, SRC, TALI, TCL3, TFPI, 트롬보스폰딘, 티미딘 키나제, TNF, TP53, trk, T-VEC, VEGF, VHL, WT1, WT-1, YES, 및 zac1을 포함한다. 예시적인 유효 유전자 요법은 종양을 억제 또는 제거하거나, 암 세포 수의 감소, 종양 크기의 감소를 발생시키거나, 종양 성장을 둔화 또는 제거하거나, 또는 종양에 의해 유발된 증상을 완화시킬 수 있다.
또 다른 예로서, 치료 유전자는 감염성 질환에 대한 치료상 유효한 반응을 제공하도록 선택될 수 있다. 특정한 실시양태에서, 감염성 질환은 인간 면역결핍 바이러스 (HIV)이다. 치료 유전자는, 예를 들어 면역 세포를 HIV 감염에 대해 저항성이 되게 하는 유전자일 수 있거나, 또는 면역 재구축, 면역 세포에 의해 발현되는 단백질을 코딩하는 유전자의 다형성, 환자에서 발현되지 않는 감염과 싸우기에 유리한 유전자, 감염원, 수용체 또는 보조수용체를 코딩하는 유전자; 수용체 또는 보조수용체에 대한 리간드를 코딩하는 유전자; 특정 전사 인자의 작용을 차단하기 위한 리보자임, 안티센스 RNA, 소형 간섭 RNA (siRNA) 또는 디코이 RNA를 코딩하는 유전자를 포함한, 바이러스 복제에 필수적인 바이러스 및 세포 유전자; 우성 음성 바이러스 단백질, 세포내 항체, 인트라카인 및 자살 유전자를 코딩하는 유전자를 통해 면역 세포가 바이러스를 효과적으로 중화시킬 수 있게 하는 것일 수 있다. 예시적인 치료 유전자 및 유전자 생성물은 α2β1; αvβ3; αvβ5; αvβ63; BOB/GPR15; Bonzo/STRL-33/TYMSTR; CCR2; CCR3; CCR5; CCR8; CD4; CD46; CD55; CXCR4; 아미노펩티다제-N; HHV-7; ICAM; ICAM-1; PRR2/HveB; HveA; α-디스트로글리칸; LDLR/α2MR/LRP; PVR; PRR1/HveC; 및 라미닌 수용체를 포함한다. HIV의 치료를 위한 치료 유효량은, 예를 들어 HIV에 대한 대상체의 면역을 증가시키거나, AIDS 또는 HIV와 연관된 증상을 호전시키거나, 또는 대상체에서 HIV에 대한 선천성 또는 적응성 면역 반응을 유도할 수 있다. HIV에 대한 면역 반응은 항체 생산을 포함할 수 있고, AIDS의 예방을 발생시킬 수 있고/거나 대상체의 AIDS 또는 HIV 감염의 증상을 호전시킬 수 있거나, 또는 HIV 감염성 및/또는 병독성을 감소 또는 제거할 수 있다.
(IV-c) 항체, CAR, 및 TCR
치료 유전자 및/또는 유전자 생성물에 더하여, 코딩 서열은 또한 치료 분자, 예컨대 항체, 1종 이상의 암 항원에 특이적인 키메라 항원 수용체 분자 및/또는 1종 이상의 암 항원에 특이적인 T-세포 수용체를 코딩할 수 있다.
원치않는 세포 유형, 예컨대 암 세포를 표적화하고 사멸시키도록 면역계의 T 세포를 유전자 조작하는 것에서 유의한 진전이 이루어졌다. 많은 이들 T 세포는 키메라 항원 수용체 (CAR) 구축물을 발현하도록 유전자 조작되었다. CAR은 유전자 변형된 T 세포가 암 세포를 인식하고 사멸시키도록 하는 여러 별개의 하위성분을 포함하는 단백질이다. 하위성분은 적어도 세포외 성분 및 세포내 성분을 포함한다.
세포외 성분은 원치않는 세포의 표면 상에 우선적으로 존재하는 마커에 특이적으로 결합하는 결합 도메인을 포함한다. 결합 도메인이 이러한 마커에 결합하는 경우에, 세포내 성분은 T 세포가 결합된 암 세포를 파괴하도록 지시한다. 결합 도메인은 전형적으로 모노클로날 항체 (mAb)로부터 유래된 단일-쇄 가변 단편 (scFv)이지만, 항체-유사 항원 결합 부위를 포함하는 다른 포맷에 기초할 수 있다.
세포내 성분은 이펙터 도메인의 포함에 기초하여 활성화 신호를 제공한다. 제1 세대 CAR은 이펙터 도메인으로서 CD3ζ의 세포질 영역을 이용하였다. 제2 세대 CAR은 CD3ζ를 분화 클러스터 28 (CD28) 또는 4-1BB (CD137)와 조합하여 이용한 한편, 제3 세대 CAR은 CD3ζ를 세포내 이펙터 도메인 내의 CD28 및 4-1BB와 조합하여 이용하였다.
CAR은 일반적으로 또한 분자 내에서 다양한 목적을 위해 사용되는 1개 이상의 링커 서열을 포함한다. 예를 들어, 막횡단 도메인은 CAR의 세포외 성분을 세포내 성분에 연결하기 위해 사용될 수 있다. 결합 도메인에 대해 막-근위인 스페이서 영역으로서 종종 지칭되는 가요성 링커 서열은 결합 도메인과 세포 막 사이에 추가의 거리를 생성하는데 사용될 수 있다. 이는 막에의 근접성에 기초하여 결합에 대한 입체 장애를 감소시키는데 유익할 수 있다. 표적화되는 세포 마커에 따라, 더 조밀한 스페이서 또는 더 긴 스페이서가 사용될 수 있다. 다른 잠재적 CAR 하위성분은 본원의 다른 곳에 보다 상세히 기재되어 있다. CAR의 성분은 이제 하기와 같이 추가로 상세하게 기재된다: 결합 도메인; 세포내 신호전달 성분; 링커; 막횡단 도메인; 접합부 아미노산; 및 제어 특색 포함 태그 카세트. 결합 도메인에 관한 설명은 또한 치료 분자로서의 항체와 관련된다.
결합 도메인. 결합 도메인은 세포 마커에 결합하여 복합체를 형성하는 임의의 물질을 포함한다. 결합 도메인의 선택은 표적 세포의 표면을 규정하는 세포 마커의 유형 및 수에 좌우될 수 있다. 결합 도메인의 예는 세포 마커 리간드, 수용체 리간드, 항체, 펩티드, 펩티드 압타머, 수용체 (예를 들어, T 세포 수용체), 키메라 항원 수용체 (CAR), 또는 그의 조합 및 조작된 단편 또는 포맷을 포함한다.
항체는 결합 도메인의 한 예이고, 세포 마커에 특이적으로 결합하는 전체 항체 또는 항체의 결합 단편, 예를 들어 Fv, Fab, Fab', F(ab')2, 및 단일 쇄 (sc) 형태 및 그의 단편을 포함한다. 항체 또는 항원 결합 단편은 폴리클로날 항체, 모노클로날 항체, 인간 항체, 인간화 항체, 합성 항체, 비-인간 항체, 재조합 항체, 키메라 항체, 이중특이적 항체, 미니바디, 및 선형 항체의 전부 또는 일부를 포함할 수 있다.
항체는 2개의 유전자, 중쇄 유전자 및 경쇄 유전자로부터 생산된다. 일반적으로, 항체는 중쇄의 2개의 동일한 카피 및 경쇄의 2개의 동일한 카피를 포함한다. 가변 중쇄 및 가변 경쇄 내에서, 상보성 결정 영역 (CDR)으로 지칭되는 절편은 에피토프 결합을 좌우한다. 각각의 중쇄는 3개의 CDR (즉, CDRH1, CDRH2, 및 CDRH3)을 갖고, 각각의 경쇄는 3개의 CDR (즉, CDRL1, CDRL2, 및 CDRL3)을 갖는다. CDR 영역은 프레임워크 잔기 (FR)에 플랭킹된다.
일부 경우에, 결합 도메인은 궁극적으로 사용될 동일한 종으로부터 유래되는 것이 유익하다. 예를 들어, 인간에서의 사용을 위해, 항원 결합 도메인은 인간 항체, 인간화 항체, 또는 그의 단편 또는 조작된 형태를 포함하는 것이 유익할 수 있다. 인간 기원으로부터의 항체 또는 인간화 항체는 인간에서 저하된 면역원성을 갖거나 또는 면역원성을 갖지 않고, 비-인간 항체와 비교하여 더 낮은 수의 비-면역원성 에피토프를 갖는다. 항체 및 그의 조작된 단편은 일반적으로 인간 대상체에서 감소된 수준의 항원성을 갖거나 또는 갖지 않도록 선택될 것이다.
특정한 실시양태에서, 결합 도메인은 인간화 항체 또는 그의 조작된 단편을 포함한다. 특정한 실시양태에서, 비-인간 항체는 인간화 항체이며, 여기서 항체의 적어도 1개의 아미노산 잔기는 인간에서 자연적으로 생산된 항체 또는 그의 단편과의 유사성을 증가시키도록 변형된다. 이들 비인간 아미노산 잔기는 종종 "유입" 잔기로 지칭되며, 이는 전형적으로 "유입" 가변 도메인으로부터 취해진다. 본원에 제공된 바와 같이, 인간화 항체 또는 항체 단편은 비인간 이뮤노글로불린 분자로부터의 1개 이상의 CDR 및 프레임워크 영역을 포함하며, 여기서 프레임워크를 포함한 아미노산 잔기는 완전히 또는 대부분 인간 배선으로부터 유래된다. 한 측면에서, 항원 결합 도메인은 인간화된다. 인간화 항체는 CDR-그라프팅 (예를 들어, 유럽 특허 번호 EP 239,400; WO 91/09967; 및 US 5,225,539, US 5,530,101, 및 US 5,585,089 참조), 베니어링 또는 재표면화 (예를 들어, EP 592,106 및 EP 519,596; 문헌 [Padlan, Molecular Immunology, 28(4/5):489-498, 1991; Studnicka et al., Protein Engineering, 7(6):805-81, 19944; 및 Roguska et al., PNAS, 91:969-973, 1994] 참조), 쇄 셔플링 (예를 들어, 미국 특허 번호 5,565,332 참조), 및 예를 들어 미국 공개 번호 2005/0042664, 미국 공개 번호 2005/0048617, 미국 특허 번호 6,407,213, 미국 특허 번호 5,766,886, WO 9317105, 문헌 [Tan et al., J. Immunol., 169:1119-25, 2002, Caldas et al., Protein Eng., 13(5):353-60, 2000, Morea et al., Methods, 20(3):267-79, 2000, Baca et al., J. Biol. Chem., 272(16): 10678-84, 1997, Roguska et al., Protein Eng., 9(10):895-904, 1996, Couto et al., Cancer Res., 55 (23 Supp):5973s-5977s, 1995, Couto et al., Cancer Res., 55(8):1717-22, 1995, Sandhu, Gene, 150(2):409-10, 1994, 및 Pedersen et al., J. Mol. Biol., 235(3):959-73, 1994]에 개시된 기술을 비롯한 관련 기술분야에 공지된 다양한 기술을 사용하여 생산될 수 있다. 종종, 프레임워크 영역 내의 프레임워크 잔기는 세포 마커 결합을 변경, 예를 들어 개선시키기 위해 CDR 공여자 항체로부터의 상응하는 잔기로 치환될 것이다. 이들 프레임워크 치환은 관련 기술분야에 널리 공지된 방법에 의해, 예를 들어 세포 마커 결합에 중요한 프레임워크 잔기를 확인하기 위한 CDR 및 프레임워크 잔기의 상호작용의 모델링 및 특정한 위치에서 비통상적인 프레임워크 잔기를 확인하기 위한 서열 비교에 의해 확인된다. (예를 들어, 미국 특허 번호 5,585,089; 및 문헌 [Riechmann et al., Nature, 332:323, 1988] 참조).
세포 마커에 특이적으로 결합하는 결합 도메인을 갖는 항체는 관련 기술분야의 통상의 기술자에게 공지된 바와 같은 모노클로날 항체를 수득하는 방법, 파지 디스플레이 방법, 인간 또는 인간화 항체를 생성하는 방법, 또는 항체를 생산하도록 조작된 트랜스제닉 동물 또는 식물을 사용하는 방법을 사용하여 제조될 수 있다 (예를 들어, US 6,291,161 및 US 6,291,158 참조). 부분 또는 완전 합성 항체의 파지 디스플레이 라이브러리가 이용가능하고, 세포 마커에 결합할 수 있는 항체 또는 그의 단편에 대해 스크리닝될 수 있다. 예를 들어, 결합 도메인은 세포 마커에 특이적으로 결합하는 Fab 단편에 대해 Fab 파지 라이브러리를 스크리닝함으로써 확인될 수 있다 (문헌 [Hoet et al., Nat. Biotechnol. 23:344, 2005] 참조). 인간 항체의 파지 디스플레이 라이브러리가 또한 이용가능하다. 추가적으로, 편리한 시스템 (예를 들어, 마우스, HuMAb 마우스® (젠팜 인터내셔널 인크.(GenPharm Int'l. Inc.), 캘리포니아주 마운틴 뷰), TC 마우스® (키린 파마 캄파니 리미티드(Kirin Pharma Co. Ltd.), 일본 도쿄), KM-마우스® (메다렉스, 인크.(Medarex, Inc.), 뉴저지주 프린스턴), 라마, 닭, 래트, 햄스터, 토끼 등)에서 면역원으로서 세포 마커를 사용하는 하이브리도마 개발을 위한 전통적인 전략을 사용하여 결합 도메인을 개발할 수 있다. 일단 확인되면, 항체의 아미노산 서열 및 항체를 코딩하는 유전자 서열을 단리 및/또는 결정할 수 있다.
일부 경우에, scFv는 관련 기술분야에 공지된 방법에 따라 제조될 수 있다 (예를 들어, 문헌 [Bird et al., Science 242:423-426 1988; 및 Huston et al., Proc. Natl. Acad. Sci. USA 85:5879-5883, 1988] 참조). ScFv 분자는 가요성 폴리펩티드 링커를 사용하여 항체의 VH 및 VL 영역을 함께 연결함으로써 생산될 수 있다. 짧은 폴리펩티드 링커가 사용되는 경우 (예를 들어, 5-10개 아미노산), 쇄내 폴딩이 방지된다. 2개의 가변 영역을 함께 모아 기능적 에피토프 결합 부위를 형성하기 위해 쇄간 폴딩이 또한 요구된다. 링커 배향 및 크기의 예에 대해서는, 예를 들어 문헌 [Hollinger et al., Proc Natl Acad. Sci. U.S.A. 90:6444-6448, 1993], 미국 공개 번호 2005/0100543, 미국 공개 번호 2005/0175606, 미국 공개 번호 2007/0014794, 및 WO2006/020258 및 WO2007/024715를 참조한다. 보다 특히, scFv의 VL 및 VH를 연결하는데 사용되는 링커 서열은 일반적으로 5 내지 35개 아미노산 길이이다. 특정한 실시양태에서, VL-VH 링커는 5 내지 35개, 10 내지 30개의 아미노산 또는 15 내지 25개의 아미노산을 포함한다. 링커 길이의 변동은 활성을 유지 또는 증진시켜, 활성 연구에서 우수한 효능을 발생시킬 수 있다. scFv는 CAR의 결합 도메인으로서 통상적으로 사용된다.
항체-기반 결합 도메인 포맷의 추가의 예는 scFv-기반 그라바바디 및 가용성 VH 도메인 항체를 포함한다. 이들 항체는 오직 중쇄 가변 영역만을 사용하여 결합 영역을 형성한다. 예를 들어, 문헌 [Jespers et al., Nat. Biotechnol. 22:1161, 2004; Cortez-Retamozo et al., Cancer Res. 64:2853, 2004; Baral et al., Nature Med. 12:580, 2006; 및 Barthelemy et al., J. Biol. Chem. 283:3639, 2008]을 참조한다.
특정한 실시양태에서, 본 개시내용의 결합 도메인 내의 VL 영역은 공지된 모노클로날 항체의 VL로부터 유래되거나 또는 이를 기초로 하고, 공지된 모노클로날 항체의 VL과 비교했을 때 1개 이상 (예를 들어, 2, 3, 4, 5, 6, 7, 8, 9, 10개)의 삽입, 1개 이상 (예를 들어, 2, 3, 4, 5, 6, 7, 8, 9, 10개)의 결실, 1개 이상 (예를 들어, 2, 3, 4, 5, 6, 7, 8, 9, 10개)의 아미노산 치환 (예를 들어, 보존적 아미노산 치환), 또는 상기 언급된 변화의 조합을 함유한다. 삽입, 결실 또는 치환은 VL 영역의 아미노- 또는 카르복시-말단 또는 양쪽 단부를 포함하여 이러한 영역 내의 임의의 곳에서 이루어질 수 있고, 단 각각의 CDR은 0개의 변화 또는 최대 1, 2, 또는 3개의 변화를 포함하고, 변형된 VL 영역을 함유하는 결합 도메인은 여전히 야생형 결합 도메인과 유사한 친화도로 그의 표적에 특이적으로 결합할 수 있다.
특정한 실시양태에서, 본 개시내용의 결합 도메인 VH 영역은 공지된 모노클로날 항체의 VH로부터 유래되거나 또는 이를 기초로 할 수 있고, 공지된 모노클로날 항체의 VH와 비교했을 때 1개 이상 (예를 들어, 2, 3, 4, 5, 6, 7, 8, 9, 10개)의 삽입, 1개 이상 (예를 들어, 2, 3, 4, 5, 6, 7, 8, 9, 10개)의 결실, 1개 이상 (예를 들어, 2, 3, 4, 5, 6, 7, 8, 9, 10개)의 아미노산 치환 (예를 들어, 보존적 아미노산 치환 또는 비-보존적 아미노산 치환), 또는 상기 언급된 변화의 조합을 함유할 수 있다. 삽입, 결실 또는 치환은 VH 영역의 아미노- 또는 카르복시-말단 또는 양쪽 단부를 포함하여 이러한 영역 내의 임의의 곳에서 이루어질 수 있고, 단 각각의 CDR은 0개의 변화 또는 최대 1, 2, 또는 3개의 변화를 포함하고, 변형된 VH 영역을 함유하는 결합 도메인은 여전히 야생형 결합 도메인과 유사한 친화도로 그의 표적에 특이적으로 결합할 수 있다.
특정한 실시양태에서, 결합 도메인은 경쇄 가변 영역 (VL)의 아미노산 서열 또는 중쇄 가변 영역 (VH), 또는 둘 다에 대해 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 적어도 99.5%, 또는 100% 동일한 서열이거나 또는 이를 포함하며, 여기서 각각의 CDR은 관심 세포 마커에 특이적으로 결합하는 모노클로날 항체 또는 그의 단편 또는 유도체로부터 0개의 변화 또는 최대 1, 2, 또는 3개의 변화를 포함한다.
결합 도메인의 대안적 공급원은 무작위 펩티드 라이브러리를 코딩하는 서열 또는 대안적 비-항체 스캐폴드, 예컨대 단일 쇄 (sc) T-세포 수용체 (scTCR) (예를 들어, 문헌 [Lake et al., Int. Immunol. 11:745, 1999; Maynard et al., J. Immunol. Methods 306:51, 2005]; US 8,361,794 참조), 피브리노겐 도메인 (예를 들어, 문헌 [Weisel et al., Science 230:1388, 1985] 참조), 쿠니츠 도메인 (예를 들어, US 6,423,498 참조), 설계된 안키린 반복 단백질 (DARPin; 문헌 [Binz et al., J. Mol. Biol. 332:489, 2003 및 Binz et al., Nat. Biotechnol. 22:575, 2004]), 피브로넥틴 결합 도메인 (애드넥틴 또는 모노바디; 문헌 [Richards et al., J. Mol. Biol. 326:1475, 2003; Parker et al., Protein Eng. Des. Selec. 18:435, 2005 및 Hackel et al., J. Mol. Biol. 381:1238-1252, 2008]), 시스테인-노트 미니단백질 (Vita et al., Proc. Nat'l. Acad. Sci. (USA) 92:6404-6408, 1995; Martin et al., Nat. Biotechnol. 21:71, 2002 및 Huang et al., Structure 13:755, 2005), 테트라트리코펩티드 반복 도메인 (Main et al., Structure 11:497, 2003 및 Cortajarena et al., ACS Chem. Biol. 3:161, 2008), 류신-풍부 반복 도메인 (Stumpp et al., J. Mol. Biol. 332:471, 2003), 리포칼린 도메인 (예를 들어, WO 2006/095164, 문헌 [Beste et al., Proc. Nat'l. Acad. Sci. (USA) 96:1898, 1999 및 Schoenfeld et al., Proc. Nat'l. Acad. Sci. (USA) 106:8198, 2009] 참조), V-유사 도메인 (예를 들어, US 2007/0065431 참조), C-유형 렉틴 도메인 (Zelensky & Gready, FEBS J. 272:6179, 2005; Beavil et al., Proc. Nat'l. Acad. Sci. (USA) 89:753, 1992 및 Sato et al., Proc. Nat'l. Acad. Sci. (USA) 100:7779, 2003), 항원 결합 도메인을 갖는 mAb2 또는 Fc-영역 (Fcab™ (에프-스타 바이오테크놀로지(F-Star Biotechnology), 영국 캠브리지; 예를 들어 WO 2007/098934 및 WO 2006/072620 참조), 아르마딜로 반복 단백질 (예를 들어, 문헌 [Madhurantakam et al., Protein Sci. 21: 1015, 2012]; WO 2009/040338 참조), 아필린 (Ebersbach et al., J. Mol. Biol. 372: 172, 2007), 아피바디, 아비머, 노틴, 피노머, 아트리머, 세포독성 T-림프구 연관 단백질-4 (Weidle et al., Cancer Gen. Proteo. 10:155, 2013) 등의 루프 영역 내의 조작된 다양한 아미노산을 코딩하는 서열을 포함한다 (Nord et al., Protein Eng. 8:601, 1995; Nord et al., Nat. Biotechnol. 15:772, 1997; Nord et al., Euro. J. Biochem. 268:4269, 2001; Binz et al., Nat. Biotechnol. 23:1257, 2005; Boersma & Plueckthun, Curr. Opin. Biotechnol. 22:849, 2011).
펩티드 압타머는 양쪽 말단에서 단백질 스캐폴드에 부착된 펩티드 루프 (이는 세포 마커에 특이적임)를 포함한다. 이러한 이중 구조적 제약은 펩티드 압타머의 결합 친화도를 항체에 대등한 수준으로 증가시킨다. 가변 루프 길이는 전형적으로 8 내지 20개 아미노산이고, 스캐폴드는 안정하고, 가용성이고, 작고, 비-독성인 임의의 단백질일 수 있다. 펩티드 압타머 선택은 상이한 시스템, 예컨대 효모 2-하이브리드 시스템 (예를 들어, Gal4 효모-2-하이브리드 시스템), 또는 LexA 상호작용 트랩 시스템을 사용하여 이루어질 수 있다.
특정한 실시양태에서, 결합 도메인은 Vα/β 및 Cα/β 쇄 (예를 들어, Vα-Cα, Vβ-Cβ, Vα-Vβ)를 포함하거나 또는 세포 마커 펩티드-MHC 복합체에 특이적인 Vα-Cα, Vβ-Cβ, Vα-Vβ 쌍을 포함하는 sc T 세포 수용체 (scTCR)이다.
특정한 실시양태에서, 조작된 결합 도메인은 Vα, Vβ, Cα, 또는 Cβ로부터 유래되거나 또는 이를 기초로 하는 Vα, Vβ, Cα, 또는 Cβ 영역을 포함하고, 언급된 Vα, Vβ, Cα, 또는 Cβ와 비교했을 때 1개 이상 (예를 들어, 2, 3, 4, 5, 6, 7, 8, 9, 10개)의 삽입, 1개 이상 (예를 들어, 2, 3, 4, 5, 6, 7, 8, 9, 10개)의 결실, 1개 이상 (예를 들어, 2, 3, 4, 5, 6, 7, 8, 9, 10개)의 아미노산 치환 (예를 들어, 보존적 아미노산 치환 또는 비-보존적 아미노산 치환), 또는 상기 언급된 변화의 조합을 포함한다. 삽입, 결실 또는 치환은 VL, VH, Vα, Vβ, Cα, 또는 Cβ 영역의 아미노- 또는 카르복시-말단 또는 양쪽 단부를 포함하여 이들 영역 내의 임의의 곳에서 이루어질 수 있고, 단 각각의 CDR은 0개의 변화 또는 최대 1, 2, 또는 3개의 변화를 포함하고, 변형된 Vα, Vβ, Cα, 또는 Cβ 영역을 함유하는 표적 결합 도메인은 여전히 야생형과 유사한 친화도 및 작용으로 그의 표적에 특이적으로 결합할 수 있다.
특정한 실시양태에서, 조작된 결합 도메인은 공지되거나 확인된 결합 도메인의 아미노산 서열에 대해 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 적어도 99.5%, 또는 100% 동일한 서열을 포함하고, 여기서 각각의 CDR은 표적화된 세포 마커에 특이적으로 결합하는 공지되거나 확인된 결합 도메인 또는 그의 단편 또는 유도체로부터 0개의 변화 또는 최대 1, 2, 또는 3개의 변화를 포함한다.
주어진 CDR 또는 FR의 정확한 아미노산 서열 경계는 문헌 [Kabat et al., (1991) "Sequences of Proteins of Immunological Interest," 5th Ed. Public Health Service, National Institutes of Health, Bethesda, Md. (카바트 넘버링 스킴); Al-Lazikani et al., J Mol Biol 273: 927-948, 1997 (코티아 넘버링 스킴); Maccallum et al., J Mol Biol 262: 732-745, 1996 (접촉 넘버링 스킴); Martin et al., Proc. Natl. Acad. Sci., 86: 9268-9272, 1989 (AbM 넘버링 스킴); Lefranc et al., Dev Comp Immunol 27(1): 55-77, 2003 (IMGT 넘버링 스킴); 및 Honegger & Pluckthun, J Mol Biol 309(3): 657-670, 2001 ("Aho" 넘버링 스킴)]에 기재된 것을 포함한, 널리 공지된 다수의 스킴 중 임의의 것을 사용하여 용이하게 결정될 수 있다. 주어진 CDR 또는 FR의 경계는 확인에 사용된 스킴에 따라 달라질 수 있다. 예를 들어, 카바트 스킴은 구조적 정렬에 기초하는 반면, 코티아 스킴은 구조적 정보에 기초한다. 카바트 및 코티아 스킴 둘 다에 대한 넘버링은 가장 통상적인 항체 영역 서열 길이에 기초하며, 삽입은 삽입 문자, 예를 들어 "30a"에 의해 제공되고, 결실이 일부 항체에서 나타난다. 2개의 스킴은 상이한 위치에 특정 삽입 및 결실 ("indel")을 배치하여, 차등 넘버링을 생성한다. 접촉 스킴은 복잡한 결정 구조의 분석을 기초로 하고, 많은 측면에서 코티아 넘버링 스킴과 유사하다. 특정한 실시양태에서, 본원에 개시된 항체 CDR 서열은 카바트 넘버링에 따른다.
CAR은 특정 표적에 결합하여 반응을 도출하도록 설계된 조작된 수용체이다. CAR은 세포 상에서 발현되는 경우에 유전자 변형된 세포가 원치않는 세포, 예컨대 암 세포 또는 바이러스-감염된 세포를 인식하고 사멸시키도록 하는 여러 별개의 하위성분을 포함한다. 하위성분은 적어도 세포외 성분 및 세포내 성분을 포함한다. 세포외 성분은 원치않는 세포의 표면 상에 우선적으로 존재하는 마커에 특이적으로 결합하는 결합 도메인을 포함한다. 결합 도메인이 이러한 마커에 결합하는 경우에, 세포내 성분은 유전자 변형된 세포를 활성화시켜 결합된 세포를 파괴한다. CAR은 세포외 성분을 세포내 성분에 연결하는 막횡단 도메인, 및 CAR의 기능을 증가시킬 수 있는 다른 하위성분을 추가적으로 포함한다. 예를 들어, 1개 이상의 링커 서열, 예컨대 스페이서 영역의 포함은 CAR이 추가의 입체형태적 가요성을 갖도록 하여, 종종 표적화된 세포 마커에 결합하는 결합 도메인의 능력을 증가시킬 수 있다.
CAR의 세포외 도메인은 결합 도메인을 포함한다. 결합 도메인은 이전에 논의되었고, 항체, scFv, 리간드, 펩티드, 펩티드 압타머, 또는 수용체를 포함할 수 있다.
특정한 실시양태에서, 조작된 CAR은 공지되거나 확인된 TCR Vα, Vβ, Cα, 또는 Cβ의 아미노산 서열에 대해 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 적어도 99.5%, 또는 100% 동일한 서열을 포함하고, 여기서 각각의 CDR은 표적화된 세포 마커에 특이적으로 결합하는 TCR 또는 그의 단편 또는 유도체로부터 0개의 변화 또는 최대 1, 2, 또는 3개의 변화를 포함한다.
특정한 실시양태에서, 조작된 CAR은 공지되거나 확인된 TCR (예를 들어, 고친화도 TCR)의 Vα, Vβ, Cα, 또는 Cβ로부터 유래되거나 또는 이를 기초로 하는 Vα, Vβ, Cα, 또는 Cβ 영역을 포함하고, 공지되거나 확인된 TCR의 Vα, Vβ, Cα, 또는 Cβ와 비교했을 때 1개 이상 (예를 들어, 2, 3, 4, 5, 6, 7, 8, 9, 10개)의 삽입, 1개 이상 (예를 들어, 2, 3, 4, 5, 6, 7, 8, 9, 10개)의 결실, 1개 이상 (예를 들어, 2, 3, 4, 5, 6, 7, 8, 9, 10개)의 아미노산 치환 (예를 들어, 보존적 아미노산 치환 또는 비-보존적 아미노산 치환), 또는 상기 언급된 변화의 조합을 포함한다. 삽입, 결실 또는 치환은 Vα, Vβ, Cα, 또는 Cβ 영역의 아미노- 또는 카르복시-말단 또는 양쪽 단부를 포함하여 이들 영역 내의 임의의 곳에서 이루어질 수 있고, 단 각각의 CDR은 0개의 변화 또는 최대 1, 2, 또는 3개의 변화를 포함하고, 변형된 Vα, Vβ, Cα, 또는 Cβ 영역을 함유하는 표적 결합 도메인은 여전히 야생형과 유사한 친화도 및 작용으로 그의 표적에 특이적으로 결합할 수 있다.
특정한 실시양태에서, CAR의 결합 도메인은 경쇄 가변 영역 (VL)의 아미노산 서열 또는 중쇄 가변 영역 (VH), 또는 둘 다에 대해 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 적어도 99.5%, 또는 100% 동일한 서열이거나 또는 이를 포함하며, 여기서 각각의 CDR은 관심 세포 마커에 특이적으로 결합하는 모노클로날 항체 또는 그의 단편 또는 유도체로부터 0개의 변화 또는 최대 1, 2, 또는 3개의 변화를 포함한다.
특정한 실시양태에서, 본 개시내용의 CAR 내의 VL 영역은 공지된 모노클로날 항체의 VL로부터 유래되거나 또는 이를 기초로 하고, 공지된 모노클로날 항체의 VL과 비교했을 때 1개 이상 (예를 들어, 2, 3, 4, 5, 6, 7, 8, 9, 10개)의 삽입, 1개 이상 (예를 들어, 2, 3, 4, 5, 6, 7, 8, 9, 10개)의 결실, 1개 이상 (예를 들어, 2, 3, 4, 5, 6, 7, 8, 9, 10개)의 아미노산 치환 (예를 들어, 보존적 아미노산 치환), 또는 상기 언급된 변화의 조합을 함유한다. 삽입, 결실 또는 치환은 VL 영역의 아미노- 또는 카르복시-말단 또는 양쪽 단부를 포함하여 이러한 영역 내의 임의의 곳에서 이루어질 수 있고, 단 각각의 CDR은 0개의 변화 또는 최대 1, 2, 또는 3개의 변화를 포함하고, 변형된 VL 영역을 함유하는 결합 도메인은 여전히 야생형 결합 도메인과 유사한 친화도로 그의 표적에 특이적으로 결합할 수 있다.
특정한 실시양태에서, 본 개시내용의 CAR 내의 결합 도메인 VH 영역은 공지된 모노클로날 항체의 VH로부터 유래되거나 또는 이를 기초로 할 수 있고, 공지된 모노클로날 항체의 VH와 비교했을 때 1개 이상 (예를 들어, 2, 3, 4, 5, 6, 7, 8, 9, 10개)의 삽입, 1개 이상 (예를 들어, 2, 3, 4, 5, 6, 7, 8, 9, 10개)의 결실, 1개 이상 (예를 들어, 2, 3, 4, 5, 6, 7, 8, 9, 10개)의 아미노산 치환 (예를 들어, 보존적 아미노산 치환 또는 비-보존적 아미노산 치환), 또는 상기 언급된 변화의 조합을 함유할 수 있다. 삽입, 결실 또는 치환은 VH 영역의 아미노- 또는 카르복시-말단 또는 양쪽 단부를 포함하여 이러한 영역 내의 임의의 곳에서 이루어질 수 있고, 단 각각의 CDR은 0개의 변화 또는 최대 1, 2, 또는 3개의 변화를 포함하고, 변형된 VH 영역을 함유하는 결합 도메인은 여전히 야생형 결합 도메인과 유사한 친화도로 그의 표적에 특이적으로 결합할 수 있다.
전립선암과 연관된 특정한 세포 마커는 PSMA, WT1, 전립선줄기 세포 항원 (PSCA), 및 SV40 T를 포함한다. 유방암과 연관된 특정한 세포 마커는 HER2 및 ERBB2를 포함한다. 난소암과 연관된 특정한 세포 마커는 L1-CAM, MUC16의 세포외 도메인 (MUC-CD), 폴레이트 결합 단백질 (폴레이트 수용체), 루이스 Y, 메소텔린, 및 WT-1을 포함한다. 췌장암과 연관된 특정한 세포 마커는 메소텔린, CEA 및 CD24를 포함한다. 다발성 골수종과 연관된 특정한 세포 마커는 BCMA, GPRC5D, CD38, 및 CS-1을 포함한다. 백혈병 및/또는 림프종과 연관된 특정한 마커는 CLL-1, CD123, CD33, 및 PD-L1을 포함한다.
특정한 실시양태에서, CAR의 결합 도메인은 세포 마커 Her2에 결합한다. 특정한 실시양태에서, HER2에 결합하는 결합 도메인은 트라스투주맙 (헤르셉틴)으로부터 유래된다. 특정한 실시양태에서, 결합 도메인은 서열식별번호: 8을 포함하는 CDRL1 서열, 서열식별번호: 9를 포함하는 CDRL2 서열, 및 서열식별번호: 10을 포함하는 CDRL3 서열을 포함하는 가변 경쇄, 및 서열식별번호: 11을 포함하는 CDRH1 서열, 서열식별번호: 12를 포함하는 CDRH2 서열, 및 서열식별번호: 13을 포함하는 CDRH3 서열을 포함하는 가변 중쇄를 포함한다.
특정한 실시양태에서, CAR의 결합 도메인은 세포 마커 PD-L1에 결합한다. 특정한 실시양태에서, PD-L1에 결합하는 결합 도메인은 펨브롤리주맙 또는 FAZ053 (노파르티스(Novartis)) 중 적어도 1종으로부터 유래된다. 특정한 실시양태에서, 결합 도메인은 서열식별번호: 14를 포함하는 CDRL1 서열, 서열식별번호: 15를 포함하는 CDRL2 서열, 및 서열식별번호: 16을 포함하는 CDRL3 서열을 포함하는 가변 경쇄, 및 서열식별번호: 17을 포함하는 CDRH1 서열, 서열식별번호: 18을 포함하는 CDRH2 서열, 및 서열식별번호: 19를 포함하는 CDRH3 서열을 포함하는 가변 중쇄를 포함한다.
PD-L1에 대한 예시적인 결합 도메인은 아벨루맙 또는 아테졸리주맙을 포함할 수 있거나 또는 그로부터 유래될 수 있다. 특정한 실시양태에서, 아벨루맙의 가변 중쇄는 서열식별번호: 20을 포함한다.
특정한 실시양태에서, 아벨루맙의 가변 경쇄는 서열식별번호: 21을 포함한다.
특정한 실시양태에서, 아벨루맙의 CDR 영역은 CDRH1 (서열식별번호: 22); CDRH2 (서열식별번호: 23); CDRH3 (서열식별번호: 24); CDRL1 (서열식별번호: 25); CDRL2 (서열식별번호: 26); 및 CDRL3 (서열식별번호: 27)을 포함한다.
특정한 실시양태에서, 아테졸리주맙의 가변 중쇄는 서열식별번호: 28을 포함한다. 특정한 실시양태에서, 아테졸리주맙의 가변 경쇄는 서열식별번호: 29를 포함한다.
특정한 실시양태에서, 아테졸리주맙의 CDR 영역은 CDRH1 (서열식별번호: 30); CDRH2 (서열식별번호: 31); CDRH3 (서열식별번호: 32); CDRL1 (서열식별번호: 33); CDRL2 (서열식별번호: 34); 및 CDRL3 (서열식별번호: 35)을 포함한다.
특정한 실시양태에서, CAR의 결합 도메인은 세포 마커 PSMA에 결합한다. 특정한 실시양태에서, 결합 도메인은 서열식별번호: 36을 포함하는 CDRL1 서열, 서열식별번호: 37을 포함하는 CDRL2 서열, 서열식별번호: 38을 포함하는 CDRL3 서열을 포함하는 가변 경쇄를 포함한다. 특정한 실시양태에서, 결합 도메인은 서열식별번호: 39를 포함하는 CDRH1 서열, 서열식별번호: 40을 포함하는 CDRH2 서열, 및 서열식별번호: 41을 포함하는 CDRH3 서열을 포함하는 가변 중쇄를 포함한다.
특정한 실시양태에서, CAR의 결합 도메인은 세포 마커 MUC16에 결합한다. 특정한 실시양태에서, 결합 도메인은 인간 또는 인간화 도메인이고, 서열식별번호: 42를 포함하는 CDRL1 서열, GAS를 포함하는 CDRL2 서열, 서열식별번호: 43을 포함하는 CDRL3 서열을 포함하는 가변 경쇄를 포함한다. 특정한 실시양태에서, 결합 도메인은 인간 또는 인간화 도메인이고, 서열식별번호: 44를 포함하는 CDRH1 서열, 서열식별번호: 45를 포함하는 CDRH2 서열, 및 서열식별번호: 46을 포함하는 CDRH3 서열을 포함하는 가변 중쇄를 포함한다.
특정한 실시양태에서, CAR의 결합 도메인은 세포 마커 FOLR에 결합한다. 특정한 실시양태에서, FOLR에 결합하는 결합 도메인은 파를레투주맙으로부터 유래된다. 특정한 실시양태에서, 결합 도메인은 서열식별번호: 47을 포함하는 CDRL1 서열, 서열식별번호: 48을 포함하는 CDRL2 서열, 및 서열식별번호: 49를 포함하는 CDRL3 서열을 포함하는 가변 경쇄, 및 서열식별번호: 50을 포함하는 CDRH1 서열, 서열식별번호: 51을 포함하는 CDRH2 서열, 및 서열식별번호: 52를 포함하는 CDRH3 서열을 포함하는 가변 중쇄를 포함한다.
메소텔린에 대한 예시적인 결합 도메인은 아마툭시맙을 포함할 수 있거나 또는 그로부터 유래될 수 있다.
특정한 실시양태에서, 아마툭시맙의 가변 중쇄는 서열식별번호: 53을 포함한다. 특정한 실시양태에서, 아마툭시맙의 가변 경쇄는 서열식별번호: 54를 포함한다.
특정한 실시양태에서, 아마툭시맙의 CDR 영역은 CDRH1 (서열식별번호: 55); CDRH2 (서열식별번호: 56); CDRH3 (서열식별번호: 57); CDRL1 (서열식별번호: 58); CDRL2 (서열식별번호: 59); 및 CDRL3 (서열식별번호: 60)을 포함한다.
또한, 예를 들어 감염원 항원에 결합함으로써 감염원 작용제에 특이적인 결합 도메인이 고려된다. 이들은 예를 들어 바이러스 감염된 세포에 의해 발현되는 예를 들어 바이러스 항원 또는 다른 바이러스 마커를 포함한다. 예시적인 바이러스는 아데노바이러스, 아레나바이러스, 분야바이러스, 코로나바이러스, 플라비바이러스, 한타바이러스, 헤파드나바이러스, 헤르페스바이러스, 유두종바이러스, 파라믹소바이러스, 파르보바이러스, 피코르나바이러스, 폭스바이러스, 오르토믹소바이러스, 레트로바이러스, 레오바이러스, 랍도바이러스, 로타바이러스, 해면상 바이러스 또는 토가바이러스를 포함한다. 추가의 실시양태에서, 바이러스 항원 마커는 CMV, 콜드 바이러스, 엡스타인-바르, 플루 바이러스, A형, B형, 및 C형 간염 바이러스, 단순 포진, HIV, 인플루엔자, 일본 뇌염, 홍역, 소아마비, 광견병, 호흡기 세포융합, 풍진, 천연두, 수두 대상포진 또는 웨스트 나일 바이러스에 의해 발현된 펩티드를 포함한다.
추가의 특정한 예로서, 시토메갈로바이러스 항원은 외피 당단백질 B 및 CMV pp65를 포함하고; 엡스타인-바르 항원은 EBV EBNAI, EBV P18, 및 EBV P23을 포함하고; 간염 항원은 HBV의 S, M, 및 L 단백질, HBV의 프리-S 항원, HBCAG 델타, HBV HBE, C형 간염 바이러스 RNA, HCV NS3 및 HCV NS4를 포함하고; 단순 포진 바이러스 항원은 극초기 단백질 및 당단백질 D를 포함하고; HIV 항원은 gag, pol, 및 env 유전자의 유전자 생성물 예컨대 HIV gp32, HIV gp41, HIV gp120, HIV gp160, HIV P17/24, HIV P24, HIV P55 GAG, HIV P66 POL, HIV TAT, HIV GP36, Nef 단백질 및 리버스 트랜스크립타제를 포함하고; 인플루엔자 항원은 헤마글루티닌 및 뉴라미니다제를 포함하고; 일본 뇌염 바이러스 항원은 단백질 E, M-E, M-E-NS1, NS1, NS1-NS2A 및 80% E를 포함하고; 홍역 항원은 홍역 바이러스 융합 단백질을 포함하고; 광견병 항원은 광견병 당단백질 및 광견병 핵단백질을 포함하고; 호흡기 세포융합 바이러스 항원은 RSV 융합 단백질 및 M2 단백질을 포함하고; 로타바이러스 항원은 VP7sc를 포함하고; 풍진 항원은 단백질 E1 및 E2를 포함하고; 수두 대상포진 바이러스 항원은 gpI 및 gpII를 포함한다. 추가의 특정한 예시적인 바이러스 항원 서열은 Nef (66-97) (서열식별번호: 61); Nef (116-145) (서열식별번호: 62); Gag p17 (17-35) (서열식별번호: 63); Gag p17-p24 (253-284) (서열식별번호: 64); 및 Pol 325-355 (RT 158-188) (서열식별번호: 65)를 포함한다. 바이러스 항원의 추가의 예에 대해서는 문헌 [Fundamental Virology, Second Edition, eds. Fields, B. N. and Knipe, D. M. (Raven Press, New York, 1991)]을 참조한다.
세포내 신호전달 성분. CAR의 세포내 또는 다른 세포질 신호전달 성분은 CAR이 발현되는 세포의 활성화를 담당한다. 용어 "세포내 신호전달 성분" 또는 "세포내 성분"은 따라서 활성화 신호를 전달하기에 충분한 세포내 도메인의 임의의 부분을 포함하는 것으로 의도된다. 발현된 CAR의 세포내 성분은 이펙터 도메인을 포함할 수 있다. 이펙터 도메인은 적절한 신호의 수신 시 세포에서 생물학적 또는 생리학적 반응을 직접적으로 또는 간접적으로 촉진할 수 있는 융합 단백질 또는 수용체의 세포내 부분이다. 특정 실시양태에서, 이펙터 도메인은 결합 시 신호를 수신하는 단백질 또는 단백질 복합체의 일부이거나, 또는 이펙터 도메인으로부터의 신호를 촉발하는 표적 분자에 직접적으로 결합한다. 이펙터 도메인은 1개 이상의 신호전달 도메인 또는 모티프, 예컨대 면역수용체 티로신-기반 활성화 모티프 (ITAM)를 함유하는 경우에 세포 반응을 직접적으로 촉진할 수 있다. 다른 실시양태에서, 이펙터 도메인은 세포 반응을 직접적으로 촉진하는 1종 이상의 다른 단백질, 예컨대 공동-자극 도메인과 회합함으로써 세포 반응을 간접적으로 촉진할 것이다.
이펙터 도메인은 암 세포에 의해 발현된 세포 마커에 결합 시 변형된 세포의 적어도 1종의 기능의 활성화를 제공할 수 있다. 변형된 세포의 활성화는 분화, 증식 및/또는 활성화 중 1종 이상 또는 다른 이펙터 기능을 포함할 수 있다. 특정한 실시양태에서, 이펙터 도메인은 T 세포 수용체, 및 공동-수용체 또는 공동-자극 분자로부터의 세포질 서열을 포함할 수 있는 공동-자극 도메인을 포함한 세포내 신호전달 성분을 포함할 수 있다.
이펙터 도메인은 1, 2, 3개 또는 그 초과의 수용체 신호전달 도메인, 세포내 신호전달 성분 (예를 들어, 세포질 신호전달 서열), 공동-자극 도메인, 또는 그의 조합을 포함할 수 있다. 예시적인 이펙터 도메인은 4-1BB (CD137), CARD11, CD3γ, CD3δ, CD3ε, CD3ζ, CD27, CD28, CD79A, CD79B, DAP10, FcRα, FcRβ (FcεR1b), FcRγ, Fyn, HVEM (LIGHTR), ICOS, LAG3, LAT, Lck, LRP, NKG2D, NOTCH1, pTα, PTCH2, OX40, ROR2, Ryk, SLAMF1, Slp76, TCRα, TCRβ, TRIM, Wnt, Zap70, 또는 그의 임의의 조합으로부터 선택된 신호전달 및 자극 도메인을 포함한다. 특정한 실시양태에서, 예시적인 이펙터 도메인은 CD86, FcγRIIa, DAP12, CD30, CD40, PD-1, 림프구 기능-연관 항원-1 (LFA-1), CD2, CD7, LIGHT, NKG2C, B7-H3, CD83과 특이적으로 결합하는 리간드, CDS, ICAM-1, GITR, BAFFR, SLAMF7, NKp80 (KLRF1), CD127, CD160, CD19, CD4, CD8α, CD8β, IL2Rβ, IL2Rγ, IL7Rα, ITGA4, VLA1, CD49a, IA4, CD49D, ITGA6, VLA-6, CD49f, ITGAD, CD11d, ITGAE, CD103, ITGAL, CD11a, ITGAM, CD11b, ITGAX, CD11c, ITGB1, CD29, ITGB2, CD18, ITGB7, TNFR2, TRANCE/RANKL, DNAM1 (CD226), SLAMF4 (CD244, 2B4), CD84, CD96 (Tactile), CEACAM1, CRTAM, Ly9 (CD229), PSGL1, CD100 (SEMA4D), CD69, SLAMF6 (NTB-A, Ly108), SLAM (CD150, IPO-3), BLAME (SLAMF8), SELPLG (CD162), LTBR, GADS, PAG/Cbp, NKp44, NKp30, 또는 NKp46으로부터 선택된 신호전달 및 공동-자극 도메인을 포함한다.
자극 방식으로 작용하는 세포내 신호전달 성분 서열은 iTAM을 포함할 수 있다. 1차 세포질 신호전달 서열을 포함하는 iTAM의 예는 CD3γ, CD3δ, CD3ε, CD3ζ, CD5, CD22, CD66d, CD79a, CD79b, 및 통상의 FcRγ (FCER1G), FcγRlla, FcRβ (Fcε Rib), DAP10, 및 DAP12로부터 유래된 것을 포함한다. 특정한 실시양태에서, CD3ζ의 변이체는 적어도 1, 2, 3개, 또는 모든 ITAM 영역을 보유한다.
특정한 실시양태에서, 이펙터 도메인은 세포질 신호전달 단백질과 회합하는 세포질 부분을 포함하며, 여기서 세포질 신호전달 단백질은 림프구 수용체 또는 그의 신호전달 도메인, 복수의 ITAM을 포함하는 단백질, 공동-자극 도메인, 또는 그의 임의의 조합이다.
세포내 신호전달 성분의 추가의 예는 CD3ζ 쇄의 세포질 서열, 및/또는 결합 도메인 결속 후에 신호 전달을 개시하기 위해 협력하여 작용하는 보조-수용체를 포함한다.
공동-자극 도메인은 그의 활성화가 세포 마커 결합에 대한 효율적인 림프구 반응에 요구될 수 있는 도메인이다. 일부 분자는 세포내 신호전달 성분 또는 공동-자극 도메인으로서 상호교환가능하다. 공동자극 도메인의 예는 CD27, CD28, 4-1BB (CD 137), OX40, CD30, CD40, PD-1, ICOS, 림프구 기능-연관 항원-1 (LFA-1), CD2, CD7, LIGHT, NKG2C, B7-H3, 및 CD83과 특이적으로 결합하는 리간드를 포함한다. 예를 들어, CD27 공동-자극은 시험관내 인간 CART 세포의 확장, 이펙터 기능, 및 생존을 증진시키고, 생체내 인간 T 세포 지속성 및 항암 활성을 증대시키는 것으로 입증되었다 (Song et al., Blood. 2012; 119(3):696-706). 이러한 공동-자극 도메인 분자의 추가의 예는 CDS, ICAM-1, GITR, BAFFR, HVEM (LIGHTR), SLAMF7, NKp80 (KLRF1), NKp44, NKp30, NKp46, CD160, CD19, CD4, CD8α, CD8β, IL2Rβ, IL2Rγ, IL7Rα, ITGA4, VLA1, CD49a, ITGA4, IA4, CD49D, ITGA6, VLA-6, CD49f, ITGAD, CDlld, ITGAE, CD103, ITGAL, CDlla, ITGAM, CDl lb, ITGAX, CDllc, ITGBl, CD29, ITGB2, CD18, ITGB7, TNFR2, TRANCE/RANKL, DNAM1 (CD226), SLAMF4 (CD244, 2B4), CD84, CD96 (Tactile), NKG2D, CEACAM1, CRTAM, Ly9 (CD229), PSGL1, CD100 (SEMA4D), CD69, SLAMF6 (NTB-A, Lyl08), SLAM (SLAMF1, CD150, IPO-3), BLAME (SLAMF8), SELPLG (CD162), LTBR, LAT, GADS, SLP-76, PAG/Cbp, 및 CD19a를 포함한다.
특정한 실시양태에서, 세포내 신호전달 성분의 아미노산 서열은 CD3ζ의 변이체 및 4-1BB 세포내 신호전달 성분의 부분을 포함한다.
특정한 실시양태에서, 세포내 신호전달 성분은 (i) CD3ζ의 신호전달 도메인의 전부 또는 일부, (ii) 4-1BB의 신호전달 도메인의 전부 또는 일부, 또는 (iii) CD3ζ 및 4-1BB의 신호전달 도메인의 전부 또는 일부를 포함한다.
세포내 성분은 또한 Wnt 신호전달 경로 (예를 들어, LRP, Ryk, 또는 ROR2), NOTCH 신호전달 경로 (예를 들어, NOTCH1, NOTCH2, NOTCH3, 또는 NOTCH4), 헤지호그 신호전달 경로 (예를 들어, PTCH 또는 SMO)의 단백질, 수용체 티로신 키나제 (RTK) (예를 들어, 표피 성장 인자 (EGF) 수용체 패밀리, 섬유모세포 성장 인자 (FGF) 수용체 패밀리, 간세포 성장 인자 (HGF) 수용체 패밀리, 인슐린 수용체 (IR) 패밀리, 혈소판-유래 성장 인자 (PDGF) 수용체 패밀리, 혈관 내피 성장 인자 (VEGF) 수용체 패밀리, 트로포미오신 수용체 키나제 (Trk) 수용체 패밀리, 에프린 (Eph) 수용체 패밀리, AXL 수용체 패밀리, 백혈구 티로신 키나제 (LTK) 수용체 패밀리, 이뮤노글로불린-유사 및 EGF-유사 도메인 1을 갖는 티로신 키나제 (TIE) 수용체 패밀리, 수용체 티로신 키나제-유사 고아 (ROR) 수용체 패밀리, 디스코이딘 도메인 (DDR) 수용체 패밀리, 형질감염 중 재배열 (RET) 수용체 패밀리, 티로신-단백질 키나제-유사 (PTK7) 수용체 패밀리, 수용체 티로신 키나제 관련 (RYK) 수용체 패밀리, 또는 근육 특이적 키나제 (MuSK) 수용체 패밀리); G-단백질-커플링된 수용체, GPCR (프리즐드 또는 스무슨드); 세린/트레오닌 키나제 수용체 (BMPR 또는 TGFR); 또는 시토카인 수용체 (IL1R, IL2R, IL7R, 또는 IL15R) 중 1종 이상을 포함할 수 있다.
링커. 본원에 사용된 링커는 분자의 2개의 다른 하위성분을 연결하는 역할을 하는 CAR 분자의 임의의 부분일 수 있다. 일부 링커는 다른 성분을 연결하는 것 외의 다른 목적을 제공하지 않는 반면, 많은 링커는 추가의 목적을 제공한다. scFv의 항체 유래 결합 도메인의 VL 및 VH를 연결하는 것과 관련된 링커는 상기 기재되어 있다. 링커는 또한 스페이서 영역, 및 접합부 아미노산을 포함할 수 있다.
스페이서 영역은 다른 연결된 성분으로부터 적절한 거리 및/또는 가요성을 생성하는데 사용되는 링커 영역의 유형이다. 특정한 실시양태에서, 스페이서 영역의 길이는 원치않는 세포 인식 및 파괴를 최적화하기 위해 원치않는 세포 상의 개별 세포 마커에 대해 맞춤화될 수 있다. 스페이서는 스페이서의 부재 하와 비교하여 항원 결합 후에 세포의 증가된 반응성을 제공하는 길이일 수 있다. 특정한 실시양태에서, 스페이서 영역 길이는 세포 마커 에피토프의 위치, 에피토프에 대한 결합 도메인의 친화도, 및/또는 세포 마커 인식에 반응하여 시험관내 및/또는 생체내에서 증식하는 분자를 발현하는 변형된 세포의 능력에 기초하여 선택될 수 있다. 스페이서 영역은 또한 변형된 세포에서 높은 발현 수준을 허용할 수 있다.
특정한 실시양태에서, 스페이서 영역은 유형 II C-렉틴 도메인간 (줄기) 영역 또는 분화 클러스터 (CD) 분자 줄기 영역인 힌지 영역을 포함한다. 본원에 사용된 "야생형 이뮤노글로불린 힌지 영역"은 항체의 중쇄에서 발견되는 CH1 및 CH2 도메인 (IgG, IgA, 및 IgD의 경우) 사이에 개재되어 이들을 연결하거나 또는 CH1 및 CH3 도메인 (IgE 및 IgM의 경우) 사이에 개재되어 이들을 연결하는 자연 발생 상부 및 중간 힌지 아미노산 서열을 지칭한다.
유형 II C-렉틴 또는 CD 분자의 "줄기 영역"은 C-유형 렉틴-유사 도메인 (CTLD; 예를 들어, 천연 킬러 세포 수용체의 CTLD와 유사함)과 소수성 부분 (막횡단 도메인) 사이에 위치하는 유형 II C-렉틴 또는 CD 분자의 세포외 도메인의 부분을 지칭한다. 예를 들어, 인간 CD94의 세포외 도메인 (진뱅크 수탁 번호 AAC50291.1)은 아미노산 잔기 34-179에 상응하지만, CTLD는 아미노산 잔기 61-176에 상응하고, 따라서 인간 CD94 분자의 줄기 영역은 소수성 부분 (막횡단 도메인)과 CTLD 사이에 위치하는 아미노산 잔기 34-60을 포함한다 (문헌 [Boyington et al., Immunity 10:15, 1999] 참조; 다른 줄기 영역의 설명에 대해서는, 또한 문헌 [Beavil et al., Proc. Nat'l. Acad. Sci. USA 89:153, 1992; 및 Figdor et al., Nat. Rev. Immunol. 2:11, 2002] 참조). 이들 유형 II C-렉틴 또는 CD 분자는 또한 줄기 영역과 막횡단 영역 또는 CTLD 사이에 접합부 아미노산 (하기 기재됨)을 가질 수 있다. 또 다른 예에서, 233개 아미노산의 인간 NKG2A 단백질 (진뱅크 수탁 번호 P26715.1)은 아미노산 71-93 범위의 소수성 부분 (막횡단 도메인) 및 아미노산 94-233 범위의 세포외 도메인을 갖는다. CTLD는 아미노산 119-231을 포함하고, 줄기 영역은 아미노산 99-116을 포함하며, 이는 추가의 접합부 아미노산에 플랭킹될 수 있다. 다른 유형 II C-렉틴 또는 CD 분자, 뿐만 아니라 그의 세포외 리간드-결합 도메인, 줄기 영역, 및 CTLD는 관련 기술분야에 공지되어 있다 (예를 들어, 각각 인간 CD23, CD69, CD72, NKG2A, 및 NKG2D의 서열 및 그의 설명에 대해; 진뱅크 수탁 번호 NP 001993.2; AAH07037.1; NP 001773.1; AAL65234.1; CAA04925.1 참조).
스페이서 영역에 관한 추가의 설명으로서, 융합 단백질의 세포외 성분은 임의로 세포외, 비-신호전달 스페이서 또는 링커 영역을 포함하며, 이는 예를 들어 결합 도메인을 숙주 세포 (예를 들어, T 세포) 표면으로부터 멀리 위치시켜 적절한 세포/세포 접촉, 항원 결합 및 활성화를 가능하게 할 수 있다 (Patel et al., Gene Therapy 6: 412-419, 1999). 나타낸 바와 같이, 융합 결합 단백질의 세포외 스페이서 영역은 일반적으로 소수성 부분 또는 막횡단 도메인과 세포외 결합 도메인 사이에 위치하고, 스페이서 영역 길이는 선택된 표적 분자, 선택된 결합 에피토프, 또는 항원-결합 도메인 크기 및 친화도에 기초하여 항원 인식 (예를 들어, 종양 인식)을 최대화하도록 달라질 수 있다 (예를 들어, 문헌 [Guest et al., J. Immunother. 28:203-11, 2005]; PCT 공개 번호 WO 2014/031687 참조). 특정 실시양태에서, 스페이서 영역은 이뮤노글로불린 힌지 영역을 포함한다. 이뮤노글로불린 힌지 영역은 야생형 이뮤노글로불린 힌지 영역 또는 변경된 야생형 이뮤노글로불린 힌지 영역일 수 있다. 특정 실시양태에서, 이뮤노글로불린 힌지 영역은 인간 이뮤노글로불린 힌지 영역이다. 이뮤노글로불린 힌지 영역은 IgG, IgA, IgD, IgE, 또는 IgM 힌지 영역일 수 있다. IgG 힌지 영역은 IgG1, IgG2, IgG3, 또는 IgG4 힌지 영역일 수 있다. 본원에 기재된 융합 결합 단백질에 사용되는 힌지 영역의 다른 예는 야생형 또는 그의 변이체일 수 있는 유형 1 막 단백질, 예컨대 CD8α, CD4, CD28, 및 CD7의 세포외 영역에 존재하는 힌지 영역을 포함한다.
특정 실시양태에서, 세포외 스페이서 영역은 CH1 도메인, CH2 도메인, CH3 도메인, CH4 도메인, 또는 그의 임의의 조합으로부터 선택된 Fc 도메인의 전부 또는 일부를 포함한다. Fc 도메인 또는 그의 부분은 야생형 또는 (예를 들어, 항체 이펙터 기능을 감소시키기 위해) 변경된 것일 수 있다. 특정 실시양태에서, 세포외 성분은 결합 도메인과 소수성 부분 사이에 배치된 이뮤노글로불린 힌지 영역, CH2 도메인, CH3 도메인, 또는 그의 임의의 조합을 포함한다.
접합부 아미노산은 스페이서에 의해 제공되는 거리를 필요로 하지 않고/거나 원치 않는 경우에 CAR 도메인의 서열을 연결하는데 사용될 수 있는 링커일 수 있다. 접합부 아미노산은 공동-자극 세포내 신호전달 성분을 연결하는데 사용될 수 있는 짧은 아미노산 서열이다. 특정한 실시양태에서, 접합부 아미노산은 9개 이하의 아미노산이다.
접합부 아미노산은 링커를 형성하기 위한 짧은 올리고- 또는 단백질 링커, 바람직하게는 2 내지 9개 아미노산 (예를 들어, 2, 3, 4, 5, 6, 7, 8, 또는 9개 아미노산) 길이일 수 있다. 특정한 실시양태에서, 글리신-세린 이중체가 적합한 접합부 아미노산 링커로서 사용될 수 있다. 특정한 실시양태에서, 단일 아미노산, 예를 들어 알라닌, 글리신이 적합한 접합부 아미노산으로서 사용될 수 있다.
막횡단 도메인. 나타낸 바와 같이, CAR 분자 내의 막횡단 도메인은 종종 세포 막을 통해 세포외 성분 및 세포내 성분을 연결하는 역할을 한다. 막횡단 도메인은 발현된 분자를 변형된 세포의 막에 고정시킬 수 있다.
막횡단 도메인은 천연 및/또는 합성 공급원으로부터 유래될 수 있다. 공급원이 천연인 경우, 막횡단 도메인은 임의의 막-결합 또는 막횡단 단백질로부터 유래될 수 있다. 막횡단 도메인은 적어도 T-세포 수용체, CD28, CD27, CD3 엡실론, CD45, CD4, CD5, CD8, CD9, CD16, CD22; CD33, CD37, CD64, CD80, CD86, CD134, CD137 및 CD154의 α, β 또는 ζ 쇄의 막횡단 영역(들)을 포함할 수 있다. 특정한 실시양태에서, 막횡단 도메인은 적어도 예를 들어 KIRDS2, OX40, CD2, CD27, LFA-1 (CD 11a, CD18), ICOS (CD278), 4-1BB (CD137), GITR, CD40, BAFFR, HVEM (LIGHTR), SLAMF7, NKp80 (KLRF1), NKp44, NKp30, NKp46, CD160, CD19, IL2Rβ, IL2Rγ, IL7R a, ITGA1, VLA1, CD49a, ITGA4, IA4, CD49D, ITGA6, VLA-6, CD49f, ITGAD, CDl ld, ITGAE, CD103, ITGAL, CDl la, ITGAM, CDl lb, ITGAX, CDl lc, ITGB1, CD29, ITGB2, CD18, ITGB7, TNFR2, DNAM1(CD226), SLAMF4 (CD244, 2B4), CD84, CD96 (Tactile), CEACAM1, CRT AM, Ly9(CD229), PSGL1, CD100 (SEMA4D), SLAMF6 (NTB-A, Lyl08), SLAM (SLAMF1, CD150, IPO-3), BLAME (SLAMF8), SELPLG (CD162), LTBR, PAG/Cbp, NKG2D, 또는 NKG2C의 막횡단 영역(들)을 포함할 수 있다.
특정한 실시양태에서, 막횡단 도메인은 세포 막에서 열역학적으로 안정한 3차원 구조를 갖고, 일반적으로 15 내지 30개 아미노산의 길이 범위이다. 막횡단 도메인의 구조는 α 나선, β 배럴, β 시트, β 나선, 또는 그의 임의의 조합을 포함할 수 있다.
막횡단 도메인은 막횡단 영역에 인접한 1개 이상의 추가의 아미노산, 예를 들어 CAR의 세포외 영역 내의 1개 이상의 아미노산 (예를 들어, 세포외 영역의 최대 15개의 아미노산) 및/또는 CAR의 세포내 영역 내의 1개 이상의 추가의 아미노산 (예를 들어, 세포내 성분의 최대 15개의 아미노산)을 포함할 수 있다. 한 측면에서, 막횡단 도메인은 신호전달 도메인, 공동-자극 도메인 또는 힌지 도메인이 유래된 동일한 단백질로부터의 것이다. 또 다른 측면에서, 막횡단 도메인은 CAR의 임의의 다른 도메인이 유래된 동일한 단백질로부터 유래되지 않는다. 일부 경우에, 막횡단 도메인은 이러한 도메인이 동일하거나 상이한 표면 막 단백질의 막횡단 도메인에 결합하는 것을 피하여 수용체 복합체의 다른 의도하지 않은 구성원과의 상호작용을 최소화하기 위해 선택될 수 있거나 또는 아미노산 치환에 의해 변형될 수 있다. 한 측면에서, 막횡단 도메인은 CAR-발현 세포의 세포 표면 상의 또 다른 CAR과 동종이량체화될 수 있다. 상이한 측면에서, 막횡단 도메인의 아미노산 서열은 동일한 CAR-발현 세포에 존재하는 천연 결합 파트너의 결합 도메인과의 상호작용을 최소화하기 위해 변형 또는 치환될 수 있다. 특정한 실시양태에서, 막횡단 도메인은 CD28 막횡단 도메인의 아미노산 서열을 포함한다.
형질도입 마커는 말단절단된 CD19 (tCD19; 문헌 [Budde et al., Blood 122: 1660, 2013] 참조); 말단절단된 인간 EGFR (tEGFR; 문헌 [Wang et al., Blood 118: 1255, 2011] 참조); 인간 CD34의 세포외 도메인; 및/또는 CD34 (문헌 [Fehse et al., Mol. Therapy 1(5 Pt 1):448-456, 2000] 참조) 및 CD20 항원 (문헌 [Philip et al., Blood 124: 1277-1278, 2014] 참조)으로부터의 표적 에피토프를 조합한 RQR8 중 적어도 1종으로부터 선택될 수 있다.
특정한 실시양태에서, i카스파제9 구축물 (iCasp9)을 코딩하는 폴리뉴클레오티드는 자살 스위치로서 CAR 뉴클레오티드 구축물 내로 삽입될 수 있다.
제어 특색은 CAR에서 다중 카피로 존재할 수 있거나, 또는 스키핑 요소의 사용에 의해 별개의 분자로서 발현될 수 있다. 특정한 실시양태에서, 형질도입 마커는 tEGFR을 포함한다. 예시적인 형질도입 마커 및 동족 쌍은 미국 특허 번호 8,802,374에 기재되어 있다.
CAR에서 적어도 1종의 제어 특색을 포함하는 것의 하나의 이점은 대상체에게 투여된 CAR 발현 세포가 제어 특색에 대한 동족 결합 분자를 사용하여, 또는 CAR을 발현하고 제어 특색에 대해 특이성을 갖는 제2 변형된 세포를 사용하는 것에 의해 고갈될 수 있다는 것이다. 변형된 세포의 제거는 제어 특색에 특이적인 고갈 작용제를 사용하여 달성될 수 있다.
특정 실시양태에서, 키메라 분자를 발현하는 변형된 세포는 제어 특색에 대해 특이성을 가지고 결합하는 항체를 사용함으로써, 또는 제어 특색에 특이적으로 결합하는 다른 동족 결합 분자에 의해 생체내에서 검출 또는 추적될 수 있으며, 제어 특색에 대한 결합 파트너는 형광 염료, 방사성-추적자, 산화철 나노입자, 또는 X선, CT-스캔, MRI-스캔, PET-스캔, 초음파, 유동-세포측정법, 근적외선 영상화 시스템, 또는 다른 영상화 양식에 의한 검출을 위해 관련 기술분야에 공지된 다른 영상화제에 접합된다 (예를 들어, 문헌 [Yu et al., Theranostics 2:3, 2012] 참조).
따라서, CAR과 함께 적어도 1종의 제어 특색을 발현하는 변형된 세포는 태그 카세트가 없는 변형된 세포와 비교하여, 예를 들어 보다 용이하게 확인, 단리, 분류, 증식 유도, 추적, 및/또는 제거될 수 있다.
T-세포 수용체 (TCR)는 주요 조직적합성 복합체 (MHC)에 결합된 펩티드의 T-세포 인식을 담당하는 T 세포의 표면 상에서 발견되는 분자이다.
TCR은 자연 발생 T 세포 수용체를 지칭한다. HSC는 선택된 TCR을 발현하도록 생체내에서 변형될 수 있다. CAR/TCR 하이브리드는 TCR의 요소 및 CAR의 요소를 갖는 단백질을 지칭한다. 예를 들어, CAR/TCR 하이브리드는 TCR 결합 도메인이 자연적으로 회합되지 않은 이펙터 도메인을 갖는 자연 발생 TCR 결합 도메인을 가질 수 있다. CAR/TCR 하이브리드는 돌연변이된 TCR 결합 도메인 및 ITAM 신호전달 도메인을 가질 수 있다. CAR/TCR 하이브리드는 삽입된 비-자연 발생 스페이서 영역 또는 막횡단 도메인을 갖는 자연 발생 TCR을 가질 수 있다.
특정한 CAR/TCR 하이브리드는 TRuC® (T 세포 수용체 융합 구축물) 하이브리드; TCR2 테라퓨틱스(TCR2 Therapeutics), 매사추세츠주 캠브리지를 포함한다. 예로서, TCR 융합 단백질의 생산은 국제 특허 공개 WO 2018/026953 및 WO 2018/067993, 및 출원 공개 US 2017/0166622에 기재되어 있다.
특정한 실시양태에서, CAR/TCR 하이브리드는 "T-세포 수용체 (TCR) 융합 단백질" 또는 "TFP"를 포함한다. TFP는 일반적으로 i) 표적 세포 상의 표면 항원에 결합할 수 있고, ii) 전형적으로 T-세포의 표면 내에 또는 표면 상에 공동-위치하는 경우에 무손상 TCR 복합체의 다른 폴리펩티드 성분과 상호작용할 수 있는 TCR을 포함하는 다양한 폴리펩티드로부터 유래된 재조합 폴리펩티드를 포함한다.
(IV-d) CRISPR
CRISPR (클러스터링된 규칙적 간격의 짧은 회문식 반복부)/Cas (CRISPR-연관 단백질) 뉴클레아제 시스템은 박테리아 시스템에 기초한 유전자 조작에 사용되는 조작된 뉴클레아제 시스템이다. 이는 부분적으로 많은 박테리아 및 고세균의 적응 면역 반응에 기초한다. 바이러스 또는 플라스미드가 박테리아를 침습할 때, 침습자의 DNA 절편은 박테리아의 "면역" 반응에 의해 CRISPR RNA (crRNA)로 전환된다. 이어서, crRNA는 부분적 상보성 영역을 통해 tracrRNA로 불리는 또 다른 유형의 RNA와 회합하여 Cas 뉴클레아제를 "프로토스페이서"로 불리는 표적 DNA 내의 crRNA에 상동성인 영역으로 가이드한다. Cas 뉴클레아제는 DNA를 절단하여 crRNA 전사체 내에 함유된 20-뉴클레오티드 상보적 가닥 서열에 의해 명시된 부위에서의 이중-가닥 파괴에서 평활 말단을 생성한다. 일부 경우에, Cas 뉴클레아제는 부위-특이적 DNA 인식 및 절단을 위해 crRNA 및 tracrRNA 둘 다를 필요로 한다.
가이드 RNA (gRNA)는 표적화 요소의 한 예이다. 그의 가장 단순한 형태에서, gRNA는 상보성에 기초하여 게놈 내의 부위를 표적화하는 서열 (예를 들어, crRNA)을 제공한다. 그러나, 하기 설명되는 바와 같이, gRNA는 또한 추가의 성분을 포함할 수 있다. 예를 들어, 특정한 실시양태에서, gRNA는 표적화 서열 (예를 들어, crRNA) 및 표적화 서열을 절단 요소에 연결하는 성분을 포함할 수 있다. 이러한 연결 성분은 tracrRNA일 수 있다. 특정한 실시양태에서, 하기 기재된 바와 같이, crRNA 및 tracrRNA를 포함하는 gRNA는 단일 gRNA (sgRNA)로 지칭되는 단일 분자로서 발현될 수 있다. gRNA는 또한 다른 메카니즘을 통해, 예컨대 나노입자를 통해 또는 이중 또는 다목적 분자의 발현 또는 구축을 통해 절단 요소에 연결될 수 있다.
특정한 실시양태에서, 표적화 요소 (예를 들어, gRNA)는 새로운 또는 증진된 특색 (예를 들어, 개선된 안정성)을 갖는 핵산을 제공하기 위해 1종 이상의 변형 (예를 들어, 염기 변형, 백본 변형)을 포함할 수 있다. 변형된 백본은 백본에 인 원자를 보유하는 것 및 백본에 인 원자를 갖지 않는 것을 포함할 수 있다. 인 원자를 함유하는 적합한 변형된 백본은, 예를 들어, 포스포로티오에이트, 키랄 포스포로티오에이트, 포스포로디티오에이트, 포스포트리에스테르, 아미노알킬포스포트리에스테르 , 메틸 및 다른 알킬 포스포네이트 예컨대 3'-알킬렌 포스포네이트, 5'-알킬렌 포스포네이트, 키랄 포스포네이트, 포스피네이트, 3'-아미노 포스포르아미데이트 및 아미노알킬포스포르아미데이트를 포함한 포스포르아미데이트, 포스포로디아미데이트, 티오노포스포르아미데이트, 티오노알킬포스포네이트, 티오노알킬포스포트리에스테르, 셀레노포스페이트, 및 정상 3'-5' 연결, 2'-5' 연결된 유사체를 갖는 보라노포스페이트, 및 1개 이상의 뉴클레오티드간 연결이 3'에서 3', 5'에서 5' 또는 2'에서 2' 연결인 역극성을 갖는 것을 포함할 수 있다. 역극성을 갖는 적합한 표적화 요소는 3'-대부분의 뉴클레오티드간 연결에서 단일 3'에서 3' 연결 (즉, 핵염기가 누락되거나 또는 그 대신 히드록실 기를 갖는 단일 역전된 뉴클레오시드 잔기)을 포함할 수 있다. 다양한 염 (예를 들어, 염화칼륨 또는 염화나트륨), 혼합된 염, 및 유리 산 형태가 또한 포함될 수 있다.
표적화 요소는 1개 이상의 포스포로티오에이트 및/또는 헤테로원자 뉴클레오시드간 연결, 특히 -CH2-NH-O-CH2-, -CH2-N(CH3)-O-CH2- (즉, 메틸렌 (메틸이미노) 또는 MMI 백본), -CH2-O-N(CH3)-CH2-, -CH2-N(CH3)-N(CH3)-CH2- 및 -O-N(CH3)-CH2-CH2- (여기서, 천연 포스포디에스테르 뉴클레오티드간 연결은 -O-P(=O)(OH)-O-CH2-로 표시됨)를 포함할 수 있다.
특정한 실시양태에서, 표적화 요소는 모르폴리노 백본 구조를 포함할 수 있다. 예를 들어, 표적화 요소는 리보스 고리 대신 6-원 모르폴리노 고리를 포함할 수 있다. 이들 실시양태 중 일부에서, 포스포로디아미데이트 또는 다른 비-포스포디에스테르 뉴클레오시드간 연결은 포스포디에스테르 연결을 대체한다.
특정한 실시양태에서, 표적화 요소는 1개 이상의 치환된 당 모이어티를 포함할 수 있다. 적합한 폴리뉴클레오티드는 OH; F; O-, S-, 또는 N-알킬; O-, S-, 또는 N-알케닐; O-, S- 또는 N-알키닐; 또는 O-알킬-O-알킬로부터 선택된 당 치환기를 포함할 수 있으며, 여기서 알킬, 알케닐 및 알키닐은 치환 또는 비치환된 C1 내지 C10 알킬 또는 C2 내지 C10 알케닐 및 알키닐일 수 있다. O((CH2)nO) mCH3, O(CH2)nOCH3, O(CH2)nNH2, O(CH2)nCH3, O(CH2)nONH2, 및 O(CH2)nON((CH2)nCH3)2가 특히 적합하며, 여기서 n 및 m은 독립적으로 1 내지 10이다.
절단 요소의 예는 뉴클레아제를 포함한다. CRISPR-Cas 유전자좌는 50개 초과의 유전자 패밀리를 갖고, 엄격하게 보편적인 유전자는 존재하지 않으며, 이는 유전자좌 아키텍처의 빠른 진화 및 극도의 다양성을 나타낸다. 예시적인 Cas 뉴클레아제는 Casl, CaslB, Cas2, Cas3, Cas4, Cas5, Cas6, Cas7, Cas8, Cas9 (또한 Csnl 및 Csxl2로도 공지됨), CaslO, , Cpfl, C2c3, C2c2 및 C2clCsyl, Csy2, Csy3, Csel, Cse2, Cscl, Csc2, Csa5, Csn2, Csm2, Csm3, Csm4, Csm5, Csm6, Cmrl, Cmr3, Cmr4, Cmr5, Cmr6, Cpfl, Csbl, Csb2, Csb3, Csxl7, Csxl4, CsxlO, Csxl6, CsaX, Csx3, Csxl, Csxl5, Csfl, Csf2, Csf3, 및 Csf4를 포함한다.
Cas 뉴클레아제의 3가지 주요 유형 (유형 I, 유형 II, 및 유형 III), 및 5가지 유형 I, 3가지 유형 II, 및 2가지 유형 III 단백질을 포함하는 10가지 하위유형이 존재한다 (예를 들어, 문헌 [Hochstrasser and Doudna, Trends Biochem Sci, 40(l):58-66, 2015] 참조). 유형 II Cas 뉴클레아제는 Casl, Cas2, Csn2, 및 Cas9를 포함한다. 이들 Cas 뉴클레아제는 관련 기술분야의 통상의 기술자에게 공지되어 있다. 예를 들어, 스트렙토코쿠스 피오게네스(Streptococcus pyogenes) 야생형 Cas9 폴리펩티드의 아미노산 서열은 예를 들어 NBCI Ref. Seq. No. NP 269215에 제시되어 있고, 스트렙토코쿠스 써모필루스(Streptococcus thermophilus) 야생형 Cas9 폴리펩티드의 아미노산 서열은 예를 들어 NBCI Ref. Seq. No. WP_011681470에 제시되어 있다.
특정한 실시양태에서, Cas9는 RNA-가이드된 이중-가닥 DNA-결합 뉴클레아제 단백질 또는 니카제 단백질을 지칭한다. 야생형 Cas9 뉴클레아제는 상이한 DNA 가닥을 절단하는 2개의 기능적 도메인, 예를 들어 RuvC 및 HNH를 갖는다. Cas9는 둘 다의 기능적 도메인이 활성인 경우에 게놈 DNA (표적 DNA)에서 이중-가닥 파괴를 유도할 수 있다. 일부 실시양태에서, Cas9 효소는 박테리아, 예컨대 코리네박터(Corynebacter), 수테렐라(Sutterella), 레지오넬라(Legionella), 트레포네마(Treponema), 필리팍토르(Filif actor), 유박테리움(Eubacterium), 스트렙토코쿠스(Streptococcus), 락토바실루스(Lactobacillus), 미코플라스마(Mycoplasma), 박테로이데스(Bacteroides), 플라비이볼라(Flaviivola), 플라보박테리움(Flavobacterium), 스파에로카에타(Sphaerochaeta), 아조스피릴룸(Azospirillum), 글루코나세토박터(Gluconacetobacter), 네이세리아(Neisseria), 로세부리아(Roseburia), 파르비바쿨룸(Parvibaculum), 스타필로코쿠스(Staphylococcus), 니트라티프락토르(Nitratifractor), 및 캄필로박터(Campylobacter)로부터 유래된 Cas9 단백질의 1개 이상의 촉매 도메인을 포함한다. 일부 실시양태에서, Cas9는 융합 단백질이고, 예를 들어 2개의 촉매 도메인은 상이한 박테리아 종으로부터 유래된다.
이전에 나타낸 바와 같이, CRISPR/Cas 시스템은 특정 경우에 crRNA 및 tracrRNA가 단일 gRNA (sgRNA)로 불리는 1개의 분자로 조합될 수 있도록 조작되었다. 이러한 조작된 접근법에서, sgRNA는 Cas를 임의의 목적하는 서열을 표적화하도록 가이드한다 (예를 들어, 문헌 [Jinek et al., Science 337:816-821, 2012; Jinek et al., eLife 2:e00471, 2013; Segal, eLife 2:e00563, 2013] 참조). 따라서, CRISPR/Cas 시스템은 세포의 게놈 내의 목적하는 표적에서 이중-가닥 파괴를 생성하도록 조작될 수 있고, 세포의 내인성 메카니즘을 이용하여 HDR 또는 NHEJ에 의해 유도된 파괴를 복구할 수 있다. 본원에 기재된 특정한 실시양태는 규정된 통합 부위에서 HDR을 촉진하기 위해 상동성 아암을 이용한다.
Cas9 뉴클레아제의 유용한 변이체는 단일 불활성 촉매 도메인, 예컨대 RuvC" 또는 HNH" 효소 또는 니카제를 포함한다. Cas9 니카제는 단지 1개의 활성 기능적 도메인을 갖고, 일부 실시양태에서, 표적 DNA의 단지 1개의 가닥을 절단하여, 단일 가닥 파괴 또는 닉을 생성한다. 일부 실시양태에서, 적어도 D10A 돌연변이를 갖는 돌연변이체 Cas9 뉴클레아제는 Cas9 니카제이다. 다른 실시양태에서, 적어도 H840A 돌연변이를 갖는 돌연변이체 Cas9 뉴클레아제는 Cas9 니카제이다. Cas9 니카제에 존재하는 돌연변이의 다른 예는 N854A 및 N863A를 포함한다. 대향하는 DNA 가닥을 표적화하는 적어도 2개의 DNA-표적화 RNA가 사용되는 경우에 Cas9 니카제를 사용하여 이중-가닥 파괴가 도입된다. 이중-닉킹된 유도된 이중-가닥 파괴는 HDR 또는 NHEJ에 의해 복구된다. 이러한 유전자 편집 전략은 일반적으로 HDR을 선호하고, 오프-타겟 DNA 부위에서 indel 돌연변이의 빈도를 감소시킨다. 일부 실시양태에서, Cas9 뉴클레아제 또는 니카제는 표적 세포 또는 표적 유기체에 대해 코돈-최적화된다.
특정한 실시양태는 스타필로코쿠스 아우레우스(Staphylococcus aureus) Cas9 (SaCas9)를 이용할 수 있다. 특정한 실시양태는 하기 위치: E782, N968, 및/또는 R1015 중 1개 이상에서 돌연변이를 갖는 SaCas9를 이용할 수 있다. 특정한 실시양태는 하기 위치: E735, E782, K929, N968, A1021, K1044 및/또는 R1015 중 1개 이상에서 돌연변이를 갖는 SaCas9를 이용할 수 있다. 일부 실시양태에서, 변이체 SaCas9 단백질은 하기 돌연변이: R1015Q, R1015H, E782K, N968K, E735K, K929R, A1021T, 및/또는 K1044N 중 1개 이상을 포함한다. 일부 실시양태에서, 변이체 SaCas9 단백질은 D10A, D556A, H557A, N580A, 예를 들어 D10A/H557A 및/또는 D10A/D556A/H557A/N580A에서 돌연변이를 포함한다. 일부 실시양태에서, 변이체 SaCas9 단백질은 E735, E782, K929, N968, R1015, A1021, 및/또는 K1044로부터 선택된 1개 이상의 돌연변이를 포함한다. 일부 실시양태에서, SaCas9 변이체는 하기 돌연변이 세트: E782K/N968K/R1015H (KKH 변이체); E782K/K929R/R1015H (KRH 변이체); 또는 E782K/K929R/N968K/R1015H (KRKH 변이체) 중 하나를 포함할 수 있다.
Cpf1에 의해 예시된 부류 II, 유형 V CRISPR-Cas 부류는 문헌 [Zetsche et al., Cell 163(3): 759-771, 2015]에서 확인된다. Cpf1 뉴클레아제는 특히 프로토스페이서-인접 모티프 또는 PAM으로 공지된 짧은 3개 염기 쌍 인식 서열 (TTN)에 의해 표적 부위 선택에서 부가된 유연성을 제공할 수 있다. Cpf1의 절단 부위는 PAM 서열로부터 적어도 18bp 떨어져 있다. 더욱이, 점착성 말단을 갖는 엇갈린 DSB는 배향-특이적 공여자 주형 삽입을 허용하며, 이는 비-분열 세포에서 유리하다.
특정한 실시양태는 조작된 Cpf1을 이용할 수 있다. 예를 들어, US 2018/0030425는 변경되고 개선된 표적 특이성을 갖는 라크노스피라세아에 박테리움(Lachnospiraceae bacterium) ND2006 및 아시다미노코쿠스(Acidaminococcus) 종 BV3L6으로부터의 조작된 Cpf1 뉴클레아제를 기재한다. 특정한 변이체는 예를 들어 하기 위치: S202, N274, N278, K290, K367, K532, K609, K915, Q962, K963, K966, K1002, 및/또는 S1003 중 1개 이상에서 돌연변이 (즉, 천연 아미노산의 상이한 아미노산, 예를 들어 알라닌, 글리신, 또는 세린으로의 대체)를 갖는 아미노산 19-1246을 적어도 포함하는 라크노스피라세아에 박테리아 ND2006을 포함한다. 특정한 Cpf1 변이체는 또한 하기 위치: N178, S186, N278, N282, R301, T315, S376, N515, K523, K524, K603, K965, Q1013, Q1014, 및/또는 K1054 중 1개 이상에서 돌연변이 (즉, 천연 아미노산의 상이한 아미노산, 예를 들어 알라닌, 글리신, 또는 세린으로의 대체 (천연 아미노산이 세린인 경우는 제외))를 갖는 아시다미노코쿠스 종 BV3L6 Cpf1 (AsCpf1)을 포함할 수 있다.
다른 Cpf1 변이체는 문헌 [Zetsche et al., (Cell 163: 759-771, 2015)]에 개시된 Cpf1 폴리펩티드뿐만 아니라 미국 특허 공개 번호 2016/0208243에 개시된 Cpf1 폴리펩티드의 Cpf1 상동체 및 오르토로그를 포함한다. 다른 조작된 Cpf1 변이체는 관련 기술분야의 통상의 기술자에게 공지되어 있고, 본 개시내용의 범주 내에 포함된다 (예를 들어, WO/2017/184768 참조).
이전에 나타낸 바와 같이, 실시양태는 상동성 지정 복구를 이용하여 유전자 구축물의 표적화된 삽입을 용이하게 하기 위해 상동성 아암을 이용한다. 상동성 아암은 절단 부위의 게놈 서열에 대해 충분한 상동성, 예를 들어 절단 부위, 예를 들어 절단 부위의 50개 이하의 염기 내, 예를 들어 30개 염기 내, 15개 염기 내, 10개 염기 내, 5개 염기 내에 플랭킹되거나 또는 절단 부위에 바로 플랭킹된 뉴클레오티드 서열과 70%, 80%, 85%, 90%, 95%, 또는 100% 상동성을 가져, 그것과 상동성을 보유하는 게놈 서열 사이의 HDR을 지지하는 임의의 길이일 수 있다. 상동성 아암은 일반적으로 게놈 서열, 예를 들어 이중 가닥 절단 (DSB)이 발생하는 게놈 영역과 동일하다. 그러나, 나타낸 바와 같이, 절대적 동일성은 요구되지 않는다.
특정한 실시양태는 상동성-지정 복구 주형과 표적화된 게놈 서열 사이에 25, 50, 100, 또는 200개 뉴클레오티드, 또는 200개 초과의 뉴클레오티드의 서열 상동성 (또는 10 내지 200개 뉴클레오티드 또는 그 초과의 임의의 정수 값)을 갖는 상동성 아암을 이용할 수 있다. 특정한 실시양태에서, 상동성 아암은 40개 뉴클레오티드 (nt) - 1000개 nt 길이이다. 특정한 실시양태에서, 상동성 아암은 500-2500개 염기 쌍, 700 - 2000개 염기 쌍, 또는 800 - 1800개 염기 쌍이다. 특정한 실시양태에서, 상동성 아암은 적어도 800개 염기 쌍 또는 적어도 850개 염기 쌍을 포함한다. 상동성 아암의 길이는 또한 대칭 또는 비대칭일 수 있다. 상동성 아암에 관한 추가의 정보에 대해서는, 문헌 [Richardson et al., Nat Biotechnol., 34(3):339-44, 2016]을 참조한다.
CRISPR-Cas 시스템 및 그의 성분에 관한 추가의 정보는 US8697359, US8771945, US8795965, US8865406, US8871445, US8889356, US8889418, US8895308, US8906616, US8932814, US8945839, US8993233, 및 US8999641; 및 그와 관련된 출원; 및 WO2014/018423, WO2014/093595, WO2014/093622, WO2014/093635, WO2014/093655, WO2014/093661, WO2014/093694, WO2014/093701, WO2014/093709, WO2014/093712, WO2014/093718, WO2014/145599, WO2014/204723, WO2014/204724, WO2014/204725, WO2014/204726, WO2014/204727, WO2014/204728, WO2014/204729, WO2015/065964, WO2015/089351, WO2015/089354, WO2015/089364, WO2015/089419, WO2015/089427, WO2015/089462, WO2015/089465, WO2015/089473 및 WO2015/089486, WO2016/205711, WO2017/106657, WO2017/127807; 및 그와 관련된 출원에 기재되어 있다.
(IV-e) 염기 편집 시스템
염기 편집은 게놈 DNA 또는 세포 RNA 내의 염기 또는 염기 쌍을 상이한 염기 또는 염기 쌍으로 전환시키는 것에 의한 핵산 서열의 선택적 변형을 지칭한다 (Rees & Liu, Nature Reviews Genetics, 19:770-788, 2018). DNA 염기 편집제의 2가지 일반적 부류가 존재한다: (i) 구아닌-시토신 염기 쌍을 티민-아데닌 염기 쌍으로 전환시키는 시토신 염기 편집제 (CBE), 및 (ii) 아데닌-티민 염기 쌍을 구아닌 시토신 염기 쌍으로 전환시키는 아데닌 염기 편집제 (ABE).
DNA 염기 편집제는 이중-가닥 파괴를 생성하지 않으면서 비-분열 세포에 이러한 점 돌연변이를 삽입할 수 있다. 이중-가닥 파괴의 결여로 인해, 염기 편집제는 과도한 바람직하지 않은 편집 부산물, 예컨대 삽입 및 결실 (indel)을 발생시키지 않는다. 예를 들어, 염기 편집제는 이중-가닥 파괴에 의존하는 기술과 비교하여 10%, 9%, 8%, 7%, 6%, 5.5%, 5%, 4.5%, 4%, 3.5%, 3%, 2.5%, 2%, 1.5%, 1%, 0.5%, 또는 0.1% 미만의 indel을 생성할 수 있다.
대부분의 염기-편집 시스템의 성분은 (1) 표적화된 DNA 결합 단백질, (2) 핵염기 데아미나제 효소, 및 (3) DNA 글리코실라제 억제제를 포함한다.
CRISPR 시스템의 임의의 뉴클레아제는 불능화될 수 있고 염기 편집 시스템 내에서 사용될 수 있다. 예시적인 Cas 뉴클레아제는 Casl, CaslB, Cas2, Cas3, Cas4, Cas5, Cas6, Cas7, Cas8, Cas9 (또한 Csnl 및 Csxl2로도 공지됨), CaslO, , Cpfl, C2c3, C2c2 및 C2clCsyl, Csy2, Csy3, Csel, Cse2, Cscl, Csc2, Csa5, Csn2, Csm2, Csm3, Csm4, Csm5, Csm6, Cmrl, Cmr3, Cmr4, Cmr5, Cmr6, Cpfl, Csbl, Csb2, Csb3, Csxl7, Csxl4, CsxlO, Csxl6, CsaX, Csx3, Csxl, Csxl5, Csf1, Csf2, Csf3, Csf4 및 그의 돌연변이를 포함한다.
다른 유전자-편집 시스템으로부터의 뉴클레아제가 또한 사용될 수 있다. 예를 들어, 염기-편집 시스템은 아연 핑거 뉴클레아제 (ZFN) (Urnov et al., Nat Rev Genet., 11(9):636-46, 2010) 및 전사 활성화제 유사 이펙터 뉴클레아제 (TALEN) (Joung et al., Nat Rev Mol Cell Biol. 14(1):49-55, 2013)를 이용할 수 있다. DNA-결합 뉴클레아제에 관한 추가의 정보에 대해서는, US2018/0312825A1을 참조한다.
특정한 실시양태에서, 핵염기 데아미나제 효소는 시티딘 데아미나제 도메인 또는 아데닌 데아미나제 도메인을 포함한다.
특정한 실시양태에서, 시티딘 데아미나제 도메인을 이용하는 CBE는 시토신의 엑소시클릭 아민을 탈아미노화하여 우라실을 생성함으로써 구아닌-시토신 염기 쌍을 티민-아데닌 염기 쌍으로 전환시킨다. 시토신 데아미나제 효소의 예는 APOBEC1, APOBEC3A, APOBEC3G, CDA1, 및 AID를 포함한다. APOBEC1은 특히 단일 가닥 (ss)DNA를 기질로서 수용하지만, 이중 가닥 (ds)DNA에 대해서는 작용할 수 없다.
대부분의 염기-편집 시스템은 또한 의도된 염기 편집을 달리 복구할 수 있는 천연 DNA 복구 메카니즘을 무효화하는 역할을 하는 DNA 글리코실라제 억제제를 포함한다. 특정한 실시양태에서, DNA 글리코실라제 억제제는 우라실 글리코실라제 억제제, 예컨대 문헌 [Wang et al., (Gene 99, 31-37, 1991)]에 기재된 우라실 DNA 글리코실라제 억제제 단백질 (UGI)을 포함한다.
염기 편집제의 성분은 직접적으로 (예를 들어, 직접 공유 결합에 의해) 또는 링커를 통해 융합될 수 있다. 예를 들어, 촉매적으로 불능화된 뉴클레아제는 링커를 통해 데아미나제 효소 및/또는 글리코실라제 억제제에 융합될 수 있다. 다중 글리코실라제 억제제는 또한 링커를 통해 융합될 수 있다. 관련 기술분야의 통상의 기술자에 의해 이해되는 바와 같이, 링커는 임의의 펩티드 또는 그의 부분을 연결하는데 사용될 수 있다.
예시적인 링커는 중합체 링커 (예를 들어, 폴리에틸렌, 폴리에틸렌 글리콜, 폴리아미드, 폴리에스테르); 아미노산 링커; 탄소-질소 결합 아미드 링커; 시클릭 또는 비-시클릭, 치환 또는 비치환된, 분지형 또는 비분지형 지방족 또는 헤테로지방족 링커; 단량체, 이량체, 또는 중합체 아미노알칸산 링커; 아미노알칸산 (예를 들어, 글리신, 에탄산, 알라닌, β-알라닌, 3-아미노프로판산, 4-아미노부탄산, 5-펜탄산) 링커; 단량체, 이량체, 또는 중합체 아미노헥산산 (Ahx) 링커; 카르보시클릭 모이어티 (예를 들어, 시클로펜탄, 시클로헥산) 링커; 아릴 또는 헤테로아릴 모이어티 링커; 및 페닐 고리 링커를 포함한다.
링커는 또한 펩티드로부터 링커로 친핵체 (예를 들어, 티올, 아미노)의 부착을 용이하게 하기 위해 관능화된 모이어티를 포함할 수 있다. 임의의 친전자체가 링커의 일부로서 사용될 수 있다. 예시적인 친전자체는 활성화된 에스테르, 활성화된 아미드, 마이클 수용자, 알킬 할라이드, 아릴 할라이드, 아실 할라이드, 및 이소티오시아네이트를 포함한다.
특정한 실시양태에서, 링커는 4-100개 아미노산 길이의 범위이다. 특정한 실시양태에서, 링커는 4개 아미노산, 9개 아미노산, 14개 아미노산, 16개 아미노산, 32개 아미노산, 또는 100개 아미노산이다.
표적화된 DNA 결합 단백질을 시티딘 데아미나제 효소 및 DNA 글리코실라제 억제제 (예를 들어, UGI)와 연결함으로써 형성된 수많은 염기-편집 (BE) 시스템이 기재되어 있다. 이들 복합체는 예를 들어 BE1 ([APOBEC1-16 아미노산 (aa) 링커-Sp dCas9 (D10A, H840A)] Komer et al., Nature, 533, 420-424, 2016), BE2 ([APOBEC1-16aa 링커-Sp dCas9 (D10A, H840A)-4aa 링커-UGI] Komer et al., 2016 상기 문헌), BE3 ([APOBEC1-16aa 링커-Sp nCas9 (D10A)-4aa 링커-UGI] Komer et al., 상기 문헌), HF-BE3 ([APOBEC1-16aa 링커-HF nCas9 (D10A)-4aa 링커-UGI] Rees et al., Nat. Commun. 8, 15790, 2017), BE4, BE4max ([APOBEC1-32aa 링커-Sp nCas9 (D10A)-9aa 링커-UGI-9aa 링커-UGI] Koblan et al., Nat. Biotechnol 10.1038/nbt.4172, 2018; Komer et al., Sci. Adv., 3, eaao4774, 2017), BE4-GAM ([Gam-16aa 링커-APOBEC1-32aa 링커-Sp nCas9 (D10A)-9aa 링커-UGI-9aa 링커-UGI] Komer et al., 2017 상기 문헌), YE1-BE3 ([APOBEC1 (W90Y, R126E)-16aa 링커-Sp nCas9 (D10A)-4aa 링커-UGI] Kim et al., Nat. Biotechnol. 35, 475-480, 2017) , EE-BE3 ([APOBEC1 (R126E, R132E)-16aa 링커-Sp nCas9 (D10A)-4aa 링커-UGI] Kim et al., 2017 상기 문헌), YE2-BE3 ([APOBEC1 (W90Y, R132E)-16aa 링커-Sp nCas9 (D10A)-4aa 링커-UGI]Kim et al., 2017 상기 문헌), YEE-BE3 ([APOBEC1 (W90Y, R126E, R132E)-16aa 링커-Sp nCas9 (D10A)-4aa 링커-UGI] Kim et al., 2017 상기 문헌), VQR-BE3 ([APOBEC1-16aa 링커-Sp VQR nCas9 (D10A)-4aa 링커-UGI] Kim et al., 2017 상기 문헌), VRER-BE3 ([APOBEC1-16aa 링커-Sp VRER nCas9 (D10A)-4aa 링커-UGI] Kim et al., Nat. Biotechnol. 35, 475-480, 2017), Sa-BE3 ([APOBEC1-16aa 링커-Sa nCas9 (D10A)-4aa 링커-UGI] Kim et al., 2017 상기 문헌), SA-BE4 ([APOBEC1-32aa 링커-Sa nCas9 (D10A)-9aa 링커-UGI-9aa linker-UGI] Komer et al., 2017 상기 문헌), SaBE4-Gam ([Gam-16aa 링커-APOBEC1-32aa 링커-Sa nCas9 (D10A)-9aa 링커-UGI-9aa 링커-UGI] Komer et al., 2017 상기 문헌), SaKKH-BE3 ([APOBEC1-16aa 링커-Sa KKH nCas9 (D10A)-4aa 링커-UGI] Kim et al., 2017 상기 문헌), Cas12a-BE ([APOBEC1-16aa 링커-dCas12a-14aa 링커-UGI], Li et al., Nat. Biotechnol. 36, 324-327, 2018), 표적-AID ([Sp nCas9 (D10A)-100aa 링커-CDA1-9aa 링커-UGI] Nishida et al., Science, 353, 10.1126/science.aaf8729, 2016), 표적-AID-NG ([Sp nCas9 (D10A)-NG-100aa 링커-CDA1-9aa 링커-UGI] Nishimasu et al., Science, 361(6408): 1259-1262, 2018), xBE3 ([APOBEC1-16aa 링커-xCas9(D10A)-4aa 링커-UGI] Hu et al., Nature, 556, 57-63, 2018), eA3A-BE3 ([APOBEC3A (N37G)-16aa 링커-Sp nCas9(D10A)-4aa 링커-UGI] Gerkhe et al., Nat. Biotechnol., 10.1038/nbt.4199, 2018), A3A-BE3 ([hAPOBEC3A-16aa 링커-Sp nCas9(D10A)-4aa 링커-UGI] Wang et al., Nat. Biotechnol. 10.1038/nbt.4198, 2018), 및 BE-PLUS ([10X GCN4-Sp nCas9(D10A) / ScFv-rAPOBEC1-UGI] Jiang et al., Cell. Res, 10.1038/s41422-018-0052-4, 2018)를 포함한다. 아데닌 데아미나제 염기 편집제를 포함한 BE 복합체의 추가의 예에 대해서는, 문헌 [Rees & Liu Nat. Rev Genet. 2018 Dec; 19(12): 770-788]을 참조한다.
염기 편집제에 관한 추가의 정보에 대해서는, US2018/0312825A1, WO2018/165629A, 문헌 [Urnov et al., Nat Rev Genet. 2010; 11(9):636-46; Joung et al., Nat Rev Mol Cell Biol. 2013; 14(1):49-55; Charpentier et al., Nature.; 495(7439):50-1, 2013; 및 Rees & Liu, Nature Reviews Genetics, 19:770-788, 2018]을 참조한다.
(IV-f) 소형 RNA
소형 RNA는 유전자 발현을 조절하는 역할을 하는 짧은 비-코딩 RNA 분자이다. 특정한 실시양태에서, 소형 RNA는 200개 미만의 뉴클레오티드 길이이다. 특정한 실시양태에서, 소형 RNA는 100개 미만의 뉴클레오티드 길이이다. 특정한 실시양태에서, 소형 RNA는 50개 미만의 뉴클레오티드 길이이다. 특정한 실시양태에서, 소형 RNA는 20개 미만의 뉴클레오티드 길이이다. 소형 RNA는 마이크로RNA (miRNA, Piwi-상호작용 RNA (piRNA), 소형 간섭 RNA (siRNA), 소형 핵소체 RNA (snoRNA), tRNA-유래 소형 RNA (tsRNA), 소형 rDNA-유래 RNA (srRNA), 및 소형 핵 RNA를 포함한다. 소형 RNA의 추가의 부류가 계속해서 발견된다.
특정한 실시양태에서, 표적 mRNA에 상동인 간섭 RNA 분자는 RNA 간섭 (RNAi)으로 지칭되는 과정인 그의 분해를 유도할 수 있다 (Carthew, Curr. Opin. Cell. Biol. 13: 244-248, 2001). RNAi는 세포에서 자연적으로 발생하여 외래 RNA (예를 들어, 바이러스 RNA)를 제거한다. 천연 RNAi는 분해 메카니즘을 다른 유사한 RNA 서열로 지시하는 유리 이중-가닥 RNA (dsRNA)로부터 절단된 단편을 통해 진행된다. 대안적으로, RNAi는 예를 들어 표적 유전자의 발현을 침묵시키기 위해 제조될 수 있다. 예시적인 RNAi 분자는 소형 헤어핀 RNA (shRNA, 또한 짧은 헤어핀 RNA로도 지칭됨) 및 소형 간섭 RNA (siRNA)를 포함한다.
본 개시내용을 제한하지 않고, 이론에 얽매이지는 않지만, RNA 간섭은 전형적으로 2-단계 과정이다. 개시 단계인 제1 단계에서, 투입 dsRNA는 아마도 dsRNA-특이적 리보뉴클레아제의 리보뉴클레아제 (RNase) III 패밀리의 구성원인 다이서의 작용에 의해 21-23개 뉴클레오티드 (nt) siRNA로 소화되며, 이는 ATP-의존성 방식으로 dsRNA (직접적으로 또는 트랜스진 또는 바이러스를 통해 도입됨)를 프로세싱 (절단)한다. 연속 절단 사건은 RNA를 각각 2-뉴클레오티드 3' 오버행을 갖는 19-21개 염기 쌍 (bp) 듀플렉스 (siRNA)로 분해한다 (Hutvagner & Zamore, Curr. Opin. Genet. Dev. 12: 225-232, 2002; Bernstein, Nature 409:363-366, 2001).
이펙터 단계에서, siRNA 듀플렉스는 뉴클레아제 복합체에 결합하여 RNA-유도된 침묵 복합체 (RISC)를 형성한다. siRNA 듀플렉스의 ATP-의존성 풀림이 RISC의 활성화에 요구된다. 이어서, 활성 RISC는 염기 쌍형성 상호작용에 의해 상동 전사체를 표적화하고, 전형적으로 mRNA를 siRNA의 3' 말단으로부터 12개의 뉴클레오티드 단편으로 절단한다 (Hutvagner & Zamore, Curr. Opin. Genet. Dev. 12: 225-232, 2002; Hammond et al., Nat. Rev. Gen. 2:110-119, 2001; Sharp, Genes. Dev. 15:485-490, 2001). 연구는 각각의 RISC가 단일 siRNA 및 RNase를 함유함을 나타낸다 (Hutvagner & Zamore, Curr. Opin. Genet. Dev. 12: 225-232, 2002).
RNAi의 주목할 만한 효력으로 인해, RNAi 경로 내의 증폭 단계가 제안되었다. 증폭은 더 많은 siRNA를 생성할 투입 dsRNA의 카피에 의해, 또는 형성된 siRNA의 복제에 의해 발생할 수 있다. 대안적으로 또는 추가적으로, 증폭은 RISC의 다중 전환 사건에 의해 이루어질 수 있다 (Hutvagner & Zamore, Curr. Opin. Genet. Dev. 12: 225-232, 2002; Hammond et al., Nat. Rev. Gen. 2:110-119, 2001; Sharp, Genes. Dev. 15:485-490, 2001). RNAi는 또한 문헌 [Tuschl (Chem. Biochem. 2: 239-245, 2001); Cullen (Nat. Immunol. 3:597-599, 2002); 및 Brantl (Biochem. Biophys. Act. 1575:15-25, 2002)]에 기재되어 있다.
본 개시내용에서 사용하기에 적합한 RNAi 분자의 합성은 하기와 같이 수행될 수 있다. 먼저, mRNA 서열을 표적화된 트랜스진의 개시 코돈의 하류에서 스캐닝할 수 있다. 각각의 AA 및 3' 인접 19개 뉴클레오티드의 발생을 잠재적 siRNA 표적 부위로서 기록한다. 특정한 실시양태에서, siRNA 표적 부위는, 비번역 영역 (UTR)이 조절 단백질 결합 부위에서 더 풍부하기 때문에 오픈 리딩 프레임으로부터 선택될 수 있다. UTR-결합 단백질 및/또는 번역 개시 복합체는 siRNA 엔도뉴클레아제 복합체의 결합을 방해할 수 있다 (Tuschl, Chem. Biochem. 2: 239-245, 2001). 글리세르알데히드 3-포스페이트 데히드로게나제 (GAPDH)에 대해 입증된 바와 같이 비번역 영역에 지시된 siRNA가 또한 효과적일 수 있으며, 여기서 5' UTR에 지시된 siRNA는 세포 GAPDH mRNA의 90% 감소를 매개하고 단백질 수준을 완전히 폐지하였음이 인지될 것이다. 둘째로, 잠재적 표적 부위는 임의의 서열 정렬 소프트웨어, 예컨대 국립 생물 정보 센터 (NCBI) 서버로부터 이용가능한 베이직 로컬 얼라인먼트 서치 툴 (BLAST) 소프트웨어를 사용하여 적절한 게놈 데이터베이스와 비교될 수 있다. 다른 코딩 서열에 대해 유의한 상동성을 나타내는 추정 표적 부위가 필터링될 수 있다.
적격 표적 서열은 siRNA 합성을 위한 주형으로서 선택될 수 있다. 선택된 서열은 G/C 함량이 낮은 것을 포함할 수 있으며, 이는 G/C 함량이 55%를 초과하는 것과 비교하여 유전자 침묵을 매개하는데 있어서 보다 효과적인 것으로 나타났기 때문이다. 몇몇 표적 부위는 평가를 위해 표적 유전자의 길이를 따라 선택될 수 있다. 선택된 siRNA의 보다 우수한 평가를 위해, 음성 대조군이 사용될 수 있다. 음성 대조군 siRNA는 siRNA와 동일한 뉴클레오티드 조성을 포함할 수 있지만, 게놈에 대한 유의한 상동성이 결여될 수 있다. 따라서, 다른 유전자에 대한 임의의 유의한 상동성을 나타내지 않는 한, siRNA의 스크램블된 뉴클레오티드 서열이 사용될 수 있다.
센스 가닥은 선택된 부분의 서열에 기초하여 설계된다. 안티센스 가닥은 상용적으로 센스 가닥과 동일한 길이이고, 상보적 뉴클레오티드를 포함한다. 특정한 실시양태에서, 가닥은 정렬 또는 어닐링 시 완전히 상보적이고 평활-말단이다. 다른 실시양태에서, 가닥은 1-, 2- 또는 3-뉴클레오티드 오버행이 생성되도록, 즉 센스 가닥의 3' 단부가 안티센스 가닥의 5' 단부보다 1, 2 또는 3개의 뉴클레오티드만큼 추가로 연장되고/거나 안티센스 가닥의 3' 단부가 센스 가닥의 5' 단부보다 1, 2 또는 3개의 뉴클레오티드만큼 추가로 연장되도록 정렬 또는 어닐링된다. 오버행은 표적 유전자 서열 (또는 그의 상보체)에 상응하는 뉴클레오티드를 포함할 수 있다. 대안적으로, 오버행은 데옥시리보뉴클레오티드, 예를 들어 데옥시티민 (dT), 또는 뉴클레오티드 유사체, 또는 다른 적합한 비-뉴클레오티드 물질을 포함할 수 있다.
RISC 내로의 안티센스 가닥의 진입을 용이하게 하기 위해 (및 따라서 표적 절단 및 침묵의 효율을 증가 또는 개선시키기 위해), 센스 가닥의 5' 단부와 안티센스 가닥의 3' 단부 사이의 염기 쌍 강도가 변경, 예를 들어 저하 또는 감소될 수 있다. 특정한 실시양태에서, 염기-쌍 강도는 제1 또는 안티센스 가닥의 3' 단부와 제2 또는 센스 가닥의 5' 단부 사이보다 제1 또는 안티센스 가닥의 5' 단부와 제2 또는 센스 가닥의 3' 단부 사이의 더 적은 G:C 염기 쌍으로 인해 더 약하다. 특정한 실시양태에서, 염기 쌍 강도는 제1 또는 안티센스 가닥의 5' 단부와 제2 또는 센스 가닥의 3' 단부 사이의 적어도 1개의 미스매칭된 염기 쌍으로 인해 더 약하다. 바람직하게는, 미스매치된 염기 쌍은 G:A, C:A, C:U, G:G, A:A, C:C 및 U:U를 포함하는 군으로부터 선택된다. 또 다른 실시양태에서, 염기 쌍 강도는 제1 또는 안티센스 가닥의 5' 단부와 제2 또는 센스 가닥의 3' 단부 사이의 적어도 1개의 워블 염기 쌍, 예를 들어 G:U로 인해 더 약하다. 또 다른 실시양태에서, 염기 쌍 강도는 희귀 뉴클레오티드, 예를 들어 이노신 (I)을 포함하는 적어도 1개의 염기 쌍으로 인해 더 약하다. 특정한 실시양태에서, 염기 쌍은 I:A, I:U 및 I:C를 포함하는 군으로부터 선택된다. 또 다른 실시양태에서, 염기 쌍 강도는 변형된 뉴클레오티드를 포함하는 적어도 1개의 염기 쌍으로 인해 더 약하다. 특정한 실시양태에서, 변형된 뉴클레오티드는, 예를 들어 2-아미노-G, 2-아미노-A, 2,6-디아미노-G, 및 2,6-디아미노-A로부터 선택된다.
ShRNA는 헤어핀 루프 구조를 갖는 단일-가닥 폴리뉴클레오티드이다. 단일-가닥 폴리뉴클레오티드는 이중-가닥 영역 내의 하나의 가닥의 3' 단부와 이중-가닥 영역 내의 다른 가닥의 5' 단부를 연결하는 루프 절편을 갖는다. 이중-가닥 영역은 표적 서열, 예컨대 트랜스진을 코딩하는 폴리뉴클레오티드에 혼성화가능한 제1 서열, 및 제1 서열에 상보적인 제2 서열로부터 형성되고, 따라서 제1 및 제2 서열은 연결 서열이 단부를 연결하여 헤어핀 루프 구조를 형성한 이중 가닥 영역을 형성한다. 제1 서열은 트랜스진을 코딩하는 폴리뉴클레오티드의 임의의 부분에 혼성화가능할 수 있다. shRNA의 이중 가닥 스템 도메인은 제한 엔도뉴클레아제 부위를 포함할 수 있다.
shRNA의 전사는 폴리머라제 III (Pol III) 프로모터에서 개시되고, 4-5-티민 전사 종결 부위의 위치 2에서 종결되는 것으로 생각된다. 발현 시, shRNA는 3' UU-오버행을 갖는 스템-루프 구조로 폴딩되는 것으로 생각되고; 후속적으로, 이들 shRNA의 단부는 프로세싱되어, shRNA가 21-23개 뉴클레오티드의 siRNA-유사 분자로 전환된다 (Brummelkamp et al., Science. 296(5567):550-553, 2002; Lee et al., Nature Biotechnol. 20(5):500-505, 2002; Miyagishi & Taira, Nature Biotechnol. 20(5):497-500, 2002; Paddison et al., Genes & Dev. 16(8): 948-958, 2002; Paul et al., Nature Biotechnol. 20(5):505-508, 2002; Sui, Proc. Natl. Acad. Sci. USA. 99(6):5515-5520, 2002; Yu et al., Proc. Natl. Acad. Sci. USA. 99(9):6047-6052, 2002).
shRNA의 스템-루프 구조는 임의적인 뉴클레오티드 오버행, 예컨대 2-bp 오버행, 예를 들어 3' UU 오버행을 가질 수 있다. 변이가 있을 수 있지만, 스템은 전형적으로 15 내지 49, 15 내지 35, 19 내지 35, 21 내지 31 bp, 또는 21 내지 29 bp의 범위이고, 루프는 4 내지 30 bp, 예를 들어, 4 내지 23 bp의 범위일 수 있다. 특정한 실시양태에서, shRNA 서열은 45-65 bp; 50-60 bp; 또는 51, 52, 53, 54, 55, 56, 57, 58, 또는 59 bp를 포함한다. 특정한 실시양태에서, shRNA 서열은 52 또는 55 bp를 포함한다. 특정한 실시양태에서, siRNA는 15-25 bp를 갖는다. 특정한 실시양태에서, siRNA는 16, 17, 18, 19, 20, 21, 22, 23, 또는 24 bp를 갖는다. 특정한 실시양태에서, siRNA는 19 bp를 갖는다. 그러나, 통상의 기술자는 16개 미만의 뉴클레오티드 또는 24개 초과의 뉴클레오티드 길이를 갖는 siRNA가 또한 RNAi를 매개하는 기능을 할 수 있다는 것을 인지할 것이다. 보다 긴 RNAi 작용제는, 바람직하지 않을 수 있는, 특정 포유동물 세포에서 인터페론 또는 단백질 키나제 R (PKR) 반응을 도출하는 것으로 입증되었다. 바람직하게는 RNAi 작용제는 PKR 반응을 도출하지 않는다 (즉, 충분히 짧은 길이를 가짐). 그러나, 보다 긴 RNAi 작용제는, 예를 들어 PKR 반응이 대안적 수단에 의해 하향조절되거나 약화된 상황에서 유용할 수 있다.
소형 RNA가 유전자 발현을 활성화시키는데 또한 사용될 수 있다.
(IV-g) 특정한 코딩 서열 및 특정한 LCR의 쌍형성
본 개시내용은 LCR, 예컨대 긴 LCR이 작동가능하게 연결된 코딩 핵산 서열의 발현 (예를 들어, 발현 수준 또는 발현의 세포 유형 특이성)을 제어할 수 있다는 인식을 포함한다. 본 개시내용의 특정한 LCR과 연관된 예시적인 발현 패턴 (예를 들어, 세포 유형 및/또는 조직 유형)이 표 1에 제공된다. 따라서, 다양한 실시양태에서, 트랜스포손 페이로드는 LCR이 발현을 구동하는 것으로 공지된 1종 이상의 세포 또는 조직 유형에서의 발현을 위한 생성물을 코딩하는 코딩 핵산 서열과 작동가능하게 연결된 LCR, 예컨대 긴 LCR을 포함할 수 있다. 몇몇 예를 제공하기 위해, 본 발현의 트랜스포손 페이로드는 (i) 적혈구, 예를 들어 조혈 줄기 세포에서의 발현을 위한 단백질을 코딩하는 코딩 서열과 작동가능하게 연결된 β-글로빈 LCR; (2) B 세포에서의 발현을 위한 단백질을 코딩하는 코딩 서열과 작동가능하게 연결된 이뮤노글로불린 중쇄 LCR; 또는 (3) T 세포에서의 발현을 위한 단백질을 코딩하는 코딩 서열과 작동가능하게 연결된 T 세포 수용체 α/δ LCR 또는 CD2 LCR을 포함할 수 있다. 예를 들어, 조혈 줄기 세포에서의 발현을 위한 단백질은 지중해빈혈, 겸상 적혈구 빈혈, 또는 혈우병으로부터 선택된 장애의 치료를 위한 단백질일 수 있고; B 세포에서의 발현을 위한 단백질은 항체, 예컨대 치료 항체일 수 있고; T 세포에서의 발현을 위한 단백질은 T 세포 수용체 (TCR), 예컨대 조작된 TCR 또는 키메라 항원 수용체 (CAR)일 수 있다. 따라서, 본 개시내용은 특히 (i) γ-글로빈, β-글로빈, 또는 인자 VIII를 부분적으로 또는 완전히 기능적으로 대체할 수 있는 단백질을 코딩하는 코딩 서열과 작동가능하게 연결된 β-글로빈 LCR, 또는 겸상 적혈구 빈혈을 유발하는 돌연변이의 교정을 위한 유전자 편집 CRISPR-Cas; (2) 항체를 코딩하는 코딩 서열과 작동가능하게 연결된 이뮤노글로불린 중쇄 LCR; 또는 (3) TCR 또는 CAR을 코딩하는 코딩 서열과 작동가능하게 연결된 T 세포 수용체 α/δ LCR 또는 CD2 LCR을 포함한다.
(V) 트랜스포사제
트랜스포사제는 전위할 수 있고 전위를 매개할 수 있는 기능적 핵산-단백질 복합체의 성분인 효소를 지칭한다. 트랜스포사제는 또한 레트로트랜스포손으로부터의 또는 레트로바이러스 기원의 인테그라제를 지칭한다. 전위 반응은 트랜스포사제 및 트랜스포사제 또는 인테그라제 효소를 포함한다. 특정한 실시양태에서, 통합의 효율, 통합될 수 있는 DNA 서열의 크기, 및 게놈 내로 통합될 수 있는 DNA 서열의 카피의 수는 이러한 전위가능 요소를 사용하는 것에 의해 개선될 수 있다. 트랜스포손은 DNA의 보다 큰 절편의 상류 및 하류에 말단 반복 서열을 갖는 짧은 핵산 서열을 포함한다. 트랜스포사제는 말단 반복 서열에 결합하고, 게놈의 또 다른 부분으로의 트랜스포손의 이동을 촉매한다.
(V-a) 슬리핑 뷰티 트랜스포사제 SB100x의 사용
슬리핑 뷰티 (SB)는 연어과 어류의 게놈으로부터 유래된 트랜스포사제이다. SB는 문헌 [Ivics et al., Cell 91, 501-510, 1997; Izsvak et al., J. Mol. Biol., 93-102, 302(1), 2000; Geurts et al., Molecular Therapy, 8(1):108-117, 2003; Mates et al., Nature Genetics 41, 753-761, 2009]; 및 미국 특허 번호 6,489,458; 7,148,203; 및 7,160,682; 미국 공개 번호 2011/117072; 2004/077572; 및 2006/252140에 기재되어 있다.
SB 트랜스포사제의 활성을 증가시키기 위해 체계적인 돌연변이유발 연구가 착수되었다. 예를 들어, 얀트(Yant) 등은 SB 트랜스포사제의 N-말단 95 AA의 알라닌으로의 체계적 교환에 착수하였다 (Mol. Cell Biol. 24: 9239-9247, 2004). 이들 치환 중 10개는 참조로서 SB10과 비교하여 200-400%의 과다활성을 유발하였다. 문헌 [Baus et al., Mol. Therapy 12: 1148-1156, 2005]에 기재된 SB16은 SB10과 비교하여 16-배 활성 증가를 갖는 것으로 보고되었다. 추가의 과다활성 SB 변이체는 문헌 [Zayed et al., (Mol Therapy, 9(2):292-304, 2004)] 및 미국 특허 번호 9,840,696에 기재되어 있다. SB 트랜스포사제의 몇몇 변이체를 스크리닝한 후, SB100X가 제1-세대 트랜스포사제보다 100-배 더 효율적인 것으로 밝혀졌다.
SB 트랜스포손은 전위시키기 위해 원형화될 필요가 있다 (Yant, et al., Nature Biotechnology, 20: 999-1005, 2002). 또한, 1.9 내지 7.2 kb의 트랜스포손의 경우 트랜스포손의 길이와 전위 빈도 사이에 역 선형 관계가 존재한다. 다시 말해서, SB 트랜스포사제는 보다 작은 트랜스포손과 비교하여 보다 큰 트랜스포손의 전달을 덜 효율적으로 매개한다 (Geurts, et al., Mol Ther., 8(1):108-17, 2003).
(V-a-i) 역전된 반복부 서열 및 위치
특정한 실시양태에서, IR (역전된 반복부)/DR (직접 반복부)을 코딩하는 서열 및 슬리핑 뷰티의 염색체 서열은 서열식별번호: 66을 포함한다. 특정한 실시양태에서, IR/DR을 코딩하는 서열 및 슬리핑 뷰티의 염색체 서열은 서열식별번호: 67을 포함한다. 특정한 실시양태에서, 슬리핑 뷰티의 IR/DR 코딩 서열은 서열식별번호: 68을 포함한다. 특정한 실시양태에서, IR/DR을 코딩하는 서열 및 슬리핑 뷰티의 염색체 서열은 서열식별번호: 69를 포함한다. 특정한 실시양태에서, IR/DR을 코딩하는 서열 및 슬리핑 뷰티의 염색체 서열은 서열식별번호: 70을 포함한다. 특정한 실시양태에서, 슬리핑 뷰티의 IR/DR을 코딩하는 서열은 서열식별번호: 71을 포함한다. 특정한 실시양태에서, IR/DR을 코딩하는 서열 및 슬리핑 뷰티의 염색체 서열은 서열식별번호: 72를 포함한다. 특정한 실시양태에서, 슬리핑 뷰티의 IR/DR을 코딩하는 서열은 서열식별번호: 73을 포함한다.
(V-a-ii) 트랜스포사제 서열
특정 실시양태에서, 슬리핑 뷰티 트랜스포사제 효소는 서열식별번호: 74의 서열을 갖는다.
특정 실시양태에서, 과다활성 슬리핑 뷰티는 SB100X이다. 특정한 실시양태에서, SB100X는 서열식별번호: 75의 서열을 갖는다.
(V-b) 다른 트랜스포사제
SB에 더하여, 인간을 포함한 척추동물의 게놈 내로의 핵산의 삽입을 용이하게 하는 다수의 트랜스포사제가 관련 기술분야에 기재되어 있다. 이러한 트랜스포사제의 예는 피기백(piggyBac)™ (예를 들어, 레피도프테란(lepidopteran) 세포 및/또는 미오티스 루시푸구스(Myotis lucifugus)로부터 유래됨); 마리네르 (예를 들어, 드로소필라(Drosophila)로부터 유래됨); 프로그 프린스 (예를 들어, 라나 피피엔스(Rana pipiens)로부터 유래됨); Tol1; Tol2 (예를 들어, 메다카 피쉬(medaka fish)로부터 유래됨); Tc부스터(TcBuster)™ (예를 들어, 거짓쌀도둑거저리 트리볼리움 카스타네움(Tribolium castaneum)으로부터 유래됨), 헬라이세르(Helraiser), 히마르1(Himar1), 패스포트(Passport), 미노스(Minos), Ac/Ds, PIF, 하르빈게르(Harbinger), 하르빈게르3-DR, HSmar1, 및 스핀온(spinON)을 포함한다.
(V-b-i) 성분 및 서열
피기백™ (PB) 트랜스포사제는, 예를 들어 문헌 [Fraser et al., Insect Mol. Biol., 5:141-51, 1996; Mitra et al., EMBO J. 27:1097-1109, 2008; Ding et al., Cell, 122:473-83, 2005]; 및 미국 특허 번호 6,218,185; 6,551,825; 6,962,810; 7,105,343; 및 7,932,088에 기재된 조밀한 기능적 트랜스포사제 단백질이다. 과다활성 피기백™ 트랜스포사제는 미국 특허 번호 10,131,885에 기재되어 있다.
특정한 실시양태에서, PB 트랜스포사제는 서열식별번호: 76 (진뱅크 ABS12111.1)에 제시된 서열을 갖는다.
특정한 실시양태에서, 프로그 프린스(Frog Prince) 트랜스포사제는 서열식별번호: 77 (진뱅크: AAP49009.1)에 제시된 바와 같은 서열을 갖는다. 또한 US2005/0241007을 참조한다.
특정한 실시양태에서, TcBuster 트랜스포사제는 서열식별번호: 78 (진뱅크: ABF20545.1)에 제시된 바와 같은 서열을 갖는다.
특정한 실시양태에서, Tol2 트랜스포사제는 서열식별번호: 79 (진뱅크: BAA87039.1)에 제시된 서열을 갖는다.
DNA 트랜스포손에 대한 추가의 정보는, 예를 들어 문헌 [Munoz-Lopez & Garcia Perez, Curr Genomics, 11(2):115-128, 2010]에서 찾아볼 수 있다.
(VI) 조절 성분
용어 "조절 성분"은 프로모터, 인핸서, 전사 종결 신호, 폴리아데닐화 서열, 및 다른 발현 제어 서열을 포함한다. 본 발명에서 언급되는 조절 성분은 핵산 서열 숙주 세포의 발현을 제어하는 것을 포함한다.
(VI-a) 프로모터
프로모터는 전사 개시 전 RNA 폴리머라제가 결합하는, 통상적으로 관련 코딩 서열의 상류 (5')에 있는 비-코딩 게놈 DNA 서열이다. 이러한 결합은 전사가 특이적 전사 개시 부위에서 개시되도록 RNA 폴리머라제를 정렬시킨다. 프로모터의 뉴클레오티드 서열은 효소 및 그에 부착되는 다른 관련 단백질 인자의 성질 및 RNA 합성 속도를 결정한다. RNA는 프로세싱되어 메신저 RNA (mRNA)를 생산하며, 이는 코딩된 폴리펩티드의 아미노산 서열로의 RNA 서열의 번역을 위한 주형으로서의 역할을 한다. 5' 비-번역 리더 서열은 mRNA의 개시 및 번역에서 소정의 역할을 할 수 있는 코딩 영역 상류의 mRNA 영역이다. 3' 전사 종결/폴리아데닐화 신호는 식물 세포에서 RNA 합성의 종결 및 3' 단부에의 폴리아데닐레이트 뉴클레오티드의 부가를 유발하도록 기능하는, 코딩 영역 하류의 비-번역 영역이다.
프로모터는 일반적 프로모터, 조직-특이적 프로모터, 세포-특이적 프로모터, 및/또는 세포질에 특이적인 프로모터를 포함할 수 있다. 프로모터는 강한 프로모터, 약한 프로모터, 구성적 발현 프로모터, 및/또는 유도성 (조건부) 프로모터를 포함할 수 있다. 유도성 프로모터는 특정 조건, 신호 또는 세포 사건에 반응하여 발현을 제어한다. 예를 들어, 프로모터는 프로모터로부터 전사를 수행하기 위해 특정한 리간드, 소분자, 전사 인자 또는 호르몬 단백질을 필요로 하는 유도성 프로모터일 수 있다. 프로모터의 특정한 예는 AFP (α-태아단백질) 프로모터, 아밀라제1C 프로모터, 아쿠아포린-5 (AP5) 프로모터, αl -항트립신 프로모터, β-act 프로모터, β-글로빈 프로모터, β-Kin 프로모터, B29 프로모터, CCKAR 프로모터, CD14 프로모터, CD43 프로모터, CD45 프로모터, CD68 프로모터, CEA 프로모터, c-erbB2 프로모터, CMV (시토메갈로바이러스 바이러스) 프로모터, minCMV 프로모터, COX-2 프로모터, CXCR4 프로모터, 데스민 프로모터, E2F-1 프로모터, EF1α (신장 인자 lα) 프로모터, EGR1 프로모터, eIF4A1 프로모터, 엘라스타제-1 프로모터, 엔도글린 프로모터, FerH 프로모터, FerL 프로모터, 피브로넥틴 프로모터, Flt-1 프로모터, GAPDH 프로모터, GFAP 프로모터, GPIIb 프로모터, GRP78 프로모터, GRP94 프로모터, HE4 프로모터, hGR1/1 프로모터, hNIS 프로모터, Hsp68 프로모터, Hsp68 최소 프로모터, HSP70 프로모터, HSV-1 바이러스 TK 유전자 프로모터, hTERT 프로모터, ICAM-2 프로모터, 칼리크레인 프로모터, LP 프로모터, 주요 후기 프로모터 (MLP), Mb 프로모터, Rho 프로모터, MT (메탈로티오네인) 프로모터, MUC1 프로모터, NphsI 프로모터, OG-2 프로모터, PGK (포스포 글리세레이트 키나제) 프로모터, PGK-1 프로모터, 폴리머라제 III (Pol III) 프로모터, PSA 프로모터, ROSA 프로모터, 라우스 육종 바이러스 (RSV) 긴-말단 반복부 (LTR) 프로모터, SP-B 프로모터, 서바이빈 프로모터, SV40 (원숭이 바이러스 40) 프로모터, SYN1 프로모터, SYT8 유전자 프로모터, TRP1 프로모터, Tyr 프로모터, 유비퀴틴 B 프로모터, 및 WASP 프로모터를 포함한다.
(VI-a-i) 프로모터의 공급원
프로모터는 천연 프로모터 또는 복합 프로모터로서 수득될 수 있다. 천연 프로모터, 또는 최소 프로모터는 주어진 유전자의 5' 영역으로부터의 뉴클레오티드 서열을 포함하는 프로모터를 지칭한다. 천연 프로모터는 코어 프로모터 및 그의 천연 5'UTR을 포함한다. 특정한 실시양태에서, 5'UTR은 인트론을 포함한다. 복합 프로모터는 상이한 기원의 프로모터 요소를 조합하거나 또는 원위 인핸서를 동일하거나 상이한 기원의 최소 프로모터와 조합함으로써 유래된 프로모터를 지칭한다.
(VI-a-ii) 예시적인 프로모터의 서열 및 서열에 대한 변이
특정한 실시양태에서, SV40 프로모터는 서열식별번호: 80에 제시된 서열을 포함한다. 특정한 실시양태에서, dESV40 프로모터 (인핸서 영역이 결실된 SV40 프로모터)는 서열식별번호: 81에 제시된 서열을 포함한다. 특정한 실시양태에서, 인간 텔로머라제 촉매 서브유닛 (hTERT) 프로모터는 서열식별번호: 82에 제시된 서열을 포함한다. 특정한 실시양태에서, 슈미트-루핀(Schmidt-Ruppin) A 균주로부터 유래된 RSV 프로모터는 서열식별번호: 83에 제시된 서열을 포함한다. 특정한 실시양태에서, hNIS 프로모터는 서열식별번호: 84에 제시된 서열을 포함한다. 특정한 실시양태에서, 인간 글루코코르티코이드 수용체 1A (hGR 1/Ap/e) 프로모터는 서열식별번호: 85에 제시된 서열을 포함한다.
특정한 실시양태에서, 프로모터는 야생형 프로모터 서열 및 야생형 프로모터에 비해 특정 위치에서 임의적인 변화 (삽입, 점 돌연변이 또는 결실 포함)를 갖는 서열을 포함한다. 특정한 실시양태에서, 프로모터는 20개 뉴클레오티드 스트레치당 1개 변화, 20개 뉴클레오티드 스트레치당 2개 변화, 20개 뉴클레오티드 스트레치당 3개 변화, 20개 뉴클레오티드 스트레치당 4개 변화, 또는 20개 뉴클레오티드 스트레치당 5개 변화를 가짐으로써 자연 발생 프로모터와 상이하다. 특정한 실시양태에서, 천연 서열은 1, 2, 3, 4, 5, 6, 7, 8, 9, 또는 10개 염기에서 변경될 것이다. 프로모터는 다른 바이러스 서열의 존재 또는 부재 하에 LTR 서열의 약 50개 뉴클레오티드 내지 LTR 서열의 100, 200, 250 또는 350개 뉴클레오티드를 포함하여 길이가 다양할 수 있다.
(VI-a-iii) 프로모터의 발현 패턴
일부 프로모터는 조직 또는 세포에 특이적이고, 일부 프로모터는 조직 또는 세포에 비-특이적이다. 포유동물 세포의 각각의 유전자는 그 자신의 프로모터를 갖고, 일부 프로모터는 특정 세포 유형에서만 활성화될 수 있다. 비-특이적 프로모터 또는 편재성 프로모터는 광범위한 세포, 조직 및 세포 주기에서 프로모터 서열과 작동가능하게 연결된 유전자 또는 뉴클레오티드 서열의 전사의 개시를 돕는다. 특정한 실시양태에서, 프로모터는 비-특이적 프로모터이다. 특정한 실시양태에서, 비-특이적 프로모터는 CMV 프로모터, RSV 프로모터, SV40 프로모터, 포유동물 신장 인자 1α (EF1α) 프로모터, β-act 프로모터, EGR1 프로모터, eIF4A1 프로모터, FerH 프로모터, FerL 프로모터, GAPDH 프로모터, GRP78 프로모터, GRP94 프로모터, HSP70 프로모터, β-Kin 프로모터, PGK-1 프로모터, ROSA 프로모터, 및/또는 유비퀴틴 B 프로모터를 포함한다.
특이적 프로모터는 프로모터 서열과 작동가능하게 연결된 뉴클레오티드 서열의 세포 특이적 발현을 돕는다. 특정한 실시양태에서, 특이적 프로모터는 B 세포, 단핵구 세포, 백혈구, 대식세포, 췌장 선방 세포, 내피 세포, 성상세포, 및/또는 임의의 다른 세포 유형 또는 세포 주기에서 활성이다. 특정한 실시양태에서, 프로모터는 특이적 프로모터이다. 특정한 실시양태에서, SYT8 유전자 프로모터는 인간 섬에서 유전자 발현을 조절한다 (Xu, et al., Nat Struct Mol Biol., 2011, 18: 372-378). 특정한 실시양태에서, 칼리크레인 프로모터는 관 세포 특이적 타액선에서 유전자 발현을 조절한다. 특정한 실시양태에서, 아밀라제 1C 프로모터는 선방 세포에서의 유전자 발현을 조절한다. 특정한 실시양태에서, 아쿠아포린-5 (AP5) 프로모터는 선방 세포에서 유전자 발현을 조절한다 (Zheng and Baum, Methods Mol Biol., 434: 205-219, 2008). 특정한 실시양태에서, B29 프로모터는 B 세포에서 유전자 발현을 조절한다. 특정한 실시양태에서, CD14 프로모터는 단핵구 세포에서 유전자 발현을 조절한다. 특정한 실시양태에서, CD43 프로모터는 백혈구 및 혈소판에서 유전자 발현을 조절한다. 특정한 실시양태에서, CD45 프로모터는 조혈 세포에서 유전자 발현을 조절한다. 특정한 실시양태에서, CD68 프로모터는 대식세포에서 유전자 발현을 조절한다. 특정한 실시양태에서, 데스민 프로모터는 근육 세포에서 유전자 발현을 조절한다. 특정한 실시양태에서, 엘라스타제-1 프로모터는 췌장 선방 세포에서 유전자 발현을 조절한다. 특정한 실시양태에서, 엔도글린 프로모터는 내피 세포에서 유전자 발현을 조절한다. 특정한 실시양태에서, 피브로넥틴 프로모터는 분화 세포 또는 치유 조직에서 유전자 발현을 조절한다. 특정한 실시양태에서, Flt-1 프로모터는 내피 세포에서 유전자 발현을 조절한다. 특정한 실시양태에서, GFAP 프로모터는 성상세포에서 유전자 발현을 조절한다. 특정한 실시양태에서, GPIIb 프로모터는 거핵구에서 유전자 발현을 조절한다. 특정한 실시양태에서, ICAM-2 프로모터는 내피 세포에서 유전자 발현을 조절한다. 특정한 실시양태에서, Mb 프로모터는 근육에서 유전자 발현을 조절한다. 특정한 실시양태에서, NphsI 프로모터는 족세포에서 유전자 발현을 조절한다. 특정한 실시양태에서, OG-2 프로모터는 골모세포, 상아질모세포에서 유전자 발현을 조절한다. 특정한 실시양태에서, SP-B 프로모터는 폐 세포에서 유전자 발현을 조절한다. 특정한 실시양태에서, SYN1 프로모터는 뉴런에서 유전자 발현을 조절한다. 특정한 실시양태에서, WASP 프로모터는 조혈 세포에서 유전자 발현을 조절한다.
특정한 실시양태에서, 프로모터는 종양-특이적 프로모터이다. 특정한 실시양태에서, AFP 프로모터는 간세포성 암종에서 유전자 발현을 조절한다. 특정한 실시양태에서, CCKAR 프로모터는 췌장암에서 유전자 발현을 조절한다. 특정한 실시양태에서, CEA 프로모터는 상피암에서 유전자 발현을 조절한다. 특정한 실시양태에서, c-erbB2 프로모터는 유방암 및 췌장암에서 유전자 발현을 조절한다. 특정한 실시양태에서, COX-2 프로모터는 종양에서 유전자 발현을 조절한다. 특정한 실시양태에서, CXCR4 프로모터는 종양에서 유전자 발현을 조절한다. 특정한 실시양태에서, E2F-1 프로모터는 종양에서 유전자 발현을 조절한다. 특정한 실시양태에서, HE4 프로모터는 종양에서 유전자 발현을 조절한다. 특정한 실시양태에서, LP 프로모터는 종양에서 유전자 발현을 조절한다. 특정한 실시양태에서, MUC1 프로모터는 암종 세포에서 유전자 발현을 조절한다. 특정한 실시양태에서, PSA 프로모터는 전립선 및 전립선암에서 유전자 발현을 조절한다. 특정한 실시양태에서, 서바이빈 프로모터는 종양에서 유전자 발현을 조절한다. 특정한 실시양태에서, TRP1 프로모터는 멜라닌세포 및 흑색종에서 유전자 발현을 조절한다. 특정한 실시양태에서, Tyr 프로모터는 멜라닌세포 및 흑색종에서 유전자 발현을 조절한다.
(VI-b) 마이크로 RNA 부위
다양한 실시양태에서, 마이크로RNA 제어 시스템은 유전자의 발현이 마이크로RNA 부위 (예를 들어, 마이크로RNA가 상호작용할 수 있는 핵산 서열)의 존재에 의해 조절되는 방법 또는 조성물을 지칭할 수 있다. 특정한 실시양태에서, 마이크로RNA 제어 시스템은 유전자가 표적 세포, 예컨대 HSPC, 예를 들어 종양 침윤 HSPC에서 독점적으로 발현되도록 유전자의 발현을 조절하였다. 일부 실시양태에서, 관심 단백질 또는 핵산 (예를 들어, 항암제, 예컨대 CAR, TCR, 항체, 및/또는 체크포인트 억제제, 예를 들어 체크포인트 억제제인 αPD-L1 항체 (예를 들어, αPD-L1γ1 항체))을 코딩하는 핵산 (예를 들어, 치료 유전자)은 마이크로RNA 부위, 복수의 동일한 마이크로RNA 부위, 또는 복수의 별개의 마이크로RNA 부위를 포함하거나, 그와 회합되거나, 또는 그와 작동가능하게 연결된다. 관련 기술분야의 통상의 기술자는 마이크로RNA 부위를 관심 유전자를 코딩하는 서열을 갖는 핵산 또는 그의 부분과 회합시키는 수단 및 기술에 친숙할 것이지만, 특정의 비제한적 예가 본원에 제공된다. 예를 들어, 관심 유전자 (예를 들어, αPD-L1γ1 항체를 코딩하는 서열)는 관심 유전자의 발현이 종양-침윤 백혈구 세포가 아닌 세포에서의 발현을 억제하지만 종양-침윤 백혈구에서의 발현은 억제하지 않는 1개 이상의 마이크로RNA 부위의 존재에 의해 조절되도록 핵산에 존재할 수 있다. 특정의 특정한 예에서, 관심 유전자 (예를 들어, αPD-L1γ1 항체를 코딩하는 서열)는 관심 유전자의 발현이 종양-침윤 백혈구 세포가 아닌 세포에서의 발현을 억제하지만 종양-침윤 백혈구에서의 발현은 억제하지 않는 1개 이상의 miR423-5p 마이크로RNA 부위의 존재에 의해 조절되도록 핵산에 존재할 수 있다. 다양한 실시양태에서, 마이크로RNA 제어 시스템은 1개 이상의 마이크로RNA 부위, 예를 들어 1, 2, 3, 4, 5, 6, 7, 8, 9, 10개, 또는 그 초과의 마이크로RNA 부위를 포함하거나 또는 관심 단백질 또는 핵산의 발현이 그에 의해 조절되는 핵산을 포함할 수 있다. 다양한 실시양태에서, 마이크로RNA 제어 시스템은 1개 이상의 miR423-5p 마이크로RNA 부위, 예를 들어 1, 2, 3, 4, 5, 6, 7, 8, 9, 10개, 또는 그 초과의 miR423-5p 마이크로RNA 부위를 포함하거나 또는 관심 단백질 또는 핵산의 발현이 그에 의해 조절되는 핵산을 포함할 수 있다. 일부 특정한 실시양태에서, 마이크로RNA 제어 시스템은 αPD-L1γ1 항체를 코딩하고, 1개 이상의 miR423-5p 마이크로RNA 부위, 예를 들어 1, 2, 3, 4, 5, 6, 7, 8, 9, 10개, 또는 그 초과의 miR423-5p 마이크로RNA 부위, 예를 들어 miR423-5p 마이크로RNA 부위를 포함하거나 또는 αPD-L1γ1 항체의 발현이 그에 의해 조절되는 핵산을 포함할 수 있다.
(VI-c) 특정한 조절 성분, 특정한 코딩 서열, 및/또는 특정한 긴 LCR의 쌍형성
본 개시내용의 트랜스포손 페이로드는 코딩 핵산 서열 (예를 들어, 단백질을 코딩하는 핵산 서열)과 작동가능하게 연결된 LCR, 예컨대 긴 LCR을 포함할 수 있으며, 여기서 코딩 핵산 서열은 또한 프로모터와 작동가능하게 연결된다. 다양한 실시양태에서, 트랜스포손 페이로드는 (i) LCR 및 (ii) 인간 게놈에서 LCR과 전형적으로 작동가능하게 연결된 프로모터 둘 다와 작동가능하게 연결된 코딩 핵산 서열을 포함한다. 다시 말해서, 트랜스포손 페이로드는 LCR을 그와 자연 쌍형성된 프로모터와 함께 포함할 수 있으며, 여기서 둘 다 함께 코딩 핵산 서열의 발현을 구동한다. 다양한 실시양태에서, LCR과 자연 쌍형성된 프로모터는 표 2에 제시된 바와 같은 프로모터이다. 다양한 실시양태에서, 프로모터는 인간 게놈에서 LCR과 자연 쌍형성된 코딩 서열의 개시 코돈의 바로 상류에 있는 핵산 서열, 예를 들어 참조 게놈에서 예를 들어 개시 코돈의 바로 상류의 100bp, 200bp, 300bp, 400bp, 500bp, 1,000bp, 1,500bp, 2,000bp, 3,000bp, 4,000bp, 5,000bp, 또는 그 초과의 뉴클레오티드를 포함하는 핵산 서열이다. 다양한 실시양태에서, 프로모터는 예를 들어 인간 게놈에서 LCR과 자연 쌍형성된 코딩 서열의 개시 코돈의 바로 상류의 100bp-5,000bp, 100bp-4,000bp, 100bp-3,000bp, 100bp-2,000bp, 100bp-1,000bp, 1,000bp-5,000bp, 1,000bp-4,000bp, 1,000bp-3,000bp, 또는 1,000bp-2,000bp를 포함하는 핵산 서열을 포함하는 핵산 서열이다. 다양한 실시양태에서, 인간 게놈에서 LCR과 자연 쌍형성된 코딩 서열은 표 1 또는 표 2에 제시된 코딩 서열이다.
다양한 실시양태에서, 트랜스포손 페이로드는 (i) LCR 및 (ii) 인간 게놈에서 LCR과 전형적으로 작동가능하게 연결되지 않은 프로모터 둘 다와 작동가능하게 연결된 코딩 핵산 서열을 포함한다. 본 개시내용은 LCR이 특정한 콘텍스트에서 진화될 수 있지만, 인간 게놈에서 전형적으로 작동가능하게 연결되지 않은 코딩 핵산 서열의 발현을 제어하고/거나 LCR이 인간 게놈에서 전형적으로 회합되지 않은 프로모터에 의해 또한 구동되는 코딩 핵산 서열 발현의 발현을 구동하는데 적용될 수 있다는 인식을 포괄한다. 따라서, LCR은 자연적으로 작동가능하게 연결된 프로모터 및/또는 유전자와 쌍형성될 수 있거나 (예를 들어, β-글로빈 프로모터와 함께 β-글로빈 또는 γ-글로빈을 코딩하는 코딩 핵산 서열과 작동가능하게 연결된 β-글로빈 LCR을 포함하는 트랜스포손 페이로드에서), 또는 자연적으로 작동가능하게 연결되지 않은 프로모터 및/또는 유전자와 쌍형성될 수 있다 (예를 들어, 인자 VIII에 대한 대체물, 예컨대 ET3을 코딩하는 코딩 핵산 서열과 작동가능하게 연결된 β-글로빈 LCR).
표 2.
(VII) 벡터
(VII-a) 대형 페이로드 통합을 개선시키기 위해 최적화될 수 있는 벡터 특색
아데노바이러스 게놈은 혈청형에 따라 26 kb 내지 45 kb 길이 범위의 선형, 비-절편화 이중-가닥 DNA이다. 아데노바이러스 DNA는 양쪽 단부 상에서 역전된 말단 반복부 (ITR)와 플랭킹되고, 이는 자기-프라이머로서 작용하여 프리마제-비의존성 DNA 합성을 촉진하고 숙주 게놈 내로의 통합을 용이하게 한다. 아데노바이러스 게놈은 또한 적절한 바이러스 전사체 패키징을 용이하게 하고 게놈의 좌측 아암에 위치하는 패키징 신호를 함유한다. 바이러스 전사체는 초기 전사 단위, E1, E2, E3, 및 E4, 및 Ad 비리온의 구조적 성분을 코딩하는 후기 전사 단위를 포함한 여러 단백질을 코딩한다 (Lee et al., Genes Dis., 4(2):43-63, 2017).
아데노바이러스는 대형의, 이십면체 형상의 비-외피보유 바이러스이다. 바이러스 캡시드는 섬유, 펜톤, 및 헥손 기반 단백질을 비롯한 3가지 유형의 단백질을 포함한다. 헥손은 바이러스 캡시드의 대부분을 구성하여, 20개의 삼각형 면을 형성한다. 펜톤 염기는 캡시드의 12개의 버텍스에 위치하고, 섬유 (또한 노브형 섬유로도 지칭됨)는 각각의 펜톤 염기로부터 돌출된다. 이들 단백질, 펜톤 및 섬유는 숙주 세포에 대한 캡시드의 부착을 용이하게 하기 때문에 수용체 결합 및 내재화에서 특히 중요하다 (Lee et al., Genes Dis., 4(2):43-63, 2017).
아데노바이러스는 그의 안정하고 안전한 게놈으로 인해 유전자 요법에 특히 적합하다. Ad 벡터의 이중 가닥 특징은 단일-가닥 DNA 또는 RNA 바이러스와 비교하여 벡터 안정성을 증가시키고 유전자 시프트 또는 드리프트를 감소시킨다. DNA 복제 동안 오류를 감소시키기 위해, Ad 벡터는 교정 DNA 폴리머라제를 사용한다. 또한, Ad 벡터는 그의 DNA를 숙주의 게놈과 통합시키지 않고, 오히려 에피솜 DNA를 숙주 세포의 핵으로 전달한다.
Ad 벡터는 또한 유전자 변형에 대해 감수성이고, 연구는 유전자 요법에서의 그의 용도를 추가로 개선시키기 위해 변형을 가하였다.
(VII-b) 혈청형 및 유사형
인간 아데노바이러스 (Ad)는 50종 초과의 혈청형을 함유하는 6개의 하위군으로 분류된다. 군은 A에서 F로 라벨링된다. 군 B Ad는 Ad3, Ad7, Ad11, Ad14, Ad16, Ad21, Ad34, Ad 35, 및 Ad50을 포함한다. Ad5는 군 C로 분류된다. 50종 초과의 인간 Ad 혈청형이 존재하기 때문에, Ad 벡터는 상이한 관심 숙주 세포를 표적화하도록 변형될 수 있다. 상이한 Ad 혈청형은 상이한 세포 수용체에 결합하고, 상이한 진입 메카니즘을 사용한다.
상이한 Ad 혈청형의 감염성은 다수의 인간 세포주로 제한된다. 감염성 연구는 Ad5 및 Ad3이 내피 또는 림프성 세포를 감염시키고 표적화하는데 특히 적합한 반면, Ad9, Ad11 및 Ad35는 인간 골수 세포를 효율적으로 감염시켰음을 밝혀내었다. 따라서, Ad9, Ad11 및 Ad35의 섬유 단백질의 노브 도메인은 Ad5 벡터를 인간 골수 세포로 재표적화하기 위한 탁월한 후보이다. 다른 가능한 혈청형은 Ad7을 포함한다.
특정한 실시양태에서, Ad 벡터는 재조합 벡터이다. 특정한 실시양태에서, Ad5/35는 Ad5의 섬유 꼬리 도메인 및 Ad35의 섬유 샤프트 및 노브 도메인을 포함하는 변형된 섬유 단백질을 발현하는 재조합 Ad5 벡터이다. 특정한 실시양태에서, Ad 벡터는 Ad5, Ad35, Ad5/35, Ad5/35++, 또는 Ad35++로부터 선택된다.
특정한 실시양태에서, Ad 벡터는 CD46 결합 아데노바이러스 섬유 폴리펩티드를 코딩하는 핵산을 포함한다. 섬유 폴리펩티드는 (a) 캡시드의 펜톤 염기 단백질과 상호작용하고 세포 핵으로의 단백질의 수송에 필요한 신호를 함유하는 N-말단 꼬리 도메인 또는 그의 등가물; (b) 1개 이상의 샤프트 도메인 또는 그의 등가물; 및 (c) 수용체 결합을 위한 결정기를 함유하는 C-말단 노브 도메인 또는 그의 등가물을 포함하는 폴리펩티드를 지칭한다. CD46에 결합하는 동종삼량체로 형성될 수 있는 섬유 폴리펩티드의 C-말단 도메인은 섬유 노브로 지칭된다. 섬유 단백질의 C-말단 부분은 삼량체화되어 CD46에 결합하는 섬유 구조를 형성할 수 있다. 섬유 노브만이 CD46-표적화에 요구된다. 따라서, 제2 핵산 모듈은 CD46에 결합하는 1개 이상의 인간 아데노바이러스 노브 도메인 또는 그의 등가물을 포함하는 아데노바이러스 섬유를 코딩한다. 다중 노브 도메인이 코딩되는 경우에, 노브 도메인은 이들이 각각 CD46에 결합하는 한 동일하거나 상이할 수 있다. 본원에 사용된 노브 도메인 "기능적 등가물"은 CD34+ 세포의 표면 상의 CD46에 대한 결합을 보유하는 1개 이상의 아미노산 결실, 치환, 또는 부가를 갖는 노브 도메인이다.
아데노바이러스 섬유 폴리펩티드는 또한 샤프트 도메인을 포함한다. 샤프트 도메인은 CD46 결합에 중요하지 않다. 특정한 실시양태에서, 샤프트 도메인은 상이한 인간 Ad 혈청형으로부터의 1개 이상의 샤프트 도메인을 포함할 수 있다. 특정한 실시양태에서, 샤프트 도메인은 섬유 노브 삼량체화를 허용하는 샤프트 도메인의 임의의 부분 또는 그의 돌연변이체를 포함할 수 있다. 특정한 실시양태에서, 샤프트 도메인은 Ad5 샤프트 도메인, Ad35 샤프트 도메인, 및 그의 기능적 등가물로부터 선택된다. 본원에 사용된 샤프트 도메인의 기능적 등가물은 섬유 노브 삼량체화를 허용하는 샤프트 도메인의 임의의 부분 또는 그의 돌연변이체이다. 1개 초과의 샤프트 도메인 또는 등가물이 존재하는 경우에, 각각의 샤프트 도메인 또는 등가물은 동일할 수 있거나, 또는 샤프트 도메인 또는 등가물의 1개 이상의 카피는 단일 재조합 폴리펩티드에서 상이할 수 있다.
아데노바이러스 섬유 폴리펩티드는 또한 꼬리 도메인을 포함한다. 아데노바이러스 꼬리 도메인 또는 그의 돌연변이체는 (헬퍼 Ad 바이러스 상의) 캡시드의 펜톤 염기 단백질과 상호작용하고, 세포 핵으로의 단백질의 수송에 필요한 신호를 함유한다. 사용된 꼬리 도메인은 HD-Ad 생산에 사용되는 헬퍼 Ad 바이러스 캡시드의 펜톤 기반 단백질과 상호작용할 것이다. 따라서, Ad5 헬퍼 바이러스가 사용되는 경우, 꼬리 도메인은 Ad5로부터 유래될 것이고; Ad35 헬퍼 바이러스가 사용되는 경우, 꼬리 도메인은 Ad 35로부터 유래될 것인 등이다.
특정한 실시양태에서, Ad 벡터는 Ad5/35 벡터를 포함한다. 특정한 실시양태에서, Ad5/35 벡터는 Ad35 섬유 노브 및 Ad5 샤프트를 갖는 키메라 Ad 벡터이다.
특정한 실시양태에서, Ad 벡터는 Ad5/35++ 벡터를 포함한다. 특정한 실시양태에서, Ad5/35++ 벡터는 돌연변이체 Ad35 섬유 노브를 갖는 키메라 Ad5/35 벡터이다. 벡터는 CD46에 대한 친화도를 25-배 증가시키고, 보다 낮은 감염 다중도 (MOI)에서 세포 형질도입 효율을 증가시키기 위해 돌연변이된다 (Li and Lieber, FEBS Letters, 593(24): 3623-3648, 2019).
특정한 실시양태에서, Ad 벡터는 Ad35 벡터를 포함한다. 특정한 실시양태에서, Ad35 벡터는 Ad35 섬유 노브 및 샤프트를 갖는 부류 B Ad 벡터이다.
특정한 실시양태에서, Ad 벡터는 Ad35++ 벡터를 포함한다. 특정한 실시양태에서, Ad35++ 벡터는 증진된 Ad35 섬유 노브 및 Ad35 샤프트를 갖는 Ad35 벡터이다.
특정한 실시양태에서, Ad 벡터는 Ad3, Ad7, Ad11, Ad14, Ad16, Ad21, Ad34, 또는 Ad50을 포함한다.
(VII-c) 성분
특정한 실시양태에서, 벡터는 페이로드, 조절 성분, 통합 요소, 선택 카세트, 및 스터퍼 서열을 포함한 성분을 포함한다.
(VII-c-i) 페이로드
특정한 실시양태에서, 벡터는 페이로드 (예를 들어, 트랜스포손 페이로드)를 포함한다. 특정한 실시양태에서, 페이로드는 관심 유전자를 코딩한다. 특정한 실시양태에서, 페이로드는 발현을 위한 추가의 요소, 예컨대 인트론 서열, 신호 서열, 핵 국재화 서열, 전사 종결 서열, 또는 IRES 유형의 번역의 개시를 위한 부위를 포함할 수 있다. 페이로드의 추가의 설명은 본원에서 찾아볼 수 있다.
(VII-c-ii) 조절 성분
특정한 실시양태에서, 벡터는 조절 성분을 포함한다. 조절 성분은 섹션 VI에 보다 상세히 기재되어 있다. 조절 성분은 인핸서, 프로모터, 및 유전자 발현을 조절하는 다른 서열을 포함할 수 있다.
특정한 실시양태에서, 조절 성분은 페이로드를 코딩하는 서열의 RNA로의 전사 및/또는 mRNA의 단백질로의 번역을 용이하게 한다. 적합한 프로모터는 예를 들어 진핵 또는 바이러스 기원의 것을 포함한다. 적합한 프로모터는 구성적 또는 조절성 (예를 들어, 유도성)일 수 있다. 적합한 프로모터의 예는 예를 들어 AFP (α-태아단백질) 프로모터, 아밀라제1C 프로모터, 아쿠아포린-5 (AP5) 프로모터, αl -항트립신 프로모터, β-act 프로모터, β-글로빈 프로모터, β-Kin 프로모터, B29 프로모터, CCKAR 프로모터, CD14 프로모터, CD43 프로모터, CD45 프로모터, CD68 프로모터, CEA 프로모터, c-erbB2 프로모터, CMV (시토메갈로바이러스 바이러스) 프로모터, COX-2 프로모터, CXCR4 프로모터, 데스민 프로모터, E2F-1 프로모터, EF1α (신장 인자 lα) 프로모터, EGR1 프로모터, eIF4A1 프로모터, 엘라스타제-1 프로모터, 엔도글린 프로모터, FerH 프로모터, FerL 프로모터, 피브로넥틴 프로모터, Flt-1 프로모터, GAPDH 프로모터, GFAP 프로모터, GPIIb 프로모터, GRP78 프로모터, GRP94 프로모터, HE4 프로모터, hGR1/1 프로모터, hNIS 프로모터, Hsp68 프로모터, HSP70 프로모터, HSV-1 바이러스 TK 유전자 프로모터, hTERT 프로모터, ICAM-2 프로모터, 칼리크레인 프로모터, LP 프로모터, 주요 후기 프로모터 (MLP), Mb 프로모터, Rho 프로모터, MT (메탈로티오네인) 프로모터, MUC1 프로모터, NphsI 프로모터, OG-2 프로모터, PGK (포스포 글리세레이트 키나제) 프로모터, PGK-1 프로모터, 폴리머라제 III (Pol III) 프로모터, PSA 프로모터, ROSA 프로모터, 라우스 육종 바이러스 (RSV) 긴-말단 반복부 (LTR) 프로모터, SP-B 프로모터, 서바이빈 프로모터, SV40 (원숭이 바이러스 40) 프로모터, SYN1 프로모터, SYT8 유전자 프로모터, TRP1 프로모터, Tyr 프로모터, 유비퀴틴 B 프로모터, 및 WASP 프로모터를 포함한다.
(VII-c-iii) 통합 요소
다양한 SB 트랜스포사제가 관련 기술분야에 공지되어 있다. 관련 기술분야에 공지된 SB 트랜스포사제의 예는, 비제한적으로, SB, SB11, SB12, HSB1, HSB2, HSB3, HSB4, HSB5, HSB13, HSB14, HSB15, HSB16, HSB17, SB100x, 및 SB150x를 포함한다. 특정한 실시양태에서, 본 개시내용은 SB100x 트랜스포사제를 이용한다. 일부 실시양태에서, SB100x 또는 SB150x 트랜스포사제가 사용될 수 있다. 일부 실시양태에서, 임의의 SB 트랜스포사제가 사용될 수 있다.
SB 트랜스포사제는 SB 역전된 말단 반복부 (ITR) 사이에 위치하는 핵산 트랜스포손 페이로드를 전위시킨다. 다양한 SB ITR이 관련 기술분야에 공지되어 있다. 일부 실시양태에서, SB ITR은 트랜스포사제에 대한 인식 신호로서 작용하는 32 bp 길이의 불완전한 직접 반복부를 포함하는 230 bp 서열이다. 조작된 SB ITR은 pT, pT2, pT3, pT2B, 및 pT4로 공지된 SB ITR을 비롯하여 관련 기술분야에 공지되어 있다. 일부 실시양태에서, pT4 ITR은, 예를 들어 SB100x 트랜스포사제에 의한 전위를 위해, 예를 들어 본 개시내용의 트랜스포손 페이로드에 플랭킹시키는데 사용된다.
(VII-c-iv) 선택 요소
특정한 실시양태에서, 벡터는 선택 카세트를 포함한 선택 요소를 포함한다. 특정한 실시양태에서, 선택 카세트는 프로모터, 선택제에 대한 저항성을 부가하는 cDNA, 및 독립적인 전사 요소의 전사를 정지시킬 수 있는 폴리 A 서열을 포함한다.
선택 카세트는 (a) 항생제 또는 다른 독소에 대한 저항성을 부여하거나, (b) 영양요구성 결핍을 보완하거나, 또는 (c) 복합 배지로부터 이용가능하지 않은 중요한 영양분을 공급하는 단백질, 예를 들어 바실루스의 경우 D-알라닌 라세마제를 코딩하는 유전자를 코딩할 수 있다. 임의의 수의 선택 시스템을 사용하여 형질전환된 세포주를 회수할 수 있다. 특정한 실시양태에서, 양성 선택 카세트는 네오마이신, 히그로마이신, 암피실린, 퓨로마이신, 플레오마이신, 제오마이신, 블라스티시딘, 비오마이신에 대한 저항성 유전자를 포함한다. 특정한 실시양태에서, 양성 선택 카세트는 메토트렉세이트에 대한 저항성을 제공하는 DHFR (디히드로폴레이트 리덕타제) 유전자, O6BG/BCNU에 대한 저항성을 담당하는 MGMT P140K 유전자, HAT 선택 배지 내에 존재하는 특정 염기 (아미노프테린, 하이포크산틴, 티미딘)의 변환을 담당하는 HPRT (하이포크산틴 포스포리보실 트랜스퍼라제) 유전자 및 일부 약물에 대한 해독을 위한 다른 유전자를 포함한다. 특정한 실시양태에서, 선택제는 네오마이신, 히그로마이신, 퓨로마이신, 플레오마이신, 제오마이신, 블라스티시딘, 비오마이신, 암피실린, O6BG/BCNU, 메토트렉세이트, 테트라시클린, 아미노프테린, 히포크산틴, 티미딘 키나제, DHFR, Gln 신테타제, 또는 ADA를 포함한다.
특정한 실시양태에서, 음성 선택 카세트는 배양 배지에 존재하는 기질을 유전자를 발현하는 세포에 대한 독성 물질로 변환시키기 위한 유전자를 포함한다. 이들 분자는 디프테리아 독소 (DTA)의 해독 유전자 (Yagi et al., Anal Biochem. 214(1):77-86, 1993; Yanagawa et al., Transgenic Res. 8(3):215-221, 1999), 간시클로비르 또는 FIAU의 존재에 감수성인 포진 바이러스의 키나제 티미딘 유전자 (HSV TK)를 포함한다. HPRT 유전자는 또한 6-티오구아닌 (6TG)을 배지 내로 첨가하는 것에 의해 음성 선택으로서 사용될 수 있고, 모든 양성 및 음성 선택을 위해 상이한 기원으로부터의 폴리 A 전사 종결 서열이 사용될 수 있으며, 가장 전형적인 것은 SV40 폴리 A 또는 진핵 유전자 폴리 A (소 성장 호르몬, 토끼β-글로빈 등)로부터 유래된 것이다.
특정한 실시양태에서, 선택 카세트는 문헌 [Olszko et al., (Gene Therapy 22: 591-595, 2015)]에 기재된 바와 같은 MGMT P140K를 포함한다. 특정한 요소에서, 선택제는 O6BG/BCNU를 포함한다.
인간 알킬 구아닌 트랜스퍼라제 (hAGT)를 코딩하는 약물 저항성 유전자 MGMT는 알킬화제, 예컨대 니트로소우레아 및 테모졸로미드 (TMZ)의 세포독성 효과에 대한 저항성을 부여하는 DNA 복구 단백질이다. 6-벤질구아닌 (6-BG)은 니트로소우레아 독성을 강화시키는 AGT의 억제제이며, TMZ와 공투여되어 이러한 작용제의 세포독성 효과를 강화시킨다. AGT의 변이체를 코딩하는 MGMT의 여러 돌연변이체 형태는 6-BG에 의한 불활성화에 대해 고도로 저항성이지만, DNA 손상을 복구하는 그의 능력을 보유한다 (Maze et al., J. Pharmacol. Exp. Ther. 290: 1467-1474, 1999). P140KMGMT-기반 약물 저항성 유전자 요법은 마우스, 개, 레서스 마카크, 및 인간 세포, 구체적으로 조혈 세포에 화학보호를 부여하는 것으로 밝혀졌다 (Zielske et al., J. Clin. Invest. 112: 1561-1570, 2003; Pollok et al., Hum. Gene Ther. 14: 1703-1714, 2003; Gerull et al., Hum. Gene Ther. 18: 451-456, 2007; Neff et al., Blood 105: 997-1002, 2005; Larochelle et al., J. Clin. Invest. 119: 1952-1963, 2009; Sawai et al., Mol. Ther. 3: 78-87, 2001).
특정한 실시양태에서, 생체내 선택 카세트와의 조합은 유전자-교정된 세포의 선택적 이점 없이 질환에 대한 중요한 성분일 것이다. 예를 들어, SCID 및 일부 다른 면역결핍 및 FA에서, 교정된 세포는 이점을 갖고, 단지 치료 유전자로 "소수의" HSPC를 형질도입시키는 것만으로 치료 효능에 충분하다. 세포가 경쟁적 이점을 입증하지 않은 혈색소병증 (즉, 겸상 적혈구 질환 및 지중해빈혈)과 같은 다른 질환의 경우에, 예컨대 생체내 선택 카세트, 예컨대 MGMT P140K와 조합된 유전자 교정된 세포의 생체내 선택은 소수의 형질도입된 HSPC를 선택하여, 유전자 교정된 세포의 증가를 가능하게 하고 치료 효능을 달성할 것이다. 이러한 접근법은 또한 HSPC를 생체외 유전자 변형보다 생체내에서 HIV에 저항성이게 만듦으로써 HIV에 대해 적용될 수 있다.
(VII-c-v) 스터퍼 서열
특정한 실시양태에서, 벡터는 스터퍼 서열을 포함한다. 특정한 실시양태에서, 스터퍼 서열은 벡터 게놈을 야생형 길이의 크기에 가까운 크기로 만들기 위해 부가될 수 있다. 스터퍼는 길이를 연장하도록 의도된 기능적으로 불활성인 서열을 정의하는 것으로 의도된, 관련 기술분야에서 일반적으로 인식되는 용어이다.
스터퍼 서열은 벡터의 효율적인 패키징 및 안정성을 달성하기 위해 사용된다. 특정한 실시양태에서, 스터퍼 서열은 벡터 게놈 크기를 야생형 바이러스의 게놈 크기의 70% 내지 110%로 만드는데 사용된다.
스터퍼 서열은 바람직하게는 포유동물 기원의 임의의 DNA일 수 있다. 본 발명의 바람직한 실시양태에서, 스터퍼 서열은 포유동물 기원의 비-코딩 서열, 예를 들어 인트론 단편이다.
스터퍼 서열은, 벡터의 크기를 미리 결정된 크기로 유지시키는데 사용되는 경우에, 벡터 게놈이 분열 또는 비분열 세포에서 안정하게 유지되도록 하는 임의의 비-코딩 코딩 서열 또는 서열일 수 있다. 이들 서열은 다른 바이러스 게놈 (예를 들어 엡스타인 바르(Epstein barr) 바이러스) 또는 유기체 (예를 들어 효모)로부터 유래될 수 있다. 예를 들어, 이들 서열은 동원체 및/또는 텔로미어의 기능적 부분일 수 있다.
(VII-d) 헬퍼-의존성 아데노바이러스 벡터
헬퍼-의존성 아데노바이러스 벡터 (HDAd)는 모든 바이러스 코딩 서열이 결여되도록 조작되고, 매우 다양한 세포 유형을 효율적으로 형질도입시키며, 무시할만한 만성 독성 하에 장기간 트랜스진 발현을 매개할 수 있다. 바이러스 코딩 서열의 결실 및 벡터 게놈 복제 (ITR) 및 캡시드화 (Ψ)에 필요한 시스-작용성 요소만을 남기는 것으로, Ad 벡터에 대한 세포성 면역 반응이 감소된다. HDAd 벡터는 최대 37 kb의 대형 클로닝 용량을 가지며, 이는 대형 페이로드의 전달을 가능하게 한다. 이들 페이로드는 대형 치료 유전자 또는 심지어 다중 트랜스진 및 트랜스진 발현을 증진, 연장, 및 조절하기 위한 대형 조절 성분을 포함할 수 있다. 다른 아데노바이러스 벡터와 같이, HDAd 게놈은 에피솜으로 남아있고, 숙주 게놈과 통합되지 않는다 (Rosewell et al., J Genet Syndr Gene Ther. Suppl 5:001, 2011).
일부 HDAd 벡터 시스템에서, 하나의 바이러스 게놈 (헬퍼)은 복제에 필요한 모든 단백질을 코딩하지만 패키징 서열 내에 조건부 결함을 갖고, 이는 비리온 내로 패키징될 가능성을 낮게 한다. 제2 바이러스 게놈은 오직 바이러스 역전된 말단 반복부 (ITR), 치료 페이로드, 및 정상 패키징 서열만을 포함하며, 이는 이러한 제2 바이러스 게놈이 HDAd 바이러스 벡터 내로 선택적으로 패키징되게 하고 생산자 세포로부터 단리되도록 한다. HDAd 바이러스 벡터는 물리적 수단에 의해 헬퍼 벡터로부터 추가로 정제될 수 있다. 일반적으로, HDAd 바이러스 벡터 및 HDAd 바이러스 벡터 제제에서 헬퍼 벡터 및/또는 헬퍼 게놈의 일부 오염이 발생할 수 있고 받아들여질 수 있다.
일부 HDAd 벡터 시스템에서, 헬퍼 게놈은 Cre/loxP 시스템을 이용한다. 특정의 이러한 HDAd 벡터 시스템에서, HDAd 공여자 벡터 게놈은 벡터 게놈 복제에 요구되는 아데노바이러스 ITR을 포함하는 500 bp의 비코딩 아데노바이러스 DNA, 및 벡터 게놈의 캡시드 내로의 캡시드화에 요구되는 패키징 서열인 Ψ를 포함한다. 또한, HDAd 공여자 벡터 게놈은 약 27.7 kb 내지 약 37 kb의 총 길이를 가질 때 가장 효율적으로 패키징될 수 있는 것으로 관찰되었고, 길이는 예를 들어 치료 페이로드 및/또는 "스터퍼" 서열로 구성될 수 있다. HDAd 공여자 벡터 게놈은 세포, 예컨대 Cre 레콤비나제를 발현하는 293 세포에 전달될 수 있고, 임의로 여기서 HDAd 공여자 벡터 게놈은 세포에 비-바이러스 벡터 형태, 예컨대 박테리아 플라스미드 형태로 전달된다 (예를 들어, HDAd 공여자 벡터 게놈은 박테리아 플라스미드 (pHDAd)로서 구축되고 제한 효소 소화에 의해 유리됨). 동일한 세포는 헬퍼 게놈에 의해 형질도입될 수 있으며, 이는 loxP 부위에 플랭킹된 패키징 서열을 보유하는 E1-결실된, Ad 벡터를 포함할 수 있어서, Cre 레콤비나제를 발현하는 293 세포의 감염 후에, 패키징 서열이 loxP 부위 사이의 Cre-매개된 부위-특이적 재조합에 의해 헬퍼 게놈으로부터 절제된다. 따라서, HDAd 공여자 벡터 게놈으로 Cre를 발현하는 293 세포를 형질감염시킬 수 있고 이는 loxP 부위에 플랭킹된 패키징 신호 (Ψ)를 보유하는 헬퍼 게놈으로 형질도입되어서, Ψ의 Cre-매개된 절제는 헬퍼 바이러스 게놈을 패키징불가능하게 만들지만, 여전히 HDAd의 증식을 위한 모든 필요한 트랜스-작용성 인자를 제공할 수 있게 한다. 패키징 서열의 절제 후에, 헬퍼 게놈은 패키징불가능하지만, 여전히 DNA 복제를 수행할 수 있고, 따라서 HDAd 공여자 벡터 게놈의 복제 및 캡시드화를 트랜스-보완한다. 일부 실시양태에서, 293 세포에 존재하는 헬퍼 및 HDAd 공여자 벡터 게놈 사이의 상동 재조합의 결과로서 복제 적격 Ad (RCA; E1+)의 생성을 방지하기 위해, "스터퍼" 서열을 E3 영역 내로 삽입하여 임의의 E1+ 재조합체가 패키징되기에 너무 커지게 만들 수 있다. FLP (예를 들어, FLPe)/frt 부위-특이적 재조합을 사용하는 유사한 HDAd 생산 시스템이 개발되었으며, 여기서 헬퍼 게놈의 패키징 신호에 플랭킹된 frt 부위 사이의 FLP-매개된 재조합은 FLP를 발현하는 293 세포에서의 헬퍼 게놈의 캡시드화에 대해 선택한다. 헬퍼 벡터에 대해 선택하기 위한 대안적 전략이 개발되었다.
HDAd5/35 벡터는 Ad35 섬유 노브 및 Ad5 샤프트를 갖는 헬퍼-의존성 키메라 Ad5/35 벡터이다. HDAd5/35++ 벡터는 돌연변이체 Ad35 섬유 노브를 갖는 헬퍼-의존성 키메라 Ad5/35 벡터이다. 벡터는 CD46에 대한 친화도를 25-배 증가시키고, 보다 낮은 감염 다중도 (MOI)에서 세포 형질도입 효율을 증가시키기 위해 돌연변이된다 (Li & Lieber, FEBS Letters, 593(24): 3623-3648, 2019). HDAd35 벡터는 헬퍼-의존성 Ad35 벡터이다. HDAd35++ 벡터는 CD46에 대한 그의 친화도를 증진시키고 세포 형질도입 효율을 증가시키는 돌연변이체 Ad35 섬유 노브를 갖는 헬퍼-의존성 Ad35 벡터이다.
(VII-e) 벡터-표적화된 세포 유형 (및 벡터 분자 표적)
(VII-e-i) HSC
특정한 실시양태에서, 벡터-표적화된 세포 유형은 조혈 줄기 세포 (HSC)를 포함한다. HSC는 CD46에의 결합에 의해 생체내 유전자 변형을 위해 표적화된다. 벡터는 CD46 결합의 특이성 및/또는 강도를 증가시키기 위해 돌연변이를 포함할 수 있다. HSC는 또한 하기 마커 프로파일에 의해 확인될 수 있다: CD34+, Lin-CD34+CD38-CD45RA-CD90+CD49f+ (HSC1) 및 CD34+CD38-CD45RA-CD90- CD49f+ (HSC2). 인간 HSC1은 하기 프로파일에 의해 확인될 수 있으며: CD34+/CD38-/CD45RA-/CD90+ 또는 CD34+/CD45RA-/CD90+ 및 마우스 LT-HSC는 Lin-Sca1+ckit+CD150+CD48-Flt3-CD34-에 의해 확인될 수 있다 (여기서 Lin은 CD3, Cd4, CD8, CD11b, CD11c, NK1.1, Gr1, 및 TER119를 포함한 성숙 세포의 임의의 마커의 발현의 부재를 나타냄). 특정한 실시양태에서, HSC는 CD164+ 프로파일에 의해 확인된다. 특정한 실시양태에서, HSC는 CD34+/CD164+ 프로파일에 의해 확인된다. HSC 마커 프로파일에 관한 추가의 정보에 대해서는 WO2017/218948을 참조한다.
(VII-e-ii) T 세포
T-세포의 여러 상이한 하위세트가 발견되었고, 각각은 별개의 기능을 갖는다. 예를 들어, 대다수의 T-세포는 여러 단백질의 복합체로서 존재하는 T-세포 수용체 (TCR)를 갖는다. 실제 T-세포 수용체는 독립적인 T-세포 수용체 알파 및 베타 (TCRα 및 TCRβ) 유전자로부터 생산되는, α- 및 β-TCR 쇄로 불리는 2개의 별개의 펩티드 쇄로 구성된다.
γδ T-세포는 그의 표면 상에 별개의 T-세포 수용체 (TCR)를 보유하는 T-세포의 소형 하위세트를 나타낸다. γδ T-세포에서, TCR은 1개의 γ-쇄 및 1개의 δ-쇄로 구성된다. 이러한 군의 T-세포는 αβ T-세포보다 훨씬 덜 흔하다 (총 T-세포의 2%).
CD3은 모든 성숙 T 세포 상에서 발현된다. 활성화된 T-세포는 4-1BB (CD137), CD69 및 CD25를 발현한다. CD5 및 트랜스페린 수용체가 또한 T-세포 상에서 발현된다.
T-세포는 헬퍼 세포 (CD4+ T-세포), 및 세포용해 T-세포를 포함하는 세포독성 T-세포 (CTL, CD8+ T-세포)로 추가로 분류될 수 있다. T 헬퍼 세포는 다른 기능 중에서도 B 세포의 형질 세포로의 성숙 및 세포독성 T-세포 및 대식세포의 활성화를 포함하여, 면역학적 과정에서 다른 백혈구를 보조한다. 이들 세포는 그의 표면 상에 CD4 단백질을 발현하기 때문에 CD4+ T-세포로도 공지되어 있다. 헬퍼 T-세포는 항원 제시 세포 (APC)의 표면 상에 발현되는 MHC 부류 II 분자에 의해 펩티드 항원이 제시될 때 활성화된다. 활성화되면, 이들은 신속하게 분열하고, 활성 면역 반응을 조절하거나 보조하는 시토카인으로 불리는 소형 단백질을 분비한다.
세포독성 T-세포는 바이러스 감염된 세포 및 종양 세포를 파괴하고, 또한 이식 거부에 연루된다. 이들 세포는 그의 표면 상에 CD8 당단백질을 발현하기 때문에 CD8+ T-세포로도 공지되어 있다. 이들 세포는 신체의 거의 모든 세포의 표면 상에 존재하는 MHC 부류 I과 회합된 항원에 결합함으로써 그의 표적을 인식한다.
특정한 실시양태에서, CAR은 세포독성 T-세포에서 발현되도록 유전자 변형된다.
본원에 사용된 "중심 기억" T-세포 (또는 "TCM")는 나이브 세포와 비교하여 그의 표면 상에 CD62L 또는 CCR7 및 CD45RO를 발현하고 CD45RA를 발현하지 않거나 감소된 발현을 갖는 항원 경험 CTL을 지칭한다. 특정한 실시양태에서, 중심 기억 세포는 나이브 세포와 비교하여 CD62L, CCR7, CD25, CD127, CD45RO, 및 CD95의 발현에 대해 양성이고, CD45RA의 감소된 발현을 갖는다.
본원에 사용된 "이펙터 기억" T-세포 (또는 "TEM")는 중심 기억 세포와 비교하여 그의 표면 상에 CD62L을 발현하지 않거나 감소된 발현을 갖고, 나이브 세포와 비교하여 CD45RA를 발현하지 않거나 감소된 발현을 갖는 항원 경험 T-세포를 지칭한다. 특정한 실시양태에서, 이펙터 기억 세포는 나이브 세포 또는 중심 기억 세포와 비교하여 CD62L 및 CCR7의 발현에 대해 음성이고, CD28 및 CD45RA의 가변 발현을 갖는다. 이펙터 T-세포는 기억 또는 나이브 T-세포와 비교하여 그랜자임 B 및 퍼포린에 대해 양성이다.
본원에 사용된 "나이브" T-세포는 중심 또는 이펙터 기억 세포와 비교하여 CD62L 및 CD45RA를 발현하고 CD45RO를 발현하지 않는 비-항원 경험 T 세포를 지칭한다. 특정한 실시양태에서, 나이브 CD8+ T 림프구는 CD62L, CCR7, CD28, CD127, 및 CD45RA를 포함한 나이브 T-세포의 표현형 마커의 발현을 특징으로 한다.
세포 또는 세포의 집단이 특정한 마커에 대해 "양성"이거나 또는 이를 발현한다는 언급은 세포 상에 또는 세포 내에 특정한 마커가 검출가능하게 존재한다는 것을 지칭한다. 표면 마커를 언급하는 경우에, 상기 용어는 유동 세포측정법에 의해, 예를 들어 마커에 특이적으로 결합하는 항체로 염색하고 상기 항체를 검출하는 것에 의해 검출되는 바와 같은 표면 발현의 존재를 지칭할 수 있으며, 여기서 염색은 이소형-매칭 대조군을 사용하여 그 외에는 동일한 조건 하에 동일한 절차를 수행하여 검출된 염색을 실질적으로 초과하는 수준에서 및/또는 마커에 대해 양성인 것으로 공지된 세포에 대한 것과 실질적으로 유사한 수준에서, 및/또는 마커에 대해 음성인 것으로 공지된 세포에 대한 것보다 실질적으로 더 높은 수준에서 유동 세포측정법에 의해 검출가능하다.
세포 또는 세포의 집단이 특정한 마커에 대해 "음성"이거나 또는 마커의 발현이 결여되어 있다는 언급은 세포 상에 또는 세포 내에 특정한 마커가 실질적으로 검출가능하게 존재하지 않는다는 것을 지칭한다. 표면 마커를 언급하는 경우에, 상기 용어는 유동 세포측정법에 의해, 예를 들어 마커에 특이적으로 결합하는 항체로 염색하고 상기 항체를 검출하는 것에 의해 검출되는 바와 같은 표면 발현의 부재를 지칭할 수 있으며, 여기서 염색은 이소형-매칭 대조군을 사용하여 그 외에는 동일한 조건 하에 동일한 절차를 수행하여 검출된 염색을 실질적으로 초과하는 수준에서, 및/또는 마커에 대해 양성인 것으로 공지된 세포에 대한 것보다 실질적으로 더 낮은 수준에서, 및/또는 마커에 대해 음성인 것으로 공지된 세포에 대한 것과 비교하여 실질적으로 유사한 수준에서 유동 세포측정법에 의해 검출되지 않는다.
(VII-e-iii) B 세포
B 세포는 체액성 반응의 매개자이고, 항원에 특이적인 항체의 생산 및 방출을 담당한다. 핵심 마커에 의해 특징화될 수 있는 여러 유형의 B 세포가 존재한다. 일반적으로, 미성숙 B 세포는 CD19, CD20, CD34, CD38, 및 CD45R을 발현하고, 이들이 성숙함에 따라 핵심 발현 마커는 CD19 및 IgM이다.
(VII-e-iv) 종양
특정한 실시양태에서, 벡터는 종양을 표적화할 수 있다. 특정한 실시양태에서, 종양은 건강한 세포가 아니라 종양 세포 상에 존재하는 수용체를 표적화하는 것에 의해 표적화된다. 종양은 αv 인테그린에 결합하는 것에 의해 생체내 유전자 변형을 위해 표적화될 수 있다. αv 인테그린은 혈관신생에서 중요한 역할을 한다. αvβ3 및 αvβ5 인테그린은 정상 내피 세포에서는 부재하거나 낮은 수준으로 발현되지만, 종양의 혈관신생 혈관계에서 유도된다 (Brooks et al., Cell, 79: 1157-1164, 1994; Hammes et al., Nature Med, 2: 529-533, 1996). 아미노펩티다제 N/CD13은 최근에 NGR 모티프에 대한 혈관신생 수용체로서 확인되었다 (Burg et al., Cancer Res, 59:2869-74, 1999). 아미노펩티다제 N/CD13은 암의 혈관신생 혈관 및 다른 혈관신생 조직에서 강하게 발현된다.
특정한 실시양태에서, 벡터는 암 세포 항원 에피토프를 표적화함으로써 종양을 표적화할 수 있다. 암 세포 항원은 암 세포 또는 종양에 의해 발현된다.
특정한 실시양태에서, 암 세포 항원 에피토프는 암 세포에 의해 우선적으로 발현된다. "우선적으로 발현된"은 암 세포 항원이 다른 세포 유형과 비교하여 암 세포 상에서 보다 높은 수준으로 발견된다는 것을 의미한다. 일부 경우에, 암 항원 에피토프는 표적화된 암 세포 유형에 의해서만 발현된다. 다른 경우에, 암 항원은 비-표적화된 세포 상에서보다 표적화된 암 세포 유형 상에서 적어도 25%, 35%, 45%, 55%, 65%, 75%, 85%, 95%, 96%, 97%, 98%, 99%, 또는 100% 더 많이 발현된다.
특정한 실시양태에서, 암 세포 항원은 암성 및 건강한 조직 상에서 유의하게 발현된다. 특정한 실시양태에서, 유의하게 발현된다는 것은 이중-특이적 항체의 사용이 온-타겟/오프-암 독성에 기초하여 발생 동안 정지되었다는 것을 의미한다. 특정한 실시양태에서, 유의하게 발현된다는 것은 이중-특이적 항체의 사용이 온-타겟/오프-암 독성에 기초하여 잠재적인 부정적 부작용에 관한 경고를 요구한다는 것을 의미한다. 한 예로서, 세툭시맙은 피부에서의 EGFR 발현으로 인한 것으로 생각되는 중증 피부 발진과 연관된 항-EGFR 항체이다. 또 다른 예는 항-HER2 (ERBB2) 항체인 헤르셉틴 (트라스투주맙)이다. 헤르셉틴은 심장에서의 표적 발현으로 인한 심장독성과 연관된다. 더욱이, CAR-T 세포로 Her2를 표적화하는 것은 폐에서의 온-타겟, 오프-암 발현으로 인해 환자에서 치명적이었다.
표 3은 특정한 암 유형에서 공동-발현될 가능성이 보다 큰 암 항원의 예를 제공한다.
표 3:
보다 특정한 예에서, 암 세포 항원은 메소텔린, MUC16, FOLR, PD-L1, ROR1, 글리피칸-2 (GPC2), 디시알로강글리오시드 (GD2), HER2, EGFR, EGFRvIII, CEA, CD56, CLL-1, CD19, CD20, CD123, CD30, CD33 (전장), CD33 (델타E2 변이체), CD33 (C-말단 절단을 가짐), BCMA, IGFR, MUC1, VEGFR, PSMA, PSCA, IL13Ra2, FAP, EpCAM, CD44, CD133, Tro-2, CD200, FLT3, GCC, 및 WT1을 포함한다. 관련 기술분야의 통상의 기술자에 의해 이해되는 바와 같이, 표적화된 항원은 신호 펩티드가 결여될 수 있다.
신경 세포 부착 분자 1 (NCAM1)로도 공지된 CD56은 세포-세포 및 세포-매트릭스 부착에 수반되는 유형 I 막 당단백질이다. 그의 세포외 도메인은 N-말단에 5개의 IgG-유사 도메인 및 막-근위 영역에 2개의 피브로넥틴 유형 III 도메인을 갖는다.
디시알로강글리오시드 GalAc베타1-4(NeuAc알파2-8NeuAc알파2-3)Gal베타1-4Glc베타1- 1Cer (GD2)은 신경모세포종을 비롯한 다양한 종양 상에서 발현된다. 디시알로강글리오시드 항원 GD2는 시알산 및 지질 잔기에 플랭킹된 올리고사카라이드의 백본을 포함한다. 예를 들어, 문헌 [Cheresh (Surv. Synth. Pathol. Res. 4:97, 1987)] 및 미국 특허 번호 5,653,977을 참조한다.
EGFR의 종양 특이적 돌연변이체인 EGFR 변이체 III (EGFRvIII)은 종종 야생형 EGFR 유전자 증폭과 연관되는 게놈 재배열의 생성물이다. EGFRvIII은 엑손 2-7의 인-프레임 결실에 의해 형성되며, 이는 접합부에서의 글리신 치환과 함께 267개 아미노산의 결실로 이어진다. 말단절단된 수용체는 리간드에 결합하는 그의 능력을 상실하지만, 구성적 키나제 활성을 획득한다. 흥미롭게도, EGFRvIII은 동일한 종양 세포에서 전장 야생형 EGFR과 빈번하게 공동 발현된다. 또한, EGFRvIII 발현 세포는 증가된 증식, 침습, 혈관신생 및 아폽토시스에 대한 저항성을 나타낸다.
EGFRvIII은 다형성 교모세포종 (GBM)에서 가장 자주 발견된다. GBM의 25-35%가 이러한 말단절단된 수용체를 보유하는 것으로 추정된다. 또한, 그의 발현은 종종 보다 공격적인 표현형 및 불량한 예후를 반영한다. GBM 외에도, EGFRvIII의 발현은 또한 다른 고형 종양, 예컨대 비소세포 폐암, 두경부암, 유방암, 난소암 및 전립선암에서 보고되었다. 대조적으로, EGFRvIII은 건강한 조직에서는 발현되지 않는다.
특정한 실시양태에서, 표적화된 암 항원 에피토프는 표적화된 암 세포 또는 종양에 의한 높은 발현 또는 표적화된 암 세포 또는 종양에 의한 낮은 발현을 가질 수 있다. 특정한 실시양태에서, 높은 발현 및 낮은 발현은 유동 세포측정법 또는 형광-활성화 세포-분류 (FAC)를 사용하여 결정될 수 있다. 유동 세포측정법의 관련 기술분야의 통상의 기술자에 의해 이해되는 바와 같이, "hi", "lo", "+" 및 "-"는 음성 또는 다른 집단에 대한 신호의 강도를 지칭한다. 특정한 실시양태에서, 양성 발현 (+)은 마커가 유동 세포측정법을 사용하여 세포 상에서 검출가능하다는 것을 의미한다. 특정한 실시양태에서, 음성 발현 (-)은 마커가 유동 세포측정법을 사용하여 검출가능하지 않다는 것을 의미한다. 특정한 실시양태에서, "hi"는 관심 마커의 양성 발현이 발현에 대해 또한 양성인 다른 세포보다 형광에 의해 측정 시 (예를 들어 FACS를 사용함) 더 밝다는 것을 의미한다. 이들 실시양태에서, 관련 기술분야의 통상의 기술자는 휘도가 검출 역치에 기초한다는 것을 인식한다. 일반적으로, 관련 기술분야의 통상의 기술자는 먼저 음성 대조군 튜브를 분석하고, FSC 및 SSC에 의해 관심 집단 주위에 게이트 (비트맵)를 설정하고, 목적하는 방출 파장에서 광전자증배관 전압 및 형광 획득을 조정하여, 세포의 97%가 음성 대조군을 갖는 형광 마커에 대해 비염색된 것으로 보이게 할 것이다. 이들 파라미터가 확립되면, 염색된 세포를 분석하고, 비염색된 형광 세포 집단과 대비하여 형광을 기록한다. 특정한 실시양태에서, 전형적인 FACS 플롯을 나타낸 것에서, hi는 가장 우측 (x 선) 또는 가장 높은 상단의 선 (상부 우측 또는 좌측)을 의미하는 반면, lo는 좌측 하부 4분면 내 또는 우측 및 좌측 4분면 사이의 중간 (그러나 음성 집단 대비 이동됨)을 의미한다. 특정한 실시양태에서, "hi"는 + 세포 대비 검출가능한 형광에서 +의 20-배 초과, +의 30-배 초과, +의 40-배 초과, +의 50-배 초과, +의 60-배 초과, +의 70-배 초과, +의 80-배 초과, +의 90-배 초과, +의 100-배 초과, 또는 그 초과의 증가를 지칭한다. 반대로, "lo"는 "hi"로서 정의된 것의 상반된 집단을 지칭할 수 있다.
(VII-e-v) 다른 표적
HSC, T 세포, B 세포, 및 종양 (또는 암 세포)에 더하여, 벡터는 박테리아 및 진균에 대한 다른 항원을 표적화할 수 있다.
박테리아를 표적화하는 항원은, 예를 들어 탄저병, 그람-음성 바실루스(bacilli), 클라미디아(chlamydia), 디프테리아(diphtheria), 헬리코박터 필로리(Helicobacter pylori), 미코박테리움 투베르쿨로시스(Mycobacterium tuberculosis), 백일해 독소, 폐렴구균, 리케치아(rickettsiae), 스타필로코쿠스(staphylococcus), 스트렙토코쿠스(streptococcus) 및 파상풍으로부터 유래될 수 있다.
박테리아 항원 마커의 특정한 예로서, 탄저병 항원은 탄저병 보호 항원을 포함하고; 그람-음성 바실루스 항원은 리포폴리사카라이드를 포함하고; 디프테리아 항원은 디프테리아 독소를 포함하고; 미코박테리움 투베르쿨로시스 항원은 미콜산, 열 쇼크 단백질 65 (HSP65), 30 kDa 주요 분비 단백질 및 항원 85A를 포함하고; 백일해 독소 항원은 헤마글루티닌, 페르탁틴, FIM2, FIM3 및 아데닐레이트 시클라제를 포함하고; 폐렴구균 항원은 뉴모리신 및 폐렴구균 피막 폴리사카라이드를 포함하고; 리케치아 항원은 rompA를 포함하고; 스트렙토코쿠스 항원은 M 단백질을 포함하고; 파상풍 항원은 파상풍 독소를 포함한다.
진균을 표적화하는 항원은, 예를 들어 칸디다(candida), 콕시디오이데스(coccidioides), 크립토코쿠스(cryptococcus), 히스토플라스마(histoplasma), 리슈마니아(leishmania), 플라스모디움(plasmodium), 원충, 기생충, 쉬스토소마, 백선, 톡소플라스마 및 트리파노소마 크루지(Trypanosoma cruzi)로부터 유래될 수 있다.
진균 항원의 특정한 예로서, 콕시디오이데스 항원은 소구 항원을 포함하고; 크립토코쿠스 항원은 피막 폴리사카라이드를 포함하고; 히스토플라스마 항원은 열 쇼크 단백질 60 (HSP60)을 포함하고; 리슈마니아 항원은 gp63 및 리포포스포글리칸을 포함하고; 플라스모디움 팔시파룸 항원은 분열소체 표면 항원, 포자소체 표면 항원, 환상포자소체 항원, 생식모세포/생식자 표면 항원, 원충성 및 다른 기생충 항원, 예컨대 혈액-단계 항원 pf 155/RESA를 포함하고; 쉬스토소마 항원은 글루타티온-S-트랜스퍼라제 및 파라미오신을 포함하고; 백선 진균 항원은 트리코피틴을 포함하고; 톡소플라스마 항원은 SAG-1 및 p30을 포함하고; 트리파노소마 크루지 항원은 75-77 kDa 항원 및 56 kDa 항원을 포함한다.
(VII-f) 예시적인 벡터
특정한 실시양태에서, 벡터는 페이로드, LCR, 조절 성분, 통합 요소, 선택 카세트, 및 스터퍼 서열을 갖는 HDAd5/35++ 벡터를 포함한다. 특정한 실시양태에서, 페이로드는 인간 γ-글로빈 유전자를 포함한다. 특정한 실시양태에서, LCR은 β-글로빈 LCR을 포함한다. 특정한 실시양태에서, 조절 성분은 β-글로빈 프로모터를 포함한다. 특정한 실시양태에서, 통합 요소는 슬리핑 뷰티 100X 트랜스포사제를 포함한다. 특정한 실시양태에서, 선택 카세트는 MGMT (P140K)를 포함한다. 특정한 실시양태에서, 벡터는 EF1α 프로모터를 추가로 포함한다.
다양한 실시양태에서, 본 개시내용의 LCR, 예컨대 긴 LCR을 포함하는 벡터는, 예를 들어 표적 세포 유형 또는 조직, 예컨대 표 1에 제시된 바와 같은 LCR이 발현을 제어하는 세포 유형 또는 조직에서 작동가능하게 연결된 코딩 핵산 서열의 증가된 발현을 제공한다. 다양한 실시양태에서, 본 개시내용의 LCR을 포함하는 벡터는 LCR을 포함하지 않는 참조 벡터와 비교하여, 예를 들어 표적 세포 유형 또는 조직에서 작동가능하게 연결된 코딩 핵산 서열의 증가된 발현을 제공한다. 다양한 실시양태에서, 본 개시내용의 긴 LCR을 포함하는 벡터는 긴 LCR을 포함하지 않는 참조 벡터, 예를 들어 보다 짧은 LCR, 예컨대 미니-LCR을 포함하는 참조 벡터와 비교하여, 예를 들어 표적 세포 유형 또는 조직에서 작동가능하게 연결된 코딩 핵산 서열의 증가된 발현을 제공한다. 다양한 실시양태에서, 증가는 참조 발현 수준의 적어도 10%, 15%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 또는 100%의 증가일 수 있다. 일부 실시양태에서, 본 개시내용의 LCR, 예컨대 긴 LCR을 포함하는 벡터는 건강한 대상체에서, 예를 들어 표적 세포 유형 또는 조직에서 참조 내인성 코딩 핵산 서열의 참조 발현 수준의 적어도 10%, 15%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 또는 100%인 작동가능하게 연결된 코딩 핵산 서열의 발현을 유발한다.
다양한 실시양태에서, 본 개시내용의 LCR, 예컨대 긴 LCR을 포함하는 벡터는 1종 이상의 비-표적 세포 유형 또는 조직, 예컨대 LCR이 발현을 제어하는 세포 유형 또는 조직으로서 표 1에 제시된 세포 유형 또는 조직이 아닌 세포 유형 또는 조직에서 작동가능하게 연결된 코딩 핵산 서열의 감소된 발현을 제공한다. 다양한 실시양태에서, 본 개시내용의 LCR, 예컨대 긴 LCR을 포함하는 벡터는 LCR을 포함하지 않는 참조 벡터와 비교하여 1종 이상의 비-표적 세포 유형 또는 조직에서 작동가능하게 연결된 코딩 핵산 서열의 감소된 발현을 제공한다. 다양한 실시양태에서, 본 개시내용의 LCR, 예컨대 긴 LCR을 포함하는 벡터는 긴 LCR을 포함하지 않는 참조 벡터, 예를 들어 보다 짧은 LCR, 예컨대 미니-LCR을 포함하는 참조 벡터와 비교하여 1종 이상의 비-표적 세포 유형 또는 조직에서 작동가능하게 연결된 코딩 핵산 서열의 감소된 발현을 제공한다. 다양한 실시양태에서, 감소는 참조 발현 수준의 적어도 10%, 15%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 또는 100%의 감소일 수 있다. 예를 들어, 특정한 실시양태에서, β-글로빈 긴 LCR의 사용은 β-글로빈 긴 LCR을 포함하지 않는 참조 벡터, 예를 들어 보다 짧은 LCR, 예컨대 β-글로빈 미니-LCR을 포함하는 참조 벡터와 비교하여, 적혈구가 아닌 세포에서 작동가능하게 연결된 코딩 서열, 예컨대 γ-글로빈 또는 β-글로빈을 코딩하는 코딩 서열의 발현을 감소시킨다.
관련 기술분야의 통상의 기술자가 인지할 바와 같이, 표적 세포 및/또는 조직에서의 증가된 발현 (예를 들어, 본 개시내용의 긴 LCR, 예컨대 긴 LCR의 사용으로 인함)은 유전자 요법에서 벡터의 최소 치료 유효 투여량을 감소시키고, 따라서 최소 치료 유효 투여량의 면역독성 및/또는 면역독성의 위험을 감소시킨다. 관련 기술분야의 통상의 기술자는 비-표적 세포 및/또는 조직에서의 감소된 발현 (예를 들어, 본 개시내용의 긴 LCR, 예컨대 긴 LCR의 사용으로 인함)이 면역독성 및/또는 면역독성의 위험을 감소시킨다는 것을 추가로 재인지할 것이다. 특정의 특정한 예에서, β-글로빈 긴 LCR의 사용은 조혈 줄기 세포에서 작동가능하게 연결된 코딩 핵산 서열의 발현을 증가시키고/거나 비-적혈구 세포에서 작동가능하게 연결된 코딩 핵산 서열의 발현을 감소시켜, 유전자 요법 면역독성 및/또는 그의 위험을 감소시킨다. 다양한 실시양태에서, 표적 세포에서 바이러스 벡터 트랜스포손 페이로드로부터의 증가된 발현 및/또는 면역독성의 감소로 인해 바이러스 벡터의 보다 많은 투여량을 전달하는 능력은 유전자 요법을 제공받는 대상체의 표적 세포 또는 조직에서 달성될 수 있는 트랜스포손 페이로드에 의해 코딩된 작용제의 총 발현을 개선시킨다. 따라서, 본 개시내용의 LCR, 예컨대 긴 LCR을 포함하는 벡터는 참조 벡터, 예컨대 LCR을 포함하지 않거나 긴 LCR을 포함하지 않는 참조 벡터와 비교하여 증가된 치료 효능을 제공할 수 있다.
(VIII) 제제
본원에 기재된 아데노바이러스 공여자 벡터, 대형 페이로드 아데노바이러스 벡터, 아데노바이러스 게놈, 및 아데노바이러스 시스템은 대상체에게의 투여를 위해 제제화될 수 있다. 제제는 치료 유전자와 회합된 재조합 대형 페이로드 아데노바이러스 벡터, 아데노바이러스 게놈, 및/또는 아데노바이러스 시스템 ("활성 성분") 및 1종 이상의 제약상 허용되는 담체를 포함한다.
특정한 실시양태에서, 제제는 제제의 적어도 0.1% w/v 또는 w/w; 제제의 적어도 1% w/v 또는 w/w; 제제의 적어도 10% w/v 또는 w/w; 제제의 적어도 20% w/v 또는 w/w; 제제의 적어도 30% w/v 또는 w/w; 제제의 적어도 40% w/v 또는 w/w; 제제의 적어도 50% w/v 또는 w/w; 제제의 적어도 60% w/v 또는 w/w; 제제의 적어도 70% w/v 또는 w/w; 제제의 적어도 80% w/v 또는 w/w; 제제의 적어도 90% w/v 또는 w/w; 제제의 적어도 95% w/v 또는 w/w; 또는 제제의 적어도 99% w/v 또는 w/w의 활성 성분을 포함한다.
예시적인 일반적으로 사용되는 제약상 허용되는 담체는 임의의 및 모든 흡수 지연제, 항산화제, 결합제, 완충제, 벌킹제 또는 충전제, 킬레이트화제, 코팅, 붕해제, 분산 매질, 겔, 등장화제, 윤활제, 보존제, 염, 용매 또는 공-용매, 안정화제, 계면활성제, 및/또는 전달 비히클을 포함한다.
예시적인 항산화제는 아스코르브산, 메티오닌, 및 비타민 E를 포함한다.
예시적인 완충제는 시트레이트 완충제, 숙시네이트 완충제, 타르트레이트 완충제, 푸마레이트 완충제, 글루코네이트 완충제, 옥살레이트 완충제, 락테이트 완충제, 아세테이트 완충제, 포스페이트 완충제, 히스티딘 완충제 및/또는 트리메틸아민 염을 포함한다.
예시적인 킬레이트화제는 EDTA이다.
예시적인 등장화제는 3가 이상의 당 알콜, 예컨대 글리세린, 에리트리톨, 아라비톨, 크실리톨, 소르비톨, 또는 만니톨을 포함한 다가 당 알콜을 포함한다.
예시적인 보존제는 페놀, 벤질 알콜, 메타-크레졸, 메틸 파라벤, 프로필 파라벤, 옥타데실디메틸벤질 암모늄 클로라이드, 벤즈알코늄 할라이드, 헥사메토늄 클로라이드, 알킬 파라벤, 예컨대 메틸 또는 프로필 파라벤, 카테콜, 레조르시놀, 시클로헥산올 및 3-펜탄올을 포함한다.
안정화제는 기능상 벌킹제로부터 활성 성분을 가용화하거나 변성 또는 용기 벽에의 부착을 방지하는 것을 돕는 첨가제까지의 범위일 수 있는 넓은 카테고리의 부형제를 지칭한다. 전형적인 안정화제는 다가 당 알콜; 아미노산, 예컨대 아르기닌, 리신, 글리신, 글루타민, 아스파라긴, 히스티딘, 알라닌, 오르니틴, L-류신, 2-페닐알라닌, 글루탐산 및 트레오닌; 유기 당 또는 당 알콜, 예컨대 락토스, 트레할로스, 스타키오스, 만니톨, 소르비톨, 크실리톨, 리비톨, 미오이니시톨, 갈락티톨, 글리세롤 및 시클리톨, 예컨대 이노시톨; PEG; 아미노산 중합체; 황-함유 환원제, 예컨대 우레아, 글루타티온, 티옥트산, 소듐 티오글리콜레이트, 티오글리세롤, α-모노티오글리세롤 및 티오황산나트륨; 저분자량 폴리펩티드 (즉, <10개 잔기); 단백질, 예컨대 인간 혈청 알부민, 소 혈청 알부민, 젤라틴 또는 이뮤노글로불린; 친수성 중합체, 예컨대 폴리비닐피롤리돈; 모노사카라이드, 예컨대 크실로스, 만노스, 프룩토스 및 글루코스; 디사카라이드, 예컨대 락토스, 말토스 및 수크로스; 트리사카라이드, 예컨대 라피노스, 및 폴리사카라이드, 예컨대 덱스트란을 포함할 수 있다. 안정화제는 전형적으로 치료 중량에 기초하여 0.1 내지 10,000 중량부의 범위로 존재한다.
본원에 개시된 제제는, 예를 들어 주사에 의한 투여를 위해 제제화될 수 있다. 주사를 위해, 제제는 예컨대 행크 용액, 링거액, 또는 생리 염수를 포함한 완충제 중에, 또는 배양 배지, 예컨대 이스코브 변형 둘베코 배지 (IMDM) 중에 수용액으로서 제제화될 수 있다. 수용액은 제제화제, 예컨대 현탁화제, 안정화제, 및/또는 분산제를 포함할 수 있다. 대안적으로, 제제는 사용 전에 적합한 비히클, 예를 들어 멸균 발열원-무함유 물로 구성하기 위한 동결건조된 및/또는 분말 형태일 수 있다.
본원에 개시된 임의의 제제는 유리하게는 투여 이익을 능가하는 유의하게 유해하거나, 알레르기성이거나, 또는 다른 불리한 반응을 생성하지 않는 것을 포함한, 임의의 다른 제약상 허용되는 담체를 포함할 수 있다. 예시적인 제약상 허용되는 담체 및 제제는 문헌 [Remington's Pharmaceutical Sciences, 18th Ed. Mack Printing Company, 1990]에 개시되어 있다. 더욱이, 제제는 US FDA 생물학적 표준 사무국 및/또는 다른 관련 외국 규제 기관에 의해 요구되는 바와 같은 멸균성, 발열원성, 일반적 안전성, 및 순도 표준을 충족시키도록 제조될 수 있다.
(IX) 적용
(IX-a) 생체내 요법
본원에 개시된 제제는 대상체 (인간, 수의학적 동물 (개, 고양이, 파충류, 조류 등), 가축 (말, 소, 염소, 돼지, 닭 등) 및 연구용 동물 (원숭이, 래트, 마우스, 어류 등)을 치료하는데 사용될 수 있다. 대상체를 치료하는 것은 치료 유효량을 전달하는 것을 포함한다. 치료 유효량은 유효량, 예방적 치료, 및/또는 치유적 치료를 제공하는 것을 포함한다.
본원에 기재된 제제는 HSPC 가동화와 협력하여 투여될 수 있다. 특정 실시양태에서, 아데노바이러스 공여자 벡터의 투여는 1종 이상의 가동화 인자의 투여와 공동으로 이루어진다. 특정한 실시양태에서, 아데노바이러스 공여자 벡터의 투여는 1종 이상의 가동화 인자의 투여에 후속한다. 특정한 실시양태에서, 아데노바이러스 공여자 벡터의 투여는 제1의 1종 이상의 가동화 인자의 투여에 후속하며, 제2의 1종 이상의 가동화 인자의 투여와 공동으로 이루어진다.
특정한 대상체에게 투여되는 아데노바이러스 공여자 벡터, 및 특정한 실시양태에서 아데노바이러스 공여자 벡터 및 가동화 인자의 실제 용량 및 양, 및 조화되는 가동화 절차 및 스케줄은, 예를 들어 표적; 체중; 상태의 유형; 상태의 중증도; 공지되었을 때 예정된 관련 사건; 이전 또는 공동 치료적 개입; 대상체의 특발증; 및 투여 경로를 포함한 물리적 및 생리학적 인자와 같은 파라미터를 고려하여 의사, 수의사, 또는 연구자에 의해 결정될 수 있다. 또한, 최적의 투여량 범위를 확인하는 것을 돕기 위해 시험관내 및 생체내 검정이 임의로 사용될 수 있다.
치료 유전자와 회합된 아데노바이러스 공여자 벡터의 치료 유효량은, 예를 들어 1 x 107 내지 50 x 108 감염 단위 (IU) 또는 5 x 107 내지 20 x 108 IU 범위의 용량을 포함할 수 있다. 다른 예에서, 용량은 5 x 107 IU, 6 x 107 IU, 7 x 107 IU, 8 x 107 IU, 9 x 107 IU, 1 x 108 IU, 2 x 108 IU, 3 x 108 IU, 4 x 108 IU, 5 x 108 IU, 6 x 108 IU, 7 x 108 IU, 8 x 108 IU, 9 x 108 IU, 10 x 108 IU, 또는 그 초과를 포함할 수 있다. 특정한 실시양태에서, 치료 유전자와 회합된 아데노바이러스 공여자 벡터의 치료 유효량은 4 x 108 IU를 포함한다. 특정한 실시양태에서, 치료 유전자와 회합된 아데노바이러스 공여자 벡터의 치료 유효량은 피하로 또는 정맥내로 투여될 수 있다. 특정한 실시양태에서, 치료 유전자와 회합된 아데노바이러스 공여자 벡터의 치료 유효량은 1종 이상의 가동화 인자로의 투여에 후속하여 투여될 수 있다.
특정한 실시양태에서, G-CSF의 치료 유효량은 0.1 μg/kg 내지 100 μg/kg을 포함한다. 특정한 실시양태에서, G-CSF의 치료 유효량은 0.5 μg/kg 내지 50 μg/kg을 포함한다. 특정한 실시양태에서, G-CSF의 치료 유효량은 0.5 μg/kg, 1 μg/kg, 2 μg/kg, 3 μg/kg, 4 μg/kg, 5 μg/kg, 6 μg/kg, 7 μg/kg, 8 μg/kg, 9 μg/kg, 10 μg/kg, 11 μg/kg, 12 μg/kg, 13 μg/kg, 14 μg/kg, 15 μg/kg, 16 μg/kg, 17 μg/kg, 18 μg/kg, 19 μg/kg, 20 μg/kg, 또는 그 초과를 포함한다. 특정한 실시양태에서, G-CSF의 치료 유효량은 5 μg/kg을 포함한다. 특정한 실시양태에서, G-CSF는 피하로 또는 정맥내로 투여될 수 있다. 특정한 실시양태에서, G-CSF는 1일, 연속 2일, 연속 3일, 연속 4일, 연속 5일, 또는 그 초과 동안 투여될 수 있다. 특정한 실시양태에서, G-CSF는 연속 4일 동안 투여될 수 있다. 특정한 실시양태에서, G-CSF는 연속 5일 동안 투여될 수 있다. 특정한 실시양태에서, 단일 작용제로서, G-CSF는 아데노바이러스 공여자 벡터 전달 3, 4, 5, 6, 7, 또는 8일 전에 개시되어 매일 10 μg/kg의 용량으로 피하로 사용될 수 있다. 특정한 실시양태에서, G-CSF는 단일 작용제로서 투여되고, 이어서 또 다른 가동화 인자와 공동 투여될 수 있다. 특정한 실시양태에서, G-CSF는 단일 작용제로서 투여되고, 이어서 AMD3100과 공동 투여될 수 있다. 특정한 실시양태에서, 치료 프로토콜은 G-CSF가 제1일, 제2일, 제3일, 및 제4일에 투여될 수 있고, 제5일에는 G-CSF 및 AMD3100이 아데노바이러스 공여자 벡터 투여 6 내지 8시간 전에 투여되는 5-일 치료를 포함한다.
투여할 GM-CSF의 치료 유효량은 예를 들어 0.1 내지 50 μg/kg 또는 0.5 내지 30 μg/kg 범위의 용량을 포함할 수 있다. 특정한 실시양태에서, GM-CSF가 투여될 수 있는 용량은 0.5 μg/kg, 1 μg/kg, 2 μg/kg, 3 μg/kg, 4 μg/kg, 5 μg/kg, 6 μg/kg, 7 μg/kg, 8 μg/kg, 9 μg/kg, 10 μg/kg, 11 μg/kg, 12 μg/kg, 13 μg/kg, 14 μg/kg, 15 μg/kg, 16 μg/kg, 17 μg/kg, 18 μg/kg, 19 μg/kg, 20 μg/kg, 또는 그 초과를 포함한다. 특정한 실시양태에서, GM-CSF는 1일, 연속 2일, 연속 3일, 연속 4일, 연속 5일, 또는 그 초과 동안 피하로 투여될 수 있다. 특정한 실시양태에서, GM-CSF는 피하로 또는 정맥내로 투여될 수 있다. 특정한 실시양태에서, GM-CSF는 아데노바이러스 공여자 벡터 전달 3, 4, 5, 6, 7, 또는 8일 전에 개시되어 매일 10 μg/kg의 용량으로 피하로 투여될 수 있다. 특정한 실시양태에서, GM-CSF는 단일 작용제로서 투여되고, 이어서 또 다른 가동화 인자와 공동 투여될 수 있다. 특정한 실시양태에서, GM-CSF는 단일 작용제로서 투여되고, 이어서 AMD3100과 공동 투여될 수 있다. 특정한 실시양태에서, 치료 프로토콜은 GM-CSF가 제1일, 제2일, 제3일, 및 제4일에 투여될 수 있고, 제5일에는 GM-CSF 및 AMD3100이 아데노바이러스 공여자 벡터 투여 6 내지 8시간 전에 투여되는 5일 치료를 포함한다. 사르그라모스팀 (GM-CSF)에 대한 투여 요법은 200 μg/m2, 210 μg/m2, 220 μg/m2, 230 μg/m2, 240 μg/m2, 250 μg/m2, 260 μg/m2, 270 μg/m2, 280 μg/m2, 290 μg/m2, 300 μg/m2, 또는 그 초과를 포함할 수 있다. 특정한 실시양태에서, 사르그라모스팀은 1일, 연속 2일, 연속 3일, 연속 4일, 연속 5일, 또는 그 초과 동안 투여될 수 있다. 특정한 실시양태에서, 사르그라모스팀은 피하로 또는 정맥내로 투여될 수 있다. 특정한 실시양태에서, 사르그라모스팀에 대한 투여 요법은 250 μg/m2/일 정맥내 또는 피하를 포함할 수 있고, 표적화된 세포 양이 말초 혈액에서 도달될 때까지 계속될 수 있거나 또는 5일 동안 계속될 수 있다. 특정한 실시양태에서, 사르그라모스팀은 단일 작용제로서 투여되고, 이어서 또 다른 가동화 인자와 공동 투여될 수 있다. 특정한 실시양태에서, 사르그라모스팀은 단일 작용제로서 투여되고, 이어서 AMD3100과 공동 투여될 수 있다. 특정한 실시양태에서, 치료 프로토콜은 사르그라모스팀이 제1일, 제2일, 제3일, 및 제4일에 투여될 수 있고, 제5일에는 사르그라모스팀 및 AMD3100이 아데노바이러스 공여자 벡터 투여 6 내지 8시간 전에 투여되는 5일 치료를 포함한다.
특정한 실시양태에서, AMD3100의 치료 유효량은 0.1 mg/kg 내지 100 mg/kg을 포함한다. 특정한 실시양태에서, AMD3100의 치료 유효량은 0.5 mg/kg 내지 50 mg/kg을 포함한다. 특정한 실시양태에서, AMD3100의 치료 유효량은 0.5 mg/kg, 1 mg/kg, 2 mg/kg, 3 mg/kg, 4 mg/kg, 5 mg/kg, 6 mg/kg, 7 mg/kg, 8 mg/kg, 9 mg/kg, 10 mg/kg, 11 mg/kg, 12 mg/kg, 13 mg/kg, 14 mg/kg, 15 mg/kg, 16 mg/kg, 17 mg/kg, 18 mg/kg, 19 mg/kg, 20 mg/kg, 또는 그 초과를 포함한다. 특정한 실시양태에서, AMD3100의 치료 유효량은 4 mg/kg을 포함한다. 특정한 실시양태에서, AMD3100의 치료 유효량은 5 mg/kg을 포함한다. 특정한 실시양태에서, AMD3100의 치료 유효량은 10 μg/kg 내지 500 μg/kg 또는 50 μg/kg 내지 400 μg/kg을 포함한다. 특정한 실시양태에서, AMD3100의 치료 유효량은 100 μg/kg, 150 μg/kg, 200 μg/kg, 250 μg/kg, 300 μg/kg, 350 μg/kg, 또는 그 초과를 포함한다. 특정한 실시양태에서, AMD3100은 피하로 또는 정맥내로 투여될 수 있다. 특정한 실시양태에서, AMD3100은 아데노바이러스 공여자 벡터 전달 6 내지 11시간 전에 160-240 μg/kg으로 피하로 투여될 수 있다. 특정한 실시양태에서, 치료 유효량의 AMD3100은 또 다른 가동화 인자의 투여와 공동으로 투여될 수 있다. 특정한 실시양태에서, 치료 유효량의 AMD3100은 또 다른 가동화 인자의 투여에 후속하여 투여될 수 있다. 특정한 실시양태에서, 치료 유효량의 AMD3100은 G-CSF의 투여에 후속하여 투여될 수 있다. 특정한 실시양태에서, 치료 프로토콜은 G-CSF가 제1일, 제2일, 제3일, 및 제4일에 투여되고, 제5일에는 G-CSF 및 AMD3100이 아데노바이러스 공여자 벡터 주사 6 내지 8시간 전에 투여되는 5-일 치료를 포함한다.
투여할 SCF의 치료 유효량은 예를 들어 0.1 내지 100 μg/kg/일 또는 0.5 내지 50 μg/kg/일 범위의 용량을 포함할 수 있다. 특정한 실시양태에서, SCF가 투여될 수 있는 용량은 0.5 μg/kg/일, 1 μg/kg/일, 2 μg/kg/일, 3 μg/kg/일, 4 μg/kg/일, 5 μg/kg/일, 6 μg/kg/일, 7 μg/kg/일, 8 μg/kg/일, 9 μg/kg/일, 10 μg/kg/일, 11 μg/kg/일, 12 μg/kg/일, 13 μg/kg/일, 14 μg/kg/일, 15 μg/kg/일, 16 μg/kg/일, 17 μg/kg/일, 18 μg/kg/일, 19 μg/kg/일, 20 μg/kg/일, 21 μg/kg/일, 22 μg/kg/일, 23 μg/kg/일, 24 μg/kg/일, 25 μg/kg/일, 26 μg/kg/일, 27 μg/kg/일, 28 μg/kg/일, 29 μg/kg/일, 30 μg/kg/일, 또는 그 초과를 포함한다. 특정한 실시양태에서, SCF는 1일, 연속 2일, 연속 3일, 연속 4일, 연속 5일, 또는 그 초과 동안 투여될 수 있다. 특정한 실시양태에서, SCF는 피하로 또는 정맥내로 투여될 수 있다. 특정한 실시양태에서, SCF는 20 μg/kg/일로 피하로 주사될 수 있다. 특정한 실시양태에서, SCF는 단일 작용제로서 투여되고, 이어서 또 다른 가동화 인자와 공동 투여될 수 있다. 특정한 실시양태에서, SCF는 단일 작용제로서 투여되고, 이어서 AMD3100과 공동 투여될 수 있다. 특정한 실시양태에서, 치료 프로토콜은 SCF가 제1일, 제2일, 제3일, 및 제4일에 투여될 수 있고, 제5일에는 SCF 및 AMD3100이 아데노바이러스 공여자 벡터 투여 6 내지 8시간 전에 투여되는 5-일 치료를 포함한다.
특정한 실시양태에서, 성장 인자 GM-CSF 및 G-CSF는 골수 함요 내의 HSPC를 말초 순환 혈액으로 가동화하여 혈액 중 순환하는 HSPC의 분율을 증가시키기 위해 투여될 수 있다. 특정한 실시양태에서, 가동화는 G-CSF/필그라스팀 (암젠(Amgen)) 및/또는 AMD3100 (시그마(Sigma))의 투여에 의해 달성될 수 있다. 특정한 실시양태에서, 가동화는 GM-CSF/사르그라모스팀 (암젠) 및/또는 AMD3100 (시그마)의 투여에 의해 달성될 수 있다. 특정한 실시양태에서, 가동화는 SCF/안세스팀 (암젠) 및/또는 AMD3100 (시그마)의 투여에 의해 달성될 수 있다. 특정한 실시양태에서, G-CSF/필그라스팀의 투여는 AMD3100의 투여에 선행한다. 특정한 실시양태에서, G-CSF/필그라스팀의 투여는 AMD3100의 투여와 공동으로 이루어진다. 특정한 실시양태에서, G-CSF/필그라스팀의 투여는 AMD3100의 투여에 선행하고, 이어서 G-CSF/필그라스팀 및 AMD3100의 공동 투여가 이어진다. US 20140193376은 S1P 수용체 1 (S1PR1) 조정제 작용제와 함께 CXCR4 길항제를 이용하는 가동화 프로토콜을 기재한다. US 20110044997은 혈관 내피 성장 인자 수용체 (VEGFR) 효능제와 함께 CXCR4 길항제를 이용하는 가동화 프로토콜을 기재한다.
치료적 대형-페이로드 아데노바이러스 벡터(들)는 스테로이드, IL-1 수용체 길항제, 및/또는 IL-6 수용체 길항제 투여와 공동으로 또는 그 후에 투여될 수 있다. 이들 프로토콜은 치료의 잠재적 부작용을 완화시킬 수 있다.
IL-1 수용체 길항제는 공지되어 있고, ADC-1001 (엘리게이터 바이오사이언스(Alligator Bioscience), 스웨덴 룬드), FX-201 (플렉시온 테라퓨틱스(Flexion Therapeutics), 매사추세츠주 벌링턴), 바이오아시스 테크놀로지스(Bioasis Technologies) (캐나다 리치먼드)로부터 입수가능한 융합 단백질, GQ-303 (진퀸 바이오테라퓨틱스 게엠베하(Genequine Biotherapeutics GmbH), 독일 함부르크), HL-2351 (한독, 인크.(Handok, Inc.), 한국 서울), MBIL-1RA (프로테오테라, 인크.(ProteoThera, Inc.), 매사추세츠주 뉴턴), 아나킨라 (피보르 파마슈티칼스(Pivor Pharmaceuticals), 캐나다 밴쿠버), 인간 이뮤노글로불린 G 또는 글로불린 S (지씨 파마(GC Pharma), 한국 경기도)를 포함한다. IL-6 수용체 길항제도 또한 관련 기술분야에 공지되어 있고, 토실리주맙, BCD-089 (바이오카드(Biocad), 러시아), HS-628 (제지앙 히순 팜(Zhejiang Hisun Pharm), 중국 타이저우 시티), 및 APX-007 (아펙시겐(Apexigen), 캘리포니아주 샌 카를로스)을 포함한다.
특정한 실시양태에서, HSPC를 풍부화하기 위해 HSC 풍부화제, 예컨대 CD19 면역독소 또는 5-FU가 투여될 수 있다. CD19 면역독소는 골수 세포의 30%를 차지하는 모든 CD19 계통 세포를 고갈시키는데 사용될 수 있다. 고갈은 골수로부터의 배출을 촉진한다. HSPC가 증식하도록 함으로써 (CD19 면역독소 또는 5-FU를 통함), 이는 그의 분화 및 골수로부터의 배출을 자극하고, 말초 혈액 세포에서 트랜스진 마킹을 증가시킨다.
치료 유효량은 임의의 적절한 투여 경로를 통해, 예컨대 주사, 주입, 관류에 의해, 보다 특히 골수, 정맥내, 피내, 동맥내, 결절내, 림프내, 복강내 주사, 주입, 또는 관류 중 1종 이상에 의한 투여에 의해 투여될 수 있다.
(IX-b) 생체외 요법 및 시험관내 용도
본원에 제공된 방법 및 조성물은 적어도 부분적으로 생체내 유전자 요법에 사용하기 위해 개시된다. 그러나, 의심을 피하기 위해, 본 개시내용은 세포 및/또는 조직의 생체외 조작을 위한 본원에 제공된 조성물 및 방법의 용도, 뿐만 아니라 연구 목적을 위한 세포 및/또는 조직의 조작을 포함한 시험관내 용도를 명백하게 포함한다.
(IX-c) 특정한 혈액 장애 (예를 들어, 혈우병, 지중해빈혈)의 치료
특정한 실시양태에서, 본원에 개시된 방법 및 제제는 혈액 장애를 치료하는데 사용될 수 있다. 특정한 실시양태에서, 제제는 혈우병, β-중증성 지중해빈혈, 다이아몬드 블랙판 빈혈 (DBA), 발작성 야간 혈색소뇨 (PNH), 순수 적혈구 무형성증 (PRCA), 불응성 빈혈, 중증 재생불량성 빈혈, 및/또는 혈액암, 예컨대 백혈병, 림프종, 및 골수종을 치료하기 위해 대상체에게 투여된다.
특정한 실시양태에서, 치료상 유효한 치료는 HbF의 발현을 유도 또는 증가시키고/거나, 헤모글로빈의 생산을 유도 또는 증가시키고/거나,β-글로빈의 생산을 유도 또는 증가시킨다. 특정한 실시양태에서, 치료상 유효한 치료는 혈액 세포 기능을 개선시키고/거나 세포의 산소화를 증가시킨다.
특정한 실시양태에서, 본 개시내용의 방법은 골수 기능의 회복을 필요로 하는 대상체에서 골수 기능을 회복시킬 수 있다. 특정한 실시양태에서, 골수 기능을 회복시키는 것은 본원에 기재된 요법이 투여되지 않은 골수 재증식을 필요로 하는 대상체와 비교하여 유전자 교정된 세포로 골수 재증식을 개선시키는 것을 포함할 수 있다. 유전자 교정된 세포로 골수 재증식을 개선시키는 것은 유전자 교정된 세포의 백분율을 증가시키는 것을 포함할 수 있다. 특정한 실시양태에서, 세포는 백혈구 및 골수 유래 세포로부터 선택된다. 특정한 실시양태에서, 유전자 교정된 세포의 백분율은 정량적 실시간 PCR 및 유동 세포측정법으로부터 선택된 검정을 사용하여 측정될 수 있다.
특정한 실시양태에서, 본 개시내용의 방법은 FA를 치료하는데 사용될 수 있다. 특정한 실시양태에서, 치료 효능은 림프구 재구성, 개선된 클론 다양성 및 흉선세포증식, 감소된 감염, 및/또는 개선된 환자 결과를 통해 관찰될 수 있다. 치료 효능은 또한 체중 증가 및 성장, 개선된 위장 기능 (예를 들어, 감소된 설사), 감소된 상기도 증상, 구강의 감소된 진균 감염 (아구창), 폐렴의 감소된 발생률 및 중증도, 감소된 수막염 및 혈류 감염, 및 감소된 귀 감염 중 1종 이상을 통해 관찰될 수 있다. 특정한 실시양태에서, FA를 본 개시내용의 방법으로 치료하는 것은 미토마이신 C (MMC)에 대한 골수 유래 세포의 저항성을 증가시키는 것을 포함한다. 특정한 실시양태에서, MMC에 대한 골수 유래 세포의 저항성은 메틸셀룰로스 및 MMC에서의 세포 생존 검정에 의해 측정될 수 있다.
(IX-c-i) 혈액 장애를 치료하기 위한 LCR, 프로모터, 코딩 서열, 및 벡터
다양한 실시양태에서, 본 개시내용은 β-글로빈 긴 LCR, β-글로빈 프로모터, 및 혈액 장애의 치료를 위한 단백질 또는 작용제를 코딩하는 코딩 핵산 서열을 포함하는 본 개시내용의 아데노바이러스 공여자 벡터를 사용한 혈액 장애의 치료를 포함한다. 다양한 실시양태에서, 혈액 장애는 지중해빈혈이고, 단백질은 β-글로빈 또는 γ-글로빈 단백질, 또는 다르게는 β-글로빈 또는 γ-글로빈을 부분적으로 또는 완전히 기능적으로 대체하는 단백질이다. 다양한 실시양태에서, 혈액 장애는 혈우병이고, 단백질은 ET3, 또는 다르게는 인자 VIII을 부분적으로 또는 완전히 기능적으로 대체하는 단백질이다. 다양한 실시양태에서, 혈액 장애는 점 돌연변이 질환, 예컨대 겸상 적혈구 빈혈이고, 작용제는 유전자 편집 단백질이다.
ET3은 하기 아미노산 서열: 서열식별번호: 99를 가질 수 있다. 다양한 실시양태에서, 인자 VIII 대체 단백질은 서열식별번호: 99에 대해 적어도 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일성을 갖는 아미노산 서열을 가질 수 있다.
β-글로빈은 하기 아미노산 서열: 서열식별번호: 100을 가질 수 있다. 다양한 실시양태에서, β-글로빈 대체 단백질은 서열식별번호: 100에 대해 적어도 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일성을 갖는 아미노산 서열을 가질 수 있다.
γ-글로빈은 하기 아미노산 서열: 서열식별번호: 101을 가질 수 있다. 다양한 실시양태에서, γ-글로빈 대체 단백질은 서열식별번호: 101에 대해 적어도 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일성을 갖는 아미노산 서열을 가질 수 있다.
(IX-c-ii) 투여량 및 제제
벡터는 세포 또는 동물, 예를 들어 인간에게 투여하기에 제약상 허용되도록 제제화될 수 있다. 벡터는 시험관내, 생체외, 또는 생체내 투여될 수 있다. 다양한 예에서, 벡터는 제약상 허용되는 담체 또는 부형제를 포함하도록 제제화될 수 있다. 제약상 허용되는 담체의 예는 생리학상 상용성인 임의의 및 모든 용매, 분산 매질, 코팅, 항박테리아제 및 항진균제, 등장화제 및 흡수 지연제 등을 포함하나 이에 제한되지는 않는다. 본 발명의 조성물은 제약상 허용되는 염, 예를 들어 산 부가염 또는 염기 부가염을 포함할 수 있다.
다양한 실시양태에서, 본원에 기재된 바와 같은 벡터를 포함하는 조성물, 예를 들어 주사용 멸균 제제는 비히클로서 주사용 증류수를 사용하여 통상적인 제약 실시에 따라 제제화될 수 있다. 예를 들어, 생리 염수, 또는 글루코스 및 다른 보충제, 예컨대 D-소르비톨, D-만노스, D-만니톨, 및 염화나트륨을 함유하는 등장성 용액이 주사용 수용액으로서, 임의로 적합한 가용화제, 예를 들어 알콜, 예컨대 에탄올 및 폴리알콜, 예컨대 프로필렌 글리콜 또는 폴리에틸렌 글리콜, 및 비이온성 계면활성제, 예컨대 폴리소르베이트 80™, HCO-50 등과 조합되어 사용될 수 있다.
본원에 개시된 바와 같이, 벡터는 관련 기술분야에 공지된 임의의 형태일 수 있다. 이러한 형태는, 예를 들어 액체, 반고체 및 고체 투여 형태, 예컨대 액체 용액 (예를 들어, 주사가능한 및 주입가능한 용액), 분산액 또는 현탁액, 정제, 환제, 분말, 리포솜 및 좌제를 포함한다.
임의의 특정한 형태의 선택 또는 사용은, 부분적으로, 의도된 투여 방식 및 치료 용도에 좌우될 수 있다. 예를 들어, 전신 또는 국부 전달을 위해 의도된 조성물을 함유하는 조성물은 주사가능한 또는 주입가능한 용액의 형태일 수 있다. 따라서, 벡터는 비경구 방식 (예를 들어, 정맥내, 피하, 복강내, 또는 근육내 주사)에 의한 투여를 위해 제제화될 수 있다. 본원에 사용된 비경구 투여는 통상적으로 주사에 의한, 경장 및 국소 투여 외의 투여 방식을 지칭하고, 정맥내, 비강내, 안내, 폐, 근육내, 동맥내, 척수강내, 피막내, 안와내, 심장내, 피내, 폐내, 복강내, 경기관, 피하, 각피하, 관절내, 피막하, 지주막하, 척수내, 경막외, 뇌내, 두개내, 경동맥내 및 수조내 주사 및 주입을 포함하나 이에 제한되지는 않는다. 비경구 투여 경로는, 예를 들어 주사에 의한 투여, 경비 투여, 경폐 투여, 또는 경피 투여일 수 있다. 투여는 정맥내 주사, 근육내 주사, 복강내 주사, 피하 주사에 의한 전신 또는 국부 투여일 수 있다.
다양한 실시양태에서, 본 발명의 벡터는 용액, 마이크로에멀젼, 분산액, 리포솜, 또는 고농도에서 안정한 저장에 적합한 다른 정렬된 구조로서 제제화될 수 있다. 멸균 주사가능한 용액은 필요한 양의 본원에 기재된 조성물을 상기 열거된 성분 중 하나 또는 그의 조합과 함께 적절한 용매 중에 혼입시킨 후, 필요에 따라, 여과 멸균함으로써 제조될 수 있다. 일반적으로, 분산액은 본원에 기재된 조성물을 염기성 분산 매질 및 상기 열거된 것으로부터의 필요한 다른 성분을 함유하는 멸균 비히클 내로 혼입시킴으로써 제조된다. 멸균 주사가능한 용액의 제조를 위한 멸균 분말의 경우에, 제조 방법은 그의 이전에 멸균-여과된 용액으로부터 본원에 기재된 조성물 플러스 임의의 추가의 목적하는 성분 (하기 참조)의 분말을 생성하는 진공 건조 및 동결-건조를 포함한다. 용액의 적절한 유동성은, 예를 들어 코팅, 예컨대 레시틴의 사용에 의해, 분산액의 경우에 요구되는 입자 크기의 유지에 의해, 및 계면활성제의 사용에 의해 유지될 수 있다. 주사가능한 조성물의 지속 흡수는 흡수를 지연시키는 시약, 예를 들어 모노스테아레이트 염 및 젤라틴을 조성물에 포함시킴으로써 달성될 수 있다.
벡터는 물 또는 또 다른 제약상 허용되는 액체 중 멸균 용액 또는 현탁액을 포함하는 주사가능한 제제의 형태로 비경구로 투여될 수 있다. 예를 들어, 벡터는 치료 분자를 제약상 허용되는 비히클 또는 매질, 예컨대 멸균수 및 생리 염수, 식물성 오일, 유화제, 현탁화제, 계면활성제, 안정화제, 향미 부형제, 희석제, 비히클, 보존제, 결합제와 적합하게 조합한 다음, 일반적으로 허용되는 제약 실시에 요구되는 단위 용량 형태로 혼합함으로써 제제화될 수 있다. 제약 제제에 포함된 벡터의 양은 지정된 범위 내의 적합한 용량이 제공되도록 하는 양이다. 유성 액체의 비제한적 예는 참깨 오일 및 대두 오일을 포함하고, 이는 가용화제로서 벤질 벤조에이트 또는 벤질 알콜과 조합될 수 있다. 포함될 수 있는 다른 항목은 완충제, 예컨대 포스페이트 완충제, 또는 아세트산나트륨 완충제, 수딩제, 예컨대 프로카인 히드로클로라이드, 안정화제, 예컨대 벤질 알콜 또는 페놀, 및 항산화제이다. 제제화된 주사제는 적합한 앰플에 포장될 수 있다.
다양한 실시양태에서, 피하 투여는 장치, 예컨대 시린지, 사전충전 시린지, 자가-주사기 (예를 들어, 일회용 또는 재사용가능), 펜 주사기, 패치 주사기, 착용가능한 주사기, 피하 주입 세트가 구비된 보행용 시린지 주입 펌프, 또는 피하 주사를 위한 다른 장치에 의해 달성될 수 있다.
일부 실시양태에서, 본원에 기재된 벡터는 국부 투여에 의해 대상체에게 치료적으로 전달될 수 있다. 본원에 사용된 "국부 투여" 또는 "국부 전달"은 혈관계를 통한 그의 의도된 표적 조직 또는 부위로의 벡터 또는 벡터의 수송에 의존하지 않는 전달을 지칭할 수 있다. 예를 들어, 벡터는 조성물 또는 작용제의 주사 또는 이식에 의해 또는 조성물 또는 작용제를 함유하는 장치의 주사 또는 이식에 의해 전달될 수 있다. 특정 실시양태에서, 표적 조직 또는 부위 부근에서의 국부 투여 후, 조성물 또는 작용제, 또는 그의 1종 이상의 성분은 투여 부위가 아닌 의도된 표적 조직 또는 부위로 확산될 수 있다.
일부 실시양태에서, 본원에 제공된 조성물은 단위 투여 형태로 존재하며, 단위 투여 형태는 자기-투여에 적합할 수 있다. 이러한 단위 투여 형태는 용기, 전형적으로 예를 들어 바이알, 카트리지, 사전충전된 시린지 또는 일회용 펜 내에 제공될 수 있다. 미국 특허 번호 6,302,855에 기재된 투여 장치와 같은 투여기가 또한 예를 들어 본원에 기재된 바와 같은 주사 시스템과 함께 사용될 수 있다.
주사에 적합한 벡터 제제의 제약 형태는 멸균 수용액 또는 분산액을 포함할 수 있다. 제제는 멸균일 수 있고, 시린지 내외로의 적절한 유동을 가능하게 하는 유체이어야 한다. 제제는 또한 제조 및 저장 조건 하에 안정할 수 있다. 담체는 예를 들어 물 및 염수 또는 완충 수용액을 함유하는 용매 또는 분산 매질일 수 있다. 바람직하게는, 등장화제, 예를 들어 당 또는 염화나트륨이 제제에 사용될 수 있다.
또한, 관련 기술분야의 통상의 기술자는 전기천공, 초음파영동, 골내 주사 방법을 통하거나 또는 유전자 총을 사용하는 것에 의할 수 있는 추가의 전달 방법을 또한 고려할 수 있다. 벡터는 또한 마이크로칩, 나노-칩 또는 나노입자 내로 이식될 수 있다.
본원에 기재된 벡터의 적합한 용량은, 예를 들어 치료될 대상체의 연령, 성별, 및 체중, 치료될 상태 또는 질환, 및 사용되는 특정한 벡터를 비롯한 다양한 인자에 좌우될 수 있다. 대상체에게 투여되는 용량에 영향을 미치는 다른 인자는, 예를 들어 상태 또는 질환의 유형 또는 중증도를 포함한다. 다른 인자는, 예를 들어 대상체에게 공동으로 영향을 미치거나 이전에 영향을 미친 다른 의학적 장애, 대상체의 전반적 건강, 대상체의 유전적 소인, 식이, 투여 시간, 배출 속도, 약물 조합물, 및 대상체에게 투여되는 임의의 다른 추가의 치료제를 포함할 수 있다. 벡터의 적합한 투여 수단은 치료될 상태 또는 질환 및 대상체의 연령 및 상태에 기초하여 선택될 수 있다. 용량 및 투여 방법은 환자의 체중, 연령, 상태 등에 따라 달라질 수 있고, 관련 기술분야의 통상의 기술자에 의해 필요에 따라 적합하게 선택될 수 있다. 임의의 특정한 대상체에 대한 구체적 투여량 및 치료 요법은 의료 진료의의 판단에 기초하여 조정될 수 있다.
벡터 용액은 치료 유효량의 본원에 기재된 조성물을 포함할 수 있다. 이러한 유효량은, 부분적으로, 투여된 조성물의 효과, 또는 1종 초과의 작용제가 사용되는 경우에 조성물 및 1종 이상의 추가의 활성제의 조합 효과에 기초하여 관련 기술분야의 통상의 기술자에 의해 용이하게 결정될 수 있다. 치료 유효량은 치료상 유익한 효과가 조성물의 임의의 독성 또는 유해한 효과를 능가하는 양일 수 있다.
(IX-d) 암 유형의 치료
특정한 실시양태에서, 본원에 개시된 방법 및 제제는 암을 치료하는데 사용될 수 있다. 특정한 실시양태에서, 제제는 급성 림프모구성 백혈병 (ALL), 급성 골수 백혈병 (AML), 만성 림프구성 백혈병 (CLL), 만성 골수 백혈병 (CML), 만성 골수단핵구성 백혈병, 미만성 대 B-세포 림프종, 여포성 림프종, 호지킨 림프종, 소아 골수단핵구성 백혈병, 다발성 골수종, 골수이형성증, 및/또는 비-호지킨 림프종을 치료하기 위해 대상체에게 투여된다.
치료될 수 있는 추가의 예시적인 암은 성상세포종, 비정형 기형 횡문근양 종양, 뇌 및 중추 신경계 (CNS) 암, 유방암, 암육종, 연골육종, 척삭종, 맥락총 암종, 맥락총 유두종, 투명 세포 연부 조직 육종, 미만성 대 B-세포 림프종, 상의세포종, 상피양 육종, 생식선외 배세포 종양, 신외 횡문근양 종양, 유잉 육종, 위장 기질 종양, 교모세포종, HBV-유발 간세포성 암종, 두경부암, 신장암, 폐암, 악성 횡문근양 종양, 수모세포종, 흑색종, 수막종, 중피종, 다발성 골수종, 신경교 종양, 달리 명시되지 않은 (NOS) 육종, 핍지교성상세포종, 핍지교종, 골육종, 난소암, 난소 투명 세포 선암종, 난소 자궁내막양 선암종, 난소 장액성 선암종, 췌장암, 췌장관 선암종, 췌장 내분비 종양, 송과체모세포종, 전립선암, 신세포 암종, 신장 수질 암종, 횡문근육종, 육종, 슈반세포종, 피부 편평 세포 암종, 및 줄기 세포 암을 포함한다. 다양한 특정한 실시양태에서, 암은 난소암이다. 다양한 특정한 실시양태에서, 암은 유방암이다.
(IX-d-i) 암 유형을 치료하기 위한 LCR, 프로모터, 코딩 서열, 및 벡터
본원에 기재된 아데노바이러스 공여자 벡터는 암의 치료에 유용하다. 이러한 아데노바이러스 공여자 벡터, 뿐만 아니라 아데노바이러스 공여자 게놈, 전위 시스템, 및 아데노바이러스 생산 시스템의 실시양태에서, 제공된 긴 LCR은 암 치료에 유용한 표적 세포로의 유전자(들)의 전달을 매개하는데 사용될 수 있다. 관련 기술분야의 통상의 기술자는 구체적 유형의 암을 치료하는데 유용할 적절한 프로모터, 코딩 서열, 및 벡터 구조를 인식할 것이다. 또한, 이러한 요소의 예는 본원에 기재되어 있다.
특정한 실시양태에서, 아데노바이러스 공여자 벡터는 암-특이적 또는 암-표적화된 치료 유전자를 발현하는 서열을 포함할 수 있다. 이러한 암-표적화된 치료 유전자의 예는 암 항원 (예를 들어, CD19, ROR1 등 - 본원에 기재된 것을 포함함)에 결합하는 항체 단편을 포함하며, 여기서 항체 단편의 서열은 TCR 서브유닛 또는 그의 부분을 코딩하는 핵산 서열과 인접하여 동일한 리딩 프레임 내에 존재한다. 이러한 TFP는 기능적 TCR 복합체를 형성하기 위해 1개 이상의 내인성 (또는 대안적으로, 1개 이상의 외인성, 또는 내인성 및 외인성의 조합) TCR 서브유닛과 회합할 수 있다.
특정한 실시양태에서, 치료 유전자는 항체 또는 항체의 결합 단편, 예컨대 Fab 또는 scFv를 코딩할 수 있다. 발현될 수 있는 예시적인 항체 (scFv 포함)는 WO2014164553A1, US20170283504, US7083785B2, US10189906B2, US10174095B2, WO2005102387A2, US20110206701A1, WO2014179759A1, US20180037651A1, US20180118822A1, WO2008047242A2, WO1996016990A1, WO2005103083A2, 및 WO1999062526A2에 기재된 것을 포함한다. 결합 도메인과 관련하여 본원에 기재된 항체, 뿐만 아니라 아테졸리주맙, 블리나투모맙, 브렌툭시맙, 세툭시맙, 시름투주맙, 파를레투주맙, 겜투주맙, OKT3, 오레고보맙, 프로믹시맙, 펨브롤리주맙, 및 트라스투주맙이 또한 사용될 수 있다.
면역 체크포인트 억제제가 또한 사용될 수 있다. 면역 체크포인트 억제제는 면역 억제 체크포인트 단백질의 기능을 억제하는 화합물을 지칭한다. 억제는 기능의 감소 및 완전한 차단을 포함한다. 바람직한 면역 체크포인트 억제제는 면역 체크포인트 단백질을 특이적으로 인식하는 항체이다. 특정한 실시양태에서, 면역 체크포인트 억제제는 대상체에서 CD8+ T 세포의 증식, 이동, 지속성 및/또는 세포독성 활성, 및 특히 대상체의 CD8+ T 세포의 종양-침윤을 증진시킨다. 따라서, 본 개시내용의 예시적인 면역 체크포인트 억제제는 αPD-L1γ1 항체 (대안적으로 αPD-L1γ1로 지칭됨)를 포함한다. αPD-L1γ1은 문헌 [Engeland et al., 2014 Mol Ther 22(11):1949-1959]에 추가로 기재되어 있다.
PD-1 및 PD-L1 항체의 예는 US 7,488,802; US 7,943,743; US 8,008,449; US 8,168,757; US 8,217,149, WO03042402, WO2008156712, WO2010089411, WO2010036959, WO2011066342, WO2011159877, WO2011082400, 및 WO2011161699에 기재되어 있다. 일부 실시양태에서, PD-1 차단제는 항-PD-L1 항체를 포함한다. 다른 실시양태에서, PD-1 차단제는 항-PD-1 항체 및 유사한 결합 단백질, 예컨대 니볼루맙 (MDX 1106, BMS 936558, ONO 4538), 그의 리간드 PD-L1 및 PD-L2에 결합하고 그에 의한 PD-1의 활성화를 차단하는 완전 인간 IgG4 항체; PD-1에 대한 인간화 모노클로날 IgG4 항체인 람브롤리주맙 (MK-3475 또는 SCH 900475); PD-1에 결합하는 인간화 항체인 CT-011; B7-DC의 융합 단백질인 AMP-224; 항체 Fc 부분; PD-L1 (B7-H1) 차단을 위한 BMS-936559 (MDX-1105-01)를 포함한다.
다른 면역-체크포인트 억제제는 림프구 활성화 유전자-3 (LAG-3) 억제제, 예컨대 가용성 Ig 융합 단백질인 IMP321을 포함한다 (Brignone et al., 2007, J. Immunol. 179:4202-4211). 다른 면역-체크포인트 억제제는 B7 억제제, 예컨대 B7-H3 및 B7-H4 억제제를 포함한다. 특히, 항-B7-H3 항체 MGA271 (Loo et al., 2012, Clin. Cancer Res. July 15 (18) 3834). 또한, TIM3 (T-세포 이뮤노글로불린 도메인 및 뮤신 도메인 3) 억제제가 포함된다 (Fourcade et al., 2010, J. Exp. Med. 207:2175-86 및 Sakuishi et al., 2010, J. Exp. Med. 207:2187-94). 본원에 사용된 용어 "TIM-3"은 관련 기술분야에서의 그의 일반적 의미를 갖고, T 세포 이뮤노글로불린 및 뮤신 도메인-함유 분자 3을 지칭한다. TIM-3의 천연 리간드는 갈렉틴 9 (Ga19)이다. 따라서, 본원에 사용된 용어 "TIM-3 억제제"는 TIM-3의 기능을 억제할 수 있는 화합물, 물질 또는 조성물을 지칭한다. 예를 들어, 억제제는 TIM-3의 발현 또는 활성을 억제하고/거나, TIM-3 신호전달 경로를 조정 또는 차단하고/거나, 갈렉틴-9에 대한 TIM-3의 결합을 차단할 수 있다. TIM-3에 대한 특이성을 갖는 항체는 관련 기술분야에 널리 공지되어 있고, 전형적으로 WO2011/155607, WO2013/006490 및 WO2010/117057에 기재된 것이다.
추가의 특정한 면역 체크포인트 억제제는 아테졸리주맙, BMS-936559, 이필리무맙, MEDI0680, MEDI4736, MSB0010718C, 펨브롤리주맙, 피딜리주맙, 및 트레멜리무맙을 포함한다. 또한, WO 1998/42752; WO 2000/37504; WO 2001/014424; WO 2004/035607; US 2005/0201994; US 2002/0039581; US 2002/086014; US 5,811,097; US 5,855,887; US 5,977,318; US 6,051,227; US 6,984,720; US 6,682,736; US 6,207,156; US 6,682,736; US 7,109,003; US 7,132,281; EP1212422B1; 문헌 [Hurwitz et al., Proc. Natl. Acad. Sci. USA, 95(17):10067-10071 (1998); Camacho et al., J. Clin. Oncology, 22(145): Abstract No. 2505 (2004) (항체 CP-675206); 및 Mokyr et al., Cancer Res, 58:5301-5304 (1998)]을 참조한다.
(IX-d-ii) 투여량 및 제제
암과 관련하여, 치료 유효량은 치료 후 종양 세포의 수를 감소시키고/거나, 전이의 수를 감소시키고/거나, 종양 부피를 감소시키고/거나, 기대 수명을 증가시키고/거나, 암 세포의 아폽토시스를 유도하고/거나, 암 세포 사멸을 유도하고/거나, 암 세포에서 화학- 또는 방사선감수성을 유도하고/거나, 암 세포 근처에서의 혈관신생을 억제하고/거나, 암 세포 증식을 억제하고/거나, 종양 성장을 억제하고/거나, 전이를 방지하고/거나, 대상체의 삶을 연장하고/거나, 암-연관 통증을 감소시키고/거나, 전이의 수를 감소시키고/거나, 암의 재발 또는 재발생을 감소시킬 수 있다.
특정한 실시양태에서, 제제는 고위험 배선 돌연변이의 보인자에서 암 재발을 예방 또는 지연시키거나 또는 암 발병을 예방 또는 지연시키기 위해 대상체에게 투여된다. 특정한 실시양태에서, 제제는 보다 높은 치료 용량의 테모졸로미드 (TMZ) 및 벤질구아닌 또는 BCNU를 제공하기 위해 대상체에게 투여된다. 강한 골수억제 오프-타겟 효과로 인해, 유효 용량의 TMZ 및 벤질구아닌을 종양에 전달하는 것은 도전과제로 남아있다. 환자는 현재 급성 골수성 백혈병 (AML), 식도암, 두경부암, 고등급 신경교종, 골수이형성 증후군, 비소세포 폐암, NSCLC; 불응성 AML, 소세포 폐암, 역형성 성상세포종, 뇌 종양, 유방암 (예를 들어, 전이성), 결장직장암 (예를 들어, 전이성), 미만성 내인성 뇌간 신경교종, 유잉 육종, 다형성 교모세포종 (GBM), 악성 신경교종, 흑색종, 전이성 악성 흑색종, 재발성 악성 흑색종, 비인두암, 전이성 유방암, 및 소아암과 연관된 치료를 위해 TMZ 및 벤질구아닌을 제공받을 수 있다.
MGMT-발현 종양을 갖는 환자는 MGMT P140k 생체내 선택 카세트와 조합된 활성 성분 (예컨대 CAR, TCR, 또는 항체)을 갖는 치료 대형-페이로드 아데노바이러스 벡터의 투여로부터 이익을 얻을 것이다. 생체외 접근법은 이러한 접근법의 적용가능성을 보여주었다. 특정한 실시양태에서, 치료량의 TMZ 및 벤질구아닌 또는 BCNU를 투여하여 종양 부담 또는 부피를 감소시킨다.
(IX-e) 점 돌연변이 상태 (예를 들어, 겸상 적혈구)의 치료
특정한 실시양태에서, 본원에 개시된 방법 및 제제는 점 돌연변이 상태를 치료하는데 사용될 수 있다. 특정한 실시양태에서, 제제는 겸상 적혈구 질환, 낭성 섬유증, 테이-삭스병, 및/또는 페닐케톤뇨를 치료하기 위해 대상체에게 투여된다. 다양한 실시양태에서, 본 개시내용의 트랜스포손 페이로드는 핵산 병변의 교정 편집을 위한 CRISPR-Cas를 코딩한다. 다양한 실시양태에서, 본 개시내용의 트랜스포손 페이로드는 핵산 병변의 교정 편집을 위한 염기 편집제를 코딩한다.
(IX-f) 특정한 효소 결핍의 치료
특정한 실시양태에서, 본원에 개시된 방법 및 제제는 특정한 효소 결핍을 치료하는데 사용될 수 있다. 특정한 실시양태에서, 제제는 후를러 증후군, 선택적 IgA 결핍, 과다 IgM, IgG 하위부류 결핍, 니만-픽병, 테이-삭스병, 고셔병, 파브리병, 크라베병, 글루코스혈증, 메이플 시럽뇨 질환, 페닐케톤뇨, 글리코겐 축적 질환, 프리드라이히 운동실조, 젤베거 증후군, 부신백질이영양증, 보체 장애, 및/또는 뮤코폴리사카라이드증을 치료하기 위해 대상체에게 투여된다.
특정한 실시양태에서, 본 개시내용의 방법은 면역화에 대한 1차 및 2차 항체 반응의 정규화를 필요로 하는 대상체에서 면역화에 대한 1차 및 2차 항체 반응을 정규화할 수 있다. 면역화에 대한 1차 및 2차 항체 반응을 정규화하는 것은 항원에 대한 부류 전환 및 기억 반응에서 기능하는 B-세포 및/또는 T-세포 시토카인 신호전달 프로그램을 회복시키는 것을 포함할 수 있다. 면역화에 대한 1차 및 2차 항체 반응을 정규화하는 것은 박테리오파지 면역화 검정에 의해 측정될 수 있다. 특정한 실시양태에서, B-세포 및/또는 T-세포 시토카인 신호전달 프로그램의 회복은 T-세포 의존성 신생항원 박테리오파지 ΨX174로의 면역화 후에 검정될 수 있다. 특정한 실시양태에서, 면역화에 대한 1차 및 2차 항체 반응을 정규화하는 것은 IgA, IgM, 및/또는 IgG의 수준의 증가를 필요로 하는 대상체에서 IgA, IgM, 및/또는 IgG의 수준을 대조군 집단으로부터 유래된 참조 수준과 대등한 수준으로 증가시키는 것을 포함할 수 있다. 특정한 실시양태에서, 면역화에 대한 1차 및 2차 항체 반응을 정규화하는 것은 IgA, IgM, 및/또는 IgG의 수준의 증가를 필요로 하는 대상체에서 IgA, IgM, 및/또는 IgG의 수준을 본원에 기재된 유전자 요법이 투여되지 않은, 이를 필요로 하는 대상체의 수준보다 더 큰 수준으로 증가시키는 것을 포함할 수 있다. IgA, IgM, 및/또는 IgG의 수준은 예를 들어 이뮤노글로불린 시험에 의해 측정될 수 있다. 특정한 실시양태에서, 이뮤노글로불린 시험은 IgG, IgA, IgM, 카파 경쇄, 람다 경쇄, 및/또는 중쇄에 결합하는 항체를 포함한다. 특정한 실시양태에서, 이뮤노글로불린 시험은 혈청 단백질 전기영동, 면역전기영동, 방사상 면역확산, 비탁측정법 및 탁도측정법을 포함한다. 상업적으로 입수가능한 이뮤노글로불린 시험 키트는 미니네프(MININEPH)™ (바인딩 사이트(Binding site), 영국 버밍햄), 및 다코(Dako) (덴마크) 및 데이드 베링(Dade Behring) (독일 마르부르크)으로부터의 이뮤노글로불린 시험 시스템을 포함한다. 특정한 실시양태에서, 이뮤노글로불린 수준을 측정하는데 사용될 수 있는 샘플은 혈액 샘플, 혈장 샘플, 뇌척수액 샘플, 및 소변 샘플을 포함한다.
특정한 실시양태에서, 본 개시내용의 방법은 SCID-X1을 치료하는데 사용될 수 있다. 특정한 실시양태에서, 본 개시내용의 방법은 SCID (예를 들어, JAK 3 키나제 결핍 SCID, 퓨린 뉴클레오시드 포스포릴라제 (PNP) 결핍 SCID, 아데노신 데아미나제 (ADA) 결핍 SCID, MHC 부류 II 결핍 또는 레콤비나제 활성화 유전자 (RAG) 결핍 SCID)를 치료하는데 사용될 수 있다. 특정한 실시양태에서, 치료 효능은 림프구 재구성, 개선된 클론 다양성 및 흉선세포증식, 감소된 감염, 및/또는 개선된 환자 결과를 통해 관찰될 수 있다. 치료 효능은 또한 체중 증가 및 성장, 개선된 위장 기능 (예를 들어, 감소된 설사), 감소된 상기도 증상, 구강의 감소된 진균 감염 (아구창), 폐렴의 감소된 발생률 및 중증도, 감소된 수막염 및 혈류 감염, 및 감소된 귀 감염 중 1종 이상을 통해 관찰될 수 있다. 특정한 실시양태에서, 본 개시내용의 방법으로 SCIDX-1을 치료하는 것은 γC-의존성 신호전달 경로에 기능성을 회복시키는 것을 포함한다. γC-의존성 신호전달 경로의 기능성은 각각 IL-21 및/또는 IL-2로의 시험관내 자극 후 이펙터 분자 STAT3 및/또는 STAT5의 티로신 인산화를 측정함으로써 검정될 수 있다. STAT3 및/또는 STAT5의 티로신 인산화는 세포내 항체 염색에 의해 측정될 수 있다.
(IX-i) 다른 용도
(IX-i-i) HIV (대표적인 감염원)
특정한 실시양태는 속발성 또는 후천성 면역 결핍, 예컨대 외상, 바이러스, 화학요법, 독소, 및 오염에 의해 유발된 면역 결핍의 치료를 포함한다. 이전에 나타낸 바와 같이, 후천성 면역결핍 증후군 (AIDS)은 바이러스, 인간 면역결핍 바이러스 (HIV)에 의해 유발된 2차 면역 결핍 장애의 예이며, 여기서 T 림프구의 고갈은 신체가 감염과 싸울 수 없게 만든다. 따라서, 또 다른 예로서, 유전자는 감염성 질환에 대한 치료상 유효한 반응을 제공하도록 선택될 수 있다. 특정한 실시양태에서, 감염성 질환은 인간 면역결핍 바이러스 (HIV)이다. 치료 유전자는, 예를 들어 면역 세포를 HIV 감염에 대해 저항성이 되게 하는 유전자일 수 있거나, 또는 면역 재구축, 면역 세포에 의해 발현되는 단백질을 코딩하는 유전자의 다형성, 환자에서 발현되지 않는 감염과 싸우기에 유리한 유전자, 감염원, 수용체 또는 보조수용체를 코딩하는 유전자; 수용체 또는 보조수용체에 대한 리간드를 코딩하는 유전자; 특정 전사 인자의 작용을 차단하기 위한 리보자임, 안티센스 RNA, 소형 간섭 RNA (siRNA) 또는 디코이 RNA를 코딩하는 유전자를 포함한, 바이러스 복제에 필수적인 바이러스 및 세포 유전자; 우성 음성 바이러스 단백질, 세포내 항체, 인트라카인 및 자살 유전자를 코딩하는 유전자를 통해 면역 세포가 바이러스를 효과적으로 중화시킬 수 있게 하는 것일 수 있다. 예시적인 치료 유전자 및 유전자 생성물은 α2β1; αvβ3; αvβ5; αvβ63; BOB/GPR15; Bonzo/STRL-33/TYMSTR; CCR2; CCR3; CCR5; CCR8; CD4; CD46; CD55; CXCR4; 아미노펩티다제-N; HHV-7; ICAM; ICAM-1; PRR2/HveB; HveA; α-디스트로글리칸; LDLR/α2MR/LRP; PVR; PRR1/HveC; 및 라미닌 수용체를 포함한다. HIV의 치료를 위한 치료 유효량은, 예를 들어 HIV에 대한 대상체의 면역을 증가시키거나, AIDS 또는 HIV와 연관된 증상을 호전시키거나, 또는 대상체에서 HIV에 대한 선천성 또는 적응성 면역 반응을 유도할 수 있다. HIV에 대한 면역 반응은 항체 생산을 포함할 수 있고, AIDS의 예방을 발생시킬 수 있고/거나 대상체의 AIDS 또는 HIV 감염의 증상을 호전시킬 수 있거나, 또는 HIV 감염성 및/또는 병독성을 감소 또는 제거할 수 있다.
하기 예시적인 실시양태 및 실시예(들)는 본 개시내용의 특정한 실시양태를 입증하기 위해 포함된다. 관련 기술분야의 통상의 기술자는 본 개시내용에 비추어 본 개시내용의 취지 및 범주로부터 벗어나지 않으면서 본원에 개시된 구체적 실시양태에 대해 많은 변화가 이루어질 수 있고, 여전히 비슷하거나 유사한 결과를 수득할 수 있다는 것을 인식하여야 한다.
(X) 예시적인 실시양태.
1. (a) 아데노바이러스 캡시드; 및 (b) (i) 적어도 10 kb의 트랜스포손 페이로드; (ii) 트랜스포손 페이로드에 플랭킹된 트랜스포손 역전된 반복부 (IR); 및 (iii) 트랜스포손 역전된 반복부에 플랭킹된 레콤비나제 직접 반복부 (DR)를 포함하는 선형, 이중-가닥 DNA 게놈을 포함하는 아데노바이러스 공여자 벡터.
2. (a) 적어도 10 kb의 트랜스포손 페이로드; (b) 트랜스포손 페이로드에 플랭킹된 트랜스포손 역전된 반복부 (IR); 및 (c) 트랜스포손 역전된 반복부에 플랭킹된 레콤비나제 직접 반복부 (DR)를 포함하는 아데노바이러스 공여자 게놈.
3. (a) 실시양태 1의 아데노바이러스 공여자 벡터; 및 (b) (i) 아데노바이러스 캡시드; 및 (ii) 트랜스포사제를 코딩하는 핵산 서열을 포함하는 아데노바이러스 지지 게놈을 포함하는 아데노바이러스 지지 벡터를 포함하는 아데노바이러스 전위 시스템.
4. (a) 실시양태 2의 아데노바이러스 공여자 게놈; 및 (b) 트랜스포사제를 코딩하는 핵산 서열을 포함하는 아데노바이러스 지지 게놈을 포함하는 아데노바이러스 전위 시스템.
5. (a) 실시양태 2의 아데노바이러스 공여자 게놈을 포함하는 핵산; 및 (b) 조건부 패키징 요소를 포함하는 아데노바이러스 헬퍼 게놈을 포함하는 핵산을 포함하는 아데노바이러스 생산 시스템.
6. 실시양태 1-5 중 어느 하나에 있어서, 트랜스포손 페이로드가 긴 LCR을 포함하고, 임의로 여기서 긴 LCR이 β-글로빈 LCR HS1 내지 HS5를 포함하는 β-글로빈 긴 LCR인 벡터, 게놈, 또는 시스템.
7. 실시양태 6에 있어서, 긴 LCR이 적어도 27 kb의 길이를 갖는 것인 벡터, 게놈, 또는 시스템.
8. 실시양태 1-6 중 어느 하나에 있어서, 트랜스포손 페이로드가 표 1에 제시된 LCR을 포함하는 것인 벡터, 게놈, 또는 시스템.
9. 실시양태 1-6 중 어느 하나에 있어서, 트랜스포손 페이로드가 적어도 15 kb, 적어도 16 kb, 적어도 17 kb, 적어도 18 kb, 적어도 19 kb, 적어도 20 kb, 적어도 21 kb, 적어도 22 kb, 적어도 23 kb, 적어도 24 kb, 적어도 25 kb, 적어도 30 kb, 적어도 35 kb, 적어도 38 kb, 또는 적어도 40 kb의 길이를 갖는 것인 벡터, 게놈, 또는 시스템.
10. 실시양태 1-6 중 어느 하나에 있어서, 트랜스포손 페이로드가 10 kb-35 kb, 10 kb-30 kb, 15 kb-35 kb, 15 kb-30 kb, 20 kb-35 kb, 또는 20 kb-30 kb의 길이를 갖는 것인 벡터, 게놈, 또는 시스템.
11. 실시양태 1-6 중 어느 하나에 있어서, 트랜스포손 페이로드가 10 kb-32.4 kb, 15 kb-32.4 kb, 또는 20 kb-32.4 kb의 길이를 갖는 것인 벡터, 게놈, 또는 시스템.
12. 실시양태 1-11 중 어느 하나에 있어서, 트랜스포손 페이로드가 단백질을 코딩하는 핵산 서열을 포함하고, 임의로 여기서 단백질이 치료 단백질인 벡터, 게놈, 또는 시스템.
13. 실시양태 12에 있어서, 단백질이 β 글로빈 대체 단백질 및 γ-글로빈 대체 단백질을 포함하는 군으로부터 선택된 것인 벡터, 게놈, 또는 시스템.
14. 실시양태 12에 있어서, 단백질이 인자 VIII 대체 단백질인 벡터, 게놈, 또는 시스템.
15. 실시양태 12 또는 13에 있어서, 단백질을 코딩하는 핵산 서열이 프로모터와 작동가능하게 연결되고, 임의로 여기서 프로모터가 β 글로빈 프로모터인 벡터, 게놈, 또는 시스템.
16. 실시양태 1-15 중 어느 하나에 있어서, 트랜스포손 역전된 반복부가 슬리핑 뷰티 (SB) 역전된 반복부이고, 임의로 여기서 SB 역전된 반복부가 pT4 역전된 반복부인 벡터, 게놈, 또는 시스템.
17. 실시양태 3-15 중 어느 하나에 있어서, 트랜스포사제가 슬리핑 뷰티 (SB) 트랜스포사제이고, 임의로 여기서 트랜스포사제가 슬리핑 뷰티 100x (SB100x)인 벡터, 게놈, 또는 시스템.
18. 실시양태 1-17 중 어느 하나에 있어서, 레콤비나제 직접 반복부가 FRT 부위인 벡터, 게놈, 또는 시스템.
19. 실시양태 3-18 중 어느 하나에 있어서, 아데노바이러스 지지 게놈이 레콤비나제를 코딩하는 핵산을 포함하는 것인 벡터, 게놈, 또는 시스템.
20. 실시양태 19에 있어서, 레콤비나제가 FLP 레콤비나제인 벡터, 게놈, 또는 시스템.
21. 실시양태 1-20 중 어느 하나에 있어서, 트랜스포손 페이로드가 β-글로빈 긴 LCR을 포함하고, 트랜스포손 페이로드가 β-글로빈 프로모터와 작동가능하게 연결된 β-글로빈을 코딩하는 핵산 서열을 포함하고, 역전된 반복부가 SB 역전된 반복부이고, 레콤비나제 직접 반복부가 FRT 부위인 벡터, 게놈, 또는 시스템.
22. 실시양태 1-21 중 어느 하나에 있어서, 트랜스포손 페이로드에 선택 카세트를 포함하고, 임의로 여기서 선택 카세트가 mgmtP140K를 코딩하는 핵산 서열을 포함하는 것인 벡터, 게놈, 또는 시스템.
23. 실시양태 1-22 중 어느 하나에 있어서, 아데노바이러스 캡시드가 CD46에 대한 증가된 친화도를 위해 변형되고, 임의로 여기서 아데노바이러스 캡시드가 Ad35++ 캡시드인 벡터, 게놈, 또는 시스템.
24. 실시양태 5-23 중 어느 하나에 있어서, 아데노바이러스 헬퍼 게놈 조건부 패키징 요소가 레콤비나제 직접 반복부에 플랭킹된 패키징 서열을 포함하는 것인 아데노바이러스 생산 시스템.
25. 실시양태 24에 있어서, 조건부 패키징 요소의 패키징 서열에 플랭킹된 레콤비나제 직접 반복부가 LoxP 부위인 아데노바이러스 생산 시스템.
26. 실시양태 1-25 중 어느 하나에 따른 벡터, 게놈, 또는 시스템을 포함하는 세포.
27. 실시양태 1-25 중 어느 하나의 트랜스포손 페이로드를 그의 게놈에 포함하는 세포로서, 여기서 세포의 게놈에 존재하는 트랜스포손 페이로드는 트랜스포손 역전된 반복부에 플랭킹된 것인 세포.
28. 실시양태 26 또는 27에 있어서, 조혈 줄기 세포인 세포.
29. 실시양태 5-25 중 어느 하나에 따른 아데노바이러스 생산 시스템을 포함하는 아데노바이러스-생산 세포로서, 임의로 HEK293 세포인 아데노바이러스-생산 세포.
30. 세포를 변형시키는 방법으로서, 세포를 실시양태 1-25 중 어느 하나에 따른 벡터, 게놈, 또는 시스템과 접촉시키는 것을 포함하는 방법.
31. 대상체의 세포를 변형시키는 방법으로서, 대상체에게 실시양태 1-25 중 어느 하나에 따른 벡터, 게놈, 또는 시스템을 투여하는 것을 포함하는 방법.
32. 대상체로부터의 세포의 단리 없이 대상체의 세포를 변형시키는 방법으로서, 대상체에게 실시양태 1-25 중 어느 하나에 따른 벡터, 게놈, 또는 시스템을 투여하는 것을 포함하는 방법.
33. 질환 또는 상태의 치료를 필요로 하는 대상체에서 질환 또는 상태를 치료하는 방법으로서, 대상체에게 실시양태 1-25 중 어느 하나에 따른 벡터, 게놈, 또는 시스템을 투여하는 것을 포함하는 방법.
34. 실시양태 31-33 중 어느 하나에 있어서, 아데노바이러스 공여자 벡터가 대상체에게 정맥내로 투여되는 것인 방법.
35. 실시양태 31-34 중 어느 하나에 있어서, 대상체에게 가동화 작용제를 투여하는 것을 포함하며, 임의로 여기서 가동화 작용제는 과립구-콜로니 자극 인자 (G-CSF), CXCR4 길항제, 및 CXCR2 효능제 중 1종 이상을 포함하는 것인 방법.
36. 실시양태 35에 있어서, CXCR4 길항제가 AMD3100인 방법.
37. 실시양태 35 또는 36에 있어서, CXCR2 효능제가 GRO-β인 방법.
38. 실시양태 31-37 중 어느 하나에 있어서, 트랜스포손 페이로드가 선택 카세트를 포함하며, 대상체에게 선택제를 투여하는 것을 포함하는 방법.
39. 실시양태 38에 있어서, 선택 카세트가 mgmtP140K를 코딩하고, 선택제가 O6BG/BCNU인 방법.
40. 실시양태 31-39 중 어느 하나에 있어서, CD46을 발현하는 세포의 적어도 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 또는 95%에서 트랜스포손 페이로드의 적어도 1개의 카피의 통합 및/또는 발현을 유발하는 방법.
41. 실시양태 31-39 중 어느 하나에 있어서, 조혈 줄기 세포 및/또는 적혈구 Ter119+ 세포의 적어도 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 또는 95%에서 트랜스포손 페이로드의 적어도 1개의 카피의 통합 및/또는 발현을 유발하는 방법.
42. 실시양태 31-41 중 어느 하나에 있어서, 트랜스포손 페이로드의 적어도 1개의 카피를 포함하는 세포의 게놈에서 트랜스포손 페이로드의 평균 적어도 2개의 카피의 통합을 유발하는 방법.
43. 실시양태 31-42 중 어느 하나에 있어서, 트랜스포손 페이로드의 적어도 1개의 카피를 포함하는 세포의 게놈에서 트랜스포손 페이로드의 평균 적어도 2.5개의 카피의 통합을 유발하는 방법.
44. 실시양태 31-43 중 어느 하나에 있어서, 트랜스포손 페이로드에 의해 코딩된 단백질의 발현을 참조 수준의 적어도 약 20%인 수준으로 유발하고, 임의로 여기서 참조가 대상체 또는 참조 집단에서의 내인성 참조 단백질의 발현인 방법.
45. 실시양태 31-43 중 어느 하나에 있어서, 트랜스포손 페이로드에 의해 코딩된 단백질의 발현을 참조 수준의 적어도 약 25%인 수준으로 유발하고, 임의로 여기서 참조가 대상체 또는 참조 집단에서의 내인성 참조 단백질의 발현인 방법.
46. 실시양태 31-45 중 어느 하나에 있어서, 대상체가 중간성 지중해빈혈을 앓고 있는 대상체이며, 여기서 트랜스포사제 페이로드는 β-글로빈 LCR HS1 내지 HS5를 포함하는 β-글로빈 긴 LCR 및 β 글로빈 프로모터와 작동가능하게 연결된 β 글로빈 대체 단백질 및/또는 γ-글로빈 대체 단백질을 코딩하는 핵산 서열을 포함하는 것인 방법.
47. 실시양태 31-45 중 어느 하나에 있어서, 대상체가 혈우병을 앓고 있는 대상체이며, 여기서 트랜스포사제 페이로드는 β-글로빈 LCR HS1 내지 HS5를 포함하는 β-글로빈 긴 LCR 및 β 글로빈 프로모터와 작동가능하게 연결된 인자 VIII 대체 단백질을 코딩하는 핵산 서열을 포함하는 것인 방법.
48. 실시양태 47에 있어서, 대상체에서의 단백질의 발현이 중간성 지중해빈혈의 적어도 1종의 증상을 감소시키고/거나 중간성 지중해빈혈을 치료하는 것인 방법.
(XI) 실험 실시예(들)
실시예 1. 대형 페이로드 아데노바이러스 벡터 유전자 요법.
서론. 혈색소병증, 예컨대 중증성 지중해빈혈 및 겸상 적혈구 빈혈의 유전자 요법이 성공적이기 위해, 전달된 유전자는 바람직하게는 통합 및 전사 침묵의 위치 효과 없이 적혈구 세포에서 높은 수준으로 발현된다. β-글로빈 유전자좌 제어 영역 (LCR)은 이러한 사용에 유익한 것으로 생각된다. 유전자 요법 적용의 경우, HS1 내지 HS5를 함유하는 β-글로빈 LCR은 트랜스제닉 마우스에서 시스-연결된 유전자에 대해 높은 수준의 발현을 부여하는 것으로 밝혀졌다 (Grosveld et al., Cell 51:975-985, 1987). 그러나, 이러한 버전의 LCR은 렌티바이러스 벡터 (삽입 용량 8 kb)에 사용하기에는 너무 크고, 따라서 말단절단된 "미니" 또는 "마이크로" LCR 버전이 개발되었다. 예를 들어, 지중해빈혈 환자에서의 진행 중인 임상 시험에서, 2.7 kb 미니-LCR (HS2-HS4를 커버함) 및 266 bp β-글로빈 프로모터를 함유하는 렌티바이러스가 사용되고 있다 (Negre et al., Curr Gene Ther 15: 64-81, 2015). 이전에는 CD46 트랜스제닉 마우스 또는 CD46/Hbbth3 지중해빈혈 마우스에서의 γ-글로빈의 발현을 위해 HS1 내지 HS4 및 β-글로빈 프로모터를 함유하는 5.9 kb β-글로빈 LCR 버전이 사용되었다 (Wang et al., J Clin Invest 129:598-615, 2019). 생체내 HSPC 형질도입/선택 접근법에 의하면, γ-글로빈 마킹은 말초 혈액 적혈구의 거의 100%에서 달성된 반면, γ-글로빈 발현의 수준은 성체 마우스 α-글로빈의 것의 10-15%였고, 평균 통합된 벡터 카피수 (VCN)는 세포당 2-3 카피였다.
β0/β0 지중해빈혈 또는 겸상 적혈구 빈혈의 완전한 치유를 위해, 일반적으로 적혈구에서 20%의 치료 글로빈 (γ- 또는 β-글로빈) 발현 수준이 요구되는 것으로 생각된다 (Fitzhugh et al., Blood 130:1946-1948, 2017). 이러한 수준에 도달하는 하나의 방법은 HSPC 형질도입을 개선시킴으로써 또는 벡터 용량을 증가시킴으로써 VCN을 증가시키는 것이다. 그러나, 이러한 접근법은 과거 다른 문맥에서, 적어도 부분적으로 이용된 벡터 시스템의 무작위 통합 패턴으로 인해 독성의 위험을 증가시키는 것으로 관찰되었다. 본 실시예에서는, CD46-트랜스제닉 마우스의 생체내 HSPC 형질도입 후에 RBC당 γ-글로빈 발현을 증가시키기 위해 보다 강한 전사 요소, 즉 보다 긴 LCR 버전을 이용하였다.
본 발명자들은 백혈구분리반출술, 골수절제, 및 HSPC 이식을 필요로 하지 않는 신규 생체내 HSPC 형질도입 접근법을 개발하였다 (Richter et al., Blood, 128: 2206-2217, 2016). 접근법은 생체내 HSPC 형질도입에 적합한 새로운 벡터 플랫폼, 즉 헬퍼-의존성, 캡시드-변형된 아데노바이러스 벡터 (HDAd5/35++)를 수반한다. 이들 벡터의 특색은 i.v. 주사 후 비-조혈 조직의 감염은 피하면서 원시 HSC의 효율적인 형질도입을 가능하게 하는 CD46-친화도 증진된 섬유 및 최대 30 b의 삽입 용량을 포함한다. 제한된 접근성으로 인해, 골수에 국재화된 HSPC는 심지어 벡터가 골수 세포 상에 존재하는 수용체를 표적화하는 경우에도, HDAd5/35++ 벡터를 포함한 정맥내로 주사된 벡터에 의해 형질도입될 수 없다 (Ni et al., Hum Gene Ther, 16: 664-677, 2005 및 Ni et al., Cancer Gene Ther, 13: 1072-1081, 2006). 과립구-콜로니-자극 인자 (G-CSF) 및 CXCR4 길항제 AMD3100 (모조빌(Mozobil)™, 플레릭사(Plerixa)™)의 조합은 동물 모델 및 인간에서 원시 전구 세포를 효율적으로 가동화하는 것으로 제시되었다 (Fruehauf et al., Cytotherapy, 11: 992-1001, 2009 및 Yannaki et al., Hum Gene Ther, 24: 852-860, 2013). G-CSF/AMD3100을 사용하여 골수로부터의 HSPC를 말초 혈류 내로 가동화한 후, HDAd5/35++ 벡터를 정맥내 주사하였다. 이는 이전에 인간 CD46 트랜스제닉 마우스 (Richter et al., Blood, 128: 2206-2217, 2016; Li et al., Mol Ther Methods Clin Dev, 9: 390-401, 2018; Li et al., Blood, 131: 2915-2928. 2018; Wang et al., J Clin Invest, 129: 598-615. 2019; Wang et al., Blood Adv, 3: 2883-2894, 2019; 및 Wang et al., Mol Ther Methods Clin Dev, 8: 52-64, 2018), 인간화 마우스 (Richter et al., Blood, 128: 2206-2217, 2016) 및 레서스 마카크 (Harworth et al., ASCGT 21th Annual meeting, 2018, DOI: 10.1016/j.ymthe.2018.05.001)에서 제시되었다. 말초에서 형질도입된 HSPC는 다시 골수로 귀소하고, 여기서 이들은 장기간 지속된다. 증식 이점 없이, 생체내 형질도입된 HSPC는 골수에서 효율적으로 배출되지 않고 하류 분화에 기여하지 않는다. O6BG/BCNU로의 동물의 단기 처리는 mgmtP140K 유전자-변형된 HSPC에 대한 증식 자극 및 말초 혈액 세포의 >80%에서의 후속적인 안정한 트랜스진 발현을 제공한다 (Wang et al., Mol Ther Methods Clin Dev, 8: 52-64, 2018).
HD-Ad5/35++ 게놈은 숙주 세포 게놈 내로 통합되지 않고, 세포 분열 시 상실된다. 유전자 요법 목적을 위해 및 생체내 형질도입된 HSPC를 장기간 추적하기 위해, HD-Ad5/35++ 벡터를 트랜스진 통합이 가능하도록 변형시켰다. 이는 과다활성 슬리핑 뷰티 트랜스포사제 시스템 (SB100)을 혼입시키는 것에 의해 수행되었다 (Zhang et al., PLoS One, 8: e75344, 2013; Hausl et al., Mol Ther, 18: 1896-1906, 2010; 및 Yant et al., Nat Biotechnol, 20: 999-1005, 2002). 제2 벡터로부터 트랜스로 공동-발현된 트랜스포사제는 트랜스진 카세트에 플랭킹된 특이적 DNA 서열 (역전된 반복부, "IR")을 인식하고, 염색체 DNA의 TA 디뉴클레오티드 내로의 통합을 촉발한다. 레트로바이러스 통합과 달리, SB100x-매개된 통합은 표적화된 유전자의 전사 상태에 의존하지 않는다 (Yant et al., Mol Cell Biol, 25: 2085-2094, 2005). 여러 연구는 SB100x-매개된 트랜스진 통합이 무작위이며, 원종양유전자의 활성화와 연관되지 않는다는 것을 입증하였다 (Richter et al., Blood, 128: 2206-2217, 2016; Wang et al., Mol Ther Methods Clin Dev, 8: 52-64, 2018; Zhang et al., PLoS One, 8: e75344, 2013; Hausl et al., Mol Ther, 18: 1896-1906, 2010; 및 Yant et al., Nat Biotechnol, 20: 999-1005, 2002). SB100x-기반 통합 시스템의 이점은 세포의 효율적인 상동 DNA 복구 기구에 의존하지 않는다는 것이다. 후자는 DNA 복구 및 재조합 효소의 낮은 활성을 나타내는 HSPC에서 중요하다 (Beerman et al., Cell Stem Cell, 15: 37-50, 2014). CD46-트랜스제닉 마우스 (Richter et al., Blood, 128: 2206-2217, 2016; Wang et al., J Clin Invest, 129: 598-615. 2019; Li et al., Mol Ther, 27: 2195-2212, 2019; Li et al., Mol Ther Methods Clin Dev, 9: 142-152, 2018; 및 Wang et al., J Virol, 79: 10999-11013, 2005) 및 인간 CD34+ 세포 (Li et al., Mol Ther, 27: 2195-2212, 2019)에서 HDAd35++-트랜스포손 벡터 및 SB100x/Flpe 발현 벡터로의 생체내 HSC 공동-감염은 유전자에 대한 선호도 없이 2개의 트랜스진 카피/세포의 무작위 트랜스진 통합을 발생시키는 것으로 입증되었다.
인간 게놈은 통상적으로 루프 형성을 통해 조절 영역 (즉, 전사 인자 결합 부위) 사이에서 장거리 상호작용을 갖는 3-D 구조로 조직화된다. 이들 상호작용의 대부분은 위상학적 회합 도메인 (TAD)의 콘텍스트에서 발생한다. TAD는 인핸서가 다른 조절 영역과 상호작용하여 전사를 제어하는 염색체 조직화의 기능적 단위로 간주된다. TAD/LCR 경계 인슐레이터는 인핸서 및 프로모터의 검색 공간을 제한하고 원치 않는 조절 접촉이 형성되는 것을 방지하는 것으로 생각된다. 이들 도메인의 양측의 경계는 상이한 포유동물 세포 유형 사이에서, 심지어 종에 걸쳐 보존된다.
현재 사용되는 렌티바이러스 및 rAAV 유전자 전달 벡터는 오직 소형 인핸서/프로모터만을 수용할 수 있으며, 이는 종종 트랜스진 발현의 준최적 수준 및 조직 특이성, 트랜스진 침묵, 및 벡터 통합 부위 주위의 조절 영역과의 비의도적 상호작용을 발생시킨다. 최악의 경우에, 후자는 원종양유전자의 활성화로 이어질 수 있다.
유전자 요법의 안전성 및 효능을 증가시키기 위해, TAD는 유전자 부가 전략에 사용되어야 한다. TAD의 중앙 크기는 880 kb이다. 고처리량 염색체 입체형태 포획 (3C) 검정 및 그의 후속 4C, 5C 및 Hi-C 프로토콜뿐만 아니라 섬유-Seq 검정의 추가의 진전으로, 조절 게놈의 조사는 빠른 속도로 진행될 것이고, 유전자 요법 목적을 위해, 단지 중요한 코어 요소만을 함유하는 TAD를 전달할 수 있다.
b-글로빈 유전자좌 제어 영역 (LCR)은 TAD의 정의에 속한다. 인간 β-글로빈 유전자 클러스터는 염색체 11에 있고, 100 kb에 걸쳐있다. β-글로빈 유전자좌는 시스-조절 요소 및 활성 염색질 허브 (ACH)로 불리는 활성 β-글로빈 유전자로 구성된 적혈구-특이적 공간 구조를 형성하는 것으로 제안되었다 (Tolhuis et al., Mol Cell, 10: 1453-1465, 2002). 코어 ACH는 발생상 보존되고, 글로빈 LCR로 불리는 상류 5' DNAse 과민성 영역 1 내지 5, 및 하류 3'HS1뿐만 아니라 적혈구-특이적 트랜스액팅 인자를 포함한다 (Kim et al., Mol Cell Biol, 27: 4551-65, 2007). 혈색소병증, 예컨대 중증성 지중해빈혈 및 겸상 적혈구 빈혈의 유전자 요법이 성공적이기 위해, 전달된 유전자는 통합 및 전사 침묵의 위치 효과 없이 적혈구 세포에서 높은 수준으로 발현되는 것이 필수적이다. 이를 달성하기 위해, β-글로빈 유전자좌 제어 영역 (LCR)이 필요한 것으로 생각된다 (Ellis et al., Clin Genet, 59: 17-24, 2001). 유전자 요법 적용의 경우, HS1 내지 HS5를 함유하는 23 kb β-글로빈 LCR이 트랜스제닉 마우스에서 시스-연결된 유전자에 대해 높은 수준의 적혈구-특이적 위치 비의존성 발현을 부여한다는 것은 주목할 만하다 (Grosveld et al., Cell, 51: 975-985, 1987). 그러나, 이러한 버전의 LCR은 렌티바이러스 벡터 (삽입 용량 8 kb)에 사용하기에는 너무 크고, 따라서 말단절단된 "미니" 또는 "마이크로" LCR 버전이 개발되었다. 예를 들어, 지중해빈혈 환자에서의 진행 중인 임상 시험에서, 2.7 kb 미니-LCR (HS2-HS4를 커버함) 및 266 bp β-글로빈 프로모터를 함유하는 렌티바이러스가 사용되고 있다 (Negre et al., Curr Gene Ther, 15: 64-81, 2015). 이전의 생체내 HSPC 형질도입 연구에서, CD46 트랜스제닉 마우스 또는 CD46/Hbbth3 지중해빈혈 마우스에서의 γ-글로빈의 발현을 위해 HS1 내지 HS4 및 β-글로빈 프로모터를 함유하는 5.9kb β-글로빈 LCR 버전이 사용되었다 (Wang et al., J Clin Invest 129:598-615, 2019). 이러한 생체내 HSPC 형질도입/선택 접근법에 의하면, γ-글로빈 마킹은 말초 혈액 적혈구의 거의 100%에서 달성되었지만, γ-글로빈 발현의 수준은 성체 마우스 α-글로빈의 것의 오직 10-15%였고, 평균 통합된 벡터 카피수 (VCN)는 세포당 2-3 카피였다. β0/β0 지중해빈혈 또는 겸상 적혈구 빈혈의 치유를 위해, 일반적으로 적혈구에서 20%의 수준 치료 글로빈 (γ- 또는 β-글로빈)이 요구되는 것으로 생각된다 (Fitzhugh et al., Blood, 130: 1946-1948, 2017). 이러한 관문에 도달하는 하나의 방법은 HSPC 형질도입을 개선시킴으로써 또는 벡터 용량을 증가시킴으로써 VCN을 증가시키는 것이지만, 이는 이러한 벡터 시스템의 무작위 통합 패턴을 고려하면 증가된 유전자독성의 위험을 보유한다. 따라서, CD46-트랜스제닉 야생형 및 지중해빈혈 마우스의 생체내 HSPC 형질도입 후에 RBC당 γ-글로빈 발현을 증가시키기 위해 29 kb LCR 버전을 이용하는 것에 초점이 맞추어졌다.
결과. 정맥내로 주사된 HDAd5/35++ 벡터를 사용한 생체내 형질도입 연구를 위한 모델로서, 완전 인간 CD46 유전자좌를 함유하고 따라서 인간과 유사한 패턴 및 수준으로 hCD46을 발현하는 트랜스제닉 마우스 (hCD46tg 마우스)를 사용하였다 (Kemper et al., (2001) Clin Exp Immunol 124: 180-189).
긴 β-글로빈 LCR을 함유하는 HDAd5/35++ 벡터. 문헌 [Wang et al., (J. Clin Invest. 129(2):598-615, 2019)]에 기재된 연구에서는, 1.6 kb β-글로빈 프로모터 (Wang et al., J Clin Invest 129:598-615, 2019; Li et al., Mol Ther Methods Clin Dev 9: 142-152, 2018)에 연결된 4.3 kb 미니 LCR (HS1 내지 HS4의 코어 요소를 포괄함; 문헌 [Lisowski et al., Blood 110:4175-4178, 2007])의 제어 하에 γ-글로빈을 발현하는 HDAd5/35++ 벡터를 사용하였다. 본 실시예에서는, γ-글로빈 유전자 발현을 최대화하기 위한 하기 요소를 함유하는 HDAd5/35++ 벡터를 구축하였다: i) 전장 HS5 내지 HS1 영역을 포함하는 21.5 kb LCR, ii) 1.6 kb β-글로빈 프로모터, iii) γ-글로빈 mRNA를 안정화시키기 위한 β-글로빈 3'UTR, 및 iv) 3' HS1 영역. 벡터를 HDAd-긴-LCR로 명명하였다 (도 1a). 통합을 매개하기 위해, LCR-벡터를 SB100x/Flpe 발현 HDAd 벡터와 조합하여 사용하였다 (도 1a).
다양한 실시양태에서, 3' HS1은 chr11 위치 5206867-5203839의 하기 핵산 서열을 갖는다. 다양한 실시양태에서, 3' HS1은 서열식별번호: 102에 제시된 바와 같은 하기 핵산 서열, 또는 서열식별번호: 102에 대해 적어도 80% 서열 동일성을 갖는 서열, 예를 들어 서열식별번호: 102에 대해 적어도 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 동일성을 갖는 서열을 갖는다.
생체외 HSPC 형질도입/이식 연구. HDAd-긴-LCR은 32.4 kb 트랜스포손을 함유하였다. SB 시스템은 대형 화물을 전달할 수 있는 것으로 밝혀졌지만 (Rostovskaya et al., Nucleic Acids Res 40: e150, 2012), 32.4 kb 트랜스포손의 염색체 통합을 매개할 수 있는지 여부는 공지되지 않았다. 따라서, 생체외 HSPC 형질도입을 형질도입 효능이 제어될 수 있는 설정에서 수행하였다. HSPC가 풍부화된 세포 분획인 CD46tg 마우스 골수 계통-음성 (Lin-) 세포를 HDAd-긴-LCR + HDAd-SB (도 1a, 1b)로 생체외 형질도입하였다. 이어서, 생체외 형질도입된 세포를 치사 방사선조사된 C57Bl/6 마우스에 이식하였다. 제4주의 생착률은 CD46-양성 PBMC에 기초하여 >95%였다. 벡터 내 mgtmP140K 돌연변이체 유전자의 존재는 형질도입된 세포의 O6BG/BCNU를 사용한 생체내 선택을 가능하게 한다 (Wang et al., Mol Ther Methods Clin Dev 8: 52-64, 2018). 이식 1개월 후에, 마우스를 4 라운드의 O6BG/BCNU 처리에 적용하여 통합된 γ-글로빈/mgmt 트랜스진 (도 1a)을 갖는 전구세포를 선택적으로 확장시켰다. 각각의 라운드의 생체내 선택에 의해, γ-글로빈-양성 말초 적혈구 (RBC)의 백분율이 증가하여, 연구 종료 시인 제20주에 >95%에 도달하였다 (도 1c). 제20주에, 동물을 희생시키고, 골수 단핵 세포 (MNC)를 분석하였다. qPCR에 의해 측정된 평균 VCN은 세포당 2.8 카피였다. γ-글로빈 발현은 유동 세포측정법에 의해 적혈구 Ter119+ 세포의 85.46(+/-5.9)% 및 14.54(+/-2.3)% 비-적혈구 (Ter119-) 골수 MNC에서 검출되었다 (도 1d).
γ-글로빈 발현이 SB100x 통합된 트랜스진으로부터 기원하였음을 입증하기 위해, 이식 후 제20주에 수거한 골수 단핵 세포 (MNC)로부터의 게놈 DNA에 대해 역 PCR (iPCR) 분석을 수행하였다. iPCR 프로토콜은 SacI로의 게놈 DNA의 소화, 재-라이게이션/원형화 단계, 네스티드 PCR 및 벡터/염색체 접합부의 서열분석을 수반한다 (도 2a). (도 2b)는 3가지의 대표적인 PCR 생성물 및 염색체 4, 15, 및 X 상에서의 통합 부위의 국재화를 보여준다. 생성물의 서열분석은 벡터 IR/DR-염색체 접합부에서 TA 디-뉴클레오티드를 포함하는 SB100x 매개된 통합에 전형적인 벡터/염색체 접합부를 입증하였다 (도 2c). 요약하면, 생체외 HSPC 형질도입 연구에서, 긴 글로빈 LCR은 SB100x 통합된 트랜스포손으로부터 기원하는 높은-수준의 γ-글로빈 발현을 부여하였다.
짧은 LCR vs 긴 LCR을 함유하는 HDAd5/35++ 벡터를 사용한 CD46b 트랜스제닉 마우스에서의 생체내 HSPC 형질도입. HDAd-긴-LCR 및 미니LCR을 함유하는 이전에 사용된 벡터 (Wang et al., J Clin Invest 129: 598-615, 2019; Li et al., Mol Ther Methods Clin Dev 9: 142-152, 2018) (본원에서 "HDAd-짧은-LCR"로 지칭됨)의 병렬 비교를 수행하였다 (도 3a). CD46-트랜스제닉 마우스를 G-CSF/AMD3100으로 가동화하고, 벡터를 정맥내로 주사하였다. 4 라운드의 O6BG/BCNU 선택을 생체내 형질도입 후 제5주에 개시하였고, 마우스를 20주 동안 추적하였다 (도 3b). 이어서, 제20주 골수 Lin- 세포를 치사 방사선조사된 C57Bl/6 마우스 내로 이식하고, 2차 수용자를 추가로 16주 동안 모니터링하였다. 생체외 HSPC 형질도입 연구에서와 같이, γ-글로빈-양성 RBC의 백분율은 각각의 생체내 선택 라운드에 의해 증가하여 제20주에 둘 다의 벡터에 대해 >95%에 도달하였다 (도 3c). 제20주 샘플로부터의 RBC 용해물에 대해 수행된 HPLC는 HDAd-긴-LCR 벡터에 대해 유의하게 더 높은 γ-글로빈/성체 마우스 α-글로빈 백분율을 보여주었다 (도 3d). 이러한 차이는 또한 mRNA 수준에서도 반영되었다 (도 3e).
qPCR에 의해 제20주에 측정된 골수 MNC에서의 벡터 카피수는 세포당 2.5-3 카피였고 (도 4), 벡터들 사이에서 유의하게 상이하지 않았다. 이는 "짧은" 11.8 kb 트랜스포손의 통합이 "긴" 32.4 kb 트랜스포손의 통합만큼 효율적임을 나타내었다. 벡터로의 생체내 HSPC 형질도입은 대다수의 적혈구 세포에서의 γ-글로빈 발현에도 불구하고 혈액학적 이상을 유발하지 않았다 (제20주) (도 5a-5b). 세포 골수의 조성 (도 5c) 및 골수 Lin- 세포의 콜로니 형성-잠재력 (도 5d)은 군 사이에서 유의하지 않았다.
제20주에 수거한 골수 Lin- 세포를 또한 사용하여, 선형 증폭-매개된 PCR (LAM-PCR)을 사용한 게놈-전반 통합 분석에 이어 통합 접합부의 서열분석을 수행하였다 (도 6). 5마리의 마우스로부터 풀링된 게놈 DNA 샘플에서, 총 76개의 별개의 SB100x-매개된 통합 부위가 확인되었다 (도 7aa, 도 7ab). IR/DR/염색체 접합부는 TA 디뉴클레오티드를 함유하였다 (도 7b). 대다수의 통합은 유전자간 및 인트론 영역 내에 각각 82% 및 19%의 빈도로 존재하였다 (도 7c). 원종양유전자 내 또는 근처에서의 통합은 발견되지 않았다. 통합은 전체 마우스 게놈의 임의의 주어진 윈도우에서 우선적 통합 없이 무작위적이었다 (도 7d).
2차 수용자의 분석. 생체내 형질도입 및 SB100x-매개된 통합이 장기간 재증식 HSPC에서 발생하였음을 입증하기 위해, 생체내 HSPC 형질도입 후 제20주에 수거한 골수 Lin- 세포를 치사 방사선조사된 C57Bl/6 마우스 (hCD46 트랜스진 부재) 내로 이식하였다. 2차 수용자에서 다계통 재구성을 구동하는 이식된 세포의 능력을 16주의 기간에 걸쳐 평가하였다. PBMC에서의 hCD46 발현에 기초한 생착률은 95%였고, 안정하게 유지되었다 (도 8a). 유동 세포측정법에 의해 측정된 RBC의 γ-글로빈 마킹은 90 내지 95%의 범위이고 안정하였다 (도 8b). γ-글로빈+ RBC의 백분율에서 2개의 벡터 사이에 유의한 차이가 존재하지 않았다. 평균 통합된 벡터 카피수는 또한 2개의 벡터 사이에서 유의하게 상이하지 않았다. γ-글로빈 발현 수준을 측정하기 위해, HPLC (도 8c) 및 qRT-PCR (도 8d, 8e)을 사용하였다. 둘 다의 분석에서, 마우스 성체 글로빈 쇄 대비 γ-글로빈의 백분율은 HDAd-긴-LCR 벡터에 대해 더 컸다. 이러한 벡터에 대한 γ-글로빈 수준은 마우스 α-글로빈의 20-25% 범위였고, 이는 이것이 혈색소병증에 대해 치유적일 것임을 암시한다. 보다 높은 γ-글로빈 발현 수준을 부여하는 것에 더하여, 긴 LCR은 또한 적혈구 (Ter119+) 분획 vs 비-적혈구 분획 (Ter119-)에서의 γ-글로빈 발현 골수 세포의 유의하게 더 높은 백분율에 의해 제시된 바와 같이, 보다 엄격한 적혈구-특이적 발현을 제공하였다 (도 9a, 9b). 골수 MNC에서의 세포당 벡터 수 카피는 생체내 HSPC 형질도입 후 제16주에 수거한 경우 HDAd-짧은-LCR과 HADad-긴-LCR 사이에서 통계적으로 유의하지 않았다 (도 9c). "1차" 생체내 HSPC 형질도입된 마우스에서와 같이, 골수의 세포 조성 또는 말초 혈액에서의 혈액학적 파라미터에 대한 높은 수준 글로빈 발현의 효과는 2차 수용자에서 관찰되지 않았다 (도 10a-10d).
인간 CD34+ 형질도입, 시험관내 선택, 및 적혈구 분화 후 2개의 벡터의 비교. 마우스 적혈구 세포와 같은 이종 시스템에서의 인간 β-글로빈 LCR의 기능은 LCR 내에 결합하는 전사 인자의 보존의 결여로 인해 준최적일 수 있다. 따라서, 인간 세포에서의 시험관내 연구를 수행하였다 (도 11a). GCSF-가동화된 건강한 공여자로부터 수득한 인간 CD34+ 세포를 HDAd-긴-LCR + HDAd-SB 또는 HDAd-짧은-LCR + HDAd-SB로 4000 vp/세포의 총 MOI, 즉 대부분의 CD34+ 세포의 형질도입을 부여하는 MOI로 형질도입하였다 (Li et al., Mol Ther Methods Clin Dev 9: 390-401, 2018). 이어서, 형질도입된 세포를 통합된 트랜스진을 갖는 세포에 대한 적혈구 분화 (ED) 및 O6BG/BCNU 선택에 적용하였다. 형질도입된 세포의 18일에 걸친 확장 동안, 대부분의 에피솜 벡터는 상실된다. ED의 말미에, 유의하게 더 높은 백분율의 γ-글로빈+ 무핵 세포 (즉, 핵을 상실한 망상적혈구)가 유동 세포측정법에 의해 HDAd-긴-LCR + HDAd-SB 설정에 대해 발견되었다 (도 11b). HPLC 분석은 또한 HDAd-긴-LCR + HDAd-SB-형질도입된 세포에서 유의하게 더 높은 γ-글로빈 쇄 수준을 입증하였다 (도 11c).
예시적인 HDAd-긴-LCR 벡터 및 HDAd-짧은-LCR 벡터의 구조. HDAd-긴-LCR에서, 21.5 kb β-글로빈 LCR (chr11:5292319-5270789)의 제어 하의 γ-글로빈 유전자, 1.6 kb β-글로빈 프로모터 (chr11:5228631-5227023) 및 또한 β-글로빈 유전자좌로부터 유래된 3' HS1 영역 (chr11:5206867-5203839). 적혈구 세포에서의 RNA 안정화를 위해, β-글로빈 유전자 UTR을 g-글로빈 유전자의 3' 단부에 연결시켰다. 벡터는 또한 형질도입된 HSPC 및 HSPC 자손의 생체내 선택을 가능하게 하는 mgmtp140k에 대한 발현 카세트를 함유한다. γ-글로빈 및 mgmt. 발현 카세트는 닭 글로빈 HS4 인슐레이터에 의해 분리된다. 32.4 kb LCR-γ-글로빈/mgtm 트랜스포손은 SB100x에 의해 인식되는 역전된 반복부 (IR) 및 Flpe 레콤비나제에 의한 트랜스포손의 원형화를 가능하게 하는 frt 부위에 플랭킹된다. HDAd-짧은-LCR에서, HDAd-긴-LCR에 존재하는 21.5 kb HS-HS5 LCR 및 3' HS1 대신에, 이 벡터는 DNase 과민성 부위 (HS) 1 내지 4의 코어 영역을 포함하는 4.3 kb 미니-LCR을 함유한다. 트랜스포손의 길이는 11.8 kb이다. (도 12a) hCD46tg 마우스를 가동화하고, HDAd-짧은-LCR + HDAd-SB 또는 HDAd-긴-LCR + HDAd-SB (4 x 1010 vp의 둘 다의 바이러스의 1:1 혼합물)를 IV 주사하였다. 5주 후, O6BG/BCNU 처리를 시작하였다. 각각의 사이클에서, BCNU 농도를 2.5 mg/kg에서 7.5 mg/kg, 및 10 mg/kg으로 증가시켰다. O6BG 농도는 3가지 처리 모두에서 30 mg/kg이었다. 분석을 위해 동물을 희생시킨 제20주까지 마우스를 추적하였다. (도 12b)
중간성 지중해빈혈에 대한 마우스 모델에서의 연구: γ-글로빈 수준. 이들 연구를 위해 (CD46+/+) 마우스를 마우스 Hbb-베타1 및 -베타2 유전자 결실에 대해 이형접합인 Hbbth3 마우스와 교배시켰다 (Yang et al., Proc Natl Acad Sci U S A, 92: 11608-11612, 1995). 생성된 Hbbth3/CD46+/+ 마우스는 중간성 지중해빈혈의 전형적인 표현형을 갖는다 (Wang et al., J Clin Invest, 129: 598-615. 2019). Hbbth3/CD46+/+ 마우스를 가동화하고, HDAd-긴-LCR 및 HDAd-짧은 LCR을 IV 주사하였다 (도 18a). 4주 후, O6BG/BCNU의 용량을 증가시키면서 4 라운드의 생체내 선택을 개시하였다. 말초 적혈구에서의 γ-글로빈 마킹은 HDAd-긴-LCR로 형질도입된 마우스의 경우 이미 제2 사이클의 생체내 선택 시 평균 40%였고, 제3 사이클의 생체내 선택 후에 모든 마우스에서 100%에 도달하였다 (도 18b). HDAd-짧은-LCR로 형질도입된 마우스의 경우, RBC에서 100% γ-글로빈 마킹에 도달하기 위해서는 4회의 생체내 선택 사이클이 필요하였다. 100% 마킹율에서, 인간 γ-글로빈 쇄 vs 성체 마우스 a-글로빈의 백분율 (HPLC에 의해 측정됨)은 시간 경과에 따라 증가하여 (대부분 아마도 질환 배경으로 인함) 처리 후 제21주까지 평균 20%에 도달하였다 (도 18c 및 18d). 이들 데이터는 i) 덜 강렬한 생체내 선택을 필요로 하고, ii) 이론상 SCA 및 중증성 지중해빈혈을 갖는 환자에서 치유적이어야 하는 γ-글로빈 발현 수준을 달성함으로써 HDAd-긴-LCR의 우월성을 입증한다.
중간성 지중해빈혈에 대한 마우스 모델에서의 연구: 혈액 파라미터의 교정. 표현형 교정이 상이한 시점에서 제시된다. 제14주의, 김사 염색 및 메이-그륀발트 염색으로 염색한 혈액 세포 형태를 제시한다 (도 21a). 처리 후 제21주에, 마우스를 희생시켰다. 처리된 CD46+/+/Hbbth3 마우스의 말초 혈액 도말표본에서 지중해빈혈 표현형의 역전이 나타나면, 저색소성의, 고도로 단편화된 부동변형적혈구증가성 기준선 RBC가 거의 정상색소성의, 잘 형상화된 RBC로 대체되었다 (도 21b, 좌측 패널). 망상적혈구를 제21주에 지중해빈혈 및 HDAd-긴-LCR로 처리된 마우스로부터의 혈액 도말표본에 대해 계수하였다 (도 21b, 우측 패널). 골수 시토스핀에서, 전적모구 및 호염기구성 적모구의 우세에 의해 나타내어지는 CD46+/+/Hbbth3 마우스의 골수에서의 적혈구 계통 성숙의 차단과 대조적으로, 대조군 및 처리된 CD46+/+/Hbbth3 마우스로부터의 시토스핀에서는 성숙 적모구가 우세하였고, 이는 다색성 및 정상색소성 적모구에 의해 나타내어졌다 (도 21c). 긴 LCR, 짧은 LCR, 및 대조군 CD46tg 벡터로 형질도입된 마우스의 정규화된 적혈구 파라미터를 제시한다 (도 22). 혈액 도말표본에서 계수된 망상적혈구의 백분율은 지중해빈혈 마우스에서의 평균 20%로부터 HDAd-긴-LCR로 처리된 마우스에서 제18주에 정상 값 (5%)으로 복귀하였다 (도 23a). 생체내 형질도입 후 제18주에서의 혈액 파라미터는 그의 대조군 CD46tg 대응물과 구별불가능하였으며, 이는 완전한 표현형 교정을 시사한다. 이는 백혈구 및 적혈구 계수뿐만 아니라 적혈구 특색 (Hb, HCT, MHCH, 및 RDW)에서의 정규화를 포함하였다 (도 23b). 또한, 제18주에 MCV 및 MCH 세포에서 정상, 기준선, 긴 LCR, 및 짧은 LCR 벡터 사이의 차이는 유의하지 않았다 (도 23b).
중간성 지중해빈혈에 대한 마우스 모델에서의 연구: 골수외 조혈 및 혈철증의 교정. 보상성 조혈의 측정가능한 특징인 비장 크기는 HDAd-긴-LCR로 처리된 동물에서 정상으로 감소되었다 (도 24a). Hbbth3/CD46 마우스와 대조적으로, 골수외 적혈구생성의 병소는 비장 및 간 절편 상에서 관찰되지 않았다 (도 24b). 강한 실질 혈철증은 비처리된 CD46+/+/Hbbth3 마우스에서 현저한 반면, CD46tg 및 처리된 CD46+/+/Hbbth3 마우스에서는 배경 철 축적만을 검출할 수 있었다 (도 25).
Hbbth3/CD46tg 마우스의 생체내 HSC 형질도입 후 제21주에 골수를 수거하였다. (도 26a) 골수 MNC에서의 세포당 벡터 카피수. 2개의 군 사이의 차이는 유의하지 않지만, 보다 큰 샘플 크기로 분석할 경우 유의해질 수 있다. (도 26b, 26c) γ-글로빈 발현의 적혈구 특이성. (도 26b) γ-글로빈 발현 적혈구 (Ter119+) 및 비-적혈구 (Ter119-) 세포의 백분율. *p<0.05. 통계적 분석은 이원 ANOVA를 사용하여 수행하였다.
아데노바이러스 공여자 벡터의 투여 전 CD46tg 및 CD46+/+/Hbbth-3 마우스로부터의 간 및 비장 절편에서의 헤마톡실린/에오신 염색에 의한 골수외 조혈 (도 27). 철 침착은 펄 염색에 의해 비장에서 헤모시데린의 세포질 청색 안료로서 제시된다.
요약하면, CD46-트랜스제닉 마우스를 사용한 생체외 및 생체내 HSPC 형질도입 연구뿐만 아니라 인간 HSPC를 사용한 시험관내 연구는 긴 LCR을 함유하는 벡터의 우월성을 입증하였다. SB100x-매개된 통합 빈도는 긴 트랜스포손에 의해 손상되지 않았다. 보다 높은 γ-글로빈 발현 수준을 부여하는 것에 더하여, 긴 LCR은 또한 보다 엄격한 적혈구-특이적 발현을 제공하였다. 중요하게는, HDAd-긴-LCR로의 처리 후에, 중간성 지중해빈혈에 대한 마우스 모델에서 완전한 치유를 달성하는데 덜 강렬한 O6BG/BCNU 선택이 요구되었다.
물질 및 방법.
성분 위치: HS5→HS1 (21.5kb): Chr11, 5292319→5270789 (서열식별번호: 6); β-프로모터: chr11, 5228631→5227018 (서열식별번호: 7); 및 3'HS1: Chr11, 5206867→5203839 (서열식별번호: 102).
HDAd 벡터: HDAd-SB 및 HDAd-짧은-LCR 벡터의 생성은 이전에 기재되었다 (Richter et al., Blood 128: 2206-2217, 2016; Li et al., Mol Ther Methods Clin Dev 9: 142-152, 2018). HDAd-긴-LCR 벡터의 생성을 위해, 상응하는 셔틀 플라스미드는 코스미드 벡터 pWE15 (스트라타진(Stratagene), 캘리포니아주 라호야)를 기초로 하였다. pWE.Ad5-SB-mgmt는 Ad5 5'ITR (뉴클레오티드 1 내지 436) 및 3'ITR (뉴클레오티드 35741 내지 35938), pBS-μLCR-γ-글로빈-mgmt로부터 유래된 인간 EF1α 프로모터-mgmt(p140k)-SV40pA-cHS4 카세트 (Wang et al., (2019) J Clin Invest 129: 598-615), SB100x-특이적 IR/DR 부위 및 FRT 부위를 함유한다. pAd.LCR-β-GFP (21.5-kb 인간 β-글로빈 LCR을 함유함 (Wang et al., (2005) J Virol 79: 10999-11013))에서의 GFP-BGHpA 단편을 인간 γ-글로빈 유전자 및 그의 3'UTR 영역으로 대체하였다 (Chr 11:5,247,139 → 5,249,804) (pAd-긴-LCR-β-γ-글로빈). 플라스미드 pAd-긴-LCR-β-γ-글로빈은 21.5-kb 인간 β-글로빈 LCR 및 3.0-kb 인간 β-글로빈 3'HS1을 함유한다. LCR-β-γ-글로빈-3'HS1을 함유하는 28.9-kb 단편을 EF1α-mgmt-SV40pA-cHS4의 카세트의 하류에 pWE.Ad5-SB-mgmt 내로 삽입하였다 (pWE.Ad5-SB-긴-LCR-γ-글로빈/mgmt). 완전한 긴-LCR-γ-글로빈/mgmt 카세트는 SB100x-특이적 IR/DR 부위 및 FRT 부위에 플랭킹되었다. 생성된 플라스미드를 기가팩(Gigapack) III 플러스 패키징 익스트랙트 (스트라타진, 캘리포니아주 라호야)을 사용하여 파지 내로 패키징하고, 증식시켰다. HD-Ad-긴-LCR-γ-글로빈/mgmt 바이러스를 생성하기 위해, 116개 세포에서의 구출을 위해 플라스미드로부터 I-CeuI 소화에 의해 바이러스 게놈을 방출시켰다. 단일 아미노산 변이 (76-이소류신 또는 76-트레오닌)를 갖는 인간 집단에서의 HBG1 유전자의 2종의 공지된 변이체가 존재한다. 유럽인에서 13% 내지 동아시아인에서 73%의 빈도 범위를 갖는 76-Ile HBG1 변이체를 사용하였다.
HDAd 바이러스를 생성하기 위해, Ad5/35++-Acr 헬퍼 바이러스를 사용하여 116개 세포에서의 구출을 위해 플라스미드로부터 FseI 소화에 의해 바이러스 게놈을 방출시켰다 (Palmer et al., Mol Ther 8: 846-852, 2003). 이러한 헬퍼 바이러스는 Ad5 섬유 꼬리, Ad35 섬유 샤프트, 및 친화도-증진된 Ad35++ 섬유 노브로 구성된 키메라 섬유를 함유하는 Ad5/35++ 헬퍼 벡터인 AdNG163-5/35++의 유도체이다 (Richter, et al., (2016) Blood 128: 2206-2217). SpCas9 활성을 억제하는 것으로 최근에 밝혀진 인간 코돈-최적화된 AcrIIA4-T2A-AcrIIA2 서열을 합성하고 (Li et al., Mol Ther Methods Clin Dev 9: 390-401, 2018), 셔틀 플라스미드 pBS-CMV-pA 내로 클로닝하였다 (pBS-CMV-Acr-pA). 후속적으로, 2.0-kb CMV-Acr-pA 카세트를 pBS-CMV-Acr-pA로부터 증폭시키고, 인-퓨전(In-Fusion) HD 클로닝 키트 (다카라(Takara))에 의해 pNG163-2-5/35++ (Richter et al., Blood 128: 2206-2217 2016)의 SwaI 부위에 삽입하였다. 이어서, 바이러스 게놈을 PacI 소화에 의해 방출시키고, Ad5/35++-Acr 헬퍼 바이러스를 구출하고, 293 세포에서 증식시켰다. Ad5/35++-Acr 헬퍼 바이러스는 Ad5 섬유 꼬리, Ad35 섬유 샤프트, 및 친화도-증진된 Ad35++ 섬유 노브로 구성된 키메라 섬유를 함유한다 (Wang et al., J Virol 82: 10567-10579, 2008). HDAd-SB의 생성은 이전에 기재되었다 (Richter et al., Blood 128: 2206-2217, 2016). 헬퍼 바이러스 오염 수준은 0.05% 미만이었다. 모든 제제에는 박테리아 내독소가 없었다.
CD34+세포 배양: G-CSF-가동화된 성체 공여자로부터의 CD34+ 세포를 동결된 스톡으로부터 회수하고, 10% 열-불활성화된 FCS, 1% BSA 0.1 mmol/l 2-메르캅토에탄올, 4 mmol/l 글루타민 및 페니실린/스트렙토마이신, Flt3 리간드 (Flt3L, 25 ng/ml), 인터류킨 3 (10 ng/ml), 트롬보포이에틴 (TPO) (2 ng/ml), 및 줄기 세포 인자 (SCF) (25 ng/ml)가 보충된 이스코브 변형 둘베코 배지 (IMDM)에서 밤새 인큐베이션하였다. 유동 세포측정법은 세포의 >98%가 CD34-양성임을 입증하였다. 시토카인 및 성장 인자는 페프로테크(Peprotech) (뉴저지주 록키 힐)로부터의 것이었다. CD34+ 세포를 저부착 12 웰 플레이트에서 바이러스로 형질도입하였다.
적혈구 시험관내 분화: 인간 HSPC의 적혈구 세포로의 분화를 문헌 [Douay et al., Methods Mol Biol 482: 127-140, 2009]에 기재된 프로토콜에 기초하여 수행하였다. 간략하게, 단계 1에서, 104개 세포/ml의 밀도의 세포를 5% 인간 혈장, 2 IU/ml 헤파린, 10 μg/ml 인슐린, 330 μg/ml 트랜스페린, 1 μM 히드로코르티손, 100 ng/ml SCF, 5 ng/ml IL-3, 3 U/ml 에리트로포이에틴 (Epo), 글루타민, 및 Pen-Strep가 보충된 IMDM에서 7일 동안 인큐베이션하였다. 단계 2에서, 1x105개 세포/ml의 밀도의 세포를 5% 인간 혈장, 2 IU/ml 헤파린, 10 μg/ml 인슐린, 330 μg/ml 트랜스페린, 100 ng/ml SCF, 3 U/ml Epo, 글루타민, 및 Pen/Strep가 보충된 IMDM에서 3일 동안 인큐베이션하였다. 단계 3에서, 1x106개 세포/ml 세포의 밀도의 세포를 5% 인간 혈장, 2 IU/ml 헤파린, 10 μg/ml 인슐린, 330 μg/ml 트랜스페린, 3 U/ml Epo, 글루타민, 및 Pen/Strep가 보충된 IMDM에서 12일 동안 인큐베이션하였다.
형질도입된 CD34+ 세포의 시험관내 선택: 형질도입된 CD34+ 세포를 시험관내 분화 프로토콜의 단계 1에서 제3일에 O6BG/BCNU로 선택하였다. 간략하게, CD34+ 세포를 50 μM O6BG와 함께 1시간 동안 인큐베이션한 다음, 35 μM BCNU와 함께 추가로 2시간 동안 인큐베이션하였다. 이어서, 세포를 2회 세척하고, 신선한 단계 1 배지에 재현탁시켰다.
Lin- 세포 배양: 계통 음성 세포를 전체 마우스 골수 세포로부터 밀테니 바이오테크(Miltenyi Biotech) (독일 베르기슈 글라트바흐)로부터의 계통 세포 고갈 키트를 사용하여 MACS에 의해 단리하였다. Lin- 세포를 10% FCS, 10% BSA, Pen-Strep, 글루타민, 10 ng/ml 인간 TPO, 20 ng/ml 마우스 SCF 및 20 ng/ml 인간 Flt-3L이 보충된 IMDM에서 배양하였다.
글로빈 HPLC: 개별 글로빈 쇄 수준을 SPD-10AV 다이오드 어레이 검출기 및 LC-10AT 이원 펌프가 장착된 시마즈 프로미넌스 기기 (시마즈(Shimadzu), 일본 교토) 상에서 정량화하였다. 물/아세토니트릴 중 0.1% 트리플루오로아세트산의 40%-60% 구배 혼합물을 비닥(Vydac) C4 역상 칼럼 (히크롬(Hichrom), 영국)을 사용하여 1 mL/분의 속도로 적용하였다.
유동 세포측정법: 세포를 1% FCS가 보충된 PBS 중에 1x106개 세포/100 μL로 재현탁시키고, FcR 차단 시약 (밀테니 바이오테크, 캘리포니아주 오번)과 함께 10분 동안 얼음 상에서 인큐베이션하였다. 다음으로, 염색 항체 용액을 106개 세포당 100 μL로 첨가하고, 암실에서 30분 동안 얼음 상에서 인큐베이션하였다. 인큐베이션 후, 세포를 FACS 완충제 (PBS, 1% FBS) 중에서 1회 세척하였다. 2차 염색을 위해, 염색 단계를 2차 염색 용액으로 반복하였다. 세척 후에, 세포를 FACS 완충제 중에 재현탁시키고, LSRII 유동 세포측정기 (비디 바이오사이언시스(BD Biosciences), 캘리포니아주 산호세)를 사용하여 분석하였다. 전방 산란-면적 및 측방 산란-면적 게이트를 사용하여 파편은 배제하였다. 이어서, 전방 산란-높이 및 전방 산란-폭 게이트를 사용하여 단일 세포를 게이팅하였다. 이어서, 유동 세포측정 데이터를 플로우조 (버전 10.0.8, 플로우조, 엘엘씨(FlowJo, LLC))를 사용하여 분석하였다. LSK 세포의 유동 분석을 위해, 세포를 비오틴-접합된 계통 검출 칵테일 (cat #: 130-092-613; 밀테니 바이오텍, 캘리포니아주 샌디에고) 및 c-Kit (cat #:12-1171-83) 및 Sca-1 (cat #: 25-5981-82)에 대한 항체, 뿐만 아니라 APC-접합된 스트렙타비딘으로 염색하였다. 이바이오사이언스(eBioscience) (캘리포니아주 샌디에고)로부터의 다른 항체는 항-마우스 LY-6A/E (Sca-1)-PE-시아닌7 (클론 D7), 항-마우스 CD117 (c-Kit)-PE (클론 2B8), 항-마우스 CD3-APC (클론 17A2; cat #:17-0032-82), 항-마우스 CD19-PE-시아닌7 (클론 eBio1D3; cat #: 25-0193-82), 및 항-마우스 Ly-66 (Gr-1)-PE, (클론 RB6-8C5; cat #: 12-5931-82)를 포함하였다. 항-마우스 Ter-119-APC (클론: Ter-119; cat #: 116211)는 바이오레전드(Biolegend) (캘리포니아주 샌디에고)로부터의 것이었다.
인간 γ-글로빈 발현을 검출하는 세포내 유동 세포측정법 및 실시간 역전사 PCR 방법에 대해, 문헌 [Wang et al., (J. Clin Invest. 129(2):598-615, 2019)]을 참조한다.
벡터 카피수의 측정: 골수 세포로부터의 총 DNA를 퀵-DNA 미니프렙 키트 (지모 리서치(Zymo Research))를 사용하여 추출하였다. HDAd-짧은 LCR-γ-글로빈/mgmt 바이러스로부터 추출된 바이러스 DNA를 연속 희석하고, 표준 곡선에 사용하였다. qPCR을 스텝원플러스(StepOnePlus) 실시간 PCR 시스템 (어플라이드 바이오시스템즈(Applied Biosystems)) 상에서 파워 SYBR 그린 PCR 마스터 믹스를 사용하여 삼중으로 수행하였다. 9.6 ng DNA (9600 pg/6 pg/세포 = 1600개 세포)를 10 μL 반응에 사용하였다. 하기 프라이머 쌍을 사용하였다: 인간 γ-글로빈 정방향 (서열식별번호: 86) 및 역방향 (서열식별번호: 87).
통합 부위 분석 (LAM-PCR). 절차의 도시에 대해, 도 6을 참조한다. 도 7d에 대한 무작위화 데이터를 포아송 회귀 삽입 모델 (PRIM)을 사용하여 생성하여, 마우스 참조 게놈 (mm9)의 각각의 염색체의 길이를 따라 비-중첩 20 킬로염기 윈도우에 대해 예상 삽입률을 계산하였다. PRIM 알고리즘은 각각의 윈도우 내의 TA 디뉴클레오티드의 수, 윈도우가 존재하는 염색체, 및 고유한 삽입의 총수에 기초하여 통계적 모델을 생성하였다. 각각의 윈도우에 대해, 예상 삽입 수를 계산하고, 관찰된 삽입 수와 비교하여 p-값을 생성하였다. 이어서, 본페로니-교정을 적용하여 삽입된 트랜스포손의 검출을 위한 풍부화를 보여주는 윈도우를 확인하였다. 이어서, TA를 함유하는 참조 게놈으로부터 무작위 서열을 생성하고, 보타이2(Bowtie2)를 사용하여 맵핑하고, 실제 통합 데이터에 대해 플롯팅하였다. R에서 ggplot2를 사용하여 계산 및 플롯을 만들었다. 호머(HOMER) 및 칩시커(ChIPseeker)를 사용하여 도면을 그렸다.
통합 부위 분석 (역 PCR). 총 골수 세포에서의 접합부를 다른 곳에 기재된 바와 같이 하되 변형을 가하여 역 PCR에 의해 분석하였다 (Wang et al., J Virol 79: 10999-11013, 2005). 간략하게, 골수 세포로부터의 게놈 DNA를 제조업체의 지침에 따라 퀵-DNA™ 미니프렙 키트 (지모 리서치)에 의해 단리하였다. 5-10 μg의 DNA를 SacI로 소화시키고, 분자내 반응을 촉진하는 조건 하에 재-라이게이션하였다. 라이게이션 혼합물을 페놀/클로로포름 추출 및 에탄올 침전으로 정제한 다음, KOD 핫 스타트 DNA 폴리머라제를 사용하는 네스티드 PCR에 사용하였다 (각각 30 사이클). 하기 프라이머를 사용하였다: EF1α p1 정방향 (서열식별번호: 88) 및 역방향 (서열식별번호: 89); EF1α p2 정방향 (서열식별번호: 90) 및 역방향 (서열식별번호: 91); 3'HS1 p1 정방향 (서열식별번호: 92) 및 역방향 (서열식별번호: 93); 및 3'HS1 p2 정방향 (서열식별번호: 94) 및 역방향 (서열식별번호: 95).
상기 표에서, 밑줄표시된 염기가 하류 클로닝에 사용된다. PCR 앰플리콘을 겔 정제하고, 클로닝하고, 서열분석하고, 정렬하여 통합 부위를 확인하였다.
동물: 동물을 수반하는 모든 실험은 제어 기관 가이드라인에 따라 및 실험 동물 복지국 (OLAW) 공중 보건 보증 (PHS) 정책, USDA 동물 복지법 및 규정, 실험 동물의 관리 및 사용에 대한 지침 및 동물 실험 윤리 제어 위원회 (IACUC) 정책에 따라 수행하였다.
완전한 인간 CD46 유전자좌를 함유하는 C57Bl/6-기반 트랜스제닉 마우스 모델 (hCD46tg)로 생체외 및 생체내 HSPC 형질도입 연구를 수행하였다. 이들 마우스는 인간과 유사한 패턴 및 수준으로 hCD46을 발현한다 (Kemper et al., Clin Exp Immunol 124: 180-189, 2001).
CD46+/+/Hbbth3 마우스의 육종 및 스크리닝: 3 라운드의 역교배 후, CD46에 대한 Hbbth3 마우스 동형접합성을 gDNA에 대한 PCR에 의해 [CD46F (서열식별번호: 96) 및 CD46R프라이머 (서열식별번호: 97) 사용], 뿐만 아니라 CD46 MFI 측정을 가능하게 하는 유동 세포측정법에 의해 확인하였다.
골수 Lin- 세포 이식: 수용자는 6 - 8주령의 암컷 C57BL/6 마우스였다. 이식 당일에, 수용자 마우스를 1000 Rad로 방사선조사하였다. 방사선조사 4시간 후, 1x106개 Lin- 세포를 꼬리 정맥을 통해 정맥내로 주사하였다. 이 프로토콜을 생체외 형질도입 Lin- 세포의 이식 및 2차 수용자 내로의 이식에 사용하였다.
HSPC 가동화 및 생체내 형질도입: 이 절차는 이전에 문헌 [Richter et al., Blood 128: 2206-2217, 2016]에 기재되었다. HSPC를 마우스에서 인간 재조합 G-CSF (5 μg/마우스/일, 4일) (암젠(Amgen), 캘리포니아주 싸우전드 오크스)의 s.c. 주사에 의해, 이어서 제5일에 AMD3100 (5 mg/kg) (시그마-알드리치(Sigma-Aldrich))의 s.c. 주사에 의해 가동화하였다. 또한, 동물에게 바이러스 주사 16시간 및 2시간 전에 덱사메타손 (10 mg/kg)을 i.p. 제공하였다. AMD3100의 30분 및 60분 후에, 동물에게 HDAd 벡터를 안와후 신경총을 통해 주사당 각각의 바이러스에 대해 4x1010 vp의 용량으로 정맥내로 주사하였다. 4주 후, O6BG/BCNU의 생체내 선택을 개시하였다.
2차 골수 이식: 수용자는 더 잭슨 래보러토리(the Jackson Laboratory)로부터의 6 - 8주령의 암컷 C57BL/6 마우스였다. 이식 당일에, 수용자 마우스를 1000 Rad로 방사선조사하였다. 생체내 형질도입된 CD46tg 마우스로부터의 골수 세포를 무균으로 단리하고, 계통-고갈된 세포를 MACS를 사용하여 단리하였다. 방사선조사 4시간 후에, 세포를 마우스당 1x106개 세포로 정맥내로 주사하였다. 제20주에, 2차 수용자를 희생시키고 혈액, 골수 및 비장으로부터의 CD46+ 세포를 MACS에 의해 단리하거나, 또는 상기 기재된 바와 같이 가동화 및 생체내 형질도입에 적용하였다. 모든 2차 수용자는 제4주에 시작된 면역억제를 제공받았다.
혈액학적 분석: 혈액 샘플을 EDTA-코팅된 튜브 내로 수집하고, 헤마베트(HemaVet) 950FS (드류 사이언티픽(Drew Scientific)) 상에서 분석을 수행하였다.
조직 분석: 2.5 μm 두께의 비장 및 간 조직 절편을 4% 포름알데히드 중에 적어도 24시간 동안 고정시키고, 탈수시키고, 파라핀에 포매시켰다. 헤마톡실린-에오신에 의한 염색을 골수외 조혈의 조직학적 평가에 사용하였다. 펄의 프러시안 블루 염색에 의해 조직 절편에서 헤모시데린을 검출하였다. 간략하게, 조직 절편을 증류수 중 동등 부피 (2%)의 페로시안화칼륨 및 염산 혼합물로 처리한 다음, 뉴트럴 레드로 대조염색하였다. 비장 크기를 비장 중량 (mg)/체중 (g)의 비로서 평가하였다.
혈액 분석 및 골수 시토스핀: 혈액 샘플을 EDTA-코팅된 튜브 내로 수집하고, 헤마베트 950FS (드류 사이언티픽, 코네티컷주 워터베리) 또는 프로사이트Dx(ProCyteDx)™ (이덱스(IDEXX), 메인주 웨스트브룩) 기계 상에서 분석을 수행하였다. 말초 혈액 도말표본을 제조하고, 메이-그륀발트/김사로 각각 5 및 15분 동안 염색하였다 (머크(Merck), 독일 다름슈타트). 골수 세포의 현탁액을 시토스핀 장치를 사용하여 슬라이드 상에서 원심분리하고, 메이-그륀발트/김사로 염색하였다. 혈액 도말표본 상의 망상적혈구를 계수한 조사자는 샘플 군 할당에 대해 맹검이었다. 동물 번호만이 슬라이드 상에 제시되었다 (동물당 5개의 슬라이드, 5개의 무작위 1 cm2 절편).
통계적 분석: 데이터는 평균 ± 평균의 표준 오차 (SEM)로서 제시된다. 다중 군의 비교를 위해, 다중 비교를 위한 본페로니 사후-검정과 함께 일원 및 이원 분산 분석 (ANOVA)을 이용하였다. 1종의 그룹화 변수에 대한 그룹 사이의 차이를 독립표본 양측 스튜던트 t-검정에 의해 결정하였다. 비-파라미터 분석을 위해 크루스칼-왈리스 검정을 사용하였다. 그래프패드 프리즘(GraphPad Prism) 버전 6.01 (그래프패드 소프트웨어 인크.(GraphPad Software Inc.), 캘리포니아주 라호야)을 사용하여 통계적 분석을 수행하였다. *p≤0.05, ** p≤0.0002, ***p≤0.00003. 0.05 미만의 P 값을 유의한 것으로 간주하였다.
논의. 이들 중 하나인 인간 β-글로빈 유전자 클러스터는 염색체 11에 있고, ~100 kb에 걸쳐 있다. β-글로빈 유전자좌는 시스-조절 요소 및 활성 염색질 허브 (ACH)로 불리는 활성 β-글로빈 유전자로 구성된 적혈구-특이적 공간 구조를 형성하는 것으로 제안되었다 (Tolhius et al., Mol Cell, 10:1453-1465, 2002). 코어 ACH는 발생상 보존되고, 글로빈 LCR로 불리는 상류 5' DNAse 과민성 영역 1 내지 5, 및 하류 3'HS1뿐만 아니라 적혈구-특이적 트랜스액팅 인자를 포함한다 (Kim et al., Mol Cell Biol., 27:4551-65, 2007). 유전자 요법 적용의 경우, HS1 내지 HS5를 함유하는 23 kb β-글로빈 LCR 플러스 3 kb 3'HS1 영역이 트랜스제닉 마우스에서 시스-연결된 유전자에 대해 높은 수준의 적혈구-특이적 위치 비의존성 발현을 부여한다는 것은 주목할 만하다 (Grosveld, Cell, 51:975-985, 1987). 이러한 LCR의 제어 하에 트랜스진을 전달하기 위한 도구는 30+ kb HDAd 벡터로 이용가능하다.
많은 유전 질환의 교정은 치료 유전자의 높은 수준 및 조직-제한된 발현을 필요로 하며, 이는 LCR을 활용하는 것에 의해 달성될 수 있다 (Li et al., Blood 100: 3077-3086, 2002). β-중증성 지중해빈혈 및 겸상 적혈구 빈혈의 치유를 위해, HSPC에서의 약 20% 유전자 마킹 및 적혈구에서의 20% 치료-글로빈 쇄 (β- 또는 γ-글로빈) 생산이 요구되는 것으로 생각된다 (Fitzhugh et al., Blood 130: 1946-1948, 2017). 크기 제한으로 인해, 오직 말단절단된 형태의 β-글로빈 LCR만이 렌티바이러스 벡터에 사용될 수 있으며, 이는 교정 유전자 발현 수준에 대한 요건을 충족시키기 어렵게 만든다 (Uchida et al., Nat Commun 10: 4479, 2019). 렌티바이러스-매개된 HSPC 형질도입 후에 발현 수준을 증가시키기 위한 전략은 벡터 용량을 증가시켜 이에 따라 통합되는 트랜스진 카피의 수를 증가시키는 것이다. 그러나, 이러한 접근법은 유전자독성 및 종양발생성의 위험을 증진시킨다. 다른 시도는 글로빈 발현 카세트를 추가로 최적화하는데 집중된다 (Uchida et al., Nat Commun 10: 4479, 2019). 30 kb의 삽입 용량을 갖는 HDAd 벡터는 후자의 개념을 개발하기 위한 이상적인 도구이다. 본 실시예에서, 29 kb γ-글로빈 발현 카세트를 보유하는 HDAd5/35++ 벡터를 생성하고, CD46-트랜스제닉 마우스에서 시험관내 및 생체내 HSPC 형질도입 후에 시험하였다.
HDAd 벡터 시스템에서, γ-글로빈 카세트의 통합은 SB100x 트랜스포사제에 의해 매개된다. SB/트랜스포손 시스템을 사용한 비-바이러스 유전자 전달은 CD19 CAR T-세포 요법 (Kebriaei et al., J Clin Invest 126: 3363-3376, 2016), 연령-관련 황반 변성 (Hudecek et al., Crit Rev Biochem Mol Biol 52: 355-380, 2017; Thumann et al., Mol Ther Nucleic Acids 6: 302-314, 2017), 및 알츠하이머병 (Eyjolfsdottir et al., Alzheimers Res Ther 8: 30, 2016)에 임상적으로 사용되고 있다. HD-Ad 매개된 SB 유전자 전달은 카이(Kay) 및 에르하르트 그룹(Ehrhardt group)에 의해 개척되었다. 그의 연구에서, 트랜스포손은 비교적 작았다; 4 kb-6 kb (Hausl et al., Mol Ther 18: 1896-1906, 2010; Yant et al., Nat Biotechnol 20: 999-1005, 2002). 본 실시예는 SB100x가, 대등한 VCN (세포당 2-3 카피)에 기초하여, 11.8kb 트랜스포손의 효능과 대등한 효능으로 32.4kb 트랜스포손을 통합할 수 있다는 것을 처음으로 입증한다. 그 자체로 이러한 발견은 SB-매개된 통합의 효능이 SB 트랜스포손의 크기와 역으로 상관된다는 관찰과 모순된다 (Karsi et al., Mar Biotechnol (NY) 3: 241-245, 2001). 시스템은 크기 제한을 벗어나는 것으로 보인다. 제1로, 촉매 프라이밍된 트랜스포손/트랜스포사제 복합체를 형성하기 위해, 트랜스포손의 2개의 단부는 트랜스포사제 분자에 의해 물리적으로 근접하게 함께 유지되어야 한다 (Hudecek et al., Crit Rev Biochem Mol Biol 52: 355-380, 2017). 이러한 제한은 공동-발현된 Flpe 레콤비나제에 의해 인식되는 frt 측면을 HDAd 벡터 내로 도입하여 트랜스포손의 원형화를 유도하는 것에 의해 해결되었다 (Yant et al., Nat Biotechnol 20: 999-1005, 2002). 대형 구축물의 전위를 제한하는 제2 메카니즘은 자가-통합, 즉 트랜스포손 내부의 TA 디뉴클레오티드 내로의 통합으로 불리는 자살 전위 메카니즘이다 (Wang et al., PLoS Genet 10: e1004103, 2014). HDAd-짧은-LCR과 HDAd-긴-LCR 사이의 VCN에서의 보이지 않는 차이는 생체내 선택과 관련될 수 있으며, 이는 특정 수준의 mgtmP140K 발현을 갖는 HSPC 및 전구세포, 즉 역치 VCN에 도달한 세포를 풍부화한다.
강력한 O6BG/BCNU 생체내 선택 시스템으로 인해, 말초 혈액 적혈구의 거의 100%가 γ-글로빈을 함유하였다. 이러한 생체내 선택 접근법은 골수에서의 세포 조성에 영향을 미치지 않지만, 백혈구감소증을 유발한다. 따라서, 세포독성 약물 BCNU를 수반하지 않는 대안적 접근법에 노력이 집중된다. 특히, 뮤린 지중해빈혈 모델에서의 연구에 의해 지지되는 바와 같이 (Wang et al., J Clin Invest 129: 598-615, 2019), 유전자-교정된 HSPC가 비-교정된 세포에 비해 증식 이점을 가질 것이기 때문에 (Perumbeti et al., Blood 114: 1174-1185, 2009) 혈색소병증을 갖는 환자에서 제약 생체내 선택은 필요하지 않을 수 있다.
1차 동물 및 2차 수용자에서 HDAd-짧은-LCR 및 HDAd-긴-LCR에 대한 대등한 VCN을 고려하면, RBC 및 골수 적혈구 전구세포에서의 γ-글로빈 수준 (HPLC 및 qRT-PCR에 의해 측정됨)은 긴 LCR을 함유하는 벡터에 대해 유의하게 더 높았다. 흥미롭게도, 2개의 벡터 사이의 차이는 2차 수용자에서 보다 현저하였다. 이는 형질도입된 장기간 재증식 HSPC로부터 유래된 RBC가 더 높은 γ-글로빈 수준을 갖는다는 것을 암시한다. 또한, HDAd-긴-LCR은 보다 강한 적혈구 특이성을 나타내었다. 이들 효과는 LCR의 염색질 개방 능력으로 인해 전사 인자에 대한 보다 우수한 접근을 발생시키는 HDAd-긴-LCR의 추가의 LCR 요소 (Li et al., Blood 100: 3077-3086, 2002), 및/또는 γ-글로빈 유전자의 증가된 전사를 발생시키는 추가의 전사 인자의 결합에 기인할 수 있다. LCR의 또 다른 특색, 즉 자율 조절 단위로서 작용하는 그의 능력이 주목할 만하며, 이는 무작위 통합 후 이웃 유전자의 보다 적은 전사활성화를 암시한다. 이와 관련하여, 보다 완전한 LCR 버전을 사용하는 것은 접근법의 잠재적 유전자독성을 감소시킨다.
요약하면, 본 실시예는 특히 마우스에서 생체내 HSPC 형질도입 후에 중증성 지중해빈혈 및 겸상 적혈구 빈혈에 대해 치유적인 것으로 생각되는 유전자 발현 역치를 충족시키는 γ-글로빈 수준을 부여하는 벡터를 기재한다.
실시예 2: SB 트랜스포사제 ITR
본 실시예는 GFP 및 MGMTP140K 선택 마커를 코딩하는 트랜스포손 페이로드에 의한 표적 세포의 마킹을 비교하며, 여기서 트랜스포손 페이로드는 3개의 상이한 SB ITR에 플랭킹된다. 본 실시예는 mgmt/GFP 트랜스포손 페이로드가 (i) pT0 ITR; (ii) pT2 ITR; 또는 (iii) pT4 ITR에 플랭킹된 3개의 플라스미드를 포함하며, 플라스미드는 그 외에는 동일하였다. 본 실시예에서, 293 세포를 mgmt./GFP 트랜스포손 페이로드를 포함하는 3개의 플라스미드로, pSB100x를 코딩하는 지지 플라스미드의 존재 또는 부재 하에 형질감염시켰다. T2는 쿠퍼 랩(Cooper lab)에 의해 개발된 IR이며, 현재 CAR T-세포 요법에 임상적으로 사용된다 (Srour et al., Blood 235(11):862-865, 2020; PMID 31961918). T4는 이츠바크 랩(Izcvak lab)에 의해 개발된 IR의 또 다른 버전이다 (Kebriaei et al., Trends Genet. 33(11)852-870, 2017; PMID: 28964527). 본 발명자들은 T0, T2, 및 T4의 임의의 선행 병렬 비교를 알지 못한다.
세포를 선택의 존재 또는 부재 하에 17일 동안 배양하였다. 선택 하에 있지 않은 세포에 대해서는 제3일, 제12일, 및 제17일에, 및 선택 하에 있는 세포에 대해서는 제3일의 50 μM O6BG/BCNU의 단일 첨가에 의해 제17일에 배양 샘플을 채취하였다 (도 28 참조). 한 시리즈에서, 세포를 제3일, 제6일, 및 제12일에 1:10 계대배양하여 에피솜 플라스미드를 제거하였다. GFP 발현 (제17일에 분석됨)은 통합된 트랜스포손으로부터의 발현을 나타낸다. 또 다른 시리즈에서, O6BG/BCNU 선택 단계를 포함시켜 통합된 mgmt를 갖는 세포를 풍부화하였다.
세포를 유동 세포측정법에 의해 GFP에 대해 분석하였다. SB100x의 부재 하에, GFP 발현은 잔류 에피솜 플라스미드로부터 유래되고, 예상대로 차이가 관찰되지 않았다. 도 29는 각각의 T0, T2, 및 T4 플라스미드에 대한 SB100x 플라스미드의 존재 또는 부재 하에 배양된 세포에 대한 배양 제12일 및 제17일의 GFP-발현 293 세포의 백분율을 보여준다. SB100x의 존재 하에, 통합이 발생하였다. GFP+ 세포의 백분율은 T0 및 T2에 대해 대등하였지만, T4에 대해서는 유의하게 더 높았다 (p<0.01). GFP MFI는 GFP 발현 수준, 즉 세포당 통합된 트랜스포손 카피의 수를 반영한다. 다시, T4에 대한 MFI는 유의하게 더 높았다. 또한 T0과 T2 사이에 유의한 차이가 존재하였다. 결론적으로, 모든 IR이 유전자 요법을 비롯한 본 개시내용의 방법 및 조성물에서 사용하기에 적합할 수 있지만, T4 IR이 SB100x 통합을 매개하는데 우수하다. 도 30은 각각의 T0, T2, 및 T4 플라스미드에 대한 SB100x 플라스미드의 존재 또는 부재 하에 배양된 세포에 대해 O6BG/BCNU로의 선택 하의 세포에 대한 배양 제17일의 GFP-발현 293 세포의 백분율을 보여준다. 저항성 세포의 상대 수. O6BG/BCNU 선택은 트랜스포손 (GFP/mgtm) 통합이 발생하지 않은 세포를 사멸시켜야 한다. SB가 없는 생존 세포의 배경은 아마도 에피솜 벡터 때문일 것이다. SB의 존재 하에, T0 vs T2 및 T2 vs T4 사이의 차이는 유의하였고, 이는 다시 T4의 우월성을 강조한다. 예상된 바와 같이, GFP 발현은 O6BG/BCNU 선택에서 생존한 모든 세포에서 대등하여야 한다.
실시예 3: 효율적인 통합을 위해 조작된 트랜스포손
본 실시예는 표적 세포 게놈 내로 효율적으로 통합될 수 있는 예시적인 트랜스포손 페이로드를 제공한다. 예시된 트랜스포손은 2.8 내지 31.8 kb 범위의 길이를 갖고, 본 발명에 따라 제공된 범위의 트랜스포손 길이에 걸쳐 효율적인 통합이 관찰될 것이다. 본 실시예의 트랜스포손은 비제한적으로 SB100x를 포함하는 슬리핑 뷰티 트랜스포사제에 의해 표적화될 수 있는 슬리핑 뷰티 IR에 플랭킹된다. 본 실시예에 제공된 트랜스포손을 본 실시예의 보다 짧은 트랜스포손 (또는 다른 참조 트랜스포손)과 비교하면, 통합의 빈도 및/또는 효율에 기초하여, 길이 의존성을 입증하지 않을 것이고/거나 관련 기술분야의 통상의 기술자에 의해 예상되는 것보다 더 낮은 길이 의존성의 정도를 입증할 것이다. 다양한 실시양태에서, 예를 들어, 통합의 빈도 및/또는 효율은 표적 게놈당 트랜스포손 통합 사건의 수에 의해 및/또는 적어도 1개 (또는 적어도 2개, 또는 적어도 3개)의 트랜스포손 통합 사건을 포함하는 표적 게놈의 수에 의해 측정될 수 있다.
다양한 예시적인 트랜스포손 페이로드가 도 31-43에 제공된다. 도면에 제공된 특정 표현은 원형화된 플라스미드 포맷의 트랜스포손 페이로드를 포함한다. 관련 기술분야의 통상의 기술자는 트랜스포손 페이로드가 분자 생물학의 기술을 사용하여, 다른 콘텍스트에서, 예를 들어 바이러스 벡터 게놈에서 용이하게 이용될 수 있다는 것을 인지할 것이다.
본 실시예는 31.776 kb의 길이를 갖는 트랜스포손을 포함하는, 본원에서 PWEAd5-PT4LCR-글로빈/mgmt 또는 pWEAd5-PT4-LCR-글로빈-mgmt로 지칭되는 핵산을 포함한다 (도 31). 트랜스포손 페이로드는 트랜스포손 역전된 반복부 (IR, 특히 슬리핑 뷰티 IR)에 플랭킹되고, 이는 다시 레콤비나제 직접 반복부 (DR, 특히 FRT DR)에 플랭킹된다. 트랜스포손은 (i) 베타 프로모터, HS1-HS5를 포함하는 긴 LCR, 및 3'HS1과 작동가능하게 연결된 감마-글로빈 코딩 서열 및 (ii) MGMTP140K 코딩 서열이 Ef1a 프로모터와 작동가능하게 연결된 MGMTP140K 선택 카세트를 포함한다.
본 실시예는 31.772 kb의 길이를 갖는 트랜스포손을 포함하는, 본원에서 HDAd5-PT4-긴 LCR 글로빈-rhMGMT로 지칭되는 핵산을 포함한다 (도 32). 트랜스포손 페이로드는 트랜스포손 역전된 반복부 (IR, 특히 슬리핑 뷰티 IR)에 플랭킹되고, 이는 다시 레콤비나제 직접 반복부 (DR, 특히 FRT DR)에 플랭킹된다. 트랜스포손은 (i) 베타 프로모터, HS1-HS5를 포함하는 긴 LCR, 및 3'HS1과 작동가능하게 연결된 감마-글로빈 코딩 서열 및 (ii) MGMTP140K 코딩 서열이 Ef1a 프로모터와 작동가능하게 연결된 MGMTP140K 선택 카세트를 포함한다.
본 실시예는 13.173 kb의 길이를 갖는 트랜스포손을 포함하는, 본원에서 HDAd-Ad5-PT4-LCR-hACE2/mgmt로 지칭되는 핵산을 포함한다 (도 33). 트랜스포손 페이로드는 트랜스포손 역전된 반복부 (IR, 특히 pT4 슬리핑 뷰티 IR)에 플랭킹되고, 이는 다시 레콤비나제 직접 반복부 (DR, 특히 FRT DR)에 플랭킹된다. 트랜스포손은 (i) 베타 프로모터 및 HS1-HS4를 포함하는 LCR과 작동가능하게 연결된 재조합 인간 ACE2 코딩 서열 및 (ii) MGMTP140K 코딩 서열이 Ef1a 프로모터와 작동가능하게 연결된 MGMTP140K 선택 카세트를 포함한다.
본 실시예는 12.169 kb의 길이를 갖는 트랜스포손을 포함하는, 본원에서 pWEHCB-마이크로LCR-글로빈/mgmt로 지칭되는 핵산을 포함한다 (도 34). 트랜스포손 페이로드는 트랜스포손 역전된 반복부 (IR, 특히 슬리핑 뷰티 IR)에 플랭킹되고, 이는 다시 레콤비나제 직접 반복부 (DR, 특히 FRT DR)에 플랭킹된다. 트랜스포손은 (i) 베타 프로모터 및 HS1-HS4를 포함하는 마이크로 LCR과 작동가능하게 연결된 감마 글로빈 코딩 서열 및 (ii) MGMTP140K 코딩 서열이 Ef1a 프로모터와 작동가능하게 연결된 MGMTP140K 선택 카세트를 포함한다.
본 실시예는 9.382 kb의 길이를 갖는 트랜스포손을 포함하는, 본원에서 pWEHCA-파코니-GFP로 지칭되는 핵산을 포함한다 (도 35). 트랜스포손 페이로드는 트랜스포손 역전된 반복부 (IR, 특히 슬리핑 뷰티 IR)에 플랭킹되고, 이는 다시 레콤비나제 직접 반복부 (DR, 특히 FRT DR)에 플랭킹된다. 트랜스포손은 (i) pgk 프로모터와 작동가능하게 연결된 FancA 코딩 서열 및 (ii) Ef1a 프로모터와 작동가능하게 연결된 GFP 코딩 서열을 포함한다.
본 실시예는 5.49 kb의 길이를 갖는 트랜스포손을 포함하는, 본원에서 pHCA-T4-rhMGMT-GFP로 지칭되는 핵산을 포함한다 (도 36). 트랜스포손 페이로드는 트랜스포손 역전된 반복부 (IR, 특히 pT4 슬리핑 뷰티 IR)에 플랭킹되고, 이는 다시 레콤비나제 직접 반복부 (DR, 특히 FRT DR)에 플랭킹된다. 트랜스포손은 (i) PGK 프로모터와 작동가능하게 연결된 GFP 코딩 서열 및 (ii) MGMTP140K 코딩 서열이 EF1a 프로모터와 작동가능하게 연결된 MGMTP140K 선택 카세트를 포함한다.
본 실시예는 3.797 kb의 길이를 갖는 트랜스포손을 포함하는 핵산을 포함한다 (도 37). 트랜스포손 페이로드는 트랜스포손 역전된 반복부 (IR, 특히 슬리핑 뷰티 IR)에 플랭킹되고, 이는 다시 레콤비나제 직접 반복부 (DR, 특히 FRT DR)에 플랭킹된다. 트랜스포손은 EF1a 프로모터와 작동가능하게 연결된 (i) GFP 코딩 서열 및 (ii) MGMTP140K 코딩 서열을 포함한다.
본 실시예는 3.709 kb의 길이를 갖는 트랜스포손을 포함하는, 본원에서 pBHCA-PT0-EF1a-mgmt/GFP로 지칭되는 핵산을 포함한다 (도 38). 트랜스포손 페이로드는 트랜스포손 역전된 반복부 (IR, 특히 pT0 슬리핑 뷰티 IR)에 플랭킹되고, 이는 다시 레콤비나제 직접 반복부 (DR, 특히 FRT DR)에 플랭킹된다. 트랜스포손은 EF1a 프로모터와 작동가능하게 연결된 (i) eGFP 코딩 서열 및 (ii) MGMTP140K 코딩 서열을 포함한다.
본 실시예는 3.547 kb의 길이를 갖는 트랜스포손을 포함하는, 본원에서 pHCA(Ad35)-PT4-EF1a-mgmt/GFP로 지칭되는 핵산을 포함한다 (도 39). 트랜스포손 페이로드는 트랜스포손 역전된 반복부 (IR, 특히 pT4 슬리핑 뷰티 IR)에 플랭킹되고, 이는 다시 레콤비나제 직접 반복부 (DR, 특히 FRT DR)에 플랭킹된다. 트랜스포손은 EF1a 프로모터와 작동가능하게 연결된 (i) GFP 코딩 서열 및 (ii) MGMTP140K 코딩 서열을 포함한다.
본 실시예는 3.543 kb의 길이를 갖는 트랜스포손을 포함하는, 본원에서 pHCA-Ad5-PT4-Ef1a-mgmt/GFP로 지칭되는 핵산을 포함한다 (도 40). 트랜스포손 페이로드는 트랜스포손 역전된 반복부 (IR, 특히 pT4 슬리핑 뷰티 IR)에 플랭킹되고, 이는 다시 레콤비나제 직접 반복부 (DR, 특히 FRT DR)에 플랭킹된다. 트랜스포손은 EF1a 프로모터와 작동가능하게 연결된 (i) GFP 코딩 서열 및 (ii) MGMTP140K 코딩 서열을 포함한다.
본 실시예는 2.781 kb의 길이를 갖는 트랜스포손을 포함하는, 본원에서 pHCA(Ad35)-PT4-EF1a-mgmt로 지칭되는 핵산을 포함한다 (도 41). 트랜스포손 페이로드는 트랜스포손 역전된 반복부 (IR, 특히 pT4 슬리핑 뷰티 IR)에 플랭킹되고, 이는 다시 레콤비나제 직접 반복부 (DR, 특히 FRT DR)에 플랭킹된다. 트랜스포손은 MGMTP140K 코딩 서열이 EF1a 프로모터와 작동가능하게 연결된 MGMTP140K 선택 카세트를 포함한다.
본 실시예는 2.777 kb의 길이를 갖는 트랜스포손을 포함하는, 본원에서 pHCA-T4-Ef1a-rhMGMT로 지칭되는 핵산을 포함한다 (도 42). 트랜스포손 페이로드는 트랜스포손 역전된 반복부 (IR, 특히 pT4 슬리핑 뷰티 IR)에 플랭킹되고, 이는 다시 레콤비나제 직접 반복부 (DR, 특히 FRT DR)에 플랭킹된다. 트랜스포손은 MGMTP140K 코딩 서열이 EF1a 프로모터와 작동가능하게 연결된 MGMTP140K 선택 카세트를 포함한다.
본 실시예는 2.751 kb의 길이를 갖는 트랜스포손을 포함하는, 본원에서 pHCA-Ad5-PT4-Ef1a-mgmt로 지칭되는 핵산을 포함한다 (도 43). 트랜스포손 페이로드는 트랜스포손 역전된 반복부 (IR, 특히 pT4 슬리핑 뷰티 IR)에 플랭킹되고, 이는 다시 레콤비나제 직접 반복부 (DR, 특히 FRT DR)에 플랭킹된다. 트랜스포손은 MGMTP140K 코딩 서열이 EF1a 프로모터와 작동가능하게 연결된 MGMTP140K 선택 카세트를 포함한다.
(XII) 닫는 단락.
관련 기술분야의 통상의 기술자에 의해 이해되는 바와 같이, 본원에 개시된 각각의 실시양태는 그의 특정한 언급된 요소, 단계, 성분 또는 구성요소를 포함하거나, 그로 본질적으로 이루어지거나, 또는 그로 이루어질 수 있다. 따라서, 용어 "비롯하다" 또는 "비롯한"은 "포함한다, 이루어진다, 또는 본질적으로 이루어진다"를 언급하는 것으로 해석되어야 한다. 연결 용어 "포함한다" 또는 "포함하다"는 명시되지 않은 요소, 단계, 성분, 또는 구성요소를, 심지어 많은 양으로 포함하나 이에 제한되지는 않고, 이를 허용함을 의미한다. 연결 어구 "이루어진"은 명시되지 않은 임의의 요소, 단계, 성분 또는 구성요소를 배제한다. 연결 어구 "본질적으로 이루어진"은 실시양태의 범주를 명시된 요소, 단계, 성분 또는 구성요소로, 및 실시양태에 실질적으로 영향을 미치지 않는 것으로 제한한다. 이와 관련하여 물질적 효과는 아데노바이러스 벡터가 대형 트랜스포손 페이로드를 운반하고/거나 대형 페이로드를 표적 게놈 내로 통합시키는 능력을 감소시키는 조성 또는 방법에서의 임의의 변화이다.
달리 나타내지 않는 한, 명세서 및 청구범위에 사용된 성분의 양, 특성, 예컨대 분자량, 반응 조건 등을 표현하는 모든 수는 모든 경우에 용어 "약"에 의해 수식되는 것으로 이해되어야 한다. 따라서, 달리 나타내지 않는 한, 명세서 및 첨부된 청구범위에 제시된 수치 파라미터는 본 발명에 의해 수득하고자 하는 목적하는 특성에 따라 달라질 수 있는 근사치이다. 최소한, 그리고 청구범위의 범주에 대한 균등론의 적용을 제한하려는 시도가 아닌 것으로서, 각각의 수치 파라미터는 적어도 보고된 유효 숫자의 수에 비추어 통상의 반올림 기술을 적용하여 해석되어야 한다. 추가의 명확성이 요구되는 경우에, 용어 "약"은 언급된 수치 값 또는 범위와 함께 사용되는 경우에 관련 기술분야의 통상의 기술자에 의해 그에 합리적으로 부여되는 의미를 가지며, 즉 언급된 값 또는 범위보다 다소 많거나 다소 적게, 언급된 값의 ±20%; 언급된 값의 ±19%; 언급된 값의 ±18%; 언급된 값의 ±17%; 언급된 값의 ±16%; 언급된 값의 ±15%; 언급된 값의 ±14%; 언급된 값의 ±13%; 언급된 값의 ±12%; 언급된 값의 ±11%; 언급된 값의 ±10%; 언급된 값의 ±9%; 언급된 값의 ±8%; 언급된 값의 ±7%; 언급된 값의 ±6%; 언급된 값의 ±5%; 언급된 값의 ±4%; 언급된 값의 ±3%; 언급된 값의 ±2%; 또는 언급된 값의 ±1%의 범위 내를 나타낸다.
본 발명의 넓은 범주를 제시하는 수치 범위 및 파라미터는 근사치이지만, 특정 실시예에 제시된 수치 값은 가능한 한 정확하게 보고된다. 그러나, 임의의 수치 값은 본질적으로 그의 각각의 시험 측정에서 발견되는 표준 편차로부터 필연적으로 발생하는 특정 오차를 함유한다.
본원에서 값의 범위에 대한 언급은 단지 범위 내에 속하는 각각의 개별 값을 개별적으로 지칭하는 약칭 방법으로서 제공되도록 의도된다. 본원에 달리 나타내지 않는 한, 각각의 개별 값은 본원에 개별적으로 인용된 것처럼 명세서에 포함된다. 본원에 기재된 모든 방법은 본원에 달리 나타내지 않는 한 또는 문맥상 명백하게 모순되지 않는 한, 임의의 적합한 순서로 수행될 수 있다. 본원에 제공된 임의의 및 모든 예 또는 예시적인 언어 (예를 들어, "예컨대")의 사용은 단지 본 발명을 보다 잘 예시하기 위해 의도되며, 달리 청구된 본 발명의 범주에 대한 제한을 제기하지 않는다. 본 명세서의 어떠한 용어도 본 발명의 실시에 필수적인 임의의 청구되지 않은 요소를 나타내는 것으로 해석되어서는 안된다.
본원에 개시된 본 발명의 대안적 요소 또는 실시양태의 그룹화는 제한으로 해석되어서는 안된다. 각각의 군 구성원은 개별적으로 또는 군의 다른 구성원 또는 본원에서 발견되는 다른 요소와의 임의의 조합으로 언급되고 청구될 수 있다. 군의 하나 이상의 구성원은 편의성 및/또는 특허성의 이유로 군에 포함되거나 군으로부터 삭제될 수 있는 것으로 예상된다. 임의의 이러한 포함 또는 삭제가 발생하는 경우에, 명세서는 변형된 바와 같은 군을 함유하는 것으로 간주되며, 따라서 첨부된 청구범위에 사용된 모든 마쿠쉬 군의 기재된 설명을 충족시킨다.
본 발명을 수행하기 위해 본 발명자들에게 공지된 최적 방식을 비롯한 본 발명의 특정 실시양태가 본원에 기재된다. 물론, 이들 기재된 실시양태에 대한 변형은 상기 설명을 읽을 때 관련 기술분야의 통상의 기술자에게 명백해질 것이다. 본 발명자는 통상의 기술자가 적절한 경우에 이러한 변형을 사용할 것으로 예상하고, 본 발명자들은 본 발명이 본원에 구체적으로 기재된 것과 달리 실시되는 것을 의도한다. 따라서, 본 발명은 적용가능한 법에 의해 허용되는 바와 같은 본원에 첨부된 청구범위에 인용된 대상의 모든 변형 및 등가물을 포함한다. 더욱이, 그의 모든 가능한 변경에서 상기 기재된 요소의 임의의 조합은 본원에 달리 나타내지 않는 한 또는 문맥상 명백하게 모순되지 않는 한 본 발명에 의해 포괄된다.
또한, 본 명세서 전반에 걸쳐 특허, 인쇄된 간행물, 학술지 논문 및 다른 서면 텍스트 (본원에 참조된 자료)에 대한 수많은 참조가 이루어졌다. 각각의 참조된 자료는 그의 참조된 교시(들)에 대해 그 전문이 개별적으로 본원에 참조로 포함된다.
본원에 개시된 본 발명의 실시양태는 본 발명의 원리를 예시하는 것으로 이해되어야 한다. 사용될 수 있는 다른 변형이 본 발명의 범위 내에 있다. 따라서, 제한이 아닌 예로서, 본 발명의 대안적 구성이 본원의 교시에 따라 이용될 수 있다. 따라서, 본 발명은 정확하게 제시되고 기재된 바와 같은 것으로 제한되지 않는다.
본원에 제시된 상세사항은 단지 예로서 및 본 발명의 바람직한 실시양태의 예시적 논의를 위한 것이며, 본 발명의 다양한 실시양태의 원리 및 개념적 측면의 가장 유용하고 용이하게 이해되는 기재인 것으로 여겨지는 것을 제공하기 위해 제시된다. 이와 관련하여, 본 발명의 근본적인 이해에 필요한 것보다 더 상세하게 본 발명의 구조적 세부사항을 나타내려는 시도는 이루어지지 않았으며, 설명은 도면 및/또는 실시예와 함께 본 발명의 여러 형태가 실제로 구현될 수 있는 방법을 관련 기술분야의 통상의 기술자에게 명백하게 한다.
본 개시내용에 사용된 정의 및 설명은 실시예(들)에서 명백하고 명료하게 변형되지 않는 한 또는 의미의 적용이 임의의 구성을 무의미하게 또는 본질적으로 무의미하게 만드는 경우에 임의의 미래 구성에서 통제되도록 의미되고 의도된다. 용어의 구성이 이를 무의미하게 또는 본질적으로 무의미하게 하는 경우에, 정의는 문헌 [Webster's Dictionary, 3rd Edition] 또는 관련 기술분야의 통상의 기술자에게 공지된 사전, 예컨대 문헌 [Oxford Dictionary of Biochemistry and Molecular Biology (Ed. Anthony Smith, Oxford University Press, Oxford, 2004)]으로부터 취해져야 한다.
서열의 요약
본원에 기재된 핵산 및/또는 아미노산 서열은 37 C.F.R. §1.822에 정의된 바와 같은 표준 문자 약어를 사용하여 제시된다. 각각의 핵산 서열의 단지 1개의 가닥이 제시되지만, 상보적 가닥이 적절한 경우에 실시양태에 포함되는 것으로 이해된다. 파일 크기가 136 KB인, 2021년 4월 9일 즈음에 생성된 "F053-0126PCT_SeqList.txt (Sequence Listing.txt)"라는 명칭의 컴퓨터 판독가능한 텍스트 파일은 본 출원에 대한 서열 목록을 함유하며, 그 전문이 본원에 참조로 포함된다. 첨부된 서열 목록에서:
서열식별번호: 1은 도 2c에 제시된 5' 단부 벡터 서열, 슬리핑 뷰티 IR/DR 서열, 통합 접합부 (chr15, 6805206)의 뉴클레오티드 서열이다.
서열식별번호: 2는 도 2c에 제시된 5' 단부 벡터 서열, 슬리핑 뷰티 IR/DR 서열, 통합 접합부 (chrX, 16897322)의 뉴클레오티드 서열이다.
서열식별번호: 3은 도 2c에 제시된 3' 단부 벡터 서열, 슬리핑 뷰티 IR/DR 서열, 통합 접합부 (chr4, 10207667)의 뉴클레오티드 서열이다.
서열식별번호: 4는 도 7b에 제시된 슬리핑 뷰티 IR/DR 서열, 통합 접합부 (chr7, 79796094)의 뉴클레오티드 서열이다.
서열식별번호: 5는 도 7b에 제시된 슬리핑 뷰티 IR/DR 서열, 통합 접합부 (반복부 영역)의 뉴클레오티드 서열이다.
서열식별번호: 6은 인간 염색체 11의 긴 β-글로빈 LCR 위치 5292319-5270789 (21,531 bp)의 뉴클레오티드 서열이다:
서열식별번호: 7은 인간 염색체 11의 위치 5228631-5227018 (1614 bp)을 포함하는 전위가능한 트랜스진 삽입물의 뉴클레오티드 서열이다:
서열식별번호: 8은 Her2-특이적 CDRL1의 아미노산 서열이다: KASQDVSIGVA
서열식별번호: 9는 Her2-특이적 CDRL2의 아미노산 서열이다: ASYRYT
서열식별번호: 10은 Her2-특이적 CDRL3의 아미노산 서열이다: QQYYIYPYT
서열식별번호: 11은 Her2-특이적 CDRH1의 아미노산 서열이다: GFTFTDYTMD
서열식별번호: 12는 Her2-특이적 CDRH2의 아미노산 서열이다: DVNPNSGGSIYNQRFK
서열식별번호: 13은 Her2-특이적 CDRH3의 아미노산 서열이다: LGPSFYFDY
서열식별번호: 14는 PD-L1-특이적 CDRL1의 아미노산 서열이다: RASKGVSTSGYSYLH
서열식별번호: 15는 PD-L1-특이적 CDRL2의 아미노산 서열이다: LASYLES
서열식별번호: 16은 PD-L1-특이적 CDRL3의 아미노산 서열이다: QHSRDLPLT
서열식별번호: 17은 PD-L1-특이적 CDRH1의 아미노산 서열이다: NYYMY
서열식별번호: 18은 PD-L1-특이적 CDRH2의 아미노산 서열이다: GINPSNGGTNFNEKFKN
서열식별번호: 19는 PD-L1-특이적 CDRH3의 아미노산 서열이다: RDYRFDMGFDY
서열식별번호: 20은 아벨루맙-특이적 가변 중쇄의 아미노산 서열이다:
EVQLLESGGGLVQPGGSLRLSCAASGFTFSSYIMMWVRQAPGKGLEWVSSIYPSGGITFYADTVKGRFTISRDNSKNTLYLQMNSLRAEDTAVYYCARIKLGTVTTVDYWGQGTLVTVSS
서열식별번호: 21은 아벨루맙-특이적 가변 경쇄의 아미노산 서열이다:
QSALTQPASVSGSPGQSITISCTGTSSDVGGYNYVSWYQQHPGKAPKLMIYDVSNRPSGVSNRFSGSKSGNTASLTISGLQAEDEADYYCSSYTSSSTRVFGTGTKVTVL
서열식별번호: 22는 아벨루맙-특이적 CDRH1의 아미노산 서열이다: SGFTFSSYIMM
서열식별번호: 23은 아벨루맙-특이적 CDRH2의 아미노산 서열이다: SIYPSGGITFYADTVKG
서열식별번호: 24는 아벨루맙-특이적 CDRH3의 아미노산 서열이다: IKLGTVTTVDY
서열식별번호: 25는 아벨루맙-특이적 CDRL1의 아미노산 서열이다: TGTSSDVGGYNYVS
서열식별번호: 26은 아벨루맙-특이적 CDRL2의 아미노산 서열이다: DVSNRPS
서열식별번호: 27은 아벨루맙-특이적 CDRL3의 아미노산 서열이다: SSYTSSSTRV
서열식별번호: 28은 하기를 포함하는 아테졸리주맙-특이적 가변 중쇄의 아미노산 서열이다:
EVQLVESGGGLVQPGGSLRLSCAASGFTFSDSWIHWVRQAPGKGLEWVAWISPYGGSTYYADSVKGRFTISADTSKNTAYLQMNSLRAEDTAVYYCARRHWPGGFDYWGQGTLVTVSS
서열식별번호: 29는 아테졸리주맙-특이적 가변 경쇄의 아미노산 서열이다:
DIQMTQSPSSLSASVGDRVTITCRASQDVSTAVAWYQQKPGKAPKLLIYSASFLYSGVPSRFSGSGSGTDFTLTISSLQPEDFATYYCQQYLYHPATFGQGTKVEIK
서열식별번호: 30은 아테졸리주맙-특이적 CDRH1의 아미노산 서열이다: SGFTFSDSWIH
서열식별번호: 31은 아테졸리주맙-특이적 CDRH2의 아미노산 서열이다: WISPYGGSTYYADSVKG
서열식별번호: 32는 아테졸리주맙-특이적 CDRH3의 아미노산 서열이다: RHWPGGFDY
서열식별번호: 33은 아테졸리주맙-특이적 CDRL1의 아미노산 서열이다: RASQDVSTAVA
서열식별번호: 34는 아테졸리주맙-특이적 CDRL2의 아미노산 서열이다: SASFLYS
서열식별번호: 35는 아테졸리주맙-특이적 CDRL3의 아미노산 서열이다: QQYLYHPAT
서열식별번호: 36은 PSMA-특이적-특이적 CDRL1의 아미노산 서열이다: KASQDVGTAVD
서열식별번호: 37은 PSMA-특이적 CDRL2의 아미노산 서열이다: WASTRHT
서열식별번호: 38은 PSMA-특이적 CDRL3의 아미노산 서열이다: QQYNSYPLT
서열식별번호: 39는 PSMA-특이적 CDRH1의 아미노산 서열이다: GYTFTEYTIH
서열식별번호: 40은 PSMA-특이적 CDRH2의 아미노산 서열이다: NINPNNGGTTYNQKFED
서열식별번호: 41은 PSMA-특이적 CDRH3의 아미노산 서열이다: GWNFDY
서열식별번호: 42는 MUC16-특이적 CDRL1의 아미노산 서열이다: SEDIYSG
서열식별번호: 43은 MUC16-특이적 CDRL3의 아미노산 서열이다: GYSYSSTL
서열식별번호: 44는 MUC16-특이적 CDRH1의 아미노산 서열이다: TLGMGVG
서열식별번호: 45는 MUC16-특이적 CDRH2의 아미노산 서열이다: HIWWDDDKYYNPALKS
서열식별번호: 46은 MUC16-특이적 CDRH3의 아미노산 서열이다: IGTAQATDALDY
서열식별번호 47은 FOLR-특이적 CDRL1의 아미노산 서열이다: KASQSVSFAGTSLMH
서열식별번호: 48은 FOLR-특이적 CDRL2의 아미노산 서열이다: RASNLEA
서열식별번호: 49는 FOLR-특이적 CDRL3의 아미노산 서열이다: QQSREYPYT
서열식별번호: 50은 FOLR-특이적 CDRH1의 아미노산 서열이다: GYFMN
서열식별번호: 51은 FOLR-특이적 CDRH2의 아미노산 서열이다: RIHPYDGDTFYNQKFQG
서열식별번호: 52는 FOLR-특이적 CDRH3의 아미노산 서열이다: YDGSRAMDY
서열식별번호: 53은 아마툭시맙-특이적 가변 중쇄의 아미노산 서열이다:
QVQLQQSGPELEKPGASVKISCKASGYSFTGYTMNWVKQSHGKSLEWIGLITPYNGASSYNQKFRGKATLTVDKSSSTAYMDLLSLTSEDSAVYFCARGGYDGRGFDYWGSGTPVTVSS.
서열식별번호: 54는 아마툭시맙-특이적 가변 경쇄의 아미노산 서열이다:
DIELTQSPAIMSASPGEKVTMTCSASSSVSYMHWYQQKSGTSPKRWIYDTSKLASGVPGRFSGSGSGNSYSLTISSVEAEDDATYYCQQWSKHPLTFGSGTKVEIK
서열식별번호: 55는 아마툭시맙-특이적 CDRH1의 아미노산 서열이다: GYSFTGYTMN
서열식별번호: 56은 아마툭시맙-특이적 CDRH2의 아미노산 서열이다: LITPYNGASSYNQ
서열식별번호: 57은 아마툭시맙-특이적 CDRH3의 아미노산 서열이다: GGYDGRGFDY
서열식별번호: 58은 아마툭시맙-특이적 CDRL1의 아미노산 서열이다: SASSSVSYMH
서열식별번호: 59는 아마툭시맙-특이적 CDRL2의 아미노산 서열이다: DTSKLAS
서열식별번호: 60은 아마툭시맙-특이적 CDRL3의 아미노산 서열이다: QQWSKHPLT
서열식별번호: 61은 Nef의 아미노산 서열 (66-97)이다:
VGFPVTPQVPLRPMTYKAAVDLSHFLKEKGGL
서열식별번호: 62는 Nef의 아미노산 서열 (116-145)이다:
HTQGYFPDWQNYTPGPGVRYPLTFGWLYKL
서열식별번호: 63은 Gag p17의 아미노산 서열 (17-35)이다:
EKIRLRPGGKKKYKLKHIV
서열식별번호: 64는 Gag p17-p24의 아미노산 서열 (253-284)이다:
NPPIPVGEIYKRWIILGLNKIVRMYSPTSILD
서열식별번호: 65는 Pol 325-355 (RT 158-188)이다:
AIFQSSMTKILEPFRKQNPDIVIYQYMDDLY
서열식별번호: 66은 슬리핑 뷰티의 IR/DR 및 염색체 서열을 코딩하는 서열의 뉴클레오티드 서열이다:
ACTTAAGTGTATGTAAACTTCCGACTTCAACTGTAGGGTACCTGATTCTCTGGGCATCTCTGCCCACTACCATG
서열식별번호: 67은 슬리핑 뷰티의 IR/DR 및 염색체 서열을 코딩하는 서열의 뉴클레오티드 서열이다:
ACTTAAGTGTATGTAAACTTCCGACTTCAACTGTAAATTTTCCACCTTTTTCAGTTTTCCTCGCCATATTTCATG
서열식별번호: 68은 슬리핑 뷰티의 IR/DR 코딩 서열의 뉴클레오티드 서열이다: ACTTAAGTGTATGTAAACTTCCGACTTCAACTG
서열식별번호: 69는 슬리핑 뷰티의 IR/DR 및 염색체 서열을 코딩하는 서열의 뉴클레오티드 서열이다:
서열식별번호: 70은 슬리핑 뷰티의 IR/DR 및 염색체 서열을 코딩하는 서열의 뉴클레오티드 서열이다:
서열식별번호: 71은 슬리핑 뷰티의 IR/DR을 코딩하는 서열이다:
서열식별번호: 72는 슬리핑 뷰티의 IR/DR 및 염색체 서열을 코딩하는 서열의 뉴클레오티드 서열이다:
서열식별번호: 73은 슬리핑 뷰티의 IR/DR을 코딩하는 서열의 뉴클레오티드 서열이다:
서열식별번호: 74는 슬리핑 뷰티 트랜스포사제 효소이다:
서열식별번호: 75는 SB100X인 과다활성 슬리핑 뷰티의 아미노산 서열이다:
서열식별번호: 76은 피기백™ (PB) 트랜스포사제의 아미노산 서열이다:
서열식별번호: 77은 프로그 프린스 트랜스포사제의 아미노산 서열이다:
서열식별번호: 78은 TcBuster 트랜스포사제의 아미노산 서열이다:
서열식별번호: 79는 Tol2 트랜스포사제의 아미노산 서열이다:
서열식별번호: 80은 SV40 프로모터의 뉴클레오티드 서열이다:
서열식별번호: 81은 dESV40 프로모터의 뉴클레오티드 서열이다:
서열식별번호: 82는 인간 텔로머라제 촉매 서브유닛 (hTERT) 프로모터의 뉴클레오티드 서열이다:
서열식별번호: 83은 슈미트-루핀 A 균주로부터 유래된 RSV 프로모터의 뉴클레오티드 서열이다:
서열식별번호: 84는 hNIS 프로모터의 뉴클레오티드 서열이다:
서열식별번호: 85는 인간 글루코코르티코이드 수용체 1A (hGR 1/Ap/e) 프로모터의 뉴클레오티드 서열이다:
서열식별번호: 86은 인간 γ-글로빈 정방향 프라이머의 뉴클레오티드 서열이다:
서열식별번호: 87은 인간 γ-글로빈 역방향 프라이머의 뉴클레오티드 서열이다:
서열식별번호: 88은 EF1α p1 정방향 프라이머의 뉴클레오티드 서열이다:
서열식별번호: 89는 EF1α p1 역방향 프라이머의 뉴클레오티드 서열이다:
서열식별번호: 90은 EF1α p2 정방향 프라이머의 뉴클레오티드 서열이다:
서열식별번호: 91은 EF1α p2 역방향 프라이머의 뉴클레오티드 서열이다:
서열식별번호: 92는 3'HS1 p1 정방향 프라이머의 뉴클레오티드 서열이다:
서열식별번호: 93은 3'HS1 p1 역방향 프라이머의 뉴클레오티드 서열이다:
서열식별번호: 94는 3'HS1 p2 정방향 프라이머의 뉴클레오티드 서열이다:
서열식별번호: 95는 3'HS1 p2 역방향 프라이머의 뉴클레오티드 서열이다:
서열식별번호: 96은 CD46F 프라이머의 뉴클레오티드 서열이다:
서열식별번호: 97은 CD46R 프라이머의 뉴클레오티드 서열이다:
서열식별번호: 98 - 삽입된 XhoI 부위 (위치 10655-10661)를 갖는 긴 β-글로빈 LCR:
서열식별번호: 99 (예시적인 ET3 서열)
서열식별번호: 100 (예시적인 β-글로빈 서열)
서열식별번호: 101 (예시적인 γ-글로빈 서열)
서열식별번호: 102 (예시적인 3'HS1 핵산 서열)
SEQUENCE LISTING
<110> Fred Hutchinson Cancer Research Center
University of Washington
<120> INTEGRATION OF LARGE ADENOVIRUS PAYLOADS
<130> F053-0126PCT / 20-148-WO-PCT
<150> US 63/009,298
<151> 2020-04-13
<160> 102
<170> PatentIn version 3.5
<210> 1
<211> 720
<212> DNA
<213> Artificial Sequence
<220>
<223> 5 end vector sequence, Sleeping Beauty IR/DR sequence,
integration junction (chr15, 6805206)
<400> 1
ccctgggatt ccccaaggca ggggcgagtc cttttgtatg aattactcaa atcgataact 60
agaaacttaa ttaacaacga gatcttataa tttgcatact tctgcctgct ggggactttc 120
cacaccctag ctgacacaag aatttgaaat acatccacag gtacacctcc aattgactca 180
aatgatgtca attagtctat cataatcttc taaagccatg acatcatttt aactggaatt 240
ttccaagctg tttaaaggca cagtcaactt agtgtatgta aacttctgac ccactggaat 300
tgtgatacag tgaattataa gtgaaataat ctgtctgtaa acaattgttg gaaaaatgac 360
ttgtgtcatg cacaaagtag atgtcctaac tgacttgcca aaactattgt ttgttaacaa 420
gaaatttgtg gagtagttga aaaacgagtt ttaatgactc caacttaagt gtatgtaaac 480
ttccgacttc aactgtaaga atggcccatt catctatagt agcacacaat atttgcattt 540
gtgcgacagt ataagggaca attatgctat caggcatttt tccaaagtga gtaatcgaag 600
tttttatacc tttgtgtgcc atgtttgcta ccatggtggg ataatcttac acgcgttctc 660
gcgaccggcc aggaaagacg caacaaaccg gaatcttctg cggcaaaagc tttattgctt 720
<210> 2
<211> 607
<212> DNA
<213> Artificial Sequence
<220>
<223> 5 end vector sequence, Sleeping Beauty IR/DR sequence,
integration junction (chrX, 16897322)
<220>
<221> misc_feature
<222> (594)..(594)
<223> n is a, c, g, or t
<220>
<221> misc_feature
<222> (596)..(597)
<223> n is a, c, g, or t
<220>
<221> misc_feature
<222> (602)..(602)
<223> n is a, c, g, or t
<400> 2
tagaaactta attaacaacg agatcttata atttgcatac ttctgcctgc tggggacttt 60
ccacacccta gctgacacaa gaatttgaaa tacatccaca ggtacacctc caattgactc 120
aaatgatgtc aattagtcta tcataatctt ctaaagccat gacatcattt taactggaat 180
tttccaagct gtttaaaggc acagtcaact tagtgtatgt aaacttctga cccactggaa 240
ttgtgataca gtgaattata agtgaaataa tctgtctgta aacaattgtt ggaaaaatga 300
cttgtgtcat gcaaagtaga tgtcctaact gacttgccaa aactattgtt tgttaacaag 360
aaatttgtgg agtagttgaa aaacgagttt taatgactcc aacttaagtg tatgtaaact 420
tccgacttca actgtacaag tagaccaaat atccatatac ataaaagaaa aaaatagaaa 480
aaatttctag tgacagaaaa atgacaaaga acatactgtt tattactact attaagatgt 540
ttgcttccat tacactcata tgagtcatga tattttttct tcattttttt ctantnncac 600
tngaaat 607
<210> 3
<211> 520
<212> DNA
<213> Artificial Sequence
<220>
<223> 3 end vector sequence, Sleeping Beauty IR/DR sequence,
integration junction (chr4, 10207667)
<400> 3
gttgctagga atgagccaaa ttcatctgta ttaaacagtg ggagcttgtg gaaggctact 60
cgaaatgttt gacccaagtt aaacaattta aaggcaatgc taccaaatac taattgagtg 120
tatgttaact tctgacccac tgggaatgtg atgaaagaaa taaaagctga aatgaatcat 180
tctctctact attattctga tatttcacat tcttaaaata aagtggtgat cctaactgac 240
cttaagacag ggaatcttta ctcggattaa atgtcaggaa ttgtgaaaaa gtgagtttaa 300
atgtatttgg ctaaggtgta tgtaaacttc cgacttcaac tgtatatcct ccccgttgca 360
ccctcttgat gatgctgaga tgaacacaga tgctcactcc ttgagggctc taagcttatg 420
ctgacacaga cacaggtgct cacttctatg aatggcctaa gatttgagga catcatgagg 480
acaagtgtga taaaatcttg gaacaacctc ccagaggtct 520
<210> 4
<211> 74
<212> DNA
<213> Artificial Sequence
<220>
<223> Sleeping beauty IR/DR sequence, integration junction (chr7,
79796094)
<400> 4
acttaagtgt atgtaaactt ccgacttcaa ctgtagggta cctgattctc tgggcatctc 60
tgcccactac catg 74
<210> 5
<211> 75
<212> DNA
<213> Artificial Sequence
<220>
<223> Sleeping beauty IR/DR sequence, Integration junction (repeat
region)
<400> 5
acttaagtgt atgtaaactt ccgacttcaa ctgtaaattt tccacctttt tcagttttcc 60
tcgccatatt tcatg 75
<210> 6
<211> 21531
<212> DNA
<213> Homo sapiens
<400> 6
gatctctatc ccctcctgtt ttctctacgt tatttatatg ggtatcatca ccatcctgga 60
caacatcagg acagatatcc ctcaccaagc caatgttcct ctctatgttg gctcaaatgt 120
ccttgaactt tcctttcacc accctttcca cagtcaaaag gatattgtag tttaatgcct 180
cagagttcag cttttaagct tctgacaaat tattcttcct ctttaggttc tcctttatgg 240
aatcttctgt actgatggcc atgtccttta actactatgt agatatctgc tactacctgt 300
attatgcctc tacctttatt agcagagtta tctgtactgt tggcatgaca atcatttgtt 360
aatatgactt gcctttcctt tttctgctat tcttgatcaa atggctcctc tttcttgctc 420
ctctcatttc tcctgccttc acttggacgt gcttcacgta gtctgtgctt atgactggat 480
taaaaattga tatggactta tcctaatgtt gttcgtcata atatgggttt tatggtccat 540
tattatttcc tatgcattga tctggagaag gcttcaatcc ttttactctt tgtggaaaat 600
atctgtaaac cttctggttc actctgctat agcaatttca gtttaggcta gtaagcatga 660
ggatgcctcc ttctctgatt tttcccacag tctgttggtc acagaataac ctgagtgatt 720
actgatgaaa gagtgagaat gttattgata gtcacaatga caaaaaacaa acaactacag 780
tcaaaatgtt tctcttttta ttagtggatt atatttcctg acctatatct ggcaggactc 840
tttagagagg tagctgaagc tgctgttatg accactagag ggaagaagat acctgtggag 900
ctaatggtcc aagatggtgg agccccaagc aaggaagttg ttaaggagcc cttttgattg 960
aaggtgggtg cccccacctt acagggacag gacatctgga tactcctccc agtttctcca 1020
gtttcccttt ttcctaatat atctcctgat aaaatgtcta tactcacttc cccatttcta 1080
ataataaagc aaaggctagt tagtaagaca tcaccttgca ttttgaaaat gccatagact 1140
ttcaaaatta tttcatacat cggtctttct ttatttcaag agtccagaaa tggcaacatt 1200
acctttgatt caatgtaatg gaaagagctc tttcaagaga cagagaaaag aataatttaa 1260
tttctttccc cacacctcct tccctgtctc ttaccctatc ttccttcctt ctaccctccc 1320
catttctctc tctcatttct cagaagtata ttttgaaagg attcatagca gacagctaag 1380
gctggttttt tctaagtgaa gaagtgatat tgagaaggta gggttgcatg agccctttca 1440
gttttttagt ttatatacat ctgtattgtt agaatgtttt ataatataaa taaaattatt 1500
tctcagttat atactagcta tgtaacctgt ggatatttcc ttaagtatta caagctatac 1560
ttaactcact tggaaaactc aaataaatac ctgcttcata gttattaata aggattaagt 1620
gagataatgc ccataagatt cctattaata acagataaat acatacacac acacacacat 1680
tgaaaggatt cttactttgt gctaggaact ataataagtt cattgatgca ttatatcatt 1740
aagttctaat ttcaacacta gaaggcaggt attatctaaa tttcatactg gatacctcca 1800
aactcataaa gataattaaa ttgccttttg tcatatattt attcaaaagg gtaaactcaa 1860
actatggctt gtctaatttt atatatcacc ctactgaaca tgaccctatt gtgatatttt 1920
ataaaattat tctcaagtta ttatgaggat gttgaaagac agagaggatg gggtgctatg 1980
ccccaaatca gcctcacaat taagctaagc agctaagagt cttgcagggt agtgtaggga 2040
ccacagggtt aagggggcag tagaattata ctcccacttt agtttcattt caaacaatcc 2100
atacacacac agccctgagc acttacaaat tatactacgc tctatacttt ttgtttaaat 2160
gtataaataa gtggatgaaa gaatagatag atagatagac agatagatga tagatagaat 2220
aaatgcttgc cttcatagct gtctccctac cttgttcaaa atgttcctgt ccagaccaaa 2280
gtaccttgcc ttcacttaag taatcaattc ctaggttata ttctgatgtc aaaggaagtc 2340
aaaagatgtg aaaaacaatt tctgacccac aactcatgct ttgtagatga ctagatcaaa 2400
aaatttcagc catatcttaa cagtgagtga acaggaaatc tcctcttttc cctacatctg 2460
agatcccagc ttctaagacc ttcaattctc actcttgatg caacagacct tggaagcata 2520
caggagagct gaacttggtc aacaaaggag aaaagtttgt tggcctccaa aggcacagct 2580
caaacttttc aagccttctc taatcttaaa ggtaaacaag ggtctcattt ctttgagaac 2640
ttcagggaaa atagacaagg acttgcctgg tgcttttggt aggggagctt gcactttccc 2700
cctttctgga ggaaatattt atccccaggt agttcccttt ttgcaccagt ggttctttga 2760
agagacttcc acctgggaac agttaaacag caactacagg gccttgaact gcacactttc 2820
agtccggtcc tcacagttga aaagacctaa gcttgtgcct gatttaagcc tttttggtca 2880
taaaacattg aattctaatc tccctctcaa ccctacagtc acccatttgg tatattaaag 2940
atgtgttgtc tactgtctag tatccctcaa gtagtgtcag gaattagtca tttaaatagt 3000
ctgcaagcca ggagtggtgg ctcatgtctg taattccagc acttgagagg tagaagtggg 3060
aggactgctt gagctcaaga gtttgatatt atcctggaca acatagcaag acctcgtctc 3120
tacttaaaaa aaaaaaaaaa attagccagg catgtgatgt acacctgtag tcccagctac 3180
tcaggaggcc gaaatgggag gatcccttga gctcaggagg tcaaggctgc agtgagacat 3240
gatcttgcca ctgcactcca gcctggacag cagagtgaaa ccttgcctca cgaaacagaa 3300
tacaaaaaca aacaaacaaa aaactgctcc gcaatgcgct tccttgatgc tctaccacat 3360
aggtctgggt actttgtaca cattatctca ttgctgttca taattgttag attaattttg 3420
taatattgat attattccta gaaagctgag gcctcaagat gataactttt attttctgga 3480
cttgtaatag ctttctcttg tattcaccat gttgtaactt tcttagagta gtaacaatat 3540
aaagttattg tgagtttttg caaacacagc aaacacaacg acccatatag acattgatgt 3600
gaaattgtct attgtcaatt tatgggaaaa caagtatgta ctttttctac taagccattg 3660
aaacaggaat aacagaacaa gattgaaaga atacattttc cgaaattact tgagtattat 3720
acaaagacaa gcacgtggac ctgggaggag ggttattgtc catgactggt gtgtggagac 3780
aaatgcaggt ttataataga tgggatggca tctagcgcaa tgactttgcc atcactttta 3840
gagagctctt ggggacccca gtacacaaga ggggacgcag ggtatatgta gacatctcat 3900
tctttttctt agtgtgagaa taagaatagc catgacctga gtttatagac aatgagccct 3960
tttctctctc ccactcagca gctatgagat ggcttgccct gcctctctac taggctgact 4020
cactccaagg cccagcaatg ggcagggctc tgtcagggct ttgatagcac tatctgcaga 4080
gccagggccg agaaggggtg gactccagag actctccctc ccattcccga gcagggtttg 4140
cttatttatg catttaaatg atatatttat tttaaaagaa ataacaggag actgcccagc 4200
cctggctgtg acatggaaac tatgtagaat attttgggtt ccattttttt ttccttcttt 4260
cagttagagg aaaaggggct cactgcacat acactagaca gaaagtcagg agctttgaat 4320
ccaagcctga tcatttccat gtcatactga gaaagtcccc acccttctct gagcctcagt 4380
ttctcttttt ataagtagga gtctggagta aatgatttcc aatggctctc atttcaatac 4440
aaaatttccg tttattaaat gcatgagctt ctgttactcc aagactgaga aggaaattga 4500
acctgagact cattgactgg caagatgtcc ccagaggctc tcattcagca ataaaattct 4560
caccttcacc caggcccact gagtgtcaga tttgcatgca ctagttcacg tgtgtaaaaa 4620
ggaggatgct tctttccttt gtattctcac atacctttag gaaagaactt agcacccttc 4680
ccacacagcc atcccaataa ctcatttcag tgactcaacc cttgacttta taaaagtctt 4740
gggcagtata gagcagagat taagagtaca gatgctggag ccagaccacc tgagtgatta 4800
gtgactcagt ttctcttagt agttgtatga ctcagtttct tcatctgtaa aatggagggt 4860
tttttaatta gtttgttttt gagaaagggt ctcactctgt cacccaaatg ggagtgtagt 4920
ggcaaaatct cggctcactg caacttgcac ttcccaggct caagcggtcc tcccacctca 4980
acatcctgag tagctggaac cacaggtaca caccaccata cctcgctaat tttttgtatt 5040
tttggtagag atggggtttc acatgttaca caggatggtc tcagactccg gagctcaagc 5100
aatctgccca cctcagcctt ccaaagtgct gggattataa gcatgattac aggagtttta 5160
acaggctcat aagattgttc tgcagcccga gtgagttaat acatgcaaag agtttaaagc 5220
agtgacttat aaatgctaac tactctagaa atgtttgcta gtattttttg tttaactgca 5280
atcattcttg ctgcaggtga aaactagtgt tctgtacttt atgcccattc atctttaact 5340
gtaataataa aaataactga catttattga aggctatcag agactgtaat tagtgctttg 5400
cataattaat catatttaat actcttggat tctttcaggt agatactatt attatcccca 5460
ttttactaca gttaaaaaaa ctacctctca acttgctcaa gcatacactc tcacacacac 5520
aaacataaac tactagcaaa tagtagaatt gagatttggt cctaattatg tctttgctca 5580
ctatccaata aatatttatt gacatgtact tcttggcagt ctgtatgctg gatgctgggg 5640
atacaaagat gtttaaattt aagctccagt ctctgcttcc aaaggcctcc caggccaagt 5700
tatccattca gaaagcattt tttactcttt gcattccact gtttttccta agtgactaaa 5760
aaattacact ttattcgtct gtgtcctgct ctgggatgat agtctgactt tcctaacctg 5820
agcctaacat ccctgacatc aggaaagact acaccatgtg gagaaggggt ggtggttttg 5880
attgctgctg tcttcagtta gatggttaac tttgtgaagt tgaaaactgt ggctctctgg 5940
ttgactgtta gagttctggc acttgtcact atgcctatta tttaacaaat gcatgaatgc 6000
ttcagaatat gggaatatta tcttctggaa tagggaatca agttatatta tgtaacccag 6060
gattagaaga ttcttctgtg tgtaagaatt tcataaacat taagctgtct agcaaaagca 6120
agggcttgga aaatctgtga gctcctcacc atatagaaag cttttaaccc atcattgaat 6180
aaatccctat aggggatttc taccctgagc aaaaggctgg tcttgattaa ttcccaaact 6240
catatagctc tgagaaagtc tatgctgtta acgttttctt gtctgctacc ccatcatatg 6300
cacaacaata aatgcaggcc taggcatgac tgaaggctct ctcataattc ttggttgcat 6360
gaatcagatt atcaacagaa atgttgagac aaactatggg gaagcagggt atgaaagagc 6420
tctgaatgaa atggaaaccg caatgcttcc tgcccattca gggctccagc atgtagaaat 6480
ctggggcttt gtgaagactg gcttaaaatc agaagcccca ttggataaga gtagggaaga 6540
acctagagcc tacgctgagc aggtttcctt catgtgacag ggagcctcct gccccgaact 6600
tccagggatc ctctcttaag tgtttcctgc tggaatctcc tcacttctat ctggaaatgg 6660
tttctccaca gtccagcccc tggctagttg aaagagttac ccatgcagag gccctcctag 6720
catccagaga ctagtgctta gattcctact ttcagcgttg gacaacctgg atccacttgc 6780
ccagtgttct tccttagttc ctaccttcga ccttgatcct cctttatctt cctgaaccct 6840
gctgagatga tctatgtggg gagaatggct tctttgagaa acatcttctt cgttagtggc 6900
ctgcccctca ttcccacttt aatatccaga atcactataa gaagaatata ataagaggaa 6960
taactcttat tataggtaag ggaaaattaa gaggcatacg tgatgggatg agtaagagag 7020
gagagggaag gattaatgga cgataaaatc tactactatt tgttgagacc ttttatagtc 7080
taatcaattt tgctattgtt ttccatcctc acgctaactc cataaaaaaa cactattatt 7140
atctttattt tgccatgaca agactgagct cagaagagtc aagcatttgc ctaaggtcgg 7200
acatgtcaga ggcagtgcca gacctatgtg agactctgca gctactgctc atgggccctg 7260
tgctgcactg atgaggagga tcagatggat ggggcaatga agcaaaggaa tcattctgtg 7320
gataaaggag acagccatga agaagtctat gactgtaaat ttgggagcag gagtctctaa 7380
ggacttggat ttcaaggaat tttgactcag caaacacaag accctcacgg tgactttgcg 7440
agctggtgtg ccagatgtgt ctatcagagg ttccagggag ggtggggtgg ggtcagggct 7500
ggccaccagc tatcagggcc cagatgggtt ataggctggc aggctcagat aggtggttag 7560
gtcaggttgg tggtgctggg tggagtccat gactcccagg agccaggaga gatagaccat 7620
gagtagaggg cagacatggg aaaggtgggg gaggcacagc atagcagcat ttttcattct 7680
actactacat gggactgctc ccctataccc ccagctaggg gcaagtgcct tgactcctat 7740
gttttcagga tcatcatcta taaagtaaga gtaataattg tgtctatctc atagggttat 7800
tatgaggatc aaaggagatg cacactctct ggaccagtgg cctaacagtt caggacagag 7860
ctatgggctt cctatgtatg ggtcagtggt ctcaatgtag caggcaagtt ccagaagata 7920
gcatcaacca ctgttagaga tatactgcca gtctcagagc ctgatgttaa tttagcaatg 7980
ggctgggacc ctcctccagt agaaccttct aaccagctgc tgcagtcaaa gtcgaatgca 8040
gctggttaga ctttttttaa tgaaagctta gctttcatta aagattaagc tcctaagcag 8100
ggcacagatg aaattgtcta acagcaactt tgccatctaa aaaaatctga cttcactgga 8160
aacatggaag cccaaggttc tgaacatgag aaatttttag gaatctgcac aggagttgag 8220
agggaaacaa gatggtgaag ggactagaaa ccacatgaga gacacgagga aatagtgtag 8280
atttaggctg gaggtaaatg aaagagaagt gggaattaat acttactgaa atctttctat 8340
atgtcaggtg ccattttatg atatttaata atctcattac atatggtaat tctgtgagat 8400
atgtattatt gaacatacta taattaatac taatgataag taacacctct tgagtactta 8460
gtatatgcta gaatcaaatt taagtttatc atatgaggcc gggcacggtg gctcatatat 8520
gggattacat gcctgtaatc ccagcacttt gggaggccaa ggcaattgga tcacctgagg 8580
tcaggagttc cagaccagcc tggccaacat ggtgaaaccc cttctctact aaaaaataca 8640
aaaaatcagc caggtgtggt ggcacgcgtc tataatccca gctactcagg aggctgaggc 8700
aggagaatca cttgaaccca ggaggtggag gttgcagtga gctaagattg caccactgca 8760
ctccagccta ggcgacagag tgagactcca tctcaaaaaa aaaaaaagaa gtttattata 8820
tgaattaact tagttttact cacaccaata ctcagaagta gattattacc tcatttattg 8880
atgaggagcc caatgtactt gtagtgtaga tcaacttatt gaaagcacaa gctaataagt 8940
agacaattag taattagaag tcagatggtc tgagctctcc tactgtctac attacatgag 9000
ctcttattaa ctggggactc gaaaatcaaa gacatgaaat aatttgtcca agcttacaga 9060
accaccaagt agtaaggcta ggatgtagac ccagttctgc tacctctgaa gacagtgttt 9120
tttccacagc aaaacacaaa ctcagatatt gtggatgcga gaaattagaa gtagatattc 9180
ctgccctgtg gcccttgctt cttactttta cttcttgtcg attggaagtt gtggtccaag 9240
ccacagttgc agaccatact tcctcaacca taattgcatt tcttcaggaa agtttgaggg 9300
agaaaaaggt aaagaaaaat ttagaaacaa cttcagaata aagagatttt ctcttgggtt 9360
acagagattg tcatatgaca aattataagc agacacttga gaaaactgaa ggcccatgcc 9420
tgcccaaatt accctttgac cccttggtca agctgcaact ttggttaaag ggagtgttta 9480
tgtgttatag tgttcattta ctcttctggt ctaacccatt ggctccgtct tcatcctgca 9540
gtgacctcag tgcctcagaa acatacatat gtttgtctag tttaagtttg tgtgaaattc 9600
taactagcgt caagaactga gggccctaaa ctatgctagg aatagtgctg tggtgctgtg 9660
ataggtacac aagaaatgag aagaaactgc agattctctg catctccctt tgccgggtct 9720
gacaacaaag tttccccaaa ttttaccaat gcaagccatt tctccatatg ctaactactt 9780
taaaatcatt tggggcttca cattgtcttt ctcatctgta aaaagaatgg aagaactcat 9840
tcctacagaa ctccctatgt cttccctgat gggctagagt tcctctttct caaaaattag 9900
ccattattgt atttccttct aagccaaagc tcagaggtct tgtattgccc agtgacatgc 9960
acactggtca aaagtaggct aagtagaagg gtactttcac aggaacagag agcaaaagag 10020
gtgggtgaat gagagggtaa gtgagaaaag acaaatgaga agttacaaca tgatggcttg 10080
ttgtctaaat atctcctagg gaattattgt gagaggtctg aatagtgttg taaaataagc 10140
tgaatctgct gccaacatta acagtcaaga aatacctccg aataactgta cctccaatta 10200
ttctttaagg tagcatgcaa ctgtaatagt tgcatgtata tatttatcat aatactgtaa 10260
cagaaaacac ttactgaata tatactgtgt ccctagttct ttacacaata aactaatctc 10320
atcctcataa ttctattagc taatacatat tatcatccta tatttcagag acttcaagaa 10380
gttaagcaac ttgctcaaga tcatctaaga agtaggtggt atttctgggc tcatttggcc 10440
cctcctaatc tctcatggca acatggctgc ctaaagtgtt gattgcctta attcatcagg 10500
gatgggctca tactcactgc agaccttaac tggcatcctc ttttcttatg tgatctgcct 10560
gaccctagta gacttatgaa atttctgatg agaaaggaga gaggagaaag gcagagctga 10620
ctgtgatgag tgatgaaggt gccttctcat ctgggtacca gtggggcctc taagactaag 10680
tcactctgtc tcactgtgtc ttagccagtt ccttacagct tgccctgatg ggagatagag 10740
aatgggtatc ctccaacaaa aaaataaatt ttcatttctc aaggtccaac ttatgttttc 10800
ttaattttta aaaaaatctt gaccattctc cactctctaa aataatccac agtgagagaa 10860
acattctttt cccccatccc ataaatacct ctattaaata tggaaaatct gggcatggtg 10920
tctcacacct gtaatcccag cactttggga ggctgaggtg ggtggactgc ttggagctca 10980
ggagttcaag accatcttgg acaacatggt gataccctgc ctctacaaaa agtacaaaaa 11040
ttagcctggc atggtggtgt gcacctgtaa tcccagctat tagggtggct gaggcaggag 11100
aattgcttga acccgggagg cggaggttgc agtgagctga gatcgtgcca ctgcactcca 11160
gcctggggga cagagcacat tataattaac tgttattttt tacttggact cttgtgggga 11220
ataagataca tgttttattc ttatttatga ttcaagcact gaaaatagtg tttagcatcc 11280
agcaggtgct tcaaaaccat ttgctgaatg attactatac tttttacaag ctcagctccc 11340
tctatccctt ccagcatcct catctctgat taaataagct tcagtttttc cttagttcct 11400
gttacatttc tgtgtgtctc cattagtgac ctcccatagt ccaagcatga gcagttctgg 11460
ccaggcccct gtcggggtca gtgccccacc cccgccttct ggttctgtgt aaccttctaa 11520
gcaaaccttc tggctcaagc acagcaatgc tgagtcatga tgagtcatgc tgaggcttag 11580
ggtgtgtgcc cagatgttct cagcctagag tgatgactcc tatctgggtc cccagcagga 11640
tgcttacagg gcagatggca aaaaaaagga gaagctgacc acctgactaa aactccacct 11700
caaacggcat cataaagaaa atggatgcct gagacagaat gtgacatatt ctagaatata 11760
ttatttcctg aatatatata tatatataca catatacgta tatatatata tatatatata 11820
tttgttgtta tcaattgcca tagaatgatt agttattgtg aatcaaatat ttatcttgca 11880
ggtggcctct atacctagaa gcggcagaat caggctttat taatacatgt gtatagattt 11940
ttaggatcta tacacatgta ttaatatgaa acaaggatat ggaagaggaa ggcatgaaaa 12000
caggaaaaga aaacaaacct tgtttgccat tttaaggcac ccctggacag ctaggtggca 12060
aaaggcctgt gctgttagag gacacatgct cacatacggg gtcagatctg acttggggtg 12120
ctactgggaa gctctcatct taaggataca tctcaggcca gtcttggtgc attaggaaga 12180
tgtaggcaac tctgatcctg agaggaaaga aacattcctc caggagagct aaaagggttc 12240
acctgtgtgg gtaactgtga aggactacaa gaggatgaaa aacaatgaca gacagacata 12300
atgcttgtgg gagaaaaaac aggaggtcaa ggggatagag aaggcttcca gaagaatggc 12360
tttgaagctg gcttctgtag gagttcacag tggcaaagat gtttcagaaa tgtgacatga 12420
cttaaggaac tatacaaaaa ggaacaaatt taaggagagg cagataaatt agttcaacag 12480
acatgcaagg aattttcaga tgaatgttat gtctccactg agcttcttga ggttagcagc 12540
tgtgagggtt ttgcaggccc aggacccatt acaggacctc acgtatactt gacactgttt 12600
tttgtattca tttgtgaatg aatgacctct tgtcagtcta ctcggtttcg ctgtgaatga 12660
atgatgtctt gtcagcctac ttggtttcgc taagagcaca gagagaagat ttagtgatgc 12720
tatgtaaaaa cttccttttt ggttcaagtg tatgtttgtg atagaaatga agacaggcta 12780
catgatgcat atctaacata aacacaaaca ttaagaaagg aaatcaacct gaagagtatt 12840
tatacagata acaaaataca gagagtgagt taaatgtgta ataactgtgg cacaggctgg 12900
aatatgagcc atttaaatca caaattaatt agaaaaaaaa cagtggggaa aaaattccat 12960
ggatgggtct agaaagacta gcattgtttt aggttgagtg gcagtgttta aagggtgata 13020
tcagactaaa cttgaaatat gtggctaaat aactagaata ctctttattt tttcgtatca 13080
tgaatagcag atatagcttg atggccccat gcttggttta acatccttgc tgttcctgac 13140
atgaaatcct taatttttga caaaggggct attcattttc attttatatt gggcctagaa 13200
attatgtaga tggtcctgag gaaaagttta tagcttgtct atttctctct ctaacatagt 13260
tgtcagcaca atgcctaggc tataggaagt actcaaagct tgttaaattg aattctatcc 13320
ttcttattca attctacaca tggaggaaaa actcatcagg gatggaggca cgcctctaag 13380
gaaggcaggt gtggctctgc agtgtgattg ggtacttgca ggacgaaggg tggggtggga 13440
gtggctaacc ttccattcct agtgcagagg tcacagccta aacatcaaat tccttgaggt 13500
gcggtggctc actcctgtaa tcacagcagt ttgggacgcc aaggtgggca gatcacttga 13560
ggtcaggagt tggacaccag cccagccaac atagtgaaac ctggtctctg cttaaaaata 13620
taaaaattag ctggacgtgg tgacgggagc ctgtaatcca actacttggg aggctgaggc 13680
aggagaatcg cttgaaccgg ggaggtggag tttgcactga gcagagatca tgccattgca 13740
ctccagcctc cagagcgaga ctctgtctaa agaaaaacga aaacaaacaa acaaacaaac 13800
aaacaaaacc catcaaattc cctgaccgaa cagaattctg tctgattgtt ctctgactta 13860
tctaccattt tccctcctta aagaaactgt gaacttcctt cagctagagg ggcctggctc 13920
agaagcctct ggtcagcatc caagaaatac ttgatgtcac tttggctaaa ggtatgatgt 13980
gtagacaagc tccagagatg gtttctcatt tccatatcca cccacccagc tttccaattt 14040
taaagccaat tctgaggtag agactgtgat gaacaaacac cttgacaaaa ttcaacccaa 14100
agactcactt tgcctagctt caaaatcctt actctgacat atactcacag ccagaaatta 14160
gcatgcacta gagtgtgcat gagtgcaaca cacacacaca ccaattccat attctctgtc 14220
agaaaatcct gttggttttt cgtgaaagga tgttttcaga ggctgacccc ttgccttcac 14280
ctccaatgct accactctgg tctaagtcac tgtcaccacc acctaaatta tagctgttga 14340
ctcataacaa tcttcctgct tctaccactg ccccactaca atttcttccc aatatactat 14400
ccaaattagt cttttcaaaa tgtaagtcat atatggtcac ctctttgttc aaagtcttct 14460
gatagtttcc tatatcattt ataataaaac caaatcctta caattctcta caatagttgt 14520
tcatgcatat attatgttta ttacagatac atatatatag ctctcatata aataaatata 14580
tatatttatg tgtatgtgtg tagagtgttt tttcttacaa ctctatgatg taggtattat 14640
tagtgtccca aattttataa tttaggactt ctatgatctc atcttttatt ctccccttca 14700
ccgaatctca tcctacattg gccttattga tattccttga aaattctaag catcttacat 14760
ctttagggta tttacatttg ccattcccta tgccctaaat atttaatcat agtttcatat 14820
aaatgggttc ctcatcatct atgggtactc tctcaggtgt taactttata gtgaggactt 14880
tcctgccata ctacttaaag tagcgatacc ctttcaccct gtcctaatca cactctggcc 14940
ttcatttcag tttttttttt ttctccatag cacctaatct cattggtata taacatgttt 15000
catttgctta tttaatgtca agctctttcc actatcaagt ccatgaaaac aggaacttta 15060
ttcctctatt ctgtttttgt gctgtattct tagcaatttt acaattttga atgaatgaat 15120
gagcagtcaa acacatatac aactataatt aaaaggatgt atgctgacac atccactgct 15180
atgcacacac aaagaaatca gtggagtaga gctggaagtg ctaagcctgc atagagctag 15240
ttagccctcc gcaggcagag ccttgatggg attactgagt tctagaattg gactcatttg 15300
ttttgtaggc tgagatttgc tcttgaaaac ttgttctgac caaaataaaa ggctcaaaag 15360
atgaatatcg aaaccagggt gttttttaca ctggaattta taactagagc actcatgttt 15420
atgtaagcaa ttaattgttt catcagtcag gtaaaagtaa agaaaaactg tgccaaggca 15480
ggtagcctaa tgcaatatgc cactaaagta aacattattt cataggtgtc agatatggct 15540
tattcatcca tcttcatggg aaggatggcc ttggcctgga catcagtgtt atgtgaggtt 15600
caaaacacct ctaggctata aggcaacaga gctccttttt tttttttctg tgctttcctg 15660
gctgtccaaa tctctaatga taagcatact tctattcaat gagaatattc tgtaagatta 15720
tagttaagaa ttgtgggagc cattccgtct cttatagtta aatttgagct tcttttatga 15780
tcactgtttt tttaatatgc tttaagttct ggggtacatg tgccatggtg gtttgctgca 15840
cccatcaacc cgtcatctac attaggtatt tctcctaatg ctatccttcc cctagccccc 15900
cacccccaac aggccccagt gtgtgatgtt cccctccctg tgtccatgga tcactggttt 15960
ttttttgttt tttttttttt tttaaagtct cagttaaatt tttggaatgt aatttatttt 16020
cctggtatcc taggacttgc aagttatctg gtcactttag ccctcacgtt ttgatgataa 16080
tcacatattt gtaaacacaa cacacacaca cacacacaca cacatatata tatatataaa 16140
acatatatat acataaacac acataacata tttatcgggc atttctgagc aactaatcat 16200
gcaggactct caaacactaa cctatagcct tttctatgta tctacttgtg tagaaaccaa 16260
gcgtggggac tgagaaggca atagcaggag cattctgact ctcactgcct ttagctaggc 16320
ccctccctca tcacagctca gcatagtcct gagctcttat ctatatccac acacagtttc 16380
tgacgctgcc cagctatcac catcccaagt ctaaagaaaa aaataatggg tttgcccatc 16440
tctgttgatt agaaaacaaa acaaaataaa ataagcccct aagctcccag aaaacatgac 16500
taaaccagca agaagaagaa aatacaatag gtatatgagg agactggtga cactagtgtc 16560
tgaatgaggc ttgagtacag aaaagaggct ctagcagcat agtggtttag aggagatgtt 16620
tctttccttc acagatgcct tagcctcaat aagcttgcgg ttgtggaagt ttactttcag 16680
aacaaactcc tgtggggcta gaattattga tggctaaaag aagcccgggg gagggaaaaa 16740
tcattcagca tcctcaccct tagtgacaca aaacagaggg ggcctggttt tccatatttc 16800
ctcatgatgg atgatctcgt taatgaaggt ggtctgacga gatcattgct tcttccattt 16860
aagccttgct cacttgccaa tcctcagttt taaccttctc cagagaaata cacatttttt 16920
attcaggaaa catactatgt tatagtttca atactaaata atcaaagtac tgaagatagc 16980
atgcataggc aagaaaaagt ccttagcttt atgttgctgt tgtttcagaa tttaaaaaag 17040
atcaccaagt caaggacttc tcagttctag cactagaggt ggaatcttag catataatca 17100
gaggtttttc aaaatttcta gacataagat tcaaagccct gcacttaaaa tagtctcatt 17160
tgaattaact ctttatataa attgaaagca cattctgaac tacttcagag tattgtttta 17220
tttctatgtt cttagttcat aaatacatta ggcaatgcaa tttaattaaa aaaacccaag 17280
aatttcttag aattttaatc atgaaaataa atgaaggcat ctttacttac tcaaggtccc 17340
aaaaggtcaa agaaaccagg aaagtaaagc tatatttcag cggaaaatgg gatatttatg 17400
agttttctaa gttgacagac tcaagtttta accttcagtg cccatcatgt aggaaagtgt 17460
ggcataactg gctgattctg gctttctact cctttttccc attaaagatc cctcctgctt 17520
aattaacatt cacaagtaac tctggttgta ctttaggcac agtggctccc gaggtcagtc 17580
acacaatagg atgtctgtgc tccaagttgc cagagagaga gattactctt gagaatgagc 17640
ctcagccctg gctcaaactc acctgcaaac ttcgtgagag atgaggcaga ggtacactac 17700
gaaagcaaca gttagaagct aaatgatgag aacacatgga ctcatagagg gaaacaacgc 17760
atactggggc ctatcagagg gtggagggtg agagaaggag aggatcagga aaaatcacta 17820
atggatgcta agcgtaatac ctgagtgatg agatcatcta tacaacaaac ccccttgaca 17880
ttcatttatc tatgtaacaa acctgcacat cctgtacatg tacccctgaa cttaaaataa 17940
aagttgaaaa caagaaagca acagtttgaa cacttgttat ggtctattct ctcattcttt 18000
acaattacac tagaaaatag ccacaggctt cctgcaaggc agccacagaa tttatgactt 18060
gtgatatcca agtcattcct ggataatgca aaatctaaca caaaatctag tagaatcatt 18120
tgcttacatc tatttttgtt ctgagaatat agatttagat acataatgga agcagaataa 18180
tttaaaatct ggctaattta gaatcctaag cagctctttt cctatcagtg gtttacaagc 18240
cttgtttata tttttcctat tttaaaaata aaaataaagt aagttatttg tggtaaagaa 18300
tattcattaa agtatttatt tcttagataa taccatgaaa aacattcagt gaagtgaagg 18360
gcctacttta cttaacaaga atctaattta tataattttt catactaata gcatctaaga 18420
acagtacaat atttgactct tcaggttaaa catatgtcat aaattagcca gaaagattta 18480
agaaaatatt ggatgtttcc ttgtttaaat taggcatctt acagttttta gaatcctgca 18540
tagaacttaa gaaattacaa atgctaaagc aaacccaaac aggcaggaat taatcttcat 18600
cgaatttggg tgtttctttc taaaagtcct ttatacttaa atgtcttaag acatacatag 18660
attttatttt actaatttta attatataga caataaatga atattcttac tgattacttt 18720
ttctgactgt ctaatctttc tgatctatcc tggatggcca taacacttat ctctctgaac 18780
tttgggcttt taatatagga aagaaaagca ataatccatt tttcatggta tctcatatga 18840
taaacaaata aaatgcttaa aaatgagcag gtgaagcaat ttatcttgaa ccaacaagca 18900
tcgaagcaat aatgagactg cccgcagcct acctgacttc tgagtcagga tttataagcc 18960
ttgttactga gacacaaacc tgggcctttc aatgctataa cctttcttga agctcctccc 19020
taccaccttt agccataagg aaacatggaa tgggtcagat ccctggatgc aagccaggtc 19080
tggaaccata ggcagtaagg agagaagaaa atgtgggctc tgcaactggc tccgagggag 19140
caggagagga tcaaccccat actctgaatc taagagaaga ctggtgtcca tactctgaat 19200
gggaagaatg atgggattac ccatagggct tgttttaggg agaaacctgt tctccaaact 19260
cttggccttg agatacctgg tccttattcc ttggactttg gcaatgtctg accctcacat 19320
tcaagttctg aggaagggcc actgccttca tactgtggat ctgtagcaaa ttccccctga 19380
aaacccagag ctgtatctta attggttaaa aaaaattata ttatctcaac gactgttctt 19440
ctctgagtag ccaagctcag cttggttcaa gctacaagca gctgagctgc tttttgtcta 19500
gtcattgttc ttttatttca gtggatcaaa tacgttcttt ccaaacctag gatcttgtct 19560
tcctaggcta tatattttgt cccaggaagt cttaatctgg ggtccacaga acactagggg 19620
gctggtgaag tttatagaaa aaaaatctgt atttttactt acatgtaact gaaatttagc 19680
attttcttct actttgaatg caaaggacaa actagaatga catcatcagt acctattgca 19740
tagttataaa gagaaaccac agatattttc atactacacc ataggtattg cagatctttt 19800
tgtttttgtt tttgtttgag atggagtttc gctcttattg cccaggctgg agtgcagtgg 19860
catgatttcg gctcactgca acctcccctt cctgcattca agcaattctc ctgccttggc 19920
ctcctgagta gctggggatt acaggcacct gccaccatgc cagtctaatt tttgtatttt 19980
tagtagagat ggggtttcgc catgttggcc aggctggtct tgaactcctg acctcagatg 20040
atctgcccgc cttggcctcc tgaagtgctg ggattatagg tgtgagccac cacgcctggc 20100
ccattgcaga tatttttaat tcacatttat ctgcatcact acttggatct taaggtagct 20160
gtagacccaa tcctagatct aatgctttca taaagaagca aatataataa atactatacc 20220
acaaatgtaa tgtttgatgt ctgataatga tatttcagtg taattaaact tagcactcct 20280
atgtatatta tttgatgcaa taaaaacata tttttttagc acttacagtc tgccaaactg 20340
gcctgtgaca caaaaaaagt ttaggaattc ctggttttgt ctgtgttagc caatggttag 20400
aatatatgct cagaaagata ccattggtta atagctaaaa gaaaatggag tagaaattca 20460
gtggcctgga ataataacaa tttgggcagt cattaagtca ggtgaagact tctggaatca 20520
tgggagaaaa gcaagggaga cattcttact tgccacaagt gttttttttt tttttttttt 20580
ttatcacaaa cataagaaaa tataataaat aacaaagtca ggttatagaa gagagaaacg 20640
ctcttagtaa acttggaata tggaatcccc aaaggcactt gacttgggag acaggagcca 20700
tactgctaag tgaaaaagac gaagaacctc tagggcctga acatacagga aattgtagga 20760
acagaaattc ctagatctgg tggggcaagg ggagccatag gagaaagaaa tggtagaaat 20820
ggatggagac ggaggcagag gtgggcagat catgaggtca agagatcgag accatcctgg 20880
caaacatggt gaaatcccgt ctctactaaa aataaaaaaa ttagctgggc atggtggcat 20940
gcgcctgtag tcccagctgc tcgggaggct gaggcaggag aatcgtttga acccaggagg 21000
cgaaggttgc agtgagctga gatagtgcca ttgcactcca gtctggcaac agagtgagac 21060
tccgtctcaa aaaaaaaaaa aaaagaaaga aagaaaagaa aaagaaaaaa gaaaaaataa 21120
atggatgtag aacaagccag aaggaggaac tgggctgggg caatgagatt atggtgatgt 21180
aagggacttt tatagaatta acaatgctgg aatttgtgga actctgcttc tattattccc 21240
ccaatcatta cttctgtcac attgatagtt aaataatttc tgtgaattta ttccttgatt 21300
ctaaaatatg aggataatga caatggtatt ataagggcag attaagtgat atagcatgag 21360
caatattctt caggcacatg gatcgaattg aatacactgt aaatcccaac ttccagtttc 21420
agctctacca agtaaagagc tagcaagtca tcaaaatggg gacatacaga aaaaaaaaag 21480
gacactagag gaataatata ccctgactcc tagcctgatt aatatatcga t 21531
<210> 7
<211> 1614
<212> DNA
<213> Homo sapiens
<400> 7
gatctctatt tatttagcaa taatagagaa agcatttaag agaataaagc aatggaaata 60
agaaatttgt aaatttcctt ctgataacta gaaatagagg atccagtttc ttttggttaa 120
cctaaatttt atttcatttt attgttttat tttattttat tttattttat tttgtgtaat 180
cgtagtttca gagtgttaga gctgaaagga agaagtagga gaaacatgca aagtaaaagt 240
ataacacttt ccttactaaa ccgacatggg tttccaggta ggggcaggat tcaggatgac 300
tgacagggcc cttagggaac actgagaccc tacgctgacc tcataaatgc ttgctacctt 360
tgctgtttta attacatctt ttaatagcag gaagcagaac tctgcacttc aaaagttttt 420
cctcacctga ggagttaatt tagtacaagg ggaaaaagta cagggggatg ggagaaaggc 480
gatcacgttg ggaagctata gagaaagaag agtaaatttt agtaaaggag gtttaaacaa 540
acaaaatata aagagaaata ggaacttgaa tcaaggaaat gattttaaaa cgcagtattc 600
ttagtggact agaggaaaaa aataatctga gccaagtaga agaccttttc ccctcctacc 660
cctactttct aagtcacaga ggctttttgt tcccccagac actcttgcag attagtccag 720
gcagaaacag ttagatgtcc ccagttaacc tcctatttga caccactgat taccccattg 780
atagtcacac tttgggttgt aagtgacttt ttatttattt gtatttttga ctgcattaag 840
aggtctctag ttttttatct cttgtttccc aaaacctaat aagtaactaa tgcacagagc 900
acattgattt gtatttattc tatttttaga cataatttat tagcatgcat gagcaaatta 960
agaaaaacaa caacaaatga atgcatatat atgtatatgt atgtgtgtat atatacacac 1020
atatatatat atattttttc ttttcttacc agaaggtttt aatccaaata aggagaagat 1080
atgcttagaa ccgaggtaga gttttcatcc attctgtcct gtaagtattt tgcatattct 1140
ggagacgcag gaagagatcc atctacatat cccaaagctg aattatggta gacaaaactc 1200
ttccactttt agtgcatcaa cttcttattt gtgtaataag aaaattggga aaacgatctt 1260
caatatgctt accaagctgt gattccaaat attacgtaaa tacacttgca aaggaggatg 1320
tttttagtag caatttgtac tgatggtatg gggccaagag atatatctta gagggagggc 1380
tgagggtttg aagtccaact cctaagccag tgccagaaga gccaaggaca ggtacggctg 1440
tcatcactta gacctcaccc tgtggagcca caccctaggg ttggccaatc tactcccagg 1500
agcagggagg gcaggagcca gggctgggca taaaagtcag ggcagagcca tctattgctt 1560
acatttgctt ctgacacaac tgtgttcact agcaacctca aacagacacc atgg 1614
<210> 8
<211> 11
<212> PRT
<213> Artificial Sequence
<220>
<223> Her2-specific CDR
<400> 8
Lys Ala Ser Gln Asp Val Ser Ile Gly Val Ala
1 5 10
<210> 9
<211> 6
<212> PRT
<213> Artificial Sequence
<220>
<223> Her2-specific CDR
<400> 9
Ala Ser Tyr Arg Tyr Thr
1 5
<210> 10
<211> 9
<212> PRT
<213> Artificial Sequence
<220>
<223> Her2-specific CDR
<400> 10
Gln Gln Tyr Tyr Ile Tyr Pro Tyr Thr
1 5
<210> 11
<211> 10
<212> PRT
<213> Artificial Sequence
<220>
<223> Her2-specific CDR
<400> 11
Gly Phe Thr Phe Thr Asp Tyr Thr Met Asp
1 5 10
<210> 12
<211> 16
<212> PRT
<213> Artificial Sequence
<220>
<223> Her2-specific CDR
<400> 12
Asp Val Asn Pro Asn Ser Gly Gly Ser Ile Tyr Asn Gln Arg Phe Lys
1 5 10 15
<210> 13
<211> 9
<212> PRT
<213> Artificial Sequence
<220>
<223> Her2-specific CDR
<400> 13
Leu Gly Pro Ser Phe Tyr Phe Asp Tyr
1 5
<210> 14
<211> 15
<212> PRT
<213> Artificial Sequence
<220>
<223> PD-L1-specific CDR
<400> 14
Arg Ala Ser Lys Gly Val Ser Thr Ser Gly Tyr Ser Tyr Leu His
1 5 10 15
<210> 15
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> PD-L1-specific CDR
<400> 15
Leu Ala Ser Tyr Leu Glu Ser
1 5
<210> 16
<211> 9
<212> PRT
<213> Artificial Sequence
<220>
<223> PD-L1-specific CDR
<400> 16
Gln His Ser Arg Asp Leu Pro Leu Thr
1 5
<210> 17
<211> 5
<212> PRT
<213> Artificial Sequence
<220>
<223> PD-L1-specific CDR
<400> 17
Asn Tyr Tyr Met Tyr
1 5
<210> 18
<211> 17
<212> PRT
<213> Artificial Sequence
<220>
<223> PD-L1-specific CDR
<400> 18
Gly Ile Asn Pro Ser Asn Gly Gly Thr Asn Phe Asn Glu Lys Phe Lys
1 5 10 15
Asn
<210> 19
<211> 11
<212> PRT
<213> Artificial Sequence
<220>
<223> PD-L1-specific CDR
<400> 19
Arg Asp Tyr Arg Phe Asp Met Gly Phe Asp Tyr
1 5 10
<210> 20
<211> 120
<212> PRT
<213> Artificial Sequence
<220>
<223> Avelumab-specific variable heavy chain
<400> 20
Glu Val Gln Leu Leu Glu Ser Gly Gly Gly Leu Val Gln Pro Gly Gly
1 5 10 15
Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Phe Thr Phe Ser Ser Tyr
20 25 30
Ile Met Met Trp Val Arg Gln Ala Pro Gly Lys Gly Leu Glu Trp Val
35 40 45
Ser Ser Ile Tyr Pro Ser Gly Gly Ile Thr Phe Tyr Ala Asp Thr Val
50 55 60
Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ser Lys Asn Thr Leu Tyr
65 70 75 80
Leu Gln Met Asn Ser Leu Arg Ala Glu Asp Thr Ala Val Tyr Tyr Cys
85 90 95
Ala Arg Ile Lys Leu Gly Thr Val Thr Thr Val Asp Tyr Trp Gly Gln
100 105 110
Gly Thr Leu Val Thr Val Ser Ser
115 120
<210> 21
<211> 110
<212> PRT
<213> Artificial Sequence
<220>
<223> Avelumab-specific variable light chain
<400> 21
Gln Ser Ala Leu Thr Gln Pro Ala Ser Val Ser Gly Ser Pro Gly Gln
1 5 10 15
Ser Ile Thr Ile Ser Cys Thr Gly Thr Ser Ser Asp Val Gly Gly Tyr
20 25 30
Asn Tyr Val Ser Trp Tyr Gln Gln His Pro Gly Lys Ala Pro Lys Leu
35 40 45
Met Ile Tyr Asp Val Ser Asn Arg Pro Ser Gly Val Ser Asn Arg Phe
50 55 60
Ser Gly Ser Lys Ser Gly Asn Thr Ala Ser Leu Thr Ile Ser Gly Leu
65 70 75 80
Gln Ala Glu Asp Glu Ala Asp Tyr Tyr Cys Ser Ser Tyr Thr Ser Ser
85 90 95
Ser Thr Arg Val Phe Gly Thr Gly Thr Lys Val Thr Val Leu
100 105 110
<210> 22
<211> 11
<212> PRT
<213> Artificial Sequence
<220>
<223> Avelumab-specific CDR
<400> 22
Ser Gly Phe Thr Phe Ser Ser Tyr Ile Met Met
1 5 10
<210> 23
<211> 17
<212> PRT
<213> Artificial Sequence
<220>
<223> Avelumab-specific CDR
<400> 23
Ser Ile Tyr Pro Ser Gly Gly Ile Thr Phe Tyr Ala Asp Thr Val Lys
1 5 10 15
Gly
<210> 24
<211> 11
<212> PRT
<213> Artificial Sequence
<220>
<223> Avelumab-specific CDR
<400> 24
Ile Lys Leu Gly Thr Val Thr Thr Val Asp Tyr
1 5 10
<210> 25
<211> 14
<212> PRT
<213> Artificial Sequence
<220>
<223> Avelumab-specific CDR
<400> 25
Thr Gly Thr Ser Ser Asp Val Gly Gly Tyr Asn Tyr Val Ser
1 5 10
<210> 26
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Avelumab-specific CDR
<400> 26
Asp Val Ser Asn Arg Pro Ser
1 5
<210> 27
<211> 10
<212> PRT
<213> Artificial Sequence
<220>
<223> Avelumab-specific CDR
<400> 27
Ser Ser Tyr Thr Ser Ser Ser Thr Arg Val
1 5 10
<210> 28
<211> 118
<212> PRT
<213> Artificial Sequence
<220>
<223> Atezolizumab-specific variable heavy chain
<400> 28
Glu Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gln Pro Gly Gly
1 5 10 15
Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Phe Thr Phe Ser Asp Ser
20 25 30
Trp Ile His Trp Val Arg Gln Ala Pro Gly Lys Gly Leu Glu Trp Val
35 40 45
Ala Trp Ile Ser Pro Tyr Gly Gly Ser Thr Tyr Tyr Ala Asp Ser Val
50 55 60
Lys Gly Arg Phe Thr Ile Ser Ala Asp Thr Ser Lys Asn Thr Ala Tyr
65 70 75 80
Leu Gln Met Asn Ser Leu Arg Ala Glu Asp Thr Ala Val Tyr Tyr Cys
85 90 95
Ala Arg Arg His Trp Pro Gly Gly Phe Asp Tyr Trp Gly Gln Gly Thr
100 105 110
Leu Val Thr Val Ser Ser
115
<210> 29
<211> 107
<212> PRT
<213> Artificial Sequence
<220>
<223> Atezolizumab-specific variable light chain
<400> 29
Asp Ile Gln Met Thr Gln Ser Pro Ser Ser Leu Ser Ala Ser Val Gly
1 5 10 15
Asp Arg Val Thr Ile Thr Cys Arg Ala Ser Gln Asp Val Ser Thr Ala
20 25 30
Val Ala Trp Tyr Gln Gln Lys Pro Gly Lys Ala Pro Lys Leu Leu Ile
35 40 45
Tyr Ser Ala Ser Phe Leu Tyr Ser Gly Val Pro Ser Arg Phe Ser Gly
50 55 60
Ser Gly Ser Gly Thr Asp Phe Thr Leu Thr Ile Ser Ser Leu Gln Pro
65 70 75 80
Glu Asp Phe Ala Thr Tyr Tyr Cys Gln Gln Tyr Leu Tyr His Pro Ala
85 90 95
Thr Phe Gly Gln Gly Thr Lys Val Glu Ile Lys
100 105
<210> 30
<211> 11
<212> PRT
<213> Artificial Sequence
<220>
<223> Atezolizumab-specific CDR
<400> 30
Ser Gly Phe Thr Phe Ser Asp Ser Trp Ile His
1 5 10
<210> 31
<211> 17
<212> PRT
<213> Artificial Sequence
<220>
<223> Atezolizumab-specific CDR
<400> 31
Trp Ile Ser Pro Tyr Gly Gly Ser Thr Tyr Tyr Ala Asp Ser Val Lys
1 5 10 15
Gly
<210> 32
<211> 9
<212> PRT
<213> Artificial Sequence
<220>
<223> Atezolizumab-specific CDR
<400> 32
Arg His Trp Pro Gly Gly Phe Asp Tyr
1 5
<210> 33
<211> 11
<212> PRT
<213> Artificial Sequence
<220>
<223> Atezolizumab-specific CDR
<400> 33
Arg Ala Ser Gln Asp Val Ser Thr Ala Val Ala
1 5 10
<210> 34
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Atezolizumab-specific CDR
<400> 34
Ser Ala Ser Phe Leu Tyr Ser
1 5
<210> 35
<211> 9
<212> PRT
<213> Artificial Sequence
<220>
<223> Atezolizumab-specific CDR
<400> 35
Gln Gln Tyr Leu Tyr His Pro Ala Thr
1 5
<210> 36
<211> 11
<212> PRT
<213> Artificial Sequence
<220>
<223> PSMA-specific-CDR
<400> 36
Lys Ala Ser Gln Asp Val Gly Thr Ala Val Asp
1 5 10
<210> 37
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> PSMA-specific-CDR
<400> 37
Trp Ala Ser Thr Arg His Thr
1 5
<210> 38
<211> 9
<212> PRT
<213> Artificial Sequence
<220>
<223> PSMA-specific-CDR
<400> 38
Gln Gln Tyr Asn Ser Tyr Pro Leu Thr
1 5
<210> 39
<211> 10
<212> PRT
<213> Artificial Sequence
<220>
<223> PSMA-specific-CDR
<400> 39
Gly Tyr Thr Phe Thr Glu Tyr Thr Ile His
1 5 10
<210> 40
<211> 17
<212> PRT
<213> Artificial Sequence
<220>
<223> PSMA-specific-CDR
<400> 40
Asn Ile Asn Pro Asn Asn Gly Gly Thr Thr Tyr Asn Gln Lys Phe Glu
1 5 10 15
Asp
<210> 41
<211> 6
<212> PRT
<213> Artificial Sequence
<220>
<223> PSMA-specific-CDR
<400> 41
Gly Trp Asn Phe Asp Tyr
1 5
<210> 42
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> MUC16-specific-CDR
<400> 42
Ser Glu Asp Ile Tyr Ser Gly
1 5
<210> 43
<211> 8
<212> PRT
<213> Artificial Sequence
<220>
<223> MUC16-specific-CDR
<400> 43
Gly Tyr Ser Tyr Ser Ser Thr Leu
1 5
<210> 44
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> MUC16-specific-CDR
<400> 44
Thr Leu Gly Met Gly Val Gly
1 5
<210> 45
<211> 16
<212> PRT
<213> Artificial Sequence
<220>
<223> MUC16-specific-CDR
<400> 45
His Ile Trp Trp Asp Asp Asp Lys Tyr Tyr Asn Pro Ala Leu Lys Ser
1 5 10 15
<210> 46
<211> 12
<212> PRT
<213> Artificial Sequence
<220>
<223> MUC16-specific-CDR
<400> 46
Ile Gly Thr Ala Gln Ala Thr Asp Ala Leu Asp Tyr
1 5 10
<210> 47
<211> 15
<212> PRT
<213> Artificial Sequence
<220>
<223> FOLR-specific-CDR
<400> 47
Lys Ala Ser Gln Ser Val Ser Phe Ala Gly Thr Ser Leu Met His
1 5 10 15
<210> 48
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> FOLR-specific-CDR
<400> 48
Arg Ala Ser Asn Leu Glu Ala
1 5
<210> 49
<211> 9
<212> PRT
<213> Artificial Sequence
<220>
<223> FOLR-specific-CDR
<400> 49
Gln Gln Ser Arg Glu Tyr Pro Tyr Thr
1 5
<210> 50
<211> 5
<212> PRT
<213> Artificial Sequence
<220>
<223> FOLR-specific-CDR
<400> 50
Gly Tyr Phe Met Asn
1 5
<210> 51
<211> 17
<212> PRT
<213> Artificial Sequence
<220>
<223> FOLR-specific-CDR
<400> 51
Arg Ile His Pro Tyr Asp Gly Asp Thr Phe Tyr Asn Gln Lys Phe Gln
1 5 10 15
Gly
<210> 52
<211> 9
<212> PRT
<213> Artificial Sequence
<220>
<223> FOLR-specific-CDR
<400> 52
Tyr Asp Gly Ser Arg Ala Met Asp Tyr
1 5
<210> 53
<211> 119
<212> PRT
<213> Artificial Sequence
<220>
<223> Amatuximab-specific variable heavy chain
<400> 53
Gln Val Gln Leu Gln Gln Ser Gly Pro Glu Leu Glu Lys Pro Gly Ala
1 5 10 15
Ser Val Lys Ile Ser Cys Lys Ala Ser Gly Tyr Ser Phe Thr Gly Tyr
20 25 30
Thr Met Asn Trp Val Lys Gln Ser His Gly Lys Ser Leu Glu Trp Ile
35 40 45
Gly Leu Ile Thr Pro Tyr Asn Gly Ala Ser Ser Tyr Asn Gln Lys Phe
50 55 60
Arg Gly Lys Ala Thr Leu Thr Val Asp Lys Ser Ser Ser Thr Ala Tyr
65 70 75 80
Met Asp Leu Leu Ser Leu Thr Ser Glu Asp Ser Ala Val Tyr Phe Cys
85 90 95
Ala Arg Gly Gly Tyr Asp Gly Arg Gly Phe Asp Tyr Trp Gly Ser Gly
100 105 110
Thr Pro Val Thr Val Ser Ser
115
<210> 54
<211> 106
<212> PRT
<213> Artificial Sequence
<220>
<223> Amatuximab-specific variable light chain
<400> 54
Asp Ile Glu Leu Thr Gln Ser Pro Ala Ile Met Ser Ala Ser Pro Gly
1 5 10 15
Glu Lys Val Thr Met Thr Cys Ser Ala Ser Ser Ser Val Ser Tyr Met
20 25 30
His Trp Tyr Gln Gln Lys Ser Gly Thr Ser Pro Lys Arg Trp Ile Tyr
35 40 45
Asp Thr Ser Lys Leu Ala Ser Gly Val Pro Gly Arg Phe Ser Gly Ser
50 55 60
Gly Ser Gly Asn Ser Tyr Ser Leu Thr Ile Ser Ser Val Glu Ala Glu
65 70 75 80
Asp Asp Ala Thr Tyr Tyr Cys Gln Gln Trp Ser Lys His Pro Leu Thr
85 90 95
Phe Gly Ser Gly Thr Lys Val Glu Ile Lys
100 105
<210> 55
<211> 10
<212> PRT
<213> Artificial Sequence
<220>
<223> Amatuximab-specific CDR
<400> 55
Gly Tyr Ser Phe Thr Gly Tyr Thr Met Asn
1 5 10
<210> 56
<211> 13
<212> PRT
<213> Artificial Sequence
<220>
<223> Amatuximab-specific CDR
<400> 56
Leu Ile Thr Pro Tyr Asn Gly Ala Ser Ser Tyr Asn Gln
1 5 10
<210> 57
<211> 10
<212> PRT
<213> Artificial Sequence
<220>
<223> Amatuximab-specific CDR
<400> 57
Gly Gly Tyr Asp Gly Arg Gly Phe Asp Tyr
1 5 10
<210> 58
<211> 10
<212> PRT
<213> Artificial Sequence
<220>
<223> Amatuximab-specific CDR
<400> 58
Ser Ala Ser Ser Ser Val Ser Tyr Met His
1 5 10
<210> 59
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Amatuximab-specific CDR
<400> 59
Asp Thr Ser Lys Leu Ala Ser
1 5
<210> 60
<211> 9
<212> PRT
<213> Artificial Sequence
<220>
<223> Amatuximab-specific CDR
<400> 60
Gln Gln Trp Ser Lys His Pro Leu Thr
1 5
<210> 61
<211> 32
<212> PRT
<213> Artificial Sequence
<220>
<223> Nef
<400> 61
Val Gly Phe Pro Val Thr Pro Gln Val Pro Leu Arg Pro Met Thr Tyr
1 5 10 15
Lys Ala Ala Val Asp Leu Ser His Phe Leu Lys Glu Lys Gly Gly Leu
20 25 30
<210> 62
<211> 30
<212> PRT
<213> Artificial Sequence
<220>
<223> Nef
<400> 62
His Thr Gln Gly Tyr Phe Pro Asp Trp Gln Asn Tyr Thr Pro Gly Pro
1 5 10 15
Gly Val Arg Tyr Pro Leu Thr Phe Gly Trp Leu Tyr Lys Leu
20 25 30
<210> 63
<211> 19
<212> PRT
<213> Artificial Sequence
<220>
<223> Gag p17
<400> 63
Glu Lys Ile Arg Leu Arg Pro Gly Gly Lys Lys Lys Tyr Lys Leu Lys
1 5 10 15
His Ile Val
<210> 64
<211> 32
<212> PRT
<213> Artificial Sequence
<220>
<223> Gag p17-p24
<400> 64
Asn Pro Pro Ile Pro Val Gly Glu Ile Tyr Lys Arg Trp Ile Ile Leu
1 5 10 15
Gly Leu Asn Lys Ile Val Arg Met Tyr Ser Pro Thr Ser Ile Leu Asp
20 25 30
<210> 65
<211> 31
<212> PRT
<213> Artificial Sequence
<220>
<223> Pol
<400> 65
Ala Ile Phe Gln Ser Ser Met Thr Lys Ile Leu Glu Pro Phe Arg Lys
1 5 10 15
Gln Asn Pro Asp Ile Val Ile Tyr Gln Tyr Met Asp Asp Leu Tyr
20 25 30
<210> 66
<211> 74
<212> DNA
<213> Artificial Sequence
<220>
<223> IR/DR and chromosomal sequence of Sleeping Beauty
<400> 66
acttaagtgt atgtaaactt ccgacttcaa ctgtagggta cctgattctc tgggcatctc 60
tgcccactac catg 74
<210> 67
<211> 75
<212> DNA
<213> Artificial Sequence
<220>
<223> IR/DR and chromosomal sequence of Sleeping Beauty
<400> 67
acttaagtgt atgtaaactt ccgacttcaa ctgtaaattt tccacctttt tcagttttcc 60
tcgccatatt tcatg 75
<210> 68
<211> 33
<212> DNA
<213> Artificial Sequence
<220>
<223> IR/DR and chromosomal sequence of Sleeping Beauty
<400> 68
acttaagtgt atgtaaactt ccgacttcaa ctg 33
<210> 69
<211> 370
<212> DNA
<213> Artificial Sequence
<220>
<223> IR/DR and chromosomal sequence of Sleeping Beauty
<400> 69
cagtcaactt agtgtatgta aacttctgac ccactggaat tgtgatacag tgaattataa 60
gtgaaataat ctgtctgtaa acaattgttg gaaaaatgac ttgtgtcatg cacaaagtag 120
atgtcctaac tgacttgcca aaactattgt ttgttaacaa gaaatttgtg gagtagttga 180
aaaacgagtt ttaatgactc caacttaagt gtatgtaaac ttccgacttc aactgtaaga 240
atggcccatt catctatagt agcacacaat atttgcattt gtgcgacagt ataagggaca 300
attatgctat caggcatttt tccaaagtga gtaatcgaag tttttatacc tttgtgtgcc 360
atgtttgcta 370
<210> 70
<211> 369
<212> DNA
<213> Artificial Sequence
<220>
<223> IR/DR and chromosomal sequence of Sleeping Beauty
<400> 70
cagtcaactt agtgtatgta aacttctgac ccactggaat tgtgatacag tgaattataa 60
gtgaaataat ctgtctgtaa acaattgttg gaaaaatgac ttgtgtcatg cacaaagtag 120
atgtcctaac tgacttgcca aaactattgt ttgttaacaa gaaatttgtg gagtagttga 180
aaaacgagtt ttaatgactc caacttaagt gtatgtaaac ttccgacttc aactgtacaa 240
gtagaccaaa tatccatata cataaaagaa aaaaatagaa aaaatttcta gtgacagaaa 300
aatgacaaag aacatactgc tttattacta ctattaagat gtttgcttcc attacactca 360
tatgagtca 369
<210> 71
<211> 227
<212> DNA
<213> Artificial Sequence
<220>
<223> IR/DR of Sleeping Beauty
<400> 71
ttagtgtatg taaacttctg acccactgga attgtgatac agtgaattat aagtgaaata 60
atctgtctgt aaacaattgt tggaaaaatg acttgtgtca tgcacaaagt agatgtccta 120
actgacttgc caaaactatt gtttgttaac aagaaatttg tggagtagtt gaaaaacgag 180
ttttaatgac tccaacttaa gtgtatgtaa acttccgact tcaactg 227
<210> 72
<211> 371
<212> DNA
<213> Artificial Sequence
<220>
<223> IR/DR and chromosomal sequence of Sleeping Beauty
<400> 72
caacttgagt gtatgttaac ttctgaccca ctgggaatgt gatgaaagaa ataaaagctg 60
aaatgaatca ttctctctac tattattctg atatttcaca ttcttaaaat aaagtggtga 120
tcctaactga ccttaagaca gggaatcttt actcggatta aatgtcagga attgtgaaaa 180
agtgagttta aatgtatttg gctaaggtgt atgtaaactt ccgacttcaa ctgtatatcc 240
tccccgttgc accctcttga tgatgctgag atgaacacag atgctcactc cttgagggct 300
ctaagcttat gctgacacag acacaggtgc tcacttctat gaatggccta agatttgagg 360
acatcatgag g 371
<210> 73
<211> 229
<212> DNA
<213> Artificial Sequence
<220>
<223> IR/DR of Sleeping Beauty
<400> 73
ttgagtgtat gttaacttct gacccactgg gaatgtgatg aaagaaataa aagctgaaat 60
gaatcattct ctctactatt attctgatat ttcacattct taaaataaag tggtgatcct 120
aactgacctt aagacaggga atctttactc ggattaaatg tcaggaattg tgaaaaagtg 180
agtttaaatg tatttggcta aggtgtatgt aaacttccga cttcaactg 229
<210> 74
<211> 340
<212> PRT
<213> Artificial Sequence
<220>
<223> Sleeping Beauty transposase enzyme
<400> 74
Met Gly Lys Ser Lys Glu Ile Ser Gln Asp Leu Arg Lys Lys Ile Val
1 5 10 15
Asp Leu His Lys Ser Gly Ser Ser Leu Gly Ala Ile Ser Lys Arg Leu
20 25 30
Lys Val Pro Arg Ser Ser Val Gln Thr Ile Val Arg Lys Tyr Lys His
35 40 45
His Gly Thr Thr Gln Pro Ser Tyr Arg Ser Gly Arg Arg Arg Tyr Leu
50 55 60
Ser Pro Arg Asp Glu Arg Thr Leu Val Arg Lys Val Gln Ile Asn Pro
65 70 75 80
Arg Thr Thr Ala Lys Asp Leu Val Lys Met Leu Glu Glu Thr Gly Thr
85 90 95
Lys Val Ser Ile Ser Thr Val Lys Arg Val Leu Tyr Arg His Asn Leu
100 105 110
Lys Gly Arg Ser Ala Arg Lys Lys Pro Leu Leu Gln Asn Arg His Lys
115 120 125
Lys Ala Arg Leu Arg Phe Ala Thr Ala His Gly Asp Lys Asp Arg Thr
130 135 140
Phe Trp Arg Asn Val Leu Trp Ser Asp Glu Thr Lys Ile Glu Leu Phe
145 150 155 160
Gly His Asn Asp His Arg Tyr Val Trp Arg Lys Lys Gly Glu Ala Cys
165 170 175
Lys Pro Lys Asn Thr Ile Pro Thr Val Lys His Gly Gly Gly Ser Ile
180 185 190
Met Leu Trp Gly Cys Phe Ala Ala Gly Gly Thr Gly Ala Leu His Lys
195 200 205
Ile Asp Gly Ile Met Arg Lys Glu Asn Tyr Val Asp Ile Leu Lys Gln
210 215 220
His Leu Lys Thr Ser Val Arg Lys Leu Lys Leu Gly Arg Lys Trp Val
225 230 235 240
Phe Gln Met Asp Asn Asp Pro Lys His Thr Ser Lys Val Val Ala Lys
245 250 255
Trp Leu Lys Asp Asn Lys Val Lys Val Leu Glu Trp Pro Ser Gln Ser
260 265 270
Pro Asp Leu Asn Pro Ile Glu Asn Leu Trp Ala Glu Leu Lys Lys Arg
275 280 285
Val Arg Ala Arg Arg Pro Thr Asn Leu Thr Gln Leu His Gln Leu Cys
290 295 300
Gln Glu Glu Trp Ala Lys Ile His Pro Thr Tyr Cys Gly Lys Leu Val
305 310 315 320
Glu Gly Tyr Pro Lys Arg Leu Thr Gln Val Lys Gln Phe Lys Gly Asn
325 330 335
Ala Thr Lys Tyr
340
<210> 75
<211> 340
<212> PRT
<213> Artificial Sequence
<220>
<223> Hyperactive Sleeping Beauty is SB100X
<400> 75
Met Gly Lys Ser Lys Glu Ile Ser Gln Asp Leu Arg Lys Arg Ile Val
1 5 10 15
Asp Leu His Lys Ser Gly Ser Ser Leu Gly Ala Ile Ser Lys Arg Leu
20 25 30
Ala Val Pro Arg Ser Ser Val Gln Thr Ile Val Arg Lys Tyr Lys His
35 40 45
His Gly Thr Thr Gln Pro Ser Tyr Arg Ser Gly Arg Arg Arg Tyr Leu
50 55 60
Ser Pro Arg Asp Glu Arg Thr Leu Val Arg Lys Val Gln Ile Asn Pro
65 70 75 80
Arg Thr Thr Ala Lys Asp Leu Val Lys Met Leu Glu Glu Thr Gly Thr
85 90 95
Lys Val Ser Ile Ser Thr Val Lys Arg Val Leu Tyr Arg His Asn Leu
100 105 110
Lys Gly His Ser Ala Arg Lys Lys Pro Leu Leu Gln Asn Arg His Lys
115 120 125
Lys Ala Arg Leu Arg Phe Ala Thr Ala His Gly Asp Lys Asp Arg Thr
130 135 140
Phe Trp Arg Asn Val Leu Trp Ser Asp Glu Thr Lys Ile Glu Leu Phe
145 150 155 160
Gly His Asn Asp His Arg Tyr Val Trp Arg Lys Lys Gly Glu Ala Cys
165 170 175
Lys Pro Lys Asn Thr Ile Pro Thr Val Lys His Gly Gly Gly Ser Ile
180 185 190
Met Leu Trp Gly Cys Phe Ala Ala Gly Gly Thr Gly Ala Leu His Lys
195 200 205
Ile Asp Gly Ile Met Asp Ala Val Gln Tyr Val Asp Ile Leu Lys Gln
210 215 220
His Leu Lys Thr Ser Val Arg Lys Leu Lys Leu Gly Arg Lys Trp Val
225 230 235 240
Phe Gln His Asp Asn Asp Pro Lys His Thr Ser Lys Val Val Ala Lys
245 250 255
Trp Leu Lys Asp Asn Lys Val Lys Val Leu Glu Trp Pro Ser Gln Ser
260 265 270
Pro Asp Leu Asn Pro Ile Glu Asn Leu Trp Ala Glu Leu Lys Lys Arg
275 280 285
Val Arg Ala Arg Arg Pro Thr Asn Leu Thr Gln Leu His Gln Leu Cys
290 295 300
Gln Glu Glu Trp Ala Lys Ile His Pro Asn Tyr Cys Gly Lys Leu Val
305 310 315 320
Glu Gly Tyr Pro Lys Arg Leu Thr Gln Val Lys Gln Phe Lys Gly Asn
325 330 335
Ala Thr Lys Tyr
340
<210> 76
<211> 594
<212> PRT
<213> Richoplusia ni
<400> 76
Met Gly Ser Ser Leu Asp Asp Glu His Ile Leu Ser Ala Leu Leu Gln
1 5 10 15
Ser Asp Asp Glu Leu Val Gly Glu Asp Ser Asp Ser Glu Ile Ser Asp
20 25 30
His Val Ser Glu Asp Asp Val Gln Ser Asp Thr Glu Glu Ala Phe Ile
35 40 45
Asp Glu Val His Glu Val Gln Pro Thr Ser Ser Gly Ser Glu Ile Leu
50 55 60
Asp Glu Gln Asn Val Ile Glu Gln Pro Gly Ser Ser Leu Ala Ser Asn
65 70 75 80
Arg Ile Leu Thr Leu Pro Gln Arg Thr Ile Arg Gly Lys Asn Lys His
85 90 95
Cys Trp Ser Thr Ser Lys Ser Thr Arg Arg Ser Arg Val Ser Ala Leu
100 105 110
Asn Ile Val Arg Ser Gln Arg Gly Pro Thr Arg Met Cys Arg Asn Ile
115 120 125
Tyr Asp Pro Leu Leu Cys Phe Lys Leu Phe Phe Thr Asp Glu Ile Ile
130 135 140
Ser Glu Ile Val Lys Trp Thr Asn Ala Glu Ile Ser Leu Lys Arg Arg
145 150 155 160
Glu Ser Met Thr Gly Ala Thr Phe Arg Asp Thr Asn Glu Asp Glu Ile
165 170 175
Tyr Ala Phe Phe Gly Ile Leu Val Met Thr Ala Val Arg Lys Asp Asn
180 185 190
His Met Ser Thr Asp Asp Leu Phe Asp Arg Ser Leu Ser Met Val Tyr
195 200 205
Val Ser Val Met Ser Arg Asp Arg Phe Asp Phe Leu Ile Arg Cys Leu
210 215 220
Arg Met Asp Asp Lys Ser Ile Arg Pro Thr Leu Arg Glu Asn Asp Val
225 230 235 240
Phe Thr Pro Val Arg Lys Ile Trp Asp Leu Phe Ile His Gln Cys Ile
245 250 255
Gln Asn Tyr Thr Pro Gly Ala His Leu Thr Ile Asp Glu Gln Leu Leu
260 265 270
Gly Phe Arg Gly Arg Cys Pro Phe Arg Met Tyr Ile Pro Asn Lys Pro
275 280 285
Ser Lys Tyr Gly Ile Lys Ile Leu Met Met Cys Asp Ser Gly Thr Lys
290 295 300
Tyr Met Ile Asn Gly Met Pro Tyr Leu Gly Arg Gly Thr Gln Thr Asn
305 310 315 320
Gly Val Pro Leu Gly Glu Tyr Tyr Val Lys Glu Leu Ser Lys Pro Val
325 330 335
His Gly Ser Cys Arg Asn Ile Thr Cys Asp Asn Trp Phe Thr Ser Ile
340 345 350
Pro Leu Ala Lys Asn Leu Leu Gln Glu Pro Tyr Lys Leu Thr Ile Val
355 360 365
Gly Thr Val Arg Ser Asn Lys Arg Glu Ile Pro Glu Val Leu Lys Asn
370 375 380
Ser Arg Ser Arg Pro Val Gly Thr Ser Met Phe Cys Phe Asp Gly Pro
385 390 395 400
Leu Thr Leu Val Ser Tyr Lys Pro Lys Pro Ala Lys Met Val Tyr Leu
405 410 415
Leu Ser Ser Cys Asp Glu Asp Ala Ser Ile Asn Glu Ser Thr Gly Lys
420 425 430
Pro Gln Met Val Met Tyr Tyr Asn Gln Thr Lys Gly Gly Val Asp Thr
435 440 445
Leu Asp Gln Met Cys Ser Val Met Thr Cys Ser Arg Lys Thr Asn Arg
450 455 460
Trp Pro Met Ala Leu Leu Tyr Gly Met Ile Asn Ile Ala Cys Ile Asn
465 470 475 480
Ser Phe Ile Ile Tyr Ser His Asn Val Ser Ser Lys Gly Glu Lys Val
485 490 495
Gln Ser Arg Lys Lys Phe Met Arg Asn Leu Tyr Met Ser Leu Thr Ser
500 505 510
Ser Phe Met Arg Lys Arg Leu Glu Ala Pro Thr Leu Lys Arg Tyr Leu
515 520 525
Arg Asp Asn Ile Ser Asn Ile Leu Pro Asn Glu Val Pro Gly Thr Ser
530 535 540
Asp Asp Ser Thr Glu Glu Pro Val Met Lys Lys Arg Thr Tyr Cys Thr
545 550 555 560
Tyr Cys Pro Ser Lys Ile Arg Arg Lys Ala Asn Ala Ser Cys Lys Lys
565 570 575
Cys Lys Lys Val Ile Cys Arg Glu His Asn Ile Asp Met Cys Gln Ser
580 585 590
Cys Phe
<210> 77
<211> 340
<212> PRT
<213> Rana pipiens
<400> 77
Met Pro Arg Pro Lys Glu Ile Gln Glu Gln Leu Arg Lys Lys Val Ile
1 5 10 15
Glu Ile Tyr Gln Ser Gly Lys Gly Tyr Lys Ala Ile Ser Lys Ala Leu
20 25 30
Gly Ile Gln Arg Thr Thr Val Arg Ala Ile Ile His Lys Trp Arg Arg
35 40 45
His Gly Thr Val Val Asn Leu Pro Arg Ser Gly Arg Pro Pro Lys Ile
50 55 60
Thr Pro Arg Ala Gln Arg Arg Leu Ile Gln Glu Val Thr Lys Asp Pro
65 70 75 80
Thr Thr Thr Ser Lys Glu Leu Gln Ala Ser Leu Ala Ser Val Lys Val
85 90 95
Ser Val His Ala Ser Thr Ile Arg Lys Arg Leu Gly Lys Asn Gly Leu
100 105 110
His Gly Arg Val Pro Arg Arg Lys Pro Leu Leu Ser Lys Lys Asn Ile
115 120 125
Lys Ala Arg Leu Asn Phe Ser Thr Thr His Leu Asp Asp Pro Gln Asp
130 135 140
Phe Trp Asp Asn Ile Leu Trp Thr Asp Glu Thr Lys Val Glu Leu Phe
145 150 155 160
Gly Arg Cys Val Ser Lys Tyr Ile Trp Arg Arg Arg Asn Thr Ala Phe
165 170 175
His Lys Lys Asn Ile Ile Pro Thr Val Lys Tyr Gly Gly Gly Ser Val
180 185 190
Met Val Trp Gly Cys Phe Ala Ala Ser Gly Pro Gly Arg Leu Ala Val
195 200 205
Ile Lys Gly Thr Met Asn Ser Ala Val Tyr Gln Glu Ile Leu Lys Glu
210 215 220
Asn Val Arg Pro Ser Val Arg Val Leu Lys Leu Lys Arg Thr Trp Val
225 230 235 240
Leu Gln Gln Asp Asn Asp Pro Lys His Thr Ser Lys Ser Thr Thr Glu
245 250 255
Trp Leu Lys Lys Asn Lys Met Lys Thr Leu Glu Trp Pro Ser Gln Ser
260 265 270
Pro Asp Leu Asn Pro Ile Glu Met Leu Trp Tyr Asp Leu Lys Lys Ala
275 280 285
Val His Ala Arg Lys Pro Ser Asn Val Thr Glu Leu Gly Gln Phe Cys
290 295 300
Lys Asp Glu Trp Ala Lys Ile Pro Pro Gly Arg Cys Lys Ser Leu Ile
305 310 315 320
Ala Arg Tyr Arg Lys Arg Leu Val Ala Val Val Ala Ala Lys Gly Gly
325 330 335
Pro Thr Ser Tyr
340
<210> 78
<211> 636
<212> PRT
<213> Tribolium castaneum
<400> 78
Met Met Leu Asn Trp Leu Lys Ser Gly Lys Leu Glu Ser Gln Ser Gln
1 5 10 15
Glu Gln Ser Ser Cys Tyr Leu Glu Asn Ser Asn Cys Leu Pro Pro Thr
20 25 30
Leu Asp Ser Thr Asp Ile Ile Gly Glu Glu Asn Lys Ala Gly Thr Thr
35 40 45
Ser Arg Lys Lys Arg Lys Tyr Asp Glu Asp Tyr Leu Asn Phe Gly Phe
50 55 60
Thr Trp Thr Gly Asp Lys Asp Glu Pro Asn Gly Leu Cys Val Ile Cys
65 70 75 80
Glu Gln Val Val Asn Asn Ser Ser Leu Asn Pro Ala Lys Leu Lys Arg
85 90 95
His Leu Asp Thr Lys His Pro Thr Leu Lys Gly Lys Ser Glu Tyr Phe
100 105 110
Lys Arg Lys Cys Asn Glu Leu Asn Gln Lys Lys His Thr Phe Glu Arg
115 120 125
Tyr Val Arg Asp Asp Asn Lys Asn Leu Leu Lys Ala Ser Tyr Leu Val
130 135 140
Ser Leu Arg Ile Ala Lys Gln Gly Glu Ala Tyr Thr Ile Ala Glu Lys
145 150 155 160
Leu Ile Lys Pro Cys Thr Lys Asp Leu Thr Thr Cys Val Phe Gly Glu
165 170 175
Lys Phe Ala Ser Lys Val Asp Leu Val Pro Leu Ser Asp Thr Thr Ile
180 185 190
Ser Arg Arg Ile Glu Asp Met Ser Tyr Phe Cys Glu Ala Val Leu Val
195 200 205
Asn Arg Leu Lys Asn Ala Lys Cys Gly Phe Thr Leu Gln Met Asp Glu
210 215 220
Ser Thr Asp Val Ala Gly Leu Ala Ile Leu Leu Val Phe Val Arg Tyr
225 230 235 240
Ile His Glu Ser Ser Phe Glu Glu Asp Met Leu Phe Cys Lys Ala Leu
245 250 255
Pro Thr Gln Thr Thr Gly Glu Glu Ile Phe Asn Leu Leu Asn Ala Tyr
260 265 270
Phe Glu Lys His Ser Ile Pro Trp Asn Leu Cys Tyr His Ile Cys Thr
275 280 285
Asp Gly Ala Lys Ala Met Val Gly Val Ile Lys Gly Val Ile Ala Arg
290 295 300
Ile Lys Lys Leu Val Pro Asp Ile Lys Ala Ser His Cys Cys Leu His
305 310 315 320
Arg His Ala Leu Ala Val Lys Arg Ile Pro Asn Ala Leu His Glu Val
325 330 335
Leu Asn Asp Ala Val Lys Met Ile Asn Phe Ile Lys Ser Arg Pro Leu
340 345 350
Asn Ala Arg Val Phe Ala Leu Leu Cys Asp Asp Leu Gly Ser Leu His
355 360 365
Lys Asn Leu Leu Leu His Thr Glu Val Arg Trp Leu Ser Arg Gly Lys
370 375 380
Val Leu Thr Arg Phe Trp Glu Leu Arg Asp Glu Ile Arg Ile Phe Phe
385 390 395 400
Asn Glu Arg Glu Phe Ala Gly Lys Leu Asn Asp Thr Ser Trp Leu Gln
405 410 415
Asn Leu Ala Tyr Ile Ala Asp Ile Phe Ser Tyr Leu Asn Glu Val Asn
420 425 430
Leu Ser Leu Gln Gly Pro Asn Ser Thr Ile Phe Lys Val Asn Ser Arg
435 440 445
Ile Asn Ser Ile Lys Ser Lys Leu Lys Leu Trp Glu Glu Cys Ile Thr
450 455 460
Lys Asn Asn Thr Glu Cys Phe Ala Asn Leu Asn Asp Phe Leu Glu Thr
465 470 475 480
Ser Asn Thr Ala Leu Asp Pro Asn Leu Lys Ser Asn Ile Leu Glu His
485 490 495
Leu Asn Gly Leu Lys Asn Thr Phe Leu Glu Tyr Phe Pro Pro Thr Cys
500 505 510
Asn Asn Ile Ser Trp Val Glu Asn Pro Phe Asn Glu Cys Gly Asn Val
515 520 525
Asp Thr Leu Pro Ile Lys Glu Arg Glu Gln Leu Ile Asp Ile Arg Thr
530 535 540
Asp Thr Thr Leu Lys Ser Ser Phe Val Pro Asp Gly Ile Gly Pro Phe
545 550 555 560
Trp Ile Lys Leu Met Asp Glu Phe Pro Glu Ile Ser Lys Arg Ala Val
565 570 575
Lys Glu Leu Met Pro Phe Val Thr Thr Tyr Leu Cys Glu Lys Ser Phe
580 585 590
Ser Val Tyr Val Ala Thr Lys Thr Lys Tyr Arg Asn Arg Leu Asp Ala
595 600 605
Glu Asp Asp Met Arg Leu Gln Leu Thr Thr Ile His Pro Asp Ile Asp
610 615 620
Asn Leu Cys Asn Asn Lys Gln Ala Gln Lys Ser His
625 630 635
<210> 79
<211> 649
<212> PRT
<213> Oryzias latipes
<400> 79
Met Glu Glu Val Cys Asp Ser Ser Ala Ala Ala Ser Ser Thr Val Gln
1 5 10 15
Asn Gln Pro Gln Asp Gln Glu His Pro Trp Pro Tyr Leu Arg Glu Phe
20 25 30
Phe Ser Leu Ser Gly Val Asn Lys Asp Ser Phe Lys Met Lys Cys Val
35 40 45
Leu Cys Leu Pro Leu Asn Lys Glu Ile Ser Ala Phe Lys Ser Ser Pro
50 55 60
Ser Asn Leu Arg Lys His Ile Glu Arg Met His Pro Asn Tyr Leu Lys
65 70 75 80
Asn Tyr Ser Lys Leu Thr Ala Gln Lys Arg Lys Ile Gly Thr Ser Thr
85 90 95
His Ala Ser Ser Ser Lys Gln Leu Lys Val Asp Ser Val Phe Pro Val
100 105 110
Lys His Val Ser Pro Val Thr Val Asn Lys Ala Ile Leu Arg Tyr Ile
115 120 125
Ile Gln Gly Leu His Pro Phe Ser Thr Val Asp Leu Pro Ser Phe Lys
130 135 140
Glu Leu Ile Ser Thr Leu Gln Pro Gly Ile Ser Val Ile Thr Arg Pro
145 150 155 160
Thr Leu Arg Ser Lys Ile Ala Glu Ala Ala Leu Ile Met Lys Gln Lys
165 170 175
Val Thr Ala Ala Met Ser Glu Val Glu Trp Ile Ala Thr Thr Thr Asp
180 185 190
Cys Trp Thr Ala Arg Arg Lys Ser Phe Ile Gly Val Thr Ala His Trp
195 200 205
Ile Asn Pro Gly Ser Leu Glu Arg His Ser Ala Ala Leu Ala Cys Lys
210 215 220
Arg Leu Met Gly Ser His Thr Phe Glu Val Leu Ala Ser Ala Met Asn
225 230 235 240
Asp Ile His Ser Glu Tyr Glu Ile Arg Asp Lys Val Val Cys Thr Thr
245 250 255
Thr Asp Ser Gly Ser Asn Phe Met Lys Ala Phe Arg Val Phe Gly Val
260 265 270
Glu Asn Asn Asp Ile Glu Thr Glu Ala Arg Arg Cys Glu Ser Asp Asp
275 280 285
Thr Asp Ser Glu Gly Cys Gly Glu Gly Ser Asp Gly Val Glu Phe Gln
290 295 300
Asp Ala Ser Arg Val Leu Asp Gln Asp Asp Gly Phe Glu Phe Gln Leu
305 310 315 320
Pro Lys His Gln Lys Cys Ala Cys His Leu Leu Asn Leu Val Ser Ser
325 330 335
Val Asp Ala Gln Lys Ala Leu Ser Asn Glu His Tyr Lys Lys Leu Tyr
340 345 350
Arg Ser Val Phe Gly Lys Cys Gln Ala Leu Trp Asn Lys Ser Ser Arg
355 360 365
Ser Ala Leu Ala Ala Glu Ala Val Glu Ser Glu Ser Arg Leu Gln Leu
370 375 380
Leu Arg Pro Asn Gln Thr Arg Trp Asn Ser Thr Phe Met Ala Val Asp
385 390 395 400
Arg Ile Leu Gln Ile Cys Lys Glu Ala Gly Glu Gly Ala Leu Arg Asn
405 410 415
Ile Cys Thr Ser Leu Glu Val Pro Met Phe Asn Pro Ala Glu Met Leu
420 425 430
Phe Leu Thr Glu Trp Ala Asn Thr Met Arg Pro Val Ala Lys Val Leu
435 440 445
Asp Ile Leu Gln Ala Glu Thr Asn Thr Gln Leu Gly Trp Leu Leu Pro
450 455 460
Ser Val His Gln Leu Ser Leu Lys Leu Gln Arg Leu His His Ser Leu
465 470 475 480
Arg Tyr Cys Asp Pro Leu Val Asp Ala Leu Gln Gln Gly Ile Gln Thr
485 490 495
Arg Phe Lys His Met Phe Glu Asp Pro Glu Ile Ile Ala Ala Ala Ile
500 505 510
Leu Leu Pro Lys Phe Arg Thr Ser Trp Thr Asn Asp Glu Thr Ile Ile
515 520 525
Lys Arg Gly Met Asp Tyr Ile Arg Val His Leu Glu Pro Leu Asp His
530 535 540
Lys Lys Glu Leu Ala Asn Ser Ser Ser Asp Asp Glu Asp Phe Phe Ala
545 550 555 560
Ser Leu Lys Pro Thr Thr His Glu Ala Ser Lys Glu Leu Asp Gly Tyr
565 570 575
Leu Ala Cys Val Ser Asp Thr Arg Glu Ser Leu Leu Thr Phe Pro Ala
580 585 590
Ile Cys Ser Leu Ser Ile Lys Thr Asn Thr Pro Leu Pro Ala Ser Ala
595 600 605
Ala Cys Glu Arg Leu Phe Ser Thr Ala Gly Leu Leu Phe Ser Pro Lys
610 615 620
Arg Ala Arg Leu Asp Thr Asn Asn Phe Glu Asn Gln Leu Leu Leu Lys
625 630 635 640
Leu Asn Leu Arg Phe Tyr Asn Phe Glu
645
<210> 80
<211> 348
<212> DNA
<213> Artificial Sequence
<220>
<223> SV40 promoter
<400> 80
ggtgtggaaa gtccccaggc tccccagcag gcagaagtat gcaaagcatg catctcaatt 60
agtcagcaac caggtgtgga aagtccccag gctccccagc aggcagaagt atgcaaagca 120
tgcatctcaa ttagtcagca accatagtcc cgcccctaac tccgcccatc ccgcccctaa 180
ctccgcccag ttccgcccat tctccgcccc atggctgact aatttttttt atttatgcag 240
aggccgaggc cgcctctgcc tctgagctat tccagaagta gtgaggaggc ttttttggag 300
gcctaggctt ttgcaaaaag ctcccgggag cttgtatatc cattttcg 348
<210> 81
<211> 206
<212> DNA
<213> Artificial Sequence
<220>
<223> dESV40 promoter
<400> 81
gcatgcatct caattagtca gcaaccatag tcccgcccct aactccgccc atcccgcccc 60
taactccgcc cagttccgcc cattctccgc cccatggctg actaattttt tttatttatg 120
cagaggccga ggccgcctcg gcctctgagc tattccagaa gtagtgagga ggcttttttg 180
gaggcctagg cttttgcaaa aagctt 206
<210> 82
<211> 463
<212> DNA
<213> Homo sapiens
<400> 82
ttggcccctc cctcgggtta ccccacagcc taggccgatt cgacctctct ccgctggggc 60
cctcgctggc gtccctgcac cctgggagcg cgagcggcgc gcgggcgggg aagcgcggcc 120
cagacccccg ggtccgcccg gagcagctgc gctgtcgggg ccaggccggg ctcccagtgg 180
attcgcgggc acagacgccc aggaccgcgc tccccacgtg gcggagggac tggggacccg 240
ggcacccgtc ctgccccttc accttccagc tccgcctcct ccgcgcggac cccgccccgt 300
cccgacccct cccgggtccc cggcccagcc ccctccgggc cctcccagcc cctccccttc 360
ctttaccgcg gccccgccct ctcctcgcgg cgcgagtttc aggcagcgct gcgtcctgct 420
gcgcacgtgg gaagccctgg ccccggccac ccccgccaga tct 463
<210> 83
<211> 648
<212> DNA
<213> Schmidt-Ruppin A strain
<400> 83
acgcgtcatg tttgacagct tatcatcgca gatccgtatg gtgcactctc agtacaatct 60
gctctgatgc cgcatagtta agccagtatc tgctccctgc ttgtgtgttg gaggtcgctg 120
agtagtgcgc gagcaaaatt taagctacaa caaggcaagg cttgaccgac aattgcatga 180
agaatctgct tagggttagg cgttttgcgc tgcttcgcga tgtacgggcc agatattcgc 240
gtatctgagg ggactagggt gtgtttaggc gaaaagcggg gcttcggttg tacgcggtta 300
ggagtcccct caggatatag tagtttcgct tttgcatagg gagggggaaa tgtagtctta 360
tgcaatactc ttgtagtctt gcaacatggt aacgatgagt tagcaacatg ccttacaagg 420
agagaaaaag caccgtgcat gccgattggt ggaagtaagg tggtacgatc gtgccttatt 480
aggaaggcaa cagacgggtc tgacatggat tggacgaacc actaaattcc gcattgcaga 540
gatattgtat ttaagtgcct agctcgatac aataaacgcc atttgaccat tcaccacatt 600
ggtgtgcacc tccaagctgg gtaccagctg ctagcaagct tgagatct 648
<210> 84
<211> 1740
<212> DNA
<213> Homo sapiens
<400> 84
gagtagctgg gattacaggc atgtgccacc acgcctcgct aatattagta tttttcatac 60
agacaagatc tcactatgtt gctcagggta gtctcgaatt ctgggactca aatgatcctc 120
ccacttcagc ctcccaaagt gctgggatta caggcataag ccatcatgcc cggcctctga 180
cgctgtttct ttcaaccccc aggatttcag attccaccag cttatggaga agggaaccaa 240
gttcgagatg cgtgattgcc cagaaagttg gaggctgagc tgagacttga acccagagac 300
cagaacctcc agaggtcaaa gtcctcctcc tgggtccccc agagaagggc cctgagatga 360
cagctcgttg gtcctcatgg aagcgtgacc cccccagtag actttctccc acacccaacc 420
ttggtttcct catctatatg atagggacaa gccagactct acctccctgg tggtcatggt 480
ctccgcttat tcgggttcat aaccttaaag gcccctcgca ccacctcagt gagccattta 540
tgcctggcac agggccaact ctcagtgcat atctgcaaag gaaccaatga atgagtgaat 600
gaagtgacaa atgaataaag gaataaatga atgaggcact tatcatgtac caggctttcg 660
ttaccacgtc ccatttattc ctctgaggca gggtctattt tatccttgtt acagatgggg 720
aaactaaggc ccagggagga gcaaagtctt ccccaagtat gtacccactc agaacttgag 780
ctctgaatgt ctcccaccca gcttagccca agagcggggt tcagtgatgc ccacccccta 840
aggctctaga gaaagggggt aggcccacat gccagtttgg gggtggtaaa gccaggtaag 900
ttttctttat gggtcccctg aaaccctgaa agtgaacccc agtcctgcat gaaagtgagc 960
tccccatagc tcaaggtatt caagcacaat acggctttga gtgctgaagc aggctgtgca 1020
ggcttggata gtgacatgcc ctctctgagc ctcaatttcc ccacctgtca acagcagaca 1080
gtgacagctg tgatcagggg atcacagtgc atggggatgg gtgggtgcat ggggatggag 1140
gggcatttgg gagccctccc cgataccacc ccctgcagcc acccagatag cctgtcctgg 1200
cctgtctgtc ccagtccagg gctgaaaggg tgcgggtcct gcccgcccct aggtctggag 1260
gcggagtcgc ggtgacccgg gagcccaata aatctgcaac ccacaatcac gagctgctcc 1320
cgtaagcccc aaggcgacct ccagctgtca gcgctgagca cagcgcccag ggagagggac 1380
agacagccgg ctgcatggga cagcggaacc cagagtgaga ggggaggtgg caggacagac 1440
agacagcagg ggcggacgca gagacagaca gcggggacag ggaggccgac acggacatcg 1500
acagcccata gattcctaac ccagggagcc ccggcccctc tcgccgcttc ccaccccaga 1560
cggagcgggg acaggctgcc gagcatcctc ccacccgccc tccccgtcct gcctcctcgg 1620
cccctgccag cttcccccgc ttgagcacgc agggcgtccg aggacgcgct gggcctccgc 1680
acccgccctc atggaggccg tggagaccgg ggaacggccc accttcggag cctgggacta 1740
<210> 85
<211> 1075
<212> DNA
<213> Homo sapiens
<400> 85
attagagatt gtaaattggg ctctgagctt cctaccaaca aaagcacaaa ggaaaatatg 60
atcactggta ttaaaaaaaa acacctatgg tttccaaaag attaaaacaa accagcagtt 120
ttatagaagc taacactaaa atctaaagga actacgttct atggagccac ttaatatgga 180
taaacacttt gacaatattc tttcaacaac tacagtaaca agtttcttag agtccatttc 240
tttttacatc cataatgaat tgtaaatctt ttctacttct taagtaaaac atcaccactt 300
aattctggta acttttccat attaactttt tagaacaatt gcaaacgtac cataaatgat 360
tgttgtcaca gtggtaacta tttgaccctg actgttattt tgtatatagc agcttttaaa 420
ataaaaaggc aacaagtttc taggcgtaat ttccacagat cttttatgta aaacaatgac 480
atcctttgca acttctgcca tttaatctat ctcaagcaag ctctctggaa acaaatctat 540
ttgaaagatt ctattgtaat tagaaatcag ggtaactgaa tgcactagat gaaaaccttc 600
tgactggggc caatgaagtc aataaagtca aaactgctgt gaatgctcaa ctgtctgcag 660
atcagatgtc ttgggatgga atccgttctc gaggccacca tcattaatat caatttggcc 720
atgtaataca agcctcactt gttccactgt tacaaatgtg cttaaaactg agctcattta 780
caatccaaat acatatgtag gatggtaacc aaggcatcac actaatttag gtattatgtt 840
ttagggggaa caaaaggtat gttaatattt tattcatctc caaattaact ataaattgtg 900
cattcttgca tagatcctcc ttgggaatga gaaattagga aaatccagtt gttaaaatga 960
atgcctaaaa tcaaaataaa atttgttttt ctggcacctg cttgatgaca cagactaata 1020
accaatgaca aaattccctt gaacccaagt tttcatttcc tcctattgtg tggtc 1075
<210> 86
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 86
gtgcttgaag gggaacaact ac 22
<210> 87
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 87
cctggcctcc agataactac ac 22
<210> 88
<211> 40
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 88
ccccctcgag gtcgacatgg ctagagactt atcgaaagca 40
<210> 89
<211> 38
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 89
attcgatatc aagctccaag atctgcacac tggtattt 38
<210> 90
<211> 39
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 90
ccccctcgag gtcgacgtac acgacatcac tttcccagt 39
<210> 91
<211> 37
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 91
attcgatatc aagctcacac tggtatttcg gtttttg 37
<210> 92
<211> 40
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 92
ccccctcgag gtcgacctac actctcagtc agcctatgga 40
<210> 93
<211> 39
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 93
attcgatatc aagcttaatc ccaaaaggct gatagtctc 39
<210> 94
<211> 40
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 94
ccccctcgag gtcgacacat ctctcacttt ctcatcacca 40
<210> 95
<211> 39
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 95
attcgatatc aagctaagta actgggatta caggagcac 39
<210> 96
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 96
aaagggcaaa taccttaagg ggtg 24
<210> 97
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 97
agcacttcga cctaaaaata gagat 25
<210> 98
<211> 21538
<212> DNA
<213> Artificial Sequence
<220>
<223> long beta-globin LCR with inserted XhoI site
<400> 98
gatctctatc ccctcctgtt ttctctacgt tatttatatg ggtatcatca ccatcctgga 60
caacatcagg acagatatcc ctcaccaagc caatgttcct ctctatgttg gctcaaatgt 120
ccttgaactt tcctttcacc accctttcca cagtcaaaag gatattgtag tttaatgcct 180
cagagttcag cttttaagct tctgacaaat tattcttcct ctttaggttc tcctttatgg 240
aatcttctgt actgatggcc atgtccttta actactatgt agatatctgc tactacctgt 300
attatgcctc tacctttatt agcagagtta tctgtactgt tggcatgaca atcatttgtt 360
aatatgactt gcctttcctt tttctgctat tcttgatcaa atggctcctc tttcttgctc 420
ctctcatttc tcctgccttc acttggacgt gcttcacgta gtctgtgctt atgactggat 480
taaaaattga tatggactta tcctaatgtt gttcgtcata atatgggttt tatggtccat 540
tattatttcc tatgcattga tctggagaag gcttcaatcc ttttactctt tgtggaaaat 600
atctgtaaac cttctggttc actctgctat agcaatttca gtttaggcta gtaagcatga 660
ggatgcctcc ttctctgatt tttcccacag tctgttggtc acagaataac ctgagtgatt 720
actgatgaaa gagtgagaat gttattgata gtcacaatga caaaaaacaa acaactacag 780
tcaaaatgtt tctcttttta ttagtggatt atatttcctg acctatatct ggcaggactc 840
tttagagagg tagctgaagc tgctgttatg accactagag ggaagaagat acctgtggag 900
ctaatggtcc aagatggtgg agccccaagc aaggaagttg ttaaggagcc cttttgattg 960
aaggtgggtg cccccacctt acagggacag gacatctgga tactcctccc agtttctcca 1020
gtttcccttt ttcctaatat atctcctgat aaaatgtcta tactcacttc cccatttcta 1080
ataataaagc aaaggctagt tagtaagaca tcaccttgca ttttgaaaat gccatagact 1140
ttcaaaatta tttcatacat cggtctttct ttatttcaag agtccagaaa tggcaacatt 1200
acctttgatt caatgtaatg gaaagagctc tttcaagaga cagagaaaag aataatttaa 1260
tttctttccc cacacctcct tccctgtctc ttaccctatc ttccttcctt ctaccctccc 1320
catttctctc tctcatttct cagaagtata ttttgaaagg attcatagca gacagctaag 1380
gctggttttt tctaagtgaa gaagtgatat tgagaaggta gggttgcatg agccctttca 1440
gttttttagt ttatatacat ctgtattgtt agaatgtttt ataatataaa taaaattatt 1500
tctcagttat atactagcta tgtaacctgt ggatatttcc ttaagtatta caagctatac 1560
ttaactcact tggaaaactc aaataaatac ctgcttcata gttattaata aggattaagt 1620
gagataatgc ccataagatt cctattaata acagataaat acatacacac acacacacat 1680
tgaaaggatt cttactttgt gctaggaact ataataagtt cattgatgca ttatatcatt 1740
aagttctaat ttcaacacta gaaggcaggt attatctaaa tttcatactg gatacctcca 1800
aactcataaa gataattaaa ttgccttttg tcatatattt attcaaaagg gtaaactcaa 1860
actatggctt gtctaatttt atatatcacc ctactgaaca tgaccctatt gtgatatttt 1920
ataaaattat tctcaagtta ttatgaggat gttgaaagac agagaggatg gggtgctatg 1980
ccccaaatca gcctcacaat taagctaagc agctaagagt cttgcagggt agtgtaggga 2040
ccacagggtt aagggggcag tagaattata ctcccacttt agtttcattt caaacaatcc 2100
atacacacac agccctgagc acttacaaat tatactacgc tctatacttt ttgtttaaat 2160
gtataaataa gtggatgaaa gaatagatag atagatagac agatagatga tagatagaat 2220
aaatgcttgc cttcatagct gtctccctac cttgttcaaa atgttcctgt ccagaccaaa 2280
gtaccttgcc ttcacttaag taatcaattc ctaggttata ttctgatgtc aaaggaagtc 2340
aaaagatgtg aaaaacaatt tctgacccac aactcatgct ttgtagatga ctagatcaaa 2400
aaatttcagc catatcttaa cagtgagtga acaggaaatc tcctcttttc cctacatctg 2460
agatcccagc ttctaagacc ttcaattctc actcttgatg caacagacct tggaagcata 2520
caggagagct gaacttggtc aacaaaggag aaaagtttgt tggcctccaa aggcacagct 2580
caaacttttc aagccttctc taatcttaaa ggtaaacaag ggtctcattt ctttgagaac 2640
ttcagggaaa atagacaagg acttgcctgg tgcttttggt aggggagctt gcactttccc 2700
cctttctgga ggaaatattt atccccaggt agttcccttt ttgcaccagt ggttctttga 2760
agagacttcc acctgggaac agttaaacag caactacagg gccttgaact gcacactttc 2820
agtccggtcc tcacagttga aaagacctaa gcttgtgcct gatttaagcc tttttggtca 2880
taaaacattg aattctaatc tccctctcaa ccctacagtc acccatttgg tatattaaag 2940
atgtgttgtc tactgtctag tatccctcaa gtagtgtcag gaattagtca tttaaatagt 3000
ctgcaagcca ggagtggtgg ctcatgtctg taattccagc acttgagagg tagaagtggg 3060
aggactgctt gagctcaaga gtttgatatt atcctggaca acatagcaag acctcgtctc 3120
tacttaaaaa aaaaaaaaaa attagccagg catgtgatgt acacctgtag tcccagctac 3180
tcaggaggcc gaaatgggag gatcccttga gctcaggagg tcaaggctgc agtgagacat 3240
gatcttgcca ctgcactcca gcctggacag cagagtgaaa ccttgcctca cgaaacagaa 3300
tacaaaaaca aacaaacaaa aaactgctcc gcaatgcgct tccttgatgc tctaccacat 3360
aggtctgggt actttgtaca cattatctca ttgctgttca taattgttag attaattttg 3420
taatattgat attattccta gaaagctgag gcctcaagat gataactttt attttctgga 3480
cttgtaatag ctttctcttg tattcaccat gttgtaactt tcttagagta gtaacaatat 3540
aaagttattg tgagtttttg caaacacagc aaacacaacg acccatatag acattgatgt 3600
gaaattgtct attgtcaatt tatgggaaaa caagtatgta ctttttctac taagccattg 3660
aaacaggaat aacagaacaa gattgaaaga atacattttc cgaaattact tgagtattat 3720
acaaagacaa gcacgtggac ctgggaggag ggttattgtc catgactggt gtgtggagac 3780
aaatgcaggt ttataataga tgggatggca tctagcgcaa tgactttgcc atcactttta 3840
gagagctctt ggggacccca gtacacaaga ggggacgcag ggtatatgta gacatctcat 3900
tctttttctt agtgtgagaa taagaatagc catgacctga gtttatagac aatgagccct 3960
tttctctctc ccactcagca gctatgagat ggcttgccct gcctctctac taggctgact 4020
cactccaagg cccagcaatg ggcagggctc tgtcagggct ttgatagcac tatctgcaga 4080
gccagggccg agaaggggtg gactccagag actctccctc ccattcccga gcagggtttg 4140
cttatttatg catttaaatg atatatttat tttaaaagaa ataacaggag actgcccagc 4200
cctggctgtg acatggaaac tatgtagaat attttgggtt ccattttttt ttccttcttt 4260
cagttagagg aaaaggggct cactgcacat acactagaca gaaagtcagg agctttgaat 4320
ccaagcctga tcatttccat gtcatactga gaaagtcccc acccttctct gagcctcagt 4380
ttctcttttt ataagtagga gtctggagta aatgatttcc aatggctctc atttcaatac 4440
aaaatttccg tttattaaat gcatgagctt ctgttactcc aagactgaga aggaaattga 4500
acctgagact cattgactgg caagatgtcc ccagaggctc tcattcagca ataaaattct 4560
caccttcacc caggcccact gagtgtcaga tttgcatgca ctagttcacg tgtgtaaaaa 4620
ggaggatgct tctttccttt gtattctcac atacctttag gaaagaactt agcacccttc 4680
ccacacagcc atcccaataa ctcatttcag tgactcaacc cttgacttta taaaagtctt 4740
gggcagtata gagcagagat taagagtaca gatgctggag ccagaccacc tgagtgatta 4800
gtgactcagt ttctcttagt agttgtatga ctcagtttct tcatctgtaa aatggagggt 4860
tttttaatta gtttgttttt gagaaagggt ctcactctgt cacccaaatg ggagtgtagt 4920
ggcaaaatct cggctcactg caacttgcac ttcccaggct caagcggtcc tcccacctca 4980
acatcctgag tagctggaac cacaggtaca caccaccata cctcgctaat tttttgtatt 5040
tttggtagag atggggtttc acatgttaca caggatggtc tcagactccg gagctcaagc 5100
aatctgccca cctcagcctt ccaaagtgct gggattataa gcatgattac aggagtttta 5160
acaggctcat aagattgttc tgcagcccga gtgagttaat acatgcaaag agtttaaagc 5220
agtgacttat aaatgctaac tactctagaa atgtttgcta gtattttttg tttaactgca 5280
atcattcttg ctgcaggtga aaactagtgt tctgtacttt atgcccattc atctttaact 5340
gtaataataa aaataactga catttattga aggctatcag agactgtaat tagtgctttg 5400
cataattaat catatttaat actcttggat tctttcaggt agatactatt attatcccca 5460
ttttactaca gttaaaaaaa ctacctctca acttgctcaa gcatacactc tcacacacac 5520
aaacataaac tactagcaaa tagtagaatt gagatttggt cctaattatg tctttgctca 5580
ctatccaata aatatttatt gacatgtact tcttggcagt ctgtatgctg gatgctgggg 5640
atacaaagat gtttaaattt aagctccagt ctctgcttcc aaaggcctcc caggccaagt 5700
tatccattca gaaagcattt tttactcttt gcattccact gtttttccta agtgactaaa 5760
aaattacact ttattcgtct gtgtcctgct ctgggatgat agtctgactt tcctaacctg 5820
agcctaacat ccctgacatc aggaaagact acaccatgtg gagaaggggt ggtggttttg 5880
attgctgctg tcttcagtta gatggttaac tttgtgaagt tgaaaactgt ggctctctgg 5940
ttgactgtta gagttctggc acttgtcact atgcctatta tttaacaaat gcatgaatgc 6000
ttcagaatat gggaatatta tcttctggaa tagggaatca agttatatta tgtaacccag 6060
gattagaaga ttcttctgtg tgtaagaatt tcataaacat taagctgtct agcaaaagca 6120
agggcttgga aaatctgtga gctcctcacc atatagaaag cttttaaccc atcattgaat 6180
aaatccctat aggggatttc taccctgagc aaaaggctgg tcttgattaa ttcccaaact 6240
catatagctc tgagaaagtc tatgctgtta acgttttctt gtctgctacc ccatcatatg 6300
cacaacaata aatgcaggcc taggcatgac tgaaggctct ctcataattc ttggttgcat 6360
gaatcagatt atcaacagaa atgttgagac aaactatggg gaagcagggt atgaaagagc 6420
tctgaatgaa atggaaaccg caatgcttcc tgcccattca gggctccagc atgtagaaat 6480
ctggggcttt gtgaagactg gcttaaaatc agaagcccca ttggataaga gtagggaaga 6540
acctagagcc tacgctgagc aggtttcctt catgtgacag ggagcctcct gccccgaact 6600
tccagggatc ctctcttaag tgtttcctgc tggaatctcc tcacttctat ctggaaatgg 6660
tttctccaca gtccagcccc tggctagttg aaagagttac ccatgcagag gccctcctag 6720
catccagaga ctagtgctta gattcctact ttcagcgttg gacaacctgg atccacttgc 6780
ccagtgttct tccttagttc ctaccttcga ccttgatcct cctttatctt cctgaaccct 6840
gctgagatga tctatgtggg gagaatggct tctttgagaa acatcttctt cgttagtggc 6900
ctgcccctca ttcccacttt aatatccaga atcactataa gaagaatata ataagaggaa 6960
taactcttat tataggtaag ggaaaattaa gaggcatacg tgatgggatg agtaagagag 7020
gagagggaag gattaatgga cgataaaatc tactactatt tgttgagacc ttttatagtc 7080
taatcaattt tgctattgtt ttccatcctc acgctaactc cataaaaaaa cactattatt 7140
atctttattt tgccatgaca agactgagct cagaagagtc aagcatttgc ctaaggtcgg 7200
acatgtcaga ggcagtgcca gacctatgtg agactctgca gctactgctc atgggccctg 7260
tgctgcactg atgaggagga tcagatggat ggggcaatga agcaaaggaa tcattctgtg 7320
gataaaggag acagccatga agaagtctat gactgtaaat ttgggagcag gagtctctaa 7380
ggacttggat ttcaaggaat tttgactcag caaacacaag accctcacgg tgactttgcg 7440
agctggtgtg ccagatgtgt ctatcagagg ttccagggag ggtggggtgg ggtcagggct 7500
ggccaccagc tatcagggcc cagatgggtt ataggctggc aggctcagat aggtggttag 7560
gtcaggttgg tggtgctggg tggagtccat gactcccagg agccaggaga gatagaccat 7620
gagtagaggg cagacatggg aaaggtgggg gaggcacagc atagcagcat ttttcattct 7680
actactacat gggactgctc ccctataccc ccagctaggg gcaagtgcct tgactcctat 7740
gttttcagga tcatcatcta taaagtaaga gtaataattg tgtctatctc atagggttat 7800
tatgaggatc aaaggagatg cacactctct ggaccagtgg cctaacagtt caggacagag 7860
ctatgggctt cctatgtatg ggtcagtggt ctcaatgtag caggcaagtt ccagaagata 7920
gcatcaacca ctgttagaga tatactgcca gtctcagagc ctgatgttaa tttagcaatg 7980
ggctgggacc ctcctccagt agaaccttct aaccagctgc tgcagtcaaa gtcgaatgca 8040
gctggttaga ctttttttaa tgaaagctta gctttcatta aagattaagc tcctaagcag 8100
ggcacagatg aaattgtcta acagcaactt tgccatctaa aaaaatctga cttcactgga 8160
aacatggaag cccaaggttc tgaacatgag aaatttttag gaatctgcac aggagttgag 8220
agggaaacaa gatggtgaag ggactagaaa ccacatgaga gacacgagga aatagtgtag 8280
atttaggctg gaggtaaatg aaagagaagt gggaattaat acttactgaa atctttctat 8340
atgtcaggtg ccattttatg atatttaata atctcattac atatggtaat tctgtgagat 8400
atgtattatt gaacatacta taattaatac taatgataag taacacctct tgagtactta 8460
gtatatgcta gaatcaaatt taagtttatc atatgaggcc gggcacggtg gctcatatat 8520
gggattacat gcctgtaatc ccagcacttt gggaggccaa ggcaattgga tcacctgagg 8580
tcaggagttc cagaccagcc tggccaacat ggtgaaaccc cttctctact aaaaaataca 8640
aaaaatcagc caggtgtggt ggcacgcgtc tataatccca gctactcagg aggctgaggc 8700
aggagaatca cttgaaccca ggaggtggag gttgcagtga gctaagattg caccactgca 8760
ctccagccta ggcgacagag tgagactcca tctcaaaaaa aaaaaaagaa gtttattata 8820
tgaattaact tagttttact cacaccaata ctcagaagta gattattacc tcatttattg 8880
atgaggagcc caatgtactt gtagtgtaga tcaacttatt gaaagcacaa gctaataagt 8940
agacaattag taattagaag tcagatggtc tgagctctcc tactgtctac attacatgag 9000
ctcttattaa ctggggactc gaaaatcaaa gacatgaaat aatttgtcca agcttacaga 9060
accaccaagt agtaaggcta ggatgtagac ccagttctgc tacctctgaa gacagtgttt 9120
tttccacagc aaaacacaaa ctcagatatt gtggatgcga gaaattagaa gtagatattc 9180
ctgccctgtg gcccttgctt cttactttta cttcttgtcg attggaagtt gtggtccaag 9240
ccacagttgc agaccatact tcctcaacca taattgcatt tcttcaggaa agtttgaggg 9300
agaaaaaggt aaagaaaaat ttagaaacaa cttcagaata aagagatttt ctcttgggtt 9360
acagagattg tcatatgaca aattataagc agacacttga gaaaactgaa ggcccatgcc 9420
tgcccaaatt accctttgac cccttggtca agctgcaact ttggttaaag ggagtgttta 9480
tgtgttatag tgttcattta ctcttctggt ctaacccatt ggctccgtct tcatcctgca 9540
gtgacctcag tgcctcagaa acatacatat gtttgtctag tttaagtttg tgtgaaattc 9600
taactagcgt caagaactga gggccctaaa ctatgctagg aatagtgctg tggtgctgtg 9660
ataggtacac aagaaatgag aagaaactgc agattctctg catctccctt tgccgggtct 9720
gacaacaaag tttccccaaa ttttaccaat gcaagccatt tctccatatg ctaactactt 9780
taaaatcatt tggggcttca cattgtcttt ctcatctgta aaaagaatgg aagaactcat 9840
tcctacagaa ctccctatgt cttccctgat gggctagagt tcctctttct caaaaattag 9900
ccattattgt atttccttct aagccaaagc tcagaggtct tgtattgccc agtgacatgc 9960
acactggtca aaagtaggct aagtagaagg gtactttcac aggaacagag agcaaaagag 10020
gtgggtgaat gagagggtaa gtgagaaaag acaaatgaga agttacaaca tgatggcttg 10080
ttgtctaaat atctcctagg gaattattgt gagaggtctg aatagtgttg taaaataagc 10140
tgaatctgct gccaacatta acagtcaaga aatacctccg aataactgta cctccaatta 10200
ttctttaagg tagcatgcaa ctgtaatagt tgcatgtata tatttatcat aatactgtaa 10260
cagaaaacac ttactgaata tatactgtgt ccctagttct ttacacaata aactaatctc 10320
atcctcataa ttctattagc taatacatat tatcatccta tatttcagag acttcaagaa 10380
gttaagcaac ttgctcaaga tcatctaaga agtaggtggt atttctgggc tcatttggcc 10440
cctcctaatc tctcatggca acatggctgc ctaaagtgtt gattgcctta attcatcagg 10500
gatgggctca tactcactgc agaccttaac tggcatcctc ttttcttatg tgatctgcct 10560
gaccctagta gacttatgaa atttctgatg agaaaggaga gaggagaaag gcagagctga 10620
ctgtgatgag tgatgaaggt gccttctcat ctggctcgag ggtaccagtg gggcctctaa 10680
gactaagtca ctctgtctca ctgtgtctta gccagttcct tacagcttgc cctgatggga 10740
gatagagaat gggtatcctc caacaaaaaa ataaattttc atttctcaag gtccaactta 10800
tgttttctta atttttaaaa aaatcttgac cattctccac tctctaaaat aatccacagt 10860
gagagaaaca ttcttttccc ccatcccata aatacctcta ttaaatatgg aaaatctggg 10920
catggtgtct cacacctgta atcccagcac tttgggaggc tgaggtgggt ggactgcttg 10980
gagctcagga gttcaagacc atcttggaca acatggtgat accctgcctc tacaaaaagt 11040
acaaaaatta gcctggcatg gtggtgtgca cctgtaatcc cagctattag ggtggctgag 11100
gcaggagaat tgcttgaacc cgggaggcgg aggttgcagt gagctgagat cgtgccactg 11160
cactccagcc tgggggacag agcacattat aattaactgt tattttttac ttggactctt 11220
gtggggaata agatacatgt tttattctta tttatgattc aagcactgaa aatagtgttt 11280
agcatccagc aggtgcttca aaaccatttg ctgaatgatt actatacttt ttacaagctc 11340
agctccctct atcccttcca gcatcctcat ctctgattaa ataagcttca gtttttcctt 11400
agttcctgtt acatttctgt gtgtctccat tagtgacctc ccatagtcca agcatgagca 11460
gttctggcca ggcccctgtc ggggtcagtg ccccaccccc gccttctggt tctgtgtaac 11520
cttctaagca aaccttctgg ctcaagcaca gcaatgctga gtcatgatga gtcatgctga 11580
ggcttagggt gtgtgcccag atgttctcag cctagagtga tgactcctat ctgggtcccc 11640
agcaggatgc ttacagggca gatggcaaaa aaaaggagaa gctgaccacc tgactaaaac 11700
tccacctcaa acggcatcat aaagaaaatg gatgcctgag acagaatgtg acatattcta 11760
gaatatatta tttcctgaat atatatatat atatacacat atacgtatat atatatatat 11820
atatatattt gttgttatca attgccatag aatgattagt tattgtgaat caaatattta 11880
tcttgcaggt ggcctctata cctagaagcg gcagaatcag gctttattaa tacatgtgta 11940
tagattttta ggatctatac acatgtatta atatgaaaca aggatatgga agaggaaggc 12000
atgaaaacag gaaaagaaaa caaaccttgt ttgccatttt aaggcacccc tggacagcta 12060
ggtggcaaaa ggcctgtgct gttagaggac acatgctcac atacggggtc agatctgact 12120
tggggtgcta ctgggaagct ctcatcttaa ggatacatct caggccagtc ttggtgcatt 12180
aggaagatgt aggcaactct gatcctgaga ggaaagaaac attcctccag gagagctaaa 12240
agggttcacc tgtgtgggta actgtgaagg actacaagag gatgaaaaac aatgacagac 12300
agacataatg cttgtgggag aaaaaacagg aggtcaaggg gatagagaag gcttccagaa 12360
gaatggcttt gaagctggct tctgtaggag ttcacagtgg caaagatgtt tcagaaatgt 12420
gacatgactt aaggaactat acaaaaagga acaaatttaa ggagaggcag ataaattagt 12480
tcaacagaca tgcaaggaat tttcagatga atgttatgtc tccactgagc ttcttgaggt 12540
tagcagctgt gagggttttg caggcccagg acccattaca ggacctcacg tatacttgac 12600
actgtttttt gtattcattt gtgaatgaat gacctcttgt cagtctactc ggtttcgctg 12660
tgaatgaatg atgtcttgtc agcctacttg gtttcgctaa gagcacagag agaagattta 12720
gtgatgctat gtaaaaactt cctttttggt tcaagtgtat gtttgtgata gaaatgaaga 12780
caggctacat gatgcatatc taacataaac acaaacatta agaaaggaaa tcaacctgaa 12840
gagtatttat acagataaca aaatacagag agtgagttaa atgtgtaata actgtggcac 12900
aggctggaat atgagccatt taaatcacaa attaattaga aaaaaaacag tggggaaaaa 12960
attccatgga tgggtctaga aagactagca ttgttttagg ttgagtggca gtgtttaaag 13020
ggtgatatca gactaaactt gaaatatgtg gctaaataac tagaatactc tttatttttt 13080
cgtatcatga atagcagata tagcttgatg gccccatgct tggtttaaca tccttgctgt 13140
tcctgacatg aaatccttaa tttttgacaa aggggctatt cattttcatt ttatattggg 13200
cctagaaatt atgtagatgg tcctgaggaa aagtttatag cttgtctatt tctctctcta 13260
acatagttgt cagcacaatg cctaggctat aggaagtact caaagcttgt taaattgaat 13320
tctatccttc ttattcaatt ctacacatgg aggaaaaact catcagggat ggaggcacgc 13380
ctctaaggaa ggcaggtgtg gctctgcagt gtgattgggt acttgcagga cgaagggtgg 13440
ggtgggagtg gctaaccttc cattcctagt gcagaggtca cagcctaaac atcaaattcc 13500
ttgaggtgcg gtggctcact cctgtaatca cagcagtttg ggacgccaag gtgggcagat 13560
cacttgaggt caggagttgg acaccagccc agccaacata gtgaaacctg gtctctgctt 13620
aaaaatataa aaattagctg gacgtggtga cgggagcctg taatccaact acttgggagg 13680
ctgaggcagg agaatcgctt gaaccgggga ggtggagttt gcactgagca gagatcatgc 13740
cattgcactc cagcctccag agcgagactc tgtctaaaga aaaacgaaaa caaacaaaca 13800
aacaaacaaa caaaacccat caaattccct gaccgaacag aattctgtct gattgttctc 13860
tgacttatct accattttcc ctccttaaag aaactgtgaa cttccttcag ctagaggggc 13920
ctggctcaga agcctctggt cagcatccaa gaaatacttg atgtcacttt ggctaaaggt 13980
atgatgtgta gacaagctcc agagatggtt tctcatttcc atatccaccc acccagcttt 14040
ccaattttaa agccaattct gaggtagaga ctgtgatgaa caaacacctt gacaaaattc 14100
aacccaaaga ctcactttgc ctagcttcaa aatccttact ctgacatata ctcacagcca 14160
gaaattagca tgcactagag tgtgcatgag tgcaacacac acacacacca attccatatt 14220
ctctgtcaga aaatcctgtt ggtttttcgt gaaaggatgt tttcagaggc tgaccccttg 14280
ccttcacctc caatgctacc actctggtct aagtcactgt caccaccacc taaattatag 14340
ctgttgactc ataacaatct tcctgcttct accactgccc cactacaatt tcttcccaat 14400
atactatcca aattagtctt ttcaaaatgt aagtcatata tggtcacctc tttgttcaaa 14460
gtcttctgat agtttcctat atcatttata ataaaaccaa atccttacaa ttctctacaa 14520
tagttgttca tgcatatatt atgtttatta cagatacata tatatagctc tcatataaat 14580
aaatatatat atttatgtgt atgtgtgtag agtgtttttt cttacaactc tatgatgtag 14640
gtattattag tgtcccaaat tttataattt aggacttcta tgatctcatc ttttattctc 14700
cccttcaccg aatctcatcc tacattggcc ttattgatat tccttgaaaa ttctaagcat 14760
cttacatctt tagggtattt acatttgcca ttccctatgc cctaaatatt taatcatagt 14820
ttcatataaa tgggttcctc atcatctatg ggtactctct caggtgttaa ctttatagtg 14880
aggactttcc tgccatacta cttaaagtag cgataccctt tcaccctgtc ctaatcacac 14940
tctggccttc atttcagttt tttttttttc tccatagcac ctaatctcat tggtatataa 15000
catgtttcat ttgcttattt aatgtcaagc tctttccact atcaagtcca tgaaaacagg 15060
aactttattc ctctattctg tttttgtgct gtattcttag caattttaca attttgaatg 15120
aatgaatgag cagtcaaaca catatacaac tataattaaa aggatgtatg ctgacacatc 15180
cactgctatg cacacacaaa gaaatcagtg gagtagagct ggaagtgcta agcctgcata 15240
gagctagtta gccctccgca ggcagagcct tgatgggatt actgagttct agaattggac 15300
tcatttgttt tgtaggctga gatttgctct tgaaaacttg ttctgaccaa aataaaaggc 15360
tcaaaagatg aatatcgaaa ccagggtgtt ttttacactg gaatttataa ctagagcact 15420
catgtttatg taagcaatta attgtttcat cagtcaggta aaagtaaaga aaaactgtgc 15480
caaggcaggt agcctaatgc aatatgccac taaagtaaac attatttcat aggtgtcaga 15540
tatggcttat tcatccatct tcatgggaag gatggccttg gcctggacat cagtgttatg 15600
tgaggttcaa aacacctcta ggctataagg caacagagct cctttttttt ttttctgtgc 15660
tttcctggct gtccaaatct ctaatgataa gcatacttct attcaatgag aatattctgt 15720
aagattatag ttaagaattg tgggagccat tccgtctctt atagttaaat ttgagcttct 15780
tttatgatca ctgttttttt aatatgcttt aagttctggg gtacatgtgc catggtggtt 15840
tgctgcaccc atcaacccgt catctacatt aggtatttct cctaatgcta tccttcccct 15900
agccccccac ccccaacagg ccccagtgtg tgatgttccc ctccctgtgt ccatggatca 15960
ctggtttttt tttgtttttt tttttttttt aaagtctcag ttaaattttt ggaatgtaat 16020
ttattttcct ggtatcctag gacttgcaag ttatctggtc actttagccc tcacgttttg 16080
atgataatca catatttgta aacacaacac acacacacac acacacacac atatatatat 16140
atataaaaca tatatataca taaacacaca taacatattt atcgggcatt tctgagcaac 16200
taatcatgca ggactctcaa acactaacct atagcctttt ctatgtatct acttgtgtag 16260
aaaccaagcg tggggactga gaaggcaata gcaggagcat tctgactctc actgccttta 16320
gctaggcccc tccctcatca cagctcagca tagtcctgag ctcttatcta tatccacaca 16380
cagtttctga cgctgcccag ctatcaccat cccaagtcta aagaaaaaaa taatgggttt 16440
gcccatctct gttgattaga aaacaaaaca aaataaaata agcccctaag ctcccagaaa 16500
acatgactaa accagcaaga agaagaaaat acaataggta tatgaggaga ctggtgacac 16560
tagtgtctga atgaggcttg agtacagaaa agaggctcta gcagcatagt ggtttagagg 16620
agatgtttct ttccttcaca gatgccttag cctcaataag cttgcggttg tggaagttta 16680
ctttcagaac aaactcctgt ggggctagaa ttattgatgg ctaaaagaag cccgggggag 16740
ggaaaaatca ttcagcatcc tcacccttag tgacacaaaa cagagggggc ctggttttcc 16800
atatttcctc atgatggatg atctcgttaa tgaaggtggt ctgacgagat cattgcttct 16860
tccatttaag ccttgctcac ttgccaatcc tcagttttaa ccttctccag agaaatacac 16920
attttttatt caggaaacat actatgttat agtttcaata ctaaataatc aaagtactga 16980
agatagcatg cataggcaag aaaaagtcct tagctttatg ttgctgttgt ttcagaattt 17040
aaaaaagatc accaagtcaa ggacttctca gttctagcac tagaggtgga atcttagcat 17100
ataatcagag gtttttcaaa atttctagac ataagattca aagccctgca cttaaaatag 17160
tctcatttga attaactctt tatataaatt gaaagcacat tctgaactac ttcagagtat 17220
tgttttattt ctatgttctt agttcataaa tacattaggc aatgcaattt aattaaaaaa 17280
acccaagaat ttcttagaat tttaatcatg aaaataaatg aaggcatctt tacttactca 17340
aggtcccaaa aggtcaaaga aaccaggaaa gtaaagctat atttcagcgg aaaatgggat 17400
atttatgagt tttctaagtt gacagactca agttttaacc ttcagtgccc atcatgtagg 17460
aaagtgtggc ataactggct gattctggct ttctactcct ttttcccatt aaagatccct 17520
cctgcttaat taacattcac aagtaactct ggttgtactt taggcacagt ggctcccgag 17580
gtcagtcaca caataggatg tctgtgctcc aagttgccag agagagagat tactcttgag 17640
aatgagcctc agccctggct caaactcacc tgcaaacttc gtgagagatg aggcagaggt 17700
acactacgaa agcaacagtt agaagctaaa tgatgagaac acatggactc atagagggaa 17760
acaacgcata ctggggccta tcagagggtg gagggtgaga gaaggagagg atcaggaaaa 17820
atcactaatg gatgctaagc gtaatacctg agtgatgaga tcatctatac aacaaacccc 17880
cttgacattc atttatctat gtaacaaacc tgcacatcct gtacatgtac ccctgaactt 17940
aaaataaaag ttgaaaacaa gaaagcaaca gtttgaacac ttgttatggt ctattctctc 18000
attctttaca attacactag aaaatagcca caggcttcct gcaaggcagc cacagaattt 18060
atgacttgtg atatccaagt cattcctgga taatgcaaaa tctaacacaa aatctagtag 18120
aatcatttgc ttacatctat ttttgttctg agaatataga tttagataca taatggaagc 18180
agaataattt aaaatctggc taatttagaa tcctaagcag ctcttttcct atcagtggtt 18240
tacaagcctt gtttatattt ttcctatttt aaaaataaaa ataaagtaag ttatttgtgg 18300
taaagaatat tcattaaagt atttatttct tagataatac catgaaaaac attcagtgaa 18360
gtgaagggcc tactttactt aacaagaatc taatttatat aatttttcat actaatagca 18420
tctaagaaca gtacaatatt tgactcttca ggttaaacat atgtcataaa ttagccagaa 18480
agatttaaga aaatattgga tgtttccttg tttaaattag gcatcttaca gtttttagaa 18540
tcctgcatag aacttaagaa attacaaatg ctaaagcaaa cccaaacagg caggaattaa 18600
tcttcatcga atttgggtgt ttctttctaa aagtccttta tacttaaatg tcttaagaca 18660
tacatagatt ttattttact aattttaatt atatagacaa taaatgaata ttcttactga 18720
ttactttttc tgactgtcta atctttctga tctatcctgg atggccataa cacttatctc 18780
tctgaacttt gggcttttaa tataggaaag aaaagcaata atccattttt catggtatct 18840
catatgataa acaaataaaa tgcttaaaaa tgagcaggtg aagcaattta tcttgaacca 18900
acaagcatcg aagcaataat gagactgccc gcagcctacc tgacttctga gtcaggattt 18960
ataagccttg ttactgagac acaaacctgg gcctttcaat gctataacct ttcttgaagc 19020
tcctccctac cacctttagc cataaggaaa catggaatgg gtcagatccc tggatgcaag 19080
ccaggtctgg aaccataggc agtaaggaga gaagaaaatg tgggctctgc aactggctcc 19140
gagggagcag gagaggatca accccatact ctgaatctaa gagaagactg gtgtccatac 19200
tctgaatggg aagaatgatg ggattaccca tagggcttgt tttagggaga aacctgttct 19260
ccaaactctt ggccttgaga tacctggtcc ttattccttg gactttggca atgtctgacc 19320
ctcacattca agttctgagg aagggccact gccttcatac tgtggatctg tagcaaattc 19380
cccctgaaaa cccagagctg tatcttaatt ggttaaaaaa aattatatta tctcaacgac 19440
tgttcttctc tgagtagcca agctcagctt ggttcaagct acaagcagct gagctgcttt 19500
ttgtctagtc attgttcttt tatttcagtg gatcaaatac gttctttcca aacctaggat 19560
cttgtcttcc taggctatat attttgtccc aggaagtctt aatctggggt ccacagaaca 19620
ctagggggct ggtgaagttt atagaaaaaa aatctgtatt tttacttaca tgtaactgaa 19680
atttagcatt ttcttctact ttgaatgcaa aggacaaact agaatgacat catcagtacc 19740
tattgcatag ttataaagag aaaccacaga tattttcata ctacaccata ggtattgcag 19800
atctttttgt ttttgttttt gtttgagatg gagtttcgct cttattgccc aggctggagt 19860
gcagtggcat gatttcggct cactgcaacc tccccttcct gcattcaagc aattctcctg 19920
ccttggcctc ctgagtagct ggggattaca ggcacctgcc accatgccag tctaattttt 19980
gtatttttag tagagatggg gtttcgccat gttggccagg ctggtcttga actcctgacc 20040
tcagatgatc tgcccgcctt ggcctcctga agtgctggga ttataggtgt gagccaccac 20100
gcctggccca ttgcagatat ttttaattca catttatctg catcactact tggatcttaa 20160
ggtagctgta gacccaatcc tagatctaat gctttcataa agaagcaaat ataataaata 20220
ctataccaca aatgtaatgt ttgatgtctg ataatgatat ttcagtgtaa ttaaacttag 20280
cactcctatg tatattattt gatgcaataa aaacatattt ttttagcact tacagtctgc 20340
caaactggcc tgtgacacaa aaaaagttta ggaattcctg gttttgtctg tgttagccaa 20400
tggttagaat atatgctcag aaagatacca ttggttaata gctaaaagaa aatggagtag 20460
aaattcagtg gcctggaata ataacaattt gggcagtcat taagtcaggt gaagacttct 20520
ggaatcatgg gagaaaagca agggagacat tcttacttgc cacaagtgtt tttttttttt 20580
ttttttttta tcacaaacat aagaaaatat aataaataac aaagtcaggt tatagaagag 20640
agaaacgctc ttagtaaact tggaatatgg aatccccaaa ggcacttgac ttgggagaca 20700
ggagccatac tgctaagtga aaaagacgaa gaacctctag ggcctgaaca tacaggaaat 20760
tgtaggaaca gaaattccta gatctggtgg ggcaagggga gccataggag aaagaaatgg 20820
tagaaatgga tggagacgga ggcagaggtg ggcagatcat gaggtcaaga gatcgagacc 20880
atcctggcaa acatggtgaa atcccgtctc tactaaaaat aaaaaaatta gctgggcatg 20940
gtggcatgcg cctgtagtcc cagctgctcg ggaggctgag gcaggagaat cgtttgaacc 21000
caggaggcga aggttgcagt gagctgagat agtgccattg cactccagtc tggcaacaga 21060
gtgagactcc gtctcaaaaa aaaaaaaaaa agaaagaaag aaaagaaaaa gaaaaaagaa 21120
aaaataaatg gatgtagaac aagccagaag gaggaactgg gctggggcaa tgagattatg 21180
gtgatgtaag ggacttttat agaattaaca atgctggaat ttgtggaact ctgcttctat 21240
tattccccca atcattactt ctgtcacatt gatagttaaa taatttctgt gaatttattc 21300
cttgattcta aaatatgagg ataatgacaa tggtattata agggcagatt aagtgatata 21360
gcatgagcaa tattcttcag gcacatggat cgaattgaat acactgtaaa tcccaacttc 21420
cagtttcagc tctaccaagt aaagagctag caagtcatca aaatggggac atacagaaaa 21480
aaaaaaggac actagaggaa taatataccc tgactcctag cctgattaat atatcgat 21538
<210> 99
<211> 1468
<212> PRT
<213> Artificial Sequence
<220>
<223> ET3SEQuence
<400> 99
Met Gln Leu Glu Leu Ser Thr Cys Val Phe Leu Cys Leu Leu Pro Leu
1 5 10 15
Gly Phe Ser Ala Ile Arg Arg Tyr Tyr Leu Gly Ala Val Glu Leu Ser
20 25 30
Trp Asp Tyr Arg Gln Ser Glu Leu Leu Arg Glu Leu His Val Asp Thr
35 40 45
Arg Phe Pro Ala Thr Ala Pro Gly Ala Leu Pro Leu Gly Pro Ser Val
50 55 60
Leu Tyr Lys Lys Thr Val Phe Val Glu Phe Thr Asp Gln Leu Phe Ser
65 70 75 80
Val Ala Arg Pro Arg Pro Pro Trp Met Gly Leu Leu Gly Pro Thr Ile
85 90 95
Gln Ala Glu Val Tyr Asp Thr Val Val Val Thr Leu Lys Asn Met Ala
100 105 110
Ser His Pro Val Ser Leu His Ala Val Gly Val Ser Phe Trp Lys Ser
115 120 125
Ser Glu Gly Ala Glu Tyr Glu Asp His Thr Ser Gln Arg Glu Lys Glu
130 135 140
Asp Asp Lys Val Leu Pro Gly Lys Ser Gln Thr Tyr Val Trp Gln Val
145 150 155 160
Leu Lys Glu Asn Gly Pro Thr Ala Ser Asp Pro Pro Cys Leu Thr Tyr
165 170 175
Ser Tyr Leu Ser His Val Asp Leu Val Lys Asp Leu Asn Ser Gly Leu
180 185 190
Ile Gly Ala Leu Leu Val Cys Arg Glu Gly Ser Leu Thr Arg Glu Arg
195 200 205
Thr Gln Asn Leu His Glu Phe Val Leu Leu Phe Ala Val Phe Asp Glu
210 215 220
Gly Lys Ser Trp His Ser Ala Arg Asn Asp Ser Trp Thr Arg Ala Met
225 230 235 240
Asp Pro Ala Pro Ala Arg Ala Gln Pro Ala Met His Thr Val Asn Gly
245 250 255
Tyr Val Asn Arg Ser Leu Pro Gly Leu Ile Gly Cys His Lys Lys Ser
260 265 270
Val Tyr Trp His Val Ile Gly Met Gly Thr Ser Pro Glu Val His Ser
275 280 285
Ile Phe Leu Glu Gly His Thr Phe Leu Val Arg His His Arg Gln Ala
290 295 300
Ser Leu Glu Ile Ser Pro Leu Thr Phe Leu Thr Ala Gln Thr Phe Leu
305 310 315 320
Met Asp Leu Gly Gln Phe Leu Leu Phe Cys His Ile Ser Ser His His
325 330 335
His Gly Gly Met Glu Ala His Val Arg Val Glu Ser Cys Ala Glu Glu
340 345 350
Pro Gln Leu Arg Arg Lys Ala Asp Glu Glu Glu Asp Tyr Asp Asp Asn
355 360 365
Leu Tyr Asp Ser Asp Met Asp Val Val Arg Leu Asp Gly Asp Asp Val
370 375 380
Ser Pro Phe Ile Gln Ile Arg Ser Val Ala Lys Lys His Pro Lys Thr
385 390 395 400
Trp Val His Tyr Ile Ala Ala Glu Glu Glu Asp Trp Asp Tyr Ala Pro
405 410 415
Leu Val Leu Ala Pro Asp Asp Arg Ser Tyr Lys Ser Gln Tyr Leu Asn
420 425 430
Asn Gly Pro Gln Arg Ile Gly Arg Lys Tyr Lys Lys Val Arg Phe Met
435 440 445
Ala Tyr Thr Asp Glu Thr Phe Lys Thr Arg Glu Ala Ile Gln His Glu
450 455 460
Ser Gly Ile Leu Gly Pro Leu Leu Tyr Gly Glu Val Gly Asp Thr Leu
465 470 475 480
Leu Ile Ile Phe Lys Asn Gln Ala Ser Arg Pro Tyr Asn Ile Tyr Pro
485 490 495
His Gly Ile Thr Asp Val Arg Pro Leu Tyr Ser Arg Arg Leu Pro Lys
500 505 510
Gly Val Lys His Leu Lys Asp Phe Pro Ile Leu Pro Gly Glu Ile Phe
515 520 525
Lys Tyr Lys Trp Thr Val Thr Val Glu Asp Gly Pro Thr Lys Ser Asp
530 535 540
Pro Arg Cys Leu Thr Arg Tyr Tyr Ser Ser Phe Val Asn Met Glu Arg
545 550 555 560
Asp Leu Ala Ser Gly Leu Ile Gly Pro Leu Leu Ile Cys Tyr Lys Glu
565 570 575
Ser Val Asp Gln Arg Gly Asn Gln Ile Met Ser Asp Lys Arg Asn Val
580 585 590
Ile Leu Phe Ser Val Phe Asp Glu Asn Arg Ser Trp Tyr Leu Thr Glu
595 600 605
Asn Ile Gln Arg Phe Leu Pro Asn Pro Ala Gly Val Gln Leu Glu Asp
610 615 620
Pro Glu Phe Gln Ala Ser Asn Ile Met His Ser Ile Asn Gly Tyr Val
625 630 635 640
Phe Asp Ser Leu Gln Leu Ser Val Cys Leu His Glu Val Ala Tyr Trp
645 650 655
Tyr Ile Leu Ser Ile Gly Ala Gln Thr Asp Phe Leu Ser Val Phe Phe
660 665 670
Ser Gly Tyr Thr Phe Lys His Lys Met Val Tyr Glu Asp Thr Leu Thr
675 680 685
Leu Phe Pro Phe Ser Gly Glu Thr Val Phe Met Ser Met Glu Asn Pro
690 695 700
Gly Leu Trp Ile Leu Gly Cys His Asn Ser Asp Phe Arg Asn Arg Gly
705 710 715 720
Met Thr Ala Leu Leu Lys Val Ser Ser Cys Asp Lys Asn Thr Gly Asp
725 730 735
Tyr Tyr Glu Asp Ser Tyr Glu Asp Ile Ser Ala Tyr Leu Leu Ser Lys
740 745 750
Asn Asn Ala Ile Glu Pro Arg Ser Phe Ala Gln Asn Ser Arg Pro Pro
755 760 765
Ser Ala Ser Ala Pro Lys Pro Pro Val Leu Arg Arg His Gln Arg Asp
770 775 780
Ile Ser Leu Pro Thr Phe Gln Pro Glu Glu Asp Lys Met Asp Tyr Asp
785 790 795 800
Asp Ile Phe Ser Thr Glu Thr Lys Gly Glu Asp Phe Asp Ile Tyr Gly
805 810 815
Glu Asp Glu Asn Gln Asp Pro Arg Ser Phe Gln Lys Arg Thr Arg His
820 825 830
Tyr Phe Ile Ala Ala Val Glu Gln Leu Trp Asp Tyr Gly Met Ser Glu
835 840 845
Ser Pro Arg Ala Leu Arg Asn Arg Ala Gln Asn Gly Glu Val Pro Arg
850 855 860
Phe Lys Lys Val Val Phe Arg Glu Phe Ala Asp Gly Ser Phe Thr Gln
865 870 875 880
Pro Ser Tyr Arg Gly Glu Leu Asn Lys His Leu Gly Leu Leu Gly Pro
885 890 895
Tyr Ile Arg Ala Glu Val Glu Asp Asn Ile Met Val Thr Phe Lys Asn
900 905 910
Gln Ala Ser Arg Pro Tyr Ser Phe Tyr Ser Ser Leu Ile Ser Tyr Pro
915 920 925
Asp Asp Gln Glu Gln Gly Ala Glu Pro Arg His Asn Phe Val Gln Pro
930 935 940
Asn Glu Thr Arg Thr Tyr Phe Trp Lys Val Gln His His Met Ala Pro
945 950 955 960
Thr Glu Asp Glu Phe Asp Cys Lys Ala Trp Ala Tyr Phe Ser Asp Val
965 970 975
Asp Leu Glu Lys Asp Val His Ser Gly Leu Ile Gly Pro Leu Leu Ile
980 985 990
Cys Arg Ala Asn Thr Leu Asn Ala Ala His Gly Arg Gln Val Thr Val
995 1000 1005
Gln Glu Phe Ala Leu Phe Phe Thr Ile Phe Asp Glu Thr Lys Ser
1010 1015 1020
Trp Tyr Phe Thr Glu Asn Val Glu Arg Asn Cys Arg Ala Pro Cys
1025 1030 1035
His Leu Gln Met Glu Asp Pro Thr Leu Lys Glu Asn Tyr Arg Phe
1040 1045 1050
His Ala Ile Asn Gly Tyr Val Met Asp Thr Leu Pro Gly Leu Val
1055 1060 1065
Met Ala Gln Asn Gln Arg Ile Arg Trp Tyr Leu Leu Ser Met Gly
1070 1075 1080
Ser Asn Glu Asn Ile His Ser Ile His Phe Ser Gly His Val Phe
1085 1090 1095
Ser Val Arg Lys Lys Glu Glu Tyr Lys Met Ala Val Tyr Asn Leu
1100 1105 1110
Tyr Pro Gly Val Phe Glu Thr Val Glu Met Leu Pro Ser Lys Val
1115 1120 1125
Gly Ile Trp Arg Ile Glu Cys Leu Ile Gly Glu His Leu Gln Ala
1130 1135 1140
Gly Met Ser Thr Thr Phe Leu Val Tyr Ser Lys Lys Cys Gln Thr
1145 1150 1155
Pro Leu Gly Met Ala Ser Gly His Ile Arg Asp Phe Gln Ile Thr
1160 1165 1170
Ala Ser Gly Gln Tyr Gly Gln Trp Ala Pro Lys Leu Ala Arg Leu
1175 1180 1185
His Tyr Ser Gly Ser Ile Asn Ala Trp Ser Thr Lys Glu Pro Phe
1190 1195 1200
Ser Trp Ile Lys Val Asp Leu Leu Ala Pro Met Ile Ile His Gly
1205 1210 1215
Ile Lys Thr Gln Gly Ala Arg Gln Lys Phe Ser Ser Leu Tyr Ile
1220 1225 1230
Ser Gln Phe Ile Ile Met Tyr Ser Leu Asp Gly Lys Lys Trp Gln
1235 1240 1245
Thr Tyr Arg Gly Asn Ser Thr Gly Thr Leu Met Val Phe Phe Gly
1250 1255 1260
Asn Val Asp Ser Ser Gly Ile Lys His Asn Ile Phe Asn Pro Pro
1265 1270 1275
Ile Ile Ala Arg Tyr Ile Arg Leu His Pro Thr His Tyr Ser Ile
1280 1285 1290
Arg Ser Thr Leu Arg Met Glu Leu Met Gly Cys Asp Leu Asn Ser
1295 1300 1305
Cys Ser Met Pro Leu Gly Met Glu Ser Lys Ala Ile Ser Asp Ala
1310 1315 1320
Gln Ile Thr Ala Ser Ser Tyr Phe Thr Asn Met Phe Ala Thr Trp
1325 1330 1335
Ser Pro Ser Lys Ala Arg Leu His Leu Gln Gly Arg Ser Asn Ala
1340 1345 1350
Trp Arg Pro Gln Val Asn Asn Pro Lys Glu Trp Leu Gln Val Asp
1355 1360 1365
Phe Gln Lys Thr Met Lys Val Thr Gly Val Thr Thr Gln Gly Val
1370 1375 1380
Lys Ser Leu Leu Thr Ser Met Tyr Val Lys Glu Phe Leu Ile Ser
1385 1390 1395
Ser Ser Gln Asp Gly His Gln Trp Thr Leu Phe Phe Gln Asn Gly
1400 1405 1410
Lys Val Lys Val Phe Gln Gly Asn Gln Asp Ser Phe Thr Pro Val
1415 1420 1425
Val Asn Ser Leu Asp Pro Pro Leu Leu Thr Arg Tyr Leu Arg Ile
1430 1435 1440
His Pro Gln Ser Trp Val His Gln Ile Ala Leu Arg Met Glu Val
1445 1450 1455
Leu Gly Cys Glu Ala Gln Asp Leu Tyr Val
1460 1465
<210> 100
<211> 147
<212> PRT
<213> Artificial Sequence
<220>
<223> beta-globin
<400> 100
Met Val His Leu Thr Pro Glu Glu Lys Ser Ala Val Thr Ala Leu Trp
1 5 10 15
Gly Lys Val Asn Val Asp Glu Val Gly Gly Glu Ala Leu Gly Arg Leu
20 25 30
Leu Val Val Tyr Pro Trp Thr Gln Arg Phe Phe Glu Ser Phe Gly Asp
35 40 45
Leu Ser Thr Pro Asp Ala Val Met Gly Asn Pro Lys Val Lys Ala His
50 55 60
Gly Lys Lys Val Leu Gly Ala Phe Ser Asp Gly Leu Ala His Leu Asp
65 70 75 80
Asn Leu Lys Gly Thr Phe Ala Thr Leu Ser Glu Leu His Cys Asp Lys
85 90 95
Leu His Val Asp Pro Glu Asn Phe Arg Leu Leu Gly Asn Val Leu Val
100 105 110
Cys Val Leu Ala His His Phe Gly Lys Glu Phe Thr Pro Pro Val Gln
115 120 125
Ala Ala Tyr Gln Lys Val Val Ala Gly Val Ala Asn Ala Leu Ala His
130 135 140
Lys Tyr His
145
<210> 101
<211> 147
<212> PRT
<213> Artificial Sequence
<220>
<223> gamma globin
<400> 101
Met Gly His Phe Thr Glu Glu Asp Lys Ala Thr Ile Thr Ser Leu Trp
1 5 10 15
Gly Lys Val Asn Val Glu Asp Ala Gly Gly Glu Thr Leu Gly Arg Leu
20 25 30
Leu Val Val Tyr Pro Trp Thr Gln Arg Phe Phe Asp Ser Phe Gly Asn
35 40 45
Leu Ser Ser Ala Ser Ala Ile Met Gly Asn Pro Lys Val Lys Ala His
50 55 60
Gly Lys Lys Val Leu Thr Ser Leu Gly Asp Ala Thr Lys His Leu Asp
65 70 75 80
Asp Leu Lys Gly Thr Phe Ala Gln Leu Ser Glu Leu His Cys Asp Lys
85 90 95
Leu His Val Asp Pro Glu Asn Phe Lys Leu Leu Gly Asn Val Leu Val
100 105 110
Thr Val Leu Ala Ile His Phe Gly Lys Glu Phe Thr Pro Glu Val Gln
115 120 125
Ala Ser Trp Gln Lys Met Val Thr Ala Val Ala Ser Ala Leu Ser Ser
130 135 140
Arg Tyr His
145
<210> 102
<211> 3030
<212> DNA
<213> Artificial Sequence
<220>
<223> 3'HS1
<400> 102
ccaggctcca ttattgatat agtcatgatc tcctctgttg gggatgaagt aggcaaattt 60
gaggcactaa tttacttctc acattctttt cttgaacaga aagatagaac tggaaattaa 120
tagtagtata taaattcaaa attttagctt taataacatt taatcagaca taaataatta 180
tggtaatgtg aatttcaata aataaatttt agttctaata taagtgtaac tgtgtaatat 240
tcatactttt tctgaaggct ttactaattt gatatggcat tactttttta ttgctgccaa 300
aactattctt attccactgt gtggtgatga gaaagtgaga gatgttctgg agatggtgat 360
tatagatagc ttccctgaag ccatagtaac cccctggaga aaaattggac ctggagtcta 420
gcagcctagg tatgggtact cgatttctta gaaagccttt acaatttcct ttatcttaaa 480
aataagggta ttgaagtaga attctagaat tttcagagga caacttaaaa tatgtgtaat 540
agttttaatt atttatcctc ataaatttaa ctgttcattt taatatattt aaggatgaat 600
tttttaaaaa gttgatttca taaaaacggg aatagaaaga tggttccata ggctgactga 660
gagtgtagag gagggatggg aagggaaaga agttgatctt cagttagact agaggaataa 720
gttttagtga tctctcacac tgcatagtga acacagttaa taatatatta tgtatttaaa 780
ttaaaaattg ctaaaaaata aatattttat gttctcacca caaaaaaagt tggaaggtga 840
ttcatatgct aattagcttg atagactctc tctacaatgt atatatagat caaacatcac 900
attgtatccc ataacatatt atatatatta tatatttata ttatatatta ttattgtatc 960
cattaatata tgcacttatt atttgccagg caaataaaaa atgtttttaa aatataaatt 1020
tatttgtaac ctccttttac ttttctgctt ggttttcttc tttcattcag tgtttaccag 1080
tttcttatag ttaattttat tttaagctgt ctcacatttt ctgaagaaaa gggaacatat 1140
taaagccaac aaaacaaata cactatcttg catgagatga tttatgtcat ggtacaatca 1200
aatgctataa atcttataaa aacttctcaa atggttagat ggctacagtt gaacagatgg 1260
accatgtcat atatttttta taatgcttct aaggtatggc taatttttaa aaaatatttt 1320
agtaatgatg ggaatattat ttatagaaat cttataaaat atataatgaa atatgtaata 1380
aagtctagat aaatgtgtat atacataata tatatttatt acataatata taatatataa 1440
tgtatattta tatattacat gcattatata ttaaatataa tacattttat atattatata 1500
ttaaaatatg taataatatg ttattaaata tatacaataa tctattacat tttatgctta 1560
tataatatat aataaatata tagtatataa taaatataca ctatatattt gtatctatat 1620
atgtttataa agtcattcct ctaattaggt cataaccatt caggtaaact ggaaatttaa 1680
gcctacttca ggtttgtggt aaatagattc tctctgaact agcatattca gaatcattaa 1740
acagtcagtt ctttggacaa gtcttataga atgttcttac ctcttcagcc atcccaagac 1800
tcttgagggc ctgacctcgc ttacactaaa gcagatctgc cttatgcatc actgaagtag 1860
ggagggaaga aagtttgatg aactacttct gacccctagt ggtgtccaga aaagaccatt 1920
aaaggaatga cctttaaagg atggacatac aattttttgt ccaaggcagg acatgtgtgg 1980
gtgtctttca gtaattatgt tctaagaaca gcaaaaactc cactgccttg gcaaatagga 2040
atgttttagt tctatagaat tataaagaag ctgtctttta aacacaatat actttctcta 2100
tgtctttgga acaatgacta ttggtcatta ccctatttta aagtaagcaa gtaatcacac 2160
agggaattat tctgaaaaga cagaaaaaaa aaaaaaacca agagatttct gcatatgtag 2220
gtcagtttta atcagagggc atcagaaaag actcctgaaa gaatgacctg gttattataa 2280
tcacagattt gctttccaag tcaacattcc agacagtgct cagaggggat acgaaaaccc 2340
ttttatttct ccagactcaa attcactgct atttgtcttc tctatttatt ttattatagg 2400
cattgttctg gttgctggga actcagactg agataccata cactgactct cagatagcat 2460
aacacaacat gatgtcttgg aaaactgtaa atctttttgt tttttaaata caggtggagc 2520
atctggcaca cctgacatat tgatcttgtt tttctttaaa tcttcattta tttaccttat 2580
caaaactatg ctctttcatc ctacctttca aaacatattt taaaaaatcc tccaacatgt 2640
attttgctct ggtaatccca aaaggctgat agtctctatg gtggcaacat ggataatact 2700
gttccccatc tagatggtct catttcttct gtatctagtc tgaagaagcc tgaatgaaag 2760
tagattttta agctttgtag ctagtctgaa gcctttgtag tcagtctgaa gaaacctgca 2820
tgaaaataga tttttttttt cctttgggac agagtcttgc tctgtcgccc agactggagt 2880
gcaatggcgc gatctcggct cactgcaact tccacctccc aggatcaagc aattctcctg 2940
cctcagtctc ccaagtaact gggattacag gagcacactg ccatgcccag ctaattattt 3000
tttgtgtttt agtagagaca gggtttcacc 3030
Claims (48)
- (a) 아데노바이러스 캡시드; 및
(b) (i) 적어도 10 kb의 트랜스포손 페이로드;
(ii) 트랜스포손 페이로드에 플랭킹된 트랜스포손 역전된 반복부 (IR); 및
(iii) 트랜스포손 역전된 반복부에 플랭킹된 레콤비나제 직접 반복부 (DR)
를 포함하는 선형 이중 가닥 DNA 게놈
을 포함하는 아데노바이러스 공여자 벡터. - (a) 적어도 10 kb의 트랜스포손 페이로드;
(b) 트랜스포손 페이로드에 플랭킹된 트랜스포손 역전된 반복부 (IR); 및
(c) 트랜스포손 역전된 반복부에 플랭킹된 레콤비나제 직접 반복부 (DR)
를 포함하는 아데노바이러스 공여자 게놈. - (a) 제1항의 아데노바이러스 공여자 벡터; 및
(b) (i) 아데노바이러스 캡시드; 및
(ii) 트랜스포사제를 코딩하는 핵산 서열을 포함하는 아데노바이러스 지지 게놈
을 포함하는 아데노바이러스 지지 벡터
를 포함하는 아데노바이러스 전위 시스템. - (a) 제2항의 아데노바이러스 공여자 게놈; 및
(b) 트랜스포사제를 코딩하는 핵산 서열을 포함하는 아데노바이러스 지지 게놈
을 포함하는 아데노바이러스 전위 시스템. - (a) 제2항의 아데노바이러스 공여자 게놈을 포함하는 핵산; 및
(b) 조건부 패키징 요소를 포함하는 아데노바이러스 헬퍼 게놈을 포함하는 핵산
을 포함하는 아데노바이러스 생산 시스템. - 제1항 내지 제5항 중 어느 한 항에 있어서, 트랜스포손 페이로드가 긴 LCR을 포함하고, 임의로 여기서 긴 LCR이 β-글로빈 LCR HS1 내지 HS5를 포함하는 β-글로빈 긴 LCR인 벡터, 게놈, 또는 시스템.
- 제6항에 있어서, 긴 LCR이 적어도 27 kb의 길이를 갖는 것인 벡터, 게놈, 또는 시스템.
- 제1항 내지 제6항 중 어느 한 항에 있어서, 트랜스포손 페이로드가 표 1에 제시된 LCR을 포함하는 것인 벡터, 게놈, 또는 시스템.
- 제1항 내지 제6항 중 어느 한 항에 있어서, 트랜스포손 페이로드가 적어도 15 kb, 적어도 16 kb, 적어도 17 kb, 적어도 18 kb, 적어도 19 kb, 적어도 20 kb, 적어도 21 kb, 적어도 22 kb, 적어도 23 kb, 적어도 24 kb, 적어도 25 kb, 적어도 30 kb, 적어도 35 kb, 적어도 38 kb, 또는 적어도 40 kb의 길이를 갖는 것인 벡터, 게놈, 또는 시스템.
- 제1항 내지 제6항 중 어느 한 항에 있어서, 트랜스포손 페이로드가 10 kb-35 kb, 10 kb-30 kb, 15 kb-35 kb, 15 kb-30 kb, 20 kb-35 kb, 또는 20 kb-30 kb의 길이를 갖는 것인 벡터, 게놈, 또는 시스템.
- 제1항 내지 제6항 중 어느 한 항에 있어서, 트랜스포손 페이로드가 10 kb-32.4 kb, 15 kb-32.4 kb, 또는 20 kb-32.4 kb의 길이를 갖는 것인 벡터, 게놈, 또는 시스템.
- 제1항 내지 제11항 중 어느 한 항에 있어서, 트랜스포손 페이로드가 단백질을 코딩하는 핵산 서열을 포함하고, 임의로 여기서 단백질이 치료 단백질인 벡터, 게놈, 또는 시스템.
- 제12항에 있어서, 단백질이 β 글로빈 대체 단백질 및 γ-글로빈 대체 단백질로 이루어진 군으로부터 선택된 것인 벡터, 게놈, 또는 시스템.
- 제12항에 있어서, 단백질이 인자 VIII 대체 단백질인 벡터, 게놈, 또는 시스템.
- 제12항 또는 제13항에 있어서, 단백질을 코딩하는 핵산 서열이 프로모터와 작동가능하게 연결되고, 임의로 여기서 프로모터가 β 글로빈 프로모터인 벡터, 게놈, 또는 시스템.
- 제1항 내지 제15항 중 어느 한 항에 있어서, 트랜스포손 역전된 반복부가 슬리핑 뷰티 (SB) 역전된 반복부이고, 임의로 여기서 SB 역전된 반복부가 pT4 역전된 반복부인 벡터, 게놈, 또는 시스템.
- 제3항 내지 제15항 중 어느 한 항에 있어서, 트랜스포사제가 슬리핑 뷰티 (SB) 트랜스포사제이고, 임의로 여기서 트랜스포사제가 슬리핑 뷰티 100x (SB100x)인 벡터, 게놈, 또는 시스템.
- 제1항 내지 제17항 중 어느 한 항에 있어서, 레콤비나제 직접 반복부가 FRT 부위인 벡터, 게놈, 또는 시스템.
- 제3항 내지 제18항 중 어느 한 항에 있어서, 아데노바이러스 지지 게놈이 레콤비나제를 코딩하는 핵산을 포함하는 것인 벡터, 게놈, 또는 시스템.
- 제19항에 있어서, 레콤비나제가 FLP 레콤비나제인 벡터, 게놈, 또는 시스템.
- 제1항 내지 제20항 중 어느 한 항에 있어서, 트랜스포손 페이로드가 β-글로빈 긴 LCR을 포함하고, 트랜스포손 페이로드가 β-글로빈 프로모터와 작동가능하게 연결된 β-글로빈을 코딩하는 핵산 서열을 포함하고, 역전된 반복부가 SB 역전된 반복부이고, 레콤비나제 직접 반복부가 FRT 부위인 벡터, 게놈, 또는 시스템.
- 제1항 내지 제21항 중 어느 한 항에 있어서, 트랜스포손 페이로드가 선택 카세트를 포함하고, 임의로 여기서 선택 카세트가 mgmtP140K를 코딩하는 핵산 서열을 포함하는 것인 벡터, 게놈, 또는 시스템.
- 제1항 내지 제22항 중 어느 한 항에 있어서, 아데노바이러스 캡시드가 CD46에 대한 증가된 친화도를 위해 변형되고, 임의로 여기서 아데노바이러스 캡시드가 Ad35++ 캡시드인 벡터, 게놈, 또는 시스템.
- 제5항 내지 제23항 중 어느 한 항에 있어서, 아데노바이러스 헬퍼 게놈 조건부 패키징 요소가 레콤비나제 직접 반복부에 플랭킹된 패키징 서열을 포함하는 것인 아데노바이러스 생산 시스템.
- 제24항에 있어서, 조건부 패키징 요소의 패키징 서열에 플랭킹된 레콤비나제 직접 반복부가 LoxP 부위인 아데노바이러스 생산 시스템.
- 제1항 내지 제25항 중 어느 한 항에 따른 벡터, 게놈, 또는 시스템을 포함하는 세포.
- 제1항 내지 제25항 중 어느 한 항의 트랜스포손 페이로드를 그의 게놈에 포함하는 세포로서, 여기서 세포의 게놈에 존재하는 트랜스포손 페이로드는 트랜스포손 역전된 반복부에 플랭킹된 것인 세포.
- 제26항 또는 제27항에 있어서, 조혈 줄기 세포인 세포.
- 제5항 내지 제25항 중 어느 한 항에 따른 아데노바이러스 생산 시스템을 포함하는 아데노바이러스-생산 세포로서, 임의로 HEK293 세포인 아데노바이러스-생산 세포.
- 세포를 변형시키는 방법으로서, 세포를 제1항 내지 제25항 중 어느 한 항에 따른 벡터, 게놈, 또는 시스템과 접촉시키는 것을 포함하는 방법.
- 대상체의 세포를 변형시키는 방법으로서, 대상체에게 제1항 내지 제25항 중 어느 한 항에 따른 벡터, 게놈, 또는 시스템을 투여하는 것을 포함하는 방법.
- 대상체로부터의 세포의 단리 없이 대상체의 세포를 변형시키는 방법으로서, 대상체에게 제1항 내지 제25항 중 어느 한 항에 따른 벡터, 게놈, 또는 시스템을 투여하는 것을 포함하는 방법.
- 질환 또는 상태의 치료를 필요로 하는 대상체에서 질환 또는 상태를 치료하는 방법으로서, 대상체에게 제1항 내지 제25항 중 어느 한 항에 따른 벡터, 게놈, 또는 시스템을 투여하는 것을 포함하는 방법.
- 제31항 내지 제33항 중 어느 한 항에 있어서, 아데노바이러스 공여자 벡터가 대상체에게 정맥내로 투여되는 것인 방법.
- 제31항 내지 제34항 중 어느 한 항에 있어서, 대상체에게 가동화 작용제를 투여하는 것을 포함하며, 임의로 여기서 가동화 작용제는 과립구-콜로니 자극 인자 (G-CSF), CXCR4 길항제, 및 CXCR2 효능제 중 1종 이상을 포함하는 것인 방법.
- 제35항에 있어서, CXCR4 길항제가 AMD3100인 방법.
- 제35항 또는 제36항에 있어서, CXCR2 효능제가 GRO-β인 방법.
- 제31항 내지 제37항 중 어느 한 항에 있어서, 트랜스포손 페이로드가 선택 카세트를 포함하며, 대상체에게 선택제를 투여하는 것을 포함하는 방법.
- 제38항에 있어서, 선택 카세트가 mgmtP140K를 코딩하고, 선택제가 O6BG/BCNU인 방법.
- 제31항 내지 제39항 중 어느 한 항에 있어서, CD46을 발현하는 세포의 적어도 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 또는 95%에서 트랜스포손 페이로드의 적어도 1개의 카피의 통합 및/또는 발현을 유발하는 방법.
- 제31항 내지 제39항 중 어느 한 항에 있어서, 조혈 줄기 세포 및/또는 적혈구 Ter119+ 세포의 적어도 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 또는 95%에서 트랜스포손 페이로드의 적어도 1개의 카피의 통합 및/또는 발현을 유발하는 방법.
- 제31항 내지 제41항 중 어느 한 항에 있어서, 트랜스포손 페이로드의 적어도 1개의 카피를 포함하는 세포의 게놈에서 트랜스포손 페이로드의 평균 적어도 2개의 카피의 통합을 유발하는 방법.
- 제31항 내지 제42항 중 어느 한 항에 있어서, 트랜스포손 페이로드의 적어도 1개의 카피를 포함하는 세포의 게놈에서 트랜스포손 페이로드의 평균 적어도 2.5개의 카피의 통합을 유발하는 방법.
- 제31항 내지 제43항 중 어느 한 항에 있어서, 트랜스포손 페이로드에 의해 코딩된 단백질의 발현을 참조 수준의 적어도 약 20%인 수준으로 유발하고, 임의로 여기서 참조가 대상체 또는 참조 집단에서의 내인성 참조 단백질의 발현인 방법.
- 제31항 내지 제43항 중 어느 한 항에 있어서, 트랜스포손 페이로드에 의해 코딩된 단백질의 발현을 참조 수준의 적어도 약 25%인 수준으로 유발하고, 임의로 여기서 참조가 대상체 또는 참조 집단에서의 내인성 참조 단백질의 발현인 방법.
- 제31항 내지 제45항 중 어느 한 항에 있어서, 대상체가 중간성 지중해빈혈을 앓고 있는 대상체이며, 여기서 트랜스포사제 페이로드는 β-글로빈 LCR HS1 내지 HS5를 포함하는 β-글로빈 긴 LCR 및 β 글로빈 프로모터와 작동가능하게 연결된 β 글로빈 대체 단백질 및/또는 γ-글로빈 대체 단백질을 코딩하는 핵산 서열을 포함하는 것인 방법.
- 제31항 내지 제45항 중 어느 한 항에 있어서, 대상체가 혈우병을 앓고 있는 대상체이며, 여기서 트랜스포사제 페이로드는 β-글로빈 LCR HS1 내지 HS5를 포함하는 β-글로빈 긴 LCR 및 β 글로빈 프로모터와 작동가능하게 연결된 인자 VIII 대체 단백질을 코딩하는 핵산 서열을 포함하는 것인 방법.
- 제47항에 있어서, 대상체에서의 단백질의 발현이 중간성 지중해빈혈의 적어도 1종의 증상을 감소시키고/거나 중간성 지중해빈혈을 치료하는 것인 방법.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US202063009298P | 2020-04-13 | 2020-04-13 | |
US63/009,298 | 2020-04-13 | ||
PCT/US2021/026880 WO2021211454A1 (en) | 2020-04-13 | 2021-04-12 | Integration of large adenovirus payloads |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20230002681A true KR20230002681A (ko) | 2023-01-05 |
Family
ID=78084993
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020227039575A Pending KR20230002681A (ko) | 2020-04-13 | 2021-04-12 | 대형 아데노바이러스 페이로드의 통합 |
Country Status (11)
Country | Link |
---|---|
US (1) | US20230313224A1 (ko) |
EP (1) | EP4136244A4 (ko) |
JP (1) | JP2023521410A (ko) |
KR (1) | KR20230002681A (ko) |
CN (1) | CN115768901A (ko) |
AU (1) | AU2021256428A1 (ko) |
BR (1) | BR112022020589A2 (ko) |
CA (1) | CA3174414A1 (ko) |
MX (1) | MX2022012819A (ko) |
TW (1) | TW202204627A (ko) |
WO (1) | WO2021211454A1 (ko) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114457119B (zh) * | 2022-04-11 | 2022-08-12 | 中吉智药(南京)生物技术有限公司 | 慢病毒载体在制备治疗β-地中海贫血药物中的应用 |
WO2024006388A1 (en) * | 2022-06-29 | 2024-01-04 | The Regents Of The University Of California | Lentiviral vectors expressing alpha-glob in genes for gene therapy of alpha thalassemia |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
ES2300200B1 (es) * | 2006-10-18 | 2009-05-01 | Universitat Autonoma De Barcelona | Transposon hsmar2 y su uso en la generacion de vectores utiles en terapia genica somatica. |
WO2013003112A1 (en) * | 2011-06-27 | 2013-01-03 | The Jackson Laboratory | Methods and compositions for treatment of cancer and autoimmune disease |
CA2947466A1 (en) * | 2014-05-01 | 2015-11-05 | University Of Washington | In vivo gene engineering with adenoviral vectors |
EP3219803A1 (en) * | 2016-03-15 | 2017-09-20 | Max-Delbrück-Centrum für Molekulare Medizin | Enhanced sleeping beauty transposons, kits and methods of transposition |
BR112021026832A2 (pt) * | 2019-07-02 | 2022-05-10 | Hutchinson Fred Cancer Res | Vetores ad35 recombinantes e aprimoramentos da terapia gênica relacionada |
BR112023021434A2 (pt) * | 2021-04-15 | 2023-12-19 | Ensoma Inc | Vetores de terapia genética adenovirais |
-
2021
- 2021-04-12 CA CA3174414A patent/CA3174414A1/en active Pending
- 2021-04-12 KR KR1020227039575A patent/KR20230002681A/ko active Pending
- 2021-04-12 MX MX2022012819A patent/MX2022012819A/es unknown
- 2021-04-12 BR BR112022020589A patent/BR112022020589A2/pt unknown
- 2021-04-12 JP JP2022562076A patent/JP2023521410A/ja active Pending
- 2021-04-12 WO PCT/US2021/026880 patent/WO2021211454A1/en unknown
- 2021-04-12 EP EP21788014.5A patent/EP4136244A4/en active Pending
- 2021-04-12 US US17/995,671 patent/US20230313224A1/en active Pending
- 2021-04-12 CN CN202180043133.5A patent/CN115768901A/zh active Pending
- 2021-04-12 AU AU2021256428A patent/AU2021256428A1/en active Pending
- 2021-04-13 TW TW110113297A patent/TW202204627A/zh unknown
Also Published As
Publication number | Publication date |
---|---|
MX2022012819A (es) | 2022-11-14 |
AU2021256428A1 (en) | 2022-10-20 |
JP2023521410A (ja) | 2023-05-24 |
US20230313224A1 (en) | 2023-10-05 |
EP4136244A1 (en) | 2023-02-22 |
WO2021211454A9 (en) | 2022-04-14 |
WO2021211454A1 (en) | 2021-10-21 |
BR112022020589A2 (pt) | 2022-12-13 |
CN115768901A (zh) | 2023-03-07 |
CA3174414A1 (en) | 2021-10-21 |
EP4136244A4 (en) | 2024-06-05 |
TW202204627A (zh) | 2022-02-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7399866B2 (ja) | CARTyrin組成物とその利用方法 | |
US20220089750A1 (en) | Car-expressing cells against multiple tumor antigens and uses thereof | |
US11952408B2 (en) | HPV-specific binding molecules | |
US20220257796A1 (en) | Recombinant ad35 vectors and related gene therapy improvements | |
CA3086187A1 (en) | Vcar compositions and methods for use | |
CN112585277A (zh) | 表达重组受体的t细胞、相关多核苷酸和方法 | |
CN112795594A (zh) | 工程化嵌合抗原受体(car)t细胞的人应用 | |
CN110418800A (zh) | 治疗溶酶体紊乱的方法 | |
US20220380776A1 (en) | Base editor-mediated cd33 reduction to selectively protect therapeutic cells | |
KR20180092989A (ko) | 트랜스포존 시스템, 이를 포함한 키트, 및 이들의 용도 | |
WO2022221702A2 (en) | Adenoviral gene therapy vectors | |
US20230313224A1 (en) | Integration of large adenovirus payloads | |
US20240108752A1 (en) | Adenoviral gene therapy vectors | |
WO2023150393A2 (en) | Inhibitor-resistant mgmt modifications and modification of mgmt-encoding nucleic acids | |
RU2804664C2 (ru) | Hpv-специфические связывающие молекулы |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PA0105 | International application |
Patent event date: 20221111 Patent event code: PA01051R01D Comment text: International Patent Application |
|
PG1501 | Laying open of application | ||
A201 | Request for examination | ||
PA0201 | Request for examination |
Patent event code: PA02012R01D Patent event date: 20240411 Comment text: Request for Examination of Application |