KR20230003511A - 안면견갑상완 근이영양증에 대한 crispr-억제 - Google Patents
안면견갑상완 근이영양증에 대한 crispr-억제 Download PDFInfo
- Publication number
- KR20230003511A KR20230003511A KR1020227039447A KR20227039447A KR20230003511A KR 20230003511 A KR20230003511 A KR 20230003511A KR 1020227039447 A KR1020227039447 A KR 1020227039447A KR 20227039447 A KR20227039447 A KR 20227039447A KR 20230003511 A KR20230003511 A KR 20230003511A
- Authority
- KR
- South Korea
- Prior art keywords
- lys
- leu
- glu
- ile
- asn
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/113—Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K48/00—Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
- A61K48/005—Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'active' part of the composition delivered, i.e. the nucleic acid delivered
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P21/00—Drugs for disorders of the muscular or neuromuscular system
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P43/00—Drugs for specific purposes, not provided for in groups A61P1/00-A61P41/00
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/85—Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
- C12N15/86—Viral vectors
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/16—Hydrolases (3) acting on ester bonds (3.1)
- C12N9/22—Ribonucleases [RNase]; Deoxyribonucleases [DNase]
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/80—Fusion polypeptide containing a DNA binding domain, e.g. Lacl or Tet-repressor
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/10—Type of nucleic acid
- C12N2310/20—Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPR]
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2750/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
- C12N2750/00011—Details
- C12N2750/14011—Parvoviridae
- C12N2750/14111—Dependovirus, e.g. adenoassociated viruses
- C12N2750/14141—Use of virus, viral particle or viral elements as a vector
- C12N2750/14143—Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Genetics & Genomics (AREA)
- Engineering & Computer Science (AREA)
- Chemical & Material Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Organic Chemistry (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Biomedical Technology (AREA)
- Biotechnology (AREA)
- Molecular Biology (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Biochemistry (AREA)
- Microbiology (AREA)
- Medicinal Chemistry (AREA)
- Public Health (AREA)
- Plant Pathology (AREA)
- Biophysics (AREA)
- Physics & Mathematics (AREA)
- Pharmacology & Pharmacy (AREA)
- Veterinary Medicine (AREA)
- Animal Behavior & Ethology (AREA)
- Virology (AREA)
- Chemical Kinetics & Catalysis (AREA)
- General Chemical & Material Sciences (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Epidemiology (AREA)
- Neurology (AREA)
- Orthopedic Medicine & Surgery (AREA)
- Physical Education & Sports Medicine (AREA)
- Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
- Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
- Acyclic And Carbocyclic Compounds In Medicinal Compositions (AREA)
- Bakery Products And Manufacturing Methods Therefor (AREA)
- Medicines Containing Material From Animals Or Micro-Organisms (AREA)
Abstract
본 개시내용은 골격근 세포에서 DUX4 유전자의 발현을 억제하기 위한 방법 및 조성물에 관한 것이다. 일부 양상에서, 본 발명은 후성적 조절인자를 DUX4 유전자좌로 지시하는 CRISPR 간섭 플랫폼을 포함한다. 일부 양상에서, 본 개시내용에 의해 기재된 방법은 안면견갑상완 근이영양증(FSHD)의 치료를 위한 DUX4 발현을 조절하는데 유용하다.
Description
관련 출원에 대한 상호 참조
본 출원은 2020년 4월 17일에 출원된 미국 가출원 제 63/011,476호에 대해 35 U.S.C. § 119(e) 하의 우선권을 주장하며, 상기 문헌은 그 전문이 본 명세서에 참조로 포함된다.
안면견갑상완 근이영양증(FSHD)(MIM 158900 및 158901)은 특정 근육 그룹의 진행성 약화 및 위축을 특징으로 하는 인간에서 세 번째로 흔한 근이영양증이다. 두 가지 형태의 질병은 염색체 4q35에서 D4Z4 거대부수체 반복 배열의 후성적 조절 장애(epigenetic dysregulation)로 인해 발생한다. 이 질병의 가장 흔한 형태인 FSHD1은 이 배열에서 염색질(chromatin)의 대규모 결실과 관련이 있다(문헌[Wijmenga, et al.(1990) Lancet. 336:651-3; Wijmenga, et al.(1992) Nat Genet. 2: 26-30, van Deutekom, et al.(1993) Hum Mol Genet. 2: 2037-42]). FSHD2는 후성적 침묵화를 유지하는 단백질의 돌연변이로 인해 발생한다. 두 조건 모두 D4Z4 염색질의 유사한 이완을 유도하여(문헌[Lemmers, et al. (2012) Nat Genet. 44: 1370-4]), 골격근에서 DUX4 레트로유전자의 비정상적인 발현을 초래한다. DUX4는 거대부수체 배열의 모든 D4Z4 반복 단위에 존재하지만, 질병 유발 대립유전자(disease-permissive allele)에서 폴리아데닐화 신호(polyadenylation signal)가 존재하기 때문에 가장 원위부 반복에 의해 인코딩된 전장(full-length) DUX4 mRNA(DUX4-fl)만 안정적으로 발현된다(문헌[Lemmers, et al.(2010) Science.329:1650-3, Snider, et al.(2010) PLoS Genet. 6: e1001181]). DUX4-FL 단백질은 결과적으로 초기 발달에서 정상적으로 발현되는 유전자의 숙주를 활성화시켜 성인 골격근에서 잘못 발현될 때 병리를 유발한다(문헌[Campbell, et al. (2018) Hum Mol Genet.; Himeda, et al. (2019) Ann Rev Genomics Hum Genet. 20:265-291]).
병태의 중증도(severity)를 감소시키기 위해 FSHD에서 후성적 조절장애를 보정하고 골격근 세포에서 DUX4 발현을 치료학적으로 감소시키기 위한 새로운 접근법이 당업계에 명백히 요구되고 있다. 본 발명은 이러한 요구를 다룬다.
본 명세서에 기재된 바와 같이, 본 발명은 안면견갑상완 근이영양증(FSHD)의 치료에 유용한 방법 및 조성물에 관한 것이다.
일 양상에서, 본 발명은 단일 가이드 RNA(single guide RNA; sgRNA) 및 융합 폴리펩타이드(fusion polypeptide)를 포함하는 CRISPR 간섭(CRISPRi) 플랫폼을 인코딩(encoding)하는 폴리뉴클레오타이드를 포함하고, 융합 폴리펩타이드는 후성적 억제인자(epigenetic repressor)에 융합된 촉매적으로 불활성인 Cas9(dCas9 또는 iCas9)를 추가로 포함한다.
다양한 실시형태에서, sgRNA는 U6 프로모터의 제어(control) 하에 있다.
다양한 실시형태에서, sgRNA는 DUX4 유전자좌(locus)를 표적화(targeting)한다.
다양한 실시형태에서, 융합 폴리펩타이드는 골격근-특이적 조절 카세트(skeletal muscle-specific regulatory cassette)의 제어 하에 있는.
본 명세서에 기재된 본 발명의 상기 양상 또는 임의의 다른 양상의 다양한 실시형태에서, 촉매적으로 불활성인 Cas9는 dSaCas9이다.
본 명세서에 기재된 본 발명의 상기 양상 또는 임의의 다른 양상의 다양한 실시형태에서, 후성적 억제인자는 HP1α, HP1γ, HP1α 또는 HP1γ의 염색체 섀도우 도메인(chromo shadow domain) 및 C-말단 확장 영역, MeCP2 전사 억제 도메인 (TRD), 및 SUV39H1 SET 도메인으로 이루어진 군으로부터 선택된다.
특정 실시형태에서, sgRNA는 서열번호 38, 39, 40, 41, 42, 또는 43을 포함한다.
특정 실시형태에서, 융합 폴리펩타이드는 서열번호 1 내지 4 중 어느 하나를 포함한다.
특정 실시형태에서, 폴리뉴클레오타이드는 서열번호 48 내지 55 중 어느 하나를 포함한다.
또 다른 양상에서, 본 발명은 sgRNA 및 융합 폴리펩타이드를 포함하는 CRISPRi 플랫폼을 인코딩하는 폴리뉴클레오타이드를 포함하는 벡터(vector)로서, 융합 폴리펩타이드는 후성적 억제인자에 융합된 촉매적으로 불활성인 Cas9(dCas9 또는 iCas9)를 추가로 포함한다.
특정 실시형태에서, sgRNA는 U6 프로모터의 제어 하에 있다.
특정 실시형태에서, sgRNA는 DUX4 유전자좌를 표적화한다.
특정 실시형태에서, 융합 폴리펩타이드는 골격근-특이적 조절 카세트의 제어 하에 있다.
특정 실시형태에서, 촉매적으로 불활성인 Cas9는 dSaCas9이다.
특정 실시형태에서, 후성적 억제인자는 HP1α, HP1γ, HP1α 또는 HP1γ의 염색체 섀도우 도메인 및 C-말단 확장 영역, MeCP2 전사 억제 도메인 (TRD), 및 SUV39H1 SET 도메인으로 이루어진 군으로부터 선택된다.
특정 실시형태에서, sgRNA는 서열번호 38, 39, 40, 41, 42, 또는 43을 포함한다.
특정 실시형태에서, 융합 폴리펩타이드는 서열번호 1 내지 4 중 어느 하나를 포함한다.
특정 실시형태에서, 폴리뉴클레오타이드는 서열번호 48 내지 55 중 어느 하나를 포함한다.
특정 실시형태에서, 벡터는 아데노-연관 바이러스 (AAV) 벡터이다.
특정 실시형태에서, 벡터는 서열번호 48 내지 55 중 어느 하나를 포함한다.
또 다른 양상에서, 이를 필요로 하는 대상체에서 안면견갑상완 근이영양증(FSHD)을 치료하는 방법으로서, 상기 방법은 DUX4 유전자 발현의 억제인자 유효랑을 대상체에게 투여하는 단계를 포함하고, 억제인자는 대상체의 골격근 세포에서 DUX4 유전자 발현을 감소시킴으로써, 장애(disorder)를 치료한다.
특정 실시형태에서, DUX4 억제인자는 sgRNA 및 융합 폴리펩타이드를 포함하는 CRISPRi 플랫폼을 포함하는 폴리뉴클레오타이드이고, 융합 폴리펩타이드는 후성적 억제인자에 융합된 dCas9를 추가로 포함한다.
특정 실시형태에서, sgRNA는 DUX4 유전자좌를 표적화한다.
특정 실시형태에서, sgRNA는 서열번호 38, 39, 40, 41, 42, 또는 43으로 이루어진 군으로부터 선택되는 핵산 서열을 포함한다.
특정 실시형태에서, dCas9는 dSaCas9이다.
특정 실시형태에서, 후성적 억제인자는 HP1α, HP1γ, HP1α 또는 HP1γ의 염색체 섀도우 도메인 및 C-말단 확장 영역, MeCP2 전사 억제 도메인 (TRD), 및 SUV39H1 SET 도메인으로 이루어진 군으로부터 선택된다.
특정 실시형태에서, 융합 폴리펩타이드는 서열번호 1 내지 4 중 어느 하나를 포함하는 폴리뉴클레오타이드에 의해 인코딩된다.
특정 실시형태에서, 폴리뉴클레오타이드는 서열번호 48 내지 55 중 어느 하나를 포함한다.
특정 실시형태에서, 대상체는 포유류이다.
특정 실시형태에서, 포유류는 인간이다.
특정 실시형태에서, 본 방법은 명세서에 기재된 본 발명의 상기 양상 또는 임의의 다른 양상 중 어느 하나의 벡터의 유효량을 대상체에 투여하는 단계를 포함한다.
특정 실시형태에서, 대상체는 포유류이다.
특정 실시형태에서, 포유류는 인간이다.
본 발명의 바람직한 실시형태에 대한 다음의 상세한 설명은 첨부된 도면과 함께 읽을 때 더 잘 이해될 것이다. 본 발명을 예시할 목적으로, 현재 바람직한 실시형태가 도면에 도시되어 있다. 그러나, 본 발명은 도면에 도시된 실시형태의 정확한 배열 및 수단으로 제한되지 않는다는 것을 이해해야 한다.
도 1a 내지 도 1d는 DUX4의 후성적 억제를 위한 CRISPRi 작제물을 도시한다. 도 1a는 최초의 2-벡터 시스템을 예시한다: 1) CKM 기반 조절 카세트의 제어 하에 KRAB 전사 억제 도메인(TRD)에 융합된 dSpCas9 및 2) U6 프로모터의 제어 하에 SpCas9-적합성 스캐폴드(scaffold)를 갖는 DUX4-표적화 sgRNA. 도 1b는 최적화된 2-벡터 시스템을 도시한다: 1) 최소화된 골격근 조절 카세트의 제어 하에 4개의 후성적 억제인자(HP1α, HP1γ, MeCP2 TRD, 또는 SUV39H1 SET 전, SET, 및 SET 후 도메인) 중 하나에 융합된 더 작은 dSaCas9 오르쏘로그, 및 2) U6 프로모터의 제어하에 추정 Pol III 종결인자가 제거되고 dCas9와의 조립을 개선하는 변형을 혼입한 SaCas9 적합 스캐폴드가 있는 DUX4 표적화 sgRNA(문헌[Tabebordar, et al.(2016) Science. 351: 407-11]). 도 1c는 최적화된 단일 벡터 시스템을 도시한다. 이 작제물은 4개의 개별 치료학적 카세트에 각 후성적 조절인자와 sgRNA 요소의 미니 형태를 포함한다. 요소의 크기는 비례하지 않는다. 도 1d는 염색체 4q35에서 FSHD 유전자좌의 개략도를 보여준다. 거리는 DUX4 MAL 개시 코돈(*)을 기준으로 표시된다. 단순화를 위해 거대부수체 배열의 원위 D4Z4 반복 단위만 표시된다. DUX4 엑손 1과 2는 D4Z4 반복 내에 위치하고 엑손 3은 말단 텔로미어 서열에 있다. sgRNA 표적 서열(#1 내지 6)의 위치가 표시된다. ChIP 앰플리콘(amplicon)의 위치는 표지되지 않은 적색 막대로 표시된다(5'에서 3': DUX4 프로모터, 엑손 1 및 엑손 3).
도 2a 내지 도 2d는 DUX4 프로모터 또는 엑손 1에 대한 후성적 억제인자의 dSaCas9 매개 집합이 FSHD 근세포에서 DUX4-fl 및 DUX4-FL 표적을 억제한다는 것을 예시하는 일련의 그래프이다. FSHD 근세포는 다음 중 하나에 융합된 dSaCas9를 발현하는 렌티바이러스(LV) 상청액으로 4회의 연속 동시 감염에 적용되었다: 도 2a) SUV39H1 SET 전, SET 및 SET 후 도메인(SET), 도 2b) MeCP2 TRD, 도 2c) HP1γ, 또는 도 2d) DUX4를 표적화하는 sgRNA(#1 내지 6) 또는 비표적화 sgRNA(NT)를 발현하는 LV의 존재 또는 부재 하의 HP1α. 세포를 감염의 마지막 라운드 후 약 72시간째에 수확하였다. DUX4-fl 및 DUX4-FL 표적 유전자 TRIM43 및 MBD3L2의 발현 수준을 qRT-PCR에 의해 평가하였다. 데이터는 각각의 dCas9-후성적 조절인자를 발현하는 세포에 대한 상대적 mRNA 발현을 단독으로 1로 설정한 적어도 4개의 독립적인 실험의 평균 + SD 값으로 표시된다. *p<0.05, **p<0.01, ***p<0.001은 NT와 비교한 것이다.
도 3a 내지 도 3d는 FSHD 근세포에서 DUX4 프로모터 또는 엑손 1이 DUX4-fl 및 DUX4-FL 표적을 억제하는 후성적 억제인자의 dSaCas9 매개 집합을 도시한다. FSHD 근세포는 다음 중 하나에 융합된 dSaCas9를 발현하는 렌티바이러스(LV) 상청액으로 4회의 연속 동시 감염에 적용되었다: 도 3a) SUV39H1 SET 전, SET 및 SET 후 도메인(SET), 도 3b) MeCP2 TRD, 도 3c) HP1γ, 또는 도 3d) DUX4를 표적화하는 sgRNA(#1 내지 6) 또는 비표적화 sgRNA(NT)를 발현하는 LV의 존재 또는 부재 하의 HP1α. 세포를 감염의 마지막 라운드 후 약 72시간에 수확하였다. DUX4-fl 및 DUX4-FL 표적 유전자 TRIM43 및 MBD3L2의 발현 수준을 qRT-PCR에 의해 평가하였다. 모든 패널에서 각 막대는 각 dCas9-후성적 조절인자를 발현하는 세포에 대한 발현을 단독으로 1로 설정한 단일 생물학적 이중 반복 실험에 대한 상대적 mRNA 발현을 나타낸다.
도 4a 및 도 4b는 DUX4-fl 억제에 필요한 SET 도메인의 효소 활성을 예시하는 한 쌍의 그래프이다. FSHD 근세포를 도 2에서와 같이 DUX4를 표적화하는 LV 발현 sgRNA(#1 내지 4) 또는 비표적화 sgRNA(NT)의 존재 또는 부재하에 효소 활성(SET-mt)을 제거하는 SET 도메인 내에 돌연변이(C326A)를 포함하는 dSaCas9-SET을 발현하는 LV 상청액으로 감염시켰다(문헌[Rea, et al. (2000) 406: 593-9]). DUX4-fl의 발현 수준은 qRT-PCR에 의해 평가하였다. 도 4a에서, 데이터는 dCas9-SET-mt를 발현하는 세포에 대한 상대적 mRNA 발현을 단독으로 1로 설정한 4개의 독립적인 실험의 평균 + SD 값으로 그래프화되었다. 도 4b에서, 각 막대는 dCas9-SET-mt를 발현하는 세포에 대한 발현을 단독으로 1로 설정한 단일 생물학적 이중 반복 실험에 대한 상대적 mRNA 발현을 나타낸다.
도 5a 내지 도 5d는 DUX4에 대한 dSaCas9-후성적 억제인자의 표적화가 MYH1 또는 D4Z4 근위 유전자에 영향을 미치지 않는다는 것을 예시하는 일련의 그래프이다. (도 5a 내지 도 5d) 말단 근육 분화 마커(marker) 미오신 중쇄 1(MYH1) 및 D4Z4 근위 유전자 FRG1 및 FRG2의 발현 수준을 도 2에 기재된 FSHD 근세포 배양물에서 qRT-PCR에 의해 평가하였다. 데이터는 각 dCas9-후성적 조절인자를 발현하는 세포에 대한 상대적 mRNA 발현을 단독으로 1로 설정한 적어도 4회의 독립적인 실험의 평균 + SD 값으로 표시된다.
도 6a 내지 도 6d는 DUX4에 대한 dSaCas9-후성적 억제인자의 표적화가 MYH1 또는 D4Z4 근위 유전자에 영향을 미치지 않는다는 것을 예시하는 일련의 그래프이다. 도 6a 내지 도 6d) 말단 근육 분화 마커 미오신 중쇄 1(MYH1) 및 D4Z4 근위 유전자 FRG1 및 FRG2의 발현 수준을 도 2에 기재된 FSHD 근세포 배양물에서 qRT-PCR에 의해 평가하였다. 모든 패널에서 각 막대는 각 dCas9-후성적 조절인자를 발현하는 세포에 대한 발현을 단독으로 1로 설정한 단일 생물학적 이중 반복 실험에 대한 상대적 mRNA 발현을 나타낸다.
도 7a 및 도 7b는 DUX4에 대한 dSaCas9-후성적 억제인자의 표적화가 골격근에서 발현되는 가장 근위의 표적외(OT) 유전자에 영향을 미치지 않는다는 것을 나타내는 한 쌍의 그래프이다. 리소좀 아미노산 수송체 1 동족체(LAAT1)(도 7a), 리보솜 생합성 조절 단백질 동족체(RRS1), 또는 구아닌 뉴클레오타이드-결합 단백질 G(i) 소단위 알파-1 이소형 1(GNAI1)(도 7b)의 수준을 도 2에 기재된 관련 FSHD 근세포 배양물에서 qRT-PCR에 의해 평가하였다. LAAT1의 인트론 1은 sgRNA #1에 대한 잠재적인 OT 매칭을 포함한다. RRS1의 단일 엑손(exon)과 GNAI1의 하류 플랭킹(flanking) 서열은 sgRNA #5에 대한 잠재적인 OT 매칭을 포함한다. 데이터는 각 dCas9-후성적 조절인자를 발현하는 세포에 대한 상대적 mRNA 발현을 단독으로 1로 설정한 5개 이상의 독립적인 실험의 평균 + SD 값으로 표시된다.
도 8a 및 도 8b는 DUX4에 대한 dSaCas9-후성적 억제인자의 표적화가 골격근에서 발현되는 가장 근위의 표적외(OT) 유전자에 영향을 미치지 않는다는 것을 나타낸다. 리소좀 아미노산 수송체 1 동족체(LAAT1)(도 8a), 리보솜 생합성 조절 단백질 동족체(RRS1) 또는 구아닌 뉴클레오타이드-결합 단백질 G(i) 소단위 알파-1 이소형 1(GNAI1)(도 8b)의 수준을 도 2에 기재된 관련 FSHD 근세포 배양물에서 qRT-PCR에 의해 평가하였다. LAAT1의 인트론 1은 sgRNA #1에 대한 잠재적인 OT 일치를 포함한다. RRS1의 단일 엑손과 GNAI1의 하류 플랭킹 서열은 sgRNA #5에 대한 잠재적인 OT 매칭을 포함한다. 모든 패널에서 각 막대는 각 dCas9-후성적 조절인자를 발현하는 세포에 대한 발현을 단독으로 1로 설정한 단일 생물학적 이중 반복 실험에 대한 상대적인 mRNA 발현을 나타낸다.
도 9a 내지 도 9c는 DUX4에 대한 후성적 억제인자의 dSaCas9 매개 집합이 유전자좌에서 염색질 억제를 증가시킨다는 것을 나타내는 일련의 그래프이다. ChIP 분석을 DUX4 프로모터 또는 엑손 1을 표적화하는 sgRNA + 각 dSaCas9-후성적 조절인자를 발현하는 LV 상청액으로 감염된 FSHD 근세포를 사용하여 수행하였다. 염색질을 HP1α(도 9a) 또는 KAP1(도 9b)에 특이적인 항체를 사용하여 면역침전시키고, DUX4 또는 MYOD1의 프로모터(Pro), 전사 개시 부위(TSS), 엑손 3, 또는 RNA-Pol II(포스포-세린 2)의 연장된 형태에 특이적인 항체에 대한 프라이머를 사용한 qPCR에 의해 분석하고(도 9c), MYOD1 또는 염색체 4의 DUX4 엑손1/인트론1에 특이적인 프라이머를 사용하여 qPCR로 분석했다. MYOD1을 DUX4를 표적화하는 CRISPRi의 영향을 받지 않아야 하는 활성 유전자에 대한 음성 대조군으로 사용하였다. DUX4 프라이머의 위치는 도 1d에 도시되어 있다. 데이터는 모의(mock) 감염된 세포에 대한 농축을 1로 설정한 α-히스톤 H3으로 정규화된 각 특정 항체에 의해 표적 영역의 농축 배수로 표시된다. 모든 패널의 경우 각 막대는 최소 3개의 독립적인 ChIP 실험의 평균을 나타낸다. *p<0.05, **p<0.01, ***p<0.001은 MYOD1에서 농축과 비교한 것이다.
도 10a 내지 도 10c는 DUX4에 대한 후성적 억제인자의 dSaCas9 매개 집합이 유전자좌에서 염색질 억제를 증가시킨다는 것을 예시한다. ChIP 분석을 DUX4 프로모터 또는 엑손 1을 표적화하는 sgRNA + 각 dSaCas9-후성적 조절인자를 발현하는 LV 상청액으로 감염된 FSHD 근세포를 사용하여 수행하였다. 염색질을 HP1α(도 10a) 또는 KAP1(도 10b)에 특이적인 항체를 사용하여 면역침전시키고, MYOD1 또는 DUX4의 프로모터(Pro), 전사 개시 부위(TSS), 엑손 3, 또는 RNA-Pol II(포스포-세린 2)의 연장 형태에 특이적인 항체에 대한 프라이머를 사용한 qPCR에 의해 분석하고(도 10c), MYOD1 또는 염색체 4의 DUX4 엑손1/인트론1에 특이적인 프라이머를 사용하여 qPCR로 분석했다. MYOD1을 DUX4를 표적화하는 CRISPRi의 영향을 받지 않아야 하는 활성 유전자에 대한 음성 대조군으로 사용하였다. DUX4 프라이머의 위치는 도 1d에 도시되어 있다. 데이터는 모의 감염된 세포에 대한 농축을 1로 설정한 α-히스톤 H3으로 정규화된 각 특정 항체에 의해 표적 영역의 농축 배수로 표시된다. 모든 패널에서 각 막대는 단일 생물학적 이중 반복 실험를 나타낸다.
도 11은 조직에서 AAV 게놈의 PCR 검출을 나타내는 그래프이다. 다양한 mCherry-발현 및 비발현 조직에서 AAV 게놈의 존재를 AAV9에 대한 프라이머를 사용하여 qPCR에 의해 평가하고, 단일 카피 Rosa26 유전자로 정규화하였다. 이는 검출 가능한 mCherry를 발현하지 않는 신장 및 간과 같은 조직이 고도로 형질도입되었음을 확인시켜, FSHD 최적화 발현 카세트의 조직 특이성을 뒷받침한다.
도 12a 내지 도 12u는 FSHD-최적화된 조절 카세트가 골격근에서는 활성이지만 심장근에서는 활성이 아님을 예시하는 일련의 현미경 사진 및 다이어그램이다. FSHD 최적화 조절 카세트의 제어 하에 mCherry를 포함하는 AAV9 바이러스 입자(도 12u)를 안와후주사에 의해 야생형 마우스에 전달하고 형광 신호를 주입 후 12주째에 Leica MZ9.5/DFC7000T 이미징 시스템을 사용하여 시각화하였다. 2-조직 패널 도 12a 내지 도 12l의 경우, 주입되지 않은 마우스의 조직이 좌측에 표시된다. 단일 조직 패널 12M-12N은 주입되지 않고; 패널 12O-12T는 AAV 주입되었다. 주입된 모든 조직은 별표로 표시된다. mCherry의 발현은 골격근(전경골 TA, 비복근 GA, 및 대퇴사두근 QUA, 뿐만 아니라, 횡격막, 가슴, 복부, 및 안면 근육)에서 검출되었으며 심장에서는 검출되지 않았다.
도 13a 내지 도 13t는 FSHD-최적화된 조절 카세트가 비골격 근육 조직에서 활성이 아님을 나타내는 일련의 이미지이다. 도 12에서 분석된 AAV9 주입된 야생형 마우스로부터의 비-근육 조직을 mCherry 발현에 대해 유사하게 분석하였다. 패널 A, B, K 및 L은 AAV 주입된 마우스의 조직만을 보여주고; 나머지 패널은 주입되지 않은 마우스(좌측) 및 주입된 마우스(우측 및 별표로 표시됨)의 조직을 보여준다. 패널 A와 B에서 좌골 신경은 흑색 화살표로 표시된다.
도 14a 내지 도 14f는 DUX4에 대한 dSaCas9-억제인자를 표적화하는 것이 FSHD 근세포에서 전체 유전자 발현에 최소한의 영향을 미친다는 것을 예시한다(도 14a 내지 도 14e). FSHD 근세포를 (도 14a) dSaCas9-KRAB + sgRNA #6, (도 14b) dSaCas9-HP1α + sgRNA #2, (도 14c) dSaCas9-HP1γ + sgRNA #5, (도 14d) dSaCas9-SET + sgRNA #1, 또는 (도 14e) dSaCas9-TRD + sgRNA #6로 형질도입시켰다. 각 처리에 대해 Illumina HiSeq 2 x 100 bp 플랫폼을 사용하여 RNA-seq로 5개의 독립적인 실험을 분석했다. 조정된 화산 산점도는 모의 감염된 세포에 대한 각 처리 간의 전체적인 전사 변화를 보여준다. 각 데이터 포인트는 유전자를 나타낸다. 상향 조절된 유전자(p < 0.05 및 log2 배수 변화(fold change) > 1)는 회색 점으로 표시된다. 하향 조절된 유전자(p < 0.05 및 log2 배수 변화 < -1)는 짙은 회색 점으로 표시된다. 고유하게 차등적으로 발현된 유전자(F로 요약됨)는 밝은 회색 점으로 표시된다.
도 15는 모의 대 KRAB의 유전자 온톨로지(ontology)(GO) 분석을 나타낸다.
도 16은 모의 대 HP1γ의 유전자 온톨로지(GO) 분석을 나타낸다.
도 17은 모의 대 HP1α의 유전자 온톨로지(GO) 분석을 나타낸다.
도 18은 모의 대 SET의 유전자 온톨로지(GO) 분석을 나타낸다.
도 19는 모의 대 TRD의 유전자 온톨로지(GO) 분석을 나타낸다.
도 20a 내지 도 20f는 DUX4 엑손 1에 대한 dSaCas9-억제인자의 생체내 표적화를 예시하며, ACTA1-MCM;FLExD 이중트랜스제닉 마우스에서 DUX4-fl 및 DUX4-FL 표적을 억제한다(도 20a 내지 도 20f). dSaCas9-TRD 또는 -KRAB ± sgRNA를 AAV9를 사용하여 하나의 인간 D4Z4 반복을 보유하는 ACTA1-MCM;FLExD 중등도 병리 FSHD-유사 트랜스제닉 마우스 모델에 근육내로 전달하였다. DUX4-fl 및 DUX4-FL 하류 마커 Wfdc3 및 Slc34a2의 발현을 qRT-PCR에 의해 평가하고 Rp137 수준으로 정규화했다. dSaCas9-TRD 또는 -KRAB 대 sgRNA의 카피 수 비율이 표시된다. *p < 0.05, **p < 0.01은 dSaCas9-TRD 또는 -KRAB 대조군과 비교한 것이다.
도 21a 및 도 21b는 CRISPRi 올인원 벡터가 FSHD1 및 FSHD2 근세포에서 DUX4-fl 및 이의 표적을 효과적으로 억제한다는 것을 예시한다. FSHD1(도 21a) 또는 FSHD2(도 21b) 일차 근세포를 dSaCas9-TRD 및 DUX4-표적화 sgRNA를 발현하는 올인원 벡터로 형질도입시켰다. DUX4-fl 및 그 표적 유전자 TRIM43 및 MBD3L2의 발현 수준을 비교를 위해 MYH1(영향을 받지 않아야 함)뿐만 아니라 qRT-PCR에 의해 평가하였다. 데이터는 모의 감염된 세포에 대한 상대적 mRNA 발현을 1로 설정한 최소 3개의 독립적인 실험의 평균 + SD 값으로 그래프화되었다. *p<0.05, **p<0.01, ***p<0.001은 모의와 비교한 것이다.
도 22는 HP1α 및 HP1γ가 최소화된 CRISPRi 올인원 벡터가 FSHD1 근세포에서 DUX4-fl 및 이의 표적을 효과적으로 억제한다는 것을 예시한다. FSHD1 일차 근세포를 1) HP1α 또는 HP1 γ의 C-말단 확장 및 염색체 섀도우 도메인에 융합된 dSaCas9 및 2) DUX4-표적화 sgRNA 또는 비표적화 균등물(HP1α-NT)을 발현하는 올인원 벡터로 형질도입시켰다. DUX4-fl 및 이의 표적 유전자 TRIM43 및 MBD3L2의 발현 수준은 비교를 위해 MYH1(영향을 받지 않아야 함)뿐만 아니라 qRT-PCR에 의해 평가하였다. 데이터는 모의 감염된 세포에 대한 상대적 mRNA 발현을 1로 설정한 3개의 독립적인 실험의 평균 + SD 값으로 그래프화되었다. *p<0.05, **p<0.01은 모의와 비교한 것이다.
도 23a 내지 도 23h는 변형된 FSHD-최적화 조절 카세트가 가자미근, 횡격막 및 심장에서 증가된 활성을 나타낸다는 것을 예시하는 일련의 현미경 사진이다. 변형된 FSHD 최적화 조절 카세트의 제어 하에 있는 mCherry를 RO 주입에 의해 AAV9에서 야생형 마우스에 전달하고 형광 신호를 표시된 경우를 제외하고 동일한 노출 시간(300ms)으로 주입 12주 후에 시각화하였다. 두 조직 패널 A 내지 G의 경우 주입된 조직을 *로 표시하였다. 패널 C의 경우 가자미근은 좌측에, EDL 근육은 우측에 표시된다. 단일 조직 패널 H를 주입하였다. 이전 카세트(문헌[Himeda, et al.(2020) Mol Ther Methods Clin Dev. 20:298-311])와 마찬가지로 mCherry 발현은 표시된 속근뿐만 아니라 가슴, 복부 및 안면 근육(표시되지 않음)에서 높았다. 이전 카세트(문헌[Himeda, et al.(2020) Mol Ther Methods Clin Dev. 20:298-311])에서 개선된 것으로 mCherry 발현이 가자미근(SOL)에서 검출되었고 횡격막에서 증가했다. 심장에서 mCherry 발현도 증가했지만 중요한 것은 발현이 모든 비근육 조직에서 여전히 검출되지 않았다는 점이다(장 및 간 표시).
도 24a 내지 도 24k는 DUX4에 대한 dSaCas9-억제인자의 표적화 후 유의한 DEG를 예시하는 표이다.
도 25는 DUX4에 대한 dSaCas9-억제인자의 표적화 후 DEG의 비교를 예시하는 표이다.
도 26a 및 도 26b는 DUX4에 대한 dSaCas9-억제인자의 표적화 후 발달 및 근원성 DEG 간의 발현 변화를 예시하는 표이다.
도 1a 내지 도 1d는 DUX4의 후성적 억제를 위한 CRISPRi 작제물을 도시한다. 도 1a는 최초의 2-벡터 시스템을 예시한다: 1) CKM 기반 조절 카세트의 제어 하에 KRAB 전사 억제 도메인(TRD)에 융합된 dSpCas9 및 2) U6 프로모터의 제어 하에 SpCas9-적합성 스캐폴드(scaffold)를 갖는 DUX4-표적화 sgRNA. 도 1b는 최적화된 2-벡터 시스템을 도시한다: 1) 최소화된 골격근 조절 카세트의 제어 하에 4개의 후성적 억제인자(HP1α, HP1γ, MeCP2 TRD, 또는 SUV39H1 SET 전, SET, 및 SET 후 도메인) 중 하나에 융합된 더 작은 dSaCas9 오르쏘로그, 및 2) U6 프로모터의 제어하에 추정 Pol III 종결인자가 제거되고 dCas9와의 조립을 개선하는 변형을 혼입한 SaCas9 적합 스캐폴드가 있는 DUX4 표적화 sgRNA(문헌[Tabebordar, et al.(2016) Science. 351: 407-11]). 도 1c는 최적화된 단일 벡터 시스템을 도시한다. 이 작제물은 4개의 개별 치료학적 카세트에 각 후성적 조절인자와 sgRNA 요소의 미니 형태를 포함한다. 요소의 크기는 비례하지 않는다. 도 1d는 염색체 4q35에서 FSHD 유전자좌의 개략도를 보여준다. 거리는 DUX4 MAL 개시 코돈(*)을 기준으로 표시된다. 단순화를 위해 거대부수체 배열의 원위 D4Z4 반복 단위만 표시된다. DUX4 엑손 1과 2는 D4Z4 반복 내에 위치하고 엑손 3은 말단 텔로미어 서열에 있다. sgRNA 표적 서열(#1 내지 6)의 위치가 표시된다. ChIP 앰플리콘(amplicon)의 위치는 표지되지 않은 적색 막대로 표시된다(5'에서 3': DUX4 프로모터, 엑손 1 및 엑손 3).
도 2a 내지 도 2d는 DUX4 프로모터 또는 엑손 1에 대한 후성적 억제인자의 dSaCas9 매개 집합이 FSHD 근세포에서 DUX4-fl 및 DUX4-FL 표적을 억제한다는 것을 예시하는 일련의 그래프이다. FSHD 근세포는 다음 중 하나에 융합된 dSaCas9를 발현하는 렌티바이러스(LV) 상청액으로 4회의 연속 동시 감염에 적용되었다: 도 2a) SUV39H1 SET 전, SET 및 SET 후 도메인(SET), 도 2b) MeCP2 TRD, 도 2c) HP1γ, 또는 도 2d) DUX4를 표적화하는 sgRNA(#1 내지 6) 또는 비표적화 sgRNA(NT)를 발현하는 LV의 존재 또는 부재 하의 HP1α. 세포를 감염의 마지막 라운드 후 약 72시간째에 수확하였다. DUX4-fl 및 DUX4-FL 표적 유전자 TRIM43 및 MBD3L2의 발현 수준을 qRT-PCR에 의해 평가하였다. 데이터는 각각의 dCas9-후성적 조절인자를 발현하는 세포에 대한 상대적 mRNA 발현을 단독으로 1로 설정한 적어도 4개의 독립적인 실험의 평균 + SD 값으로 표시된다. *p<0.05, **p<0.01, ***p<0.001은 NT와 비교한 것이다.
도 3a 내지 도 3d는 FSHD 근세포에서 DUX4 프로모터 또는 엑손 1이 DUX4-fl 및 DUX4-FL 표적을 억제하는 후성적 억제인자의 dSaCas9 매개 집합을 도시한다. FSHD 근세포는 다음 중 하나에 융합된 dSaCas9를 발현하는 렌티바이러스(LV) 상청액으로 4회의 연속 동시 감염에 적용되었다: 도 3a) SUV39H1 SET 전, SET 및 SET 후 도메인(SET), 도 3b) MeCP2 TRD, 도 3c) HP1γ, 또는 도 3d) DUX4를 표적화하는 sgRNA(#1 내지 6) 또는 비표적화 sgRNA(NT)를 발현하는 LV의 존재 또는 부재 하의 HP1α. 세포를 감염의 마지막 라운드 후 약 72시간에 수확하였다. DUX4-fl 및 DUX4-FL 표적 유전자 TRIM43 및 MBD3L2의 발현 수준을 qRT-PCR에 의해 평가하였다. 모든 패널에서 각 막대는 각 dCas9-후성적 조절인자를 발현하는 세포에 대한 발현을 단독으로 1로 설정한 단일 생물학적 이중 반복 실험에 대한 상대적 mRNA 발현을 나타낸다.
도 4a 및 도 4b는 DUX4-fl 억제에 필요한 SET 도메인의 효소 활성을 예시하는 한 쌍의 그래프이다. FSHD 근세포를 도 2에서와 같이 DUX4를 표적화하는 LV 발현 sgRNA(#1 내지 4) 또는 비표적화 sgRNA(NT)의 존재 또는 부재하에 효소 활성(SET-mt)을 제거하는 SET 도메인 내에 돌연변이(C326A)를 포함하는 dSaCas9-SET을 발현하는 LV 상청액으로 감염시켰다(문헌[Rea, et al. (2000) 406: 593-9]). DUX4-fl의 발현 수준은 qRT-PCR에 의해 평가하였다. 도 4a에서, 데이터는 dCas9-SET-mt를 발현하는 세포에 대한 상대적 mRNA 발현을 단독으로 1로 설정한 4개의 독립적인 실험의 평균 + SD 값으로 그래프화되었다. 도 4b에서, 각 막대는 dCas9-SET-mt를 발현하는 세포에 대한 발현을 단독으로 1로 설정한 단일 생물학적 이중 반복 실험에 대한 상대적 mRNA 발현을 나타낸다.
도 5a 내지 도 5d는 DUX4에 대한 dSaCas9-후성적 억제인자의 표적화가 MYH1 또는 D4Z4 근위 유전자에 영향을 미치지 않는다는 것을 예시하는 일련의 그래프이다. (도 5a 내지 도 5d) 말단 근육 분화 마커(marker) 미오신 중쇄 1(MYH1) 및 D4Z4 근위 유전자 FRG1 및 FRG2의 발현 수준을 도 2에 기재된 FSHD 근세포 배양물에서 qRT-PCR에 의해 평가하였다. 데이터는 각 dCas9-후성적 조절인자를 발현하는 세포에 대한 상대적 mRNA 발현을 단독으로 1로 설정한 적어도 4회의 독립적인 실험의 평균 + SD 값으로 표시된다.
도 6a 내지 도 6d는 DUX4에 대한 dSaCas9-후성적 억제인자의 표적화가 MYH1 또는 D4Z4 근위 유전자에 영향을 미치지 않는다는 것을 예시하는 일련의 그래프이다. 도 6a 내지 도 6d) 말단 근육 분화 마커 미오신 중쇄 1(MYH1) 및 D4Z4 근위 유전자 FRG1 및 FRG2의 발현 수준을 도 2에 기재된 FSHD 근세포 배양물에서 qRT-PCR에 의해 평가하였다. 모든 패널에서 각 막대는 각 dCas9-후성적 조절인자를 발현하는 세포에 대한 발현을 단독으로 1로 설정한 단일 생물학적 이중 반복 실험에 대한 상대적 mRNA 발현을 나타낸다.
도 7a 및 도 7b는 DUX4에 대한 dSaCas9-후성적 억제인자의 표적화가 골격근에서 발현되는 가장 근위의 표적외(OT) 유전자에 영향을 미치지 않는다는 것을 나타내는 한 쌍의 그래프이다. 리소좀 아미노산 수송체 1 동족체(LAAT1)(도 7a), 리보솜 생합성 조절 단백질 동족체(RRS1), 또는 구아닌 뉴클레오타이드-결합 단백질 G(i) 소단위 알파-1 이소형 1(GNAI1)(도 7b)의 수준을 도 2에 기재된 관련 FSHD 근세포 배양물에서 qRT-PCR에 의해 평가하였다. LAAT1의 인트론 1은 sgRNA #1에 대한 잠재적인 OT 매칭을 포함한다. RRS1의 단일 엑손(exon)과 GNAI1의 하류 플랭킹(flanking) 서열은 sgRNA #5에 대한 잠재적인 OT 매칭을 포함한다. 데이터는 각 dCas9-후성적 조절인자를 발현하는 세포에 대한 상대적 mRNA 발현을 단독으로 1로 설정한 5개 이상의 독립적인 실험의 평균 + SD 값으로 표시된다.
도 8a 및 도 8b는 DUX4에 대한 dSaCas9-후성적 억제인자의 표적화가 골격근에서 발현되는 가장 근위의 표적외(OT) 유전자에 영향을 미치지 않는다는 것을 나타낸다. 리소좀 아미노산 수송체 1 동족체(LAAT1)(도 8a), 리보솜 생합성 조절 단백질 동족체(RRS1) 또는 구아닌 뉴클레오타이드-결합 단백질 G(i) 소단위 알파-1 이소형 1(GNAI1)(도 8b)의 수준을 도 2에 기재된 관련 FSHD 근세포 배양물에서 qRT-PCR에 의해 평가하였다. LAAT1의 인트론 1은 sgRNA #1에 대한 잠재적인 OT 일치를 포함한다. RRS1의 단일 엑손과 GNAI1의 하류 플랭킹 서열은 sgRNA #5에 대한 잠재적인 OT 매칭을 포함한다. 모든 패널에서 각 막대는 각 dCas9-후성적 조절인자를 발현하는 세포에 대한 발현을 단독으로 1로 설정한 단일 생물학적 이중 반복 실험에 대한 상대적인 mRNA 발현을 나타낸다.
도 9a 내지 도 9c는 DUX4에 대한 후성적 억제인자의 dSaCas9 매개 집합이 유전자좌에서 염색질 억제를 증가시킨다는 것을 나타내는 일련의 그래프이다. ChIP 분석을 DUX4 프로모터 또는 엑손 1을 표적화하는 sgRNA + 각 dSaCas9-후성적 조절인자를 발현하는 LV 상청액으로 감염된 FSHD 근세포를 사용하여 수행하였다. 염색질을 HP1α(도 9a) 또는 KAP1(도 9b)에 특이적인 항체를 사용하여 면역침전시키고, DUX4 또는 MYOD1의 프로모터(Pro), 전사 개시 부위(TSS), 엑손 3, 또는 RNA-Pol II(포스포-세린 2)의 연장된 형태에 특이적인 항체에 대한 프라이머를 사용한 qPCR에 의해 분석하고(도 9c), MYOD1 또는 염색체 4의 DUX4 엑손1/인트론1에 특이적인 프라이머를 사용하여 qPCR로 분석했다. MYOD1을 DUX4를 표적화하는 CRISPRi의 영향을 받지 않아야 하는 활성 유전자에 대한 음성 대조군으로 사용하였다. DUX4 프라이머의 위치는 도 1d에 도시되어 있다. 데이터는 모의(mock) 감염된 세포에 대한 농축을 1로 설정한 α-히스톤 H3으로 정규화된 각 특정 항체에 의해 표적 영역의 농축 배수로 표시된다. 모든 패널의 경우 각 막대는 최소 3개의 독립적인 ChIP 실험의 평균을 나타낸다. *p<0.05, **p<0.01, ***p<0.001은 MYOD1에서 농축과 비교한 것이다.
도 10a 내지 도 10c는 DUX4에 대한 후성적 억제인자의 dSaCas9 매개 집합이 유전자좌에서 염색질 억제를 증가시킨다는 것을 예시한다. ChIP 분석을 DUX4 프로모터 또는 엑손 1을 표적화하는 sgRNA + 각 dSaCas9-후성적 조절인자를 발현하는 LV 상청액으로 감염된 FSHD 근세포를 사용하여 수행하였다. 염색질을 HP1α(도 10a) 또는 KAP1(도 10b)에 특이적인 항체를 사용하여 면역침전시키고, MYOD1 또는 DUX4의 프로모터(Pro), 전사 개시 부위(TSS), 엑손 3, 또는 RNA-Pol II(포스포-세린 2)의 연장 형태에 특이적인 항체에 대한 프라이머를 사용한 qPCR에 의해 분석하고(도 10c), MYOD1 또는 염색체 4의 DUX4 엑손1/인트론1에 특이적인 프라이머를 사용하여 qPCR로 분석했다. MYOD1을 DUX4를 표적화하는 CRISPRi의 영향을 받지 않아야 하는 활성 유전자에 대한 음성 대조군으로 사용하였다. DUX4 프라이머의 위치는 도 1d에 도시되어 있다. 데이터는 모의 감염된 세포에 대한 농축을 1로 설정한 α-히스톤 H3으로 정규화된 각 특정 항체에 의해 표적 영역의 농축 배수로 표시된다. 모든 패널에서 각 막대는 단일 생물학적 이중 반복 실험를 나타낸다.
도 11은 조직에서 AAV 게놈의 PCR 검출을 나타내는 그래프이다. 다양한 mCherry-발현 및 비발현 조직에서 AAV 게놈의 존재를 AAV9에 대한 프라이머를 사용하여 qPCR에 의해 평가하고, 단일 카피 Rosa26 유전자로 정규화하였다. 이는 검출 가능한 mCherry를 발현하지 않는 신장 및 간과 같은 조직이 고도로 형질도입되었음을 확인시켜, FSHD 최적화 발현 카세트의 조직 특이성을 뒷받침한다.
도 12a 내지 도 12u는 FSHD-최적화된 조절 카세트가 골격근에서는 활성이지만 심장근에서는 활성이 아님을 예시하는 일련의 현미경 사진 및 다이어그램이다. FSHD 최적화 조절 카세트의 제어 하에 mCherry를 포함하는 AAV9 바이러스 입자(도 12u)를 안와후주사에 의해 야생형 마우스에 전달하고 형광 신호를 주입 후 12주째에 Leica MZ9.5/DFC7000T 이미징 시스템을 사용하여 시각화하였다. 2-조직 패널 도 12a 내지 도 12l의 경우, 주입되지 않은 마우스의 조직이 좌측에 표시된다. 단일 조직 패널 12M-12N은 주입되지 않고; 패널 12O-12T는 AAV 주입되었다. 주입된 모든 조직은 별표로 표시된다. mCherry의 발현은 골격근(전경골 TA, 비복근 GA, 및 대퇴사두근 QUA, 뿐만 아니라, 횡격막, 가슴, 복부, 및 안면 근육)에서 검출되었으며 심장에서는 검출되지 않았다.
도 13a 내지 도 13t는 FSHD-최적화된 조절 카세트가 비골격 근육 조직에서 활성이 아님을 나타내는 일련의 이미지이다. 도 12에서 분석된 AAV9 주입된 야생형 마우스로부터의 비-근육 조직을 mCherry 발현에 대해 유사하게 분석하였다. 패널 A, B, K 및 L은 AAV 주입된 마우스의 조직만을 보여주고; 나머지 패널은 주입되지 않은 마우스(좌측) 및 주입된 마우스(우측 및 별표로 표시됨)의 조직을 보여준다. 패널 A와 B에서 좌골 신경은 흑색 화살표로 표시된다.
도 14a 내지 도 14f는 DUX4에 대한 dSaCas9-억제인자를 표적화하는 것이 FSHD 근세포에서 전체 유전자 발현에 최소한의 영향을 미친다는 것을 예시한다(도 14a 내지 도 14e). FSHD 근세포를 (도 14a) dSaCas9-KRAB + sgRNA #6, (도 14b) dSaCas9-HP1α + sgRNA #2, (도 14c) dSaCas9-HP1γ + sgRNA #5, (도 14d) dSaCas9-SET + sgRNA #1, 또는 (도 14e) dSaCas9-TRD + sgRNA #6로 형질도입시켰다. 각 처리에 대해 Illumina HiSeq 2 x 100 bp 플랫폼을 사용하여 RNA-seq로 5개의 독립적인 실험을 분석했다. 조정된 화산 산점도는 모의 감염된 세포에 대한 각 처리 간의 전체적인 전사 변화를 보여준다. 각 데이터 포인트는 유전자를 나타낸다. 상향 조절된 유전자(p < 0.05 및 log2 배수 변화(fold change) > 1)는 회색 점으로 표시된다. 하향 조절된 유전자(p < 0.05 및 log2 배수 변화 < -1)는 짙은 회색 점으로 표시된다. 고유하게 차등적으로 발현된 유전자(F로 요약됨)는 밝은 회색 점으로 표시된다.
도 15는 모의 대 KRAB의 유전자 온톨로지(ontology)(GO) 분석을 나타낸다.
도 16은 모의 대 HP1γ의 유전자 온톨로지(GO) 분석을 나타낸다.
도 17은 모의 대 HP1α의 유전자 온톨로지(GO) 분석을 나타낸다.
도 18은 모의 대 SET의 유전자 온톨로지(GO) 분석을 나타낸다.
도 19는 모의 대 TRD의 유전자 온톨로지(GO) 분석을 나타낸다.
도 20a 내지 도 20f는 DUX4 엑손 1에 대한 dSaCas9-억제인자의 생체내 표적화를 예시하며, ACTA1-MCM;FLExD 이중트랜스제닉 마우스에서 DUX4-fl 및 DUX4-FL 표적을 억제한다(도 20a 내지 도 20f). dSaCas9-TRD 또는 -KRAB ± sgRNA를 AAV9를 사용하여 하나의 인간 D4Z4 반복을 보유하는 ACTA1-MCM;FLExD 중등도 병리 FSHD-유사 트랜스제닉 마우스 모델에 근육내로 전달하였다. DUX4-fl 및 DUX4-FL 하류 마커 Wfdc3 및 Slc34a2의 발현을 qRT-PCR에 의해 평가하고 Rp137 수준으로 정규화했다. dSaCas9-TRD 또는 -KRAB 대 sgRNA의 카피 수 비율이 표시된다. *p < 0.05, **p < 0.01은 dSaCas9-TRD 또는 -KRAB 대조군과 비교한 것이다.
도 21a 및 도 21b는 CRISPRi 올인원 벡터가 FSHD1 및 FSHD2 근세포에서 DUX4-fl 및 이의 표적을 효과적으로 억제한다는 것을 예시한다. FSHD1(도 21a) 또는 FSHD2(도 21b) 일차 근세포를 dSaCas9-TRD 및 DUX4-표적화 sgRNA를 발현하는 올인원 벡터로 형질도입시켰다. DUX4-fl 및 그 표적 유전자 TRIM43 및 MBD3L2의 발현 수준을 비교를 위해 MYH1(영향을 받지 않아야 함)뿐만 아니라 qRT-PCR에 의해 평가하였다. 데이터는 모의 감염된 세포에 대한 상대적 mRNA 발현을 1로 설정한 최소 3개의 독립적인 실험의 평균 + SD 값으로 그래프화되었다. *p<0.05, **p<0.01, ***p<0.001은 모의와 비교한 것이다.
도 22는 HP1α 및 HP1γ가 최소화된 CRISPRi 올인원 벡터가 FSHD1 근세포에서 DUX4-fl 및 이의 표적을 효과적으로 억제한다는 것을 예시한다. FSHD1 일차 근세포를 1) HP1α 또는 HP1 γ의 C-말단 확장 및 염색체 섀도우 도메인에 융합된 dSaCas9 및 2) DUX4-표적화 sgRNA 또는 비표적화 균등물(HP1α-NT)을 발현하는 올인원 벡터로 형질도입시켰다. DUX4-fl 및 이의 표적 유전자 TRIM43 및 MBD3L2의 발현 수준은 비교를 위해 MYH1(영향을 받지 않아야 함)뿐만 아니라 qRT-PCR에 의해 평가하였다. 데이터는 모의 감염된 세포에 대한 상대적 mRNA 발현을 1로 설정한 3개의 독립적인 실험의 평균 + SD 값으로 그래프화되었다. *p<0.05, **p<0.01은 모의와 비교한 것이다.
도 23a 내지 도 23h는 변형된 FSHD-최적화 조절 카세트가 가자미근, 횡격막 및 심장에서 증가된 활성을 나타낸다는 것을 예시하는 일련의 현미경 사진이다. 변형된 FSHD 최적화 조절 카세트의 제어 하에 있는 mCherry를 RO 주입에 의해 AAV9에서 야생형 마우스에 전달하고 형광 신호를 표시된 경우를 제외하고 동일한 노출 시간(300ms)으로 주입 12주 후에 시각화하였다. 두 조직 패널 A 내지 G의 경우 주입된 조직을 *로 표시하였다. 패널 C의 경우 가자미근은 좌측에, EDL 근육은 우측에 표시된다. 단일 조직 패널 H를 주입하였다. 이전 카세트(문헌[Himeda, et al.(2020) Mol Ther Methods Clin Dev. 20:298-311])와 마찬가지로 mCherry 발현은 표시된 속근뿐만 아니라 가슴, 복부 및 안면 근육(표시되지 않음)에서 높았다. 이전 카세트(문헌[Himeda, et al.(2020) Mol Ther Methods Clin Dev. 20:298-311])에서 개선된 것으로 mCherry 발현이 가자미근(SOL)에서 검출되었고 횡격막에서 증가했다. 심장에서 mCherry 발현도 증가했지만 중요한 것은 발현이 모든 비근육 조직에서 여전히 검출되지 않았다는 점이다(장 및 간 표시).
도 24a 내지 도 24k는 DUX4에 대한 dSaCas9-억제인자의 표적화 후 유의한 DEG를 예시하는 표이다.
도 25는 DUX4에 대한 dSaCas9-억제인자의 표적화 후 DEG의 비교를 예시하는 표이다.
도 26a 및 도 26b는 DUX4에 대한 dSaCas9-억제인자의 표적화 후 발달 및 근원성 DEG 간의 발현 변화를 예시하는 표이다.
정의
달리 정의되지 않는 한, 본 명세서에서 사용되는 모든 기술 및 과학 용어는 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 것과 동일한 의미를 갖는다. 본 명세서에 기재된 것과 유사하거나 균등한 임의의 방법 및 재료가 본 발명의 시험을 위한 실시에 사용될 수 있지만, 바람직한 재료 및 방법이 본 명세서에 기재되어 있다. 본 발명을 기재하고 청구함에 있어 다음과 같은 용어가 사용될 것이다.
또한, 본 명세서에서 사용되는 바와 같이, 용어는 특정 실시형태를 기재하기 위한 목적으로 사용된 것으로, 제한하려는 의도가 아님을 이해해야 한다.
단수형 관사 ("a" 및 "an")는 본 명세서에서 관사의 문법적 대상 중 하나 또는 하나 초과(즉, 적어도 하나)를 지칭하는데 사용된다. 예로서, "요소"는 하나의 요소 또는 하나 초과의 요소를 의미한다.
양, 시간적 지속시간 등과 같은 측정 가능한 값을 언급할 때 본 명세서에서 사용되는 "약"은 명시된 값으로부터 ±20% 또는 ±10%, 보다 바람직하게는 ±5%, 훨씬 더욱 바람직하게는 ±1%, 및 여전히 더욱 바람직하게는 ±0.1%을 포함하는 것을 의미하며, 이러한 변화는 개시된 방법을 수행하는데 적합하기 때문이다.
본 명세서에 사용되는 바와 같이, 용어 "자가"는 동일한 개체로부터 유래된 임의의 물질을 의미하며, 이는 추후에 개체 내로 재도입된다.
"동종"은 동일한 종의 다른 동물로부터 유래된 이식편을 지칭한다.
"이종"은 상이한 종의 동물로부터 유래된 이식편을 지칭한다.
본 명세서에 사용되는 바와 같이, 용어 "암"은 비정상적인 세포의 빠르고 제어되지 않는 성장을 특징으로 하는 질병으로 정의된다. 암세포는 국소적으로 또는 혈류와 림프계를 통해 신체의 다른 부분으로 확산될 수 있다. 다양한 암의 예는 다음에 제한되는 것은 아니나, 유방암(breast cancer), 전립선암(prostate cancer), 난소암(ovarian cancer), 자궁경부암(cervical cancer), 피부암(skin cancer), 췌장암(pancreatic cancer), 결장직장암(colorectal cancer), 신장암(renal cancer), 간암(liver cancer), 뇌암(brain cancer), 림프종(lymphoma), 백혈병(leukemia), 폐암(lung cancer) 등을 포함한다. 특정 실시형태에서, 암은 갑상선 수질 암종이다.
"절단"이라는 용어는 핵산 분자의 골격과 같은 공유 결합의 파괴를 지칭한다. 절단은 다음에 제한되는 것은 아니나, 포스포디에스테르 결합의 효소적 또는 화학적 가수분해를 포함하는 다양한 방법에 의해 개시될 수 있다. 단일 가닥 절단 및 이중 가닥 절단이 모두 가능하다. 이중 가닥 절단은 2개의 별개의 단일 가닥 절단 사건의 결과로 발생할 수 있다. DNA 절단으로 인해 평활 말단(blunt end) 또는 접착성 말단(staggered end)이 생성될 수 있다. 특정 실시형태에서, 융합 폴리펩타이드는 절단된 이중 가닥 DNA를 표적화하기 위해 사용될 수 있다.
본 명세서에 사용되는 바와 같이, 용어 "보존적 서열 변형"은 아미노산 서열을 포함하는 항체의 결합 특성에 유의한 영향을 미치거나 변이시키지 않는 아미노산 변형을 지칭하는 것으로 의도된다. 이러한 보존적 변형에는 아미노산 치환, 추가 및 결실이 포함된다. 변형은 부위-지정 돌연변이유발 및 PCR-매개 돌연변이유발과 같은 당업계에 공지된 표준 기술에 의해 본 발명의 항체에 도입될 수 있다. 보존적 아미노산 치환은 아미노산 잔기가 유사한 측쇄를 갖는 아미노산 잔기로 대체된 것이다. 유사한 측쇄를 갖는 아미노산 잔기의 패밀리는 당업계에 정의되어 있다. 이러한 패밀리에는 염기성 측쇄(예를 들어, 리신, 아르기닌, 히스티딘), 산성 측쇄(예를 들어, 아스파르트산, 글루탐산), 전하를 띠지 않는 극성 측쇄(예를 들어, 글리신, 아스파라긴, 글루타민, 세린, 트레오닌, 티로신, 시스테인, 트립토판), 비극성 측쇄(예를 들어, 알라닌, 발린, 류신, 이소류신, 프롤린, 페닐알라닌, 메티오닌), 베타-분지형 측쇄(예를 들어, 트레오닌, 발린, 이소류신) 및 방향족 측쇄(예를 들어, 타이로신, 페닐알라닌, 트립토판, 히스티딘)가 있는 아미노산을 포함한다. 따라서, 항체의 CDR 영역 내의 하나 이상의 아미노산 잔기는 동일한 측쇄 패밀리로부터의 다른 아미노산 잔기로 대체될 수 있고 변이된 항체는 본 명세서에 기재된 기능적 분석을 사용하여 항원에 결합하는 능력에 대해 시험될 수 있다.
"질병"은 동물이 항상성을 유지할 수 없으며, 질병이 개선되지 않으면 동물의 건강이 계속 악화되는 동물의 건강 상태이다. 이와 달리, 동물의 "장애"는 동물이 항상성을 유지할 수 있는 건강 상태이지만 동물의 건강 상태가 장애가 없을 때보다 덜 유리한 상태이다. 치료하지 않고 방치하면 장애가 반드시 동물의 건강 상태를 더 악화시키는 것은 아니다.
"유효량" 또는 "치료학적 유효량"은 본 명세서에서 상호 혼용되며, 특정 생물학적 결과를 달성하거나 치료학적 또는 예방학적 효과를 제공하는데 효과적인 본 명세서에 기재된 바와 같은 화합물, 제형, 물질 또는 조성물의 양을 지칭한다. 이러한 결과는 다음에 제한되는 것은 아니나, 당업계에 적합한 임의의 수단에 의해 결정된 항종양 활성을 포함할 수 있다.
"인코딩"은 뉴클레오타이드(즉, rRNA, tRNA 및 mRNA)의 소정의 서열 또는 아미노산의 소정의 서열 및 그로부터 생성되는 생물학적 특성을 갖는 생물학적 과정에서 유전자, cDNA, 또는 mRNA와 같은 폴리뉴클레오타이드에서 뉴클레오타이드의 특정 서열의 고유한 특성을 지칭한다. 따라서 해당 유전자에 상응하는 mRNA의 전사 및 번역이 세포 또는 다른 생물학적 시스템에서 단백질을 생성하는 경우 유전자는 단백질을 인코딩한다. 뉴클레오타이드 서열이 mRNA 서열과 동일하고 일반적으로 서열 목록에 제공되는 코딩 가닥과 유전자 또는 cDNA의 전사를 위한 주형(template)으로 사용되는 비-코딩(non-coding) 가닥 모두는 단백질 또는 해당 유전자 또는 cDNA의 다른 산물을 인코딩하는 것으로 지칭될 수 있다.
본 명세서에 사용되는 바와 같이, "내인성"은 유기체, 세포, 조직 또는 계로부터 생성되거나 그 내부에서 생성되는 임의의 물질을 지칭한다.
본 명세서에 사용되는 바와 같이, 용어 "외인성"은 유기체, 세포, 조직 또는 계로부터 도입되거나 외부에서 생성된 임의의 물질을 지칭한다.
본 명세서에 사용되는 바와 같이, 용어 "발현"은 이의 프로모터에 의해 유도되는 특정 뉴클레오타이드 서열의 전사 및/또는 번역으로 정의된다.
"발현 벡터"는 발현될 뉴클레오타이드 서열에 작동가능하게 연결된 발현 조절 서열을 포함하는 재조합 폴리뉴클레오타이드를 포함하는 벡터를 지칭한다. 발현 벡터는 발현을 위한 충분한 시스 작용 요소를 포함하고; 발현을 위한 다른 요소는 숙주 세포에 의해 또는 시험관내 발현 시스템에서 공급될 수 있다. 발현 벡터는 재조합 폴리뉴클레오타이드를 포함하는 코스미드, 플라스미드(예를 들어, 네이키드 또는 리포솜에 포함됨) 및 바이러스(예를 들어, 센다이 바이러스, 렌티바이러스, 레트로바이러스, 아데노바이러스 및 아데노 연관 바이러스)와 같은 당업계에 알려진 모든 것을 포함한다.
본 명세서에 사용되는 바와 같이, "상동성"은 2개의 중합체 분자 사이, 예를 들어 2개의 DNA 분자 또는 2개의 RNA 분자와 같은 2개의 핵산 분자 사이, 또는 2개의 폴리펩타이드 분자 사이의 소단위 서열 동일성을 지칭한다. 두 분자 모두의 소단위 위치가 동일한 단위체 소단위체에 의해 점유될 때; 예를 들어, 2개의 DNA 분자 각각의 위치가 아데닌에 의해 점유된다면, 이는 그 위치에서 상동이다. 두 서열 사이의 상동성은 매칭되거나 상동인 위치의 수의 직접적인 함수이고; 예를 들어, 2개의 서열에 있는 위치의 절반(예를 들어, 10개의 소단위 길이의 중합체에서 5개의 위치)이 상동인 경우, 2개의 서열은 50% 상동이고; 위치의 90%(예를 들어, 10개 중 9개)가 매칭되거나 상동인 경우 2개의 서열은 90% 상동이다.
"인간화(humanized0" 형태의 비인간(예를 들어, 뮤린) 항체는 비인간 면역글로불린에서 유래한 최소 서열을 포함하는 키메라(chimera) 면역글로불린, 면역글로불린 사슬 또는 이의 단편(예를 들어, Fv, Fab, Fab', F(ab')2 또는 항체의 다른 항원-결합 하위서열이다. 대부분의 경우 인간화 항체는 인간 면역글로불린(수용체 항체)으로, 수용체의 상보성 결정 영역(CDR)의 잔기가 마우스, 적절한 특이성, 친화도 및 용량을 갖는 마우스, 랫트 (rat)또는 토끼와 같은 비인간 종(공여체 항체)의 CDR로부터의 잔기에 의해 대체된다. 일부 예에서, 인간 면역글로불린의 Fv 프레임워크 영역(FR) 잔기는 상응하는 비인간 잔기로 대체된다. 더욱이, 인간화 항체는 수용체 항체나 유입된 CDR 또는 프레임워크 서열에 존재하지 않는 잔기를 포함할 수 있다. 이러한 변형은 항체 성능을 추가로 개선하고 최적화하기 위해 수행된다. 일반적으로, 인간화 항체는 적어도 하나, 통상적으로 2개의 가변 도메인을 실질적으로 모두 포함할 것이며, 모든 또는 실질적으로 모든 CDR 영역은 비-인간 면역글로불린의 CDR 영역에 상응하고, 모든 또는 실질적으로 모든 FR 영역은 인간 면역글로불린 서열의 FR 영역에 상응한다. 인간화 항체는 또한 최적으로 면역글로불린 불변 영역(Fc)의 적어도 일부, 통상적으로 인간 면역글로불린의 불변 영역을 포함할 것이다. 자세한 내용은 문헌[Jones et al., Nature, 321: 522-525, 1986; Reichmann et al., Nature, 332: 323-329, 1988; Presta, Curr. Op. Struct. Biol., 2: 593-596, 1992]을 참조한다.
"완전한 인간(fully human)"은 전체 분자가 인간 유래이거나 항체의 인간 형태와 동일한 아미노산 서열로 구성된 항체와 같은 면역글로불린을 지칭한다.
본 명세서에 사용되는 바와 같이, "동일성"은 2개의 중합체 분자 사이, 특히 2개의 아미노산 분자, 예를 들어 2개의 폴리펩타이드 분자 사이의 소단위 서열 동일성을 지칭한다. 2개의 아미노산 서열이 동일한 위치에 동일한 잔기를 갖는 경우; 예를 들어, 2개의 폴리펩타이드 분자 각각의 위치가 아르기닌에 의해 점유된다면, 이는 그 위치에서 동일하다. 2개의 아미노산 서열이 정렬의 동일한 위치에 동일한 잔기를 갖는 동일성 또는 정도는 종종 백분율로 표시된다. 두 아미노산 서열 사이의 동일성은 매칭되거나 동일한 위치의 수의 직접적인 함수이고; 예를 들어, 2개의 서열에서 위치의 절반(예를 들어, 10개 아미노산 길이의 중합체에서 5개 위치)이 동일한 경우, 2개의 서열은 50% 동일하며; 위치의 90%(예를 들어, 10개 중 9개)가 매칭되거나 동일한 경우 2개의 아미노산 서열은 90% 동일하다.
본 명세서에 사용되는 바와 같이, "지침 자료"는 본 발명의 조성물 및 방법의 유용성을 전달하는데 사용될 수 있는 출판물, 기록, 도표, 또는 임의의 다른 표현 매체를 포함한다. 본 발명의 키트의 지침 자료는 예를 들어 본 발명의 핵산, 펩타이드 및/또는 조성물을 포함하는 용기에 부착되거나 핵산, 펩타이드 및/또는 조성물을 포함하는 용기와 함께 전달된다. 대안적으로, 지침 자료는 지침 자료와 화합물이 수령인에 의해 협력적으로 사용될 의도로 용기와 별도로 전달될 수 있다.
"단리된"은 천연 상태에서 변이되거나 제거된 것을 의미한다. 예를 들어, 살아있는 동물에 천연적으로 존재하는 핵산 또는 펩타이드는 "단리된" 것이 아니지만, 천연 상태의 공존 물질로부터 부분적으로 또는 완전히 분리된 동일한 핵산 또는 펩타이드는 "단리된" 것이다. 단리된 핵산 또는 단백질은 실질적으로 정제된 형태로 존재할 수 있거나, 예를 들어 숙주 세포와 같은 비-천연(non-native) 환경에 존재할 수 있다.
본 명세서에 사용되는 바와 같이, 용어 "변형된"은 본 발명의 분자 또는 세포의 변경된 상태 또는 구조를 의미한다. 분자는 화학적, 구조적, 기능적을 포함하여 다양한 방식으로 변형될 수 있다. 세포는 핵산의 도입을 통해 변형될 수 있다.
본 명세서에 사용되는 바와 같이, 용어 "조절"은 치료 또는 화합물의 부재 하에 대상체에서의 반응 수준과 비교하고/하거나, 동일하지만 치료를 받지 않은 대상체의 반응 수준과 비교하여 대상체에서의 반응 수준의 검출가능한 증가 또는 감소를 매개하는 것을 의미한다. 이 용어는 고유 신호 또는 반응을 교란시키고/시키거나, 이에 영향을 주어 대상체, 바람직하게는 인간에서 유익한 치료 반응을 매개하는 것을 포함한다.
본 발명의 맥락에서, 일반적으로 존재하는 핵산 염기에 대한 하기 약어가 사용된다. "A"는 아데노신을 지칭하고, "C"는 시토신을 지칭하고, "G"는 구아노신을 지칭하고, "T"는 티미딘을 지칭하고, "U"는 우리딘을 지칭한다.
달리 명시되지 않는 한, "아미노산 서열을 인코딩하는 뉴클레오타이드 서열"은 서로의 축퇴 형태이고 동일한 아미노산 서열을 인코딩하는 모든 뉴클레오타이드 서열을 포함한다. 단백질 또는 RNA를 인코딩하는 뉴클레오타이드 서열이라는 어구는 또한 단백질을 인코딩하는 뉴클레오타이드 서열이 일부 형태에서 인트론(들)을 포함할 수 있는 정도로 인트론을 포함할 수 있다.
"작동가능하게 연결된"이라는 용어는 조절 서열과 이종 핵산 서열 사이의 기능적 연결을 지칭하여 후자의 발현을 초래한다. 예를 들어, 제1 핵산 서열은 제1 핵산 서열이 제2 핵산 서열과 기능적 관계에 위치할 때 제2 핵산 서열과 작동가능하게 연결된다. 예를 들어, 프로모터가 코딩 서열(coding sequence)의 전사 또는 발현에 영향을 미치는 경우 프로모터는 코딩 서열에 작동가능하게 연결된다. 일반적으로, 작동 가능하게 연결된 DNA 서열은 인접하며, 필요한 경우 동일한 판독 프레임에서 2개의 단백질 코딩 영역을 연결한다.
면역원성 조성물의 "비경구" 투여는 예를 들어, 피하(s.c.), 정맥내(i.v.), 근육내(i.m.), 또는 흉골내 주입, 또는 주입 기술을 포함한다.
본 명세서에 사용되는 바와 같이, 용어 "폴리뉴클레오타이드"는 뉴클레오타이드의 사슬로 정의된다. 또한 핵산은 뉴클레오타이드의 중합체이다. 따라서, 본 명세서에 사용된 핵산 및 폴리뉴클레오타이드는 상호 혼용 가능하다. 당업자는 핵산이 단량체 "뉴클레오타이드"로 가수분해될 수 있는 폴리뉴클레오타이드라는 일반적인 지식을 가지고 있다. 단량체 뉴클레오타이드는 뉴클레오사이드로 가수분해될 수 있다. 본 명세서에 사용된 폴리뉴클레오타이드는 제한 없이, 일반적인 클로닝 기술과 PCR™ 등을 이용하여, 그리고 합성 수단에 의해 재조합 수단, 즉, 재조합 라이브러리 또는 세포 게놈으로부터 핵산 서열의 클로닝을 포함하여, 다음에 제한되는 것은 아니나, 당업계에서 이용가능한 임의의 수단에 의해 획득된 모든 핵산 서열을 포함한다.
본 명세서에 사용되는 바와 같이, 용어 "펩타이드", "폴리펩타이드" 및 "단백질"은 상호 혼용되며, 펩타이드 결합에 의해 공유 연결된 아미노산 잔기로 구성된 화합물을 지칭한다. 단백질 또는 펩타이드는 적어도 2개의 아미노산을 포함해야 하며, 단백질 또는 펩타이드의 서열을 구성할 수 있는 최대 아미노산 수에는 제한이 없다. 폴리펩타이드는 펩타이드 결합에 의해 서로 연결된 2개 이상의 아미노산을 포함하는 임의의 펩타이드 또는 단백질을 포함한다. 본 명세서에 사용되는 바와 같이, 이 용어는 예를 들어 당업계에서 일반적으로 펩타이드, 올리고펩타이드 및 올리고머로 지칭되는 단일 사슬 및 당업계에서 일반적으로 단백질로 지칭되는 보다 긴 사슬을 지칭하며, 이들 중 많은 유형이 있다. "폴리펩타이드"는 예를 들어 생물학적으로 활성인 단편, 실질적으로 상동인 폴리펩타이드, 올리고펩타이드, 동종이량체(homodimer), 이종이량체(heterodimer), 폴리펩타이드의 변이체, 변형된 폴리펩타이드, 유도체, 유사체, 융합 단백질 등을 포함한다. 폴리펩타이드는 천연 펩타이드, 재조합 펩타이드, 합성 펩타이드, 또는 이의 조합을 포함한다.
본 명세서에 사용되는 바와 같이, 용어 "프로모터"는 폴리뉴클레오타이드 서열의 특이적 전사를 개시하는데 필요한 세포의 합성 기전 또는 도입된 합성 기전에 의해 인식되는 DNA 서열로 정의된다.
본 명세서에 사용되는 바와 같이, 용어 "프로모터/조절 서열"은 프로모터/조절 서열에 작동가능하게 연결된 유전자 산물의 발현에 필요한 핵산 서열을 의미한다. 일부 경우에, 이 서열은 중심 프로모터 서열일 수 있고, 다른 경우에, 이 서열은 또한 유전자 산물의 발현에 필요한 인핸서 서열 및 기타 조절 요소를 포함할 수 있다. 프로모터/조절 서열은 예를 들어 조직 특이적 방식으로 유전자 산물을 발현하는 것일 수 있다.
"항시적" 프로모터는 유전자 산물을 인코딩하거나 특정하는 폴리뉴클레오타이드와 작동 가능하게 연결될 때 유전자 산물이 세포의 대부분 또는 모든 생리학적 조건하에서 세포에서 생성되게 하는 뉴클레오타이드 서열이다.
"유도성" 프로모터는 유전자 산물을 인코딩하거나 특정하는 폴리뉴클레오타이드와 작동 가능하게 연결될 때 세포에 프로모터에 상응하는 유도인자가 존재하는 경우에만 실질적으로 세포에서 유전자 산물이 생성되도록 하는 뉴클레오타이드 서열이다.
"조직 특이적" 프로모터는 유전자 산물을 인코딩하거나 특정하는 폴리뉴클레오타이드와 작동 가능하게 연결될 때 세포가 프로모터에 해당하는 유형의 조직의 세포인 경우에만 실질적으로 세포에서 유전자 산물이 생성되도록 하는 뉴클레오타이드 서열이다.
본 명세서에 사용되는 바와 같이, 용어 "후성적"은 DNA 뉴클레오타이드 서열의 변이를 포함하지 않는 유전자 발현에 대한 유전적 영향을 지칭한다. 후성적 조절은 영향을 받는 유전자의 발현을 향상시키거나 억제할 수 있으며, DNA의 디옥시리보스 골격의 화학적 변형 또는 DNA/히스톤 단백질 복합체의 결합 또는 둘 모두를 포함할 수 있다.
본 명세서에 사용되는 바와 같이, 용어 "후성적 조절인자"는 특정 DNA 유전자좌의 후성적 상태를 변이시키도록 작용하는 인자, 효소, 화합물 또는 조성물을 지칭한다. 후성적 조절인자는 DNA 연관 단백질의 변형 또는 DNA 자체의 화학 구조를 유도하거나 촉매할 수 있다.
본 명세서에서 상호 혼용 가능하게 사용되는 용어 "후성적 태그(tag)" 또는 "후성적 마커" 또는 "후성적 마크"는 유전자 발현의 후성적 조절을 초래하는 DNA 및 DNA-연관 단백질에 대해 이루어진 특정 화학적 변형을 기재한다. 후성적 마크 또는 태그의 예는 다음에 제한되는 것은 아니나, CpG 디뉴클레오타이드 및 히스톤 단백질로부터 메틸 또는 아세틸 기의 추가 또는 제거를 포함할 수 있다. 후성적 태그 또는 마크의 수와 밀도는 특정 DNA 유전자좌가 적용되는 후성적 조절의 정도와 상관관계가 있을 수 있다.
"신호 전달 경로"는 세포의 한 부분에서 세포의 다른 부분으로 신호를 전달하는 역할을 하는 다양한 신호 전달 분자 사이의 생화학적 관계를 지칭한다. "세포 표면 수용체"라는 어구는 세포의 원형질막을 가로질러 신호를 수신하고 신호를 전달할 수 있는 분자 및 분자 복합체를 포함한다.
항체와 관련하여 본 명세서에 사용되는 바와 같이, 용어 "특이적으로 결합하는"은 특정 항원을 인식하지만 샘플에서 다른 분자를 실질적으로 인식하거나 결합하지 않는 항체를 의미한다. 예를 들어, 한 종의 항원에 특이적으로 결합하는 항체는 또한 하나 이상의 종의 항원에 결합할 수 있다. 그러나 이러한 종간 반응성 자체가 항체의 특이적 분류를 변이시키지는 않는다. 또 다른 예에서, 항원에 특이적으로 결합하는 항체는 또한 항원의 상이한 대립형질 형태에 결합할 수 있다. 그러나 이러한 교차 반응성 자체가 항체의 특이적 분류를 변이시키지는 않는다. 일부 경우에, 용어 "특이적 결합" 또는 "특이적으로 결합하는"은 항체, 단백질 또는 펩타이드와 제2 화학 종과의 상호작용과 관련하여 사용될 수 있고, 상호작용이 화학종에 대한 특정 구조(예를 들어, 항원 결정기 또는 에피토프)의 존재에 좌우되고; 예를 들어, 항체가 일반적으로 단백질보다는 특정 단백질 구조를 인식하고 이에 결합함을 의미한다. 항체가 에피토프 "A"에 특이적인 경우, 표지된 "A"와 항체를 포함하는 반응에서 에피토프 A(또는 유리, 표지되지 않은 A)를 포함하는 분자의 존재는 항체에 결합된 표지된 A의 양을 감소시킬 것이다.
용어 "대상체"는 면역 반응이 유도될 수 있는 살아있는 유기체(예를 들어, 포유류)를 포함하도록 의도된다. 본 명세서에 사용되는 바와 같이, "대상체" 또는 "환자"는 인간 또는 인간이 아닌 포유류일 수 있다. 비인간 포유류은 예를 들어 가축 및 애완동물, 예를 들어 양, 소, 돼지, 개, 고양이 및 뮤린 포유류를 포함한다. 바람직하게는, 대상체는 인간이다.
"표적 부위" 또는 "표적 서열"은 결합 분자가 결합이 일어나기에 충분한 조건 하에 특이적으로 결합할 수 있는 핵산의 일부를 정의하는 게놈 핵산 서열을 지칭한다.
본 명세서에 사용되는 바와 같이, 용어 "치료학적"은 치료 및/또는 예방을 의미한다. 치료학적 효과는 질병 상태의 억제, 완화 또는 근절에 의해 얻어진다.
본 명세서에 사용되는 바와 같이, 용어 "형질감염된" 또는 "형질전환된" 또는 "형질도입된"은 외인성 핵산이 숙주 세포 내로 전달되거나 도입되는 과정을 지칭한다. "형질감염된" 또는 "형질전환된" 또는 "형질도입된" 세포는 외인성 핵산으로 형질감염, 형질전환 또는 형질도입된 세포이다. 세포에는 1차 대상체 세포와 그 자손이 포함된다.
용어 "전이유전자"는 동물, 특히 포유류, 보다 구체적으로 살아있는 동물의 포유류 세포의 게놈에 인공적으로 삽입되었거나 인공적으로 삽입될 유전 물질을 지칭한다.
용어 "트랜스제닉 동물"은 세포의 일부에 염색체외 요소로 존재하거나 생식계열 DNA(즉, 대부분 또는 모든 세포의 게놈 서열) 내로 안정적으로 혼입된 비내인성(즉, 이종성) 핵산 서열을 갖는 비인간 동물, 일반적으로 포유류, 예를 들어 형질전환 마우스를 지칭한다. 이종 핵산은 예를 들어 숙주 동물의 배아 또는 배아 줄기 세포의 유전자 조작에 의해 이러한 트랜스제닉 동물의 생식계열로 도입된다.
용어 "녹아웃(knockout) 마우스"는 기존 유전자가 비활성화된(즉, "녹아웃") 마우스를 지칭한다. 일부 실시형태에서, 유전자는 상동 재조합에 의해 불활성화된다. 일부 실시형태에서, 유전자는 인공 핵산 서열로의 교체 또는 파괴에 의해 불활성화된다.
본 명세서에 사용되는 바와 같이, 용어로서 질병을 "치료한다"는 것은 대상체가 경험하는 질병 또는 장애의 적어도 하나의 징후 또는 증상의 빈도 또는 중증도를 감소시키는 것을 의미한다.
본 명세서에 사용되는 바와 같이, "전사 제어 하" 또는 "작동적으로 연결된"이라는 어구는 프로모터가 RNA 중합효소에 의한 전사의 개시 및 폴리뉴클레오타이드의 발현을 제어하기 위해 폴리뉴클레오타이드와 관련하여 정확한 위치 및 배향에 있다는 것을 의미한다.
"벡터"는 단리된 핵산을 포함하고 단리된 핵산을 세포 내부로 전달하는데 사용될 수 있는 물질의 조성물이다. 다음에 제한되는 것은 아니나, 선형 폴리뉴클레오타이드, 이온성 또는 양친매성 화합물과 관련된 폴리뉴클레오타이드, 플라스미드 및 바이러스를 포함하는 수많은 벡터가 당업계에 공지되어 있다. 따라서, 용어 "벡터"는 자가 복제 플라스미드 또는 바이러스를 포함한다. 이 용어는 또한 예를 들어 폴리리신 화합물, 리포솜 등과 같은 세포 내로 핵산의 전달을 촉진하는 비-플라스미드 및 비-바이러스성 화합물을 포함하는 것으로 해석되어야 한다. 바이러스 벡터의 예는 다음에 제한되는 것은 아니나, 센다이 바이러스 벡터(Sendai viral vector), 아데노바이러스 벡터(adenoviral vector), 아데노-연관 바이러스 벡터(adeno-associated virus vector), 레트로바이러스 벡터(retroviral vector), 렌티바이러스 벡터(lentiviral vector) 등을 포함한다.
범위: 본 개시내용을 통해, 본 발명의 다양한 양상은 범위 형식으로 제시될 수 있다. 범위 형식의 설명은 단지 편의와 간결함을 위한 것이며 본 발명의 범위에 대한 고정적인 제한으로 해석되어서는 안 된다는 것을 이해해야 한다. 따라서 범위에 대한 설명은 가능한 모든 하위 범위와 해당 범위 내의 개별 수치를 구체적으로 개시한 것으로 고려되어야 한다. 예를 들어, 1 내지 6과 같은 범위의 설명은 1 내지 3, 1 내지 4, 1 내지 5, 2 내지 4, 2 내지 6, 3 내지 6과 같은 하위 범위 및 해당 범위 내의 개별 수치, 예를 들어, 1, 2, 2.7, 3, 4, 5, 5.3 및 6을 구체적으로 개시한 것으로 고려되어야 한다. 이는 범위의 폭에 관계없이 적용된다.
설명
본 발명은 안면견갑상완 근이영양증(FSHD)의 치료에 유용한 방법 및 조성물에 관한 것이다. 이 장애는 DUX4 유전자좌의 불완전한 후성적 침묵화로 인해 발생하며, 이는 골격근에서 DUX4 유전자의 부적절한 병원성 발현을 유발한다. 일부 실시형태에서, DUX4의 발현은 DUX4 유전자좌의 염색질 구조를 변경하여 억제된 전사를 초래하는 후성적 조절인자의 사용을 통해 억제될 수 있다. 일부 실시형태에서, CRISPR 억제(CRISPRi) 시스템은 특이적 단일 가이드 RNA(sgRNA)의 사용을 통해 후성적 조절인자를 DUX4 유전자좌로 지시하는데 사용된다. 본 발명의 일부 실시형태에서, 후성적 조절인자 단백질은 촉매적으로 사멸된 Cas9(dCas9) 단백질에 연결되며, 이는 서열-특이적 sgRNA와 조합되고 조직-특이적 프로모터에 의해 제어될 때 골격근 세포에서만 후성적 조절인자의 발현 및 기능을 보장한다.
본 발명은 필요한 대상체에서 FSHD의 치료를 위한 방법 및 조성물을 제공한다. 일부 실시형태에서, 본 방법은 근세포에서 DUX4 유전자좌를 특이적으로 표적화하는 CRISPRi 시스템에 연결된 후성적 조절인자의 치료 유효량을 대상체에게 투여하는 단계를 포함한다. 일부 실시형태에서, 본 조성물은 단일 폴리뉴클레오타이드로서 아데노-연관 바이러스(AAV) 벡터 내에 패키징될 수 있도록 크기에 대해 고유하게 변형되어 임상 환경에서 생체내 사용을 가능하게 한다.
CRISPR/Cas9-기반 시스템
본 명세서에 사용되는 바와 같이, "집합된 규칙적으로 간격을 둔 짧은 회문 반복" 및 "CRISPR"은 침입하는 파지 및 플라스미드에 대한 방어로서 진화하고 원핵 세포에 대한 후천적 면역의 형태를 제공하는 미생물 뉴클레아제 시스템을 지칭하는 용어이다. CRISPR 유전자좌는 바이러스 게놈 물질에서 유래된 짧은 서열인 "스페이서 DNA" 절편이 플랭킹한다. 유형 II CRISPR 시스템에서 스페이서 DNA는 트랜스활성화 RNA(tracrRNA)에 혼성화되고 CRISPR-RNA(crRNA)로 처리되며, 그런 다음 CRISPR-연관(Cas) 뉴클레아제와 결합하여 외래 DNA를 인식하고 분해하는 복합체를 형성한다. 본 발명의 일 실시형태에서, CRISPR 시스템은 Cas9 엔도뉴클레아제를 이용한다. 다음에 제한되는 것은 아니나, T7, Cas3, Cas8a, Cas8b, Cas10d, Cse1, Csy1, Csn2, Cas4, Cas10, Csm2, Cmr5, Fok1, 또는 당업계에 공지된 기타 뉴클레아제, 및 이의 임의의 조합을 포함하는 다른 엔도뉴클레아제도 사용될 수 있다.
CRISPR 뉴클레아제의 예는 다음에 제한되는 것은 아니나, Cas9 dCas9, Cas6, Cpf1, Cas12a, Cas13a, CasX, CasY, 및 이의 천연 및 합성 변이체를 포함한다.
CRISPR 시스템의 3가지 부류(유형 I, II 및 III 효과기 시스템)가 알려져 있다. Type II 효과기 시스템은 단일 Cas 뉴클레아제인 Cas9를 사용하여 dsDNA를 절단하는 4개의 순차적 단계로 표적 DNA 이중 가닥 절단을 수행한다. 복합체로 작용하는 여러 별개의 효과기(effector)가 필요한 유형 I 및 유형 III 효과기 시스템과 비교하여, 유형 II 시스템의 상대적 단순성으로 인해 이는 진핵 세포와 같은 다른 세포 유형에서 사용할 수 있다.
CRISPR 표적 인식은 표적 DNA의 "프로토스페이서(protospacer)" 서열과 crRNA의 스페이서 서열 사이의 상보적 쌍을 검출할 때 이루어진다. 그런 다음 Cas9 뉴클레아제는 매칭된 프로토스페이서-인접 모티프(protospacer-adjacent motif; PAM)가 프로토스페이서의 3' 말단에도 존재하는 경우 표적 DNA를 절단한다. 다른 유형 II 시스템은 상이한 PAM 서열 요구 사항을 가진다. 일부 실시형태에서, S. 피오게네스 CRISPR 시스템은 5'-NRG-3'으로서 이 Cas9(SpCas9)에 대한 PAM 서열을 가질 수 있으며, R은 A 또는 G이고, 인간 세포에 이 시스템의 특이성을 부여한다. CRISPR/Cas9 시스템의 고유한 기능은 단일 Cas9 단백질을 2개 이상의 sgRNA와 공동 발현함으로써 여러 별개의 게놈 유전자좌를 동시에 표적화할 수 있는 직접적인 능력이다. 예를 들어, 스트렙토코쿠스 피오게네스(Streptococcus pyogenes)(S. 피오게네스) 유형 II 시스템은 천연적으로 "NGG" 서열을 사용하는 것을 선호하며, "N"은 임의의 뉴클레오타이드일 수 있지만 조작된 시스템에서 다른 PAM 서열, 예컨대 "NAG"를 허용한다(문헌[Hsu et al, (2013) Nature Biotechnology, 10:1038]). 유사하게, 네시세리아 메닝지티디스(Neisseria meningitidis)(NmCas9)에서 유래된 Cas9는 일반적으로 NNNNGATT의 고유 PAM을 갖지만 다양한 PAM 서열을 인식할 수 있다.
가이드 RNA(sgRNA)는, 예를 들어, 표적 DNA 서열에 상보적인 적어도 12 내지 20개의 뉴클레오타이드 서열을 포함하는 뉴클레오타이드 서열을 포함할 수 있고 tracrRNA 서열 또는 tracrRNA로 기능하는 임의의 RNA 서열과 유사한 이의 3' 말단의 공통 스캐폴드 RNA 서열을 포함할 수 있다. sgRNA 서열은 예를 들어 표적 DNA에서 PAM 서열의 위치를 확인함으로써 sgRNA 결합 부위를 확인한 다음 PAM 부위의 바로 상류에 있는 약 12 내지 20개 이상의 뉴클레오타이드를 선택함으로써 결정될 수 있다. 표적 DNA 상의 2개의 sgRNA 결합 부위 사이의 스페이서 서열(갭 크기)은 표적 DNA 서열에 의존할 수 있고 당업자에 의해 결정될 수 있다.
본 발명의 일 실시형태에서, CRISPR 시스템 도입은 유도성 CRISPR 시스템 도입을 포함한다. CRISPR 시스템은 CRISPR 벡터를 포함하는 세포를 Cas 발현 벡터와 같은 CRISPR 시스템에서 유도성 프로모터를 활성화하는 작용제(agent)에 노출시킴으로써 유도될 수 있다. 이러한 실시형태에서, Cas 발현 벡터는 항생제(예를 들어, 테트라사이클린 또는 테트라사이클린의 유도체, 예를 들어 독시사이클린)에 대한 노출에 의해 유도될 수 있는 것과 같은 유도성 프로모터를 포함한다. 그러나, 다른 유도성 프로모터가 사용될 수 있음을 이해해야 한다. 유도제는 유도성 프로모터의 유도를 초래하는 선택적 조건(예를 들어, 작용제, 예를 들어 항생제에 대한 노출)일 수 있다. 또 다른 실시형태에서, CRISPR 시스템은 조직-특이적 프로모터에 의해 유도될 수 있다. 이 경우, 발현이 해당 관심 세포 또는 조직 유형에 크게 제한되는 유전자의 프로모터를 사용하여 CRISPR 벡터의 발현을 유도한다. 따라서 CRISPR 시스템의 발현은 특정 세포 유형으로만 제한된다. 본 발명의 일 실시형태에서, CRISPR 시스템은 골격근 세포로의 발현을 제한하는 크레아틴 키나제, M형(CKM) 인핸서 및 프로모터를 기반으로 하는 조절 카세트의 제어 하에 있다.
불활성화된 dCas9 CRISPR 시스템
본 발명에서 사용되는 CRISPR/Cas9 기반 시스템은 Cas9 단백질 또는 이의 단편, Cas9 융합 단백질, Cas9 단백질 또는 이의 단편을 인코딩하는 핵산, 또는 Cas9 융합 단백질을 인코딩하는 핵산을 포함할 수 있다. Cas9 단백질은 핵산을 절단하고 CRISPR 유전자좌에 의해 인코딩되는 엔도뉴클레아제이며 유형 II CRISPR 시스템에 관여한다. Cas9 단백질은 스트렙토코쿠스 피오게네스와 같은 임의의 박테리아 또는 고세균 종에서 유래할 수 있다. 상이한 종으로부터의 Cas9 서열 및 구조는 당업계에 공지되어 있고, 예를 들어, 문헌[Ferretti et al., Proc Natl Acad Sci USA. (2001); 98(8): 4658-63; Deltcheva et al., Nature. 2011 Mar. 31; 471(7340):602-7; 및 Jinek et al., Science. (2012); 337(6096):816-21]을 참조하며, 상기 문헌의 전문은 본 명세서에 참조로 포함된다.
S. 피오게네스 Cas9는 아마도 가장 널리 사용되는 Cas9 분자일 것이다. 특히, S. 피오게네스 Cas9는 상당히 커서(유전자 자체가 4.1Kb 이상) 특정 전달 벡터에 패킹하기가 어렵다. 예를 들어, 아데노 연관 바이러스(AAV) 벡터의 패키징 한계는 4.5 또는 4.75Kb이다. 이는 Cas9뿐만 아니라 프로모터 및 전사 종결인자와 같은 조절 요소가 모두 동일한 바이러스 벡터에 맞아야 함을 의미한다. 4.5 또는 4.75Kb보다 큰 작제물은 바이러스 생성을 크게 감소시킨다. 한 가지 가능성은 S. 피오게네스 Cas9의 기능적 단편을 사용하는 것이다. 또 다른 가능성은 Cas9를 하위 부분(예를 들어, Cas9의 N-말단 엽 및 C-말단 엽)으로 분할하는 것이다. 각 하위 부분은 별도의 벡터로 발현되며 이러한 하위 부분은 연결되어 기능적인 Cas9를 형성한다. 예를 들어, 문헌[Chew et al., Nat Methods. 2016년; 13:868-74; Truong et al., Nucleic Acids Res. 2015; 43: 6450-6458; 및 Fine et al., Sci Rep. 2015; 5:10777]을 참조하며, 상기 문헌은 그 전문이 본 명세서에 참조로 포함된다.
대안적으로, 다른 종으로부터의 더 짧은 Cas9 분자, 예를 들어 스타필로코커스 아우레우스(Staphylococcus aureus), 캄필로박터 제주니(Campylobacter jejuni), 코리네박테리움 디프테리아(Corynebacterium diphtheria), 유박테리움 벤트리오섬(Eubacterium ventriosum), 스트렙토코커스 파스퇴리아누스(Streptococcus pasteurianus), 락토바실러스 파르시미니스(Lactobacillus farciminis), 스파에로카에타 글로부스(Sphaerochaeta globus), 아조피릴룸(Azospirillum)(B510) 균주, 글루코나세토박터 디아조트로피쿠스(Gluconacetobacter diazotrophicus), 네이세리아 시네레아(Neisseria cinerea), 로즈부리아 인테리스(Roseburia intestinalis), 파르비바쿨룸 라바멘티보란스(Parvibaculum lavamentivorans), 니트라티프랙터 살수기니스(Nitratifractor salsuginis)(균주 DSM 16511), 캄필로박터 라리(Campylobacter lari)(균주 CF89-12), 또는 스트렙토코커스(Streptococcus thermophilus)(LMD-9) 균주로부터의 Cas9 분자가 본 명세서에 기재된 조성물 및 방법에 사용될 수 있다.
본 발명의 일 실시형태에서, 본 개시내용은 촉매적으로 불활성인 Cas 단백질에 융합된 DNA 변형 도메인을 포함하는 키메라 융합 단백질에 관한 것이다. 당업자는 불활성화된 Cas 뉴클레아제가 "사멸된" Cas, iCas 또는 dCas 단백질로 상호 혼용 가능하게 지칭된다는 것을 인식할 것이다. 이러한 방식으로, dCas9 단백질은 정상적인 뉴클레아제 활성이 부족하지만 야생형 단백질의 sgRNA-결합 및 DNA-표적화 활성을 유지한다. 특정 sgRNA와 쌍을 이루는 S. 피오게네스(dSpCas9)에서 유래된 dCas9 단백질은 입체 장애를 통해 또는 다른 유전자 발현 변형 단백질과의 융합을 통해 유전자 발현을 침묵화시키기 위해 박테리아, 효모 및 인간 세포의 유전자를 표적화할 수 있다. 표적 유전자의 전사를 감소시키거나 방해하는 이러한 CRISPR 시스템은 CRISPR 간섭 또는 CRISPRi 또는 sgRNA/CRISPRi 시스템으로 알려져 있다.
본 발명의 특정 실시형태의 CRISPRi 시스템에 적합한 dCas 분자는 야생형 Cas 분자로부터 유래될 수 있고, I형, II형, 또는 III형 CRISPR-Cas 시스템으로부터 유래될 수 있다. 일부 실시형태에서, 적합한 dCas 분자는 Cas1, Cas2, Cas3, Cas4, Cas5, Cash, Cas7, Cas8, Cas9, 또는 Cas10 분자로부터 유래될 수 있다. 본 발명의 일부 실시형태에서, dCas 분자는 Cas9 분자로부터 유래된다. dCas9 분자는 예를 들어 DNA-절단 도메인, 예를 들어 뉴클레아제 도메인, 예를 들어 RuvC 및/또는 HNH 도메인에서 Cas9 분자에 점 돌연변이(예를 들어, 치환, 결실 또는 부가)를 도입함으로써 획득될 수 있다. 예를 들어, 문헌[Jinek et al., Science (2012) 337:816-21]을 참조한다. 유사한 돌연변이는 또한 임의의 다른 천연 공급원으로부터의 임의의 다른 Cas9 단백질 및 예를 들어, 스트렙토코커스 써모필레스(Streptococcus thermophiles), 스트렙토코커스 살비바리우스(Streptococcus salivarius), 스트렙토코커스 파스테우리아누스(Streptococcus pasteurianus), 스트렙토코커스 무탄스(Streptococcus mutans), 스트렙토코커스 미티스(Streptococcus mitis), 스트렙토코커스 인판타리우스(Streptococcus infantarius), 스트렙토코커스 인터메디우스(Streptococcus intermedius), 스트렙토코커스 에푸(Streptococcus equ), 스트렙토코커스 아갈락티아에(Streptococcus agalactiae), 스트렙토코커스 안지노수스(Streptococcus anginosus), 바실루스 투링지엔시스(Bacillus thuringiensis), 피니티무스(Finitimus), 스트렙토코커스 다이스갈락티아에(Streptococcus dysgalactiae), 스트렙토코커스 갈롤리티쿠스(Streptococcus gallolyticus), 스트렙토코커스 마세도니쿠스(Streptococcus macedonicus), 스트렙토코커스 고도니(Streptococcus gordonii), 스트렙토코커스 수이스(Streptococcus suis), 스트렙토코커스 이니아에(Streptococcus iniae), 네이세리아 메닝지티데스(Neisseria meningitides), 락토바실루스 카세이(Lactobacillus casei), 락토바실루스 살비바리우스(Lactobacillus salivarius), 리스테리아 이노쿠아(Listeria innocua), 리스테리아 모노사이토게네스(Listeria monocytogenes), 락토바실루스 부크네리(Lactobacillus buchneri), 락토바실루스 파라카세이(Lactobacillus paracasei), 락토바실루스 산프란시센시스(Lactobacillus sanfranciscensis), 락토바실루스 퍼멘툼(Lactobacillus fermentum), 리스테리아 이노쿠아 세로바(Listeria innocua serovar), 락토바실루스 람노수스(Lactobacillus rhamnosus), 락토바실루스 카세이(Lactobacillus casei), 락토바실루스 산프란시센시스(Lactobacillus sanfranciscensis), 하에모필루스 스푸토룸(Haemophilus sputorum), 레오바실루스(Geobacillus), 엔테로코쿠스 히라에(Enterococcus hirae), 엔테로코쿠스 파에칼리스(Enterococcus faecalis), 바실루스 케레우스(Bacillus cereus), 트레포네마 소크란스키(Treponema socranskii), 피네골디아 마그나(Finegoldia magna) 등과 같은 임의의 다른 종으로부터의 임의의 인위적으로 돌연변이된 Cas9 단백질에 적용될 수 있다. 유사한 촉매적으로 불활성인 돌연변이는 또한 임의의 다른 천연 공급원, 임의의 인위적으로 돌연변이된 Cas9 단백질, 및/또는 dCas9 유사 sgRNA 결합 도메인을 포함하는 임의의 인위적으로 생성된 단백질 단편으로부터의 임의의 다른 Cas9 단백질에 적용될 수 있다.
dCas9 융합 단백질
본 발명의 일 실시형태에서, CRISPR/dCas9-기반 시스템은 융합 단백질을 포함할 수 있다. 융합 단백질은 짧은 링커 폴리펩타이드 서열을 통해 제2 폴리펩타이드에 접합된 촉매적으로 불활성인 Cas(dCas) 단백질을 포함할 수 있다. 본 발명의 일부 실시형태에서, 제2 폴리펩타이드는 당업자에게 공지된 임의의 DNA 변형 효소로부터 유래된 DNA 변형 도메인을 포함한다. 융합 단백질의 DNA 변형 도메인은 전장 DNA 변형 효소 또는 도메인이 전장 DNA 변형 효소의 DNA 변형 활성을 보유하는 전장 DNA 변형 효소로부터 획득된 도메인일 수 있다.
본 발명의 일부 실시형태에서, 제2 폴리펩타이드는 다음에 제한되는 것은 아니나, 전사 활성화, 전사 억제, 전사 방출 인자 활성, 히스톤 변형 활성, 후성적 전사 억제 활성, 뉴클레아제 활성, 핵산 결합 활성, 메틸라제 활성 및 데메틸라제 활성 등으로 이루어진 군으로부터 선택되는 활성을 갖는 효소 또는 효소로부터의 기능적 도메인이다.
본 발명의 일 실시형태에서, 제2 폴리펩타이드 도메인은 후생적 억제인자 활성을 가질 수 있다. 후성적 억제인자 활성은 염색질의 구조적 변화를 유도함으로써 전사 유전자 활성에 영향을 미치는 많은 기전을 포함할 수 있다. 이러한 메커니즘의 예에는 다음에 제한되는 것은 아니나, DNA 메틸화 및 탈메틸화뿐만 아니라 탈아세틸화, 아세틸화, 메틸화 및 탈메틸화를 포함하는 히스톤 변형이 포함된다. 본 발명의 일부 실시형태에서, dCas9 융합 단백질은 SUV39H1 SET 전, SET 및 SET 후 도메인으로부터 유래된 후성적 억제인자를 포함한다. SUV39H1은 HP1과 같은 다른 억제 인자를 집합하여 전사 침묵화를 초래하는 억제 마크인 히스톤 H3의 리신 9를 트리메틸화하는 히스톤 메틸트랜스퍼라제이다. 3개의 SET 도메인은 모두 메틸트랜스퍼라제 활성에 필요하다. 본 발명의 일부 실시형태에서, dCas9 단백질은 HP1 패밀리 단백질로부터 유래된 후성적 조절인자와 융합된다. HP1 또는 이질염색질 단백질 1 단백질은 메틸화된 히스톤 H3에 결합하여 전사 활성을 억제하는 이질염색질 복합체 형성을 지원한다. 본 발명의 일부 실시형태에서, HP1 단백질은 일반적으로 이질염색질에 위치하는 HP1α이다. 본 발명의 일부 실시형태에서, HP1 단백질은 유사하게 이질염색질에 위치하고 전사 침묵화를 매개하는 HP1γ이다. 본 발명의 일부 실시형태에서, dCas9 단백질은 HP1α 또는 HP1γ의 염색체 섀도우 도메인 및 C-말단 확장 영역에 융합된다. HP1γ는 특히 건강한 골격근 세포에서 DUX4 유전자를 침묵화시키는 역할을 하는 정상적인 D4Z4 거대부수체 배열에 다량 존재하며 HP1γ 결합은 FSHD에서 손실된다. 본 발명의 일부 실시형태에서, dCas9 융합 단백질은 MeCP2로부터 유래된 전사 억제 도메인(TRD)을 포함한다. 이 도메인은 억제 히스톤 표시에 특이적으로 결합하고 다른 조절 단백질과 공동 억제 복합체를 형성하여 전사 침묵화를 시행한다.
유전자 전달 시스템 및 아데노 연관 바이러스(AAV)
본 발명에 기재된 것과 같은 유전자 전달 시스템은 유전자 작제물을 표적 세포로 이동시키기 위해 벡터 또는 벡터 시스템에 의존한다. 조혈 줄기 또는 전구 세포(progenitor cell)에 핵산을 도입하는 방법에는 물리적, 생물학적 및 화학적 방법이 포함된다. RNA와 같은 폴리뉴클레오타이드를 숙주 세포에 도입하기 위한 물리적 방법에는 인산칼슘 침전, 리포펙션, 입자 충격, 미세주입, 전기천공 등이 포함된다. RNA는 전기천공법(Amaxa Nucleofector-II (Amaxa Biosystems, Cologne, Germany)), (ECM 830 (BTX) (Harvard Instruments, Boston, Mass.) 또는 Gene Pulser II( BioRad, Denver, Colo.), Multiporator(Eppendort, Hamburg Germany)를 포함하는 상업적으로 이용 가능한 방법을 사용하여 표적 세포내로 도입될 수 있다. RNA는 또한 리포펙션을 사용한 양이온성 리포솜 매개 형질감염 사용, 중합체 캡슐화 사용, 펩타이드 매개 형질감염 사용 또는 "유전자 총(gene gun)" 사용에 의해 세포내로 도입될 수 있다(예를 들어, 문헌[Nishikawa, et al. Hum Gene Ther., 12(8):861-70(2001)] 참조).
폴리뉴클레오타이드를 숙주 세포에 도입하기 위한 화학적 수단은 거대분자 복합체, 나노캡슐, 미소구체, 비드(bead)와 같은 콜로이드 분산 시스템, 및 수중유 에멀젼(oil-in-water emulsion), 미셀(micell), 혼합 미셀 및 리포솜을 포함하는 지질 기반 시스템을 포함한다. 시험관내 및 생체내 전달 비히클로서 사용하기 위한 예시적인 콜로이드 시스템은 리포솜(예를 들어, 인공 막 소포)이다.
사용에 적합한 지질은 상업적 공급원으로부터 얻을 수 있다. 예를 들어, 디미리스틸 포스파티딜콜린("DMPC")은 미주리주 세인트루이스에 소재한 시그마로부터 입수할 수 있고; 디세틸 포스페이트("DCP")는 K & K Laboratories(Plainview, NY)로부터 입수할 수 있고; 콜레스테롤("Choi")은 Calbiochem-Behring에서 입수할 수 있고; 디미리스틸 포스파티딜글리세롤("DMPG") 및 기타 지질은 Avanti Polar Lipids, Inc.(Birmingham, AL)로부터 입수할 수 있다. 클로로포름 또는 클로로포름/메탄올의 지질 저장 용액은 약 -20℃에서 저장할 수 있다. 클로로포름은 메탄올보다 쉽게 증발하기 때문에 유일한 용매로 사용된다. "리포솜"은 봉입된 지질 이중층 또는 응집체의 생성에 의해 형성된 다양한 단일 및 다중층 지질 비히클을 포괄하는 일반적인 용어이다. 리포솜은 인지질 이중층 막과 내부 수성 매질을 갖는 소포 구조를 갖는 것을 특징으로 할 수 있다. 다층 리포솜은 수성 매질로 분리된 여러 지질층을 가지고 있다. 이는 인지질이 과량의 수용액에 현탁되면 자발적으로 형성된다. 지질 요소은 폐쇄된 구조가 형성되기 전에 자가 재배열을 거쳐 지질 이중층 사이에 물과 용해된 용질을 가둔다(문헌[Ghosh et al., (1991) Glycobiology 5: 505-10]). 그러나, 용액에서 정상적인 소포 구조와 다른 구조를 갖는 조성물도 포함된다. 예를 들어, 지질은 미셀 구조를 가정하거나 단순히 지질 분자의 불균일한 응집체로 존재할 수 있다. 또한 리포펙타민-핵산 복합체가 고려된다.
해당 폴리뉴클레오타이드를 숙주 세포에 도입하기 위한 생물학적 방법은 DNA 및 RNA 벡터의 사용을 포함한다. 바이러스 벡터, 특히 레트로바이러스 벡터는 유전자를 포유류, 예를 들어 인간 세포에 삽입하기 위해 가장 널리 사용되는 방법이 되었다. 다른 바이러스 벡터는 렌티바이러스, 폭스바이러스, 단순 헤르페스 바이러스 I, 아데노바이러스 및 아데노 연관 바이러스 등으로부터 유래될 수 있다. 예를 들어, 미국 특허 제 5,350,674호 및 제 5,585,362호를 참조한다.
현재, 유전자 작제물을 살아있는 세포로 전달하는 가장 효율적이고 효과적인 방법은 복제 결함이 있는 바이러스를 기반으로 하는 벡터 시스템을 사용하는 것이다. 당업계에 알려진 가장 효과적인 벡터 중 일부는 아데노 연관 바이러스(AAV)를 기반으로 하는 벡터이다. AAV는 파로바이러스과의 작은 바이러스로 복제 결함이 있고 임의의 인간의 질병을 일으키지 않는 것으로 알려져 있으며 매우 약한(mild) 면역 반응을 일으키며 활발하게 분열하는 세포와 휴면 중인 세포를 모두 감염시킬 수 있으며 표적 세포의 게놈에 혼입되지 않은 염색체외 상태에서 안정적으로 지속된다는 점에서 유전자 전달을 위한 매력적인 벡터가 된다. 특정 실시형태에서, 본 개시내용은 본 발명의 dCas9-기반 CRISPRi 시스템을 포함하는 AAV 벡터를 제공한다.
핵산을 세포 내로 도입하기 위해 사용된 방법에 관계없이, 세포 내 핵산의 존재를 확인하기 위해 다양한 분석이 수행될 수 있다. 이러한 분석은 예를 들어 서던 및 노던 블롯팅, RT-PCR 및 PCR과 같은 당업자에게 잘 알려진 "분자 생물학적" 분석; "생화학적" 분석, 예를 들어 면역학적 수단(ELISA 및 웨스턴 블롯)에 의해 또는 본 발명의 범위에 속하는 작용제를 확인하기 위해 본 명세서에 기재된 분석에 의한 특정 펩타이드의 존재 또는 부재 검출을 포함한다.
약제학적 조성물
본 발명의 약제학적 조성물은 하나 이상의 약제학적으로 또는 생리학적으로 허용 가능한 담체(carrier), 희석제(diluent), 보조제 또는 부형제(excipient)와 조합하여 본 명세서에 기재된 바와 같이 포함할 수 있다. 이러한 조성물은 중성 완충 식염수, 인산염 완충 식염수 등과 같은 완충제; 글루코스, 만노스, 수크로스 또는 덱스트란과 같은 탄수화물, 만니톨; 단백질; 글리신과 같은 폴리펩타이드 또는 아미노산; 항산화제; EDTA 또는 글루타티온과 같은 킬레이트제; 애주번트(예를 들어, 수산화알루미늄); 및 보존제를 포함할 수 있다. 본 발명의 조성물은 바람직하게는 정맥내 투여용으로 제형화된다.
본 발명의 약제학적 조성물은 치료(또는 예방)될 질병에 적절한 방식으로 투여될 수 있다. 투여의 양과 빈도는 환자의 병태, 환자의 질병의 유형 및 중증도와 같은 인자에 의해 결정되지만 적절한 투여량은 임상 시험에 의해 결정될 수 있다.
본 발명의 약제학적 조성물은 정제, 캡슐, 분말, 용액, 현탁액(suspension), 에멀젼 등과 같은 고체 또는 액체 형태로 투여될 수 있다. 본 발명의 약제학적 조성물은 경구, 비경구, 피하, 정맥내, 근육내, 복강내, 비강 점적, 이식, 강내 또는 방광내 점적, 안구내, 동맥내, 병변내, 경피, 또는 점막에의 적용에 의해 투여될 수 있다. 일부 실시형태에서, 조성물은 예를 들어 흡입에 의해 코, 목 또는 기관지에 적용될 수 있다.
선택적으로, 본 발명의 방법은 조직 복구를 유도하거나, 세포 사멸을 감소시키거나, 또 다른 바람직한 생물학적 반응을 유도하기 위한 조성물(들)의 투여량, 그 안의 성분의 농도 및 조성물(들)을 투여하는 시기를 확인하기 위해 적합한 동물 모델에 본 발명의 조성물을 투여하는 단계를 제공한다. 이러한 결정은 과도한 실험이 필요하지 않지만 통상적이며 과도한 실험 없이 확인할 수 있다.
생물학적 활성제는 선택된 pH로 완충될 수 있는 멸균 액체 제제(preparation), 예를 들어 등장성 수용액, 현탁액, 에멀젼, 분산액 또는 점성 조성물로서 대상체에게 편리하게 제공될 수 있다. 본 발명의 세포 및 작용제는 액체 또는 점성 제형으로 제공될 수 있다. 일부 적용의 경우, 특히 주입에 의한 투여가 편리하기 때문에 액체 제형이 바람직하다. 조직과의 장기간 접촉이 필요한 경우 점성 조성물이 바람직할 수 있다. 이러한 조성물은 적절한 점성 범위 내에서 제형화된다. 액체 또는 점성 조성물은 예를 들어 물, 식염수, 인산염 완충 식염수, 폴리올(예를 들어, 글리세롤, 프로필렌 글리콜, 액체 폴리에틸렌 글리콜 등) 및 이의 적합한 혼합물을 포함하는 용매 또는 분산 매질일 수 있는 담체를 포함할 수 있다.
멸균 주입 가능한 용액은 탈람파넬 및/또는 페람파넬을 적절한 경우 다양한 양의 다른 요소과 함께 필요한 양의 적절한 용매에 현탁시킴으로써 제조된다. 이러한 조성물은 멸균수, 생리식염수, 글루코스, 덱스트로스 등과 같은 적절한 담체, 희석제 또는 부형제와 혼합될 수 있다. 조성물은 또한 동결건조될 수 있다. 조성물은 투여 경로 및 적절한 제제에 따라 습윤제, 분산제 또는 유화제(예를 들어, 메틸셀룰로스), pH 완충제, 겔화 또는 점성 향상 첨가제, 보존제, 향미제, 착색제 등과 같은 보조 물질을 포함할 수 있다. 문헌["REMINGTON'S PHARMACEUTICAL SCIENCE", 17th edition, 1985]와 같은 표준 텍스트는 본 명세서에 참조로 포함되어 과도한 실험 없이 적절한 제제를 제조하는데 참조할 수 있다.
항균성 보존제, 항산화제, 킬레이트화제 및 완충제를 포함하는 조성물의 안정성 및 멸균성을 향상시키는 다양한 첨가제가 첨가될 수 있다. 미생물 작용의 방지는 다양한 항균제 및 항진균제, 예를 들어 파라벤, 클로로부탄올, 페놀, 소르브산 등에 의해 보장될 수 있다. 주입 가능한 약제학적 형태의 연장된 흡수는 흡수를 지연시키는 작용제, 예를 들어 알루미늄 모노스테아레이트 및 젤라틴의 사용에 의해 야기될 수 있다. 그러나, 본 발명에 따르면, 사용된 임의의 비히클(vehicle), 희석제 또는 첨가제는 이의 조절 배지에 존재하는 세포 또는 작용제와 상용성이어야 한다.
조성물은 등장성일 수 있으며, 즉, 이는 혈액 및 누액과 동일한 삼투압을 가질 수 있다. 본 발명의 조성물의 적절한 등장성은 염화나트륨, 또는 덱스트로스, 붕산, 주석산나트륨, 프로필렌 글리콜 또는 기타 무기 또는 유기 용질과 같은 기타 약제학적으로 허용 가능한 작용제를 사용하여 달성될 수 있다. 염화나트륨은 특히 나트륨 이온을 포함하는 완충제에 바람직하다.
조성물의 점성은 적절한 경우 메틸셀룰로스와 같은 약제학적으로 허용 가능한 증점제를 사용하여 선택된 수준으로 유지될 수 있다. 다른 적합한 증점제는 예를 들어 잔탄 검, 카복시메틸 셀룰로스, 하이드록시프로필 셀룰로스, 카보머 등을 포함한다. 적합한 담체 및 기타 첨가제의 선택은 정확한 투여 경로 및 특정 투여 형태의 특성, 예를 들어 액체 투여 형태(예를 들어, 조성물이 용액, 현탁액, 겔 또는 다른 액체 형태, 예컨대 시간 방출 형태 또는 액체 충전 형태로 제형화되어야 하는지)에 따라 달라질 것이다. 당업자는 조성물의 성분이 화학적으로 불활성인 것으로 선택되어야 함을 인식할 것이다.
본 발명에 유용한 방법 및 조성물은 실시예에 기재된 특정 제형으로 제한되지 않는다는 것을 이해해야 한다. 하기 실시예는 본 발명의 벡터 및 치료학적 방법을 수행하고 사용하는 방법에 대한 완전한 개시 및 설명을 당업자에게 제공하기 위해 제시되며, 본 발명자(들)가 본 발명으로 고려하는 범위를 제한하려는 것이 아니다.
치료 방법
FSHD는 상염색체 우성 방식으로 유전되는 골격근의 진행성 변성을 수반하는 유전적 근육 장애이다. 명칭에서 알 수 있듯이 FSHD는 다른 근육 그룹에도 영향을 미칠 수 있지만 주로 안면, 견갑골 및 팔뚝의 근육에 영향을 미친다. FSHD는 뒤센(Duchenne) 및 베커(Becker) 및 근긴장성 이영양증에 이어 세 번째로 흔한 유형의 근이영양증이다. FSHD의 발병률은 출생 100,000명당 약 4명으로 추정된다. 이 장애의 병인은 골격근 세포에서 DUX4 유전자의 비정상적인 발현으로 이어지는 염색체 4q35에서 D4Z4 거대부수체 반복 배열의 후성적 제어의 상실로 인해 발생한다. DUX4는 일반적으로 배아 발달 동안에만 발현되고 D4Z4 배열에서 많은 수의 반복의 결과로 후성적으로 침묵화되는 전사 인자이다. DUX4는 모든 D4Z4 반복 단위에 존재하지만, 전장 mRNA(DUX4-fl)는 기능성 폴리아데닐화 신호의 존재로 인해 가장 원위 반복에 의해서만 안정적으로 발현될 수 있다.
임상적으로, FSHD는 근육 약화 및 점진적인 위축으로 나타나며, 주로 안면, 어깨 및 팔뚝의 근육에 영향을 미치지만, 골반, 엉덩이 및 하부 다리의 근육도 영향을 받을 수 있다. FSHD의 증상은 영아 형태로 알려진 출생 직후에 발생할 수 있지만 종종 사춘기 또는 10 내지 26세 사이의 젊은 성인기까지 나타나지 않는다. 드물게, 증상이 훨씬 나중에 발생하거나 일부 경우에는 전혀 발생하지 않을 수 있다. FSHD의 징후와 증상은 가장 흔히 안면의 근육 약화로 개시되며 눈꺼풀 처짐, 뺨 근육의 약화로 인한 휘파람 불가능, 단어 발음의 어려움을 동반한 표정 감소를 포함한다. 증상의 중증도는 종종 팔, 견갑골, 다리로 진행되어 어깨 높이 이상으로 도달할 수 없고, 익상 견갑(scapular winging) 및 경사 어깨를 초래한다. 만성 통증은 질병의 진행 단계와 관련이 있으며 사례의 50% 내지 80%에서 나타난다. 청력 상실과 심장 부정맥이 발생할 수 있지만 흔하지는 않다. 극단적인 경우 FSHD로 인해 환자가 휠체어에 의존하거나 인공호흡기 지원이 필요하다.
현재 FHSD에 대한 치료법이 비교적 적고 질병의 원인에 대해 특이적인 것은 없다. 현재의 요법은 FHSD의 영향을 멈추거나 되돌릴 수 없지만 치료학적 전략은 장애의 많은 증상을 완화할 수 있다. 상완 약화 및 익상 견갑의 진행 사례는 견갑골을 흉곽에 외과적으로 고정함으로써 안정화될 수 있다. 이 절차는 팔의 움직임을 제한하지만 팔 근육에 견고한 지지대를 제공하여 기능을 향상시킬 수 있다. 등 지지대, 코르셋 및 거들 형태의 다양한 보조 장치를 사용하여 등 상부 및 하부의 약해진 근육을 안정화하고 보충할 수 있다. 이와 유사하게, 다리 하부 지지대와 발목-발 보조 장치는 균형과 이동성을 유지하는데 도움이 될 수 있다.
기계적으로, FSHD는 크게 두 가지 형태로 분류될 수 있다. 가장 흔한 형태의 질병인 FSHD1은 D4Z4 거대부수체 배열의 유전적 단축으로 인해 발생하며, 결과적으로 일반적으로 억제되는 염색질의 이완을 초래한다. FSHD2는 후성적 침묵화를 유지하는 단백질의 돌연변이로 인해 발생한다. 두 경우 모두, DUX4-fl 단백질의 결과적인 발현은 초기 발달에서 정상적으로 발현되는 다수의 유전자를 활성화시키며, 이는 성인 골격근에서 이소성으로 발현될 때 병리를 유발한다.
본 발명의 일부 양상은 필요한 대상체에서 FSHD를 치료하는 방법에 관한 것이다. 일부 실시형태에서, 본 방법은 DUX4 유전자 발현의 억제인자의 유효량을 대상체에게 투여하는 단계를 포함하고, 억제인자는 대상체의 골격근 세포에서 DUX4 유전자 발현을 감소시킨다. 일부 실시형태에서, DUX4 억제인자는 후성적 억제인자에 융합된 dCas9 단백질을 추가로 포함하는 융합 단백질 및 sgRNA를 포함하는 CRISPRi 플랫폼의 형태이다. 일부 실시형태에서, sgRNA는 후성적 억제인자를 D4Z4 유전자좌로 지시한다. 일부 실시형태에서, 억제인자의 D4Z4 유전자좌에 대한 위치화는 유전자좌의 염색질에 대한 후성적 변형을 유도하여 DUX4 발현의 억제를 초래함으로써 FSHD 병태의 중증도를 감소시키거나 역전시킨다.
일부 실시형태에서, 후성적 억제인자는 DNA 골격의 구조를 화학적으로 변이시키거나 히스톤 단백질을 번역후 변형시키는 염색질 변형인자이다. 후성적 염색질 변형인자의 예에는 다음에 제한되는 것은 아니나, 히스톤 데메틸라제, 히스톤 메틸트랜스퍼라제, 히스톤 데아세틸라제, 히스톤 아세틸트랜스퍼라제, 특정 브로모도메인-포함 단백질, 히스톤을 인산화하는 작용을 하는 키나제, 및 액틴 의존성 염색질 조절인자가 포함된다. 일부 실시형태에서, DNA의 화학적 변이는 CpG 디뉴클레오타이드 서열에서 시토신 잔기의 C5 위치의 메틸화를 포함한다. 일부 실시형태에서, 유전자좌 염색질의 결과적인 변형은 DNA와 관련된 후성적 마크 또는 태그의 수 및 밀도를 증가시키고, 이는 결과적으로 유전자좌의 유전자의 전사를 억제하는 보다 "밀폐된" 또는 "밀집한" 구조를 유도한다. 일부 실시형태에서, D4Z4 유전자좌에 대한 dCas9 융합 단백질의 결합은 이의 DNA 결합 부위에 대한 인핸서 및 프로모터 단백질 접근의 물리적 차단을 통해 감소된 유전자 발현을 추가로 초래한다. 이러한 억제 메커니즘은 D4Z4 유전자좌의 후성적 침묵화를 적어도 부분적으로 복원하는 역할을 한다. 일부 실시형태에서, 본 발명에서 사용되는 후성적 억제인자의 예는 다음에 제한되는 것은 아니나, HP1α 및 HP1γ의 염색체 셰도우 도메인 및 C-말단 확장 영역을 포함하는 HP1 패밀리 단백질을 포함한다. 일부 실시형태에서, 후성적 억제인자는 메틸-CpG-결합 단백질 MeCP2의 전사 억제 도메인(TRD)을 포함한다. 일부 실시형태에서, 후성적 억제인자는 히스톤-리신 N-메틸트랜스퍼라제 단백질 SUV39H1의 SET 도메인을 포함한다. 일부 실시형태에서, 후성적 억제인자는 효소적으로 활성인 SET 도메인에 더하여 SUV39H1의 SET 전 및 후 도메인을 추가로 포함한다.
실험예
본 발명은 하기 실험예를 참조하여 더욱 상세하게 기재된다. 이러한 실시예는 설명의 목적으로만 제공되며 달리 명시되지 않는 한 제한하려는 의도가 아니다. 따라서, 본 발명은 하기 실시예로 제한되는 것으로 해석되어서는 안 되며, 오히려 본 명세서에 제공된 교시의 결과로서 명백해지는 임의의 및 모든 변형을 포함하는 것으로 해석되어야 한다.
추가 설명 없이, 당업자는 선행 설명 및 하기 예시적인 실시예를 사용하여 본 발명의 화합물을 제조 및 활용하고 청구된 방법을 실시할 수 있다고 믿어진다. 따라서, 다음의 실시예는 본 발명의 바람직한 실시형태를 구체적으로 지적하고, 본 개시내용의 나머지 부분을 어떤 식으로든 제한하는 것으로 해석되어서는 안 된다.
재료 및 방법이 이제 기재된다.
항체. 본 연구에 사용된 ChIP-grade 항체, α-KAP1 (ab3831), α-HP1α (ab77256), α-RNA Pol II CTD repeat (phospho S2) (ab5095), 및 α-histone H3 (ab1791)를 Abcam (Cambridge, MA)에서 구입했다.
플라스미드. dSaCas9 작제물을 변형된 CKM 프로모터의 상류에 직렬 형태의 3개의 변형된 CKM 인핸서로 구성된 근육 특이적 조절 카세트로 설계하였다(문헌[Himeda, et al. (2021) Mol Ther, In press]). 인핸서 변형은 다음과 같다: 1) 우측 E-박스로 돌연변이된 좌측 E-박스(문헌[Nguyen, et al. (2003) J Biol Chem. 278: 46494-505]); 2) 인핸서 CArG 및 AP2 부위가 제거됨; 3) 우측 E-박스와 MEF2 부위 제거 사이의 63 bp 제거(문헌[Salva, et al. (2007) Mol Ther. 15: 320-9]); 4) TF 결합 모티프 간의 서열 최소화; 5) 사용된 +1 내지 +50 프로모터 서열(문헌[Salva, et al. (2007) Mol Ther. 15: 320-9]); 6) 공통 Inr 부위 추가. 이 조절 카세트를 1 내지 4개의 후성적 억제인자(SUV39H1 SET 전, SET, 및 SET 후 도메인, MeCP2 TRD, HP1α, 또는 HP1γ) 및 HA 태그, 이 후 SV40 후기 pA 신호에 프레임내 융합된 SV40 이분 핵 위치화 신호 플랭킹 dSaCas9의 상류에 설계하였다. sgRNA 작제물을 U6 프로모터에 이어 sgRNA, SaCas9 최적화 스캐폴드 및 cPPT/CTS로 설계하였다. 올인원 플라스미드 작제물은 동일한 플라스미드에 근육 조절 카세트, dSa-Cas9 융합체 및 U6-sgRNA를 포함했다. 작제물을 pUC57에서 GenScript에 의해 합성하고 1차 FSHD 근세포 감염을 위한 pRRLSIN 렌티바이러스(LV) 벡터 또는 마우스의 AAV 감염을 위한 pAAV-CA로 클로닝하였다. pRRLSIN.cPPT.PGK-GFP.WPRE는 Didier Trono(Addgene 플라스미드 # 12252; http://n2t.net/addgene:12252; RRID:Addgene_12252)에서 제공하였다. pAAV-CA는 Naoshige Uchida(Addgene 플라스미드 # 69616; https://www.addgene.org/69616/ ; RRID: Addgene_69616)에서 제공하였다.
sgRNA 설계 및 플라스미드 작제. Broad Institute (https://portals.broadinstitute.org/gpp/public/analysis-tools/sgrna-design)에서 공개적으로 사용 가능한 sgRNA 설계 도구를 사용하여 DUX4 유전자좌 범위를 표적화하는 dSaCas9 적합 sgRNA를 설계했다. sgRNA를 모 작제물(parent construct)의 BfuAI 부위에 개별적으로 클로닝하고 서열 확인되거나 올인원 플라스미드로 직접 합성하고 서열 확인하였다. 공개적으로 사용 가능한 Cas-OFFinder 도구(http://www.rgenome.net/cas-offinder/)를 사용하여 골격근에서 발현된 유전자에서 가장 근접하게 매칭되는 OT 서열을 검색했다. 자세한 내용은 표 1을 참조한다.
세포 배양, 일시적 형질감염, LV 감염 및 AAV 감염. FSHD1 환자(17Abic)의 이두박근에서 유래된 근원성 세포를 매사추세츠 의과 대학에 저장된 Wellstone FSHD 세포 저장소에서 얻었고 기재된 바와 같이 성장시켰다(문헌[Himeda, et al. (2016) Mol Ther. 24: 527-35]). 293T 패키징 세포를 기재된 바와 같이 성장시키고 형질감염시켰다(문헌[Himeda, et al. (2016) Mol Ther. 24: 527-35]). 약 70 내지 80% 컨플루언스(confluence)에서 17Abic 근모세포를 기재된 대로 4회의 연속 감염에 적용하였다(문헌[Himeda, et al. (2016) Mol Ther. 24: 527-35]). 세포를 감염의 마지막 라운드 약 72시간 후에 수확하였다. pAAV-CA 플라스미드를 사용하여 감염성 AAV9 바이러스 입자(Vector Biolabs)를 생성했다.
정량적 역전사효소 PCR(qRT-PCR). Trizol(Invitrogen)을 사용하여 총 RNA를 추출하고 컬럼 상 DNase I 분해 후 RNeasy Mini 키트(Qiagen)를 사용하여 정제했다. 기재된 대로 Superscript III 역전사효소(Invitrogen)를 사용하여 cDNA 합성에 총 RNA(2μg)를 사용하고 qPCR 분석에 200ng의 cDNA를 사용했다(문헌[Jones, et al.(2015) Clin Epigenetics. 7:37]). 올리고뉴클레오타이드 프라이머 서열은 표 2에 제공되어 있다.
염색질 면역침전(ChIP). ChIP 분석을 기재된 대로 Fast ChIP 방법을 사용하여 LV 감염된 17Abic 분화된 근세포로 수행하였다(문헌[Himeda, et al. (2016) Mol Ther. 24: 527-35]). 염색질을 2μg의 특정 항체를 사용하여 면역침전시켰다. 기재된 대로 SYBR 녹색 정량적 PCR 분석을 수행했다(문헌[Himeda, et al. (2016) Mol Ther. 24: 527-35]). 올리고뉴클레오타이드 프라이머 서열은 표 2에 제공되어 있다.
AAV 주입 및 시각화. mCherry를 조절하는 FSHD 최적화된 유전자 발현 카세트(도 12u)를 Naoshige Uchida(Addgene plasmid # 69616 ; http://n2t.net/addgene:69616 ; RRID:Addgene_69616)에서 제공한 pAAV-CA 플라스미드의 AAV2 ITR(MluI 및 RsrII 사용) 사이에 클로닝하고, 작제물을 AAV9 생성을 위해 Vector Biolabs(Malvern, PA)로 보냈다. AAV9-FSHD-mCherry 벡터(3.2 x 1013 GC/ml의 100μl)를 3.5주령에 야생형 C57BL/6J 마우스의 안정맥동에 주입했다. 체중당 평균 AAV 투여량은 2.8 x 1011GC/kg이었다. AAV 주입 12주 후에, PBS의 경심 관류에 의해 혈액을 제거하고, 이미징 및 분자 분석을 위해 조직을 샘플링하였다. 모든 조직의 mCherry 신호를 표시되지 않는 한 동일한 노출을 사용하여 Leica MZ9.5 / DFC-7000T 형광 이미징 시스템 및 Leica LAS X 소프트웨어로 캡처하였다. 이미지를 Adobe Photoshop CS6으로 조합하며 노출을 동일하게 조정하였다. 또한, 게놈 DNA를 개별 조직에서 단리하고 bGH 프라이머를 사용하여 qPCR(50ng 게놈 DNA)에 의해 바이러스 게놈을 정량화하고 내인성 단일 카피 Rosa26 유전자로 정규화했다. 올리고뉴클레오타이드 프라이머 서열은 표 2에 제공되어 있다.
RNA-seq. FSHD 근세포(17Abic)를 각각 DUX4를 표적화하는 sgRNA를 발현하는 LV와 조합하여, 1) SUV39H1 SET 전, SET, 및 SET 후 도메인 (SET), 2) MeCP2 TRD, 3) HP1γ, 4) HP1α, 또는 5) KRAB TRD에 융합된 dSaCas9를 발현하는 LV 상청액으로 4회의 연속 동시 감염에 적용하였다. 세포를 감염의 마지막 라운드 약 72시간 후에 수확하였다. 모든 처리에 대해 5개의 개별 실험을 수행하였으며, 시퀀싱을 위해 샘플을 제출하기 전에 qRT-PCR에 의해 DUX4-fl 및 DUX4-FL 표적의 감소가 확인하였다. RNA-seq 분석을 GeneWiz, LLC에서 Illumina HiSeq 2 x 100bp 플랫폼을 사용하여 수행했으며, 이는 유전자 발현 수준, 스플라이싱 변이체 발현 및 신규 전사체 조립(주석이 없는 서열 포함)을 확인하는데 이상적이다. rRNA 고갈, 라이브러리 작제(library construction), 시퀀싱 및 초기 분석(모든 서열 판독을 인간 게놈에 매핑, 판독 적중 수 측정 및 차등 유전자 발현 비교)을 GeneWiz에서 수행했다. Trimmomatic v.0.36을 사용하여 품질이 낮은 가능한 어댑터 서열과 뉴클레오타이드를 제거하기 위해 서열 판독을 트리밍했다. 트리밍된 판독값을 STAR 정렬기 v.2.5.2b를 사용하여 ENSEMBL에서 사용 가능한 호모 사피엔스 GRCh38 참조 게놈에 매핑하였다. STAR 정렬기는 스플라이싱 접합을 검출하고 이를 혼입하여 전체 판독 서열을 정렬하는데 도움이 되는 스플라이싱 정렬기이다. 고유한 유전자 적중 수를 Subread 패키지 v.1.5.2의 featureCounts를 사용하여 계산하였다. 엑손 영역에 속하는 고유한 판독만 계산하였다. 가닥 특이적 라이브러리 제제를 수행하였으므로 판독을 가닥 특이적으로 계수하였다. 샘플 그룹 간의 유전자 발현 비교를 아래에 기재된 DESeq2를 사용하여 수행하였다. GeneSCF v.1.1-p2 소프트웨어를 구현하여 통계적으로 유의한 유전자 세트에 대해 유전자 온톨로지(ontology) 분석을 수행했다. goa_human GO 목록을 생물학적 과정을 기반으로 유전자 세트를 클러스터링하고 통계적 중요성을 결정하는데 사용하였다. 대안적으로 스플라이싱된 전사체의 발현 수준을 추정하기 위해 게놈에 매핑된 RNA-seq 판독에서 스플라이싱 변이체 적중 수를 추출했다. DEXSeq를 사용하여 유전자의 엑손(및 접합부)에 대한 판독 수의 상당한 차이를 시험하여 하나 초과의 샘플이 있는 그룹에 대해 차등적으로 스플라이싱된 유전자를 확인했다. Prism 7(Graphpad)을 사용하여 차등적으로 발현된 유전자의 점 그래프를 생성했다.
ACTA1-MCM; FLExD 이중 트랜스제닉 마우스에서 dSaCas9-TRD 또는 -KRAB의 AAV 형질도입. 4주령 수컷 ACTA1-MCM; FLExD 이중 트랜스제닉 동물의 전방 경골(TA) 근육에 다양한 비율의 AAV9-dSaCas9-TRD 또는 -KRAB 및 AAV9-sgRNA를 주입하였다. AAV-dSaCas9-TRD 또는 -KRAB를 모든 실험에 대해 5x105 GC/TA로 주입하였다. AAV 주입 3.5주 후에, 마우스에 5 mg/kg의 타목시펜(TMX)을 복강내 주입하여 골격근에서 DUX4-fl 발현을 유도하였다. TA 근육을 유전자 발현 분석을 위해 TMX 주입 14일 후에 샘플링하였다.
통계적 분석. 1차 세포에서의 실험을 적어도 4개의 생물학적 이중 반복 실험물(qRT-PCR 분석용)과 적어도 3개의 생물학적 이중 반복 실험물(ChIP 분석용)을 사용하여 수행하였으며, 데이터는 비쌍 양측 스튜던트 t-검정을 사용하여 분석하였다(p 값: *p<0.05, **p<0.01, ***p<0.001). RNA-seq 분석을 GeneWiz에서 5개의 생물학적 이중 반복 실험물을 사용하여 수행했으며, DESeq2를 사용하여 샘플 그룹 간의 유전자 발현 비교를 수행했다. Wald 시험을 p-값 및 log2 배수 변화를 생성하는데 사용하였다. p-값이 0.05 미만이고 절대 log2 배수 변화가 1 초과인 유전자를 각 비교에 대해 DEG로 지정하였다. GO 용어의 농축을 Fisher 정확한 시험(GeneSCF v1.1-p2)을 사용하여 시험하였다. 상당히 농축된 GO 용어는 차등적으로 발현된 유전자 세트에서 조정된 P-값이 0.05 미만이었다. 마우스에서 AAV 형질도입을 위해, 유전자 발현을 비쌍 양측 스튜던트 t-검정을 사용하여 분석하였다.
서열번호 | sgRNA | 표적 | 21-nt 서열 + PAM (NNGRRT) | 미스매치 | 유동 |
5. | 1 | DUX4 prom | CGGCCCCAGGCCTCGACGCCCTGGGGT | ||
6. | OT | LAAT1* | aGGCCCCAGG-CTCGcCGCCCCAGGAT | 2 | 1 |
7. | 5 | DUX4 엑손 1 | CTGTGCAGCGCGGCCCCCGGCGGGGGT | ||
8. | OT | RRS1** | CTGT--AGCtCGGCCtCCGGCGTGGGT | 2 | 2 |
9. | OT | GNAI1** | C--TGCgGCGCGGCCaCCGGCGGGAGT | 2 | 2 |
이 연구에 사용된 2개의 dSaCas9-적합성 sgRNA는 표시된 바와 같이 골격근에서 발현되는 유전자 또는 그 근처에서 잠재적인 표적외(OT) 매칭(http://www.rgenome.net/cas-offinder/)를 나타내었다. *리소좀 아미노산 수송체 1 동족체(LAAT1)의 인트론 1은 sgRNA #1에 대한 잠재적인 OT 매치를 포함한다. **리보솜 생합성 조절 단백질 동족체(RRS1)의 단일 엑손과 구아닌 뉴클레오타이드 결합 단백질 G(i) 소단위 알파-1 이소형 1(GNAI1)의 하류 플랭킹 서열은 sgRNA #5에 대한 잠재적인 OT 매치를 포함한다.
서열번호 | 유형 | 명칭 | 서열 |
10. | qRT-PCR | DUX4-fl-F | GCTCTGCTGGAGGAGCTTTAGGA |
11. | qRT-PCR | DUX4-fl-R | CGCACTGCTCGCAGGTCTGCWGGT |
12. | qRT-PCR | DUX4-fl-네스티드-F | AGCTTTAGGACGCGGGGTTGGGAC |
13. | qRT-PCR | DUX4-fl-네스티드-R | GCAGGTCTGCWGGTACCTGG |
14. | qRT-PCR | TRIM43-F | ACCCATCACTGGACTGGTGT |
15. | qRT-PCR | TRIM43-R: | CACATCCTCAAAGAGCCTGA |
16. | qRT-PCR | MBD3L2-F: | GCGTTCACCTCTTTTCCAAG |
17. | qRT-PCR | MBD3L2-R: | GCCATGTGGATTTCTCGTTT |
18. | qRT-PCR | MYH1-F: | ACAGAAGCGCAATGTTGAAG |
19. | qRT-PCR | MYH1-R: | CACCTTTGCTTGCAGTTTGT |
20. | qRT-PCR | FRG1-F: | TCTACAGAGACGTAGGCTGTCA |
21. | qRT-PCR | FRG1-R: | CTTGAGCACGAGCTTGGTAG |
22. | qRT-PCR | FRG2-F: | GGGAAAACTGCAGGAAAA |
23. | qRT-PCR | FRG2-R: | CTGGACAGTTCCCTGCTGTGT |
24. | qRT-PCR | LAAT1-F: | TCTGCTTTGCTGCATCTACC |
25. | qRT-PCR | LAAT1-R: | AGTACAGCGTCAGCATCACC |
26. | qRT-PCR | RRS1-F: | CACAACCGAGACTTTGGAGA |
27. | qRT-PCR | RRS1-R: | TCCCGCTCTGATACACAAAC |
28. | qRT-PCR | GNAI1-F: | CATCCCGACTCAACAAGATG |
29. | qRT-PCR | GNAI1-R: | TGCATTCGGTTCATTTCTTC |
30. | ChIP | DUX4 prom-F: | CCTGTTGCTCACGTCTCTCC |
31. | ChIP | DUX4 prom-R: | GTGGGGAGTCTGCAGTGTG |
32. | ChIP | DUX4 TSS-F: | GACACCCTCGGACAGCAC |
33. | ChIP | DUX4 TSS-R: | GTACGGGTTCCGCTCAAAG |
34. | ChIP | DUX4 엑손3-F | CTGACGTGCAAGGGAGCT |
35. | ChIP | DUX4 엑손3-R | CAGGTTTGCCTAGACAGCG |
36. | ChIP | 4-spec D4Z4-F | TCTGCTGGAGGAGCTTTAG |
37. | ChIP | 4-spec D4Z4-R | GAATGGCAGTTCTCCGCG* |
38. | CRISPRi** | sgRNA-1 | CGGCCCCAGGCCTCGACGCCC |
39. | CRISPRi** | sgRNA-2 | TCGACGCCCTGGGGTCCCTTC |
40. | CRISPRi** | sgRNA-3 | TCCGCGGGGAGGGTGCTGTCC |
41. | CRISPRi** | sgRNA-4 | GCCAGCTGAGGCAGCACCGGC |
42. | CRISPRi** | sgRNA-5 | CTGTGCAGCGCGGCCCCCGGC |
43. | CRISPRi** | sgRNA-6 | TCATCCAGCAGCAGGCCGCAG |
44. | AAV qPCR | bGH-F | TCTAGTTGCCAGCCATCTGTTGT |
45. | AAV qPCR | bGH-R | TGGGAGTGGCACCTTCCA |
46. | AAV qPCR | Rosa26-F | CAATACCTTTCTGGGAGTTCTCTGCTGC |
47. | AAV qPCR | Rosa26-R | TGCAGGACAACGCCCACACACC |
*이 위치의 G는 4번 염색체(G)와 10번 염색체(T)에 특이적이다.
**각 sgRNA는 가장 효과적인 표적화를 위해 G가 선행하는 21bp 서열이다.
서열번호 | 명칭 | 유형 | 아미노산 서열 |
1. | SUV39H1 SET | dSaCas9 융합 단백질 | MAPKKKRKVEASKRNYILGLAIGITSVGYGIIDYETRDVIDAGVRLFKEANVENNEGRRSKRGARRLKRRRRHRIQRVKKLLFDYNLLTDHSELSGINPYEARVKGLSQKLSEEEFSAALLHLAKRRGVHNVNEVEEDTGNELSTKEQISRNSKALEEKYVAELQLERLKKDGEVRGSINRFKTSDYVKEAKQLLKVQKAYHQLDQSFIDTYIDLLETRRTYYEGPGEGSPFGWKDIKEWYEMLMGHCTYFPEELRSVKYAYNADLYNALNDLNNLVITRDENEKLEYYEKFQIIENVFKQKKKPTLKQIAKEILVNEEDIKGYRVTSTGKPEFTNLKVYHDIKDITARKEIIENAELLDQIAKILTIYQSSEDIQEELTNLNSELTQEEIEQISNLKGYTGTHNLSLKAINLILDELWHTNDNQIAIFNRLKLVPKKVDLSQQKEIPTTLVDDFILSPVVKRSFIQSIKVINAIIKKYGLPNDIIIELAREKNSKDAQKMINEMQKRNRQTNERIEEIIRTTGKENAKYLIEKIKLHDMQEGKCLYSLEAIPLEDLLNNPFNYEVDHIIPRSVSFDNSFNNKVLVKQEEASKKGNRTPFQYLSSSDSKISYETFKKHILNLAKGKGRISKTKKEYLLEERDINRFSVQKDFINRNLVDTRYATRGLMNLLRSYFRVNNLDVKVKSINGGFTSFLRRKWKFKKERNKGYKHHAEDALIIANADFIFKEWKKLDKAKKVMENQMFEEKQAESMPEIETEQEYKEIFITPHQIKHIKDFKDYKYSHRVDKKPNRELINDTLYSTRKDDKGNTLIVNNLNGLYDKDNDKLKKLINKSPEKLLMYHHDPQTYQKLKLIMEQYGDEKNPLYKYYEETGNYLTKYSKKDNGPVIKKIKYYGNKLNAHLDITDDYPNSRNKVVKLSLKPYRFDVYLDNGVYKFVTVKNLDVIKKENYYEVNSKCYEEAKKLKKISNQAEFIASFYNNDLIKINGELYRVIGVNNDLLNRIEVNMIDITYREYLENMNDKRPPRIIKTIASKTQSIKKYSTDILGNLYEVKSKKHPQIIKKGGTGGPKKKRKVGRAYDLCIFRTDDGRGWGVRTLEKIRKNSFVMEYVGEIITSEEAERRGQIYDRQGATYLFDLDYVEDVYTVDAAYYGNISHFVNHSCDPNLQVYNVFIDNLDERLPRYPYDVPDYA |
2. | MeCP2 TRD | dSaCas9 융합 단백질 | MAPKKKRKVEASKRNYILGLAIGITSVGYGIIDYETRDVIDAGVRLFKEANVENNEGRRSKRGARRLKRRRRHRIQRVKKLLFDYNLLTDHSELSGINPYEARVKGLSQKLSEEEFSAALLHLAKRRGVHNVNEVEEDTGNELSTKEQISRNSKALEEKYVAELQLERLKKDGEVRGSINRFKTSDYVKEAKQLLKVQKAYHQLDQSFIDTYIDLLETRRTYYEGPGEGSPFGWKDIKEWYEMLMGHCTYFPEELRSVKYAYNADLYNALNDLNNLVITRDENEKLEYYEKFQIIENVFKQKKKPTLKQIAKEILVNEEDIKGYRVTSTGKPEFTNLKVYHDIKDITARKEIIENAELLDQIAKILTIYQSSEDIQEELTNLNSELTQEEIEQISNLKGYTGTHNLSLKAINLILDELWHTNDNQIAIFNRLKLVPKKVDLSQQKEIPTTLVDDFILSPVVKRSFIQSIKVINAIIKKYGLPNDIIIELAREKNSKDAQKMINEMQKRNRQTNERIEEIIRTTGKENAKYLIEKIKLHDMQEGKCLYSLEAIPLEDLLNNPFNYEVDHIIPRSVSFDNSFNNKVLVKQEEASKKGNRTPFQYLSSSDSKISYETFKKHILNLAKGKGRISKTKKEYLLEERDINRFSVQKDFINRNLVDTRYATRGLMNLLRSYFRVNNLDVKVKSINGGFTSFLRRKWKFKKERNKGYKHHAEDALIIANADFIFKEWKKLDKAKKVMENQMFEEKQAESMPEIETEQEYKEIFITPHQIKHIKDFKDYKYSHRVDKKPNRELINDTLYSTRKDDKGNTLIVNNLNGLYDKDNDKLKKLINKSPEKLLMYHHDPQTYQKLKLIMEQYGDEKNPLYKYYEETGNYLTKYSKKDNGPVIKKIKYYGNKLNAHLDITDDYPNSRNKVVKLSLKPYRFDVYLDNGVYKFVTVKNLDVIKKENYYEVNSKCYEEAKKLKKISNQAEFIASFYNNDLIKINGELYRVIGVNNDLLNRIEVNMIDITYREYLENMNDKRPPRIIKTIASKTQSIKKYSTDILGNLYEVKSKKHPQIIKKGGTGGPKKKRKVGRAGRKPGSVVAAAAAEAKKKAVKESSIRSVQETVLPIKKRKTRYPYDVPDYA |
3. | HP1α 염색체 섀도우 및 CTE | dSaCas9융합 단백질 | MAPKKKRKVEASKRNYILGLAIGITSVGYGIIDYETRDVIDAGVRLFKEANVENNEGRRSKRGARRLKRRRRHRIQRVKKLLFDYNLLTDHSELSGINPYEARVKGLSQKLSEEEFSAALLHLAKRRGVHNVNEVEEDTGNELSTKEQISRNSKALEEKYVAELQLERLKKDGEVRGSINRFKTSDYVKEAKQLLKVQKAYHQLDQSFIDTYIDLLETRRTYYEGPGEGSPFGWKDIKEWYEMLMGHCTYFPEELRSVKYAYNADLYNALNDLNNLVITRDENEKLEYYEKFQIIENVFKQKKKPTLKQIAKEILVNEEDIKGYRVTSTGKPEFTNLKVYHDIKDITARKEIIENAELLDQIAKILTIYQSSEDIQEELTNLNSELTQEEIEQISNLKGYTGTHNLSLKAINLILDELWHTNDNQIAIFNRLKLVPKKVDLSQQKEIPTTLVDDFILSPVVKRSFIQSIKVINAIIKKYGLPNDIIIELAREKNSKDAQKMINEMQKRNRQTNERIEEIIRTTGKENAKYLIEKIKLHDMQEGKCLYSLEAIPLEDLLNNPFNYEVDHIIPRSVSFDNSFNNKVLVKQEEASKKGNRTPFQYLSSSDSKISYETFKKHILNLAKGKGRISKTKKEYLLEERDINRFSVQKDFINRNLVDTRYATRGLMNLLRSYFRVNNLDVKVKSINGGFTSFLRRKWKFKKERNKGYKHHAEDALIIANADFIFKEWKKLDKAKKVMENQMFEEKQAESMPEIETEQEYKEIFITPHQIKHIKDFKDYKYSHRVDKKPNRELINDTLYSTRKDDKGNTLIVNNLNGLYDKDNDKLKKLINKSPEKLLMYHHDPQTYQKLKLIMEQYGDEKNPLYKYYEETGNYLTKYSKKDNGPVIKKIKYYGNKLNAHLDITDDYPNSRNKVVKLSLKPYRFDVYLDNGVYKFVTVKNLDVIKKENYYEVNSKCYEEAKKLKKISNQAEFIASFYNNDLIKINGELYRVIGVNNDLLNRIEVNMIDITYREYLENMNDKRPPRIIKTIASKTQSIKKYSTDILGNLYEVKSKKHPQIIKKGGTGGPKKKRKVGRALEPEKIIGATDSCGDLMFLMKWKDTDEADLVLAKEANVKCPQIVIAFYEERLTWHAYPEDAENKEKETAKSYPYDVPDYA |
4. | HP1γ 염색체 섀도우 및 CTE | dSaCas9융합 단백질 | MAPKKKRKVEASKRNYILGLAIGITSVGYGIIDYETRDVIDAGVRLFKEANVENNEGRRSKRGARRLKRRRRHRIQRVKKLLFDYNLLTDHSELSGINPYEARVKGLSQKLSEEEFSAALLHLAKRRGVHNVNEVEEDTGNELSTKEQISRNSKALEEKYVAELQLERLKKDGEVRGSINRFKTSDYVKEAKQLLKVQKAYHQLDQSFIDTYIDLLETRRTYYEGPGEGSPFGWKDIKEWYEMLMGHCTYFPEELRSVKYAYNADLYNALNDLNNLVITRDENEKLEYYEKFQIIENVFKQKKKPTLKQIAKEILVNEEDIKGYRVTSTGKPEFTNLKVYHDIKDITARKEIIENAELLDQIAKILTIYQSSEDIQEELTNLNSELTQEEIEQISNLKGYTGTHNLSLKAINLILDELWHTNDNQIAIFNRLKLVPKKVDLSQQKEIPTTLVDDFILSPVVKRSFIQSIKVINAIIKKYGLPNDIIIELAREKNSKDAQKMINEMQKRNRQTNERIEEIIRTTGKENAKYLIEKIKLHDMQEGKCLYSLEAIPLEDLLNNPFNYEVDHIIPRSVSFDNSFNNKVLVKQEEASKKGNRTPFQYLSSSDSKISYETFKKHILNLAKGKGRISKTKKEYLLEERDINRFSVQKDFINRNLVDTRYATRGLMNLLRSYFRVNNLDVKVKSINGGFTSFLRRKWKFKKERNKGYKHHAEDALIIANADFIFKEWKKLDKAKKVMENQMFEEKQAESMPEIETEQEYKEIFITPHQIKHIKDFKDYKYSHRVDKKPNRELINDTLYSTRKDDKGNTLIVNNLNGLYDKDNDKLKKLINKSPEKLLMYHHDPQTYQKLKLIMEQYGDEKNPLYKYYEETGNYLTKYSKKDNGPVIKKIKYYGNKLNAHLDITDDYPNSRNKVVKLSLKPYRFDVYLDNGVYKFVTVKNLDVIKKENYYEVNSKCYEEAKKLKKISNQAEFIASFYNNDLIKINGELYRVIGVNNDLLNRIEVNMIDITYREYLENMNDKRPPRIIKTIASKTQSIKKYSTDILGNLYEVKSKKHPQIIKKGGTGGPKKKRKVGRALDPERIIGATDSSGELMFLMKWKDSDEADLVLAKEANMKCPQIVIAFYEERLTWHSCPEDEAQYPYDVPDYA |
[표 4] 유전자 발현 조절 카세트(단일 벡터 시스템의 도 1c 서열)
*볼드체로 표시된 서열은 sgRNA의 위치이다(표 2 참조)
이제 실험 결과를 기재한다.
실시예 1: DUX4 프로모터 또는 엑손 1에 대한 후성적 억제인자의 dSaCas9 매개 집합은 FSHD 근세포에서 DUX4-fl 및 DUX4-FL 표적을 억제한다. 효과적인 CRISPR 기반 FSHD 요법은 골격근에 치료학적 성분의 효율적 전달과 질병 부위의 장기간 억제를 필요로 한다. 이러한 요구를 해결하기 위해 기존 CRISPRi 플랫폼을 재설계하였다. 이전 연구에서는 KRAB 도메인에 융합된 dSpCas9를 사용했는데(도 1a), 이는 배양된 세포에서 단기 억제에는 충분했지만 장기 침묵화에는 이상적이지 않았다. 안정적인 침묵화는 DNA 메틸트랜스퍼라제(DNMT)를 DUX4로 표적화하여 직접 달성할 수 있으나; 이러한 효소의 촉매 도메인은 생체내 전달에 필요한 현재 AAV 벡터의 패키징 한계(약 4.4kb)에 맞추기에는 너무 크다. 따라서 안정적인 침묵화에도 영향을 줄 수 있는 더 작은 후성적 조절인자와 억제 도메인을 선택하였다.
다양한 기능을 포괄하지만, HP1 단백질은 이질염색질 형성의 핵심 매개인자이다. HP1α는 주로 이질염색질에 위치하고 HP1γ는 건강한 근세포의 D4Z4 거대부수체 배열에서 다량 존재하고 FSHD에서 손실된다. SUV39H1은 히스톤 메틸트랜스퍼라제로서 함동원체 및 텔로미어 영역에서 구성적 이질염색질을 확립한다. SUV39H1의 SET 도메인은 이질염색질에 대한 안정적인 결합에 관여하고 HP1을 집합시키는 억제 마크인 H3K9 트리메틸화를 매개한다. SET 도메인은 효소 활성의 활성 부위를 포함하지만 메틸트랜스퍼라제 활성을 위해서는 SET 전 및 SET 후 도메인이 모두 필요하다. methyl-CpG-결합 단백질 MeCP2는 염색질 조절에서 다양한 역할을 하지만, 이의 TRD는 억제 히스톤 마크와 공동 억제 복합체에 결합한다.
AAV 벡터에서 이러한 비교적 작은 억제인자 및 억제 도메인에 융합된 dCas9를 수용하기 위해서는 현재의 조절 카세트를 최소화해야 했다. Hauschka 연구실(문헌[Salva, et al. (2007) Mol Ther. 15: 320-9; Himeda, et al. (2011) Methods Mol Biol. 34:1942-55])의 핵심 작업을 기반으로 하여 최소화된 골격근 조절 카세트를 더 큰 치료 성분이 생체내에서 전달될 수 있도록 설계하였다. CKM 프로모터의 상류에 있는 3개의 CKM 인핸서의 변형된 형태인 CKM 기반 카세트로 개시하여(문헌[Himeda, et al. (2011) Methods Mol Biol. 34:1942-55]), 요소와 요소 사이에 추가 공간을 제거하고, 골격근에서의 발현에 불필요한 CarG 및 AP2 부위를 결실시켰다(문헌[Amacher, et al. (1993) Mol Cell Biol. 13:2753-64; Donoviel, et al. (1996) Mol Cell Biol. 16:1649-58]). 이는 조절 카세트의 크기를 378bp로 감소시켜 이전에 AAV 벡터에 맞지 않는 후성적 억제인자에 융합된 더 작은 dSaCas9 오르쏘로그를 포함하는 작제물의 생성을 가능하게 했다. 따라서 신규한 CRISPRi 플랫폼은 다음으로 구성된다: 1) FSHD-최적화된 조절 카세트의 제어 하에 4개의 후성적 억제인자(HP1α, HP1γ, MeCP2 TRD, 또는 SUV39H1 SET 전, SET, 및 SET 후 도메인) 중 하나에 융합된 dSaCas9, 및 2) U6 프로모터의 제어 하에 있는 DUX4 유전자좌를 표적화하는 sgRNA(도 1b). 이들 성분은 배양된 근세포의 감염을 위해 렌티바이러스(LV) 벡터에서 초기에 발현되었지만, 각 치료학적 카세트는 생체내 사용을 위해 AAV 벡터에 효율적으로 패키징될 수 있다.
DUX4 유전자좌를 가로질러 표적화하는 Sa 프로토스페이서 인접 모티프(PAM)(NNGRRT)에 적합한 단일 가이드 RNA(sgRNA)를 설계하였다(재료 및 방법 및 도 1d). 모든 실험에 대해 FSHD 근원성 배양물의 4개의 연속 동시 감염을 기재된 대로 수행하였다(문헌[Himeda, et al. (2016) Mol Ther. 24:527-35]). 세포를 각각의 후성적 조절인자 또는 개별 sgRNA에 융합된 dSaCas9를 발현하는 LV 상청액의 다양한 조합으로 감염시켰다. qRT-PCR에 의한 유전자 발현 분석을 위해 감염의 최종 라운드 3일 후에 세포를 수확하였다.
DUX4 엑손 3 또는 D4Z4 상류 인핸서의 표적화는 영향이 없었지만, DUX4 프로모터 또는 엑손 1에 대한 각각의 dSaCas9-후성적 조절인자의 표적화는 DUX4-fl mRNA의 수준을 내인성 수준의 약 30 내지 50%로 유의하게 감소시켰다(도 2 및 도 3). DUX4-FL 단백질 수준이 낮고 FSHD 근세포에서 평가하기 어렵기 때문에 DUX4-FL 표적 유전자 발현은 DUX4 활성의 보다 신뢰할 수 있는 분석 및 관련 기능 판독으로 통상적으로 평가하였다. 중요하게는, 병원성 결과를 갖는 것으로 생각되는 DUX4-FL 표적의 발현 수준은 DUX4-fl mRNA의 감소와 병행하여 상당히 감소된다(도 2, 도 3).
SET 도메인의 효소 활성이 DUX4-fl에 대한 영향에 필요한지 확인하기 위해, DUX4 프로모터/엑손 1에 대한 효소 활성을 제거하는 SET 도메인 내에 돌연변이(C326A)를 포함하는 dSaCas9-SET을 생성했다. 영향은 매우 다양했지만 불활성 SET 도메인은 DUX4-fl의 수준에 유의한 영향을 미치지 않았으며(도 4), 이는 이 영역의 효소 활성이 DUX4-fl 억제에 필요함을 나타낸다.
실시예 2: DUX4에 대한 dSaCas9-후성적 억제인자의 표적화는 골격근에서 발현되는 MYH1, D4Z4 근위 유전자, 또는 가장 근접하게 매칭되는 OT 유전자에 영향을 미치지 않는다. 근육 분화에 대한 dSaCas9-후성적 억제인자의 비특이적 영향을 배제하기 위해, 말단 근육 분화의 마커인 미오신 중쇄 1(MYH1)의 수준을 위에서 기재한 세포에서 qRT-PCR에 의해 평가했다. 중요하게는, MYH1 수준은 모든 배양에서 균등했으며(도 5 및 도 6), 더 낮은 수준의 DUX4-fl이 분화 장애로 인한 것이 아님을 나타낸다. FRG1 및 FRG2의 발현 수준을 또한 측정하였다. 이 두 개의 다른 FSHD 후보 유전자는 D4Z4 거대부수체에 인접해 있다. DUX4 프로모터/엑손 1에 대한 각 dSaCas9-억제인자의 집합은 이러한 D4Z4 근위 유전자의 발현을 감소시키지 않았다(도 5 및 도 6).
각 dSaCas9-억제인자와 함께 최적으로 작동하는 sgRNA의 경우, 공개적으로 사용 가능한 Cas-OFFinder 도구(http://www.rgenome.net/cas-offinder/)를 사용하여 인간 게놈에서 가장 근접하게 매칭되는 OT 서열을 검색했다. sgRNA #1 및 #5만이 골격근에서 발현되는 유전자 내 또는 근처에서 근접하게 매칭되는 OT를 가졌다(표 1). 리소좀 아미노산 수송체 1 동족체(LAAT1)의 인트론 1은 sgRNA #1에 대한 잠재적인 OT 매칭을 포함한다. 리보솜 생합성 조절 단백질 동족체(RRS1)의 단일 엑손과 구아닌 뉴클레오타이드 결합 단백질 G(i) 소단위 알파-1 이소형 1(GNAI1)의 하류 서열 283bp는 sgRNA #5에 대한 잠재적인 OT 매칭을 포함한다. 그러나, DUX4-fl의 현저한 감소와 이와 달리, sgRNA #1로 dSaCas9-SET의 표적화는 LAAT1 발현에 영향을 미치지 않았다(도 7a 및 도 8a). 유사하게, sgRNA #5로 dSaCas9-HP1γ의 표적화는 RRS1 또는 GNAI1의 수준에 영향을 미치지 않았다(도 7b 및 도 8b).
실시예 3: DUX4에 대한 후성적 억제인자의 dSaCas9 매개 집합은 유전자좌에서 염색질 억제를 증가시킨다. DUX4 프로모터/엑손 1에 대한 각각의 후성적 억제인자의 표적화는 DUX4-fl의 수준을 감소시켰기 때문에, 각각은 유전자좌에서 염색질 구조의 직접적인 변화를 매개할 것으로 예측되었다. 따라서, ChIP 분석을 사용하여 FSHD 근세포에서 CRISPRi 처리 후 D4Z4에 걸쳐 억제 염색질의 여러 마크를 평가했다. 4개의 4q/10q 대립유전자 중 3개가 이미 압축된 이질염색질 상태에 있기 때문에 억제 마크의 증가는 DUX4 유전자좌에서 평가하기 어렵다. 따라서 수축된 대립유전자의 억제 증가를 평가하려는 모든 시도는 다른 3개의 존재에 의해 약화된다. 당연히, 억제성 H3K9me3 히스톤 마크의 전반적인 수준의 변화는 D4Z4 반복에서 검출할 수 없었으나; 다른 억제 마크는 높은 배경을 극복하면서 검출 가능하고 유의하게 높아졌다. DUX4에 대한 HP1α의 집합은 유전자좌 전반에 걸쳐 이 인자의 약 30 내지 40% 농축으로 이어졌고(도 9a 및 도 10a), KAP1 공동 억제인자의 점유를 증가시켰다(도 9b 및 도 10b). HP1γ의 집합은 DUX4 엑손 3에서 HP1α 및 KAP1 모두의 증가로 이어졌고, MeCP2 TRD의 집합은 유전자좌 전반에 걸쳐 HP1α의 증가로 이어졌다(도 9 및 도 10). 4가지 인자 각각의 집합은 또한 관찰되는 DUX4-fl mRNA의 더 낮은 수준(도 2)과 일치하는 병원성 반복(도 9c 및 도 10c)에서 RNA Pol II(포스포-세린 2)의 연장된 형태에서 약 40 내지 60% 감소를 초래했다. 종합하면, 이러한 결과는 dSaCas9-억제인자를 사용한 치료가 질병 유전자좌의 염색질을 보다 정상적인 억제 상태로 복원시킨다는 것을 나타낸다.
실시예 4: FSHD-최적화된 조절 카세트는 골격근에서만 활성이다. 최적화된 카세트의 개발에 따라 더 작은 CKM 기반 조절 카세트가 골격근에서 높은 활성을 유지하고 다른 조직에서는 활성이 낮거나 없음을 확인하는 것이 중요했다. 따라서, FSHD-최적화된 조절 카세트의 생체내 발현을 야생형 마우스에 대한 AAV9-매개 이식유전자 전달을 사용하여 분석하였다. 바이러스 입자를 전신 후안와 주입(systemic retro-orbital injection)(2.8x1014개 게놈 카피[GC]/kg 체중)에 의해 전달하고, mCherry 리포터 신호를 주입 12주 후에 시각화하였다. AAV9 벡터에 대해 이전에 보고된 바와 같이(문헌[Inagaki, et al.(2006) Mol Ther. 14:45-53]), 이 벡터는 골격근, 심장 근육 및 간을 강력하게 형질도입하였다(도 11). 그럼에도 불구하고, mCherry 발현은 골격근에서만 검출되었고 심장(도 12) 및 비근육 조직(도 13)에서는 검출되지 않았으며, 이는 FSHD-최적화된 조절 카세트가 중요한 표적 조직에서만 활성임을 나타낸다. DUX4는 일반적으로 건강한 개체의 이 조직에서 발현되기 때문에 고환의 친화도/활성의 부재는 특히 중요하다.
실시예 5: DUX4에 대한 dSaCas9-억제인자의 표적화는 근육 전사체에 대해 최소한의 영향을 나타낸다.
표적외 DNA 결합(ChIP-seq에 의한)의 분석은 더 중요한 표적외 유전자 발현 특성에 대해 밝히지 않기 때문에, 가장 효과적인 sgRNA로 DUX4에 대한 각 dSaCas9-억제인자를 표적화하는 전체 영향을 평가하기 위해 RNA-seq를 수행하였다. 1차 FSHD 근세포를 벡터의 각 조합(도 14에 기재됨) 또는 비교를 위해 dSaCas9-KRAB + sgRNA #6으로 형질도입시켰다. 유전자 온톨로지(GO) 분석은 잘못 조절된 세포 반응의 대부분이 LV 형질도입 또는 가능하게는 dCas9 발현으로 인한 것일 가능성이 있고 dCas9-효과기에 의해 매개되는 표적외 억제로 인한 것이 아님을 보여준다(도 15 내지 도 19). 4개의 서로 다른 sgRNA를 이용한 표적화가 선천적 면역 반응과 일치하는 차등적으로 발현된 유전자(DEG)의 매우 유사한 특성을 생성한다는 사실은 이 결론을 강력하게 지지하지만(도 24 내지 도 26), 일부 면역 관련 DEG는 DUX4 표적에는 면역 매개인자가 포함되기 때문에 DUX4 매개 조절 장애의 보정을 나타낼 수 있다. 바이러스에 대한 반응과 일치하는 DEG를 제거한 후, 남아 있는 대다수는 DUX4 오발현에 의해 탈조절되는 배아 프로그램 또는 발달 경로의 일부이다(도 26 및 표 5). 이들 유전자 중 다수는 다중 치료에 공통적이며 이의 차등적 발현은 보다 정상적인 유전자 발현 패턴으로의 복귀를 나타낸다. 예를 들어, DUX4 발현은 여러 독립적인 연구에서 TRIM14, KREMEN2, LY6E 및 PARP14의 수준을 감소시키며(문헌[Jagannathan, et al. (2016) Hum. Mol. Genet. 25:4419-4431]); 이러한 연구와 일치하여 4가지 dSaCas9-후성적 억제인자 치료 모두 이 유전자의 발현을 증가시켰다. 이와 달리, DUX4 과발현 후에 상향조절되는 TM6SF1 및 ITGA8(문헌[Jagannathan, et al. (2016) Hum. Mol. Genet. 25:4419-4431])은 모든 dSaCas9-후성적 억제인자를 사용한 치료 후에 둘 모두 감소했다.
qRT-PCR(MYOD1, MYOG, 및 MYH1)에 의해 평가된 근원성 유전자의 발현 수준은 또한 RNA-seq 분석에 의해 변화를 나타내지 않았다(도 26). 차등 발현되는 유일한 근육 유전자는 MEF2C의 안티센스 전사체인 dSaCas9-SET, -HP1γ 또는 -TRD로 처리한 후 약 2배 증가된 CKM 및 dSaCas9-SET 처리 후 약 2배 증가된 MYBPC2이다 (도 26). DUX4 발현은 근육 형성을 억제하는 것으로 보고되기 때문에 이러한 변화는 DUX4 매개 전사 조절 장애의 유익한 변형을 나타낼 수도 있다.
중요하게는, 각각의 치료에 대한 검출가능한 표적외 반응의 수가 극히 적었다. dSaCas9-TRD 또는 -HP1α를 사용한 처리는 유의한 고유한 DEG를 생성하지 않았고, dSaCas9-SET 및 -HP1γ를 사용한 처리는 각각 단지 7 및 8개의 고유한 DEG를 생성하였다(도 14, 도 24 및 도 25). 따라서 sgRNA 표적의 인실리코 검색에 의해 예측된 바와 같이 CRISPRi에 대한 이 시스템은 인간 근세포에서 매우 특이적이다. 이와 달리, dSaCas9-TRD와 동일한 sgRNA(#6)를 사용하여 표적화된 dSaCas9-KRAB를 사용한 처리는 37개의 고유한 DEG를 생성했다(dSaCas9-TRD의 경우 0). 이 결과는 dSpCas9-KRAB에 대해 보고된 높은 특이성을 고려하면 놀라운 것이었다; 이론에 결부시키고자 하는 것은 아니나, 적어도 근세포에서 KRAB 억제인자가 sgRNA 표적화와 무관한 게놈 위치에 집합되고 MeCP2 TRD보다 더 복잡한 억제인자임을 시사한다.
dSaCas9-TRD | dSaCas9-SET | dSaCas9-HP1g | dSaCas9-HP1a | |
KREMEN2 | 1.33 | 1.57 | 1.64 | 1.26 |
FRAS1 | 1.08 | 1.15 | 1.05 | NS |
TRIM14 | 1.05 | 1.10 | 1.16 | 1.03 |
FRZB | NS | NS | 1.02 | 1.09 |
COL9A2 | NS | NS | 1.15 | NS |
TYMP | 1.53 | 1.63 | 1.70 | 1.30 |
CMPK2 | 4.47 | 4.80 | 4.82 | 4.12 |
SPTBN5 | 1.14 | 1.13 | 1.23 | 1.02 |
GRIA1 | 1.09 | 1.18 | 1.39 | 1.33 |
TPPP3 | 1.07 | 1.28 | 1.20 | 1.01 |
LY6E | 1.69 | 1.96 | 1.92 | 1.54 |
PARP14 | 1.11 | 1.33 | 1.21 | 1.05 |
ACSM5 | 1.13 | 1.45 | 1.35 | NS |
PRELP | 1.01 | 1.02 | 1.05 | NS |
TM6SF1 | -1.10 | -1.35 | -1.16 | -1.22 |
ITGA8 | -1.24 | -1.36 | -1.37 | -1.19 |
COL10A1 | NS | -1.02 | NS | -1.13 |
실시예 6: DUX4 엑손 1에 대한 dSaCas9-억제인자의 생체내 표적화는 ACTA1-MCM; FLExDUX4 이중 트랜스제닉 마우스에서 DUX4-fl 및 DUX4-FL 표적을 억제한다.
생체내에서 DUX4-fl을 억제하는 CRISPRi 플랫폼의 능력을 시험하기 위해, ACTA1-MCM; FLExDUX4(FLExD) FSHD 유사 이중 트랜스제닉 마우스 모델을 사용하였으며, 이는 DUX4-fl을 발현하도록 유도될 수 있고 저 투여량(low dose)의 타목시펜에 반응하여 중등도의 병리학을 개발할 수 있다(문헌[Jones, et al.(2020) Skelet. Muscle 10, 8]). 이 마우스는 DUX4-fl이 발현되고 sgRNA에 의해 엑손 1에 표적화될 수 있는 하나의 인간 D4Z4 반복을 보유한다. 마우스에 dSaCas9-TRD 또는 -KRAB를 인코딩하는 AAV9 벡터 및 DUX4 엑손 1을 표적화하는 sgRNA를 다른 비율로 근육내 주입한 후 3.5주 후 타목시펜을 복강내 주입하여 골격근에서 모자이크 DUX4-fl 발현을 유도했다. 유도 2주 후, DUX4-FL의 발현 및 DUX4-FL에 의해 강력하게 유도된 2개의 직접적인 표적 유전자의 마우스 동족체를 주입된 TA에서 qRT-PCR에 의해 평가했다. DUX4-fl 전이유전자의 전사체 수준은 이 모델에서 평가하기 어렵지만, DUX4 엑손 1에 대한 dCas9-TRD 또는 -KRAB의 표적화는 sgRNA 대 효과기 비율이 높을수록 DUX4-fl의 발현이 약 30% 감소한다 (도 20). DUX4-FL 표적 Wfdc3 및 Slc34a2의 전사체 수준이 또한 감소되었지만, 감소는 sgRNA 대 효과기의 더 낮은 비율에서 dCas9-TRD에 대해서만 유의하였다(도 20). 이러한 영향은 미미하지만 이 후성적 CRISPRi 플랫폼이 지속적인 전임상 개발을 위한 실행 가능한 전략이라는 원리 증명을 제공한다.
실시예 7: CRISPRi 올인원 벡터의 설계 및 배양된 1차 FSHD 근세포에서의 검증. 성공적인 원리 증명(문헌[Himeda, et al.(2020) Mol Ther Methods Clin Dev. 20:298-311])에 이어, 치료학적 카세트를 단일 벡터 내에서 모든 CRISPRi 성분(각 후성적 조절인자에 융합된 dSaCas9 및 이의 표적화 sgRNA)이 수용되도록 재조작하였다(도 1c). 이는 CRISPRi를 임상에 전달하는데 중요하고, 이는 두 가지 바이러스를 제거하고, 따라서 1) 전달 효율성을 증가시키고 2) 높은 요법 비용을 감소시키고 3) 높은 바이러스 투여량과 관련된 면역 독성을 감소시킨다. 4개의 올인원(all-in-one) CRISPRi 치료학적 카세트를 처음에 렌티바이러스(LV) 벡터에서 조작하였다. 중요하게도 카세트의 크기를 각각 AAV에서 사용할 수 있도록 총 4.4kb 미만으로 제한하였다. 이 크기 제한 내에서 모든 CRISPRi 성분을 수용하려면 치료학적 카세트의 추가 최소화가 필요했고; 따라서 HP1α 및 HP1γ를 필수 염색체 섀도우 및 C-말단 확장 도메인으로 트리밍하고 SET 전 및 후 도메인을 SUV39H1 카세트에서 제거하였다. 각 올인원 벡터에는 다음이 포함된다: 1) FSHD-최적화된 조절 카세트의 제어 하에 5개의 억제인자 (HP1α 또는 HP1γ 염색체 섀도우 도메인 및 C-말단 확장, MeCP2 TRD, 또는 SUV39H1 SET 도메인) 중 하나에 융합된 dSaCas9 및 2) U6 프로모터의 제어 하에 DUX4 프로모터/엑손 1을 표적화하는 sgRNA(도 1c, 표 3 및 표 4). 대조군 벡터는 비표적화 sgRNA와 함께 각 dSaCas9-억제인자를 포함한다.
원리 증명으로서 dSaCas9-TRD를 사용하여, CRISPRi에 대한 이 단일 벡터 시스템은 1차 FSHD1 및 FSHD2 근세포 둘 모두에서 DUX4 및 이의 표적을 효과적으로 억제한다(도 21). 중요한 것은 이것이 DUX4를 표적화하는 CRISPRi가 FSHD2 환자 세포에서 효과적일 수 있다는 첫 번째 증명이라는 점이다. 또한, HP1α 및 HP1γ를 이의 필수 염색체 셰도우 및 C-말단 확장 도메인으로 트리밍하면 여전히 FSHD1 근세포에서 DUX4-fl 및 이의 표적 유전자의 효과적인 억제를 가능하게 한다(도 22).
실시예 8: 변형된 FSHD-최적화된 조절 카세트는 가자미근, 횡격막 및 심장에서 증가된 활성을 나타낸다.
현재 벡터가 속근(fast-twitch muscle)에서 매우 높게 발현되지만, 한 가지 약점은 가자미근 및 횡격막에서의 발현 부재이다(문헌[Himeda, et al. (2020) Mol Ther Methods Clin Dev. 20:298-311]). 이 문제를 처리하기 위해 조절 카세트를 추가 우측 E-박스가 CKM 인핸서의 최초 좌측 E-박스로 교체되도록 재설계하였다(문헌[Himeda, et al. (2011) Methods Mol. Biol. 709:3-19]). 이 변형은 가자미근과 횡격막, 및 심장에서 카세트 활성을 증가시켰다. 중요하게는, 신규한 카세트는 속근에서 여전히 매우 높은 활성을 나타냈고, 비-근육 조직에서 발현이 검출 불가능하였다(도 23). 심장에서의 발현은 FSHD 특이적 카세트에 필요하지 않지만 DUX4 유전자좌가 이미 억제된 조직(예를 들어, 심장 근육)에서 억제인자를 DUX4로 표적화하면 부정적인 영향이 발생하지 않아야 한다.
실시예 9: 논의. FSHD에 대한 치료법이나 개선적인 치료가 없으므로 효과적인 요법이이 절실히 필요하다. FSHD 발병이 골격근에서 DUX4의 비정상적인 발현에 의해 유발된다는 발견 이후, DUX4 및 그 하류 경로를 표적화하는 수많은 치료학적 접근법이 개발되고 있다. 매우 유사한 간접 발현 스크린에서 독립적으로 확인된 DUX4 발현을 표적화하는 소분자는 유망하지만, 이의 발견은 스크리닝된 화학 라이브러리, 투여 및 작용 모드에 의해 제한된다. 라이브러리의 명백한 중복에도 불구하고 유사한 접근법을 사용하는 두 개의 게시된 스크린은 DUX4 억제에 대해 다른 분자, 표적 및 경로를 확인했고 심지어 다른 표적을 제외했으며(문헌[Cruz, et al.(2018) J Biol Chem.; Campbell, et al.(2017) Skelet Muscle.7:16]), 이는 우려의 원인이다. 다른 것은 DUX4 활성 또는 독성을 표적화하는데 집중했으나(문헌[Choi, et al. (2016) J Biomol Screen. 21:680-8; Bosnakovski, et al.(2014) Skelet Muscle. 4:4; Bosnakovski, et al.(2019) Sci Adv. 5:7781); 그러나 여기에는 편재하고, 강력한 세포 경로가 포함되며 어떤 것이 병리학의 원인인지는 분명하지 않다. 많은 치료가 전임상 연구에서 매우 성공적이었고 임상 시험 중에만 실패했다는 점을 강조할 가치가 있다. 근긴장성 이영양증 분야의 최근 사건은 유망한 단일 치료법의 결과로 잠재적인 요법의 대안적 방법을 포기하지 않는 것의 중요성을 강조했다. DUX4 발현 또는 활성을 표적화하는 모든 보고서에서 억제의 전체적인 영향은 조사되지 않았으며, 대부분의 알려진 표적은 특히 FSHD에 필요한 장기간 투여 중에 억제가 상당한 부적절한 영향을 미칠 가능성이 있는 편재적 세포 효과기이다.
FSHD 요법에 대한 가장 직접적인 경로는 DUX4 mRNA의 발현을 제거하는 것이다. 효과적인 요법에 필요한 DUX4 억제의 양은 알려져 있지 않지만, 임상적으로 영향을 받은 무증상 FSHD 대상체의 데이터는 임의의 DUX4 발현의 감소가 치료적 이점을 가질 것임을 뒷받침한다(문헌[Jones, et al.(2012) Hum Mol Genet. 21:4419-30 ; Wang, et al.(2019) Hum Mol Genet. 28:476-486]). 그러나 DUX4와 이를 인코딩하는 D4Z4 반복은 고유한 치료 문제를 나타낸다. 예를 들어, 매우 유사한 D4Z4 반복 배열이 게놈의 여러 유전자좌에 존재하지만 DUX4는 가능한 대립 유전자의 가장 원위 반복 단위에서만 안정적으로 발현된다. 또한 다른 포유류에는 기능적 오르쏘로그가 포함되어 있지만 D4Z4 배열와 완전한 DUX4 유전자는 구세계 영장류 외부에서 보존되지 않으며 천연 동물 모델도 존재하지 않는다.
CRISPR/Cas9 기술은 특정 게놈 영역을 표적화하고 변형하기 위해 광범위하게 사용되어 많은 질병의 영구적인 보정 가능성을 제공한다. 표준 CRISPR 편집과 관련된 위험은 임의의 유전자좌에 대한 우려사항이지만 FSHD 유전자좌와 같이 고도로 반복적인 영역에서는 특히 우려된다. 그러나 유전자 발현을 억제하기 위한 CRISPR의 사용은 FSHD에 이상적으로 적합하다. 불행히도, 인간 유전자 요법을 위한 CRISPRi 플랫폼은 AAV 벡터에서 사용 가능한 공간의 대부분을 차지하는 큰 크기의 Cas9 표적화 단백질에 의해 제한되어 효과기를 위한 공간이 거의 남지 않는다. 당연히 대부분의 원리 증명 연구는 LV 벡터에서 dSpCas9를 활용했는데, 이는 게놈 용량이 더 크고 배양된 세포에서의 발현에 편리하지만 임상 유전자 전달에는 유용하지 않다. 더 작은 dSaCas9 오르쏘로그는 융합된 효과기와 잘 작동하는 것으로 나타났지만(문헌[Josipovic, et al.(2019) J Biotechnol. 301:18-23]), 그 코딩 서열은 여전히 3kb를 초과하여 AAV의 4.4kb 패키징 용량 내에 염색질 조절인자 및 조절서열을 위한 공간이 거의 남지 않는다. AAV 벡터의 패키징 제한이 FSHD 및 기타 많은 질병의 유전자 요법에 대한 주요 장애물임을 강조할 가치가 있다. FSHD용 CRISPRi 플랫폼을 임상에 도입하려면 dCas9 치료학적 카세트에 포함될 만큼 충분히 작고 안정한 억제인자를 찾고 현재의 근육 특이적 조절 카세트의 크기를 감소시키는 것이 필수적이었다.
많은 실험실의 연구에서 dCas9-KRAB를 사용하여 표적 유전자를 억제했지만; 이 효과기에 의해 매개되는 억제는 지속적인 발현이 필요하다. dCas9-효과기는 안정적인 에피솜 AAV 벡터에서 지속적으로 발현될 수 있지만 이것이 보장되지는 않는다. 임상적 관점에서, 전이유전자의 지속적인 평생 발현에 의존하지 않는 안정적인 억제를 달성하는 것이 훨씬 더 바람직한 것으로 보인다. 따라서, 골격근에 대한 높은 활성과 특이성을 유지하는 광범위하게 사용되는 CKM 기반 카세트(문헌[Salva, et al. (2007) Mol Ther. 15: 320-9])를 기반으로 하는 최소화된 카세트를 생성하였으며, 이 FSHD 최적화 카세트를 안정한 침묵화를 매개할 수 있는 4개의 작은 후성적 억제인자 각각에 융합된 dSaCas9의 발현을 유도하는데 사용하였다. 본 명세서에서 이러한 예는 이러한 후성적 조절인자의 dSaCas9 매개 표적이 근육 전사체에 최소한의 영향을 미치는 것으로, FSHD 근세포 및 DUX4-기반 트랜스제닉 마우스 모델에서 FSHD 유전자좌의 염색질을 보다 정상적인 억제 상태로 되돌리고 DUX4-fl 및 이의 표적의 발현을 감소시킨다는 원리 증명을 나타낸다.
DUX4-fl 및 이의 표적의 더욱 강력한 억제가 ACTA1-MCM; FLExD 이중 트랜스제닉 마우스에서보다 1차 FSHD 근세포에서 관찰되었고; 이는 효율적인 후성적 침묵화에 충분하지 않을 수 있는 단일 D4Z4 반복만 포함하는 마우스 모델의 한계로 인해 발생할 수 있다. 따라서 진행 중인 연구는 성숙한 FSHD 근섬유를 포함하는 인간 이종이식 모델에서 이 CRISPRi 플랫폼을 시험할 것이다(문헌[Mueller, et al. (2019) Exp. Neurol 320:113011]). 이 마우스는 면역이 저하되어 있으므로 DUX4 매개 면역 병리에 대한 CRISPRi의 효과를 평가하는데 유용하지 않다. 그러나 FSHD 환자의 전체 D4Z4 배열을 포함하기 때문에 이종이식 모델은 질병 위치에서 장기적인 후성적 변화를 평가하는데 이상적일 수 있다. 유전자 요법을 위한 현재 AAV 벡터는 한 번만 투여할 수 있기 때문에 CRISPRi에 의해 매개되는 DUX4 억제의 안정성을 결정하는 것이 중요한 목표이다.
Cas9 편집의 주요 문제는 dCas9 효과기에 대한 문제로 고려되지 않은 유해한 돌연변이로 이어지는 표적외 절단의 가능성이다. 그러나, DNA에 결합하는 dCas9에 의해 형성된 R-루프가 표적내 및 외 부위 모두에서 돌연변이를 유발할 수 있다는 것이 효모에서 최근에 입증되었으나(문헌[Laughery, et al. (2019) Nucleic Acids Res. 47:2389-2401]), 빈도는 Cas9에 의해 유도된 것보다 몇 배 더 낮다. 이 매우 낮은 비율과 일치하게, dCas9에 의해 유도된 돌연변이는 포유류 세포에서 검출되지 않았다(문헌[Lei, et al. (2018) Nat. Struct. Mol. Biol. 25:45-52]). 또한 이 문제는 일반적으로 침묵화하는 D4Z4 영역을 표적화할 때 개선된다. 다행히 FSHD의 CRISPRi의 경우 표적화된 영역의 특성과 사용된 조절 유형 모두 CRISPR 플랫폼과 관련된 일반적인 문제를 완화하는 경향이 있다.
CRISPR 및 기타 유전자 표적화 시스템이 계속 진화함에 따라 이 연구의 결과가 변화하는 플랫폼에 적용될 수 있다는 것이 중요하다. 최소의 표적외 효과로 DUX4 유전자좌를 성공적으로 표적화하는 sgRNA의 확인은 조작된 Cas9 변이체 및 다른 효과기에 융합된 dCas9에 유용한 것으로 입증되어야 한다. 또한, DUX4 프로모터와 엑손 1은 후성적 조절의 표적으로 확인되었으며 이 영역에는 Cas9의 다른 오르쏘로그에 적합한 수많은 sgRNA 표적이 포함되어 있다. 이러한 오르쏘로그가 더 잘 특성화되면 더 작고 덜 면역원성인 형태를 사용할 수 있게 되어 더 큰 후성적 조절인자와의 융합이 생체내 전달에 더 잘 적응하도록 해야 한다.
이들 실시예는 근육 장애에서 dCas9-매개 후성적 억제의 성공적인 사용을 입증하고, 따라서 생체내에서 이 접근법의 기능적 효능 및 안정성을 평가하기 위한 후속 진행 중인 연구를 위한 토대를 마련한다. 궁극적으로 치료 관련 플랫폼을 사용하여 FSHD의 기본 병원성 기전을 변형하는 것이 중요하다. 또한, dCas9 기반 염색질 효과기의 성공적인 사용은 비정상적인 유전자 조절의 다른 질병에 적용할 수 있어야 한다.
일련의 실시형태
다음의 일련의 실시형태가 제공되며, 번호는 중요도를 나타내는 것으로 해석되어서는 안된다.
실시형태 1은 단일 가이드 RNA(sgRNA) 및 융합 폴리펩타이드를 포함하는 CRISPR 간섭(CRISPRi) 플랫폼을 인코딩하는 폴리뉴클레오타이드로서, 융합 폴리펩타이드는 후성적 억제인자에 융합된 촉매적으로 불활성인 Cas9(dCas9 또는 iCas9)를 추가로 포함하는 폴리뉴클레오타이드를 제공한다.
실시형태 2는 sgRNA는 U6 프로모터의 제어 하에 있는 실시형태 1의 폴리뉴클레오타이드를 제공한다.
실시형태 3은 sgRNA는 DUX4 유전자좌를 표적화하고 실시형태 1의 폴리뉴클레오타이드를 제공한다.
실시형태 4는 융합 폴리펩타이드는 골격근-특이적 조절 카세트의 제어 하에 있는 실시형태 1 내지 3 중 어느 하나의 폴리뉴클레오타이드를 제공한다.
실시형태 5는 촉매적으로 불활성인 Cas9는 dSaCas9인 실시형태 1 내지 4 중 어느 하나의 폴리뉴클레오타이드를 제공한다.
실시형태 6은 후성적 억제인자는 HP1α, HP1γ HP1α 또는 HP1γ의 염색체 섀도우 도메인 및 C-말단 확장 영역, MeCP2 전사 억제 도메인 (TRD), 및 SUV39H1 SET 도메인으로 이루어진 군으로부터 선택되는 실시형태 1 내지 5 중 어느 하나의 폴리뉴클레오타이드를 제공한다.
실시형태 7은 sgRNA는 서열번호 38, 39, 40, 41, 42, 또는 43을 포함하는 실시형태 1 내지 6 중 어느 하나의 폴리뉴클레오타이드를 제공한다.
실시형태 8은 융합 폴리펩타이드는 서열번호 1 내지 4 중 어느 하나를 포함하는 실시형태 1 내지 6 중 어느 하나의 폴리뉴클레오타이드를 제공한다.
실시형태 9는 폴리뉴클레오타이드는 서열번호 48 내지 55 중 어느 하나를 포함하는 실시형태 1 내지 6 중 어느 하나의 폴리뉴클레오타이드를 제공한다.
실시형태 10은 sgRNA 및 융합 폴리펩타이드를 포함하는 CRISPRi 플랫폼을 인코딩하는 폴리뉴클레오타이드를 포함하는 벡터로서, 융합 폴리펩타이드는 후성적 억제인자에 융합된 촉매적으로 불활성인 Cas9(dCas9 또는 iCas9)를 추가로 포함하는 벡터를 제공한다.
실시형태 11은 sgRNA는 U6 프로모터의 제어 하에 있는 실시형태 10의 벡터를 제공한다.
실시형태 12는 sgRNA는 DUX4 유전자좌를 표적화하는 실시형태 10의 벡터를 제공한다.
실시형태 13은 융합 폴리펩타이드는 골격근-특이적 조절 카세트의 제어 하에 있는 실시형태 10 내지 12 중 어느 하나의 벡터를 제공한다.
실시형태 14는 촉매적으로 불활성인 Cas9는 dSaCas9인 실시형태 10 내지 13 중 어느 하나의 벡터를 제공한다.
실시형태 15는 후성적 억제인자는 HP1α, HP1γ HP1α 또는 HP1γ의 염색체 섀도우 도메인 및 C-말단 확장 영역, MeCP2 전사 억제 도메인 (TRD), 및 SUV39H1 SET 도메인으로 이루어진 군으로부터 선택되는 실시형태 10 내지 14 중 어느 하나의 벡터를 제공한다.
실시형태 16은 sgRNA는 서열번호 38, 39, 40, 41, 42, 또는 43을 포함하는 실시형태 10 내지 15 중 어느 하나의 벡터를 제공한다.
실시형태 17은 융합 폴리펩타이드는 서열번호 1 내지 4 중 어느 하나를 포함하는 실시형태 10 내지 16 중 어느 하나의 벡터를 제공한다.
실시형태 18은 폴리뉴클레오타이드는 서열번호 48 내지 55 중 어느 하나를 포함하는 실시형태 10 내지 17 중 어느 하나의 벡터를 제공한다.
실시형태 19는 벡터는 아데노-연관 바이러스 (AAV) 벡터인 실시형태 10 내지 18 중 어느 하나의 벡터를 제공한다.
실시형태 20은 벡터는 서열번호 48 내지 55 중 어느 하나를 포함하는 실시형태 10 내지 19 중 어느 하나의 벡터를 제공한다.
실시형태 21은 이를 필요로 하는 대상체에서 안면견갑상완 근이영양증(FSHD)을 치료하는 방법으로서, 상기 방법은 DUX4 유전자 발현의 억제인자의 유효량을 대상체에게 투여하는 단계를 포함하고, 억제인자는 대상체의 골격근 세포에서 DUX4 유전자 발현을 감소시킴으로써, 장애를 치료하는 방법을 제공한다.
실시형태 22는 DUX4 억제인자는 sgRNA 및 융합 폴리펩타이드를 포함하는 CRISPRi 플랫폼을 포함하는 폴리뉴클레오타이드이고, 융합 폴리펩타이드는 후성적 억제인자에 융합된 dCas9를 추가로 포함하는 실시형태 21의 방법을 제공한다.
실시형태 23은 sgRNA는 DUX4 유전자좌를 표적화하는 실시형태 21 또는 22의 방법을 제공한다.
실시형태 24는 sgRNA는 서열번호 38, 39, 40, 41, 42, 또는 43을 포함하는 실시형태 21 내지 23 중 어느 하나의 방법을 제공한다.
실시형태 25는 dCas9는 dSaCas9인 실시형태 21 내지 24 중 어느 하나의 방법을 제공한다.
실시형태 26은후성적 억제인자는 HP1α, HP1γ, HP1α 또는 HP1γ의 염색체 섀도우 도메인 및 C-말단 확장 영역, MeCP2 전사 억제 도메인 (TRD), 및 SUV39H1 SET 도메인으로 이루어진 군으로부터 선택되는 실시형태 21 내지 25 중 어느 하나의 방법을 제공한다.
실시형태 27은 융합 폴리펩타이드는 서열번호 1 내지 4 중 어느 하나를 포함하는 폴리뉴클레오타이드에 의해 인코딩되는 실시형태 21 내지 26 중 어느 하나의 방법을 제공한다.
실시형태 28은 폴리뉴클레오타이드는 서열번호 48 내지 55 중 어느 하나를 포함하는 실시형태 21 내지 27 중 어느 하나의 방법을 제공한다.
실시형태 29는 대상체는 포유류인 실시형태 21 내지 28 중 어느 하나의 방법을 제공한다.
실시형태 30은 포유류는 인간인 실시형태 29의 방법을 제공한다.
실시형태 31은 이를 필요로 하는 대상체에서 FSHD를 치료하는 방법으로서, 상기 방법은 실시형태 10 내지 20 중 어느 하나의 벡터의 유효량을 대상체에게 투여하는 단계를 포함하는 방법을 제공한다.
실시형태 32는 대상체는 포유류인 실시형태 31의 방법을 제공한다.
실시형태 33은 포유류는 인간인 실시형태 32의 방법을 제공한다.
다른 실시형태
본 명세서에서 변수의 임의의 정의에서 요소 목록의 인용은 나열된 요소의 임의의 단일 요소 또는 조합(또는 하위 조합)으로서 해당 변수의 정의를 포함한다. 본 명세서에서 실시형태의 언급은 임의의 단일 실시형태로서 또는 임의의 다른 실시형태 또는 이의 일부와 조합된 실시형태를 포함한다.
본 명세서에 인용된 각각의 모든 특허, 특허 출원 및 간행물의 개시내용은 그 전문이 참조로 본 명세서에 포함된다. 본 발명이 특정 실시형태를 참조하여 개시되었지만, 본 발명의 진정한 사상 및 범위를 벗어나지 않으면서 본 발명의 다른 실시형태 및 변형예가 당업자에 의해 고안될 수 있음이 명백하다. 첨부된 청구범위는 이러한 모든 실시형태 및 균등 변형을 포함하는 것으로 해석되도록 의도된다.
SEQUENCE LISTING
<110> Nevada Research & Innovation Corporation
Jones, Peter L.
Himeda, Charis L.
<120> CRISPR-INHIBITION FOR FACIOSCAPULOHUMERAL MUSCULAR DYSTROPHY
<130> 369055-7015WO1(00046)
<150> U.S. Provisional Patent Application No. 63/011,476
<151> 2020-04-17
<160> 58
<170> PatentIn version 3.5
<210> 1
<211> 1191
<212> PRT
<213> Artificial Sequence
<220>
<223> SUV39H1 SET dSaCas9 Fusion Protein
<400> 1
Met Ala Pro Lys Lys Lys Arg Lys Val Glu Ala Ser Lys Arg Asn Tyr
1 5 10 15
Ile Leu Gly Leu Ala Ile Gly Ile Thr Ser Val Gly Tyr Gly Ile Ile
20 25 30
Asp Tyr Glu Thr Arg Asp Val Ile Asp Ala Gly Val Arg Leu Phe Lys
35 40 45
Glu Ala Asn Val Glu Asn Asn Glu Gly Arg Arg Ser Lys Arg Gly Ala
50 55 60
Arg Arg Leu Lys Arg Arg Arg Arg His Arg Ile Gln Arg Val Lys Lys
65 70 75 80
Leu Leu Phe Asp Tyr Asn Leu Leu Thr Asp His Ser Glu Leu Ser Gly
85 90 95
Ile Asn Pro Tyr Glu Ala Arg Val Lys Gly Leu Ser Gln Lys Leu Ser
100 105 110
Glu Glu Glu Phe Ser Ala Ala Leu Leu His Leu Ala Lys Arg Arg Gly
115 120 125
Val His Asn Val Asn Glu Val Glu Glu Asp Thr Gly Asn Glu Leu Ser
130 135 140
Thr Lys Glu Gln Ile Ser Arg Asn Ser Lys Ala Leu Glu Glu Lys Tyr
145 150 155 160
Val Ala Glu Leu Gln Leu Glu Arg Leu Lys Lys Asp Gly Glu Val Arg
165 170 175
Gly Ser Ile Asn Arg Phe Lys Thr Ser Asp Tyr Val Lys Glu Ala Lys
180 185 190
Gln Leu Leu Lys Val Gln Lys Ala Tyr His Gln Leu Asp Gln Ser Phe
195 200 205
Ile Asp Thr Tyr Ile Asp Leu Leu Glu Thr Arg Arg Thr Tyr Tyr Glu
210 215 220
Gly Pro Gly Glu Gly Ser Pro Phe Gly Trp Lys Asp Ile Lys Glu Trp
225 230 235 240
Tyr Glu Met Leu Met Gly His Cys Thr Tyr Phe Pro Glu Glu Leu Arg
245 250 255
Ser Val Lys Tyr Ala Tyr Asn Ala Asp Leu Tyr Asn Ala Leu Asn Asp
260 265 270
Leu Asn Asn Leu Val Ile Thr Arg Asp Glu Asn Glu Lys Leu Glu Tyr
275 280 285
Tyr Glu Lys Phe Gln Ile Ile Glu Asn Val Phe Lys Gln Lys Lys Lys
290 295 300
Pro Thr Leu Lys Gln Ile Ala Lys Glu Ile Leu Val Asn Glu Glu Asp
305 310 315 320
Ile Lys Gly Tyr Arg Val Thr Ser Thr Gly Lys Pro Glu Phe Thr Asn
325 330 335
Leu Lys Val Tyr His Asp Ile Lys Asp Ile Thr Ala Arg Lys Glu Ile
340 345 350
Ile Glu Asn Ala Glu Leu Leu Asp Gln Ile Ala Lys Ile Leu Thr Ile
355 360 365
Tyr Gln Ser Ser Glu Asp Ile Gln Glu Glu Leu Thr Asn Leu Asn Ser
370 375 380
Glu Leu Thr Gln Glu Glu Ile Glu Gln Ile Ser Asn Leu Lys Gly Tyr
385 390 395 400
Thr Gly Thr His Asn Leu Ser Leu Lys Ala Ile Asn Leu Ile Leu Asp
405 410 415
Glu Leu Trp His Thr Asn Asp Asn Gln Ile Ala Ile Phe Asn Arg Leu
420 425 430
Lys Leu Val Pro Lys Lys Val Asp Leu Ser Gln Gln Lys Glu Ile Pro
435 440 445
Thr Thr Leu Val Asp Asp Phe Ile Leu Ser Pro Val Val Lys Arg Ser
450 455 460
Phe Ile Gln Ser Ile Lys Val Ile Asn Ala Ile Ile Lys Lys Tyr Gly
465 470 475 480
Leu Pro Asn Asp Ile Ile Ile Glu Leu Ala Arg Glu Lys Asn Ser Lys
485 490 495
Asp Ala Gln Lys Met Ile Asn Glu Met Gln Lys Arg Asn Arg Gln Thr
500 505 510
Asn Glu Arg Ile Glu Glu Ile Ile Arg Thr Thr Gly Lys Glu Asn Ala
515 520 525
Lys Tyr Leu Ile Glu Lys Ile Lys Leu His Asp Met Gln Glu Gly Lys
530 535 540
Cys Leu Tyr Ser Leu Glu Ala Ile Pro Leu Glu Asp Leu Leu Asn Asn
545 550 555 560
Pro Phe Asn Tyr Glu Val Asp His Ile Ile Pro Arg Ser Val Ser Phe
565 570 575
Asp Asn Ser Phe Asn Asn Lys Val Leu Val Lys Gln Glu Glu Ala Ser
580 585 590
Lys Lys Gly Asn Arg Thr Pro Phe Gln Tyr Leu Ser Ser Ser Asp Ser
595 600 605
Lys Ile Ser Tyr Glu Thr Phe Lys Lys His Ile Leu Asn Leu Ala Lys
610 615 620
Gly Lys Gly Arg Ile Ser Lys Thr Lys Lys Glu Tyr Leu Leu Glu Glu
625 630 635 640
Arg Asp Ile Asn Arg Phe Ser Val Gln Lys Asp Phe Ile Asn Arg Asn
645 650 655
Leu Val Asp Thr Arg Tyr Ala Thr Arg Gly Leu Met Asn Leu Leu Arg
660 665 670
Ser Tyr Phe Arg Val Asn Asn Leu Asp Val Lys Val Lys Ser Ile Asn
675 680 685
Gly Gly Phe Thr Ser Phe Leu Arg Arg Lys Trp Lys Phe Lys Lys Glu
690 695 700
Arg Asn Lys Gly Tyr Lys His His Ala Glu Asp Ala Leu Ile Ile Ala
705 710 715 720
Asn Ala Asp Phe Ile Phe Lys Glu Trp Lys Lys Leu Asp Lys Ala Lys
725 730 735
Lys Val Met Glu Asn Gln Met Phe Glu Glu Lys Gln Ala Glu Ser Met
740 745 750
Pro Glu Ile Glu Thr Glu Gln Glu Tyr Lys Glu Ile Phe Ile Thr Pro
755 760 765
His Gln Ile Lys His Ile Lys Asp Phe Lys Asp Tyr Lys Tyr Ser His
770 775 780
Arg Val Asp Lys Lys Pro Asn Arg Glu Leu Ile Asn Asp Thr Leu Tyr
785 790 795 800
Ser Thr Arg Lys Asp Asp Lys Gly Asn Thr Leu Ile Val Asn Asn Leu
805 810 815
Asn Gly Leu Tyr Asp Lys Asp Asn Asp Lys Leu Lys Lys Leu Ile Asn
820 825 830
Lys Ser Pro Glu Lys Leu Leu Met Tyr His His Asp Pro Gln Thr Tyr
835 840 845
Gln Lys Leu Lys Leu Ile Met Glu Gln Tyr Gly Asp Glu Lys Asn Pro
850 855 860
Leu Tyr Lys Tyr Tyr Glu Glu Thr Gly Asn Tyr Leu Thr Lys Tyr Ser
865 870 875 880
Lys Lys Asp Asn Gly Pro Val Ile Lys Lys Ile Lys Tyr Tyr Gly Asn
885 890 895
Lys Leu Asn Ala His Leu Asp Ile Thr Asp Asp Tyr Pro Asn Ser Arg
900 905 910
Asn Lys Val Val Lys Leu Ser Leu Lys Pro Tyr Arg Phe Asp Val Tyr
915 920 925
Leu Asp Asn Gly Val Tyr Lys Phe Val Thr Val Lys Asn Leu Asp Val
930 935 940
Ile Lys Lys Glu Asn Tyr Tyr Glu Val Asn Ser Lys Cys Tyr Glu Glu
945 950 955 960
Ala Lys Lys Leu Lys Lys Ile Ser Asn Gln Ala Glu Phe Ile Ala Ser
965 970 975
Phe Tyr Asn Asn Asp Leu Ile Lys Ile Asn Gly Glu Leu Tyr Arg Val
980 985 990
Ile Gly Val Asn Asn Asp Leu Leu Asn Arg Ile Glu Val Asn Met Ile
995 1000 1005
Asp Ile Thr Tyr Arg Glu Tyr Leu Glu Asn Met Asn Asp Lys Arg
1010 1015 1020
Pro Pro Arg Ile Ile Lys Thr Ile Ala Ser Lys Thr Gln Ser Ile
1025 1030 1035
Lys Lys Tyr Ser Thr Asp Ile Leu Gly Asn Leu Tyr Glu Val Lys
1040 1045 1050
Ser Lys Lys His Pro Gln Ile Ile Lys Lys Gly Gly Thr Gly Gly
1055 1060 1065
Pro Lys Lys Lys Arg Lys Val Gly Arg Ala Tyr Asp Leu Cys Ile
1070 1075 1080
Phe Arg Thr Asp Asp Gly Arg Gly Trp Gly Val Arg Thr Leu Glu
1085 1090 1095
Lys Ile Arg Lys Asn Ser Phe Val Met Glu Tyr Val Gly Glu Ile
1100 1105 1110
Ile Thr Ser Glu Glu Ala Glu Arg Arg Gly Gln Ile Tyr Asp Arg
1115 1120 1125
Gln Gly Ala Thr Tyr Leu Phe Asp Leu Asp Tyr Val Glu Asp Val
1130 1135 1140
Tyr Thr Val Asp Ala Ala Tyr Tyr Gly Asn Ile Ser His Phe Val
1145 1150 1155
Asn His Ser Cys Asp Pro Asn Leu Gln Val Tyr Asn Val Phe Ile
1160 1165 1170
Asp Asn Leu Asp Glu Arg Leu Pro Arg Tyr Pro Tyr Asp Val Pro
1175 1180 1185
Asp Tyr Ala
1190
<210> 2
<211> 1128
<212> PRT
<213> Artificial Sequence
<220>
<223> MeCP2 TRD dSaCas9 Fusion Protein
<400> 2
Met Ala Pro Lys Lys Lys Arg Lys Val Glu Ala Ser Lys Arg Asn Tyr
1 5 10 15
Ile Leu Gly Leu Ala Ile Gly Ile Thr Ser Val Gly Tyr Gly Ile Ile
20 25 30
Asp Tyr Glu Thr Arg Asp Val Ile Asp Ala Gly Val Arg Leu Phe Lys
35 40 45
Glu Ala Asn Val Glu Asn Asn Glu Gly Arg Arg Ser Lys Arg Gly Ala
50 55 60
Arg Arg Leu Lys Arg Arg Arg Arg His Arg Ile Gln Arg Val Lys Lys
65 70 75 80
Leu Leu Phe Asp Tyr Asn Leu Leu Thr Asp His Ser Glu Leu Ser Gly
85 90 95
Ile Asn Pro Tyr Glu Ala Arg Val Lys Gly Leu Ser Gln Lys Leu Ser
100 105 110
Glu Glu Glu Phe Ser Ala Ala Leu Leu His Leu Ala Lys Arg Arg Gly
115 120 125
Val His Asn Val Asn Glu Val Glu Glu Asp Thr Gly Asn Glu Leu Ser
130 135 140
Thr Lys Glu Gln Ile Ser Arg Asn Ser Lys Ala Leu Glu Glu Lys Tyr
145 150 155 160
Val Ala Glu Leu Gln Leu Glu Arg Leu Lys Lys Asp Gly Glu Val Arg
165 170 175
Gly Ser Ile Asn Arg Phe Lys Thr Ser Asp Tyr Val Lys Glu Ala Lys
180 185 190
Gln Leu Leu Lys Val Gln Lys Ala Tyr His Gln Leu Asp Gln Ser Phe
195 200 205
Ile Asp Thr Tyr Ile Asp Leu Leu Glu Thr Arg Arg Thr Tyr Tyr Glu
210 215 220
Gly Pro Gly Glu Gly Ser Pro Phe Gly Trp Lys Asp Ile Lys Glu Trp
225 230 235 240
Tyr Glu Met Leu Met Gly His Cys Thr Tyr Phe Pro Glu Glu Leu Arg
245 250 255
Ser Val Lys Tyr Ala Tyr Asn Ala Asp Leu Tyr Asn Ala Leu Asn Asp
260 265 270
Leu Asn Asn Leu Val Ile Thr Arg Asp Glu Asn Glu Lys Leu Glu Tyr
275 280 285
Tyr Glu Lys Phe Gln Ile Ile Glu Asn Val Phe Lys Gln Lys Lys Lys
290 295 300
Pro Thr Leu Lys Gln Ile Ala Lys Glu Ile Leu Val Asn Glu Glu Asp
305 310 315 320
Ile Lys Gly Tyr Arg Val Thr Ser Thr Gly Lys Pro Glu Phe Thr Asn
325 330 335
Leu Lys Val Tyr His Asp Ile Lys Asp Ile Thr Ala Arg Lys Glu Ile
340 345 350
Ile Glu Asn Ala Glu Leu Leu Asp Gln Ile Ala Lys Ile Leu Thr Ile
355 360 365
Tyr Gln Ser Ser Glu Asp Ile Gln Glu Glu Leu Thr Asn Leu Asn Ser
370 375 380
Glu Leu Thr Gln Glu Glu Ile Glu Gln Ile Ser Asn Leu Lys Gly Tyr
385 390 395 400
Thr Gly Thr His Asn Leu Ser Leu Lys Ala Ile Asn Leu Ile Leu Asp
405 410 415
Glu Leu Trp His Thr Asn Asp Asn Gln Ile Ala Ile Phe Asn Arg Leu
420 425 430
Lys Leu Val Pro Lys Lys Val Asp Leu Ser Gln Gln Lys Glu Ile Pro
435 440 445
Thr Thr Leu Val Asp Asp Phe Ile Leu Ser Pro Val Val Lys Arg Ser
450 455 460
Phe Ile Gln Ser Ile Lys Val Ile Asn Ala Ile Ile Lys Lys Tyr Gly
465 470 475 480
Leu Pro Asn Asp Ile Ile Ile Glu Leu Ala Arg Glu Lys Asn Ser Lys
485 490 495
Asp Ala Gln Lys Met Ile Asn Glu Met Gln Lys Arg Asn Arg Gln Thr
500 505 510
Asn Glu Arg Ile Glu Glu Ile Ile Arg Thr Thr Gly Lys Glu Asn Ala
515 520 525
Lys Tyr Leu Ile Glu Lys Ile Lys Leu His Asp Met Gln Glu Gly Lys
530 535 540
Cys Leu Tyr Ser Leu Glu Ala Ile Pro Leu Glu Asp Leu Leu Asn Asn
545 550 555 560
Pro Phe Asn Tyr Glu Val Asp His Ile Ile Pro Arg Ser Val Ser Phe
565 570 575
Asp Asn Ser Phe Asn Asn Lys Val Leu Val Lys Gln Glu Glu Ala Ser
580 585 590
Lys Lys Gly Asn Arg Thr Pro Phe Gln Tyr Leu Ser Ser Ser Asp Ser
595 600 605
Lys Ile Ser Tyr Glu Thr Phe Lys Lys His Ile Leu Asn Leu Ala Lys
610 615 620
Gly Lys Gly Arg Ile Ser Lys Thr Lys Lys Glu Tyr Leu Leu Glu Glu
625 630 635 640
Arg Asp Ile Asn Arg Phe Ser Val Gln Lys Asp Phe Ile Asn Arg Asn
645 650 655
Leu Val Asp Thr Arg Tyr Ala Thr Arg Gly Leu Met Asn Leu Leu Arg
660 665 670
Ser Tyr Phe Arg Val Asn Asn Leu Asp Val Lys Val Lys Ser Ile Asn
675 680 685
Gly Gly Phe Thr Ser Phe Leu Arg Arg Lys Trp Lys Phe Lys Lys Glu
690 695 700
Arg Asn Lys Gly Tyr Lys His His Ala Glu Asp Ala Leu Ile Ile Ala
705 710 715 720
Asn Ala Asp Phe Ile Phe Lys Glu Trp Lys Lys Leu Asp Lys Ala Lys
725 730 735
Lys Val Met Glu Asn Gln Met Phe Glu Glu Lys Gln Ala Glu Ser Met
740 745 750
Pro Glu Ile Glu Thr Glu Gln Glu Tyr Lys Glu Ile Phe Ile Thr Pro
755 760 765
His Gln Ile Lys His Ile Lys Asp Phe Lys Asp Tyr Lys Tyr Ser His
770 775 780
Arg Val Asp Lys Lys Pro Asn Arg Glu Leu Ile Asn Asp Thr Leu Tyr
785 790 795 800
Ser Thr Arg Lys Asp Asp Lys Gly Asn Thr Leu Ile Val Asn Asn Leu
805 810 815
Asn Gly Leu Tyr Asp Lys Asp Asn Asp Lys Leu Lys Lys Leu Ile Asn
820 825 830
Lys Ser Pro Glu Lys Leu Leu Met Tyr His His Asp Pro Gln Thr Tyr
835 840 845
Gln Lys Leu Lys Leu Ile Met Glu Gln Tyr Gly Asp Glu Lys Asn Pro
850 855 860
Leu Tyr Lys Tyr Tyr Glu Glu Thr Gly Asn Tyr Leu Thr Lys Tyr Ser
865 870 875 880
Lys Lys Asp Asn Gly Pro Val Ile Lys Lys Ile Lys Tyr Tyr Gly Asn
885 890 895
Lys Leu Asn Ala His Leu Asp Ile Thr Asp Asp Tyr Pro Asn Ser Arg
900 905 910
Asn Lys Val Val Lys Leu Ser Leu Lys Pro Tyr Arg Phe Asp Val Tyr
915 920 925
Leu Asp Asn Gly Val Tyr Lys Phe Val Thr Val Lys Asn Leu Asp Val
930 935 940
Ile Lys Lys Glu Asn Tyr Tyr Glu Val Asn Ser Lys Cys Tyr Glu Glu
945 950 955 960
Ala Lys Lys Leu Lys Lys Ile Ser Asn Gln Ala Glu Phe Ile Ala Ser
965 970 975
Phe Tyr Asn Asn Asp Leu Ile Lys Ile Asn Gly Glu Leu Tyr Arg Val
980 985 990
Ile Gly Val Asn Asn Asp Leu Leu Asn Arg Ile Glu Val Asn Met Ile
995 1000 1005
Asp Ile Thr Tyr Arg Glu Tyr Leu Glu Asn Met Asn Asp Lys Arg
1010 1015 1020
Pro Pro Arg Ile Ile Lys Thr Ile Ala Ser Lys Thr Gln Ser Ile
1025 1030 1035
Lys Lys Tyr Ser Thr Asp Ile Leu Gly Asn Leu Tyr Glu Val Lys
1040 1045 1050
Ser Lys Lys His Pro Gln Ile Ile Lys Lys Gly Gly Thr Gly Gly
1055 1060 1065
Pro Lys Lys Lys Arg Lys Val Gly Arg Ala Gly Arg Lys Pro Gly
1070 1075 1080
Ser Val Val Ala Ala Ala Ala Ala Glu Ala Lys Lys Lys Ala Val
1085 1090 1095
Lys Glu Ser Ser Ile Arg Ser Val Gln Glu Thr Val Leu Pro Ile
1100 1105 1110
Lys Lys Arg Lys Thr Arg Tyr Pro Tyr Asp Val Pro Asp Tyr Ala
1115 1120 1125
<210> 3
<211> 1158
<212> PRT
<213> Artificial Sequence
<220>
<223> HP1alpha chromo shadow and CTE dSaCas9 Fusion Protein
<400> 3
Met Ala Pro Lys Lys Lys Arg Lys Val Glu Ala Ser Lys Arg Asn Tyr
1 5 10 15
Ile Leu Gly Leu Ala Ile Gly Ile Thr Ser Val Gly Tyr Gly Ile Ile
20 25 30
Asp Tyr Glu Thr Arg Asp Val Ile Asp Ala Gly Val Arg Leu Phe Lys
35 40 45
Glu Ala Asn Val Glu Asn Asn Glu Gly Arg Arg Ser Lys Arg Gly Ala
50 55 60
Arg Arg Leu Lys Arg Arg Arg Arg His Arg Ile Gln Arg Val Lys Lys
65 70 75 80
Leu Leu Phe Asp Tyr Asn Leu Leu Thr Asp His Ser Glu Leu Ser Gly
85 90 95
Ile Asn Pro Tyr Glu Ala Arg Val Lys Gly Leu Ser Gln Lys Leu Ser
100 105 110
Glu Glu Glu Phe Ser Ala Ala Leu Leu His Leu Ala Lys Arg Arg Gly
115 120 125
Val His Asn Val Asn Glu Val Glu Glu Asp Thr Gly Asn Glu Leu Ser
130 135 140
Thr Lys Glu Gln Ile Ser Arg Asn Ser Lys Ala Leu Glu Glu Lys Tyr
145 150 155 160
Val Ala Glu Leu Gln Leu Glu Arg Leu Lys Lys Asp Gly Glu Val Arg
165 170 175
Gly Ser Ile Asn Arg Phe Lys Thr Ser Asp Tyr Val Lys Glu Ala Lys
180 185 190
Gln Leu Leu Lys Val Gln Lys Ala Tyr His Gln Leu Asp Gln Ser Phe
195 200 205
Ile Asp Thr Tyr Ile Asp Leu Leu Glu Thr Arg Arg Thr Tyr Tyr Glu
210 215 220
Gly Pro Gly Glu Gly Ser Pro Phe Gly Trp Lys Asp Ile Lys Glu Trp
225 230 235 240
Tyr Glu Met Leu Met Gly His Cys Thr Tyr Phe Pro Glu Glu Leu Arg
245 250 255
Ser Val Lys Tyr Ala Tyr Asn Ala Asp Leu Tyr Asn Ala Leu Asn Asp
260 265 270
Leu Asn Asn Leu Val Ile Thr Arg Asp Glu Asn Glu Lys Leu Glu Tyr
275 280 285
Tyr Glu Lys Phe Gln Ile Ile Glu Asn Val Phe Lys Gln Lys Lys Lys
290 295 300
Pro Thr Leu Lys Gln Ile Ala Lys Glu Ile Leu Val Asn Glu Glu Asp
305 310 315 320
Ile Lys Gly Tyr Arg Val Thr Ser Thr Gly Lys Pro Glu Phe Thr Asn
325 330 335
Leu Lys Val Tyr His Asp Ile Lys Asp Ile Thr Ala Arg Lys Glu Ile
340 345 350
Ile Glu Asn Ala Glu Leu Leu Asp Gln Ile Ala Lys Ile Leu Thr Ile
355 360 365
Tyr Gln Ser Ser Glu Asp Ile Gln Glu Glu Leu Thr Asn Leu Asn Ser
370 375 380
Glu Leu Thr Gln Glu Glu Ile Glu Gln Ile Ser Asn Leu Lys Gly Tyr
385 390 395 400
Thr Gly Thr His Asn Leu Ser Leu Lys Ala Ile Asn Leu Ile Leu Asp
405 410 415
Glu Leu Trp His Thr Asn Asp Asn Gln Ile Ala Ile Phe Asn Arg Leu
420 425 430
Lys Leu Val Pro Lys Lys Val Asp Leu Ser Gln Gln Lys Glu Ile Pro
435 440 445
Thr Thr Leu Val Asp Asp Phe Ile Leu Ser Pro Val Val Lys Arg Ser
450 455 460
Phe Ile Gln Ser Ile Lys Val Ile Asn Ala Ile Ile Lys Lys Tyr Gly
465 470 475 480
Leu Pro Asn Asp Ile Ile Ile Glu Leu Ala Arg Glu Lys Asn Ser Lys
485 490 495
Asp Ala Gln Lys Met Ile Asn Glu Met Gln Lys Arg Asn Arg Gln Thr
500 505 510
Asn Glu Arg Ile Glu Glu Ile Ile Arg Thr Thr Gly Lys Glu Asn Ala
515 520 525
Lys Tyr Leu Ile Glu Lys Ile Lys Leu His Asp Met Gln Glu Gly Lys
530 535 540
Cys Leu Tyr Ser Leu Glu Ala Ile Pro Leu Glu Asp Leu Leu Asn Asn
545 550 555 560
Pro Phe Asn Tyr Glu Val Asp His Ile Ile Pro Arg Ser Val Ser Phe
565 570 575
Asp Asn Ser Phe Asn Asn Lys Val Leu Val Lys Gln Glu Glu Ala Ser
580 585 590
Lys Lys Gly Asn Arg Thr Pro Phe Gln Tyr Leu Ser Ser Ser Asp Ser
595 600 605
Lys Ile Ser Tyr Glu Thr Phe Lys Lys His Ile Leu Asn Leu Ala Lys
610 615 620
Gly Lys Gly Arg Ile Ser Lys Thr Lys Lys Glu Tyr Leu Leu Glu Glu
625 630 635 640
Arg Asp Ile Asn Arg Phe Ser Val Gln Lys Asp Phe Ile Asn Arg Asn
645 650 655
Leu Val Asp Thr Arg Tyr Ala Thr Arg Gly Leu Met Asn Leu Leu Arg
660 665 670
Ser Tyr Phe Arg Val Asn Asn Leu Asp Val Lys Val Lys Ser Ile Asn
675 680 685
Gly Gly Phe Thr Ser Phe Leu Arg Arg Lys Trp Lys Phe Lys Lys Glu
690 695 700
Arg Asn Lys Gly Tyr Lys His His Ala Glu Asp Ala Leu Ile Ile Ala
705 710 715 720
Asn Ala Asp Phe Ile Phe Lys Glu Trp Lys Lys Leu Asp Lys Ala Lys
725 730 735
Lys Val Met Glu Asn Gln Met Phe Glu Glu Lys Gln Ala Glu Ser Met
740 745 750
Pro Glu Ile Glu Thr Glu Gln Glu Tyr Lys Glu Ile Phe Ile Thr Pro
755 760 765
His Gln Ile Lys His Ile Lys Asp Phe Lys Asp Tyr Lys Tyr Ser His
770 775 780
Arg Val Asp Lys Lys Pro Asn Arg Glu Leu Ile Asn Asp Thr Leu Tyr
785 790 795 800
Ser Thr Arg Lys Asp Asp Lys Gly Asn Thr Leu Ile Val Asn Asn Leu
805 810 815
Asn Gly Leu Tyr Asp Lys Asp Asn Asp Lys Leu Lys Lys Leu Ile Asn
820 825 830
Lys Ser Pro Glu Lys Leu Leu Met Tyr His His Asp Pro Gln Thr Tyr
835 840 845
Gln Lys Leu Lys Leu Ile Met Glu Gln Tyr Gly Asp Glu Lys Asn Pro
850 855 860
Leu Tyr Lys Tyr Tyr Glu Glu Thr Gly Asn Tyr Leu Thr Lys Tyr Ser
865 870 875 880
Lys Lys Asp Asn Gly Pro Val Ile Lys Lys Ile Lys Tyr Tyr Gly Asn
885 890 895
Lys Leu Asn Ala His Leu Asp Ile Thr Asp Asp Tyr Pro Asn Ser Arg
900 905 910
Asn Lys Val Val Lys Leu Ser Leu Lys Pro Tyr Arg Phe Asp Val Tyr
915 920 925
Leu Asp Asn Gly Val Tyr Lys Phe Val Thr Val Lys Asn Leu Asp Val
930 935 940
Ile Lys Lys Glu Asn Tyr Tyr Glu Val Asn Ser Lys Cys Tyr Glu Glu
945 950 955 960
Ala Lys Lys Leu Lys Lys Ile Ser Asn Gln Ala Glu Phe Ile Ala Ser
965 970 975
Phe Tyr Asn Asn Asp Leu Ile Lys Ile Asn Gly Glu Leu Tyr Arg Val
980 985 990
Ile Gly Val Asn Asn Asp Leu Leu Asn Arg Ile Glu Val Asn Met Ile
995 1000 1005
Asp Ile Thr Tyr Arg Glu Tyr Leu Glu Asn Met Asn Asp Lys Arg
1010 1015 1020
Pro Pro Arg Ile Ile Lys Thr Ile Ala Ser Lys Thr Gln Ser Ile
1025 1030 1035
Lys Lys Tyr Ser Thr Asp Ile Leu Gly Asn Leu Tyr Glu Val Lys
1040 1045 1050
Ser Lys Lys His Pro Gln Ile Ile Lys Lys Gly Gly Thr Gly Gly
1055 1060 1065
Pro Lys Lys Lys Arg Lys Val Gly Arg Ala Leu Glu Pro Glu Lys
1070 1075 1080
Ile Ile Gly Ala Thr Asp Ser Cys Gly Asp Leu Met Phe Leu Met
1085 1090 1095
Lys Trp Lys Asp Thr Asp Glu Ala Asp Leu Val Leu Ala Lys Glu
1100 1105 1110
Ala Asn Val Lys Cys Pro Gln Ile Val Ile Ala Phe Tyr Glu Glu
1115 1120 1125
Arg Leu Thr Trp His Ala Tyr Pro Glu Asp Ala Glu Asn Lys Glu
1130 1135 1140
Lys Glu Thr Ala Lys Ser Tyr Pro Tyr Asp Val Pro Asp Tyr Ala
1145 1150 1155
<210> 4
<211> 1150
<212> PRT
<213> Artificial Sequence
<220>
<223> HP1gamma chromo shadow and CTE dSaCas9 Fusion Protein
<400> 4
Met Ala Pro Lys Lys Lys Arg Lys Val Glu Ala Ser Lys Arg Asn Tyr
1 5 10 15
Ile Leu Gly Leu Ala Ile Gly Ile Thr Ser Val Gly Tyr Gly Ile Ile
20 25 30
Asp Tyr Glu Thr Arg Asp Val Ile Asp Ala Gly Val Arg Leu Phe Lys
35 40 45
Glu Ala Asn Val Glu Asn Asn Glu Gly Arg Arg Ser Lys Arg Gly Ala
50 55 60
Arg Arg Leu Lys Arg Arg Arg Arg His Arg Ile Gln Arg Val Lys Lys
65 70 75 80
Leu Leu Phe Asp Tyr Asn Leu Leu Thr Asp His Ser Glu Leu Ser Gly
85 90 95
Ile Asn Pro Tyr Glu Ala Arg Val Lys Gly Leu Ser Gln Lys Leu Ser
100 105 110
Glu Glu Glu Phe Ser Ala Ala Leu Leu His Leu Ala Lys Arg Arg Gly
115 120 125
Val His Asn Val Asn Glu Val Glu Glu Asp Thr Gly Asn Glu Leu Ser
130 135 140
Thr Lys Glu Gln Ile Ser Arg Asn Ser Lys Ala Leu Glu Glu Lys Tyr
145 150 155 160
Val Ala Glu Leu Gln Leu Glu Arg Leu Lys Lys Asp Gly Glu Val Arg
165 170 175
Gly Ser Ile Asn Arg Phe Lys Thr Ser Asp Tyr Val Lys Glu Ala Lys
180 185 190
Gln Leu Leu Lys Val Gln Lys Ala Tyr His Gln Leu Asp Gln Ser Phe
195 200 205
Ile Asp Thr Tyr Ile Asp Leu Leu Glu Thr Arg Arg Thr Tyr Tyr Glu
210 215 220
Gly Pro Gly Glu Gly Ser Pro Phe Gly Trp Lys Asp Ile Lys Glu Trp
225 230 235 240
Tyr Glu Met Leu Met Gly His Cys Thr Tyr Phe Pro Glu Glu Leu Arg
245 250 255
Ser Val Lys Tyr Ala Tyr Asn Ala Asp Leu Tyr Asn Ala Leu Asn Asp
260 265 270
Leu Asn Asn Leu Val Ile Thr Arg Asp Glu Asn Glu Lys Leu Glu Tyr
275 280 285
Tyr Glu Lys Phe Gln Ile Ile Glu Asn Val Phe Lys Gln Lys Lys Lys
290 295 300
Pro Thr Leu Lys Gln Ile Ala Lys Glu Ile Leu Val Asn Glu Glu Asp
305 310 315 320
Ile Lys Gly Tyr Arg Val Thr Ser Thr Gly Lys Pro Glu Phe Thr Asn
325 330 335
Leu Lys Val Tyr His Asp Ile Lys Asp Ile Thr Ala Arg Lys Glu Ile
340 345 350
Ile Glu Asn Ala Glu Leu Leu Asp Gln Ile Ala Lys Ile Leu Thr Ile
355 360 365
Tyr Gln Ser Ser Glu Asp Ile Gln Glu Glu Leu Thr Asn Leu Asn Ser
370 375 380
Glu Leu Thr Gln Glu Glu Ile Glu Gln Ile Ser Asn Leu Lys Gly Tyr
385 390 395 400
Thr Gly Thr His Asn Leu Ser Leu Lys Ala Ile Asn Leu Ile Leu Asp
405 410 415
Glu Leu Trp His Thr Asn Asp Asn Gln Ile Ala Ile Phe Asn Arg Leu
420 425 430
Lys Leu Val Pro Lys Lys Val Asp Leu Ser Gln Gln Lys Glu Ile Pro
435 440 445
Thr Thr Leu Val Asp Asp Phe Ile Leu Ser Pro Val Val Lys Arg Ser
450 455 460
Phe Ile Gln Ser Ile Lys Val Ile Asn Ala Ile Ile Lys Lys Tyr Gly
465 470 475 480
Leu Pro Asn Asp Ile Ile Ile Glu Leu Ala Arg Glu Lys Asn Ser Lys
485 490 495
Asp Ala Gln Lys Met Ile Asn Glu Met Gln Lys Arg Asn Arg Gln Thr
500 505 510
Asn Glu Arg Ile Glu Glu Ile Ile Arg Thr Thr Gly Lys Glu Asn Ala
515 520 525
Lys Tyr Leu Ile Glu Lys Ile Lys Leu His Asp Met Gln Glu Gly Lys
530 535 540
Cys Leu Tyr Ser Leu Glu Ala Ile Pro Leu Glu Asp Leu Leu Asn Asn
545 550 555 560
Pro Phe Asn Tyr Glu Val Asp His Ile Ile Pro Arg Ser Val Ser Phe
565 570 575
Asp Asn Ser Phe Asn Asn Lys Val Leu Val Lys Gln Glu Glu Ala Ser
580 585 590
Lys Lys Gly Asn Arg Thr Pro Phe Gln Tyr Leu Ser Ser Ser Asp Ser
595 600 605
Lys Ile Ser Tyr Glu Thr Phe Lys Lys His Ile Leu Asn Leu Ala Lys
610 615 620
Gly Lys Gly Arg Ile Ser Lys Thr Lys Lys Glu Tyr Leu Leu Glu Glu
625 630 635 640
Arg Asp Ile Asn Arg Phe Ser Val Gln Lys Asp Phe Ile Asn Arg Asn
645 650 655
Leu Val Asp Thr Arg Tyr Ala Thr Arg Gly Leu Met Asn Leu Leu Arg
660 665 670
Ser Tyr Phe Arg Val Asn Asn Leu Asp Val Lys Val Lys Ser Ile Asn
675 680 685
Gly Gly Phe Thr Ser Phe Leu Arg Arg Lys Trp Lys Phe Lys Lys Glu
690 695 700
Arg Asn Lys Gly Tyr Lys His His Ala Glu Asp Ala Leu Ile Ile Ala
705 710 715 720
Asn Ala Asp Phe Ile Phe Lys Glu Trp Lys Lys Leu Asp Lys Ala Lys
725 730 735
Lys Val Met Glu Asn Gln Met Phe Glu Glu Lys Gln Ala Glu Ser Met
740 745 750
Pro Glu Ile Glu Thr Glu Gln Glu Tyr Lys Glu Ile Phe Ile Thr Pro
755 760 765
His Gln Ile Lys His Ile Lys Asp Phe Lys Asp Tyr Lys Tyr Ser His
770 775 780
Arg Val Asp Lys Lys Pro Asn Arg Glu Leu Ile Asn Asp Thr Leu Tyr
785 790 795 800
Ser Thr Arg Lys Asp Asp Lys Gly Asn Thr Leu Ile Val Asn Asn Leu
805 810 815
Asn Gly Leu Tyr Asp Lys Asp Asn Asp Lys Leu Lys Lys Leu Ile Asn
820 825 830
Lys Ser Pro Glu Lys Leu Leu Met Tyr His His Asp Pro Gln Thr Tyr
835 840 845
Gln Lys Leu Lys Leu Ile Met Glu Gln Tyr Gly Asp Glu Lys Asn Pro
850 855 860
Leu Tyr Lys Tyr Tyr Glu Glu Thr Gly Asn Tyr Leu Thr Lys Tyr Ser
865 870 875 880
Lys Lys Asp Asn Gly Pro Val Ile Lys Lys Ile Lys Tyr Tyr Gly Asn
885 890 895
Lys Leu Asn Ala His Leu Asp Ile Thr Asp Asp Tyr Pro Asn Ser Arg
900 905 910
Asn Lys Val Val Lys Leu Ser Leu Lys Pro Tyr Arg Phe Asp Val Tyr
915 920 925
Leu Asp Asn Gly Val Tyr Lys Phe Val Thr Val Lys Asn Leu Asp Val
930 935 940
Ile Lys Lys Glu Asn Tyr Tyr Glu Val Asn Ser Lys Cys Tyr Glu Glu
945 950 955 960
Ala Lys Lys Leu Lys Lys Ile Ser Asn Gln Ala Glu Phe Ile Ala Ser
965 970 975
Phe Tyr Asn Asn Asp Leu Ile Lys Ile Asn Gly Glu Leu Tyr Arg Val
980 985 990
Ile Gly Val Asn Asn Asp Leu Leu Asn Arg Ile Glu Val Asn Met Ile
995 1000 1005
Asp Ile Thr Tyr Arg Glu Tyr Leu Glu Asn Met Asn Asp Lys Arg
1010 1015 1020
Pro Pro Arg Ile Ile Lys Thr Ile Ala Ser Lys Thr Gln Ser Ile
1025 1030 1035
Lys Lys Tyr Ser Thr Asp Ile Leu Gly Asn Leu Tyr Glu Val Lys
1040 1045 1050
Ser Lys Lys His Pro Gln Ile Ile Lys Lys Gly Gly Thr Gly Gly
1055 1060 1065
Pro Lys Lys Lys Arg Lys Val Gly Arg Ala Leu Asp Pro Glu Arg
1070 1075 1080
Ile Ile Gly Ala Thr Asp Ser Ser Gly Glu Leu Met Phe Leu Met
1085 1090 1095
Lys Trp Lys Asp Ser Asp Glu Ala Asp Leu Val Leu Ala Lys Glu
1100 1105 1110
Ala Asn Met Lys Cys Pro Gln Ile Val Ile Ala Phe Tyr Glu Glu
1115 1120 1125
Arg Leu Thr Trp His Ser Cys Pro Glu Asp Glu Ala Gln Tyr Pro
1130 1135 1140
Tyr Asp Val Pro Asp Tyr Ala
1145 1150
<210> 5
<211> 27
<212> DNA
<213> Artificial Sequence
<220>
<223> DUX4 prom
<400> 5
cggccccagg cctcgacgcc ctggggt 27
<210> 6
<211> 26
<212> DNA
<213> Artificial Sequence
<220>
<223> LAAT1
<400> 6
aggccccagg ctcgccgccc caggat 26
<210> 7
<211> 27
<212> DNA
<213> Artificial Sequence
<220>
<223> DUX4 exon 1
<400> 7
ctgtgcagcg cggcccccgg cgggggt 27
<210> 8
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> RRS1
<400> 8
ctgtagctcg gcctccggcg tgggt 25
<210> 9
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> GNAI1
<400> 9
ctgcggcgcg gccaccggcg ggagt 25
<210> 10
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> DUX4-fl-F
<400> 10
gctctgctgg aggagcttta gga 23
<210> 11
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> DUX4-fl-R
<400> 11
cgcactgctc gcaggtctgc wggt 24
<210> 12
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> DUX4-fl-nested-F
<400> 12
agctttagga cgcggggttg ggac 24
<210> 13
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> DUX4-fl-nested-R
<400> 13
gcaggtctgc wggtacctgg 20
<210> 14
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> TRIM43-F
<400> 14
acccatcact ggactggtgt 20
<210> 15
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> TRIM43-R:
<400> 15
cacatcctca aagagcctga 20
<210> 16
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> MBD3L2-F:
<400> 16
gcgttcacct cttttccaag 20
<210> 17
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> MBD3L2-R:
<400> 17
gccatgtgga tttctcgttt 20
<210> 18
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> MYH1-F:
<400> 18
acagaagcgc aatgttgaag 20
<210> 19
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> MYH1-R
<400> 19
cacctttgct tgcagtttgt 20
<210> 20
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> FRG1-F
<400> 20
tctacagaga cgtaggctgt ca 22
<210> 21
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> FRG1-R
<400> 21
cttgagcacg agcttggtag 20
<210> 22
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> FRG2-F
<400> 22
gggaaaactg caggaaaa 18
<210> 23
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> FRG2-R
<400> 23
ctggacagtt ccctgctgtg t 21
<210> 24
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> LAAT1-F
<400> 24
tctgctttgc tgcatctacc 20
<210> 25
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> LAAT1-R
<400> 25
agtacagcgt cagcatcacc 20
<210> 26
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> RRS1-F
<400> 26
cacaaccgag actttggaga 20
<210> 27
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> RRS1-R
<400> 27
tcccgctctg atacacaaac 20
<210> 28
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> GNAI1-F
<400> 28
catcccgact caacaagatg 20
<210> 29
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> GNAI1-R
<400> 29
tgcattcggt tcatttcttc 20
<210> 30
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> DUX4 prom-F
<400> 30
cctgttgctc acgtctctcc 20
<210> 31
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> DUX4 prom-R
<400> 31
gtggggagtc tgcagtgtg 19
<210> 32
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> DUX4 TSS-F
<400> 32
gacaccctcg gacagcac 18
<210> 33
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> DUX4 TSS-R
<400> 33
gtacgggttc cgctcaaag 19
<210> 34
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> DUX4 exon3-F
<400> 34
ctgacgtgca agggagct 18
<210> 35
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> DUX4 exon3-R
<400> 35
caggtttgcc tagacagcg 19
<210> 36
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> 4-spec D4Z4-F
<400> 36
tctgctggag gagctttag 19
<210> 37
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> 4-spec D4Z4-R
<400> 37
gaatggcagt tctccgcg 18
<210> 38
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> sgRNA-1
<400> 38
cggccccagg cctcgacgcc c 21
<210> 39
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> sgRNA-2
<400> 39
tcgacgccct ggggtccctt c 21
<210> 40
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> sgRNA-3
<400> 40
tccgcgggga gggtgctgtc c 21
<210> 41
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> sgRNA-4
<400> 41
gccagctgag gcagcaccgg c 21
<210> 42
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> sgRNA-5
<400> 42
ctgtgcagcg cggcccccgg c 21
<210> 43
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> sgRNA-6
<400> 43
tcatccagca gcaggccgca g 21
<210> 44
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> bGH-F
<400> 44
tctagttgcc agccatctgt tgt 23
<210> 45
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> bGH-R
<400> 45
tgggagtggc accttcca 18
<210> 46
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<223> Rosa26-F
<400> 46
caataccttt ctgggagttc tctgctgc 28
<210> 47
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Rosa26-R
<400> 47
tgcaggacaa cgcccacaca cc 22
<210> 48
<211> 4388
<212> DNA
<213> Artificial Sequence
<220>
<223> AIO CLH-17v2 (mouse CKM-TRD)
<220>
<221> misc_feature
<222> (4263)..(4283)
<223> n is a, c, g, or t
<400> 48
acgcgtgata tcggacaccc gagatgcctg gttataatta acccagacat gtggctgccc 60
cccccaacac ctgctgcgag ctctaaaaat aaccctggga cacccgagat gcctggttat 120
aattaaccca gacatgtggc tgcccccccc aacacctgct gcgagctcta aaaataaccc 180
tgggacaccc gagatgcctg gttataatta acccagacat gtggctgccc cccccaacac 240
ctgctgcgag ctctaaaaat aacccctccc tggggacagc ccctcctggc tagtcacacc 300
ctgtaggctc ctctatataa cccaggggca caggggctgc cctcattcta ccaccacctc 360
cacagcacag acagacactc aggagccagc cagcgccacc atggccccca agaagaagag 420
gaaggtggag gccagcaagc ggaactacat cctgggcctg gccatcggca tcaccagcgt 480
gggctacggc atcatcgact acgagacccg ggacgtgatc gacgccggcg tgcggctgtt 540
caaggaggcc aacgtggaga acaacgaggg caggcggagc aagagaggcg ccagaaggct 600
gaagcggcgg aggcggcaca gaatccagag agtgaagaag ctgctgttcg actacaacct 660
gctgaccgac cacagcgagc tgagcggcat caacccctac gaggccagag tgaagggcct 720
gagccagaag ctgagcgagg aggagttcag cgccgccctg ctgcacctgg ccaagagaag 780
aggcgtgcac aacgtgaacg aggtggagga ggacaccggc aacgagctgt ccaccaagga 840
gcagatcagc cggaacagca aggccctgga ggagaagtac gtggccgagc tgcagctgga 900
gcggctgaag aaggacggcg aggtgcgggg cagcatcaac agattcaaga ccagcgacta 960
cgtgaaggag gccaagcagc tgctgaaggt gcagaaggcc taccaccagc tggaccagag 1020
cttcatcgac acctacatcg acctgctgga gacccggcgg acctactacg agggccccgg 1080
cgagggcagc cccttcggct ggaaggacat caaggagtgg tacgagatgc tgatgggcca 1140
ctgcacctac ttccccgagg agctgcggag cgtgaagtac gcctacaacg ccgacctgta 1200
caacgccctg aacgacctga acaacctggt gatcaccagg gacgagaacg agaagctgga 1260
gtactacgag aagttccaga tcatcgagaa cgtgttcaag cagaagaaga agcccaccct 1320
gaagcagatc gccaaggaga tcctggtgaa cgaggaggac atcaagggct acagagtgac 1380
cagcaccggc aagcccgagt tcaccaacct gaaggtgtac cacgacatca aggacatcac 1440
cgcccggaag gagatcatcg agaacgccga gctgctggac cagatcgcca agatcctgac 1500
catctaccag agcagcgagg acatccagga ggagctgacc aacctgaact ccgagctgac 1560
ccaggaggag atcgagcaga tcagcaacct gaagggctac accggcaccc acaacctgag 1620
cctgaaggcc atcaacctga tcctggacga gctgtggcac accaacgaca accagatcgc 1680
catcttcaac cggctgaagc tggtgcccaa gaaggtggac ctgtcccagc agaaggagat 1740
ccccaccacc ctggtggacg acttcatcct gagccccgtg gtgaagagaa gcttcatcca 1800
gagcatcaag gtgatcaacg ccatcatcaa gaagtacggc ctgcccaacg acatcatcat 1860
cgagctggcc cgggagaaga actccaagga cgcccagaag atgatcaacg agatgcagaa 1920
gcggaaccgg cagaccaacg agcggatcga ggagatcatc cggaccaccg gcaaggagaa 1980
cgccaagtac ctgatcgaga agatcaagct gcacgacatg caggagggca agtgcctgta 2040
cagcctggag gccatccccc tggaggacct gctgaacaac cccttcaact acgaggtgga 2100
ccacatcatc cccagaagcg tgtccttcga caacagcttc aacaacaagg tgctggtgaa 2160
gcaggaggag gccagcaaga agggcaaccg gacccccttc cagtacctga gcagcagcga 2220
cagcaagatc agctacgaga ccttcaagaa gcacatcctg aacctggcca agggcaaggg 2280
cagaatcagc aagaccaaga aggagtacct gctggaggag cgggacatca acaggttctc 2340
cgtgcagaag gacttcatca accggaacct ggtggacacc agatacgcca ccagaggcct 2400
gatgaacctg ctgcggagct acttcagagt gaacaacctg gacgtgaagg tgaagtccat 2460
caacggcggc ttcaccagct tcctgcggcg gaagtggaag ttcaagaagg agcggaacaa 2520
gggctacaag caccacgccg aggacgccct gatcatcgcc aacgccgact tcatcttcaa 2580
ggagtggaag aagctggaca aggccaagaa ggtgatggag aaccagatgt tcgaggagaa 2640
gcaggccgag agcatgcccg agatcgagac cgagcaggag tacaaggaga tcttcatcac 2700
cccccaccag atcaagcaca tcaaggactt caaggactac aagtacagcc accgggtgga 2760
caagaagccc aacagagagc tgatcaacga caccctgtac tccacccgga aggacgacaa 2820
gggcaacacc ctgatcgtga acaacctgaa cggcctgtac gacaaggaca acgacaagct 2880
gaagaagctg atcaacaaga gccccgagaa gctgctgatg taccaccacg acccccagac 2940
ctaccagaag ctgaagctga tcatggagca gtacggcgac gagaagaacc ccctgtacaa 3000
gtactacgag gagaccggca actacctgac caagtactcc aagaaggaca acggccccgt 3060
gatcaagaag atcaagtact acggcaacaa gctgaacgcc cacctggaca tcaccgacga 3120
ctaccccaac agcagaaaca aggtggtgaa gctgtccctg aagccctaca gattcgacgt 3180
gtacctggac aacggcgtgt acaagttcgt gaccgtgaag aacctggacg tgatcaagaa 3240
ggagaactac tacgaggtga acagcaagtg ctacgaggag gccaagaagc tgaagaagat 3300
cagcaaccag gccgagttca tcgcctcctt ctacaacaac gacctgatca agatcaacgg 3360
cgagctgtac agagtgatcg gcgtgaacaa cgacctgctg aaccggatcg aggtgaacat 3420
gatcgacatc acctaccgcg agtacctgga gaacatgaac gacaagaggc cccccaggat 3480
catcaagacc atcgcctcca agacccagag catcaagaag tacagcaccg acatcctggg 3540
caacctgtac gaggtgaagt ccaagaagca cccccagatc atcaagaagg gcggcaccgg 3600
cggccccaag aagaagagga aggtgggccg ggccggccgg aagcccggca gcgtggtggc 3660
cgccgccgcc gccgaggcca agaagaaggc cgtgaaggag agcagcatcc ggagcgtgca 3720
ggagaccgtg ctgcccatca agaagcggaa gaccagatac ccctacgacg tgcccgacta 3780
cgcctgatat ttgtgaaatt tgtgatgcta ttgctttatt tgtaaccatc tagctttatt 3840
tgtgaaattt gtgatgctat tgctttattt gtaaccattt tatttgtgaa atttgtgatg 3900
ctattgcttt atttgtaacc attataagct gcaataaaca agttaacaac aacaattgca 3960
ttcattttat gtttcaggtt cagggggaga tgtgggaggt tttttaaagc gggagggcct 4020
atttcccatg attccttcat atttgcatat acgatacaag gctgttagag agataattag 4080
aattaatttg actgtaaaca caaagatatt agtacaaaat acgtgacgta gaaagtaata 4140
atttcttggg tagtttgcag ttttaaaatt atgttttaaa atggactatc atatgcttac 4200
cgtaacttga aagtatttcg atttcttggc tttatatatc ttgtggaaag gacgaaacac 4260
cgnnnnnnnn nnnnnnnnnn nnngtttaag tactctgtgc tggaaacagc acagaatcta 4320
cttaaacaag gcaaaatgcc gtgtttatct cgtcaacttg ttggcgagat ttttttggta 4380
ccggaccg 4388
<210> 49
<211> 4385
<212> DNA
<213> Artificial Sequence
<220>
<223> AIO CLH-17v2 (human CKM-TRD)
<220>
<221> misc_feature
<222> (4260)..(4280)
<223> n is a, c, g, or t
<400> 49
acgcgtgata tcggacaccc gagacgcccg gttataatta accaggacac gtggcgaccc 60
cccccaacac ctgcccgacc tctaaaaata actcctggac acccgagacg cccggttata 120
attaaccagg acacgtggcg acccccccca acacctgccc gacctctaaa aataactcct 180
ggacacccga gacgcccggt tataattaac caggacacgt ggcgaccccc cccaacacct 240
gcccgacctc taaaaataac ccctccctgg ggacaacccc tcccagccaa tagcacagcc 300
taggtccccc tatataaggc cacggctgct ggcccttcct cattctcagt gtcacctcca 360
ggatacagac agcccccctt cagcccagcc cgccaccatg gcccccaaga agaagaggaa 420
ggtggaggcc agcaagcgga actacatcct gggcctggcc atcggcatca ccagcgtggg 480
ctacggcatc atcgactacg agacccggga cgtgatcgac gccggcgtgc ggctgttcaa 540
ggaggccaac gtggagaaca acgagggcag gcggagcaag agaggcgcca gaaggctgaa 600
gcggcggagg cggcacagaa tccagagagt gaagaagctg ctgttcgact acaacctgct 660
gaccgaccac agcgagctga gcggcatcaa cccctacgag gccagagtga agggcctgag 720
ccagaagctg agcgaggagg agttcagcgc cgccctgctg cacctggcca agagaagagg 780
cgtgcacaac gtgaacgagg tggaggagga caccggcaac gagctgtcca ccaaggagca 840
gatcagccgg aacagcaagg ccctggagga gaagtacgtg gccgagctgc agctggagcg 900
gctgaagaag gacggcgagg tgcggggcag catcaacaga ttcaagacca gcgactacgt 960
gaaggaggcc aagcagctgc tgaaggtgca gaaggcctac caccagctgg accagagctt 1020
catcgacacc tacatcgacc tgctggagac ccggcggacc tactacgagg gccccggcga 1080
gggcagcccc ttcggctgga aggacatcaa ggagtggtac gagatgctga tgggccactg 1140
cacctacttc cccgaggagc tgcggagcgt gaagtacgcc tacaacgccg acctgtacaa 1200
cgccctgaac gacctgaaca acctggtgat caccagggac gagaacgaga agctggagta 1260
ctacgagaag ttccagatca tcgagaacgt gttcaagcag aagaagaagc ccaccctgaa 1320
gcagatcgcc aaggagatcc tggtgaacga ggaggacatc aagggctaca gagtgaccag 1380
caccggcaag cccgagttca ccaacctgaa ggtgtaccac gacatcaagg acatcaccgc 1440
ccggaaggag atcatcgaga acgccgagct gctggaccag atcgccaaga tcctgaccat 1500
ctaccagagc agcgaggaca tccaggagga gctgaccaac ctgaactccg agctgaccca 1560
ggaggagatc gagcagatca gcaacctgaa gggctacacc ggcacccaca acctgagcct 1620
gaaggccatc aacctgatcc tggacgagct gtggcacacc aacgacaacc agatcgccat 1680
cttcaaccgg ctgaagctgg tgcccaagaa ggtggacctg tcccagcaga aggagatccc 1740
caccaccctg gtggacgact tcatcctgag ccccgtggtg aagagaagct tcatccagag 1800
catcaaggtg atcaacgcca tcatcaagaa gtacggcctg cccaacgaca tcatcatcga 1860
gctggcccgg gagaagaact ccaaggacgc ccagaagatg atcaacgaga tgcagaagcg 1920
gaaccggcag accaacgagc ggatcgagga gatcatccgg accaccggca aggagaacgc 1980
caagtacctg atcgagaaga tcaagctgca cgacatgcag gagggcaagt gcctgtacag 2040
cctggaggcc atccccctgg aggacctgct gaacaacccc ttcaactacg aggtggacca 2100
catcatcccc agaagcgtgt ccttcgacaa cagcttcaac aacaaggtgc tggtgaagca 2160
ggaggaggcc agcaagaagg gcaaccggac ccccttccag tacctgagca gcagcgacag 2220
caagatcagc tacgagacct tcaagaagca catcctgaac ctggccaagg gcaagggcag 2280
aatcagcaag accaagaagg agtacctgct ggaggagcgg gacatcaaca ggttctccgt 2340
gcagaaggac ttcatcaacc ggaacctggt ggacaccaga tacgccacca gaggcctgat 2400
gaacctgctg cggagctact tcagagtgaa caacctggac gtgaaggtga agtccatcaa 2460
cggcggcttc accagcttcc tgcggcggaa gtggaagttc aagaaggagc ggaacaaggg 2520
ctacaagcac cacgccgagg acgccctgat catcgccaac gccgacttca tcttcaagga 2580
gtggaagaag ctggacaagg ccaagaaggt gatggagaac cagatgttcg aggagaagca 2640
ggccgagagc atgcccgaga tcgagaccga gcaggagtac aaggagatct tcatcacccc 2700
ccaccagatc aagcacatca aggacttcaa ggactacaag tacagccacc gggtggacaa 2760
gaagcccaac agagagctga tcaacgacac cctgtactcc acccggaagg acgacaaggg 2820
caacaccctg atcgtgaaca acctgaacgg cctgtacgac aaggacaacg acaagctgaa 2880
gaagctgatc aacaagagcc ccgagaagct gctgatgtac caccacgacc cccagaccta 2940
ccagaagctg aagctgatca tggagcagta cggcgacgag aagaaccccc tgtacaagta 3000
ctacgaggag accggcaact acctgaccaa gtactccaag aaggacaacg gccccgtgat 3060
caagaagatc aagtactacg gcaacaagct gaacgcccac ctggacatca ccgacgacta 3120
ccccaacagc agaaacaagg tggtgaagct gtccctgaag ccctacagat tcgacgtgta 3180
cctggacaac ggcgtgtaca agttcgtgac cgtgaagaac ctggacgtga tcaagaagga 3240
gaactactac gaggtgaaca gcaagtgcta cgaggaggcc aagaagctga agaagatcag 3300
caaccaggcc gagttcatcg cctccttcta caacaacgac ctgatcaaga tcaacggcga 3360
gctgtacaga gtgatcggcg tgaacaacga cctgctgaac cggatcgagg tgaacatgat 3420
cgacatcacc taccgcgagt acctggagaa catgaacgac aagaggcccc ccaggatcat 3480
caagaccatc gcctccaaga cccagagcat caagaagtac agcaccgaca tcctgggcaa 3540
cctgtacgag gtgaagtcca agaagcaccc ccagatcatc aagaagggcg gcaccggcgg 3600
ccccaagaag aagaggaagg tgggccgggc cggccggaag cccggcagcg tggtggccgc 3660
cgccgccgcc gaggccaaga agaaggccgt gaaggagagc agcatccgga gcgtgcagga 3720
gaccgtgctg cccatcaaga agcggaagac cagatacccc tacgacgtgc ccgactacgc 3780
ctgatatttg tgaaatttgt gatgctattg ctttatttgt aaccatctag ctttatttgt 3840
gaaatttgtg atgctattgc tttatttgta accattttat ttgtgaaatt tgtgatgcta 3900
ttgctttatt tgtaaccatt ataagctgca ataaacaagt taacaacaac aattgcattc 3960
attttatgtt tcaggttcag ggggagatgt gggaggtttt ttaaagcggg agggcctatt 4020
tcccatgatt ccttcatatt tgcatatacg atacaaggct gttagagaga taattagaat 4080
taatttgact gtaaacacaa agatattagt acaaaatacg tgacgtagaa agtaataatt 4140
tcttgggtag tttgcagttt taaaattatg ttttaaaatg gactatcata tgcttaccgt 4200
aacttgaaag tatttcgatt tcttggcttt atatatcttg tggaaaggac gaaacaccgn 4260
nnnnnnnnnn nnnnnnnnnn gtttaagtac tctgtgctgg aaacagcaca gaatctactt 4320
aaacaaggca aaatgccgtg tttatctcgt caacttgttg gcgagatttt tttggtaccg 4380
gaccg 4385
<210> 50
<211> 4478
<212> DNA
<213> Artificial Sequence
<220>
<223> AIO CLH-22 (mouse CKM-HP1alpha)
<220>
<221> misc_feature
<222> (4353)..(4373)
<223> n is a, c, g, or t
<400> 50
acgcgtgata tcggacaccc gagatgcctg gttataatta acccagacat gtggctgccc 60
cccccaacac ctgctgcgag ctctaaaaat aaccctggga cacccgagat gcctggttat 120
aattaaccca gacatgtggc tgcccccccc aacacctgct gcgagctcta aaaataaccc 180
tgggacaccc gagatgcctg gttataatta acccagacat gtggctgccc cccccaacac 240
ctgctgcgag ctctaaaaat aacccctccc tggggacagc ccctcctggc tagtcacacc 300
ctgtaggctc ctctatataa cccaggggca caggggctgc cctcattcta ccaccacctc 360
cacagcacag acagacactc aggagccagc cagcgccacc atggccccca agaagaagag 420
gaaggtggag gccagcaagc ggaactacat cctgggcctg gccatcggca tcaccagcgt 480
gggctacggc atcatcgact acgagacccg ggacgtgatc gacgccggcg tgcggctgtt 540
caaggaggcc aacgtggaga acaacgaggg caggcggagc aagagaggcg ccagaaggct 600
gaagcggcgg aggcggcaca gaatccagag agtgaagaag ctgctgttcg actacaacct 660
gctgaccgac cacagcgagc tgagcggcat caacccctac gaggccagag tgaagggcct 720
gagccagaag ctgagcgagg aggagttcag cgccgccctg ctgcacctgg ccaagagaag 780
aggcgtgcac aacgtgaacg aggtggagga ggacaccggc aacgagctgt ccaccaagga 840
gcagatcagc cggaacagca aggccctgga ggagaagtac gtggccgagc tgcagctgga 900
gcggctgaag aaggacggcg aggtgcgggg cagcatcaac agattcaaga ccagcgacta 960
cgtgaaggag gccaagcagc tgctgaaggt gcagaaggcc taccaccagc tggaccagag 1020
cttcatcgac acctacatcg acctgctgga gacccggcgg acctactacg agggccccgg 1080
cgagggcagc cccttcggct ggaaggacat caaggagtgg tacgagatgc tgatgggcca 1140
ctgcacctac ttccccgagg agctgcggag cgtgaagtac gcctacaacg ccgacctgta 1200
caacgccctg aacgacctga acaacctggt gatcaccagg gacgagaacg agaagctgga 1260
gtactacgag aagttccaga tcatcgagaa cgtgttcaag cagaagaaga agcccaccct 1320
gaagcagatc gccaaggaga tcctggtgaa cgaggaggac atcaagggct acagagtgac 1380
cagcaccggc aagcccgagt tcaccaacct gaaggtgtac cacgacatca aggacatcac 1440
cgcccggaag gagatcatcg agaacgccga gctgctggac cagatcgcca agatcctgac 1500
catctaccag agcagcgagg acatccagga ggagctgacc aacctgaact ccgagctgac 1560
ccaggaggag atcgagcaga tcagcaacct gaagggctac accggcaccc acaacctgag 1620
cctgaaggcc atcaacctga tcctggacga gctgtggcac accaacgaca accagatcgc 1680
catcttcaac cggctgaagc tggtgcccaa gaaggtggac ctgtcccagc agaaggagat 1740
ccccaccacc ctggtggacg acttcatcct gagccccgtg gtgaagagaa gcttcatcca 1800
gagcatcaag gtgatcaacg ccatcatcaa gaagtacggc ctgcccaacg acatcatcat 1860
cgagctggcc cgggagaaga actccaagga cgcccagaag atgatcaacg agatgcagaa 1920
gcggaaccgg cagaccaacg agcggatcga ggagatcatc cggaccaccg gcaaggagaa 1980
cgccaagtac ctgatcgaga agatcaagct gcacgacatg caggagggca agtgcctgta 2040
cagcctggag gccatccccc tggaggacct gctgaacaac cccttcaact acgaggtgga 2100
ccacatcatc cccagaagcg tgtccttcga caacagcttc aacaacaagg tgctggtgaa 2160
gcaggaggag gccagcaaga agggcaaccg gacccccttc cagtacctga gcagcagcga 2220
cagcaagatc agctacgaga ccttcaagaa gcacatcctg aacctggcca agggcaaggg 2280
cagaatcagc aagaccaaga aggagtacct gctggaggag cgggacatca acaggttctc 2340
cgtgcagaag gacttcatca accggaacct ggtggacacc agatacgcca ccagaggcct 2400
gatgaacctg ctgcggagct acttcagagt gaacaacctg gacgtgaagg tgaagtccat 2460
caacggcggc ttcaccagct tcctgcggcg gaagtggaag ttcaagaagg agcggaacaa 2520
gggctacaag caccacgccg aggacgccct gatcatcgcc aacgccgact tcatcttcaa 2580
ggagtggaag aagctggaca aggccaagaa ggtgatggag aaccagatgt tcgaggagaa 2640
gcaggccgag agcatgcccg agatcgagac cgagcaggag tacaaggaga tcttcatcac 2700
cccccaccag atcaagcaca tcaaggactt caaggactac aagtacagcc accgggtgga 2760
caagaagccc aacagagagc tgatcaacga caccctgtac tccacccgga aggacgacaa 2820
gggcaacacc ctgatcgtga acaacctgaa cggcctgtac gacaaggaca acgacaagct 2880
gaagaagctg atcaacaaga gccccgagaa gctgctgatg taccaccacg acccccagac 2940
ctaccagaag ctgaagctga tcatggagca gtacggcgac gagaagaacc ccctgtacaa 3000
gtactacgag gagaccggca actacctgac caagtactcc aagaaggaca acggccccgt 3060
gatcaagaag atcaagtact acggcaacaa gctgaacgcc cacctggaca tcaccgacga 3120
ctaccccaac agcagaaaca aggtggtgaa gctgtccctg aagccctaca gattcgacgt 3180
gtacctggac aacggcgtgt acaagttcgt gaccgtgaag aacctggacg tgatcaagaa 3240
ggagaactac tacgaggtga acagcaagtg ctacgaggag gccaagaagc tgaagaagat 3300
cagcaaccag gccgagttca tcgcctcctt ctacaacaac gacctgatca agatcaacgg 3360
cgagctgtac agagtgatcg gcgtgaacaa cgacctgctg aaccggatcg aggtgaacat 3420
gatcgacatc acctaccgcg agtacctgga gaacatgaac gacaagaggc cccccaggat 3480
catcaagacc atcgcctcca agacccagag catcaagaag tacagcaccg acatcctggg 3540
caacctgtac gaggtgaagt ccaagaagca cccccagatc atcaagaagg gcggcaccgg 3600
cggccccaag aagaagagga aggtgggccg ggccctggag cccgagaaga tcatcggcgc 3660
caccgactcc tgcggcgacc tgatgttcct gatgaagtgg aaggacaccg acgaggccga 3720
cctggtgctg gccaaggagg ccaacgtgaa gtgcccccag atcgtgatcg ccttctacga 3780
ggagcggctg acctggcacg cctaccccga ggacgccgag aacaaggaga aggagaccgc 3840
caagagctac ccctacgacg tgcccgacta cgcctgatat ttgtgaaatt tgtgatgcta 3900
ttgctttatt tgtaaccatc tagctttatt tgtgaaattt gtgatgctat tgctttattt 3960
gtaaccattt tatttgtgaa atttgtgatg ctattgcttt atttgtaacc attataagct 4020
gcaataaaca agttaacaac aacaattgca ttcattttat gtttcaggtt cagggggaga 4080
tgtgggaggt tttttaaagc gggagggcct atttcccatg attccttcat atttgcatat 4140
acgatacaag gctgttagag agataattag aattaatttg actgtaaaca caaagatatt 4200
agtacaaaat acgtgacgta gaaagtaata atttcttggg tagtttgcag ttttaaaatt 4260
atgttttaaa atggactatc atatgcttac cgtaacttga aagtatttcg atttcttggc 4320
tttatatatc ttgtggaaag gacgaaacac cgnnnnnnnn nnnnnnnnnn nnngtttaag 4380
tactctgtgc tggaaacagc acagaatcta cttaaacaag gcaaaatgcc gtgtttatct 4440
cgtcaacttg ttggcgagat ttttttggta ccggaccg 4478
<210> 51
<211> 4475
<212> DNA
<213> Artificial Sequence
<220>
<223> AIO CLH-22 (human CKM-HP1alpha)
<220>
<221> misc_feature
<222> (4350)..(4370)
<223> n is a, c, g, or t
<400> 51
acgcgtgata tcggacaccc gagacgcccg gttataatta accaggacac gtggcgaccc 60
cccccaacac ctgcccgacc tctaaaaata actcctggac acccgagacg cccggttata 120
attaaccagg acacgtggcg acccccccca acacctgccc gacctctaaa aataactcct 180
ggacacccga gacgcccggt tataattaac caggacacgt ggcgaccccc cccaacacct 240
gcccgacctc taaaaataac ccctccctgg ggacaacccc tcccagccaa tagcacagcc 300
taggtccccc tatataaggc cacggctgct ggcccttcct cattctcagt gtcacctcca 360
ggatacagac agcccccctt cagcccagcc cgccaccatg gcccccaaga agaagaggaa 420
ggtggaggcc agcaagcgga actacatcct gggcctggcc atcggcatca ccagcgtggg 480
ctacggcatc atcgactacg agacccggga cgtgatcgac gccggcgtgc ggctgttcaa 540
ggaggccaac gtggagaaca acgagggcag gcggagcaag agaggcgcca gaaggctgaa 600
gcggcggagg cggcacagaa tccagagagt gaagaagctg ctgttcgact acaacctgct 660
gaccgaccac agcgagctga gcggcatcaa cccctacgag gccagagtga agggcctgag 720
ccagaagctg agcgaggagg agttcagcgc cgccctgctg cacctggcca agagaagagg 780
cgtgcacaac gtgaacgagg tggaggagga caccggcaac gagctgtcca ccaaggagca 840
gatcagccgg aacagcaagg ccctggagga gaagtacgtg gccgagctgc agctggagcg 900
gctgaagaag gacggcgagg tgcggggcag catcaacaga ttcaagacca gcgactacgt 960
gaaggaggcc aagcagctgc tgaaggtgca gaaggcctac caccagctgg accagagctt 1020
catcgacacc tacatcgacc tgctggagac ccggcggacc tactacgagg gccccggcga 1080
gggcagcccc ttcggctgga aggacatcaa ggagtggtac gagatgctga tgggccactg 1140
cacctacttc cccgaggagc tgcggagcgt gaagtacgcc tacaacgccg acctgtacaa 1200
cgccctgaac gacctgaaca acctggtgat caccagggac gagaacgaga agctggagta 1260
ctacgagaag ttccagatca tcgagaacgt gttcaagcag aagaagaagc ccaccctgaa 1320
gcagatcgcc aaggagatcc tggtgaacga ggaggacatc aagggctaca gagtgaccag 1380
caccggcaag cccgagttca ccaacctgaa ggtgtaccac gacatcaagg acatcaccgc 1440
ccggaaggag atcatcgaga acgccgagct gctggaccag atcgccaaga tcctgaccat 1500
ctaccagagc agcgaggaca tccaggagga gctgaccaac ctgaactccg agctgaccca 1560
ggaggagatc gagcagatca gcaacctgaa gggctacacc ggcacccaca acctgagcct 1620
gaaggccatc aacctgatcc tggacgagct gtggcacacc aacgacaacc agatcgccat 1680
cttcaaccgg ctgaagctgg tgcccaagaa ggtggacctg tcccagcaga aggagatccc 1740
caccaccctg gtggacgact tcatcctgag ccccgtggtg aagagaagct tcatccagag 1800
catcaaggtg atcaacgcca tcatcaagaa gtacggcctg cccaacgaca tcatcatcga 1860
gctggcccgg gagaagaact ccaaggacgc ccagaagatg atcaacgaga tgcagaagcg 1920
gaaccggcag accaacgagc ggatcgagga gatcatccgg accaccggca aggagaacgc 1980
caagtacctg atcgagaaga tcaagctgca cgacatgcag gagggcaagt gcctgtacag 2040
cctggaggcc atccccctgg aggacctgct gaacaacccc ttcaactacg aggtggacca 2100
catcatcccc agaagcgtgt ccttcgacaa cagcttcaac aacaaggtgc tggtgaagca 2160
ggaggaggcc agcaagaagg gcaaccggac ccccttccag tacctgagca gcagcgacag 2220
caagatcagc tacgagacct tcaagaagca catcctgaac ctggccaagg gcaagggcag 2280
aatcagcaag accaagaagg agtacctgct ggaggagcgg gacatcaaca ggttctccgt 2340
gcagaaggac ttcatcaacc ggaacctggt ggacaccaga tacgccacca gaggcctgat 2400
gaacctgctg cggagctact tcagagtgaa caacctggac gtgaaggtga agtccatcaa 2460
cggcggcttc accagcttcc tgcggcggaa gtggaagttc aagaaggagc ggaacaaggg 2520
ctacaagcac cacgccgagg acgccctgat catcgccaac gccgacttca tcttcaagga 2580
gtggaagaag ctggacaagg ccaagaaggt gatggagaac cagatgttcg aggagaagca 2640
ggccgagagc atgcccgaga tcgagaccga gcaggagtac aaggagatct tcatcacccc 2700
ccaccagatc aagcacatca aggacttcaa ggactacaag tacagccacc gggtggacaa 2760
gaagcccaac agagagctga tcaacgacac cctgtactcc acccggaagg acgacaaggg 2820
caacaccctg atcgtgaaca acctgaacgg cctgtacgac aaggacaacg acaagctgaa 2880
gaagctgatc aacaagagcc ccgagaagct gctgatgtac caccacgacc cccagaccta 2940
ccagaagctg aagctgatca tggagcagta cggcgacgag aagaaccccc tgtacaagta 3000
ctacgaggag accggcaact acctgaccaa gtactccaag aaggacaacg gccccgtgat 3060
caagaagatc aagtactacg gcaacaagct gaacgcccac ctggacatca ccgacgacta 3120
ccccaacagc agaaacaagg tggtgaagct gtccctgaag ccctacagat tcgacgtgta 3180
cctggacaac ggcgtgtaca agttcgtgac cgtgaagaac ctggacgtga tcaagaagga 3240
gaactactac gaggtgaaca gcaagtgcta cgaggaggcc aagaagctga agaagatcag 3300
caaccaggcc gagttcatcg cctccttcta caacaacgac ctgatcaaga tcaacggcga 3360
gctgtacaga gtgatcggcg tgaacaacga cctgctgaac cggatcgagg tgaacatgat 3420
cgacatcacc taccgcgagt acctggagaa catgaacgac aagaggcccc ccaggatcat 3480
caagaccatc gcctccaaga cccagagcat caagaagtac agcaccgaca tcctgggcaa 3540
cctgtacgag gtgaagtcca agaagcaccc ccagatcatc aagaagggcg gcaccggcgg 3600
ccccaagaag aagaggaagg tgggccgggc cctggagccc gagaagatca tcggcgccac 3660
cgactcctgc ggcgacctga tgttcctgat gaagtggaag gacaccgacg aggccgacct 3720
ggtgctggcc aaggaggcca acgtgaagtg cccccagatc gtgatcgcct tctacgagga 3780
gcggctgacc tggcacgcct accccgagga cgccgagaac aaggagaagg agaccgccaa 3840
gagctacccc tacgacgtgc ccgactacgc ctgatatttg tgaaatttgt gatgctattg 3900
ctttatttgt aaccatctag ctttatttgt gaaatttgtg atgctattgc tttatttgta 3960
accattttat ttgtgaaatt tgtgatgcta ttgctttatt tgtaaccatt ataagctgca 4020
ataaacaagt taacaacaac aattgcattc attttatgtt tcaggttcag ggggagatgt 4080
gggaggtttt ttaaagcggg agggcctatt tcccatgatt ccttcatatt tgcatatacg 4140
atacaaggct gttagagaga taattagaat taatttgact gtaaacacaa agatattagt 4200
acaaaatacg tgacgtagaa agtaataatt tcttgggtag tttgcagttt taaaattatg 4260
ttttaaaatg gactatcata tgcttaccgt aacttgaaag tatttcgatt tcttggcttt 4320
atatatcttg tggaaaggac gaaacaccgn nnnnnnnnnn nnnnnnnnnn gtttaagtac 4380
tctgtgctgg aaacagcaca gaatctactt aaacaaggca aaatgccgtg tttatctcgt 4440
caacttgttg gcgagatttt tttggtaccg gaccg 4475
<210> 52
<211> 4454
<212> DNA
<213> Artificial Sequence
<220>
<223> AIO CLH-23 (mouse CKM-HP1gamma)
<220>
<221> misc_feature
<222> (4329)..(4349)
<223> n is a, c, g, or t
<400> 52
acgcgtgata tcggacaccc gagatgcctg gttataatta acccagacat gtggctgccc 60
cccccaacac ctgctgcgag ctctaaaaat aaccctggga cacccgagat gcctggttat 120
aattaaccca gacatgtggc tgcccccccc aacacctgct gcgagctcta aaaataaccc 180
tgggacaccc gagatgcctg gttataatta acccagacat gtggctgccc cccccaacac 240
ctgctgcgag ctctaaaaat aacccctccc tggggacagc ccctcctggc tagtcacacc 300
ctgtaggctc ctctatataa cccaggggca caggggctgc cctcattcta ccaccacctc 360
cacagcacag acagacactc aggagccagc cagcgccacc atggccccca agaagaagag 420
gaaggtggag gccagcaagc ggaactacat cctgggcctg gccatcggca tcaccagcgt 480
gggctacggc atcatcgact acgagacccg ggacgtgatc gacgccggcg tgcggctgtt 540
caaggaggcc aacgtggaga acaacgaggg caggcggagc aagagaggcg ccagaaggct 600
gaagcggcgg aggcggcaca gaatccagag agtgaagaag ctgctgttcg actacaacct 660
gctgaccgac cacagcgagc tgagcggcat caacccctac gaggccagag tgaagggcct 720
gagccagaag ctgagcgagg aggagttcag cgccgccctg ctgcacctgg ccaagagaag 780
aggcgtgcac aacgtgaacg aggtggagga ggacaccggc aacgagctgt ccaccaagga 840
gcagatcagc cggaacagca aggccctgga ggagaagtac gtggccgagc tgcagctgga 900
gcggctgaag aaggacggcg aggtgcgggg cagcatcaac agattcaaga ccagcgacta 960
cgtgaaggag gccaagcagc tgctgaaggt gcagaaggcc taccaccagc tggaccagag 1020
cttcatcgac acctacatcg acctgctgga gacccggcgg acctactacg agggccccgg 1080
cgagggcagc cccttcggct ggaaggacat caaggagtgg tacgagatgc tgatgggcca 1140
ctgcacctac ttccccgagg agctgcggag cgtgaagtac gcctacaacg ccgacctgta 1200
caacgccctg aacgacctga acaacctggt gatcaccagg gacgagaacg agaagctgga 1260
gtactacgag aagttccaga tcatcgagaa cgtgttcaag cagaagaaga agcccaccct 1320
gaagcagatc gccaaggaga tcctggtgaa cgaggaggac atcaagggct acagagtgac 1380
cagcaccggc aagcccgagt tcaccaacct gaaggtgtac cacgacatca aggacatcac 1440
cgcccggaag gagatcatcg agaacgccga gctgctggac cagatcgcca agatcctgac 1500
catctaccag agcagcgagg acatccagga ggagctgacc aacctgaact ccgagctgac 1560
ccaggaggag atcgagcaga tcagcaacct gaagggctac accggcaccc acaacctgag 1620
cctgaaggcc atcaacctga tcctggacga gctgtggcac accaacgaca accagatcgc 1680
catcttcaac cggctgaagc tggtgcccaa gaaggtggac ctgtcccagc agaaggagat 1740
ccccaccacc ctggtggacg acttcatcct gagccccgtg gtgaagagaa gcttcatcca 1800
gagcatcaag gtgatcaacg ccatcatcaa gaagtacggc ctgcccaacg acatcatcat 1860
cgagctggcc cgggagaaga actccaagga cgcccagaag atgatcaacg agatgcagaa 1920
gcggaaccgg cagaccaacg agcggatcga ggagatcatc cggaccaccg gcaaggagaa 1980
cgccaagtac ctgatcgaga agatcaagct gcacgacatg caggagggca agtgcctgta 2040
cagcctggag gccatccccc tggaggacct gctgaacaac cccttcaact acgaggtgga 2100
ccacatcatc cccagaagcg tgtccttcga caacagcttc aacaacaagg tgctggtgaa 2160
gcaggaggag gccagcaaga agggcaaccg gacccccttc cagtacctga gcagcagcga 2220
cagcaagatc agctacgaga ccttcaagaa gcacatcctg aacctggcca agggcaaggg 2280
cagaatcagc aagaccaaga aggagtacct gctggaggag cgggacatca acaggttctc 2340
cgtgcagaag gacttcatca accggaacct ggtggacacc agatacgcca ccagaggcct 2400
gatgaacctg ctgcggagct acttcagagt gaacaacctg gacgtgaagg tgaagtccat 2460
caacggcggc ttcaccagct tcctgcggcg gaagtggaag ttcaagaagg agcggaacaa 2520
gggctacaag caccacgccg aggacgccct gatcatcgcc aacgccgact tcatcttcaa 2580
ggagtggaag aagctggaca aggccaagaa ggtgatggag aaccagatgt tcgaggagaa 2640
gcaggccgag agcatgcccg agatcgagac cgagcaggag tacaaggaga tcttcatcac 2700
cccccaccag atcaagcaca tcaaggactt caaggactac aagtacagcc accgggtgga 2760
caagaagccc aacagagagc tgatcaacga caccctgtac tccacccgga aggacgacaa 2820
gggcaacacc ctgatcgtga acaacctgaa cggcctgtac gacaaggaca acgacaagct 2880
gaagaagctg atcaacaaga gccccgagaa gctgctgatg taccaccacg acccccagac 2940
ctaccagaag ctgaagctga tcatggagca gtacggcgac gagaagaacc ccctgtacaa 3000
gtactacgag gagaccggca actacctgac caagtactcc aagaaggaca acggccccgt 3060
gatcaagaag atcaagtact acggcaacaa gctgaacgcc cacctggaca tcaccgacga 3120
ctaccccaac agcagaaaca aggtggtgaa gctgtccctg aagccctaca gattcgacgt 3180
gtacctggac aacggcgtgt acaagttcgt gaccgtgaag aacctggacg tgatcaagaa 3240
ggagaactac tacgaggtga acagcaagtg ctacgaggag gccaagaagc tgaagaagat 3300
cagcaaccag gccgagttca tcgcctcctt ctacaacaac gacctgatca agatcaacgg 3360
cgagctgtac agagtgatcg gcgtgaacaa cgacctgctg aaccggatcg aggtgaacat 3420
gatcgacatc acctaccgcg agtacctgga gaacatgaac gacaagaggc cccccaggat 3480
catcaagacc atcgcctcca agacccagag catcaagaag tacagcaccg acatcctggg 3540
caacctgtac gaggtgaagt ccaagaagca cccccagatc atcaagaagg gcggcaccgg 3600
cggccccaag aagaagagga aggtgggccg ggccctggac cccgagcgga tcatcggcgc 3660
caccgacagc agcggcgagc tgatgttcct gatgaagtgg aaggacagcg acgaggccga 3720
cctggtgctg gccaaggagg ccaacatgaa gtgcccccag atcgtgatcg ccttctacga 3780
ggagcggctg acctggcaca gctgccccga ggacgaggcc cagtacccct acgacgtgcc 3840
cgactacgcc tgatatttgt gaaatttgtg atgctattgc tttatttgta accatctagc 3900
tttatttgtg aaatttgtga tgctattgct ttatttgtaa ccattttatt tgtgaaattt 3960
gtgatgctat tgctttattt gtaaccatta taagctgcaa taaacaagtt aacaacaaca 4020
attgcattca ttttatgttt caggttcagg gggagatgtg ggaggttttt taaagcggga 4080
gggcctattt cccatgattc cttcatattt gcatatacga tacaaggctg ttagagagat 4140
aattagaatt aatttgactg taaacacaaa gatattagta caaaatacgt gacgtagaaa 4200
gtaataattt cttgggtagt ttgcagtttt aaaattatgt tttaaaatgg actatcatat 4260
gcttaccgta acttgaaagt atttcgattt cttggcttta tatatcttgt ggaaaggacg 4320
aaacaccgnn nnnnnnnnnn nnnnnnnnng tttaagtact ctgtgctgga aacagcacag 4380
aatctactta aacaaggcaa aatgccgtgt ttatctcgtc aacttgttgg cgagattttt 4440
ttggtaccgg accg 4454
<210> 53
<211> 4451
<212> DNA
<213> Artificial Sequence
<220>
<223> AIO CLH-23 (human CKM-HP1gamma)
<220>
<221> misc_feature
<222> (4326)..(4346)
<223> n is a, c, g, or t
<400> 53
acgcgtgata tcggacaccc gagacgcccg gttataatta accaggacac gtggcgaccc 60
cccccaacac ctgcccgacc tctaaaaata actcctggac acccgagacg cccggttata 120
attaaccagg acacgtggcg acccccccca acacctgccc gacctctaaa aataactcct 180
ggacacccga gacgcccggt tataattaac caggacacgt ggcgaccccc cccaacacct 240
gcccgacctc taaaaataac ccctccctgg ggacaacccc tcccagccaa tagcacagcc 300
taggtccccc tatataaggc cacggctgct ggcccttcct cattctcagt gtcacctcca 360
ggatacagac agcccccctt cagcccagcc cgccaccatg gcccccaaga agaagaggaa 420
ggtggaggcc agcaagcgga actacatcct gggcctggcc atcggcatca ccagcgtggg 480
ctacggcatc atcgactacg agacccggga cgtgatcgac gccggcgtgc ggctgttcaa 540
ggaggccaac gtggagaaca acgagggcag gcggagcaag agaggcgcca gaaggctgaa 600
gcggcggagg cggcacagaa tccagagagt gaagaagctg ctgttcgact acaacctgct 660
gaccgaccac agcgagctga gcggcatcaa cccctacgag gccagagtga agggcctgag 720
ccagaagctg agcgaggagg agttcagcgc cgccctgctg cacctggcca agagaagagg 780
cgtgcacaac gtgaacgagg tggaggagga caccggcaac gagctgtcca ccaaggagca 840
gatcagccgg aacagcaagg ccctggagga gaagtacgtg gccgagctgc agctggagcg 900
gctgaagaag gacggcgagg tgcggggcag catcaacaga ttcaagacca gcgactacgt 960
gaaggaggcc aagcagctgc tgaaggtgca gaaggcctac caccagctgg accagagctt 1020
catcgacacc tacatcgacc tgctggagac ccggcggacc tactacgagg gccccggcga 1080
gggcagcccc ttcggctgga aggacatcaa ggagtggtac gagatgctga tgggccactg 1140
cacctacttc cccgaggagc tgcggagcgt gaagtacgcc tacaacgccg acctgtacaa 1200
cgccctgaac gacctgaaca acctggtgat caccagggac gagaacgaga agctggagta 1260
ctacgagaag ttccagatca tcgagaacgt gttcaagcag aagaagaagc ccaccctgaa 1320
gcagatcgcc aaggagatcc tggtgaacga ggaggacatc aagggctaca gagtgaccag 1380
caccggcaag cccgagttca ccaacctgaa ggtgtaccac gacatcaagg acatcaccgc 1440
ccggaaggag atcatcgaga acgccgagct gctggaccag atcgccaaga tcctgaccat 1500
ctaccagagc agcgaggaca tccaggagga gctgaccaac ctgaactccg agctgaccca 1560
ggaggagatc gagcagatca gcaacctgaa gggctacacc ggcacccaca acctgagcct 1620
gaaggccatc aacctgatcc tggacgagct gtggcacacc aacgacaacc agatcgccat 1680
cttcaaccgg ctgaagctgg tgcccaagaa ggtggacctg tcccagcaga aggagatccc 1740
caccaccctg gtggacgact tcatcctgag ccccgtggtg aagagaagct tcatccagag 1800
catcaaggtg atcaacgcca tcatcaagaa gtacggcctg cccaacgaca tcatcatcga 1860
gctggcccgg gagaagaact ccaaggacgc ccagaagatg atcaacgaga tgcagaagcg 1920
gaaccggcag accaacgagc ggatcgagga gatcatccgg accaccggca aggagaacgc 1980
caagtacctg atcgagaaga tcaagctgca cgacatgcag gagggcaagt gcctgtacag 2040
cctggaggcc atccccctgg aggacctgct gaacaacccc ttcaactacg aggtggacca 2100
catcatcccc agaagcgtgt ccttcgacaa cagcttcaac aacaaggtgc tggtgaagca 2160
ggaggaggcc agcaagaagg gcaaccggac ccccttccag tacctgagca gcagcgacag 2220
caagatcagc tacgagacct tcaagaagca catcctgaac ctggccaagg gcaagggcag 2280
aatcagcaag accaagaagg agtacctgct ggaggagcgg gacatcaaca ggttctccgt 2340
gcagaaggac ttcatcaacc ggaacctggt ggacaccaga tacgccacca gaggcctgat 2400
gaacctgctg cggagctact tcagagtgaa caacctggac gtgaaggtga agtccatcaa 2460
cggcggcttc accagcttcc tgcggcggaa gtggaagttc aagaaggagc ggaacaaggg 2520
ctacaagcac cacgccgagg acgccctgat catcgccaac gccgacttca tcttcaagga 2580
gtggaagaag ctggacaagg ccaagaaggt gatggagaac cagatgttcg aggagaagca 2640
ggccgagagc atgcccgaga tcgagaccga gcaggagtac aaggagatct tcatcacccc 2700
ccaccagatc aagcacatca aggacttcaa ggactacaag tacagccacc gggtggacaa 2760
gaagcccaac agagagctga tcaacgacac cctgtactcc acccggaagg acgacaaggg 2820
caacaccctg atcgtgaaca acctgaacgg cctgtacgac aaggacaacg acaagctgaa 2880
gaagctgatc aacaagagcc ccgagaagct gctgatgtac caccacgacc cccagaccta 2940
ccagaagctg aagctgatca tggagcagta cggcgacgag aagaaccccc tgtacaagta 3000
ctacgaggag accggcaact acctgaccaa gtactccaag aaggacaacg gccccgtgat 3060
caagaagatc aagtactacg gcaacaagct gaacgcccac ctggacatca ccgacgacta 3120
ccccaacagc agaaacaagg tggtgaagct gtccctgaag ccctacagat tcgacgtgta 3180
cctggacaac ggcgtgtaca agttcgtgac cgtgaagaac ctggacgtga tcaagaagga 3240
gaactactac gaggtgaaca gcaagtgcta cgaggaggcc aagaagctga agaagatcag 3300
caaccaggcc gagttcatcg cctccttcta caacaacgac ctgatcaaga tcaacggcga 3360
gctgtacaga gtgatcggcg tgaacaacga cctgctgaac cggatcgagg tgaacatgat 3420
cgacatcacc taccgcgagt acctggagaa catgaacgac aagaggcccc ccaggatcat 3480
caagaccatc gcctccaaga cccagagcat caagaagtac agcaccgaca tcctgggcaa 3540
cctgtacgag gtgaagtcca agaagcaccc ccagatcatc aagaagggcg gcaccggcgg 3600
ccccaagaag aagaggaagg tgggccgggc cctggacccc gagcggatca tcggcgccac 3660
cgacagcagc ggcgagctga tgttcctgat gaagtggaag gacagcgacg aggccgacct 3720
ggtgctggcc aaggaggcca acatgaagtg cccccagatc gtgatcgcct tctacgagga 3780
gcggctgacc tggcacagct gccccgagga cgaggcccag tacccctacg acgtgcccga 3840
ctacgcctga tatttgtgaa atttgtgatg ctattgcttt atttgtaacc atctagcttt 3900
atttgtgaaa tttgtgatgc tattgcttta tttgtaacca ttttatttgt gaaatttgtg 3960
atgctattgc tttatttgta accattataa gctgcaataa acaagttaac aacaacaatt 4020
gcattcattt tatgtttcag gttcaggggg agatgtggga ggttttttaa agcgggaggg 4080
cctatttccc atgattcctt catatttgca tatacgatac aaggctgtta gagagataat 4140
tagaattaat ttgactgtaa acacaaagat attagtacaa aatacgtgac gtagaaagta 4200
ataatttctt gggtagtttg cagttttaaa attatgtttt aaaatggact atcatatgct 4260
taccgtaact tgaaagtatt tcgatttctt ggctttatat atcttgtgga aaggacgaaa 4320
caccgnnnnn nnnnnnnnnn nnnnnngttt aagtactctg tgctggaaac agcacagaat 4380
ctacttaaac aaggcaaaat gccgtgttta tctcgtcaac ttgttggcga gatttttttg 4440
gtaccggacc g 4451
<210> 54
<211> 4533
<212> DNA
<213> Artificial Sequence
<220>
<223> AIO CLH-26 (mouse CKM-SET)
<220>
<221> misc_feature
<222> (4408)..(4428)
<223> n is a, c, g, or t
<400> 54
acgcgtgata tcggacaccc gagatgcctg gttataatta acccagacat gtggctgccc 60
cccccaacac ctgctgcgag ctctaaaaat aaccctggga cacccgagat gcctggttat 120
aattaaccca gacatgtggc tgcccccccc aacacctgct gcgagctcta aaaataaccc 180
tgggacaccc gagatgcctg gttataatta acccagacat gtggctgccc cccccaacac 240
ctgctgcgag ctctaaaaat aacccctccc tggggacagc ccctcctggc tagtcacacc 300
ctgtaggctc ctctatataa cccaggggca caggggctgc cctcattcta ccaccacctc 360
cacagcacag acagacactc aggagccagc cagcgccacc atggccccca agaagaagag 420
gaaggtggag gccagcaagc ggaactacat cctgggcctg gccatcggca tcaccagcgt 480
gggctacggc atcatcgact acgagacccg ggacgtgatc gacgccggcg tgcggctgtt 540
caaggaggcc aacgtggaga acaacgaggg caggcggagc aagagaggcg ccagaaggct 600
gaagcggcgg aggcggcaca gaatccagag agtgaagaag ctgctgttcg actacaacct 660
gctgaccgac cacagcgagc tgagcggcat caacccctac gaggccagag tgaagggcct 720
gagccagaag ctgagcgagg aggagttcag cgccgccctg ctgcacctgg ccaagagaag 780
aggcgtgcac aacgtgaacg aggtggagga ggacaccggc aacgagctgt ccaccaagga 840
gcagatcagc cggaacagca aggccctgga ggagaagtac gtggccgagc tgcagctgga 900
gcggctgaag aaggacggcg aggtgcgggg cagcatcaac agattcaaga ccagcgacta 960
cgtgaaggag gccaagcagc tgctgaaggt gcagaaggcc taccaccagc tggaccagag 1020
cttcatcgac acctacatcg acctgctgga gacccggcgg acctactacg agggccccgg 1080
cgagggcagc cccttcggct ggaaggacat caaggagtgg tacgagatgc tgatgggcca 1140
ctgcacctac ttccccgagg agctgcggag cgtgaagtac gcctacaacg ccgacctgta 1200
caacgccctg aacgacctga acaacctggt gatcaccagg gacgagaacg agaagctgga 1260
gtactacgag aagttccaga tcatcgagaa cgtgttcaag cagaagaaga agcccaccct 1320
gaagcagatc gccaaggaga tcctggtgaa cgaggaggac atcaagggct acagagtgac 1380
cagcaccggc aagcccgagt tcaccaacct gaaggtgtac cacgacatca aggacatcac 1440
cgcccggaag gagatcatcg agaacgccga gctgctggac cagatcgcca agatcctgac 1500
catctaccag agcagcgagg acatccagga ggagctgacc aacctgaact ccgagctgac 1560
ccaggaggag atcgagcaga tcagcaacct gaagggctac accggcaccc acaacctgag 1620
cctgaaggcc atcaacctga tcctggacga gctgtggcac accaacgaca accagatcgc 1680
catcttcaac cggctgaagc tggtgcccaa gaaggtggac ctgtcccagc agaaggagat 1740
ccccaccacc ctggtggacg acttcatcct gagccccgtg gtgaagagaa gcttcatcca 1800
gagcatcaag gtgatcaacg ccatcatcaa gaagtacggc ctgcccaacg acatcatcat 1860
cgagctggcc cgggagaaga actccaagga cgcccagaag atgatcaacg agatgcagaa 1920
gcggaaccgg cagaccaacg agcggatcga ggagatcatc cggaccaccg gcaaggagaa 1980
cgccaagtac ctgatcgaga agatcaagct gcacgacatg caggagggca agtgcctgta 2040
cagcctggag gccatccccc tggaggacct gctgaacaac cccttcaact acgaggtgga 2100
ccacatcatc cccagaagcg tgtccttcga caacagcttc aacaacaagg tgctggtgaa 2160
gcaggaggag gccagcaaga agggcaaccg gacccccttc cagtacctga gcagcagcga 2220
cagcaagatc agctacgaga ccttcaagaa gcacatcctg aacctggcca agggcaaggg 2280
cagaatcagc aagaccaaga aggagtacct gctggaggag cgggacatca acaggttctc 2340
cgtgcagaag gacttcatca accggaacct ggtggacacc agatacgcca ccagaggcct 2400
gatgaacctg ctgcggagct acttcagagt gaacaacctg gacgtgaagg tgaagtccat 2460
caacggcggc ttcaccagct tcctgcggcg gaagtggaag ttcaagaagg agcggaacaa 2520
gggctacaag caccacgccg aggacgccct gatcatcgcc aacgccgact tcatcttcaa 2580
ggagtggaag aagctggaca aggccaagaa ggtgatggag aaccagatgt tcgaggagaa 2640
gcaggccgag agcatgcccg agatcgagac cgagcaggag tacaaggaga tcttcatcac 2700
cccccaccag atcaagcaca tcaaggactt caaggactac aagtacagcc accgggtgga 2760
caagaagccc aacagagagc tgatcaacga caccctgtac tccacccgga aggacgacaa 2820
gggcaacacc ctgatcgtga acaacctgaa cggcctgtac gacaaggaca acgacaagct 2880
gaagaagctg atcaacaaga gccccgagaa gctgctgatg taccaccacg acccccagac 2940
ctaccagaag ctgaagctga tcatggagca gtacggcgac gagaagaacc ccctgtacaa 3000
gtactacgag gagaccggca actacctgac caagtactcc aagaaggaca acggccccgt 3060
gatcaagaag atcaagtact acggcaacaa gctgaacgcc cacctggaca tcaccgacga 3120
ctaccccaac agcagaaaca aggtggtgaa gctgtccctg aagccctaca gattcgacgt 3180
gtacctggac aacggcgtgt acaagttcgt gaccgtgaag aacctggacg tgatcaagaa 3240
ggagaactac tacgaggtga acagcaagtg ctacgaggag gccaagaagc tgaagaagat 3300
cagcaaccag gccgagttca tcgcctcctt ctacaacaac gacctgatca agatcaacgg 3360
cgagctgtac agagtgatcg gcgtgaacaa cgacctgctg aaccggatcg aggtgaacat 3420
gatcgacatc acctaccgcg agtacctgga gaacatgaac gacaagaggc cccccaggat 3480
catcaagacc atcgcctcca agacccagag catcaagaag tacagcaccg acatcctggg 3540
caacctgtac gaggtgaagt ccaagaagca cccccagatc atcaagaagg gcggcaccgg 3600
cggccccaag aagaagagga aggtgggccg ggcctacgac ctgtgcatct tcaggacaga 3660
cgacggccgg ggctggggcg tgcggaccct ggagaagatc cggaagaaca gcttcgtgat 3720
ggagtacgtg ggcgagatca tcaccagcga ggaggccgag cggcggggcc agatctacga 3780
ccggcagggc gccacctacc tgttcgacct ggactacgtg gaggacgtgt acaccgtgga 3840
cgccgcctac tacggcaaca tcagccactt cgtgaaccac agctgcgacc ccaacctgca 3900
ggtgtacaac gtgttcatcg acaacctgga cgagcggctg ccccgctacc cctacgacgt 3960
gcccgactac gcctgatatt tgtgaaattt gtgatgctat tgctttattt gtaaccatct 4020
agctttattt gtgaaatttg tgatgctatt gctttatttg taaccattat aagctgcaat 4080
aaacaagtta acaacaacaa ttgcattcat tttatgtttc aggttcaggg ggagatgtgg 4140
gaggtttttt aaagcgggag ggcctatttc ccatgattcc ttcatatttg catatacgat 4200
acaaggctgt tagagagata attagaatta atttgactgt aaacacaaag atattagtac 4260
aaaatacgtg acgtagaaag taataatttc ttgggtagtt tgcagtttta aaattatgtt 4320
ttaaaatgga ctatcatatg cttaccgtaa cttgaaagta tttcgatttc ttggctttat 4380
atatcttgtg gaaaggacga aacaccgnnn nnnnnnnnnn nnnnnnnngt ttaagtactc 4440
tgtgctggaa acagcacaga atctacttaa acaaggcaaa atgccgtgtt tatctcgtca 4500
acttgttggc gagatttttt tggtaccgga ccg 4533
<210> 55
<211> 4530
<212> DNA
<213> Artificial Sequence
<220>
<223> AIO CLH-26 (human CKM-SET)
<220>
<221> misc_feature
<222> (4405)..(4425)
<223> n is a, c, g, or t
<400> 55
acgcgtgata tcggacaccc gagacgcccg gttataatta accaggacac gtggcgaccc 60
cccccaacac ctgcccgacc tctaaaaata actcctggac acccgagacg cccggttata 120
attaaccagg acacgtggcg acccccccca acacctgccc gacctctaaa aataactcct 180
ggacacccga gacgcccggt tataattaac caggacacgt ggcgaccccc cccaacacct 240
gcccgacctc taaaaataac ccctccctgg ggacaacccc tcccagccaa tagcacagcc 300
taggtccccc tatataaggc cacggctgct ggcccttcct cattctcagt gtcacctcca 360
ggatacagac agcccccctt cagcccagcc cgccaccatg gcccccaaga agaagaggaa 420
ggtggaggcc agcaagcgga actacatcct gggcctggcc atcggcatca ccagcgtggg 480
ctacggcatc atcgactacg agacccggga cgtgatcgac gccggcgtgc ggctgttcaa 540
ggaggccaac gtggagaaca acgagggcag gcggagcaag agaggcgcca gaaggctgaa 600
gcggcggagg cggcacagaa tccagagagt gaagaagctg ctgttcgact acaacctgct 660
gaccgaccac agcgagctga gcggcatcaa cccctacgag gccagagtga agggcctgag 720
ccagaagctg agcgaggagg agttcagcgc cgccctgctg cacctggcca agagaagagg 780
cgtgcacaac gtgaacgagg tggaggagga caccggcaac gagctgtcca ccaaggagca 840
gatcagccgg aacagcaagg ccctggagga gaagtacgtg gccgagctgc agctggagcg 900
gctgaagaag gacggcgagg tgcggggcag catcaacaga ttcaagacca gcgactacgt 960
gaaggaggcc aagcagctgc tgaaggtgca gaaggcctac caccagctgg accagagctt 1020
catcgacacc tacatcgacc tgctggagac ccggcggacc tactacgagg gccccggcga 1080
gggcagcccc ttcggctgga aggacatcaa ggagtggtac gagatgctga tgggccactg 1140
cacctacttc cccgaggagc tgcggagcgt gaagtacgcc tacaacgccg acctgtacaa 1200
cgccctgaac gacctgaaca acctggtgat caccagggac gagaacgaga agctggagta 1260
ctacgagaag ttccagatca tcgagaacgt gttcaagcag aagaagaagc ccaccctgaa 1320
gcagatcgcc aaggagatcc tggtgaacga ggaggacatc aagggctaca gagtgaccag 1380
caccggcaag cccgagttca ccaacctgaa ggtgtaccac gacatcaagg acatcaccgc 1440
ccggaaggag atcatcgaga acgccgagct gctggaccag atcgccaaga tcctgaccat 1500
ctaccagagc agcgaggaca tccaggagga gctgaccaac ctgaactccg agctgaccca 1560
ggaggagatc gagcagatca gcaacctgaa gggctacacc ggcacccaca acctgagcct 1620
gaaggccatc aacctgatcc tggacgagct gtggcacacc aacgacaacc agatcgccat 1680
cttcaaccgg ctgaagctgg tgcccaagaa ggtggacctg tcccagcaga aggagatccc 1740
caccaccctg gtggacgact tcatcctgag ccccgtggtg aagagaagct tcatccagag 1800
catcaaggtg atcaacgcca tcatcaagaa gtacggcctg cccaacgaca tcatcatcga 1860
gctggcccgg gagaagaact ccaaggacgc ccagaagatg atcaacgaga tgcagaagcg 1920
gaaccggcag accaacgagc ggatcgagga gatcatccgg accaccggca aggagaacgc 1980
caagtacctg atcgagaaga tcaagctgca cgacatgcag gagggcaagt gcctgtacag 2040
cctggaggcc atccccctgg aggacctgct gaacaacccc ttcaactacg aggtggacca 2100
catcatcccc agaagcgtgt ccttcgacaa cagcttcaac aacaaggtgc tggtgaagca 2160
ggaggaggcc agcaagaagg gcaaccggac ccccttccag tacctgagca gcagcgacag 2220
caagatcagc tacgagacct tcaagaagca catcctgaac ctggccaagg gcaagggcag 2280
aatcagcaag accaagaagg agtacctgct ggaggagcgg gacatcaaca ggttctccgt 2340
gcagaaggac ttcatcaacc ggaacctggt ggacaccaga tacgccacca gaggcctgat 2400
gaacctgctg cggagctact tcagagtgaa caacctggac gtgaaggtga agtccatcaa 2460
cggcggcttc accagcttcc tgcggcggaa gtggaagttc aagaaggagc ggaacaaggg 2520
ctacaagcac cacgccgagg acgccctgat catcgccaac gccgacttca tcttcaagga 2580
gtggaagaag ctggacaagg ccaagaaggt gatggagaac cagatgttcg aggagaagca 2640
ggccgagagc atgcccgaga tcgagaccga gcaggagtac aaggagatct tcatcacccc 2700
ccaccagatc aagcacatca aggacttcaa ggactacaag tacagccacc gggtggacaa 2760
gaagcccaac agagagctga tcaacgacac cctgtactcc acccggaagg acgacaaggg 2820
caacaccctg atcgtgaaca acctgaacgg cctgtacgac aaggacaacg acaagctgaa 2880
gaagctgatc aacaagagcc ccgagaagct gctgatgtac caccacgacc cccagaccta 2940
ccagaagctg aagctgatca tggagcagta cggcgacgag aagaaccccc tgtacaagta 3000
ctacgaggag accggcaact acctgaccaa gtactccaag aaggacaacg gccccgtgat 3060
caagaagatc aagtactacg gcaacaagct gaacgcccac ctggacatca ccgacgacta 3120
ccccaacagc agaaacaagg tggtgaagct gtccctgaag ccctacagat tcgacgtgta 3180
cctggacaac ggcgtgtaca agttcgtgac cgtgaagaac ctggacgtga tcaagaagga 3240
gaactactac gaggtgaaca gcaagtgcta cgaggaggcc aagaagctga agaagatcag 3300
caaccaggcc gagttcatcg cctccttcta caacaacgac ctgatcaaga tcaacggcga 3360
gctgtacaga gtgatcggcg tgaacaacga cctgctgaac cggatcgagg tgaacatgat 3420
cgacatcacc taccgcgagt acctggagaa catgaacgac aagaggcccc ccaggatcat 3480
caagaccatc gcctccaaga cccagagcat caagaagtac agcaccgaca tcctgggcaa 3540
cctgtacgag gtgaagtcca agaagcaccc ccagatcatc aagaagggcg gcaccggcgg 3600
ccccaagaag aagaggaagg tgggccgggc ctacgacctg tgcatcttca ggacagacga 3660
cggccggggc tggggcgtgc ggaccctgga gaagatccgg aagaacagct tcgtgatgga 3720
gtacgtgggc gagatcatca ccagcgagga ggccgagcgg cggggccaga tctacgaccg 3780
gcagggcgcc acctacctgt tcgacctgga ctacgtggag gacgtgtaca ccgtggacgc 3840
cgcctactac ggcaacatca gccacttcgt gaaccacagc tgcgacccca acctgcaggt 3900
gtacaacgtg ttcatcgaca acctggacga gcggctgccc cgctacccct acgacgtgcc 3960
cgactacgcc tgatatttgt gaaatttgtg atgctattgc tttatttgta accatctagc 4020
tttatttgtg aaatttgtga tgctattgct ttatttgtaa ccattataag ctgcaataaa 4080
caagttaaca acaacaattg cattcatttt atgtttcagg ttcaggggga gatgtgggag 4140
gttttttaaa gcgggagggc ctatttccca tgattccttc atatttgcat atacgataca 4200
aggctgttag agagataatt agaattaatt tgactgtaaa cacaaagata ttagtacaaa 4260
atacgtgacg tagaaagtaa taatttcttg ggtagtttgc agttttaaaa ttatgtttta 4320
aaatggacta tcatatgctt accgtaactt gaaagtattt cgatttcttg gctttatata 4380
tcttgtggaa aggacgaaac accgnnnnnn nnnnnnnnnn nnnnngttta agtactctgt 4440
gctggaaaca gcacagaatc tacttaaaca aggcaaaatg ccgtgtttat ctcgtcaact 4500
tgttggcgag atttttttgg taccggaccg 4530
<210> 56
<211> 1120
<212> PRT
<213> Artificial Sequence
<220>
<223> MeCP2 TRD AAV Vector
<400> 56
Met Ala Pro Lys Lys Lys Arg Lys Val Glu Ala Ser Lys Arg Asn Tyr
1 5 10 15
Ile Leu Gly Leu Ala Ile Gly Ile Thr Ser Val Gly Tyr Gly Ile Ile
20 25 30
Asp Tyr Glu Thr Arg Asp Val Ile Asp Ala Gly Val Arg Leu Phe Lys
35 40 45
Glu Ala Asn Val Glu Asn Asn Glu Gly Arg Arg Ser Lys Arg Gly Ala
50 55 60
Arg Arg Leu Lys Arg Arg Arg Arg His Arg Ile Gln Arg Val Lys Lys
65 70 75 80
Leu Leu Phe Asp Tyr Asn Leu Leu Thr Asp His Ser Glu Leu Ser Gly
85 90 95
Ile Asn Pro Tyr Glu Ala Arg Val Lys Gly Leu Ser Gln Lys Leu Ser
100 105 110
Glu Glu Glu Phe Ser Ala Ala Leu Leu His Leu Ala Lys Arg Arg Gly
115 120 125
Val His Asn Val Asn Glu Val Glu Glu Asp Thr Gly Asn Glu Leu Ser
130 135 140
Thr Lys Glu Gln Ile Ser Arg Asn Ser Lys Ala Leu Glu Glu Lys Tyr
145 150 155 160
Val Ala Glu Leu Gln Leu Glu Arg Leu Lys Lys Asp Gly Glu Val Arg
165 170 175
Gly Ser Ile Asn Arg Phe Lys Thr Ser Asp Tyr Val Lys Glu Ala Lys
180 185 190
Gln Leu Leu Lys Val Gln Lys Ala Tyr His Gln Leu Asp Gln Ser Phe
195 200 205
Ile Asp Thr Tyr Ile Asp Leu Leu Glu Thr Arg Arg Thr Tyr Tyr Glu
210 215 220
Gly Pro Gly Glu Gly Ser Pro Phe Gly Trp Lys Asp Ile Lys Glu Trp
225 230 235 240
Tyr Glu Met Leu Met Gly His Cys Thr Tyr Phe Pro Glu Glu Leu Arg
245 250 255
Ser Val Lys Tyr Ala Tyr Asn Ala Asp Leu Tyr Asn Ala Leu Asn Asp
260 265 270
Leu Asn Asn Leu Val Ile Thr Arg Asp Glu Asn Glu Lys Leu Glu Tyr
275 280 285
Tyr Glu Lys Phe Gln Ile Ile Glu Asn Val Phe Lys Gln Lys Lys Lys
290 295 300
Pro Thr Leu Lys Gln Ile Ala Lys Glu Ile Leu Val Asn Glu Glu Asp
305 310 315 320
Ile Lys Gly Tyr Arg Val Thr Ser Thr Gly Lys Pro Glu Phe Thr Asn
325 330 335
Leu Lys Val Tyr His Asp Ile Lys Asp Ile Thr Ala Arg Lys Glu Ile
340 345 350
Ile Glu Asn Ala Glu Leu Leu Asp Gln Ile Ala Lys Ile Leu Thr Ile
355 360 365
Tyr Gln Ser Ser Glu Asp Ile Gln Glu Glu Leu Thr Asn Leu Asn Ser
370 375 380
Glu Leu Thr Gln Glu Glu Ile Glu Gln Ile Ser Asn Leu Lys Gly Tyr
385 390 395 400
Thr Gly Thr His Asn Leu Ser Leu Lys Ala Ile Asn Leu Ile Leu Asp
405 410 415
Glu Leu Trp His Thr Asn Asp Asn Gln Ile Ala Ile Phe Asn Arg Leu
420 425 430
Lys Leu Val Pro Lys Lys Val Asp Leu Ser Gln Gln Lys Glu Ile Pro
435 440 445
Thr Thr Leu Val Asp Asp Phe Ile Leu Ser Pro Val Val Lys Arg Ser
450 455 460
Phe Ile Gln Ser Ile Lys Val Ile Asn Ala Ile Ile Lys Lys Tyr Gly
465 470 475 480
Leu Pro Asn Asp Ile Ile Ile Glu Leu Ala Arg Glu Lys Asn Ser Lys
485 490 495
Asp Ala Gln Lys Met Ile Asn Glu Met Gln Lys Arg Asn Arg Gln Thr
500 505 510
Asn Glu Arg Ile Glu Glu Ile Ile Arg Thr Thr Gly Lys Glu Asn Ala
515 520 525
Lys Tyr Leu Ile Glu Lys Ile Lys Leu His Asp Met Gln Glu Gly Lys
530 535 540
Cys Leu Tyr Ser Leu Glu Ala Ile Pro Leu Glu Asp Leu Leu Asn Asn
545 550 555 560
Pro Phe Asn Tyr Glu Val Asp His Ile Ile Pro Arg Ser Val Ser Phe
565 570 575
Asp Asn Ser Phe Asn Asn Lys Val Leu Val Lys Gln Glu Glu Ala Ser
580 585 590
Lys Lys Gly Asn Arg Thr Pro Phe Gln Tyr Leu Ser Ser Ser Asp Ser
595 600 605
Lys Ile Ser Tyr Glu Thr Phe Lys Lys His Ile Leu Asn Leu Ala Lys
610 615 620
Gly Lys Gly Arg Ile Ser Lys Thr Lys Lys Glu Tyr Leu Leu Glu Glu
625 630 635 640
Arg Asp Ile Asn Arg Phe Ser Val Gln Lys Asp Phe Ile Asn Arg Asn
645 650 655
Leu Val Asp Thr Arg Tyr Ala Thr Arg Gly Leu Met Asn Leu Leu Arg
660 665 670
Ser Tyr Phe Arg Val Asn Asn Leu Asp Val Lys Val Lys Ser Ile Asn
675 680 685
Gly Gly Phe Thr Ser Phe Leu Arg Arg Lys Trp Lys Phe Lys Lys Glu
690 695 700
Arg Asn Lys Gly Tyr Lys His His Ala Glu Asp Ala Leu Ile Ile Ala
705 710 715 720
Asn Ala Asp Phe Ile Phe Lys Glu Trp Lys Lys Leu Asp Lys Ala Lys
725 730 735
Lys Val Met Glu Asn Gln Met Phe Glu Glu Lys Gln Ala Glu Ser Met
740 745 750
Pro Glu Ile Glu Thr Glu Gln Glu Tyr Lys Glu Ile Phe Ile Thr Pro
755 760 765
His Gln Ile Lys His Ile Lys Asp Phe Lys Asp Tyr Lys Tyr Ser His
770 775 780
Arg Val Asp Lys Lys Pro Asn Arg Glu Leu Ile Asn Asp Thr Leu Tyr
785 790 795 800
Ser Thr Arg Lys Asp Asp Lys Gly Asn Thr Leu Ile Val Asn Asn Leu
805 810 815
Asn Gly Leu Tyr Asp Lys Asp Asn Asp Lys Leu Lys Lys Leu Ile Asn
820 825 830
Lys Ser Pro Glu Lys Leu Leu Met Tyr His His Asp Pro Gln Thr Tyr
835 840 845
Gln Lys Leu Lys Leu Ile Met Glu Gln Tyr Gly Asp Glu Lys Asn Pro
850 855 860
Leu Tyr Lys Tyr Tyr Glu Glu Thr Gly Asn Tyr Leu Thr Lys Tyr Ser
865 870 875 880
Lys Lys Asp Asn Gly Pro Val Ile Lys Lys Ile Lys Tyr Tyr Gly Asn
885 890 895
Lys Leu Asn Ala His Leu Asp Ile Thr Asp Asp Tyr Pro Asn Ser Arg
900 905 910
Asn Lys Val Val Lys Leu Ser Leu Lys Pro Tyr Arg Phe Asp Val Tyr
915 920 925
Leu Asp Asn Gly Val Tyr Lys Phe Val Thr Val Lys Asn Leu Asp Val
930 935 940
Ile Lys Lys Glu Asn Tyr Tyr Glu Val Asn Ser Lys Cys Tyr Glu Glu
945 950 955 960
Ala Lys Lys Leu Lys Lys Ile Ser Asn Gln Ala Glu Phe Ile Ala Ser
965 970 975
Phe Tyr Asn Asn Asp Leu Ile Lys Ile Asn Gly Glu Leu Tyr Arg Val
980 985 990
Ile Gly Val Asn Asn Asp Leu Leu Asn Arg Ile Glu Val Asn Met Ile
995 1000 1005
Asp Ile Thr Tyr Arg Glu Tyr Leu Glu Asn Met Asn Asp Lys Arg
1010 1015 1020
Pro Pro Arg Ile Ile Lys Thr Ile Ala Ser Lys Thr Gln Ser Ile
1025 1030 1035
Lys Lys Tyr Ser Thr Asp Ile Leu Gly Asn Leu Tyr Glu Val Lys
1040 1045 1050
Ser Lys Lys His Pro Gln Ile Ile Lys Lys Gly Gly Thr Gly Gly
1055 1060 1065
Pro Lys Lys Lys Arg Lys Val Gly Arg Ala Gly Arg Lys Pro Gly
1070 1075 1080
Ser Val Val Ala Ala Ala Ala Ala Glu Ala Lys Lys Lys Ala Val
1085 1090 1095
Lys Glu Ser Ser Ile Arg Ser Val Gln Glu Thr Val Leu Pro Ile
1100 1105 1110
Lys Lys Arg Lys Thr Arg Ala
1115 1120
<210> 57
<211> 1149
<212> PRT
<213> Artificial Sequence
<220>
<223> HP1alpha AAV Vector
<400> 57
Met Ala Pro Lys Lys Lys Arg Lys Val Glu Ala Ser Lys Arg Asn Tyr
1 5 10 15
Ile Leu Gly Leu Ala Ile Gly Ile Thr Ser Val Gly Tyr Gly Ile Ile
20 25 30
Asp Tyr Glu Thr Arg Asp Val Ile Asp Ala Gly Val Arg Leu Phe Lys
35 40 45
Glu Ala Asn Val Glu Asn Asn Glu Gly Arg Arg Ser Lys Arg Gly Ala
50 55 60
Arg Arg Leu Lys Arg Arg Arg Arg His Arg Ile Gln Arg Val Lys Lys
65 70 75 80
Leu Leu Phe Asp Tyr Asn Leu Leu Thr Asp His Ser Glu Leu Ser Gly
85 90 95
Ile Asn Pro Tyr Glu Ala Arg Val Lys Gly Leu Ser Gln Lys Leu Ser
100 105 110
Glu Glu Glu Phe Ser Ala Ala Leu Leu His Leu Ala Lys Arg Arg Gly
115 120 125
Val His Asn Val Asn Glu Val Glu Glu Asp Thr Gly Asn Glu Leu Ser
130 135 140
Thr Lys Glu Gln Ile Ser Arg Asn Ser Lys Ala Leu Glu Glu Lys Tyr
145 150 155 160
Val Ala Glu Leu Gln Leu Glu Arg Leu Lys Lys Asp Gly Glu Val Arg
165 170 175
Gly Ser Ile Asn Arg Phe Lys Thr Ser Asp Tyr Val Lys Glu Ala Lys
180 185 190
Gln Leu Leu Lys Val Gln Lys Ala Tyr His Gln Leu Asp Gln Ser Phe
195 200 205
Ile Asp Thr Tyr Ile Asp Leu Leu Glu Thr Arg Arg Thr Tyr Tyr Glu
210 215 220
Gly Pro Gly Glu Gly Ser Pro Phe Gly Trp Lys Asp Ile Lys Glu Trp
225 230 235 240
Tyr Glu Met Leu Met Gly His Cys Thr Tyr Phe Pro Glu Glu Leu Arg
245 250 255
Ser Val Lys Tyr Ala Tyr Asn Ala Asp Leu Tyr Asn Ala Leu Asn Asp
260 265 270
Leu Asn Asn Leu Val Ile Thr Arg Asp Glu Asn Glu Lys Leu Glu Tyr
275 280 285
Tyr Glu Lys Phe Gln Ile Ile Glu Asn Val Phe Lys Gln Lys Lys Lys
290 295 300
Pro Thr Leu Lys Gln Ile Ala Lys Glu Ile Leu Val Asn Glu Glu Asp
305 310 315 320
Ile Lys Gly Tyr Arg Val Thr Ser Thr Gly Lys Pro Glu Phe Thr Asn
325 330 335
Leu Lys Val Tyr His Asp Ile Lys Asp Ile Thr Ala Arg Lys Glu Ile
340 345 350
Ile Glu Asn Ala Glu Leu Leu Asp Gln Ile Ala Lys Ile Leu Thr Ile
355 360 365
Tyr Gln Ser Ser Glu Asp Ile Gln Glu Glu Leu Thr Asn Leu Asn Ser
370 375 380
Glu Leu Thr Gln Glu Glu Ile Glu Gln Ile Ser Asn Leu Lys Gly Tyr
385 390 395 400
Thr Gly Thr His Asn Leu Ser Leu Lys Ala Ile Asn Leu Ile Leu Asp
405 410 415
Glu Leu Trp His Thr Asn Asp Asn Gln Ile Ala Ile Phe Asn Arg Leu
420 425 430
Lys Leu Val Pro Lys Lys Val Asp Leu Ser Gln Gln Lys Glu Ile Pro
435 440 445
Thr Thr Leu Val Asp Asp Phe Ile Leu Ser Pro Val Val Lys Arg Ser
450 455 460
Phe Ile Gln Ser Ile Lys Val Ile Asn Ala Ile Ile Lys Lys Tyr Gly
465 470 475 480
Leu Pro Asn Asp Ile Ile Ile Glu Leu Ala Arg Glu Lys Asn Ser Lys
485 490 495
Asp Ala Gln Lys Met Ile Asn Glu Met Gln Lys Arg Asn Arg Gln Thr
500 505 510
Asn Glu Arg Ile Glu Glu Ile Ile Arg Thr Thr Gly Lys Glu Asn Ala
515 520 525
Lys Tyr Leu Ile Glu Lys Ile Lys Leu His Asp Met Gln Glu Gly Lys
530 535 540
Cys Leu Tyr Ser Leu Glu Ala Ile Pro Leu Glu Asp Leu Leu Asn Asn
545 550 555 560
Pro Phe Asn Tyr Glu Val Asp His Ile Ile Pro Arg Ser Val Ser Phe
565 570 575
Asp Asn Ser Phe Asn Asn Lys Val Leu Val Lys Gln Glu Glu Ala Ser
580 585 590
Lys Lys Gly Asn Arg Thr Pro Phe Gln Tyr Leu Ser Ser Ser Asp Ser
595 600 605
Lys Ile Ser Tyr Glu Thr Phe Lys Lys His Ile Leu Asn Leu Ala Lys
610 615 620
Gly Lys Gly Arg Ile Ser Lys Thr Lys Lys Glu Tyr Leu Leu Glu Glu
625 630 635 640
Arg Asp Ile Asn Arg Phe Ser Val Gln Lys Asp Phe Ile Asn Arg Asn
645 650 655
Leu Val Asp Thr Arg Tyr Ala Thr Arg Gly Leu Met Asn Leu Leu Arg
660 665 670
Ser Tyr Phe Arg Val Asn Asn Leu Asp Val Lys Val Lys Ser Ile Asn
675 680 685
Gly Gly Phe Thr Ser Phe Leu Arg Arg Lys Trp Lys Phe Lys Lys Glu
690 695 700
Arg Asn Lys Gly Tyr Lys His His Ala Glu Asp Ala Leu Ile Ile Ala
705 710 715 720
Asn Ala Asp Phe Ile Phe Lys Glu Trp Lys Lys Leu Asp Lys Ala Lys
725 730 735
Lys Val Met Glu Asn Gln Met Phe Glu Glu Lys Gln Ala Glu Ser Met
740 745 750
Pro Glu Ile Glu Thr Glu Gln Glu Tyr Lys Glu Ile Phe Ile Thr Pro
755 760 765
His Gln Ile Lys His Ile Lys Asp Phe Lys Asp Tyr Lys Tyr Ser His
770 775 780
Arg Val Asp Lys Lys Pro Asn Arg Glu Leu Ile Asn Asp Thr Leu Tyr
785 790 795 800
Ser Thr Arg Lys Asp Asp Lys Gly Asn Thr Leu Ile Val Asn Asn Leu
805 810 815
Asn Gly Leu Tyr Asp Lys Asp Asn Asp Lys Leu Lys Lys Leu Ile Asn
820 825 830
Lys Ser Pro Glu Lys Leu Leu Met Tyr His His Asp Pro Gln Thr Tyr
835 840 845
Gln Lys Leu Lys Leu Ile Met Glu Gln Tyr Gly Asp Glu Lys Asn Pro
850 855 860
Leu Tyr Lys Tyr Tyr Glu Glu Thr Gly Asn Tyr Leu Thr Lys Tyr Ser
865 870 875 880
Lys Lys Asp Asn Gly Pro Val Ile Lys Lys Ile Lys Tyr Tyr Gly Asn
885 890 895
Lys Leu Asn Ala His Leu Asp Ile Thr Asp Asp Tyr Pro Asn Ser Arg
900 905 910
Asn Lys Val Val Lys Leu Ser Leu Lys Pro Tyr Arg Phe Asp Val Tyr
915 920 925
Leu Asp Asn Gly Val Tyr Lys Phe Val Thr Val Lys Asn Leu Asp Val
930 935 940
Ile Lys Lys Glu Asn Tyr Tyr Glu Val Asn Ser Lys Cys Tyr Glu Glu
945 950 955 960
Ala Lys Lys Leu Lys Lys Ile Ser Asn Gln Ala Glu Phe Ile Ala Ser
965 970 975
Phe Tyr Asn Asn Asp Leu Ile Lys Ile Asn Gly Glu Leu Tyr Arg Val
980 985 990
Ile Gly Val Asn Asn Asp Leu Leu Asn Arg Ile Glu Val Asn Met Ile
995 1000 1005
Asp Ile Thr Tyr Arg Glu Tyr Leu Glu Asn Met Asn Asp Lys Arg
1010 1015 1020
Pro Pro Arg Ile Ile Lys Thr Ile Ala Ser Lys Thr Gln Ser Ile
1025 1030 1035
Lys Lys Tyr Ser Thr Asp Ile Leu Gly Asn Leu Tyr Glu Val Lys
1040 1045 1050
Ser Lys Lys His Pro Gln Ile Ile Lys Lys Gly Gly Thr Gly Gly
1055 1060 1065
Pro Lys Lys Lys Arg Lys Val Gly Arg Ala Glu Pro Glu Lys Ile
1070 1075 1080
Ile Gly Ala Thr Asp Ser Cys Gly Asp Leu Met Phe Leu Met Lys
1085 1090 1095
Trp Lys Asp Thr Asp Glu Ala Asp Leu Val Leu Ala Lys Glu Ala
1100 1105 1110
Asn Val Lys Cys Pro Gln Ile Val Ile Ala Phe Tyr Glu Glu Arg
1115 1120 1125
Leu Thr Trp His Ala Tyr Pro Glu Asp Ala Glu Asn Lys Glu Lys
1130 1135 1140
Glu Thr Ala Lys Ser Ala
1145
<210> 58
<211> 1142
<212> PRT
<213> Artificial Sequence
<220>
<223> HP1gamma AAV Vector
<400> 58
Met Ala Pro Lys Lys Lys Arg Lys Val Glu Ala Ser Lys Arg Asn Tyr
1 5 10 15
Ile Leu Gly Leu Ala Ile Gly Ile Thr Ser Val Gly Tyr Gly Ile Ile
20 25 30
Asp Tyr Glu Thr Arg Asp Val Ile Asp Ala Gly Val Arg Leu Phe Lys
35 40 45
Glu Ala Asn Val Glu Asn Asn Glu Gly Arg Arg Ser Lys Arg Gly Ala
50 55 60
Arg Arg Leu Lys Arg Arg Arg Arg His Arg Ile Gln Arg Val Lys Lys
65 70 75 80
Leu Leu Phe Asp Tyr Asn Leu Leu Thr Asp His Ser Glu Leu Ser Gly
85 90 95
Ile Asn Pro Tyr Glu Ala Arg Val Lys Gly Leu Ser Gln Lys Leu Ser
100 105 110
Glu Glu Glu Phe Ser Ala Ala Leu Leu His Leu Ala Lys Arg Arg Gly
115 120 125
Val His Asn Val Asn Glu Val Glu Glu Asp Thr Gly Asn Glu Leu Ser
130 135 140
Thr Lys Glu Gln Ile Ser Arg Asn Ser Lys Ala Leu Glu Glu Lys Tyr
145 150 155 160
Val Ala Glu Leu Gln Leu Glu Arg Leu Lys Lys Asp Gly Glu Val Arg
165 170 175
Gly Ser Ile Asn Arg Phe Lys Thr Ser Asp Tyr Val Lys Glu Ala Lys
180 185 190
Gln Leu Leu Lys Val Gln Lys Ala Tyr His Gln Leu Asp Gln Ser Phe
195 200 205
Ile Asp Thr Tyr Ile Asp Leu Leu Glu Thr Arg Arg Thr Tyr Tyr Glu
210 215 220
Gly Pro Gly Glu Gly Ser Pro Phe Gly Trp Lys Asp Ile Lys Glu Trp
225 230 235 240
Tyr Glu Met Leu Met Gly His Cys Thr Tyr Phe Pro Glu Glu Leu Arg
245 250 255
Ser Val Lys Tyr Ala Tyr Asn Ala Asp Leu Tyr Asn Ala Leu Asn Asp
260 265 270
Leu Asn Asn Leu Val Ile Thr Arg Asp Glu Asn Glu Lys Leu Glu Tyr
275 280 285
Tyr Glu Lys Phe Gln Ile Ile Glu Asn Val Phe Lys Gln Lys Lys Lys
290 295 300
Pro Thr Leu Lys Gln Ile Ala Lys Glu Ile Leu Val Asn Glu Glu Asp
305 310 315 320
Ile Lys Gly Tyr Arg Val Thr Ser Thr Gly Lys Pro Glu Phe Thr Asn
325 330 335
Leu Lys Val Tyr His Asp Ile Lys Asp Ile Thr Ala Arg Lys Glu Ile
340 345 350
Ile Glu Asn Ala Glu Leu Leu Asp Gln Ile Ala Lys Ile Leu Thr Ile
355 360 365
Tyr Gln Ser Ser Glu Asp Ile Gln Glu Glu Leu Thr Asn Leu Asn Ser
370 375 380
Glu Leu Thr Gln Glu Glu Ile Glu Gln Ile Ser Asn Leu Lys Gly Tyr
385 390 395 400
Thr Gly Thr His Asn Leu Ser Leu Lys Ala Ile Asn Leu Ile Leu Asp
405 410 415
Glu Leu Trp His Thr Asn Asp Asn Gln Ile Ala Ile Phe Asn Arg Leu
420 425 430
Lys Leu Val Pro Lys Lys Val Asp Leu Ser Gln Gln Lys Glu Ile Pro
435 440 445
Thr Thr Leu Val Asp Asp Phe Ile Leu Ser Pro Val Val Lys Arg Ser
450 455 460
Phe Ile Gln Ser Ile Lys Val Ile Asn Ala Ile Ile Lys Lys Tyr Gly
465 470 475 480
Leu Pro Asn Asp Ile Ile Ile Glu Leu Ala Arg Glu Lys Asn Ser Lys
485 490 495
Asp Ala Gln Lys Met Ile Asn Glu Met Gln Lys Arg Asn Arg Gln Thr
500 505 510
Asn Glu Arg Ile Glu Glu Ile Ile Arg Thr Thr Gly Lys Glu Asn Ala
515 520 525
Lys Tyr Leu Ile Glu Lys Ile Lys Leu His Asp Met Gln Glu Gly Lys
530 535 540
Cys Leu Tyr Ser Leu Glu Ala Ile Pro Leu Glu Asp Leu Leu Asn Asn
545 550 555 560
Pro Phe Asn Tyr Glu Val Asp His Ile Ile Pro Arg Ser Val Ser Phe
565 570 575
Asp Asn Ser Phe Asn Asn Lys Val Leu Val Lys Gln Glu Glu Ala Ser
580 585 590
Lys Lys Gly Asn Arg Thr Pro Phe Gln Tyr Leu Ser Ser Ser Asp Ser
595 600 605
Lys Ile Ser Tyr Glu Thr Phe Lys Lys His Ile Leu Asn Leu Ala Lys
610 615 620
Gly Lys Gly Arg Ile Ser Lys Thr Lys Lys Glu Tyr Leu Leu Glu Glu
625 630 635 640
Arg Asp Ile Asn Arg Phe Ser Val Gln Lys Asp Phe Ile Asn Arg Asn
645 650 655
Leu Val Asp Thr Arg Tyr Ala Thr Arg Gly Leu Met Asn Leu Leu Arg
660 665 670
Ser Tyr Phe Arg Val Asn Asn Leu Asp Val Lys Val Lys Ser Ile Asn
675 680 685
Gly Gly Phe Thr Ser Phe Leu Arg Arg Lys Trp Lys Phe Lys Lys Glu
690 695 700
Arg Asn Lys Gly Tyr Lys His His Ala Glu Asp Ala Leu Ile Ile Ala
705 710 715 720
Asn Ala Asp Phe Ile Phe Lys Glu Trp Lys Lys Leu Asp Lys Ala Lys
725 730 735
Lys Val Met Glu Asn Gln Met Phe Glu Glu Lys Gln Ala Glu Ser Met
740 745 750
Pro Glu Ile Glu Thr Glu Gln Glu Tyr Lys Glu Ile Phe Ile Thr Pro
755 760 765
His Gln Ile Lys His Ile Lys Asp Phe Lys Asp Tyr Lys Tyr Ser His
770 775 780
Arg Val Asp Lys Lys Pro Asn Arg Glu Leu Ile Asn Asp Thr Leu Tyr
785 790 795 800
Ser Thr Arg Lys Asp Asp Lys Gly Asn Thr Leu Ile Val Asn Asn Leu
805 810 815
Asn Gly Leu Tyr Asp Lys Asp Asn Asp Lys Leu Lys Lys Leu Ile Asn
820 825 830
Lys Ser Pro Glu Lys Leu Leu Met Tyr His His Asp Pro Gln Thr Tyr
835 840 845
Gln Lys Leu Lys Leu Ile Met Glu Gln Tyr Gly Asp Glu Lys Asn Pro
850 855 860
Leu Tyr Lys Tyr Tyr Glu Glu Thr Gly Asn Tyr Leu Thr Lys Tyr Ser
865 870 875 880
Lys Lys Asp Asn Gly Pro Val Ile Lys Lys Ile Lys Tyr Tyr Gly Asn
885 890 895
Lys Leu Asn Ala His Leu Asp Ile Thr Asp Asp Tyr Pro Asn Ser Arg
900 905 910
Asn Lys Val Val Lys Leu Ser Leu Lys Pro Tyr Arg Phe Asp Val Tyr
915 920 925
Leu Asp Asn Gly Val Tyr Lys Phe Val Thr Val Lys Asn Leu Asp Val
930 935 940
Ile Lys Lys Glu Asn Tyr Tyr Glu Val Asn Ser Lys Cys Tyr Glu Glu
945 950 955 960
Ala Lys Lys Leu Lys Lys Ile Ser Asn Gln Ala Glu Phe Ile Ala Ser
965 970 975
Phe Tyr Asn Asn Asp Leu Ile Lys Ile Asn Gly Glu Leu Tyr Arg Val
980 985 990
Ile Gly Val Asn Asn Asp Leu Leu Asn Arg Ile Glu Val Asn Met Ile
995 1000 1005
Asp Ile Thr Tyr Arg Glu Tyr Leu Glu Asn Met Asn Asp Lys Arg
1010 1015 1020
Pro Pro Arg Ile Ile Lys Thr Ile Ala Ser Lys Thr Gln Ser Ile
1025 1030 1035
Lys Lys Tyr Ser Thr Asp Ile Leu Gly Asn Leu Tyr Glu Val Lys
1040 1045 1050
Ser Lys Lys His Pro Gln Ile Ile Lys Lys Gly Gly Thr Gly Gly
1055 1060 1065
Pro Lys Lys Lys Arg Lys Val Gly Arg Ala Leu Asp Pro Glu Arg
1070 1075 1080
Ile Ile Gly Ala Thr Asp Ser Ser Gly Glu Leu Met Phe Leu Met
1085 1090 1095
Lys Trp Lys Asp Ser Asp Glu Ala Asp Leu Val Leu Ala Lys Glu
1100 1105 1110
Ala Asn Met Lys Cys Pro Gln Ile Val Ile Ala Phe Tyr Glu Glu
1115 1120 1125
Arg Leu Thr Trp His Ser Cys Pro Glu Asp Glu Ala Gln Ala
1130 1135 1140
Claims (33)
- 단일 가이드 RNA(single guide RNA; sgRNA) 및 융합 폴리펩타이드(fusion polypeptide)를 포함하는 CRISPR 간섭(CRISPRi) 플랫폼을 인코딩(encoding)하는 폴리뉴클레오타이드로서, 융합 폴리펩타이드는 후성적 억제인자(epigenetic repressor)에 융합된 촉매적으로 불활성인 Cas9 (dCas9 또는 iCas9)를 추가로 포함하는 폴리뉴클레오타이드.
- 제1항에 있어서, sgRNA는 U6 프로모터의 제어(control) 하에 있는, 폴리뉴클레오타이드.
- 제1항에 있어서, sgRNA는 DUX4 유전자좌(locus)를 표적화(targeting)하는, 폴리뉴클레오타이드.
- 제1항 내지 제3항 중 어느 한 항에 있어서, 융합 폴리펩타이드는 골격근-특이적 조절 카세트(skeleton muscle-specific regulatory cassette)의 제어 하에 있는, 폴리뉴클레오타이드.
- 제1항 내지 제4항 중 어느 한 항에 있어서, 촉매적으로 불활성인 Cas9는 dSaCas9인, 폴리뉴클레오타이드.
- 제1항 내지 제5항 중 어느 한 항에 있어서, 후성적 억제인자는 HP1α, HP1γ, HP1α 또는 HP1γ의 염색체 섀도우 도메인(chromo shadow domain) 및 C-말단 확장 영역, MeCP2 전사 억제 도메인 (TRD), 및 SUV39H1 SET 도메인으로 이루어진 군으로부터 선택되는, 폴리뉴클레오타이드.
- 제1항 내지 제6항 중 어느 한 항에 있어서, sgRNA는 서열번호 38, 39, 40, 41, 42, 또는 43을 포함하는, 폴리뉴클레오타이드.
- 제1항 내지 제6항 중 어느 한 항에 있어서, 융합 폴리펩타이드는 서열번호 1 내지 4 중 어느 하나를 포함하는, 폴리뉴클레오타이드.
- 제1항 내지 제6항 중 어느 한 항에 있어서, 폴리뉴클레오타이드는 서열번호 48 내지 55 중 어느 하나를 포함하는, 폴리뉴클레오타이드.
- sgRNA 및 융합 폴리펩타이드를 포함하는 CRISPRi 플랫폼을 인코딩하는 폴리뉴클레오타이드를 포함하는 벡터(vector)로서, 융합 폴리펩타이드는 후성적 억제인자에 융합된 촉매적으로 불활성인 Cas9(dCas9 또는 iCas9)를 추가로 포함하는, 벡터.
- 제10항에 있어서, sgRNA는 U6 프로모터의 제어 하에 있는, 벡터.
- 제10항에 있어서, sgRNA는 DUX4 유전자좌를 표적화하는, 벡터.
- 제10항 내지 제12항 중 어느 한 항에 있어서, 융합 폴리펩타이드는 골격근-특이적 조절 카세트의 제어 하에 있는, 벡터.
- 제10항 내지 제13항 중 어느 한 항에 있어서, 촉매적으로 불활성인 Cas9는 dSaCas9인, 벡터.
- 제10항 내지 제14항 중 어느 한 항에 있어서, 후성적 억제인자는 HP1α, HP1γ, HP1α 또는 HP1γ의 염색체 섀도우 도메인 및 C-말단 확장 영역, MeCP2 전사 억제 도메인 (TRD), 및 SUV39H1 SET 도메인으로 이루어진 군으로부터 선택되는, 벡터.
- 제10항 내지 제15항 중 어느 한 항에 있어서, sgRNA는 서열번호 38, 39, 40, 41, 42, 또는 43을 포함하는 군으로부터 선택되는 핵산을 포함하는, 벡터.
- 제10항 내지 제16항 중 어느 한 항에 있어서, 융합 폴리펩타이드는 서열번호 1 내지 4 중 어느 하나를 포함하는, 벡터.
- 제10항 내지 제17항 중 어느 한 항에 있어서, 폴리뉴클레오타이드는 서열번호 48 내지 55 중 어느 하나를 포함하는, 벡터.
- 제10항 내지 제18항 중 어느 한 항에 있어서, 벡터는 아데노-연관 바이러스 (AAV) 벡터인, 벡터.
- 제10항 내지 제19항 중 어느 한 항에 있어서, 벡터는 서열번호 48 내지 55 중 어느 하나를 포함하는, 벡터.
- 이를 필요로 하는 대상체(subject)에서 안면견갑상완 근이영양증(facioscapulohumeral muscular dystrophy; FSHD)을 치료하는 방법으로서, 상기 방법은 DUX4 유전자 발현의 억제인자의 유효량을 대상체에게 투여하는 단계를 포함하고, 억제인자는 대상체의 골격근 세포에서 DUX4 유전자 발현을 감소시킴으로써, 장애(disorder)를 치료하는, 방법.
- 제21항에 있어서, DUX4 억제인자는 sgRNA 및 융합 폴리펩타이드를 포함하는 CRISPRi 플랫폼을 포함하는 폴리뉴클레오타이드이고, 융합 폴리펩타이드는 후성적 억제인자에 융합된 dCas9를 추가로 포함하는, 방법.
- 제21항 내지 제22항 중 어느 한 항에 있어서, sgRNA는 DUX4 유전자좌를 표적화하는, 방법.
- 제21항 내지 제23항 중 어느 한 항에 있어서, sgRNA는 서열번호 38, 39, 40, 41, 42, 또는 43으로 이루어진 군으로부터 선택되는 핵산 서열을 포함하는, 방법.
- 제21항 내지 제24항 중 어느 한 항에 있어서, dCas9는 dSaCas9인, 방법.
- 제21항 내지 제25항 중 어느 한 항에 있어서, 후성적 억제인자는 HP1α, HP1γ, HP1α 또는 HP1γ의 염색체 섀도우 도메인 및 C-말단 확장 영역, MeCP2 전사 억제 도메인 (TRD), 및 SUV39H1 SET 도메인으로 이루어진 군으로부터 선택되는, 방법.
- 제21항 내지 제26항 중 어느 한 항에 있어서, 융합 폴리펩타이드는 서열번호 1 내지 4 중 어느 하나를 포함하는 폴리뉴클레오타이드에 의해 인코딩되는, 방법.
- 제21항 내지 제27항 중 어느 한 항에 있어서, 폴리뉴클레오타이드는 서열번호 48 내지 55 중 어느 하나를 포함하는, 방법.
- 제21항 내지 제28항 중 어느 한 항에 있어서, 대상체는 포유류인, 방법.
- 제29항에 있어서, 포유류는 인간인, 방법.
- 이를 필요로 하는 대상체에서 FSHD를 치료하는 방법으로서, 상기 방법은 제10항 내지 제20항 중 어느 한 항의 벡터의 유효량을 대상체에게 투여하는 단계를 포함하는, 방법.
- 제31항에 있어서, 대상체는 포유류인, 방법.
- 제32항에 있어서, 포유류는 인간인, 방법.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US202063011476P | 2020-04-17 | 2020-04-17 | |
US63/011,476 | 2020-04-17 | ||
PCT/US2021/025940 WO2021211325A1 (en) | 2020-04-17 | 2021-04-06 | Crispr-inhibition for facioscapulohumeral muscular dystrophy |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20230003511A true KR20230003511A (ko) | 2023-01-06 |
Family
ID=78084611
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020227039447A Pending KR20230003511A (ko) | 2020-04-17 | 2021-04-06 | 안면견갑상완 근이영양증에 대한 crispr-억제 |
Country Status (11)
Country | Link |
---|---|
US (1) | US20230174958A1 (ko) |
EP (1) | EP4135778A4 (ko) |
JP (1) | JP2023522020A (ko) |
KR (1) | KR20230003511A (ko) |
CN (1) | CN115768487A (ko) |
AU (1) | AU2021257213A1 (ko) |
BR (1) | BR112022020945A2 (ko) |
CA (1) | CA3175625A1 (ko) |
IL (1) | IL297113A (ko) |
MX (1) | MX2022012965A (ko) |
WO (1) | WO2021211325A1 (ko) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
MX2022012265A (es) | 2020-04-02 | 2023-01-11 | Mirecule Inc | Inhibicion dirigida utilizando oligonucleotidos ingenieria. |
EP4558177A2 (en) * | 2022-07-20 | 2025-05-28 | Nevada Research & Innovation Corporation | Muscle-specific regulatory cassettes |
WO2025019820A1 (en) * | 2023-07-19 | 2025-01-23 | Nevada Research & Innovation Corporation | All in one vectors for the treatment of facioscapulohumeral muscular dystrophy |
CN117448380A (zh) * | 2023-12-22 | 2024-01-26 | 上海元戊医学技术有限公司 | iPSC来源的COL10A1蛋白低表达MSC细胞株的构建方法及其应用 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3192880B1 (en) * | 2010-08-18 | 2019-10-09 | Fred Hutchinson Cancer Research Center | Nucleic acid agents for use in treating facioscapulohumeral dystrophy (fshd) |
ES2765481T3 (es) * | 2013-12-12 | 2020-06-09 | Broad Inst Inc | Administración, uso y aplicaciones terapéuticas de los sistemas crispr-cas y composiciones para la edición genómica |
JP6626829B2 (ja) * | 2014-01-21 | 2019-12-25 | フレイエ ユニヴェルシテイト ブリュッセルVrije Universiteit Brussel | 筋特異的核酸調節エレメント並びにその方法及び使用 |
WO2018057863A1 (en) * | 2016-09-23 | 2018-03-29 | University Of Massachusetts | Silencing of dux4 by recombinant gene editing complexes |
WO2018085842A1 (en) * | 2016-11-07 | 2018-05-11 | University Of Massachusetts | Therapeutic targets for facioscapulohumeral muscular dystrophy |
US11674140B2 (en) * | 2017-09-07 | 2023-06-13 | The Children's Medical Center Corporation | Compositions and methods for treating facioscapulohumeral dystrophy |
MX2020003961A (es) * | 2017-10-05 | 2020-09-22 | Fulcrum Therapeutics Inc | Uso de inhibidores de p38 para reducir la expresion de dux4. |
-
2021
- 2021-04-06 WO PCT/US2021/025940 patent/WO2021211325A1/en active Application Filing
- 2021-04-06 BR BR112022020945A patent/BR112022020945A2/pt unknown
- 2021-04-06 AU AU2021257213A patent/AU2021257213A1/en active Pending
- 2021-04-06 KR KR1020227039447A patent/KR20230003511A/ko active Pending
- 2021-04-06 CN CN202180041592.XA patent/CN115768487A/zh active Pending
- 2021-04-06 EP EP21787712.5A patent/EP4135778A4/en active Pending
- 2021-04-06 IL IL297113A patent/IL297113A/en unknown
- 2021-04-06 MX MX2022012965A patent/MX2022012965A/es unknown
- 2021-04-06 CA CA3175625A patent/CA3175625A1/en active Pending
- 2021-04-06 US US17/919,198 patent/US20230174958A1/en active Pending
- 2021-04-06 JP JP2022562629A patent/JP2023522020A/ja active Pending
Also Published As
Publication number | Publication date |
---|---|
WO2021211325A1 (en) | 2021-10-21 |
CN115768487A (zh) | 2023-03-07 |
CA3175625A1 (en) | 2021-10-21 |
AU2021257213A1 (en) | 2022-11-03 |
IL297113A (en) | 2022-12-01 |
US20230174958A1 (en) | 2023-06-08 |
MX2022012965A (es) | 2023-01-18 |
JP2023522020A (ja) | 2023-05-26 |
BR112022020945A2 (pt) | 2022-12-27 |
EP4135778A1 (en) | 2023-02-22 |
EP4135778A4 (en) | 2024-05-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20240417757A1 (en) | Methods and compositions for modulating a genome | |
CN110418647B (zh) | Rna指导的核酸修饰酶及其使用方法 | |
JP2025066771A (ja) | サプレッサーtRNA及びデアミナーゼによる変異のRNAターゲティング | |
KR20230003511A (ko) | 안면견갑상완 근이영양증에 대한 crispr-억제 | |
US20200340012A1 (en) | Crispr-cas genome engineering via a modular aav delivery system | |
US20230250407A1 (en) | Silencing of dux4 by recombinant gene editing complexes | |
JP2021523739A (ja) | プログラム可能な塩基エディターシステムを用いて単一ヌクレオチド多型を編集する方法 | |
CA3110998A1 (en) | Rna and dna base editing via engneered adar recruitment | |
KR20210091160A (ko) | 면역요법을 위한 조성물 및 방법 | |
JP7631215B2 (ja) | Ttrガイドrnaと、rnaガイドdna結合剤をコードするポリヌクレオチドとを含む組成物および方法 | |
US20220098593A1 (en) | Splice acceptor site disruption of a disease-associated gene using adenosine deaminase base editors, including for the treatment of genetic disease | |
KR20220090512A (ko) | 액체암의 치료를 위한 조성물 및 방법 | |
KR20210127206A (ko) | 유전성 질환의 치료를 위한 것을 포함하는, 아데노신 데아미나제 염기 편집기를 사용하여 질환-관련 유전자를 편집하는 방법 | |
US20210322577A1 (en) | Methods and systems for modifying dna | |
US20230392132A1 (en) | Dual aav vector-mediated deletion of large mutational hotspot for treatment of duchenne muscular dystrophy | |
JP2023515710A (ja) | CRISPR媒介式エクソン欠失用の最適なgRNA対を発見するためのハイスループットスクリーニング法 | |
JP2023515709A (ja) | 筋肉特異的プロモーターをコードするaavベクターを使用するインビボでの衛星細胞の遺伝子編集 | |
JP2020527030A (ja) | 肝臓において目的のタンパク質を発現するためのプラットフォーム | |
AU2016373365A1 (en) | Transposon system, kit comprising the same, and uses thereof | |
JP7667595B2 (ja) | Aqp1 RNAを標的とするsgRNA及びそのベクターと使用 | |
CN119256086A (zh) | 工程化基因效应因子、组合物及其使用方法 | |
TW202112797A (zh) | 經由靶向lama1基因治療肌肉萎縮症的方法 | |
CN117580941A (zh) | 多重CRISPR/Cas9介导的靶基因激活系统 | |
WO2022115579A1 (en) | Mammalian mobile element compositions, systems and therapeutic applications | |
US9816077B2 (en) | Use of integrase for targeted gene expression |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PA0105 | International application |
Patent event date: 20221110 Patent event code: PA01051R01D Comment text: International Patent Application |
|
PG1501 | Laying open of application | ||
A201 | Request for examination | ||
PA0201 | Request for examination |
Patent event code: PA02012R01D Patent event date: 20240405 Comment text: Request for Examination of Application |