[go: up one dir, main page]

KR20220035107A - Arsa 유전자 전달을 위한 아데노-연관 바이러스 조성물 및 이의 사용 방법 - Google Patents

Arsa 유전자 전달을 위한 아데노-연관 바이러스 조성물 및 이의 사용 방법 Download PDF

Info

Publication number
KR20220035107A
KR20220035107A KR1020227000707A KR20227000707A KR20220035107A KR 20220035107 A KR20220035107 A KR 20220035107A KR 1020227000707 A KR1020227000707 A KR 1020227000707A KR 20227000707 A KR20227000707 A KR 20227000707A KR 20220035107 A KR20220035107 A KR 20220035107A
Authority
KR
South Korea
Prior art keywords
amino acid
seq
capsid protein
protein corresponding
gly
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
KR1020227000707A
Other languages
English (en)
Inventor
마틴 티아 바보발 세인트
앨버트 반즈 세이무어
힐러드 루빈
Original Assignee
호몰로지 메디슨, 인크.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 호몰로지 메디슨, 인크. filed Critical 호몰로지 메디슨, 인크.
Publication of KR20220035107A publication Critical patent/KR20220035107A/ko
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/86Viral vectors
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K67/00Rearing or breeding animals, not otherwise provided for; New or modified breeds of animals
    • A01K67/027New or modified breeds of vertebrates
    • A01K67/0275Genetically modified vertebrates, e.g. transgenic
    • A01K67/0276Knock-out vertebrates
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • A61K48/005Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'active' part of the composition delivered, i.e. the nucleic acid delivered
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P25/00Drugs for disorders of the nervous system
    • A61P25/28Drugs for disorders of the nervous system for treating neurodegenerative disorders of the central nervous system, e.g. nootropic agents, cognition enhancers, drugs for treating Alzheimer's disease or other forms of dementia
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2217/00Genetically modified animals
    • A01K2217/07Animals genetically altered by homologous recombination
    • A01K2217/075Animals genetically altered by homologous recombination inducing loss of function, i.e. knock out
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2227/00Animals characterised by species
    • A01K2227/10Mammal
    • A01K2227/105Murine
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2267/00Animals characterised by purpose
    • A01K2267/03Animal model, e.g. for test or diseases
    • A01K2267/0306Animal model for genetic diseases
    • A01K2267/0318Animal model for neurodegenerative disease, e.g. non- Alzheimer's
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14111Dependovirus, e.g. adenoassociated viruses
    • C12N2750/14122New viral proteins or individual genes, new structural or functional aspects of known viral proteins or genes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14111Dependovirus, e.g. adenoassociated viruses
    • C12N2750/14141Use of virus, viral particle or viral elements as a vector
    • C12N2750/14143Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y301/00Hydrolases acting on ester bonds (3.1)
    • C12Y301/06Sulfuric ester hydrolases (3.1.6)
    • C12Y301/06001Arylsulfatase (3.1.6.1)

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Organic Chemistry (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Medicinal Chemistry (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • Animal Behavior & Ethology (AREA)
  • Veterinary Medicine (AREA)
  • Neurosurgery (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Microbiology (AREA)
  • Neurology (AREA)
  • Public Health (AREA)
  • General Chemical & Material Sciences (AREA)
  • Plant Pathology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Psychiatry (AREA)
  • Hospice & Palliative Care (AREA)
  • Epidemiology (AREA)
  • Virology (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Environmental Sciences (AREA)
  • Animal Husbandry (AREA)
  • Biodiversity & Conservation Biology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Peptides Or Proteins (AREA)
  • Medicines Containing Material From Animals Or Micro-Organisms (AREA)

Abstract

세포에서 아릴술파타아제 A(ARSA) 폴리펩티드를 발현하여 ARSA 유전자 기능을 회복시킬 수 있는 아데노-연관 바이러스(AAV) 조성물이 본원에 제공된다. 또한, AAV 조성물을 사용하는 방법, 및 AAV 조성물을 제조하기 위한 포장 시스템이 제공된다.

Description

ARSA 유전자 전달을 위한 아데노-연관 바이러스 조성물 및 이의 사용 방법
관련 출원에 대한 상호 참조
본 출원은, 2019년 6월 10일에 출원된 미국 가출원 제62/859,539호, 2019년 6월 25일에 출원된 미국 가출원 제62/866,374호, 2019년 10월 15일에 출원된 미국 가출원 제62/915,523호, 2020년 1월 13일에 출원된 미국 가출원 제62/960,487호, 2020년 3월 10일에 출원된 미국 가출원 제62/987,858호, 및 2020년 4월 16일에 출원된 미국 가출원 제63/010,970호의 이익을 주장하며, 이들 각각은 그 전체가 참조로서 본원에 통합된다.
서열 목록
본 출원은 ASCII 포맷으로 전자적으로 제출된 서열 목록을 포함하며, 그 전체가 본원에 참조로서 통합된다(전술한 ASCII 사본은 2020년 4월 16일에 생성되었고, "705151_HMW-030-6_ST25.txt"로 명명되며, 크기는 295,995바이트임).
이염색 백색질장애(Metachromatic leukodystrophy, MLD)는 충족되지 않은 의학적 요구가 높은 치명적인 리소좀 축적 장애이다. 이러한 신경퇴행성 질환은 3가지 형태(후기 영아, 청소년 및 성인)로 발생하며 리소좀 효소 아릴술파타아제-A(ARSA)의 결핍으로 인한 것이다. ARSA는 리소좀이라 불리는 세포 구조에 위치하며, 술파타이드를 분해하는 데 도움을 준다. 이러한 효소의 결여는 뇌, 척수 및 말초 기관에 술파타이드의 큰 축적을 초래하며, 이는 신경 섬유의 주요 보호층인 수초(myelin)의 심각한 손상을 초래한다. 수초 생성 세포에서의 술파타이드 축적은 근육 및 촉각, 통증, 열 및 소리와 같은 감각을 감지하는 감각 세포에 뇌, 척수 및 뇌와 척수를 근육 및 감각 세포에 연결하는 신경을 포함하는 신경계 전체에 걸쳐 백색질의 점진적인 파괴를 야기한다. 따라서, MLD는 중추 신경계, 및 이어서 말초 신경계의 진행성 축삭 탈수초화를 특징으로 한다. 이는 획득된 기능 및/또는 기술의 상실, 근긴장 저하, 운동실조, 발작, 실명, 난청, 및 예기치 않은 사망을 초래한다.
이염색 백색질장애를 앓고 있는 사람의 경우, 백색질 손상은 지적 기능 및 보행 능력과 같은 운동 기술의 점진적인 저하를 야기한다. 또한, 영향을 받은 개인은 사지 감각 상실, 요실금, 발작, 마비, 실어증, 실명 및 난청이 발생한다. 결국, 이러한 개인은 주변 환경에 대한 인식을 상실하고 반응하지 않게 된다. 신경학적 문제는 이염색 백색질장애의 주요 특징이지만, 다른 기관 및 조직에 대한 술파타이드 축적의 영향이 보고되었으며, 가장 빈번하게는 담낭과 관련이 있다.
MLD는 여러 가지 치료로 관리할 수 있다. 예를 들어, MLD의 징후 및 증상을 감소시키고 관련 통증을 완화시키는 약물. 조혈 줄기 세포 이식은 건강한 세포를 도입하여 병든 세포를 대체함으로써 MLD의 진행을 지연시키는 것으로 나타났다. 다른 치료는 근육 및 관절 유연성을 촉진하고 운동 범위를 유지하기 위한 물리치료, 작업치료 및 언어치료를 포함한다. 그러나, MLD에 대한 치료법은 없다.
MLD를 가진 대부분의 개인은 아릴술파타아제 A(ARSA) 유전자에 돌연변이를 가지며, MLD를 유발하는 110개 이상의 구별되는 ARSA 돌연변이가 식별되었다. 담체 돌연변이는 100명 중 1명에서 발견되었으며, 미국에서는 40,000명 중 1명, 또는 전 세계적으로는 160,000명 중 1명에게 영향을 미친다.
유전자 요법은 MLD를 치유할 수 있는 특별한 기회를 제공한다. 렌티바이러스 벡터를 포함하는 레트로바이러스 벡터는 핵산을 숙주 세포 게놈 내로 통합시킬 수 있고, 게놈 내로 그의 비표적화된 삽입으로 인한 안전성 우려를 제기할 수 있다. 예를 들어, 벡터는 종양 억제 유전자를 교란시키거나 종양 유전자를 활성화시켜 악성 종양을 유발할 위험이 있다. 실제로, CD34+ 골수 전구체를 감마레트로바이러스 벡터로 형질도입함으로써 X-염색체 연관 중증 복합 면역결핍(SCID)을 치료하기 위한 임상시험에서, 10명의 환자 중 4명에서 백혈병이 발생했다(Hacein-Bey-Abina 등, J Clin Invest. (2008) 118(9):3132-42). 반면, 비통합 벡터는 종종 불충분한 발현 수준 또는 생체 내 부적절한 발현 지속시간을 겪는다.
따라서, MLD 환자에서 ARSA 유전자 기능을 효율적이고 안전하게 복원할 수 있는 개선된 유전자 요법 조성물 및 방법이 당업계에 필요하다.
본원에서는, 세포에서 ARSA 유전자 기능을 복원할 수 있는 아데노-관련 바이러스(AAV) 조성물, 및 ARSA 유전자 기능의 감소와 연관된 질환(예를 들어, MLD)을 치료하기 위해 이를 사용하는 방법이 제공된다. 또한, 아데노-관련 바이러스 조성물을 제조하기 위한 패키징 시스템이 제공된다.
따라서, 일 양태에서, 본 개시는 세포에서 아릴술파타아제 A(ARSA) 폴리펩티드를 발현시키는 방법을 제공하며, 방법은, (a) AAV 캡시드 단백질(예를 들어, 클레이드 F 캡시드 단백질)을 포함하는 AAV 캡시드; 및 (b) 침묵적으로 변형된 ARSA 코딩 서열에 작동 가능하게 연결된 전사 조절 요소를 포함하는 전달 게놈을 포함하는, 재조합 아데노-연관 바이러스(rAAV)로 세포를 형질도입하는 단계를 포함한다.
특정 구현예에서, 세포는 뉴런 및/또는 신경교세포이다. 특정 구현예에서, 세포는 중추 신경계 및/또는 말초 신경계의 뉴런 및/또는 신경교세포이다. 특정 구현예에서, 세포는 척수, 운동 피질, 감각 피질, 해마, 피각, 소뇌, 선택적으로 소뇌 핵, 및 이들의 임의의 조합으로 이루어진 군으로부터 선택된 중추 신경계 영역의 세포이다. 특정 구현예에서, 세포는 운동 뉴런, 성상교세포, 희소돌기교세포, 중추 신경계의 대뇌 피질의 세포, 말초 신경계의 감각 뉴런, 슈반(Schwann) 세포, 및 이들의 임의의 조합으로 이루어진 군으로부터 선택된 세포이다. 특정 구현예에서, 세포는 포유류 대상체에 존재하고, AAV는 대상체에서 세포를 형질도입하기에 효과적인 양으로 대상체에게 투여된다.
또 다른 양태에서, 본 개시는 이염색 백색질장애(MLD)를 앓고 있는 대상체를 치료하는 방법을 제공하며, 방법은 (a) AAV 캡시드 단백질을 포함하는 AAV 캡시드(예를 들어, 클레이드 F 캡시드 단백질), 및 (b) 침묵적으로 변형된 ARSA 코딩 서열에 작동 가능하게 연결된 전사 조절 요소를 포함하는 전달 게놈을 포함하는 rAAV의 유효량을 대상체에게 투여하는 단계를 포함한다.
특정 구현예에서, 침묵적으로 변형된 ARSA 코딩 서열은 서열번호 23에 제시된 아미노산 서열을 암호화한다. 특정 구현예에서, 침묵적으로 변형된 ARSA 코딩 서열은 서열번호 14, 62, 또는 72에 제시된 뉴클레오티드 서열을 포함한다.
특정 구현예에서, 전사 조절 요소는 시토메갈로바이러스(CMV) 인핸서 요소, 닭-β-액틴(CBA) 프로모터, 작은 닭-β-액틴(SmCBA) 프로모터, 칼모둘린 1(CALM1) 프로모터, 프로테오리피드 단백질 1(PLP1) 프로모터, 신경교 섬유소 산성 단백질(GFAP) 프로모터, 시냅신 2(SYN2) 프로모터, 메탈로티오네인 3(MT3) 프로모터, 및 이들의 임의의 조합으로 이루어진 군으로부터 선택된 하나 이상의 요소를 포함한다. 특정 구현예에서, 전사 조절 요소는 서열번호 25, 32, 36, 54, 55 및 58로 이루어진 군으로부터 선택되는 서열과 적어도 90% 동일한 뉴클레오티드 서열을 포함한다. 특정 구현예에서, 전사 조절 요소는 서열번호 25, 32, 36, 54, 55 및 58로 이루어진 군으로부터 선택되는 뉴클레오티드 서열을 포함한다. 특정 구현예에서, 전사 조절 요소는 서열번호 58, 25 및 32에 제시된 5'로부터 3'까지의 뉴클레오티드 서열을 포함한다. 특정 구현예에서, 전사 조절 요소는 서열번호 36에 제시된 뉴클레오티드 서열을 포함한다.
특정 구현예에서, 전달 게놈은 침묵적으로 변형된 ARSA 코딩 서열에 대한 폴리아데닐화 서열 3'을 추가로 포함한다. 특정 구현예에서, 폴리아데닐화 서열은 외인성 폴리아데닐화 서열이다. 특정 구현예에서, 외인성 폴리아데닐화 서열은 SV40 폴리아데닐화 서열이다. 특정 구현예에서, SV40 폴리아데닐화 서열은 서열번호 42에 제시된 뉴클레오티드 서열을 포함한다.
특정 구현예에서, 전달 게놈은 스터퍼(stuffer) 서열을 추가로 포함한다. 특정 구현예에서, 전달 게놈은 침묵적으로 변형된 ARSA 코딩 서열에 대한 스터퍼 서열 3'을 추가로 포함한다. 소정의 구현예에서, 스터퍼 서열은 폴리아데닐화 서열에 대해 3'이다.
소정의 구현예에서, 전달 게놈은 서열번호 41, 44, 46, 65, 67, 및 75로 이루어진 군으로부터 선택되는 서열을 포함한다.
특정 구현예에서, 전달 게놈은 게놈의 5' 역위 말단 반복(5' ITR) 뉴클레오티드 서열 5', 및 게놈의 3' 역위 말단 반복(3' ITR) 뉴클레오티드 서열 3'을 추가로 포함한다. 특정 구현예에서, 5' ITR 뉴클레오티드 서열은 서열번호 18과 적어도 95%의 서열 동일성을 갖고, 3' ITR 뉴클레오티드 서열은 서열번호 19와 적어도 95%의 서열 동일성을 갖는다. 특정 구현예에서, 5' ITR 뉴클레오티드 서열은 서열번호 26과 적어도 95%의 서열 동일성을 갖고, 3' ITR 뉴클레오티드 서열은 서열번호 27과 적어도 95%의 서열 동일성을 갖는다. 특정 구현예에서, 5' ITR 뉴클레오티드 서열은 서열번호 18과 적어도 95%의 서열 동일성을 갖고, 3' ITR 뉴클레오티드 서열은 서열번호 57과 적어도 95%의 서열 동일성을 갖는다.
특정 구현예에서, 전달 게놈은 서열번호 47, 48, 49, 68, 69, 및 76으로 이루어진 군으로부터 선택되는 뉴클레오티드 서열을 포함한다.
특정 구현예에서, 이염색 백색질장애는 아릴술파타아제 A(ARSA) 유전자 돌연변이와 연관된다. 특정 구현예에서, 대상체는 인간 대상체이다.
특정 구현예에서, 캡시드 단백질은 서열번호 2, 3, 4, 6, 7, 10, 11, 12, 13, 15, 16, 또는 17의 아미노산 203 내지 736의 아미노산 서열과 적어도 95% 서열 동일성을 갖는 아미노산 서열을 포함한다. 특정 구현예에서, 서열번호 16의 아미노산 206에 상응하는 캡시드 단백질 중의 아미노산은 C이고; 서열번호 16의 아미노산 296에 상응하는 캡시드 단백질 중의 아미노산은 H이고; 서열번호 16의 아미노산 312에 상응하는 캡시드 단백질 중의 아미노산은 Q이고; 서열번호 16의 아미노산 346에 상응하는 캡시드 단백질 중의 아미노산은 A이고; 서열번호 16의 아미노산 464에 상응하는 캡시드 단백질 중의 아미노산은 N이고; 서열번호 16의 아미노산 468에 상응하는 캡시드 단백질 중의 아미노산은 S이고; 서열번호 16의 아미노산 501에 상응하는 캡시드 단백질 중의 아미노산은 I이고; 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질 중의 아미노산은 R이고; 서열번호 16의 아미노산 590에 상응하는 캡시드 단백질 중의 아미노산은 R이고; 서열번호 16의 아미노산 626에 상응하는 캡시드 단백질 중의 아미노산은 G 또는 Y이고; 서열번호 16의 아미노산 681에 상응하는 캡시드 단백질 중의 아미노산은 M이고; 서열번호 16의 아미노산 687에 상응하는 캡시드 단백질 중의 아미노산은 R이고; 서열번호 16의 아미노산 690에 상응하는 캡시드 단백질 중의 아미노산은 K이고; 서열번호 16의 아미노산 706에 상응하는 캡시드 단백질 중의 아미노산은 C이고; 또는, 서열번호 16의 아미노산 718에 상응하는 캡시드 단백질 중의 아미노산은 G이다.
특정 구현예에서, (a) 서열번호 16의 아미노산 626에 상응하는 캡시드 단백질 중의 아미노산은 G, 서열번호 16의 아미노산 718에 상응하는 캡시드 단백질 중의 아미노산은 G이고; (b) 서열번호 16의 아미노산 296에 상응하는 캡시드 단백질 중의 아미노산은 H, 서열번호 16의 아미노산 464에 상응하는 캡시드 단백질 중의 아미노산은 N, 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질 중의 아미노산은 R, 서열번호 16의 아미노산 681에 상응하는 캡시드 단백질 중의 아미노산은 M이고; (c) 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질 중의 아미노산은 R, 서열번호 16의 아미노산 687에 상응하는 캡시드 단백질 중의 아미노산은 R이고; (d) 서열번호 16의 아미노산 346에 상응하는 캡시드 단백질 중의 아미노산은 A, 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질 중의 아미노산은 R이고; 또는 (e) 서열번호 16의 아미노산 501에 상응하는 캡시드 단백질 중의 아미노산은 I, 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질 중의 아미노산은 R, 서열번호 16의 아미노산 706에 상응하는 캡시드 단백질 중의 아미노산은 C이다.
특정 구현예에서, 캡시드 단백질은 서열번호 2, 3, 4, 6, 7, 10, 11, 12, 13, 15, 16, 또는 17의 아미노산 203 내지 736의 아미노산 서열을 포함한다.
특정 구현예에서, 캡시드 단백질은 서열번호 2, 3, 4, 5, 6, 7, 9, 10, 11, 12, 13, 15, 16, 또는 17의 아미노산 138 내지 736의 아미노산 서열과 적어도 95% 서열 동일성을 갖는 아미노산 서열을 포함한다. 특정 구현예에서, 서열번호 16의 아미노산 151에 상응하는 캡시드 단백질 중의 아미노산은 R이고; 서열번호 16의 아미노산 160에 상응하는 캡시드 단백질 중의 아미노산은 D이고; 서열번호 16의 아미노산 206에 상응하는 캡시드 단백질 중의 아미노산은 C이고; 서열번호 16의 아미노산 296에 상응하는 캡시드 단백질 중의 아미노산은 H이고; 서열번호 16의 아미노산 312에 상응하는 캡시드 단백질 중의 아미노산은 Q이고; 서열번호 16의 아미노산 346에 상응하는 캡시드 단백질 중의 아미노산은 A이고; 서열번호 16의 아미노산 464에 상응하는 캡시드 단백질 중의 아미노산은 N이고; 서열번호 16의 아미노산 468에 상응하는 캡시드 단백질 중의 아미노산은 S이고; 서열번호 16의 아미노산 501에 상응하는 캡시드 단백질 중의 아미노산은 I이고; 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질 중의 아미노산은 R이고; 서열번호 16의 아미노산 590에 상응하는 캡시드 단백질 중의 아미노산은 R이고; 서열번호 16의 아미노산 626에 상응하는 캡시드 단백질 중의 아미노산은 G 또는 Y이고; 서열번호 16의 아미노산 681에 상응하는 캡시드 단백질 중의 아미노산은 M이고; 서열번호 16의 아미노산 687에 상응하는 캡시드 단백질 중의 아미노산은 R이고; 서열번호 16의 아미노산 690에 상응하는 캡시드 단백질 중의 아미노산은 K이고; 서열번호 16의 아미노산 706에 상응하는 캡시드 단백질 중의 아미노산은 C이고; 또는, 서열번호 16의 아미노산 718에 상응하는 캡시드 단백질 중의 아미노산은 G이다.
특정 구현예에서, (a) 서열번호 16의 아미노산 626에 상응하는 캡시드 단백질 중의 아미노산은 G, 서열번호 16의 아미노산 718에 상응하는 캡시드 단백질 중의 아미노산은 G이고; (b) 서열번호 16의 아미노산 296에 상응하는 캡시드 단백질 중의 아미노산은 H, 서열번호 16의 아미노산 464에 상응하는 캡시드 단백질 중의 아미노산은 N, 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질 중의 아미노산은 R, 서열번호 16의 아미노산 681에 상응하는 캡시드 단백질 중의 아미노산은 M이고; (c) 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질 중의 아미노산은 R, 서열번호 16의 아미노산 687에 상응하는 캡시드 단백질 중의 아미노산은 R이고; (d) 서열번호 16의 아미노산 346에 상응하는 캡시드 단백질 중의 아미노산은 A, 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질 중의 아미노산은 R이고; 또는 (e) 서열번호 16의 아미노산 501에 상응하는 캡시드 단백질 중의 아미노산은 I, 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질 중의 아미노산은 R, 서열번호 16의 아미노산 706에 상응하는 캡시드 단백질 중의 아미노산은 C이다.
특정 구현예에서, 캡시드 단백질은 서열번호 2, 3, 4, 5, 6, 7, 9, 10, 11, 12, 13, 15, 16, 또는 17의 아미노산 138 내지 736의 아미노산 서열을 포함한다.
특정 구현예에서, 캡시드 단백질은 서열번호 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 15, 16, 또는 17의 아미노산 1 내지 736의 아미노산 서열과 적어도 95% 서열 동일성을 갖는 아미노산 서열을 포함한다. 특정 구현예에서, 서열번호 16의 아미노산 2에 상응하는 캡시드 단백질 중의 아미노산은 T이고; 서열번호 16의 아미노산 65에 상응하는 캡시드 단백질 중의 아미노산은 I이고; 서열번호 16의 아미노산 68에 상응하는 캡시드 단백질 중의 아미노산은 V이고; 서열번호 16의 아미노산 77에 상응하는 캡시드 단백질 중의 아미노산은 R이고; 서열번호 16의 아미노산 119에 상응하는 캡시드 단백질 중의 아미노산은 L이고; 서열번호 16의 아미노산 151에 상응하는 캡시드 단백질 중의 아미노산은 R이고; 서열번호 16의 아미노산 160에 상응하는 캡시드 단백질 중의 아미노산은 D이고; 서열번호 16의 아미노산 206에 상응하는 캡시드 단백질 중의 아미노산은 C이고; 서열번호 16의 아미노산 296에 상응하는 캡시드 단백질 중의 아미노산은 H이고; 서열번호 16의 아미노산 312에 상응하는 캡시드 단백질 중의 아미노산은 Q이고; 서열번호 16의 아미노산 346에 상응하는 캡시드 단백질 중의 아미노산은 A이고; 서열번호 16의 아미노산 464에 상응하는 캡시드 단백질 중의 아미노산은 N이고; 서열번호 16의 아미노산 468에 상응하는 캡시드 단백질 중의 아미노산은 S이고; 서열번호 16의 아미노산 501에 상응하는 캡시드 단백질 중의 아미노산은 I이고; 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질 중의 아미노산은 R이고; 서열번호 16의 아미노산 590에 상응하는 캡시드 단백질 중의 아미노산은 R이고; 서열번호 16의 아미노산 626에 상응하는 캡시드 단백질 중의 아미노산은 G 또는 Y이고; 서열번호 16의 아미노산 681에 상응하는 캡시드 단백질 중의 아미노산은 M이고; 서열번호 16의 아미노산 687에 상응하는 캡시드 단백질 중의 아미노산은 R이고; 서열번호 16의 아미노산 690에 상응하는 캡시드 단백질 중의 아미노산은 K이고; 서열번호 16의 아미노산 706에 상응하는 캡시드 단백질 중의 아미노산은 C이고; 또는, 서열번호 16의 아미노산 718에 상응하는 캡시드 단백질 중의 아미노산은 G이다.
특정 구현예에서, (a) 서열번호 16의 아미노산 2에 상응하는 캡시드 단백질 중의 아미노산은 T, 서열번호 16의 아미노산 312에 상응하는 캡시드 단백질 중의 아미노산은 Q이고; (b) 서열번호 16의 아미노산 65에 상응하는 캡시드 단백질 중의 아미노산은 I, 서열번호 16의 아미노산 626에 상응하는 캡시드 단백질 중의 아미노산은 Y이고; (c) 서열번호 16의 아미노산 77에 상응하는 캡시드 단백질 중의 아미노산은 R, 서열번호 16의 아미노산 690에 상응하는 캡시드 단백질 중의 아미노산은 K이고; (d) 서열번호 16의 아미노산 119에 상응하는 캡시드 단백질 중의 아미노산은 L, 서열번호 16의 아미노산 468에 상응하는 캡시드 단백질 중의 아미노산은 S이고; (e) 서열번호 16의 아미노산 626에 상응하는 캡시드 단백질 중의 아미노산은 G, 서열번호 16의 아미노산 718에 상응하는 캡시드 단백질 중의 아미노산은 G이고; (f) 서열번호 16의 아미노산 296에 상응하는 캡시드 단백질 중의 아미노산은 H, 서열번호 16의 아미노산 464에 상응하는 캡시드 단백질 중의 아미노산은 N, 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질 중의 아미노산은 R, 서열번호 16의 아미노산 681에 상응하는 캡시드 단백질 중의 아미노산은 M이고; (g) 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질 중의 아미노산은 R, 서열번호 16의 아미노산 687에 상응하는 캡시드 단백질 중의 아미노산은 R이고; (h) 서열번호 16의 아미노산 346에 상응하는 캡시드 단백질 중의 아미노산은 A, 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질 중의 아미노산은 R이고; 또는 (i) 서열번호 16의 아미노산 501에 상응하는 캡시드 단백질 중의 아미노산은 I, 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질 중의 아미노산은 R, 서열번호 16의 아미노산 706에 상응하는 캡시드 단백질 중의 아미노산은 C이다.
특정 구현예에서, 캡시드 단백질은 서열번호 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 15, 16, 또는 17의 아미노산 1 내지 736의 아미노산 서열을 포함한다.
또 다른 양태에서, 본 개시는, (a) AAV 캡시드 단백질을 포함하는 AAV 캡시드(예를 들어, 클레이드 F 캡시드 단백질), 및 (b) 침묵적으로 변형된 ARSA 코딩 서열에 작동 가능하게 연결된 전사 조절 요소를 포함하는 전달 게놈을 포함하는 rAAV를 제공한다.
특정 구현예에서, 침묵적으로 변형된 ARSA 코딩 서열은 서열번호 23에 제시된 아미노산 서열을 암호화한다. 특정 구현예에서, 침묵적으로 변형된 ARSA 코딩 서열은 서열번호 14에 제시된 뉴클레오티드 서열을 포함한다. 특정 구현예에서, 침묵적으로 변형된 ARSA 코딩 서열은 서열번호 62 또는 72에 제시된 뉴클레오티드 서열을 포함한다.
특정 구현예에서, 전사 조절 요소는 시토메갈로바이러스(CMV) 인핸서 요소, 닭-β-액틴(CBA) 프로모터, 작은 닭-β-액틴(SmCBA) 프로모터, 칼모둘린 1(CALM1) 프로모터, 프로테오리피드 단백질 1(PLP1) 프로모터, 신경교 섬유소 산성 단백질(GFAP) 프로모터, 시냅신 2(SYN2) 프로모터, 메탈로티오네인 3(MT3) 프로모터, 및 이들의 임의의 조합으로 이루어진 군으로부터 선택된 하나 이상의 요소를 포함한다. 특정 구현예에서, 전사 조절 요소는 서열번호 25, 32, 36, 54, 55 및 58로 이루어진 군으로부터 선택되는 서열과 적어도 90% 동일한 뉴클레오티드 서열을 포함한다. 특정 구현예에서, 전사 조절 요소는 서열번호 25, 32, 36, 54, 55 및 58로 이루어진 군으로부터 선택되는 뉴클레오티드 서열을 포함한다. 특정 구현예에서, 전사 조절 요소는 서열번호 58, 25 및 32에 제시된 5'로부터 3'까지의 뉴클레오티드 서열을 포함한다. 특정 구현예에서, 전사 조절 요소는 서열번호 36에 제시된 뉴클레오티드 서열을 포함한다.
특정 구현예에서, 전달 게놈은 침묵적으로 변형된 ARSA 코딩 서열에 대한 폴리아데닐화 서열 3'을 추가로 포함한다. 특정 구현예에서, 폴리아데닐화 서열은 외인성 폴리아데닐화 서열이다. 특정 구현예에서, 외인성 폴리아데닐화 서열은 SV40 폴리아데닐화 서열이다. 특정 구현예에서, SV40 폴리아데닐화 서열은 서열번호 42에 제시된 뉴클레오티드 서열을 포함한다.
소정의 구현예에서, 전달 게놈은 서열번호 41, 44, 46, 65, 67, 및 75로 이루어진 군으로부터 선택되는 서열을 포함한다.
특정 구현예에서, 전달 게놈은 게놈의 5' 역위 말단 반복(5' ITR) 뉴클레오티드 서열 5', 및 게놈의 3' 역위 말단 반복(3' ITR) 뉴클레오티드 서열 3'을 추가로 포함한다. 특정 구현예에서, 5' ITR 뉴클레오티드 서열은 서열번호 18과 적어도 95%의 서열 동일성을 갖고, 3' ITR 뉴클레오티드 서열은 서열번호 19와 적어도 95%의 서열 동일성을 갖는다.
특정 구현예에서, 전달 게놈은 서열번호 47, 48, 49, 68, 69, 및 76으로 이루어진 군으로부터 선택되는 뉴클레오티드 서열을 포함한다. 특정 구현예에서, 전달 게놈의 뉴클레오티드 서열은 서열번호 47, 48, 49, 68, 69, 및 76으로 이루어진 군으로부터 선택되는 뉴클레오티드 서열로 이루어진다. 특정 구현예에서, 전달 게놈의 뉴클레오티드 서열은 서열번호 48에 제시된 뉴클레오티드 서열을 포함한다.
특정 구현예에서, 캡시드 단백질은 서열번호 2, 3, 4, 6, 7, 10, 11, 12, 13, 15, 16, 또는 17의 아미노산 203 내지 736의 아미노산 서열과 적어도 95% 서열 동일성을 갖는 아미노산 서열을 포함한다. 특정 구현예에서, 서열번호 16의 아미노산 206에 상응하는 캡시드 단백질 중의 아미노산은 C이고; 서열번호 16의 아미노산 296에 상응하는 캡시드 단백질 중의 아미노산은 H이고; 서열번호 16의 아미노산 312에 상응하는 캡시드 단백질 중의 아미노산은 Q이고; 서열번호 16의 아미노산 346에 상응하는 캡시드 단백질 중의 아미노산은 A이고; 서열번호 16의 아미노산 464에 상응하는 캡시드 단백질 중의 아미노산은 N이고; 서열번호 16의 아미노산 468에 상응하는 캡시드 단백질 중의 아미노산은 S이고; 서열번호 16의 아미노산 501에 상응하는 캡시드 단백질 중의 아미노산은 I이고; 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질 중의 아미노산은 R이고; 서열번호 16의 아미노산 590에 상응하는 캡시드 단백질 중의 아미노산은 R이고; 서열번호 16의 아미노산 626에 상응하는 캡시드 단백질 중의 아미노산은 G 또는 Y이고; 서열번호 16의 아미노산 681에 상응하는 캡시드 단백질 중의 아미노산은 M이고; 서열번호 16의 아미노산 687에 상응하는 캡시드 단백질 중의 아미노산은 R이고; 서열번호 16의 아미노산 690에 상응하는 캡시드 단백질 중의 아미노산은 K이고; 서열번호 16의 아미노산 706에 상응하는 캡시드 단백질 중의 아미노산은 C이고; 또는, 서열번호 16의 아미노산 718에 상응하는 캡시드 단백질 중의 아미노산은 G이다.
특정 구현예에서, (a) 서열번호 16의 아미노산 626에 상응하는 캡시드 단백질 중의 아미노산은 G, 서열번호 16의 아미노산 718에 상응하는 캡시드 단백질 중의 아미노산은 G이고; (b) 서열번호 16의 아미노산 296에 상응하는 캡시드 단백질 중의 아미노산은 H, 서열번호 16의 아미노산 464에 상응하는 캡시드 단백질 중의 아미노산은 N, 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질 중의 아미노산은 R, 서열번호 16의 아미노산 681에 상응하는 캡시드 단백질 중의 아미노산은 M이고; (c) 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질 중의 아미노산은 R, 서열번호 16의 아미노산 687에 상응하는 캡시드 단백질 중의 아미노산은 R이고; (d) 서열번호 16의 아미노산 346에 상응하는 캡시드 단백질 중의 아미노산은 A, 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질 중의 아미노산은 R이고; 또는 (e) 서열번호 16의 아미노산 501에 상응하는 캡시드 단백질 중의 아미노산은 I, 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질 중의 아미노산은 R, 서열번호 16의 아미노산 706에 상응하는 캡시드 단백질 중의 아미노산은 C이다.
특정 구현예에서, 캡시드 단백질은 서열번호 2, 3, 4, 6, 7, 10, 11, 12, 13, 15, 16, 또는 17의 아미노산 203 내지 736의 아미노산 서열을 포함한다.
특정 구현예에서, 캡시드 단백질은 서열번호 2, 3, 4, 5, 6, 7, 9, 10, 11, 12, 13, 15, 16, 또는 17의 아미노산 138 내지 736의 아미노산 서열과 적어도 95% 서열 동일성을 갖는 아미노산 서열을 포함한다. 특정 구현예에서, 서열번호 16의 아미노산 151에 상응하는 캡시드 단백질 중의 아미노산은 R이고; 서열번호 16의 아미노산 160에 상응하는 캡시드 단백질 중의 아미노산은 D이고; 서열번호 16의 아미노산 206에 상응하는 캡시드 단백질 중의 아미노산은 C이고; 서열번호 16의 아미노산 296에 상응하는 캡시드 단백질 중의 아미노산은 H이고; 서열번호 16의 아미노산 312에 상응하는 캡시드 단백질 중의 아미노산은 Q이고; 서열번호 16의 아미노산 346에 상응하는 캡시드 단백질 중의 아미노산은 A이고; 서열번호 16의 아미노산 464에 상응하는 캡시드 단백질 중의 아미노산은 N이고; 서열번호 16의 아미노산 468에 상응하는 캡시드 단백질 중의 아미노산은 S이고; 서열번호 16의 아미노산 501에 상응하는 캡시드 단백질 중의 아미노산은 I이고; 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질 중의 아미노산은 R이고; 서열번호 16의 아미노산 590에 상응하는 캡시드 단백질 중의 아미노산은 R이고; 서열번호 16의 아미노산 626에 상응하는 캡시드 단백질 중의 아미노산은 G 또는 Y이고; 서열번호 16의 아미노산 681에 상응하는 캡시드 단백질 중의 아미노산은 M이고; 서열번호 16의 아미노산 687에 상응하는 캡시드 단백질 중의 아미노산은 R이고; 서열번호 16의 아미노산 690에 상응하는 캡시드 단백질 중의 아미노산은 K이고; 서열번호 16의 아미노산 706에 상응하는 캡시드 단백질 중의 아미노산은 C이고; 또는, 서열번호 16의 아미노산 718에 상응하는 캡시드 단백질 중의 아미노산은 G이다.
특정 구현예에서, (a) 서열번호 16의 아미노산 626에 상응하는 캡시드 단백질 중의 아미노산은 G, 서열번호 16의 아미노산 718에 상응하는 캡시드 단백질 중의 아미노산은 G이고; (b) 서열번호 16의 아미노산 296에 상응하는 캡시드 단백질 중의 아미노산은 H, 서열번호 16의 아미노산 464에 상응하는 캡시드 단백질 중의 아미노산은 N, 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질 중의 아미노산은 R, 서열번호 16의 아미노산 681에 상응하는 캡시드 단백질 중의 아미노산은 M이고; (c) 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질 중의 아미노산은 R, 서열번호 16의 아미노산 687에 상응하는 캡시드 단백질 중의 아미노산은 R이고; (d) 서열번호 16의 아미노산 346에 상응하는 캡시드 단백질 중의 아미노산은 A, 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질 중의 아미노산은 R이고; 또는 (e) 서열번호 16의 아미노산 501에 상응하는 캡시드 단백질 중의 아미노산은 I, 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질 중의 아미노산은 R, 서열번호 16의 아미노산 706에 상응하는 캡시드 단백질 중의 아미노산은 C이다.
특정 구현예에서, 캡시드 단백질은 서열번호 2, 3, 4, 5, 6, 7, 9, 10, 11, 12, 13, 15, 16, 또는 17의 아미노산 138 내지 736의 아미노산 서열을 포함한다.
특정 구현예에서, 캡시드 단백질은 서열번호 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 15, 16, 또는 17의 아미노산 1 내지 736의 아미노산 서열과 적어도 95% 서열 동일성을 갖는 아미노산 서열을 포함한다. 특정 구현예에서, 서열번호 16의 아미노산 2에 상응하는 캡시드 단백질 중의 아미노산은 T이고; 서열번호 16의 아미노산 65에 상응하는 캡시드 단백질 중의 아미노산은 I이고; 서열번호 16의 아미노산 68에 상응하는 캡시드 단백질 중의 아미노산은 V이고; 서열번호 16의 아미노산 77에 상응하는 캡시드 단백질 중의 아미노산은 R이고; 서열번호 16의 아미노산 119에 상응하는 캡시드 단백질 중의 아미노산은 L이고; 서열번호 16의 아미노산 151에 상응하는 캡시드 단백질 중의 아미노산은 R이고; 서열번호 16의 아미노산 160에 상응하는 캡시드 단백질 중의 아미노산은 D이고; 서열번호 16의 아미노산 206에 상응하는 캡시드 단백질 중의 아미노산은 C이고; 서열번호 16의 아미노산 296에 상응하는 캡시드 단백질 중의 아미노산은 H이고; 서열번호 16의 아미노산 312에 상응하는 캡시드 단백질 중의 아미노산은 Q이고; 서열번호 16의 아미노산 346에 상응하는 캡시드 단백질 중의 아미노산은 A이고; 서열번호 16의 아미노산 464에 상응하는 캡시드 단백질 중의 아미노산은 N이고; 서열번호 16의 아미노산 468에 상응하는 캡시드 단백질 중의 아미노산은 S이고; 서열번호 16의 아미노산 501에 상응하는 캡시드 단백질 중의 아미노산은 I이고; 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질 중의 아미노산은 R이고; 서열번호 16의 아미노산 590에 상응하는 캡시드 단백질 중의 아미노산은 R이고; 서열번호 16의 아미노산 626에 상응하는 캡시드 단백질 중의 아미노산은 G 또는 Y이고; 서열번호 16의 아미노산 681에 상응하는 캡시드 단백질 중의 아미노산은 M이고; 서열번호 16의 아미노산 687에 상응하는 캡시드 단백질 중의 아미노산은 R이고; 서열번호 16의 아미노산 690에 상응하는 캡시드 단백질 중의 아미노산은 K이고; 서열번호 16의 아미노산 706에 상응하는 캡시드 단백질 중의 아미노산은 C이고; 또는, 서열번호 16의 아미노산 718에 상응하는 캡시드 단백질 중의 아미노산은 G이다.
특정 구현예에서, (a) 서열번호 16의 아미노산 2에 상응하는 캡시드 단백질 중의 아미노산은 T, 서열번호 16의 아미노산 312에 상응하는 캡시드 단백질 중의 아미노산은 Q이고; (b) 서열번호 16의 아미노산 65에 상응하는 캡시드 단백질 중의 아미노산은 I, 서열번호 16의 아미노산 626에 상응하는 캡시드 단백질 중의 아미노산은 Y이고; (c) 서열번호 16의 아미노산 77에 상응하는 캡시드 단백질 중의 아미노산은 R, 서열번호 16의 아미노산 690에 상응하는 캡시드 단백질 중의 아미노산은 K이고; (d) 서열번호 16의 아미노산 119에 상응하는 캡시드 단백질 중의 아미노산은 L, 서열번호 16의 아미노산 468에 상응하는 캡시드 단백질 중의 아미노산은 S이고; (e) 서열번호 16의 아미노산 626에 상응하는 캡시드 단백질 중의 아미노산은 G, 서열번호 16의 아미노산 718에 상응하는 캡시드 단백질 중의 아미노산은 G이고; (f) 서열번호 16의 아미노산 296에 상응하는 캡시드 단백질 중의 아미노산은 H, 서열번호 16의 아미노산 464에 상응하는 캡시드 단백질 중의 아미노산은 N, 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질 중의 아미노산은 R, 서열번호 16의 아미노산 681에 상응하는 캡시드 단백질 중의 아미노산은 M이고; (g) 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질 중의 아미노산은 R, 서열번호 16의 아미노산 687에 상응하는 캡시드 단백질 중의 아미노산은 R이고; (h) 서열번호 16의 아미노산 346에 상응하는 캡시드 단백질 중의 아미노산은 A, 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질 중의 아미노산은 R이고; 또는 (i) 서열번호 16의 아미노산 501에 상응하는 캡시드 단백질 중의 아미노산은 I, 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질 중의 아미노산은 R, 서열번호 16의 아미노산 706에 상응하는 캡시드 단백질 중의 아미노산은 C이다.
특정 구현예에서, 캡시드 단백질은 서열번호 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 15, 16, 또는 17의 아미노산 1 내지 736의 아미노산 서열을 포함한다.
또 다른 양태에서, 본 개시는 본원에 기술된 rAAV를 포함하는 약학적 조성물을 제공한다.
또 다른 양태에서, 본 개시는 서열번호 14, 62 및 72에 제시된 핵산 서열을 포함하는 폴리뉴클레오티드를 제공한다.
또 다른 양태에서, 본 개시는 rAAV의 제조를 위한 패키징 시스템을 제공하며, 여기에서 패키징 시스템은 (a) 하나 이상의 AAV Rep 단백질을 암호화하는 제1 뉴클레오티드 서열; (b) 제41항 내지 제71항 중 어느 한 항의 AAV의 캡시드 단백질을 암호화하는 제2 뉴클레오티드 서열; 및 (c) 제41항 내지 제71항 중 어느 한 항의 AAV의 rAAV 게놈 서열을 포함하는 제3 뉴클레오티드 서열을 포함한다.
특정 구현예에서, 패키징 시스템은 제1 뉴클레오티드 서열 및 제2 뉴클레오티드 서열을 포함하는 제1 벡터, 및 제3 뉴클레오티드 서열을 포함하는 제2 벡터를 포함한다.
특정 구현예에서, 패키징 시스템은 하나 이상의 헬퍼 바이러스 유전자를 포함하는 제4 뉴클레오티드 서열을 추가로 포함한다. 특정 구현예에서, 제4 뉴클레오티드 서열은 제3 벡터 내에 포함된다. 특정 구현예에서, 제4 뉴클레오티드 서열은 아데노바이러스, 포진 바이러스, 우두 바이러스, 및 거대세포 바이러스(CMV)로 이루어진 군으로부터 선택된 바이러스 유래의 하나 이상의 유전자를 포함한다.
특정 구현예에서, 제1 벡터, 제2 벡터, 및/또는 제3 벡터는 플라스미드이다.
또 다른 양태에서, 본 개시는 rAAV의 재조합 제조 방법을 제공하며, 방법은 rAAV가 생산되는 조건 하에서 본원에 기술된 패키징 시스템을 세포에 도입하는 단계를 포함한다.
또 다른 양태에서, 본 개시는 본원에 기술된 바와 같은 세포에서 아릴술파타아제 A(ARSA) 폴리펩티드를 발현하기 위한 방법에 사용하기 위한, 본원에 기술된 rAAV를 제공한다.
또 다른 양태에서, 본 개시는 본원에 기술된 바와 같은 이염색 백색질장애(MLD)를 앓고 있는 대상체를 치료하기 위한 방법에 사용하기 위한, 본원에 기술된 rAAV를 제공한다.
도 1a, 1b, 1c, 및 1d는 각각 T-001, pHMI-5000, pHMI-5003, 및 pHMI-hARSA1-TC-002 벡터의 벡터 맵이다.
도 2a, 2b, 및 2c. 도 2a는 비히클 대조군 또는 AAVHSC15 캡시드에 패키징된 pHMI-5000으로 치료한 ARSA(-/-) 마우스에서 항-LAMP-1 항체를 사용하여 면역조직화학에 의해 조사한 LAMP-1 면역반응성으로부터 유도된 총 픽셀 강도의 정량화를 나타내는 그래프이다(dWM: 배측 백색질; vWM: 복측 백색질; 및 vGM: 복측 회색질). 도 2b는 시간 경과에 따른 대조군 마우스(WT/Het) 및 ARSA(-/-) 마우스의 뇌에서 측정된 C18:0 술파타이드의 수준을 나타내는 그래프이다. 도 2c는 AAVHSC15 캡시드에 4e13 vg/kg(투여량-4)의 투여량으로 패키징된 pHMI-hARSA1-TC-002, 또는 비히클 대조군으로 치료한 ARSA(-/-) 마우스에서의 술파타이드의 수준 변화를 (나이 일치 야생형 대조군에 대한 배수로서) 나타내는 그래프이다. 도 2d는 AAVHSC15 캡시드에 4e13 vg/kg 또는 6e13 vg/kg의 투여량으로 패키징된 pHMI-5000, 또는 비히클 대조군으로 치료한 ARSA(-/-) 마우스의 전뇌, 중뇌 및 후뇌에서의 C18:0 및 C18:1 술파타이드 이소형의 수준 변화를 (나이 일치 야생형 대조군에 대한 배수로서) 나타내는 일련의 그래프이다. 도 2e는 AAVHSC15 캡시드에 4e13 vg/kg의 투여량으로 패키징된 pHMI-5000, 또는 비히클 대조군으로 치료한 ARSA(-/-) 마우스의 전뇌, 중뇌 및 후뇌에서의 C18:0 및 C18:1 술파타이드 이소형의 수준 변화를 (나이 일치 야생형 대조군에 대한 배수로서) 나타내는 일련의 그래프이다. 도 2f는 AAVHSC15 캡시드에 4e13 vg/kg의 투여량으로 패키징된 pHMI-5000, 또는 비히클 대조군으로 치료한 ARSA(-/-) 마우스의 전뇌, 중뇌 및 후뇌에서의 C24:0 및 C24:1 술파타이드 이소형의 수준 변화를 (나이 일치 야생형 대조군에 대한 배수로서) 나타내는 일련의 그래프이다. 도 2g는 AAVHSC15 캡시드에 4e13 vg/kg의 투여량으로 패키징된 pHMI-5000, 또는 비히클 대조군으로 치료한 ARSA(-/-) 마우스의 전뇌, 중뇌 및 후뇌에서의 총 술파타이드 이소형의 수준 변화를 (나이 일치 야생형 대조군에 대한 배수로서) 나타내는 일련의 그래프이다.
도 3a 및 3b. 도 3a는 대조군 마우스(WT/Het) 및 ARSA(-/-) 마우스에서 4주차에 측정된 수초 및 림프구 단백질(MAL) mRNA 전사체의 수준을 나타내는 그래프이다. 도 3b는 연령이 일치하는 야생형 마우스 및 비히클 치료 ARSA(-/-) 마우스와 비교하여 AAVHSC15 캡시드에 4e13 vg/kg(투여량-4)의 투여량으로 패키징된 pHMI-5000으로 치료한 ARSA(-/-) 마우스에서 검출된 MAL 전사체의 수준을 나타내는 그래프이다. 도 3c는 AAVHSC15 캡시드에 패키징된 4e13 vg/kg의 pHMI-5000, 또는 비히클 대조군을 투여한 후 12 또는 52주차에 야생형 마우스 또는 ARSA(-/-) 마우스에서 검출된 MAL 전사체 카피수를 나타내는 그래프이다.
도 4는 ARSA(-/-) 마우스의 뇌에서 형질도입된 세포당 벡터 게놈의 수와 cDNA의 ng당 hARSA의 카피수 사이의 상관 관계를 나타내는 플롯이다.
도 5는 각각의 경우 2e13 vg/kg의 투여량으로 투여된, AAV9 또는 AAVHSC15 캡시드 중 하나에 패키징된 전달 벡터 pHMI-5000의 정맥내 투여 후 ARSA(-/-) 마우스의 뇌에서 형질도입된 세포당 벡터 게놈의 수를 나타내는 그래프이다.
도 6은 표시된 투여량으로 AAV9 또는 AAVHSC15 캡시드 중 하나로 패키징된 전달 벡터 pHMI-5000의 정맥내 투여 후 ARSA(-/-) 마우스의 뇌에서 측정된 정상 인간 ARSA 효소 활성 수준의 백분율을 나타내는 그래프이다.
도7은 각각의 경우 4e13 vg/kg의 투여량으로, AAV9 또는 AAVHSC15 캡시드 중 하나에 패키징된 전달 벡터 pHMI-5000을 정맥내 투여한 ARSA(-/-) 마우스의 뇌에서의 세포당 벡터 게놈의 수를 나타내는 그래프이다.
도 8은 AAVHSC15에 패키징된 전달 벡터 pHMI-5000의 정맥내(IV) 또는 경막내(IT) 투여 후 후뇌 및 중뇌에서 정상 인간 ARSA 효소 활성의 백분율을 나타내는 그래프이다.
도 9a, 9b, 9c, 및 9d. 도 9a는 표시된 투여량으로 ARSA(-/-) 마우스에 AAVHSC15 캡시드에 패키징된 전달 벡터 pHMI-5000의 정맥내 투여 후 뇌에서 달성된 정상 hARSA 활성의 백분율을 나타내는 그래프이다. 도 9b는 표시된 투여량으로 AAVHSC15 캡시드에 패키징된 전달 벡터 pHMI-5000의 정맥내 투여 후 ARSA(-/-) 마우스의 뇌에서의 세포당 벡터 게놈의 수를 나타내는 그래프이다. 도 9c는 투여 후 12주의 과정에 걸쳐 AAVHSC15 캡시드에 패키징된 4e13 vg/kg의 pHMI-5000을 투여한 신생아 ARSA(-/-) 마우스에서 hARSA 효소 활성의 수준을 나타내는 그래프이다. 도 9d는 AAVHSC15 캡시드에 패키징된 4e13 vg/kg의 pHMI-5000을 투여한 성체 ARSA(-/-) 마우스의 뇌에서 (hARSA 전사 분석을 통한) ARSA 효소 활성의 수준을 나타내는 그래프이다. 도 9e는 AAVHSC15 캡시드에 패키징된 pHMI-5000의 단일 정맥 내 4e13 vg/kg 투여량을 투여한 ARSA(-/-) 마우스의 뇌에서 게놈 DNA ug 당 벡터 게놈의 수를 나타내는 그래프이다. 도 9f는 AAVHSC15 캡시드에 패키징된 pHMI-5000의 단일 정맥 내 4e13 vg/kg 투여량을 투여한 ARSA(-/-) 마우스의 뇌에서의 RNA ng 당 ARSA 전사체의 카피수를 나타내는 그래프이다.
도 10a 및 도 10b는 각각 TC-013.pHMIA2 및 TC-015.pKITR 벡터의 벡터 맵이다.
도 11은, 각각의 경우 AAVHSC15 캡시드로 패키징되고 4e13 vg/kg의 투여량으로 정맥내 투여된, 전달 벡터 pHMI-5000(CBA 프로모터), TC-013.pHMIA2(CALM1 프로모터), 및 TC-015.pKITR(smCBA 프로모터)을 투여한 마우스 ARSA(-/-) 마우스의 뇌에서 세포당 형질도입된 바이러스 게놈의 수를 나타내는 그래프이다.
도 12는, 각각의 경우 AAVHSC15 캡시드로 패키징되고 4e13 vg/kg의 투여량으로 정맥 내 투여된, 전달 벡터 pHMI-5000(CBA 프로모터), 및 TC-015.pKITR(smCBA 프로모터)을 투여한 마우스 ARSA(-/-) 마우스의 뇌에서 검출된 정상 인간 ARSA 효소 활성의 백분율을 나타내는 그래프이다.
도 13은 마우스의 뇌에서 항-hARSA 항체를 사용한 hARSA의 발현을 나타내는 면역블롯의 사진이다. 각각의 경우 AAVHSC15 캡시드로 패키징되고, 각각 4e13 vg/kg 및 8e13 vg/kg의 투여량으로 정맥내 투여된, 전달 벡터 pHMI-5000(CBA 프로모터), 및 TC-015.pKITR(smCBA 프로모터)를 ARSA(-/-) 마우스에게 투여하였다(각 벡터에 대해 n = 5마리 마우스).
도 14는 전달 벡터 pHMI-5004의 벡터 맵이다.
도 15는 전달 벡터 pHMI-5005의 벡터 맵이다.
도 16은 표시된 투여량으로 AAVHSC15 캡시드에 패키징된 pHMI-5005로 치료하거나, 비히클 대조군으로 치료한 비인간 영장류에서의 알라닌 아미노전이효소(ALT) 수준을 나타내는 그래프이다.
도 17은 AAVHSC15 캡시드에 패키징된 pHMI-5005가 투여된 비인간 영장류의 중추신경계(CNS) 및 뇌척수액(CSF)에서의 ARSA 활성을 나타내는 그래프이다.
본원에서는, 세포에서 ARSA 유전자 기능을 복원할 수 있는 아데노-관련 바이러스(AAV) 조성물, 및 ARSA 유전자 기능의 감소와 연관된 질환(예를 들어, MLD)을 치료하기 위해 이를 사용하는 방법이 제공된다. 또한, 아데노-관련 바이러스 조성물을 제조하기 위한 패키징 시스템이 제공된다.
I. 정의
본원에서 사용되는 용어 "복제-결함 아데노-연관 바이러스"는 Rep 및 Cap 유전자가 결여된 게놈을 포함하는 AAV를 지칭한다.
본원에서 사용되는 용어 "ARSA 유전자"는 아릴술파타아제 A 유전자를 지칭한다. 인간 ARSA 유전자는 National Center for Biotechnology Information (NCBI) 유전자 ID 410에 의해 식별된다. ARSA mRNA의 예시적인 뉴클레오티드 서열은 서열번호 14로서 제공된다. ARSA 폴리펩티드의 예시적인 아미노산 서열은 서열번호 23으로서 제공된다.
본원에서 사용되는 용어 "전달 게놈"은, 전달 게놈이 세포 내로 도입될 때 코딩 서열의 발현을 매개하는 외인성 전사 조절 요소에 작동 가능하게 연결된 코딩 서열을 포함하는 재조합 AAV 게놈을 지칭한다. 특정 구현예에서, 전달 게놈은 세포의 염색체 DNA에 통합되지 않는다. 당업자는 ARSA 코딩 서열에 작동 가능하게 연결된 전사 조절 요소를 포함하는 전달 게놈의 부분이 ARSA 코딩 서열의 전사 방향에 대해 센스 또는 안티센스 배향에 있을 수 있음을 이해할 것이다.
본원에서 사용되는 용어 "클레이드(Clade) F 캡시드 단백질"은 본원에서 서열번호 1의 아미노산 1 내지 736, 138 내지 736, 및 203 내지 736에서 각각 제시된 VP1, VP2 또는 VP3 아미노산 서열과 적어도 90%의 동일성을 갖는 AAV VP1, VP2 또는 VP3 캡시드 단백질을 지칭한다.
본원에서 사용되는, 2개의 뉴클레오티드 서열 사이 또는 2개의 아미노산 서열 사이의 "백분율 동일성"은 정렬된 서열 쌍 사이의 일치되는 수에 100을 곱하고, 내부 갭을 포함하는 정렬된 영역의 길이를 나눔으로써 계산된다. 동일성 채점은 완벽한 일치만을 계산하며, 아미노산의 서로 유사한 정도는 고려하지 않는다. 내부 갭만이 길이에 포함되고, 서열 단부에서의 갭은 포함되지 않는다.
본원에서 사용되는 "ARSA 유전자 돌연변이와 연관된 질환 또는 장애"는 ARSA 유전자의 돌연변이에 의해 야기되거나, 이에 의해 악화되거나, 또는 이와 유전적으로 연결된 임의의 질환 또는 장애를 지칭한다. 특정 구현예에서, ARSA 유전자 돌연변이와 연관된 질환 또는 장애는 이염색 백색질장애(MLD)이다.
본원에서 사용되는 용어 "암호화 서열"은, 시작 코돈에서 시작하여 정지 코돈에서 끝나는, 폴리펩티드를 암호화하는 상보적 DNA(cDNA)의 부분을 지칭한다. 유전자는 대안적 스플라이싱, 대안적 번역 개시, 및 모집단 내 변이로 인해 하나 이상의 코딩 서열을 가질 수 있다. 코딩 서열은 야생형이거나 코돈-변형될 수 있다. 예시적인 야생형 ARSA 코딩 서열은 서열번호 24에 제시되어 있다.
본원에서 사용되는 용어 "침묵적으로 변형된"은 코딩 서열 또는 스터퍼-삽입 코딩 서열에 의해 암호화된 폴리펩티드의 아미노산 서열을 변화시키지 않는 (예를 들어, 뉴클레오티드 치환에 의한) 유전자의 코딩 서열 또는 스터퍼-삽입 코딩 서열의 변형을 지칭한다. 이러한 침묵 변형은 코딩 서열이 세포 내로 형질도입될 때 코딩 서열의 번역 효율을 증가시킬 수 있고/있거나 내인성 유전자의 상응하는 서열과의 재조합을 방지할 수 있다는 점에서 유리하다.
본 개시에서, ARSA 유전자에서의 뉴클레오티드 위치는 시작 코돈의 제1 뉴클레오티드에 대해 지정된다. 시작 코돈의 제1 뉴클레오티드는 위치 1이고; 시작 코돈의 제1 뉴클레오티드에 대한 뉴클레오티드 5'는 음의 수를 가지며; 시작 코돈의 제1 뉴클레오티드에 대한 뉴클레오티드 3'는 양의 수를 갖는다. 인간 ARSA 유전자의 예시적인 뉴클레오티드 1은 NCBI 기준 서열: NG_009260.2(영역: 5028 - 10426) 뉴클레오티드 374이고, 인간 ARSA 유전자의 예시적인 뉴클레오티드 3은 NCBI 기준 서열: NG_009260.2(영역: 5028 - 10426)의 뉴클레오티드 376이다. 시작 코돈에 인접한 뉴클레오티드 5'는 뉴클레오티드 -1이다.
본 개시에서, ARSA 유전자 내의 엑손 및 인트론은, NCBI 기준 서열: NG_009260.2(영역: 5028 - 10426)의 뉴클레오티드 374인, 시작 코돈의 제1 뉴클레오티드를 포함하는 엑손에 대해 특정된다. 시작 코돈의 제1 뉴클레오티드를 포함하는 엑손은 엑손 1이다. 엑손 3'에서 엑손 1은 5'에서 3'까지: 엑손 2, 엑손 3 등이다. 인트론 3'에서 엑손 1은 5'에서 3'까지: 인트론 1, 인트론 2 등이다. 따라서, ARSA 유전자는 5'에서 3'까지: 엑손 1, 인트론 1, 엑손 2, 인트론 2, 엑손 3 등을 포함한다. 인간 ARSA 유전자의 예시적인 엑손 1은 NCBI 기준 서열: NG_009260.2(영역: 5028 - 10426)의 뉴클레오티드 374 내지 597이다. 인간 ARSA 유전자의 예시적인 인트론 1은 NCBI 기준 서열: NG_009260.2(영역: 5028 - 10426)의 뉴클레오티드 598 내지 746이다.
본원에서 사용되는 용어 "전사 조절 요소" 또는 "TRE"는 RNA 중합효소에 의해 작동 가능하게 연결된 뉴클레오티드 서열의 전사를 조절(예를 들어, 제어, 증가, 또는 감소)하여 RNA 분자를 형성하는 시스-작용 뉴클레오티드 서열, 예를 들어, DNA 서열을 지칭한다. TRE는 전사 인자와 같은 하나 이상의 트랜스-작용 분자에 의존하여 전사를 조절한다. 따라서, 하나의 TRE는, 예를 들어, 상이한 유형의 세포에 존재할 때, 상이한 트랜스-작용 분자와 접촉할 경우 상이한 방식으로 전사를 조절할 수 있다. TRE는 하나 이상의 프로모터 요소 및/또는 인핸서 요소를 포함할 수 있다. 당업자는, 유전자 내의 프로모터 및 인핸서 요소가 위치상 근접할 수 있고, 용어 "프로모터"는 프로모터 요소 및 인핸서 요소를 포함하는 서열을 지칭할 수 있음을 이해할 것이다. 따라서, 용어 "프로모터"는 서열에서의 인핸서 요소를 배제하지 않는다. 프로모터 및 인핸서 요소는 동일한 유전자 또는 종으로부터 유래될 필요가 없으며, 각각의 프로모터 또는 인핸서 요소의 서열은 게놈 내의 상응하는 내인성 서열과 동일하거나 실질적으로 동일할 수 있다.
본원에서 사용되는 용어 "작동 가능하게 연결된"은 TRE와 전사될 코딩 서열 사이의 연결을 설명하는 데 사용된다. 일반적으로, 유전자 발현은 하나 이상의 프로모터 및/또는 인핸서 요소를 포함하는 TRE의 조절 하에 배치된다. 코딩 서열의 전사가 TRE에 의해 제어되거나 영향을 받는 경우, 코딩 서열은 TRE에 "작동 가능하게 연결"된다. TRE의 프로모터 및 인핸서 요소는 원하는 전사 활성이 수득되는 한, 코딩 서열로부터 임의의 배향 및/또는 거리에 있을 수 있다. 특정 구현예에서, TRE는 코딩 서열로부터 상류에 있다.
본원에서 사용되는 용어 "리보좀 스키핑 요소"는 하나의 mRNA 분자의 번역으로부터 2개의 펩티드 사슬의 생성을 야기할 수 있는 짧은 펩티드 서열을 암호화하는 뉴클레오티드 서열을 지칭한다.   특정 구현예에서, 리보솜 스키핑 요소는 X1X2EX3NPGP의 컨센서스 모티프를 포함하는 펩티드를 암호화하며, 여기에서 X1은 D 또는 G이고, X2는 V 또는 I이고, X3은 임의의 아미노산이다(서열번호 34). 특정 구현예에서, 리보솜 스키핑 요소는 토세아(Thosea) 아시그나 바이러스 2A 펩티드(T2A), 돼지 테스코바이러스-1 2A 펩티드(P2A), 발-구강 질환 바이러스 2A 펩티드(F2A), 말 비염 A 바이러스 2A 펩티드(E2A), 세포질 다면체증 바이러스 2A 펩티드(BmCPV 2A), 또는 B. mori 2A 펩티드의 플라셰리(flacherie) 바이러스(BmIFV 2A)를 암호화한다. T2A 펩티드 및 P2A 펩티드의 예시적인 아미노산 서열은 서열번호 37 및 38에 각각 제시되어 있다. T2A 요소 및 P2A 요소의 예시적인 뉴클레오티드 서열은 서열번호 66 및 63에 각각 제시되어 있다. 특정 구현예에서, 리보솜 스키핑 요소는 N 말단에서 Gly-Ser-Gly의 서열을 추가로 포함하는 펩티드를 암호화하되, 선택적으로 Gly-Ser-Gly의 서열은 GGCAGCGGA의 뉴클레오티드 서열에 의해 암호화된다. 이론에 구속되지 않고, 리보솜 스키핑 요소는: 제1 펩티드 사슬의 번역의 종료 및 제2 펩티드 사슬의 번역 재개시에 의해; 또는 암호화된 펩티드의 고유한 프로테아제 활성에 의해 또는 환경(예를 들어, 세포액)에서의 또 다른 프로테아제에 의해 리보솜 스키핑 요소에 의해 암호화된 펩티드 서열에서의 펩티드 결합의 절단에 의해 기능하는 것으로 가정된다.
본원에서 사용되는 용어 "리보솜 스키핑 펩티드"는 리보솜 스키핑 요소에 의해 암호화된 펩티드를 지칭한다. 
본원에서 사용되는 용어 "폴리아데닐화 서열"은 RNA로 전사될 때 폴리아데닐화 신호 서열을 구성하는 DNA 서열을 지칭한다. 폴리아데닐화 서열은 (예를 들어, ARSA 유전자로부터 유래된) 천연이거나 외인성일 수 있다. 외인성 폴리아데닐화 서열은 포유류 또는 바이러스 폴리아데닐화 서열(예를 들어, SV40 폴리아데닐화 서열)일 수 있다.
본원에서 사용되는 "외인성 폴리아데닐화 서열"은 ARSA 유전자(예를 들어, 인간 ARSA 유전자)의 내인성 폴리아데닐화 서열과 동일하지 않거나 실질적으로 동일하지 않은 폴리아데닐화 서열을 지칭한다. 특정 구현예에서, 외인성 폴리아데닐화 서열은 동일한 종(예를 들어, 인간)에서의 비-ARSA 유전자의 폴리아데닐화 서열이다. 특정 구현예에서, 외인성 폴리아데닐화 서열은 상이한 종(예를 들어, 바이러스)의 비폴리아데닐화 서열이다.
본원에서 사용되는, 대상체에게 AAV를 투여하는 맥락에서의 용어 "유효량"은 원하는 예방 효과 또는 치료 효과를 달성하는 AAV의 양을 지칭한다.
II. 아데노-연관 바이러스 조성물
일 양태에서, ARSA 유전자 기능이 감소되거나 달리 결함이 있는 세포에서 ARSA 폴리펩티드를 발현하는데 유용한 신규 재조합 AAV(예를 들어, 복제-결함 AAV) 조성물이 본원에 제공된다. 특정 구현예에서, 본원에 개시된 rAAV는, 캡시드 단백질(예를 들어, 클레이드 F 캡시드 단백질)을 포함하는 AAV 캡시드; 및 ARSA 코딩 서열(예를 들어, 침묵적으로 변형된 ARSA 코딩 서열)에 작동 가능하게 연결되어 AAV로 형질도입된 세포에서 ARSA의 염색체 외 발현을 가능하게 하는 전사 조절 요소를 포함하는 전달 게놈을 포함한다.
AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, 또는 AAV9 혈청형으로부터의 캡시드 단백질을 포함하되 이들로 한정되지 않는, 당업계에 공지된 임의의 캡시드로부터의 캡시드 단백질이 본원에 개시된 rAAV 조성물에 사용될 수 있다. 예를 들어, 특정 구현예에서, 캡시드 단백질은 서열번호 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 15, 16, 또는 17의 아미노산 203 내지 736의 아미노산 서열과 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 서열 동일성을 갖는 아미노산 서열을 포함한다. 특정 구현예에서, 캡시드 단백질은 서열번호 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 15, 16, 또는 17의 아미노산 203 내지 736의 아미노산 서열과 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 서열 동일성을 갖는 아미노산 서열을 포함하며, 여기에서: 서열번호 16의 아미노산 206에 상응하는 캡시드 단백질 중의 아미노산은 C이고; 서열번호 16의 아미노산 296에 상응하는 캡시드 단백질 중의 아미노산은 H이고; 서열번호 16의 아미노산 312에 상응하는 캡시드 단백질 중의 아미노산은 Q이고; 서열번호 16의 아미노산 346에 상응하는 캡시드 단백질 중의 아미노산은 A이고; 서열번호 16의 아미노산 464에 상응하는 캡시드 단백질 중의 아미노산은 N이고; 서열번호 16의 아미노산 468에 상응하는 캡시드 단백질 중의 아미노산은 S이고; 서열번호 16의 아미노산 501에 상응하는 캡시드 단백질 중의 아미노산은 I이고; 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질 중의 아미노산은 R이고; 서열번호 16의 아미노산 590에 상응하는 캡시드 단백질 중의 아미노산은 R이고; 서열번호 16의 아미노산 626에 상응하는 캡시드 단백질 중의 아미노산은 G 또는 Y이고; 서열번호 16의 아미노산 681에 상응하는 캡시드 단백질 중의 아미노산은 M이고; 서열번호 16의 아미노산 687에 상응하는 캡시드 단백질 중의 아미노산은 R이고; 서열번호 16의 아미노산 690에 상응하는 캡시드 단백질 중의 아미노산은 K이고; 서열번호 16의 아미노산 706에 상응하는 캡시드 단백질 중의 아미노산은 C이고; 또는, 서열번호 16의 아미노산 718에 상응하는 캡시드 단백질 중의 아미노산은 G이다. 특정 구현예에서, 서열번호 16의 아미노산 626에 상응하는 캡시드 단백질 중의 아미노산은 G이고, 서열번호 16의 아미노산 718에 상응하는 캡시드 단백질 중의 아미노산은 G이다. 특정 구현예에서, 서열번호 16의 아미노산 296에 상응하는 캡시드 단백질 중의 아미노산은 H이고, 서열번호 16의 아미노산 464에 상응하는 캡시드 단백질 중의 아미노산은 N이고, 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질 중의 아미노산은 R이고, 서열번호 16의 아미노산 681에 상응하는 캡시드 단백질 중의 아미노산은 M이다. 특정 구현예에서, 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질 중의 아미노산은 R이고, 서열번호 16의 아미노산 687에 상응하는 캡시드 단백질 중의 아미노산은 R이다. 특정 구현예에서, 서열번호 16의 아미노산 346에 상응하는 캡시드 단백질 중의 아미노산은 A이고, 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질 중의 아미노산은 R이다. 특정 구현예에서, 서열번호 16의 아미노산 501에 상응하는 캡시드 단백질 중의 아미노산은 I이고, 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질 중의 아미노산은 R이고, 서열번호 16의 아미노산 706에 상응하는 캡시드 단백질 중의 아미노산은 C이다. 특정 구현예에서, 캡시드 단백질은 서열번호 2, 3, 4, 6, 7, 10, 11, 12, 13, 15, 16, 또는 17의 아미노산 203 내지 736의 아미노산 서열을 포함한다.
예를 들어, 특정 구현예에서, 캡시드 단백질은 서열번호 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 15, 16, 또는 17의 아미노산 138 내지 736의 아미노산 서열과 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 서열 동일성을 갖는 아미노산 서열을 포함한다. 특정 구현예에서, 캡시드 단백질은 서열번호 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 15, 16, 또는 17의 아미노산 138 내지 736의 아미노산 서열과 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 서열 동일성을 갖는 아미노산 서열을 포함하며, 여기에서: 서열번호 16의 아미노산 151에 상응하는 캡시드 단백질 중의 아미노산은 R이고; 서열번호 16의 아미노산 160에 상응하는 캡시드 단백질 중의 아미노산은 D이고; 서열번호 16의 아미노산 206에 상응하는 캡시드 단백질 중의 아미노산은 C이고; 서열번호 16의 아미노산 296에 상응하는 캡시드 단백질 중의 아미노산은 H이고; 서열번호 16의 아미노산 312에 상응하는 캡시드 단백질 중의 아미노산은 Q이고; 서열번호 16의 아미노산 346에 상응하는 캡시드 단백질 중의 아미노산은 A이고; 서열번호 16의 아미노산 464에 상응하는 캡시드 단백질 중의 아미노산은 N이고; 서열번호 16의 아미노산 468에 상응하는 캡시드 단백질 중의 아미노산은 S이고; 서열번호 16의 아미노산 501에 상응하는 캡시드 단백질 중의 아미노산은 I이고; 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질 중의 아미노산은 R이고; 서열번호 16의 아미노산 590에 상응하는 캡시드 단백질 중의 아미노산은 R이고; 서열번호 16의 아미노산 626에 상응하는 캡시드 단백질 중의 아미노산은 G 또는 Y이고; 서열번호 16의 아미노산 681에 상응하는 캡시드 단백질 중의 아미노산은 M이고; 서열번호 16의 아미노산 687에 상응하는 캡시드 단백질 중의 아미노산은 R이고; 서열번호 16의 아미노산 690에 상응하는 캡시드 단백질 중의 아미노산은 K이고; 서열번호 16의 아미노산 706에 상응하는 캡시드 단백질 중의 아미노산은 C이고; 또는, 서열번호 16의 아미노산 718에 상응하는 캡시드 단백질 중의 아미노산은 G이다. 특정 구현예에서, 서열번호 16의 아미노산 626에 상응하는 캡시드 단백질 중의 아미노산은 G이고, 서열번호 16의 아미노산 718에 상응하는 캡시드 단백질 중의 아미노산은 G이다. 특정 구현예에서, 서열번호 16의 아미노산 296에 상응하는 캡시드 단백질 중의 아미노산은 H이고, 서열번호 16의 아미노산 464에 상응하는 캡시드 단백질 중의 아미노산은 N이고, 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질 중의 아미노산은 R이고, 서열번호 16의 아미노산 681에 상응하는 캡시드 단백질 중의 아미노산은 M이다. 특정 구현예에서, 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질 중의 아미노산은 R이고, 서열번호 16의 아미노산 687에 상응하는 캡시드 단백질 중의 아미노산은 R이다. 특정 구현예에서, 서열번호 16의 아미노산 346에 상응하는 캡시드 단백질 중의 아미노산은 A이고, 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질 중의 아미노산은 R이다. 특정 구현예에서, 서열번호 16의 아미노산 501에 상응하는 캡시드 단백질 중의 아미노산은 I이고, 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질 중의 아미노산은 R이고, 서열번호 16의 아미노산 706에 상응하는 캡시드 단백질 중의 아미노산은 C이다. 특정 구현예에서, 캡시드 단백질은 서열번호 2, 3, 4, 5, 6, 7, 9, 10, 11, 12, 13, 15, 16, 또는 17의 아미노산 138 내지 736의 아미노산 서열을 포함한다.
예를 들어, 특정 구현예에서, 캡시드 단백질은 서열번호 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 15, 16, 또는 17의 아미노산 1 내지 736의 아미노산 서열과 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 서열 동일성을 갖는 아미노산 서열을 포함한다. 특정 구현예에서, 캡시드 단백질은 서열번호 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 15, 16, 또는 17의 아미노산 1 내지 736의 아미노산 서열과 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 서열 동일성을 갖는 아미노산 서열을 포함하며, 여기에서: 서열번호 16의 아미노산 2에 상응하는 캡시드 단백질 중의 아미노산은 T이고; 서열번호 16의 아미노산 65에 상응하는 캡시드 단백질 중의 아미노산은 I이고; 서열번호 16의 아미노산 68에 상응하는 캡시드 단백질 중의 아미노산은 V이고; 서열번호 16의 아미노산 77에 상응하는 캡시드 단백질 중의 아미노산은 R이고; 서열번호 16의 아미노산 119에 상응하는 캡시드 단백질 중의 아미노산은 L이고; 서열번호 16의 아미노산 151에 상응하는 캡시드 단백질 중의 아미노산은 R이고; 서열번호 16의 아미노산 160에 상응하는 캡시드 단백질 중의 아미노산은 D이고; 서열번호 16의 아미노산 206에 상응하는 캡시드 단백질 중의 아미노산은 C이고; 서열번호 16의 아미노산 296에 상응하는 캡시드 단백질 중의 아미노산은 H이고; 서열번호 16의 아미노산 312에 상응하는 캡시드 단백질 중의 아미노산은 Q이고; 서열번호 16의 아미노산 346에 상응하는 캡시드 단백질 중의 아미노산은 A이고; 서열번호 16의 아미노산 464에 상응하는 캡시드 단백질 중의 아미노산은 N이고; 서열번호 16의 아미노산 468에 상응하는 캡시드 단백질 중의 아미노산은 S이고; 서열번호 16의 아미노산 501에 상응하는 캡시드 단백질 중의 아미노산은 I이고; 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질 중의 아미노산은 R이고; 서열번호 16의 아미노산 590에 상응하는 캡시드 단백질 중의 아미노산은 R이고; 서열번호 16의 아미노산 626에 상응하는 캡시드 단백질 중의 아미노산은 G 또는 Y이고; 서열번호 16의 아미노산 681에 상응하는 캡시드 단백질 중의 아미노산은 M이고; 서열번호 16의 아미노산 687에 상응하는 캡시드 단백질 중의 아미노산은 R이고; 서열번호 16의 아미노산 690에 상응하는 캡시드 단백질 중의 아미노산은 K이고; 서열번호 16의 아미노산 706에 상응하는 캡시드 단백질 중의 아미노산은 C이고; 또는, 서열번호 16의 아미노산 718에 상응하는 캡시드 단백질 중의 아미노산은 G이다. 특정 구현예에서, 서열번호 16의 아미노산 2에 상응하는 캡시드 단백질 중의 아미노산은 T이고, 서열번호 16의 아미노산 312에 상응하는 캡시드 단백질 중의 아미노산은 Q이다. 특정 구현예에서, 서열번호 16의 아미노산 65에 상응하는 캡시드 단백질 중의 아미노산은 I이고, 서열번호 16의 아미노산 626에 상응하는 캡시드 단백질 중의 아미노산은 Y이다. 특정 구현예에서, 서열번호 16의 아미노산 77에 상응하는 캡시드 단백질 중의 아미노산은 R이고, 서열번호 16의 아미노산 690에 상응하는 캡시드 단백질 중의 아미노산은 K이다. 특정 구현예에서, 서열번호 16의 아미노산 119에 상응하는 캡시드 단백질 중의 아미노산은 L이고, 서열번호 16의 아미노산 468에 상응하는 캡시드 단백질 중의 아미노산은 S이다. 특정 구현예에서, 서열번호 16의 아미노산 626에 상응하는 캡시드 단백질 중의 아미노산은 G이고, 서열번호 16의 아미노산 718에 상응하는 캡시드 단백질 중의 아미노산은 G이다. 특정 구현예에서, 서열번호 16의 아미노산 296에 상응하는 캡시드 단백질 중의 아미노산은 H이고, 서열번호 16의 아미노산 464에 상응하는 캡시드 단백질 중의 아미노산은 N이고, 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질 중의 아미노산은 R이고, 서열번호 16의 아미노산 681에 상응하는 캡시드 단백질 중의 아미노산은 M이다. 특정 구현예에서, 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질 중의 아미노산은 R이고, 서열번호 16의 아미노산 687에 상응하는 캡시드 단백질 중의 아미노산은 R이다. 특정 구현예에서, 서열번호 16의 아미노산 346에 상응하는 캡시드 단백질 중의 아미노산은 A이고, 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질 중의 아미노산은 R이다. 특정 구현예에서, 서열번호 16의 아미노산 501에 상응하는 캡시드 단백질 중의 아미노산은 I이고, 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질 중의 아미노산은 R이고, 서열번호 16의 아미노산 706에 상응하는 캡시드 단백질 중의 아미노산은 C이다. 특정 구현예에서, 캡시드 단백질은 서열번호 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 15, 16, 또는 17의 아미노산 1 내지 736의 아미노산 서열을 포함한다.
특정 구현예에서, AAV 캡시드는, (a) 서열번호 2, 3, 4, 6, 7, 10, 11, 12, 13, 15, 16, 또는 17의 아미노산 203 내지 736의 아미노산 서열을 포함하는 캡시드 단백질; (b) 서열번호 2, 3, 4, 5, 6, 7, 9, 10, 11, 12, 13, 15, 16, 또는 17의 아미노산 138 내지 736의 아미노산 서열을 포함하는 캡시드 단백질; 및 (c) 서열번호 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 15, 16, 또는 17의 아미노산 1 내지 736의 아미노산 서열을 포함하는 캡시드 단백질 중 2개 이상을 포함한다. 특정 구현예에서, AAV 캡시드는, (a) 서열번호 2, 3, 4, 6, 7, 10, 11, 12, 13, 15, 16, 또는 17의 아미노산 203 내지 736으로 이루어진 아미노산 서열을 갖는 캡시드 단백질; (b) 서열번호 2, 3, 4, 5, 6, 7, 9, 10, 11, 12, 13, 15, 16, 또는 17의 아미노산 138 내지 736으로 이루어진 아미노산 서열을 갖는 캡시드 단백질; 및 (c) 서열번호 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 15, 16, 또는 17의 아미노산 1 내지 736으로 이루어진 아미노산 서열을 갖는 캡시드 단백질을 포함한다.
특정 구현예에서, AAV 캡시드는, (a) 서열번호 8의 아미노산 203 내지 736의 서열과 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 서열 동일성을 갖는 아미노산 서열을 포함하는 캡시드 단백질; (b) 서열번호 8의 아미노산 138 내지 736의 서열과 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 서열 동일성을 갖는 아미노산 서열을 포함하는 캡시드 단백질; 및 (c) 서열번호 8의 아미노산 1 내지 736의 서열과 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 서열 동일성을 갖는 아미노산 서열을 포함하는 캡시드 단백질 중 하나 이상을 포함한다. 특정 구현예에서, AAV 캡시드는, (a) 서열번호 8의 아미노산 203 내지 736의 아미노산 서열을 포함하는 캡시드 단백질; (b) 서열번호 8의 아미노산 138 내지 736의 아미노산 서열을 포함하는 캡시드 단백질; 및 (c) 서열번호 8의 아미노산 1 내지 736의 아미노산 서열을 포함하는 캡시드 단백질 중 하나 이상을 포함한다. 특정 구현예에서, AAV 캡시드는, (a) 서열번호 8의 아미노산 203 내지 736의 아미노산 서열을 포함하는 캡시드 단백질; (b) 서열번호 8의 아미노산 138 내지 736의 아미노산 서열을 포함하는 캡시드 단백질; 및 (c) 서열번호 8의 아미노산 1 내지 736의 아미노산 서열을 포함하는 캡시드 단백질 중 2개 이상을 포함한다. 특정 구현예에서, AAV 캡시드는, (a) 서열번호 8의 아미노산 203 내지 736으로 이루어진 아미노산을 갖는 캡시드 단백질; (b) 서열번호 8의 아미노산 138 내지 736으로 이루어진 아미노산을 갖는 캡시드 단백질; 및 (c) 서열번호 8의 아미노산 1 내지 736으로 이루어진 아미노산을 갖는 캡시드 단백질을 포함한다.
특정 구현예에서, AAV 캡시드는, (a) 서열번호 11의 아미노산 203 내지 736의 서열과 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 서열 동일성을 갖는 아미노산 서열을 포함하는 캡시드 단백질; (b) 서열번호 11의 아미노산 138 내지 736의 서열과 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 서열 동일성을 갖는 아미노산 서열을 포함하는 캡시드 단백질; 및 (c) 서열번호 11의 아미노산 1 내지 736의 서열과 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 서열 동일성을 갖는 아미노산 서열을 포함하는 캡시드 단백질 중 하나 이상을 포함한다. 특정 구현예에서, AAV 캡시드는, (a) 서열번호 11의 아미노산 203 내지 736의 아미노산 서열을 포함하는 캡시드 단백질; (b) 서열번호 11의 아미노산 138 내지 736의 아미노산 서열을 포함하는 캡시드 단백질; 및 (c) 서열번호 11의 아미노산 1 내지 736의 아미노산 서열을 포함하는 캡시드 단백질 중 하나 이상을 포함한다. 특정 구현예에서, AAV 캡시드는, (a) 서열번호 11의 아미노산 203 내지 736의 아미노산 서열을 포함하는 캡시드 단백질; (b) 서열번호 11의 아미노산 138 내지 736의 아미노산 서열을 포함하는 캡시드 단백질; 및 (c) 서열번호 11의 아미노산 1 내지 736의 아미노산 서열을 포함하는 캡시드 단백질 중 2개 이상을 포함한다. 특정 구현예에서, AAV 캡시드는, (a) 서열번호 11의 아미노산 203 내지 736으로 이루어진 아미노산을 갖는 캡시드 단백질; (b) 서열번호 11의 아미노산 138 내지 736으로 이루어진 아미노산을 갖는 캡시드 단백질; 및 (c) 서열번호 11의 아미노산 1 내지 736으로 이루어진 아미노산을 갖는 캡시드 단백질을 포함한다.
특정 구현예에서, AAV 캡시드는, (a) 서열번호 13의 아미노산 203 내지 736의 서열과 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 서열 동일성을 갖는 아미노산 서열을 포함하는 캡시드 단백질; (b) 서열번호 13의 아미노산 138 내지 736의 서열과 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 서열 동일성을 갖는 아미노산 서열을 포함하는 캡시드 단백질; 및 (c) 서열번호 13의 아미노산 1 내지 736의 서열과 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 서열 동일성을 갖는 아미노산 서열을 포함하는 캡시드 단백질 중 하나 이상을 포함한다. 특정 구현예에서, AAV 캡시드는, (a) 서열번호 13의 아미노산 203 내지 736의 아미노산 서열을 포함하는 캡시드 단백질; (b) 서열번호 13의 아미노산 138 내지 736의 아미노산 서열을 포함하는 캡시드 단백질; 및 (c) 서열번호 13의 아미노산 1 내지 736의 아미노산 서열을 포함하는 캡시드 단백질 중 하나 이상을 포함한다. 특정 구현예에서, AAV 캡시드는, (a) 서열번호 13의 아미노산 203 내지 736의 아미노산 서열을 포함하는 캡시드 단백질; (b) 서열번호 13의 아미노산 138 내지 736의 아미노산 서열을 포함하는 캡시드 단백질; 및 (c) 서열번호 13의 아미노산 1 내지 736의 아미노산 서열을 포함하는 캡시드 단백질 중 2개 이상을 포함한다. 특정 구현예에서, AAV 캡시드는, (a) 서열번호 13의 아미노산 203 내지 736으로 이루어진 아미노산을 갖는 캡시드 단백질; (b) 서열번호 13의 아미노산 138 내지 736으로 이루어진 아미노산을 갖는 캡시드 단백질; 및 (c) 서열번호 13의 아미노산 1 내지 736으로 이루어진 아미노산을 갖는 캡시드 단백질을 포함한다.
특정 구현예에서, AAV 캡시드는, (a) 서열번호 16의 아미노산 203 내지 736의 서열과 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 서열 동일성을 갖는 아미노산 서열을 포함하는 캡시드 단백질; (b) 서열번호 16의 아미노산 138 내지 736의 서열과 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 서열 동일성을 갖는 아미노산 서열을 포함하는 캡시드 단백질; 및 (c) 서열번호 16의 아미노산 1 내지 736의 서열과 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 서열 동일성을 갖는 아미노산 서열을 포함하는 캡시드 단백질 중 하나 이상을 포함한다. 특정 구현예에서, AAV 캡시드는, (a) 서열번호 16의 아미노산 203 내지 736의 아미노산 서열을 포함하는 캡시드 단백질; (b) 서열번호 16의 아미노산 138 내지 736의 아미노산 서열을 포함하는 캡시드 단백질; 및 (c) 서열번호 16의 아미노산 1 내지 736의 아미노산 서열을 포함하는 캡시드 단백질 중 하나 이상을 포함한다. 특정 구현예에서, AAV 캡시드는, (a) 서열번호 16의 아미노산 203 내지 736의 아미노산 서열을 포함하는 캡시드 단백질; (b) 서열번호 16의 아미노산 138 내지 736의 아미노산 서열을 포함하는 캡시드 단백질; 및 (c) 서열번호 16의 아미노산 1 내지 736의 아미노산 서열을 포함하는 캡시드 단백질 중 2개 이상을 포함한다. 특정 구현예에서, AAV 캡시드는, (a) 서열번호 16의 아미노산 203 내지 736으로 이루어진 아미노산을 갖는 캡시드 단백질; (b) 서열번호 16의 아미노산 138 내지 736으로 이루어진 아미노산을 갖는 캡시드 단백질; 및 (c) 서열번호 16의 아미노산 1 내지 736으로 이루어진 아미노산을 갖는 캡시드 단백질을 포함한다.
본원에 개시된 AAV 조성물에 유용한 전달 게놈은 대체로 ARSA 코딩 서열에 작동 가능하게 연결된 전사 조절 요소(TRE)를 포함한다. 특정 구현예에서, 전달 게놈은 TRE 및 ARSA 코딩 서열의 5' 역위 말단 반복(5' ITR) 뉴클레오티드 서열 5', 및 TRE 및 ARSA 코딩 서열의 3' 역위 말단 반복(3' ITR) 뉴클레오티드 서열 3'을 포함한다.
특정 구현예에서, ARSA 코딩 서열은 ARSA 유전자의 코딩 서열의 전부 또는 실질적으로 전부를 포함한다. 특정 구현예에서, 전달 게놈은 서열번호 23을 암호화하는 뉴클레오티드 서열을 포함하고, 선택적으로 ARSA 코딩 서열에 대해 외인성 폴리아데닐화 서열 3'을 추가로 포함할 수 있다. 특정 구현예에서, 서열번호 23을 암호화하는 뉴클레오티드 서열은 야생형이다(예를 들어, 서열번호 24에 제시된 서열을 가짐). 특정 구현예에서, 서열번호 23을 암호화하는 뉴클레오티드 서열은 침묵적으로 변형된다(예를 들어, 서열번호 14, 62, 또는 72에 제시된 서열을 가짐).
특정 구현예에서, ARSA 코딩 서열은 ARSA 단백질의 아미노산 서열의 전부 또는 실질적으로 전부를 포함하는 폴리펩티드를 암호화한다. 특정 구현예에서, ARSA 코딩 서열은 야생형 ARSA 단백질(예를 들어, 인간 ARSA 단백질)의 아미노산 서열을 암호화한다. 특정 구현예에서, ARSA 코딩 서열은 돌연변이 ARSA 단백질(예를 들어, 인간 ARSA 단백질)의 아미노산 서열을 암호화하며, 여기에서 돌연변이 ARSA 폴리펩티드는 야생형 ARSA 폴리펩티드의 기능적 균등물이다. 즉, 야생형 ARSA 폴리펩티드로서 기능할 수 있다. 특정 구현예에서, 기능적으로 균등한 ARSA 폴리펩티드는 야생형 ARSA 폴리펩티드에서 발견되지 않은 적어도 하나의 특성, 예를 들어, 단백질 분해에 저항하는 능력을 추가로 포함한다.
특정 구현예에서, 본원에 개시된 AAV 조성물에 유용한 전달 게놈은 대체로 ARSA 및/또는 SUMF1을 암호화하는 코딩 서열에 작동 가능하게 연결된 전사 조절 요소(TRE)를 포함한다. 술파타아제 변형 인자 1(SUMF1) 유전자는, 기질 술파타아제 내의 시스테인 잔기를 활성 부위 3-옥소알라닌 잔기로 산화시킴으로써 황산 에스테르의 가수분해를 촉매하는 효소를 암호화하며, 이는 C-알파-포르밀글리신으로도 알려져 있다. SUMF1과 연관된 질환은 다수의 술파타아제 결핍증 및 이염색 백색질장애를 포함한다.
특정 구현예에서, SUMF1 코딩 서열은 SUMF1 유전자의 코딩 서열의 전부 또는 실질적으로 전부를 포함한다. 특정 구현예에서, 전달 게놈은 서열번호 29를 암호화하는 뉴클레오티드 서열을 포함하고, 선택적으로 SUMF1 코딩 서열에 대해 외인성 폴리아데닐화 서열 3'을 추가로 포함할 수 있다. 특정 구현예에서, 서열번호 29를 암호화하는 뉴클레오티드 서열은 야생형이다(예를 들어, 서열번호 64에 제시된 서열을 가짐). 특정 구현예에서, 서열번호 29를 암호화하는 뉴클레오티드 서열은 침묵적으로 변형된다.
특정 구현예에서, SUMF1 코딩 서열은 SUMF1 단백질의 아미노산 서열의 전부 또는 실질적으로 전부를 포함하는 폴리펩티드를 암호화한다. 특정 구현예에서, SUMF1 코딩 서열은 야생형 SUMF1 단백질(예를 들어, 인간 SUMF1 단백질(hSUMF1))의 아미노산 서열을 암호화한다. 특정 구현예에서, SUMF1 코딩 서열은 돌연변이 SUMF1 단백질(예를 들어, 인간 SUMF1 단백질)의 아미노산 서열을 암호화하며, 여기에서 돌연변이 SUMF1 폴리펩티드는 야생형 SUMF1 폴리펩티드의 기능적 균등물이다. 즉, 야생형 SUMF1 폴리펩티드로서 기능할 수 있다. 특정 구현예에서, 기능적으로 균등한 SUMF1 폴리펩티드는 야생형 SUMF1 폴리펩티드에서 발견되지 않은 적어도 하나의 특성, 예를 들어, 단백질 분해에 저항하는 능력을 추가로 포함한다.
특정 구현예에서, 전달 게놈은 hARSA 및 hSUMF1 둘 모두를 발현하도록 설계되고, hARSA를 암호화하는 제1 코딩 서열 및 hSUMF1을 암호화하는 제2 코딩 서열을 포함하는 뉴클레오티드 서열을 포함한다. 특정 구현예에서, hARSA를 암호화하는 제1 코딩 서열 및 hSUMF1을 암호화하는 제2 코딩 서열은 리보솜 스키핑 요소에 의해 분리된다. 당업계에 공지된 임의의 리보솜 스키핑 요소, 예를 들어 본원의 다른 곳에서 기술된 리보솜 스키핑 요소가 사용될 수 있다. 특정 구현예에서, hARSA를 암호화하는 제1 코딩 서열 및 hSUMF1을 암호화하는 제2 코딩 서열을 포함하는 뉴클레오티드 서열은 서열번호 30에 제시된 뉴클레오티드 서열을 포함한다.
특정 구현예에서, 본원에 개시된 AAV 조성물에 유용한 전달 게놈은 대체로 ARSA 및/또는 SapB를 암호화하는 코딩 서열에 작동 가능하게 연결된 전사 조절 요소(TRE)를 포함한다. 프로사포신(Prosaposin, PSAP) 유전자는 사포신 A, B, C, 및 D를 포함하는 4개의 주요 절단 산물을 생성하도록 단백질분해 처리되는 고도로 보존된 전전구단백질(preproprotein)을 암호화한다. 전구체 단백질의 각 도메인은 시스테인 잔기 및 당질화 부위의 배치와 거의 동일한 대략 80개 아미노산 잔기 길이이다. 사포신 A 내지 D는 이들이 짧은 올리고당기를 갖는 글리코스핑고리피드(glycosphingolipid)의 이화작용을 용이하게 하는 리소좀 구획에 주로 국소화된다. 전구체 단백질은 분비 단백질 및 일체형 막 단백질로서 존재하며, 신경영양 활성을 갖는다. 이 유전자의 돌연변이는 고셰병(Gaucher) 및 이염색 백색질장애와 연관이 있다. 사포신 B(SapB)는, ARSA에 의한 갈락토-세레브로사이드(galacto-cerebroside) 술페이트, 베타-갈락토시다아제(galactosidase)에 의한 GM1 강글리오사이드(ganglioside), 및 알파-갈락토시다아제 A에 의한 글로보트리아오실세라마이드(globotriaosylceramide)의 가수분해를 자극하는 것으로 나타났다. SapB는 스핑고리피드(sphingolipid) 가수분해효소의 기질과 함께 가용화 복합체를 형성하는 것으로 나타났다.
특정 구현예에서, SapB 코딩 서열은 SapB 유전자의 코딩 서열의 전부 또는 실질적으로 전부를 포함한다. 특정 구현예에서, 전달 게놈은 서열번호 33을 암호화하는 뉴클레오티드 서열을 포함하고, 선택적으로 SapB 코딩 서열에 대해 외인성 폴리아데닐화 서열 3'을 추가로 포함할 수 있다. 특정 구현예에서, 서열번호 33을 암호화하는 뉴클레오티드 서열은 야생형이다(예를 들어, 서열번호 73에 제시된 서열을 가짐). 특정 구현예에서, 서열번호 33를 암호화하는 뉴클레오티드 서열은 침묵적으로 변형된다.
특정 구현예에서, SapB 코딩 서열은 SapB 단백질의 아미노산 서열의 전부 또는 실질적으로 전부를 포함하는 폴리펩티드를 암호화한다. 특정 구현예에서, SapB 코딩 서열은 야생형 SapB 단백질(예를 들어, 인간 SapB 단백질(hSapB))의 아미노산 서열을 암호화한다. 특정 구현예에서, SapB 코딩 서열은 돌연변이 SapB 단백질(예를 들어, 인간 SapB 단백질)의 아미노산 서열을 암호화하며, 여기에서 돌연변이 SapB 폴리펩티드는 야생형 SapB 폴리펩티드의 기능적 균등물이다. 즉, 야생형 SapB 폴리펩티드로서 기능할 수 있다. 특정 구현예에서, 기능적으로 균등한 SapB 폴리펩티드는 야생형 SapB 폴리펩티드에서 발견되지 않은 적어도 하나의 특성, 예를 들어, 단백질 분해에 저항하는 능력을 추가로 포함한다.
특정 구현예에서, 전달 게놈은 hARSA 및 hSapB 둘 모두를 발현하도록 설계되고, hARSA를 암호화하는 제1 코딩 서열 및 hSapB을 암호화하는 제2 코딩 서열을 포함하는 뉴클레오티드 서열을 포함한다. 특정 구현예에서, hARSA를 암호화하는 제1 코딩 서열 및 hSapB을 암호화하는 제2 코딩 서열은 리보솜 스키핑 요소에 의해 분리된다. 당업계에 공지된 임의의 리보솜 스키핑 요소, 예를 들어 본원의 다른 곳에서 기술된 리보솜 스키핑 요소가 사용될 수 있다. 특정 구현예에서, hARSA를 암호화하는 제1 코딩 서열 및 hSapB을 암호화하는 제2 코딩 서열을 포함하는 뉴클레오티드 서열은 서열번호 74에 제시된 뉴클레오티드 서열을 포함한다.
전달 게놈은 임의의 포유류 세포(예를 들어, 인간 세포)에서 ARSA, SUMF1, 및/또는 SapB를 발현하는데 사용될 수 있다. 따라서, TRE는 임의의 포유류 세포(예를 들어, 인간 세포)에서 활성일 수 있다. 특정 구현예에서, TRE는 광범위한 인간 세포에서 활성이다. 이러한 TRE는, 거대세포바이러스(CMV) 프로모터/인핸서(예를 들어, 서열번호 58과 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 동일한 뉴클레오티드 서열을 포함함), SV40 프로모터, 닭 베타 액틴(CBA) 프로모터(예를 들어, 서열번호 59 또는 25와 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 동일한 뉴클레오티드 서열을 포함함), smCBA 프로모터(예를 들어, 서열번호 55와 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 동일한 뉴클레오티드 서열을 포함함), 인간 신장 인자 1 알파(EF1α) 프로모터(예를 들어, 서열번호 40과 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 동일한 뉴클레오티드 서열을 포함함), 전사 인자 결합 부위를 포함하는 마우스의 미세 바이러스(MVM) 인트론(예를 들어, 서열번호 35와 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 동일한 뉴클레오티드 서열을 포함함), 인간 포스포글리세레이트 키나아제(PGK1) 프로모터, 인간 유비퀴틴 C(Ubc) 프로모터, 인간 베타 액틴 프로모터, 인간 뉴런 특이적 에놀라아제(enolase)(ENO2) 프로모터, 인간 베타-글루쿠로니다제(glucuronidase)(GUSB) 프로모터, 토끼 베타-글로빈 요소(예를 들어, 서열번호 60과 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 동일한 뉴클레오티드 서열을 포함함), 인간 칼모듈린(calmodulin) 1(CALM1) 프로모터(예를 들어, 서열번호 54와 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 동일한 뉴클레오티드 서열을 포함함), 및/또는 인간 메틸-CpG 결합 단백질 2(MeCP2) 프로모터를 포함하는 구성 프로모터 및/또는 인핸서 요소를 포함할 수 있다. 이들 TRE 중 어느 하나는 효율적인 전사를 유도하기 위해 임의의 순서로 조합될 수 있다. 예를 들어, 전달 게놈은 CMV 인핸서, CBA 프로모터, 및 집합적으로 CAG 프로모터로 지칭되는 토끼 베타-글로빈 유전자의 엑손 3의 스플라이스 수용체를 포함할 수 있다(예를 들어, 서열번호 28과 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 동일한 뉴클레오티드 서열을 포함함). 예를 들어, 전달 게놈은 CMV 인핸서 및 CBA 프로모터, 및 이에 이어지는 집합적으로 CASI 프로모터 영역으로 지칭되는 스플라이스 공여자 및 스플라이스 수용자를 포함할 수 있다(예를 들어, 서열번호 63과 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 동일한 뉴클레오티드 서열을 포함함).
대안적으로, TRE는 조직-특이적 TRE일 수 있다. 즉, 이는 특정 조직(들) 및/또는 기관(들)에서 활성이다. 조직-특이적 TRE는 하나 이상의 조직-특이적 프로모터 및/또는 인핸서 요소, 및 선택적으로 하나 이상의 구성 프로모터 및/또는 인핸서 요소를 포함한다. 당업자는 조직-특이적 프로모터 및/또는 인핸서 요소가 당업계에 공지된 방법에 의해 조직에서 특이적으로 발현된 유전자로부터 단리될 수 있음을 이해할 것이다.
특정 구현예에서, TRE는 뇌-특이적(예를 들어, 뉴런-특이적, 신경교세포-특이적, 성상교세포-특이적, 희소돌기교세포-특이적, 미세교세포-특이적 및/또는 중추 신경계-특이적)이다. 예시적인 뇌-특이적 TRE는, 제한 없이, 인간 신경교 섬유소 산성 단백질(GFAP) 프로모터, 인간 시냅신 1(SYN1) 프로모터, 인간 시냅신 2(SYN2) 프로모터, 인간 메탈로티오네인 3(MT3) 프로모터, 및/또는 인간 프로테오리피드 단백질 1(PLP1) 프로모터로부터의 하나 이상의 요소를 포함할 수 있다. 더 많은 뇌-특이적 프로모터 요소가 WO2016/100575A1에 개시되어 있으며, 이는 그 전체가 참조로서 본원에 통합된다.
특정 구현예에서, 전달 게놈은 2개 이상의 TRE를 포함하고, 전술한 TRE 중 적어도 하나를 선택적으로 포함한다. 당업자는 이들 TRE 중 임의의 것이 임의의 순서로 조합될 수 있고, 구성 TRE 및 조직-특이적 TRE의 조합이 효율적이고 조직-특이적인 전사를 유도할 수 있음을 이해할 것이다.
특정 구현예에서, 전달 벡터는 비암호화 스터퍼 서열을 추가로 포함한다(예를 들어, 서열번호 39와 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 뉴클레오티드 서열을 포함함). 비암호화 스터퍼 서열은 효율적인 DNA 패키징을 위한 적절한 한계 내에서 벡터의 크기를 유지하기 위해 사용될 수 있으며, 따라서 DNA 패키징의 효율을 증가시키기 위해 사용될 수 있다. 당업자는 스터퍼 서열의 성질이 벡터의 기능에 영향을 미칠 수 있다는 것을 인식할 것이고, 따라서 사용하기에 가장 적합한 스터퍼 서열을 선택할 것이다.
특정 구현예에서, 전달 벡터는 ARSA 코딩 서열에 인트론 5'을 추가로 포함하거나 이에 삽입된다. 이러한 인트론은, 예를 들어, 전사 침묵을 감소시키고 핵에서 세포질로 mRNA를 내보내는 것을 향상시킴으로써 이식유전자 발현을 증가시킬 수 있다. 특정 구현예에서, 전달 게놈은 5'에서 3'까지: 비암호화 엑손, 인트론, 및 ARSA 코딩 서열을 포함한다. 특정 구현예에서, 인트론 서열은 ARSA 코딩 서열에 삽입되며, 여기에서 선택적으로, 인트론은 2개의 천연 엑손을 연결하는 뉴클레오티드 간 결합에 삽입된다. 특정 구현예에서, 인트론은 천연 엑손 1 및 엑손 2를 연결하는 뉴클레오티드간 결합에 삽입된다.
인트론은 ARSA 유전자의 천연 인트론 서열, 상이한 종으로부터의 인트론 서열 또는 동일한 종으로부터의 상이한 유전자, 및/또는 합성 인트론 서열을 포함할 수 있다. 당업자는 합성 인트론 서열이 당업계에 공지된 임의의 컨센서스 스플라이싱 모티프를 도입함으로써 RNA 스플라이싱을 매개하도록 설계될 수 있음을 이해할 것이다(예를 들어, Sibley 등, (2016) Nature Reviews Genetics, 17, 407-21, 이는 그 전체가 본원에 참조로서 통합됨). 예시적인 인트론 서열은 Lu 등, (2013) Molecular Therapy 21(5): 954-63, 및 Lu 등, (2017) Hum. Gene Ther. 28(1): 125-34에서 제공되며, 이는 그 전체가 참조로서 본원에 통합된다. 특정 구현예에서, 전달 게놈은 SV40 인트론(예를 들어, 서열번호 31과 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 동일한 뉴클레오티드 서열을 포함함) 또는 마우스의 미세 바이러스(MVM) 인트론(예를 들어, 서열번호 35와 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 동일한 뉴클레오티드 서열을 포함함)을 포함한다. 특정 구현예에서, 전달 게놈은 SV40 인트론(예를 들어, 서열번호 31에 제시된 뉴클레오티드 서열을 포함함) 또는 마우스의 미세 바이러스(MVM) 인트론(예를 들어, 서열번호 35에 제시된 뉴클레오티드 서열을 포함함)를 포함한다. 특정 구현예에서, 전달 게놈은, 부분적으로 전사되지 않은 닭 ACTB(cACTB) 프로모터, 모든 cACTB 엑손 1, 부분적으로 cACTB 인트론 1, 부분적으로 토끼 HBB2(rHBB2) 인트론 2, 및 부분적으로 rHBB2 엑손 3을 포함하는, 닭 및 토끼 서열의 조합을 포함하는 키메라 인트론 서열을 포함한다(예를 들어, 서열번호 32). 특정 구현예에서, 전달 게놈은 키메라 인트론 서열을 포함한다(예를 들어, 서열번호 32와 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 동일한 뉴클레오티드 서열을 포함함). 특정 구현예에서, 전달 게놈은 키메라 인트론 서열을 포함한다(예를 들어, 서열번호 32에 제시된 뉴클레오티드 서열을 포함함).
특정 구현예에서, 전달 게놈은 CMV 인핸서, CBA 프로모터, 및 키메라 인트론 서열을 포함한다(예를 들어, 서열번호 36과 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 동일한 뉴클레오티드 서열을 포함함). 특정 구현예에서, 전달 게놈은 서열번호 36을 포함하는 TRE를 포함한다.
특정 구현예에서, 본원에서 개시된 전달 게놈은 전사 종결자(예를 들어, 폴리아데닐화 서열)를 추가로 포함한다. 특정 구현예에서, 전사 종결자는 ARSA 코딩 서열에 대해 3'이다. 전사 종결자는 전사를 효과적으로 종료하는 임의의 서열일 수 있고, 당업자는 이러한 서열이 ARSA 코딩 서열의 전사가 필요한 세포에서 발현되는 임의의 유전자로부터 단리될 수 있음을 이해할 것이다. 특정 구현예에서, 전사 종결자는 폴리아데닐화 서열을 포함한다. 특정 구현예에서, 폴리아데닐화 서열은 인간 ARSA 유전자의 내인성 폴리아데닐화 서열과 동일하거나 실질적으로 동일하다. 특정 구현예에서, 폴리아데닐화 서열은 외인성 폴리아데닐화 서열이다. 특정 구현예에서, 폴리아데닐화 서열은 SV40 폴리아데닐화 서열이다(예를 들어, 서열번호 31, 42, 43, 또는 45에 제시된 뉴클레오티드 서열, 또는 이에 상보적인 뉴클레오티드 서열을 포함함). 특정 구현예에서, 폴리아데닐화 서열은 서열번호 42에 제시된 서열을 포함한다.
특정 구현예에서, 전달 게놈은 5'에서 3'까지: TRE, ARSA 코딩 서열, 및 폴리아데닐화 서열을 포함한다. 특정 구현예에서, TRE는 서열번호 25, 32, 36, 54, 55, 및/또는 58 중 어느 하나와 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 갖고; ARSA 코딩 서열은 서열번호 14, 24, 62, 또는 72와 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 갖고/갖거나; 폴리아데닐화 서열은 서열번호 42, 43, 및 45와 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 갖는다.
특정 구현예에서, TRE는 서열번호 36에 제시된 서열을 포함하고; ARSA 코딩 서열은 서열번호 14에 제시된 서열을 포함하고/하거나; 폴리아데닐화 서열은 서열번호 42에 제시된 서열을 포함한다. 특정 구현예에서, TRE는 5'에서 3'까지 서열번호 58에 제시된 서열, 서열번호 25에 제시된 서열, 및 서열번호 32에 제시된 서열을 포함한다.
특정 구현예에서, TRE는 서열번호 54에 제시된 서열을 포함하고; ARSA 코딩 서열은 서열번호 62에 제시된 서열을 포함하고/하거나; 폴리아데닐화 서열은 서열번호 42에 제시된 서열을 포함한다. 특정 구현예에서, TRE는 서열번호 55에 제시된 서열을 포함하고; ARSA 코딩 서열은 서열번호 62에 제시된 서열을 포함하고/하거나; 폴리아데닐화 서열은 서열번호 42에 제시된 서열을 포함한다.
특정 구현예에서, TRE는 서열번호 36에 제시된 서열을 포함하고; ARSA 코딩 서열은 서열번호 72에 제시된 서열을 포함하고/하거나; 폴리아데닐화 서열은 서열번호 42에 제시된 서열을 포함한다. 특정 구현예에서, TRE는 5'에서 3'까지 서열번호 58에 제시된 서열, 서열번호 25에 제시된 서열, 및 서열번호 32에 제시된 서열을 포함한다.
특정 구현예에서, 전달 게놈은 hSUMF1 코딩 서열을 추가로 포함한다. 특정 구현예에서, 전달 게놈은 5'에서 3'까지: TRE, ARSA 코딩 서열, 2A 요소, 및 hSUMF1 코딩 서열을 포함한다. 특정 구현예에서, TRE는 서열번호 25, 32, 36, 54, 55, 및/또는 58과 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 갖고; ARSA 코딩 서열은 서열번호 62와 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 갖고; 2A 요소는 서열번호 63과 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 갖고; hSUMF1 서열은 서열번호 64와 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 갖는다. 특정 구현예에서, hSUMF1 코딩 서열을 추가로 포함하는 전달 게놈은 5'에서 3'까지: 서열번호 54 또는 55에 제시된 서열을 포함하는 TRE, 서열번호 62에 제시된 서열을 포함하는 hARSA 코딩 서열, 서열번호 63에 제시된 서열을 포함하는 2A 요소, 및 서열번호 64에 제시된 서열을 포함하는 hSUMF1 코딩 서열을 포함한다. 특정 구현예에서, hARSA-2A-hSUMF1 코딩 서열은 서열번호 30에 제시된 서열을 포함한다.
특정 구현예에서, 전달 게놈은 hSapB 코딩 서열을 추가로 포함한다. 특정 구현예에서, 전달 게놈은 5'에서 3'까지: TRE, ARSA 코딩 서열, 2A 요소, 및 hSapB 코딩 서열을 포함한다. 특정 구현예에서, TRE는 서열번호 25, 32, 36, 54, 55, 및/또는 58과 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 갖고; ARSA 코딩 서열은 서열번호 72와 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 갖고; 2A 요소는 서열번호 63과 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 갖고; hSapB 서열은 서열번호 73과 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 갖는다. 특정 구현예에서, hSapB 코딩 서열을 추가로 포함하는 전달 게놈은 5'에서 3'까지: 서열번호 36에 제시된 서열을 포함하는 TRE, 서열번호 72에 제시된 서열을 포함하는 hARSA 코딩 서열, 서열번호 63에 제시된 서열을 포함하는 2A 요소, 및 서열번호 74에 제시된 서열을 포함하는 hSapB 코딩 서열을 포함한다. 특정 구현예에서, hARSA-2A-hSapB 코딩 서열은 서열번호 74에 제시된 서열을 포함한다.
특정 구현예에서, 전달 게놈은 서열번호 41, 44, 46, 65, 67, 또는 75와 적어도 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 동일한 서열을 포함한다. 특정 구현예에서, 전달 게놈은 서열번호 41, 44, 46, 65, 67, 또는 75에 제시된 뉴클레오티드 서열을 포함한다. 특정 구현예에서, 전달 게놈의 뉴클레오티드 서열은 서열번호 41, 44, 46, 65, 67, 또는 75에 제시된 뉴클레오티드 서열을 포함한다. 특정 구현예에서, 전달 게놈은 서열번호 44에 제시된 뉴클레오티드 서열을 포함한다. 특정 구현예에서, 전달 게놈의 뉴클레오티드 서열은 서열번호 44에 제시된 뉴클레오티드 서열로 이루어진다.
특정 구현예에서, 본원에서 개시된 전달 게놈은 TRE의 5' 역위 말단 반복(5' ITR) 뉴클레오티드 서열 5', 및 ARSA 코딩 서열의 3' 역위 말단 반복(3' ITR) 뉴클레오티드 서열 3'을 포함한다. 임의의 AAV 혈청형 또는 이의 변이체로부터의 ITR 서열은 본원에 개시된 전달 게놈에 사용될 수 있다. 5' 및 3' ITR은 동일한 혈청형의 AAV 또는 상이한 혈청형의 AAV로부터 유래할 수 있다. 본원에 개시된 전달 게놈에 사용하기 위한 예시적인 ITR은 서열번호 18 내지 21, 26 및 27에 제시되어 있다.
특정 구현예에서, 5' ITR 또는 3' ITR은 AAV2로부터 유래한다. 특정 구현예에서, 5' ITR 또는 3' ITR 둘 모두는 AAV2로부터 유래한다. 특정 구현예에서, 5' ITR 뉴클레오티드 서열은 서열번호 18과 적어도 90%(예를 들어, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100%)의 서열 동일성을 갖거나, 3' ITR 뉴클레오티드 서열은 서열번호 19와 적어도 90%(예를 들어, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100%)의 서열 동일성을 갖는다. 특정 구현예에서, 5' ITR 뉴클레오티드 서열은 서열번호 18과 적어도 90%(예를 들어, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100%)의 서열 동일성을 갖고, 3' ITR 뉴클레오티드 서열은 서열번호 19와 적어도 90%(예를 들어, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100%)의 서열 동일성을 갖는다. 특정 구현예에서, 전달 게놈은 서열번호 41, 44, 46, 65, 67, 또는 75 중 어느 하나에 제시된 뉴클레오티드 서열, 서열번호 18의 서열을 갖는 5' ITR 뉴클레오티드 서열, 및 서열번호 19의 서열을 갖는 3' ITR 뉴클레오티드 서열을 포함한다.
특정 구현예에서, 5' ITR 또는 3' ITR은 AAV5로부터 유래한다. 특정 구현예에서, 5' ITR 또는 3' ITR 둘 모두는 AAV5로부터 유래한다. 특정 구현예에서, 5' ITR 뉴클레오티드 서열은 서열번호 20과 적어도 90%(예를 들어, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100%)의 서열 동일성을 갖거나, 3' ITR 뉴클레오티드 서열은 서열번호 21과 적어도 90%(예를 들어, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100%)의 서열 동일성을 갖는다. 특정 구현예에서, 5' ITR 뉴클레오티드 서열은 서열번호 20과 적어도 90%(예를 들어, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100%)의 서열 동일성을 갖고, 3' ITR 뉴클레오티드 서열은 서열번호 21과 적어도 90%(예를 들어, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100%)의 서열 동일성을 갖는다. 특정 구현예에서, 전달 게놈은 서열번호 46 내지 50 중 어느 하나에 제시된 뉴클레오티드 서열, 서열번호 20의 서열을 갖는 5' ITR 뉴클레오티드 서열, 및 서열번호 21의 서열을 갖는 3' ITR 뉴클레오티드 서열을 포함한다.
특정 구현예에서, 5' ITR 뉴클레오티드 서열 및 3' ITR 뉴클레오티드 서열은 서로 실질적으로 상보적이다(예를 들어, 5' 또는 3' ITR에서의 1, 2, 3, 4 또는 5 뉴클레오티드 위치에서의 불일치를 제외하고 서로 상보적임).
특정 구현예에서, 5' ITR 또는 3' ITR은 Rep 단백질("비-분해성 ITR")에 의한 분해능을 감소시키거나 폐지하도록 변형된다. 특정 구현예에서, 비-분해성 ITR은 말단 분해능 부위의 뉴클레오티드 서열에 삽입, 결실, 또는 치환을 포함한다. 이러한 변형은 전달 게놈이 감염된 세포에서 복제된 후 AAV의 자가-상보성, 이중-가닥 DNA 게놈의 형성을 가능하게 한다. 예시적인 비-분해성 ITR 서열은 당업계에 공지되어 있다(예를 들어, 미국 특허 제7,790,154호 및 제9,783,824호에 제공된 것들을 참조하며, 이들은 그 전체가 참조로서 본원에 통합됨). 특정 구현예에서, 5' ITR은 서열번호 26과 적어도 95%, 96%, 97%, 98%, 또는 99% 동일한 뉴클레오티드 서열을 포함한다. 특정 구현예에서, 5' ITR은 서열번호 26과 적어도 95%, 96%, 97%, 98%, 또는 99% 동일한 뉴클레오티드 서열로 이루어진다. 특정 구현예에서, 5' ITR은 서열번호 26에 제시된 뉴클레오티드 서열로 이루어진다. 특정 구현예에서, 3' ITR은 서열번호 27과 적어도 95%, 96%, 97%, 98%, 또는 99% 동일한 뉴클레오티드 서열을 포함한다. 특정 구현예에서, 5' ITR은 서열번호 27과 적어도 95%, 96%, 97%, 98%, 또는 99% 동일한 뉴클레오티드 서열로 이루어진다. 특정 구현예에서, 3' ITR은 서열번호 27에 제시된 뉴클레오티드 서열로 이루어진다. 특정 구현예에서, 5' ITR은 서열번호 26에 제시된 뉴클레오티드 서열로 이루어지고, 3' ITR은 서열번호 27에 제시된 뉴클레오티드 서열로 이루어진다. 특정 구현예에서, 5' ITR은 서열번호 26에 제시된 뉴클레오티드 서열로 이루어지고, 3' ITR은 서열번호 19에 제시된 뉴클레오티드 서열로 이루어진다.
특정 구현예에서, 3' ITR은 야생형 AAV2 게놈 서열로부터 유래된 추가의 뉴클레오티드 서열의 측면에 위치한다. 특정 구현예에서, 3' ITR은 야생형 AAV2 ITR에 인접한 야생형 AAV2 서열로부터 유래된 추가의 37 bp 서열의 측면에 위치한다. 예를 들어, Savy 등, Human Gene Therapy Methods (2017) 28(5): 277-289 참조(이는 그 전체가 본원에 참조로서 통합됨). 특정 구현예에서, 추가의 37 bp 서열은 3' ITR의 내부에 있다. 특정 구현예에서, 37 bp 서열은 서열 번호 56에 제시된 서열로 이루어진다. 특정 구현예에서, 3' ITR은 서열번호 57과 적어도 95%, 96%, 97%, 98%, 또는 99% 동일한 뉴클레오티드 서열을 포함한다. 특정 구현예에서, 3' ITR은 서열 번호 57에 제시된 뉴클레오티드 서열을 포함한다. 특정 구현예에서, 3' ITR의 뉴클레오티드 서열은 서열번호 57과 적어도 95%, 96%, 97%, 98%, 또는 99% 동일한 뉴클레오티드 서열로 이루어진다. 특정 구현예에서, 3' ITR의 뉴클레오티드 서열은 서열번호 57에 제시된 뉴클레오티드 서열로 이루어진다.
특정 구현예에서, 전달 게놈은 5'에서 3'까지: 5' ITR; 5'에서 3'까지: 본원에 개시된 바와 같은, TRE, 선택적으로 비암호화 엑손 및 인트론, ARSA 코딩 서열, 및 폴리아데닐화 서열을 포함하는 내부 요소; 비-분해성 ITR; 내부 요소에 상보적인 뉴클레오티드 서열; 및 3' ITR을 포함한다. 이러한 전달 게놈은 감염 후 및 복제 전에 AAV의 자가-상보성, 이중-가닥 DNA 게놈을 형성할 수 있다.
특정 구현예에서, 전달 게놈은 5'에서 3'까지: 5' ITR, TRE, ARSA 코딩 서열, 폴리아데닐화 서열, 및 3' ITR을 포함한다. 특정 구현예에서, 5' ITR은 서열번호 18, 20, 또는 26과 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 갖고; TRE는 서열번호 25, 32, 36, 54, 55, 및/또는 58과 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 갖고; ARSA 코딩 서열은 서열번호 14, 24, 62, 또는 72와 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 갖고; 폴리아데닐화 서열은 서열번호 42, 43, 및 45와 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 갖고/갖거나; 3' ITR은 서열번호 19, 21, 27, 또는 57과 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 갖는다. 특정 구현예에서, 5' ITR은 서열번호 18, 20, 및 26으로 이루어진 군으로부터 선택된 뉴클레오티드 서열을 포함하거나 이로 이루어지고; TRE는 서열번호 25, 32, 36, 54, 55, 및/또는 58로 이루어진 군으로부터 선택된 뉴클레오티드 서열을 포함하고; ARSA 코딩 서열은 서열번호 14, 24, 62, 또는 72에 제시된 서열을 포함하고; 폴리아데닐화 서열은 서열번호 42, 43, 및 45로 이루어진 군으로부터 선택된 뉴클레오티드 서열을 포함하고/하거나; 3' ITR은 서열번호 19, 21, 27, 또는 57로 이루어진 군으로부터 선택된 뉴클레오티드 서열을 포함하거나 이로 이루어진다.
특정 구현예에서, 5' ITR은 서열 번호 18에 제시된 서열을 포함하거나 이로 이루어지고; TRE는 서열 번호 36에 제시된 서열을 포함하고; ARSA 코딩 서열은 서열 번호 14, 24, 62 또는 72에 제시된 서열을 포함하고; 폴리아데닐화 서열은 서열 번호 42에 제시된 서열을 포함하고/하거나; 3' ITR은 서열번호 19에 제시된 서열을 포함하거나 이로 이루어진다.
특정 구현예에서, 전달 게놈은 서열번호 47, 48, 49, 68, 69, 또는 76과 적어도 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 동일한 서열을 포함한다. 특정 구현예에서, 전달 게놈은 서열번호 47, 48, 49, 68, 69, 또는 76에 제시된 뉴클레오티드 서열을 포함한다. 특정 구현예에서, 전달 게놈의 뉴클레오티드 서열은 서열번호 47, 48, 49, 68, 69, 또는 76에 제시된 뉴클레오티드 서열을 포함한다. 특정 구현예에서, 전달 게놈은 서열번호 48에 제시된 뉴클레오티드 서열을 포함한다. 특정 구현예에서, 전달 게놈의 뉴클레오티드 서열은 서열번호 48에 제시된 뉴클레오티드 서열을 포함한다.
특정 구현예에서, rAAV는 다음을 포함한다: (a) 서열번호 16의 아미노산 203 내지 736의 아미노산 서열을 포함하는 AAV 캡시드 단백질, 및 다음의 유전적 요소를 5'에서 3'까지 포함하는 전달 게놈: 5' ITR 요소(예를 들어, 서열번호 18의 5' ITR), 인핸서 요소(예를 들어, 서열번호 58의 인핸서 요소), 프로모터 서열(예를 들어, 서열번호 25의 프로모터 서열), 키메라 인트론 서열(예를 들어, 서열번호 32의 키메라 인트론 서열), 침묵적으로 변형된 인간 ARSA 코딩 서열(예를 들어, 서열번호: 14의 hARSA 코딩 서열), SV40 폴리아데닐화 서열(예를 들어, 서열 번호 42의 SV40 폴리아데닐화 서열),및 3' ITR 요소(예를 들어, 서열번호 19의 3' ITR); (b) 서열번호 16의 아미노산 138 내지 736의 아미노산 서열을 포함하는 AAV 캡시드 단백질, 및 다음의 유전적 요소를 5'에서 3'까지 포함하는 전달 게놈: 5' ITR 요소(예를 들어, 서열번호 18의 5' ITR), 인핸서 요소(예를 들어, 서열번호 58의 인핸서 요소), 프로모터 서열(예를 들어, 서열번호 25의 프로모터 서열), 키메라 인트론 서열(예를 들어, 서열번호 32의 키메라 인트론 서열), 침묵적으로 변형된 인간 ARSA 코딩 서열(예를 들어, 서열번호: 14의 hARSA 코딩 서열), SV40 폴리아데닐화 서열(예를 들어, 서열 번호 42의 SV40 폴리아데닐화 서열),및 3' ITR 요소(예를 들어, 서열번호 19의 3' ITR); 및/또는 (c) 서열번호 16의 아미노산 서열을 포함하는 AAV 캡시드 단백질, 및 다음의 유전적 요소를 5'에서 3'까지 포함하는 전달 게놈: 5' ITR 요소(예를 들어, 서열번호 18의 5' ITR), 인핸서 요소(예를 들어, 서열번호 58의 인핸서 요소), 프로모터 서열(예를 들어, 서열번호 25의 프로모터 서열), 키메라 인트론 서열(예를 들어, 서열번호 32의 키메라 인트론 서열), 침묵적으로 변형된 인간 ARSA 코딩 서열(예를 들어, 서열번호: 14의 hARSA 코딩 서열), SV40 폴리아데닐화 서열(예를 들어, 서열 번호 42의 SV40 폴리아데닐화 서열),및 3' ITR 요소(예를 들어, 서열번호 19의 3' ITR).
특정 구현예에서, rAAV는 다음을 포함한다: (a) 서열번호 16의 아미노산 203 내지 736의 아미노산 서열을 포함하는 AAV 캡시드 단백질, 및 서열번호 41, 44, 46, 47, 48, 49, 65, 67, 68, 69, 75, 또는 76 중 어느 하나에 제시된 뉴클레오티드 서열을 포함하는 전달 게놈; (b) 서열번호 16의 아미노산 138 내지 736의 아미노산 서열을 포함하는 AAV 캡시드 단백질, 및 서열번호 41, 44, 46, 47, 48, 49, 65, 67, 68, 69, 75, 또는 76 중 어느 하나에 제시된 뉴클레오티드 서열을 포함하는 전달 게놈; 및/또는 (c) 서열번호 16의 아미노산 서열을 포함하는 AAV 캡시드 단백질, 및 서열번호 41, 44, 46, 47, 48, 49, 65, 67, 68, 69, 75, 또는 76 중 어느 하나에서 제시된 뉴클레오티드 서열을 포함하는 전달 게놈.
또 다른 양태에서, 서열번호 41, 44, 46, 47, 48, 49, 65, 67, 68, 69, 75, 또는 76에 제시된 핵산 서열과 적어도 80%(예를 들어, 적어도 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%) 동일한 핵산 서열을 포함하는 폴리뉴클레오티드가 본원에서 제공된다.   특정 구현예에서, 폴리뉴클레오티드는 서열번호 41, 44, 46, 47, 48, 49, 65, 67, 68, 69, 75, 또는 76에 제시된 핵산 서열을 포함한다.   특정 구현예에서, 폴리뉴클레오티드는 서열번호 41, 44, 46, 47, 48, 49, 65, 67, 68, 69, 75, 또는 76에 제시된 핵산 서열로 이루어진다.   특정 구현예에서, 폴리뉴클레오티드는 서열번호 44 또는 48에 제시된 핵산 서열을 포함한다. 특정 구현예에서, 폴리뉴클레오티드는 서열번호 44 또는 48에 제시된 핵산 서열로 이루어진다.
또한, 서열번호 14, 62, 또는 72에 제시된 핵산 서열과 적어도 80%(예를 들어, 적어도 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%) 동일한 핵산 서열을 포함하는 폴리뉴클레오티드가 본원에서 제공된다. 특정 구현예에서, 폴리뉴클레오티드는 서열번호 14, 62 또는 72에 제시된 핵산 서열을 포함한다.   특정 구현예에서, 폴리뉴클레오티드는 서열번호 14, 62 또는 72에 제시된 핵산 서열로 이루어진다.   특정 구현예에서, 폴리뉴클레오티드는 서열번호 14에 제시된 핵산 서열을 포함한다. 특정 구현예에서, 폴리뉴클레오티드는 서열번호 14에 제시된 핵산 서열로 이루어진다.
또 다른 양태에서, 본 개시는 약학적으로 허용 가능한 부형제, 보조제, 희석제, 비히클 또는 담체, 또는 이들의 조합과 함께 본원에 개시된 바와 같은 AAV를 포함하는 약학적 조성물을 제공한다. "약학적으로 허용 가능한 담체"는, 조성물의 활성 성분과 조합될 때, 성분이 생물학적 활성을 유지할 수 있게 하고 의도하지 않은 면역 반응과 같은 파괴적인 생리학적 반응을 일으키지 않는 임의의 물질을 포함한다. 약학적으로 허용 가능한 담체는 물, 인산염 완충 식염수, 유화액, 예컨대 오일/물 유화액, 및 습윤제를 포함한다. 이러한 담체를 포함하는 조성물은 Remington's Pharmaceutical Sciences, 현재 판, Mack Publishing Co., Easton Pa. 18042, USA; A. Gennaro (2000) "Remington: The Science and Practice of Pharmacy", 제20판, Lippincott, Williams, & Wilkins; Pharmaceutical Dosage Forms and Drug Delivery Systems (1999) H. C. Ansel 등, 제7판, Lippincott, Williams, & Wilkins; 및 Handbook of Pharmaceutical Excipients (2000) A. H. Kibbe 등, 제3판, Amer. Pharmaceutical Assoc.에 제시된 것들과 같은 공지된 종래의 방법에 의해 제형화된다.
또 다른 양태에서, 본 개시는 인간 ARSA 단백질 또는 이의 단편을 암호화하는 코딩 서열을 포함하는 폴리뉴클레오티드를 제공하며, 여기에서 코딩 서열은 야생형 인간 ARSA 유전자와 100% 미만(예를 들어, 95%, 90%, 85%, 80%, 75%, 70%, 65%, 60%, 55%, 또는 50% 미만)의 동일성을 갖도록 침묵적으로 변형된다. 특정 구현예에서, 폴리뉴클레오티드는 서열번호 14, 62 또는 72에 제시된 서열을 포함한다. 특정 구현예에서, 폴리뉴클레오티드는 서열번호 14, 62 또는 72에 제시된 서열로 이루어진다. 폴리뉴클레오티드는 DNA, RNA, 변형된 DNA, 변형된 RNA, 또는 이들의 조합을 포함할 수 있다. 특정 구현예에서, 폴리뉴클레오티드는 발현 벡터이다.
III. 사용 방법
또 다른 양태에서, 본 개시는 세포에서 ARSA 폴리펩티드를 발현시키는 방법을 제공한다. 방법은 대체로 본원에 개시된 바와 같은 rAAV로 세포를 형질도입하는 단계를 포함한다. 이러한 방법은 ARSA 발현을 복원하는 데 매우 효율적이다. 따라서, 특정 구현예에서, 본원에 개시된 방법은 본원에 개시된 rAAV로 세포를 형질도입하는 단계를 포함한다.
본원에 개시된 방법은 ARSA 유전자에서 돌연변이를 보유하는 임의의 세포에 적용될 수 있다. 당업자는 활성 내인성 ARSA를 필요로 하는 세포가 특히 관심 대상임을 이해할 것이다. 따라서, 특정 구현예에서, 방법은 내인성 ARSA 활성을 상실한 임의의 세포에 적용된다. 특정 구현예에서, 방법은 뉴런 및/또는 신경교세포에 적용된다. 특정 구현예에서, 특정 관심 대상은 활성 내인성 ARSA를 필요로 하는 뉴런 및/또는 신경교세포이다. 특정 구현예에서, 방법은 중추 신경계의 세포 및/또는 말초 신경계의 세포에 적용된다. 특정 구현예에서, 특정 관심 대상은 활성 내인성 ARSA를 필요로 하는 중추 신경계 및/또는 말초 신경계의 세포이다. 특정 구현예에서, 특정 관심 대상은 전뇌, 중뇌, 후뇌, 척수, 및 이들의 임의의 조합의 세포이다. 특정 구현예에서, 특정 관심 대상은 척수, 운동 피질, 감각 피질, 시상, 해마, 피각, 소뇌(예를 들어, 소뇌 핵), 및 이들의 임의의 조합으로 이루어진 군으로부터 선택된 중추 신경계 영역의 세포이다. 특정 구현예에서, 특정 관심 대상은 뇌의 교뇌 및 수질의 세포, 척수의 상행근막, 및 이들의 임의의 조합이다. 특정 구현예에서, 특정 관심 대상은, 활성 내인성 ARSA를 필요로 하는, 척수, 운동 피질, 감각 피질, 시상, 해마, 피각, 소뇌(예를 들어, 소뇌 핵), 및 이들의 임의의 조합으로 이루어진 군으로부터 선택된 중추 신경계 영역의 세포이다. 특정 구현예에서, 특정 관심 대상은 중추 신경계(CNS)에서의 운동 뉴런 및 성상교세포 프로파일, CNS에서의 희소돌기교세포(상행 섬유), CNS에서의 대뇌 피질의 세포 집단, 및 말초 신경계(PNS)의 감각 뉴런이다. 특정 구현예에서, 특정 관심 대상은 척수의 배측 근막 내에 있는 것과 같은 희소돌기교세포이다. 특정 구현예에서, 특정 관심 대상은, 성상교세포, 희소돌기교세포, 슈반 세포, 및 이의 임의의 조합을 포함하지만 이에 한정되지 않는, 중추 신경계에서의 신경교 프로파일이다. 특정 구현예에서, 특정 관심 대상은 운동 뉴런, 성상교세포, 희소돌기교세포, 중추 신경계의 대뇌 피질 세포, 말초 신경계의 감각 뉴런, 말초 신경계의 신경교세포(예를 들어, 슈반 세포), 및 이의 임의의 조합이다.
본원에 개시된 방법은 연구 목적을 위해 시험관 내에서 수행될 수 있거나, 치료 목적을 위해 생체 외 또는 생체 내에서 수행될 수 있다.
특정 구현예에서, 형질도입될 세포는 포유류 대상체에 존재하고, AAV는 대상체에서 세포를 형질도입하기에 효과적인 양으로 대상체에게 투여된다. 따라서, 특정 구현예에서, 본 개시는 ARSA 유전자 돌연변이와 연관된 질환 또는 장애를 갖는 대상체를 치료하기 위한 방법을 제공하며, 방법은 대체로 본원에 개시된 바와 같은 rAAV의 유효량을 대상체에게 투여하는 단계를 포함한다. 대상체는 ARSA 돌연변이를 갖는 인간 대상체, 비인간 영장류 대상체(예를 들어, 시노몰구스(cynomolgus)) 또는 설치류 대상체(예를 들어, 마우스)일 수 있다. ARSA 유전자 돌연변이와 연관된 임의의 질환 또는 장애는 본원에 개시된 방법을 사용하여 치료될 수 있다. 적절한 질환 또는 장애는, 제한 없이, 이염색 백색질장애를 포함한다.
특정 구현예에서, 전술한 방법은 다음을 포함하는 rAAV를 사용한다: (a) 서열번호 16의 아미노산 203 내지 736의 아미노산 서열을 포함하는 AAV 캡시드 단백질, 및 다음의 유전적 요소를 5'에서 3'까지 포함하는 전달 게놈: 5' ITR 요소(예를 들어, 서열번호 18의 5' ITR), 인핸서 요소(예를 들어, 서열번호 58의 인핸서 요소), 프로모터 서열(예를 들어, 서열번호 25의 프로모터 서열), 키메라 인트론 서열(예를 들어, 서열번호 32의 키메라 인트론 서열), 침묵적으로 변형된 인간 ARSA 코딩 서열(예를 들어, 서열번호: 14의 hARSA 코딩 서열), SV40 폴리아데닐화 서열(예를 들어, 서열 번호 42의 SV40 폴리아데닐화 서열),및 3' ITR 요소(예를 들어, 서열번호 19의 3' ITR); (b) 서열번호 16의 아미노산 138 내지 736의 아미노산 서열을 포함하는 AAV 캡시드 단백질, 및 다음의 유전적 요소를 5'에서 3'까지 포함하는 전달 게놈: 5' ITR 요소(예를 들어, 서열번호 18의 5' ITR), 인핸서 요소(예를 들어, 서열번호 58의 인핸서 요소), 프로모터 서열(예를 들어, 서열번호 25의 프로모터 서열), 키메라 인트론 서열(예를 들어, 서열번호 32의 키메라 인트론 서열), 침묵적으로 변형된 인간 ARSA 코딩 서열(예를 들어, 서열번호: 14의 hARSA 코딩 서열), SV40 폴리아데닐화 서열(예를 들어, 서열 번호 42의 SV40 폴리아데닐화 서열),및 3' ITR 요소(예를 들어, 서열번호 19의 3' ITR); 및/또는 (c) 서열번호 16의 아미노산 서열을 포함하는 AAV 캡시드 단백질, 및 다음의 유전적 요소를 5'에서 3'까지 포함하는 전달 게놈: 5' ITR 요소(예를 들어, 서열번호 18의 5' ITR), 인핸서 요소(예를 들어, 서열번호 58의 인핸서 요소), 프로모터 서열(예를 들어, 서열번호 25의 프로모터 서열), 키메라 인트론 서열(예를 들어, 서열번호 32의 키메라 인트론 서열), 침묵적으로 변형된 인간 ARSA 코딩 서열(예를 들어, 서열번호: 14의 hARSA 코딩 서열), SV40 폴리아데닐화 서열(예를 들어, 서열 번호 42의 SV40 폴리아데닐화 서열),및 3' ITR 요소(예를 들어, 서열번호 19의 3' ITR).
특정 구현예에서, 전술한 방법은 다음을 포함하는 rAAV를 사용한다: (a) 서열번호 16의 아미노산 203 내지 736의 아미노산 서열을 포함하는 AAV 캡시드 단백질, 및 서열번호 41, 44, 46, 47, 48, 49, 65, 67, 68, 69, 75, 또는 76 중 어느 하나에 제시된 뉴클레오티드 서열을 포함하는 전달 게놈; (b) 서열번호 16의 아미노산 138 내지 736의 아미노산 서열을 포함하는 AAV 캡시드 단백질, 및 서열번호 41, 44, 46, 47, 48, 49, 65, 67, 68, 69, 75, 또는 76 중 어느 하나에 제시된 뉴클레오티드 서열을 포함하는 전달 게놈; 및/또는 (c) 서열번호 16의 아미노산 서열을 포함하는 AAV 캡시드 단백질, 및 서열번호 41, 44, 46, 47, 48, 49, 65, 67, 68, 69, 75, 또는 76 중 어느 하나에서 제시된 뉴클레오티드 서열을 포함하는 전달 게놈.
본원에 개시된 방법은 생체 내 및 시험관 내 모두에서 높은 효율로 세포에서 ARSA 단백질을 발현할 수 있다는 점에서 특히 유리하다. 특정 구현예에서, ARSA 단백질의 발현 수준은 ARSA 유전자 내에 돌연변이를 갖지 않는 동일한 유형의 세포에서의 내인성 ARSA 단백질의 발현 수준의 적어도 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 또는 100%이다. 특정 구현예에서, ARSA 단백질의 발현 수준은 ARSA 유전자 내에 돌연변이를 갖지 않는 동일한 유형의 세포에서의 내인성 ARSA 단백질의 발현 수준보다 적어도 1.1, 1.2, 1.3, 1.4, 1.5, 1.6, 1.7, 1.8, 1.9, 2, 3, 4, 5, 6, 7, 8, 9, 또는 10배 더 높다. ELISA, 웨스턴 블롯팅, 면역 염색, 및 질량 분광분석을 포함하되 이들로 한정되지 않는, ARSA 단백질의 발현 수준을 결정하는 임의의 방법이 사용될 수 있다.
특정 구현예에서, 본원에 개시된 AAV 조성물로 세포를 형질도입하는 것은 본원에 제공된 바와 같이 또는 당업자에게 공지된 임의의 형질도입 방법에 의해 수행될 수 있다. 특정 구현예에서, 세포는 50,000; 100,000; 150,000; 200,000; 250,000; 300,000; 350,000; 400,000; 450,000; 또는 500,000의 감염 다중도(MOI)로 또는 세포의 최적 형질도입을 제공하는 임의의 MOI로 AAV와 접촉될 수 있다.
본원에 개시된 AAV 조성물은 정맥내, 경막내, 복강내, 피하, 근육내, 비강내, 국소 또는 피부내 경로를 포함하되 이들로 한정되지 않는 임의의 적절한 경로에 의해 대상체에게 투여될 수 있다. 특정 구현예에서, 조성물은 정맥내 주사 또는 피하 주사를 통해 투여되도록 제형화된다.
IV. AAV 패키징 시스템
또 다른 양태에서, 본 개시는 본원에 개시된 재조합 아데노-연관 바이러스(rAAV)의 재조합 제조를 위한 패키징 시스템을 제공한다. 이러한 패키징 시스템은 대체로, 하나 이상의 AAV Rep 단백질을 암호화하는 제1 뉴클레오티드; 본원에 개시된 바와 같은 AAV 중 어느 하나의 캡시드 단백질을 암호화하는 제2 뉴클레오티드; 및 본원에 개시된 바와 같은 rAAV 게놈 중 어느 하나를 포함하는 제3 뉴클레오티드 서열을 포함하되, 패키징 시스템은 캡시드 내에 전달 게놈을 둘러싸서 AAV를 형성하도록 세포 내에서 작동한다.
특정 구현예에서, 패키징 시스템은 하나 이상의 AAV Rep 단백질을 암호화하는 제1 뉴클레오티드 및 AAV 캡시드 단백질을 암호화하는 제2 뉴클레오티드, 및 rAAV 게놈을 포함하는 제3 뉴클레오티드 서열을 포함하는 제2 벡터를 포함한다. 본원에 기술된 패키징 시스템의 맥락에서 사용되는 바와 같이, "벡터"는 핵산을 세포 내로 도입하기 위한 비히클인 핵산 분자를 지칭한다(예를 들어, 플라스미드, 바이러스, 코스미드, 인공 염색체 등).
임의의 AAV Rep 단백질은 본원에 개시된 패키징 시스템에 사용될 수 있다. 패키징 시스템의 특정 구현예에서, Rep 뉴클레오티드 서열은 AAV2 Rep 단백질을 암호화한다. 적절한 AAV2 Rep 단백질은 Rep 78/68 또는 Rep 68/52를 포함하되 이에 한정되지 않는다. 패키징 시스템의 특정 구현예에서, AAV2 Rep 단백질을 암호화하는 뉴클레오티드 서열은 서열번호 22의 AAV2 Rep 아미노산 서열과 최소 백분율 서열 동일성을 갖는 단백질을 암호화하는 뉴클레오티드 서열을 포함하되, 최소 백분율 서열 동일성은 AAV2 Rep 단백질의 아미노산 서열 길이에 걸쳐 적어도 70%(예를 들어, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 98%, 적어도 99%, 또는 100%)이다. 패키징 시스템의 특정 구현예에서, AAV2 Rep 단백질은 서열번호 22에 제시된 아미노산 서열을 갖는다.
패키징 시스템의 특정 구현예에서, 패키징 시스템은 하나 이상의 헬퍼 바이러스 유전자를 포함하는 제4 뉴클레오티드 서열을 추가로 포함한다. 패키징 시스템의 특정 구현예에서, 패키징 시스템은 하나 이상의 헬퍼 바이러스 유전자를 포함하는 제4 뉴클레오티드 서열을 포함하는 제3 벡터, 예를 들어 헬퍼 바이러스 벡터를 추가로 포함한다. 제3 벡터는 독립적인 제3 벡터이거나, 제1 벡터와 일체화되거나, 제2 벡터와 일체화될 수 있다.
패키징 시스템의 특정 구현예에서, 헬퍼 바이러스는 아데노바이러스, 포진 바이러스(단순 포진 바이러스(HSV)를 포함함), 수두 바이러스(예를 들어, 우두 바이러스), 거대세포 바이러스(CMV), 및 바큘로바이러스로 이루어진 군으로부터 선택된다. 헬퍼 바이러스가 아데노바이러스인 패키징 시스템의 특정 구현예에서, 아데노바이러스 게놈은 El, E2, E4 및 VA로 이루어진 군으로부터 선택된 하나 이상의 아데노바이러스 RNA 유전자를 포함한다. 헬퍼 바이러스가 HSV인 패키징 시스템의 특정 구현예에서, HSV 게놈은 UL5/8/52, ICPO, ICP4, ICP22 및 UL30/UL42로 이루어진 군으로부터 선택된 하나 이상의 HSV 유전자를 포함한다.
패키징 시스템의 특정 구현예에서, 제1, 제2 및/또는 제3 벡터는 하나 이상의 플라스미드 내에 함유된다. 특정 구현예에서, 제1 벡터 및 제3 벡터는 제1 플라스미드 내에 함유된다. 특정 구현예에서, 제2 벡터 및 제3 벡터는 제2 플라스미드 내에 함유된다.
패키징 시스템의 특정 구현예에서, 제1, 제2 및/또는 제3 벡터는 하나 이상의 재조합 헬퍼 바이러스 내에 함유된다. 특정 구현예에서, 제1 벡터 및 제3 벡터는 재조합 헬퍼 바이러스 내에 함유된다. 특정 구현예에서, 제2 벡터 및 제3 벡터는 재조합 헬퍼 바이러스 내에 함유된다.
또 다른 양태에서, 본 개시는 본원에 기술된 바와 같은 AAV의 재조합 제조 방법을 제공하며, 방법은 본원에 기술된 바와 같은 rAAV를 형성하도록 캡시드 내에 rAAV 게놈을 둘러싸도록 작동되는 조건 하에서 본원에 기술된 바와 같은 패키징 시스템으로 세포를 형질감염시키거나 형질도입하는 단계를 포함한다. rAAV의 재조합 제조를 위한 예시적인 방법은 다음을 포함한다: 일시적 형질감염(예를 들어, 본원에 기재된 바와 같은 제1, 및 제2, 및 선택적으로 제3 벡터를 함유하는 하나 이상의 형질감염 플라스미드를 사용함), 바이러스 감염(예를 들어, 본원에 개시된 바와 같은 제1, 제2, 선택적으로 제3 벡터를 함유하는 하나 이상의 재조합 헬퍼 바이러스, 예컨대 아데노바이러스, 폭스바이러스(예를 들어, 우두 바이러스), 포진 바이러스(HSV, 거대세포 바이러스, 또는 바큘로바이러스를 포함함)를 사용함), 및 안정한 생산자 세포주 형질감염 또는 감염(예를 들어, 하나 이상의 AAV Rep 단백질을 암호화하는 Rep 뉴클레오티드 서열 및/또는 본원에 기재된 바와 같은 하나 이상의 캡시드 단백질을 암호화하는 Cap 뉴클레오티드 서열을 함유하는 포유동물 또는 곤충 세포와 같은 안정한 생산자 세포, 및 플라스미드 또는 재조합 헬퍼 바이러스의 형태로 전달되는 본원에 기술된 전달 게놈을 사용함).
따라서, 본 개시는 재조합 AAV(rAAV)의 제조를 위한 패키징 시스템을 제공하며, 여기에서 패키징 시스템은 하나 이상의 AAV Rep 단백질을 암호화하는 제1 뉴클레오티드 서열; 본원에 기술된 AAV 중 어느 하나의 캡시드 단백질을 암호화하는 제2 뉴클레오티드 서열; 본원에 기술된 AAV 중 어느 하나의 rAAV 게놈 서열을 포함하는 제3 뉴클레오티드 서열; 및 선택적으로 하나 이상의 헬퍼 바이러스 유전자를 포함하는 제4 뉴클레오티드 서열을 포함한다.
V. 실시예
본원에 개시된 재조합 AAV 벡터는 시험관 내 및 생체 내에서 매우 효율적인 유전자 전달을 매개한다. 다음의 실시예는 본원에 개시된 바와 같은 AAV 기반 벡터를 사용하여 (이염색 백색질장애와 같은 특정 인간 질환에서 돌연변이된) ARSA 유전자의 발현을 효율적으로 복원하는 것을 입증한다. 이들 실시예는 예시로서 제공되며, 제한하는 것이 아니다.
실시예 1: 인간 ARSA 전달 벡터
본 실시예는 벡터가 형질도입되는 세포(예를 들어, 인간 세포 또는 마우스 세포)에서 인간 ARSA(hARSA)의 발현을 위한 인간 ARSA 전달 벡터 T-001, pHMI-5000, pHMI-5003, 및 pHMI-hARSA1-TC-002를 제공한다.
a) T-001
도 1a에 나타낸 바와 같은 ARSA 전달 벡터 TC-001은 5'에서 3'까지 다음의 유전적 요소를 포함한다: 5' ITR 요소, CMV 인핸서 요소를 포함하는 전사 조절 요소, 닭-β-액틴 프로모터, 및 키메라 인트론 서열; 야생형 인간 ARSA 코딩 서열; SV40 폴리아데닐화 서열; 및 3' ITR 요소. 이들 요소의 서열은 표 1에 제시되어 있다. 이 벡터는 벡터가 형질도입되는 세포(예를 들어, 인간 세포 또는 마우스 세포)에서 인간 ARSA 단백질을 발현할 수 있다.
b) pHMI-5000
도 1b에 나타낸 바와 같은 ARSA 전달 벡터 pHMI-5000은 5'에서 3'까지 다음의 유전적 요소를 포함한다: 5' ITR 요소, CMV 인핸서 요소를 포함하는 전사 조절 요소, 닭-β-액틴 프로모터, 및 키메라 인트론 서열; 침묵적으로 변형된 인간 ARSA 코딩 서열; SV40 폴리아데닐화 서열; 및 3' ITR 요소. 이들 요소의 서열은 표 1에 제시되어 있다. 이 벡터는 벡터가 형질도입되는 세포(예를 들어, 인간 세포 또는 마우스 세포)에서 인간 ARSA 단백질을 발현할 수 있다.
c) pHMI-5003
도 1c에 나타낸 바와 같은 ARSA 전달 벡터 pHMI-5003은 5'에서 3'까지 다음의 유전적 요소를 포함한다: 5' ITR 요소, CMV 인핸서 요소를 포함하는 전사 조절 요소, 닭-β-액틴 프로모터, 및 키메라 인트론 서열; 침묵적으로 변형된 인간 ARSA 코딩 서열; SV40 폴리아데닐화 서열; 비암호화 스터퍼 서열; 및 3' ITR 요소. 이들 요소의 서열은 표 1에 제시되어 있다. 이 벡터는 벡터가 형질도입되는 세포(예를 들어, 인간 세포 또는 마우스 세포)에서 인간 ARSA 단백질을 발현할 수 있다.
d) pHMI-hARSA1-TC-002
도 1d에 나타낸 바와 같은 ARSA 전달 벡터 pHMI-hARSA1-TC-002는 5'에서 3'까지 pHMI-5000과 동일한 유전적 요소를 포함한다. 이들 요소의 서열은 표 1에 제시되어 있다. pHMI-hARSA1-TC-002와 pHMI-5000 간의 차이는 벡터 백본 서열에 있다. 이 벡터는 벡터가 형질도입되는 세포(예를 들어, 인간 세포 또는 마우스 세포)에서 인간 ARSA 단백질을 발현할 수 있다.
Figure pct00001
본원에 개시된 벡터는 AAVHSC5, AAVHSC7, AAVHSC15 또는 AAVHSC17 캡시드와 같은 AAV 캡시드에 패키징 수 있지만, 이에 한정되지 않는다. 패키징된 바이러스 입자는 야생형 동물 또는 ARSA-결핍 동물에 투여될 수 있다.
실시예 2: ARSA(-/-) 마우스 모델에서의 ARSA 유전자 전달
마우스에서 ARSA 유전자 전달의 효과를 연구하기 위해, ARSA(-/-) 마우스 모델을 생성하였다. ARSA(-/-) 마우스 모델은 네오마이신 카세트를 마우스 ARSA 유전자의 엑손 4 내로 삽입하여 생산된 ARSA 녹-아웃 마우스이다(Hess 등, Proc. Natl. Acad. Sci. U.S.A. 1996, 93(25):14821-14826 참조, 그 전체는 참조로서 본원에 통합됨). ARSA(-/-) 마우스는 인간과 비교하여 유사하지만 보다 경미한 이염색 백색질장애(MLD)를 나타낸다. ARSA(-/-) 마우스는 광범위한 탈수초(demyelination)의 증상을 나타내지 않는다.
MLD를 조사하기 위해 다양한 바이오마커가 사용될 수 있다. 예를 들어, 뇌에서 술파타이드의 수준을 측정할 수 있다. 동물이 나이가 들면서 축적이 증가한다는 희소돌기교세포(C24:0) 및 뉴런(C18:0) 술파타이드의 증가가 보고되었다. 수초 및 림프구 단백질(MAL) mRNA 전사체의 수준을 측정할 수 있다. MAL은 희소돌기교세포 및 슈반 세포에 의해 발현되고, 신경교세포-축삭 접합부를 안정화시키고, MLD의 병리에 관여한다. MAL 전사체의 수준은 ARSA(-/-) 마우스에서 감소되는 것으로 보고되었다. 리소좀-연관 막 단백질(LAMP-1)은 MLD를 조사하는 데 사용될 수 있는 또 다른 바이오마커이다. LAMP-1 면역 반응성은 항-LAMP-1 항체를 사용하여 ARSA(-/-) 및 야생형 마우스에서 척수 조직에 대한 면역조직화학에 의해 조사되었으며, ARSA(-/-) 마우스에서 LAMP-1 면역 반응성의 증가를 나타냈다. 도 2a는 ARSA(-/-) 마우스의 척수 조직 상에서의 면역조직화학(IHC)에 의해 조사된 LAMP-1 면역 반응성으로부터 유도된 총 픽셀 강도의 정량화를 나타낸다. 비히클 대조군 또는 AAVHSC15 캡시드에 패키징된 pHMI-5000으로 치료한 ARSA(-/-) 마우스에서 항-LAMP-1 항체를 사용하여 IHC를 수행하였다. 도 2a에 나타낸 바와 같이, 투여(4e13 vg/kg의 pHMI-5000이 AAVHSC15 캡시드에 패키징됨) 후 12주차에, 비히클 대조군이 투여된 ARSA(-/-) 동물과 비교하여 LAMP-1 수준의 유의한 감소가 검출되었다.
뇌 조직을 칭량하고, Precellys 비드 균질화기 중 250 uL의 물 중에서 균질화시키고, Pierce BCA 단백질 분석 정량화를 위해 균질물의 10 uL 분취액을 제거하였다. 760 uL의 아세토니트릴을 각 균질물에 첨가하고, 혼합물을 두 번째로 균질화하였다. 균질물을 14,000 x g에서 15분 동안 원심분리하고, 원심분리된 정화된 상청액을 제거하고, RapidFire-MS 분석을 위해 75% 아세토니트릴에서 5회 희석하였다. C19:0 술파타이드(Matreya cat# 1888)를 내부 표준으로서 사용하였고, Sciex API4000 삼중 사중극자 질량 분광계 상의 MRM 모드에서 C18:0, C18:1, C24:0 및 C24:1 술파타이드와 함께 모니터링하였다. 각각의 분석물의 농도를 계산하기 위해 사용된 각각의 샘플에 대한 고유 표준 곡선을 생성하기 위해, 8가지 상이한 농도의 C19:0 술파타이드 IS를 각 샘플에 8회 주입하였다. 도 2b는 시간 경과에 따른 대조군 마우스(WT/Het) 및 ARSA(-/-) 마우스의 뇌에서의 C18:0 술파타이드의 수준을 나타낸다. 대조군은 야생형 동물(ARSA(+/+)) 및 이형접합체 동물(ARSA(+/-))의 혼합체였다. 도 2b에 나타낸 바와 같이, ARSA(-/-) 마우스의 뇌에서의 C18:0 술파타이드의 수준은 시간이 지남에 따라 축적되는 반면, 대조군 마우스의 뇌에서의 C18:0 술파타이드의 수준은 시간이 지남에 따라 크게 변하지 않은 채로 남아 있다. 도 2b의 데이터는 2마리의 대조군 마우스 및 2마리의 ARSA(-/-) 마우스의 분석으로부터 생성되었다. ARSA 결핍 마우스에서 술파타이드 축적에 대한 ARSA 유전자 전달의 효과를 조사하기 위해, AAVHSC15 캡시드에 패키징된 4e13 vg/kg의 pHMI-hARSA1-TC-002로 ARSA(-/-) 마우스를 치료하였다(도 2c). 도 2c에 나타낸 바와 같이, 투여 후 7개월차에, 비히클 대조군으로 치료한 ARSA(-/-) 마우스와 비교하여 치료한 ARSA(-/-) 마우스에서 뇌 술파타이드 수준의 유의한 감소가 관찰되었다.
AAVHSC15 캡시드로 패키징된 4e13 vg/kg 및 6e13 vg/kg의 pHMI-5000, 또는 비히클 대조군으로 치료한 후 7개월차에, ARSA(-/-) 마우스의 전뇌, 중뇌 및 후뇌에서의 C18:0 및 C18:1 술파타이드 이소형 수준을 결정하였다(도 2d). 술파타이드 이소형 수준은 동일한 연령의 야생형 대조군 동물에 대한 배수로서 제시된다. 도 2d에 나타낸 바와 같이, 투여 후 7개월차에, 비히클 대조군으로 치료한 ARSA(-/-) 마우스와 비교하여 치료한 ARSA(-/-) 마우스의 3개의 뇌 영역 모두에서 뇌 술파타이드 수준의 유의한 감소가 관찰되었다. 사용된 방법 및 물질은 전술한 바와 동일하였다. 데이터는 페어링되지 않은 T-검정을 사용하여 분석하였다.
AAVHS15 캡시드로 패키징된 4e13 vg/kg의 pHMI-5000, 또는 비히클 대조군으로 치료한 후 52주차에, ARSA(-/-) 마우스의 전뇌, 중뇌 및 후뇌에서의 C18:0 및 C18:1 술파타이드 이소형 수준(도 2e), C24:0 및 C24:1 술파타이드 이소형 수준(도 2f), 및 총 술파타이드 이소형 수준(도 2g)을 결정하였다. 사용된 방법 및 물질은 전술한 바와 동일하였다. 데이터는 페어링되지 않은 T-검정을 사용하여 분석하였다.
도 3a는 대조군 마우스(WT/Het) 및 ARSA(-/-) 마우스에서 4주차에서의 MAL 전사체의 수준을 나타낸다. 대조군은 야생형 동물(ARSA(+/+)) 및 이형접합체 동물(ARSA(+/-))의 혼합체였다. 트리졸(Trizol) 추출 후 Qiagen RNEasy 컬럼 정제로 마우스 총 RNA를 제조하였다. 전사체를 생산하기 위해 ThermoFisher 고용량 cDNA 키트를 사용하는 cDNA 합성을 위한 템플릿으로서 RNA를 사용하였다. 마우스 HPRT1에 대해 정규화된 카피수로 마우스 수초 및 림프구 단백질(MAL)에 특이적인 액적(droplet) 디지털 PCR 및 프라이머/프로브 세트를 사용하여 MAL 전사체를 평가하였다. 도시된 바와 같이, 4주차에, MAL 전사체의 수준은 이형접합성 마우스와 비교하여 ARSA(-/-) 마우스에서 감소된다. 도 3의 데이터는 5마리의 대조군 마우스 및 6마리의 ARSA(-/-) 마우스의 분석으로부터 생성되었다. ARSA 결핍 마우스에서 MAL 전사물의 수준에 대한 ARSA 유전자 전달의 효과를 조사하기 위해, AAVHSC15 캡시드에 패키징된 4e13 vg/kg의 pHMI-5000으로 ARSA(-/-) 마우스를 치료하였다(도 3b). 도 3b에 나타낸 바와 같이, 투여 후 3개월차에, 야생형 마우스 및 비히클로 치료한 ARSA(-/-) 마우스와 비교하여 치료한 ARSA(-/-) 마우스의 MAL 전사체의 수준의 유의한 증가가 관찰되었다.
AAVHSC15 캡시드에 패키징된 4e13 vg/kg의 pHMI-5000으로 치료한 ARSA(-/-) 마우스에서 MAL 전사체 카피수의 수준을 결정하였다(도 3c). 도 3c는 투여 후 12 또는 52주차에, 야생형 마우스, 또는 비히클 대조군 또는 AAVHSC15 캡시드에 패키징된 4e13 vg/kg의 pHMI-5000을 투여한 ARSA(-/-) 마우스에서 검출된 MAL 전사체 카피수를 나타낸다. 사용된 방법 및 물질은 전술한 바와 동일하였다. 데이터는 페어링되지 않은 T-검정을 사용하여 분석하였다. 도 3c에서, 동물 군 간의 통계적 유의성은 다음과 같다: 12주 비히클 대 치료한 동물, p = 0.0012; 12주 치료한 동물 대 야생형 동물, p < 0.0001; 52주 비히클 대 치료한 동물, p = 0.0004; 및 52주 치료한 동물 대 야생형 동물, 유의하지 않음.
hARSA 활성의 치료적 수준이 달성될 수 있는지의 여부를 조사하기 위해, AAV9 캡시드에 패키징된 전달 벡터 T-001(PCT 공개번호 WO2002/052052 참조, 그 전체는 참조로서 본원에 통합됨)을 ARSA(-/-) 마우스에 투여하였다. 미치료 대조군 ARSA(-/-) 마우스, 및 AAV9 캡시드로 패키징된 전달 벡터 T-001을 투여한 ARSA(-/-) 마우스로부터 수득한 뇌 절편의 항-ARSA 면역 반응성은, 치료적 수준(10%)의 hARSA 효소 활성이 체중 킬로그램당(vg/kg) 2e13 벡터 게놈의 투여량에서 달성되었음을 나타낸다. 치료한 ARSA(-/-) 마우스로부터 수득한 뇌 절편의 항-ARSA 면역 반응성은 또한 뇌에서 ARSA 효소 활성의 투여량 의존적 증가를 나타낸다.
실시예 3: ARSA(-/-) 마우스 모델에서의 ARSA 유전자 전달
본 실시예는 인간 ARSA 전달 벡터 pHMI-5000의 사용에 관한 실험 데이터를 제공한다. 본원에 기술된 바와 같이, 전달 벡터 pHMI-5000은 ARSA 단백질의 유의하게 개선된 발현을 나타내는 것으로 나타난, 침묵적으로 변형된 인간 ARSA 코딩 서열을 포함한다.
도 4는 뇌에서 형질도입된 세포당 벡터 게놈의 수와 cDNA의 ng당 hARSA의 카피수 사이의 상관 관계를 나타내는 플롯이다. 마우스 게놈 DNA는 Qiagen의 QIAamp Fast DNA 조직 키트를 사용하여 제조하였다. VG 수는 내인성 마우스 게놈 서열에 대해 정규화된 코돈 최적화된 인간 ARSA 벡터 게놈의 코딩 영역에 특이적인 액적 디지털 PCR 및 프라이머/프로브 세트에 의해 결정하였다. 마우스 총 RNA를 본원에 기술된 바와 같이 제조하고, ARSA 전사체를 액적 디지털 PCR을 사용하여 평가하고, 마우스 GUSB에 대해 정규화된 카피수로 VG 수를 결정하기 위해 사용한 동일한 프라이머/프로브 세트를 사용하였다. 도시된 바와 같이, AAVHSC15 캡시드에 패키징된 전달 벡터 pHMI-5000을 사용하여 형질도입된 세포의 경우, 형질도입된 세포당 검출된 벡터 게놈의 수는 cDNA의 ng당 hARSA의 카피 수와 강력하게 상관된다(R2 = 0.9332).
AAVHSC15와 AAV9 캡시드 매개 전달 간의 비교에서, AAVHSC15는 뇌에서 AAV9를 유의하게 능가한다는 것을 발견하였다. 도 5는 AAV9 또는 AAVHSC15 캡시드에 패키징된 전달 벡터 pHMI-5000에 대해 2e13 vg/kg의 투여량으로 뇌에서 형질도입된 세포당 벡터 게놈의 수를 나타낸다. 도시된 바와 같이, AAV9 캡시드와 비교하여, 전달 벡터 pHMI-5000이 AAVHSC15 캡시드에 패키징되었을 경우, 세포당 벡터 게놈 수가 10배 더 높은 것으로 관찰되었다. 도 6은 표시된 투여량으로 AAV9 또는 AAVHSC15 캡시드 중 하나로 패키징된 전달 벡터 pHMI-5000에 대해 측정된 정상 인간 ARSA 효소 활성 수준의 백분율을 나타낸다. 도7은 4e13 vg/kg으로 AAV9 또는 AAVHSC15 캡시드 중 하나에 패키징된 전달 벡터 pHMI-5000을 투여한 마우스의 형질도입된 뇌 세포당 벡터 게놈의 수를 나타낸다.
AAVHSC15 캡시드에 패키징된 pHMI-5000은 AAV9 캡시드에 패키징된 pHMI-5000에 비해 더 강력하고 더 광범위한 뇌 및 척수 발현 프로파일을 나타냈다. 항-ARSA 면역 반응성 실험은, 각각의 경우 3e13 vg/kg의 투여량에서, AAV9 캡시드로 패키징된 pHMI-5000을 정맥내 투여한 마우스에 비해, AAVHSC15 캡시드로 패키징된 pHMI-5000을 정맥내 투여한 마우스의 뇌 절편에서 훨씬 더 높은 수준이 검출되었음을 나타낸다.
뇌에서의 hARSA의 생체분포에 대한 투여 경로의 효과를 평가하기 위해, AAVHSC15 캡시드에 패키징된 전달 벡터 pHMI-5000을 각각 4e13 vg/kg 및 4e12 vg/kg의 투여량으로 정맥내(IV) 및 경막내(IT) 경로를 통해 투여하였다. 항-ARSA 면역 반응성은 AAVHSC15에 패키징된 pHMI-5000의 IV 투여 후 ARSA(-/-) 마우스의 주요 중추 신경계 영역에 존재하였다. 항-마우스 ARSA(mARSA) 또는 인간 ARSA(hARSA)는 운동 및 감각 피질, 해마(CA3 영역), 피각 및 소뇌를 포함하여 이에 한정되지 않는 곳에서 광범위하게 검출되었다. 도 8은 AAVHSC15에 패키징된 전달 벡터 pHMI-5000의 IV 또는 IT 투여 후, 후뇌 및 중뇌에서의 정상 인간 ARSA 효소 활성의 백분율 정량화를 나타낸다.
AAVHSC15 캡시드에 패키징된 pHMI-5000을 4e13 vg/kg으로 4주 동안 투여한 ARSA(-/-) 마우스에서, 생물학적으로 관련 있는 hARSA의 분포는 뇌의 주요 생리학적 영역뿐만 아니라 중추 신경계(CNS)의 주둥이-꼬리 축(rostro-caudal axis) 전체에 걸쳐 검출되었다. hARSA는 항-hARSA 항체를 이용하여 검출되었으며, 척수, 운동 피질, 시상, 해마, 소뇌핵에서 검출되었다. hARSA는 또한, CNS에서의 운동 뉴런 및 성상교세포 프로파일; CNS에서의 희소돌기교세포(상행 섬유에서 높은 검출); CNS에서의 대뇌 피질의 세포 집단; 및 말초 신경계(PNS)의 감각 뉴런 및 슈반 세포에서 검출된다. 유사한 생물학적 분포는 이르면 치료 후 2주차에 검출될 수 있다.
AAVHSC15 캡시드에 2e13 vg/kg으로 패키징된 pHMI-5000이 투여된 마우스에서, 4e13 vg/kg 이상의 투여량이 투여된 마우스에서 관찰된 것과 동일한 조직학적 분포가 관찰되었다. 이들 실험에서, hARSA는 리소좀의 전형적인 점모양 패턴으로 세포 세포질에서 검출되었다.
도 9a 및 9b에 도시된 바와 같이, 인간 ARSA 효소 활성의 생리학적 수준은 치료한 ARSA(-/-) 마우스의 뇌에서 투여 후 4주차에 회복되었다. hARSA 효소 활성을 평가하기 위해 ARSA(-/-) 마우스로부터의 뇌 용해물을 사용하였다. 투여량-범위 확인 연구는 hARSA 효소 활성이 AAVHSC15 캡시드에 패키징된 전달 벡터 pHMI-5000의 IV 투여의 투여량과 상관 관계가 있음을 나타냈다. 효소 활성은 치료된 동물에서 검출되었지만, 비히클 대조군 동물에서는 검출되지 않았다. 시험된 투여량에 대해, 효소 활성 수준(약 40 내지 145%)은 이전의 임상에서 결정된 바와 같은(Patil 및 Maegawa, Drug Des. Devel. Ther. 2013, 7:729-745 참조), 약 10 내지 15%의 치료 목표를 훨씬 초과하였다. 도 9a는 ARSA(-/-) 마우스에 표시된 투여량으로 AAVHSC15 캡시드에 패키징된 전달 벡터 pHMI-5000의 정맥내 투여에 의해 달성된 정상 hARSA 활성의 백분율을 나타낸다. 도시된 바와 같이, hARSA 활성의 투여량 의존적 반응이 달성되었다. 도 9b는 표시된 투여량으로 AAVHSC15 캡시드에 패키징된 전달 벡터 pHMI-5000를 투여한 ARSA(-/-) 마우스의 뇌에서의 세포당 벡터 게놈의 수를 나타낸다. 1e13 vg/kg, 4e13 vg/kg, 및 6e13 vg/kg 투여량의 경우, n = 5마리 마우스. 2e13 vg/kg 투여량의 경우, n = 4마리 마우스. 모든 마우스는 5주령 수컷이었다. 도 9c에서, 가용성 기질 p-니트로카테콜-술페이트(pNCS)으로부터 술페이트의 절단을 측정하는 비색 아릴술파타아제 A-특이적 분석을 사용하여 ARSA 효소 활성을 평가하였다. 경쟁 효소로부터 술페이트의 비-특이적 절단은 알리술파타아제 A-특이적 면역침전 단계의 사용에 의해 제거된다. 뇌에서의 정상적인 인간 ARSA 효소 활성은 2마리의 정상적인 인간 수컷 및 암컷 각각의 전두엽 피질에서의 ARSA 효소 활성의 분석에 의해 결정된다. 인간 전두엽 피질 샘플을 BioiVT로부터 구매하고, 각각의 ARSA 효소 활성 분석 플레이트 상에서 시험 샘플과 함께 3회 실행하였다. 데이터는, 시간당 단백질 mg당, 탈황된 pNCS(ng 단위)의 평균 양의 백분율로서 표현된다. 도 9c는 AAVHSC15 캡시드에 패키징된 pHMI-5000의 1회 정맥내 4e13 vg/kg 투여량이 (점선으로 표시된 바와 같이) 치료 후 1주일차부터 치료 후 12주차까지, 설정된 10 내지 15%의 인간 치료 목표를 초과하는 수준으로 신생아 ARSA(-/-) 마우스의 뇌에서 hARSA 효소 활성을 검출하였음을 나타낸다. 투여 후 1, 2, 3, 4 및 12주차에 물질을 수집하였다. 각 시점에 대해 n = 6마리의 마우스, 8주령의 3마리의 수컷 및 3마리의 암컷.
도 9d에서, 트리졸(Trizol) 추출 후 Qiagen RNEasy 컬럼 정제로 마우스 총 RNA를 제조하였다. 전사체를 생산하기 위해 ThermoFisher 고용량 cDNA 키트를 사용하는 cDNA 합성을 위한 템플릿으로서 RNA를 사용하였다. ARSA 전사체를 코돈 최적화된 인간 ARSA 전사체에 특이적인 액적 디지털 PCR 및 프라이머/프로브 세트를 사용하여 평가하였으며, 카피수는 마우스 GUSB에 대해 정규화되었다. 도 9d는 AAVHSC15 캡시드에 패키징된 pHMI-5000의 1회 정맥내 4e13 vg/kg 투여량이 성체 ARSA(-/-) 마우스의 뇌에서 정상적인 수준의 hARSA 효소 활성을 (hARSA 전사 분석을 통해) 이르게는 치료 후 1주차에 검출되었음을 나타낸다. hARSA 효소 활성의 피크 수준은 투여 후 2 내지 3주 사이에 관찰되었으며, 이어서 정상-상태 고평부는 10 내지 15%의 설정된 인간 치료 목표를 초과하는 수준으로 치료 후 52주차까지 유지되었다. 투여 후 1, 2, 3, 4, 8, 12, 26, 및 52주차에 물질을 수집하였다. 도 9e는 AAVHSC15 캡시드에 포장된 pHMI-5000의 단일 정맥 내 4e13 vg/kg 투여량을 투여한 ARSA(-/-) 마우스의 뇌에서 게놈 DNA ug 당 벡터 게놈의 수를 나타낸다. 투여 후 1, 2, 3, 8, 12, 26, 및 52주차에 물질을 수집하였다. 도 9f는 AAVHSC15 캡시드에 포장된 pHMI-5000의 단일 정맥 내 4e13 vg/kg 투여량을 투여한 ARSA(-/-) 마우스의 뇌에서의 RNA ng 당 ARSA 전사체의 카피수를 나타낸다. 투여 후 4, 8, 12, 26, 및 52주차에 물질을 수집하였다.
실시예 4: 인간 ARSA 전달 벡터
본 실시예는 벡터가 형질도입되는 세포(예를 들어, 인간 세포 또는 마우스 세포)에서 hARSA의 발현을 위한 인간 ARSA 전달 벡터 TC-013.pHMIA2 및 TC-015.pKITR을 제공한다. hARSA를 발현하는 것에 더하여, 이들 벡터는 또한 인간 SUMF1를 발현하도록 설계된다. hARSA 및 hSUMF1의 코딩 서열은 2A 요소에 의해 분리된다. 특정 구현예에서, 리보솜 스키핑 요소(예를 들어, 2A 요소)는 N 말단에서 Gly-Ser-Gly의 서열을 추가로 포함하는 펩티드를 암호화하되, 선택적으로 Gly-Ser-Gly의 서열은 GGCAGCGGA의 뉴클레오티드 서열에 의해 암호화된다. 이론에 구속되지 않고, 리보솜 스키핑 요소는: 제1 펩티드 사슬의 번역의 종료 및 제2 펩티드 사슬의 번역 재개시에 의해; 또는 암호화된 펩티드의 고유한 프로테아제 활성에 의해 또는 환경(예를 들어, 세포액)에서의 또 다른 프로테아제에 의해 리보솜 스키핑 요소에 의해 암호화된 펩티드 서열에서의 펩티드 결합의 절단에 의해 기능하는 것으로 가정된다.
a) TC-013.pHMIA2
도 10a에 나타낸 바와 같은 ARSA 전달 벡터 TC-013.pHMIA2는 5'에서 3'까지 다음의 유전적 요소를 포함한다: 5' ITR 요소, CALM1 프로모터를 포함하는 전사 조절 요소; 침묵적으로 변형된 인간 ARSA 코딩 서열; 2A 요소; 침묵적으로 변형된 SUMF1 코딩 서열; 및 3' ITR 요소. 이들 요소의 서열은 표 2에 제시되어 있다. 이 벡터는 벡터가 형질도입되는 세포(예를 들어, 인간 세포 또는 마우스 세포)에서 인간 ARSA 단백질 및 인간 SUMF1 단백질을 발현할 수 있다.
b) TC-015.pKITR
도 10b에 나타낸 바와 같은 ARSA 전달 벡터 TC-015.pKITR은 5'에서 3'까지 다음의 유전적 요소를 포함한다: 5' ITR 요소, smCBA 프로모터를 포함하는 전사 조절 요소; 침묵적으로 변형된 인간 ARSA 코딩 서열; 2A 요소; 침묵적으로 변형된 SUMF1 코딩 서열; 및 3' ITR 요소. 이들 요소의 서열은 표 2에 제시되어 있다. 이 벡터는 벡터가 형질도입되는 세포(예를 들어, 인간 세포 또는 마우스 세포)에서 인간 ARSA 단백질 및 인간 SUMF1 단백질을 발현할 수 있다.
Figure pct00002
본원에 개시된 벡터는 AAVHSC5, AAVHSC7, AAVHSC15 또는 AAVHSC17 캡시드와 같은 AAV 캡시드에 패키징 수 있지만, 이에 한정되지 않는다. 패키징된 바이러스 입자는 야생형 동물 또는 ARSA-결핍 동물에 투여될 수 있다.
뇌에서의 hARSA 발현에 대한 프로모터의 효과를 평가하기 위해, 전달 벡터 pHMI-5000, TC-013.pHMIA2, 및 TC-015.pKITR을 AAVHSC15 캡시드에 패키징하고, ARSA(-/-) 마우스에게 투여했다. hARSA 발현 및 효소 활성은 세포수 당 유사한 바이러스 게놈을 갖는, 4e13 vg/kg의 투여량으로 투여된 pHMI-5000 벡터(닭-β-액틴(CBA) 프로모터), 및 8e13 vg/kg의 투여량으로 투여된 TC-015.pKITR(smCBA 프로모터)을 사용하여 뇌에서 검출되었다. CBA 프로모터는 시험된 다른 프로모터와 비교하여 가장 낮은 투여량에서 hARSA의 가장 높은 발현을 초래한다. 도 11은, 각각의 경우 AAVHSC15 캡시드로 패키징되고 4e13 vg/kg의 투여량으로 투여된, pHMI-5000(CBA 프로모터), TC-013.pHMIA2(CALM1 프로모터), 및 TC-015.pKITR(smCBA 프로모터)에 대한 세포당 형질도입된 바이러스 게놈의 수를 나타낸다(각 벡터에 대해 n = 5마리 마우스). 도 12는, 각각의 경우 AAVHSC15 캡시드로 패키징되고 4e13 vg/kg의 투여량으로 투여된, pHMI-5000(CBA 프로모터), 및 TC-015.pKITR(smCBA 프로모터)에 대해 검출된 정상 인간 ARSA 효소 활성의 백분율을 나타낸다(각 벡터에 대해 n = 5마리 마우스). 도 13은 hARSA의 발현이, AAVHSC15 캡시드에 패키징되고 4e13 vg/kg의 투여량으로 투여된 pHMI-5000(CBA 프로모터), 및 AAVHSC15 캡시드에 패키징되고 8e13 vg/kg의 투여량으로 투여된 TC-015.pKITR(smCBA 프로모터)에 대한 웨스턴 블롯의 항-hARSA 항체를 사용하여 마우스의 뇌에서 검출될 수 있음을 나타낸다(각 벡터에 대해 n = 5마리 마우스).
실시예 5: 인간 ARSA 전달 벡터
본 실시예는 벡터가 형질도입되는 세포(예를 들어, 인간 세포 또는 마우스 세포)에서 hARSA의 발현을 위한 인간 ARSA 전달 벡터 pHMI-5004를 제공한다. hARSA를 발현하는 것에 더하여, 이 벡터는 또한 인간 사포신 B(SapB)를 발현하도록 설계된다. hARSA 및 SapB의 코딩 서열은 2A 요소에 의해 분리된다.
도 14에 나타낸 바와 같은 ARSA 전달 벡터 pHMI-5004는 5'에서 3'까지 다음의 유전적 요소를 포함한다: 5' ITR 요소, CMV 인핸서 요소를 포함하는 전사 조절 요소, 닭-β-액틴 프로모터, 및 키메라 인트론 서열; 침묵적으로 변형된 인간 ARSA 코딩 서열; 2A 요소; 야생형 인간 SapB 코딩 서열; 및 3' ITR 요소. 이들 요소의 서열은 표 3에 제시되어 있다. 이 벡터는 벡터가 형질도입되는 세포(예를 들어, 인간 세포 또는 마우스 세포)에서 인간 ARSA 및/또는 SapB 단백질을 발현할 수 있다.
Figure pct00003
실시예 6: 비인간 영장류에서의 ARSA 유전자 전달
비인간 영장류에서 AAVHSC 매개 ARSA 유전자 전달의 단일 투여의 효과를 조사하기 위해, 6마리의 수컷 미처리 어린 시노몰구스 원숭이에게 표 4 및 5에 제시된 실험 설계에 따라 투여하였다.
Figure pct00004
Figure pct00005
도 15에 나타낸 바와 같은 ARSA 전달 벡터 pHMI-5005는 5'에서 3'까지 다음의 유전적 요소를 포함한다: 5' ITR 요소, CMV 인핸서 요소를 포함하는 전사 조절 요소, 닭-β-액틴 프로모터, 및 키메라 인트론 서열; 침묵적으로 변형된 인간 ARSA 코딩 서열; V5 태그; 및 3' ITR 요소. 이들 요소의 서열은 표 6에 제시되어 있다. 이 벡터는 벡터가 형질도입되는 세포(예를 들어, 인간 세포 또는 마우스 세포)에서 인간 ARSA 단백질을 발현할 수 있다.
Figure pct00006
pHMI-5005는 V5-태그 ARSA 전달 벡터이다. AAVHSC15 캡시드에 패키징된 pHMI-5005를 표 4 및 표 5에 제시된 실험 설계에 따라 비인간 영장류(NHP)에 투여하였다. 0일차에, 투여는, 요측/복재 정맥을 통한 1 내지 2분의 저속 볼루스 정맥내 주사(IV), 또는 소뇌연수조(cisterna magna, CM) 내로의 직접 주사로 수행되었다. 생존력 확인은 사망 및 빈사 상태의 징후에 대해 1일 2회 수행하였다. 임상 관찰은 매일 아침 및 투여 완료 후(15분) 투여 당일 및 투여 후 4시간에 수행하였다. 혈액학 및 임상 화학을 위한 혈액은 투여 직전 및 투여 후 1, 2 및 4주차에 채취하였다. 뇌척수액(CSF) 및 혈액 채취 후 28일 및 29일차에 부검 시, 동물을 1.0 L의 저온 식염수로 관류시켜 혈구를 제거하였다. 부검 시, 뇌, 간, 척수(자궁경부 및 요추), 경부 및 요추 후근 신경절(DRG), 삼차 신경절, 신장, 좌골 신경, 말초 림프절, 비장, 심장, 폐 및 고환을 채취하였다.
생물학적 분석을 위해, 투여 직전 및 제1, 2 및 4주차에 V5 Elisa를 위한 혈청을 채취한다(0.5 mL 전혈, 혈청으로 처리/2개의 분취량으로 분할됨). 0.5 mL의 CSF를 (CM 투여된 3군 동물로부터) 투여 전에 수집하고 (모든 동물로부터) 부검시 1 내지 2 mL를 채취하였다. 15 mL의 말초 혈액 단핵 세포(PBMC)를 부검 전에 전혈로부터 채취하였다.
도 16은 AAVHSC15 캡시드에 패키징된 pHMI-5005를 투여한 NHP에서 알라닌 아미노전이효소(ALT)의 수준 상승을 나타낸다. ALT 상승은 투여 후 14일차에 베이스라인 수준으로 회복되었다.
AAVHSC15에 패키징된 4e13 vg/kg의 pHMI-5005를 1회 IV 투여한 NHP(2군 동물)를 투여 후 28일 및 29일차에 희생시켰다. 희생된 2군 동물의 중추신경계(CNS) 및 뇌척수액(CSF)에서 인간 ARSA 효소 활성 수준이 검출되었다(도 17). 도 17에 도시된 바와 같이, hARSA 활성은 점선으로 표시된 바와 같이, 치료 임계치를 초과하는 수준(야생형 인간 뇌 수준의 15%)에서 검출되었다. 동물 18C27(2군)의 CNS 및 말초 신경계(PNS)에서의 면역형광 염색은 (V5-태그 검출을 통해) hARSA의 존재를 확인하고, 배근 신경절, 척수 운동 뉴런, 및 소뇌를 포함하는 특정 영역에서의 존재를 확인한다.
* * *
본 발명은 본원에 기술된 특정 구현예에 의해 그 범위가 제한되지 않는다. 실제로, 기술된 것들에 더하여, 본 발명의 다양한 변형은 전술한 설명 및 첨부 도면으로부터 당업자에게 명백해질 것이다. 이러한 변형은 첨부된 청구범위의 범주 내에 속하는 것으로 의도된다.
본원에 인용된 모든 참조(예를 들어, 간행물 또는 특허 또는 특허 출원)는 각각의 개별 참조(예를 들어, 간행물 또는 특허 또는 특허 출원)가 모든 목적을 위해 그 전체가 참조로서 포함되는 것으로 구체적 및 개별적으로 표시된 것과 동일한 정도로 그 전체가 모든 목적을 위해 본원에 참조로서 포함된다. 다른 구현예는 다음의 청구범위 내에 있다.
<110> HOMOLOGY MEDICINES, INC. <120> ADENO-ASSOCIATED VIRUS COMPOSITIONS FOR ARSA GENE TRANSFER AND METHODS OF USE THEREOF <130> 706508: HMW-030PC <150> US 62/859,539 <151> 2019-06-10 <150> US 62/866,374 <151> 2019-06-25 <150> US 62/915,523 <151> 2019-10-15 <150> US 62/960,487 <151> 2020-01-13 <150> US 62/987,858 <151> 2020-03-10 <150> US 63/010,970 <151> 2020-04-16 <160> 81 <170> PatentIn version 3.5 <210> 1 <211> 736 <212> PRT <213> adeno-associated AAV9 <400> 1 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser 1 5 10 15 Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro 20 25 30 Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly 145 150 155 160 Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr 165 170 175 Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro 180 185 190 Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly 195 200 205 Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser 210 215 220 Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile 225 230 235 240 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn 260 265 270 Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg 275 280 285 Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn 290 295 300 Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile 305 310 315 320 Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn 325 330 335 Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu 340 345 350 Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro 355 360 365 Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp 370 375 380 Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe 385 390 395 400 Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu 405 410 415 Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu 420 425 430 Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser 435 440 445 Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser 450 455 460 Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro 465 470 475 480 Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn 485 490 495 Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn 500 505 510 Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys 515 520 525 Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly 530 535 540 Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile 545 550 555 560 Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser 565 570 575 Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln 580 585 590 Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln 595 600 605 Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His 610 615 620 Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met 625 630 635 640 Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala 645 650 655 Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr 660 665 670 Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln 675 680 685 Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn 690 695 700 Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val 705 710 715 720 Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu 725 730 735 <210> 2 <211> 736 <212> PRT <213> Artificial Sequence <220> <223> AAV isolate <400> 2 Met Thr Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser 1 5 10 15 Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro 20 25 30 Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly 145 150 155 160 Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr 165 170 175 Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro 180 185 190 Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly 195 200 205 Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser 210 215 220 Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile 225 230 235 240 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn 260 265 270 Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg 275 280 285 Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn 290 295 300 Asn Trp Gly Phe Arg Pro Lys Gln Leu Asn Phe Lys Leu Phe Asn Ile 305 310 315 320 Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn 325 330 335 Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu 340 345 350 Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro 355 360 365 Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp 370 375 380 Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe 385 390 395 400 Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu 405 410 415 Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu 420 425 430 Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser 435 440 445 Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser 450 455 460 Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro 465 470 475 480 Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn 485 490 495 Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn 500 505 510 Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys 515 520 525 Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly 530 535 540 Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile 545 550 555 560 Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser 565 570 575 Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln 580 585 590 Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln 595 600 605 Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His 610 615 620 Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met 625 630 635 640 Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala 645 650 655 Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr 660 665 670 Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln 675 680 685 Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn 690 695 700 Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val 705 710 715 720 Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu 725 730 735 <210> 3 <211> 736 <212> PRT <213> Artificial Sequence <220> <223> AAV isolate <400> 3 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser 1 5 10 15 Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro 20 25 30 Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly 145 150 155 160 Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr 165 170 175 Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro 180 185 190 Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly 195 200 205 Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser 210 215 220 Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile 225 230 235 240 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn 260 265 270 Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg 275 280 285 Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn 290 295 300 Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile 305 310 315 320 Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn 325 330 335 Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu 340 345 350 Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro 355 360 365 Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp 370 375 380 Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe 385 390 395 400 Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu 405 410 415 Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu 420 425 430 Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser 435 440 445 Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser 450 455 460 Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro 465 470 475 480 Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn 485 490 495 Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn 500 505 510 Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys 515 520 525 Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly 530 535 540 Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile 545 550 555 560 Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser 565 570 575 Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln 580 585 590 Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln 595 600 605 Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His 610 615 620 Thr Gly Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met 625 630 635 640 Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala 645 650 655 Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr 660 665 670 Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln 675 680 685 Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn 690 695 700 Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Gly Gly Val 705 710 715 720 Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu 725 730 735 <210> 4 <211> 736 <212> PRT <213> Artificial Sequence <220> <223> AAV isolate <400> 4 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser 1 5 10 15 Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro 20 25 30 Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Ile Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly 145 150 155 160 Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr 165 170 175 Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro 180 185 190 Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly 195 200 205 Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser 210 215 220 Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile 225 230 235 240 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn 260 265 270 Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg 275 280 285 Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn 290 295 300 Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile 305 310 315 320 Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn 325 330 335 Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu 340 345 350 Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro 355 360 365 Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp 370 375 380 Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe 385 390 395 400 Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu 405 410 415 Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu 420 425 430 Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser 435 440 445 Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser 450 455 460 Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro 465 470 475 480 Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn 485 490 495 Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn 500 505 510 Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys 515 520 525 Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly 530 535 540 Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile 545 550 555 560 Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser 565 570 575 Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln 580 585 590 Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln 595 600 605 Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His 610 615 620 Thr Tyr Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met 625 630 635 640 Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala 645 650 655 Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr 660 665 670 Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln 675 680 685 Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn 690 695 700 Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val 705 710 715 720 Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu 725 730 735 <210> 5 <211> 736 <212> PRT <213> Artificial Sequence <220> <223> AAV isolate <400> 5 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser 1 5 10 15 Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro 20 25 30 Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Asp 145 150 155 160 Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr 165 170 175 Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro 180 185 190 Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly 195 200 205 Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser 210 215 220 Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile 225 230 235 240 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn 260 265 270 Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg 275 280 285 Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn 290 295 300 Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile 305 310 315 320 Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn 325 330 335 Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu 340 345 350 Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro 355 360 365 Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp 370 375 380 Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe 385 390 395 400 Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu 405 410 415 Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu 420 425 430 Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser 435 440 445 Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser 450 455 460 Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro 465 470 475 480 Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn 485 490 495 Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn 500 505 510 Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys 515 520 525 Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly 530 535 540 Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile 545 550 555 560 Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser 565 570 575 Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln 580 585 590 Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln 595 600 605 Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His 610 615 620 Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met 625 630 635 640 Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala 645 650 655 Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr 660 665 670 Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln 675 680 685 Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn 690 695 700 Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val 705 710 715 720 Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu 725 730 735 <210> 6 <211> 736 <212> PRT <213> Artificial Sequence <220> <223> AAV isolate <400> 6 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser 1 5 10 15 Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro 20 25 30 Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Leu Gln Ala Lys Lys Arg Leu Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly 145 150 155 160 Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr 165 170 175 Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro 180 185 190 Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly 195 200 205 Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser 210 215 220 Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile 225 230 235 240 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn 260 265 270 Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg 275 280 285 Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn 290 295 300 Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile 305 310 315 320 Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn 325 330 335 Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu 340 345 350 Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro 355 360 365 Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp 370 375 380 Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe 385 390 395 400 Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu 405 410 415 Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu 420 425 430 Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser 435 440 445 Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser 450 455 460 Val Ala Gly Ser Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro 465 470 475 480 Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn 485 490 495 Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn 500 505 510 Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys 515 520 525 Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly 530 535 540 Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile 545 550 555 560 Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser 565 570 575 Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln 580 585 590 Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln 595 600 605 Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His 610 615 620 Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met 625 630 635 640 Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala 645 650 655 Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr 660 665 670 Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln 675 680 685 Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn 690 695 700 Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val 705 710 715 720 Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu 725 730 735 <210> 7 <211> 736 <212> PRT <213> Artificial Sequence <220> <223> AAV isolate <400> 7 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser 1 5 10 15 Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro 20 25 30 Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly 145 150 155 160 Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr 165 170 175 Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro 180 185 190 Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly 195 200 205 Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser 210 215 220 Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile 225 230 235 240 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn 260 265 270 Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg 275 280 285 Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn 290 295 300 Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile 305 310 315 320 Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn 325 330 335 Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu 340 345 350 Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro 355 360 365 Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp 370 375 380 Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe 385 390 395 400 Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu 405 410 415 Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu 420 425 430 Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser 435 440 445 Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser 450 455 460 Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro 465 470 475 480 Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn 485 490 495 Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn 500 505 510 Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys 515 520 525 Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly 530 535 540 Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile 545 550 555 560 Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser 565 570 575 Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Arg Ala Gln 580 585 590 Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln 595 600 605 Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His 610 615 620 Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met 625 630 635 640 Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala 645 650 655 Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr 660 665 670 Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln 675 680 685 Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn 690 695 700 Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val 705 710 715 720 Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu 725 730 735 <210> 8 <211> 736 <212> PRT <213> Artificial Sequence <220> <223> AAV isolate <400> 8 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser 1 5 10 15 Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro 20 25 30 Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Ala Val Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly 145 150 155 160 Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr 165 170 175 Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro 180 185 190 Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly 195 200 205 Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser 210 215 220 Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile 225 230 235 240 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn 260 265 270 Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg 275 280 285 Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn 290 295 300 Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile 305 310 315 320 Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn 325 330 335 Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu 340 345 350 Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro 355 360 365 Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp 370 375 380 Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe 385 390 395 400 Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu 405 410 415 Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu 420 425 430 Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser 435 440 445 Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser 450 455 460 Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro 465 470 475 480 Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn 485 490 495 Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn 500 505 510 Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys 515 520 525 Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly 530 535 540 Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile 545 550 555 560 Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser 565 570 575 Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln 580 585 590 Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln 595 600 605 Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His 610 615 620 Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met 625 630 635 640 Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala 645 650 655 Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr 660 665 670 Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln 675 680 685 Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn 690 695 700 Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val 705 710 715 720 Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu 725 730 735 <210> 9 <211> 736 <212> PRT <213> Artificial Sequence <220> <223> AAV isolate <400> 9 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser 1 5 10 15 Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro 20 25 30 Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu Gln Ser Pro Arg Glu Pro Asp Ser Ser Ala Gly Ile Gly 145 150 155 160 Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr 165 170 175 Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro 180 185 190 Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly 195 200 205 Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser 210 215 220 Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile 225 230 235 240 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn 260 265 270 Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg 275 280 285 Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn 290 295 300 Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile 305 310 315 320 Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn 325 330 335 Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu 340 345 350 Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro 355 360 365 Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp 370 375 380 Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe 385 390 395 400 Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu 405 410 415 Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu 420 425 430 Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser 435 440 445 Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser 450 455 460 Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro 465 470 475 480 Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn 485 490 495 Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn 500 505 510 Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys 515 520 525 Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly 530 535 540 Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile 545 550 555 560 Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser 565 570 575 Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln 580 585 590 Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln 595 600 605 Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His 610 615 620 Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met 625 630 635 640 Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala 645 650 655 Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr 660 665 670 Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln 675 680 685 Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn 690 695 700 Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val 705 710 715 720 Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu 725 730 735 <210> 10 <211> 736 <212> PRT <213> Artificial Sequence <220> <223> AAV isolate <400> 10 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser 1 5 10 15 Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro 20 25 30 Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly 145 150 155 160 Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr 165 170 175 Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro 180 185 190 Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Cys Gly Gly 195 200 205 Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser 210 215 220 Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile 225 230 235 240 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn 260 265 270 Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg 275 280 285 Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn 290 295 300 Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile 305 310 315 320 Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn 325 330 335 Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu 340 345 350 Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro 355 360 365 Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp 370 375 380 Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe 385 390 395 400 Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu 405 410 415 Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu 420 425 430 Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser 435 440 445 Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser 450 455 460 Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro 465 470 475 480 Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn 485 490 495 Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn 500 505 510 Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys 515 520 525 Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly 530 535 540 Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile 545 550 555 560 Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser 565 570 575 Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln 580 585 590 Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln 595 600 605 Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His 610 615 620 Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met 625 630 635 640 Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala 645 650 655 Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr 660 665 670 Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln 675 680 685 Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn 690 695 700 Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val 705 710 715 720 Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu 725 730 735 <210> 11 <211> 736 <212> PRT <213> Artificial Sequence <220> <223> AAV isolate <400> 11 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser 1 5 10 15 Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro 20 25 30 Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Arg Ala Tyr Asp 65 70 75 80 Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly 145 150 155 160 Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr 165 170 175 Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro 180 185 190 Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly 195 200 205 Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser 210 215 220 Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile 225 230 235 240 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn 260 265 270 Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg 275 280 285 Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn 290 295 300 Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile 305 310 315 320 Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn 325 330 335 Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu 340 345 350 Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro 355 360 365 Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp 370 375 380 Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe 385 390 395 400 Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu 405 410 415 Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu 420 425 430 Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser 435 440 445 Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser 450 455 460 Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro 465 470 475 480 Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn 485 490 495 Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn 500 505 510 Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys 515 520 525 Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly 530 535 540 Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile 545 550 555 560 Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser 565 570 575 Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln 580 585 590 Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln 595 600 605 Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His 610 615 620 Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met 625 630 635 640 Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala 645 650 655 Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr 660 665 670 Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln 675 680 685 Lys Lys Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn 690 695 700 Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val 705 710 715 720 Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu 725 730 735 <210> 12 <211> 736 <212> PRT <213> Artificial Sequence <220> <223> AAV isolate <400> 12 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser 1 5 10 15 Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro 20 25 30 Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly 145 150 155 160 Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr 165 170 175 Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro 180 185 190 Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly 195 200 205 Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser 210 215 220 Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile 225 230 235 240 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn 260 265 270 Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg 275 280 285 Phe His Cys His Phe Ser Pro His Asp Trp Gln Arg Leu Ile Asn Asn 290 295 300 Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile 305 310 315 320 Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn 325 330 335 Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu 340 345 350 Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro 355 360 365 Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp 370 375 380 Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe 385 390 395 400 Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu 405 410 415 Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu 420 425 430 Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser 435 440 445 Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Asn 450 455 460 Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro 465 470 475 480 Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn 485 490 495 Asn Asn Ser Glu Phe Ala Trp Pro Arg Ala Ser Ser Trp Ala Leu Asn 500 505 510 Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys 515 520 525 Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly 530 535 540 Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile 545 550 555 560 Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser 565 570 575 Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln 580 585 590 Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln 595 600 605 Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His 610 615 620 Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met 625 630 635 640 Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala 645 650 655 Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr 660 665 670 Gln Tyr Ser Thr Gly Gln Val Ser Met Glu Ile Glu Trp Glu Leu Gln 675 680 685 Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn 690 695 700 Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val 705 710 715 720 Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu 725 730 735 <210> 13 <211> 736 <212> PRT <213> Artificial Sequence <220> <223> AAV isolate <400> 13 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser 1 5 10 15 Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro 20 25 30 Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly 145 150 155 160 Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr 165 170 175 Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro 180 185 190 Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly 195 200 205 Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser 210 215 220 Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile 225 230 235 240 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn 260 265 270 Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg 275 280 285 Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn 290 295 300 Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile 305 310 315 320 Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn 325 330 335 Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu 340 345 350 Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro 355 360 365 Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp 370 375 380 Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe 385 390 395 400 Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu 405 410 415 Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu 420 425 430 Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser 435 440 445 Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser 450 455 460 Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro 465 470 475 480 Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn 485 490 495 Asn Asn Ser Glu Phe Ala Trp Pro Arg Ala Ser Ser Trp Ala Leu Asn 500 505 510 Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys 515 520 525 Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly 530 535 540 Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile 545 550 555 560 Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser 565 570 575 Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln 580 585 590 Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln 595 600 605 Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His 610 615 620 Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met 625 630 635 640 Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala 645 650 655 Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr 660 665 670 Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln 675 680 685 Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn 690 695 700 Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val 705 710 715 720 Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu 725 730 735 <210> 14 <211> 1527 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 14 atgtctatgg gggctcctcg ctccctgctg ctggcactgg ccgccgggct ggctgtcgca 60 agaccaccta atatcgtcct gatttttgca gacgatctgg gatacggcga cctgggatgc 120 tatggccacc caagctccac cacacccaac ctggaccagc tggcagcagg aggcctgcgg 180 ttcaccgact tctacgtgcc agtgagcctg tgcaccccct ccagagccgc cctgctgaca 240 ggcaggctgc cagtgcgcat gggcatgtat cctggcgtgc tggtgccatc tagcaggggc 300 ggcctgccac tggaggaggt gaccgtggca gaggtgctgg cagccagagg ctacctgaca 360 ggaatggccg gcaagtggca cctgggagtg ggaccagagg gagccttcct gccccctcac 420 cagggcttcc accggtttct gggcatccct tattctcacg accagggccc atgccagaac 480 ctgacctgtt ttccaccagc aacaccatgc gacggaggat gtgatcaggg cctggtgcca 540 atcccactgc tggcaaatct gagcgtggag gcacagcctc catggctgcc tggcctggag 600 gcaagataca tggccttcgc ccacgacctg atggcagatg cacagcggca ggatagacct 660 ttctttctgt actatgcctc ccaccacacc cactatccac agttcagcgg ccagtccttt 720 gccgagaggt ccggaagggg accattcggc gactctctga tggagctgga tgccgccgtg 780 ggcaccctga tgacagcaat cggcgacctg ggcctgctgg aggagacact ggtcatcttc 840 accgccgata acggccctga gacaatgcgg atgtctagag gcggatgcag cggcctgctg 900 agatgtggca agggaaccac atacgaggga ggcgtgcgcg agcctgccct ggcattttgg 960 ccaggacaca tcgcacctgg agtgacccac gagctggcct cctctctgga cctgctgcca 1020 acactggccg ccctggcagg agcacctctg ccaaatgtga ccctggacgg cttcgatctg 1080 agcccactgc tgctgggaac cggcaagtcc cctaggcagt ctctgttctt ttacccctcc 1140 tatcctgatg aggtgcgggg cgtgtttgcc gtgagaaccg gcaagtacaa ggcccacttc 1200 tttacacagg gctctgccca cagcgacacc acagcagatc cagcatgcca cgccagctcc 1260 tctctgaccg cacacgagcc acctctgctg tacgacctgt ccaaggatcc cggcgagaac 1320 tataatctgc tgggaggagt ggcaggagca acccctgagg tgctgcaggc cctgaagcag 1380 ctgcagctgc tgaaggcaca gctggacgca gcagtgacat tcggcccaag ccaggtggcc 1440 agaggcgagg atcccgccct gcagatctgt tgccaccccg gctgcacccc aagacctgcc 1500 tgttgccatt gccccgaccc acacgcc 1527 <210> 15 <211> 736 <212> PRT <213> Artificial Sequence <220> <223> AAV isolate <400> 15 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser 1 5 10 15 Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro 20 25 30 Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly 145 150 155 160 Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr 165 170 175 Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro 180 185 190 Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly 195 200 205 Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser 210 215 220 Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile 225 230 235 240 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn 260 265 270 Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg 275 280 285 Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn 290 295 300 Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile 305 310 315 320 Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn 325 330 335 Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu 340 345 350 Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro 355 360 365 Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp 370 375 380 Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe 385 390 395 400 Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu 405 410 415 Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu 420 425 430 Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser 435 440 445 Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser 450 455 460 Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro 465 470 475 480 Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn 485 490 495 Asn Asn Ser Glu Phe Ala Trp Pro Arg Ala Ser Ser Trp Ala Leu Asn 500 505 510 Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys 515 520 525 Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly 530 535 540 Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile 545 550 555 560 Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser 565 570 575 Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln 580 585 590 Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln 595 600 605 Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His 610 615 620 Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met 625 630 635 640 Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala 645 650 655 Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr 660 665 670 Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Arg Gln 675 680 685 Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn 690 695 700 Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val 705 710 715 720 Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu 725 730 735 <210> 16 <211> 736 <212> PRT <213> Artificial Sequence <220> <223> AAV isolate <400> 16 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser 1 5 10 15 Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro 20 25 30 Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly 145 150 155 160 Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr 165 170 175 Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro 180 185 190 Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly 195 200 205 Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser 210 215 220 Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile 225 230 235 240 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn 260 265 270 Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg 275 280 285 Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn 290 295 300 Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile 305 310 315 320 Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn 325 330 335 Asn Leu Thr Ser Thr Val Gln Val Phe Ala Asp Ser Asp Tyr Gln Leu 340 345 350 Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro 355 360 365 Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp 370 375 380 Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe 385 390 395 400 Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu 405 410 415 Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu 420 425 430 Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser 435 440 445 Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser 450 455 460 Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro 465 470 475 480 Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn 485 490 495 Asn Asn Ser Glu Phe Ala Trp Pro Arg Ala Ser Ser Trp Ala Leu Asn 500 505 510 Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys 515 520 525 Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly 530 535 540 Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile 545 550 555 560 Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser 565 570 575 Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln 580 585 590 Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln 595 600 605 Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His 610 615 620 Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met 625 630 635 640 Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala 645 650 655 Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr 660 665 670 Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln 675 680 685 Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn 690 695 700 Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val 705 710 715 720 Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu 725 730 735 <210> 17 <211> 736 <212> PRT <213> Artificial Sequence <220> <223> AAV isolate <400> 17 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser 1 5 10 15 Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro 20 25 30 Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly 145 150 155 160 Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr 165 170 175 Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro 180 185 190 Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly 195 200 205 Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser 210 215 220 Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile 225 230 235 240 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn 260 265 270 Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg 275 280 285 Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn 290 295 300 Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile 305 310 315 320 Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn 325 330 335 Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu 340 345 350 Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro 355 360 365 Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp 370 375 380 Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe 385 390 395 400 Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu 405 410 415 Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu 420 425 430 Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser 435 440 445 Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser 450 455 460 Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro 465 470 475 480 Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn 485 490 495 Asn Asn Ser Glu Ile Ala Trp Pro Arg Ala Ser Ser Trp Ala Leu Asn 500 505 510 Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys 515 520 525 Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly 530 535 540 Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile 545 550 555 560 Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser 565 570 575 Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln 580 585 590 Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln 595 600 605 Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His 610 615 620 Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met 625 630 635 640 Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala 645 650 655 Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr 660 665 670 Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln 675 680 685 Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn 690 695 700 Tyr Cys Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val 705 710 715 720 Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu 725 730 735 <210> 18 <211> 145 <212> DNA <213> Artificial Sequence <220> <223> AAV2 5' ITR <400> 18 ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 60 cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag agagggagtg 120 gccaactcca tcactagggg ttcct 145 <210> 19 <211> 145 <212> DNA <213> Artificial Sequence <220> <223> AAV2 3' ITR <400> 19 aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg 60 ccgggcgacc aaaggtcgcc cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc 120 gagcgcgcag agagggagtg gccaa 145 <210> 20 <211> 167 <212> DNA <213> Artificial Sequence <220> <223> AAV5 5' ITR <400> 20 ctctcccccc tgtcgcgttc gctcgctcgc tggctcgttt gggggggtgg cagctcaaag 60 agctgccaga cgacggccct ctggccgtcg cccccccaaa cgagccagcg agcgagcgaa 120 cgcgacaggg gggagagtgc cacactctca agcaaggggg ttttgta 167 <210> 21 <211> 167 <212> DNA <213> Artificial Sequence <220> <223> AAV5 3' ITR <400> 21 tacaaaacct ccttgcttga gagtgtggca ctctcccccc tgtcgcgttc gctcgctcgc 60 tggctcgttt gggggggtgg cagctcaaag agctgccaga cgacggccct ctggccgtcg 120 cccccccaaa cgagccagcg agcgagcgaa cgcgacaggg gggagag 167 <210> 22 <211> 621 <212> PRT <213> Artificial Sequence <220> <223> AAV2 Rep <400> 22 Met Pro Gly Phe Tyr Glu Ile Val Ile Lys Val Pro Ser Asp Leu Asp 1 5 10 15 Glu His Leu Pro Gly Ile Ser Asp Ser Phe Val Asn Trp Val Ala Glu 20 25 30 Lys Glu Trp Glu Leu Pro Pro Asp Ser Asp Met Asp Leu Asn Leu Ile 35 40 45 Glu Gln Ala Pro Leu Thr Val Ala Glu Lys Leu Gln Arg Asp Phe Leu 50 55 60 Thr Glu Trp Arg Arg Val Ser Lys Ala Pro Glu Ala Leu Phe Phe Val 65 70 75 80 Gln Phe Glu Lys Gly Glu Ser Tyr Phe His Met His Val Leu Val Glu 85 90 95 Thr Thr Gly Val Lys Ser Met Val Leu Gly Arg Phe Leu Ser Gln Ile 100 105 110 Arg Glu Lys Leu Ile Gln Arg Ile Tyr Arg Gly Ile Glu Pro Thr Leu 115 120 125 Pro Asn Trp Phe Ala Val Thr Lys Thr Arg Asn Gly Ala Gly Gly Gly 130 135 140 Asn Lys Val Val Asp Glu Cys Tyr Ile Pro Asn Tyr Leu Leu Pro Lys 145 150 155 160 Thr Gln Pro Glu Leu Gln Trp Ala Trp Thr Asn Met Glu Gln Tyr Leu 165 170 175 Ser Ala Cys Leu Asn Leu Thr Glu Arg Lys Arg Leu Val Ala Gln His 180 185 190 Leu Thr His Val Ser Gln Thr Gln Glu Gln Asn Lys Glu Asn Gln Asn 195 200 205 Pro Asn Ser Asp Ala Pro Val Ile Arg Ser Lys Thr Ser Ala Arg Tyr 210 215 220 Met Glu Leu Val Gly Trp Leu Val Asp Lys Gly Ile Thr Ser Glu Lys 225 230 235 240 Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala 245 250 255 Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Gly Lys 260 265 270 Ile Met Ser Leu Thr Lys Thr Ala Pro Asp Tyr Leu Val Gly Gln Gln 275 280 285 Pro Val Glu Asp Ile Ser Ser Asn Arg Ile Tyr Lys Ile Leu Glu Leu 290 295 300 Asn Gly Tyr Asp Pro Gln Tyr Ala Ala Ser Val Phe Leu Gly Trp Ala 305 310 315 320 Thr Lys Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala 325 330 335 Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Thr Val Pro 340 345 350 Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp 355 360 365 Cys Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala 370 375 380 Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg 385 390 395 400 Val Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Asp Pro Thr Pro Val 405 410 415 Ile Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser 420 425 430 Thr Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe 435 440 445 Glu Leu Thr Arg Arg Leu Asp His Asp Phe Gly Lys Val Thr Lys Gln 450 455 460 Glu Val Lys Asp Phe Phe Arg Trp Ala Lys Asp His Val Val Glu Val 465 470 475 480 Glu His Glu Phe Tyr Val Lys Lys Gly Gly Ala Lys Lys Arg Pro Ala 485 490 495 Pro Ser Asp Ala Asp Ile Ser Glu Pro Lys Arg Val Arg Glu Ser Val 500 505 510 Ala Gln Pro Ser Thr Ser Asp Ala Glu Ala Ser Ile Asn Tyr Ala Asp 515 520 525 Arg Tyr Gln Asn Lys Cys Ser Arg His Val Gly Met Asn Leu Met Leu 530 535 540 Phe Pro Cys Arg Gln Cys Glu Arg Met Asn Gln Asn Ser Asn Ile Cys 545 550 555 560 Phe Thr His Gly Gln Lys Asp Cys Leu Glu Cys Phe Pro Val Ser Glu 565 570 575 Ser Gln Pro Val Ser Val Val Lys Lys Ala Tyr Gln Lys Leu Cys Tyr 580 585 590 Ile His His Ile Met Gly Lys Val Pro Asp Ala Cys Thr Ala Cys Asp 595 600 605 Leu Val Asn Val Asp Leu Asp Asp Cys Ile Phe Glu Gln 610 615 620 <210> 23 <211> 509 <212> PRT <213> Homo sapiens <400> 23 Met Ser Met Gly Ala Pro Arg Ser Leu Leu Leu Ala Leu Ala Ala Gly 1 5 10 15 Leu Ala Val Ala Arg Pro Pro Asn Ile Val Leu Ile Phe Ala Asp Asp 20 25 30 Leu Gly Tyr Gly Asp Leu Gly Cys Tyr Gly His Pro Ser Ser Thr Thr 35 40 45 Pro Asn Leu Asp Gln Leu Ala Ala Gly Gly Leu Arg Phe Thr Asp Phe 50 55 60 Tyr Val Pro Val Ser Leu Cys Thr Pro Ser Arg Ala Ala Leu Leu Thr 65 70 75 80 Gly Arg Leu Pro Val Arg Met Gly Met Tyr Pro Gly Val Leu Val Pro 85 90 95 Ser Ser Arg Gly Gly Leu Pro Leu Glu Glu Val Thr Val Ala Glu Val 100 105 110 Leu Ala Ala Arg Gly Tyr Leu Thr Gly Met Ala Gly Lys Trp His Leu 115 120 125 Gly Val Gly Pro Glu Gly Ala Phe Leu Pro Pro His Gln Gly Phe His 130 135 140 Arg Phe Leu Gly Ile Pro Tyr Ser His Asp Gln Gly Pro Cys Gln Asn 145 150 155 160 Leu Thr Cys Phe Pro Pro Ala Thr Pro Cys Asp Gly Gly Cys Asp Gln 165 170 175 Gly Leu Val Pro Ile Pro Leu Leu Ala Asn Leu Ser Val Glu Ala Gln 180 185 190 Pro Pro Trp Leu Pro Gly Leu Glu Ala Arg Tyr Met Ala Phe Ala His 195 200 205 Asp Leu Met Ala Asp Ala Gln Arg Gln Asp Arg Pro Phe Phe Leu Tyr 210 215 220 Tyr Ala Ser His His Thr His Tyr Pro Gln Phe Ser Gly Gln Ser Phe 225 230 235 240 Ala Glu Arg Ser Gly Arg Gly Pro Phe Gly Asp Ser Leu Met Glu Leu 245 250 255 Asp Ala Ala Val Gly Thr Leu Met Thr Ala Ile Gly Asp Leu Gly Leu 260 265 270 Leu Glu Glu Thr Leu Val Ile Phe Thr Ala Asp Asn Gly Pro Glu Thr 275 280 285 Met Arg Met Ser Arg Gly Gly Cys Ser Gly Leu Leu Arg Cys Gly Lys 290 295 300 Gly Thr Thr Tyr Glu Gly Gly Val Arg Glu Pro Ala Leu Ala Phe Trp 305 310 315 320 Pro Gly His Ile Ala Pro Gly Val Thr His Glu Leu Ala Ser Ser Leu 325 330 335 Asp Leu Leu Pro Thr Leu Ala Ala Leu Ala Gly Ala Pro Leu Pro Asn 340 345 350 Val Thr Leu Asp Gly Phe Asp Leu Ser Pro Leu Leu Leu Gly Thr Gly 355 360 365 Lys Ser Pro Arg Gln Ser Leu Phe Phe Tyr Pro Ser Tyr Pro Asp Glu 370 375 380 Val Arg Gly Val Phe Ala Val Arg Thr Gly Lys Tyr Lys Ala His Phe 385 390 395 400 Phe Thr Gln Gly Ser Ala His Ser Asp Thr Thr Ala Asp Pro Ala Cys 405 410 415 His Ala Ser Ser Ser Leu Thr Ala His Glu Pro Pro Leu Leu Tyr Asp 420 425 430 Leu Ser Lys Asp Pro Gly Glu Asn Tyr Asn Leu Leu Gly Gly Val Ala 435 440 445 Gly Ala Thr Pro Glu Val Leu Gln Ala Leu Lys Gln Leu Gln Leu Leu 450 455 460 Lys Ala Gln Leu Asp Ala Ala Val Thr Phe Gly Pro Ser Gln Val Ala 465 470 475 480 Arg Gly Glu Asp Pro Ala Leu Gln Ile Cys Cys His Pro Gly Cys Thr 485 490 495 Pro Arg Pro Ala Cys Cys His Cys Pro Asp Pro His Ala 500 505 <210> 24 <211> 1527 <212> DNA <213> Homo sapiens <400> 24 atgtccatgg gggcaccgcg gtccctcctc ctggccctgg ctgctggcct ggccgttgcc 60 cgtccgccca acatcgtgct gatctttgcc gacgacctcg gctatgggga cctgggctgc 120 tatgggcacc ccagctctac cactcccaac ctggaccagc tggcggcggg agggctgcgg 180 ttcacagact tctacgtgcc tgtgtctctg tgcacaccct ctagggccgc cctcctgacc 240 ggccggctcc cggttcggat gggcatgtac cctggcgtcc tggtgcccag ctcccggggg 300 ggcctgcccc tggaggaggt gaccgtggcc gaagtcctgg ctgcccgagg ctacctcaca 360 ggaatggccg gcaagtggca ccttggggtg gggcctgagg gggccttcct gcccccccat 420 cagggcttcc atcgatttct aggcatcccg tactcccacg accagggccc ctgccagaac 480 ctgacctgct tcccgccggc cactccttgc gacggtggct gtgaccaggg cctggtcccc 540 atcccactgt tggccaacct gtccgtggag gcgcagcccc cctggctgcc cggactagag 600 gcccgctaca tggctttcgc ccatgacctc atggccgacg cccagcgcca ggatcgcccc 660 ttcttcctgt actatgcctc tcaccacacc cactaccctc agttcagtgg gcagagcttt 720 gcagagcgtt caggccgcgg gccatttggg gactccctga tggagctgga tgcagctgtg 780 gggaccctga tgacagccat aggggacctg gggctgcttg aagagacgct ggtcatcttc 840 actgcagaca atggacctga gaccatgcgt atgtcccgag gcggctgctc cggtctcttg 900 cggtgtggaa agggaacgac ctacgagggc ggtgtccgag agcctgcctt ggccttctgg 960 ccaggtcata tcgctcccgg cgtgacccac gagctggcca gctccctgga cctgctgcct 1020 accctggcag ccctggctgg ggccccactg cccaatgtca ccttggatgg ctttgacctc 1080 agccccctgc tgctgggcac aggcaagagc cctcggcagt ctctcttctt ctacccgtcc 1140 tacccagacg aggtccgtgg ggtttttgct gtgcggactg gaaagtacaa ggctcacttc 1200 ttcacccagg gctctgccca cagtgatacc actgcagacc ctgcctgcca cgcctccagc 1260 tctctgactg ctcatgagcc cccgctgctc tatgacctgt ccaaggaccc tggtgagaac 1320 tacaacctgc tggggggtgt ggccggggcc accccagagg tgctgcaagc cctgaaacag 1380 cttcagctgc tcaaggccca gttagacgca gctgtgacct tcggccccag ccaggtggcc 1440 cggggcgagg accccgccct gcagatctgc tgtcatcctg gctgcacccc ccgcccagct 1500 tgctgccatt gcccagatcc ccatgcc 1527 <210> 25 <211> 278 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 25 tcgaggtgag ccccacgttc tgcttcactc tccccatctc ccccccctcc ccacccccaa 60 ttttgtattt atttattttt taattatttt gtgcagcgat gggggcgggg gggggggggg 120 ggcgcgcgcc aggcggggcg gggcggggcg aggggcgggg cggggcgagg cggagaggtg 180 cggcggcagc caatcagagc ggcgcgctcc gaaagtttcc ttttatggcg aggcggcggc 240 ggcggcggcc ctataaaaag cgaagcgcgc ggcgggcg 278 <210> 26 <211> 106 <212> DNA <213> Artificial Sequence <220> <223> 5' ITR <400> 26 ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60 ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtgg 106 <210> 27 <211> 143 <212> DNA <213> Artificial Sequence <220> <223> 3' ITR <400> 27 aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg 60 ccgggcgacc aaaggtcgcc cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc 120 gagcgcgcag agagggagtg gcc 143 <210> 28 <211> 1873 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 28 gatcttcaat attggccatt agccatatta ttcattggtt atatagcata aatcaatatt 60 ggctattggc cattgcatac gttgtatcta tatcataata tgtacattta tattggctca 120 tgtccaatat gaccgccatg ttggcattga ttattgacta gttattaata gtaatcaatt 180 acggggtcat tagttcatag cccatatatg gagttccgcg ttacataact tacggtaaat 240 ggcccgcctg gctgaccgcc caacgacccc cgcccattga cgtcaataat gacgtatgtt 300 cccatagtaa cgccaatagg gactttccat tgacgtcaat gggtggagta tttacggtaa 360 actgcccact tggcagtaca tcaagtgtat catatgccaa gtccgccccc tattgacgtc 420 aatgacggta aatggcccgc ctggcattat gcccagtaca tgaccttacg ggactttcct 480 acttggcagt acatctacgt attagtcatc gctattacca tggtcgaggt gagccccacg 540 ttctgcttca ctctccccat ctcccccccc tccccacccc caattttgta tttatttatt 600 ttttaattat tttgtgcagc gatgggggcg gggggggggg gggggcgcgc gccaggcggg 660 gcggggcggg gcgaggggcg gggcggggcg aggcggagag gtgcggcggc agccaatcag 720 agcggcgcgc tccgaaagtt tccttttatg gcgaggcggc ggcggcggcg gccctataaa 780 aagcgaagcg cgcggcgggc gggagtcgct gcgacgctgc cttcgccccg tgccccgctc 840 cgccgccgcc tcgcgccgcc cgccccggct ctgactgacc gcgttactcc cacaggtgag 900 cgggcgggac ggcccttctc ctccgggctg taattagcgc ttggtttaat gacggcttgt 960 ttcttttctg tggctgcgtg aaagccttga ggggctccgg gagggccctt tgtgcggggg 1020 ggagcggctc ggggggtgcg tgcgtgtgtg tgtgcgtggg gagcgccgcg tgcggcccgc 1080 gctgcccggc ggctgtgagc gctgcgggcg cggcgcgggg ctttgtgcgc tccgcagtgt 1140 gcgcgagggg agcgcggccg ggggcggtgc cccgcggtgc ggggggggct gcgaggggaa 1200 caaaggctgc gtgcggggtg tgtgcgtggg ggggtgagca gggggtgtgg gcgcggcggt 1260 cgggctgtaa cccccccctg cacccccctc cccgagttgc tgagcacggc ccggcttcgg 1320 gtgcggggct ccgtacgggg cgtggcgcgg ggctcgccgt gccgggcggg gggtggcggc 1380 aggtgggggt gccgggcggg gcggggccgc ctcgggccgg ggagggctcg ggggaggggc 1440 gcggcggccc ccggagcgcc ggcggctgtc gaggcgcggc gagccgcagc cattgccttt 1500 tatggtaatc gtgcgagagg gcgcagggac ttcctttgtc ccaaatctgt gcggagccga 1560 aatctgggag gcgccgccgc accccctcta gcgggcgcgg ggcgaagcgg tgcggcgccg 1620 gcaggaagga aatgggcggg gagggccttc gtgcgtcgcc gcgccgccgt ccccttctcc 1680 ctctccagcc tcggggctgt ccgcgggggg acggctgcct tcggggggga cggggcaggg 1740 cggggttcgg cttctggcgt gtgaccggcg gctctagagc ctctgctaac catgttcatg 1800 ccttcttctt tttcctacag ctcctgggca acgtgctggt tattgtgctg tctcatcatt 1860 ttggcaaaga att 1873 <210> 29 <211> 374 <212> PRT <213> Homo sapiens <400> 29 Met Ala Ala Pro Ala Leu Gly Leu Val Cys Gly Arg Cys Pro Glu Leu 1 5 10 15 Gly Leu Val Leu Leu Leu Leu Leu Leu Ser Leu Leu Cys Gly Ala Ala 20 25 30 Gly Ser Gln Glu Ala Gly Thr Gly Ala Gly Ala Gly Ser Leu Ala Gly 35 40 45 Ser Cys Gly Cys Gly Thr Pro Gln Arg Pro Gly Ala His Gly Ser Ser 50 55 60 Ala Ala Ala His Arg Tyr Ser Arg Glu Ala Asn Ala Pro Gly Pro Val 65 70 75 80 Pro Gly Glu Arg Gln Leu Ala His Ser Lys Met Val Pro Ile Pro Ala 85 90 95 Gly Val Phe Thr Met Gly Thr Asp Asp Pro Gln Ile Lys Gln Asp Gly 100 105 110 Glu Ala Pro Ala Arg Arg Val Thr Ile Asp Ala Phe Tyr Met Asp Ala 115 120 125 Tyr Glu Val Ser Asn Thr Glu Phe Glu Lys Phe Val Asn Ser Thr Gly 130 135 140 Tyr Leu Thr Glu Ala Glu Lys Phe Gly Asp Ser Phe Val Phe Glu Gly 145 150 155 160 Met Leu Ser Glu Gln Val Lys Thr Asn Ile Gln Gln Ala Val Ala Ala 165 170 175 Ala Pro Trp Trp Leu Pro Val Lys Gly Ala Asn Trp Arg His Pro Glu 180 185 190 Gly Pro Asp Ser Thr Ile Leu His Arg Pro Asp His Pro Val Leu His 195 200 205 Val Ser Trp Asn Asp Ala Val Ala Tyr Cys Thr Trp Ala Gly Lys Arg 210 215 220 Leu Pro Thr Glu Ala Glu Trp Glu Tyr Ser Cys Arg Gly Gly Leu His 225 230 235 240 Asn Arg Leu Phe Pro Trp Gly Asn Lys Leu Gln Pro Lys Gly Gln His 245 250 255 Tyr Ala Asn Ile Trp Gln Gly Glu Phe Pro Val Thr Asn Thr Gly Glu 260 265 270 Asp Gly Phe Gln Gly Thr Ala Pro Val Asp Ala Phe Pro Pro Asn Gly 275 280 285 Tyr Gly Leu Tyr Asn Ile Val Gly Asn Ala Trp Glu Trp Thr Ser Asp 290 295 300 Trp Trp Thr Val His His Ser Val Glu Glu Thr Leu Asn Pro Lys Gly 305 310 315 320 Pro Pro Ser Gly Lys Asp Arg Val Lys Lys Gly Gly Ser Tyr Met Cys 325 330 335 His Arg Ser Tyr Cys Tyr Arg Tyr Arg Cys Ala Ala Arg Ser Gln Asn 340 345 350 Thr Pro Asp Ser Ser Ala Ser Asn Leu Gly Phe Arg Cys Ala Ala Asp 355 360 365 Arg Leu Pro Thr Met Asp 370 <210> 30 <211> 2718 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 30 atgagcatgg gcgcccccag aagcctgtta cttgctttag ctgctggcct tgcagtggca 60 aggcccccta acatcgtgct gatctttgca gatgacttgg gatatgggga tcttggttgt 120 tatggccacc catcaagcac aactcccaat ctggatcagt tggctgcagg aggtctgagg 180 tttacagact tttatgttcc agtctccctg tgcactcctt ctcgggctgc cctgcttact 240 gggaggctcc ctgtgagaat gggtatgtac cctggagtgt tggtcccatc cagcagggga 300 gggctgcccc tggaagaggt gacagtggca gaggtgctgg cagcacgagg ctatctgact 360 ggcatggcag gcaagtggca cctgggtgta gggccagagg gtgctttcct gcctccccat 420 cagggctttc ataggtttct gggaatccca tactctcatg accaaggacc ctgccagaac 480 ctcacctgtt tcccccctgc aacaccatgt gatgggggct gtgatcaagg tctggttcct 540 ataccactgc ttgctaatct ttcagtggaa gctcaaccac cctggctgcc tggcttggag 600 gctagataca tggccttcgc acatgatctg atggcagatg cccagagaca agataggcct 660 ttcttcctct actatgcatc tcaccacacc cactatcctc agttctcagg ccaatcattt 720 gctgagcgta gtggcagggg cccatttggg gacagtttga tggaactgga tgccgcagtt 780 ggtaccctca tgacagcaat aggggactta ggtttgctgg aggaaacatt ggtaattttc 840 acagctgata atggccctga gacaatgaga atgtctaggg gaggctgctc tggtcttctg 900 aggtgtggta aagggactac atatgaggga ggagtgaggg aaccagctct tgccttttgg 960 ccaggtcaca tagcccctgg agttacacat gaactagctt cttccctgga cttgcttcct 1020 acactggcag ccctggcagg tgcccctctc cctaatgtaa ctttagatgg atttgacctc 1080 tctccactac ttttagggac agggaaaagt ccaaggcagt ccttattctt ctatccttcc 1140 tacccagatg aggtgagggg tgtttttgcc gtgaggactg ggaaatacaa agctcatttt 1200 tttacccagg gatcagctca ttcagacacc acagctgatc ctgcctgtca tgccagcagt 1260 agcttgacag cacatgagcc tcccttactg tatgacctga gcaaggaccc aggggagaac 1320 tataacctgc ttgggggggt tgctggggcc accccagaag tgcttcaggc actaaagcag 1380 ctgcaactgc ttaaagcaca gttggatgct gcagtgacct ttggcccttc ccaggtggcc 1440 agaggcgagg atcccgccct gcagatctgc tgccacccag gctgcacacc cagacctgcc 1500 tgctgtcact gccccgaccc acacgccggc agcggagcta ctaacttcag cctgctgaag 1560 caggctggag acgtggagga gaaccctgga cctatggctg ccccagccct ggggctggtg 1620 tgtggcagat gccctgagct gggcctggtg ctgcttctcc tgctgctgag cctcctgtgt 1680 ggtgctgctg gctctcagga agcagggaca ggagcaggag caggttctct ggctggctca 1740 tgcggttgtg ggacccccca gaggccaggg gctcatgggt cctctgcagc tgcccacagg 1800 tactcaaggg aagcaaatgc ccctggcccc gtacctgggg aaaggcaact tgctcactcc 1860 aagatggttc ctatccctgc aggagttttt actatgggaa ctgatgaccc tcagatcaag 1920 caggatggtg aagcaccagc taggagagtc acaattgatg ccttctatat ggatgcctat 1980 gaagtgtcaa acacagaatt tgagaaattt gtaaacagca ctggatacct tacagaggct 2040 gagaaatttg gtgacagttt tgtttttgaa ggcatgctaa gtgagcaggt gaagaccaat 2100 atccaacagg cagtggctgc agccccctgg tggctgcctg ttaaaggagc caattggaga 2160 cacccagagg gaccagactc aactatcctc cacaggcctg accaccctgt gctgcatgtg 2220 tcctggaatg atgcagtggc atactgcacc tgggctggga aaaggttacc aacagaggca 2280 gaatgggagt attcctgccg gggtggactg cacaacagac tgttcccctg gggcaataag 2340 ctgcaaccta aaggacagca ttatgccaat atttggcagg gagagttccc agtcacaaac 2400 actggtgagg atggcttcca gggaactgcc cctgtggatg ctttcccacc caatggctat 2460 gggttgtaca atatagttgg gaatgcctgg gagtggactt ctgactggtg gacggtccat 2520 cacagtgtgg aagagacact gaacccaaag gggcccccct caggcaagga cagagtcaag 2580 aaaggtggct cttatatgtg tcacagaagc tattgctaca gatataggtg tgctgcaaga 2640 agtcagaaca cccctgacag ctcagctagc aatctgggat ttagatgtgc agcagataga 2700 ctccccacca tggactga 2718 <210> 31 <211> 93 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 31 ctctaaggta aatataaaat ttttaagtgt ataatgtgtt aaactactga ttctaattgt 60 ttctctcttt tagattccaa cctttggaac tga 93 <210> 32 <211> 1017 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 32 ggagtcgctg cgcgctgcct tcgccccgtg ccccgctccg ccgccgcctc gcgccgcccg 60 ccccggctct gactgaccgc gttactccca caggtgagcg ggcgggacgg cccttctcct 120 ccgggctgta attagcgctt ggtttaatga cggcttgttt cttttctgtg gctgcgtgaa 180 agccttgagg ggctccggga gggccctttg tgcgggggga gcggctcggg gggtgcgtgc 240 gtgtgtgtgt gcgtggggag cgccgcgtgc ggctccgcgc tgcccggcgg ctgtgagcgc 300 tgcgggcgcg gcgcggggct ttgtgcgctc cgcagtgtgc gcgaggggag cgcggccggg 360 ggcggtgccc cgcggtgcgg ggggggctgc gaggggaaca aaggctgcgt gcggggtgtg 420 tgcgtggggg ggtgagcagg gggtgtgggc gcgtcggtcg ggctgcaacc ccccctgcac 480 ccccctcccc gagttgctga gcacggcccg gcttcgggtg cggggctccg tacggggcgt 540 ggcgcggggc tcgccgtgcc gggcgggggg tggcggcagg tgggggtgcc gggcggggcg 600 gggccgcctc gggccgggga gggctcgggg gaggggcgcg gcggcccccg gagcgccggc 660 ggctgtcgag gcgcggcgag ccgcagccat tgccttttat ggtaatcgtg cgagagggcg 720 cagggacttc ctttgtccca aatctgtgcg gagccgaaat ctgggaggcg ccgccgcacc 780 ccctctagcg ggcgcggggc gaagcggtgc ggcgccggca ggaaggaaat gggcggggag 840 ggccttcgtg cgtcgccgcg ccgccgtccc cttctccctc tccagcctcg gggctgtccg 900 cggggggacg gctgccttcg ggggggacgg ggcagggcgg ggttcggctt ctggcgtgtg 960 accggcggct ctagagcctc tgctaaccat gttcatgcct tcttcttttt cctacag 1017 <210> 33 <211> 79 <212> PRT <213> Homo sapiens <400> 33 Gly Asp Val Cys Gln Asp Cys Ile Gln Met Val Thr Asp Ile Gln Thr 1 5 10 15 Ala Val Arg Thr Asn Ser Thr Phe Val Gln Ala Leu Val Glu His Val 20 25 30 Lys Glu Glu Cys Asp Arg Leu Gly Pro Gly Met Ala Asp Ile Cys Lys 35 40 45 Asn Tyr Ile Ser Gln Tyr Ser Glu Ile Ala Ile Gln Met Met Met His 50 55 60 Met Gln Pro Lys Glu Ile Cys Ala Leu Val Gly Phe Cys Asp Glu 65 70 75 <210> 34 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> MISC_FEATURE <222> (1) <223> Xaa is D or G <220> <221> MISC_FEATURE <222> (2) <223> Xaa is V or I <220> <221> MISC_FEATURE <222> (4) <223> Xaa is any amino acid <400> 34 Xaa Xaa Glu Xaa Asn Pro Gly Pro 1 5 <210> 35 <211> 92 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 35 aagaggtaag ggtttaaggg atggttggtt ggtggggtat taatgtttaa ttacctggag 60 cacctgcctg aaatcacttt ttttcaggtt gg 92 <210> 36 <211> 1676 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 36 ggcattgatt attgactagt tattaatagt aatcaattac ggggtcatta gttcatagcc 60 catatatgga gttccgcgtt acataactta cggtaaatgg cccgcctggc tgaccgccca 120 acgacccccg cccattgacg tcaataatga cgtatgttcc catagtaacg ccaataggga 180 ctttccattg acgtcaatgg gtggagtatt tacggtaaac tgcccacttg gcagtacatc 240 aagtgtatca tatgccaagt ccgcccccta ttgacgtcaa tgacggtaaa tggcccgcct 300 ggcattatgc ccagtacatg accttacggg actttcctac ttggcagtac atctacgtat 360 tagtcatcgc tattaccatg gtcgaggtga gccccacgtt ctgcttcact ctccccatct 420 cccccccctc cccaccccca attttgtatt tatttatttt ttaattattt tgtgcagcga 480 tgggggcggg gggggggggg gggcgcgcgc caggcggggc ggggcggggc gaggggcggg 540 gcggggcgag gcggagaggt gcggcggcag ccaatcagag cggcgcgctc cgaaagtttc 600 cttttatggc gaggcggcgg cggcggcggc cctataaaaa gcgaagcgcg cggcgggcgg 660 gagtcgctgc gcgctgcctt cgccccgtgc cccgctccgc cgccgcctcg cgccgcccgc 720 cccggctctg actgaccgcg ttactcccac aggtgagcgg gcgggacggc ccttctcctc 780 cgggctgtaa ttagcgcttg gtttaatgac ggcttgtttc ttttctgtgg ctgcgtgaaa 840 gccttgaggg gctccgggag ggccctttgt gcggggggag cggctcgggg ggtgcgtgcg 900 tgtgtgtgtg cgtggggagc gccgcgtgcg gctccgcgct gcccggcggc tgtgagcgct 960 gcgggcgcgg cgcggggctt tgtgcgctcc gcagtgtgcg cgaggggagc gcggccgggg 1020 gcggtgcccc gcggtgcggg gggggctgcg aggggaacaa aggctgcgtg cggggtgtgt 1080 gcgtgggggg gtgagcaggg ggtgtgggcg cgtcggtcgg gctgcaaccc cccctgcacc 1140 cccctccccg agttgctgag cacggcccgg cttcgggtgc ggggctccgt acggggcgtg 1200 gcgcggggct cgccgtgccg ggcggggggt ggcggcaggt gggggtgccg ggcggggcgg 1260 ggccgcctcg ggccggggag ggctcggggg aggggcgcgg cggcccccgg agcgccggcg 1320 gctgtcgagg cgcggcgagc cgcagccatt gccttttatg gtaatcgtgc gagagggcgc 1380 agggacttcc tttgtcccaa atctgtgcgg agccgaaatc tgggaggcgc cgccgcaccc 1440 cctctagcgg gcgcggggcg aagcggtgcg gcgccggcag gaaggaaatg ggcggggagg 1500 gccttcgtgc gtcgccgcgc cgccgtcccc ttctccctct ccagcctcgg ggctgtccgc 1560 ggggggacgg ctgccttcgg gggggacggg gcagggcggg gttcggcttc tggcgtgtga 1620 ccggcggctc tagagcctct gctaaccatg ttcatgcctt cttctttttc ctacag 1676 <210> 37 <211> 16 <212> PRT <213> Artificial Sequence <220> <223> T2A peptide <400> 37 Glu Gly Arg Gly Ser Leu Leu Thr Cys Gly Asp Val Glu Glu Asn Pro 1 5 10 15 <210> 38 <211> 16 <212> PRT <213> Artificial Sequence <220> <223> P2A peptide <400> 38 Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp Val Glu Glu Asn 1 5 10 15 <210> 39 <211> 540 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 39 cctgcaggct caccagtgtt tgtgactggg aactctccct gccaaatatt ggcataatgc 60 tgtcctttag gttgcagctt attgccccag gggaacagtc tgttgtgcag tccaccccgg 120 caggaatact cccattctgc ctctgttggt aaccttttcc cagcccaggt gcagtatgcc 180 actgcatcat tccaggacac atgcagcaca gggtggtcag gcctgtggag gatagttgag 240 tctggtccct ctgggtgtct ccaattggct cctttaacag gcagccacca gggggctgca 300 gccactgcct gttggatatt ggtcttcacc tgctcactta gcatgccttc aaaaacaaaa 360 ctgtcaccaa atttctcagc ctctgtaagg tatccagtgc tgtttacaaa tttctcaaat 420 tctgtgtttg acacttcata ggcatccata tagaaggcat caattgtgac tctcctagct 480 ggtgcttcac catcctgctt gatctgaggg tcatcagttc ccatagtaaa aactcctgca 540 540 <210> 40 <211> 1168 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 40 cgtgaggctc cggtgcccgt cagtgggcag agcgcacatc gcccacagtc cccgagaagt 60 tggggggagg ggtcggcaat tgaaccggtg cctagagaag gtggcgcggg gtaaactggg 120 aaagtgatgt cgtgtactgg ctccgccttt ttcccgaggg tgggggagaa ccgtatataa 180 gtgcagtagt cgccgtgaac gttctttttc gcaacgggtt tgccgccaga acacaggtaa 240 gtgccgtgtg tggttcccgc gggcctggcc tctttacggg ttatggccct tgcgtgcctt 300 gaattacttc cacctggctc cagtacgtga ttcttgatcc cgagctggag ccaggggcgg 360 gccttgcgct ttaggagccc cttcgcctcg tgcttgagtt gaggcctggc ctgggcgctg 420 gggccgccgc gtgcgaatct ggtggcacct tcgcgcctgt ctcgctgctt tcgataagtc 480 tctagccatt taaaattttt gatgacctgc tgcgacgctt tttttctggc aagatagtct 540 tgtaaatgcg ggccaggatc tgcacactgg tatttcggtt tttggggccg cgggcggcga 600 cggggcccgt gcgtcccagc gcacatgttc ggcgaggcgg ggcctgcgag cgcggccacc 660 gagaatcgga cgggggtagt ctcaagctgg ccggcctgct ctggtgcctg gcctcgcgcc 720 gccgtgtatc gccccgccct gggcggcaag gctggcccgg tcggcaccag ttgcgtgagc 780 ggaaagatgg ccgcttcccg gccctgctcc agggggctca aaatggagga cgcggcgctc 840 gggagagcgg gcgggtgagt cacccacaca aaggaaaggg gcctttccgt cctcagccgt 900 cgcttcatgt gactccacgg agtaccgggc gccgtccagg cacctcgatt agttctggag 960 cttttggagt acgtcgtctt taggttgggg ggaggggttt tatgcgatgg agtttcccca 1020 cactgagtgg gtggagactg aagttaggcc agcttggcac ttgatgtaat tctccttgga 1080 atttgccctt tttgagtttg gatcttggtt cattctcaag cctcagacag tggttcaaag 1140 tttttttctt ccatttcagg tgtcgtga 1168 <210> 41 <211> 3416 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 41 ggcattgatt attgactagt tattaatagt aatcaattac ggggtcatta gttcatagcc 60 catatatgga gttccgcgtt acataactta cggtaaatgg cccgcctggc tgaccgccca 120 acgacccccg cccattgacg tcaataatga cgtatgttcc catagtaacg ccaataggga 180 ctttccattg acgtcaatgg gtggagtatt tacggtaaac tgcccacttg gcagtacatc 240 aagtgtatca tatgccaagt ccgcccccta ttgacgtcaa tgacggtaaa tggcccgcct 300 ggcattatgc ccagtacatg accttacggg actttcctac ttggcagtac atctacgtat 360 tagtcatcgc tattaccatg gtcgaggtga gccccacgtt ctgcttcact ctccccatct 420 cccccccctc cccaccccca attttgtatt tatttatttt ttaattattt tgtgcagcga 480 tgggggcggg gggggggggg gggcgcgcgc caggcggggc ggggcggggc gaggggcggg 540 gcggggcgag gcggagaggt gcggcggcag ccaatcagag cggcgcgctc cgaaagtttc 600 cttttatggc gaggcggcgg cggcggcggc cctataaaaa gcgaagcgcg cggcgggcgg 660 gagtcgctgc gcgctgcctt cgccccgtgc cccgctccgc cgccgcctcg cgccgcccgc 720 cccggctctg actgaccgcg ttactcccac aggtgagcgg gcgggacggc ccttctcctc 780 cgggctgtaa ttagcgcttg gtttaatgac ggcttgtttc ttttctgtgg ctgcgtgaaa 840 gccttgaggg gctccgggag ggccctttgt gcggggggag cggctcgggg ggtgcgtgcg 900 tgtgtgtgtg cgtggggagc gccgcgtgcg gctccgcgct gcccggcggc tgtgagcgct 960 gcgggcgcgg cgcggggctt tgtgcgctcc gcagtgtgcg cgaggggagc gcggccgggg 1020 gcggtgcccc gcggtgcggg gggggctgcg aggggaacaa aggctgcgtg cggggtgtgt 1080 gcgtgggggg gtgagcaggg ggtgtgggcg cgtcggtcgg gctgcaaccc cccctgcacc 1140 cccctccccg agttgctgag cacggcccgg cttcgggtgc ggggctccgt acggggcgtg 1200 gcgcggggct cgccgtgccg ggcggggggt ggcggcaggt gggggtgccg ggcggggcgg 1260 ggccgcctcg ggccggggag ggctcggggg aggggcgcgg cggcccccgg agcgccggcg 1320 gctgtcgagg cgcggcgagc cgcagccatt gccttttatg gtaatcgtgc gagagggcgc 1380 agggacttcc tttgtcccaa atctgtgcgg agccgaaatc tgggaggcgc cgccgcaccc 1440 cctctagcgg gcgcggggcg aagcggtgcg gcgccggcag gaaggaaatg ggcggggagg 1500 gccttcgtgc gtcgccgcgc cgccgtcccc ttctccctct ccagcctcgg ggctgtccgc 1560 ggggggacgg ctgccttcgg gggggacggg gcagggcggg gttcggcttc tggcgtgtga 1620 ccggcggctc tagagcctct gctaaccatg ttcatgcctt cttctttttc ctacagctcc 1680 tgggcaacgt gctggttatt gtgctgtctc atcattttgg caaagaattc cgccaccatg 1740 tccatggggg caccgcggtc cctcctcctg gccctggctg ctggcctggc cgttgcccgt 1800 ccgcccaaca tcgtgctgat ctttgccgac gacctcggct atggggacct gggctgctat 1860 gggcacccca gctctaccac tcccaacctg gaccagctgg cggcgggagg gctgcggttc 1920 acagacttct acgtgcctgt gtctctgtgc acaccctcta gggccgccct cctgaccggc 1980 cggctcccgg ttcggatggg catgtaccct ggcgtcctgg tgcccagctc ccgggggggc 2040 ctgcccctgg aggaggtgac cgtggccgaa gtcctggctg cccgaggcta cctcacagga 2100 atggccggca agtggcacct tggggtgggg cctgaggggg ccttcctgcc cccccatcag 2160 ggcttccatc gatttctagg catcccgtac tcccacgacc agggcccctg ccagaacctg 2220 acctgcttcc cgccggccac tccttgcgac ggtggctgtg accagggcct ggtccccatc 2280 ccactgttgg ccaacctgtc cgtggaggcg cagcccccct ggctgcccgg actagaggcc 2340 cgctacatgg ctttcgccca tgacctcatg gccgacgccc agcgccagga tcgccccttc 2400 ttcctgtact atgcctctca ccacacccac taccctcagt tcagtgggca gagctttgca 2460 gagcgttcag gccgcgggcc atttggggac tccctgatgg agctggatgc agctgtgggg 2520 accctgatga cagccatagg ggacctgggg ctgcttgaag agacgctggt catcttcact 2580 gcagacaatg gacctgagac catgcgtatg tcccgaggcg gctgctccgg tctcttgcgg 2640 tgtggaaagg gaacgaccta cgagggcggt gtccgagagc ctgccttggc cttctggcca 2700 ggtcatatcg ctcccggcgt gacccacgag ctggccagct ccctggacct gctgcctacc 2760 ctggcagccc tggctggggc cccactgccc aatgtcacct tggatggctt tgacctcagc 2820 cccctgctgc tgggcacagg caagagccct cggcagtctc tcttcttcta cccgtcctac 2880 ccagacgagg tccgtggggt ttttgctgtg cggactggaa agtacaaggc tcacttcttc 2940 acccagggct ctgcccacag tgataccact gcagaccctg cctgccacgc ctccagctct 3000 ctgactgctc atgagccccc gctgctctat gacctgtcca aggaccctgg tgagaactac 3060 aacctgctgg ggggtgtggc cggggccacc ccagaggtgc tgcaagccct gaaacagctt 3120 cagctgctca aggcccagtt agacgcagct gtgaccttcg gccccagcca ggtggcccgg 3180 ggcgaggacc ccgccctgca gatctgctgt catcctggct gcaccccccg cccagcttgc 3240 tgccattgcc cagatcccca tgcctgagat tctagagtcg agccgcggac tagtaacttg 3300 tttattgcag cttataatgg ttacaaataa agcaatagca tcacaaattt cacaaataaa 3360 gcattttttt cactgcattc tagttgtggt ttgtccaaac tcatcaatgt atctta 3416 <210> 42 <211> 122 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 42 aacttgttta ttgcagctta taatggttac aaataaagca atagcatcac aaatttcaca 60 aataaagcat ttttttcact gcattctagt tgtggtttgt ccaaactcat caatgtatct 120 ta 122 <210> 43 <211> 133 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 43 tgctttattt gtgaaatttg tgatgctatt gctttatttg taaccattat aagctgcaat 60 aaacaagtta acaacaacaa ttgcattcat tttatgtttc aggttcaggg ggaggtgtgg 120 gaggtttttt aaa 133 <210> 44 <211> 3416 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 44 ggcattgatt attgactagt tattaatagt aatcaattac ggggtcatta gttcatagcc 60 catatatgga gttccgcgtt acataactta cggtaaatgg cccgcctggc tgaccgccca 120 acgacccccg cccattgacg tcaataatga cgtatgttcc catagtaacg ccaataggga 180 ctttccattg acgtcaatgg gtggagtatt tacggtaaac tgcccacttg gcagtacatc 240 aagtgtatca tatgccaagt ccgcccccta ttgacgtcaa tgacggtaaa tggcccgcct 300 ggcattatgc ccagtacatg accttacggg actttcctac ttggcagtac atctacgtat 360 tagtcatcgc tattaccatg gtcgaggtga gccccacgtt ctgcttcact ctccccatct 420 cccccccctc cccaccccca attttgtatt tatttatttt ttaattattt tgtgcagcga 480 tgggggcggg gggggggggg gggcgcgcgc caggcggggc ggggcggggc gaggggcggg 540 gcggggcgag gcggagaggt gcggcggcag ccaatcagag cggcgcgctc cgaaagtttc 600 cttttatggc gaggcggcgg cggcggcggc cctataaaaa gcgaagcgcg cggcgggcgg 660 gagtcgctgc gcgctgcctt cgccccgtgc cccgctccgc cgccgcctcg cgccgcccgc 720 cccggctctg actgaccgcg ttactcccac aggtgagcgg gcgggacggc ccttctcctc 780 cgggctgtaa ttagcgcttg gtttaatgac ggcttgtttc ttttctgtgg ctgcgtgaaa 840 gccttgaggg gctccgggag ggccctttgt gcggggggag cggctcgggg ggtgcgtgcg 900 tgtgtgtgtg cgtggggagc gccgcgtgcg gctccgcgct gcccggcggc tgtgagcgct 960 gcgggcgcgg cgcggggctt tgtgcgctcc gcagtgtgcg cgaggggagc gcggccgggg 1020 gcggtgcccc gcggtgcggg gggggctgcg aggggaacaa aggctgcgtg cggggtgtgt 1080 gcgtgggggg gtgagcaggg ggtgtgggcg cgtcggtcgg gctgcaaccc cccctgcacc 1140 cccctccccg agttgctgag cacggcccgg cttcgggtgc ggggctccgt acggggcgtg 1200 gcgcggggct cgccgtgccg ggcggggggt ggcggcaggt gggggtgccg ggcggggcgg 1260 ggccgcctcg ggccggggag ggctcggggg aggggcgcgg cggcccccgg agcgccggcg 1320 gctgtcgagg cgcggcgagc cgcagccatt gccttttatg gtaatcgtgc gagagggcgc 1380 agggacttcc tttgtcccaa atctgtgcgg agccgaaatc tgggaggcgc cgccgcaccc 1440 cctctagcgg gcgcggggcg aagcggtgcg gcgccggcag gaaggaaatg ggcggggagg 1500 gccttcgtgc gtcgccgcgc cgccgtcccc ttctccctct ccagcctcgg ggctgtccgc 1560 ggggggacgg ctgccttcgg gggggacggg gcagggcggg gttcggcttc tggcgtgtga 1620 ccggcggctc tagagcctct gctaaccatg ttcatgcctt cttctttttc ctacagctcc 1680 tgggcaacgt gctggttatt gtgctgtctc atcattttgg caaagaattc cgccaccatg 1740 tctatggggg ctcctcgctc cctgctgctg gcactggccg ccgggctggc tgtcgcaaga 1800 ccacctaata tcgtcctgat ttttgcagac gatctgggat acggcgacct gggatgctat 1860 ggccacccaa gctccaccac acccaacctg gaccagctgg cagcaggagg cctgcggttc 1920 accgacttct acgtgccagt gagcctgtgc accccctcca gagccgccct gctgacaggc 1980 aggctgccag tgcgcatggg catgtatcct ggcgtgctgg tgccatctag caggggcggc 2040 ctgccactgg aggaggtgac cgtggcagag gtgctggcag ccagaggcta cctgacagga 2100 atggccggca agtggcacct gggagtggga ccagagggag ccttcctgcc ccctcaccag 2160 ggcttccacc ggtttctggg catcccttat tctcacgacc agggcccatg ccagaacctg 2220 acctgttttc caccagcaac accatgcgac ggaggatgtg atcagggcct ggtgccaatc 2280 ccactgctgg caaatctgag cgtggaggca cagcctccat ggctgcctgg cctggaggca 2340 agatacatgg ccttcgccca cgacctgatg gcagatgcac agcggcagga tagacctttc 2400 tttctgtact atgcctccca ccacacccac tatccacagt tcagcggcca gtcctttgcc 2460 gagaggtccg gaaggggacc attcggcgac tctctgatgg agctggatgc cgccgtgggc 2520 accctgatga cagcaatcgg cgacctgggc ctgctggagg agacactggt catcttcacc 2580 gccgataacg gccctgagac aatgcggatg tctagaggcg gatgcagcgg cctgctgaga 2640 tgtggcaagg gaaccacata cgagggaggc gtgcgcgagc ctgccctggc attttggcca 2700 ggacacatcg cacctggagt gacccacgag ctggcctcct ctctggacct gctgccaaca 2760 ctggccgccc tggcaggagc acctctgcca aatgtgaccc tggacggctt cgatctgagc 2820 ccactgctgc tgggaaccgg caagtcccct aggcagtctc tgttctttta cccctcctat 2880 cctgatgagg tgcggggcgt gtttgccgtg agaaccggca agtacaaggc ccacttcttt 2940 acacagggct ctgcccacag cgacaccaca gcagatccag catgccacgc cagctcctct 3000 ctgaccgcac acgagccacc tctgctgtac gacctgtcca aggatcccgg cgagaactat 3060 aatctgctgg gaggagtggc aggagcaacc cctgaggtgc tgcaggccct gaagcagctg 3120 cagctgctga aggcacagct ggacgcagca gtgacattcg gcccaagcca ggtggccaga 3180 ggcgaggatc ccgccctgca gatctgttgc caccccggct gcaccccaag acctgcctgt 3240 tgccattgcc ccgacccaca cgcctaagat tctagagtcg agccgcggac tagtaacttg 3300 tttattgcag cttataatgg ttacaaataa agcaatagca tcacaaattt cacaaataaa 3360 gcattttttt cactgcattc tagttgtggt ttgtccaaac tcatcaatgt atctta 3416 <210> 45 <211> 198 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 45 gatccagaca tgataagata cattgatgag tttggacaaa ccacaactag aatgcagtga 60 aaaaaatgct ttatttgtga aatttgtgat gctattgctt tatttgtaac cattataagc 120 tgcaataaac aagttaacaa caacaattgc attcatttta tgtttcaggt tcagggggag 180 gtgtgggagg ttttttaa 198 <210> 46 <211> 3416 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 46 ggcattgatt attgactagt tattaatagt aatcaattac ggggtcatta gttcatagcc 60 catatatgga gttccgcgtt acataactta cggtaaatgg cccgcctggc tgaccgccca 120 acgacccccg cccattgacg tcaataatga cgtatgttcc catagtaacg ccaataggga 180 ctttccattg acgtcaatgg gtggagtatt tacggtaaac tgcccacttg gcagtacatc 240 aagtgtatca tatgccaagt ccgcccccta ttgacgtcaa tgacggtaaa tggcccgcct 300 ggcattatgc ccagtacatg accttacggg actttcctac ttggcagtac atctacgtat 360 tagtcatcgc tattaccatg gtcgaggtga gccccacgtt ctgcttcact ctccccatct 420 cccccccctc cccaccccca attttgtatt tatttatttt ttaattattt tgtgcagcga 480 tgggggcggg gggggggggg gggcgcgcgc caggcggggc ggggcggggc gaggggcggg 540 gcggggcgag gcggagaggt gcggcggcag ccaatcagag cggcgcgctc cgaaagtttc 600 cttttatggc gaggcggcgg cggcggcggc cctataaaaa gcgaagcgcg cggcgggcgg 660 gagtcgctgc gcgctgcctt cgccccgtgc cccgctccgc cgccgcctcg cgccgcccgc 720 cccggctctg actgaccgcg ttactcccac aggtgagcgg gcgggacggc ccttctcctc 780 cgggctgtaa ttagcgcttg gtttaatgac ggcttgtttc ttttctgtgg ctgcgtgaaa 840 gccttgaggg gctccgggag ggccctttgt gcggggggag cggctcgggg ggtgcgtgcg 900 tgtgtgtgtg cgtggggagc gccgcgtgcg gctccgcgct gcccggcggc tgtgagcgct 960 gcgggcgcgg cgcggggctt tgtgcgctcc gcagtgtgcg cgaggggagc gcggccgggg 1020 gcggtgcccc gcggtgcggg gggggctgcg aggggaacaa aggctgcgtg cggggtgtgt 1080 gcgtgggggg gtgagcaggg ggtgtgggcg cgtcggtcgg gctgcaaccc cccctgcacc 1140 cccctccccg agttgctgag cacggcccgg cttcgggtgc ggggctccgt acggggcgtg 1200 gcgcggggct cgccgtgccg ggcggggggt ggcggcaggt gggggtgccg ggcggggcgg 1260 ggccgcctcg ggccggggag ggctcggggg aggggcgcgg cggcccccgg agcgccggcg 1320 gctgtcgagg cgcggcgagc cgcagccatt gccttttatg gtaatcgtgc gagagggcgc 1380 agggacttcc tttgtcccaa atctgtgcgg agccgaaatc tgggaggcgc cgccgcaccc 1440 cctctagcgg gcgcggggcg aagcggtgcg gcgccggcag gaaggaaatg ggcggggagg 1500 gccttcgtgc gtcgccgcgc cgccgtcccc ttctccctct ccagcctcgg ggctgtccgc 1560 ggggggacgg ctgccttcgg gggggacggg gcagggcggg gttcggcttc tggcgtgtga 1620 ccggcggctc tagagcctct gctaaccatg ttcatgcctt cttctttttc ctacagctcc 1680 tgggcaacgt gctggttatt gtgctgtctc atcattttgg caaagaattc cgccaccatg 1740 tctatggggg ctcctcgctc cctgctgctg gcactggccg ccgggctggc tgtcgcaaga 1800 ccacctaata tcgtcctgat ttttgcagac gatctgggat acggcgacct gggatgctat 1860 ggccacccaa gctccaccac acccaacctg gaccagctgg cagcaggagg cctgcggttc 1920 accgacttct acgtgccagt gagcctgtgc accccctcca gagccgccct gctgacaggc 1980 aggctgccag tgcgcatggg catgtatcct ggcgtgctgg tgccatctag caggggcggc 2040 ctgccactgg aggaggtgac cgtggcagag gtgctggcag ccagaggcta cctgacagga 2100 atggccggca agtggcacct gggagtggga ccagagggag ccttcctgcc ccctcaccag 2160 ggcttccacc ggtttctggg catcccttat tctcacgacc agggcccatg ccagaacctg 2220 acctgttttc caccagcaac accatgcgac ggaggatgtg atcagggcct ggtgccaatc 2280 ccactgctgg caaatctgag cgtggaggca cagcctccat ggctgcctgg cctggaggca 2340 agatacatgg ccttcgccca cgacctgatg gcagatgcac agcggcagga tagacctttc 2400 tttctgtact atgcctccca ccacacccac tatccacagt tcagcggcca gtcctttgcc 2460 gagaggtccg gaaggggacc attcggcgac tctctgatgg agctggatgc cgccgtgggc 2520 accctgatga cagcaatcgg cgacctgggc ctgctggagg agacactggt catcttcacc 2580 gccgataacg gccctgagac aatgcggatg tctagaggcg gatgcagcgg cctgctgaga 2640 tgtggcaagg gaaccacata cgagggaggc gtgcgcgagc ctgccctggc attttggcca 2700 ggacacatcg cacctggagt gacccacgag ctggcctcct ctctggacct gctgccaaca 2760 ctggccgccc tggcaggagc acctctgcca aatgtgaccc tggacggctt cgatctgagc 2820 ccactgctgc tgggaaccgg caagtcccct aggcagtctc tgttctttta cccctcctat 2880 cctgatgagg tgcggggcgt gtttgccgtg agaaccggca agtacaaggc ccacttcttt 2940 acacagggct ctgcccacag cgacaccaca gcagatccag catgccacgc cagctcctct 3000 ctgaccgcac acgagccacc tctgctgtac gacctgtcca aggatcccgg cgagaactat 3060 aatctgctgg gaggagtggc aggagcaacc cctgaggtgc tgcaggccct gaagcagctg 3120 cagctgctga aggcacagct ggacgcagca gtgacattcg gcccaagcca ggtggccaga 3180 ggcgaggatc ccgccctgca gatctgttgc caccccggct gcaccccaag acctgcctgt 3240 tgccattgcc ccgacccaca cgcctaagat tctagagtcg agccgcggac tagtaacttg 3300 tttattgcag cttataatgg ttacaaataa agcaatagca tcacaaattt cacaaataaa 3360 gcattttttt cactgcattc tagttgtggt ttgtccaaac tcatcaatgt atctta 3416 <210> 47 <211> 3949 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 47 ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 60 cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag agagggagtg 120 gccaactcca tcactagggg ttcctggagg ggtggagtcg tgacgtgaat tacgtcatag 180 ggttagggag gtcctgcaga tcttcaatat tggccattag ccatattatt cattggttat 240 atagcataaa tcaatattgg ctattggcca ttgcatacgt tgtatctata tcataatatg 300 tacatttata ttggctcatg tccaatatga ccgccatgtt ggcattgatt attgactagt 360 tattaatagt aatcaattac ggggtcatta gttcatagcc catatatgga gttccgcgtt 420 acataactta cggtaaatgg cccgcctggc tgaccgccca acgacccccg cccattgacg 480 tcaataatga cgtatgttcc catagtaacg ccaataggga ctttccattg acgtcaatgg 540 gtggagtatt tacggtaaac tgcccacttg gcagtacatc aagtgtatca tatgccaagt 600 ccgcccccta ttgacgtcaa tgacggtaaa tggcccgcct ggcattatgc ccagtacatg 660 accttacggg actttcctac ttggcagtac atctacgtat tagtcatcgc tattaccatg 720 gtcgaggtga gccccacgtt ctgcttcact ctccccatct cccccccctc cccaccccca 780 attttgtatt tatttatttt ttaattattt tgtgcagcga tgggggcggg gggggggggg 840 gggcgcgcgc caggcggggc ggggcggggc gaggggcggg gcggggcgag gcggagaggt 900 gcggcggcag ccaatcagag cggcgcgctc cgaaagtttc cttttatggc gaggcggcgg 960 cggcggcggc cctataaaaa gcgaagcgcg cggcgggcgg gagtcgctgc gcgctgcctt 1020 cgccccgtgc cccgctccgc cgccgcctcg cgccgcccgc cccggctctg actgaccgcg 1080 ttactcccac aggtgagcgg gcgggacggc ccttctcctc cgggctgtaa ttagcgcttg 1140 gtttaatgac ggcttgtttc ttttctgtgg ctgcgtgaaa gccttgaggg gctccgggag 1200 ggccctttgt gcggggggag cggctcgggg ggtgcgtgcg tgtgtgtgtg cgtggggagc 1260 gccgcgtgcg gctccgcgct gcccggcggc tgtgagcgct gcgggcgcgg cgcggggctt 1320 tgtgcgctcc gcagtgtgcg cgaggggagc gcggccgggg gcggtgcccc gcggtgcggg 1380 gggggctgcg aggggaacaa aggctgcgtg cggggtgtgt gcgtgggggg gtgagcaggg 1440 ggtgtgggcg cgtcggtcgg gctgcaaccc cccctgcacc cccctccccg agttgctgag 1500 cacggcccgg cttcgggtgc ggggctccgt acggggcgtg gcgcggggct cgccgtgccg 1560 ggcggggggt ggcggcaggt gggggtgccg ggcggggcgg ggccgcctcg ggccggggag 1620 ggctcggggg aggggcgcgg cggcccccgg agcgccggcg gctgtcgagg cgcggcgagc 1680 cgcagccatt gccttttatg gtaatcgtgc gagagggcgc agggacttcc tttgtcccaa 1740 atctgtgcgg agccgaaatc tgggaggcgc cgccgcaccc cctctagcgg gcgcggggcg 1800 aagcggtgcg gcgccggcag gaaggaaatg ggcggggagg gccttcgtgc gtcgccgcgc 1860 cgccgtcccc ttctccctct ccagcctcgg ggctgtccgc ggggggacgg ctgccttcgg 1920 gggggacggg gcagggcggg gttcggcttc tggcgtgtga ccggcggctc tagagcctct 1980 gctaaccatg ttcatgcctt cttctttttc ctacagctcc tgggcaacgt gctggttatt 2040 gtgctgtctc atcattttgg caaagaattc cgccaccatg tccatggggg caccgcggtc 2100 cctcctcctg gccctggctg ctggcctggc cgttgcccgt ccgcccaaca tcgtgctgat 2160 ctttgccgac gacctcggct atggggacct gggctgctat gggcacccca gctctaccac 2220 tcccaacctg gaccagctgg cggcgggagg gctgcggttc acagacttct acgtgcctgt 2280 gtctctgtgc acaccctcta gggccgccct cctgaccggc cggctcccgg ttcggatggg 2340 catgtaccct ggcgtcctgg tgcccagctc ccgggggggc ctgcccctgg aggaggtgac 2400 cgtggccgaa gtcctggctg cccgaggcta cctcacagga atggccggca agtggcacct 2460 tggggtgggg cctgaggggg ccttcctgcc cccccatcag ggcttccatc gatttctagg 2520 catcccgtac tcccacgacc agggcccctg ccagaacctg acctgcttcc cgccggccac 2580 tccttgcgac ggtggctgtg accagggcct ggtccccatc ccactgttgg ccaacctgtc 2640 cgtggaggcg cagcccccct ggctgcccgg actagaggcc cgctacatgg ctttcgccca 2700 tgacctcatg gccgacgccc agcgccagga tcgccccttc ttcctgtact atgcctctca 2760 ccacacccac taccctcagt tcagtgggca gagctttgca gagcgttcag gccgcgggcc 2820 atttggggac tccctgatgg agctggatgc agctgtgggg accctgatga cagccatagg 2880 ggacctgggg ctgcttgaag agacgctggt catcttcact gcagacaatg gacctgagac 2940 catgcgtatg tcccgaggcg gctgctccgg tctcttgcgg tgtggaaagg gaacgaccta 3000 cgagggcggt gtccgagagc ctgccttggc cttctggcca ggtcatatcg ctcccggcgt 3060 gacccacgag ctggccagct ccctggacct gctgcctacc ctggcagccc tggctggggc 3120 cccactgccc aatgtcacct tggatggctt tgacctcagc cccctgctgc tgggcacagg 3180 caagagccct cggcagtctc tcttcttcta cccgtcctac ccagacgagg tccgtggggt 3240 ttttgctgtg cggactggaa agtacaaggc tcacttcttc acccagggct ctgcccacag 3300 tgataccact gcagaccctg cctgccacgc ctccagctct ctgactgctc atgagccccc 3360 gctgctctat gacctgtcca aggaccctgg tgagaactac aacctgctgg ggggtgtggc 3420 cggggccacc ccagaggtgc tgcaagccct gaaacagctt cagctgctca aggcccagtt 3480 agacgcagct gtgaccttcg gccccagcca ggtggcccgg ggcgaggacc ccgccctgca 3540 gatctgctgt catcctggct gcaccccccg cccagcttgc tgccattgcc cagatcccca 3600 tgcctgagat tctagagtcg agccgcggac tagtaacttg tttattgcag cttataatgg 3660 ttacaaataa agcaatagca tcacaaattt cacaaataaa gcattttttt cactgcattc 3720 tagttgtggt ttgtccaaac tcatcaatgt atcttaggtc tagatacgta gataagtagc 3780 atggcgggtt aatcattaac tacaaggaac ccctagtgat ggagttggcc actccctctc 3840 tgcgcgctcg ctcgctcact gaggccgggc gaccaaaggt cgcccgacgc ccgggctttg 3900 cccgggcggc ctcagtgagc gagcgagcgc gcagagaggg agtggccaa 3949 <210> 48 <211> 3949 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 48 ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 60 cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag agagggagtg 120 gccaactcca tcactagggg ttcctggagg ggtggagtcg tgacgtgaat tacgtcatag 180 ggttagggag gtcctgcaga tcttcaatat tggccattag ccatattatt cattggttat 240 atagcataaa tcaatattgg ctattggcca ttgcatacgt tgtatctata tcataatatg 300 tacatttata ttggctcatg tccaatatga ccgccatgtt ggcattgatt attgactagt 360 tattaatagt aatcaattac ggggtcatta gttcatagcc catatatgga gttccgcgtt 420 acataactta cggtaaatgg cccgcctggc tgaccgccca acgacccccg cccattgacg 480 tcaataatga cgtatgttcc catagtaacg ccaataggga ctttccattg acgtcaatgg 540 gtggagtatt tacggtaaac tgcccacttg gcagtacatc aagtgtatca tatgccaagt 600 ccgcccccta ttgacgtcaa tgacggtaaa tggcccgcct ggcattatgc ccagtacatg 660 accttacggg actttcctac ttggcagtac atctacgtat tagtcatcgc tattaccatg 720 gtcgaggtga gccccacgtt ctgcttcact ctccccatct cccccccctc cccaccccca 780 attttgtatt tatttatttt ttaattattt tgtgcagcga tgggggcggg gggggggggg 840 gggcgcgcgc caggcggggc ggggcggggc gaggggcggg gcggggcgag gcggagaggt 900 gcggcggcag ccaatcagag cggcgcgctc cgaaagtttc cttttatggc gaggcggcgg 960 cggcggcggc cctataaaaa gcgaagcgcg cggcgggcgg gagtcgctgc gcgctgcctt 1020 cgccccgtgc cccgctccgc cgccgcctcg cgccgcccgc cccggctctg actgaccgcg 1080 ttactcccac aggtgagcgg gcgggacggc ccttctcctc cgggctgtaa ttagcgcttg 1140 gtttaatgac ggcttgtttc ttttctgtgg ctgcgtgaaa gccttgaggg gctccgggag 1200 ggccctttgt gcggggggag cggctcgggg ggtgcgtgcg tgtgtgtgtg cgtggggagc 1260 gccgcgtgcg gctccgcgct gcccggcggc tgtgagcgct gcgggcgcgg cgcggggctt 1320 tgtgcgctcc gcagtgtgcg cgaggggagc gcggccgggg gcggtgcccc gcggtgcggg 1380 gggggctgcg aggggaacaa aggctgcgtg cggggtgtgt gcgtgggggg gtgagcaggg 1440 ggtgtgggcg cgtcggtcgg gctgcaaccc cccctgcacc cccctccccg agttgctgag 1500 cacggcccgg cttcgggtgc ggggctccgt acggggcgtg gcgcggggct cgccgtgccg 1560 ggcggggggt ggcggcaggt gggggtgccg ggcggggcgg ggccgcctcg ggccggggag 1620 ggctcggggg aggggcgcgg cggcccccgg agcgccggcg gctgtcgagg cgcggcgagc 1680 cgcagccatt gccttttatg gtaatcgtgc gagagggcgc agggacttcc tttgtcccaa 1740 atctgtgcgg agccgaaatc tgggaggcgc cgccgcaccc cctctagcgg gcgcggggcg 1800 aagcggtgcg gcgccggcag gaaggaaatg ggcggggagg gccttcgtgc gtcgccgcgc 1860 cgccgtcccc ttctccctct ccagcctcgg ggctgtccgc ggggggacgg ctgccttcgg 1920 gggggacggg gcagggcggg gttcggcttc tggcgtgtga ccggcggctc tagagcctct 1980 gctaaccatg ttcatgcctt cttctttttc ctacagctcc tgggcaacgt gctggttatt 2040 gtgctgtctc atcattttgg caaagaattc cgccaccatg tctatggggg ctcctcgctc 2100 cctgctgctg gcactggccg ccgggctggc tgtcgcaaga ccacctaata tcgtcctgat 2160 ttttgcagac gatctgggat acggcgacct gggatgctat ggccacccaa gctccaccac 2220 acccaacctg gaccagctgg cagcaggagg cctgcggttc accgacttct acgtgccagt 2280 gagcctgtgc accccctcca gagccgccct gctgacaggc aggctgccag tgcgcatggg 2340 catgtatcct ggcgtgctgg tgccatctag caggggcggc ctgccactgg aggaggtgac 2400 cgtggcagag gtgctggcag ccagaggcta cctgacagga atggccggca agtggcacct 2460 gggagtggga ccagagggag ccttcctgcc ccctcaccag ggcttccacc ggtttctggg 2520 catcccttat tctcacgacc agggcccatg ccagaacctg acctgttttc caccagcaac 2580 accatgcgac ggaggatgtg atcagggcct ggtgccaatc ccactgctgg caaatctgag 2640 cgtggaggca cagcctccat ggctgcctgg cctggaggca agatacatgg ccttcgccca 2700 cgacctgatg gcagatgcac agcggcagga tagacctttc tttctgtact atgcctccca 2760 ccacacccac tatccacagt tcagcggcca gtcctttgcc gagaggtccg gaaggggacc 2820 attcggcgac tctctgatgg agctggatgc cgccgtgggc accctgatga cagcaatcgg 2880 cgacctgggc ctgctggagg agacactggt catcttcacc gccgataacg gccctgagac 2940 aatgcggatg tctagaggcg gatgcagcgg cctgctgaga tgtggcaagg gaaccacata 3000 cgagggaggc gtgcgcgagc ctgccctggc attttggcca ggacacatcg cacctggagt 3060 gacccacgag ctggcctcct ctctggacct gctgccaaca ctggccgccc tggcaggagc 3120 acctctgcca aatgtgaccc tggacggctt cgatctgagc ccactgctgc tgggaaccgg 3180 caagtcccct aggcagtctc tgttctttta cccctcctat cctgatgagg tgcggggcgt 3240 gtttgccgtg agaaccggca agtacaaggc ccacttcttt acacagggct ctgcccacag 3300 cgacaccaca gcagatccag catgccacgc cagctcctct ctgaccgcac acgagccacc 3360 tctgctgtac gacctgtcca aggatcccgg cgagaactat aatctgctgg gaggagtggc 3420 aggagcaacc cctgaggtgc tgcaggccct gaagcagctg cagctgctga aggcacagct 3480 ggacgcagca gtgacattcg gcccaagcca ggtggccaga ggcgaggatc ccgccctgca 3540 gatctgttgc caccccggct gcaccccaag acctgcctgt tgccattgcc ccgacccaca 3600 cgcctaagat tctagagtcg agccgcggac tagtaacttg tttattgcag cttataatgg 3660 ttacaaataa agcaatagca tcacaaattt cacaaataaa gcattttttt cactgcattc 3720 tagttgtggt ttgtccaaac tcatcaatgt atcttaggtc tagatacgta gataagtagc 3780 atggcgggtt aatcattaac tacaaggaac ccctagtgat ggagttggcc actccctctc 3840 tgcgcgctcg ctcgctcact gaggccgggc gaccaaaggt cgcccgacgc ccgggctttg 3900 cccgggcggc ctcagtgagc gagcgagcgc gcagagaggg agtggccaa 3949 <210> 49 <211> 4500 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 49 ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 60 cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag agagggagtg 120 gccaactcca tcactagggg ttcctggagg ggtggagtcg tgacgtgaat tacgtcatag 180 ggttagggag gtcctgcata tgcggccgcg atcttcaata ttggccatta gccatattat 240 tcattggtta tatagcataa atcaatattg gctattggcc attgcatacg ttgtatctat 300 atcataatat gtacatttat attggctcat gtccaatatg accgccatgt tggcattgat 360 tattgactag ttattaatag taatcaatta cggggtcatt agttcatagc ccatatatgg 420 agttccgcgt tacataactt acggtaaatg gcccgcctgg ctgaccgccc aacgaccccc 480 gcccattgac gtcaataatg acgtatgttc ccatagtaac gccaataggg actttccatt 540 gacgtcaatg ggtggagtat ttacggtaaa ctgcccactt ggcagtacat caagtgtatc 600 atatgccaag tccgccccct attgacgtca atgacggtaa atggcccgcc tggcattatg 660 cccagtacat gaccttacgg gactttccta cttggcagta catctacgta ttagtcatcg 720 ctattaccat ggtcgaggtg agccccacgt tctgcttcac tctccccatc tcccccccct 780 ccccaccccc aattttgtat ttatttattt tttaattatt ttgtgcagcg atgggggcgg 840 gggggggggg ggggcgcgcg ccaggcgggg cggggcgggg cgaggggcgg ggcggggcga 900 ggcggagagg tgcggcggca gccaatcaga gcggcgcgct ccgaaagttt ccttttatgg 960 cgaggcggcg gcggcggcgg ccctataaaa agcgaagcgc gcggcgggcg ggagtcgctg 1020 cgcgctgcct tcgccccgtg ccccgctccg ccgccgcctc gcgccgcccg ccccggctct 1080 gactgaccgc gttactccca caggtgagcg ggcgggacgg cccttctcct ccgggctgta 1140 attagcgctt ggtttaatga cggcttgttt cttttctgtg gctgcgtgaa agccttgagg 1200 ggctccggga gggccctttg tgcgggggga gcggctcggg gggtgcgtgc gtgtgtgtgt 1260 gcgtggggag cgccgcgtgc ggctccgcgc tgcccggcgg ctgtgagcgc tgcgggcgcg 1320 gcgcggggct ttgtgcgctc cgcagtgtgc gcgaggggag cgcggccggg ggcggtgccc 1380 cgcggtgcgg ggggggctgc gaggggaaca aaggctgcgt gcggggtgtg tgcgtggggg 1440 ggtgagcagg gggtgtgggc gcgtcggtcg ggctgcaacc ccccctgcac ccccctcccc 1500 gagttgctga gcacggcccg gcttcgggtg cggggctccg tacggggcgt ggcgcggggc 1560 tcgccgtgcc gggcgggggg tggcggcagg tgggggtgcc gggcggggcg gggccgcctc 1620 gggccgggga gggctcgggg gaggggcgcg gcggcccccg gagcgccggc ggctgtcgag 1680 gcgcggcgag ccgcagccat tgccttttat ggtaatcgtg cgagagggcg cagggacttc 1740 ctttgtccca aatctgtgcg gagccgaaat ctgggaggcg ccgccgcacc ccctctagcg 1800 ggcgcggggc gaagcggtgc ggcgccggca ggaaggaaat gggcggggag ggccttcgtg 1860 cgtcgccgcg ccgccgtccc cttctccctc tccagcctcg gggctgtccg cggggggacg 1920 gctgccttcg ggggggacgg ggcagggcgg ggttcggctt ctggcgtgtg accggcggct 1980 ctagagcctc tgctaaccat gttcatgcct tcttcttttt cctacagctc ctgggcaacg 2040 tgctggttat tgtgctgtct catcattttg gcaaagaatt ccgccaccat gtctatgggg 2100 gctcctcgct ccctgctgct ggcactggcc gccgggctgg ctgtcgcaag accacctaat 2160 atcgtcctga tttttgcaga cgatctggga tacggcgacc tgggatgcta tggccaccca 2220 agctccacca cacccaacct ggaccagctg gcagcaggag gcctgcggtt caccgacttc 2280 tacgtgccag tgagcctgtg caccccctcc agagccgccc tgctgacagg caggctgcca 2340 gtgcgcatgg gcatgtatcc tggcgtgctg gtgccatcta gcaggggcgg cctgccactg 2400 gaggaggtga ccgtggcaga ggtgctggca gccagaggct acctgacagg aatggccggc 2460 aagtggcacc tgggagtggg accagaggga gccttcctgc cccctcacca gggcttccac 2520 cggtttctgg gcatccctta ttctcacgac cagggcccat gccagaacct gacctgtttt 2580 ccaccagcaa caccatgcga cggaggatgt gatcagggcc tggtgccaat cccactgctg 2640 gcaaatctga gcgtggaggc acagcctcca tggctgcctg gcctggaggc aagatacatg 2700 gccttcgccc acgacctgat ggcagatgca cagcggcagg atagaccttt ctttctgtac 2760 tatgcctccc accacaccca ctatccacag ttcagcggcc agtcctttgc cgagaggtcc 2820 ggaaggggac cattcggcga ctctctgatg gagctggatg ccgccgtggg caccctgatg 2880 acagcaatcg gcgacctggg cctgctggag gagacactgg tcatcttcac cgccgataac 2940 ggccctgaga caatgcggat gtctagaggc ggatgcagcg gcctgctgag atgtggcaag 3000 ggaaccacat acgagggagg cgtgcgcgag cctgccctgg cattttggcc aggacacatc 3060 gcacctggag tgacccacga gctggcctcc tctctggacc tgctgccaac actggccgcc 3120 ctggcaggag cacctctgcc aaatgtgacc ctggacggct tcgatctgag cccactgctg 3180 ctgggaaccg gcaagtcccc taggcagtct ctgttctttt acccctccta tcctgatgag 3240 gtgcggggcg tgtttgccgt gagaaccggc aagtacaagg cccacttctt tacacagggc 3300 tctgcccaca gcgacaccac agcagatcca gcatgccacg ccagctcctc tctgaccgca 3360 cacgagccac ctctgctgta cgacctgtcc aaggatcccg gcgagaacta taatctgctg 3420 ggaggagtgg caggagcaac ccctgaggtg ctgcaggccc tgaagcagct gcagctgctg 3480 aaggcacagc tggacgcagc agtgacattc ggcccaagcc aggtggccag aggcgaggat 3540 cccgccctgc agatctgttg ccaccccggc tgcaccccaa gacctgcctg ttgccattgc 3600 cccgacccac acgcctaaga ttctagagtc gagccgcgga ctagtaactt gtttattgca 3660 gcttataatg gttacaaata aagcaatagc atcacaaatt tcacaaataa agcatttttt 3720 tcactgcatt ctagttgtgg tttgtccaaa ctcatcaatg tatcttacct gcaggctcac 3780 cagtgtttgt gactgggaac tctccctgcc aaatattggc ataatgctgt cctttaggtt 3840 gcagcttatt gccccagggg aacagtctgt tgtgcagtcc accccggcag gaatactccc 3900 attctgcctc tgttggtaac cttttcccag cccaggtgca gtatgccact gcatcattcc 3960 aggacacatg cagcacaggg tggtcaggcc tgtggaggat agttgagtct ggtccctctg 4020 ggtgtctcca attggctcct ttaacaggca gccaccaggg ggctgcagcc actgcctgtt 4080 ggatattggt cttcacctgc tcacttagca tgccttcaaa aacaaaactg tcaccaaatt 4140 tctcagcctc tgtaaggtat ccagtgctgt ttacaaattt ctcaaattct gtgtttgaca 4200 cttcataggc atccatatag aaggcatcaa ttgtgactct cctagctggt gcttcaccat 4260 cctgcttgat ctgagggtca tcagttccca tagtaaaaac tcctgcaggt ctagatacgt 4320 agataagtag catggcgggt taatcattaa ctacaaggaa cccctagtga tggagttggc 4380 cactccctct ctgcgcgctc gctcgctcac tgaggccggg cgaccaaagg tcgcccgacg 4440 cccgggcttt gcccgggcgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa 4500 4500 <210> 50 <211> 6612 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 50 cgccagggtt ttcccagtca cgacgttgta aaacgacggc cagtgccaag cttgcatgcc 60 tgcatttggc cactccctct ctgcgcgctc gctcgctcac tgaggccggg cgaccaaagg 120 tcgcccgacg cccgggcttt gcccgggcgg cctcagtgag cgagcgagcg cgcagagagg 180 gagtggccaa ctccatcact aggggttcct ggaggggtgg agtcgtgacg tgaattacgt 240 catagggtta gggaggtcct gcagatcttc aatattggcc attagccata ttattcattg 300 gttatatagc ataaatcaat attggctatt ggccattgca tacgttgtat ctatatcata 360 atatgtacat ttatattggc tcatgtccaa tatgaccgcc atgttggcat tgattattga 420 ctagttatta atagtaatca attacggggt cattagttca tagcccatat atggagttcc 480 gcgttacata acttacggta aatggcccgc ctggctgacc gcccaacgac ccccgcccat 540 tgacgtcaat aatgacgtat gttcccatag taacgccaat agggactttc cattgacgtc 600 aatgggtgga gtatttacgg taaactgccc acttggcagt acatcaagtg tatcatatgc 660 caagtccgcc ccctattgac gtcaatgacg gtaaatggcc cgcctggcat tatgcccagt 720 acatgacctt acgggacttt cctacttggc agtacatcta cgtattagtc atcgctatta 780 ccatggtcga ggtgagcccc acgttctgct tcactctccc catctccccc ccctccccac 840 ccccaatttt gtatttattt attttttaat tattttgtgc agcgatgggg gcgggggggg 900 ggggggggcg cgcgccaggc ggggcggggc ggggcgaggg gcggggcggg gcgaggcgga 960 gaggtgcggc ggcagccaat cagagcggcg cgctccgaaa gtttcctttt atggcgaggc 1020 ggcggcggcg gcggccctat aaaaagcgaa gcgcgcggcg ggcgggagtc gctgcgcgct 1080 gccttcgccc cgtgccccgc tccgccgccg cctcgcgccg cccgccccgg ctctgactga 1140 ccgcgttact cccacaggtg agcgggcggg acggcccttc tcctccgggc tgtaattagc 1200 gcttggttta atgacggctt gtttcttttc tgtggctgcg tgaaagcctt gaggggctcc 1260 gggagggccc tttgtgcggg gggagcggct cggggggtgc gtgcgtgtgt gtgtgcgtgg 1320 ggagcgccgc gtgcggctcc gcgctgcccg gcggctgtga gcgctgcggg cgcggcgcgg 1380 ggctttgtgc gctccgcagt gtgcgcgagg ggagcgcggc cgggggcggt gccccgcggt 1440 gcgggggggg ctgcgagggg aacaaaggct gcgtgcgggg tgtgtgcgtg ggggggtgag 1500 cagggggtgt gggcgcgtcg gtcgggctgc aaccccccct gcacccccct ccccgagttg 1560 ctgagcacgg cccggcttcg ggtgcggggc tccgtacggg gcgtggcgcg gggctcgccg 1620 tgccgggcgg ggggtggcgg caggtggggg tgccgggcgg ggcggggccg cctcgggccg 1680 gggagggctc gggggagggg cgcggcggcc cccggagcgc cggcggctgt cgaggcgcgg 1740 cgagccgcag ccattgcctt ttatggtaat cgtgcgagag ggcgcaggga cttcctttgt 1800 cccaaatctg tgcggagccg aaatctggga ggcgccgccg caccccctct agcgggcgcg 1860 gggcgaagcg gtgcggcgcc ggcaggaagg aaatgggcgg ggagggcctt cgtgcgtcgc 1920 cgcgccgccg tccccttctc cctctccagc ctcggggctg tccgcggggg gacggctgcc 1980 ttcggggggg acggggcagg gcggggttcg gcttctggcg tgtgaccggc ggctctagag 2040 cctctgctaa ccatgttcat gccttcttct ttttcctaca gctcctgggc aacgtgctgg 2100 ttattgtgct gtctcatcat tttggcaaag aattccgcca ccatgtccat gggggcaccg 2160 cggtccctcc tcctggccct ggctgctggc ctggccgttg cccgtccgcc caacatcgtg 2220 ctgatctttg ccgacgacct cggctatggg gacctgggct gctatgggca ccccagctct 2280 accactccca acctggacca gctggcggcg ggagggctgc ggttcacaga cttctacgtg 2340 cctgtgtctc tgtgcacacc ctctagggcc gccctcctga ccggccggct cccggttcgg 2400 atgggcatgt accctggcgt cctggtgccc agctcccggg ggggcctgcc cctggaggag 2460 gtgaccgtgg ccgaagtcct ggctgcccga ggctacctca caggaatggc cggcaagtgg 2520 caccttgggg tggggcctga gggggccttc ctgccccccc atcagggctt ccatcgattt 2580 ctaggcatcc cgtactccca cgaccagggc ccctgccaga acctgacctg cttcccgccg 2640 gccactcctt gcgacggtgg ctgtgaccag ggcctggtcc ccatcccact gttggccaac 2700 ctgtccgtgg aggcgcagcc cccctggctg cccggactag aggcccgcta catggctttc 2760 gcccatgacc tcatggccga cgcccagcgc caggatcgcc ccttcttcct gtactatgcc 2820 tctcaccaca cccactaccc tcagttcagt gggcagagct ttgcagagcg ttcaggccgc 2880 gggccatttg gggactccct gatggagctg gatgcagctg tggggaccct gatgacagcc 2940 ataggggacc tggggctgct tgaagagacg ctggtcatct tcactgcaga caatggacct 3000 gagaccatgc gtatgtcccg aggcggctgc tccggtctct tgcggtgtgg aaagggaacg 3060 acctacgagg gcggtgtccg agagcctgcc ttggccttct ggccaggtca tatcgctccc 3120 ggcgtgaccc acgagctggc cagctccctg gacctgctgc ctaccctggc agccctggct 3180 ggggccccac tgcccaatgt caccttggat ggctttgacc tcagccccct gctgctgggc 3240 acaggcaaga gccctcggca gtctctcttc ttctacccgt cctacccaga cgaggtccgt 3300 ggggtttttg ctgtgcggac tggaaagtac aaggctcact tcttcaccca gggctctgcc 3360 cacagtgata ccactgcaga ccctgcctgc cacgcctcca gctctctgac tgctcatgag 3420 cccccgctgc tctatgacct gtccaaggac cctggtgaga actacaacct gctggggggt 3480 gtggccgggg ccaccccaga ggtgctgcaa gccctgaaac agcttcagct gctcaaggcc 3540 cagttagacg cagctgtgac cttcggcccc agccaggtgg cccggggcga ggaccccgcc 3600 ctgcagatct gctgtcatcc tggctgcacc ccccgcccag cttgctgcca ttgcccagat 3660 ccccatgcct gagattctag agtcgagccg cggactagta acttgtttat tgcagcttat 3720 aatggttaca aataaagcaa tagcatcaca aatttcacaa ataaagcatt tttttcactg 3780 cattctagtt gtggtttgtc caaactcatc aatgtatctt aggtctagat acgtagataa 3840 gtagcatggc gggttaatca ttaactacaa ggaaccccta gtgatggagt tggccactcc 3900 ctctctgcgc gctcgctcgc tcactgaggc cgggcgacca aaggtcgccc gacgcccggg 3960 ctttgcccgg gcggcctcag tgagcgagcg agcgcgcaga gagggagtgg ccaaagatcc 4020 ccgggtaccg agctcgaatt cgtaatcatg tcatagctgt ttcctgtgtg aaattgttat 4080 ccgctcacaa ttccacacaa catacgagcc ggaagcataa agtgtaaagc ctggggtgcc 4140 taatgagtga gctaactcac attaattgcg ttgcgctcac tgcccgcttt ccagtcggga 4200 aacctgtcgt gccagctgca ttaatgaatc ggccaacgcg cggggagagg cggtttgcgt 4260 attggcgaac ttttgctgag ttgaaggatc agatcacgca tcttcccgac aacgcagacc 4320 gttccgtggc aaagcaaaag ttcaaaatca gtaaccgtca gtgccgataa gttcaaagtt 4380 aaacctggtg ttgataccaa cattgaaacg ctgatcgaaa acgcgctgaa aaacgctgct 4440 gaatgtgcga gcttcttccg cttcctcgct cactgactcg ctgcgctcgg tcgttcggct 4500 gcggcgagcg gtatcagctc actcaaaggc ggtaatacgg ttatccacag aatcagggga 4560 taacgcagga aagaacatgt gagcaaaagg ccagcaaaag gccaggaacc gtaaaaaggc 4620 cgcgttgctg gcgtttttcc ataggctccg cccccctgac gagcatcaca aaaatcgacg 4680 ctcaagtcag aggtggcgaa acccgacagg actataaaga taccaggcgt ttccccctgg 4740 aagctccctc gtgcgctctc ctgttccgac cctgccgctt accggatacc tgtccgcctt 4800 tctcccttcg ggaagcgtgg cgctttctca atgctcacgc tgtaggtatc tcagttcggt 4860 gtaggtcgtt cgctccaagc tgggctgtgt gcacgaaccc cccgttcagc ccgaccgctg 4920 cgccttatcc ggtaactatc gtcttgagtc caacccggta agacacgact tatcgccact 4980 ggcagcagcc actggtaaca ggattagcag agcgaggtat gtaggcggtg ctacagagtt 5040 cttgaagtgg tggcctaact acggctacac tagaaggaca gtatttggta tctgcgctct 5100 gctgaagcca gttaccttcg gaaaaagagt tggtagctct tgatccggca aacaaaccac 5160 cgctggtagc ggtggttttt ttgtttgcaa gcagcagatt acgcgcagaa aaaaaggatc 5220 tcaagaagat cctttgatct tttctacggg gtctgacgct cagtggaacg atccgtcgag 5280 aggtctgcct cgtgaagaag gtgttgctga ctcataccag gcctgaatcg ccccatcatc 5340 cagccagaaa gtgagggagc cacggttgat gagagctttg ttgtaggtgg accagttggt 5400 gattttgaac ttttgctttg ccacggaacg gtctgcgttg tcgggaagat gcgtgatctg 5460 atccttcaac tcagcaaaag ttcgatttat tcaacaaagc cacgttgtgt ctcaaaatct 5520 ctgatgttac attgcacaag ataaaaatat atcatcatga acaataaaac tgtctgctta 5580 cataaacagt aatacaaggg gtgttatgag ccatattcaa cgggaaacgt cttgctcgaa 5640 gccgcgatta aattccaaca tggatgctga tttatatggg tataaatggg ctcgcgataa 5700 tgtcgggcaa tcaggtgcga caatctatcg attgtatggg aagcccgatg cgccagagtt 5760 gtttctgaaa catggcaaag gtagcgttgc caatgatgtt acagatgaga tggtcagact 5820 aaactggctg acggaattta tgcctcttcc gaccatcaag cattttatcc gtactcctga 5880 tgatgcatgg ttactcacca ctgcgatccc cgggaaaaca gcattccagg tattagaaga 5940 atatcctgat tcaggtgaaa atattgttga tgcgctggca gtgttcctgc gccggttgca 6000 ttcgattcct gtttgtaatt gtccttttaa cagcgatcgc gtatttcgtc tcgctcaggc 6060 gcaatcacga atgaataacg gtttggttga tgcgagtgat tttgatgacg agcgtaatgg 6120 ctggcctgtt gaacaagtct ggaaagaaat gcataagctt ttgccattct caccggattc 6180 agtcgtcact catggtgatt tctcacttga taaccttatt tttgacgagg ggaaattaat 6240 aggttgtatt gatgttggac gagtcggaat cgcagaccga taccaggatc ttgccatcct 6300 atggaactgc ctcggtgagt tttctccttc attacagaaa cggctttttc aaaaatatgg 6360 tattgataat cctgatatga ataaattgca gtttcatttg atgctcgatg agtttttcta 6420 atcagaattg gttaattggt tgtaacactg gcagagcatt acgctgactt gacgggacgg 6480 cggctttgtt gaataaatcg cattcgccat tcaggctgcg caactgttgg gaagggcgat 6540 cggtgcgggc ctcttcgcta ttacgccagc tggcgaaagg gggatgtgct gcaaggcgat 6600 taagttgggt aa 6612 <210> 51 <211> 5792 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 51 gtcaggtggc acttttcggg gaaatgtggc atgcctgcat ttggccactc cctctctgcg 60 cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc cgacgcccgg gctttgcccg 120 ggcggcctca gtgagcgagc gagcgcgcag agagggagtg gccaactcca tcactagggg 180 ttcctggagg ggtggagtcg tgacgtgaat tacgtcatag ggttagggag gtcctgcaga 240 tcttcaatat tggccattag ccatattatt cattggttat atagcataaa tcaatattgg 300 ctattggcca ttgcatacgt tgtatctata tcataatatg tacatttata ttggctcatg 360 tccaatatga ccgccatgtt ggcattgatt attgactagt tattaatagt aatcaattac 420 ggggtcatta gttcatagcc catatatgga gttccgcgtt acataactta cggtaaatgg 480 cccgcctggc tgaccgccca acgacccccg cccattgacg tcaataatga cgtatgttcc 540 catagtaacg ccaataggga ctttccattg acgtcaatgg gtggagtatt tacggtaaac 600 tgcccacttg gcagtacatc aagtgtatca tatgccaagt ccgcccccta ttgacgtcaa 660 tgacggtaaa tggcccgcct ggcattatgc ccagtacatg accttacggg actttcctac 720 ttggcagtac atctacgtat tagtcatcgc tattaccatg gtcgaggtga gccccacgtt 780 ctgcttcact ctccccatct cccccccctc cccaccccca attttgtatt tatttatttt 840 ttaattattt tgtgcagcga tgggggcggg gggggggggg gggcgcgcgc caggcggggc 900 ggggcggggc gaggggcggg gcggggcgag gcggagaggt gcggcggcag ccaatcagag 960 cggcgcgctc cgaaagtttc cttttatggc gaggcggcgg cggcggcggc cctataaaaa 1020 gcgaagcgcg cggcgggcgg gagtcgctgc gcgctgcctt cgccccgtgc cccgctccgc 1080 cgccgcctcg cgccgcccgc cccggctctg actgaccgcg ttactcccac aggtgagcgg 1140 gcgggacggc ccttctcctc cgggctgtaa ttagcgcttg gtttaatgac ggcttgtttc 1200 ttttctgtgg ctgcgtgaaa gccttgaggg gctccgggag ggccctttgt gcggggggag 1260 cggctcgggg ggtgcgtgcg tgtgtgtgtg cgtggggagc gccgcgtgcg gctccgcgct 1320 gcccggcggc tgtgagcgct gcgggcgcgg cgcggggctt tgtgcgctcc gcagtgtgcg 1380 cgaggggagc gcggccgggg gcggtgcccc gcggtgcggg gggggctgcg aggggaacaa 1440 aggctgcgtg cggggtgtgt gcgtgggggg gtgagcaggg ggtgtgggcg cgtcggtcgg 1500 gctgcaaccc cccctgcacc cccctccccg agttgctgag cacggcccgg cttcgggtgc 1560 ggggctccgt acggggcgtg gcgcggggct cgccgtgccg ggcggggggt ggcggcaggt 1620 gggggtgccg ggcggggcgg ggccgcctcg ggccggggag ggctcggggg aggggcgcgg 1680 cggcccccgg agcgccggcg gctgtcgagg cgcggcgagc cgcagccatt gccttttatg 1740 gtaatcgtgc gagagggcgc agggacttcc tttgtcccaa atctgtgcgg agccgaaatc 1800 tgggaggcgc cgccgcaccc cctctagcgg gcgcggggcg aagcggtgcg gcgccggcag 1860 gaaggaaatg ggcggggagg gccttcgtgc gtcgccgcgc cgccgtcccc ttctccctct 1920 ccagcctcgg ggctgtccgc ggggggacgg ctgccttcgg gggggacggg gcagggcggg 1980 gttcggcttc tggcgtgtga ccggcggctc tagagcctct gctaaccatg ttcatgcctt 2040 cttctttttc ctacagctcc tgggcaacgt gctggttatt gtgctgtctc atcattttgg 2100 caaagaattc cgccaccatg tctatggggg ctcctcgctc cctgctgctg gcactggccg 2160 ccgggctggc tgtcgcaaga ccacctaata tcgtcctgat ttttgcagac gatctgggat 2220 acggcgacct gggatgctat ggccacccaa gctccaccac acccaacctg gaccagctgg 2280 cagcaggagg cctgcggttc accgacttct acgtgccagt gagcctgtgc accccctcca 2340 gagccgccct gctgacaggc aggctgccag tgcgcatggg catgtatcct ggcgtgctgg 2400 tgccatctag caggggcggc ctgccactgg aggaggtgac cgtggcagag gtgctggcag 2460 ccagaggcta cctgacagga atggccggca agtggcacct gggagtggga ccagagggag 2520 ccttcctgcc ccctcaccag ggcttccacc ggtttctggg catcccttat tctcacgacc 2580 agggcccatg ccagaacctg acctgttttc caccagcaac accatgcgac ggaggatgtg 2640 atcagggcct ggtgccaatc ccactgctgg caaatctgag cgtggaggca cagcctccat 2700 ggctgcctgg cctggaggca agatacatgg ccttcgccca cgacctgatg gcagatgcac 2760 agcggcagga tagacctttc tttctgtact atgcctccca ccacacccac tatccacagt 2820 tcagcggcca gtcctttgcc gagaggtccg gaaggggacc attcggcgac tctctgatgg 2880 agctggatgc cgccgtgggc accctgatga cagcaatcgg cgacctgggc ctgctggagg 2940 agacactggt catcttcacc gccgataacg gccctgagac aatgcggatg tctagaggcg 3000 gatgcagcgg cctgctgaga tgtggcaagg gaaccacata cgagggaggc gtgcgcgagc 3060 ctgccctggc attttggcca ggacacatcg cacctggagt gacccacgag ctggcctcct 3120 ctctggacct gctgccaaca ctggccgccc tggcaggagc acctctgcca aatgtgaccc 3180 tggacggctt cgatctgagc ccactgctgc tgggaaccgg caagtcccct aggcagtctc 3240 tgttctttta cccctcctat cctgatgagg tgcggggcgt gtttgccgtg agaaccggca 3300 agtacaaggc ccacttcttt acacagggct ctgcccacag cgacaccaca gcagatccag 3360 catgccacgc cagctcctct ctgaccgcac acgagccacc tctgctgtac gacctgtcca 3420 aggatcccgg cgagaactat aatctgctgg gaggagtggc aggagcaacc cctgaggtgc 3480 tgcaggccct gaagcagctg cagctgctga aggcacagct ggacgcagca gtgacattcg 3540 gcccaagcca ggtggccaga ggcgaggatc ccgccctgca gatctgttgc caccccggct 3600 gcaccccaag acctgcctgt tgccattgcc ccgacccaca cgcctaagat tctagagtcg 3660 agccgcggac tagtaacttg tttattgcag cttataatgg ttacaaataa agcaatagca 3720 tcacaaattt cacaaataaa gcattttttt cactgcattc tagttgtggt ttgtccaaac 3780 tcatcaatgt atcttaggtc tagatacgta gataagtagc atggcgggtt aatcattaac 3840 tacaaggaac ccctagtgat ggagttggcc actccctctc tgcgcgctcg ctcgctcact 3900 gaggccgggc gaccaaaggt cgcccgacgc ccgggctttg cccgggcggc ctcagtgagc 3960 gagcgagcgc gcagagaggg agtggccaaa gatccccggg taccgaggac gaattctcta 4020 gatatcgctc aatactgacc atttaaatca tacctgacct ccatagcaga aagtcaaaag 4080 cctccgaccg gaggcttttg acttgatcgg cacgtaagag gttccaactt tcaccataat 4140 gaaataagat cactaccggg cgtatttttt gagttatcga gattttcagg agctaaggaa 4200 gctaaaatga gccatattca acgggaaacg tcttgctcga ggccgcgatt aaattccaac 4260 atggatgctg atttatatgg gtataaatgg gctcgcgata atgtcgggca atcaggtgcg 4320 acaatctatc gattgtatgg gaagcccgat gcgccagagt tgtttctgaa acatggcaaa 4380 ggtagcgttg ccaatgatgt tacagatgag atggtcaggc taaactggct gacggaattt 4440 atgcctcttc cgaccatcaa gcattttatc cgtactcctg atgatgcatg gttactcacc 4500 actgcgatcc cagggaaaac agcattccag gtattagaag aatatcctga ttcaggtgaa 4560 aatattgttg atgcgctggc agtgttcctg cgccggttgc attcgattcc tgtttgtaat 4620 tgtcctttta acggcgatcg cgtatttcgt ctcgctcagg cgcaatcacg aatgaataac 4680 ggtttggttg gtgcgagtga ttttgatgac gagcgtaatg gctggcctgt tgaacaagtc 4740 tggaaagaaa tgcataagct tttgccattc tcaccggatt cagtcgtcac tcatggtgat 4800 ttctcacttg ataaccttat ttttgacgag gggaaattaa taggttgtat tgatgttgga 4860 cgagtcggaa tcgcagaccg ataccaggat cttgccatcc tatggaactg cctcggtgag 4920 ttttctcctt cattacagaa acggcttttt caaaaatatg gtattgataa tcctgatatg 4980 aataaattgc agtttcactt gatgctcgat gagtttttct gagggcccaa atgtaatcac 5040 ctggctcacc ttcgggtggg cctttctgcg ttgctggcgt ttttccatag gctccgcccc 5100 cctgacgagc atcacaaaaa tcgatgctca agtcagaggt ggcgaaaccc gacaggacta 5160 taaagatacc aggcgtttcc ccctggaagc tccctcgtgc gctctcctgt tccgaccctg 5220 ccgcttaccg gatacctgtc cgcctttctc ccttcgggaa gcgtggcgct ttctcatagc 5280 tcacgctgta ggtatctcag ttcggtgtag gtcgttcgct ccaagctggg ctgtgtgcac 5340 gaaccccccg ttcagcccga ccgctgcgcc ttatccggta actatcgtct tgagtccaac 5400 ccggtaagac acgacttatc gccactggca gcagccactg gtaacaggat tagcagagcg 5460 aggtatgtag gcggtgctac agagttcttg aagtggtggc ctaactacgg ctacactaga 5520 agaacagtat ttggtatctg cgctctgctg aagccagtta cctcggaaaa agagttggta 5580 gctcttgatc cggcaaacaa accaccgctg gtagcggtgg tttttttgtt tgcaagcagc 5640 agattacgcg cagaaaaaaa ggatctcaag aagatccttt gattttctac cgaagaaagg 5700 cccacccgtg aaggtgagcc agtgagttga ttgcagtcca gttacgctgg agtctgaggc 5760 tcgtcctgaa tgatatcaag cttgaattcg tt 5792 <210> 52 <211> 6342 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 52 tttccatagg ctccgccccc ctgacgagca tcacaaaaat cgatgctcaa gtcagaggtg 60 gcgaaacccg acaggactat aaagatacca ggcgtttccc cctggaagct ccctcgtgcg 120 ctctcctgtt ccgaccctgc cgcttaccgg atacctgtcc gcctttctcc cttcgggaag 180 cgtggcgctt tctcatagct cacgctgtag gtatctcagt tcggtgtagg tcgttcgctc 240 caagctgggc tgtgtgcacg aaccccccgt tcagcccgac cgctgcgcct tatccggtaa 300 ctatcgtctt gagtccaacc cggtaagaca cgacttatcg ccactggcag cagccactgg 360 taacaggatt agcagagcga ggtatgtagg cggtgctaca gagttcttga agtggtggcc 420 taactacggc tacactagaa gaacagtatt tggtatctgc gctctgctga agccagttac 480 ctcggaaaaa gagttggtag ctcttgatcc ggcaaacaaa ccaccgctgg tagcggtggt 540 ttttttgttt gcaagcagca gattacgcgc agaaaaaaag gatctcaaga agatcctttg 600 attttctacc gaagaaaggc ccacccgtga aggtgagcca gtgagttgat tgcagtccag 660 ttacgctgga gtctgaggct cgtcctgaat gatatcaagc ttgaattcgt gtcaggtggc 720 acttttcggg gaaatgtggc atgcctgcat ttggccactc cctctctgcg cgctcgctcg 780 ctcactgagg ccgggcgacc aaaggtcgcc cgacgcccgg gctttgcccg ggcggcctca 840 gtgagcgagc gagcgcgcag agagggagtg gccaactcca tcactagggg ttcctggagg 900 ggtggagtcg tgacgtgaat tacgtcatag ggttagggag gtcctgcata tgcggccgcg 960 atcttcaata ttggccatta gccatattat tcattggtta tatagcataa atcaatattg 1020 gctattggcc attgcatacg ttgtatctat atcataatat gtacatttat attggctcat 1080 gtccaatatg accgccatgt tggcattgat tattgactag ttattaatag taatcaatta 1140 cggggtcatt agttcatagc ccatatatgg agttccgcgt tacataactt acggtaaatg 1200 gcccgcctgg ctgaccgccc aacgaccccc gcccattgac gtcaataatg acgtatgttc 1260 ccatagtaac gccaataggg actttccatt gacgtcaatg ggtggagtat ttacggtaaa 1320 ctgcccactt ggcagtacat caagtgtatc atatgccaag tccgccccct attgacgtca 1380 atgacggtaa atggcccgcc tggcattatg cccagtacat gaccttacgg gactttccta 1440 cttggcagta catctacgta ttagtcatcg ctattaccat ggtcgaggtg agccccacgt 1500 tctgcttcac tctccccatc tcccccccct ccccaccccc aattttgtat ttatttattt 1560 tttaattatt ttgtgcagcg atgggggcgg gggggggggg ggggcgcgcg ccaggcgggg 1620 cggggcgggg cgaggggcgg ggcggggcga ggcggagagg tgcggcggca gccaatcaga 1680 gcggcgcgct ccgaaagttt ccttttatgg cgaggcggcg gcggcggcgg ccctataaaa 1740 agcgaagcgc gcggcgggcg ggagtcgctg cgcgctgcct tcgccccgtg ccccgctccg 1800 ccgccgcctc gcgccgcccg ccccggctct gactgaccgc gttactccca caggtgagcg 1860 ggcgggacgg cccttctcct ccgggctgta attagcgctt ggtttaatga cggcttgttt 1920 cttttctgtg gctgcgtgaa agccttgagg ggctccggga gggccctttg tgcgggggga 1980 gcggctcggg gggtgcgtgc gtgtgtgtgt gcgtggggag cgccgcgtgc ggctccgcgc 2040 tgcccggcgg ctgtgagcgc tgcgggcgcg gcgcggggct ttgtgcgctc cgcagtgtgc 2100 gcgaggggag cgcggccggg ggcggtgccc cgcggtgcgg ggggggctgc gaggggaaca 2160 aaggctgcgt gcggggtgtg tgcgtggggg ggtgagcagg gggtgtgggc gcgtcggtcg 2220 ggctgcaacc ccccctgcac ccccctcccc gagttgctga gcacggcccg gcttcgggtg 2280 cggggctccg tacggggcgt ggcgcggggc tcgccgtgcc gggcgggggg tggcggcagg 2340 tgggggtgcc gggcggggcg gggccgcctc gggccgggga gggctcgggg gaggggcgcg 2400 gcggcccccg gagcgccggc ggctgtcgag gcgcggcgag ccgcagccat tgccttttat 2460 ggtaatcgtg cgagagggcg cagggacttc ctttgtccca aatctgtgcg gagccgaaat 2520 ctgggaggcg ccgccgcacc ccctctagcg ggcgcggggc gaagcggtgc ggcgccggca 2580 ggaaggaaat gggcggggag ggccttcgtg cgtcgccgcg ccgccgtccc cttctccctc 2640 tccagcctcg gggctgtccg cggggggacg gctgccttcg ggggggacgg ggcagggcgg 2700 ggttcggctt ctggcgtgtg accggcggct ctagagcctc tgctaaccat gttcatgcct 2760 tcttcttttt cctacagctc ctgggcaacg tgctggttat tgtgctgtct catcattttg 2820 gcaaagaatt ccgccaccat gtctatgggg gctcctcgct ccctgctgct ggcactggcc 2880 gccgggctgg ctgtcgcaag accacctaat atcgtcctga tttttgcaga cgatctggga 2940 tacggcgacc tgggatgcta tggccaccca agctccacca cacccaacct ggaccagctg 3000 gcagcaggag gcctgcggtt caccgacttc tacgtgccag tgagcctgtg caccccctcc 3060 agagccgccc tgctgacagg caggctgcca gtgcgcatgg gcatgtatcc tggcgtgctg 3120 gtgccatcta gcaggggcgg cctgccactg gaggaggtga ccgtggcaga ggtgctggca 3180 gccagaggct acctgacagg aatggccggc aagtggcacc tgggagtggg accagaggga 3240 gccttcctgc cccctcacca gggcttccac cggtttctgg gcatccctta ttctcacgac 3300 cagggcccat gccagaacct gacctgtttt ccaccagcaa caccatgcga cggaggatgt 3360 gatcagggcc tggtgccaat cccactgctg gcaaatctga gcgtggaggc acagcctcca 3420 tggctgcctg gcctggaggc aagatacatg gccttcgccc acgacctgat ggcagatgca 3480 cagcggcagg atagaccttt ctttctgtac tatgcctccc accacaccca ctatccacag 3540 ttcagcggcc agtcctttgc cgagaggtcc ggaaggggac cattcggcga ctctctgatg 3600 gagctggatg ccgccgtggg caccctgatg acagcaatcg gcgacctggg cctgctggag 3660 gagacactgg tcatcttcac cgccgataac ggccctgaga caatgcggat gtctagaggc 3720 ggatgcagcg gcctgctgag atgtggcaag ggaaccacat acgagggagg cgtgcgcgag 3780 cctgccctgg cattttggcc aggacacatc gcacctggag tgacccacga gctggcctcc 3840 tctctggacc tgctgccaac actggccgcc ctggcaggag cacctctgcc aaatgtgacc 3900 ctggacggct tcgatctgag cccactgctg ctgggaaccg gcaagtcccc taggcagtct 3960 ctgttctttt acccctccta tcctgatgag gtgcggggcg tgtttgccgt gagaaccggc 4020 aagtacaagg cccacttctt tacacagggc tctgcccaca gcgacaccac agcagatcca 4080 gcatgccacg ccagctcctc tctgaccgca cacgagccac ctctgctgta cgacctgtcc 4140 aaggatcccg gcgagaacta taatctgctg ggaggagtgg caggagcaac ccctgaggtg 4200 ctgcaggccc tgaagcagct gcagctgctg aaggcacagc tggacgcagc agtgacattc 4260 ggcccaagcc aggtggccag aggcgaggat cccgccctgc agatctgttg ccaccccggc 4320 tgcaccccaa gacctgcctg ttgccattgc cccgacccac acgcctaaga ttctagagtc 4380 gagccgcgga ctagtaactt gtttattgca gcttataatg gttacaaata aagcaatagc 4440 atcacaaatt tcacaaataa agcatttttt tcactgcatt ctagttgtgg tttgtccaaa 4500 ctcatcaatg tatcttacct gcaggctcac cagtgtttgt gactgggaac tctccctgcc 4560 aaatattggc ataatgctgt cctttaggtt gcagcttatt gccccagggg aacagtctgt 4620 tgtgcagtcc accccggcag gaatactccc attctgcctc tgttggtaac cttttcccag 4680 cccaggtgca gtatgccact gcatcattcc aggacacatg cagcacaggg tggtcaggcc 4740 tgtggaggat agttgagtct ggtccctctg ggtgtctcca attggctcct ttaacaggca 4800 gccaccaggg ggctgcagcc actgcctgtt ggatattggt cttcacctgc tcacttagca 4860 tgccttcaaa aacaaaactg tcaccaaatt tctcagcctc tgtaaggtat ccagtgctgt 4920 ttacaaattt ctcaaattct gtgtttgaca cttcataggc atccatatag aaggcatcaa 4980 ttgtgactct cctagctggt gcttcaccat cctgcttgat ctgagggtca tcagttccca 5040 tagtaaaaac tcctgcaggt ctagatacgt agataagtag catggcgggt taatcattaa 5100 ctacaaggaa cccctagtga tggagttggc cactccctct ctgcgcgctc gctcgctcac 5160 tgaggccggg cgaccaaagg tcgcccgacg cccgggcttt gcccgggcgg cctcagtgag 5220 cgagcgagcg cgcagagagg gagtggccaa agatccccgg gtaccgagga cgaattctct 5280 agatatcgct caatactgac catttaaatc atacctgacc tccatagcag aaagtcaaaa 5340 gcctccgacc ggaggctttt gacttgatcg gcacgtaaga ggttccaact ttcaccataa 5400 tgaaataaga tcactaccgg gcgtattttt tgagttatcg agattttcag gagctaagga 5460 agctaaaatg agccatattc aacgggaaac gtcttgctcg aggccgcgat taaattccaa 5520 catggatgct gatttatatg ggtataaatg ggctcgcgat aatgtcgggc aatcaggtgc 5580 gacaatctat cgattgtatg ggaagcccga tgcgccagag ttgtttctga aacatggcaa 5640 aggtagcgtt gccaatgatg ttacagatga gatggtcagg ctaaactggc tgacggaatt 5700 tatgcctctt ccgaccatca agcattttat ccgtactcct gatgatgcat ggttactcac 5760 cactgcgatc ccagggaaaa cagcattcca ggtattagaa gaatatcctg attcaggtga 5820 aaatattgtt gatgcgctgg cagtgttcct gcgccggttg cattcgattc ctgtttgtaa 5880 ttgtcctttt aacggcgatc gcgtatttcg tctcgctcag gcgcaatcac gaatgaataa 5940 cggtttggtt ggtgcgagtg attttgatga cgagcgtaat ggctggcctg ttgaacaagt 6000 ctggaaagaa atgcataagc ttttgccatt ctcaccggat tcagtcgtca ctcatggtga 6060 tttctcactt gataacctta tttttgacga ggggaaatta ataggttgta ttgatgttgg 6120 acgagtcgga atcgcagacc gataccagga tcttgccatc ctatggaact gcctcggtga 6180 gttttctcct tcattacaga aacggctttt tcaaaaatat ggtattgata atcctgatat 6240 gaataaattg cagtttcact tgatgctcga tgagtttttc tgagggccca aatgtaatca 6300 cctggctcac cttcgggtgg gcctttctgc gttgctggcg tt 6342 <210> 53 <211> 6612 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 53 cgccagggtt ttcccagtca cgacgttgta aaacgacggc cagtgccaag cttgcatgcc 60 tgcatttggc cactccctct ctgcgcgctc gctcgctcac tgaggccggg cgaccaaagg 120 tcgcccgacg cccgggcttt gcccgggcgg cctcagtgag cgagcgagcg cgcagagagg 180 gagtggccaa ctccatcact aggggttcct ggaggggtgg agtcgtgacg tgaattacgt 240 catagggtta gggaggtcct gcagatcttc aatattggcc attagccata ttattcattg 300 gttatatagc ataaatcaat attggctatt ggccattgca tacgttgtat ctatatcata 360 atatgtacat ttatattggc tcatgtccaa tatgaccgcc atgttggcat tgattattga 420 ctagttatta atagtaatca attacggggt cattagttca tagcccatat atggagttcc 480 gcgttacata acttacggta aatggcccgc ctggctgacc gcccaacgac ccccgcccat 540 tgacgtcaat aatgacgtat gttcccatag taacgccaat agggactttc cattgacgtc 600 aatgggtgga gtatttacgg taaactgccc acttggcagt acatcaagtg tatcatatgc 660 caagtccgcc ccctattgac gtcaatgacg gtaaatggcc cgcctggcat tatgcccagt 720 acatgacctt acgggacttt cctacttggc agtacatcta cgtattagtc atcgctatta 780 ccatggtcga ggtgagcccc acgttctgct tcactctccc catctccccc ccctccccac 840 ccccaatttt gtatttattt attttttaat tattttgtgc agcgatgggg gcgggggggg 900 ggggggggcg cgcgccaggc ggggcggggc ggggcgaggg gcggggcggg gcgaggcgga 960 gaggtgcggc ggcagccaat cagagcggcg cgctccgaaa gtttcctttt atggcgaggc 1020 ggcggcggcg gcggccctat aaaaagcgaa gcgcgcggcg ggcgggagtc gctgcgcgct 1080 gccttcgccc cgtgccccgc tccgccgccg cctcgcgccg cccgccccgg ctctgactga 1140 ccgcgttact cccacaggtg agcgggcggg acggcccttc tcctccgggc tgtaattagc 1200 gcttggttta atgacggctt gtttcttttc tgtggctgcg tgaaagcctt gaggggctcc 1260 gggagggccc tttgtgcggg gggagcggct cggggggtgc gtgcgtgtgt gtgtgcgtgg 1320 ggagcgccgc gtgcggctcc gcgctgcccg gcggctgtga gcgctgcggg cgcggcgcgg 1380 ggctttgtgc gctccgcagt gtgcgcgagg ggagcgcggc cgggggcggt gccccgcggt 1440 gcgggggggg ctgcgagggg aacaaaggct gcgtgcgggg tgtgtgcgtg ggggggtgag 1500 cagggggtgt gggcgcgtcg gtcgggctgc aaccccccct gcacccccct ccccgagttg 1560 ctgagcacgg cccggcttcg ggtgcggggc tccgtacggg gcgtggcgcg gggctcgccg 1620 tgccgggcgg ggggtggcgg caggtggggg tgccgggcgg ggcggggccg cctcgggccg 1680 gggagggctc gggggagggg cgcggcggcc cccggagcgc cggcggctgt cgaggcgcgg 1740 cgagccgcag ccattgcctt ttatggtaat cgtgcgagag ggcgcaggga cttcctttgt 1800 cccaaatctg tgcggagccg aaatctggga ggcgccgccg caccccctct agcgggcgcg 1860 gggcgaagcg gtgcggcgcc ggcaggaagg aaatgggcgg ggagggcctt cgtgcgtcgc 1920 cgcgccgccg tccccttctc cctctccagc ctcggggctg tccgcggggg gacggctgcc 1980 ttcggggggg acggggcagg gcggggttcg gcttctggcg tgtgaccggc ggctctagag 2040 cctctgctaa ccatgttcat gccttcttct ttttcctaca gctcctgggc aacgtgctgg 2100 ttattgtgct gtctcatcat tttggcaaag aattccgcca ccatgtctat gggggctcct 2160 cgctccctgc tgctggcact ggccgccggg ctggctgtcg caagaccacc taatatcgtc 2220 ctgatttttg cagacgatct gggatacggc gacctgggat gctatggcca cccaagctcc 2280 accacaccca acctggacca gctggcagca ggaggcctgc ggttcaccga cttctacgtg 2340 ccagtgagcc tgtgcacccc ctccagagcc gccctgctga caggcaggct gccagtgcgc 2400 atgggcatgt atcctggcgt gctggtgcca tctagcaggg gcggcctgcc actggaggag 2460 gtgaccgtgg cagaggtgct ggcagccaga ggctacctga caggaatggc cggcaagtgg 2520 cacctgggag tgggaccaga gggagccttc ctgccccctc accagggctt ccaccggttt 2580 ctgggcatcc cttattctca cgaccagggc ccatgccaga acctgacctg ttttccacca 2640 gcaacaccat gcgacggagg atgtgatcag ggcctggtgc caatcccact gctggcaaat 2700 ctgagcgtgg aggcacagcc tccatggctg cctggcctgg aggcaagata catggccttc 2760 gcccacgacc tgatggcaga tgcacagcgg caggatagac ctttctttct gtactatgcc 2820 tcccaccaca cccactatcc acagttcagc ggccagtcct ttgccgagag gtccggaagg 2880 ggaccattcg gcgactctct gatggagctg gatgccgccg tgggcaccct gatgacagca 2940 atcggcgacc tgggcctgct ggaggagaca ctggtcatct tcaccgccga taacggccct 3000 gagacaatgc ggatgtctag aggcggatgc agcggcctgc tgagatgtgg caagggaacc 3060 acatacgagg gaggcgtgcg cgagcctgcc ctggcatttt ggccaggaca catcgcacct 3120 ggagtgaccc acgagctggc ctcctctctg gacctgctgc caacactggc cgccctggca 3180 ggagcacctc tgccaaatgt gaccctggac ggcttcgatc tgagcccact gctgctggga 3240 accggcaagt cccctaggca gtctctgttc ttttacccct cctatcctga tgaggtgcgg 3300 ggcgtgtttg ccgtgagaac cggcaagtac aaggcccact tctttacaca gggctctgcc 3360 cacagcgaca ccacagcaga tccagcatgc cacgccagct cctctctgac cgcacacgag 3420 ccacctctgc tgtacgacct gtccaaggat cccggcgaga actataatct gctgggagga 3480 gtggcaggag caacccctga ggtgctgcag gccctgaagc agctgcagct gctgaaggca 3540 cagctggacg cagcagtgac attcggccca agccaggtgg ccagaggcga ggatcccgcc 3600 ctgcagatct gttgccaccc cggctgcacc ccaagacctg cctgttgcca ttgccccgac 3660 ccacacgcct aagattctag agtcgagccg cggactagta acttgtttat tgcagcttat 3720 aatggttaca aataaagcaa tagcatcaca aatttcacaa ataaagcatt tttttcactg 3780 cattctagtt gtggtttgtc caaactcatc aatgtatctt aggtctagat acgtagataa 3840 gtagcatggc gggttaatca ttaactacaa ggaaccccta gtgatggagt tggccactcc 3900 ctctctgcgc gctcgctcgc tcactgaggc cgggcgacca aaggtcgccc gacgcccggg 3960 ctttgcccgg gcggcctcag tgagcgagcg agcgcgcaga gagggagtgg ccaaagatcc 4020 ccgggtaccg agctcgaatt cgtaatcatg tcatagctgt ttcctgtgtg aaattgttat 4080 ccgctcacaa ttccacacaa catacgagcc ggaagcataa agtgtaaagc ctggggtgcc 4140 taatgagtga gctaactcac attaattgcg ttgcgctcac tgcccgcttt ccagtcggga 4200 aacctgtcgt gccagctgca ttaatgaatc ggccaacgcg cggggagagg cggtttgcgt 4260 attggcgaac ttttgctgag ttgaaggatc agatcacgca tcttcccgac aacgcagacc 4320 gttccgtggc aaagcaaaag ttcaaaatca gtaaccgtca gtgccgataa gttcaaagtt 4380 aaacctggtg ttgataccaa cattgaaacg ctgatcgaaa acgcgctgaa aaacgctgct 4440 gaatgtgcga gcttcttccg cttcctcgct cactgactcg ctgcgctcgg tcgttcggct 4500 gcggcgagcg gtatcagctc actcaaaggc ggtaatacgg ttatccacag aatcagggga 4560 taacgcagga aagaacatgt gagcaaaagg ccagcaaaag gccaggaacc gtaaaaaggc 4620 cgcgttgctg gcgtttttcc ataggctccg cccccctgac gagcatcaca aaaatcgacg 4680 ctcaagtcag aggtggcgaa acccgacagg actataaaga taccaggcgt ttccccctgg 4740 aagctccctc gtgcgctctc ctgttccgac cctgccgctt accggatacc tgtccgcctt 4800 tctcccttcg ggaagcgtgg cgctttctca atgctcacgc tgtaggtatc tcagttcggt 4860 gtaggtcgtt cgctccaagc tgggctgtgt gcacgaaccc cccgttcagc ccgaccgctg 4920 cgccttatcc ggtaactatc gtcttgagtc caacccggta agacacgact tatcgccact 4980 ggcagcagcc actggtaaca ggattagcag agcgaggtat gtaggcggtg ctacagagtt 5040 cttgaagtgg tggcctaact acggctacac tagaaggaca gtatttggta tctgcgctct 5100 gctgaagcca gttaccttcg gaaaaagagt tggtagctct tgatccggca aacaaaccac 5160 cgctggtagc ggtggttttt ttgtttgcaa gcagcagatt acgcgcagaa aaaaaggatc 5220 tcaagaagat cctttgatct tttctacggg gtctgacgct cagtggaacg atccgtcgag 5280 aggtctgcct cgtgaagaag gtgttgctga ctcataccag gcctgaatcg ccccatcatc 5340 cagccagaaa gtgagggagc cacggttgat gagagctttg ttgtaggtgg accagttggt 5400 gattttgaac ttttgctttg ccacggaacg gtctgcgttg tcgggaagat gcgtgatctg 5460 atccttcaac tcagcaaaag ttcgatttat tcaacaaagc cacgttgtgt ctcaaaatct 5520 ctgatgttac attgcacaag ataaaaatat atcatcatga acaataaaac tgtctgctta 5580 cataaacagt aatacaaggg gtgttatgag ccatattcaa cgggaaacgt cttgctcgaa 5640 gccgcgatta aattccaaca tggatgctga tttatatggg tataaatggg ctcgcgataa 5700 tgtcgggcaa tcaggtgcga caatctatcg attgtatggg aagcccgatg cgccagagtt 5760 gtttctgaaa catggcaaag gtagcgttgc caatgatgtt acagatgaga tggtcagact 5820 aaactggctg acggaattta tgcctcttcc gaccatcaag cattttatcc gtactcctga 5880 tgatgcatgg ttactcacca ctgcgatccc cgggaaaaca gcattccagg tattagaaga 5940 atatcctgat tcaggtgaaa atattgttga tgcgctggca gtgttcctgc gccggttgca 6000 ttcgattcct gtttgtaatt gtccttttaa cagcgatcgc gtatttcgtc tcgctcaggc 6060 gcaatcacga atgaataacg gtttggttga tgcgagtgat tttgatgacg agcgtaatgg 6120 ctggcctgtt gaacaagtct ggaaagaaat gcataagctt ttgccattct caccggattc 6180 agtcgtcact catggtgatt tctcacttga taaccttatt tttgacgagg ggaaattaat 6240 aggttgtatt gatgttggac gagtcggaat cgcagaccga taccaggatc ttgccatcct 6300 atggaactgc ctcggtgagt tttctccttc attacagaaa cggctttttc aaaaatatgg 6360 tattgataat cctgatatga ataaattgca gtttcatttg atgctcgatg agtttttcta 6420 atcagaattg gttaattggt tgtaacactg gcagagcatt acgctgactt gacgggacgg 6480 cggctttgtt gaataaatcg cattcgccat tcaggctgcg caactgttgg gaagggcgat 6540 cggtgcgggc ctcttcgcta ttacgccagc tggcgaaagg gggatgtgct gcaaggcgat 6600 taagttgggt aa 6612 <210> 54 <211> 918 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 54 ggcatcctaa aaaatattca gtggaaacgt aaaaacatta aagactgatt aaacatcgca 60 gcatgacaca gatttagcaa ctgagcataa ataatttgac tcggatactg ctccaaaatc 120 cgaagaggac caatttcttc caggaggaca actacctcgt cctctgcaga cccctctcct 180 cggcagctga aggagtgtgg ccaatctgcc tccacctccc cgcggacccc ctactctcag 240 gacctcctgc agcaccccaa actggaagtg gccgctgcag acccaaggac gaggggcacg 300 cgggagccgg cagccctagt ggagcggttg gagatgttga ggtgggaggg tcacccaggt 360 ggggtgaggc tggggtaggt agcggagtga acggcttccg aagctctggg ccgcccccag 420 gttggactaa gcaggcgctc tgtcttcgcc cccgcccagg gtgggcgtct cctgaggact 480 ccccgccaca cctgacccga gaccgcgcgc ccagcctaga acgcttcccc gacccagcgt 540 agggccgccg cgactggcgg gcgagggtcg gcgggaggcc tggcgaaccc gggggcggga 600 ccaggcgggc aaggcccggc tgccgcagcg ccgctctgcg cgaggcggct ccgccgcggc 660 ggagggatac ggcgcaccat atatatatcg cggggcgcag actcgcgctc cggcagtggt 720 gctgggagtg tcgtggacgc cgtgccgtta ctcgtagtca ggcggcggcg caggcggcgg 780 cggcggcata gcgcacagcg cgccttagca gcagcagcag cagcagcggc atcggaggta 840 cccccgccgt cgcagccccc gcgctggtgc agccaccctc gctccctctg ctcttcctcc 900 cttcgctcgc accaagag 918 <210> 55 <211> 953 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 55 aattcggtac cctagttatt aatagtaatc aattacgggg tcattagttc atagcccata 60 tatggagttc cgcgttacat aacttacggt aaatggcccg cctggctgac cgcccaacga 120 cccccgccca ttgacgtcaa taatgacgta tgttcccata gtaacgccaa tagggacttt 180 ccattgacgt caatgggtgg actatttacg gtaaactgcc cacttggcag tacatcaagt 240 gtatcatatg ccaagtacgc cccctattga cgtcaatgac ggtaaatggc ccgcctggca 300 ttatgcccag tacatgacct tatgggactt tcctacttgg cagtacatct acgtattagt 360 catcgctatt accatggtcg aggtgagccc cacgttctgc ttcactctcc ccatctcccc 420 cccctcccca cccccaattt tgtatttatt tattttttaa ttattttgtg cagcgatggg 480 ggcggggggg gggggggggc gcgcgccagg cggggcgggg cggggcgagg ggcggggcgg 540 ggcgaggcgg agaggtgcgg cggcagccaa tcagagcggc gcgctccgaa agtttccttt 600 tatggcgagg cggcggcggc ggcggcccta taaaaagcga agcgcgcggc gggcgggagt 660 cgctgcgacg ctgccttcgc cccgtgcccc gctccgccgc cgcctcgcgc cgcccgcccc 720 ggctctgact gaccgcgtta ctcccacagg tgagcgggcg ggacggccct tctcctccgg 780 gctgtaatta gcgcttggtt taatgacggc ttgtttcttt tctgtggctg cgtgaaagcc 840 ttgaggggct ccgggagcta gagcctctgc taaccatgtt catgccttct tctttttcct 900 acagctcctg ggcaacgtgc tggttattgt gctgtctcat cattttggca aag 953 <210> 56 <211> 37 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 56 gtagataagt agcatggcgg gttaatcatt aactaca 37 <210> 57 <211> 180 <212> DNA <213> Artificial Sequence <220> <223> 3' ITR <400> 57 gtagataagt agcatggcgg gttaatcatt aactacaagg aacccctagt gatggagttg 60 gccactccct ctctgcgcgc tcgctcgctc actgaggccg ggcgaccaaa ggtcgcccga 120 cgcccgggct ttgcccgggc ggcctcagtg agcgagcgag cgcgcagaga gggagtggcc 180 180 <210> 58 <211> 380 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 58 ggcattgatt attgactagt tattaatagt aatcaattac ggggtcatta gttcatagcc 60 catatatgga gttccgcgtt acataactta cggtaaatgg cccgcctggc tgaccgccca 120 acgacccccg cccattgacg tcaataatga cgtatgttcc catagtaacg ccaataggga 180 ctttccattg acgtcaatgg gtggagtatt tacggtaaac tgcccacttg gcagtacatc 240 aagtgtatca tatgccaagt ccgcccccta ttgacgtcaa tgacggtaaa tggcccgcct 300 ggcattatgc ccagtacatg accttacggg actttcctac ttggcagtac atctacgtat 360 tagtcatcgc tattaccatg 380 <210> 59 <211> 1246 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 59 tcgaggtgag ccccacgttc tgcttcactc tccccatctc ccccccctcc ccacccccaa 60 ttttgtattt atttattttt taattatttt gtgcagcgat gggggcgggg gggggggggg 120 ggcgcgcgcc aggcggggcg gggcggggcg aggggcgggg cggggcgagg cggagaggtg 180 cggcggcagc caatcagagc ggcgcgctcc gaaagtttcc ttttatggcg aggcggcggc 240 ggcggcggcc ctataaaaag cgaagcgcgc ggcgggcggg agtcgctgcg cgctgccttc 300 gccccgtgcc ccgctccgcc gccgcctcgc gccgcccgcc ccggctctga ctgaccgcgt 360 tactcccaca ggtgagcggg cgggacggcc cttctcctcc gggctgtaat tagcgcttgg 420 tttaatgacg gcttgtttct tttctgtggc tgcgtgaaag ccttgagggg ctccgggagg 480 gccctttgtg cggggggagc ggctcggggg gtgcgtgcgt gtgtgtgtgc gtggggagcg 540 ccgcgtgcgg ctccgcgctg cccggcggct gtgagcgctg cgggcgcggc gcggggcttt 600 gtgcgctccg cagtgtgcgc gaggggagcg cggccggggg cggtgccccg cggtgcgggg 660 ggggctgcga ggggaacaaa ggctgcgtgc ggggtgtgtg cgtggggggg tgagcagggg 720 gtgtgggcgc gtcggtcggg ctgcaacccc ccctgcaccc ccctccccga gttgctgagc 780 acggcccggc ttcgggtgcg gggctccgta cggggcgtgg cgcggggctc gccgtgccgg 840 gcggggggtg gcggcaggtg ggggtgccgg gcggggcggg gccgcctcgg gccggggagg 900 gctcggggga ggggcgcggc ggcccccgga gcgccggcgg ctgtcgaggc gcggcgagcc 960 gcagccattg ccttttatgg taatcgtgcg agagggcgca gggacttcct ttgtcccaaa 1020 tctgtgcgga gccgaaatct gggaggcgcc gccgcacccc ctctagcggg cgcggggcga 1080 agcggtgcgg cgccggcagg aaggaaatgg gcggggaggg ccttcgtgcg tcgccgcgcc 1140 gccgtcccct tctccctctc cagcctcggg gctgtccgcg gggggacggc tgccttcggg 1200 ggggacgggg cagggcgggg ttcggcttct ggcgtgtgac cggcgg 1246 <210> 60 <211> 95 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 60 cctctgctaa ccatgttcat gccttcttct ttttcctaca gctcctgggc aacgtgctgg 60 ttattgtgct gtctcatcat tttggcaaag aattc 95 <210> 61 <211> 1061 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 61 tagggaggtc ctgcacgtta cataacttac ggtaaatggc ccgcctggct gaccgcccaa 60 cgacccccgc ccattgacgt caataatgac gtatgttccc atagtaacgc caatagggac 120 tttccattga cgtcaatggg tggagtattt acggtaaact gcccacttgg cagtacatca 180 agtgtatcat atgccaagta cgccccctat tgacgtcaat gacggtaaat ggcccgcctg 240 gcattatgcc cagtacatga ccttatggga ctttcctact tggcagtaca tctacgtatt 300 agtcatcgct attaccatgg tcgaggtgag ccccacgttc tgcttcactc tccccatctc 360 ccccccctcc ccacccccaa ttttgtattt atttattttt taattatttt gtgcagcgat 420 gggggcgggg gggggggggg gcgcgcgcca ggcggggcgg ggcggggcga ggggcggggc 480 ggggcgaggc ggagaggtgc ggcggcagcc aatcagagcg gcgcgctccg aaagtttcct 540 tttatggcga ggcggcggcg gcggcggccc tataaaaagc gaagcgcgcg gcgggcggga 600 gtcgctgcgc gctgccttcg ccccgtgccc cgctccgccg ccgcctcgcg ccgcccgccc 660 cggctctgac tgaccgcgtt actaaaacag gtaagtccgg cctccgcgcc gggttttggc 720 gcctcccgcg ggcgcccccc tcctcacggc gagcgctgcc acgtcagacg aagggcgcag 780 cgagcgtcct gatccttccg cccggacgct caggacagcg gcccgctgct cataagactc 840 ggccttagaa ccccagtatc agcagaagga cattttagga cgggacttgg gtgactctag 900 ggcactggtt ttctttccag agagcggaac aggcgaggaa aagtagtccc ttctcggcga 960 ttctgcggag ggatctccgt ggggcggtga acgccgatga tgcctctact aaccatgttc 1020 atgttttctt tttttttcta caggtcctgg gtgacgaaca g 1061 <210> 62 <211> 1527 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 62 atgagcatgg gcgcccccag aagcctgtta cttgctttag ctgctggcct tgcagtggca 60 aggcccccta acatcgtgct gatctttgca gatgacttgg gatatgggga tcttggttgt 120 tatggccacc catcaagcac aactcccaat ctggatcagt tggctgcagg aggtctgagg 180 tttacagact tttatgttcc agtctccctg tgcactcctt ctcgggctgc cctgcttact 240 gggaggctcc ctgtgagaat gggtatgtac cctggagtgt tggtcccatc cagcagggga 300 gggctgcccc tggaagaggt gacagtggca gaggtgctgg cagcacgagg ctatctgact 360 ggcatggcag gcaagtggca cctgggtgta gggccagagg gtgctttcct gcctccccat 420 cagggctttc ataggtttct gggaatccca tactctcatg accaaggacc ctgccagaac 480 ctcacctgtt tcccccctgc aacaccatgt gatgggggct gtgatcaagg tctggttcct 540 ataccactgc ttgctaatct ttcagtggaa gctcaaccac cctggctgcc tggcttggag 600 gctagataca tggccttcgc acatgatctg atggcagatg cccagagaca agataggcct 660 ttcttcctct actatgcatc tcaccacacc cactatcctc agttctcagg ccaatcattt 720 gctgagcgta gtggcagggg cccatttggg gacagtttga tggaactgga tgccgcagtt 780 ggtaccctca tgacagcaat aggggactta ggtttgctgg aggaaacatt ggtaattttc 840 acagctgata atggccctga gacaatgaga atgtctaggg gaggctgctc tggtcttctg 900 aggtgtggta aagggactac atatgaggga ggagtgaggg aaccagctct tgccttttgg 960 ccaggtcaca tagcccctgg agttacacat gaactagctt cttccctgga cttgcttcct 1020 acactggcag ccctggcagg tgcccctctc cctaatgtaa ctttagatgg atttgacctc 1080 tctccactac ttttagggac agggaaaagt ccaaggcagt ccttattctt ctatccttcc 1140 tacccagatg aggtgagggg tgtttttgcc gtgaggactg ggaaatacaa agctcatttt 1200 tttacccagg gatcagctca ttcagacacc acagctgatc ctgcctgtca tgccagcagt 1260 agcttgacag cacatgagcc tcccttactg tatgacctga gcaaggaccc aggggagaac 1320 tataacctgc ttgggggggt tgctggggcc accccagaag tgcttcaggc actaaagcag 1380 ctgcaactgc ttaaagcaca gttggatgct gcagtgacct ttggcccttc ccaggtggcc 1440 agaggcgagg atcccgccct gcagatctgc tgccacccag gctgcacacc cagacctgcc 1500 tgctgtcact gccccgaccc acacgcc 1527 <210> 63 <211> 57 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 63 gctactaact tcagcctgct gaagcaggct ggagacgtgg aggagaaccc tggacct 57 <210> 64 <211> 1122 <212> DNA <213> Homo sapiens <400> 64 atggctgccc cagccctggg gctggtgtgt ggcagatgcc ctgagctggg cctggtgctg 60 cttctcctgc tgctgagcct cctgtgtggt gctgctggct ctcaggaagc agggacagga 120 gcaggagcag gttctctggc tggctcatgc ggttgtggga ccccccagag gccaggggct 180 catgggtcct ctgcagctgc ccacaggtac tcaagggaag caaatgcccc tggccccgta 240 cctggggaaa ggcaacttgc tcactccaag atggttccta tccctgcagg agtttttact 300 atgggaactg atgaccctca gatcaagcag gatggtgaag caccagctag gagagtcaca 360 attgatgcct tctatatgga tgcctatgaa gtgtcaaaca cagaatttga gaaatttgta 420 aacagcactg gataccttac agaggctgag aaatttggtg acagttttgt ttttgaaggc 480 atgctaagtg agcaggtgaa gaccaatatc caacaggcag tggctgcagc cccctggtgg 540 ctgcctgtta aaggagccaa ttggagacac ccagagggac cagactcaac tatcctccac 600 aggcctgacc accctgtgct gcatgtgtcc tggaatgatg cagtggcata ctgcacctgg 660 gctgggaaaa ggttaccaac agaggcagaa tgggagtatt cctgccgggg tggactgcac 720 aacagactgt tcccctgggg caataagctg caacctaaag gacagcatta tgccaatatt 780 tggcagggag agttcccagt cacaaacact ggtgaggatg gcttccaggg aactgcccct 840 gtggatgctt tcccacccaa tggctatggg ttgtacaata tagttgggaa tgcctgggag 900 tggacttctg actggtggac ggtccatcac agtgtggaag agacactgaa cccaaagggg 960 cccccctcag gcaaggacag agtcaagaaa ggtggctctt atatgtgtca cagaagctat 1020 tgctacagat ataggtgtgc tgcaagaagt cagaacaccc ctgacagctc agctagcaat 1080 ctgggattta gatgtgcagc agatagactc cccaccatgg ac 1122 <210> 65 <211> 3739 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 65 ggcatcctaa aaaatattca gtggaaacgt aaaaacatta aagactgatt aaacatcgca 60 gcatgacaca gatttagcaa ctgagcataa ataatttgac tcggatactg ctccaaaatc 120 cgaagaggac caatttcttc caggaggaca actacctcgt cctctgcaga cccctctcct 180 cggcagctga aggagtgtgg ccaatctgcc tccacctccc cgcggacccc ctactctcag 240 gacctcctgc agcaccccaa actggaagtg gccgctgcag acccaaggac gaggggcacg 300 cgggagccgg cagccctagt ggagcggttg gagatgttga ggtgggaggg tcacccaggt 360 ggggtgaggc tggggtaggt agcggagtga acggcttccg aagctctggg ccgcccccag 420 gttggactaa gcaggcgctc tgtcttcgcc cccgcccagg gtgggcgtct cctgaggact 480 ccccgccaca cctgacccga gaccgcgcgc ccagcctaga acgcttcccc gacccagcgt 540 agggccgccg cgactggcgg gcgagggtcg gcgggaggcc tggcgaaccc gggggcggga 600 ccaggcgggc aaggcccggc tgccgcagcg ccgctctgcg cgaggcggct ccgccgcggc 660 ggagggatac ggcgcaccat atatatatcg cggggcgcag actcgcgctc cggcagtggt 720 gctgggagtg tcgtggacgc cgtgccgtta ctcgtagtca ggcggcggcg caggcggcgg 780 cggcggcata gcgcacagcg cgccttagca gcagcagcag cagcagcggc atcggaggta 840 cccccgccgt cgcagccccc gcgctggtgc agccaccctc gctccctctg ctcttcctcc 900 cttcgctcgc accaagaggt aagggtttaa gggatggttg gttggtgggg tattaatgtt 960 taattacctg gagcacctgc ctgaaatcac tttttttcag gttgggccac ccgccgccac 1020 catgagcatg ggcgccccca gaagcctgtt acttgcttta gctgctggcc ttgcagtggc 1080 aaggccccct aacatcgtgc tgatctttgc agatgacttg ggatatgggg atcttggttg 1140 ttatggccac ccatcaagca caactcccaa tctggatcag ttggctgcag gaggtctgag 1200 gtttacagac ttttatgttc cagtctccct gtgcactcct tctcgggctg ccctgcttac 1260 tgggaggctc cctgtgagaa tgggtatgta ccctggagtg ttggtcccat ccagcagggg 1320 agggctgccc ctggaagagg tgacagtggc agaggtgctg gcagcacgag gctatctgac 1380 tggcatggca ggcaagtggc acctgggtgt agggccagag ggtgctttcc tgcctcccca 1440 tcagggcttt cataggtttc tgggaatccc atactctcat gaccaaggac cctgccagaa 1500 cctcacctgt ttcccccctg caacaccatg tgatgggggc tgtgatcaag gtctggttcc 1560 tataccactg cttgctaatc tttcagtgga agctcaacca ccctggctgc ctggcttgga 1620 ggctagatac atggccttcg cacatgatct gatggcagat gcccagagac aagataggcc 1680 tttcttcctc tactatgcat ctcaccacac ccactatcct cagttctcag gccaatcatt 1740 tgctgagcgt agtggcaggg gcccatttgg ggacagtttg atggaactgg atgccgcagt 1800 tggtaccctc atgacagcaa taggggactt aggtttgctg gaggaaacat tggtaatttt 1860 cacagctgat aatggccctg agacaatgag aatgtctagg ggaggctgct ctggtcttct 1920 gaggtgtggt aaagggacta catatgaggg aggagtgagg gaaccagctc ttgccttttg 1980 gccaggtcac atagcccctg gagttacaca tgaactagct tcttccctgg acttgcttcc 2040 tacactggca gccctggcag gtgcccctct ccctaatgta actttagatg gatttgacct 2100 ctctccacta cttttaggga cagggaaaag tccaaggcag tccttattct tctatccttc 2160 ctacccagat gaggtgaggg gtgtttttgc cgtgaggact gggaaataca aagctcattt 2220 ttttacccag ggatcagctc attcagacac cacagctgat cctgcctgtc atgccagcag 2280 tagcttgaca gcacatgagc ctcccttact gtatgacctg agcaaggacc caggggagaa 2340 ctataacctg cttggggggg ttgctggggc caccccagaa gtgcttcagg cactaaagca 2400 gctgcaactg cttaaagcac agttggatgc tgcagtgacc tttggccctt cccaggtggc 2460 cagaggcgag gatcccgccc tgcagatctg ctgccaccca ggctgcacac ccagacctgc 2520 ctgctgtcac tgccccgacc cacacgccgg cagcggagct actaacttca gcctgctgaa 2580 gcaggctgga gacgtggagg agaaccctgg acctatggct gccccagccc tggggctggt 2640 gtgtggcaga tgccctgagc tgggcctggt gctgcttctc ctgctgctga gcctcctgtg 2700 tggtgctgct ggctctcagg aagcagggac aggagcagga gcaggttctc tggctggctc 2760 atgcggttgt gggacccccc agaggccagg ggctcatggg tcctctgcag ctgcccacag 2820 gtactcaagg gaagcaaatg cccctggccc cgtacctggg gaaaggcaac ttgctcactc 2880 caagatggtt cctatccctg caggagtttt tactatggga actgatgacc ctcagatcaa 2940 gcaggatggt gaagcaccag ctaggagagt cacaattgat gccttctata tggatgccta 3000 tgaagtgtca aacacagaat ttgagaaatt tgtaaacagc actggatacc ttacagaggc 3060 tgagaaattt ggtgacagtt ttgtttttga aggcatgcta agtgagcagg tgaagaccaa 3120 tatccaacag gcagtggctg cagccccctg gtggctgcct gttaaaggag ccaattggag 3180 acacccagag ggaccagact caactatcct ccacaggcct gaccaccctg tgctgcatgt 3240 gtcctggaat gatgcagtgg catactgcac ctgggctggg aaaaggttac caacagaggc 3300 agaatgggag tattcctgcc ggggtggact gcacaacaga ctgttcccct ggggcaataa 3360 gctgcaacct aaaggacagc attatgccaa tatttggcag ggagagttcc cagtcacaaa 3420 cactggtgag gatggcttcc agggaactgc ccctgtggat gctttcccac ccaatggcta 3480 tgggttgtac aatatagttg ggaatgcctg ggagtggact tctgactggt ggacggtcca 3540 tcacagtgtg gaagagacac tgaacccaaa ggggcccccc tcaggcaagg acagagtcaa 3600 gaaaggtggc tcttatatgt gtcacagaag ctattgctac agatataggt gtgctgcaag 3660 aagtcagaac acccctgaca gctcagctag caatctggga tttagatgtg cagcagatag 3720 actccccacc atggactga 3739 <210> 66 <211> 54 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 66 gagggcagag gaagtcttct aacatgcggt gacgtggagg agaatcccgg ccct 54 <210> 67 <211> 3686 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 67 aattcggtac cctagttatt aatagtaatc aattacgggg tcattagttc atagcccata 60 tatggagttc cgcgttacat aacttacggt aaatggcccg cctggctgac cgcccaacga 120 cccccgccca ttgacgtcaa taatgacgta tgttcccata gtaacgccaa tagggacttt 180 ccattgacgt caatgggtgg actatttacg gtaaactgcc cacttggcag tacatcaagt 240 gtatcatatg ccaagtacgc cccctattga cgtcaatgac ggtaaatggc ccgcctggca 300 ttatgcccag tacatgacct tatgggactt tcctacttgg cagtacatct acgtattagt 360 catcgctatt accatggtcg aggtgagccc cacgttctgc ttcactctcc ccatctcccc 420 cccctcccca cccccaattt tgtatttatt tattttttaa ttattttgtg cagcgatggg 480 ggcggggggg gggggggggc gcgcgccagg cggggcgggg cggggcgagg ggcggggcgg 540 ggcgaggcgg agaggtgcgg cggcagccaa tcagagcggc gcgctccgaa agtttccttt 600 tatggcgagg cggcggcggc ggcggcccta taaaaagcga agcgcgcggc gggcgggagt 660 cgctgcgacg ctgccttcgc cccgtgcccc gctccgccgc cgcctcgcgc cgcccgcccc 720 ggctctgact gaccgcgtta ctcccacagg tgagcgggcg ggacggccct tctcctccgg 780 gctgtaatta gcgcttggtt taatgacggc ttgtttcttt tctgtggctg cgtgaaagcc 840 ttgaggggct ccgggagcta gagcctctgc taaccatgtt catgccttct tctttttcct 900 acagctcctg ggcaacgtgc tggttattgt gctgtctcat cattttggca aaggctagcg 960 ccgccaccat gagcatgggc gcccccagaa gcctgttact tgctttagct gctggccttg 1020 cagtggcaag gccccctaac atcgtgctga tctttgcaga tgacttggga tatggggatc 1080 ttggttgtta tggccaccca tcaagcacaa ctcccaatct ggatcagttg gctgcaggag 1140 gtctgaggtt tacagacttt tatgttccag tctccctgtg cactccttct cgggctgccc 1200 tgcttactgg gaggctccct gtgagaatgg gtatgtaccc tggagtgttg gtcccatcca 1260 gcaggggagg gctgcccctg gaagaggtga cagtggcaga ggtgctggca gcacgaggct 1320 atctgactgg catggcaggc aagtggcacc tgggtgtagg gccagagggt gctttcctgc 1380 ctccccatca gggctttcat aggtttctgg gaatcccata ctctcatgac caaggaccct 1440 gccagaacct cacctgtttc ccccctgcaa caccatgtga tgggggctgt gatcaaggtc 1500 tggttcctat accactgctt gctaatcttt cagtggaagc tcaaccaccc tggctgcctg 1560 gcttggaggc tagatacatg gccttcgcac atgatctgat ggcagatgcc cagagacaag 1620 ataggccttt cttcctctac tatgcatctc accacaccca ctatcctcag ttctcaggcc 1680 aatcatttgc tgagcgtagt ggcaggggcc catttgggga cagtttgatg gaactggatg 1740 ccgcagttgg taccctcatg acagcaatag gggacttagg tttgctggag gaaacattgg 1800 taattttcac agctgataat ggccctgaga caatgagaat gtctagggga ggctgctctg 1860 gtcttctgag gtgtggtaaa gggactacat atgagggagg agtgagggaa ccagctcttg 1920 ccttttggcc aggtcacata gcccctggag ttacacatga actagcttct tccctggact 1980 tgcttcctac actggcagcc ctggcaggtg cccctctccc taatgtaact ttagatggat 2040 ttgacctctc tccactactt ttagggacag ggaaaagtcc aaggcagtcc ttattcttct 2100 atccttccta cccagatgag gtgaggggtg tttttgccgt gaggactggg aaatacaaag 2160 ctcatttttt tacccaggga tcagctcatt cagacaccac agctgatcct gcctgtcatg 2220 ccagcagtag cttgacagca catgagcctc ccttactgta tgacctgagc aaggacccag 2280 gggagaacta taacctgctt gggggggttg ctggggccac cccagaagtg cttcaggcac 2340 taaagcagct gcaactgctt aaagcacagt tggatgctgc agtgaccttt ggcccttccc 2400 aggtggccag aggcgaggat cccgccctgc agatctgctg ccacccaggc tgcacaccca 2460 gacctgcctg ctgtcactgc cccgacccac acgccggcag cggagctact aacttcagcc 2520 tgctgaagca ggctggagac gtggaggaga accctggacc tatggctgcc ccagccctgg 2580 ggctggtgtg tggcagatgc cctgagctgg gcctggtgct gcttctcctg ctgctgagcc 2640 tcctgtgtgg tgctgctggc tctcaggaag cagggacagg agcaggagca ggttctctgg 2700 ctggctcatg cggttgtggg accccccaga ggccaggggc tcatgggtcc tctgcagctg 2760 cccacaggta ctcaagggaa gcaaatgccc ctggccccgt acctggggaa aggcaacttg 2820 ctcactccaa gatggttcct atccctgcag gagtttttac tatgggaact gatgaccctc 2880 agatcaagca ggatggtgaa gcaccagcta ggagagtcac aattgatgcc ttctatatgg 2940 atgcctatga agtgtcaaac acagaatttg agaaatttgt aaacagcact ggatacctta 3000 cagaggctga gaaatttggt gacagttttg tttttgaagg catgctaagt gagcaggtga 3060 agaccaatat ccaacaggca gtggctgcag ccccctggtg gctgcctgtt aaaggagcca 3120 attggagaca cccagaggga ccagactcaa ctatcctcca caggcctgac caccctgtgc 3180 tgcatgtgtc ctggaatgat gcagtggcat actgcacctg ggctgggaaa aggttaccaa 3240 cagaggcaga atgggagtat tcctgccggg gtggactgca caacagactg ttcccctggg 3300 gcaataagct gcaacctaaa ggacagcatt atgccaatat ttggcaggga gagttcccag 3360 tcacaaacac tggtgaggat ggcttccagg gaactgcccc tgtggatgct ttcccaccca 3420 atggctatgg gttgtacaat atagttggga atgcctggga gtggacttct gactggtgga 3480 cggtccatca cagtgtggaa gagacactga acccaaaggg gcccccctca ggcaaggaca 3540 gagtcaagaa aggtggctct tatatgtgtc acagaagcta ttgctacaga tataggtgtg 3600 ctgcaagaag tcagaacacc cctgacagct cagctagcaa tctgggattt agatgtgcag 3660 cagatagact ccccaccatg gactga 3686 <210> 68 <211> 4346 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 68 ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 60 cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag agagggagtg 120 gccaactcca tcactagggg ttcctggagg ggtggagtcg tgacgtgaat tacgtcatag 180 ggttagggag gtcctgcata tgcggccgcg gcatcctaaa aaatattcag tggaaacgta 240 aaaacattaa agactgatta aacatcgcag catgacacag atttagcaac tgagcataaa 300 taatttgact cggatactgc tccaaaatcc gaagaggacc aatttcttcc aggaggacaa 360 ctacctcgtc ctctgcagac ccctctcctc ggcagctgaa ggagtgtggc caatctgcct 420 ccacctcccc gcggaccccc tactctcagg acctcctgca gcaccccaaa ctggaagtgg 480 ccgctgcaga cccaaggacg aggggcacgc gggagccggc agccctagtg gagcggttgg 540 agatgttgag gtgggagggt cacccaggtg gggtgaggct ggggtaggta gcggagtgaa 600 cggcttccga agctctgggc cgcccccagg ttggactaag caggcgctct gtcttcgccc 660 ccgcccaggg tgggcgtctc ctgaggactc cccgccacac ctgacccgag accgcgcgcc 720 cagcctagaa cgcttccccg acccagcgta gggccgccgc gactggcggg cgagggtcgg 780 cgggaggcct ggcgaacccg ggggcgggac caggcgggca aggcccggct gccgcagcgc 840 cgctctgcgc gaggcggctc cgccgcggcg gagggatacg gcgcaccata tatatatcgc 900 ggggcgcaga ctcgcgctcc ggcagtggtg ctgggagtgt cgtggacgcc gtgccgttac 960 tcgtagtcag gcggcggcgc aggcggcggc ggcggcatag cgcacagcgc gccttagcag 1020 cagcagcagc agcagcggca tcggaggtac ccccgccgtc gcagcccccg cgctggtgca 1080 gccaccctcg ctccctctgc tcttcctccc ttcgctcgca ccaagaggta agggtttaag 1140 ggatggttgg ttggtggggt attaatgttt aattacctgg agcacctgcc tgaaatcact 1200 ttttttcagg ttgggccacc cgccgccacc atgagcatgg gcgcccccag aagcctgtta 1260 cttgctttag ctgctggcct tgcagtggca aggcccccta acatcgtgct gatctttgca 1320 gatgacttgg gatatgggga tcttggttgt tatggccacc catcaagcac aactcccaat 1380 ctggatcagt tggctgcagg aggtctgagg tttacagact tttatgttcc agtctccctg 1440 tgcactcctt ctcgggctgc cctgcttact gggaggctcc ctgtgagaat gggtatgtac 1500 cctggagtgt tggtcccatc cagcagggga gggctgcccc tggaagaggt gacagtggca 1560 gaggtgctgg cagcacgagg ctatctgact ggcatggcag gcaagtggca cctgggtgta 1620 gggccagagg gtgctttcct gcctccccat cagggctttc ataggtttct gggaatccca 1680 tactctcatg accaaggacc ctgccagaac ctcacctgtt tcccccctgc aacaccatgt 1740 gatgggggct gtgatcaagg tctggttcct ataccactgc ttgctaatct ttcagtggaa 1800 gctcaaccac cctggctgcc tggcttggag gctagataca tggccttcgc acatgatctg 1860 atggcagatg cccagagaca agataggcct ttcttcctct actatgcatc tcaccacacc 1920 cactatcctc agttctcagg ccaatcattt gctgagcgta gtggcagggg cccatttggg 1980 gacagtttga tggaactgga tgccgcagtt ggtaccctca tgacagcaat aggggactta 2040 ggtttgctgg aggaaacatt ggtaattttc acagctgata atggccctga gacaatgaga 2100 atgtctaggg gaggctgctc tggtcttctg aggtgtggta aagggactac atatgaggga 2160 ggagtgaggg aaccagctct tgccttttgg ccaggtcaca tagcccctgg agttacacat 2220 gaactagctt cttccctgga cttgcttcct acactggcag ccctggcagg tgcccctctc 2280 cctaatgtaa ctttagatgg atttgacctc tctccactac ttttagggac agggaaaagt 2340 ccaaggcagt ccttattctt ctatccttcc tacccagatg aggtgagggg tgtttttgcc 2400 gtgaggactg ggaaatacaa agctcatttt tttacccagg gatcagctca ttcagacacc 2460 acagctgatc ctgcctgtca tgccagcagt agcttgacag cacatgagcc tcccttactg 2520 tatgacctga gcaaggaccc aggggagaac tataacctgc ttgggggggt tgctggggcc 2580 accccagaag tgcttcaggc actaaagcag ctgcaactgc ttaaagcaca gttggatgct 2640 gcagtgacct ttggcccttc ccaggtggcc agaggcgagg atcccgccct gcagatctgc 2700 tgccacccag gctgcacacc cagacctgcc tgctgtcact gccccgaccc acacgccggc 2760 agcggagcta ctaacttcag cctgctgaag caggctggag acgtggagga gaaccctgga 2820 cctatggctg ccccagccct ggggctggtg tgtggcagat gccctgagct gggcctggtg 2880 ctgcttctcc tgctgctgag cctcctgtgt ggtgctgctg gctctcagga agcagggaca 2940 ggagcaggag caggttctct ggctggctca tgcggttgtg ggacccccca gaggccaggg 3000 gctcatgggt cctctgcagc tgcccacagg tactcaaggg aagcaaatgc ccctggcccc 3060 gtacctgggg aaaggcaact tgctcactcc aagatggttc ctatccctgc aggagttttt 3120 actatgggaa ctgatgaccc tcagatcaag caggatggtg aagcaccagc taggagagtc 3180 acaattgatg ccttctatat ggatgcctat gaagtgtcaa acacagaatt tgagaaattt 3240 gtaaacagca ctggatacct tacagaggct gagaaatttg gtgacagttt tgtttttgaa 3300 ggcatgctaa gtgagcaggt gaagaccaat atccaacagg cagtggctgc agccccctgg 3360 tggctgcctg ttaaaggagc caattggaga cacccagagg gaccagactc aactatcctc 3420 cacaggcctg accaccctgt gctgcatgtg tcctggaatg atgcagtggc atactgcacc 3480 tgggctggga aaaggttacc aacagaggca gaatgggagt attcctgccg gggtggactg 3540 cacaacagac tgttcccctg gggcaataag ctgcaaccta aaggacagca ttatgccaat 3600 atttggcagg gagagttccc agtcacaaac actggtgagg atggcttcca gggaactgcc 3660 cctgtggatg ctttcccacc caatggctat gggttgtaca atatagttgg gaatgcctgg 3720 gagtggactt ctgactggtg gacggtccat cacagtgtgg aagagacact gaacccaaag 3780 gggcccccct caggcaagga cagagtcaag aaaggtggct cttatatgtg tcacagaagc 3840 tattgctaca gatataggtg tgctgcaaga agtcagaaca cccctgacag ctcagctagc 3900 aatctgggat ttagatgtgc agcagataga ctccccacca tggactgaga tccagacatg 3960 ataagataca ttgatgagtt tggacaaacc acaactagaa tgcagtgaaa aaaatgcttt 4020 atttgtgaaa tttgtgatgc tattgcttta tttgtaacca ttataagctg caataaacaa 4080 gttaacaaca acaattgcat tcattttatg tttcaggttc agggggaggt gtgggaggtt 4140 ttttaaacct gcaggtctag atacgtagat aagtagcatg gcgggttaat cattaactac 4200 aaggaacccc tagtgatgga gttggccact ccctctctgc gcgctcgctc gctcactgag 4260 gccgggcgac caaaggtcgc ccgacgcccg ggctttgccc gggcggcctc agtgagcgag 4320 cgagcgcgca gagagggagt ggccaa 4346 <210> 69 <211> 4492 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 69 ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 60 cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag agagggagtg 120 gccaactcca tcactagggg ttcctggagg ggtggagtcg tgacgtgaat tacgtcatag 180 ggttagggag gtcctgcata tgcggccgca cctaggtcat tctggcctcc ccctccctca 240 aggccagtca ttctggcctg tccttccccg aaggccagtc attctggcct ccccctcccc 300 caaggccagt cattctggcc ttcccctccc ttaaggccag agtactatcg attcacacaa 360 aaaaccaaca cactattgca atgaaaataa atttccttta ttaagcttaa ttcggtaccc 420 tagttattaa tagtaatcaa ttacggggtc attagttcat agcccatata tggagttccg 480 cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc cccgcccatt 540 gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc attgacgtca 600 atgggtggac tatttacggt aaactgccca cttggcagta catcaagtgt atcatatgcc 660 aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt atgcccagta 720 catgacctta tgggactttc ctacttggca gtacatctac gtattagtca tcgctattac 780 catggtcgag gtgagcccca cgttctgctt cactctcccc atctcccccc cctccccacc 840 cccaattttg tatttattta ttttttaatt attttgtgca gcgatggggg cggggggggg 900 gggggggcgc gcgccaggcg gggcggggcg gggcgagggg cggggcgggg cgaggcggag 960 aggtgcggcg gcagccaatc agagcggcgc gctccgaaag tttcctttta tggcgaggcg 1020 gcggcggcgg cggccctata aaaagcgaag cgcgcggcgg gcgggagtcg ctgcgacgct 1080 gccttcgccc cgtgccccgc tccgccgccg cctcgcgccg cccgccccgg ctctgactga 1140 ccgcgttact cccacaggtg agcgggcggg acggcccttc tcctccgggc tgtaattagc 1200 gcttggttta atgacggctt gtttcttttc tgtggctgcg tgaaagcctt gaggggctcc 1260 gggagctaga gcctctgcta accatgttca tgccttcttc tttttcctac agctcctggg 1320 caacgtgctg gttattgtgc tgtctcatca ttttggcaaa ggctagcgcc gccaccatga 1380 gcatgggcgc ccccagaagc ctgttacttg ctttagctgc tggccttgca gtggcaaggc 1440 cccctaacat cgtgctgatc tttgcagatg acttgggata tggggatctt ggttgttatg 1500 gccacccatc aagcacaact cccaatctgg atcagttggc tgcaggaggt ctgaggttta 1560 cagactttta tgttccagtc tccctgtgca ctccttctcg ggctgccctg cttactggga 1620 ggctccctgt gagaatgggt atgtaccctg gagtgttggt cccatccagc aggggagggc 1680 tgcccctgga agaggtgaca gtggcagagg tgctggcagc acgaggctat ctgactggca 1740 tggcaggcaa gtggcacctg ggtgtagggc cagagggtgc tttcctgcct ccccatcagg 1800 gctttcatag gtttctggga atcccatact ctcatgacca aggaccctgc cagaacctca 1860 cctgtttccc ccctgcaaca ccatgtgatg ggggctgtga tcaaggtctg gttcctatac 1920 cactgcttgc taatctttca gtggaagctc aaccaccctg gctgcctggc ttggaggcta 1980 gatacatggc cttcgcacat gatctgatgg cagatgccca gagacaagat aggcctttct 2040 tcctctacta tgcatctcac cacacccact atcctcagtt ctcaggccaa tcatttgctg 2100 agcgtagtgg caggggccca tttggggaca gtttgatgga actggatgcc gcagttggta 2160 ccctcatgac agcaataggg gacttaggtt tgctggagga aacattggta attttcacag 2220 ctgataatgg ccctgagaca atgagaatgt ctaggggagg ctgctctggt cttctgaggt 2280 gtggtaaagg gactacatat gagggaggag tgagggaacc agctcttgcc ttttggccag 2340 gtcacatagc ccctggagtt acacatgaac tagcttcttc cctggacttg cttcctacac 2400 tggcagccct ggcaggtgcc cctctcccta atgtaacttt agatggattt gacctctctc 2460 cactactttt agggacaggg aaaagtccaa ggcagtcctt attcttctat ccttcctacc 2520 cagatgaggt gaggggtgtt tttgccgtga ggactgggaa atacaaagct cattttttta 2580 cccagggatc agctcattca gacaccacag ctgatcctgc ctgtcatgcc agcagtagct 2640 tgacagcaca tgagcctccc ttactgtatg acctgagcaa ggacccaggg gagaactata 2700 acctgcttgg gggggttgct ggggccaccc cagaagtgct tcaggcacta aagcagctgc 2760 aactgcttaa agcacagttg gatgctgcag tgacctttgg cccttcccag gtggccagag 2820 gcgaggatcc cgccctgcag atctgctgcc acccaggctg cacacccaga cctgcctgct 2880 gtcactgccc cgacccacac gccggcagcg gagctactaa cttcagcctg ctgaagcagg 2940 ctggagacgt ggaggagaac cctggaccta tggctgcccc agccctgggg ctggtgtgtg 3000 gcagatgccc tgagctgggc ctggtgctgc ttctcctgct gctgagcctc ctgtgtggtg 3060 ctgctggctc tcaggaagca gggacaggag caggagcagg ttctctggct ggctcatgcg 3120 gttgtgggac cccccagagg ccaggggctc atgggtcctc tgcagctgcc cacaggtact 3180 caagggaagc aaatgcccct ggccccgtac ctggggaaag gcaacttgct cactccaaga 3240 tggttcctat ccctgcagga gtttttacta tgggaactga tgaccctcag atcaagcagg 3300 atggtgaagc accagctagg agagtcacaa ttgatgcctt ctatatggat gcctatgaag 3360 tgtcaaacac agaatttgag aaatttgtaa acagcactgg ataccttaca gaggctgaga 3420 aatttggtga cagttttgtt tttgaaggca tgctaagtga gcaggtgaag accaatatcc 3480 aacaggcagt ggctgcagcc ccctggtggc tgcctgttaa aggagccaat tggagacacc 3540 cagagggacc agactcaact atcctccaca ggcctgacca ccctgtgctg catgtgtcct 3600 ggaatgatgc agtggcatac tgcacctggg ctgggaaaag gttaccaaca gaggcagaat 3660 gggagtattc ctgccggggt ggactgcaca acagactgtt cccctggggc aataagctgc 3720 aacctaaagg acagcattat gccaatattt ggcagggaga gttcccagtc acaaacactg 3780 gtgaggatgg cttccaggga actgcccctg tggatgcttt cccacccaat ggctatgggt 3840 tgtacaatat agttgggaat gcctgggagt ggacttctga ctggtggacg gtccatcaca 3900 gtgtggaaga gacactgaac ccaaaggggc ccccctcagg caaggacaga gtcaagaaag 3960 gtggctctta tatgtgtcac agaagctatt gctacagata taggtgtgct gcaagaagtc 4020 agaacacccc tgacagctca gctagcaatc tgggatttag atgtgcagca gatagactcc 4080 ccaccatgga ctgagatcca gacatgataa gatacattga tgagtttgga caaaccacaa 4140 ctagaatgca gtgaaaaaaa tgctttattt gtgaaatttg tgatgctatt gctttatttg 4200 taaccattat aagctgcaat aaacaagtta acaacaacaa ttgcattcat tttatgtttc 4260 aggttcaggg ggaggtgtgg gaggtttttt aaacctgcag gtctagatac gtagataagt 4320 agcatggcgg gttaatcatt aactacaagg aacccctagt gatggagttg gccactccct 4380 ctctgcgcgc tcgctcgctc actgaggccg ggcgaccaaa ggtcgcccga cgcccgggct 4440 ttgcccgggc ggcctcagtg agcgagcgag cgcgcagaga gggagtggcc aa 4492 <210> 70 <211> 7537 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 70 aaagcgggca gtgagcgcaa cgcaattaat gtgagttagc tcactcatta ggcaccccag 60 gctttacact ttatgcttcc ggctcgtatg ttgtgtggaa ttgtgagcgg ataacaattt 120 cacacaggaa acagctatga ccatgattac gccaagctta gatccccggg taccgagctc 180 gaattcactg gccgtcgttt tacaacgtcg tgactgggaa aaccctggcg ttacccaact 240 taatcgcctt gcagcacatc cccctttcgc cagctggcgt aatagcgaag aggcccgcac 300 cgatcgccct tcccaacagt tgcgcagcct gaatggcgaa tggcgcctga tgcggtattt 360 tctccttacg catctgtgcg gtatttcaca ccgcatatgg tgcactctca gtacaatctg 420 ctctgatgcc gcatagttaa gccagccccg acacccgcca acacccgctg acgcgccctg 480 acgggcttgt ctgctcccgg catccgctta cagacaagct gtgaccgtct ccgggagctg 540 catgtgtcag aggttttcac cgtcatcacc gaaacgcgcg agacgaaagg gcctcgtgat 600 acgcctattt ttataggtta atgtcatgat aataatggtt tcttagacgt caggtggcac 660 ttttcgggga aatgtggcat gcctgcattt ggccactccc tctctgcgcg ctcgctcgct 720 cactgaggcc gggcgaccaa aggtcgcccg acgcccgggc tttgcccggg cggcctcagt 780 gagcgagcga gcgcgcagag agggagtggc caactccatc actaggggtt cctggagggg 840 tggagtcgtg acgtgaatta cgtcataggg ttagggaggt cctgcatatg cggccgcggc 900 atcctaaaaa atattcagtg gaaacgtaaa aacattaaag actgattaaa catcgcagca 960 tgacacagat ttagcaactg agcataaata atttgactcg gatactgctc caaaatccga 1020 agaggaccaa tttcttccag gaggacaact acctcgtcct ctgcagaccc ctctcctcgg 1080 cagctgaagg agtgtggcca atctgcctcc acctccccgc ggacccccta ctctcaggac 1140 ctcctgcagc accccaaact ggaagtggcc gctgcagacc caaggacgag gggcacgcgg 1200 gagccggcag ccctagtgga gcggttggag atgttgaggt gggagggtca cccaggtggg 1260 gtgaggctgg ggtaggtagc ggagtgaacg gcttccgaag ctctgggccg cccccaggtt 1320 ggactaagca ggcgctctgt cttcgccccc gcccagggtg ggcgtctcct gaggactccc 1380 cgccacacct gacccgagac cgcgcgccca gcctagaacg cttccccgac ccagcgtagg 1440 gccgccgcga ctggcgggcg agggtcggcg ggaggcctgg cgaacccggg ggcgggacca 1500 ggcgggcaag gcccggctgc cgcagcgccg ctctgcgcga ggcggctccg ccgcggcgga 1560 gggatacggc gcaccatata tatatcgcgg ggcgcagact cgcgctccgg cagtggtgct 1620 gggagtgtcg tggacgccgt gccgttactc gtagtcaggc ggcggcgcag gcggcggcgg 1680 cggcatagcg cacagcgcgc cttagcagca gcagcagcag cagcggcatc ggaggtaccc 1740 ccgccgtcgc agcccccgcg ctggtgcagc caccctcgct ccctctgctc ttcctccctt 1800 cgctcgcacc aagaggtaag ggtttaaggg atggttggtt ggtggggtat taatgtttaa 1860 ttacctggag cacctgcctg aaatcacttt ttttcaggtt gggccacccg ccgccaccat 1920 gagcatgggc gcccccagaa gcctgttact tgctttagct gctggccttg cagtggcaag 1980 gccccctaac atcgtgctga tctttgcaga tgacttggga tatggggatc ttggttgtta 2040 tggccaccca tcaagcacaa ctcccaatct ggatcagttg gctgcaggag gtctgaggtt 2100 tacagacttt tatgttccag tctccctgtg cactccttct cgggctgccc tgcttactgg 2160 gaggctccct gtgagaatgg gtatgtaccc tggagtgttg gtcccatcca gcaggggagg 2220 gctgcccctg gaagaggtga cagtggcaga ggtgctggca gcacgaggct atctgactgg 2280 catggcaggc aagtggcacc tgggtgtagg gccagagggt gctttcctgc ctccccatca 2340 gggctttcat aggtttctgg gaatcccata ctctcatgac caaggaccct gccagaacct 2400 cacctgtttc ccccctgcaa caccatgtga tgggggctgt gatcaaggtc tggttcctat 2460 accactgctt gctaatcttt cagtggaagc tcaaccaccc tggctgcctg gcttggaggc 2520 tagatacatg gccttcgcac atgatctgat ggcagatgcc cagagacaag ataggccttt 2580 cttcctctac tatgcatctc accacaccca ctatcctcag ttctcaggcc aatcatttgc 2640 tgagcgtagt ggcaggggcc catttgggga cagtttgatg gaactggatg ccgcagttgg 2700 taccctcatg acagcaatag gggacttagg tttgctggag gaaacattgg taattttcac 2760 agctgataat ggccctgaga caatgagaat gtctagggga ggctgctctg gtcttctgag 2820 gtgtggtaaa gggactacat atgagggagg agtgagggaa ccagctcttg ccttttggcc 2880 aggtcacata gcccctggag ttacacatga actagcttct tccctggact tgcttcctac 2940 actggcagcc ctggcaggtg cccctctccc taatgtaact ttagatggat ttgacctctc 3000 tccactactt ttagggacag ggaaaagtcc aaggcagtcc ttattcttct atccttccta 3060 cccagatgag gtgaggggtg tttttgccgt gaggactggg aaatacaaag ctcatttttt 3120 tacccaggga tcagctcatt cagacaccac agctgatcct gcctgtcatg ccagcagtag 3180 cttgacagca catgagcctc ccttactgta tgacctgagc aaggacccag gggagaacta 3240 taacctgctt gggggggttg ctggggccac cccagaagtg cttcaggcac taaagcagct 3300 gcaactgctt aaagcacagt tggatgctgc agtgaccttt ggcccttccc aggtggccag 3360 aggcgaggat cccgccctgc agatctgctg ccacccaggc tgcacaccca gacctgcctg 3420 ctgtcactgc cccgacccac acgccggcag cggagctact aacttcagcc tgctgaagca 3480 ggctggagac gtggaggaga accctggacc tatggctgcc ccagccctgg ggctggtgtg 3540 tggcagatgc cctgagctgg gcctggtgct gcttctcctg ctgctgagcc tcctgtgtgg 3600 tgctgctggc tctcaggaag cagggacagg agcaggagca ggttctctgg ctggctcatg 3660 cggttgtggg accccccaga ggccaggggc tcatgggtcc tctgcagctg cccacaggta 3720 ctcaagggaa gcaaatgccc ctggccccgt acctggggaa aggcaacttg ctcactccaa 3780 gatggttcct atccctgcag gagtttttac tatgggaact gatgaccctc agatcaagca 3840 ggatggtgaa gcaccagcta ggagagtcac aattgatgcc ttctatatgg atgcctatga 3900 agtgtcaaac acagaatttg agaaatttgt aaacagcact ggatacctta cagaggctga 3960 gaaatttggt gacagttttg tttttgaagg catgctaagt gagcaggtga agaccaatat 4020 ccaacaggca gtggctgcag ccccctggtg gctgcctgtt aaaggagcca attggagaca 4080 cccagaggga ccagactcaa ctatcctcca caggcctgac caccctgtgc tgcatgtgtc 4140 ctggaatgat gcagtggcat actgcacctg ggctgggaaa aggttaccaa cagaggcaga 4200 atgggagtat tcctgccggg gtggactgca caacagactg ttcccctggg gcaataagct 4260 gcaacctaaa ggacagcatt atgccaatat ttggcaggga gagttcccag tcacaaacac 4320 tggtgaggat ggcttccagg gaactgcccc tgtggatgct ttcccaccca atggctatgg 4380 gttgtacaat atagttggga atgcctggga gtggacttct gactggtgga cggtccatca 4440 cagtgtggaa gagacactga acccaaaggg gcccccctca ggcaaggaca gagtcaagaa 4500 aggtggctct tatatgtgtc acagaagcta ttgctacaga tataggtgtg ctgcaagaag 4560 tcagaacacc cctgacagct cagctagcaa tctgggattt agatgtgcag cagatagact 4620 ccccaccatg gactgagatc cagacatgat aagatacatt gatgagtttg gacaaaccac 4680 aactagaatg cagtgaaaaa aatgctttat ttgtgaaatt tgtgatgcta ttgctttatt 4740 tgtaaccatt ataagctgca ataaacaagt taacaacaac aattgcattc attttatgtt 4800 tcaggttcag ggggaggtgt gggaggtttt ttaaacctgc aggtctagat acgtagataa 4860 gtagcatggc gggttaatca ttaactacaa ggaaccccta gtgatggagt tggccactcc 4920 ctctctgcgc gctcgctcgc tcactgaggc cgggcgacca aaggtcgccc gacgcccggg 4980 ctttgcccgg gcggcctcag tgagcgagcg agcgcgcaga gagggagtgg ccaaagatcc 5040 ccgggtaccg agctcgaatt cactggccgt cgttttacaa cgtcgtgact gggaaaaccc 5100 tggcgttacc caacttaatc gccttgcagc acatccccct ttcgccagct ggcgtaatag 5160 cgaagaggcc cgcaccgatc gcccttccca acagttgcgc agcctgaatg gcgaatggcg 5220 cctgatgcgg tattttctcc ttacgcatct gtgcggtatt tcacaccgca tatggtgcac 5280 tctcagtaca atctgctctg atgccgcata gttaagccag ccccgacacc cgccaacacc 5340 cgctgacgcg ccctgacggg cttgtctgct cccggcatcc gcttacagac aagctgtgac 5400 cgtctccggg agctgcatgt gtcagaggtt ttcaccgtca tcaccgaaac gcgcgagacg 5460 aaagggcctc gtgatacgcc tatttttata ggttaatgtc atgataataa tggtttctta 5520 gacgtcaggt ggcacttttc ggggaaatgt gcgcggaacc cctatttgtt tatttttcta 5580 aatacattca aatatgtatc cgctcatgag acaataaccc tgataaatgc ttcaataata 5640 ttgaaaaagg aagagtatga gtattcaaca tttccgtgtc gcccttattc ccttttttgc 5700 ggcattttgc cttcctgttt ttgctcaccc agaaacgctg gtgaaagtaa aagatgctga 5760 agatcagttg ggtgcacgag tgggttacat cgaactggat ctcaacagcg gtaagatcct 5820 tgagagtttt cgccccgaag aacgttttcc aatgatgagc acttttaaag ttctgctatg 5880 tggcgcggta ttatcccgta ttgacgccgg gcaagagcaa ctcggtcgcc gcatacacta 5940 ttctcagaat gacttggttg agtactcacc agtcacagaa aagcatctta cggatggcat 6000 gacagtaaga gaattatgca gtgctgccat aaccatgagt gataacactg cggccaactt 6060 acttctgaca acgatcggag gaccgaagga gctaaccgct tttttgcaca acatggggga 6120 tcatgtaact cgccttgatc gttgggaacc ggagctgaat gaagccatac caaacgacga 6180 gcgtgacacc acgatgcctg tagcaatggc aacaacgttg cgcaaactat taactggcga 6240 actacttact ctagcttccc ggcaacaatt aatagactgg atggaggcgg ataaagttgc 6300 aggaccactt ctgcgctcgg cccttccggc tggctggttt attgctgata aatctggagc 6360 cggtgagcgt gggtctcgcg gtatcattgc agcactgggg ccagatggta agccctcccg 6420 tatcgtagtt atctacacga cggggagtca ggcaactatg gatgaacgaa atagacagat 6480 cgctgagata ggtgcctcac tgattaagca ttggtaactg tcagaccaag tttactcata 6540 tatactttag attgatttaa aacttcattt ttaatttaaa aggatctagg tgaagatcct 6600 ttttgataat ctcatgacca aaatccctta acgtgagttt tcgttccact gagcgtcaga 6660 ccccgtagaa aagatcaaag gatcttcttg agatcctttt tttctgcgcg taatctgctg 6720 cttgcaaaca aaaaaaccac cgctaccagc ggtggtttgt ttgccggatc aagagctacc 6780 aactcttttt ccgaaggtaa ctggcttcag cagagcgcag ataccaaata ctgttcttct 6840 agtgtagccg tagttaggcc accacttcaa gaactctgta gcaccgccta catacctcgc 6900 tctgctaatc ctgttaccag tggctgctgc cagtggcgat aagtcgtgtc ttaccgggtt 6960 ggactcaaga cgatagttac cggataaggc gcagcggtcg ggctgaacgg ggggttcgtg 7020 cacacagccc agcttggagc gaacgaccta caccgaactg agatacctac agcgtgagct 7080 atgagaaagc gccacgcttc ccgaagggag aaaggcggac aggtatccgg taagcggcag 7140 ggtcggaaca ggagagcgca cgagggagct tccaggggga aacgcctggt atctttatag 7200 tcctgtcggg tttcgccacc tctgacttga gcgtcgattt ttgtgatgct cgtcaggggg 7260 gcggagccta tggaaaaacg ccagcaacgc ggccttttta cggttcctgg ccttttgctg 7320 gccttttgct cacatgttct ttcctgcgtt atcccctgat tctgtggata accgtattac 7380 cgcctttgag tgagctgata ccgctcgccg cagccgaacg accgagcgca gcgagtcagt 7440 gagcgaggaa gcggaagagc gcccaatacg caaaccgcct ctccccgcgc gttggccgat 7500 tcattaatgc agctggcacg acaggtttcc cgactgg 7537 <210> 71 <211> 6335 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 71 gtcaggtggc acttttcggg gaaatgtggc atgcctgcat ttggccactc cctctctgcg 60 cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc cgacgcccgg gctttgcccg 120 ggcggcctca gtgagcgagc gagcgcgcag agagggagtg gccaactcca tcactagggg 180 ttcctggagg ggtggagtcg tgacgtgaat tacgtcatag ggttagggag gtcctgcata 240 tgcggccgca cctaggtcat tctggcctcc ccctccctca aggccagtca ttctggcctg 300 tccttccccg aaggccagtc attctggcct ccccctcccc caaggccagt cattctggcc 360 ttcccctccc ttaaggccag agtactatcg attcacacaa aaaaccaaca cactattgca 420 atgaaaataa atttccttta ttaagcttaa ttcggtaccc tagttattaa tagtaatcaa 480 ttacggggtc attagttcat agcccatata tggagttccg cgttacataa cttacggtaa 540 atggcccgcc tggctgaccg cccaacgacc cccgcccatt gacgtcaata atgacgtatg 600 ttcccatagt aacgccaata gggactttcc attgacgtca atgggtggac tatttacggt 660 aaactgccca cttggcagta catcaagtgt atcatatgcc aagtacgccc cctattgacg 720 tcaatgacgg taaatggccc gcctggcatt atgcccagta catgacctta tgggactttc 780 ctacttggca gtacatctac gtattagtca tcgctattac catggtcgag gtgagcccca 840 cgttctgctt cactctcccc atctcccccc cctccccacc cccaattttg tatttattta 900 ttttttaatt attttgtgca gcgatggggg cggggggggg gggggggcgc gcgccaggcg 960 gggcggggcg gggcgagggg cggggcgggg cgaggcggag aggtgcggcg gcagccaatc 1020 agagcggcgc gctccgaaag tttcctttta tggcgaggcg gcggcggcgg cggccctata 1080 aaaagcgaag cgcgcggcgg gcgggagtcg ctgcgacgct gccttcgccc cgtgccccgc 1140 tccgccgccg cctcgcgccg cccgccccgg ctctgactga ccgcgttact cccacaggtg 1200 agcgggcggg acggcccttc tcctccgggc tgtaattagc gcttggttta atgacggctt 1260 gtttcttttc tgtggctgcg tgaaagcctt gaggggctcc gggagctaga gcctctgcta 1320 accatgttca tgccttcttc tttttcctac agctcctggg caacgtgctg gttattgtgc 1380 tgtctcatca ttttggcaaa ggctagcgcc gccaccatga gcatgggcgc ccccagaagc 1440 ctgttacttg ctttagctgc tggccttgca gtggcaaggc cccctaacat cgtgctgatc 1500 tttgcagatg acttgggata tggggatctt ggttgttatg gccacccatc aagcacaact 1560 cccaatctgg atcagttggc tgcaggaggt ctgaggttta cagactttta tgttccagtc 1620 tccctgtgca ctccttctcg ggctgccctg cttactggga ggctccctgt gagaatgggt 1680 atgtaccctg gagtgttggt cccatccagc aggggagggc tgcccctgga agaggtgaca 1740 gtggcagagg tgctggcagc acgaggctat ctgactggca tggcaggcaa gtggcacctg 1800 ggtgtagggc cagagggtgc tttcctgcct ccccatcagg gctttcatag gtttctggga 1860 atcccatact ctcatgacca aggaccctgc cagaacctca cctgtttccc ccctgcaaca 1920 ccatgtgatg ggggctgtga tcaaggtctg gttcctatac cactgcttgc taatctttca 1980 gtggaagctc aaccaccctg gctgcctggc ttggaggcta gatacatggc cttcgcacat 2040 gatctgatgg cagatgccca gagacaagat aggcctttct tcctctacta tgcatctcac 2100 cacacccact atcctcagtt ctcaggccaa tcatttgctg agcgtagtgg caggggccca 2160 tttggggaca gtttgatgga actggatgcc gcagttggta ccctcatgac agcaataggg 2220 gacttaggtt tgctggagga aacattggta attttcacag ctgataatgg ccctgagaca 2280 atgagaatgt ctaggggagg ctgctctggt cttctgaggt gtggtaaagg gactacatat 2340 gagggaggag tgagggaacc agctcttgcc ttttggccag gtcacatagc ccctggagtt 2400 acacatgaac tagcttcttc cctggacttg cttcctacac tggcagccct ggcaggtgcc 2460 cctctcccta atgtaacttt agatggattt gacctctctc cactactttt agggacaggg 2520 aaaagtccaa ggcagtcctt attcttctat ccttcctacc cagatgaggt gaggggtgtt 2580 tttgccgtga ggactgggaa atacaaagct cattttttta cccagggatc agctcattca 2640 gacaccacag ctgatcctgc ctgtcatgcc agcagtagct tgacagcaca tgagcctccc 2700 ttactgtatg acctgagcaa ggacccaggg gagaactata acctgcttgg gggggttgct 2760 ggggccaccc cagaagtgct tcaggcacta aagcagctgc aactgcttaa agcacagttg 2820 gatgctgcag tgacctttgg cccttcccag gtggccagag gcgaggatcc cgccctgcag 2880 atctgctgcc acccaggctg cacacccaga cctgcctgct gtcactgccc cgacccacac 2940 gccggcagcg gagctactaa cttcagcctg ctgaagcagg ctggagacgt ggaggagaac 3000 cctggaccta tggctgcccc agccctgggg ctggtgtgtg gcagatgccc tgagctgggc 3060 ctggtgctgc ttctcctgct gctgagcctc ctgtgtggtg ctgctggctc tcaggaagca 3120 gggacaggag caggagcagg ttctctggct ggctcatgcg gttgtgggac cccccagagg 3180 ccaggggctc atgggtcctc tgcagctgcc cacaggtact caagggaagc aaatgcccct 3240 ggccccgtac ctggggaaag gcaacttgct cactccaaga tggttcctat ccctgcagga 3300 gtttttacta tgggaactga tgaccctcag atcaagcagg atggtgaagc accagctagg 3360 agagtcacaa ttgatgcctt ctatatggat gcctatgaag tgtcaaacac agaatttgag 3420 aaatttgtaa acagcactgg ataccttaca gaggctgaga aatttggtga cagttttgtt 3480 tttgaaggca tgctaagtga gcaggtgaag accaatatcc aacaggcagt ggctgcagcc 3540 ccctggtggc tgcctgttaa aggagccaat tggagacacc cagagggacc agactcaact 3600 atcctccaca ggcctgacca ccctgtgctg catgtgtcct ggaatgatgc agtggcatac 3660 tgcacctggg ctgggaaaag gttaccaaca gaggcagaat gggagtattc ctgccggggt 3720 ggactgcaca acagactgtt cccctggggc aataagctgc aacctaaagg acagcattat 3780 gccaatattt ggcagggaga gttcccagtc acaaacactg gtgaggatgg cttccaggga 3840 actgcccctg tggatgcttt cccacccaat ggctatgggt tgtacaatat agttgggaat 3900 gcctgggagt ggacttctga ctggtggacg gtccatcaca gtgtggaaga gacactgaac 3960 ccaaaggggc ccccctcagg caaggacaga gtcaagaaag gtggctctta tatgtgtcac 4020 agaagctatt gctacagata taggtgtgct gcaagaagtc agaacacccc tgacagctca 4080 gctagcaatc tgggatttag atgtgcagca gatagactcc ccaccatgga ctgagatcca 4140 gacatgataa gatacattga tgagtttgga caaaccacaa ctagaatgca gtgaaaaaaa 4200 tgctttattt gtgaaatttg tgatgctatt gctttatttg taaccattat aagctgcaat 4260 aaacaagtta acaacaacaa ttgcattcat tttatgtttc aggttcaggg ggaggtgtgg 4320 gaggtttttt aaacctgcag gtctagatac gtagataagt agcatggcgg gttaatcatt 4380 aactacaagg aacccctagt gatggagttg gccactccct ctctgcgcgc tcgctcgctc 4440 actgaggccg ggcgaccaaa ggtcgcccga cgcccgggct ttgcccgggc ggcctcagtg 4500 agcgagcgag cgcgcagaga gggagtggcc aaagatcccc gggtaccgag gacgaattct 4560 ctagatatcg ctcaatactg accatttaaa tcatacctga cctccatagc agaaagtcaa 4620 aagcctccga ccggaggctt ttgacttgat cggcacgtaa gaggttccaa ctttcaccat 4680 aatgaaataa gatcactacc gggcgtattt tttgagttat cgagattttc aggagctaag 4740 gaagctaaaa tgagccatat tcaacgggaa acgtcttgct cgaggccgcg attaaattcc 4800 aacatggatg ctgatttata tgggtataaa tgggctcgcg ataatgtcgg gcaatcaggt 4860 gcgacaatct atcgattgta tgggaagccc gatgcgccag agttgtttct gaaacatggc 4920 aaaggtagcg ttgccaatga tgttacagat gagatggtca ggctaaactg gctgacggaa 4980 tttatgcctc ttccgaccat caagcatttt atccgtactc ctgatgatgc atggttactc 5040 accactgcga tcccagggaa aacagcattc caggtattag aagaatatcc tgattcaggt 5100 gaaaatattg ttgatgcgct ggcagtgttc ctgcgccggt tgcattcgat tcctgtttgt 5160 aattgtcctt ttaacggcga tcgcgtattt cgtctcgctc aggcgcaatc acgaatgaat 5220 aacggtttgg ttggtgcgag tgattttgat gacgagcgta atggctggcc tgttgaacaa 5280 gtctggaaag aaatgcataa gcttttgcca ttctcaccgg attcagtcgt cactcatggt 5340 gatttctcac ttgataacct tatttttgac gaggggaaat taataggttg tattgatgtt 5400 ggacgagtcg gaatcgcaga ccgataccag gatcttgcca tcctatggaa ctgcctcggt 5460 gagttttctc cttcattaca gaaacggctt tttcaaaaat atggtattga taatcctgat 5520 atgaataaat tgcagtttca cttgatgctc gatgagtttt tctgagggcc caaatgtaat 5580 cacctggctc accttcgggt gggcctttct gcgttgctgg cgtttttcca taggctccgc 5640 ccccctgacg agcatcacaa aaatcgatgc tcaagtcaga ggtggcgaaa cccgacagga 5700 ctataaagat accaggcgtt tccccctgga agctccctcg tgcgctctcc tgttccgacc 5760 ctgccgctta ccggatacct gtccgccttt ctcccttcgg gaagcgtggc gctttctcat 5820 agctcacgct gtaggtatct cagttcggtg taggtcgttc gctccaagct gggctgtgtg 5880 cacgaacccc ccgttcagcc cgaccgctgc gccttatccg gtaactatcg tcttgagtcc 5940 aacccggtaa gacacgactt atcgccactg gcagcagcca ctggtaacag gattagcaga 6000 gcgaggtatg taggcggtgc tacagagttc ttgaagtggt ggcctaacta cggctacact 6060 agaagaacag tatttggtat ctgcgctctg ctgaagccag ttacctcgga aaaagagttg 6120 gtagctcttg atccggcaaa caaaccaccg ctggtagcgg tggttttttt gtttgcaagc 6180 agcagattac gcgcagaaaa aaaggatctc aagaagatcc tttgattttc taccgaagaa 6240 aggcccaccc gtgaaggtga gccagtgagt tgattgcagt ccagttacgc tggagtctga 6300 ggctcgtcct gaatgatatc aagcttgaat tcgtt 6335 <210> 72 <211> 1527 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 72 atgtctatgg gggctcctcg ctccctgctg ctggcactgg ccgccgggct ggctgtcgca 60 agaccaccta atatcgtcct gatttttgca gacgatctgg gatacggcga cctgggatgc 120 tatggccacc caagctccac cacacccaac ctggaccagc tggcagcagg aggcctgcgg 180 ttcaccgact tctacgtgcc agtgagcctg tgcaccccct ccagagccgc cctgctgaca 240 ggcaggctgc cagtgcgcat gggcatgtat cctggcgtgc tggtgccatc tagcaggggc 300 ggcctgccac tggaggaggt gaccgtggca gaggtgctgg cagccagagg ctacctgaca 360 ggaatggccg gcaagtggca cctgggagtg ggaccagagg gagccttcct gccccctcac 420 cagggcttcc accggtttct gggcatccct tattctcacg accagggccc atgccagaac 480 ctgacctgtt ttccaccagc aacaccatgc gacggaggat gtgatcaggg cctggtgcca 540 atcccactgc tggcaaatct gagcgtggag gcacagcctc catggctgcc tggcctggag 600 gcaagataca tggccttcgc ccacgacctg atggcagatg cacagcggca ggatagacct 660 ttctttctgt actatgcctc ccaccacacc cactatccac agttcagcgg ccagtccttt 720 gccgagaggt ccggaagggg accattcggc gactctctga tggagctgga tgccgccgtg 780 ggcaccctga tgacagcaat cggcgacctg ggcctgctgg aggagacact ggtcatcttc 840 accgccgata acggccctga gacaatgcgg atgtctagag gcggatgcag cggcctgctg 900 agatgtggca agggaaccac atacgaggga ggcgtgcgcg agcctgccct ggcattttgg 960 ccaggacaca tcgcacctgg agtgacccac gagctggcct cctctctgga cctgctgcca 1020 acactggccg ccctggcagg agcacctctg ccaaatgtga ccctggacgg cttcgatctg 1080 agcccactgc tgctgggaac cggcaagtcc cctaggcagt ctctgttctt ttacccctcc 1140 tatcctgatg aggtgcgggg cgtgtttgcc gtgagaaccg gcaagtacaa ggcccacttc 1200 tttacacagg gctctgccca cagcgacacc acagcagatc cagcatgcca cgccagctcc 1260 tctctgaccg cacacgagcc acctctgctg tacgacctgt ccaaggatcc cggcgagaac 1320 tataatctgc tgggaggagt ggcaggagca acccctgagg tgctgcaggc cctgaagcag 1380 ctgcagctgc tgaaggcaca gctggacgca gcagtgacat tcggcccaag ccaggtggcc 1440 agaggcgagg atcccgccct gcagatctgc tgccacccag gctgcacacc cagacctgcc 1500 tgctgtcact gccccgaccc acacgcc 1527 <210> 73 <211> 237 <212> DNA <213> Homo sapiens <400> 73 ggggacgttt gccaggactg cattcagatg gtgactgaca tccagactgc tgtacggacc 60 aactccacct ttgtccaggc cttggtggaa catgtcaagg aggagtgtga ccgcctgggc 120 cctggcatgg ccgacatatg caagaactat atcagccagt attctgaaat tgctatccag 180 atgatgatgc acatgcaacc caaggagatc tgtgcgctgg ttgggttctg tgatgag 237 <210> 74 <211> 1833 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 74 atgtctatgg gggctcctcg ctccctgctg ctggcactgg ccgccgggct ggctgtcgca 60 agaccaccta atatcgtcct gatttttgca gacgatctgg gatacggcga cctgggatgc 120 tatggccacc caagctccac cacacccaac ctggaccagc tggcagcagg aggcctgcgg 180 ttcaccgact tctacgtgcc agtgagcctg tgcaccccct ccagagccgc cctgctgaca 240 ggcaggctgc cagtgcgcat gggcatgtat cctggcgtgc tggtgccatc tagcaggggc 300 ggcctgccac tggaggaggt gaccgtggca gaggtgctgg cagccagagg ctacctgaca 360 ggaatggccg gcaagtggca cctgggagtg ggaccagagg gagccttcct gccccctcac 420 cagggcttcc accggtttct gggcatccct tattctcacg accagggccc atgccagaac 480 ctgacctgtt ttccaccagc aacaccatgc gacggaggat gtgatcaggg cctggtgcca 540 atcccactgc tggcaaatct gagcgtggag gcacagcctc catggctgcc tggcctggag 600 gcaagataca tggccttcgc ccacgacctg atggcagatg cacagcggca ggatagacct 660 ttctttctgt actatgcctc ccaccacacc cactatccac agttcagcgg ccagtccttt 720 gccgagaggt ccggaagggg accattcggc gactctctga tggagctgga tgccgccgtg 780 ggcaccctga tgacagcaat cggcgacctg ggcctgctgg aggagacact ggtcatcttc 840 accgccgata acggccctga gacaatgcgg atgtctagag gcggatgcag cggcctgctg 900 agatgtggca agggaaccac atacgaggga ggcgtgcgcg agcctgccct ggcattttgg 960 ccaggacaca tcgcacctgg agtgacccac gagctggcct cctctctgga cctgctgcca 1020 acactggccg ccctggcagg agcacctctg ccaaatgtga ccctggacgg cttcgatctg 1080 agcccactgc tgctgggaac cggcaagtcc cctaggcagt ctctgttctt ttacccctcc 1140 tatcctgatg aggtgcgggg cgtgtttgcc gtgagaaccg gcaagtacaa ggcccacttc 1200 tttacacagg gctctgccca cagcgacacc acagcagatc cagcatgcca cgccagctcc 1260 tctctgaccg cacacgagcc acctctgctg tacgacctgt ccaaggatcc cggcgagaac 1320 tataatctgc tgggaggagt ggcaggagca acccctgagg tgctgcaggc cctgaagcag 1380 ctgcagctgc tgaaggcaca gctggacgca gcagtgacat tcggcccaag ccaggtggcc 1440 agaggcgagg atcccgccct gcagatctgc tgccacccag gctgcacacc cagacctgcc 1500 tgctgtcact gccccgaccc acacgccggc agcggagcta ctaacttcag cctgctgaag 1560 caggctggag acgtggagga gaaccctgga cctggggacg tttgccagga ctgcattcag 1620 atggtgactg acatccagac tgctgtacgg accaactcca cctttgtcca ggccttggtg 1680 gaacatgtca aggaggagtg tgaccgcctg ggccctggca tggccgacat atgcaagaac 1740 tatatcagcc agtattctga aattgctatc cagatgatga tgcacatgca acccaaggag 1800 atctgtgcgc tggttgggtt ctgtgatgag tga 1833 <210> 75 <211> 3698 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 75 ggcattgatt attgactagt tattaatagt aatcaattac ggggtcatta gttcatagcc 60 catatatgga gttccgcgtt acataactta cggtaaatgg cccgcctggc tgaccgccca 120 acgacccccg cccattgacg tcaataatga cgtatgttcc catagtaacg ccaataggga 180 ctttccattg acgtcaatgg gtggagtatt tacggtaaac tgcccacttg gcagtacatc 240 aagtgtatca tatgccaagt ccgcccccta ttgacgtcaa tgacggtaaa tggcccgcct 300 ggcattatgc ccagtacatg accttacggg actttcctac ttggcagtac atctacgtat 360 tagtcatcgc tattaccatg gtcgaggtga gccccacgtt ctgcttcact ctccccatct 420 cccccccctc cccaccccca attttgtatt tatttatttt ttaattattt tgtgcagcga 480 tgggggcggg gggggggggg gggcgcgcgc caggcggggc ggggcggggc gaggggcggg 540 gcggggcgag gcggagaggt gcggcggcag ccaatcagag cggcgcgctc cgaaagtttc 600 cttttatggc gaggcggcgg cggcggcggc cctataaaaa gcgaagcgcg cggcgggcgg 660 gagtcgctgc gcgctgcctt cgccccgtgc cccgctccgc cgccgcctcg cgccgcccgc 720 cccggctctg actgaccgcg ttactcccac aggtgagcgg gcgggacggc ccttctcctc 780 cgggctgtaa ttagcgcttg gtttaatgac ggcttgtttc ttttctgtgg ctgcgtgaaa 840 gccttgaggg gctccgggag ggccctttgt gcggggggag cggctcgggg ggtgcgtgcg 900 tgtgtgtgtg cgtggggagc gccgcgtgcg gctccgcgct gcccggcggc tgtgagcgct 960 gcgggcgcgg cgcggggctt tgtgcgctcc gcagtgtgcg cgaggggagc gcggccgggg 1020 gcggtgcccc gcggtgcggg gggggctgcg aggggaacaa aggctgcgtg cggggtgtgt 1080 gcgtgggggg gtgagcaggg ggtgtgggcg cgtcggtcgg gctgcaaccc cccctgcacc 1140 cccctccccg agttgctgag cacggcccgg cttcgggtgc ggggctccgt acggggcgtg 1200 gcgcggggct cgccgtgccg ggcggggggt ggcggcaggt gggggtgccg ggcggggcgg 1260 ggccgcctcg ggccggggag ggctcggggg aggggcgcgg cggcccccgg agcgccggcg 1320 gctgtcgagg cgcggcgagc cgcagccatt gccttttatg gtaatcgtgc gagagggcgc 1380 agggacttcc tttgtcccaa atctgtgcgg agccgaaatc tgggaggcgc cgccgcaccc 1440 cctctagcgg gcgcggggcg aagcggtgcg gcgccggcag gaaggaaatg ggcggggagg 1500 gccttcgtgc gtcgccgcgc cgccgtcccc ttctccctct ccagcctcgg ggctgtccgc 1560 ggggggacgg ctgccttcgg gggggacggg gcagggcggg gttcggcttc tggcgtgtga 1620 ccggcggctc tagagcctct gctaaccatg ttcatgcctt cttctttttc ctacagctcc 1680 tgggcaacgt gctggttatt gtgctgtctc atcattttgg caaagaattc cgccaccatg 1740 tctatggggg ctcctcgctc cctgctgctg gcactggccg ccgggctggc tgtcgcaaga 1800 ccacctaata tcgtcctgat ttttgcagac gatctgggat acggcgacct gggatgctat 1860 ggccacccaa gctccaccac acccaacctg gaccagctgg cagcaggagg cctgcggttc 1920 accgacttct acgtgccagt gagcctgtgc accccctcca gagccgccct gctgacaggc 1980 aggctgccag tgcgcatggg catgtatcct ggcgtgctgg tgccatctag caggggcggc 2040 ctgccactgg aggaggtgac cgtggcagag gtgctggcag ccagaggcta cctgacagga 2100 atggccggca agtggcacct gggagtggga ccagagggag ccttcctgcc ccctcaccag 2160 ggcttccacc ggtttctggg catcccttat tctcacgacc agggcccatg ccagaacctg 2220 acctgttttc caccagcaac accatgcgac ggaggatgtg atcagggcct ggtgccaatc 2280 ccactgctgg caaatctgag cgtggaggca cagcctccat ggctgcctgg cctggaggca 2340 agatacatgg ccttcgccca cgacctgatg gcagatgcac agcggcagga tagacctttc 2400 tttctgtact atgcctccca ccacacccac tatccacagt tcagcggcca gtcctttgcc 2460 gagaggtccg gaaggggacc attcggcgac tctctgatgg agctggatgc cgccgtgggc 2520 accctgatga cagcaatcgg cgacctgggc ctgctggagg agacactggt catcttcacc 2580 gccgataacg gccctgagac aatgcggatg tctagaggcg gatgcagcgg cctgctgaga 2640 tgtggcaagg gaaccacata cgagggaggc gtgcgcgagc ctgccctggc attttggcca 2700 ggacacatcg cacctggagt gacccacgag ctggcctcct ctctggacct gctgccaaca 2760 ctggccgccc tggcaggagc acctctgcca aatgtgaccc tggacggctt cgatctgagc 2820 ccactgctgc tgggaaccgg caagtcccct aggcagtctc tgttctttta cccctcctat 2880 cctgatgagg tgcggggcgt gtttgccgtg agaaccggca agtacaaggc ccacttcttt 2940 acacagggct ctgcccacag cgacaccaca gcagatccag catgccacgc cagctcctct 3000 ctgaccgcac acgagccacc tctgctgtac gacctgtcca aggatcccgg cgagaactat 3060 aatctgctgg gaggagtggc aggagcaacc cctgaggtgc tgcaggccct gaagcagctg 3120 cagctgctga aggcacagct ggacgcagca gtgacattcg gcccaagcca ggtggccaga 3180 ggcgaggatc ccgccctgca gatctgctgc cacccaggct gcacacccag acctgcctgc 3240 tgtcactgcc ccgacccaca cgccggcagc ggagctacta acttcagcct gctgaagcag 3300 gctggagacg tggaggagaa ccctggacct ggggacgttt gccaggactg cattcagatg 3360 gtgactgaca tccagactgc tgtacggacc aactccacct ttgtccaggc cttggtggaa 3420 catgtcaagg aggagtgtga ccgcctgggc cctggcatgg ccgacatatg caagaactat 3480 atcagccagt attctgaaat tgctatccag atgatgatgc acatgcaacc caaggagatc 3540 tgtgcgctgg ttgggttctg tgatgagtga actagtaact tgtttattgc agcttataat 3600 ggttacaaat aaagcaatag catcacaaat ttcacaaata aagcattttt ttcactgcat 3660 tctagttgtg gtttgtccaa actcatcaat gtatctta 3698 <210> 76 <211> 4231 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 76 ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 60 cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag agagggagtg 120 gccaactcca tcactagggg ttcctggagg ggtggagtcg tgacgtgaat tacgtcatag 180 ggttagggag gtcctgcaga tcttcaatat tggccattag ccatattatt cattggttat 240 atagcataaa tcaatattgg ctattggcca ttgcatacgt tgtatctata tcataatatg 300 tacatttata ttggctcatg tccaatatga ccgccatgtt ggcattgatt attgactagt 360 tattaatagt aatcaattac ggggtcatta gttcatagcc catatatgga gttccgcgtt 420 acataactta cggtaaatgg cccgcctggc tgaccgccca acgacccccg cccattgacg 480 tcaataatga cgtatgttcc catagtaacg ccaataggga ctttccattg acgtcaatgg 540 gtggagtatt tacggtaaac tgcccacttg gcagtacatc aagtgtatca tatgccaagt 600 ccgcccccta ttgacgtcaa tgacggtaaa tggcccgcct ggcattatgc ccagtacatg 660 accttacggg actttcctac ttggcagtac atctacgtat tagtcatcgc tattaccatg 720 gtcgaggtga gccccacgtt ctgcttcact ctccccatct cccccccctc cccaccccca 780 attttgtatt tatttatttt ttaattattt tgtgcagcga tgggggcggg gggggggggg 840 gggcgcgcgc caggcggggc ggggcggggc gaggggcggg gcggggcgag gcggagaggt 900 gcggcggcag ccaatcagag cggcgcgctc cgaaagtttc cttttatggc gaggcggcgg 960 cggcggcggc cctataaaaa gcgaagcgcg cggcgggcgg gagtcgctgc gcgctgcctt 1020 cgccccgtgc cccgctccgc cgccgcctcg cgccgcccgc cccggctctg actgaccgcg 1080 ttactcccac aggtgagcgg gcgggacggc ccttctcctc cgggctgtaa ttagcgcttg 1140 gtttaatgac ggcttgtttc ttttctgtgg ctgcgtgaaa gccttgaggg gctccgggag 1200 ggccctttgt gcggggggag cggctcgggg ggtgcgtgcg tgtgtgtgtg cgtggggagc 1260 gccgcgtgcg gctccgcgct gcccggcggc tgtgagcgct gcgggcgcgg cgcggggctt 1320 tgtgcgctcc gcagtgtgcg cgaggggagc gcggccgggg gcggtgcccc gcggtgcggg 1380 gggggctgcg aggggaacaa aggctgcgtg cggggtgtgt gcgtgggggg gtgagcaggg 1440 ggtgtgggcg cgtcggtcgg gctgcaaccc cccctgcacc cccctccccg agttgctgag 1500 cacggcccgg cttcgggtgc ggggctccgt acggggcgtg gcgcggggct cgccgtgccg 1560 ggcggggggt ggcggcaggt gggggtgccg ggcggggcgg ggccgcctcg ggccggggag 1620 ggctcggggg aggggcgcgg cggcccccgg agcgccggcg gctgtcgagg cgcggcgagc 1680 cgcagccatt gccttttatg gtaatcgtgc gagagggcgc agggacttcc tttgtcccaa 1740 atctgtgcgg agccgaaatc tgggaggcgc cgccgcaccc cctctagcgg gcgcggggcg 1800 aagcggtgcg gcgccggcag gaaggaaatg ggcggggagg gccttcgtgc gtcgccgcgc 1860 cgccgtcccc ttctccctct ccagcctcgg ggctgtccgc ggggggacgg ctgccttcgg 1920 gggggacggg gcagggcggg gttcggcttc tggcgtgtga ccggcggctc tagagcctct 1980 gctaaccatg ttcatgcctt cttctttttc ctacagctcc tgggcaacgt gctggttatt 2040 gtgctgtctc atcattttgg caaagaattc cgccaccatg tctatggggg ctcctcgctc 2100 cctgctgctg gcactggccg ccgggctggc tgtcgcaaga ccacctaata tcgtcctgat 2160 ttttgcagac gatctgggat acggcgacct gggatgctat ggccacccaa gctccaccac 2220 acccaacctg gaccagctgg cagcaggagg cctgcggttc accgacttct acgtgccagt 2280 gagcctgtgc accccctcca gagccgccct gctgacaggc aggctgccag tgcgcatggg 2340 catgtatcct ggcgtgctgg tgccatctag caggggcggc ctgccactgg aggaggtgac 2400 cgtggcagag gtgctggcag ccagaggcta cctgacagga atggccggca agtggcacct 2460 gggagtggga ccagagggag ccttcctgcc ccctcaccag ggcttccacc ggtttctggg 2520 catcccttat tctcacgacc agggcccatg ccagaacctg acctgttttc caccagcaac 2580 accatgcgac ggaggatgtg atcagggcct ggtgccaatc ccactgctgg caaatctgag 2640 cgtggaggca cagcctccat ggctgcctgg cctggaggca agatacatgg ccttcgccca 2700 cgacctgatg gcagatgcac agcggcagga tagacctttc tttctgtact atgcctccca 2760 ccacacccac tatccacagt tcagcggcca gtcctttgcc gagaggtccg gaaggggacc 2820 attcggcgac tctctgatgg agctggatgc cgccgtgggc accctgatga cagcaatcgg 2880 cgacctgggc ctgctggagg agacactggt catcttcacc gccgataacg gccctgagac 2940 aatgcggatg tctagaggcg gatgcagcgg cctgctgaga tgtggcaagg gaaccacata 3000 cgagggaggc gtgcgcgagc ctgccctggc attttggcca ggacacatcg cacctggagt 3060 gacccacgag ctggcctcct ctctggacct gctgccaaca ctggccgccc tggcaggagc 3120 acctctgcca aatgtgaccc tggacggctt cgatctgagc ccactgctgc tgggaaccgg 3180 caagtcccct aggcagtctc tgttctttta cccctcctat cctgatgagg tgcggggcgt 3240 gtttgccgtg agaaccggca agtacaaggc ccacttcttt acacagggct ctgcccacag 3300 cgacaccaca gcagatccag catgccacgc cagctcctct ctgaccgcac acgagccacc 3360 tctgctgtac gacctgtcca aggatcccgg cgagaactat aatctgctgg gaggagtggc 3420 aggagcaacc cctgaggtgc tgcaggccct gaagcagctg cagctgctga aggcacagct 3480 ggacgcagca gtgacattcg gcccaagcca ggtggccaga ggcgaggatc ccgccctgca 3540 gatctgctgc cacccaggct gcacacccag acctgcctgc tgtcactgcc ccgacccaca 3600 cgccggcagc ggagctacta acttcagcct gctgaagcag gctggagacg tggaggagaa 3660 ccctggacct ggggacgttt gccaggactg cattcagatg gtgactgaca tccagactgc 3720 tgtacggacc aactccacct ttgtccaggc cttggtggaa catgtcaagg aggagtgtga 3780 ccgcctgggc cctggcatgg ccgacatatg caagaactat atcagccagt attctgaaat 3840 tgctatccag atgatgatgc acatgcaacc caaggagatc tgtgcgctgg ttgggttctg 3900 tgatgagtga actagtaact tgtttattgc agcttataat ggttacaaat aaagcaatag 3960 catcacaaat ttcacaaata aagcattttt ttcactgcat tctagttgtg gtttgtccaa 4020 actcatcaat gtatcttagg tctagatacg tagataagta gcatggcggg ttaatcatta 4080 actacaagga acccctagtg atggagttgg ccactccctc tctgcgcgct cgctcgctca 4140 ctgaggccgg gcgaccaaag gtcgcccgac gcccgggctt tgcccgggcg gcctcagtga 4200 gcgagcgagc gcgcagagag ggagtggcca a 4231 <210> 77 <211> 6073 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 77 tttccatagg ctccgccccc ctgacgagca tcacaaaaat cgatgctcaa gtcagaggtg 60 gcgaaacccg acaggactat aaagatacca ggcgtttccc cctggaagct ccctcgtgcg 120 ctctcctgtt ccgaccctgc cgcttaccgg atacctgtcc gcctttctcc cttcgggaag 180 cgtggcgctt tctcatagct cacgctgtag gtatctcagt tcggtgtagg tcgttcgctc 240 caagctgggc tgtgtgcacg aaccccccgt tcagcccgac cgctgcgcct tatccggtaa 300 ctatcgtctt gagtccaacc cggtaagaca cgacttatcg ccactggcag cagccactgg 360 taacaggatt agcagagcga ggtatgtagg cggtgctaca gagttcttga agtggtggcc 420 taactacggc tacactagaa gaacagtatt tggtatctgc gctctgctga agccagttac 480 ctcggaaaaa gagttggtag ctcttgatcc ggcaaacaaa ccaccgctgg tagcggtggt 540 ttttttgttt gcaagcagca gattacgcgc agaaaaaaag gatctcaaga agatcctttg 600 attttctacc gaagaaaggc ccacccgtga aggtgagcca gtgagttgat tgcagtccag 660 ttacgctgga gtctgaggct cgtcctgaat gatatcaagc ttgaattcgt gtcaggtggc 720 acttttcggg gaaatgtggc atgcctgcat ttggccactc cctctctgcg cgctcgctcg 780 ctcactgagg ccgggcgacc aaaggtcgcc cgacgcccgg gctttgcccg ggcggcctca 840 gtgagcgagc gagcgcgcag agagggagtg gccaactcca tcactagggg ttcctggagg 900 ggtggagtcg tgacgtgaat tacgtcatag ggttagggag gtcctgcaga tcttcaatat 960 tggccattag ccatattatt cattggttat atagcataaa tcaatattgg ctattggcca 1020 ttgcatacgt tgtatctata tcataatatg tacatttata ttggctcatg tccaatatga 1080 ccgccatgtt ggcattgatt attgactagt tattaatagt aatcaattac ggggtcatta 1140 gttcatagcc catatatgga gttccgcgtt acataactta cggtaaatgg cccgcctggc 1200 tgaccgccca acgacccccg cccattgacg tcaataatga cgtatgttcc catagtaacg 1260 ccaataggga ctttccattg acgtcaatgg gtggagtatt tacggtaaac tgcccacttg 1320 gcagtacatc aagtgtatca tatgccaagt ccgcccccta ttgacgtcaa tgacggtaaa 1380 tggcccgcct ggcattatgc ccagtacatg accttacggg actttcctac ttggcagtac 1440 atctacgtat tagtcatcgc tattaccatg gtcgaggtga gccccacgtt ctgcttcact 1500 ctccccatct cccccccctc cccaccccca attttgtatt tatttatttt ttaattattt 1560 tgtgcagcga tgggggcggg gggggggggg gggcgcgcgc caggcggggc ggggcggggc 1620 gaggggcggg gcggggcgag gcggagaggt gcggcggcag ccaatcagag cggcgcgctc 1680 cgaaagtttc cttttatggc gaggcggcgg cggcggcggc cctataaaaa gcgaagcgcg 1740 cggcgggcgg gagtcgctgc gcgctgcctt cgccccgtgc cccgctccgc cgccgcctcg 1800 cgccgcccgc cccggctctg actgaccgcg ttactcccac aggtgagcgg gcgggacggc 1860 ccttctcctc cgggctgtaa ttagcgcttg gtttaatgac ggcttgtttc ttttctgtgg 1920 ctgcgtgaaa gccttgaggg gctccgggag ggccctttgt gcggggggag cggctcgggg 1980 ggtgcgtgcg tgtgtgtgtg cgtggggagc gccgcgtgcg gctccgcgct gcccggcggc 2040 tgtgagcgct gcgggcgcgg cgcggggctt tgtgcgctcc gcagtgtgcg cgaggggagc 2100 gcggccgggg gcggtgcccc gcggtgcggg gggggctgcg aggggaacaa aggctgcgtg 2160 cggggtgtgt gcgtgggggg gtgagcaggg ggtgtgggcg cgtcggtcgg gctgcaaccc 2220 cccctgcacc cccctccccg agttgctgag cacggcccgg cttcgggtgc ggggctccgt 2280 acggggcgtg gcgcggggct cgccgtgccg ggcggggggt ggcggcaggt gggggtgccg 2340 ggcggggcgg ggccgcctcg ggccggggag ggctcggggg aggggcgcgg cggcccccgg 2400 agcgccggcg gctgtcgagg cgcggcgagc cgcagccatt gccttttatg gtaatcgtgc 2460 gagagggcgc agggacttcc tttgtcccaa atctgtgcgg agccgaaatc tgggaggcgc 2520 cgccgcaccc cctctagcgg gcgcggggcg aagcggtgcg gcgccggcag gaaggaaatg 2580 ggcggggagg gccttcgtgc gtcgccgcgc cgccgtcccc ttctccctct ccagcctcgg 2640 ggctgtccgc ggggggacgg ctgccttcgg gggggacggg gcagggcggg gttcggcttc 2700 tggcgtgtga ccggcggctc tagagcctct gctaaccatg ttcatgcctt cttctttttc 2760 ctacagctcc tgggcaacgt gctggttatt gtgctgtctc atcattttgg caaagaattc 2820 cgccaccatg tctatggggg ctcctcgctc cctgctgctg gcactggccg ccgggctggc 2880 tgtcgcaaga ccacctaata tcgtcctgat ttttgcagac gatctgggat acggcgacct 2940 gggatgctat ggccacccaa gctccaccac acccaacctg gaccagctgg cagcaggagg 3000 cctgcggttc accgacttct acgtgccagt gagcctgtgc accccctcca gagccgccct 3060 gctgacaggc aggctgccag tgcgcatggg catgtatcct ggcgtgctgg tgccatctag 3120 caggggcggc ctgccactgg aggaggtgac cgtggcagag gtgctggcag ccagaggcta 3180 cctgacagga atggccggca agtggcacct gggagtggga ccagagggag ccttcctgcc 3240 ccctcaccag ggcttccacc ggtttctggg catcccttat tctcacgacc agggcccatg 3300 ccagaacctg acctgttttc caccagcaac accatgcgac ggaggatgtg atcagggcct 3360 ggtgccaatc ccactgctgg caaatctgag cgtggaggca cagcctccat ggctgcctgg 3420 cctggaggca agatacatgg ccttcgccca cgacctgatg gcagatgcac agcggcagga 3480 tagacctttc tttctgtact atgcctccca ccacacccac tatccacagt tcagcggcca 3540 gtcctttgcc gagaggtccg gaaggggacc attcggcgac tctctgatgg agctggatgc 3600 cgccgtgggc accctgatga cagcaatcgg cgacctgggc ctgctggagg agacactggt 3660 catcttcacc gccgataacg gccctgagac aatgcggatg tctagaggcg gatgcagcgg 3720 cctgctgaga tgtggcaagg gaaccacata cgagggaggc gtgcgcgagc ctgccctggc 3780 attttggcca ggacacatcg cacctggagt gacccacgag ctggcctcct ctctggacct 3840 gctgccaaca ctggccgccc tggcaggagc acctctgcca aatgtgaccc tggacggctt 3900 cgatctgagc ccactgctgc tgggaaccgg caagtcccct aggcagtctc tgttctttta 3960 cccctcctat cctgatgagg tgcggggcgt gtttgccgtg agaaccggca agtacaaggc 4020 ccacttcttt acacagggct ctgcccacag cgacaccaca gcagatccag catgccacgc 4080 cagctcctct ctgaccgcac acgagccacc tctgctgtac gacctgtcca aggatcccgg 4140 cgagaactat aatctgctgg gaggagtggc aggagcaacc cctgaggtgc tgcaggccct 4200 gaagcagctg cagctgctga aggcacagct ggacgcagca gtgacattcg gcccaagcca 4260 ggtggccaga ggcgaggatc ccgccctgca gatctgctgc cacccaggct gcacacccag 4320 acctgcctgc tgtcactgcc ccgacccaca cgccggcagc ggagctacta acttcagcct 4380 gctgaagcag gctggagacg tggaggagaa ccctggacct ggggacgttt gccaggactg 4440 cattcagatg gtgactgaca tccagactgc tgtacggacc aactccacct ttgtccaggc 4500 cttggtggaa catgtcaagg aggagtgtga ccgcctgggc cctggcatgg ccgacatatg 4560 caagaactat atcagccagt attctgaaat tgctatccag atgatgatgc acatgcaacc 4620 caaggagatc tgtgcgctgg ttgggttctg tgatgagtga actagtaact tgtttattgc 4680 agcttataat ggttacaaat aaagcaatag catcacaaat ttcacaaata aagcattttt 4740 ttcactgcat tctagttgtg gtttgtccaa actcatcaat gtatcttagg tctagatacg 4800 tagataagta gcatggcggg ttaatcatta actacaagga acccctagtg atggagttgg 4860 ccactccctc tctgcgcgct cgctcgctca ctgaggccgg gcgaccaaag gtcgcccgac 4920 gcccgggctt tgcccgggcg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 4980 aagatccccg ggtaccgagg acgaattctc tagatatcgc tcaatactga ccatttaaat 5040 catacctgac ctccatagca gaaagtcaaa agcctccgac cggaggcttt tgacttgatc 5100 ggcacgtaag aggttccaac tttcaccata atgaaataag atcactaccg ggcgtatttt 5160 ttgagttatc gagattttca ggagctaagg aagctaaaat gagccatatt caacgggaaa 5220 cgtcttgctc gaggccgcga ttaaattcca acatggatgc tgatttatat gggtataaat 5280 gggctcgcga taatgtcggg caatcaggtg cgacaatcta tcgattgtat gggaagcccg 5340 atgcgccaga gttgtttctg aaacatggca aaggtagcgt tgccaatgat gttacagatg 5400 agatggtcag gctaaactgg ctgacggaat ttatgcctct tccgaccatc aagcatttta 5460 tccgtactcc tgatgatgca tggttactca ccactgcgat cccagggaaa acagcattcc 5520 aggtattaga agaatatcct gattcaggtg aaaatattgt tgatgcgctg gcagtgttcc 5580 tgcgccggtt gcattcgatt cctgtttgta attgtccttt taacggcgat cgcgtatttc 5640 gtctcgctca ggcgcaatca cgaatgaata acggtttggt tggtgcgagt gattttgatg 5700 acgagcgtaa tggctggcct gttgaacaag tctggaaaga aatgcataag cttttgccat 5760 tctcaccgga ttcagtcgtc actcatggtg atttctcact tgataacctt atttttgacg 5820 aggggaaatt aataggttgt attgatgttg gacgagtcgg aatcgcagac cgataccagg 5880 atcttgccat cctatggaac tgcctcggtg agttttctcc ttcattacag aaacggcttt 5940 ttcaaaaata tggtattgat aatcctgata tgaataaatt gcagtttcac ttgatgctcg 6000 atgagttttt ctgagggccc aaatgtaatc acctggctca ccttcgggtg ggcctttctg 6060 cgttgctggc gtt 6073 <210> 78 <211> 42 <212> DNA <213> Artificial Sequence <220> <223> Synthetic nucleic acid sequence <400> 78 ggaaaaccaa taccaaaccc tctattagga ttggactcaa ca 42 <210> 79 <211> 3458 <212> DNA <213> Artificial Sequence <220> <223> Synthetic nucleic acid sequence <400> 79 ggcattgatt attgactagt tattaatagt aatcaattac ggggtcatta gttcatagcc 60 catatatgga gttccgcgtt acataactta cggtaaatgg cccgcctggc tgaccgccca 120 acgacccccg cccattgacg tcaataatga cgtatgttcc catagtaacg ccaataggga 180 ctttccattg acgtcaatgg gtggagtatt tacggtaaac tgcccacttg gcagtacatc 240 aagtgtatca tatgccaagt ccgcccccta ttgacgtcaa tgacggtaaa tggcccgcct 300 ggcattatgc ccagtacatg accttacggg actttcctac ttggcagtac atctacgtat 360 tagtcatcgc tattaccatg gtcgaggtga gccccacgtt ctgcttcact ctccccatct 420 cccccccctc cccaccccca attttgtatt tatttatttt ttaattattt tgtgcagcga 480 tgggggcggg gggggggggg gggcgcgcgc caggcggggc ggggcggggc gaggggcggg 540 gcggggcgag gcggagaggt gcggcggcag ccaatcagag cggcgcgctc cgaaagtttc 600 cttttatggc gaggcggcgg cggcggcggc cctataaaaa gcgaagcgcg cggcgggcgg 660 gagtcgctgc gcgctgcctt cgccccgtgc cccgctccgc cgccgcctcg cgccgcccgc 720 cccggctctg actgaccgcg ttactcccac aggtgagcgg gcgggacggc ccttctcctc 780 cgggctgtaa ttagcgcttg gtttaatgac ggcttgtttc ttttctgtgg ctgcgtgaaa 840 gccttgaggg gctccgggag ggccctttgt gcggggggag cggctcgggg ggtgcgtgcg 900 tgtgtgtgtg cgtggggagc gccgcgtgcg gctccgcgct gcccggcggc tgtgagcgct 960 gcgggcgcgg cgcggggctt tgtgcgctcc gcagtgtgcg cgaggggagc gcggccgggg 1020 gcggtgcccc gcggtgcggg gggggctgcg aggggaacaa aggctgcgtg cggggtgtgt 1080 gcgtgggggg gtgagcaggg ggtgtgggcg cgtcggtcgg gctgcaaccc cccctgcacc 1140 cccctccccg agttgctgag cacggcccgg cttcgggtgc ggggctccgt acggggcgtg 1200 gcgcggggct cgccgtgccg ggcggggggt ggcggcaggt gggggtgccg ggcggggcgg 1260 ggccgcctcg ggccggggag ggctcggggg aggggcgcgg cggcccccgg agcgccggcg 1320 gctgtcgagg cgcggcgagc cgcagccatt gccttttatg gtaatcgtgc gagagggcgc 1380 agggacttcc tttgtcccaa atctgtgcgg agccgaaatc tgggaggcgc cgccgcaccc 1440 cctctagcgg gcgcggggcg aagcggtgcg gcgccggcag gaaggaaatg ggcggggagg 1500 gccttcgtgc gtcgccgcgc cgccgtcccc ttctccctct ccagcctcgg ggctgtccgc 1560 ggggggacgg ctgccttcgg gggggacggg gcagggcggg gttcggcttc tggcgtgtga 1620 ccggcggctc tagagcctct gctaaccatg ttcatgcctt cttctttttc ctacagctcc 1680 tgggcaacgt gctggttatt gtgctgtctc atcattttgg caaagaattc cgccaccatg 1740 tctatggggg ctcctcgctc cctgctgctg gcactggccg ccgggctggc tgtcgcaaga 1800 ccacctaata tcgtcctgat ttttgcagac gatctgggat acggcgacct gggatgctat 1860 ggccacccaa gctccaccac acccaacctg gaccagctgg cagcaggagg cctgcggttc 1920 accgacttct acgtgccagt gagcctgtgc accccctcca gagccgccct gctgacaggc 1980 aggctgccag tgcgcatggg catgtatcct ggcgtgctgg tgccatctag caggggcggc 2040 ctgccactgg aggaggtgac cgtggcagag gtgctggcag ccagaggcta cctgacagga 2100 atggccggca agtggcacct gggagtggga ccagagggag ccttcctgcc ccctcaccag 2160 ggcttccacc ggtttctggg catcccttat tctcacgacc agggcccatg ccagaacctg 2220 acctgttttc caccagcaac accatgcgac ggaggatgtg atcagggcct ggtgccaatc 2280 ccactgctgg caaatctgag cgtggaggca cagcctccat ggctgcctgg cctggaggca 2340 agatacatgg ccttcgccca cgacctgatg gcagatgcac agcggcagga tagacctttc 2400 tttctgtact atgcctccca ccacacccac tatccacagt tcagcggcca gtcctttgcc 2460 gagaggtccg gaaggggacc attcggcgac tctctgatgg agctggatgc cgccgtgggc 2520 accctgatga cagcaatcgg cgacctgggc ctgctggagg agacactggt catcttcacc 2580 gccgataacg gccctgagac aatgcggatg tctagaggcg gatgcagcgg cctgctgaga 2640 tgtggcaagg gaaccacata cgagggaggc gtgcgcgagc ctgccctggc attttggcca 2700 ggacacatcg cacctggagt gacccacgag ctggcctcct ctctggacct gctgccaaca 2760 ctggccgccc tggcaggagc acctctgcca aatgtgaccc tggacggctt cgatctgagc 2820 ccactgctgc tgggaaccgg caagtcccct aggcagtctc tgttctttta cccctcctat 2880 cctgatgagg tgcggggcgt gtttgccgtg agaaccggca agtacaaggc ccacttcttt 2940 acacagggct ctgcccacag cgacaccaca gcagatccag catgccacgc cagctcctct 3000 ctgaccgcac acgagccacc tctgctgtac gacctgtcca aggatcccgg cgagaactat 3060 aatctgctgg gaggagtggc aggagcaacc cctgaggtgc tgcaggccct gaagcagctg 3120 cagctgctga aggcacagct ggacgcagca gtgacattcg gcccaagcca ggtggccaga 3180 ggcgaggatc ccgccctgca gatctgttgc caccccggct gcaccccaag acctgcctgt 3240 tgccattgcc ccgacccaca cgccggaaaa ccaataccaa accctctatt aggattggac 3300 tcaacataag attctagagt cgagccgcgg actagtaact tgtttattgc agcttataat 3360 ggttacaaat aaagcaatag catcacaaat ttcacaaata aagcattttt ttcactgcat 3420 tctagttgtg gtttgtccaa actcatcaat gtatctta 3458 <210> 80 <211> 3991 <212> DNA <213> Artificial Sequence <220> <223> Synthetic nucleic acid sequence <400> 80 ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 60 cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag agagggagtg 120 gccaactcca tcactagggg ttcctggagg ggtggagtcg tgacgtgaat tacgtcatag 180 ggttagggag gtcctgcaga tcttcaatat tggccattag ccatattatt cattggttat 240 atagcataaa tcaatattgg ctattggcca ttgcatacgt tgtatctata tcataatatg 300 tacatttata ttggctcatg tccaatatga ccgccatgtt ggcattgatt attgactagt 360 tattaatagt aatcaattac ggggtcatta gttcatagcc catatatgga gttccgcgtt 420 acataactta cggtaaatgg cccgcctggc tgaccgccca acgacccccg cccattgacg 480 tcaataatga cgtatgttcc catagtaacg ccaataggga ctttccattg acgtcaatgg 540 gtggagtatt tacggtaaac tgcccacttg gcagtacatc aagtgtatca tatgccaagt 600 ccgcccccta ttgacgtcaa tgacggtaaa tggcccgcct ggcattatgc ccagtacatg 660 accttacggg actttcctac ttggcagtac atctacgtat tagtcatcgc tattaccatg 720 gtcgaggtga gccccacgtt ctgcttcact ctccccatct cccccccctc cccaccccca 780 attttgtatt tatttatttt ttaattattt tgtgcagcga tgggggcggg gggggggggg 840 gggcgcgcgc caggcggggc ggggcggggc gaggggcggg gcggggcgag gcggagaggt 900 gcggcggcag ccaatcagag cggcgcgctc cgaaagtttc cttttatggc gaggcggcgg 960 cggcggcggc cctataaaaa gcgaagcgcg cggcgggcgg gagtcgctgc gcgctgcctt 1020 cgccccgtgc cccgctccgc cgccgcctcg cgccgcccgc cccggctctg actgaccgcg 1080 ttactcccac aggtgagcgg gcgggacggc ccttctcctc cgggctgtaa ttagcgcttg 1140 gtttaatgac ggcttgtttc ttttctgtgg ctgcgtgaaa gccttgaggg gctccgggag 1200 ggccctttgt gcggggggag cggctcgggg ggtgcgtgcg tgtgtgtgtg cgtggggagc 1260 gccgcgtgcg gctccgcgct gcccggcggc tgtgagcgct gcgggcgcgg cgcggggctt 1320 tgtgcgctcc gcagtgtgcg cgaggggagc gcggccgggg gcggtgcccc gcggtgcggg 1380 gggggctgcg aggggaacaa aggctgcgtg cggggtgtgt gcgtgggggg gtgagcaggg 1440 ggtgtgggcg cgtcggtcgg gctgcaaccc cccctgcacc cccctccccg agttgctgag 1500 cacggcccgg cttcgggtgc ggggctccgt acggggcgtg gcgcggggct cgccgtgccg 1560 ggcggggggt ggcggcaggt gggggtgccg ggcggggcgg ggccgcctcg ggccggggag 1620 ggctcggggg aggggcgcgg cggcccccgg agcgccggcg gctgtcgagg cgcggcgagc 1680 cgcagccatt gccttttatg gtaatcgtgc gagagggcgc agggacttcc tttgtcccaa 1740 atctgtgcgg agccgaaatc tgggaggcgc cgccgcaccc cctctagcgg gcgcggggcg 1800 aagcggtgcg gcgccggcag gaaggaaatg ggcggggagg gccttcgtgc gtcgccgcgc 1860 cgccgtcccc ttctccctct ccagcctcgg ggctgtccgc ggggggacgg ctgccttcgg 1920 gggggacggg gcagggcggg gttcggcttc tggcgtgtga ccggcggctc tagagcctct 1980 gctaaccatg ttcatgcctt cttctttttc ctacagctcc tgggcaacgt gctggttatt 2040 gtgctgtctc atcattttgg caaagaattc cgccaccatg tctatggggg ctcctcgctc 2100 cctgctgctg gcactggccg ccgggctggc tgtcgcaaga ccacctaata tcgtcctgat 2160 ttttgcagac gatctgggat acggcgacct gggatgctat ggccacccaa gctccaccac 2220 acccaacctg gaccagctgg cagcaggagg cctgcggttc accgacttct acgtgccagt 2280 gagcctgtgc accccctcca gagccgccct gctgacaggc aggctgccag tgcgcatggg 2340 catgtatcct ggcgtgctgg tgccatctag caggggcggc ctgccactgg aggaggtgac 2400 cgtggcagag gtgctggcag ccagaggcta cctgacagga atggccggca agtggcacct 2460 gggagtggga ccagagggag ccttcctgcc ccctcaccag ggcttccacc ggtttctggg 2520 catcccttat tctcacgacc agggcccatg ccagaacctg acctgttttc caccagcaac 2580 accatgcgac ggaggatgtg atcagggcct ggtgccaatc ccactgctgg caaatctgag 2640 cgtggaggca cagcctccat ggctgcctgg cctggaggca agatacatgg ccttcgccca 2700 cgacctgatg gcagatgcac agcggcagga tagacctttc tttctgtact atgcctccca 2760 ccacacccac tatccacagt tcagcggcca gtcctttgcc gagaggtccg gaaggggacc 2820 attcggcgac tctctgatgg agctggatgc cgccgtgggc accctgatga cagcaatcgg 2880 cgacctgggc ctgctggagg agacactggt catcttcacc gccgataacg gccctgagac 2940 aatgcggatg tctagaggcg gatgcagcgg cctgctgaga tgtggcaagg gaaccacata 3000 cgagggaggc gtgcgcgagc ctgccctggc attttggcca ggacacatcg cacctggagt 3060 gacccacgag ctggcctcct ctctggacct gctgccaaca ctggccgccc tggcaggagc 3120 acctctgcca aatgtgaccc tggacggctt cgatctgagc ccactgctgc tgggaaccgg 3180 caagtcccct aggcagtctc tgttctttta cccctcctat cctgatgagg tgcggggcgt 3240 gtttgccgtg agaaccggca agtacaaggc ccacttcttt acacagggct ctgcccacag 3300 cgacaccaca gcagatccag catgccacgc cagctcctct ctgaccgcac acgagccacc 3360 tctgctgtac gacctgtcca aggatcccgg cgagaactat aatctgctgg gaggagtggc 3420 aggagcaacc cctgaggtgc tgcaggccct gaagcagctg cagctgctga aggcacagct 3480 ggacgcagca gtgacattcg gcccaagcca ggtggccaga ggcgaggatc ccgccctgca 3540 gatctgttgc caccccggct gcaccccaag acctgcctgt tgccattgcc ccgacccaca 3600 cgccggaaaa ccaataccaa accctctatt aggattggac tcaacataag attctagagt 3660 cgagccgcgg actagtaact tgtttattgc agcttataat ggttacaaat aaagcaatag 3720 catcacaaat ttcacaaata aagcattttt ttcactgcat tctagttgtg gtttgtccaa 3780 actcatcaat gtatcttagg tctagatacg tagataagta gcatggcggg ttaatcatta 3840 actacaagga acccctagtg atggagttgg ccactccctc tctgcgcgct cgctcgctca 3900 ctgaggccgg gcgaccaaag gtcgcccgac gcccgggctt tgcccgggcg gcctcagtga 3960 gcgagcgagc gcgcagagag ggagtggcca a 3991 <210> 81 <211> 6654 <212> DNA <213> Artificial Sequence <220> <223> Synthetic nucleic acid sequence <400> 81 cgccagggtt ttcccagtca cgacgttgta aaacgacggc cagtgccaag cttgcatgcc 60 tgcatttggc cactccctct ctgcgcgctc gctcgctcac tgaggccggg cgaccaaagg 120 tcgcccgacg cccgggcttt gcccgggcgg cctcagtgag cgagcgagcg cgcagagagg 180 gagtggccaa ctccatcact aggggttcct ggaggggtgg agtcgtgacg tgaattacgt 240 catagggtta gggaggtcct gcagatcttc aatattggcc attagccata ttattcattg 300 gttatatagc ataaatcaat attggctatt ggccattgca tacgttgtat ctatatcata 360 atatgtacat ttatattggc tcatgtccaa tatgaccgcc atgttggcat tgattattga 420 ctagttatta atagtaatca attacggggt cattagttca tagcccatat atggagttcc 480 gcgttacata acttacggta aatggcccgc ctggctgacc gcccaacgac ccccgcccat 540 tgacgtcaat aatgacgtat gttcccatag taacgccaat agggactttc cattgacgtc 600 aatgggtgga gtatttacgg taaactgccc acttggcagt acatcaagtg tatcatatgc 660 caagtccgcc ccctattgac gtcaatgacg gtaaatggcc cgcctggcat tatgcccagt 720 acatgacctt acgggacttt cctacttggc agtacatcta cgtattagtc atcgctatta 780 ccatggtcga ggtgagcccc acgttctgct tcactctccc catctccccc ccctccccac 840 ccccaatttt gtatttattt attttttaat tattttgtgc agcgatgggg gcgggggggg 900 ggggggggcg cgcgccaggc ggggcggggc ggggcgaggg gcggggcggg gcgaggcgga 960 gaggtgcggc ggcagccaat cagagcggcg cgctccgaaa gtttcctttt atggcgaggc 1020 ggcggcggcg gcggccctat aaaaagcgaa gcgcgcggcg ggcgggagtc gctgcgcgct 1080 gccttcgccc cgtgccccgc tccgccgccg cctcgcgccg cccgccccgg ctctgactga 1140 ccgcgttact cccacaggtg agcgggcggg acggcccttc tcctccgggc tgtaattagc 1200 gcttggttta atgacggctt gtttcttttc tgtggctgcg tgaaagcctt gaggggctcc 1260 gggagggccc tttgtgcggg gggagcggct cggggggtgc gtgcgtgtgt gtgtgcgtgg 1320 ggagcgccgc gtgcggctcc gcgctgcccg gcggctgtga gcgctgcggg cgcggcgcgg 1380 ggctttgtgc gctccgcagt gtgcgcgagg ggagcgcggc cgggggcggt gccccgcggt 1440 gcgggggggg ctgcgagggg aacaaaggct gcgtgcgggg tgtgtgcgtg ggggggtgag 1500 cagggggtgt gggcgcgtcg gtcgggctgc aaccccccct gcacccccct ccccgagttg 1560 ctgagcacgg cccggcttcg ggtgcggggc tccgtacggg gcgtggcgcg gggctcgccg 1620 tgccgggcgg ggggtggcgg caggtggggg tgccgggcgg ggcggggccg cctcgggccg 1680 gggagggctc gggggagggg cgcggcggcc cccggagcgc cggcggctgt cgaggcgcgg 1740 cgagccgcag ccattgcctt ttatggtaat cgtgcgagag ggcgcaggga cttcctttgt 1800 cccaaatctg tgcggagccg aaatctggga ggcgccgccg caccccctct agcgggcgcg 1860 gggcgaagcg gtgcggcgcc ggcaggaagg aaatgggcgg ggagggcctt cgtgcgtcgc 1920 cgcgccgccg tccccttctc cctctccagc ctcggggctg tccgcggggg gacggctgcc 1980 ttcggggggg acggggcagg gcggggttcg gcttctggcg tgtgaccggc ggctctagag 2040 cctctgctaa ccatgttcat gccttcttct ttttcctaca gctcctgggc aacgtgctgg 2100 ttattgtgct gtctcatcat tttggcaaag aattccgcca ccatgtctat gggggctcct 2160 cgctccctgc tgctggcact ggccgccggg ctggctgtcg caagaccacc taatatcgtc 2220 ctgatttttg cagacgatct gggatacggc gacctgggat gctatggcca cccaagctcc 2280 accacaccca acctggacca gctggcagca ggaggcctgc ggttcaccga cttctacgtg 2340 ccagtgagcc tgtgcacccc ctccagagcc gccctgctga caggcaggct gccagtgcgc 2400 atgggcatgt atcctggcgt gctggtgcca tctagcaggg gcggcctgcc actggaggag 2460 gtgaccgtgg cagaggtgct ggcagccaga ggctacctga caggaatggc cggcaagtgg 2520 cacctgggag tgggaccaga gggagccttc ctgccccctc accagggctt ccaccggttt 2580 ctgggcatcc cttattctca cgaccagggc ccatgccaga acctgacctg ttttccacca 2640 gcaacaccat gcgacggagg atgtgatcag ggcctggtgc caatcccact gctggcaaat 2700 ctgagcgtgg aggcacagcc tccatggctg cctggcctgg aggcaagata catggccttc 2760 gcccacgacc tgatggcaga tgcacagcgg caggatagac ctttctttct gtactatgcc 2820 tcccaccaca cccactatcc acagttcagc ggccagtcct ttgccgagag gtccggaagg 2880 ggaccattcg gcgactctct gatggagctg gatgccgccg tgggcaccct gatgacagca 2940 atcggcgacc tgggcctgct ggaggagaca ctggtcatct tcaccgccga taacggccct 3000 gagacaatgc ggatgtctag aggcggatgc agcggcctgc tgagatgtgg caagggaacc 3060 acatacgagg gaggcgtgcg cgagcctgcc ctggcatttt ggccaggaca catcgcacct 3120 ggagtgaccc acgagctggc ctcctctctg gacctgctgc caacactggc cgccctggca 3180 ggagcacctc tgccaaatgt gaccctggac ggcttcgatc tgagcccact gctgctggga 3240 accggcaagt cccctaggca gtctctgttc ttttacccct cctatcctga tgaggtgcgg 3300 ggcgtgtttg ccgtgagaac cggcaagtac aaggcccact tctttacaca gggctctgcc 3360 cacagcgaca ccacagcaga tccagcatgc cacgccagct cctctctgac cgcacacgag 3420 ccacctctgc tgtacgacct gtccaaggat cccggcgaga actataatct gctgggagga 3480 gtggcaggag caacccctga ggtgctgcag gccctgaagc agctgcagct gctgaaggca 3540 cagctggacg cagcagtgac attcggccca agccaggtgg ccagaggcga ggatcccgcc 3600 ctgcagatct gttgccaccc cggctgcacc ccaagacctg cctgttgcca ttgccccgac 3660 ccacacgccg gaaaaccaat accaaaccct ctattaggat tggactcaac ataagattct 3720 agagtcgagc cgcggactag taacttgttt attgcagctt ataatggtta caaataaagc 3780 aatagcatca caaatttcac aaataaagca tttttttcac tgcattctag ttgtggtttg 3840 tccaaactca tcaatgtatc ttaggtctag atacgtagat aagtagcatg gcgggttaat 3900 cattaactac aaggaacccc tagtgatgga gttggccact ccctctctgc gcgctcgctc 3960 gctcactgag gccgggcgac caaaggtcgc ccgacgcccg ggctttgccc gggcggcctc 4020 agtgagcgag cgagcgcgca gagagggagt ggccaaagat ccccgggtac cgagctcgaa 4080 ttcgtaatca tgtcatagct gtttcctgtg tgaaattgtt atccgctcac aattccacac 4140 aacatacgag ccggaagcat aaagtgtaaa gcctggggtg cctaatgagt gagctaactc 4200 acattaattg cgttgcgctc actgcccgct ttccagtcgg gaaacctgtc gtgccagctg 4260 cattaatgaa tcggccaacg cgcggggaga ggcggtttgc gtattggcga acttttgctg 4320 agttgaagga tcagatcacg catcttcccg acaacgcaga ccgttccgtg gcaaagcaaa 4380 agttcaaaat cagtaaccgt cagtgccgat aagttcaaag ttaaacctgg tgttgatacc 4440 aacattgaaa cgctgatcga aaacgcgctg aaaaacgctg ctgaatgtgc gagcttcttc 4500 cgcttcctcg ctcactgact cgctgcgctc ggtcgttcgg ctgcggcgag cggtatcagc 4560 tcactcaaag gcggtaatac ggttatccac agaatcaggg gataacgcag gaaagaacat 4620 gtgagcaaaa ggccagcaaa aggccaggaa ccgtaaaaag gccgcgttgc tggcgttttt 4680 ccataggctc cgcccccctg acgagcatca caaaaatcga cgctcaagtc agaggtggcg 4740 aaacccgaca ggactataaa gataccaggc gtttccccct ggaagctccc tcgtgcgctc 4800 tcctgttccg accctgccgc ttaccggata cctgtccgcc tttctccctt cgggaagcgt 4860 ggcgctttct caatgctcac gctgtaggta tctcagttcg gtgtaggtcg ttcgctccaa 4920 gctgggctgt gtgcacgaac cccccgttca gcccgaccgc tgcgccttat ccggtaacta 4980 tcgtcttgag tccaacccgg taagacacga cttatcgcca ctggcagcag ccactggtaa 5040 caggattagc agagcgaggt atgtaggcgg tgctacagag ttcttgaagt ggtggcctaa 5100 ctacggctac actagaagga cagtatttgg tatctgcgct ctgctgaagc cagttacctt 5160 cggaaaaaga gttggtagct cttgatccgg caaacaaacc accgctggta gcggtggttt 5220 ttttgtttgc aagcagcaga ttacgcgcag aaaaaaagga tctcaagaag atcctttgat 5280 cttttctacg gggtctgacg ctcagtggaa cgatccgtcg agaggtctgc ctcgtgaaga 5340 aggtgttgct gactcatacc aggcctgaat cgccccatca tccagccaga aagtgaggga 5400 gccacggttg atgagagctt tgttgtaggt ggaccagttg gtgattttga acttttgctt 5460 tgccacggaa cggtctgcgt tgtcgggaag atgcgtgatc tgatccttca actcagcaaa 5520 agttcgattt attcaacaaa gccacgttgt gtctcaaaat ctctgatgtt acattgcaca 5580 agataaaaat atatcatcat gaacaataaa actgtctgct tacataaaca gtaatacaag 5640 gggtgttatg agccatattc aacgggaaac gtcttgctcg aagccgcgat taaattccaa 5700 catggatgct gatttatatg ggtataaatg ggctcgcgat aatgtcgggc aatcaggtgc 5760 gacaatctat cgattgtatg ggaagcccga tgcgccagag ttgtttctga aacatggcaa 5820 aggtagcgtt gccaatgatg ttacagatga gatggtcaga ctaaactggc tgacggaatt 5880 tatgcctctt ccgaccatca agcattttat ccgtactcct gatgatgcat ggttactcac 5940 cactgcgatc cccgggaaaa cagcattcca ggtattagaa gaatatcctg attcaggtga 6000 aaatattgtt gatgcgctgg cagtgttcct gcgccggttg cattcgattc ctgtttgtaa 6060 ttgtcctttt aacagcgatc gcgtatttcg tctcgctcag gcgcaatcac gaatgaataa 6120 cggtttggtt gatgcgagtg attttgatga cgagcgtaat ggctggcctg ttgaacaagt 6180 ctggaaagaa atgcataagc ttttgccatt ctcaccggat tcagtcgtca ctcatggtga 6240 tttctcactt gataacctta tttttgacga ggggaaatta ataggttgta ttgatgttgg 6300 acgagtcgga atcgcagacc gataccagga tcttgccatc ctatggaact gcctcggtga 6360 gttttctcct tcattacaga aacggctttt tcaaaaatat ggtattgata atcctgatat 6420 gaataaattg cagtttcatt tgatgctcga tgagtttttc taatcagaat tggttaattg 6480 gttgtaacac tggcagagca ttacgctgac ttgacgggac ggcggctttg ttgaataaat 6540 cgcattcgcc attcaggctg cgcaactgtt gggaagggcg atcggtgcgg gcctcttcgc 6600 tattacgcca gctggcgaaa gggggatgtg ctgcaaggcg attaagttgg gtaa 6654

Claims (83)

  1. 세포에서 아릴술파타아제 A(ARSA) 폴리펩티드를 발현하기 위한 방법으로서, 상기 방법은 재조합 아데노-연관 바이러스(rAAV)로 상기 세포를 형질도입하는 단계를 포함하되, 상기 재조합 아데노-연관 바이러스는,
    (a) AAV 캡시드 단백질을 포함하는 AAV 캡시드; 및
    (b) 침묵적으로 변형된 ARSA 코딩 서열에 작동 가능하게 연결된 전사 조절 요소를 포함하는 전달 게놈을 포함하는, 방법.
  2. 제1항에 있어서, 상기 세포는 뉴런 및/또는 신경교세포이되, 선택적으로 상기 세포는 상기 중추 신경계 및/또는 상기 말초 신경계의 뉴런 및/또는 신경교세포인, 방법.
  3. 제1항에 있어서, 상기 세포는 척수, 운동 피질, 감각 피질, 해마, 피각, 소뇌, 선택적으로 소뇌 핵, 및 이들의 임의의 조합으로 이루어진 군으로부터 선택된 중추 신경계 영역의 세포인, 방법.
  4. 제1항에 있어서, 상기 세포는 운동 뉴런, 성상교세포, 희소돌기교세포, 중추 신경계의 대뇌 피질의 세포, 말초 신경계의 감각 뉴런, 슈반 세포, 및 이들의 임의의 조합으로 이루어진 군으로부터 선택되는, 방법.
  5. 제1항 내지 제4항 중 어느 한 항에 있어서, 상기 세포는 포유류 대상체에 존재하고, 상기 AAV는 상기 대상체에서 상기 세포를 형질도입하기에 효과적인 양으로 상기 대상체에게 투여되는, 방법.
  6. 이염색 백색질장애(MLD)를 앓고 있는 대상체를 치료하는 방법으로서, 상기 방법은:
    (a) 캡시드 단백질을 포함하는 AAV 캡시드; 및
    (b) 침묵적으로 변형된 ARSA 코딩 서열에 작동 가능하게 연결된 전사 조절 요소를 포함하는 전달 게놈을 포함하는 rAAV의 유효량을 상기 대상체에게 투여하는 단계를 포함하는, 방법.
  7. 제1항 내지 제9항 중 어느 한 항에 있어서, 상기 침묵적으로 변형된 ARSA 코딩 서열은 서열 번호 23에 제시된 아미노산 서열을 암호화하는, 방법.
  8. 제7항에 있어서, 상기 침묵적으로 변형된 ARSA 코딩 서열은 서열번호 14, 62, 또는 72에 제시된 뉴클레오티드 서열을 포함하는, 방법.
  9. 제1항 내지 제11항 중 어느 한 항에 있어서, 상기 전사 조절 요소는 시토메갈로바이러스(CMV) 인핸서 요소, 닭-β-액틴(CBA) 프로모터, 작은 닭-β-액틴(SmCBA) 프로모터, 칼모둘린 1(CALM1) 프로모터, 프로테오리피드 단백질 1(PLP1) 프로모터, 신경교 섬유소 산성 단백질(GFAP) 프로모터, 시냅신 2(SYN2) 프로모터, 메탈로티오네인 3(MT3) 프로모터, 및 이들의 임의의 조합으로 이루어진 군으로부터 선택된 하나 이상의 요소를 포함하는, 방법.
  10. 제1항 내지 제12항 중 어느 한 항에 있어서, 상기 전사 조절 요소는 서열번호 25, 32, 36, 54, 55 및 58로 이루어진 군으로부터 선택되는 서열과 적어도 90% 동일한 뉴클레오티드 서열을 포함하는, 방법.
  11. 제1항 내지 제13항 중 어느 한 항에 있어서, 상기 전사 조절 요소는 서열번호 25, 32, 36, 54, 55 및 58로 이루어진 군으로부터 선택되는 뉴클레오티드 서열을 포함하는, 방법.
  12. 제1항 내지 제14항 중 어느 한 항에 있어서, 상기 전사 조절 요소는 5'에서 3'까지 서열번호 58, 25, 및 32에 제시된 뉴클레오티드 서열을 포함하는, 방법.
  13. 제1항 내지 제15항 중 어느 한 항에 있어서, 상기 전사 조절 요소는 서열번호 36에 제시된 뉴클레오티드 서열을 포함하는, 방법.
  14. 제1항 내지 제16항 중 어느 한 항에 있어서, 상기 전달 게놈은 상기 침묵적으로 변형된 ARSA 코딩 서열에 대한 폴리아데닐화 서열 3'을 추가로 포함하는, 방법.
  15. 제14항에 있어서, 상기 폴리아데닐화 서열은 외인성 폴리아데닐화 서열인, 방법.
  16. 제15항에 있어서, 상기 외인성 폴리아데닐화 서열은 SV40 폴리아데닐화 서열인, 방법.
  17. 제16항에 있어서, 상기 SV40 폴리아데닐화 서열은 서열 번호 42에 제시된 뉴클레오티드 서열을 포함하는, 방법.
  18. 제1항 내지 제17항 중 어느 한 항에 있어서, 상기 전달 게놈은 스터퍼 서열을 추가로 포함하는, 방법.
  19. 제1항 내지 제18항 중 어느 한 항에 있어서, 상기 전달 게놈은 상기 침묵적으로 변형된 ARSA 코딩 서열에 대한 스터퍼 서열 3'을 추가로 포함하는, 방법.
  20. 제18항 또는 제19항에 있어서, 상기 스터퍼 서열은 상기 폴리아데닐화 서열에 대해 3'인, 방법.
  21. 제1항 내지 제20항 중 어느 한 항에 있어서, 상기 전달 게놈은 서열번호 41, 44, 46, 65, 67, 75, 및 79로 이루어진 군으로부터 선택되는 서열을 포함하는, 방법.
  22. 제1항 내지 제21항 중 어느 한 항에 있어서, 상기 전달 게놈은 상기 게놈의 5' 역위 말단 반복(5' ITR) 뉴클레오티드 서열 5', 및 상기 게놈의 3' 역위 말단 반복(3' ITR) 뉴클레오티드 서열 3'을 추가로 포함하는, 방법.
  23. 제22항에 있어서, 상기 5' ITR 뉴클레오티드 서열은 서열번호 18과 적어도 95%의 서열 동일성을 갖고, 상기 3' ITR 뉴클레오티드 서열은 서열번호 19와 적어도 95%의 서열 동일성을 갖는, 방법.
  24. 제22항에 있어서, 상기 5' ITR 뉴클레오티드 서열은 서열번호 26과 적어도 95%의 서열 동일성을 갖고, 상기 3' ITR 뉴클레오티드 서열은 서열번호 27과 적어도 95%의 서열 동일성을 갖는, 방법.
  25. 제22항에 있어서, 상기 5' ITR 뉴클레오티드 서열은 서열번호 18과 적어도 95%의 서열 동일성을 갖고, 상기 3' ITR 뉴클레오티드 서열은 서열번호 57과 적어도 95%의 서열 동일성을 갖는, 방법.
  26. 제1항 내지 제25항 중 어느 한 항에 있어서, 상기 전달 게놈은 서열번호 47, 48, 49, 68, 69, 76, 및 80으로 이루어진 군으로부터 선택되는 뉴클레오티드 서열을 포함하는, 방법.
  27. 제5항 내지 제25항 중 어느 한 항에 있어서, 이염색 백색질장애는 아릴술파타아제 A(ARSA) 유전자 돌연변이와 연관된, 방법.
  28. 제6항내지 제27항 중 어느 한 항에 있어서, 상기 대상체는 인간 대상체인, 방법.
  29. 제1항 내지 제28항 중 어느 한 항에 있어서, 상기 캡시드 단백질은 서열번호 2, 3, 4, 6, 7, 10, 11, 12, 13, 15, 16, 또는 17의 아미노산 203 내지 736의 아미노산 서열과 적어도 95% 서열 동일성을 갖는 아미노산 서열을 포함하는, 방법.
  30. 제29항에 있어서, 상기 서열번호 16의 아미노산 206에 상응하는 캡시드 단백질 중의 아미노산은 C이고; 상기 서열번호 16의 아미노산 296에 상응하는 캡시드 단백질 중의 아미노산은 H이고; 상기 서열번호 16의 아미노산 312에 상응하는 캡시드 단백질 중의 아미노산은 Q이고; 상기 서열번호 16의 아미노산 346에 상응하는 캡시드 단백질 중의 아미노산은 A이고; 상기 서열번호 16의 아미노산 464에 상응하는 캡시드 단백질 중의 아미노산은 N이고; 상기 서열번호 16의 아미노산 468에 상응하는 캡시드 단백질 중의 아미노산은 S이고; 상기 서열번호 16의 아미노산 501에 상응하는 캡시드 단백질 중의 아미노산은 I이고; 상기 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질 중의 아미노산은 R이고; 상기 서열번호 16의 아미노산 590에 상응하는 캡시드 단백질 중의 아미노산은 R이고; 상기 서열번호 16의 아미노산 626에 상응하는 캡시드 단백질 중의 아미노산은 G 또는 Y이고; 상기 서열번호 16의 아미노산 681에 상응하는 캡시드 단백질 중의 아미노산은 M이고; 상기 서열번호 16의 아미노산 687에 상응하는 캡시드 단백질 중의 아미노산은 R이고; 상기 서열번호 16의 아미노산 690에 상응하는 캡시드 단백질 중의 아미노산은 K이고; 상기 서열번호 16의 아미노산 706에 상응하는 캡시드 단백질 중의 아미노산은 C이고; 또는, 상기 서열번호 16의 아미노산 718에 상응하는 캡시드 단백질 중의 아미노산은 G인, 방법.
  31. 제30항에 있어서,
    (a) 상기 서열번호 16의 아미노산 626에 상응하는 캡시드 단백질 중의 아미노산은 G이고, 상기 서열번호 16의 아미노산 718에 상응하는 캡시드 단백질 중의 아미노산은 G이고;
    (b) 상기 서열번호 16의 아미노산 296에 상응하는 캡시드 단백질 중의 아미노산은 H이고, 상기 서열번호 16의 아미노산 464에 상응하는 캡시드 단백질 중의 아미노산은 N이고, 상기 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질 중의 아미노산은 R이고, 상기 서열번호 16의 아미노산 681에 상응하는 캡시드 단백질 중의 아미노산은 M이고;
    (c) 상기 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질 중의 아미노산은 R이고, 상기 서열번호 16의 아미노산 687에 상응하는 캡시드 단백질 중의 아미노산은 R이고;
    (d) 상기 서열번호 16의 아미노산 346에 상응하는 캡시드 단백질 중의 아미노산은 A이고, 상기 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질 중의 아미노산은 R이거나;
    (e) 상기 서열번호 16의 아미노산 501에 상응하는 캡시드 단백질 중의 아미노산은 I이고, 상기 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질 중의 아미노산은 R이고, 상기 서열번호 16의 아미노산 706에 상응하는 캡시드 단백질 중의 아미노산은 C인, 방법.
  32. 제30항에 있어서, 상기 캡시드 단백질은 서열번호 2, 3, 4, 6, 7, 10, 11, 12, 13, 15, 16, 또는 17의 아미노산 203 내지 736의 아미노산 서열을 포함하는, 방법.
  33. 제1항 내지 제32항 중 어느 한 항에 있어서, 상기 캡시드 단백질은 서열번호 2, 3, 4, 5, 6, 7, 9, 10, 11, 12, 13, 15, 16, 또는 17의 아미노산 138 내지 736의 아미노산 서열과 적어도 95% 서열 동일성을 갖는 아미노산 서열을 포함하는, 방법.
  34. 제33항에 있어서, 상기 서열번호 16의 아미노산 151에 상응하는 캡시드 단백질 중의 아미노산은 R이고; 상기 서열번호 16의 아미노산 160에 상응하는 캡시드 단백질 중의 아미노산은 D이고; 상기 서열번호 16의 아미노산 206에 상응하는 캡시드 단백질 중의 아미노산은 C이고; 상기 서열번호 16의 아미노산 296에 상응하는 캡시드 단백질 중의 아미노산은 H이고; 상기 서열번호 16의 아미노산 312에 상응하는 캡시드 단백질 중의 아미노산은 Q이고; 상기 서열번호 16의 아미노산 346에 상응하는 캡시드 단백질 중의 아미노산은 A이고; 상기 서열번호 16의 아미노산 464에 상응하는 캡시드 단백질 중의 아미노산은 N이고; 상기 서열번호 16의 아미노산 468에 상응하는 캡시드 단백질 중의 아미노산은 S이고; 상기 서열번호 16의 아미노산 501에 상응하는 캡시드 단백질 중의 아미노산은 I이고; 상기 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질 중의 아미노산은 R이고; 상기 서열번호 16의 아미노산 590에 상응하는 캡시드 단백질 중의 아미노산은 R이고; 상기 서열번호 16의 아미노산 626에 상응하는 캡시드 단백질 중의 아미노산은 G 또는 Y이고; 상기 서열번호 16의 아미노산 681에 상응하는 캡시드 단백질 중의 아미노산은 M이고; 상기 서열번호 16의 아미노산 687에 상응하는 캡시드 단백질 중의 아미노산은 R이고; 상기 서열번호 16의 아미노산 690에 상응하는 캡시드 단백질 중의 아미노산은 K이고; 상기 서열번호 16의 아미노산 706에 상응하는 캡시드 단백질 중의 아미노산은 C이고; 또는, 상기 서열번호 16의 아미노산 718에 상응하는 캡시드 단백질 중의 아미노산은 G인, 방법.
  35. 제34항에 있어서,
    (a) 상기 서열번호 16의 아미노산 626에 상응하는 캡시드 단백질 중의 아미노산은 G이고, 상기 서열번호 16의 아미노산 718에 상응하는 캡시드 단백질 중의 아미노산은 G이고;
    (b) 상기 서열번호 16의 아미노산 296에 상응하는 캡시드 단백질 중의 아미노산은 H이고, 상기 서열번호 16의 아미노산 464에 상응하는 캡시드 단백질 중의 아미노산은 N이고, 상기 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질 중의 아미노산은 R이고, 상기 서열번호 16의 아미노산 681에 상응하는 캡시드 단백질 중의 아미노산은 M이고;
    (c) 상기 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질 중의 아미노산은 R이고, 상기 서열번호 16의 아미노산 687에 상응하는 캡시드 단백질 중의 아미노산은 R이고;
    (d) 상기 서열번호 16의 아미노산 346에 상응하는 캡시드 단백질 중의 아미노산은 A이고, 상기 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질 중의 아미노산은 R이거나;
    (e) 상기 서열번호 16의 아미노산 501에 상응하는 캡시드 단백질 중의 아미노산은 I이고, 상기 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질 중의 아미노산은 R이고, 상기 서열번호 16의 아미노산 706에 상응하는 캡시드 단백질 중의 아미노산은 C인, 방법.
  36. 제34항에 있어서, 상기 캡시드 단백질은 서열번호 2, 3, 4, 5, 6, 7, 9, 10, 11, 12, 13, 15, 16, 또는 17의 아미노산 138 내지 736의 아미노산 서열을 포함하는, 방법.
  37. 제1항 내지 제36항 중 어느 한 항에 있어서, 상기 캡시드 단백질은 서열번호 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 15, 16, 또는 17의 아미노산 1 내지 736의 아미노산 서열과 적어도 95% 서열 동일성을 갖는 아미노산 서열을 포함하는, 방법.
  38. 제37항에 있어서, 상기 서열번호 16의 아미노산 2에 상응하는 캡시드 단백질 중의 아미노산은 T이고; 상기 서열번호 16의 아미노산 65에 상응하는 캡시드 단백질 중의 아미노산은 I이고; 상기 서열번호 16의 아미노산 68에 상응하는 캡시드 단백질 중의 아미노산은 V이고; 상기 서열번호 16의 아미노산 77에 상응하는 캡시드 단백질 중의 아미노산은 R이고; 상기 서열번호 16의 아미노산 119에 상응하는 캡시드 단백질 중의 아미노산은 L이고; 상기 서열번호 16의 아미노산 151에 상응하는 캡시드 단백질 중의 아미노산은 R이고; 상기 서열번호 16의 아미노산 160에 상응하는 캡시드 단백질 중의 아미노산은 D이고; 상기 서열번호 16의 아미노산 206에 상응하는 캡시드 단백질 중의 아미노산은 C이고; 상기 서열번호 16의 아미노산 296에 상응하는 캡시드 단백질 중의 아미노산은 H이고; 상기 서열번호 16의 아미노산 312에 상응하는 캡시드 단백질 중의 아미노산은 Q이고; 상기 서열번호 16의 아미노산 346에 상응하는 캡시드 단백질 중의 아미노산은 A이고; 상기 서열번호 16의 아미노산 464에 상응하는 캡시드 단백질 중의 아미노산은 N이고; 상기 서열번호 16의 아미노산 468에 상응하는 캡시드 단백질 중의 아미노산은 S이고; 상기 서열번호 16의 아미노산 501에 상응하는 캡시드 단백질 중의 아미노산은 I이고; 상기 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질 중의 아미노산은 R이고; 상기 서열번호 16의 아미노산 590에 상응하는 캡시드 단백질 중의 아미노산은 R이고; 상기 서열번호 16의 아미노산 626에 상응하는 캡시드 단백질 중의 아미노산은 G 또는 Y이고; 상기 서열번호 16의 아미노산 681에 상응하는 캡시드 단백질 중의 아미노산은 M이고; 상기 서열번호 16의 아미노산 687에 상응하는 캡시드 단백질 중의 아미노산은 R이고; 상기 서열번호 16의 아미노산 690에 상응하는 캡시드 단백질 중의 아미노산은 K이고; 상기 서열번호 16의 아미노산 706에 상응하는 캡시드 단백질 중의 아미노산은 C이고; 또는, 상기 서열번호 16의 아미노산 718에 상응하는 캡시드 단백질 중의 아미노산은 G인, 방법.
  39. 제38항에 있어서,
    (a) 상기 서열번호 16의 아미노산 2에 상응하는 캡시드 단백질 중의 아미노산은 T이고, 상기 서열번호 16의 아미노산 312에 상응하는 캡시드 단백질 중의 아미노산은 Q이고;
    (b) 상기 서열번호 16의 아미노산 65에 상응하는 캡시드 단백질 중의 아미노산은 I이고, 상기 서열번호 16의 아미노산 626에 상응하는 캡시드 단백질 중의 아미노산은 Y이고;
    (c) 상기 서열번호 16의 아미노산 77에 상응하는 캡시드 단백질 중의 아미노산은 R이고, 상기 서열번호 16의 아미노산 690에 상응하는 캡시드 단백질 중의 아미노산은 K이고;
    (d) 상기 서열번호 16의 아미노산 119에 상응하는 캡시드 단백질 중의 아미노산은 L이고, 상기 서열번호 16의 아미노산 468에 상응하는 캡시드 단백질 중의 아미노산은 S이고;
    (e) 상기 서열번호 16의 아미노산 626에 상응하는 캡시드 단백질 중의 아미노산은 G이고, 상기 서열번호 16의 아미노산 718에 상응하는 캡시드 단백질 중의 아미노산은 G이고;
    (f) 상기 서열번호 16의 아미노산 296에 상응하는 캡시드 단백질 중의 아미노산은 H이고, 상기 서열번호 16의 아미노산 464에 상응하는 캡시드 단백질 중의 아미노산은 N이고, 상기 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질 중의 아미노산은 R이고, 상기 서열번호 16의 아미노산 681에 상응하는 캡시드 단백질 중의 아미노산은 M이고;
    (g) 상기 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질 중의 아미노산은 R이고, 상기 서열번호 16의 아미노산 687에 상응하는 캡시드 단백질 중의 아미노산은 R이고;
    (h) 상기 서열번호 16의 아미노산 346에 상응하는 캡시드 단백질 중의 아미노산은 A이고, 상기 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질 중의 아미노산은 R이거나;
    (i) 상기 서열번호 16의 아미노산 501에 상응하는 캡시드 단백질 중의 아미노산은 I이고, 상기 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질 중의 아미노산은 R이고, 상기 서열번호 16의 아미노산 706에 상응하는 캡시드 단백질 중의 아미노산은 C인, 방법.
  40. 제38항에 있어서, 상기 캡시드 단백질은 서열번호 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 15, 16, 또는 17의 아미노산 1 내지 736의 아미노산 서열을 포함하는, 방법.
  41. rAAV로서,
    (a) AAV 캡시드 단백질을 포함하는 AAV 캡시드; 및
    (b) 침묵적으로 변형된 ARSA 코딩 서열에 작동 가능하게 연결된 전사 조절 요소를 포함하는 전달 게놈을 포함하는, rAAV.
  42. 제41항에 있어서, 상기 침묵적으로 변형된 ARSA 코딩 서열은 서열번호 23에 제시된 아미노산 서열을 암호화하는, rAAV.
  43. 제42항에 있어서, 상기 침묵적으로 변형된 ARSA 코딩 서열은 서열번호 14에 제시된 뉴클레오티드 서열을 포함하는, rAAV.
  44. 제42항에 있어서, 상기 침묵적으로 변형된 ARSA 코딩 서열은 서열번호 62 또는 72에 제시된 뉴클레오티드 서열을 포함하는, rAAV.
  45. 제41항 내지 제44항 중 어느 한 항에 있어서, 상기 전사 조절 요소는 시토메갈로바이러스(CMV) 인핸서 요소, 닭-β-액틴(CBA) 프로모터, 작은 닭-β-액틴(SmCBA) 프로모터, 칼모둘린 1(CALM1) 프로모터, 프로테오리피드 단백질 1(PLP1) 프로모터, 신경교 섬유소 산성 단백질(GFAP) 프로모터, 시냅신 2(SYN2) 프로모터, 메탈로티오네인 3(MT3) 프로모터, 및 이들의 임의의 조합으로 이루어진 군으로부터 선택된 하나 이상의 요소를 포함하는, rAAV.
  46. 제45항에 있어서, 상기 전사 조절 요소는 서열번호 25, 32, 36, 54, 55 및 58로 이루어진 군으로부터 선택되는 서열과 적어도 90% 동일한 뉴클레오티드 서열을 포함하는, rAAV.
  47. 제45항에 있어서, 상기 전사 조절 요소는 서열번호 25, 32, 36, 54, 55 및 58로 이루어진 군으로부터 선택되는 뉴클레오티드 서열을 포함하는, rAAV.
  48. 제45항에 있어서, 상기 전사 조절 요소는 5'에서 3'까지 서열번호 58, 25, 및 32에 제시된 뉴클레오티드 서열을 포함하는, rAAV.
  49. 제45항에 있어서, 상기 전사 조절 요소는 서열번호 36에 제시된 뉴클레오티드 서열을 포함하는, rAAV.
  50. 제41항 내지 제49항 중 어느 한 항에 있어서, 상기 전달 게놈은 상기 침묵적으로 변형된 ARSA 코딩 서열에 대한 폴리아데닐화 서열 3'을 추가로 포함하는, rAAV.
  51. 제50항에 있어서, 상기 폴리아데닐화 서열은 외인성 폴리아데닐화 서열인, rAAV.
  52. 제51항에 있어서, 상기 외인성 폴리아데닐화 서열은 SV40 폴리아데닐화 서열인, rAAV.
  53. 제52항에 있어서, 상기 SV40 폴리아데닐화 서열은 서열 번호 42에 제시된 뉴클레오티드 서열을 포함하는, rAAV.
  54. 제41항 내지 제53항 중 어느 한 항에 있어서, 상기 전달 게놈은 서열번호 41, 44, 46, 65, 67, 75, 및 79로 이루어진 군으로부터 선택되는 서열을 포함하는, rAAV.
  55. 제41항 내지 제54항 중 어느 한 항에 있어서, 상기 전달 게놈은 상기 게놈의 5' 역위 말단 반복(5' ITR) 뉴클레오티드 서열 5', 및 상기 게놈의 3' 역위 말단 반복(3' ITR) 뉴클레오티드 서열 3'을 추가로 포함하는, rAAV.
  56. 제55항에 있어서, 상기 5' ITR 뉴클레오티드 서열은 서열번호 18과 적어도 95%의 서열 동일성을 갖고, 상기 3' ITR 뉴클레오티드 서열은 서열번호 19와 적어도 95%의 서열 동일성을 갖는, rAAV.
  57. 제41항 내지 제55항 중 어느 한 항에 있어서, 상기 전달 게놈은 서열번호 47, 48, 49, 68, 69, 76, 및 80으로 이루어진 군으로부터 선택되는 뉴클레오티드 서열을 포함하는, rAAV.
  58. 제41항 내지 제55항 중 어느 한 항에 있어서, 상기 전달 게놈의 뉴클레오티드 서열은 서열번호 47, 48, 49, 68, 69, 76, 및 80으로 이루어진 군으로부터 선택되는 뉴클레오티드 서열로 이루어진, rAAV.
  59. 제41항 내지 제58항 중 어느 한 항에 있어서, 상기 전달 게놈의 뉴클레오티드 서열은 서열번호 48에 제시된 뉴클레오티드 서열로 이루어진, rAAV.
  60. 제41항 내지 제59항 중 어느 한 항에 있어서, 상기 캡시드 단백질은 서열번호 2, 3, 4, 6, 7, 10, 11, 12, 13, 15, 16, 또는 17의 아미노산 203 내지 736의 아미노산 서열과 적어도 95% 서열 동일성을 갖는 아미노산 서열을 포함하는, rAAV.
  61. 제60항에 있어서, 상기 서열번호 16의 아미노산 206에 상응하는 캡시드 단백질 중의 아미노산은 C이고; 상기 서열번호 16의 아미노산 296에 상응하는 캡시드 단백질 중의 아미노산은 H이고; 상기 서열번호 16의 아미노산 312에 상응하는 캡시드 단백질 중의 아미노산은 Q이고; 상기 서열번호 16의 아미노산 346에 상응하는 캡시드 단백질 중의 아미노산은 A이고; 상기 서열번호 16의 아미노산 464에 상응하는 캡시드 단백질 중의 아미노산은 N이고; 상기 서열번호 16의 아미노산 468에 상응하는 캡시드 단백질 중의 아미노산은 S이고; 상기 서열번호 16의 아미노산 501에 상응하는 캡시드 단백질 중의 아미노산은 I이고; 상기 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질 중의 아미노산은 R이고; 상기 서열번호 16의 아미노산 590에 상응하는 캡시드 단백질 중의 아미노산은 R이고; 상기 서열번호 16의 아미노산 626에 상응하는 캡시드 단백질 중의 아미노산은 G 또는 Y이고; 상기 서열번호 16의 아미노산 681에 상응하는 캡시드 단백질 중의 아미노산은 M이고; 상기 서열번호 16의 아미노산 687에 상응하는 캡시드 단백질 중의 아미노산은 R이고; 상기 서열번호 16의 아미노산 690에 상응하는 캡시드 단백질 중의 아미노산은 K이고; 상기 서열번호 16의 아미노산 706에 상응하는 캡시드 단백질 중의 아미노산은 C이고; 또는, 상기 서열번호 16의 아미노산 718에 상응하는 캡시드 단백질 중의 아미노산은 G인, rAAV.
  62. 제61항에 있어서,
    (a) 상기 서열번호 16의 아미노산 626에 상응하는 캡시드 단백질 중의 아미노산은 G이고, 상기 서열번호 16의 아미노산 718에 상응하는 캡시드 단백질 중의 아미노산은 G이고;
    (b) 상기 서열번호 16의 아미노산 296에 상응하는 캡시드 단백질 중의 아미노산은 H이고, 상기 서열번호 16의 아미노산 464에 상응하는 캡시드 단백질 중의 아미노산은 N이고, 상기 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질 중의 아미노산은 R이고, 상기 서열번호 16의 아미노산 681에 상응하는 캡시드 단백질 중의 아미노산은 M이고;
    (c) 상기 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질 중의 아미노산은 R이고, 상기 서열번호 16의 아미노산 687에 상응하는 캡시드 단백질 중의 아미노산은 R이고;
    (d) 상기 서열번호 16의 아미노산 346에 상응하는 캡시드 단백질 중의 아미노산은 A이고, 상기 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질 중의 아미노산은 R이거나;
    (e) 상기 서열번호 16의 아미노산 501에 상응하는 캡시드 단백질 중의 아미노산은 I이고, 상기 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질 중의 아미노산은 R이고, 상기 서열번호 16의 아미노산 706에 상응하는 캡시드 단백질 중의 아미노산은 C인, rAAV.
  63. 제61항에 있어서, 상기 캡시드 단백질은 서열번호 2, 3, 4, 6, 7, 10, 11, 12, 13, 15, 16, 또는 17의 아미노산 203 내지 736의 아미노산 서열을 포함하는, rAAV.
  64. 제41항 내지 제63항 중 어느 한 항에 있어서, 상기 캡시드 단백질은 서열번호 2, 3, 4, 5, 6, 7, 9, 10, 11, 12, 13, 15, 16, 또는 17의 아미노산 138 내지 736의 아미노산 서열과 적어도 95% 서열 동일성을 갖는 아미노산 서열을 포함하는, rAAV.
  65. 제64항에 있어서, 상기 서열번호 16의 아미노산 151에 상응하는 캡시드 단백질 중의 아미노산은 R이고; 상기 서열번호 16의 아미노산 160에 상응하는 캡시드 단백질 중의 아미노산은 D이고; 상기 서열번호 16의 아미노산 206에 상응하는 캡시드 단백질 중의 아미노산은 C이고; 상기 서열번호 16의 아미노산 296에 상응하는 캡시드 단백질 중의 아미노산은 H이고; 상기 서열번호 16의 아미노산 312에 상응하는 캡시드 단백질 중의 아미노산은 Q이고; 상기 서열번호 16의 아미노산 346에 상응하는 캡시드 단백질 중의 아미노산은 A이고; 상기 서열번호 16의 아미노산 464에 상응하는 캡시드 단백질 중의 아미노산은 N이고; 상기 서열번호 16의 아미노산 468에 상응하는 캡시드 단백질 중의 아미노산은 S이고; 상기 서열번호 16의 아미노산 501에 상응하는 캡시드 단백질 중의 아미노산은 I이고; 상기 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질 중의 아미노산은 R이고; 상기 서열번호 16의 아미노산 590에 상응하는 캡시드 단백질 중의 아미노산은 R이고; 상기 서열번호 16의 아미노산 626에 상응하는 캡시드 단백질 중의 아미노산은 G 또는 Y이고; 상기 서열번호 16의 아미노산 681에 상응하는 캡시드 단백질 중의 아미노산은 M이고; 상기 서열번호 16의 아미노산 687에 상응하는 캡시드 단백질 중의 아미노산은 R이고; 상기 서열번호 16의 아미노산 690에 상응하는 캡시드 단백질 중의 아미노산은 K이고; 상기 서열번호 16의 아미노산 706에 상응하는 캡시드 단백질 중의 아미노산은 C이고; 또는, 상기 서열번호 16의 아미노산 718에 상응하는 캡시드 단백질 중의 아미노산은 G인, rAAV.
  66. 제65항에 있어서,
    (a) 상기 서열번호 16의 아미노산 626에 상응하는 캡시드 단백질 중의 아미노산은 G이고, 상기 서열번호 16의 아미노산 718에 상응하는 캡시드 단백질 중의 아미노산은 G이고;
    (b) 상기 서열번호 16의 아미노산 296에 상응하는 캡시드 단백질 중의 아미노산은 H이고, 상기 서열번호 16의 아미노산 464에 상응하는 캡시드 단백질 중의 아미노산은 N이고, 상기 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질 중의 아미노산은 R이고, 상기 서열번호 16의 아미노산 681에 상응하는 캡시드 단백질 중의 아미노산은 M이고;
    (c) 상기 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질 중의 아미노산은 R이고, 상기 서열번호 16의 아미노산 687에 상응하는 캡시드 단백질 중의 아미노산은 R이고;
    (d) 상기 서열번호 16의 아미노산 346에 상응하는 캡시드 단백질 중의 아미노산은 A이고, 상기 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질 중의 아미노산은 R이거나;
    (e) 상기 서열번호 16의 아미노산 501에 상응하는 캡시드 단백질 중의 아미노산은 I이고, 상기 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질 중의 아미노산은 R이고, 상기 서열번호 16의 아미노산 706에 상응하는 캡시드 단백질 중의 아미노산은 C인, rAAV.
  67. 제65항에 있어서, 상기 캡시드 단백질은 서열번호 2, 3, 4, 5, 6, 7, 9, 10, 11, 12, 13, 15, 16, 또는 17의 아미노산 138 내지 736의 아미노산 서열을 포함하는, rAAV.
  68. 제41항 내지 제67항 중 어느 한 항에 있어서, 상기 캡시드 단백질은 서열번호 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 15, 16, 또는 17의 아미노산 1 내지 736의 아미노산 서열과 적어도 95% 서열 동일성을 갖는 아미노산 서열을 포함하는, rAAV.
  69. 제68항에 있어서, 상기 서열번호 16의 아미노산 2에 상응하는 캡시드 단백질 중의 아미노산은 T이고; 상기 서열번호 16의 아미노산 65에 상응하는 캡시드 단백질 중의 아미노산은 I이고; 상기 서열번호 16의 아미노산 68에 상응하는 캡시드 단백질 중의 아미노산은 V이고; 상기 서열번호 16의 아미노산 77에 상응하는 캡시드 단백질 중의 아미노산은 R이고; 상기 서열번호 16의 아미노산 119에 상응하는 캡시드 단백질 중의 아미노산은 L이고; 상기 서열번호 16의 아미노산 151에 상응하는 캡시드 단백질 중의 아미노산은 R이고; 상기 서열번호 16의 아미노산 160에 상응하는 캡시드 단백질 중의 아미노산은 D이고; 상기 서열번호 16의 아미노산 206에 상응하는 캡시드 단백질 중의 아미노산은 C이고; 상기 서열번호 16의 아미노산 296에 상응하는 캡시드 단백질 중의 아미노산은 H이고; 상기 서열번호 16의 아미노산 312에 상응하는 캡시드 단백질 중의 아미노산은 Q이고; 상기 서열번호 16의 아미노산 346에 상응하는 캡시드 단백질 중의 아미노산은 A이고; 상기 서열번호 16의 아미노산 464에 상응하는 캡시드 단백질 중의 아미노산은 N이고; 상기 서열번호 16의 아미노산 468에 상응하는 캡시드 단백질 중의 아미노산은 S이고; 상기 서열번호 16의 아미노산 501에 상응하는 캡시드 단백질 중의 아미노산은 I이고; 상기 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질 중의 아미노산은 R이고; 상기 서열번호 16의 아미노산 590에 상응하는 캡시드 단백질 중의 아미노산은 R이고; 상기 서열번호 16의 아미노산 626에 상응하는 캡시드 단백질 중의 아미노산은 G 또는 Y이고; 상기 서열번호 16의 아미노산 681에 상응하는 캡시드 단백질 중의 아미노산은 M이고; 상기 서열번호 16의 아미노산 687에 상응하는 캡시드 단백질 중의 아미노산은 R이고; 상기 서열번호 16의 아미노산 690에 상응하는 캡시드 단백질 중의 아미노산은 K이고; 상기 서열번호 16의 아미노산 706에 상응하는 캡시드 단백질 중의 아미노산은 C이고; 또는, 상기 서열번호 16의 아미노산 718에 상응하는 캡시드 단백질 중의 아미노산은 G인, rAAV.
  70. 제69항에 있어서,
    (a) 상기 서열번호 16의 아미노산 2에 상응하는 캡시드 단백질 중의 아미노산은 T이고, 상기 서열번호 16의 아미노산 312에 상응하는 캡시드 단백질 중의 아미노산은 Q이고;
    (b) 상기 서열번호 16의 아미노산 65에 상응하는 캡시드 단백질 중의 아미노산은 I이고, 상기 서열번호 16의 아미노산 626에 상응하는 캡시드 단백질 중의 아미노산은 Y이고;
    (c) 상기 서열번호 16의 아미노산 77에 상응하는 캡시드 단백질 중의 아미노산은 R이고, 상기 서열번호 16의 아미노산 690에 상응하는 캡시드 단백질 중의 아미노산은 K이고;
    (d) 상기 서열번호 16의 아미노산 119에 상응하는 캡시드 단백질 중의 아미노산은 L이고, 상기 서열번호 16의 아미노산 468에 상응하는 캡시드 단백질 중의 아미노산은 S이고;
    (e) 상기 서열번호 16의 아미노산 626에 상응하는 캡시드 단백질 중의 아미노산은 G이고, 상기 서열번호 16의 아미노산 718에 상응하는 캡시드 단백질 중의 아미노산은 G이고;
    (f) 상기 서열번호 16의 아미노산 296에 상응하는 캡시드 단백질 중의 아미노산은 H이고, 상기 서열번호 16의 아미노산 464에 상응하는 캡시드 단백질 중의 아미노산은 N이고, 상기 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질 중의 아미노산은 R이고, 상기 서열번호 16의 아미노산 681에 상응하는 캡시드 단백질 중의 아미노산은 M이고;
    (g) 상기 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질 중의 아미노산은 R이고, 상기 서열번호 16의 아미노산 687에 상응하는 캡시드 단백질 중의 아미노산은 R이고;
    (h) 상기 서열번호 16의 아미노산 346에 상응하는 캡시드 단백질 중의 아미노산은 A이고, 상기 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질 중의 아미노산은 R이거나;
    (i) 상기 서열번호 16의 아미노산 501에 상응하는 캡시드 단백질 중의 아미노산은 I이고, 상기 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질 중의 아미노산은 R이고, 상기 서열번호 16의 아미노산 706에 상응하는 캡시드 단백질 중의 아미노산은 C인, rAAV.
  71. 제69항에 있어서, 상기 캡시드 단백질은 서열번호 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 15, 16, 또는 17의 아미노산 1 내지 736의 아미노산 서열을 포함하는, rAAV.
  72. 제41항 내지 제71항 중 어느 한 항의 rAAV를 포함하는, 약학적 조성물.
  73. 서열번호 14, 62 및 72에 제시된 핵산 서열을 포함하는, 폴리뉴클레오티드.
  74. rAAV의 제조를 위한 패키징 시스템으로서, 상기 패키징 시스템은,
    (a) 하나 이상의 AAV Rep 단백질을 암호화하는 제1 뉴클레오티드 서열;
    (b) 제41항 내지 제71항 중 어느 한 항의 AAV의 캡시드 단백질을 암호화하는 제2 뉴클레오티드 서열; 및
    (c) 제41항 내지 제71항 중 어느 한 항의 AAV의 rAAV 게놈 서열을 포함하는 제3 뉴클레오티드 서열을 포함하는, 패키징 시스템.
  75. 제74항에 있어서, 상기 패키징 시스템은 상기 제1 뉴클레오티드 서열 및 상기 제2 뉴클레오티드 서열을 포함하는 제1 벡터, 및 상기 제3 뉴클레오티드 서열을 포함하는 제2 벡터를 포함하는, 패키징 시스템.
  76. 제74항 또는 제75항에 있어서, 하나 이상의 헬퍼 바이러스 유전자를 포함하는 제4 뉴클레오티드 서열을 추가로 포함하는, 패키징 시스템.
  77. 제76항에 있어서, 상기 제4 뉴클레오티드 서열은 제3 벡터 내에 포함되는, 패키징 시스템.
  78. 제74항 내지 제77항 중 어느 한 항에 있어서, 상기 제4 뉴클레오티드 서열은 아데노바이러스, 포진 바이러스, 우두 바이러스, 및 시토메갈로바이러스(CMV)로 이루어진 군으로부터 선택된 바이러스로부터의 하나 이상의 유전자를 포함하는, 패키징 시스템.
  79. 제74항 내지 제78항 중 어느 한 항에 있어서, 상기 제1 벡터, 제2 벡터, 및/또는 상기 제3 벡터는 플라스미드인, 패키징 시스템.
  80. rAAV의 재조합 제조 방법으로서, 상기 방법은 상기 rAAV가 생성되는 조건 하에서 제74항 내지 제79항 중 어느 한 항의 패키징 시스템을 세포 내에 도입하는 단계를 포함하는, 방법.
  81. 의약으로서 사용하기 위한, 제41항 내지 제71항 중 어느 한 항의 rAAV, 제72항의 약학적 조성물, 또는 제73항의 폴리뉴클레오티드.
  82. MLD의 치료에 사용하기 위한, 제41항 내지 제71항 중 어느 한 항의 rAAV, 제72항의 약학적 조성물, 또는 제73항의 폴리뉴클레오티드.
  83. MLD를 갖는 대상체를 치료하는 방법에 사용하기 위한, 제41항 내지 제71항 중 어느 한 항의 rAAV, 제72항의 약학적 조성물, 또는 제73항의 폴리뉴클레오티드로서, 상기 방법은 상기 rAAV, 상기 약학적 조성물, 또는 상기 폴리뉴클레오티드를 상기 대상체에게 투여하는 방법을 포함하는, rAAV, 약학적 조성물, 또는 폴리뉴클레오티드.

KR1020227000707A 2019-06-10 2020-06-09 Arsa 유전자 전달을 위한 아데노-연관 바이러스 조성물 및 이의 사용 방법 Pending KR20220035107A (ko)

Applications Claiming Priority (13)

Application Number Priority Date Filing Date Title
US201962859539P 2019-06-10 2019-06-10
US62/859,539 2019-06-10
US201962866374P 2019-06-25 2019-06-25
US62/866,374 2019-06-25
US201962915523P 2019-10-15 2019-10-15
US62/915,523 2019-10-15
US202062960487P 2020-01-13 2020-01-13
US62/960,487 2020-01-13
US202062987858P 2020-03-10 2020-03-10
US62/987,858 2020-03-10
US202063010970P 2020-04-16 2020-04-16
US63/010,970 2020-04-16
PCT/US2020/036846 WO2020251954A1 (en) 2019-06-10 2020-06-09 Adeno-associated virus compositions for arsa gene transfer and methods of use thereof

Publications (1)

Publication Number Publication Date
KR20220035107A true KR20220035107A (ko) 2022-03-21

Family

ID=73782242

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020227000707A Pending KR20220035107A (ko) 2019-06-10 2020-06-09 Arsa 유전자 전달을 위한 아데노-연관 바이러스 조성물 및 이의 사용 방법

Country Status (15)

Country Link
US (1) US20220204991A1 (ko)
EP (1) EP3980447A4 (ko)
JP (1) JP2022536338A (ko)
KR (1) KR20220035107A (ko)
CN (1) CN114502575A (ko)
AU (1) AU2020292256B2 (ko)
BR (1) BR112021024855A2 (ko)
CA (1) CA3142932A1 (ko)
CL (1) CL2021003295A1 (ko)
CO (1) CO2021016797A2 (ko)
IL (1) IL288863A (ko)
MX (1) MX2021015076A (ko)
PE (1) PE20220233A1 (ko)
TW (1) TW202112807A (ko)
WO (1) WO2020251954A1 (ko)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2769577C1 (ru) * 2021-06-01 2022-04-04 федеральное государственное автономное образовательное учреждение высшего образования "Казанский (Приволжский) федеральный университет" (ФГАОУ ВО КФУ) Препарат для лечения метахроматической лейкодистрофии и способ ее лечения
WO2023225481A1 (en) * 2022-05-16 2023-11-23 Genzyme Corporation Methods of treating metachromatic leukodystrophy
JP2025525792A (ja) 2022-07-29 2025-08-07 リジェネロン・ファーマシューティカルズ・インコーポレイテッド トランスフェリン受容体1に対して再標的化されるウイルス粒子
WO2024036250A2 (en) * 2022-08-10 2024-02-15 Homology Medicines, Inc. Adeno-associated virus compositions for arsa gene transfer and methods of use thereof

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9839696B2 (en) * 2010-04-30 2017-12-12 City Of Hope Recombinant adeno-associated vectors for targeted treatment
CN103189507A (zh) * 2010-10-27 2013-07-03 学校法人自治医科大学 用于向神经系统细胞导入基因的腺相关病毒粒子
PL3137497T5 (pl) * 2014-05-02 2025-06-09 Genzyme Corporation Wektory AAV do terapii genowej siatkówki i OUN
EP3632923A1 (en) * 2015-01-16 2020-04-08 Voyager Therapeutics, Inc. Central nervous system targeting polynucleotides
AU2016235163B2 (en) * 2015-03-24 2022-03-24 The Regents Of The University Of California Adeno-associated virus variants and methods of use thereof
RS63927B1 (sr) * 2015-05-15 2023-02-28 Regenxbio Inc Povezani adenovirus za terapijsku isporuku u centralni nervni sistem
CA2989830A1 (en) * 2015-06-18 2016-12-22 The Broad Institute, Inc. Crispr enzyme mutations reducing off-target effects
EP3746113A4 (en) * 2018-02-01 2022-03-09 Homology Medicines, Inc. ADENO-ASSOCIATED VIRUS COMPOSITIONS FOR PAH GENE TRANSFER AND METHODS OF USE
CN113454232B (zh) * 2019-02-15 2024-10-29 世代生物公司 封闭端dna(cedna)产生中对rep蛋白活性的调节
US12338451B2 (en) * 2019-05-03 2025-06-24 The Trustees Of The University Of Pennsylvania Compositions useful in treatment of metachromatic leukodystrophy

Also Published As

Publication number Publication date
IL288863A (en) 2022-02-01
BR112021024855A2 (pt) 2022-05-03
TW202112807A (zh) 2021-04-01
CL2021003295A1 (es) 2022-09-23
EP3980447A1 (en) 2022-04-13
WO2020251954A1 (en) 2020-12-17
MX2021015076A (es) 2022-06-02
CO2021016797A2 (es) 2022-01-17
PE20220233A1 (es) 2022-02-07
CA3142932A1 (en) 2020-12-17
JP2022536338A (ja) 2022-08-15
CN114502575A (zh) 2022-05-13
AU2020292256B2 (en) 2023-01-19
EP3980447A4 (en) 2023-07-26
US20220204991A1 (en) 2022-06-30
AU2020292256A1 (en) 2022-01-06

Similar Documents

Publication Publication Date Title
AU2020205228B2 (en) Gene therapies for lysosomal disorders
AU2020260485B2 (en) Gene therapies for lysosomal disorders
AU2023214366B2 (en) Gene therapies for lysosomal disorders
KR20220006527A (ko) 리소좀 장애에 대한 유전자 요법
AU2020292256B2 (en) Adeno-associated virus compositions for ARSA gene transfer and methods of use thereof
KR20210150486A (ko) 리소좀 장애에 대한 유전자 요법
KR20230066360A (ko) 신경퇴행성 장애를 위한 유전자 요법
CN116157527A (zh) 用于溶酶体病症的基因疗法
KR102545070B1 (ko) 안구 장애에 대한 유전자 치료
AU2018387826B2 (en) Constructs comprising neuronal viability factors and uses thereof
HK40048832A (en) Gene therapies for lysosomal disorders
HK40046514A (en) Gene therapies for lysosomal disorders
HK40048832B (zh) 用於溶酶体障碍的基因疗法
HK40047428A (en) Gene therapies for lysosomal disorders

Legal Events

Date Code Title Description
PA0105 International application

St.27 status event code: A-0-1-A10-A15-nap-PA0105

P11-X000 Amendment of application requested

St.27 status event code: A-2-2-P10-P11-nap-X000

P13-X000 Application amended

St.27 status event code: A-2-2-P10-P13-nap-X000

PG1501 Laying open of application

St.27 status event code: A-1-1-Q10-Q12-nap-PG1501

E13-X000 Pre-grant limitation requested

St.27 status event code: A-2-3-E10-E13-lim-X000

P11-X000 Amendment of application requested

St.27 status event code: A-2-2-P10-P11-nap-X000

P13-X000 Application amended

St.27 status event code: A-2-2-P10-P13-nap-X000

PA0201 Request for examination

St.27 status event code: A-1-2-D10-D11-exm-PA0201

D21 Rejection of application intended

Free format text: ST27 STATUS EVENT CODE: A-1-2-D10-D21-EXM-PE0902 (AS PROVIDED BY THE NATIONAL OFFICE)

PE0902 Notice of grounds for rejection

St.27 status event code: A-1-2-D10-D21-exm-PE0902