[go: up one dir, main page]

KR20200127170A - Pah 유전자 기능 복원을 위한 아데노-연관 바이러스 조성물 및 이의 사용 방법 - Google Patents

Pah 유전자 기능 복원을 위한 아데노-연관 바이러스 조성물 및 이의 사용 방법 Download PDF

Info

Publication number
KR20200127170A
KR20200127170A KR1020207024199A KR20207024199A KR20200127170A KR 20200127170 A KR20200127170 A KR 20200127170A KR 1020207024199 A KR1020207024199 A KR 1020207024199A KR 20207024199 A KR20207024199 A KR 20207024199A KR 20200127170 A KR20200127170 A KR 20200127170A
Authority
KR
South Korea
Prior art keywords
amino acid
seq
capsid protein
nucleotide
pah
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Ceased
Application number
KR1020207024199A
Other languages
English (en)
Inventor
앨버트 반즈 세이무어
씨민 세어 아메드
제이슨 보크 라이트
세레나 니콜 돌리브
제임스 앤서니 맥스위건
제이미 미첼 프라우트
다니엘 로렌 수키어션
Original Assignee
호몰로지 메디슨, 인크.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 호몰로지 메디슨, 인크. filed Critical 호몰로지 메디슨, 인크.
Publication of KR20200127170A publication Critical patent/KR20200127170A/ko
Ceased legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • C12N15/902Stable introduction of foreign DNA into chromosome using homologous recombination
    • C12N15/907Stable introduction of foreign DNA into chromosome using homologous recombination in mammalian cells
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K35/00Medicinal preparations containing materials or reaction products thereof with undetermined constitution
    • A61K35/66Microorganisms or materials therefrom
    • A61K35/76Viruses; Subviral particles; Bacteriophages
    • A61K35/761Adenovirus
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • A61K48/005Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'active' part of the composition delivered, i.e. the nucleic acid delivered
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P13/00Drugs for disorders of the urinary system
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N7/00Viruses; Bacteriophages; Compositions thereof; Preparation or purification thereof
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/0004Oxidoreductases (1.)
    • C12N9/0071Oxidoreductases (1.) acting on paired donors with incorporation of molecular oxygen (1.14)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y114/00Oxidoreductases acting on paired donors, with incorporation or reduction of molecular oxygen (1.14)
    • C12Y114/16Oxidoreductases acting on paired donors, with incorporation or reduction of molecular oxygen (1.14) with reduced pteridine as one donor, and incorporation of one atom of oxygen (1.14.16)
    • C12Y114/16001Phenylalanine 4-monooxygenase (1.14.16.1)
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2217/00Genetically modified animals
    • A01K2217/07Animals genetically altered by homologous recombination
    • A01K2217/072Animals genetically altered by homologous recombination maintaining or altering function, i.e. knock in
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2217/00Genetically modified animals
    • A01K2217/07Animals genetically altered by homologous recombination
    • A01K2217/075Animals genetically altered by homologous recombination inducing loss of function, i.e. knock out
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2227/00Animals characterised by species
    • A01K2227/10Mammal
    • A01K2227/105Murine
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2267/00Animals characterised by purpose
    • A01K2267/03Animal model, e.g. for test or diseases
    • A01K2267/0306Animal model for genetic diseases
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2710/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA dsDNA viruses
    • C12N2710/00011Details
    • C12N2710/10011Adenoviridae
    • C12N2710/10033Use of viral protein as therapeutic agent other than vaccine, e.g. apoptosis inducing or anti-inflammatory
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2710/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA dsDNA viruses
    • C12N2710/00011Details
    • C12N2710/10011Adenoviridae
    • C12N2710/10051Methods of production or purification of viral material
    • C12N2710/10052Methods of production or purification of viral material relating to complementing cells and packaging systems for producing virus or viral particles
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14111Dependovirus, e.g. adenoassociated viruses
    • C12N2750/14121Viruses as such, e.g. new isolates, mutants or their genomic sequences
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14111Dependovirus, e.g. adenoassociated viruses
    • C12N2750/14141Use of virus, viral particle or viral elements as a vector
    • C12N2750/14143Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14111Dependovirus, e.g. adenoassociated viruses
    • C12N2750/14151Methods of production or purification of viral material
    • C12N2750/14152Methods of production or purification of viral material relating to complementing cells and packaging systems for producing virus or viral particles

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Microbiology (AREA)
  • Medicinal Chemistry (AREA)
  • Biochemistry (AREA)
  • Virology (AREA)
  • Mycology (AREA)
  • Veterinary Medicine (AREA)
  • Public Health (AREA)
  • Animal Behavior & Ethology (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Epidemiology (AREA)
  • Cell Biology (AREA)
  • Plant Pathology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Immunology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Urology & Nephrology (AREA)
  • General Chemical & Material Sciences (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Peptides Or Proteins (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Medicines Containing Material From Animals Or Micro-Organisms (AREA)
  • Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
  • Enzymes And Modification Thereof (AREA)

Abstract

본 명세서는 세포에서 페닐알라닌 히드록실라제 (PAH) 유전자 기능을 복원할 수 있는 아데노-연관 바이러스 (AAV)를 제공한다. 또한 AAV 조성물의 사용 방법, 및 AAV 조성물의 제조를 위한 패키징 시스템을 제공한다.

Description

PAH 유전자 기능 복원을 위한 아데노-연관 바이러스 조성물 및 이의 사용 방법
관련 출원
본 출원은 2018년 2월 1일 출원된 미국 가출원 제62/625,149호, 및 2018년 5월 16일 출원된 미국 가출원 제62/672,377호에 대한 우선권을 청구하고, 이들 전체 개시 내용은 참조하여 본 명세서에 편입시킨다.
전자 제출된 서열 목록에 관한 참조
ASCII 텍스트 파일로 전자 제출된 서열 목록의 내용 (명칭: HMT-024PC_SeqList_ST25.txt; 크기: 367,287 바이트; 및 생성일: 2019년 1월 30일)은 그 전문이 참조로 본 명세서에 편입된다.
페닐케톤뇨증 (PKU)은 대부분의 사례가 페닐알라닌 히드록실라제 (PAH) 유전자의 돌연변이로 인해 초래되는 상염색체 열성 유전병이다. PAH 유전자는 다량체화 시에 L-페닐알라닌 (Phe)의 L-티로신 (Tyr)으로의 히드록실화를 촉매하는 간 효소를 코딩한다. PAH 활성의 감소 또는 실활은 페닐알라닌 축적 및 이의 페닐 피루베이트 (페닐케톤이라고도 함)로의 전환을 야기시킨다. 페닐알라닌 물질대사에서 이러한 이상은 신경 성숙 및 미엘린 합성을 손상시켜서, 정신 지체, 발작 및 다른 심각한 의료 문제를 일으킨다.
현재, PKU에 대한 치료는 존재하지 않는다. 표준 치료는 고량의 페닐알라닌을 함유하는 음식물을 최소화하는 식이 관리이다. 태어나서부터 저페닐알라닌 분유를 사용한 식이 관리는 대체로 장애의 신경학적 결과의 발생을 예방한다. 그러나, 저단백질 식이를 하더라도, 아이들은 여전히 성장 지체를 앓고, 성인은 종종 골다공증 및 비타민 결핍을 겪는다. 게다가, 평생 식이 치료의 준수는 특히 학령 이후에는 어렵다.
거대 중성 아미노산 (LNAA) 보충, 보조인자 테트라히드로비옵테린 요법, 효소 대체 요법, 및 유전자 변형 프로바이오틱 요법을 포함한, 신규 치료 전략이 최근에 부상하였다. 그러나, 이들 전략은 단점을 갖고 있다. LNAA 보충법은 저 Phe 식이를 준수하지 않는 성인에게만 적합하다. 보조인자 테트라히드로비옵테린은 일부 경증 형태의 PKU에서만 사용할 수 있다. PAH에 대한 대체제, 예를 들어 페닐알라닌 암모니아-리아제 (PAL)의 투여에 의한 효소 대체는 효능을 저하시키고/시키거나 부작용을 초래하는 면역 반응을 일으킬 수 있다. 유전자 변형 프로바이오틱 요법의 경우에는, PAL-발현 이. 콜라이의 병원성이 우려되었다.
유전자 요법은 PKU를 치유할 고유한 기회를 제공한다. 렌티바이러스 벡터를 포함한, 레트로바이러스 벡터는 숙주 세포 게놈으로 핵산을 통합시킬 수 있다. 그러나, 이들 벡터는 그들의 게놈으로의 비표적화된 삽입으로 인해서 안정성 문제가 제기될 수 있다. 예를 들어, 벡터가 종양 억제인자 유전자를 파괴하거나 또는 종양유전자를 활성화시킬 위험성이 있어서, 악성종을 초래하게 된다. 실제로, 감마레트로바이러스 벡터로 CD34+ 골수 전구체를 형질도입시켜 X-연관 중증 복합 면역결핍증 (SCID)을 치료하기 위한 임상 시험에서, 10명 환자 중 4명에서 백혈병이 발생되었다 (Hacein-Bey-Abina et al., J Clin Invest. (2008) 118(9):3132-42).
뉴클레아제-기반 유전자 편집 기술, 예컨대 메가뉴클레아제, 징크 핑거 뉴클레아제 (ZFN), 전사 활성인자-유사 이펙터 뉴클레아제 (TALEN), 및 크리스퍼 (CRISPR, clustered, regularly interspaced, short palindromic repeat) 기술이 PKU 환자에서 PAH 유전자의 결함을 교정하는데 사용될 수 있다. 그러나, 이들 기술 각각은 의도하는 표적 부위와 서열이 유사한 인간 게놈 내 표적외 부위 돌연변이의 잠재성으로 인해 안정성 문제를 제기한다.
따라서, PKU 환자에서 PAH 유전자 기능을 효율적이고 안전하게 복원할 수 있는 개선된 유전자 요법 조성물 및 방법에 대한 당분야의 요구가 존재한다.
본 명세서는 세포에서 PAH 유전자 기능을 복원할 수 있는 아데노-연관 바이러스 (AAV) 조성물, 및 PAH 유전자 기능 (예를 들어, PKU)의 감소와 연관된 질환을 치료하는 이의 사용 방법을 제공한다. 또한, 아데노-연관 바이러스 조성물을 제조하기 위한 패키징 시스템을 제공한다.
따라서, 일 양상에서, 본 개시는 페닐알라닌 히드록실라제 (PAH) 유전자의 돌연변이를 교정하기 위한 방법을 제공하고, 이 방법은
(a) AAV 캡시드; 및
(b) (i) PAH 유전자 내 표적 유전자좌를 편집하기 위한 편집 엘리먼트; (ii) 표적 유전자좌에 대해 5'의 제1 게놈 영역에 대해 상동성을 갖는 편집 엘리먼트의 5'의 5' 상동성 팔부 뉴클레오티드 서열; 및 (iii) 표적 유전자좌에 대해 3'의 제2 게놈 영역에 대해 상동성을 갖는 편집 엘리먼트의 3'의 3' 상동성 팔부 뉴클레오티드 서열을 포함하는 교정 게놈
을 포함하는 복제-결함 아데노-연관 바이러스 (AAV)를 세포에 형질도입시키는 단계를 포함하고,
세포는 외생성 뉴클레아제 또는 외생성 뉴클레아제를 코딩하는 뉴클레오티드 서열을 동시-형질도입하거나 또는 동시-투여하지 않고 형질도입된다.
일정 구현예에서, 세포는 간세포, 신장 세포, 또는 뇌, 뇌하수체, 부신, 췌장, 방광, 담낭, 결장, 소장, 또는 유방의 세포이다. 일정 구현예에서, 세포는 포유동물 대상체에 존재하고 AAV는 대상체의 세포를 형질도입시키는데 유효한 양으로 대상체에게 투여된다.
다른 양상에서, 본 개시는 PAH 유전자 돌연변이와 연관된 질환 또는 장애를 갖는 대상체를 치료하기 위한 방법을 제공하고, 방법은
(a) AAV 캡시드; 및
(b) (i) PAH 유전자의 표적 유전자좌를 편집하기 위한 편집 엘리먼트; (ii) 표적 유전자좌에 대해 5'의 제1 게놈 영역에 대해 상동성을 갖는 편집 엘리먼트의 5'의 5' 상동성 팔부 뉴클레오티드 서열; 및 (iii) 표적 유전자좌에 대해 3'의 제2 게놈 영역에 대해 상동성을 갖는 편집 엘리먼트의 3'의 3' 상동성 팔부 뉴클레오티드 서열을 포함하는 교정 게놈
을 포함하는 복제-결함 AAV의 유효량을 대상체에게 투여하는 단계를 포함하고,
외생성 뉴클레아제 또는 외생성 뉴클레아제를 코딩하는 뉴클레오티드 서열은 대상체에게 동시-투여되지 않는다.
일정 구현예에서, 질환 또는 장애는 페닐케톤뇨증이다. 일정 구현예에서, 대상체는 인간 대상체이다.
다른 양상에서, 본 개시는
(a) AAV 캡시드; 및
(b) (i) PAH 유전자의 표적 유전자좌를 편집하기 위한 편집 엘리먼트; (ii) 표적 유전자좌에 대해 5'의 제1 게놈 영역에 대해 상동성을 갖는 편집 엘리먼트의 5'의 5' 상동성 팔부 뉴클레오티드 서열 5'; 및 (iii) 표적 유전자좌에 대해 3'의 제2 게놈 영역에 대해 상동성을 갖는 편집 엘리먼트의 3'의 3' 상동성 팔부 뉴클레오티드 서열을 포함하는 교정 게놈
을 포함하는 복제-결함 아데노-연관 바이러스 (AAV)를 제공한다.
하기 구현예들은 각각의 전술된 양상에 적용된다.
일정 구현예에서, 편집 엘리먼트는 PAH 코딩 서열의 적어도 일부분을 포함한다. 일정 구현예에서, 편집 엘리먼트는 PAH 코딩 서열을 포함한다. 일정 구현예에서, PAH 코딩 서열은 SEQ ID NO: 23에 기재된 아미노산 서열을 코딩한다. 일정 구현예에서, PAH 코딩 서열은 SEQ ID NO: 24에 기재된 서열을 포함한다. 일정 구현예에서, PAH 코딩 서열은 침묵적으로 변경된다. 일정 구현예에서, PAH 코딩 서열은 SEQ ID NO: 25, 116, 131, 132, 138, 139, 또는 143에 기재된 서열을 포함한다.
일정 구현예에서, 편집 엘리먼트는 PAH 인트론-삽입된 코딩 서열을 포함하고, 임의로 PAH 인트론-삽입된 코딩 서열은 PAH 코딩 서열에 삽입된 비천연 인트론을 포함한다. 일정 구현예에서, 비천연 인트론은 헤모글로빈 베타 유전자의 제1 인트론 및 마우스의 미니트 (minute) 바이러스 (MVM) 인트론으로 이루어진 군으로부터 선택된다. 일정 구현예에서, 비천연 인트론은 SEQ ID NO: 28-30, 및 120-130 중 어느 하나와 적어도 90%가 동일한 뉴클레오티드 서열로 이루어진다. 일정 구현예에서, 비천연 인트론은 SEQ ID NO: 28-30, 및 120-130 중 어느 하나에 기재된 뉴클레오티드 서열로 이루어진다.
일정 구현예에서, PAH 인트론-삽입된 코딩 서열은 SEQ ID NO: 23에 기재된 아미노산 서열을 코딩한다. 일정 구현예에서, PAH 인트론-삽입된 코딩 서열은 5'에서 3'으로, PAH 코딩 서열의 제1 부분, 인트론, 및 PAH 코딩 서열의 제2 부분을 포함하고, 제1 부분 및 제2 부분은 함께 스플라이싱될 때, 완전한 PAH 코딩 서열을 형성한다. 일정 구현예에서, PAH 코딩 서열은 SEQ ID NO: 24에 기재된 서열을 포함한다. 일정 구현예에서, PAH 코딩 서열은 침묵적으로 변경된다. 일정 구현예에서, PAH 코딩 서열은 SEQ ID NO: 25 또는 116에 기재된 서열을 포함한다. 일정 구현예에서, PAH 코딩 서열의 제1 부분은 SEQ ID NO: 64 또는 65에 기재된 아미노산 서열을 포함하고/하거나, PAH 코딩 서열의 제2 부분은 SEQ ID NO: 66 또는 67에 기재된 아미노산 서열을 포함한다. 일정 구현예에서, PAH 코딩 서열의 제1 부분은 SEQ ID NO: 64 또는 65에 기재된 아미노산 서열로 이루어지고, PAH 코딩 서열의 제2 부분은 SEQ ID NO: 66 또는 67에 기재된 아미노산 서열로 이루어진다.
일정 구현예에서, 편집 엘리먼트는 5'에서 3'으로, 리보솜 스키핑 엘리먼트, 및 PAH 코딩 서열 또는 PAH 인트론-삽입된 코딩 서열을 포함한다. 일정 구현예에서, 편집 엘리먼트는 PAH 코딩 서열 또는 PAH 인트론-삽입된 코딩 서열에 대해 3'에 폴리아데닐화 서열을 더 포함한다. 일정 구현예에서, 폴리아데닐화 서열은 외생성 폴리아데닐화 서열이고, 임의로 외생성 폴리아데닐화 서열은 SV40 폴리아데닐화 서열이다. 일정 구현예에서, SV40 폴리아데닐화 서열은 SEQ ID NO: 31-34, 및 이의 상보성 서열로 이루어진 군으로부터 선택되는 뉴클레오티드 서열을 포함한다.
일정 구현예에서, 표적 유전자좌에 대해 5'의 뉴클레오티드는 PAH 유전자의 엑손에 존재한다. 일정 구현예에서, 표적 유전자좌에 대해 5'의 뉴클레오티드는 PAH 유전자의 엑손 1에 존재한다.
일정 구현예에서, 편집 엘리먼트는 리보솜 스키핑 엘리먼트에 대해 5'에 스플라이스 억셉터를 더 포함한다. 일정 구현예에서, 표적 유전자좌에 대해 5'의 뉴클레오티드는 PAH 유전자의 인트론에 존재한다. 일정 구현예에서, 표적 유전자좌에 대해 5'의 뉴클레오티드는 PAH 유전자의 인트론 1에 존재한다. 일정 구현예에서, 편집 엘리먼트는 SEQ ID NO: 35에 기재된 뉴클레오티드 서열을 포함한다.
일정 구현예에서, 5' 상동성 팔부 뉴클레오티드 서열은 제1 게놈 영역과 적어도 90%, 95%, 96%, 97%, 98%, 또는 99%가 동일하다. 일정 구현예에서, 3' 상동성 팔부 뉴클레오티드 서열은 제2 게놈 영역과 적어도 90%, 95%, 96%, 97%, 98%, 또는 99%가 동일하다.
일정 구현예에서, 제1 게놈 영역은 제1 편집창에 위치되고, 제2 게놈 영역은 제2 편집창에 위치된다. 일정 구현예에서, 제1 편집창은 SEQ ID NO: 36 또는 45에 기재된 뉴클레오티드 서열로 이루어진다. 일정 구현예에서, 제2 편집창은 SEQ ID NO: 36 또는 45에 기재된 뉴클레오티드 서열로 이루어진다. 일정 구현예에서, 제1 편집창은 SEQ ID NO: 36에 기재된 뉴클레오티드 서열로 이루어진고, 제2 편집창은 SEQ ID NO: 45에 기재된 뉴클레오티드 서열로 이루어진다.
일정 구현예에서, 제1 게놈 영역은 SEQ ID NO: 36에 기재된 뉴클레오티드 서열로 이루어진다. 일정 구현예에서, 제2 게놈 영역은 SEQ ID NO: 45에 기재된 뉴클레오티드 서열로 이루어진다.
일정 구현예에서, 각각의 5' 및 3' 상동성 팔부 뉴클레오티드 서열은 독립적으로 약 100개 내지 약 2000개 뉴클레오티드의 길이를 갖는다.
일정 구현예에서, 5' 상동성 팔부는 PAH 유전자의 뉴클레오티드 -2에 해당하는 C, PAH 유전자의 뉴클레오티드 4에 해당하는 G, PAH 유전자의 뉴클레오티드 6에 해당하는 G, PAH 유전자의 뉴클레오티드 7에 해당하는 G, PAH 유전자의 뉴클레오티드 9에 해당하는 G, PAH 유전자의 뉴클레오티드 -467에 해당하는 A, PAH 유전자의 뉴클레오티드 -465에 해당하는 A, PAH 유전자의 뉴클레오티드 -181에 해당하는 A, PAH 유전자의 뉴클레오티드 -214에 해당하는 G, PAH 유전자의 뉴클레오티드 -212에 해당하는 C, PAH 유전자의 뉴클레오티드 -211에 해당하는 A, PAH 유전자의 뉴클레오티드 194에 해당하는 G, PAH 유전자의 뉴클레오티드 -433에 해당하는 C, PAH 유전자의 뉴클레오티드 -432에 해당하는 C, PAH 유전자의 뉴클레오티드 -394 내지 -388에 해당하는 ACGCTGTTCTTCGCC (SEQ ID NO: 68), PAH 유전자의 뉴클레오티드 -341에 해당하는 A, PAH 유전자의 뉴클레오티드 -339에 해당하는 A, PAH 유전자의 뉴클레오티드 -225에 해당하는 A, PAH 유전자의 뉴클레오티드 -211에 해당하는 A, 및/또는 PAH 유전자의 뉴클레오티드 -203에 해당하는 A를 포함한다. 일정 구현예에서, 5' 상동성 팔부는
(a) PAH 유전자의 뉴클레오티드 -2에 해당하는 C, PAH 유전자의 뉴클레오티드 4에 해당하는 G, PAH 유전자의 뉴클레오티드 6에 해당하는 G, PAH 유전자의 뉴클레오티드 7에 해당하는 G, 및 PAH 유전자의 뉴클레오티드 9에 해당하는 G;
(b) PAH 유전자의 뉴클레오티드 -467에 해당하는 A, 및 PAH 유전자의 뉴클레오티드 -465에 해당하는 A;
(c) PAH 유전자의 뉴클레오티드 -181에 해당하는 A;
(d) PAH 유전자의 뉴클레오티드 -214에 해당하는 G, PAH 유전자의 뉴클레오티드 -212에 해당하는 C, 및 PAH 유전자의 뉴클레오티드 -211에 해당하는 A;
(e) PAH 유전자의 뉴클레오티드 194에 해당하는 G;
(f) PAH 유전자의 뉴클레오티드 -433에 해당하는 C, 및 PAH 유전자의 뉴클레오티드 -432에 해당하는 C;
(g) PAH 유전자의 뉴클레오티드 -394 내지 -388에 해당하는 ACGCTGTTCTTCGCC (SEQ ID NO: 68); 및/또는
(h) PAH 유전자의 뉴클레오티드 -341에 해당하는 A, PAH 유전자의 뉴클레오티드 -339에 해당하는 A, PAH 유전자의 뉴클레오티드 -225에 해당하는 A, PAH 유전자의 뉴클레오티드 -211에 해당하는 A, 및 PAH 유전자의 뉴클레오티드 -203에 해당하는 A를 포함한다. 일정 구현예에서, 5' 상동성 팔부는 (c) 및 (d), (f) 및 (g), 및/또는 (b) 및 (h)의 변형을 포함한다.
일정 구현예에서, 5' 상동성 팔부는 SEQ ID NO: 36-44, 111, 115, 및 142 중 어느 하나에 기재된 뉴클레오티드 서열로 이루어진다. 일정 구현예에서, 3' 상동성 팔부는 SEQ ID NO: 45, 112, 117, 144에 기재된 뉴클레오티드 서열로 이루어진다.
일정 구현예에서, 교정 게놈은 SEQ ID NO: 46-54, 113, 118, 134, 136, 및 145 중 어느 하나에 기재된 뉴클레오티드 서열을 포함한다.
일정 구현예에서, 교정 게놈은 5' 상동성 팔부 뉴클레오티드 서열의 5'의 5' 반전 말단 반복부 (5' ITR) 뉴클레오티드 서열, 및 3' 상동성 팔부 뉴클레오티드 서열의 3'의 3' 반전 말단 반복부 (3' ITR) 뉴클레오티드 서열을 더 포함한다. 일정 구현예에서, 5' ITR 뉴클레오티드 서열은 SEQ ID NO: 18과 적어도 95% 서열 동일성을 갖고, 3' ITR 뉴클레오티드 서열은 SEQ ID NO: 19와 적어도 95% 서열 동일성을 갖는다. 일정 구현예에서, 5' ITR 뉴클레오티드 서열은 SEQ ID NO: 20과 적어도 95% 서열 동일성을 갖고, 3' ITR 뉴클레오티드 서열은 SEQ ID NO: 21과 적어도 95% 서열 동일성을 갖는다. 일정 구현예에서, 5' ITR 뉴클레오티드 서열은 SEQ ID NO: 26과 적어도 95% 서열 동일성을 갖고, 3' ITR 뉴클레오티드 서열은 SEQ ID NO: 27과 적어도 95% 서열 동일성을 갖는다.
일정 구현예에서, 교정 게놈은 SEQ ID NO: 55-63, 114, 119, 135, 137, 및 146 중 어느 하나에 기재된 뉴클레오티드 서열을 포함한다. 일정 구현예에서, 교정 게놈은 SEQ ID NO: 55-63, 114, 119, 135, 137, 및 146 중 어느 하나에 기재된 뉴클레오티드 서열로 이루어진다.
일정 구현예에서, AAV 캡시드는 AAV 분기군 F 캡시드 단백질을 포함한다.
일정 구현예에서, AAV 분기군 F 캡시드 단백질은 SEQ ID NO: 2, 3, 4, 6, 7, 10, 11, 12, 13, 15, 16, 또는 17의 아미노산 203-736의 아미노산 서열과 적어도 95% 서열 동일성을 갖는 아미노산 서열을 포함한다. 일정 구현예에서, SEQ ID NO: 2의 아미노산 206에 해당하는 캡시드 단백질의 아미노산은 C이거나; SEQ ID NO: 2의 아미노산 296에 해당하는 캡시드 단백질의 아미노산은 H이거나; SEQ ID NO: 2의 아미노산 312에 해당하는 캡시드 단백질의 아미노산은 Q이거나; SEQ ID NO: 2의 아미노산 346에 해당하는 캡시드 단백질의 아미노산은 A이거나; SEQ ID NO: 2의 아미노산 464에 해당하는 캡시드 단백질의 아미노산은 N이거나; SEQ ID NO: 2의 아미노산 468에 해당하는 캡시드 단백질의 아미노산은 S이거나; SEQ ID NO: 2의 아미노산 501에 해당하는 캡시드 단백질의 아미노산은 I이거나; SEQ ID NO: 2의 아미노산 505에 해당하는 캡시드 단백질의 아미노산은 R이거나; SEQ ID NO: 2의 아미노산 590에 해당하는 캡시드 단백질의 아미노산은 R이거나; SEQ ID NO: 2의 아미노산 626에 해당하는 캡시드 단백질의 아미노산은 G 또는 Y이거나; SEQ ID NO: 2의 아미노산 681에 해당하는 캡시드 단백질의 아미노산은 M이거나; SEQ ID NO: 2의 아미노산 687에 해당하는 캡시드 단백질의 아미노산은 R이거나; SEQ ID NO: 2의 아미노산 690에 해당하는 캡시드 단백질의 아미노산은 K이거나; SEQ ID NO: 2의 아미노산 706에 해당하는 캡시드 단백질의 아미노산은 C이거나; 또는 SEQ ID NO: 2의 아미노산 718에 해당하는 캡시드 단백질의 아미노산은 G이다. 일정 구현예에서,
(a) SEQ ID NO: 2의 아미노산 626에 해당하는 캡시드 단백질의 아미노산은 G이고, SEQ ID NO: 2의 아미노산 718에 해당하는 캡시드 단백질의 아미노산은 G이거나;
(b) SEQ ID NO: 2의 아미노산 296에 해당하는 캡시드 단백질의 아미노산은 H이고, SEQ ID NO: 2의 아미노산 464에 해당하는 캡시드 단백질의 아미노산은 N이고, SEQ ID NO: 2의 아미노산 505에 해당하는 캡시드 단백질의 아미노산은 R이고, SEQ ID NO: 2의 아미노산 681에 해당하는 캡시드 단백질의 아미노산은 M이거나;
(c) SEQ ID NO: 2의 아미노산 505에 해당하는 캡시드 단백질의 아미노산은 R이고, SEQ ID NO: 2의 아미노산 687에 해당하는 캡시드 단백질의 아미노산은 R이거나;
(d) SEQ ID NO: 2의 아미노산 346에 해당하는 캡시드 단백질의 아미노산은 A이고, SEQ ID NO: 2의 아미노산 505에 해당하는 캡시드 단백질의 아미노산은 R이거나; 또는
(e) SEQ ID NO: 2의 아미노산 501에 해당하는 캡시드 단백질의 아미노산은 I, SEQ ID NO: 2의 아미노산 505에 해당하는 캡시드 단백질의 아미노산은 R이고, SEQ ID NO: 2의 아미노산 706에 해당하는 캡시드 단백질의 아미노산은 C이다.
일정 구현예에서, 캡시드 단백질은 SEQ ID NO: 2, 3, 4, 6, 7, 10, 11, 12, 13, 15, 16, 또는 17의 아미노산 203-736의 아미노산 서열을 포함한다.
일정 구현예에서, AAV 분기군 F 캡시드 단백질은 SEQ ID NO: 2, 3, 4, 5, 6, 7, 9, 10, 11, 12, 13, 15, 16, 또는 17의 아미노산 138-736의 아미노산 서열과 적어도 95% 서열 동일성을 갖는 아미노산 서열을 포함한다. 일정 구현예에서, SEQ ID NO: 2의 아미노산 151에 해당하는 캡시드 단백질의 아미노산은 R이거나; SEQ ID NO: 2의 아미노산 160에 해당하는 캡시드 단백질의 아미노산은 D이거나; SEQ ID NO: 2의 아미노산 206에 해당하는 캡시드 단백질의 아미노산은 C이거나; SEQ ID NO: 2의 아미노산 296에 해당하는 캡시드 단백질의 아미노산은 H이거나; SEQ ID NO: 2의 아미노산 312에 해당하는 캡시드 단백질의 아미노산은 Q이거나; SEQ ID NO: 2의 아미노산 346에 해당하는 캡시드 단백질의 아미노산은 A이거나; SEQ ID NO: 2의 아미노산 464에 해당하는 캡시드 단백질의 아미노산은 N이거나; SEQ ID NO: 2의 아미노산 468에 해당하는 캡시드 단백질의 아미노산은 S이거나; SEQ ID NO: 2의 아미노산 501에 해당하는 캡시드 단백질의 아미노산은 I이거나; SEQ ID NO: 2의 아미노산 505에 해당하는 캡시드 단백질의 아미노산은 R이거나; SEQ ID NO: 2의 아미노산 590에 해당하는 캡시드 단백질의 아미노산은 R이거나; SEQ ID NO: 2의 아미노산 626에 해당하는 캡시드 단백질의 아미노산은 G 또는 Y이거나; SEQ ID NO: 2의 아미노산 681에 해당하는 캡시드 단백질의 아미노산은 M이거나; SEQ ID NO: 2의 아미노산 687에 해당하는 캡시드 단백질의 아미노산은 R이거나; SEQ ID NO: 2의 아미노산 690에 해당하는 캡시드 단백질의 아미노산은 K이고; SEQ ID NO: 2의 아미노산 706에 해당하는 캡시드 단백질의 아미노산은 C이거나; 또는 SEQ ID NO: 2의 아미노산 718에 해당하는 캡시드 단백질의 아미노산은 G이다. 일정 구현예에서,
(a) SEQ ID NO: 2의 아미노산 626에 해당하는 캡시드 단백질의 아미노산은 G이고, SEQ ID NO: 2의 아미노산 718에 해당하는 캡시드 단백질의 아미노산은 G이거나;
(b) SEQ ID NO: 2의 아미노산 296에 해당하는 캡시드 단백질의 아미노산은 H이고, SEQ ID NO: 2의 아미노산 464에 해당하는 캡시드 단백질의 아미노산은 N이고, SEQ ID NO: 2의 아미노산 505에 해당하는 캡시드 단백질의 아미노산은 R이고, SEQ ID NO: 2의 아미노산 681에 해당하는 캡시드 단백질의 아미노산은 M이거나;
(c) SEQ ID NO: 2의 아미노산 505에 해당하는 캡시드의 아미노산은 R이고, SEQ ID NO: 2의 아미노산 687에 해당하는 캡시드 단백질의 아미노산은 R이거나;
(d) SEQ ID NO: 2의 아미노산 346에 해당하는 캡시드 단백질의 아미노산은 A이고, SEQ ID NO: 2의 아미노산 505에 해당하는 캡시드 단백질의 아미노산은 R이거나; 또는
(e) SEQ ID NO: 2의 아미노산 501에 해당하는 캡시드 단백질의 아미노산은 I이고, SEQ ID NO: 2의 아미노산 505에 해당하는 캡시드 단백질의 아미노산은 R이고, SEQ ID NO: 2의 아미노산 706에 해당하는 캡시드 단백질의 아미노산은 C이다.
일정 구현예에서, 캡시드 단백질은 SEQ ID NO: 2, 3, 4, 5, 6, 7, 9, 10, 11, 12, 13, 15, 16, 또는 17의 아미노산 138-736의 아미노산 서열을 포함한다.
일정 구현예에서, AAV 분기군 F 캡시드 단백질은 SEQ ID NO: 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 15, 16, 또는 17의 아미노산 1-736의 아미노산 서열과 적어도 95% 서열 동일성을 갖는 아미노산 서열을 포함한다. 일정 구현예에서, SEQ ID NO: 2의 아미노산 2에 해당하는 캡시드 단백질의 아미노산은 T이거나; SEQ ID NO: 2의 아미노산 65에 해당하는 캡시드 단백질의 아미노산은 I이거나; SEQ ID NO: 2의 아미노산 68에 해당하는 캡시드 단백질의 아미노산은 V이거나; SEQ ID NO: 2의 아미노산 77에 해당하는 캡시드 단백질의 아미노산은 R이거나; SEQ ID NO: 2의 아미노산 119에 해당하는 캡시드 단백질의 아미노산은 L이거나; SEQ ID NO: 2의 아미노산 151에 해당하는 캡시드 단백질의 아미노산은 R이거나; SEQ ID NO: 2의 아미노산 160에 해당하는 캡시드 단백질의 아미노산은 D이거나; SEQ ID NO: 2의 아미노산 206에 해당하는 캡시드 단백질의 아미노산은 C이거나; SEQ ID NO: 2의 아미노산 296에 해당하는 캡시드 단백질의 아미노산은 H이거나; SEQ ID NO: 2의 아미노산 312에 해당하는 캡시드 단백질의 아미노산은 Q이거나; SEQ ID NO: 2의 아미노산 346에 해당하는 캡시드 단백질의 아미노산은 A이거나; SEQ ID NO: 2의 아미노산 464에 해당하는 캡시드 단백질의 아미노산은 N이거나; SEQ ID NO: 2의 아미노산 468에 해당하는 캡시드 단백질의 아미노산은 S이고; SEQ ID NO: 2의 아미노산 501에 해당하는 캡시드 단백질의 아미노산은 I이고; SEQ ID NO: 2의 아미노산 505에 해당하는 캡시드 단백질의 아미노산은 R이거나; SEQ ID NO: 2의 아미노산 590에 해당하는 캡시드 단백질의 아미노산은 R이거나; SEQ ID NO: 2의 아미노산 626에 해당하는 캡시드 단백질의 아미노산은 G 또는 Y이거나; SEQ ID NO: 2의 아미노산 681에 해당하는 캡시드 단백질의 아미노산은 M이거나; SEQ ID NO: 2의 아미노산 687에 해당하는 캡시드 단백질의 아미노산은 R이거나; SEQ ID NO: 2의 아미노산 690에 해당하는 캡시드 단백질의 아미노산은 K이거나; SEQ ID NO: 2의 아미노산 706에 해당하는 캡시드 단백질의 아미노산은 C이거나; 또는 SEQ ID NO: 2의 아미노산 718에 해당하는 캡시드 단백질의 아미노산은 G이다. 일정 구현예에서,
(a) SEQ ID NO: 2의 아미노산 2에 해당하는 캡시드 단백질의 아미노산은 T이고, SEQ ID NO: 2의 아미노산 312에 해당하는 캡시드 단백질의 아미노산은 Q이거나;
(b) SEQ ID NO: 2의 아미노산 65에 해당하는 캡시드 단백질의 아미노산은 I이고, SEQ ID NO: 2의 아미노산 626에 해당하는 캡시드 단백질의 아미노산은 Y이거나;
(c) SEQ ID NO: 2의 아미노산 77에 해당하는 캡시드 단백질의 아미노산은 R이고, SEQ ID NO: 2의 아미노산 690에 해당하는 캡시드 단백질의 아미노산은 K이거나;
(d) SEQ ID NO: 2의 아미노산 119에 해당하는 캡시드 단백질의 아미노산은 L이고, SEQ ID NO: 2의 아미노산 468에 해당하는 캡시드 단백질의 아미노산은 S이거나;
(e) SEQ ID NO: 2의 아미노산 626에 해당하는 캡시드 단백질의 아미노산은 G이고, SEQ ID NO: 2의 아미노산 718에 해당하는 캡시드 단백질의 아미노산은 G이거나;
(f) SEQ ID NO: 2의 아미노산 296에 해당하는 캡시드 단백질의 아미노산은 H이고, SEQ ID NO: 2의 아미노산 464에 해당하는 캡시드 단백질의 아미노산은 N이고, SEQ ID NO: 2의 아미노산 505에 해당하는 캡시드 단백질의 아미노산은 R이고, SEQ ID NO: 2의 아미노산 681에 해당하는 캡시드 단백질의 아미노산은 M이거나;
(g) SEQ ID NO: 2의 아미노산 505에 해당하는 캡시드 단백질의 아미노산은 R이고, SEQ ID NO: 2의 아미노산 687에 해당하는 캡시드 단백질의 아미노산은 R이거나;
(h) SEQ ID NO: 2의 아미노산 346에 해당하는 캡시드 단백질의 아미노산은 A이고, SEQ ID NO: 2의 아미노산 505에 해당하는 캡시드 단백질의 아미노산은 R이거나; 또는
(i) SEQ ID NO: 2의 아미노산 501에 해당하는 캡시드 단백질의 아미노산은 I이고, SEQ ID NO: 2의 아미노산 505에 해당하는 캡시드 단백질의 아미노산은 R이고, SEQ ID NO: 2의 아미노산 706에 해당하는 캡시드 단백질의 아미노산은 C이다.
일정 구현예에서, 캡시드 단백질은 SEQ ID NO: 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 15, 16, 또는 17의 아미노산 1-736의 아미노산 서열을 포함한다.
일정 구현예에서, 표적 유전자좌로 편집 엘리먼트의 통합 효율은 AAV가 표준 AAV 투여 조건 하에서 외생성 뉴클레아제의 부재 하에 인간 간세포가 이식된 마우스에게 투여될 때 적어도 1%이다. 일정 구현예에서, 표적 유전자좌로 편집 엘리먼트의 통합의 대립유전자 빈도는 AAV가 표준 AAV 투여 조건 하에서 외생성 뉴클레아제의 부재 하에 인간 간세포가 인식된 마우스에게 투여될 때 적어도 0.5%이다.
다른 양상에서, 본 개시는 본 명세서에 개시된 AAV를 포함하는 약학 조성물을 제공한다.
다른 양상에서, 본 개시는 AAV의 재조합 제조를 위한 패키징 시스템을 제공하고, 패키징 시스템은
(a) 하나 이상의 AAV Rep 단백질을 코딩하는 Rep 뉴클레오티드 서열;
(b) 본 명세서에 개시된 바와 같은 하나 이상의 AAV 분기군 F 캡시드 단백질을 코딩하는 Cap 뉴클레오티드 서열 ; 및
(c) 본 명세서에 개시된 바와 같은 교정 게놈 또는 전달 (transfer) 게놈을 포함하고, 패키징 시스템은 AAV를 형성하도록 캡시드에 교정 게놈 또는 전달 게놈을 밀봉하기 위해 세포에서 작동된다.
일정 구현예에서, 패키징 시스템은 Rep 뉴클레오티드 서열 및 Cap 뉴클레오티드 서열을 포함하는 제1 벡터, 및 교정 게놈을 포함하는 제2 벡터를 포함한다. 일정 구현예에서, Rep 뉴클레오티드 서열은 AAV2 Rep 단백질을 코딩한다. 일정 구현예에서, AAV2 Rep 단백질은 78/68 또는 Rep 68/52이다. 일정 구현예에서, AAV2 Rep 단백질은 SEQ ID NO: 22의 AAV2 Rep 아미노산 서열과 최소 백분율의 서열 동일성을 갖는 아미노산 서열을 포함하고, 최소 백분율의 서열 동일성은 AAV2 Rep 단백질을 코딩하는 아미노산 서열의 길이 전반에서 적어도 70%이다.
일정 구현예에서, 패키징 시스템은 제3 벡터를 더 포함하고, 제3 벡터는 헬퍼 바이러스 벡터이다. 일정 구현예에서, 헬퍼 바이러스 벡터는 독립적인 제3 벡터이다. 일정 구현예에서, 헬퍼 바이러스 벡터는 제1 벡터와 통합된다. 일정 구현예에서, 헬퍼 바이러스 벡터는 제2 벡터와 통합된다. 일정 구현예에서, 제3 벡터는 헬퍼 바이러스 단백질을 코딩하는 유전자를 포함한다.
일정 구현예에서, 헬퍼 바이러스는 아데노바이러스, 헤르페스 바이러스, 백시니아 바이러스, 및 사이토메갈로바이러스 (CMV)로 이루어진 군으로부터 선택된다. 일정 구현예에서, 헬퍼 바이러스는 아데노바이러스이다. 일정 구현예에서, 아데노바이러스 게놈은 E1, E2, E4 및 VA로 이루어진 군으로부터 선택되는 하나 이상의 아데노바이러스 RNA 유전자를 포함한다. 일정 구현예에서, 헬퍼 바이러스는 헤르페스 심플렉스 바이러스 (HSV)이다. 일정 구현예에서, HSV 게놈은 UL5/8/52, ICPO, ICP4, ICP22 및 UL30/UL42로 이루어진 군으로부터 선택되는 하나 이상의 HSV 유전자를 포함한다.
일정 구현예에서, 제1 벡터 및 제3 벡터는 제1 형질감염 플라스미드 내에 함유된다. 일정 구현예에서, 제2 벡터 및 제3 벡터의 뉴클레오티드는 제2 형질감염 플라스미드 내에 함유된다. 일정 구현예에서, 제1 벡터 및 제3 벡터의 뉴클레오티드는 재조합 헬퍼 바이러스에 클로닝된다. 일정 구현예에서, 제2 벡터 및 제3 벡터의 뉴클레오티드는 재조합 헬퍼 바이러스에 클로닝된다.
다른 양상에서, 본 개시는 AAV의 재조합 제조를 위한 방법을 제공하고, 방법은 AAV를 형성하도록 캡시드에 교정 게놈 또는 전달 게놈을 밀봉시키기 위해 작동되는 조건 하에서 세포에 본 명세서에 기술된 바와 같은 패키징 시스템을 도입시키는 단계를 포함한다.
도 1A 는 pHMI-hPAH-hAC-008 벡터의 맵이다.
도 1B 는 pHMI-hPAH-h1C-007 벡터의 맵이다.
도 1C 는 pHMIA-hPAH-hI1C-032.1 벡터의 맵이다.
도 2 는 pCOH-WT-PAH ("WT PAH"), pCOH-CO-PAH ("CO PAH pCOH"), 및 pHMI-CO-PAH ("CO PAH pHMI") 벡터로부터 인간 PAH의 발현을 보여주는 웨스턴 블롯의 이미지이다. 5x105 HEK 293 세포를 1 ㎍의 벡터로 형질감염시켰다. 세포의 용해물은 형질감염 이후 48시간에 수집하였다. 인간 PAH의 발현은 항-PAH 항체 (Sigma HPA031642)를 사용한 웨스턴 블롯팅으로 검출하였다. 항-GAPDH 항체 (Millipore MAB 374)로 검출되는 GAPDH 단백질의 양은 로딩 대조군으로서 도시되었다.
도 3A 는 편집 표적 부위의 선형 증폭 ("LAM-농축") 또는 PCR 증폭 ("앰플리콘") 이후에 PAH cDNA의 정량을 보여주는 그래프이다.
도 3B 는 액적 디지털 PCR (ddPCR)에 의한 pHMI-hPAH-hA-002 벡터 통합의 정량적 분석을 보여주는 그래프이다.
도 4A 는 pHMI-hPAH-mAC-006 벡터의 디자인 및 마우스 게놈으로 이의 예상되는 통합을 도시한다.
도 4B 는 pHMI-hPAH-mAC-006 벡터에 의해 편집된 대립유전자를 PCR를 통해 검출하기 위한 방법을 예시하는 다이아그램이다. 2개 쌍의 프라이머를 디자인하였다: 제1 쌍은 미편집된 대립유전자 ("대조군 PCR")로부터 867 bp DNA를 증폭시킬 수 있었고; 제2 쌍은 편집된 대립유전자 ("편집된 대립유전자 PCR")로부터 2459 bp DNA를 특이적으로 증폭시킬 수 있었다.
도 4C 는 도 4A에 예시된 바와 같이 대조군 PCR ("대조군 PCR") 및 편집된 대립유전자 PCR ("Edit PCR")로부터의 PCR 생성물을 보여주는 DNA 전기영동의 이미지이다. AAVHSC 캡시드에 패키징된 pHMI-hPAH-mAC-006 벡터는 2마리 야생형 신생 마우스에게 꼬리 정맥을 통해 정맥내로 체중 kg 당 2x1013 벡터 게놈의 용량이 주사되었다. 간 샘플은 2주 이후에 수집되었다. 염수 처리된 마우스 유래 간 샘플 및 3T3 마우스 섬유아세포의 세포 샘플은 편집된 대립유전자 PCR을 위한 음성 대조군으로서 사용되었다.
도 5A 는 편집된 대립유전자를 ddPCR을 통해 정량하기 위한 방법을 예시하는 다이아그램이다. 제1 프라이머 쌍은 pHMI-hPAH-mAC-006 벡터의 제1 서열을 증폭시키도록 디자인되었고, 제1 프로브 ("벡터 프로브")는 제1 서열과 하이브리드화하도록 디자인되었다. 제2 프라이머 쌍은 벡터 근처 마우스 게놈 상의 제2 서열을 증폭시키도록 디자인되었고, 제2 프로브 ("유전자좌 프로브")는 제2 서열과 하이브리드화하도록 디자인되었다. DNA 샘플은 유적 (oil droplet)으로 분할하였다. DNA의 농도는 하나의 유적이 무작위적으로 벡터 입자 및 게놈 DNA 입자를 함유할 확률을 유의하게 감소시키기 위해서 20 ㎕ 당 600 pg으로 최적화시켰다 (p<0.001). 게놈으로 벡터의 통합 시에, 동일 유적 내 벡터 프로브 및 유전자좌 프로브의 이중 양성 비율이 증가된다.
도 5B 는 도 5A에 기술된 방법을 사용해 예상되는 결과를 예시하는 다이아그램이다. 다이아그램에서, 각각의 도트는 단일 유적을 나타낸다. 음성 벡터 프로브 신호이지만 양성 유전자좌 프로브 신호를 갖는 도트는 미편집된 대립유전자를 나타내는 한편, 양성 벡터 프로브 신호이지만 양성 유전자좌 프로브 신호를 갖는 도트는 편집된 대립유전자를 나타낸다.
도 5C 는 도 5A에 기술된 방법을 사용하여 마우스 간으로부터 생성된 데이터를 도시하는 그래프이다. AAVHSC 캡시드에 패키징된 pHMI-hPAH-mAC-006 벡터는 2마리 야생형 신생 마우스에게 꼬리 정맥을 통해 정맥내로 체중 kg 당 2x1013 벡터 게놈의 용량이 주사된다. 간 샘플은 2주 이후에 수집하였다. 하나의 샘플이 도 5A에 기술된 방법을 사용해 분석되었다. 벡터 프로브 및 유전자좌 프로브 이중 양성 유적이 검출되었다.
도 5D 는 염수 처리 마우스 유래 간 및 pHMI-hPAH-mAC-006 플라스미드를 함유하는 샘플로부터 생성된 데이터를 도시하는 그래프이다. 소수의 프로브 및 유전자좌 프로브 이중 양성 유적이 검출되어서, 샘플이 하나의 유적이 무작위적으로 벡터 입자 및 게놈 DNA 입자를 함유할 확률이 매우 낮도록 충분히 희석되었다는 것을 시사한다.
도 5E 는 도 5D의 그래프의 정량을 도시한 그래프 및 다른 샘플로부터 생성된 그래프이다. 2마리의 대조군 마우스는 각각 간에서 0% 및 0.0395%의 편집된 대립유전자를 가졌고, pHMI-hPAH-mAC-006 벡터로 처리된 2마리 마우스는 간에서 각각 2.504% 및 2.783% 편집된 대립유전자를 가졌다.
도 6 은 pHMI-hPAH-mAC-006 벡터의 투여 이후 간에서 PAH의 mRNA 발현을 도시한 그래프이다. RNA를 추출하여 역전사시켰다. 프라이머 및 프로브 쌍은 편집된 대립유전자로부터 PAH 발현을 특이적으로 검출하도록 디자인되었다. 각각의 PAH 발현 수준은 내생성 Hprt의 발현 수준에 대해 정규화된다.
도 7A 는 벡터 및 마우스 PAH 게놈 유전자좌 카피수를 측정하기 위한 프라이머 및 프로브 세트를 사용한 ddPCR을 통해서 측정된, 마우스 혈액 샘플에서 AAVHSC 캡시드에 패키징된 pHMI-hPAH-mAC-006 벡터의 형질도입 효율을 도시하는 그래프이다. 세포 당 벡터 게놈의 개수 ("세포 당 VG")는 벡터의 수 대 마우스 PAH의 게놈 유전자좌의 카피수의 측정된 비율로부터 계산된다.
도 7B 는 마우스 PAH 유전자좌 및 인간 PAH 유전자좌로 통합된 AAV 벡터 ("페이로드")로부터 통합된 DNA의 빈도를 측정하기 위한 프라이머 프로브 세트를 사용한 다중화 ddPCR을 통해 측정된 마우스 혈액 샘플에서의 편집 효율 백분율을 도시하는 그래프이다. 편집 빈도는 별개 핵산 분자에서 페이로드 및 표적 DNA의 동시-분할의 예상 확률을 초과하는 단일 유적 내 페이로드 및 표적 DNA의 검출된 동시-분할을 기반으로 계산하였다.
도 7C 는 AAVHSC 캡시드에 패키징된 pHMI-hPAH-mAC-006 벡터의 투여 이후에 마우스에서 기준치 대비 혈청 페닐알라닌 수준의 백분율을 도시하는 그래프이다. 처리된 동물 및 대조군 동물 (AAV 투여를 받지 않은 마우스)에서의 평균 수준이 그래프화된다.
도 7D 는 AAVHSC 캡시드에 패키징된 pHMI-hPAH-mAC-006 벡터가 주사된 각각의 개별 마우스 또는 AAV 투여를 받지 않은 각각의 대조군 마우스에서 기준치 대비 혈청 페닐알라닌 수준의 백분율을 도시한 그래프이다. p 값은 대조군 분포에 대해 ANOVA를 통해 계산하였다.
도 7E 는 기준치 대비 혈청 페닐알라닌 수준의 백분율 및 편집 효율 백분율 간 상관성을 도시하는 그래프이다.
도 7F 는 hPAH-mAC-006 벡터 (중간 패널), 비통합 Pah 이식유전자 벡터 (우측 패널), 또는 염수 대조군 (좌측 패널)이 주사된 마우스의 간 샘플에서 PAH 서열을 포함하는 아마도 바이러스 DNA 및 Pah mRNA의 인 시츄 하이브리드화 (ISH)를 도시한 이미지의 세트이다.
도 8A 는 벡터에 특이적인 프라이머 및 프로브 세트를 사용한 ddPCR을 통해 측정된, AAVHSC15 캡시드에 패키징된 벡터가 투여된 마우스에서 인간 및 마우스 간세포에서의 hPAH-hAC-008 벡터 및 hPAH-hAC-008-HBB 벡터의 형질도입 효율을 도시한 그래프이다. y-축은 마우스 또는 인간 세포의 게놈에 대해 측정된 벡터의 개수를 의미한다.
도 8B 는 미변형 또는 변형 hPAH-hAC-008 벡터가 투여된 마우스 유래 간 샘플에서 침묵 코돈 변경을 갖는 PAH 서열을 포함하는 가능한 바이러스 DNA 및 인간 Pah mRNA의 인 시츄 하이브리드화를 도시한 일련의 사진이다. 프로브는 미변형 또는 변형 hPAH-hAC-008 벡터에 의해 편집된 유전자 좌위로부터 전사된 mRNA 만을 검출하였다.
도 8C 는 다중화 ddPCR을 통해 측정된, 인간 간세포가 이식된 마우스 유래 마우스 및 인간 간세포에서 hPAH-hAC-008 벡터의 편집 효율의 백분율을 도시한 그래프이다. 도면의 좌측 절반은 hPAH-hAC-008-HBB 벡터가 처리된 동물의 편집 효율을 의미하고, 우측 절반은 hPAH-hAC-008 벡터가 처리된 동물의 것을 의미한다. p 값은 ANOVA로 계산하였다.
도 9A 는 마우스에서 PAH 유전자의 편집 효율을 결정하기 위해 사용되는 어세이의 개략도를 도시한다.
도 9B pHMI-hPAH-mAC-006 벡터 또는 비히클 대조군이 투여된 마우스 유래 세포에서 PAH 유전자 편집 효율을 도시한 그래프이다.
도 10A 는 AAVHSC15 캡시드 또는 비히클 대조군에 패키징된 pHMI-hPAH-mAC-006 벡터의 투여 이후 마우스에서 기준치 대비 혈청 페닐알라닌 수준의 평균 백분율을 도시한 그래프이다.
도 10B 는 AAVHSC15 캡시드 또는 비히클 대조군에 패키징된 pHMI-hPAH-mAC-006 벡터의 투여 이후 마우스에서 기준치 대비 혈청 티로신 수준의 평균 백분율을 도시한 그래프이다.
도 10C 는 AAVHSC15 캡시드 또는 비히클 대조군에 패키징된 pHMI-hPAH-mAC-006 벡터를 받은 마우스에스 혈청 페닐알라닌 및 혈청 티로신 수준 간 비율을 도시한 그래프이다.
도 11A 는 pHMI-hPAH-mAC-006 벡터 또는 비히클 대조군이 투여된 마우스로부터 수득된 세포에서 평균 PAH 유전자 편집 효율 및 형질도입 효율을 도시한 그래프이다.
도 11B 는 pHMI-hPAH-mAC-006 벡터 (AAVHSC15-mPAH) 및 또는 비히클 대조군이 투여된 마우스에서 수득된 세포에서, 마우스 GAPDH의 발현 수준에 대해 정규화된, 발현된 PAH mRNA의 상대적 분량을 도시한 그래프를 도시한다.
도 12A HuLiv 인간화 간 마우스 모델을 도시한 개략도이다.
도 12B 는 AAVHSC15 캡시드에 패키징된 pHMIK-hPAH-hI1C-032 벡터의 투여 이후 1주차 및 6주차에 마우스로부터 수득된 세포에서의 평균 PAH 유전자 편집 효율을 도시한다.
도 13 은 AAVHSC15 캡시드에 패키징된 pHMIK-hPAH-hI1C-032 벡터가 투여된 HuLiv 마우스로부터 수득된 세포에서, ddPCR 및 차세대 시퀀싱 (NGS)으로 결정된, 평균 PAH 유전자 편집 효율을 도시한 그래프이다.
도 14 는 대조군 마우스와 비교한, AAVHSC15 캡시드에 패키징된 pHMIK-hPAH-hI1C-032 벡터 (hPAH-032) 또는 pHMI-hPAH-mAC-006 벡터 (mPAH-006)가 정맥내로 투여된 PAH 녹-아웃 마우스 모델 (PAH ENU2) 마우스의 평균 혈청 페닐알라닌 수준을 도시한 그래프이다.
도 15A 는 인간 PAH 발현 및 혈청 Phe 수준 간 관련성을 도시한 그래프이다.
도 15B 는 AAVHSC15 캡시드에 패키징된 pHMIK-hPAH-hI1C-032 벡터가 처리된 2종의 상이한 HuLiv 마우스에서 인간 GAPDH 대비 인간 PAH의 발현을 도시한 그래프이다.
도 16 은 AAVHSC15 캡시드에서 패키징된 pHMI-hPAH-mAC-006 벡터 (우측)가 처리된 PAHENU2 마우스에서 마우스 PAH 유전자 발현 및 처리된 (좌측) HuLiv 마우스에서 인간 PAH 유전자 발현을 도시한 그래프이다.
도 17A, 17B, 17C, 17D, 17E 는 각각 pKITR-hPAH-mAC-006-HCR, pKITR-hPAH-hI1C-032-HCR, pKITR-hPAH-mAC-006-SD.3, pHMIA2-hPAH-hI1C-032-SD.3, 및 pHMIA2-hPAH-mAC-006-HBB1의 벡터 맵을 도시한다.
본 개시는 세포에서 PAH 유전자 기능을 복원할 수 있는 아데노-연관 바이러스 (AAV) 조성물을 제공하였다. 또한 아데노-연관 바이러스 조성물을 제조하기 위한 패키징 시스템을 제공한다.
I. 정의
본 명세서에서 사용되는, 용어 "복제-결함 아데노-연관 바이러스"는 Rep 및 Cap 유전자가 결여된 게놈을 포함하는 AAV를 의미한다.
본 명세서에서 사용되는, 용어 "PAH 유전자"는 제한없이 PAH 유전자의 코딩 영역, 엑손, 인트론, 5' UTR, 3' UTR, 및 전사 조절 영역을 포함하는, 페닐알라닌 히드록실라제 (PAH) 유전자를 의미한다. 인간 PAH 유전자는 Entrez Gene ID 5053로 확인된다. PAH mRNA의 예시적인 뉴클레오티드 서열은 SEQ ID NO: 24로서 제공된다. PAH 폴리펩티드의 예시적인 아미노산 서열은 SEQ ID NO: 23으로서 제공된다.
본 명세서에서 사용되는, 용어 "PAH 유전자 내 돌연변이의 교정"은 야생형 PAH 폴리펩티드를 발현시킬 수 있는 PAH 유전자를 생성시키기 위해 돌연변이체 PAH 유전자 내 표적 유전자좌에서의 하나 이상의 뉴클레오티드의 삽입, 결실 또는 치환을 의미한다. 일정 구현예에서, "PAH 유전자 내 돌연변이의 교정"은 야생형 PAH 폴리펩티드 또는 이의 기능적 균등체가 돌연변이체 PAH 유전자 좌위로부터 (예를 들어, 내생성 PAH 유전자 프로모터의 제어 하에서) 발현되도록, 야생형 PAH 폴리펩티드의 적어도 일부분 또는 이의 기능적 균등체를 코딩하는 뉴클레오티드 서열을 돌연변이체 PAH 유전자에 삽입시키는 것을 의미한다.
본 명세서에서 사용되는, 용어 "교정 게놈"은 PAH 유전자 내 유전자 결함을 교정하기 위해 표적 유전자좌로 상동성 재조합을 통해서 편집 엘리먼트 (예를 들어, 하나 이상의 뉴클레오티드 또는 뉴클레오티드간 결합)를 통합시킬 수 있는 재조합 AAV 게놈을 의미한다. 일정 구현예에서, 표적 유전자좌는 인간 PAH 유전자에 존재한다. 당업자는 5' 상동성 팔부, 편집 엘리먼트, 및 3' 상동성 팔부를 포함하는 교정 게놈의 일부분이 표적 유전자좌 (예를 들어, 인간 PAH 유전자)에 대해 센스 또는 안티센스 배향일 수 있다는 것을 이해하게 될 것이다.
본 명세서에서 사용되는, 용어 "편집 엘리먼트"는 표적 유전자좌에 통합될 때 표적 유전자좌를 변형시키는 교정 게놈의 일부분을 의미한다. 편집 엘리먼트는 표적 유전자좌에서의 하나 이상의 뉴클레오티드의 삽입, 결실 또는 치환을 매개할 수 있다.
본 명세서에서 사용되는, 용어 "표적 유전자좌"는 편집 엘리먼트에 의해 변형되는 뉴클레오티드간 결합 (예를 들어, 인간 PAH 유전자의 영역 또는 뉴클레오티드간 결합) 또는 염색체의 영역을 의미한다.
본 명세서에서 사용되는, 용어 "상동성 팔부"는 표적 유전자좌에 측접하는 게놈과 실질적으로 동일한 편집 엘리먼트의 5' 또는 3'에 위치된 교정 게놈의 일부분을 의미한다. 일정 구현예에서, 표적 유전자좌는 인간 PAH 유전자에 존재하고, 상동성 팔부는 표적 유전자좌에 측접하는 게놈과 실질적으로 동일한 서열을 포함한다.
본 명세서에서 사용되는, 용어 "분기군 F 캡시드 단백질"은 본 명세서의 SEQ ID NO:1의 아미노산 1-736, 138-736, 및 203-736에 각각 기재된 VP1, VP2, 또는 VP3의 아미노산 서열과 적어도 90% 동일성을 갖는 아미노산 서열을 포함하는 AAV VP1, VP2, 또는 VP3 캡시드 단백질을 의미한다.
본 명세서에서 사용되는, 2개 뉴클레오티드 서열 또는 2개 아미노산 서열 간 동일성은 정렬된 동일한 뉴클레오티드 또는 아미노산의 개수를 더 긴 뉴클레오티드 또는 아미노산 서열의 전체 길이로 나누어서 결정된다.
본 명세서에서 사용되는, 용어 "PAH 유전자 돌연변이와 연관된 질환 또는 장애"는 PAH 유전자의 변이에 의해 초래되거나, 그로 인해 악화되거나, 또는 그와 유전적으로 연결된 임의의 질환 또는 장애를 의미한다. 일정 구현예에서, PAH 유전자 돌연변이와 연관된 질환 또는 장애는 페닐케톤뇨증 (PKU)이다.
본 명세서에서 사용되는 용어 "침묵적으로 변경"은 코딩서열 또는 스터퍼 (stuffer)-삽입된 코딩 서열에 의해 코딩되는 폴리펩티드의 아미노산 서열을 변화시키지 않고 (예를 들어, 뉴클레오티드 치환에 의한) 유전자의 코딩 서열 또는 스터퍼-삽입된 코딩 서열의 변경을 의미한다. 코돈 변경은 당분야에 공지된 임의의 방법으로 통해 수행될 수 있다 (예를 들어, 그 전문이 참조로 본 명세서에 편입되는, [Mauro & Chappell (2014) Trends Mol Med. 20(11):604-13]에 기재된 바와 같음). 이러한 침묵 변경은 표적 유전자에 대해 직렬상동 (paralogous)인 다른 유전자 또는 위유전자의 유전자좌로 교정 게놈의 통합 가능성을 감소시킨다는 점에서 유리하다. 이러한 침묵 변경은 또한 편집 엘리먼트 및 표적 유전자 간 상동성을 감소시켜서, 상동성 팔부 대신에 편집 엘리먼트에 의해 매개되는 바람직하지 않은 통합을 감소시킨다.
본 명세서에서 사용되는 용어 "코딩 서열"은 출발 코돈에서 시작하여 중지 코돈에서 종결되는, 폴리펩티드를 코딩하는 상보성 DNA (cDNA)의 일부분을 의미한다. 유전자는 선택적 스플라이싱 및/또는 선택적 번역 개시로 인해 하나 이상의 코딩 서열을 가질 수 있다. 코딩 서열은 야생형일 수 있거나 또는 침묵적으로 변경될 수 있다. 예시적인 야생형 PAH 코딩 서열은 SEQ ID NO: 24에 기재되어 있다.
본 명세서에서 사용되는 용어 유전자의 "인트론-삽입된 코딩 서열"은 유전자의 코딩 서열에 삽입된 하나 이상의 인트론을 포함하는 뉴클레오티드 서열을 의미한다. 일정 구현예에서, 인트론 중 적어도 하나는 비천연 인트론으로서, 다시말해서, 유전자의 천연 인트론과 상이한 서열을 갖는다. 일정 구현예에서, 인트론-삽입된 코딩 서열 내 모든 인트론은 비천연 인트론이다. 비천연 인트론은 상이한 종 유래 인트론의 서열, 또는 동일한 종 유래 상이한 유전자 내 인트론의 서열을 가질 수 있다. 대안적으로 또는 추가적으로, 비천연 인트론 서열의 적어도 일부분은 합성일 수 있다. 당업자는 비천연 인트론 서열이 당분야에 공지된 임의의 공통 스플라이싱 모티프를 도입시켜서 RNA 스플라이싱을 매개하도록 디자인될 수 있다는 것을 이해하게 될 것이다. 예시적인 공통 스플라이싱 모티프는 [Sibley et al., (2016) Nature Reviews Genetics, 17, 407-21]에 제공되어 있고, 이의 전문을 참조로 본 명세서에 편입시킨다. 비천연 인트론의 삽입은 스터퍼 서열이 최적 크기 (예를 들어, 4.5-4.8 kb)에 도달하도록 벡터의 조정을 가능하게 하므로, 벡터 패키징의 효율 및 강건성을 촉진시킬 수 있다. 일정 구현예에서, 인트론의 적어도 하나는 유전자의 천연 인트론이다. 일정 구현예에서, 인트론-삽입된 코딩 서열 내 모든 인트론은 유전자의 천연 인트론이다. 비천연 또는 천연 인트론은 코딩 서열 내 임의의 뉴클레오티드간 결합에서 삽입될 수 있다. 일정 구현예에서, 하나 이상의 비천연 또는 천연 인트론은 효율적인 스플라이싱을 촉진하는 것으로 예측되는 뉴클레오티드간 결합에 삽입된다 (예를 들어, 그 전문이 참조로 본 명세서에 편입되는 문헌 [Zhang (1998) Human Molecular Genetics, 7(5):919-32] 참조). 일정 구현예에서, 하나 이상의 비천연 또는 천연 인트론은 2개의 내생성 엑손을 연결하는 뉴클레오티드간 결합에 삽입된다.
본 명세서에서 사용되는 용어 "리보솜 스키핑 엘리먼트"는 하나의 mRNA 분자의 번역으로부터 2개의 펩티드 사슬의 생성을 초래할 수 있는 짧은 펩티드 서열을 코딩하는 뉴클레오티드 서열을 의미한다. 일정 구현예에서, 리보솜 스키핑 엘리먼트는 X1X2EX3NPGP의 공통 모티프를 포함하는 펩티드를 코딩하고, 여기서 X1 은 D 또는 G이고, X2 는 V 또는 I이고, X3 은 임의의 아미노산이다 (SEQ ID NO: 75). 일정 구현예에서, 리보솜 스키핑 엘리먼트는 토세아-아시그나 바이러스 2A 펩티드 (T2A), 돼지 테스코바이러스-1 2A 펩티드 (P2A), 구제역 바이러스 2A 펩티드 (F2A), 말 비염 A 바이러스 2A 펩티드 (E2A), 세포질 다각체병 바이러스 2A 펩티드 (BmCPV 2A), 또는 누에나방 (B. mori)의 무름병 바이러스 2A 펩티드 (BmIFV 2A)를 코딩한다. T2A 펩티드 및 P2A 펩티드의 예시적인 아미노산 서열은 각각 SEQ ID NO: 76 및 77에 기재되어 있다. T2A 엘리먼트 및 P2A 엘리먼트의 예시적인 뉴클레오티드 서열은 각각 SEQ ID NO: 78 및 79에 기재되어 있다. 일정 구현예에서, 리보솜 스키핑 엘리먼트는 N-말단에서 Gly-Ser-Gly의 서열을 더 포함하는 펩티드를 코딩하고, 임의로 Gly-Ser-Gly의 서열은 GGCAGCGGA의 뉴클레오티드 서열에 의해 코딩된다. 이론에 국한하고 싶지 않지만, 리보솜 스키핑 엘리먼트는 제1 펩티드 사슬의 번역을 종결하고 제2 펩티드 사슬의 번역을 재개시하거나; 또는 코딩된 펩티드의 내재성 프로테아제 활성에 의해 리보솜 스키핑 엘리먼트에 의해 코딩되는 펩티드 서열 내 펩티드 결합의 절단에 의하거나, 또는 환경 (예를 들어, 시토졸) 내 다른 프로테아제에 의해 기능한다고 가정된다.
본 명세서에서 사용되는 용어 "리보솜 스키핑 펩티드"는 리보솜 스키핑 엘리먼트에 의해 코딩되는 펩티드를 의미한다. 
본 명세서에서 사용되는 용어 "폴리아데닐화 서열"은 RNA로 전사될 때 폴리아데닐화 신호 서열을 구성하는 DNA 서열을 의미한다. 폴리아데닐화 서열은 천연 (예를 들어, PAH 유전자 유래) 유래일 수 있거나 또는 외생성일 수 있다. 외생성 폴리아데닐화 서열은 포유동물 또는 바이러스 폴리아데닐화 서열 (예를 들어, SV40 폴리아데닐화 서열)일 수 있다.
본 개시에서, PAH 유전자 내 뉴클레오티드 위치는 출발 코돈의 제1 뉴클레오티드에 대해 명시된다. 출발 코돈의 제1 뉴클레오티드는 위치 1이고; 출발 코돈의 제1 뉴클레오티드에 대해 5'의 뉴클레오티드는 음수를 가지며; 출발 코돈의 제1 뉴클레오티드에 대해 3'의 뉴클레오티드는 양수를 갖는다. 본 명세서에서 사용되는, 인간 PAH 유전자의 뉴클레오티드 1은 NCBI 참조 서열: NG_008690.1의 뉴클레오티드 5,473이고, 인간 PAH 유전자의 뉴클레오티드 -1은 NCBI 참조 서열: NG_008690.1의 뉴클레오티드 5,472이다.
본 개시에서, PAH 유전자 내 엑손 및 인트론은 NCBI 참조 서열: NG_008690.1의 뉴클레오티드 5473인, 출발 코돈의 제1 뉴클레오티드를 포괄하는 엑손에 대해 명시된다. 출발 코돈의 제1 뉴클레오티드를 포괄하는 엑손은 엑손 1이다. 엑손 1에 대한 3'의 엑손은 5'에서 3'으로, 엑손 2, 엑손 3 등이다. 엑손 1에 대한 3'의 인트론은 5'에서 3'으로, 인트론 1, 인트론 2 등이다. 따라서, PAH 유전자는 5'에서 3'으로, 엑손 1, 인트론 1, 엑손 2, 인트론 2, 엑손 3 등을 포함한다. 본 명세서에서 사용되는, 인간 PAH 유전자의 엑손 1은 NCBI 참조 서열: NG_008690.1의 뉴클레오티드 5001-5532이고, 인간 PAH 유전자의 인트론 1은 NCBI 참조 서열: NG_008690.1의 뉴클레오티드 5533-9704이다.
본 명세서에서 사용되는 용어 "통합"은 교정 게놈과 표적 유전자좌 간에 상동성 재조합을 통한 (예를 들어, PAH 유전자의) 표적 유전자좌로 편집 엘리먼트의 도입을 의미한다. 편집 엘리먼트의 통합은 (예를 들어, PAH 유전자의) 표적 유전자좌 내 하나 이상의 뉴클레오티드의 치환, 삽입, 및/또는 결실을 일으킬 수 있다.
본 명세서에서 사용되는 용어 "표적 유전자좌로 편집 엘리먼트의 통합 효율"은 표적 유전자좌로 편집 엘리먼트의 통합이 발생된 형질도입된 개체군 중 세포의 백분율을 의미한다.
본 명세서에서 사용되는 용어 "표적 유전자좌로 편집 엘리먼트의 통합의 대립유전자 빈도"는 표적 유전자좌로 편집 엘리먼트의 통합이 발생된 형질도입된 세포 개체군 중 대립유전자의 백분율을 의미한다.
본 명세서에서 사용되는 용어 "표준 AAV 투여 조건"은 간세포 절제 이후에 마우스에 이식된 인간 간세포의 형질도입을 의미하고, AAV는 실시예 5, 섹션 b의 방법에서 제공된 바와 같이, 정맥내로 체중 킬로그램 당 1 Х 1013 벡터 게놈의 용량으로 투여된다.
대상체에게 AAV의 투여 상황에서 본 명세서에서 사용되는 용어 "유효량"은 바람직한 예방적 또는 치료적 효과를 달성하는 AAV의 양을 의미한다.
II. 아데노-연관 바이러스 조성물
일 양상에서, 본 명세서는 PAH 유전자 기능이 감소되거나 또는 그렇지 않으면 결함이 있는 세포에서 PAH 발현을 복원시키는데 유용한 신규한 복제-결함 AAV 조성물을 제공한다. 이러한 AAV 조성물은 PAH 유전자 내 돌연변이의 교정 또는 PAH 발현의 복원에서 매우 효율적이며, 이러한 교정을 촉진하기 위해서 외생성 뉴클레아제 (예를 들어, 메가뉴클레아제, 징크 핑거 뉴클레아제, 전사 활성인자-유사 뉴클레아제 (TALEN), 또는 RNA-가이드된 뉴클레아제 예컨대 Cas9)의 작용을 통한 표적 유전자좌에서의 게놈의 절단을 요구하지 않는다. 따라서, 일정 구현예에서, 본 명세서에 개시된 AAV 조성물은 외생성 뉴클레아제 또는 외생성 뉴클레아제를 코딩하는 뉴클레오티드 서열을 포함하지 않는다.
일정 구현예에서, 본 명세서에 개시된 AAV는 AAV 캡시드; 및 PAH 유전자 내 표적 유전자좌를 편집하기 위한 교정 게놈을 포함한다. 본 명세서에 개시된 AAV 조성물에 사용할 수 있는 AAV 캡시드 단백질은 제한없이 분기군 A AAV, 분기군 B AAV, 분기군 C AAV, 분기군 D AAV, 분기군 E AAV, 및 분기군 F AAV의 AAV 캡시드 단백질 및 이의 유도체를 포함한다. 일정 구현예에서, AAV 캡시드 단백질은 AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, 또는 AAVrh10의 AAV 캡시드 단백질 또는 이의 유도체이다. 일정 구현예에서, AAV 캡시드는 AAV 분기군 F 캡시드 단백질을 포함한다.
임의의 AAV 분기군 F 캡시드 단백질 또는 이의 유도체가 본 명세서에 개시된 AAV 조성물에 사용될 수 있다. 예를 들어, AAV 분기군 F 캡시드 단백질은 SEQ ID NO: 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 15, 16, 또는 17의 아미노산 203-736의 아미노산 서열과 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 서열 동일성을 갖는 아미노산 서열을 포함한다. 일정 구현예에서, AAV 분기군 F 캡시드 단백질은 SEQ ID NO: 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 15, 16, 또는 17의 아미노산 203-736의 아미노산 서열과 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 서열 동일성을 갖는 아미노산 서열을 포함하고, 여기서 SEQ ID NO: 2의 아미노산 206에 해당하는 캡시드 단백질의 아미노산은 C이거나; SEQ ID NO: 2의 아미노산 296에 해당하는 캡시드 단백질의 아미노산은 H이거나; SEQ ID NO: 2의 아미노산 312에 해당하는 캡시드 단백질의 아미노산은 Q이거나; SEQ ID NO: 2의 아미노산 346에 해당하는 캡시드 단백질의 아미노산은 A이거나; SEQ ID NO: 2의 아미노산 464에 해당하는 캡시드 단백질의 아미노산은 N이거나; SEQ ID NO: 2의 아미노산 468에 해당하는 캡시드 단백질의 아미노산은 S이거나; SEQ ID NO: 2의 아미노산 501에 해당하는 캡시드 단백질의 아미노산은 I이거나; SEQ ID NO: 2의 아미노산 505에 해당하는 캡시드 단백질의 아미노산은 R이거나; SEQ ID NO: 2의 아미노산 590에 해당하는 캡시드 단백질의 아미노산은 R이거나; SEQ ID NO: 2의 아미노산 626에 해당하는 캡시드 단백질의 아미노산은 G 또는 Y이거나; SEQ ID NO: 2의 아미노산 681에 해당하는 캡시드 단백질의 아미노산은 M이거나; SEQ ID NO: 2의 아미노산 687에 해당하는 캡시드 단백질의 아미노산은 R이거나; SEQ ID NO: 2의 아미노산 690에 해당하는 캡시드 단백질의 아미노산은 K이거나; SEQ ID NO: 2의 아미노산 706에 해당하는 캡시드 단백질의 아미노산은 C이거나; 또는 SEQ ID NO: 2의 아미노산 718에 해당하는 캡시드 단백질의 아미노산은 G이다. 일정 구현예에서, SEQ ID NO: 2의 아미노산 626에 해당하는 캡시드 단백질의 아미노산은 G이고, SEQ ID NO: 2의 아미노산 718에 해당하는 캡시드 단백질의 아미노산은 G이다. 일정 구현예에서, SEQ ID NO: 2의 아미노산 296에 해당하는 캡시드 단백질의 아미노산은 H이고, SEQ ID NO: 2의 아미노산 464에 해당하는 캡시드 단백질의 아미노산은 N이고, SEQ ID NO: 2의 아미노산 505에 해당하는 캡시드 단백질의 아미노산은 R이고, SEQ ID NO: 2의 아미노산 681에 해당하는 캡시드 단백질의 아미노산은 M이다. 일정 구현예에서, SEQ ID NO: 2의 아미노산 505에 해당하는 캡시드 단백질의 아미노산은 R이고, SEQ ID NO: 2의 아미노산 687에 해당하는 캡시드 단백질의 아미노산은 R이다. 일정 구현예에서, SEQ ID NO: 2의 아미노산 346에 해당하는 캡시드 단백질의 아미노산은 A이고, SEQ ID NO: 2의 아미노산 505에 해당하는 캡시드 단백질의 아미노산은 R이다. 일정 구현예에서, SEQ ID NO: 2의 아미노산 501에 해당하는 캡시드 단백질의 아미노산은 I이고, SEQ ID NO: 2의 아미노산 505에 해당하는 캡시드 단백질의 아미노산은 R이고, SEQ ID NO: 2의 아미노산 706에 해당하는 캡시드 단백질의 아미노산은 C이다. 일정 구현예에서, AAV 분기군 F 캡시드 단백질은 SEQ ID NO: 2, 3, 4, 6, 7, 10, 11, 12, 13, 15, 16, 또는 17의 아미노산 203-736의 아미노산 서열을 포함한다.
예를 들어, 일정 구현예에서, AAV 분기군 F 캡시드 단백질은 SEQ ID NO: 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 15, 16, 또는 17의 아미노산 138-736의 아미노산 서열과 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 서열 동일성을 갖는 아미노산 서열을 포함한다. 일정 구현예에서, AAV 분기군 F 캡시드 단백질은 SEQ ID NO: 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 15, 16, 또는 17의 아미노산 138-736의 아미노산 서열과 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 서열 동일성을 갖는 아미노산 서열을 포함하고, 여기서 SEQ ID NO: 2의 아미노산 151에 해당하는 캡시드 단백질의 아미노산은 R이거나; SEQ ID NO: 2의 아미노산 160에 해당하는 캡시드 단백질의 아미노산은 D이거나; SEQ ID NO: 2의 아미노산 206에 해당하는 캡시드 단백질의 아미노산은 C이거나; SEQ ID NO: 2의 아미노산 296에 해당하는 캡시드 단백질의 아미노산은 H이거나; SEQ ID NO: 2의 아미노산 312에 해당하는 캡시드 단백질의 아미노산은 Q이거나; SEQ ID NO: 2의 아미노산 346에 해당하는 캡시드 단백질의 아미노산은 A이거나; SEQ ID NO: 2의 아미노산 464에 해당하는 캡시드 단백질의 아미노산은 N이거나; SEQ ID NO: 2의 아미노산 468에 해당하는 캡시드 단백질의 아미노산은 S이거나; SEQ ID NO: 2의 아미노산 501에 해당하는 캡시드 단백질의 아미노산은 I이거나; SEQ ID NO: 2의 아미노산 505에 해당하는 캡시드 단백질의 아미노산은 R이거나; SEQ ID NO: 2의 아미노산 590에 해당하는 캡시드 단백질의 아미노산은 R이거나; SEQ ID NO: 2의 아미노산 626에 해당하는 캡시드 단백질의 아미노산은 G 또는 Y이거나; SEQ ID NO: 2의 아미노산 681에 해당하는 캡시드 단백질의 아미노산은 M이거나; SEQ ID NO: 2의 아미노산 687에 해당하는 캡시드 단백질의 아미노산은 R이거나; SEQ ID NO: 2의 아미노산 690에 해당하는 캡시드 단백질의 아미노산은 K이거나; SEQ ID NO: 2의 아미노산 706에 해당하는 캡시드 단백질의 아미노산은 C이거나; 또는 SEQ ID NO: 2의 아미노산 718에 해당하는 캡시드 단백질의 아미노산은 G이다. 일정 구현예에서, SEQ ID NO: 2의 아미노산 626에 해당하는 캡시드 단백질의 아미노산은 G이고, SEQ ID NO: 2의 아미노산 718에 해당하는 캡시드 단백질의 아미노산은 G이다. 일정 구현예에서, SEQ ID NO: 2의 아미노산 296에 해당하는 캡시드 단백질의 아미노산은 H이고, SEQ ID NO: 2의 아미노산 464에 해당하는 캡시드 단백질의 아미노산은 N이고, SEQ ID NO: 2의 아미노산 505에 해당하는 캡시드 단백질의 아미노산은 R이고, SEQ ID NO: 2의 아미노산 681에 해당하는 캡시드 단백질의 아미노산은 M이다. 일정 구현예에서, SEQ ID NO: 2의 아미노산 505에 해당하는 캡시드 단백질의 아미노산은 R이고, SEQ ID NO: 2의 아미노산 687에 해당하는 캡시드 단백질의 아미노산은 R이다. 일정 구현예에서, SEQ ID NO: 2의 아미노산 346에 해당하는 캡시드 단백질의 아미노산은 A이고, SEQ ID NO: 2의 아미노산 505에 해당하는 캡시드 단백질의 아미노산은 R이다. 일정 구현예에서, SEQ ID NO: 2의 아미노산 501에 해당하는 캡시드 단백질의 아미노산은 I이고, SEQ ID NO: 2의 아미노산 505에 해당하는 캡시드 단백질의 아미노산은 R이고, SEQ ID NO: 2의 아미노산 706에 해당하는 캡시드 단백질의 아미노산은 C이다. 일정 구현예에서, AAV 분기군 F 캡시드 단백질은 SEQ ID NO: 2, 3, 4, 5, 6, 7, 9, 10, 11, 12, 13, 15, 16, 또는 17의 아미노산 138-736의 아미노산 서열을 포함한다.
예를 들어, 일정 구현예에서, AAV 분기군 F 캡시드 단백질은 SEQ ID NO: 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 15, 16, 또는 17의 아미노산 1-736의 아미노산 서열과 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 서열 동일성을 갖는 아미노산 서열을 포함한다. 일정 구현예에서, AAV 분기군 F 캡시드 단백질은 SEQ ID NO: 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 15, 16, 또는 17의 아미노산 1-736의 아미노산 서열과 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 서열 동일성을 갖는 아미노산 서열을 포함하고, 여기서 SEQ ID NO: 2의 아미노산 2에 해당하는 캡시드 단백질의 아미노산은 T이거나; SEQ ID NO: 2의 아미노산 65에 해당하는 캡시드 단백질의 아미노산은 I이거나; SEQ ID NO: 2의 아미노산 68에 해당하는 캡시드 단백질의 아미노산은 V이거나; SEQ ID NO: 2의 아미노산 77에 해당하는 캡시드 단백질의 아미노산은 R이거나; SEQ ID NO: 2의 아미노산 119에 해당하는 캡시드 단백질의 아미노산은 L이거나; SEQ ID NO: 2의 아미노산 151에 해당하는 캡시드 단백질의 아미노산은 R이거나; SEQ ID NO: 2의 아미노산 160에 해당하는 캡시드 단백질의 아미노산은 D이거나; SEQ ID NO: 2의 아미노산 206에 해당하는 캡시드 단백질의 아미노산은 C이거나; SEQ ID NO: 2의 아미노산 296에 해당하는 캡시드 단백질의 아미노산은 H이거나; SEQ ID NO: 2의 아미노산 312에 해당하는 캡시드 단백질의 아미노산은 Q이거나; SEQ ID NO: 2의 아미노산 346에 해당하는 캡시드 단백질의 아미노산은 A이거나; SEQ ID NO: 2의 아미노산 464에 해당하는 캡시드 단백질의 아미노산은 N이거나; SEQ ID NO: 2의 아미노산 468에 해당하는 캡시드 단백질의 아미노산은 S이거나; SEQ ID NO: 2의 아미노산 501에 해당하는 캡시드 단백질의 아미노산은 I이거나; SEQ ID NO: 2의 아미노산 505에 해당하는 캡시드 단백질의 아미노산은 R이거나; SEQ ID NO: 2의 아미노산 590에 해당하는 캡시드 단백질의 아미노산은 R이거나; SEQ ID NO: 2의 아미노산 626에 해당하는 캡시드 단백질의 아미노산은 G 또는 Y이거나; SEQ ID NO: 2의 아미노산 681에 해당하는 캡시드 단백질의 아미노산은 M이거나; SEQ ID NO: 2의 아미노산 687에 해당하는 캡시드 단백질의 아미노산은 R이거나; SEQ ID NO: 2의 아미노산 690에 해당하는 캡시드 단백질의 아미노산은 K이거나; SEQ ID NO: 2의 아미노산 706에 해당하는 캡시드 단백질의 아미노산은 C이거나; 또는 SEQ ID NO: 2의 아미노산 718에 해당하는 캡시드 단백질의 아미노산은 G이다. 일정 구현예에서, SEQ ID NO: 2의 아미노산 2에 해당하는 캡시드 단백질의 아미노산은 T이고, SEQ ID NO: 2의 아미노산 312에 해당하는 캡시드 단백질의 아미노산은 Q이다. 일정 구현예에서, SEQ ID NO: 2의 아미노산 65에 해당하는 캡시드 단백질의 아미노산은 I이고, SEQ ID NO: 2의 아미노산 626에 해당하는 캡시드 단백질의 아미노산은 Y이다. 일정 구현예에서, SEQ ID NO: 2의 아미노산 77에 해당하는 캡시드 단백질의 아미노산은 R이고, SEQ ID NO: 2의 아미노산 690에 해당하는 캡시드 단백질의 아미노산은 K이다. 일정 구현예에서, SEQ ID NO: 2의 아미노산 119에 해당하는 캡시드 단백질의 아미노산은 L이고, SEQ ID NO: 2의 아미노산 468에 해당하는 캡시드 단백질의 아미노산은 S이다. 일정 구현예에서, SEQ ID NO: 2의 아미노산 626에 해당하는 캡시드 단백질의 아미노산은 G이고, SEQ ID NO: 2의 아미노산 718에 해당하는 캡시드 단백질의 아미노산은 G이다. 일정 구현예에서, SEQ ID NO: 2의 아미노산 296에 해당하는 캡시드 단백질의 아미노산은 H이고, SEQ ID NO: 2의 아미노산 464에 해당하는 캡시드 단백질의 아미노산은 N이고, SEQ ID NO: 2의 아미노산 505에 해당하는 캡시드 단백질의 아미노산은 R이고, SEQ ID NO: 2의 아미노산 681에 해당하는 캡시드 단백질의 아미노산은 M이다. 일정 구현예에서, SEQ ID NO: 2의 아미노산 505에 해당하는 캡시드 단백질의 아미노산은 R이고, SEQ ID NO: 2의 아미노산 687에 해당하는 캡시드 단백질의 아미노산은 R이다. 일정 구현예에서, SEQ ID NO: 2의 아미노산 346에 해당하는 캡시드 단백질의 아미노산은 A이고, SEQ ID NO: 2의 아미노산 505에 해당하는 캡시드 단백질의 아미노산은 R이다. 일정 구현예에서, SEQ ID NO: 2의 아미노산 501에 해당하는 캡시드 단백질의 아미노산은 I이고, SEQ ID NO: 2의 아미노산 505에 해당하는 캡시드 단백질의 아미노산은 R이고, SEQ ID NO: 2의 아미노산 706에 해당하는 캡시드 단백질의 아미노산은 C이다. 일정 구현예에서, AAV 분기군 F 캡시드 단백질은 SEQ ID NO: 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 15, 16, 또는 17의 아미노산 1-736의 아미노산 서열을 포함한다.
일정 구현예에서, AAV 캡시드는 (a) SEQ ID NO: 2, 3, 4, 6, 7, 10, 11, 12, 13, 15, 16, 또는 17의 아미노산 203-736의 아미노산 서열을 포함하는 분기군 F 캡시드 단백질; (b) SEQ ID NO: 2, 3, 4, 5, 6, 7, 9, 10, 11, 12, 13, 15, 16, 또는 17의 아미노산 138-736의 아미노산 서열을 포함하는 분기군 F 캡시드 단백질; 및 (c) SEQ ID NO: 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 15, 16, 또는 17의 아미노산 1-736의 아미노산 서열을 포함하는 분기군 F 캡시드 단백질 중 둘 이상을 포함한다. 일정 구현예에서, AAV 캡시드는 (a) SEQ ID NO: 2, 3, 4, 6, 7, 10, 11, 12, 13, 15, 16, 또는 17의 아미노산 203-736으로 이루어지는 아미노산 서열을 갖는 분기군 F 캡시드 단백질; (b) SEQ ID NO: 2, 3, 4, 5, 6, 7, 9, 10, 11, 12, 13, 15, 16, 또는 17의 아미노산 138-736으로 이루어지는 아미노산 서열을 갖는 분기군 F 캡시드 단백질; 및 (c) SEQ ID NO: 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 15, 16, 또는 17의 아미노산 1-736으로 이루어지는 아미노산 서열을 갖는 분기군 F 캡시드 단백질을 포함한다.
일정 구현예에서, AAV 캡시드는 (a) SEQ ID NO: 8의 아미노산 203-736의 서열과 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 서열 동일성을 갖는 아미노산 서열을 포함하는 분기군 F 캡시드 단백질; (b) SEQ ID NO: 8의 아미노산 138-736의 서열과 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 서열 동일성을 갖는 아미노산 서열을 포함하는 분기군 F 캡시드 단백질; 및 (c) SEQ ID NO: 8의 아미노산 1-736의 서열과 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 서열 동일성을 갖는 아미노산 서열을 포함하는 분기군 F 캡시드 단백질 중 하나 이상을 포함한다. 일정 구현예에서, AAV 캡시드는 (a) SEQ ID NO: 8의 아미노산 203-736의 아미노산 서열을 포함하는 분기군 F 캡시드 단백질; (b) SEQ ID NO: 8의 아미노산 138-736의 아미노산 서열을 포함하는 분기군 F 캡시드 단백질; 및 (c) SEQ ID NO: 8의 아미노산 1-736의 아미노산 서열을 포함하는 분기군 F 캡시드 단백질 중 하나 이상을 포함한다. 일정 구현예에서, AAV 캡시드는 (a) SEQ ID NO: 8의 아미노산 203-736의 아미노산 서열을 포함하는 분기군 F 캡시드 단백질; (b) SEQ ID NO: 8의 아미노산 138-736의 아미노산 서열을 포함하는 분기군 F 캡시드 단백질; 및 (c) SEQ ID NO: 8의 아미노산 1-736의 아미노산 서열을 포함하는 분기군 F 캡시드 단백질 중 둘 이상을 포함한다. 일정 구현예에서, AAV 캡시드는 (a) SEQ ID NO: 8의 아미노산 203-736으로 이루어진 아미노산 서열을 갖는 분기군 F 캡시드 단백질; (b) SEQ ID NO: 8의 아미노산 138-736으로 이루어진 아미노산 서열을 갖는 분기군 F 캡시드 단백질; 및 (c) SEQ ID NO: 8의 아미노산 1-736으로 이루어진 아미노산 서열을 갖는 분기군 F 캡시드 단백질을 포함한다.
일정 구현예에서, AAV 캡시드는 (a) SEQ ID NO: 11의 아미노산 203-736의 서열과 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 서열 동일성을 갖는 아미노산 서열을 포함하는 분기군 F 캡시드 단백질; (b) SEQ ID NO: 11의 아미노산 138-736의 서열과 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 서열 동일성을 갖는 아미노산 서열을 포함하는 분기군 F 캡시드 단백질; 및 (c) SEQ ID NO: 11의 아미노산 1-736의 서열과 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 서열 동일성을 갖는 아미노산 서열을 포함하는 분기군 F 캡시드 단백질 중 하나 이상을 포함한다. 일정 구현예에서, AAV 캡시드는 (a) SEQ ID NO: 11의 아미노산 203-736의 아미노산 서열을 포함하는 분기군 F 캡시드 단백질; (b) SEQ ID NO: 11의 아미노산 138-736의 아미노산 서열을 포함하는 분기군 F 캡시드 단백질; 및 (c) SEQ ID NO: 11의 아미노산 1-736의 아미노산 서열을 포함하는 분기군 F 캡시드 단백질 중 하나 이상을 포함한다. 일정 구현예에서, AAV 캡시드는 (a) SEQ ID NO: 11의 아미노산 203-736의 아미노산 서열을 포함하는 분기군 F 캡시드 단백질; (b) SEQ ID NO: 11의 아미노산 138-736의 아미노산 서열을 포함하는 분기군 F 캡시드 단백질; 및 (c) SEQ ID NO: 11의 아미노산 1-736의 아미노산 서열을 포함하는 분기군 F 캡시드 단백질 중 둘 이상을 포함한다. 일정 구현예에서, AAV 캡시드는 (a) SEQ ID NO: 11의 아미노산 203-736으로 이루어진 아미노산 서열을 갖는 분기군 F 캡시드 단백질; (b) SEQ ID NO: 11의 아미노산 138-736으로 이루어진 아미노산 서열을 갖는 분기군 F 캡시드 단백질; 및 (c) SEQ ID NO: 11의 아미노산 1-736으로 이루어진 아미노산 서열을 갖는 분기군 F 캡시드 단백질을 포함한다.
일정 구현예에서, AAV 캡시드는 (a) SEQ ID NO: 13의 아미노산 203-736의 서열과 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 서열 동일성을 갖는 아미노산 서열을 포함하는 분기군 F 캡시드 단백질; (b) SEQ ID NO: 13의 아미노산 138-736의 서열과 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 서열 동일성을 갖는 아미노산 서열을 포함하는 분기군 F 캡시드 단백질; 및 (c) SEQ ID NO: 13의 아미노산 1-736의 서열과 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 서열 동일성을 갖는 아미노산 서열을 포함하는 분기군 F 캡시드 단백질 중 하나 이상을 포함한다. 일정 구현예에서, AAV 캡시드는 (a) SEQ ID NO: 13의 아미노산 203-736의 아미노산 서열을 포함하는 분기군 F 캡시드 단백질; (b) SEQ ID NO: 13의 아미노산 138-736의 아미노산 서열을 포함하는 분기군 F 캡시드 단백질; 및 (c) SEQ ID NO: 13의 아미노산 1-736의 아미노산 서열을 포함하는 분기군 F 캡시드 단백질 중 하나 이상을 포함한다. 일정 구현예에서, AAV 캡시드는 (a) SEQ ID NO: 13의 아미노산 203-736의 아미노산 서열을 포함하는 분기군 F 캡시드 단백질; (b) SEQ ID NO: 13의 아미노산 138-736의 아미노산 서열을 포함하는 분기군 F 캡시드 단백질; 및 (c) SEQ ID NO: 13의 아미노산 1-736의 아미노산 서열을 포함하는 분기군 F 캡시드 단백질 중 둘 이상을 포함한다. 일정 구현예에서, AAV 캡시드는 (a) SEQ ID NO: 13의 아미노산 203-736으로 이루어진 아미노산 서열을 갖는 분기군 F 캡시드 단백질; (b) SEQ ID NO: 13의 아미노산 138-736으로 이루어진 아미노산 서열을 갖는 분기군 F 캡시드 단백질; 및 (c) SEQ ID NO: 13의 아미노산 1-736으로 이루어진 아미노산 서열을 갖는 분기군 F 캡시드 단백질을 포함한다.
일정 구현예에서, AAV 캡시드는 (a) SEQ ID NO: 16의 아미노산 203-736의 서열과 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 서열 동일성을 갖는 아미노산 서열을 포함하는 분기군 F 캡시드 단백질; (b) SEQ ID NO: 16의 아미노산 138-736의 서열과 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 서열 동일성을 갖는 아미노산 서열을 포함하는 분기군 F 캡시드 단백질; 및 (c) SEQ ID NO: 16의 아미노산 1-736의 서열과 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 서열 동일성을 갖는 아미노산 서열을 포함하는 분기군 F 캡시드 단백질 중 하나 이상을 포함한다. 일정 구현예에서, AAV 캡시드는 (a) SEQ ID NO: 16의 아미노산 203-736의 아미노산 서열을 포함하는 분기군 F 캡시드 단백질; (b) SEQ ID NO: 16의 아미노산 138-736의 아미노산 서열을 포함하는 분기군 F 캡시드 단백질; 및 (c) SEQ ID NO: 16의 아미노산 1-736의 아미노산 서열을 포함하는 분기군 F 캡시드 단백질 중 하나 이상을 포함한다. 일정 구현예에서, AAV 캡시드는 (a) SEQ ID NO: 16의 아미노산 203-736의 아미노산 서열을 포함하는 분기군 F 캡시드 단백질; (b) SEQ ID NO: 16의 아미노산 138-736의 아미노산 서열을 포함하는 분기군 F 캡시드 단백질; 및 (c) SEQ ID NO: 16의 아미노산 1-736의 아미노산 서열을 포함하는 분기군 F 캡시드 단백질 중 둘 이상을 포함한다. 일정 구현예에서, AAV 캡시드는 (a) SEQ ID NO: 16의 아미노산 203-736으로 이루어진 아미노산 서열을 갖는 분기군 F 캡시드 단백질; (b) SEQ ID NO: 16의 아미노산 138-736으로 이루어진 아미노산 서열을 갖는 분기군 F 캡시드 단백질; 및 (c) SEQ ID NO: 16의 아미노산 1-736으로 이루어진 아미노산 서열을 갖는 분기군 F 캡시드 단백질을 포함한다.
본 명세서에 개시된 AAV 조성물에서 유용한 교정 게놈은 일반적으로 (i) PAH 유전자 내 표적 유전자좌를 편집하기 위한 편집 엘리먼트, (ii) 표적 유전자좌에 대해 5'의 제1 게놈 영역에 대해 상동성을 갖는 편집 엘리먼트의 5'의 5' 상동성 팔부 뉴클레오티드 서열, 및 (iii) 표적 유전자좌에 대해 3'의 제2 게놈 영역에 대해 상동성을 갖는 편집 엘리먼트의 3'의 3' 상동성 팔부 뉴클레오티드 서열을 포함하고, 5' 상동성 팔부, 편집 엘리먼트, 및 3' 상동성 팔부를 포함하는 교정 게놈의 일부는 PAH 유전자 좌위에 대해 센스 또는 안티센스 배향일 수 있다. 일정 구현예에서, 교정 게놈은 5' 상동성 팔부 뉴클레오티드 서열의 5'에 5' 반전 말단 반복부 (5' ITR) 뉴클레오티드 서열, 및 3' 상동성 팔부 뉴클레오티드 서열의 3'에 3' 반전 말단 반복부 (3' ITR) 뉴클레오티드 서열을 포함한다.
본 명세서에 개시된 교정 게놈에서 사용되는 편집 엘리먼트는 표적 유전자좌에서의 하나 이상의 뉴클레오티드의 삽입, 결실 또는 치환을 매개할 수 있다.
일정 구현예에서, 표적 유전자좌에서 상동성 재조합을 통해 올바르게 통합될 때, 편집 엘리먼트는 야생형 PAH 폴리펩티드 또는 이의 기능적 균등체가 돌연변이체 PAH 유전자 좌위로부터 발현되도록, 돌연변이체 PAH 유전자로 PAH 코딩 서열의 적어도 일부분을 포함하는 뉴클레오티드 서열을 삽입시킨다. 일정 구현예에서, 편집 엘리먼트는 완전한 PAH 코딩 서열 (예를 들어, 야생형 PAH 코딩 서열 또는 침묵적으로 변경된 PAH 코딩 서열)을 포함한다. 일정 구현예에서, 편집 엘리먼트는 PAH 코딩 서열의 뉴클레오티드 4 내지 1359를 포함한다. 일정 구현예에서, 편집 엘리먼트는 PAH 인트론-삽입된 코딩 서열 (예를 들어, 야생형 또는 침묵적으로 변경된 PAH 코딩 서열에 삽입된 인트론 포함)을 포함한다.
일정 구현예에서, PAH 코딩 서열은 야생형 PAH 폴리펩티드 (예를 들어, SEQ ID NO: 23에 기재된 아미노산 서열을 가짐)를 코딩한다. 일정 구현예에서, PAH 코딩 서열은 야생형 (예를 들어, SEQ ID NO: 24에 기재된 뉴클레오티드 서열을 포함)이다. 일정 구현예에서, PAH 코딩 서열은 야생형 PAH 유전자의 해당 엑손과 100% 미만 (예를 들어, 95%, 90%, 85%, 80%, 75%, 70%, 65%, 60%, 55%, 또는 50% 미만)으로 동일하게 침묵적으로 변경된다. 일정 구현예에서, PAH 코딩 서열은 SEQ ID NO: 25에 기재된 뉴클레오티드 서열을 포함한다). 일정 구현예에서, PAH 코딩 서열은 SEQ ID NO: 116에 기재된 뉴클레오티드 서열을 포함한다).
일정 구현예에서, PAH 인트론-삽입된 코딩 서열은 야생형 PAH 폴리펩티드 (예를 들어, SEQ ID NO: 23에 기재된 아미노산 서열을 가짐)를 코딩한다. 일정 구현예에서, PAH 인트론-삽입된 코딩 서열은 PAH 코딩 서열에 삽입된 적어도 하나 (예를 들어, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 또는 12)의 인트론을 포함한다. 인트론은 PAH 유전자의 천연 인트론 서열, 상이한 종 또는 동일 종 유래 상이한 유전자로부터의 인트론 서열, 및/또는 합성 인트론 서열을 포함할 수 있다. 일정 구현예에서, 비천연 인트론은 길이가 100개, 200개, 300개, 400개, 500개, 600개, 700개, 800개, 900개, 1000개, 1,500개, 또는 2,000개 뉴클레오티드 이하이다. 이론에 국한하고 싶지 않지만, 인트론은 예를 들어 핵에서 세포질로 mRNA 이출의 전사적 침묵화 및 증강을 감소시킴으로써, 이식 유전자 발현을 증가시킬 수 있다고 가정한다. 당업자는 합성 인트론 서열이 당분야에 공지된 임의의 공통 스플라이싱 모티프를 도입시켜 RNA 스플라이싱을 매개하도록 디자인될 수 있다는 것을 이해하게 될 것이다 (예를 들어, 그 전문이 참조로 본 명세서에 편입되는 [Sibley et al., (2016) Nature Reviews Genetics, 17, 407-21] 참조). 예시적인 인트론 서열은 그 전문이 참조로 본 명세서에 편입되는 [Lu et al. (2013) Molecular Therapy 21(5): 954-63], 및 [Lu et al. (2017) Hum. Gene Ther. 28(1): 125-34]에 제공되어 있다. 일정 구현예에서, 편집 엘리먼트는 임의 종 (예를 들어, 인간, 마우스 또는 토끼)에서의 헤모글로빈 베타 유전자의 제1 인트론을 포함한다. 일정 구현예에서, 편집 엘리먼트는 인간 HBB 유전자의 제1 인트론 (예를 들어, SEQ ID NO: 28과 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%가 동일한 뉴클레오티드 서열 포함)을 포함한다. 일정 구현예에서, 편집 엘리먼트는 마우스 HBB 유전자의 제1 인트론 (예를 들어, SEQ ID NO: 29와 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%가 동일한 뉴클레오티드 서열 포함)을 포함한다. 일정 구현예에서, 편집 엘리먼트는 마우스 미니트 바이러스 (MVM) 인트론 (예를 들어, SEQ ID NO: 30과 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%가 동일한 뉴클레오티드 서열 포함)를 포함한다.
일정 구현예에서, 편집 엘리먼트는 SEQ ID NO: 120과 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%가 동일한 뉴클레오티드 서열을 포함하거나 또는 그로 이루어진 키메라 MVM 인트론 (본 명세서에서 ChiMVM라고도 함)을 포함한다. 일정 구현예에서, 편집 엘리먼트는 예를 들어 SEQ ID NO: 121과 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%가 동일한 뉴클레오티드 서열을 포함하거나 또는 그로 이루어진, SV40 인트론을 포함한다. 일정 구현예에서, 편집 엘리먼트는 예를 들어 SEQ ID NO: 122와 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%가 동일한 뉴클레오티드 서열을 포함하거나 또는 그로 이루어진, 아데노바이러스 삼부체 리더 인트론 (예를 들어, 본 명세서에서 AdTPL이라고도 함)을 포함한다. 일정 구현예에서, 편집 엘리먼트는 예를 들어 SEQ ID NO: 123과 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%가 동일한 뉴클레오티드 서열을 포함하거나 또는 그로 이루어진, 미니 β-글로빈 인트론 (본 명세서에서 MiniBGlobin이라고도 함)을 포함한다. 일정 구현예에서, 편집 엘리먼트는 예를 들어 SEQ ID NO: 124과 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%가 동일한 뉴클레오티드 서열을 포함하거나 또는 그로 이루어진, AdV/Ig 키메라 인트론 (본 명세서에서 AdVIgG라고도 함)을 포함한다. 일정 구현예에서, 편집 엘리먼트는 예를 들어 SEQ ID NO: 125와 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%가 동일한 뉴클레오티드 서열을 포함하거나 또는 그로 이루어진, β-글로빈 스플라이스 도너 영역 및 IgG 중쇄 스플라이스 억셉터 영역을 포함하는 키메라 인트론인, β-글로빈 Ig 중쇄 인트론 (본 명세서에서 BglobinIg라고도 함)을 포함한다. 일정 구현예에서, 편집 엘리먼트는 예를 들어, SEQ ID NO: 126과 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%가 동일한 뉴클레오티드 서열을 포함하거나 또는 그로 이루어진, 야생형 MVFM 인트론의 변이체인, Wu MVM 인트론 (본 명세서에서 Wu MVM이라고도 함)을 포함한다. 일정 구현예에서, 편집 엘리먼트는 예를 들어 SEQ ID NO: 127과 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%가 동일한 뉴클레오티드 서열을 포함하거나 또는 그로 이루어진, HCR1 엘리먼트 (본 명세서에서 OptHCR이라고도 함)를 포함한다. 일정 구현예에서, 편집 엘리먼트는 예를 들어 SEQ ID NO: 128과 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%가 동일한 뉴클레오티드 서열을 포함하거나 또는 그로 이루어진, β-글로빈 인트론 (본 명세서에서 또한 Bglobin이라고도 함)을 포함한다. 일정 구현예에서, 편집 엘리먼트는 예를 들어 SEQ ID NO: 129와 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%가 동일한 뉴클레오티드 서열을 포함하거나 또는 그로 이루어진, 인자 IX 인트론 (본 명세서에서 tFIX 또는 FIX 인트론이라고도 함)을 포함한다. 일정 구현예에서, 편집 엘리먼트는 예를 들어 SEQ ID NO: 130과 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%가 동일한 뉴클레오티드 서열을 포함하거나 또는 그로 이루어진, ch2BLood 인트론 (본 명세서에서 BloodEnh라고도 함)을 포함한다. 일정 구현예에서, PAH 인트론-삽입된 코딩 서열은 야생형 PAH 폴리펩티드 (예를 들어, SEQ ID NO: 2에 기재된 아미노산 서열을 가짐)를 코딩한다. 일정 구현예에서, PAH 인트론-삽입된 코딩 서열은 함께 스플라이싱될 때, 완전한 PAH 코딩 서열을 형성하는 PAH 코딩 서열의 일부를 포함한다. 일정 구현예에서, PAH 코딩 서열은 야생형 (예를 들어, SEQ ID NO: 24에 기재된 뉴클레오티드 서열 포함)이다. 일정 구현예에서, PAH 코딩 서열은 야생형 PAH 유전자의 해당 엑손과 100% 미만 (예를 들어, 95%, 90%, 85%, 80%, 75%, 70%, 65%, 60%, 55%, 또는 50% 미만)으로 동일하게 되도록 침묵적으로 변경된다. 일정 구현예에서, PAH 코딩 서열은 SEQ ID NO: 25에 기재된 뉴클레오티드 서열을 포함한다). 일정 구현예에서, PAH 코딩 서열은 SEQ ID NO: 116에 기재된 뉴클레오티드 서열을 포함하거나 또는 그로 이루어진다. 일정 구현예에서, 인트론-삽입된 PAH 코딩 서열은 SEQ ID NO: 116과 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%가 동일한 뉴클레오티드 서열을 포함한다. 일정 구현예에서, PAH 코딩 서열은 SEQ ID NO: 116에 기재된 뉴클레오티드 서열로 이루어진다. 일정 구현예에서, 인트론-삽입된 PAH 코딩 서열은 SEQ ID NO: 80, 81, 82, 131, 132, 또는 143에 기재된 뉴클레오티드 서열을 포함한다. 일정 구현예에서, 인트론-삽입된 PAH 코딩 서열은 SEQ ID NO: 80, 81, 82, 131, 132, 또는 143과 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%가 동일한 뉴클레오티드 서열을 포함한다. 일정 구현예에서, 인트론-삽입된 PAH 코딩 서열은 SEQ ID NO: 80, 81, 82, 131, 132, 또는 143에 기재된 뉴클레오티드 서열로 이루어진다.
인트론은 PAH 코딩 서열 내 임의 위치에 삽입될 수 있다. 일정 구현예에서, 인트론은 2개의 천연 엑손을 연결하는 뉴클레오티드간 결합에 해당하는 위치에 삽입된다. 일정 구현예에서, 인트론은 천연 엑손 8 및 엑손 9를 연결하는 뉴클레오티드간 결합에 해당하는 위치에 삽입된다. 일정 구현예에서, PAH 인트론-삽입된 코딩 서열은 5'에서 3'으로, PAH 코딩 서열의 제1 부분, 인트론, 및 PAH 코딩 서열의 제2 부분을 포함하고, 여기서 제1 부분 및 제2 부분은 함께 스플라이싱될 때, 완전한 PAH 코딩 서열 (예를 들어, 야생형 PAH 코딩 서열, 또는 침묵적으로 변경된 PAH 코딩 서열)을 형성한다. 일정 구현예에서, PAH 코딩 서열의 제1 부분은 SEQ ID NO: 64 또는 65에 기재된 아미노산 서열을 포함하고/하거나, PAH 코딩 서열의 제2 부분은 SEQ ID NO: 66 또는 67에 기재된 아미노산 서열을 포함한다. 일정 구현예에서, PAH 코딩 서열의 제1 부분은 SEQ ID NO: 64 또는 65에 기재된 아미노산 서열로 이루어지고, PAH 코딩 서열의 제2 부분은 SEQ ID NO: 66 또는 67에 기재된 아미노산 서열로 이루어진다. 일정 구현예에서, PAH 코딩 서열의 제1 부분은 SEQ ID NO: 65에 기재된 아미노산 서열로 이루어지고, PAH 코딩 서열의 제2 부분은 SEQ ID NO: 67에 기재된 아미노산 서열로 이루어진다. 일정 구현예에서, 편집 엘리먼트는 3'에서 5'으로, SEQ ID NO: 64에 기재된 뉴클레오티드 서열로 이루어진 PAH 코딩 서열의 제1 부분, 또는 이의 침묵적으로 변경된 변이체 (예를 들어, SEQ ID NO: 65에 기재된 뉴클레오티드 서열로 이루어짐); 인트론 (예를 들어, SEQ ID NO: 28, 29, 또는 30에 기재된 뉴클레오티드 서열로 이루어짐); 및 SEQ ID NO: 66에 기재된 뉴클레오티드 서열로 이루어진 PAH 코딩 서열의 제2 부분, 또는 이의 침묵적으로 변경된 변이체 (예를 들어, SEQ ID NO: 66에 기재된 뉴클레오티드 서열로 이루어짐)를 포함한다.
일정 구현예에서, PAH 코딩 서열은 변형된 스플라이스 도너 부위를 포함한다. 일정 구현예에서, 스플라이스 도너 부위-변형된 PAH 코딩 서열은 SEQ ID NO: 138 또는 139에 기재된 뉴클레오티드 서열을 포함한다. 일정 구현예에서, 스플라이스 도너 부위-변형된 PAH 코딩 서열은 SEQ ID NO: 138 또는 139와 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%가 동일한 뉴클레오티드 서열을 포함한다. 일정 구현예에서, 스플라이스 도너 부위-변형된 PAH 코딩 서열은 SEQ ID NO: 138 또는 139에 기재된 뉴클레오티드 서열로 이루어진다.
일정 구현예에서, 편집 엘리먼트는 PAH 코딩 서열 또는 PAH 인트론-삽입된 코딩 서열에 대해 3'에 전사 종결인자를 더 포함한다. 일정 구현예에서, 전사 종결인자는 폴리아데닐화 서열 (예를 들어, 외생성 폴리아데닐화 서열)을 포함한다. 일정 구현예에서, 외생성 폴리아데닐화 서열은 SV40 폴리아데닐화 서열 (예를 들어, SEQ ID NO: 31-34로 이루어진 군으로부터 선택되는 뉴클레오티드 서열, 또는 이의 상보성 서열을 포함)을 포함한다. 일정 구현예에서, SV40 폴리아데닐화 서열은 SEQ ID NO: 31에 기재된 뉴클레오티드 서열을 포함한다. 일정 구현예에서, 편집 엘리먼트는 5'에서 3'으로 PAH 코딩 서열 (예를 들어, SEQ ID NO: 25에 기재된 뉴클레오티드 서열 포함) 또는 PAH 인트론-삽입된 코딩 서열 (예를 들어, SEQ ID NO: 80에 기재된 뉴클레오티드 서열 포함), 및 SV40 폴리아데닐화 서열 (예를 들어, SEQ ID NO: 31에 기재된 뉴클레오티드 서열 포함)을 포함한다.
일정 구현예에서, 편집 엘리먼트는 SV40 폴리아데닐화 서열에 대해 5'에 ID 카세트 (예를 들어, SEQ ID NO: 31에 기재된 뉴클레오티드 서열 포함)를 더 포함할 수 있다. ID 카세트는 차세대 시퀀싱 실험을 수행할 때 확인 목적을 위해 사용될 수 있는 서열을 제공한다. 일정 구현예에서, ID 카세트는 SEQ ID NO: 33에 기재된 뉴클레오티드 서열을 포함한다. 일정 구현예에서, ID 카세트는 SEQ ID NO: 33과 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%가 동일한 뉴클레오티드 서열을 포함한다. 일정 구현예에서, ID 카세트는 SEQ ID NO: 33에 기재된 뉴클레오티드 서열로 이루어진다. 일정 구현예에서, 편집 엘리먼트는 5'에서 3'으로 PAH 코딩 서열 또는 PAH 인트론-삽입된 코딩 서열, ID 카세트, 및 SV40 폴리아데닐화 서열을 포함한다.
일정 구현예에서, 편집 엘리먼트는 PAH 코딩 서열 또는 PAH 인트론-삽입된 코딩 서열에 대해 5'에 리보솜 스키핑 엘리먼트를 더 포함한다. 일정 구현예에서, 편집 엘리먼트는 5'에서 3'으로, 리보솜 스키핑 엘리먼트; PAH 코딩 서열 또는 PAH 인트론-삽입된 코딩 서열; 및 임의로 전사 종결인자 (예를 들어, 폴리아데닐화 서열)을 포함한다. 일정 구현예에서, 상기에 언급된 편집 엘리먼트는 상동성 재조합을 통해서 PAH 유전자의 엑손 (예를 들어, 표적 유전자좌에 대해 5'의 뉴클레오티드는 PAH 유전자의 엑손에 존재)으로 통합되어서, 5'에서 3'으로 표적 유전자좌에 대해 5'에 PAH 유전자의 일부분; 리보솜 스키핑 엘리먼트; PAH 코딩 서열 또는 PAH 인트론-삽입된 코딩 서열; 및 전사 종결인자 (예를 들어, 폴리아데닐화 서열)를 포함하는 재조합 서열을 생성시킬 수 있고, 여기서 리보솜 스키핑 엘리먼트는 표적 유전자좌에 대해 5'에서의 PAH 유전자의 일부분 및 완전한 PAH 코딩 서열과 인 프레임으로 존재하도록 위치된다. 이러한 재조합 서열의 전사 및 번역은 코딩된 리보솜 스키핑 펩티드의 5' 부분 융합된 표적 유전자좌에 대한 5'의 PAH 유전자의 일부분에 의해 코딩되는 아미노산 서열을 포함하는 제1 폴리펩티드, 및 PAH 폴리펩티드의 완전한 아미노산 서열에 융합된 코딩된 리보솜 스키핑 펩티드의 3' 부분을 포함하는 제2 폴리펩티드를 생성시킨다.
일정 구현예에서, 표적 유전자좌에 대해 5'의 뉴클레오티드는 PAH 유전자의 엑손 (예를 들어, 엑손 1, 엑손 2, 엑손 3, 엑손 4, 엑손 5, 엑손 6, 엑손 7, 엑손 8, 엑손 9, 엑손 10, 엑손 11, 엑손 12, 또는 엑손 13)에 존재한다. 일정 구현예에서, 표적 유전자좌는 PAH 유전자의 엑손 (예를 들어, 엑손 1, 엑손 2, 엑손 3, 엑손 4, 엑손 5, 엑손 6, 엑손 7, 엑손 8, 엑손 9, 엑손 10, 엑손 11, 엑손 12, 또는 엑손 13) 내 뉴클레오티드간 결합이다. 일정 구현예에서, 표적 유전자좌는 PAH 유전자 내 서열이고, 여기서 이 서열의 5' 말단은 PAH 유전자의 엑손 (예를 들어, 엑손 1, 엑손 2, 엑손 3, 엑손 4, 엑손 5, 엑손 6, 엑손 7, 엑손 8, 엑손 9, 엑손 10, 엑손 11, 엑손 12, 또는 엑손 13) 또는 ASCL1 (Achaete-scute homolog 1) 및 PAH 사이의 유전자간 영역 내에 존재하고, 이 서열의 3' 말단은 PAH 유전자 또는 PAH 및 인슐린-유사 성장 인자 1 (IGF1) 사이의 유전자간 영역 내 임의의 뉴클레오티드일 수 있다. 일정 구현예에서, 표적 유전자좌에 대해 5'의 뉴클레오티드는 PAH 유전자의 엑손 1, 엑손 2, 또는 엑손 3에 존재한다. 일정 구현예에서, 표적 유전자좌는 PAH 유전자의 엑손 1, 엑손 2, 또는 엑손 3 내 뉴클레오티드간 결합이다. 일정 구현예에서, 표적 유전자좌는 PAH 유전자 내 서열이고, 여기서 이 서열의 5' 말단은 PAH 유전자의 엑손 1, 엑손 2, 또는 엑손 3 내에 존재하고, 이 서열의 3' 말단은 PAH 유전자 또는 PAH 및 IGF1 사이의 유전자간 영역 내 임의의 뉴클레오티드일 수 있다.
일정 구현예에서, 편집 엘리먼트는 리보솜 스키핑 엘리먼트에 대해 5'에 스플라이스 억셉터를 포함한다. 일정 구현예에서, 편집 엘리먼트는 5'에서 3'으로, 스플라이스 억셉터; 리보솜 스키핑 엘리먼트; PAH 코딩 서열 또는 PAH 인트론-삽입된 코딩 서열; 및 임의로 전사 종결인자 (예를 들어, 폴리아데닐화 서열)를 포함한다. 일정 구현예에서, 상기 언급된 편집 엘리먼트는 상동성 재조합을 통해 PAH 유전자의 인트론 (예를 들어, 표적 유전자좌에 대해 5'의 뉴클레오티드는 PAH 유전자의 인트론 내에 존재)에 통합되어서 5'에서 3'으로, 인트론의 내생성 스플라이스 억셉터가 아닌 내생성 스플라이스 도너 부위를 포함하는 표적 유전자좌에 대해 5'의 PAH 유전자의 일부분; 스플라이스 억셉터; 리보솜 스키핑 엘리먼트, PAH 코딩 서열 또는 PAH 인트론-삽입된 코딩 서열; 및 전사 종결인자 (예를 들어, 폴리아데닐화 서열)를 포함하는 재조합 서열을 생성시킬 수 있고, 리보솜 스키핑 엘리먼트는 PAH 코딩 서열 또는 PAH 인트론-삽입된 코딩 서열과 인 프레임으로 존재하도록, 그리고 PAH의 인트론의 내생성 스플라이스 도너로 스플라이스 억셉터의 스플라이싱이 표적 유전자좌에 대해 5'의 PAH 유전자의 일부분과 인 프레임으로 배치되도록, 위치된다. 이 재조합 서열의 발현은 코딩된 리보솜 스키핑 펩티드의 5' 부분에 융합된 표적 유전자좌에 대해 5'의 PAH 유전자의 일부분에 의해 코딩되는 아미노산 서열을 포함하는 제1 폴리펩티드, 및 코딩된 리보솜 스키핑 펩티드의 3' 부분에 융합된 PAH 폴리펩티드의 완전한 아미노산 서열을 포함하는 제2 폴리펩티드를 생성시킨다.
일정 구현예에서, 표적 유전자좌에 대해 5'의 뉴클레오티드는 PAH 유전자의 인트론 (예를 들어, 인트론 1, 인트론 2, 인트론 3, 인트론 4, 인트론 5, 인트론 6, 인트론 7, 인트론 8, 인트론 9, 인트론 10, 인트론 11, 또는 인트론 12)에 존재한다. 일정 구현예에서, 표적 유전자좌는 PAH 유전자의 인트론 (예를 들어, 인트론 1, 인트론 2, 인트론 3, 인트론 4, 인트론 5, 인트론 6, 인트론 7, 인트론 8, 인트론 9, 인트론 10, 인트론 11, 또는 인트론 12) 내 뉴클레오티드간 결합이다. 일정 구현예에서, 표적 유전자좌는 PAH 유전자 내 서열이고, 이 서열의 5' 말단은 PAH 유전자의 인트론 (예를 들어, 인트론 1, 인트론 2, 인트론 3, 인트론 4, 인트론 5, 인트론 6, 인트론 7, 인트론 8, 인트론 9, 인트론 10, 인트론 11, 또는 인트론 12) 내에 존재하고, 이 서열의 3' 말단은 PAH 유전자 또는 PAH 및 IGF1 사이의 유전자간 영역 내 임의 뉴클레오티드일 수 있다. 일정 구현예에서, 표적 유전자좌에 대해 5'의 뉴클레오티드는 PAH 유전자의 인트론 1, 인트론 2, 또는 인트론 3 내에 존재한다. 일정 구현예에서, 표적 유전자좌는 PAH 유전자의 인트론 1, 인트론 2, 또는 인트론 3 내 뉴클레오티드간 결합이다. 일정 구현예에서, 표적 유전자좌는 PAH 유전자 내 서열이고, 이 서열의 5' 말단은 PAH 유전자의 인트론 1, 인트론 2, 또는 인트론 3 내에 존재하고, 이 서열의 3' 말단은 PAH 유전자 또는 PAH 및 IGF1 사이의 유전자간 영역 내 임의 뉴클레오티드일 수 있다. 일정 구현예에서, 표적 유전자좌에 대해 5'의 뉴클레오티드는 PAH 유전자의 인트론 1에 존재한다. 일정 구현예에서, 표적 유전자좌는 PAH 유전자 내 서열이고, 이 서열의 5' 말단은 PAH 유전자의 인트론 1에 존재하고, 이 서열의 3' 말단은 PAH 유전자 또는 PAH 및 IGF1 사이의 유전자간 영역 내 임의 뉴클레오티드일 수 있다.
본 명세서에 개시된 임의의 모든 편집 엘리먼트는 야생형 PAH 유전자에 존재하지 않는 제한 엔도뉴클레아제 부위를 더 포함할 수 있다. 이러한 제한 엔도뉴클레아제 부위는 제한 단편 길이 다형성 분석을 기반으로 하거나 또는 표적 유전자좌 및 이의 측접 영역, 또는 이로부터 증폭된 핵산의 핵산 시퀀싱 분석을 통해서 표적 유전자좌에서 편집 엘리먼트의 통합을 갖는 세포의 확인을 가능하게 한다.
본 명세서에 개시된 임의의 모든 편집 엘리먼트는 표적 유전자좌로 통합될 때 PAH 폴리펩티드에 하나 이상의 아미노산 돌연변이를 초래하는 하나 이상의 뉴클레오티드 변경을 포함할 수 있다. 일정 구현예에서, 돌연변이체 PAH 폴리펩티드는 야생형 PAH 폴리펩티드의 기능성 균등체이고, 다시 말해서, 야생형 PAH 폴리펩티드와 같은 기능을 할 수 있다. 일정 구현예에서, 기능적으로 균등한 PAH 폴리펩티드는 야생형 PAH 폴리펩티드에 존재하지 않는 적어도 하나의 특징, 예를 들어 PAH 단백질 (예를 들어, 이량체 또는 사량체)을 안정화시키는 능력, 또는 단백질 분해에 저항하는 능력을 더 포함한다.
일정 구현예에서, 본 명세서에 기술된 바와 같은 편집 엘리먼트는 적어도 0, 1, 2, 10, 100, 200, 500, 1000, 1500, 2000, 3000, 4000, 또는 5000개 뉴클레오티드를 포함한다. 일정 구현예에서, 편집 엘리먼트는 1 내지 5000개, 1 내지 4500개, 1 내지 4000개, 1 내지 3000개, 1 내지 2000개, 1 내지 1000개, 1 내지 500개, 1 내지 200개, 1 내지 100개, 1 내지 50개, 또는 1 내지 10개 뉴클레오티드를 포함하거나 또는 그로 이루어진다.
일정 구현예에서, 본 명세서에 기술된 바와 같은 편집 엘리먼트는 PAH 코딩 서열 또는 이의 일부분 (예를 들어, 완전한 인간 PAH 코딩 서열, 또는 인간 PAH 코딩 서열의 뉴클레오티드 4 내지 1359), 5' 비번역 영역 (UTR), 3' UTR, 프로모터, 스플라이스 도너, 스플라이스 억셉터, 비코딩 RNA를 코딩하는 서열, 인슐레이터, 유전자 또는 이의 조합을 포함하거나 또는 그로 이루어진다.
일정 구현예에서, 편집 엘리먼트는 SEQ ID NO: 35, 83, 또는 84에 기재된 서열과 적어도 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 99.5%가 동일한 뉴클레오티드 서열을 포함한다. 일정 구현예에서, 편집 엘리먼트는 SEQ ID NO: 35, 83, 또는 84에 기재된 뉴클레오티드 서열을 포함한다. 일정 구현예에서, 편집 엘리먼트는 SEQ ID NO: 35, 83, 또는 84에 기재된 뉴클레오티드 서열로 이루어진다. 일정 구현예에서, 편집 엘리먼트는 SEQ ID NO: 147, 148, 149, 150, 151, 152, 또는 153에 기재된 서열과 적어도 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 99.5%가 동일한 뉴클레오티드 서열을 포함한다. 일정 구현예에서, 편집 엘리먼트는 SEQ ID NO: 147, 148, 149, 150, 151, 152, 또는 153에 기재된 뉴클레오티드 서열을 포함한다. 일정 구현예에서, 편집 엘리먼트는 SEQ ID NO: 147, 148, 149, 150, 151, 152, 또는 153에 기재된 뉴클레오티드 서열로 이루어진다.
본 명세서에 개시된 교정 게놈에서 사용되는 상동성 팔부는 PAH 유전자 또는 게놈 상의 근처 유전자의 임의 영역에 대해 유도될 수 있다. 상동성 팔부의 정확한 정체 및 위치는 편집 엘리먼트 및/또는 표적 유전자좌의 정체에 따라 결정된다.
본 명세서에 개시된 교정 게놈에서 채택되는 상동성 팔부는 표적 유전자좌 (예를 들어, PAH 유전자 내 표적 유전자좌)에 측접하는 게놈과 실질적으로 동일하다. 일정 구현예에서, 5' 상동성 팔부는 표적 유전자좌에 대해 5'의 제1 게놈 영역에 대해서 적어도 약 90% (예를 들어, 적어도 약 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 99.5%)의 뉴클레오티드 서열 동일성을 갖는다. 일정 구현예에서, 5' 상동성 팔부는 제1 게놈 영역에 대해 100% 뉴클레오티드 서열 동일성을 갖는다. 일정 구현예에서, 3' 상동성 팔부는 표적 유전자좌에 대해 3'의 제2 게놈 영역에 대해 적어도 약 90% (예를 들어, 적어도 약 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 99.5%) 뉴클레오티드 서열 동일성을 갖는다. 일정 구현예에서, 3' 상동성 팔부는 제2 게놈 영역에 대해 100% 뉴클레오티드 서열 동일성을 갖는다. 일정 구현예에서, 5' 및 3' 상동성 팔부는 각각 표적 유전자좌 (예를 들어, PAH 유전자 내 표적 유전자좌)에 측접하는 제1 및 제2 게놈 영역과 각각 적어도 약 90% (예를 들어, 적어도 약 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 99.5%)가 동일하다. 일정 구현예에서, 5' 및 3' 상동성 팔부는 각각 표적 유전자좌 (예를 들어, PAH 유전자 내 표적 유전자좌)에 측접하는 제1 및 제2 게놈 영역과 각각 100%가 동일하다. 일정 구현예에서, 5' 상동성 팔부 및/또는 3' 상동성 팔부 및 표적 유전자좌에 측접하는 게놈의 해당 영역의 뉴클레오티드 서열의 편차는 뉴클레오티드 서열의 비코딩 편차를 포함하거나, 그로 본질적으로 이루어지거나 또는 그로 이루어진다.
당업자는 상동성 팔부가 상동성 재조합에 의해 표적 유전자좌로 편집 엘리먼트의 통합을 매개할 수 있기 위해서 표적 유전자좌에 측접하는 게놈 서열과 100% 동일할 필요는 없다는 것을 이해하게 될 것이다. 예를 들어, 상동성 팔부는 발현 수준 또는 특이성을 개선시키기 위해 디자인된 하나 이상의 변형 (예를 들어, 뉴클레오티드 치환, 삽입 또는 결실), 및/또는 인간 개체군에서의 하나 이상의 유전자 변이를 포함할 수 있다. 인간 유전자 변이는 표적 게놈에 전용인 유전적인 변이 및 신규한 변이 둘 모두를 포함하고, 단순 뉴클레오티드 다형성, 삽입, 결실, 재배열, 반전, 중복, 미세-반복부, 및 이의 조합을 포괄한다. 이러한 변이는 당분야에 공지되어 있고, 예를 들어, dnSNP의 데이터베이스 (Sherry et al. Nucleic Acids Res. 2001; 29(1):308-11), Database of Genomic Variants (Nucleic Acids Res. 2014; 42(Database issue):D986-92), ClinVar (Nucleic Acids Res. 2014; 42(Database issue): D980-D985), Genbank (Nucleic Acids Res. 2016; 44(Database issue): D67-D72), ENCODE (genome.ucsc.edu/encode/terms.html), JASPAR (Nucleic Acids Res. 2018; 46(D1): D260-D266), 및 PROMO (Messeguer et al. Bioinformatics 2002; 18(2):333-334; Farre et al. Nucleic Acids Res. 2003; 31(13):3651-3653)에서 확인할 수 있으며, 이들 각각은 참조로 본 명세서에 편입시킨다. 당업자는 상동성 팔부가 표적 유전자좌에 측접하는 게놈 서열과 100% 동일하지 않은 상황에서, 상동성 팔부와 게놈 사이의 상동성 재조합은 사용된 상동성 팔부의 서열과 동일하게 되도록 표적 유전자좌에 측접하는 게놈 서열을 변경시킬 수 있다는 것을 더욱 이해하게 될 것이다.
일정 구현예에서, 표적 유전자좌에 대해 5'의 제1 게놈 영역은 제1 편집창에 위치되고, 제1 편집창은 SEQ ID NO: 36에 기재된 뉴클레오티드 서열로 이루어진다. 일정 구현예에서, 표적 유전자좌에 대해 3'의 제2 게놈 영역은 제2 편집창에 위치되고, 제2 편집창은 SEQ ID NO: 45에 기재된 뉴클레오티드 서열로 이루어진다. 일정 구현예에서, 표적 유전자좌에 대해 5'의 제1 게놈 영역은 제1 편집창에 위치되고, 제1 편집창은 SEQ ID NO: 36에 기재된 뉴클레오티드 서열로 이루어지고; 표적 유전자좌에 대해 3'의 제2 게놈 영역은 제2 PAH 표적화 유전자좌에 위치되고, 제2 편집창은 SEQ ID NO: 45에 기재된 뉴클레오티드 서열로 이루어진다.
일정 구현예에서, 제1 및 제2 편집창은 상이하다. 일정 구현예에서, 제1 편집창은 제2 편집창에 대해 5'에 위치된다. 일정 구현예에서, 제1 게놈 영역은 제1 게놈 영역이 위치하는 제1 편집창의 서열에 비해서 짧은 서열로 이루어진다. 일정 구현예에서, 제1 게놈 영역은 제1 게놈 영역이 위치하는 제1 편집창의 서열로 이루어진다. 일정 구현예에서, 제2 게놈 영역은 제2 게놈 영역이 위치하는 제2 편집창의 서열에 비해 짧은 서열로 이루어진다. 일정 구현예에서, 제2 게놈 영역은 제2 게놈 영역이 위치하는 제2 편집창의 서열로 이루어진다. 일정 구현예에서, 표적 유전자좌에 대해 5'의 제1 게놈 영역은 SEQ ID NO: 36에 기재된 서열을 갖는다. 일정 구현예에서, 표적 유전자좌에 대해 3'의 제2 게놈 영역은 SEQ ID NO: 45에 기재된 서열을 갖는다. 일정 구현예에서, 표적 유전자좌에 대해 5'의 제1 게놈 영역 및 표적 유전자좌에 대해 3'의 제2 게놈 영역은 각각 SEQ ID NO: 36 및 45에 기재된 서열을 갖는다.
일정 구현예에서, 제1 및 제2 편집창은 동일하다. 일정 구현예에서, 표적 유전자좌는 편집창 내 뉴클레오티드간 결합 또는 뉴클레오티드 서열이고, 제1 게놈 영역은 표적 유전자좌에 대해 5'의 편집창의 제1 부분으로 이루어지고, 제2 게놈 영역은 표적 유전자좌에 대해 3'의 편집창의 제2 부분으로 이루어진다. 일정 구현예에서, 편집창의 제1 부분은 편집창의 5' 말단에서부터 표적 유전자좌에 대해 5'에 인접한 뉴클레오티드까지의 서열로 이루어진다. 일정 구현예에서, 편집창의 제2 부분은 표적 유전자좌에 대해 3'에 인접한 뉴클레오티드로부터 편집창의 3' 말단까지의 서열로 이루어진다. 일정 구현예에서, 편집창의 제1 부분은 편집창의 5' 말단으로부터 표적 유전자좌에 대해 5'에 인접한 뉴클레오티드까지의 서열로 이루어지고, 편집창의 제2 부분은 표적 유전자좌에 대해 3'에 인접한 뉴클레오티드로부터 편집창의 3' 말단까지의 서열로 이루어진다. 일정 구현예에서, 편집창은 SEQ ID NO: 36 또는 45에 기재된 뉴클레오티드 서열로 이루어진다. 일정 구현예에서, 편집창의 제1 및 제2 부분은 실질적으로 동등한 길이를 갖는다 (예를 들어, 더 짧은 부분의 길이 대 더 긴 부분의 길이의 비율은 0.5, 0.55, 0.6, 0.65, 0.7, 0.75, 0.8, 0.85, 0.9, 0.95, 0.96, 0.97, 0.98, 또는 0.99 초과임).
일정 구현예에서, 5' 상동성 팔부는 약 50 내지 약 4000개 뉴클레오티드 (예를 들어, 약 100 내지 약 3000개, 약 200 내지 약 2000개, 약 500 내지 약 1000개 뉴클레오티드)의 길이를 갖는다. 일정 구현예에서, 5' 상동성 팔부는 약 800개 뉴클레오티드의 길이를 갖는다. 일정 구현예에서, 5' 상동성 팔부는 약 100개 뉴클레오티드의 길이를 갖는다. 일정 구현예에서, 3' 상동성 팔부는 약 50 내지 약 4000개 뉴클레오티드 (예를 들어, 약 100 내지 약 3000개, 약 200 내지 약 2000개, 약 500 내지 약 1000개 뉴클레오티드)의 길이를 갖는다. 일정 구현예에서, 3' 상동성 팔부는 약 800개 뉴클레오티드의 길이를 갖는다. 일정 구현예에서, 3' 상동성 팔부는 약 100개 뉴클레오티드의 길이를 갖는다. 일정 구현예에서, 5' 및 3' 상동성 팔부의 각각은 독립적으로 약 50 내지 약 4000개 뉴클레오티드 (예를 들어, 약 100 내지 약 3000개, 약 200 내지 약 2000개, 약 500 내지 약 1000개 뉴클레오티드)의 길이를 갖는다. 일정 구현예에서, 5' 및 3' 상동성 팔부는 약 800개 뉴클레오티드의 길이를 갖는다.
일정 구현예에서, 5' 및 3' 상동성 팔부는 실질적으도 동등한 뉴클레오티드 길이를 갖는다. 일정 구현예에서, 5' 및 3' 상동성 팔부는 비대칭적인 뉴클레오티드 길이를 갖는다. 일정 구현예에서, 뉴클레오티드 길이의 비대칭성은 5' 및 3' 상동성 팔부 간 90% 이하의 길이 차이, 예컨대 80%, 70%, 60%, 50%, 40%, 30%, 20%, 또는 10% 이하의 길이 차이로 정의된다.
일정 구현예에서, 5' 상동성 팔부는 PAH 유전자의 뉴클레오티드 -2에 해당하는 C, PAH 유전자의 뉴클레오티드 4에 해당하는 G, PAH 유전자의 뉴클레오티드 6에 해당하는 G, PAH 유전자의 뉴클레오티드 7에 해당하는 G, PAH 유전자의 뉴클레오티드 9에 해당하는 G, PAH 유전자의 뉴클레오티드 -467에 해당하는 A, PAH 유전자의 뉴클레오티드 -465에 해당하는 A, PAH 유전자의 뉴클레오티드 -181에 해당하는 A, PAH 유전자의 뉴클레오티드 -214에 해당하는 G, PAH 유전자의 뉴클레오티드 -212에 해당하는 C, PAH 유전자의 뉴클레오티드 -211에 해당하는 A, PAH 유전자의 뉴클레오티드 194에 해당하는 G, PAH 유전자의 뉴클레오티드 -433에 해당하는 C, PAH 유전자의 뉴클레오티드 -432에 해당하는 C, PAH 유전자의 뉴클레오티드 -394 내지 -388에 해당하는 ACGCTGTTCTTCGCC (SEQ ID NO: 68), PAH 유전자의 뉴클레오티드 -341에 해당하는 A, PAH 유전자의 뉴클레오티드 -339에 해당하는 A, PAH 유전자의 뉴클레오티드 -225에 해당하는 A, PAH 유전자의 뉴클레오티드 -211에 해당하는 A, 및/또는 PAH 유전자의 뉴클레오티드 -203에 해당하는 A를 포함한다.
일정 구현예에서, 5' 상동성 팔부는
(a) PAH 유전자의 뉴클레오티드 -2에 해당하는 C, PAH 유전자의 뉴클레오티드 4에 해당하는 G, PAH 유전자의 뉴클레오티드 6에 해당하는 G, PAH 유전자의 뉴클레오티드 7에 해당하는 G, 및 PAH 유전자의 뉴클레오티드 9에 해당하는 G;
(b) PAH 유전자의 뉴클레오티드 -467에 해당하는 A, 및 PAH 유전자의 뉴클레오티드 -465에 해당하는 A;
(c) PAH 유전자의 뉴클레오티드 -181에 해당하는 A;
(d) PAH 유전자의 뉴클레오티드 -214에 해당하는 G, PAH 유전자의 뉴클레오티드 -212에 해당하는 C, 및 PAH 유전자의 뉴클레오티드 -211에 해당하는 A;
(e) PAH 유전자의 뉴클레오티드 194에 해당하는 G;
(f) PAH 유전자의 뉴클레오티드 -433에 해당하는 C, 및 PAH 유전자의 뉴클레오티드 -432에 해당하는 C;
(g) PAH 유전자의 뉴클레오티드 -394 내지 -388에 해당하는 ACGCTGTTCTTCGCC (SEQ ID NO: 68); 및/또는
(h) PAH 유전자의 뉴클레오티드 -341에 해당하는 A, PAH 유전자의 뉴클레오티드 -339에 해당하는 A, PAH 유전자의 뉴클레오티드 -225에 해당하는 A, PAH 유전자의 뉴클레오티드 -211에 해당하는 A, 및 PAH 유전자의 뉴클레오티드 -203에 해당하는 A
를 포함한다.
일정 구현예에서, 5' 상동성 팔부는
(a) PAH 유전자의 뉴클레오티드 -2에 해당하는 C, PAH 유전자의 뉴클레오티드 4에 해당하는 G, PAH 유전자의 뉴클레오티드 6에 해당하는 G, PAH 유전자의 뉴클레오티드 7에 해당하는 G, 및 PAH 유전자의 뉴클레오티드 9에 해당하는 G;
(b) PAH 유전자의 뉴클레오티드 -467에 해당하는 A, 및 PAH 유전자의 뉴클레오티드 -465에 해당하는 A;
(c) PAH 유전자의 뉴클레오티드 -181에 해당하는 A;
(d) PAH 유전자의 뉴클레오티드 -181에 해당하는 A, PAH 유전자의 뉴클레오티드 -214에 해당하는 G, PAH 유전자의 뉴클레오티드 -212에 해당하는 C, 및 PAH 유전자의 뉴클레오티드 -211에 해당하는 A;
(e) PAH 유전자의 뉴클레오티드 194에 해당하는 G;
(f) PAH 유전자의 뉴클레오티드 -433에 해당하는 C, 및 PAH 유전자의 뉴클레오티드 -432에 해당하는 C;
(g) PAH 유전자의 뉴클레오티드 -433에 해당하는 C, PAH 유전자의 뉴클레오티드 -432에 해당하는 C, 및 PAH 유전자의 뉴클레오티드 -394 내지 -388에 해당하는 ACGCTGTTCTTCGCC (SEQ ID NO: 68); 및/또는
(h) PAH 유전자의 뉴클레오티드 -467에 해당하는 A, PAH 유전자의 뉴클레오티드 -465에 해당하는 A, PAH 유전자의 뉴클레오티드 -341에 해당하는 A, PAH 유전자의 뉴클레오티드 -339에 해당하는 A, PAH 유전자의 뉴클레오티드 -225에 해당하는 A, PAH 유전자의 뉴클레오티드 -211에 해당하는 A, 및 PAH 유전자의 뉴클레오티드 -203에 해당하는 A
를 포함한다.
일정 구현예에서, 5' 상동성 팔부는 임의로 상기 기재된 위치에서의 뉴클레오티드 중 하나 이상을 포함하는, SEQ ID NO: 36에 기재된 뉴클레오티드 서열과 적어도 약 90% (예를 들어, 적어도 약 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 99.5%)의 뉴클레오티드 서열 동일성을 갖는다. 일정 구현예에서, 5' 상동성 팔부는 인간 개체군에서 하나 이상의 유전자 변이를 더 포함한다. 일정 구현예에서, 5' 상동성 팔부는 SEQ ID NO: 36, 37, 38, 39, 40, 41, 42, 43, 또는 44에 기재된 뉴클레오티드 서열을 포함한다. 일정 구현예에서, 5' 상동성 팔부는 SEQ ID NO: 36, 37, 38, 39, 40, 41, 42, 43, 또는 44에 기재된 뉴클레오티드 서열로 이루어진다.
일정 구현예에서, 3' 상동성 팔부는 SEQ ID NO: 45에 기재된 뉴클레오티드 서열과 적어도 약 90% (예를 들어, 적어도 약 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 99.5%)의 뉴클레오티드 서열 동일성을 갖는다. 일정 구현예에서, 3' 상동성 팔부는 인간 개체군에서 하나 이상의 유전자 변이를 더 포함한다. 일정 구현예에서, 3' 상동성 팔부는 SEQ ID NO: 45에 기재된 뉴클레오티드 서열을 포함한다. 일정 구현예에서, 3' 상동성 팔부는 SEQ ID NO: 45에 기재된 뉴클레오티드 서열로 이루어진다.
일정 구현예에서, 5' 상동성 팔부 및 3' 상동성 팔부 각각은 각각 SEQ ID NO: 36 및 45에 기재된 뉴클레오티드 서열과 적어도 약 90% (예를 들어, 적어도 약 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 99.5%)의 뉴클레오티드 서열 동일성을 가지며, 임의로 5' 상동성 팔부는 상기 기개된 위치에서의 뉴클레오티드 중 하나 이상을 포함한다. 일정 구현예에서, 5' 상동성 팔부 및 3' 상동성 팔부는 각각 SEQ ID NO: 36 및 45, 37 및 45, 38 및 45, 39 및 45, 40 및 45, 41 및 45, 42 및 45, 43 및 45, 또는, 44 및 45에 기재된 뉴클레오티드 서열을 포함한다. 일정 구현예에서, 5' 상동성 팔부 및 3' 상동성 팔부는 각각 SEQ ID NO: 36 및 45, 37 및 45, 38 및 45, 39 및 45, 40 및 45, 41 및 45, 42 및 45, 43 및 45, 또는 44 및 45에 기재된 뉴클레오티드 서열로 이루어진다.
일정 구현예에서, 5' 상동성 팔부는 SEQ ID NO: 69 또는 72에 기재된 뉴클레오티드 서열을 포함한다. 일정 구현예에서, 5' 상동성 팔부는 SEQ ID NO: 69 또는 72에 기재된 뉴클레오티드 서열로 이루어진다. 일정 구현예에서, 3' 상동성 팔부는 SEQ ID NO: 70 또는 73에 기재된 뉴클레오티드 서열을 포함한다. 일정 구현예에서, 3' 상동성 팔부는 SEQ ID NO: 70 또는 73에 기재된 뉴클레오티드 서열로 이루어진다. 일정 구현예에서, 5' 상동성 팔부 및 3' 상동성 팔부는 각각 SEQ ID NO: 69 및 70, 또는 72 및 73에 기재된 뉴클레오티드 서열을 포함한다. 일정 구현예에서, 5' 상동성 팔부 및 3' 상동성 팔부는 각각 SEQ ID NO: 69 및 70, 또는 72 및 73에 기재된 뉴클레오티드 서열로 이루어진다.
일정 구현예에서, 5' 상동성 팔부는 SEQ ID NO: 111, 115, 또는 142에 기재된 뉴클레오티드 서열을 포함한다. 일정 구현예에서, 5' 상동성 팔부는 SEQ ID NO: 111, 115, 또는 142에 기재된 뉴클레오티드 서열로 이루어진다. 일정 구현예에서, 3' 상동성 팔부는 SEQ ID NO: 112, 117, 또는 144에 기재된 뉴클레오티드 서열을 포함한다. 일정 구현예에서, 3' 상동성 팔부는 SEQ ID NO: 112, 117, 또는 144에 기재된 뉴클레오티드 서열로 이루어진다. 일정 구현예에서, 5' 상동성 팔부 및 3' 상동성 팔부는 각각 SEQ ID NO: 111 및 112, 115 및 117, 또는 142 및 144에 기재된 뉴클레오티드 서열을 포함한다. 일정 구현예에서, 5' 상동성 팔부 및 3' 상동성 팔부는 각각 SEQ ID NO: 111 및 112, 115 및 117, 또는 142 및 144에 기재된 뉴클레오티드 서열로 이루어진다.
일정 구현예에서, 교정 게놈은 SEQ ID NO: 46, 47, 48, 49, 50, 51, 52, 53, 54, 85, 86, 113, 118, 134, 136, 또는 145와 적어도 90% (예를 들어, 적어도 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 99.5%)가 동일한 뉴클레오티드 서열을 포함한다. 일정 구현예에서, 교정 게놈은 SEQ ID NO: 46, 47, 48, 49, 50, 51, 52, 53, 54, 85, 86, 113, 118, 134, 136, 또는 145에 기재된 뉴클레오티드 서열을 포함한다. 일정 구현예에서, 교정 게놈은 SEQ ID NO: 46, 47, 48, 49, 50, 51, 52, 53, 54, 85, 86, 113, 118, 134, 136, 또는 145에 기재된 뉴클레오티드 서열로 이루어진다.
일정 구현예에서, 본 명세서에 개시된 교정 게놈은 5' 상동성 팔부 뉴클레오티드 서열의 5'에 5' 반전 말단 반복부 (5' ITR) 뉴클레오티드 서열, 및 3' 상동성 팔부 뉴클레오티드 서열의 3'에 3' 반전 말단 반복부 (3' ITR) 뉴클레오티드 서열을 더 포함한다. 임의의 AAV 혈청형 또는 이의 변이체 유래 ITR 서열은 본 명세서에 개시된 교정 게놈에서 사용될 수 있다. 5' 및 3' ITR은 동일한 혈청형의 AAV 또는 상이한 혈청형의 AAV로부터 유래될 수 있다. 본 명세서에 개시된 교정 게놈에서 사용을 위한 예시적인 ITR는 본 명세서에서 SEQ ID NO: 18-21에 기재되어 있다. 일정 구현예에서, 5' ITR 뉴클레오티드 서열 및 3' ITR 뉴클레오티드 서열은 서로 실질적으로 상보적 (예를 들어, 5' 또는 3' ITR의 1, 2, 3, 4 또는 5 뉴클레오티드 위치에서의 미스매치를 제외하고 서로 상보적)이다.
일정 구현예에서, 5' ITR 또는 3' ITR은 AAV2로부터 유래된다. 일정 구현예에서, 5' ITR 및 3' ITR 둘 모두는 AAV2로부터 유래된다. 일정 구현예에서, 5' ITR 뉴클레오티드 서열은 SEQ ID NO:18과 적어도 95% (예를 들어, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100%) 서열 동일성을 갖거나, 또는 3' ITR 뉴클레오티드 서열은 SEQ ID NO:19와 적어도 95% (예를 들어, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100%) 서열 동일성을 갖는다. 일정 구현예에서, 5' ITR 뉴클레오티드 서열은 SEQ ID NO:18과 적어도 95% (예를 들어, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100%) 서열 동일성을 갖고, 3' ITR 뉴클레오티드 서열은 SEQ ID NO:19와 적어도 95% (예를 들어, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100%) 서열 동일성을 갖는다. 일정 구현예에서, 교정 게놈은 SEQ ID NO: 35에 기재된 뉴클레오티드 서열을 갖는 편집 엘리먼트, SEQ ID NO:18의 서열을 갖는 5' ITR 뉴클레오티드 서열, 및 SEQ ID NO:19의 서열을 갖는 3' ITR 뉴클레오티드 서열을 포함한다. 일정 구현예에서, 교정 게놈은 SEQ ID NO: 46-54 중 어느 하나에 기재된 뉴클레오티드 서열, SEQ ID NO:18의 서열을 갖는 5' ITR 뉴클레오티드 서열, 및 SEQ ID NO:19의 서열을 갖는 3' ITR 뉴클레오티드 서열을 포함한다. 일정 구현예에서, 교정 게놈은 5'에서 3'으로 SEQ ID NO:18의 서열을 갖는 5' ITR 뉴클레오티드 서열, SEQ ID NO: 46-54 중 어느 하나에 기재된 뉴클레오티드 서열, 및 SEQ ID NO:19의 서열을 갖는 3' ITR 뉴클레오티드 서열로 이루어진다.
일정 구현예에서, 5' ITR 또는 3' ITR은 AAV5로부터 유래된다. 일정 구현예에서, 5' ITR 및 3' ITR 둘 모두는 AAV5로부터 유래된다. 일정 구현예에서, 5' ITR 뉴클레오티드 서열은 SEQ ID NO:20과 적어도 95% (예를 들어, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100%) 서열 동일성을 갖거나, 또는 3' ITR 뉴클레오티드 서열은 SEQ ID NO:21과 적어도 95% 서열 동일성을 갖는다. 일정 구현예에서, 5' ITR 뉴클레오티드 서열은 SEQ ID NO:20과 적어도 95% (예를 들어, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100%) 서열 동일성을 갖고, 3' ITR 뉴클레오티드 서열은 SEQ ID NO:21과 적어도 95% (예를 들어, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100%) 서열 동일성을 갖는다. 일정 구현예에서, 교정 게놈은 SEQ ID NO: 35에 기재된 뉴클레오티드 서열을 갖는 편집 엘리먼트, SEQ ID NO:20의 서열을 갖는 5' ITR 뉴클레오티드 서열, 및 SEQ ID NO:21의 서열을 갖는 3' ITR 뉴클레오티드 서열을 포함한다. 일정 구현예에서, 교정 게놈은 SEQ ID NO: 46-54 중 어느 하나에 기재된 뉴클레오티드 서열, SEQ ID NO:20의 서열을 갖는 5' ITR 뉴클레오티드 서열, 및 SEQ ID NO:21의 서열을 갖는 3' ITR 뉴클레오티드 서열을 포함한다. 일정 구현예에서, 교정 게놈은 5'에서 3'으로 SEQ ID NO:20의 서열을 갖는 5' ITR 뉴클레오티드 서열, SEQ ID NO: 46-54 중 어느 하나에 기재된 뉴클레오티드 서열, 및 SEQ ID NO:21의 서열을 갖는 3' ITR 뉴클레오티드 서열로 이루어진다.
일정 구현예에서, 5' ITR 뉴클레오티드 서열 및 3' ITR 뉴클레오티드 서열은 서로 실질적으로 상보적 (예를 들어, 5' 또는 3' ITR 내 1, 2, 3, 4 또는 5 뉴클레오티드 위치에서의 미스매치를 제외하고 서로 상보적)이다.
일정 구현예에서, 5' ITR 또는 3' ITR은 Rep 단백질에 의한 분해능을 감소시키거나 또는 폐기시키도록 변형된다 ("비분해성 (non-resolvable) ITR"). 일정 구현예에서, 비분해성 ITR은 말단 분해 부위의 뉴클레오티드 서열에 삽입, 결실 또는 치환을 포함한다. 이러한 변형은 전달 게놈이 감염된 세포에서 복제된 이후에 AAV의 자기-상보적, 이중 가닥 DNA 게놈의 형성을 가능하게 한다. 예시적인 비분해성 ITR 서열은 당분야에 공지되어 있다 (예를 들어, 그 전문이 참조로 본 명세서에 편입되는 미국 특허 제7,790,154호 및 제9,783,824호 참조). 일정 구현예에서, 5' ITR은 SEQ ID NO: 26과 적어도 95%, 96%, 97%, 98%, 또는 99%가 동일한 뉴클레오티드 서열을 포함한다. 일정 구현예에서, 5' ITR은 SEQ ID NO: 26과 적어도 95%, 96%, 97%, 98%, 또는 99%가 동일한 뉴클레오티드 서열로 이루어진다. 일정 구현예에서, 5' ITR은 SEQ ID NO: 26에 기재된 뉴클레오티드 서열로 이루어진다. 일정 구현예에서, 3' ITR은 SEQ ID NO: 27과 적어도 95%, 96%, 97%, 98%, 또는 99%가 동일한 뉴클레오티드 서열을 포함한다. 일정 구현예에서, 5' ITR은 SEQ ID NO: 27과 적어도 95%, 96%, 97%, 98%, 또는 99%가 동일한 뉴클레오티드 서열로 이루어진다. 일정 구현예에서, 3' ITR은 SEQ ID NO: 27에 기재된 뉴클레오티드 서열로 이루어진다. 일정 구현예에서, 5' ITR은 SEQ ID NO: 26에 기재된 뉴클레오티드 서열로 이루어지고, 3' ITR은 SEQ ID NO: 27에 기재된 뉴클레오티드 서열로 이루어진다. 일정 구현예에서, 5' ITR은 SEQ ID NO: 26에 기재된 뉴클레오티드 서열로 이루어지고, 3' ITR은 SEQ ID NO: 19에 기재된 뉴클레오티드 서열로 이루어진다.
일정 구현예에서, 3' ITR은 야생형 AAV2 게놈 서열로부터 유래된 추가의 뉴클레오티드 서열이 측접된다. 일정 구현예에서, 3' ITR은 야생형 AAV2 ITR에 인접하는 야생형 AAV2 서열로부터 유래된 추가의 37 bp 서열이 측접한다. 예를 들어, [Savy et al., Human Gene Therapy Methods (2017) 28(5): 277-289] (이의 전문은 참조로 본 명세서에 편입됨)을 참조한다. 일정 구현예에서, 추가의 37 bp 서열은 3' ITR의 내부에 있다. 일정 구현예에서, 37 bp 서열은 SEQ ID NO: 140에 기재된 서열로 이루어진다. 일정 구현예에서, 3' ITR은 SEQ ID NO: 141과 적어도 95%, 96%, 97%, 98%, 또는 99%가 동일한 뉴클레오티드 서열을 포함한다. 일정 구현예에서, 3' ITR은 SEQ ID NO: 141에 기재된 뉴클레오티드 서열을 포함한다. 일정 구현예에서, 3' ITR의 뉴클레오티드 서열은 SEQ ID NO: 141과 적어도 95%, 96%, 97%, 98%, 또는 99%가 동일한 뉴클레오티드 서열로 이루어진다. 일정 구현예에서, 3' ITR의 뉴클레오티드 서열은 SEQ ID NO: 141에 기재된 뉴클레오티드 서열로 이루어진다.
일정 구현예에서, 본 명세서에 개시된 교정 게놈은 약 0.5 내지 약 8 kb (예를 들어, 약 1 내지 약 5, 약 2 내지 약 5, 약 3 내지 약 5, 약 4 내지 약 5, 약 4.5 내지 약 4.8, 또는 약 4.7 kb)의 길이를 갖는다.
일정 구현예에서, 교정 게놈은 SEQ ID NO: 55, 56, 57, 58, 59, 60, 61, 62, 63, 87, 88, 114, 119, 135, 137, 또는 146과 적어도 90% (예를 들어, 적어도 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 99.5%)가 동일한 뉴클레오티드 서열을 포함한다. 일정 구현예에서, 교정 게놈은 SEQ ID NO: 55, 56, 57, 58, 59, 60, 61, 62, 63, 87, 88, 114, 119, 135, 137, 또는 146에 기재된 뉴클레오티드 서열을 포함한다. 일정 구현예에서, 교정 게놈은 SEQ ID NO: 55, 56, 57, 58, 59, 60, 61, 62, 63, 87, 88, 114, 119, 135, 137, 또는 146에 기재된 뉴클레오티드 서열로 이루어진다.
일정 구현예에서, 복제-결함 AAV는 (a) SEQ ID NO: 16의 아미노산 203-736의 아미노산 서열, 및 5'에서 3'으로 하기 유전자 엘리먼트: 5' ITR 엘리먼트 (예를 들어, SEQ ID NO: 18의 5' ITR), 5' 상동성 팔부 (예를 들어, SEQ ID NO: 115의 5' 상동성 팔부), 스플라이스 억셉터 (예를 들어, SEQ ID NO: 14의 스플라이스 억셉터), 2A 엘리먼트 (예를 들어, SEQ ID NO: 74의 2A 엘리먼트), 침묵적으로 변경된 인간 PAH 코딩 서열 (예를 들어, SEQ ID NO: 116의 PAH 코딩 서열), SV40 폴리아데닐화 서열 (예를 들어, SEQ ID NO: 31의 SV40 폴리아데닐화 서열), 3' 상동성 팔부 (예를 들어, SEQ ID NO: 117의 3' 상동성 팔부), 및 3' ITR 엘리먼트 (예를 들어, SEQ ID NO: 19의 3' ITR)를 포함하는 전달 게놈을 포함하는 AAV 캡시드 단백질; (b) SEQ ID NO: 16의 아미노산 138-736의 아미노산 서열, 및 5'에서 3'으로 하기 유전자 엘리먼트: 5' ITR 엘리먼트 (예를 들어, SEQ ID NO: 18의 5' ITR), 5' 상동성 팔부 (예를 들어, SEQ ID NO: 115의 5' 상동성 팔부), 스플라이스 억셉터 (예를 들어, SEQ ID NO: 14의 스플라이스 억셉터), 2A 엘리먼트 (예를 들어, SEQ ID NO: 74의 2A 엘리먼트), 침묵적으로 변경된 인간 PAH 코딩 서열 (예를 들어, SEQ ID NO: 116의 PAH 코딩 서열), SV40 폴리아데닐화 서열 (예를 들어, SEQ ID NO: 31의 SV40 폴리아데닐화 서열), 3' 상동성 팔부 (예를 들어, SEQ ID NO: 117의 3' 상동성 팔부, 및 3' ITR 엘리먼트 (예를 들어, SEQ ID NO: 19의 3' ITR)를 포함하는 전달 게놈을 포함하는 AAV 캡시드 단백질; 및/또는 (c) SEQ ID NO: 16의 아미노산 서열, 및 5'에서 3'으로 하기 유전자 엘리먼트: 5' ITR 엘리먼트 (예를 들어, SEQ ID NO: 18의 5' ITR), 5' 상동성 팔부 (예를 들어, SEQ ID NO: 115의 5' 상동성 팔부), 스플라이스 억셉터 (예를 들어, SEQ ID NO: 14의 스플라이스 억셉터), 2A 엘리먼트 (예를 들어, SEQ ID NO: 74의 2A 엘리먼트), 침묵적으로 변경된 인간 PAH 코딩 서열 (예를 들어, SEQ ID NO: 116의 PAH 코딩 서열), SV40 폴리아데닐화 서열 (예를 들어, SEQ ID NO: 31의 SV40 폴리아데닐화 서열), 3' 상동성 팔부 (예를 들어, SEQ ID NO: 117의 3' 상동성 팔부), 및 3' ITR 엘리먼트 (예를 들어, SEQ ID NO: 19의 3' ITR)를 포함하는 전달 게놈을 포함하는 AAV 캡시드 단백질을 포함한다.
일정 구현예에서, 복제-결함 AAV는 (a) SEQ ID NO: 16의 아미노산 203-736의 아미노산 서열, 및 SEQ ID NO: 25, 46-63, 113, 114, 116, 118, 119, 134-137, 145, 및 146 중 어느 하나에 기재된 뉴클레오티드 서열을 포함하는 교정 게놈을 포함하는 AAV 캡시드 단백질; (b) SEQ ID NO: 16의 아미노산 138-736의 아미노산 서열, 및 SEQ ID NO: 25, 46-63, 113, 114, 116, 118, 119, 134-137, 145, 및 146 중 어느 하나에 기재된 뉴클레오티드 서열을 포함하는 교정 게놈을 포함하는 AAV 캡시드 단백질; 및/또는 (c) SEQ ID NO: 16의 아미노산 서열, 및 SEQ ID NO: 25, 46-63, 113, 114, 116, 118, 119, 134-137, 145, 및 146 중 어느 하나에 기재된 뉴클레오티드 서열을 포함하는 교정 게놈을 포함하는 AAV 캡시드 단백질을 포함한다.
본 명세서에 개시된 AAV 조성물은 그들이 시험관내 및 생체내 둘 모두에서 높은 효율로 세포에서 PAH 유전자를 교정할 수 있다는 점에서 특히 유리하다. 일정 구현예에서, 표적 유전자좌로 편집 엘리먼트의 편집 효율은 AAV가 표준 AAV 투여 조건 하에서 외생성 뉴클레아제의 부재 하에 인간 간세포가 이식된 마우스에 투여될 때 적어도 1% (예를 들어, 적어도 2%, 3%, 4%, 5%, 6%, 7%, 8%, 9%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95%)이다. 일정 구현예에서, 표적 유전자좌로 편집 엘리먼트의 통합의 대립유전자 빈도는 AAV가 표준 AAV 투여 조건 하에서 외생성 뉴클레아제 부재 하에 인간 간세포가 이식된 마우스에게 투여될 때 적어도 0.5% (예를 들어, 적어도 1%, 2%, 3%, 4%, 5%, 6%, 7%, 8%, 9%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95%)이다.
PAH 유전자의 편집 효율을 결정하는 임의의 방법이 적용될 수 있다. 일정 구현예에서, 개별 세포는 형질도입된 세포의 개체군으로부터 분리되고, PAH 유전자의 표적 유전자좌로 올바르게 통합된 편집 엘리먼트의 존재를 확인할 수 있는 PCR 프라이머 를 사용한 단일-세포 PCR가 수행된다. 이러한 방법은 비변형된 표적 유전자좌를 선택적으로 증폭시키는 PCR 프라이머를 사용한 동일 세포의 단일-세포 PCR을 더 포함할 수 있다. 이러한 방식으로, 세포의 유전자형을 결정할 수 있다. 예를 들어, 단일 세포 PCR이 세포가 편집된 표적 유전자좌 및 비변형된 표적 유전자좌 둘 모두를 갖는다는 것을 보여준다면, 그 세포는 편집된 PAH 유전자에 대해 이형접합으로 간주된다.
추가로 또는 대안적으로, 일정 구현예에서, 선형 증폭 매개 PCR (LAM-PCR),정량적 PCR (qPCR) 또는 디지털 액적 PCR (ddPCR)이 오직 편집된 PAH 대립유전자만을 검출하는 프라이머 및 프로브를 사용하여 형질도입된 세포의 개체군으로부터 추출된 DNA에 대해 수행될 수 있다. 이러한 방법은 샘플 내 총 게놈의 개수 및 미편집된 PAH 대립유전자의 개수를 결정하기 위해서 (동일 반응 또는 개별 반응으로) 추가의 qPCR 또는 ddPCR을 더 포함할 수 있다. 이들 개수는 표적 유전자좌로 편집 엘리먼트의 통합의 대립유전자 빈도를 결정하는데 사용될 수 있다.
추가로 또는 대안적으로, 일정 구현예에서, PAH 유전자좌는 표적 유전자좌에 측접하는 PAH 유전자의 영역에 결합하는 프라이머를 사용한 PCR을 통해서, 또는 교정 게놈 내 영역 (예를 들어, 그 유전자좌에 비천연적인 외생성 서열을 포함하는 영역)에 결합하는 프라이머를 사용한 LAM-PCR을 통해서 형질도입된 세포의 개체군으로부터 추출된 DNA로부터 증폭될 수 있다. 최종 PCR 앰플리콘은 형질도입된 세포의 개체군에 존재하는 편집 및 미편집 PAH 대립유전자의 상대적인 개수를 결정하기 위해 단일 분자 차세대 시퀀싱 (NGS) 기술을 사용해 개별적으로 시퀀싱될 수 있다. 이들 개수는 표적 유전자좌로 편집 엘리먼트의 통합의 대립유전자 빈도를 결정하는데 사용될 수 있다.
다른 양상에서, 본 개시는 약학적으로 허용가능한 부형제, 보강제, 희석제, 비히클 또는 담체, 또는 이의 조합과 함께 본 명세서에 개시된 AAV를 포함하는 약학 조성물을 제공한다. "약학적으로 허용가능한 담체"는 조성물의 활성 성분과 배합될 때, 의도하지 않은 면역 반응과 같은, 파괴적 생리학적 반응을 초래하지 ?方? 성분이 생물학적 활성을 유지할 수 있게 하는, 임의의 재료를 포함한다. 약학적으로 허용가능한 담체는 물, 포스페이트 완충 염수, 에멀션 예컨대 오일/물 에멀션, 및 습윤제를 포함한다. 이러한 담체를 포함하는 조성물은 다음의 문헌들에 기술된 것과 같은 충분히 공지된 통상의 방법을 통해 제제화된다: Remington's Pharmaceutical Sciences, current Ed., Mack Publishing Co., Easton Pa. 18042, USA; A. Gennaro (2000) "Remington: The Science and Practice of Pharmacy", 20th edition, Lippincott, Williams, & Wilkins; Pharmaceutical Dosage Forms and Drug Delivery Systems (1999) H. C. Ansel et al, 7th ed., Lippincott, Williams, & Wilkins; 및 Handbook of Pharmaceutical Excipients (2000) A. H. Kibbe et al, 3rd ed. Amer. Pharmaceutical Assoc.
III. 사용 방법
다른 양상에서, 본 개시는 세포에서 PAH 폴리펩티드를 발현하거나 또는 PAH 유전자 내 돌연변이를 교정하기 위한 방법을 제공한다. 이 방법은 일반적으로 본 명세서에 개시된 복제-결함 AAV를 세포에 형질도입시키는 단계를 포함한다. 이러한 방법은 PAH 유전자 내 돌연변이의 교정 또는 PAH 발현의 복원에서 매우 효과적으로, 이러한 교정을 촉진시키기 위해 외생성 뉴클레아제 (예를 들어, 메가뉴클레아제, 징크 핑거 뉴클레아제, 전사 활성인자-유사 뉴클레아제 (TALEN), 또는 RNA-가이드된 뉴클레아제 예컨대 Cas9)의 작용에 의한 표적 유전자좌에서 게놈의 절단을 요구하지 않는다. 따라서, 일정 구현예에서, 본 명세서에 개시된 방법은 외생성 뉴클레아제 또는 외생성 뉴클레아제를 코딩하는 뉴클레오티드 서열의 동시-형질도입 또는 동시-투여없이 본 명세서에 개시된 바와 같은 복제-결함 AAV를 세포에 형질도입시키는 단계를 포함한다.
본 명세서에 개시된 방법은 PAH 유전자에 돌연변이를 보유하는 임의 세포에 적용될 수 있다. 당업자는 PAH를 활성적으로 발현하는 세포에 특히 관심이 있다는 것을 이해하게 될 것이다. 따라서, 일정 구현예에서, 방법은 간, 신장, 뇌, 뇌하수체, 부신, 췌장, 방광, 담낭, 결장, 소장, 또는 유방의 세포에 적용된다. 일정 구현예에서, 방법은 간세포 및/또는 신장 세포에 적용된다.
본 명세서에 개시된 방법은 연구 목적을 위해 시험관내에서 수행될 수 있거나 또는 치료 목적으로 생체외 또는 생체내에서 수행될 수 있다.
일정 구현예에서, 형질도입시키려는 세포는 포유동물 대상체에 존재하고 AAV는 대상체의 세포를 형질도입시키기에 유효한 양으로 대상체에게 투여된다. 따라서, 일정 구현예에서, 본 개시는 PAH 유전자 돌연변이와 연관된 질환 또는 장애를 갖는 대상체를 치료하기 위한 방법을 제공하고, 이 방법은 일반적으로 본 명세서에 개시된 바와 같은 복제-결함 AAV의 유효량을 대상체에게 투여하는 단계를 포함한다. 대상체는 인간 대상체일 수 있거나 또는 인간 간 세포를 함유하는 설치류 대상체 (예를 들어, 마우스)일 수 있다. 적합한 마우스 대상체는 제한없이 인간 간의 세포 (예를 들어, 인간 간세포)가 생착된 마우스를 포함한다. PAH 유전자 돌연변이와 연관된 임의의 질환 또는 장애는 본 명세서에 개시된 방법을 사용해 치료될 수 있다. 이러한 질환 또는 장애는 제한없이 페닐케톤뇨증을 포함한다. 일정 구현예에서, 세포는 외생성 뉴클레아제 또는 외생성 뉴클레아제를 코딩하는 뉴클레오티드 서열을 동시-형질도입 또는 동시-투여하지 않고 형질도입된다.
본 명세서에 개시된 방법은 그들이 생체내 및 시험관내 둘 모두에서 높은 효율로 세포의 PAH 유전자를 교정할 수 있다는 점에서 특히 유리하다. 일정 구현예에서, 표적 유전자좌로 편집 엘리먼트의 통합 효율은 AAV가 표준 AAV 투여 조건 하에서 외생성 뉴클레아제의 부재 하에 인간 간세포가 이식된 마우스에 투여될 때 적어도 1% (예를 들어, 적어도 2%, 3%, 4%, 5%, 6%, 7%, 8%, 9%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95%)이다. 일정 구현예에서, 표적 유전자좌로 편집 엘리먼트의 통합의 대립유전자 빈도는 AAV가 표준 AAV 투여 조건 하에서 외생성 뉴클레아제의 부재 하에 인간 간세포가 이식된 마우스에게 투여될 때 적어도 0.5% (예를 들어, 적어도 1%, 2%, 3%, 4%, 5%, 6%, 7%, 8%, 9%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95%)이다.
일정 구현예에서, 본 명세서에 개시된 AAV 조성물에 의한 세포의 형질도입은 본 명세서에 제공된 바와 같이 또는 당업자에게 공지된 임의의 형질도입 방법에 의해 수행될 수 있다. 일정 구현예에서, 세포는 50,000; 100,000; 150,000; 200,000; 250,000; 300,000; 350,000; 400,000; 450,000; 또는 500,000의 감염 다중도 (MOI), 또는 세포의 최적 형질도입을 제공하는 임의의 MOI로 AAV와 접촉될 수 있다.
일정 구현예에서, 전술한 방법은 (a) SEQ ID NO: 16의 아미노산 203-736의 아미노산 서열, 및 5'에서 3'으로 하기 유전자 엘리먼트: 5' ITR 엘리먼트 (예를 들어, SEQ ID NO: 18의 5' ITR), 5' 상동성 팔부 (예를 들어, SEQ ID NO: 115의 5' 상동성 팔부), 스플라이스 억셉터 (예를 들어, SEQ ID NO: 14의 스플라이스 억셉터), 2A 엘리먼트 (예를 들어, SEQ ID NO: 74의 2A 엘리먼트), 침묵적으로 변경된 인간 PAH 코딩 서열 (예를 들어, SEQ ID NO: 116의 PAH 코딩 서열), SV40 폴리아데닐화 서열 (예를 들어, SEQ ID NO: 31의 SV40 폴리아데닐화 서열), 3' 상동성 팔부 (예를 들어, SEQ ID NO: 117의 3' 상동성 팔부), 및 3' ITR 엘리먼트 (예를 들어, SEQ ID NO: 19의 3' ITR)를 포함하는 전달 게놈을 포함하는 AAV 캡시드 단백질; (b) SEQ ID NO: 16의 아미노산 138-736의 아미노산 서열, 및 5'에서 3'으로 하기 유전자 엘리먼트: 5' ITR 엘리먼트 (예를 들어, SEQ ID NO: 18의 5' ITR), 5' 상동성 팔부 (예를 들어, SEQ ID NO: 115의 5' 상동성 팔부), 스플라이스 억셉터 (예를 들어, SEQ ID NO: 14의 스플라이스 억셉터), 2A 엘리먼트 (예를 들어, SEQ ID NO: 74의 2A 엘리먼트), 침묵적으로 변경된 인간 PAH 코딩 서열 (예를 들어, SEQ ID NO: 116의 PAH 코딩 서열), SV40 폴리아데닐화 서열 (예를 들어, SEQ ID NO: 31의 SV40 폴리아데닐화 서열), 3' 상동성 팔부 (예를 들어, SEQ ID NO: 117의 3' 상동성 팔부), 및 3' ITR 엘리먼트 (예를 들어, SEQ ID NO: 19의 3' ITR)를 포함하는 전달 게놈을 포함하는 AAV 캡시드 단백질; 및/또는 (c) SEQ ID NO: 16의 아미노산 서열, 및 5'에서 3'으로 하기 유전자 엘리먼트: 5' ITR 엘리먼트 (예를 들어, SEQ ID NO: 18의 5' ITR), 5' 상동성 팔부 (예를 들어, SEQ ID NO: 115의 5' 상동성 팔부), 스플라이스 억셉터 (예를 들어, SEQ ID NO: 14의 스플라이스 억셉터), 2A 엘리먼트 (예를 들어, SEQ ID NO: 74의 2A 엘리먼트), 침묵적으로 변경된 인간 PAH 코딩 서열 (예를 들어, SEQ ID NO: 116의 PAH 코딩 서열), SV40 폴리아데닐화 서열 (예를 들어, SEQ ID NO: 31의 SV40 폴리아데닐화 서열), 3' 상동성 팔부 (예를 들어, SEQ ID NO: 117의 3' 상동성 팔부), 및 3' ITR 엘리먼트 (예를 들어, SEQ ID NO: 19의 3' ITR)를 포함하는 전달 게놈을 포함하는 AAV 캡시드 단백질을 포함하는 복제-결함 AAV를 적용한다.
일정 구현예에서, 전술한 방법은 (a) SEQ ID NO: 16의 아미노산 203-736의 아미노산 서열, 및 SEQ ID NO: 25, 46-63, 113, 114, 116, 118, 119, 134-137, 145, 및 146 중 어느 하나에 기재된 뉴클레오티드 서열을 포함하는 교정 게놈을 포함하는 AAV 캡시드 단백질; (b) SEQ ID NO: 16의 아미노산 138-736의 아미노산 서열, 및 SEQ ID NO: 25, 46-63, 113, 114, 116, 118, 119, 134-137, 145, 및 146 중 어느 하나에 기재된 뉴클레오티드 서열을 포함하는 교정 게놈을 포함하는 AAV 캡시드 단백질; 및/또는 (c) SEQ ID NO: 16의 아미노산 서열, 및 SEQ ID NO: 25, 46-63, 113, 114, 116, 118, 119, 134-137, 145, 및 146 중 어느 하나에 기재된 뉴클레오티드 서열을 포함하는 교정 게놈을 포함하는 AAV 캡시드 단백질을 포함하는 복제-결함 AAV를 적용한다.
본 명세서에 개시된 AAV 조성물은 제한없이, 정맥내, 복강내, 피하, 근육내, 비내, 국소 또는 피내 경로를 포함한 임의의 적절한 경로를 통해 대상체에게 투여될 수 있다. 일정 구현예에서, 조성물은 정맥내 주사 또는 피하 주사를 통한 투여를 위해 제제화된다.
IV. AAV 패키징 시스템
다른 양상에서, 본 개시는 본 명세서에 개시된 복제-결함 AAV의 재조합 제조를 위한 패키징 시스템을 제공한다. 이러한 패키징 시스템은 일반적으로 하나 이상의 AAV Rep 단백질을 코딩하는 Rep 뉴클레오티드 서열; 본 명세서에 개시된 바와 같은 하나 이상의 AAV 분기군 F 캡시드 단백질을 코딩하는 Cap 뉴클레오티드 서열; 및 본 명세서에 개시된 바와 같은 PAH 유전자의 교정을 위한 교정 게놈 또는 PAH 유전자의 발현을 위한 전달 게놈을 포함하고, 여기서 패키징 시스템은 AAV를 형성하도록 캡시드에 교정 게놈의 밀봉을 위해 세포에서 작동된다.
일정 구현예에서, 패키징 시스템은 Rep 뉴클레오티드 서열 및 Cap 뉴클레오티드 서열을 포함하는 제1 벡터, 및 교정 게놈 또는 전달 게놈을 포함하는 제2 벡터를 포함한다. 본 명세서에서 기술된 바와 같은 패키징 시스템에서 사용되는 "벡터"는 세포로 핵산을 도입시키기 위한 비히클인 핵산 (예를 들어, 플라스미드, 바이러스, 코스미드, 인공 염색체 등)을 의미한다.
임의의 AAV Rep 단백질은 본 명세서에 기술된 바와 같은 패키징 시스템에 적용될 수 있다. 패키징 시스템의 일정 구현예에서, Rep 뉴클레오티드 서열은 AAV2 Rep 단백질을 코딩한다. 적합한 AAV2 Rep 단백질은 제한없이 Rep 78/68 또는 Rep 68/52를 포함한다. 패키징 시스템의 일정 구현예에서, AAV2 Rep 단백질을 코딩하는 뉴클레오티드 서열은 SEQ ID NO: 22의 AAV2 Rep 아미노산 서열과 최소 백분율의 서열 동일성을 갖는 단백질을 코딩하는 뉴클레오티드 서열을 포함하고, 최소 백분율의 서열 동일성은 AAV2 Rep 단백질의 아미노산 서열 길이에 걸쳐 적어도 70% (예를 들어, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 98%, 적어도 99%, 또는 100%)이다. 패키징 시스템의 일정 구현예에서, AAV2 Rep 단백질은 SEQ ID NO: 22에 기재된 아미노산 서열을 갖는다.
패키징 시스템의 일정 구현예에서, 패키징 시스템은 제3 벡터, 예를 들어 헬퍼 바이러스 벡터를 더 포함한다. 제3 벡터는 독립적인 제3 벡터일 수 있거나, 제1 벡터와 통합될 수 있거나, 또는 제2 벡터와 통합될 수 있다. 일정 구현예에서, 제3 벡터는 헬퍼 바이러스 단백질을 코딩하는 유전자를 포함한다.
패키징 시스템의 일정 구현예에서, 헬퍼 바이러스는 아데노바이러스, 헤르페스 바이러스 (헤르페스 심플렉스 바이러스 (HSV) 포함), 폭스 바이러스 (예컨대 백시니아 바이러스), 사이토메갈로바이러스 (CMV), 및 배큘로바이러스로 이루어진 군으로부터 선택된다. 패키징 시스템의 일정 구현예에서, 헬퍼 바이러스가 아데노바이러스인 경우에, 아데노바이러스 게놈은 E1, E2, E4 및 VA로 이루어진 군으로부터 선택되는 하나 이상의 아데노바이러스 RNA 유전자를 포함한다. 패키징 시스템의 일정 구현예에서, 헬퍼 바이러스가 HSV인 경우, HSV 게놈은 UL5/8/52, ICPO, ICP4, ICP22 및 UL30/UL42로 이루어진 군으로부터 선택되는 하나 이상의 HSV 유전자를 포함한다.
패키징 시스템의 일정 구현예에서, 제1, 제2, 및/또는 제3 벡터는 하나 이상의 형질감염 플라스미드 내에 함유된다. 일정 구현예에서, 제1 벡터 및 제3 벡터는 제1 형질감염 플라스미드 내에 함유된다. 일정 구현예에서, 제2 벡터 및 제3 벡터는 제2 형질감염 플라스미드 내에 함유된다.
패키징 시스템의 일정 구현예에서, 제1, 제2, 및/또는 제3 벡터는 하나 이상의 재조합 헬퍼 바이러스 내에 함유된다. 일정 구현예에서, 제1 벡터 및 제3 벡터는 재조합 헬퍼 바이러스 내에 함유된다. 일정 구현예에서, 제2 벡터 및 제3 벡터는 재조합 헬퍼 바이러스 내에 함유된다.
추가 양상에서, 본 개시는 본 명세서에 기술된 바와 같은 AAV의 재조합 제조를 위한 방법이 제공되고, 여기서 방법은 본 명세서에 기술된 바와 같이 AAV를 형성하도록 캡시드에 교정 게놈의 밀봉을 위해 작동되는 조건 하에서 기술된 바와 같은 패키징 시스템으로 세포를 형질감염 또는 형질도입시키는 단계를 포함한다. AAV의 재조합 제조를 위한 예시적인 방법은 일시적 형질감염 (예를 들어, 본 명세서에 기술된 바와 같은 제1, 제2, 및 임의로 제3 벡터를 함유하는 하나 이상의 형질감염 플라스미드 사용), 바이러스 감염 (예를 들어, 하나 이상의 재조합 헬퍼 바이러스, 예컨대 아데노바이러스, 폭스바이러스 (예컨대 백시니아 바이러스), 헤르페스 바이러스 (본 명세서에 기술된 바와 같은 제1, 및 제2, 및 임의로 제3 벡터를 함유하는, HSV, 사이토메갈로바이러스, 또는 배큘로바이러스 포함), 및 안정한 생산자 세포주 형질감염 또는 감염 (예를 들어, 본 명세서에 기술된 바와 같은 하나 이상의 AAV Rep 단백질을 코딩하는 Rep 뉴클레오티드 서열 및/또는 하나 이상의 AAV 분기군 F 캡시드 단백질을 코딩하는 Cap 뉴클레오티드 서열을 함유하는, 포유동물 또는 곤충 세포와 같은 안정한 생산자 세포, 및 형질감염 플라스미드 또는 재조합 헬퍼 바이러스의 형태로 전달되는 본 명세서에 기술된 바와 같은 교정 게놈 사용)을 포함한다.
V. 실시예
본 명세서에 개시된 재조합 AAV 벡터는 시험관내 및 생체내에서 고도의 효율적인 유전자 편집을 매개한다. 하기 실시예는 AAV 분기군 F 캡시드 (예를 들어, 그 전문이 참조로 본 명세서에 편입되되는, 미국 특허 제9,623,120호에 개시된, AAVHSC7, AAVHSC15 또는 AAVHSC17)에 패키징될 수 있는 교정 벡터를 제공하고, 소정 인간 질환, 예컨대 페닐케톤뇨증에서 돌연변이된 PAH 유전자의 발현의 효율적인 복원을 입증한다. 이들 실시예는 제한이 아닌 예시로 제공된다.
실시예 1: PAH 교정 벡터 pHMI-hPAH-hAC-008
a) PAH 교정 벡터 pHMI-hPAH-hAC-008
도 1A에 도시된 바와 같은, PAH 교정 벡터 pHMI-hPAH-hAC-008는 5'에서 3'으로, 하기 유전자 엘리먼트: 5' ITR 엘리먼트, 5' 상동성 팔부, 침묵적으로 변경된 인간 PAH 코딩 서열, SV40 폴리아데닐화 서열, 표적화된 통합 제한 카세트 ("TI RE"), 3' 상동성 팔부, 및 3' ITR 엘리먼트를 포함한다. 이들 엘리먼트의 서열은 표 1에 기재되어 있다. 5' 상동성 팔부는 인간 PAH 출발 코돈으로부터 상류에 야생형 게놈 서열 800개 뉴클레오티드를 포함하고, 따라서 일부 PKU 환자에서 관찰되는 바와 같은 PAH 발현에 영향을 미치는 출발 코돈 및/또는 5' 비번역 영역 (UTR) 내 돌연변이를 교정하는 능력을 갖는다. 3' 상동성 팔부는 출발 코돈으로부터 하류에 야생형 게놈 서열 800개 뉴클레오티드를 포함한다. 인간 게놈으로 PAH 교정 벡터 pHMI-hPAH-hAC-008의 통합은 침묵적으로 변경된 인간 PAH 코딩 서열, SV40 폴리아데닐화 서열, 및 표적화된 통합 제한 카세트를 PAH 출발 코돈 표적 유전자좌에 삽입 (즉, PAH 유전자의 뉴클레오티드 1-3을 치환)시켜서, PAH 유전자의 5' UTR, 코딩 서열, 또는 3' UTR 내 돌연변이로 인해 손상된 야생형 PAH 단백질의 발현을 복원시킨다.
Figure pct00001
b) PAH 교정 벡터 pHMI-hPAH-h1C-007
도 1B에 도시된 바와 같은, PAH 교정 벡터 pHMI-hPAH-h1C-007은 5'에서 3'으로, 하기 유전자 엘리먼트: 5' ITR 엘리먼트, 5' 상동성 팔부, 스플라이스 억셉터, 2A 엘리먼트, 침묵적으로 변경된 인간 PAH 코딩 서열, SV40 폴리아데닐화 서열, 표적화된 통합 제한 카세트 ("TI RE"), 3' 상동성 팔부, 및 3' ITR 엘리먼트를 포함한다. 이들 엘리먼트의 서열은 표 2에 기재되어 있다. 5' 상동성 팔부는 인트론 1에 위치하는, 인간 PAH의 뉴클레오티드 2128로부터 상류에 800개 뉴클레오티드의 야생형 게놈 서열을 포함한다. 3' 상동성 팔부는 인간 PAH의 뉴클레오티드 2127로부터 하류에 800개 뉴클레오티드의 야생형 게놈 서열을 포함한다. 인간 게놈으로 PAH 교정 벡터 pHMI-hPAH-h1C-007의 통합은 5'에서 3'으로 하기 엘리먼트: 내생성 PAH의 엑손 1, 이의 5' 스플라이스 도너로부터 뉴클레오티드 2127의 인트론 1의 일부분, 벡터 pHMI-hPAH-h1C-007의 스플라이스 억셉터, 2A 엘리먼트, 침묵적으로 변경된 인간 PAH 코딩 서열, 및 SV40 폴리아데닐화 서열을 포함하는 프리-mRNA로 PAH 유전자좌의 전사를 가능하게 한다. 이러한 프리-mRNA의 스플라이싱은 5'에서 3'으로, 하기 엘리먼트: 내생성 PAH의 엑손 1, 2A 엘리먼트 (PAH 엑손 1과 인 프레임), 침묵적으로 변경된 인간 PAH 코딩 서열 (2A 엘리먼트와 인 프레임), 및 SV40 폴리아데닐화 서열를 포함하는 mRNA를 생성시킨다. 2A 엘리먼트는 2종의 폴리펩티드의 생성을 야기시킨다: 2A 펩티드의 N-말단부와 융합된 엑손 1의 말단에서 종결된 절단된 PAH 펩티드, 및 전체 길이 PAH 폴리펩티드와 융합된 2A 펩티드로부터의 프롤린. 그러므로, 벡터 pHMI-hPAH-h1C-007의 통합은 PAH 유전자의 코딩 서열 또는 3' UTR 내 돌연변이로 인해 손상된 야생형 PAH 단백질의 발현을 복원시킬 수 있다.
Figure pct00002
상기 2종의 벡터에 채택된 침묵 변경은 발현 벡터 pCOH-WT-PAH, pCOH-CO-PAH, 및 pHMI-CO-PAH의 비교를 통해 입증된 바와 같이, PAH 단백질의 발현을 유의하게 개선시켰다. pCOH-WT-PAH 벡터는 SEQ ID NO: 24에 기재된 야생형 PAH 코딩 서열에 작동적으로 연결된 CBA 프로모터를 포함한다. pCOH-CO-PAH 및 pHMI-CO-PAH 벡터는 각각이 SEQ ID NO: 25에 기재된 바와 같은 침묵적으로 변경된 인간 PAH 코딩 서열에 작동적으로 연결된 CBA 프로모터를 포함한다. pCOH-CO-PAH 및 pHMI-CO-PAH 벡터는 매우 유사하였다. 각각의 벡터는 PAH가 천연적으로 결핍된 HEK 293 세포로 형질감염시켰다. 도 2에 도시된 바와 같이, VG-GT-CO-PAH ("CO-hPAH")는 VG-GT-PAH ("WT-hPAH")에 비해 특히 더 높은 인간 PAH의 발현 수준을 일으켰다.
실시예 2: PAH 교정 벡터 pHMIA-hPAH-hI1C-032.1 및 이의 변이체
효율적인 유전자 편집을 촉진시키는 상동성 팔부 서열을 동정하기 위해서, 130종 교정 벡터를 디자인하였고, 이들 중 70종을 인간 간세포 암종 세포에서 시험하였다. pHMIA-hPAH-hI1C-032.1 벡터가 시험관내에서 최고 편집 효율을 나타내었다. 이 실시예는 이러한 벡터의 구조 및 이의 변이체를 제공한다.
a) PAH 교정 벡터 pHMIA-hPAH-hI1C-032.1
도 1C에 도시된 바와 같은, PAH 교정 벡터 pHMIA-hPAH-hI1C-032.1은 5'에서 3'으로, 하기 유전자 엘리먼트: 5' ITR 엘리먼트, 5' 상동성 팔부, 스플라이스 억셉터, P2A 엘리먼트, 침묵적으로 변경된 인간 PAH 코딩 서열, SV40 폴리아데닐화 서열, 3' 상동성 팔부, 및 3' ITR 엘리먼트를 포함한다. 이들 엘리먼트의 서열은 표 3에 기재되어 있다. 5' 상동성 팔부는 인간 PAH의 뉴클레오티드 -686 내지 274의 야생형 게놈 서열을 포함하고, 이의 3' 말단은 인트론 1에 위치된다. 3' 상동성 팔부는 인간 PAH의 뉴클레오티드 415 내지 1325의 야생형 게놈 서열을 포함한다. 인간 게놈으로 PAH 교정 벡터 pHMIA-hPAH-hI1C-032.1의 통합은 5'에서 3'으로, 하기 엘리먼트: 내생성 PAH의 엑손 1, 이의 5' 스플라이스 도너로부터 뉴클레오티드 274의 인트론 1의 일부분, 벡터 pHMIA-hPAH-hI1C-032.1의 스플라이스 억셉터, P2A 엘리먼트, 침묵적으로 변경된 인간 PAH 코딩 서열, 및 SV40 폴리아데닐화 서열을 포함하는 프리-mRNA로 PAH 유전자좌의 전사를 가능하게 한다. 이러한 프리-mRNA의 스플라이싱은 5'에서 3'으로, 하기 엘리먼트: 내생성 PAH의 엑손 1, P2A 엘리먼트 (PAH 엑손 1과 인 프레임), 침묵적으로 변경된 인간 PAH 코딩 서열 (P2A 엘리먼트와 인 프레임), 및 SV40 폴리아데닐화 서열을 포함하는 mRNA를 생성시킨다. P2A 엘리먼트는 2종 폴리펩티드의 생성을 야기시킨다: P2A 펩티드의 N-말단부와 융합된 엑손 1의 말단에서 종결된 절단된 PAH 펩티드, 및 전체 길이 PAH 폴리펩티드와 융합된 P2A 펩티드로부터의 프롤린. 그러므로, 벡터 pHMIA-hPAH-hI1C-032.1의 통합은 PAH 유전자의 코딩 서열 또는 3' UTR 내 돌연변이로 인해 손상된 야생형 PAH 단백질의 발현을 복원시킬 수 있다.
Figure pct00003
b) PAH 교정 벡터 pHMIA-hPAH-hI1C-032.1의 변이체
pHMIA-hPAH-hI1C-032.1 벡터의 8종 변이체는 PAH 유전자 좌위의 발현을 개선시키도록 디자인되었다. pHMIA-hPAH-hI1C-032.2 내지 pHMIA-hPAH-hI1C-032.9로 명명된 이들 변이체는 오직 5' 상동성 팔부만이 pHMIA-hPAH-hI1C-032.1과 상이하다. 상이한 엘리먼트의 서열은 표 4에 기재되어 있다.
Figure pct00004
pHMIA-hPAH-hI1C-032.2 벡터는 전사물로 개선된 리보솜 동원을 위한 코작 (Kozak) 서열을 최적화시키도록 디자인되었다. PAH 유전자의 각각 위치 -2, 4, 6, 7, 및 9에 뉴클레오티드 C, G, G, G, 및 G를 갖는 것이 pHMIA-hPAH-hI1C-032.1과 상이하다.
pHMIA-hPAH-hI1C-032.3 벡터는 발현을 억제할 수 있는 PAH 유전자의 5' UTR 내 단일 사중체를 제거하도록 디자인되었다. PAH 유전자의 각각 위치 -467 및 -465에 뉴클레오티드 A 및 A를 갖는 것이 pHMIA-hPAH-hI1C-032.1과 상이하다.
pHMIA-hPAH-hI1C-032.4 벡터는 발현을 증가시키기 위해 사이클릭 AMP 반응 엘리먼트를 최적화시키도록 디자인되었다. PAH 유전자의 위치 -181에 뉴클레오티드 A를 갖는 것이 pHMIA-hPAH-hI1C-032.1과 상이하다.
pHMIA-hPAH-hI1C-032.5 벡터는 발현을 증가시키기 위해 2종의 사이클릭 AMP 반응 엘리먼트를 최적화시키기 위해 디자인되었다. PAH 유전자의 각각 위치 -214, -212, -211, 및 -181에 뉴클레오티드 G, C, A, 및 A를 갖는 것이 pHMIA-hPAH-hI1C-032.1과 상이하다.
pHMIA-hPAH-hI1C-032.6 벡터는 인간에서 변경된 PAH 발현과 상관있는, SNP rs1522295의 소수 대립유전자를 도입시키기 위해 디자인되었다. PAH 유전자의 위치 194에 뉴클레오티드 G를 갖는 것이 pHMIA-hPAH-hI1C-032.1과 상이하다.
pHMIA-hPAH-hI1C-032.7 벡터는 발현을 증가시키도록 5' UTR 내 글루코코르티코이드 결합 부위를 최적화시키기 위해 디자인되었다. PAH 유전자의 각각 위치 -433 및 -432에 뉴클레오티드 C 및 C를 갖는 것이 pHMIA-hPAH-hI1C-032.1과 상이하다.
pHMIA-hPAH-hI1C-032.8 벡터는 개선된 발현을 위해 2개 글루코코르티코이드 결합 부위 및 단일 AP2 결합 부위를 변형시키기 위해 디자인되었다. PAH 유전자의 각각 위치 -433 및 -432에 뉴클레오티드 C 및 C를 갖고, PAH 유전자의 위치 -394 내지 -388에 뉴클레오티드 서열 ACGCTGTTCTTCGCC (SEQ ID NO: 68)을 갖는 것이 pHMIA-hPAH-hI1C-032.1과 상이하다.
pHMIA-hPAH-hI1C-032.9 벡터는 발현을 억제할 수 있는 5' UTR 내 3개의 G-사중체를 파괴하기 위해 디자인되었다. PAH 유전자의 뉴클레오티드 위치 -467, -465, -341, -339, -225, -211, 및 -203의 각각에 뉴클레오티드 A를 갖는 것이 pHMIA-hPAH-hI1C-032.1과 상이하다.
실시예 3: 시험관내 인간 PAH 유전자 편집
이 실시예는 이전 실시예에 기술된 것들과 같은, PAH 교정 벡터를 조사하기 위한 시험관내 방법을 제공한다.
PAH 교정 벡터 pHMI-hPAH-hA-002, PAH 코딩 서열이 야생형 (즉, 침묵적으로 변경되지 않음)인 pHMI-hPAH-hAC-008의 변이체, 및 PAH 교정 벡터 pHMI-hPAH-h1-001, PAH 코딩 서열이 야생형 (즉, 침묵적으로 변경되지 않음)인 pHMI-hPAH-h1C-007의 변이체가 표적화된 통합의 평가를 위해 조사되었다. K562 세포를 150,000의 MOI로 AAVHSC17에 패키징된 pHMI-hPAH-hA-002 벡터로 형질도입시켰다. 세포의 게놈 DNA는 48시간 후에 수집하였다. 각각 상동성 팔부의 바깥쪽에 위치하는, 서열 ccaaatcccaccagctcact (SEQ ID NO: 89) 및 tcccatgaaactgaggtgtga (SEQ ID NO: 90)을 갖는 단일 바이오틴화 프라이머가 선형 증폭을 통해 DNA 샘플을 증폭시키는데 개별적으로 사용되었다. 편집 및 미편집된 대립유전자 모두가 편중되지 않고 증폭되었다. 증폭된 DNA 샘플을 풀링하였고 스트렙타비딘 풀다운으로 농축하였다. pHMI-hPAH-hA-002 통합이 존재하는 대립유전자의 개수는 PAH_게놈 세트 1 프라이머/프로브 세트를 사용한 ddPCR을 통해 측정하였다.
도 3A, 좌측 패널 ("LAM-농축")에 도시된 바와 같이, pHMI-hPAH-hA-002 벡터 ("R1 ATG")가 형질도입된 세포 유래 샘플에서 바람직한 통합이 검출되었지만, pHMI-hPAH-h1-001 벡터 ("R1 인트론")가 형질도입된 세포 또는 비형질도입 세포 ("R1 WT") 유래 샘플에서는 검출되지 않았다. 도 3A의 우측 패널 ("앰플리콘")에서, 벡터 통합량은 SV40_FAM 세트 1 프라이머/프로브 세트를 사용한 ddPCR을 통해 측정되었다. 양성 신호는 pHMI-hPAH-hA-002 벡터 ("T001 Frag")가 형질도입된 세포와 pHMI-hPAH-h1-001 벡터 ("T002 Frag")가 형질도입된 세포 둘 모두로부터의 샘플에서 검출되어, 이들 세포가 벡터 통합을 겪었다는 것을 의미하였다.
표적화된 통합을 정량하기 위해서, 표 6에 표시된 바와 같은, 3개의 프라이머 및 프로브 세트가 ddPCR에 의한 통합의 검출을 위해 디자인되었다. PAH_게놈 세트 1은 pHMI-hPAH-hA-002의 표적화된 통합 이후에 미편집된 게놈 및 편집된 게놈을 검출하였다. SV40_FAM 세트 1은 편집된 게놈 및 비통합된 벡터에 존재한 SV40 폴리아데닐화 서열 내 서열을 검출하였다. PAH_HA 세트 1은 편집 및 미편집된 게놈 둘 모두를 비롯하여, 비통합된 벡터에 존재한 상동성 팔부 내 영역을 검출하였다.
DNA 샘플은 유적으로 분할하였다. DNA의 농도는 하나의 유적이 무작위적으로 2종 DNA 분자 (예를 들어, 벡터 입자 및 게놈 DNA 입자)를 가질 확률을 유의하게 감소시키기 위해서 20 ㎕ 당 600 pg의 농도로 최적화시켰다 (p<0.001). PAH_게놈 세트 1을 통해 확인된 DNA의 수량 (수량_게놈)은 미편집 및 편집 게놈의 총량을 나타냈다. SV40_FAM 세트 1로 확인된 DNA의 수량 (수량_페이로드)은 편집된 게놈 및 비통합된 벡터의 총량을 나타냈다. PAH_HA 세트 1로 확인된 DNA의 수량 (수량_HA)은 미편집된 게놈, 편집된 게놈, 및 비통합된 벡터의 총량을 나타냈다. 따라서, 편집된 게놈의 수량은 하기 식: 수량_게놈 + 수량_페이로드 - 수량_HA을 통해 계산할 수 있다. 올바른 통합을 갖는 게놈의 분율은 편집된 게놈의 수량을 수량_게놈으로 나누어서 계산할 수 있다.
Figure pct00005
도 3B에 도시된 바와 같이, 상기 프라이머/프로브 세트로 측정된, pHMI-hPAH-hA-002 벡터의 올바른 통합을 갖는 게놈의 비율은 17.86%였다. pHMI-hPAH-hA-002 벡터가 형질도입되지 않은 대조군 세포에서 통합이 검출되지 않았다.
실시예 4: 마우스 간에서 생체내 PAH 유전자 편집
이 실시예는 마우스 PAH 유전자를 편집할 수 있는 PAH 교정 벡터를 조사하고, 마우스 간에서 그들의 편집 효율을 결정하기 위한 동물 모델을 제공한다.
a) 야생형 마우스에서 마우스 PAH 유전자의 편집
특정 예에서, 본 명세서는 pHMI-hPAH-mAC-006 벡터를 사용한 마우스 게놈의 생체내 편집을 제공한다. pHMI-hPAH-mAC-006 벡터는 pHMI-hPAH-hAC-008 벡터와 유사하지만, 인간 PAH 유전자보다는 마우스 PAH 유전자를 편집할 수 있었다 (도 4A). 특히, pHMI-hPAH-mAC-006은 5'에서 3'으로 하기 유전자 엘리먼트: 5' ITR 엘리먼트, 5' 상동성 팔부, 침묵적으로 변경된 인간 PAH 코딩 서열, SV40 폴리아데닐화 서열, 표적화된 통합 제한 카세트 ("TI RE"), 3' 상동성 팔부, 및 3' ITR 엘리먼트를 포함하였다. 이들 엘리먼트의 서열은 표 6에 기재되어 있다. 5' 상동성 팔부는 마우스 PAH 출발 코돈을 포함하고, 그로부터 상류에 야생형 게놈 서열을 포함하였고, 따라서 마우스 PAH 유전자의 출발 코돈 및/또는 5' 비번역 영역 (UTR) 내 돌연변이를 교정하는 능력을 가졌다. 3' 상동성 팔부는 마우스 PAH의 출발 코돈으로부터 하류에 야생형 게놈 서열을 포함하였다. 마우스 게놈으로 PAH 교정 벡터 pHMI-hPAH-mAC-006의 통합은 침묵적으로 변경된 인간 PAH 코딩 서열, SV40 폴리아데닐화 서열, 및 표적화된 통합 제한 카세트를 마우스 PAH 유전자의 출발 코돈에서 삽입 (즉, 마우스 PAH 유전자의 뉴클레오티드 1-3을 치환)시킬 수 있어서, 마우스 세포에서 야생형 인간 PAH 단백질을 발현시킬 수 있었다. 벡터 단독은 프로모터 서열을 포함하지 않았고, 게놈 통합없이 독립적인 PAH 발현을 구동시킬 수 없었다.
Figure pct00006
pHMI-hPAH-mAC-006 벡터를 AAVHSC17 캡시드에 패키징시켰고 2마리 야생형 신생 마우스에게 꼬리 정맥을 통해서 정맥내로 체중 kg 당 2x1013 벡터 게놈의 용량으로 주사되었다. 2마리 대조군 마우스는 꼬리 정맥을 통해서 염수 주사를 받았다. 간 샘플은 2주 이후에 수집하였다.
PCR 방법은 마우스 게놈으로 pHMI-hPAH-mAC-006 벡터의 통합을 검출하기 위해 개발되었다. 도 4B에 도시된 바와 같이, 제1 프라이머 쌍 (SEQ ID NO: 62 및 63)은 미편집된 대립유전자로부터 867 bp DNA를 증폭시키기 위해 디자인되었고 ("대조군 PCR"); 제2 프라이머 쌍 (SEQ ID NO: 64 및 65)은 편집된 대립유전자로부터 2459 bp DNA를 특이적으로 증폭시키기 위해 디자인되었다 ("편집된 대립유전자 PCR"). 도 4C에 도시된 바와 같이, 염수 처리 마우스 유래 간 샘플 및 3T3 마우스 섬유아세포의 세포 샘플은 편집된 대립유전자에 해당되는 PCR 산물을 생성시키지 않았는데 반해서, pHMI-hPAH-mAC-006 벡터가 주사된 2마리 마우스 유래 간 샘플은 편집된 대립유전자에 해당하는 PCR 산물을 생성시켰다. 모든 4종 샘플은 미편집된 대립유전자에 해당하는 PCR 산물의 유사한 수준을 생성시켜서, 샘플들이 품질이 비슷하였다는 것을 시사한다.
ddPCR 방법은 마우스 게놈으로 pHMI-hPAH-mAC-006 벡터의 통합을 정량하기 위해 개발되었다. 표 7에 표시된 바와 같이, 프라이머 및 프로브의 2개 세트는 ddPCR을 통한 통합의 검출을 위해 디자인되었다. mPAH_ATG_gDNA_FAM 세트 1은 pHMI-hPAH-mAC-006의 표적화된 통합 이후에 미편집된 게놈 및 편집된 게놈을 검출하였다. SV40_FAM 세트 1은 편집된 게놈 및 비통합된 벡터에 존재한, SV40 폴리아데닐화 서열 내 서열을 검출하였다 (도 5A).
DNA 샘플은 유적으로 분할하였다. DNA의 농도는 하나의 유적이 무작위적으로 벡터 입자 및 게놈 DNA 입자를 함유할 확률을 유의하게 감소시키기 위해서 20 ㎕ 당 600 pg로 최적화시켰다 (p<0.001) (도 5C 및 5D). 게놈으로 벡터의 통합 시에, 동일 유적 내 벡터 프로브 및 유전자좌 프로브의 이중 양성 비율이 증가된다 (도 5B). 도 5E에 도시된 바와 같이, 2마리 대조군 마우스는 각각 간에서 0% 및 0.0395%의 편집된 대립유전자를 가졌고, pHMI-hPAH-mAC-006 벡터가 처리된 2마리 마우스는 각각 간에서 2.504% 및 2.783%의 편집된 대립유전자를 가졌다. 따라서, 소정 조건 하에서 간에서 pHMI-hPAH-mAC-006 벡터의 전체 통합 효율은 약 2.6%였다. 각각의 개별 세포에 대한 통합 효율은 벡터가 모든 세포에 형질도입되지 않았기 때문에, 더 높을 것으로 예상된다.
Figure pct00007
편집된 대립유전자로부터 발현되는 mRNA의 상대적 수량은 ddPCR을 통해 결정하였다. SV40_FAM 세트 1은 편집된 대립유전자로부터 인간 PAH를 특이적으로 검출하는데 사용되었다. 각각의 PAH 발현 수준은 내생성 Hprt의 발현 수준에 대해 정규화되었다. 도 6에 도시된 바와 같이, 대조군 마우스는 인간 PAH의 발현을 보이지 않아서, 프라이머 및 프로브가 내생성 마우스 PAH와 교차 반응하지 않았다는 것을 시사한다. 야생형 수준에 대한 PAH 발현율은 Hprt에 대한 내생성 마우스 PAH 신호에 대해 정규화된 Hprt 대비 인간 PAH 신호를 기반으로 계산하였다. pHMI-hPAH-mAC-006 벡터로 처리된 2마리 마우스는 내생성 마우스 PAH 수준 대비 각각 5.378% 및 4.846% mRNA 수준을 가졌다. 따라서, 소정 조건 하에서 간에서 pHMI-hPAH-mAC-006 벡터의 전체 mRNA 수준은 약 5% 였다. 각각의 개별 세포에 대한 mRNA 수준은 벡터가 모든 세포에 형질도입되지 않았기 때문에, 더 높을 것으로 예상된다.
b) pah 녹아웃 마우스에서 마우스 PAH 유전자의 편집
한 실험에서, 표현형 교정에서 pHMI-hPAH-mAC-006 벡터의 효율은 PAH 녹아웃 마우스 모델 (PAH ENU2)을 사용해 결정하였다. 간략하게, AAVHSC15 캡시드에 패키징된 hPAH-mAC-006 벡터는 정맥내로, 5연속일간, 이들 마우스에게 체중 킬로그램 당 1.16 Х 1014 벡터 게놈의 용량으로 투여되었다. 혈청 페닐알라닌 (Phe)은 질량 분광법을 통해서 5개월 동안 매주 측정하였다. 5개월 이후에, DNA는 간 샘플로부터 추출되었고, 세포 당 벡터 게놈의 개수는 벡터 및 인간 PAH 게놈 유전자좌 카피수를 측정하기 위해서 프라이머 및 프로브 세트를 사용한 ddPCR을 통해 분석하였다.
형질도입 효율 (세포 당 벡터 게놈의 개수 ("세포 당 VG")로 측정됨)은 벡터, 및 마우스 및 인간 PAH 게놈 유전자좌 카피수를 측정하기 위해 프라이머 및 프로브 세트를 사용한 ddPCR을 통해 결정하였다. 편집 빈도는 마우스 PAH 유전자좌 및 인간 PAH 유전자좌에 통합된 AAV 벡터 ("페이로드")로부터의 편집 엘리먼트 DNA의 빈도를 측정하기 위해 프라이머 프로브 세트를 사용한 다중화 ddPCR을 통해 측정하였다. 간략하게, 단일 DNA 가닥을 유적으로 분할하였다. 각각의 유적은 페이로드의 존재 또는 부재와 함께 인간 또는 마우스 PAH DNA의 존재에 대해 시험하였다. 편집 빈도는 개별 핵산 분자에서 표적 DNA 및 페이로드의 동시-분할의 예상 확률을 초과하는 단일 유적 내 표적 DNA 및 페이로드의 검출된 동시-분할을 기반으로 계산하였다.
PAH 녹아웃 마우스는 혈액 중 증가된 페닐알라닌 (Phe) 수준의 표현형을 가졌다. 표현형 변화를 조사하기 위해서, AAV 벡터의 투여 이후에 Phe의 혈청 수준을 측정하였고, 그 수준 비율은 0 시간에서의 기준치에 대해 계산하였고, 수준 백분율을 AAV 벡터를 받지 않은 대조군 마우스와 비교하였다.
AAVHSC15 캡시드에 패키징된 hPAH-mAC-006 벡터가 투여된 마우스는 세포 당 약 8 내지 18 벡터 게놈의 형질도입 효율 (도 7A), 및 대립유전자의 개수 대비 약 4.4%의 평균 편집 효율 (도 7B)을 보였다. 이러한 편집 효율은 적어도 5개월 동안 약 50% 까지 마우스의 혈청에서 Phe 수준을 감소시키기에 충분한 PAH의 발현 수준을 뒷받침하였고 (도 7C 및 7D), 표현형 변화는 편집 효율과 상관있었다 (도 7E). Pah 유전자좌에서 벡터의 올바른 상동성 재조합은 페이로드와 하이브리드화된 제1 프라이머, 및 우측 상동성 팔부로부터 하류의 게놈 서열과 하이브리드화된 제2 프라이머를 사용하여 편집된 게놈 유전자좌로부터 증폭된 PCR 산물의 길이를 통해 검증되었다 (데이터 미도시).
상동성 재조합이 편집된 대립유전자에 임의의 게놈 변경을 도입시켰는지 여부를 결정하기 위해서, 상동성 팔부에 해당하는 게놈 영역 내 DNA 서열은 심층 시퀀싱 (Illumina)을 통해 더 분석하였다. 샘플은 모두 고품질 서열 판독치를 가졌고, 모든 위치는 20,000 판독치 이상의 심도로 시퀀싱되었다. 삽입 및 결실 (이하 "indel")은 indel 품질 필터 및 가닥 편향 필터가 구비된 Somatic Variant Callers를 통해서 확인하였다. 특히, 10개 연속 G를 포함하는 우측 상동성 팔부 내 영역은 대조군 및 처리 동물 둘 모두에서 약 0.02-0.05%의 상승된 indel 비율을 보였다. 이러한 유전자좌를 비롯하여, 몇몇 다른 유전자좌에서 Indel은 진짜 변화에 대한 필터를 통과하지 않았고, 추가 분석을 위해 제거되었다. 표 8에 표시된 바와 같이, 미처리된 대조군 동물은 0.002-0.006%의 indel 비율을 보였다. 처리 동물 1은 0.031%의 Indel 비율을 가졌고; 처리 동물 2는 필터를 통과한 indel을 갖지 않았으며; 처리 동물 3은 대조군 동물과 유사한 indel 비율을 가졌다. 모든 확인된 indel은 비번역 영역에 존재하였다.
Figure pct00008
상기 결과는 게놈에 PAH 코딩 서열을 삽입하는 교정 벡터를 사용하여 PAH 결핍 표현형을 반전시키는 실현가능성을 입증하였다.
생체내 형질도입 후 개별 마우스 간세포에서 인간 PAH의 발현을 검출하기 위해서, RNA 인 시츄 하이브리드화 (ISH)는 상기 기술된 바와 같이 침묵 코돈 변경을 갖는 인간 PAH RNA의 >1kb에 특이적인 프로브를 사용하여 간 조직 절편 상에서 수행하였다 (Advanced Cell Diagnostics, Inc., Hayward, CA). 도 7F에 도시된 바와 같이, 이러한 프로브는 인간 PAH RNA 및 hPAH-mAC-006 벡터가 형질도입된 마우스 간세포 내 PAH 서열을 포함하는 가능한 바이러스 DNA를 검출하였지만, 내생성 마우스 Pah RNA와 교차 하이브리드화하지 않았다. 동일한 침묵 코돈 변경을 갖는 인간 Pah RNA의 발현을 구동시키는 CMV 프로모터를 포함하는 이식유전자 구성체가 형질도입된 마우스의 간 샘플이 양성 대조군으로서 사용되었다.
c) PAH 교정 벡터 pHMI-hPAH-mAC-006
pHMI-hPAH-mAC-006 벡터는 5'에서 3'으로 하기 유전자 엘리먼트: 5' ITR 엘리먼트, 5' 상동성 팔부, 침묵적으로 변경된 인간 PAH 코딩 서열, SV40 폴리아데닐화 서열, 3' 상동성 팔부, 및 3' ITR 엘리먼트를 포함하였다. 이들 엘리먼트의 서열은 표 9에 기재되어 있다.
Figure pct00009
d) pHMI-hPAH-mAC-006이 투여된 마우스에서 PAH 유전자 편집 효율
도 9A는 pHMI-hPAH-mAC-006 벡터를 받은 마우스에서 PAH 유전자의 편집 효율을 결정하기 위해 사용된 어세이의 개략도를 도시한다. ddPCR 및 LAM-NGS (LAM-PCR 이후 차세대 시퀀싱 (NGS))는 본 명세서에 기술되고 도 9A에 표시된 바와 같이 수행되었다. 도 9B는 pHMI-hPAH-mAC-006 벡터 또는 비히클 대조군이 투여된 마우스의 세포에서 결정된 PAH 유전자 편집 효율의 그래프를 도시한다. 도 9B에 도시된 바와 같이, HMI-hPAH-mAC-006 벡터가 투여된 마우스에서 PAH 유전자 편집 효율은 대립유전자의 개수 대비 약 8%인 것으로 결정되었다. 편집된 영역에서 오류는 검출되지 않았다.
e) 마우스 모델에서 고페닐알라닌혈증의 지속적인 표현형 교정
한 실험에서, 표현형 교정에서 pHMI-hPAH-mAC-006 벡터의 효능은 PAH 녹아웃 마우스 모델 (PAH ENU2)을 사용해 결정되었다. pHMI-hPAH-mAC-006 벡터는 AAVHSC15 캡시드에 패키징되었고 정맥내로 마우스에게 체중 kg 당 1 Х 1014 벡터 게놈의 용량으로 투여되었다. 표현형 변화를 조사하기 위해서, AAVHSC15 캡시드에 패키징된 pHMI-hPAH-mAC-006 벡터의 투여 이후 페닐알라닌 (Phe) 및 티로신 (Tyr)의 혈청 수준은 7주간 매주 측정되었고, 수준 백분율은 0시의 기준치에 대해 계산되었으며, 수준 백분율은 비히클 대조군을 받은 대조군 마우스와 비교하였다. 총 4마리의 마우스는 AAVHSC15 캡시드에 패키징된 pHMI-hPAH-mAC-006 벡터가 투여되었고, 2마리 마우스는 비히클 대조군이 투여되었다. 도 10에 도시된 바와 같이, Phe의 혈청 수준의 유의한 감소 (도 10A; *는 비히클 대비 2원 ANOVA로 반복 측정하여 p<0.0001; 시간 대비 2원 ANOVA로 반복 측정하여 p<0.0001을 의미) 및 Tyr의 혈청 수준의 유의한 증가 (도 10B; *는 비히클 대비 2원 ANOVA로 반복 측정하여 p<0.05; 시간 대비 2원 ANOVA로 반복 측정하여 p<0.0003을 의미)가 벡터를 받은 마우스에서 관찰되었다. 도 10C는 벡터 또는 비히클 대조군을 받은 마우스에서 혈청 Phe 및 혈청 Tyr 간 비율을 도시한다 (*는 비히클 대비 2원 ANOVA로 반복 측정하여 p< 0.002; 시간 대비 2원 ANOVA로 반복 측정하여 p<0.0004를 의미).
도 11A는 pHMI-hPAH-mAC-006 벡터 또는 비히클 대조군이 투여된 마우스로부터 수득된 세포의 PAH 유전자 편집 효율 및 형질도입 효율을 보여주는 그래프를 도시한다. 도 11A의 좌측 y-축은 편집 효율의 백분율을 의미하고 pHMI-hPAH-mAC-006 벡터 (AAVHSC15-mPAH)가 투여된 마우스가 대립유전자의 개수에 대해 약 5% 편집 효율을 가졌다는 것을 보여준다. 도 11A의 우측 y-축은 세포 당 벡터 게놈의 개수를 의미하고 pHMI-hPAH-mAC-006 벡터 (AAVHSC15-mPAH)가 투여된 마우스가 세포 당 약 140 벡터 게놈의 형질도입 효율을 가졌다는 것을 보여준다.
도 11B는 pHMI-hPAH-mAC-006 벡터 (AAVHSC15-mPAH) 또는 비히클 대조군이 투여된 마우스로부터 수득된 세포의, 마우스 GAPDH의 발현 수준에 대해 정규화된, 발현된 PAH mRNA의 상대량을 보여주는 그래프를 도시한다. 도시된 바와 같이, pHMI-hPAH-mAC-006 벡터 (AAVHSC15-mPAH)가 투여된 마우스로부터 수득된 세포는 비히클 대조군이 투여된 마우스와 비교하여 인간 PAH mRNA의 유의한 수준을 가졌다 (*는 비히클 대비 양측 만 위트니 (Mann Whitney) 검정에 의한 p<0.005를 의미).
실시예 5: 마우스 모델에서 인간 PAH 유전자의 생체내 편집
이 실시예는 마우스 모델에서 인간 PAH 유전자의 편집에 있어서, 이전 실시예에 기술된 것과 같은, PAH 교정 벡터를 조사하기 위한 동물 모델을 제공한다.
a) 마우스 모델에서 인간 혈액 세포 중 인간 PAH의 편집
간략하게, NOD.Cg-Prkdc scid Il2rg tm1Wjl/SzJ (NSG) 마우스를 준치사량 조사를 통해 골수둔감화 (myeloblated)시켰고 인간 CD34+ 조혈 줄기 세포를 이식하였다. 생착 수준은 유세포측정을 통해 말초 혈액 중 인간 및 마우스 CD45+ 세포의 양을 확인하여 12주 이후부터 결정하였고, 50% 초과로 순환성 인간 CD45+ 세포를 갖는 마우스를 선택하였다. AAVHSC17 캡시드로 패키징된 hPAH-hAC-008 벡터는 4개 그룹으로 균등하게 분배된 12마리의 이러한 마우스에게 정맥내로 투여되었다. 제1 및 제2 마우스 그룹은 체중 킬로그램 당 1.54 Х 1013 벡터 게놈의 용량을 받았고, 제3 및 제4 마우스 그룹은 체중 킬로그램 당 2.1 Х 1012 벡터 게놈의 용량을 받았다. 마우스는 주사 후 6주차에 안락사되었다. 혈액, 골수 및 비장 조직의 샘플을 수집하였고, 게놈 DNA를 추출하였다.
마우스 및 인간 세포에서 편집 빈도는 마우스 PAH 유전자좌 및 인간 PAH 유전자좌에 통합된 AAV 벡터 ("페이로드")로부터 통합된 DNA의 빈도를 측정하기 위한 프라이머 프로브 세트를 사용해 다중화 액적 디지털 PCR (ddPCR)을 통해 측정하였다. 간략하게, 단일 DNA 가닥을 유적에 분할하였다. 각각의 유적은 페이로드의 존재 또는 부재와 함께 인간 또는 마우스 PAH DNA의 존재에 대해 시험되었다. 편집 빈도는 개별 핵산 분자에서 표적 DNA 및 페이로드의 동시-분할의 예상 확률을 초과하는 단일 유적 내 표적 DNA 및 페이로드의 검출된 동시-분할을 기반으로 계산하였다.
표 10에 표시된 바와 같이, 인간 세포의 편집은 용량 의존적인 방식으로 골수 샘플에서 검출되었다. 특히, 마우스 세포에서 편집이 검출되지 않았으므로, 편집은 인간 게놈에 특이적이었다.
Figure pct00010
도 8A는 AAVHSC15 캡시드에 패키징된 벡터가 투여된 마우스에서 인간 및 마우스 간세포에서의 hPAH-hAC-008 벡터 및 hPAH-hAC-008-HBB 벡터의 형질도입 효율을 도시한다.
b) HBB 인트론을 포함하는 벡터를 사용한 마우스 모델에서 인간 간세포 중 인간 PAH의 편집
hPAH-hAC-008 벡터는 임의의 인트론없이 완전한 인간 PAH 코딩 서열을 포함한다. 인간 HBB 유전자의 제1 인트론 (SEQ ID NO: 28의 뉴클레오티드 서열을 가짐)이 인간 PAH 코딩 서열의 뉴클레오티드 912 및 913 사이에 첨가된 것인, 변형된 벡터 hPAH-hAC-008-HBB는 벡터로부터 전사되는 RNA 분자의 핵 이출 및 안정성을 개선시키기 위해 생성되었다. 뉴클레오티드 912 및 913 사이의 뉴클레오티드간 결합은 코돈의 침묵 변경을 통해 파괴되지 않은, 천연 PAH 유전자의 엑손 8 및 엑손 9 사이의 스플라이싱 부위에 해당된다.
벡터는 AAVHSC15 캡시드로 패키징되었고, 마우스에게 정맥내로 체중 킬로그램 당 1 Х 1013 벡터 게놈의 용량으로 투여되었다. 투여 후 6주차에, 간 샘플을 수집하였고, 침묵적으로 변경된 인간 PAH mRNA 및 가능하게 PAH 서열을 포함하는 바이러스 DNA의 국재화를 인시츄 하이브리드화를 통해 조사하였다. 도 8B에 도시된 바와 같이, HBB 인트론의 첨가는 mRNA의 핵 이출을 실질적으로 개선시켰다. 이러한 결과는 PAH 코딩 서열 내 인트론의 첨가가 잠재적으로 PAH 유전자의 발현 수준을 증가시킬 수 있고, 이러한 특징이 PAH 교정 벡터의 디자인에 포함될 수 있다는 것을 입증하였다.
c) 마우스 모델에서 인간 간세포의 인간 PAH의 편집
간략하게, 통상 ERG® 녹아웃 마우스라고 하는, C57Bl/6 배경의 Fah -/- Rag2 -/- Il2rg -/- 마우스가 간 인간화용 모델로서 사용되었다. 이 마우스는 면역결핍이고 티로신 이화작용 효소 푸마릴아세토아세테이트 히드롤라제 (Fah)가 결여되었다. 마우스 간세포의 절제는 보호 약물 2-(2-니트로-4-트리플루오로메틸벤조일)-1,3-시클로헥산디온 (NTBC)의 투여 중지를 통해 유도시켰다. 마우스는 인간 간세포가 접목되었고, 우로키나제-발현 아데노바이러스가 인간 간세포의 재증식을 증강시키기 위해 투여되었다. 생착은 CuRx™ 니티시논 (20-0026) 및 SMX/TMP 항생제 (20-0037)의 예방적 처치의 적절한 용법과 함께 동물 일생 동안 지속되었다. 동물들은 체중이 평균 22 그램이었고, 통상 수명은 18개월 내지 24개월이었다.
hPAH-hAC-008 또는 hPAH-hAC-008-HBB 벡터는 AAVHSC15 캡시드에 패키징되었고, 마우스에게 정맥내로 체중 킬로그램 당 1 Х 1013 벡터 게놈의 용량으로 투여되었다. 투여 후 6주차에, 간 샘플을 수집하였고, 인간 및 마우스 간세포를 분리하였으며 간 관류 이후에 Miltenyi autoMACS 컬럼을 사용해 정제하였다. DNA를 추출하였고, 유전자 편집 효율은 상기 기술된 바와 동일한 ddPCR 방법을 사용해 측정하였다.
도 8C에 도시된 바와 같이, 모든 대립유전자 중에서 편집된 대립유전자의 백분율로서 측정된, 인간 간세포에서 편집 효율의 백분율은 hPAH-hAC-008 벡터가 처리된 동물에서 2.2%였고, hPAH-hAC-008-HBB 벡터가 처리된 동물에서 4.3%였다. 편집은 양쪽 동물 유래 마우스 간세포에서 검출되지 않았다. 양쪽 동물로부터의 마우스 간세포에서 편집 검출의 결여는 마우스 간세포도 역시 형질도입되었으므로 형질도입 효율의 결여에 의한 것은 아닌 듯하다 (도 8A). 개별 실험에서, hPAH-hAC-008 벡터에 의한 인간 게놈의 편집은 인간 게놈의 대립유전자의 개수 대비 2.131%의 비율로 검출되었는데 반해, 간 샘플에서 마우스 게놈의 편집은 마우스 게놈의 대립유전자 개수 대비 0.05% 비율로 검출되었다. 이들 결과는 hPAH-hAC-008 벡터 또는 이의 변형된 형태에 의한 PAH 유전자의 인간-특이적 편집을 보여주었고, 간세포에서 편집 효율을 조사하기 위한 생체내 모델을 제공하였다.
d) 마우스 모델에서 인간 간세포 중 인간 PAH의 편집
한 실험에서, 통상 FRG® 녹아웃 마우스 (본 명세서에서 HuLiv 마우스라고도 함)라고 하는, C57Bl/6 배경의 Fah -/- Rag2 -/- Il2rg -/- 마우스가 상기 기술된 바와 같이, 간 인간화용 모델로서 사용되었다 (도 12A 참조).
pHMIK-hPAH-hI1C-032 벡터는 5'에서 3'으로 하기 유전자 엘리먼트: 5' ITR 엘리먼트, 5' 상동성 팔부, 스플라이싱 억셉터, 2A 엘리먼트, 침묵적으로 변경된 인간 PAH 코딩 서열, SV40 폴리아데닐화 서열, 3' 상동성 팔부, 및 3' ITR 엘리먼트를 포함하였다. 이들 엘리먼트의 서열은 표 11에 기재되어 있다.
Figure pct00011
pHMIK-hPAH-hI1C-032 벡터는 AAVHSC15 캡시드에 패키징되었고, 마우스에게 정맥내로 체중 킬로그램 당 1 Х 1014 벡터 게놈의 용량으로 투여되었다. AAVHSC15 캡시드에 패키징된 pHMIK-hPAH-hI1C-032 벡터를 받은 3마리 마우스 유래 간 샘플을 수집하였고, 인간 및 마우스 간세포를 분리 및 정제하였으며, DNA를 추출하였다. 유전자 편집 효율은 상기 기술된 바와 동일한 ddPCR 방법을 사용해 측정하였다.
인간 간세포에서 PAH 유전자 편집의 지속성은 벡터의 투여 이후 1주차 및 6주차에 처리된 마우스로부터 수득된 세포 내 모든 대립유전자 중에서 편집된 대립유전자의 백분율을 결정하여 측정하였다. 도 12B에 도시된 바와 같이, 약 4% PAH 유전자 편집이 벡터 투여 후 1주차 마우스로부터 수득된 세포에서 측정되었고, 약 7% 편집이 벡터 투여 후 6주차 마우스로부터 수득된 세포에서 측정되었다.
pHMIK-hPAH-hI1C-032 벡터에 의해 매개되는 게놈 편집은 HuLiv 마우스에서 인간 간세포에 특이적인 것으로 확인되었다. 도 13에 도시된 바와 같이, 벡터의 투여 후 1주차에, PAH 유전자 편집 (ddPCR 및 NGS로 결정)은 인간 게놈의 대립유전자 개수에 대해 약 3% 내지 3.5%의 비율로 검출되었는데 반해서, 간 샘플에서 마우스 게놈의 편집은 마우스 게놈의 대립유전자 개수 대비 0%에 가까웠다. 벡터의 투여 이후 6주차에, 편집은 인간 게놈의 대립유전자 개수 대비 약 5% 내지 6.5%의 비율로 검출되었다. *는 마우스 값과 비교하여 p<0.0025를 의미한다.
더 나아가서, pHMIK-hPAH-hI1C-032 벡터는 인간 이외 세포에서 비효과적인 것으로 확인되었다. 도 14에 도시된 바와 같이, PAH 녹아웃 마우스 (PAH ENU2) 마우스는 정맥내로 AAVHSC15 캡시드에 패키징된 pHMIK-hPAH-hI1C-032 벡터 (hPAH-032)가 체중 킬로그램 당 1 Х 1014 벡터 게놈의 용량으로 투여되었을 때, 혈청 페닐알라닌의 수준은 주사 후 최대 3주까지 대조군 투여된 마우스와 유사하였다. 대조적으로, pHMI-hPAH-mAC-006 벡터 (mPAH-006)가 투여된 마우스는 주사후 1주만에 혈청 Phe 수준의 감소를 보였다.
도 15A는 인간 PAH 발현 및 혈청 Phe 수준 간 관련성을 보여준다. 도시된 바와 같이, PAHENU2 마우스에서 pHMI-hPAH-mAC-006 벡터를 사용한 실험에서 모은 데이터에서, 10%의 인간 PAH 발현이 PAHENU2 마우스에서 표현형을 교정한다. 따라서, 내생성 수준 대비 인간 PAH 발현의 10%는 페닐알라닌혈증을 교정하는데 필요한 수준 (예를 들어, 치료적 수준)인 것으로 결정되었다.
발현의 치료적 수준은 pHMIK-hPAH-hI1C-032 벡터에서 검출되었다. 인간 간세포에서 인간 PAH 발현은 pHMIK-hPAH-hI1C-032 벡터 (hPAH-032)가 체중 킬로그램 당 1 Х 1014 벡터 게놈의 용량으로 투여된 HuLiv 마우스에서 인간 GAPDH에 대해 측정되었다. 도 15B에 도시된 바와 같이, 벡터가 처리된 2마리의 상이한 HuLiv 마우스에서 인간 PAH의 발현을 측정하기 위한 2종의 상이한 발현 프로브를 사용하여,인간 PAH 발현은 인간 간세포에서 10% 초과인 것으로 결정되었다. 벡터가 투여된 HuLiv 마우스의 인간 간세포에서 PAH 유전자 편집 범위는 3회의 상이한 실험에 걸쳐서 13마리의 상이한 마우스에서 약 5% 내지 약 11%인 것으로 측정되었다.
pHMIK-hPAH-hI1C-032 벡터는 인간 PAH 유전자를 표적화하는 것이 확인되었고 HuLiv 마우스에서 편집된 mRNA 교정된 수준을 야기시켰다. 표현형 교정에 필요한 PAH mRNA 수준이 (PAH 녹아웃 마우스 모델 (PAH ENU2)을 사용하여) 마우스 모델에서 최초로 확립되었다. 이것은 내생성 수준에 대해서 약 10%의 PAH 발현인 것으로 결정되었다 (도 15A 참조). 도 16에 도시된 바와 같이, GAPDH 발현 대비 인간 PAH 유전자 발현은 약 44.9%인 것으로 결정되었고 (좌측), GAPDH 발현 대비 마우스 PAH 유전자 발현은 약 39.7%인 것으로 결정되었다 (우측).
실시예 6: 인간 PAH 교정 벡터
이 실시예는 인간 PAH 교정 벡터 pKITR-hPAH-mAC-006-HCR, pKITR-hPAH-hI1C-032-HCR, pKITR-hPAH-mAC-006-SD.3, pHMIA2-hPAH-hI1C-032-SD.3, 및 pHMIA2-hPAH-mAC-006-HBB1을 제공한다. 벡터의 개략도는 각각 도 17A, 17B, 17C, 17D, 및 17E에 도시된다.
a) pKITR-hPAH-mAC-006-HCR, pKITR-hPAH-hI1C-032-HCR, 및 pHMIA2-hPAH-mAC-006-HBB1
벡터 pKITR-hPAH-mAC-006-HCR 및 pKITR-hPAH-hI1C-032-HCR은 PAH 코딩 서열로 HCR 인트론을 삽입시켜 생성시켰다. 벡터 pHMIA2-hPAH-mAC-006-HBB1은 PAH 코딩 서열에 HBB1 인트론을 삽입시켜 생성시켰다. HCR 및 HBB1 인트론은 간 및 혈액 세포주에서 높은 발현을 보이는 인트론을 결정하기 위해 루시퍼라제 리포터를 사용한 인트론 스크리닝 실험에서 그들 성능을 기반으로 선택하였다. 스크린에서 사용된 인트론은 표 12에 기재되어 있다.
Figure pct00012
pKITR-hPAH-mAC-006-HCR은 5'에서 3'으로 하기 유전자 엘리먼트: 5' ITR 엘리먼트, 5' 상동성 팔부, 이에 삽입된 HCR 인트론을 갖는 침묵적으로 변경된 인간 PAH 코딩 서열, SV40 폴리아데닐화 서열, 표적화된 통합 제한 카세트 ("TI RE"), 3' 상동성 팔부, 및 3' ITR 엘리먼트를 포함하였다. pKITR-hPAH-hI1C-032-HCR은 5'에서 3'으로 하기 유전자 엘리먼트: 5' ITR 엘리먼트, 5' 상동성 팔부, 스플라이스 억셉터, 2A 엘리먼트, 이에 삽입된 HCR 인트론을 갖는 침묵적으로 변경된 인간 PAH 코딩 서열, SV40 폴리아데닐화 서열, 3' 상동성 팔부, 및 3' ITR 엘리먼트를 포함하였다. pHMIA2-hPAH-mAC-006-HBB1은 5'에서 3'으로 하기 유전자 엘리먼트: 5' ITR 엘리먼트, 5' 상동성 팔부, 이에 삽입된 HBB 인트론을 갖는 침묵적으로 변경된 인간 PAH 코딩 서열, SV40 폴리아데닐화 서열, 표적화된 통합 제한 카세트 ("TI RE"), 3' 상동성 팔부, 및 3' ITR 엘리먼트를 포함하였다. 이들 엘리먼트의 서열은 표 13에 기재되어 있다.
Figure pct00013
b) pKITR-hPAH-mAC-006-SD.3 및 pHMIA2-hPAH-hI1C-032-SD.3벡터
pKITR-hPAH-mAC-006-SD.3 및 pHMIA2-hPAH-hI1C-032-SD.3은 스플라이스 도너 부위를 변형시켜 생성시켰다. 스플라이스 도너는 각각 도 17C 및 17D에 표시된 바와 같이 변형되었다. pKITR-hPAH-mAC-006-SD.3은 5'에서 3'으로 하기 유전자 엘리먼트: 5' ITR 엘리먼트, 5' 상동성 팔부, 스플라이스 도너 변경을 갖는 침묵적으로 변경된 인간 PAH 코딩 서열, SV40 폴리아데닐화 서열, 표적화된 통합 제한 카세트 ("TI RE"), 3' 상동성 팔부, 및 3' ITR 엘리먼트를 포함하였다. pHMIA2-hPAH-hI1C-032-SD.3은 5'에서 3'으로 하기 유전자 엘리먼트: 5' ITR 엘리먼트, 5' 상동성 팔부, 스플라이싱 억셉터, 2A 엘리먼트, 스플라이스 도너 변경을 갖는 침묵적으로 변경된 인간 PAH 코딩 서열, SV40 폴리아데닐화 서열, 3' 상동성 팔부, 및 3' ITR 엘리먼트를 포함하였다. 이들 엘리먼트의 서열을 표 14에 기재되어 있다.
Figure pct00014
* * *
본 발명은 본 명세서에 기술된 특별한 구현예에 의해 범주가 제한되는 것이 아니다. 실제로, 기술된 것들 이외에도 본 발명의 다양한 변형이 전술된 설명 및 수반되는 도면을 통해서 당업자에게 자명해 질 것이다. 이러한 변형은 첨부된 청구항의 범주 내에 포함시키고자 한다.
본 명세서에서 인용되는 모든 참조 (예를 들어, 출판물 또는 특허 또는 특허 출원)는 각각의 개별 참조 (예를 들어, 출판물 또는 특허 또는 특허 출원)가 모든 목적을 위해 그 전체로 참조로 편입된다고 특별히 개별적으로 표시된 바와 동일한 정도로 모든 목적으로 위해 그들 전체로 참조로 본 명세서에 편입된다. 다른 구현예들이 하기 청구항 내에 포함된다.
SEQUENCE LISTING <110> HOMOLOGY MEDICINES, INC. <120> ADENO-ASSOCIATED VIRUS COMPOSITIONS FOR RESTORING PAH GENE FUNCTION AND METHODS OF USE THEREOF <130> 610062: HMT-024PC <150> 62/625,149 <151> 2018-02-01 <150> 62/672,377 <151> 2018-05-16 <160> 153 <170> PatentIn version 3.5 <210> 1 <211> 736 <212> PRT <213> Artificial Sequence <220> <223> adeno-associated AAV9 <400> 1 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser 1 5 10 15 Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro 20 25 30 Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly 145 150 155 160 Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr 165 170 175 Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro 180 185 190 Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly 195 200 205 Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser 210 215 220 Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile 225 230 235 240 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn 260 265 270 Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg 275 280 285 Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn 290 295 300 Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile 305 310 315 320 Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn 325 330 335 Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu 340 345 350 Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro 355 360 365 Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp 370 375 380 Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe 385 390 395 400 Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu 405 410 415 Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu 420 425 430 Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser 435 440 445 Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser 450 455 460 Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro 465 470 475 480 Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn 485 490 495 Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn 500 505 510 Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys 515 520 525 Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly 530 535 540 Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile 545 550 555 560 Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser 565 570 575 Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln 580 585 590 Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln 595 600 605 Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His 610 615 620 Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met 625 630 635 640 Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala 645 650 655 Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr 660 665 670 Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln 675 680 685 Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn 690 695 700 Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val 705 710 715 720 Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu 725 730 735 <210> 2 <211> 736 <212> PRT <213> Artificial Sequence <220> <223> novel AAV isolate <400> 2 Met Thr Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser 1 5 10 15 Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro 20 25 30 Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly 145 150 155 160 Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr 165 170 175 Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro 180 185 190 Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly 195 200 205 Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser 210 215 220 Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile 225 230 235 240 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn 260 265 270 Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg 275 280 285 Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn 290 295 300 Asn Trp Gly Phe Arg Pro Lys Gln Leu Asn Phe Lys Leu Phe Asn Ile 305 310 315 320 Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn 325 330 335 Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu 340 345 350 Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro 355 360 365 Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp 370 375 380 Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe 385 390 395 400 Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu 405 410 415 Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu 420 425 430 Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser 435 440 445 Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser 450 455 460 Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro 465 470 475 480 Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn 485 490 495 Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn 500 505 510 Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys 515 520 525 Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly 530 535 540 Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile 545 550 555 560 Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser 565 570 575 Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln 580 585 590 Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln 595 600 605 Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His 610 615 620 Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met 625 630 635 640 Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala 645 650 655 Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr 660 665 670 Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln 675 680 685 Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn 690 695 700 Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val 705 710 715 720 Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu 725 730 735 <210> 3 <211> 736 <212> PRT <213> Artificial Sequence <220> <223> novel AAV isolate <400> 3 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser 1 5 10 15 Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro 20 25 30 Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly 145 150 155 160 Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr 165 170 175 Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro 180 185 190 Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly 195 200 205 Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser 210 215 220 Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile 225 230 235 240 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn 260 265 270 Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg 275 280 285 Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn 290 295 300 Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile 305 310 315 320 Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn 325 330 335 Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu 340 345 350 Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro 355 360 365 Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp 370 375 380 Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe 385 390 395 400 Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu 405 410 415 Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu 420 425 430 Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser 435 440 445 Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser 450 455 460 Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro 465 470 475 480 Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn 485 490 495 Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn 500 505 510 Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys 515 520 525 Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly 530 535 540 Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile 545 550 555 560 Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser 565 570 575 Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln 580 585 590 Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln 595 600 605 Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His 610 615 620 Thr Gly Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met 625 630 635 640 Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala 645 650 655 Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr 660 665 670 Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln 675 680 685 Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn 690 695 700 Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Gly Gly Val 705 710 715 720 Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu 725 730 735 <210> 4 <211> 736 <212> PRT <213> Artificial Sequence <220> <223> novel AAV isolate <400> 4 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser 1 5 10 15 Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro 20 25 30 Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Ile Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly 145 150 155 160 Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr 165 170 175 Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro 180 185 190 Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly 195 200 205 Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser 210 215 220 Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile 225 230 235 240 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn 260 265 270 Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg 275 280 285 Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn 290 295 300 Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile 305 310 315 320 Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn 325 330 335 Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu 340 345 350 Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro 355 360 365 Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp 370 375 380 Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe 385 390 395 400 Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu 405 410 415 Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu 420 425 430 Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser 435 440 445 Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser 450 455 460 Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro 465 470 475 480 Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn 485 490 495 Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn 500 505 510 Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys 515 520 525 Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly 530 535 540 Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile 545 550 555 560 Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser 565 570 575 Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln 580 585 590 Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln 595 600 605 Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His 610 615 620 Thr Tyr Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met 625 630 635 640 Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala 645 650 655 Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr 660 665 670 Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln 675 680 685 Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn 690 695 700 Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val 705 710 715 720 Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu 725 730 735 <210> 5 <211> 736 <212> PRT <213> Artificial Sequence <220> <223> novel AAV isolate <400> 5 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser 1 5 10 15 Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro 20 25 30 Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Asp 145 150 155 160 Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr 165 170 175 Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro 180 185 190 Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly 195 200 205 Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser 210 215 220 Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile 225 230 235 240 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn 260 265 270 Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg 275 280 285 Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn 290 295 300 Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile 305 310 315 320 Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn 325 330 335 Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu 340 345 350 Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro 355 360 365 Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp 370 375 380 Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe 385 390 395 400 Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu 405 410 415 Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu 420 425 430 Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser 435 440 445 Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser 450 455 460 Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro 465 470 475 480 Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn 485 490 495 Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn 500 505 510 Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys 515 520 525 Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly 530 535 540 Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile 545 550 555 560 Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser 565 570 575 Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln 580 585 590 Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln 595 600 605 Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His 610 615 620 Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met 625 630 635 640 Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala 645 650 655 Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr 660 665 670 Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln 675 680 685 Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn 690 695 700 Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val 705 710 715 720 Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu 725 730 735 <210> 6 <211> 736 <212> PRT <213> Artificial Sequence <220> <223> novel AAV isolate <400> 6 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser 1 5 10 15 Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro 20 25 30 Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Leu Gln Ala Lys Lys Arg Leu Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly 145 150 155 160 Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr 165 170 175 Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro 180 185 190 Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly 195 200 205 Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser 210 215 220 Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile 225 230 235 240 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn 260 265 270 Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg 275 280 285 Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn 290 295 300 Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile 305 310 315 320 Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn 325 330 335 Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu 340 345 350 Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro 355 360 365 Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp 370 375 380 Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe 385 390 395 400 Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu 405 410 415 Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu 420 425 430 Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser 435 440 445 Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser 450 455 460 Val Ala Gly Ser Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro 465 470 475 480 Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn 485 490 495 Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn 500 505 510 Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys 515 520 525 Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly 530 535 540 Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile 545 550 555 560 Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser 565 570 575 Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln 580 585 590 Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln 595 600 605 Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His 610 615 620 Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met 625 630 635 640 Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala 645 650 655 Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr 660 665 670 Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln 675 680 685 Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn 690 695 700 Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val 705 710 715 720 Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu 725 730 735 <210> 7 <211> 736 <212> PRT <213> Artificial Sequence <220> <223> novel AAV isolate <400> 7 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser 1 5 10 15 Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro 20 25 30 Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly 145 150 155 160 Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr 165 170 175 Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro 180 185 190 Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly 195 200 205 Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser 210 215 220 Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile 225 230 235 240 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn 260 265 270 Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg 275 280 285 Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn 290 295 300 Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile 305 310 315 320 Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn 325 330 335 Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu 340 345 350 Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro 355 360 365 Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp 370 375 380 Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe 385 390 395 400 Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu 405 410 415 Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu 420 425 430 Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser 435 440 445 Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser 450 455 460 Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro 465 470 475 480 Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn 485 490 495 Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn 500 505 510 Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys 515 520 525 Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly 530 535 540 Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile 545 550 555 560 Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser 565 570 575 Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Arg Ala Gln 580 585 590 Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln 595 600 605 Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His 610 615 620 Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met 625 630 635 640 Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala 645 650 655 Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr 660 665 670 Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln 675 680 685 Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn 690 695 700 Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val 705 710 715 720 Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu 725 730 735 <210> 8 <211> 736 <212> PRT <213> Artificial Sequence <220> <223> novel AAV isolate <400> 8 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser 1 5 10 15 Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro 20 25 30 Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Ala Val Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly 145 150 155 160 Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr 165 170 175 Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro 180 185 190 Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly 195 200 205 Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser 210 215 220 Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile 225 230 235 240 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn 260 265 270 Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg 275 280 285 Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn 290 295 300 Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile 305 310 315 320 Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn 325 330 335 Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu 340 345 350 Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro 355 360 365 Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp 370 375 380 Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe 385 390 395 400 Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu 405 410 415 Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu 420 425 430 Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser 435 440 445 Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser 450 455 460 Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro 465 470 475 480 Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn 485 490 495 Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn 500 505 510 Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys 515 520 525 Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly 530 535 540 Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile 545 550 555 560 Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser 565 570 575 Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln 580 585 590 Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln 595 600 605 Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His 610 615 620 Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met 625 630 635 640 Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala 645 650 655 Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr 660 665 670 Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln 675 680 685 Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn 690 695 700 Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val 705 710 715 720 Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu 725 730 735 <210> 9 <211> 736 <212> PRT <213> Artificial Sequence <220> <223> novel AAV isolate <400> 9 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser 1 5 10 15 Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro 20 25 30 Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu Gln Ser Pro Arg Glu Pro Asp Ser Ser Ala Gly Ile Gly 145 150 155 160 Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr 165 170 175 Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro 180 185 190 Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly 195 200 205 Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser 210 215 220 Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile 225 230 235 240 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn 260 265 270 Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg 275 280 285 Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn 290 295 300 Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile 305 310 315 320 Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn 325 330 335 Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu 340 345 350 Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro 355 360 365 Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp 370 375 380 Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe 385 390 395 400 Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu 405 410 415 Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu 420 425 430 Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser 435 440 445 Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser 450 455 460 Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro 465 470 475 480 Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn 485 490 495 Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn 500 505 510 Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys 515 520 525 Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly 530 535 540 Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile 545 550 555 560 Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser 565 570 575 Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln 580 585 590 Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln 595 600 605 Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His 610 615 620 Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met 625 630 635 640 Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala 645 650 655 Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr 660 665 670 Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln 675 680 685 Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn 690 695 700 Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val 705 710 715 720 Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu 725 730 735 <210> 10 <211> 736 <212> PRT <213> Artificial Sequence <220> <223> novel AAV isolate <400> 10 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser 1 5 10 15 Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro 20 25 30 Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly 145 150 155 160 Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr 165 170 175 Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro 180 185 190 Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Cys Gly Gly 195 200 205 Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser 210 215 220 Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile 225 230 235 240 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn 260 265 270 Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg 275 280 285 Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn 290 295 300 Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile 305 310 315 320 Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn 325 330 335 Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu 340 345 350 Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro 355 360 365 Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp 370 375 380 Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe 385 390 395 400 Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu 405 410 415 Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu 420 425 430 Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser 435 440 445 Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser 450 455 460 Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro 465 470 475 480 Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn 485 490 495 Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn 500 505 510 Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys 515 520 525 Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly 530 535 540 Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile 545 550 555 560 Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser 565 570 575 Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln 580 585 590 Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln 595 600 605 Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His 610 615 620 Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met 625 630 635 640 Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala 645 650 655 Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr 660 665 670 Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln 675 680 685 Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn 690 695 700 Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val 705 710 715 720 Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu 725 730 735 <210> 11 <211> 736 <212> PRT <213> Artificial Sequence <220> <223> novel AAV isolate <400> 11 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser 1 5 10 15 Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro 20 25 30 Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Arg Ala Tyr Asp 65 70 75 80 Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly 145 150 155 160 Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr 165 170 175 Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro 180 185 190 Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly 195 200 205 Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser 210 215 220 Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile 225 230 235 240 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn 260 265 270 Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg 275 280 285 Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn 290 295 300 Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile 305 310 315 320 Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn 325 330 335 Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu 340 345 350 Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro 355 360 365 Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp 370 375 380 Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe 385 390 395 400 Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu 405 410 415 Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu 420 425 430 Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser 435 440 445 Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser 450 455 460 Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro 465 470 475 480 Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn 485 490 495 Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn 500 505 510 Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys 515 520 525 Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly 530 535 540 Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile 545 550 555 560 Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser 565 570 575 Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln 580 585 590 Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln 595 600 605 Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His 610 615 620 Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met 625 630 635 640 Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala 645 650 655 Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr 660 665 670 Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln 675 680 685 Lys Lys Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn 690 695 700 Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val 705 710 715 720 Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu 725 730 735 <210> 12 <211> 736 <212> PRT <213> Artificial Sequence <220> <223> novel AAV isolate <400> 12 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser 1 5 10 15 Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro 20 25 30 Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly 145 150 155 160 Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr 165 170 175 Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro 180 185 190 Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly 195 200 205 Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser 210 215 220 Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile 225 230 235 240 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn 260 265 270 Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg 275 280 285 Phe His Cys His Phe Ser Pro His Asp Trp Gln Arg Leu Ile Asn Asn 290 295 300 Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile 305 310 315 320 Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn 325 330 335 Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu 340 345 350 Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro 355 360 365 Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp 370 375 380 Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe 385 390 395 400 Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu 405 410 415 Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu 420 425 430 Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser 435 440 445 Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Asn 450 455 460 Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro 465 470 475 480 Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn 485 490 495 Asn Asn Ser Glu Phe Ala Trp Pro Arg Ala Ser Ser Trp Ala Leu Asn 500 505 510 Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys 515 520 525 Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly 530 535 540 Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile 545 550 555 560 Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser 565 570 575 Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln 580 585 590 Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln 595 600 605 Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His 610 615 620 Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met 625 630 635 640 Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala 645 650 655 Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr 660 665 670 Gln Tyr Ser Thr Gly Gln Val Ser Met Glu Ile Glu Trp Glu Leu Gln 675 680 685 Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn 690 695 700 Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val 705 710 715 720 Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu 725 730 735 <210> 13 <211> 736 <212> PRT <213> Artificial Sequence <220> <223> novel AAV isolate <400> 13 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser 1 5 10 15 Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro 20 25 30 Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly 145 150 155 160 Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr 165 170 175 Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro 180 185 190 Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly 195 200 205 Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser 210 215 220 Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile 225 230 235 240 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn 260 265 270 Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg 275 280 285 Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn 290 295 300 Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile 305 310 315 320 Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn 325 330 335 Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu 340 345 350 Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro 355 360 365 Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp 370 375 380 Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe 385 390 395 400 Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu 405 410 415 Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu 420 425 430 Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser 435 440 445 Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser 450 455 460 Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro 465 470 475 480 Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn 485 490 495 Asn Asn Ser Glu Phe Ala Trp Pro Arg Ala Ser Ser Trp Ala Leu Asn 500 505 510 Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys 515 520 525 Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly 530 535 540 Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile 545 550 555 560 Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser 565 570 575 Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln 580 585 590 Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln 595 600 605 Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His 610 615 620 Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met 625 630 635 640 Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala 645 650 655 Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr 660 665 670 Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln 675 680 685 Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn 690 695 700 Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val 705 710 715 720 Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu 725 730 735 <210> 14 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> splice acceptor <400> 14 ctgacctctt ctcttcctcc cacagg 26 <210> 15 <211> 736 <212> PRT <213> Artificial Sequence <220> <223> novel AAV isolate <400> 15 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser 1 5 10 15 Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro 20 25 30 Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly 145 150 155 160 Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr 165 170 175 Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro 180 185 190 Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly 195 200 205 Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser 210 215 220 Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile 225 230 235 240 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn 260 265 270 Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg 275 280 285 Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn 290 295 300 Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile 305 310 315 320 Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn 325 330 335 Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu 340 345 350 Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro 355 360 365 Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp 370 375 380 Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe 385 390 395 400 Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu 405 410 415 Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu 420 425 430 Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser 435 440 445 Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser 450 455 460 Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro 465 470 475 480 Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn 485 490 495 Asn Asn Ser Glu Phe Ala Trp Pro Arg Ala Ser Ser Trp Ala Leu Asn 500 505 510 Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys 515 520 525 Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly 530 535 540 Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile 545 550 555 560 Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser 565 570 575 Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln 580 585 590 Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln 595 600 605 Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His 610 615 620 Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met 625 630 635 640 Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala 645 650 655 Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr 660 665 670 Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Arg Gln 675 680 685 Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn 690 695 700 Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val 705 710 715 720 Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu 725 730 735 <210> 16 <211> 736 <212> PRT <213> Artificial Sequence <220> <223> novel AAV isolate <400> 16 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser 1 5 10 15 Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro 20 25 30 Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly 145 150 155 160 Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr 165 170 175 Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro 180 185 190 Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly 195 200 205 Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser 210 215 220 Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile 225 230 235 240 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn 260 265 270 Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg 275 280 285 Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn 290 295 300 Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile 305 310 315 320 Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn 325 330 335 Asn Leu Thr Ser Thr Val Gln Val Phe Ala Asp Ser Asp Tyr Gln Leu 340 345 350 Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro 355 360 365 Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp 370 375 380 Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe 385 390 395 400 Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu 405 410 415 Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu 420 425 430 Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser 435 440 445 Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser 450 455 460 Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro 465 470 475 480 Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn 485 490 495 Asn Asn Ser Glu Phe Ala Trp Pro Arg Ala Ser Ser Trp Ala Leu Asn 500 505 510 Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys 515 520 525 Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly 530 535 540 Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile 545 550 555 560 Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser 565 570 575 Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln 580 585 590 Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln 595 600 605 Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His 610 615 620 Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met 625 630 635 640 Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala 645 650 655 Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr 660 665 670 Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln 675 680 685 Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn 690 695 700 Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val 705 710 715 720 Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu 725 730 735 <210> 17 <211> 736 <212> PRT <213> Artificial Sequence <220> <223> novel AAV isolate <400> 17 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser 1 5 10 15 Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro 20 25 30 Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly 145 150 155 160 Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr 165 170 175 Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro 180 185 190 Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly 195 200 205 Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser 210 215 220 Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile 225 230 235 240 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn 260 265 270 Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg 275 280 285 Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn 290 295 300 Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile 305 310 315 320 Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn 325 330 335 Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu 340 345 350 Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro 355 360 365 Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp 370 375 380 Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe 385 390 395 400 Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu 405 410 415 Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu 420 425 430 Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser 435 440 445 Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser 450 455 460 Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro 465 470 475 480 Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn 485 490 495 Asn Asn Ser Glu Ile Ala Trp Pro Arg Ala Ser Ser Trp Ala Leu Asn 500 505 510 Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys 515 520 525 Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly 530 535 540 Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile 545 550 555 560 Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser 565 570 575 Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln 580 585 590 Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln 595 600 605 Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His 610 615 620 Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met 625 630 635 640 Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala 645 650 655 Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr 660 665 670 Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln 675 680 685 Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn 690 695 700 Tyr Cys Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val 705 710 715 720 Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu 725 730 735 <210> 18 <211> 145 <212> DNA <213> Artificial Sequence <220> <223> AAV2 5' ITR <400> 18 ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 60 cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag agagggagtg 120 gccaactcca tcactagggg ttcct 145 <210> 19 <211> 145 <212> DNA <213> Artificial Sequence <220> <223> AAV2 3' ITR <400> 19 aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg 60 ccgggcgacc aaaggtcgcc cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc 120 gagcgcgcag agagggagtg gccaa 145 <210> 20 <211> 167 <212> DNA <213> Artificial Sequence <220> <223> AAV5 5' ITR <400> 20 ctctcccccc tgtcgcgttc gctcgctcgc tggctcgttt gggggggtgg cagctcaaag 60 agctgccaga cgacggccct ctggccgtcg cccccccaaa cgagccagcg agcgagcgaa 120 cgcgacaggg gggagagtgc cacactctca agcaaggggg ttttgta 167 <210> 21 <211> 167 <212> DNA <213> Artificial Sequence <220> <223> AAV5 3' ITR <400> 21 tacaaaacct ccttgcttga gagtgtggca ctctcccccc tgtcgcgttc gctcgctcgc 60 tggctcgttt gggggggtgg cagctcaaag agctgccaga cgacggccct ctggccgtcg 120 cccccccaaa cgagccagcg agcgagcgaa cgcgacaggg gggagag 167 <210> 22 <211> 621 <212> PRT <213> Artificial Sequence <220> <223> AAV2 Rep <400> 22 Met Pro Gly Phe Tyr Glu Ile Val Ile Lys Val Pro Ser Asp Leu Asp 1 5 10 15 Glu His Leu Pro Gly Ile Ser Asp Ser Phe Val Asn Trp Val Ala Glu 20 25 30 Lys Glu Trp Glu Leu Pro Pro Asp Ser Asp Met Asp Leu Asn Leu Ile 35 40 45 Glu Gln Ala Pro Leu Thr Val Ala Glu Lys Leu Gln Arg Asp Phe Leu 50 55 60 Thr Glu Trp Arg Arg Val Ser Lys Ala Pro Glu Ala Leu Phe Phe Val 65 70 75 80 Gln Phe Glu Lys Gly Glu Ser Tyr Phe His Met His Val Leu Val Glu 85 90 95 Thr Thr Gly Val Lys Ser Met Val Leu Gly Arg Phe Leu Ser Gln Ile 100 105 110 Arg Glu Lys Leu Ile Gln Arg Ile Tyr Arg Gly Ile Glu Pro Thr Leu 115 120 125 Pro Asn Trp Phe Ala Val Thr Lys Thr Arg Asn Gly Ala Gly Gly Gly 130 135 140 Asn Lys Val Val Asp Glu Cys Tyr Ile Pro Asn Tyr Leu Leu Pro Lys 145 150 155 160 Thr Gln Pro Glu Leu Gln Trp Ala Trp Thr Asn Met Glu Gln Tyr Leu 165 170 175 Ser Ala Cys Leu Asn Leu Thr Glu Arg Lys Arg Leu Val Ala Gln His 180 185 190 Leu Thr His Val Ser Gln Thr Gln Glu Gln Asn Lys Glu Asn Gln Asn 195 200 205 Pro Asn Ser Asp Ala Pro Val Ile Arg Ser Lys Thr Ser Ala Arg Tyr 210 215 220 Met Glu Leu Val Gly Trp Leu Val Asp Lys Gly Ile Thr Ser Glu Lys 225 230 235 240 Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala 245 250 255 Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Gly Lys 260 265 270 Ile Met Ser Leu Thr Lys Thr Ala Pro Asp Tyr Leu Val Gly Gln Gln 275 280 285 Pro Val Glu Asp Ile Ser Ser Asn Arg Ile Tyr Lys Ile Leu Glu Leu 290 295 300 Asn Gly Tyr Asp Pro Gln Tyr Ala Ala Ser Val Phe Leu Gly Trp Ala 305 310 315 320 Thr Lys Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala 325 330 335 Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Thr Val Pro 340 345 350 Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp 355 360 365 Cys Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala 370 375 380 Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg 385 390 395 400 Val Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Asp Pro Thr Pro Val 405 410 415 Ile Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser 420 425 430 Thr Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe 435 440 445 Glu Leu Thr Arg Arg Leu Asp His Asp Phe Gly Lys Val Thr Lys Gln 450 455 460 Glu Val Lys Asp Phe Phe Arg Trp Ala Lys Asp His Val Val Glu Val 465 470 475 480 Glu His Glu Phe Tyr Val Lys Lys Gly Gly Ala Lys Lys Arg Pro Ala 485 490 495 Pro Ser Asp Ala Asp Ile Ser Glu Pro Lys Arg Val Arg Glu Ser Val 500 505 510 Ala Gln Pro Ser Thr Ser Asp Ala Glu Ala Ser Ile Asn Tyr Ala Asp 515 520 525 Arg Tyr Gln Asn Lys Cys Ser Arg His Val Gly Met Asn Leu Met Leu 530 535 540 Phe Pro Cys Arg Gln Cys Glu Arg Met Asn Gln Asn Ser Asn Ile Cys 545 550 555 560 Phe Thr His Gly Gln Lys Asp Cys Leu Glu Cys Phe Pro Val Ser Glu 565 570 575 Ser Gln Pro Val Ser Val Val Lys Lys Ala Tyr Gln Lys Leu Cys Tyr 580 585 590 Ile His His Ile Met Gly Lys Val Pro Asp Ala Cys Thr Ala Cys Asp 595 600 605 Leu Val Asn Val Asp Leu Asp Asp Cys Ile Phe Glu Gln 610 615 620 <210> 23 <211> 452 <212> PRT <213> Homo sapiens <400> 23 Met Ser Thr Ala Val Leu Glu Asn Pro Gly Leu Gly Arg Lys Leu Ser 1 5 10 15 Asp Phe Gly Gln Glu Thr Ser Tyr Ile Glu Asp Asn Cys Asn Gln Asn 20 25 30 Gly Ala Ile Ser Leu Ile Phe Ser Leu Lys Glu Glu Val Gly Ala Leu 35 40 45 Ala Lys Val Leu Arg Leu Phe Glu Glu Asn Asp Val Asn Leu Thr His 50 55 60 Ile Glu Ser Arg Pro Ser Arg Leu Lys Lys Asp Glu Tyr Glu Phe Phe 65 70 75 80 Thr His Leu Asp Lys Arg Ser Leu Pro Ala Leu Thr Asn Ile Ile Lys 85 90 95 Ile Leu Arg His Asp Ile Gly Ala Thr Val His Glu Leu Ser Arg Asp 100 105 110 Lys Lys Lys Asp Thr Val Pro Trp Phe Pro Arg Thr Ile Gln Glu Leu 115 120 125 Asp Arg Phe Ala Asn Gln Ile Leu Ser Tyr Gly Ala Glu Leu Asp Ala 130 135 140 Asp His Pro Gly Phe Lys Asp Pro Val Tyr Arg Ala Arg Arg Lys Gln 145 150 155 160 Phe Ala Asp Ile Ala Tyr Asn Tyr Arg His Gly Gln Pro Ile Pro Arg 165 170 175 Val Glu Tyr Met Glu Glu Glu Lys Lys Thr Trp Gly Thr Val Phe Lys 180 185 190 Thr Leu Lys Ser Leu Tyr Lys Thr His Ala Cys Tyr Glu Tyr Asn His 195 200 205 Ile Phe Pro Leu Leu Glu Lys Tyr Cys Gly Phe His Glu Asp Asn Ile 210 215 220 Pro Gln Leu Glu Asp Val Ser Gln Phe Leu Gln Thr Cys Thr Gly Phe 225 230 235 240 Arg Leu Arg Pro Val Ala Gly Leu Leu Ser Ser Arg Asp Phe Leu Gly 245 250 255 Gly Leu Ala Phe Arg Val Phe His Cys Thr Gln Tyr Ile Arg His Gly 260 265 270 Ser Lys Pro Met Tyr Thr Pro Glu Pro Asp Ile Cys His Glu Leu Leu 275 280 285 Gly His Val Pro Leu Phe Ser Asp Arg Ser Phe Ala Gln Phe Ser Gln 290 295 300 Glu Ile Gly Leu Ala Ser Leu Gly Ala Pro Asp Glu Tyr Ile Glu Lys 305 310 315 320 Leu Ala Thr Ile Tyr Trp Phe Thr Val Glu Phe Gly Leu Cys Lys Gln 325 330 335 Gly Asp Ser Ile Lys Ala Tyr Gly Ala Gly Leu Leu Ser Ser Phe Gly 340 345 350 Glu Leu Gln Tyr Cys Leu Ser Glu Lys Pro Lys Leu Leu Pro Leu Glu 355 360 365 Leu Glu Lys Thr Ala Ile Gln Asn Tyr Thr Val Thr Glu Phe Gln Pro 370 375 380 Leu Tyr Tyr Val Ala Glu Ser Phe Asn Asp Ala Lys Glu Lys Val Arg 385 390 395 400 Asn Phe Ala Ala Thr Ile Pro Arg Pro Phe Ser Val Arg Tyr Asp Pro 405 410 415 Tyr Thr Gln Arg Ile Glu Val Leu Asp Asn Thr Gln Gln Leu Lys Ile 420 425 430 Leu Ala Asp Ser Ile Asn Ser Glu Ile Gly Ile Leu Cys Ser Ala Leu 435 440 445 Gln Lys Ile Lys 450 <210> 24 <211> 1359 <212> DNA <213> Homo sapiens <400> 24 atgtccactg cggtcctgga aaacccaggc ttgggcagga aactctctga ctttggacag 60 gaaacaagct atattgaaga caactgcaat caaaatggtg ccatatcact gatcttctca 120 ctcaaagaag aagttggtgc attggccaaa gtattgcgct tatttgagga gaatgatgta 180 aacctgaccc acattgaatc tagaccttct cgtttaaaga aagatgagta tgaatttttc 240 acccatttgg ataaacgtag cctgcctgct ctgacaaaca tcatcaagat cttgaggcat 300 gacattggtg ccactgtcca tgagctttca cgagataaga agaaagacac agtgccctgg 360 ttcccaagaa ccattcaaga gctggacaga tttgccaatc agattctcag ctatggagcg 420 gaactggatg ctgaccaccc tggttttaaa gatcctgtgt accgtgcaag acggaagcag 480 tttgctgaca ttgcctacaa ctaccgccat gggcagccca tccctcgagt ggaatacatg 540 gaggaagaaa agaaaacatg gggcacagtg ttcaagactc tgaagtcctt gtataaaacc 600 catgcttgct atgagtacaa tcacattttt ccacttcttg aaaagtactg tggcttccat 660 gaagataaca ttccccagct ggaagacgtt tctcaattcc tgcagacttg cactggtttc 720 cgcctccgac ctgtggctgg cctgctttcc tctcgggatt tcttgggtgg cctggccttc 780 cgagtcttcc actgcacaca gtacatcaga catggatcca agcccatgta tacccccgaa 840 cctgacatct gccatgagct gttgggacat gtgcccttgt tttcagatcg cagctttgcc 900 cagttttccc aggaaattgg ccttgcctct ctgggtgcac ctgatgaata cattgaaaag 960 ctcgccacaa tttactggtt tactgtggag tttgggctct gcaaacaagg agactccata 1020 aaggcatatg gtgctgggct cctgtcatcc tttggtgaat tacagtactg cttatcagag 1080 aagccaaagc ttctccccct ggagctggag aagacagcca tccaaaatta cactgtcacg 1140 gagttccagc ccctgtatta cgtggcagag agttttaatg atgccaagga gaaagtaagg 1200 aactttgctg ccacaatacc tcggcccttc tcagttcgct acgacccata cacccaaagg 1260 attgaggtct tggacaatac ccagcagctt aagattttgg ctgattccat taacagtgaa 1320 attggaatcc tttgcagtgc cctccagaaa ataaagtaa 1359 <210> 25 <211> 1359 <212> DNA <213> Artificial Sequence <220> <223> Silently altered PAH coding sequence <400> 25 atgtccaccg ctgtgctgga gaaccctggg ctggggagga aactgtcaga cttcgggcag 60 gagacttcat acattgagga taactgtaac cagaatggcg ccatctctct gatcttcagc 120 ctgaaggagg aagtgggcgc cctggcaaag gtgctgcgcc tgtttgagga gaacgacgtg 180 aatctgaccc acatcgagtc ccggccttct agactgaaga aggacgagta cgagttcttt 240 acccacctgg ataagcggtc cctgccagcc ctgacaaaca tcatcaagat cctgaggcac 300 gacatcggag caaccgtgca cgagctgtct cgggacaaga agaaggatac cgtgccctgg 360 ttccctcgga caatccagga gctggataga tttgccaacc agatcctgtc ttacggagca 420 gagctggacg cagatcaccc tggcttcaag gacccagtgt atcgggcccg gagaaagcag 480 tttgccgata tcgcctacaa ttataggcac ggacagccaa tccctcgcgt ggagtatatg 540 gaggaggaga agaagacctg gggcacagtg ttcaagaccc tgaagagcct gtacaagaca 600 cacgcctgct acgagtataa ccacatcttc cccctgctgg agaagtattg tggctttcac 660 gaggacaata tccctcagct ggaggacgtg agccagttcc tgcagacctg cacaggcttt 720 aggctgaggc cagtggcagg actgctgagc tcccgggact tcctgggagg actggccttc 780 agagtgtttc actgcaccca gtacatcagg cacggctcca agccaatgta tacaccagag 840 cccgacatct gtcacgagct gctgggccac gtgcccctgt ttagcgatag atccttcgcc 900 cagttttccc aggagatcgg actggcatct ctgggagcac ctgacgagta catcgagaag 960 ctggccacca tctattggtt cacagtggag tttggcctgt gcaagcaggg cgatagcatc 1020 aaggcctacg gagcaggact gctgtctagc ttcggcgagc tgcagtattg tctgtccgag 1080 aagccaaagc tgctgcccct ggagctggag aagaccgcca tccagaacta caccgtgaca 1140 gagttccagc ccctgtacta tgtggccgag tcttttaacg atgccaagga gaaggtgaga 1200 aatttcgccg ccacaatccc taggcccttc agcgtgcggt acgaccctta tacccagagg 1260 atcgaggtgc tggataatac acagcagctg aagatcctgg ctgactcaat caatagcgaa 1320 atcggaatcc tgtgctccgc cctgcagaaa atcaaatga 1359 <210> 26 <211> 106 <212> DNA <213> Artificial Sequence <220> <223> truncated AAV2 5'ITR <400> 26 ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60 ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtgg 106 <210> 27 <211> 143 <212> DNA <213> Artificial Sequence <220> <223> modified AAV2 3'ITR <400> 27 aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg 60 ccgggcgacc aaaggtcgcc cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc 120 gagcgcgcag agagggagtg gcc 143 <210> 28 <211> 130 <212> DNA <213> Homo sapiens <400> 28 gttggtatca aggttacaag acaggtttaa ggagaccaat agaaactggg catgtggaga 60 cagagaagac tcttgggttt ctgataggca ctgactctct ctgcctattg gtctattttc 120 ccacccttag 130 <210> 29 <211> 116 <212> DNA <213> Mus musculus <400> 29 gttggtatcc aggttacaag gcagctcaca agaagaagtt gggtgcttgg agacagaggt 60 ctgctttcca gcagacacta actttcagtg tcccctgtct atgtttccct ttttag 116 <210> 30 <211> 92 <212> DNA <213> Artificial Sequence <220> <223> Minute virus in mice <400> 30 aagaggtaag ggtttaaggg atggttggtt ggtggggtat taatgtttaa ttacctggag 60 cacctgcctg aaatcacttt ttttcaggtt gg 92 <210> 31 <211> 198 <212> DNA <213> Simian virus 40 <400> 31 gatccagaca tgataagata cattgatgag tttggacaaa ccacaactag aatgcagtga 60 aaaaaatgct ttatttgtga aatttgtgat gctattgctt tatttgtaac cattataagc 120 tgcaataaac aagttaacaa caacaattgc attcatttta tgtttcaggt tcagggggag 180 gtgtgggagg ttttttaa 198 <210> 32 <211> 122 <212> DNA <213> Simian virus 40 <400> 32 aacttgttta ttgcagctta taatggttac aaataaagca atagcatcac aaatttcaca 60 aataaagcat ttttttcact gcattctagt tgtggtttgt ccaaactcat caatgtatct 120 ta 122 <210> 33 <211> 133 <212> DNA <213> Simian virus 40 <400> 33 tgctttattt gtgaaatttg tgatgctatt gctttatttg taaccattat aagctgcaat 60 aaacaagtta acaacaacaa ttgcattcat tttatgtttc aggttcaggg ggaggtgtgg 120 gaggtttttt aaa 133 <210> 34 <211> 135 <212> DNA <213> Simian virus 40 <400> 34 gatccagaca tgataagata cattgatgag tttggacaaa ccacaactag aatgcagtga 60 aaaaaatgct ttatttgtga aatttgtgat gctattgctt tatttgtaac cattataagc 120 tgcaataaac aagtt 135 <210> 35 <211> 1654 <212> DNA <213> Artificial Sequence <220> <223> pHMIA-hPAH-hI1C-032.1 editing element <400> 35 ctgacctctt ctcttcctcc cacagggcag cggagctact aacttcagcc tgctgaagca 60 ggctggagac gtggaggaga accctggacc tatgtccacc gctgtgctgg agaaccctgg 120 gctggggagg aaactgtcag acttcgggca ggagacttca tacattgagg ataactgtaa 180 ccagaatggc gccatctctc tgatcttcag cctgaaggag gaagtgggcg ccctggcaaa 240 ggtgctgcgc ctgtttgagg agaacgacgt gaatctgacc cacatcgagt cccggccttc 300 tagactgaag aaggacgagt acgagttctt tacccacctg gataagcggt ccctgccagc 360 cctgacaaac atcatcaaga tcctgaggca cgacatcgga gcaaccgtgc acgagctgtc 420 tcgggacaag aagaaggata ccgtgccctg gttccctcgg acaatccagg agctggatag 480 atttgccaac cagatcctgt cttacggagc agagctggac gcagatcacc ctggcttcaa 540 ggacccagtg tatcgggccc ggagaaagca gtttgccgat atcgcctaca attataggca 600 cggacagcca atccctcgcg tggagtatat ggaggaggag aagaagacct ggggcacagt 660 gttcaagacc ctgaagagcc tgtacaagac acacgcctgc tacgagtata accacatctt 720 ccccctgctg gagaagtatt gtggctttca cgaggacaat atccctcagc tggaggacgt 780 gagccagttc ctgcagacct gcacaggctt taggctgagg ccagtggcag gactgctgag 840 ctcccgggac ttcctgggag gactggcctt cagagtgttt cactgcaccc agtacatcag 900 gcacggctcc aagccaatgt atacaccaga gcccgacatc tgtcacgagc tgctgggcca 960 cgtgcccctg tttagcgata gatccttcgc ccagttttcc caggagatcg gactggcatc 1020 tctgggagca cctgacgagt acatcgagaa gctggccacc atctattggt tcacagtgga 1080 gtttggcctg tgcaagcagg gcgatagcat caaggcctac ggagcaggac tgctgtctag 1140 cttcggcgag ctgcagtatt gtctgtccga gaagccaaag ctgctgcccc tggagctgga 1200 gaagaccgcc atccagaact acaccgtgac agagttccag cccctgtact atgtggccga 1260 gtcttttaac gatgccaagg agaaggtgag aaatttcgcc gccacaatcc ctaggccctt 1320 cagcgtgcgg tacgaccctt atacccagag gatcgaggtg ctggataata cacagcagct 1380 gaagatcctg gctgactcaa tcaatagcga aatcggaatc ctgtgctccg ccctgcagaa 1440 aatcaaatga ggtaccgatc cagacatgat aagatacatt gatgagtttg gacaaaccac 1500 aactagaatg cagtgaaaaa aatgctttat ttgtgaaatt tgtgatgcta ttgctttatt 1560 tgtaaccatt ataagctgca ataaacaagt taacaacaac aattgcattc attttatgtt 1620 tcaggttcag ggggaggtgt gggaggtttt ttaa 1654 <210> 36 <211> 960 <212> DNA <213> Homo sapiens <400> 36 gcttcaggag cagttgtgcg aatagctgga gaacaccagg ctggatttaa acccagatcg 60 ctcttacatt tgctctttac ctgctgtgct cagcgttcac gtgccctcta gctgtagttt 120 tctgaagtca gcgcacagca aggcagtgtg cttagaggtt aacagaaggg aaaacaacaa 180 caacaaaaat ctaaatgaga atcctgactg tttcagctgg gggtaagggg ggcggattat 240 tcatataatt gttataccag acggtcgcag gcttagtcca attgcagaga actcgcttcc 300 caggcttctg agagtcccgg aagtgcctaa acctgtctaa tcgacggggc ttgggtggcc 360 cgtcgctccc tggcttcttc cctttaccca gggcgggcag cgaagtggtg cctcctgcgt 420 cccccacacc ctccctcagc ccctcccctc cggcccgtcc tgggcaggtg acctggagca 480 tccggcaggc tgccctggcc tcctgcgtca ggacaacgcc cacgaggggc gttactgtgc 540 ggagatgcac cacgcaagag acaccctttg taactctctt ctcctcccta gtgcgaggtt 600 aaaaccttca gccccacgtg ctgtttgcaa acctgcctgt acctgaggcc ctaaaaagcc 660 agagacctca ctcccgggga gccagcatgt ccactgcggt cctggaaaac ccaggcttgg 720 gcaggaaact ctctgacttt ggacaggtga gccacggcag cctgagctgc tcagttaggg 780 gaatttgggc ctccagagaa agagatccga agactgctgg tgcttcctgg tttcataagc 840 tcagtaagaa gtctgaattc gttggaagct gatgagaata tccaggaagt caacagacaa 900 atgtcctcaa caattgtttc taagtaggag aacatctgtc ctcggtggct ttcacaggaa 960 <210> 37 <211> 960 <212> DNA <213> Artificial Sequence <220> <223> 32.2 vector 5' homology arm <400> 37 gcttcaggag cagttgtgcg aatagctgga gaacaccagg ctggatttaa acccagatcg 60 ctcttacatt tgctctttac ctgctgtgct cagcgttcac gtgccctcta gctgtagttt 120 tctgaagtca gcgcacagca aggcagtgtg cttagaggtt aacagaaggg aaaacaacaa 180 caacaaaaat ctaaatgaga atcctgactg tttcagctgg gggtaagggg ggcggattat 240 tcatataatt gttataccag acggtcgcag gcttagtcca attgcagaga actcgcttcc 300 caggcttctg agagtcccgg aagtgcctaa acctgtctaa tcgacggggc ttgggtggcc 360 cgtcgctccc tggcttcttc cctttaccca gggcgggcag cgaagtggtg cctcctgcgt 420 cccccacacc ctccctcagc ccctcccctc cggcccgtcc tgggcaggtg acctggagca 480 tccggcaggc tgccctggcc tcctgcgtca ggacaacgcc cacgaggggc gttactgtgc 540 ggagatgcac cacgcaagag acaccctttg taactctctt ctcctcccta gtgcgaggtt 600 aaaaccttca gccccacgtg ctgtttgcaa acctgcctgt acctgaggcc ctaaaaagcc 660 agagacctca ctcccgggga gccaccatgg cggcggcggt cctggaaaac ccaggcttgg 720 gcaggaaact ctctgacttt ggacaggtga gccacggcag cctgagctgc tcagttaggg 780 gaatttgggc ctccagagaa agagatccga agactgctgg tgcttcctgg tttcataagc 840 tcagtaagaa gtctgaattc gttggaagct gatgagaata tccaggaagt caacagacaa 900 atgtcctcaa caattgtttc taagtaggag aacatctgtc ctcggtggct ttcacaggaa 960 <210> 38 <211> 960 <212> DNA <213> Artificial Sequence <220> <223> 32.3 vector 5' homology arm <400> 38 gcttcaggag cagttgtgcg aatagctgga gaacaccagg ctggatttaa acccagatcg 60 ctcttacatt tgctctttac ctgctgtgct cagcgttcac gtgccctcta gctgtagttt 120 tctgaagtca gcgcacagca aggcagtgtg cttagaggtt aacagaaggg aaaacaacaa 180 caacaaaaat ctaaatgaga atcctgactg tttcagctga gagtaagggg ggcggattat 240 tcatataatt gttataccag acggtcgcag gcttagtcca attgcagaga actcgcttcc 300 caggcttctg agagtcccgg aagtgcctaa acctgtctaa tcgacggggc ttgggtggcc 360 cgtcgctccc tggcttcttc cctttaccca gggcgggcag cgaagtggtg cctcctgcgt 420 cccccacacc ctccctcagc ccctcccctc cggcccgtcc tgggcaggtg acctggagca 480 tccggcaggc tgccctggcc tcctgcgtca ggacaacgcc cacgaggggc gttactgtgc 540 ggagatgcac cacgcaagag acaccctttg taactctctt ctcctcccta gtgcgaggtt 600 aaaaccttca gccccacgtg ctgtttgcaa acctgcctgt acctgaggcc ctaaaaagcc 660 agagacctca ctcccgggga gccagcatgt ccactgcggt cctggaaaac ccaggcttgg 720 gcaggaaact ctctgacttt ggacaggtga gccacggcag cctgagctgc tcagttaggg 780 gaatttgggc ctccagagaa agagatccga agactgctgg tgcttcctgg tttcataagc 840 tcagtaagaa gtctgaattc gttggaagct gatgagaata tccaggaagt caacagacaa 900 atgtcctcaa caattgtttc taagtaggag aacatctgtc ctcggtggct ttcacaggaa 960 <210> 39 <211> 960 <212> DNA <213> Artificial Sequence <220> <223> 32.4 vector 5' homology arm <400> 39 gcttcaggag cagttgtgcg aatagctgga gaacaccagg ctggatttaa acccagatcg 60 ctcttacatt tgctctttac ctgctgtgct cagcgttcac gtgccctcta gctgtagttt 120 tctgaagtca gcgcacagca aggcagtgtg cttagaggtt aacagaaggg aaaacaacaa 180 caacaaaaat ctaaatgaga atcctgactg tttcagctgg gggtaagggg ggcggattat 240 tcatataatt gttataccag acggtcgcag gcttagtcca attgcagaga actcgcttcc 300 caggcttctg agagtcccgg aagtgcctaa acctgtctaa tcgacggggc ttgggtggcc 360 cgtcgctccc tggcttcttc cctttaccca gggcgggcag cgaagtggtg cctcctgcgt 420 cccccacacc ctccctcagc ccctcccctc cggcccgtcc tgggcaggtg acctggagca 480 tccggcaggc tgccctggcc tcctgagtca ggacaacgcc cacgaggggc gttactgtgc 540 ggagatgcac cacgcaagag acaccctttg taactctctt ctcctcccta gtgcgaggtt 600 aaaaccttca gccccacgtg ctgtttgcaa acctgcctgt acctgaggcc ctaaaaagcc 660 agagacctca ctcccgggga gccagcatgt ccactgcggt cctggaaaac ccaggcttgg 720 gcaggaaact ctctgacttt ggacaggtga gccacggcag cctgagctgc tcagttaggg 780 gaatttgggc ctccagagaa agagatccga agactgctgg tgcttcctgg tttcataagc 840 tcagtaagaa gtctgaattc gttggaagct gatgagaata tccaggaagt caacagacaa 900 atgtcctcaa caattgtttc taagtaggag aacatctgtc ctcggtggct ttcacaggaa 960 <210> 40 <211> 960 <212> DNA <213> Artificial Sequence <220> <223> 32.5 vector 5' homology arm <400> 40 gcttcaggag cagttgtgcg aatagctgga gaacaccagg ctggatttaa acccagatcg 60 ctcttacatt tgctctttac ctgctgtgct cagcgttcac gtgccctcta gctgtagttt 120 tctgaagtca gcgcacagca aggcagtgtg cttagaggtt aacagaaggg aaaacaacaa 180 caacaaaaat ctaaatgaga atcctgactg tttcagctgg gggtaagggg ggcggattat 240 tcatataatt gttataccag acggtcgcag gcttagtcca attgcagaga actcgcttcc 300 caggcttctg agagtcccgg aagtgcctaa acctgtctaa tcgacggggc ttgggtggcc 360 cgtcgctccc tggcttcttc cctttaccca gggcgggcag cgaagtggtg cctcctgcgt 420 cccccacacc ctccctcagc ccctcccctc cggcccgtcc tgggcaggtg acgtcaagca 480 tccggcaggc tgccctggcc tcctgagtca ggacaacgcc cacgaggggc gttactgtgc 540 ggagatgcac cacgcaagag acaccctttg taactctctt ctcctcccta gtgcgaggtt 600 aaaaccttca gccccacgtg ctgtttgcaa acctgcctgt acctgaggcc ctaaaaagcc 660 agagacctca ctcccgggga gccagcatgt ccactgcggt cctggaaaac ccaggcttgg 720 gcaggaaact ctctgacttt ggacaggtga gccacggcag cctgagctgc tcagttaggg 780 gaatttgggc ctccagagaa agagatccga agactgctgg tgcttcctgg tttcataagc 840 tcagtaagaa gtctgaattc gttggaagct gatgagaata tccaggaagt caacagacaa 900 atgtcctcaa caattgtttc taagtaggag aacatctgtc ctcggtggct ttcacaggaa 960 <210> 41 <211> 960 <212> DNA <213> Artificial Sequence <220> <223> 32.6 vector 5' homology arm <400> 41 gcttcaggag cagttgtgcg aatagctgga gaacaccagg ctggatttaa acccagatcg 60 ctcttacatt tgctctttac ctgctgtgct cagcgttcac gtgccctcta gctgtagttt 120 tctgaagtca gcgcacagca aggcagtgtg cttagaggtt aacagaaggg aaaacaacaa 180 caacaaaaat ctaaatgaga atcctgactg tttcagctgg gggtaagggg ggcggattat 240 tcatataatt gttataccag acggtcgcag gcttagtcca attgcagaga actcgcttcc 300 caggcttctg agagtcccgg aagtgcctaa acctgtctaa tcgacggggc ttgggtggcc 360 cgtcgctccc tggcttcttc cctttaccca gggcgggcag cgaagtggtg cctcctgcgt 420 cccccacacc ctccctcagc ccctcccctc cggcccgtcc tgggcaggtg acctggagca 480 tccggcaggc tgccctggcc tcctgcgtca ggacaacgcc cacgaggggc gttactgtgc 540 ggagatgcac cacgcaagag acaccctttg taactctctt ctcctcccta gtgcgaggtt 600 aaaaccttca gccccacgtg ctgtttgcaa acctgcctgt acctgaggcc ctaaaaagcc 660 agagacctca ctcccgggga gccagcatgt ccactgcggt cctggaaaac ccaggcttgg 720 gcaggaaact ctctgacttt ggacaggtga gccacggcag cctgagctgc tcagttaggg 780 gaatttgggc ctccagagaa agagatccga agactgctgg tgcttcctgg tttcataagc 840 tcagtaagaa gtctgaattc gttggaagct gatgagaatg tccaggaagt caacagacaa 900 atgtcctcaa caattgtttc taagtaggag aacatctgtc ctcggtggct ttcacaggaa 960 <210> 42 <211> 960 <212> DNA <213> Artificial Sequence <220> <223> 32.7 vector 5' homology arm <400> 42 gcttcaggag cagttgtgcg aatagctgga gaacaccagg ctggatttaa acccagatcg 60 ctcttacatt tgctctttac ctgctgtgct cagcgttcac gtgccctcta gctgtagttt 120 tctgaagtca gcgcacagca aggcagtgtg cttagaggtt aacagaaggg aaaacaacaa 180 caacaaaaat ctaaatgaga atcctgactg tttcagctgg gggtaagggg ggcggattat 240 tcatataatt gttccaccag acggtcgcag gcttagtcca attgcagaga actcgcttcc 300 caggcttctg agagtcccgg aagtgcctaa acctgtctaa tcgacggggc ttgggtggcc 360 cgtcgctccc tggcttcttc cctttaccca gggcgggcag cgaagtggtg cctcctgcgt 420 cccccacacc ctccctcagc ccctcccctc cggcccgtcc tgggcaggtg acctggagca 480 tccggcaggc tgccctggcc tcctgcgtca ggacaacgcc cacgaggggc gttactgtgc 540 ggagatgcac cacgcaagag acaccctttg taactctctt ctcctcccta gtgcgaggtt 600 aaaaccttca gccccacgtg ctgtttgcaa acctgcctgt acctgaggcc ctaaaaagcc 660 agagacctca ctcccgggga gccagcatgt ccactgcggt cctggaaaac ccaggcttgg 720 gcaggaaact ctctgacttt ggacaggtga gccacggcag cctgagctgc tcagttaggg 780 gaatttgggc ctccagagaa agagatccga agactgctgg tgcttcctgg tttcataagc 840 tcagtaagaa gtctgaattc gttggaagct gatgagaata tccaggaagt caacagacaa 900 atgtcctcaa caattgtttc taagtaggag aacatctgtc ctcggtggct ttcacaggaa 960 <210> 43 <211> 968 <212> DNA <213> Artificial Sequence <220> <223> 32.8 vector 5' homology arm <400> 43 gcttcaggag cagttgtgcg aatagctgga gaacaccagg ctggatttaa acccagatcg 60 ctcttacatt tgctctttac ctgctgtgct cagcgttcac gtgccctcta gctgtagttt 120 tctgaagtca gcgcacagca aggcagtgtg cttagaggtt aacagaaggg aaaacaacaa 180 caacaaaaat ctaaatgaga atcctgactg tttcagctgg gggtaagggg ggcggattat 240 tcatataatt gttccaccag acggtcgcag gcttagtcca attgcagaga acacgctgtt 300 cttcgcccca ggcttctgag agtcccggaa gtgcctaaac ctgtctaatc gacggggctt 360 gggtggcccg tcgctccctg gcttcttccc tttacccagg gcgggcagcg aagtggtgcc 420 tcctgcgtcc cccacaccct ccctcagccc ctcccctccg gcccgtcctg ggcaggtgac 480 ctggagcatc cggcaggctg ccctggcctc ctgcgtcagg acaacgccca cgaggggcgt 540 tactgtgcgg agatgcacca cgcaagagac accctttgta actctcttct cctccctagt 600 gcgaggttaa aaccttcagc cccacgtgct gtttgcaaac ctgcctgtac ctgaggccct 660 aaaaagccag agacctcact cccggggagc cagcatgtcc actgcggtcc tggaaaaccc 720 aggcttgggc aggaaactct ctgactttgg acaggtgagc cacggcagcc tgagctgctc 780 agttagggga atttgggcct ccagagaaag agatccgaag actgctggtg cttcctggtt 840 tcataagctc agtaagaagt ctgaattcgt tggaagctga tgagaatatc caggaagtca 900 acagacaaat gtcctcaaca attgtttcta agtaggagaa catctgtcct cggtggcttt 960 cacaggaa 968 <210> 44 <211> 960 <212> DNA <213> Artificial Sequence <220> <223> 32.9 vector 5' homology arm <400> 44 gcttcaggag cagttgtgcg aatagctgga gaacaccagg ctggatttaa acccagatcg 60 ctcttacatt tgctctttac ctgctgtgct cagcgttcac gtgccctcta gctgtagttt 120 tctgaagtca gcgcacagca aggcagtgtg cttagaggtt aacagaaggg aaaacaacaa 180 caacaaaaat ctaaatgaga atcctgactg tttcagctga gagtaagggg ggcggattat 240 tcatataatt gttataccag acggtcgcag gcttagtcca attgcagaga actcgcttcc 300 caggcttctg agagtcccgg aagtgcctaa acctgtctaa tcgacagagc ttgggtggcc 360 cgtcgctccc tggcttcttc cctttaccca gggcgggcag cgaagtggtg cctcctgcgt 420 cccccacacc ctccctcagc ccctcccctc cggcccgtcc taggcaggtg acctgaagca 480 tccagcaggc tgccctggcc tcctgcgtca ggacaacgcc cacgaggggc gttactgtgc 540 ggagatgcac cacgcaagag acaccctttg taactctctt ctcctcccta gtgcgaggtt 600 aaaaccttca gccccacgtg ctgtttgcaa acctgcctgt acctgaggcc ctaaaaagcc 660 agagacctca ctcccgggga gccagcatgt ccactgcggt cctggaaaac ccaggcttgg 720 gcaggaaact ctctgacttt ggacaggtga gccacggcag cctgagctgc tcagttaggg 780 gaatttgggc ctccagagaa agagatccga agactgctgg tgcttcctgg tttcataagc 840 tcagtaagaa gtctgaattc gttggaagct gatgagaata tccaggaagt caacagacaa 900 atgtcctcaa caattgtttc taagtaggag aacatctgtc ctcggtggct ttcacaggaa 960 <210> 45 <211> 911 <212> DNA <213> Homo sapiens <400> 45 ctgggatggg atgtggaatc cttctagatt tcttttgtaa tatttataaa gtgctctcag 60 caaggtatca aaatggcaaa attgtgagta actatcctcc tttcattttg ggaagaagat 120 gaggcatgaa gagaattcag acagaaactt actcagacca ggggaggcag aaactaagca 180 gagaggaaaa tgaccaagag ttagccctgg gcatggaatg tgaaagaacc ctaaacgtga 240 cttggaaata atgcccaagg tatattccat tctccgggat ttgttggcat tttcttgagg 300 tgaagaattg cagaatacat tctttaatgt gacctacata tttacccatg ggaggaagtc 360 tgctcctgga ctcttgagat tcagtcataa agcccaggcc agggaaataa tgtaagtctg 420 caggcccctg tcatcagtag gattagggag aagagttctc agtagaaaac agggaggctg 480 gagagaaaag aatggttaat gttaacgtta atataactag aaagactgca gaacttagga 540 ctgattttta tttgaatcct taaaaaaaaa aatttcttat gaaaatagta catggctctt 600 aggagacaga acttattgta cagaggaaca gcgtgagagt cagagtgatc ccagaacagg 660 tcctggctcc atcctgcaca tagttttggt gctgctggca atacggtccc cacaactgtg 720 ggaaggggtt aggggcaggg atctcatcag gaaagcatag gggtttaaag ttctttatag 780 agcacttaga agattgagaa tccacaaatt atattaataa caaacaaagt agtgtcgtgt 840 tatatagtaa atgtgaattt gcagacacat ttagggaaaa gttataatta aaaaaatagg 900 ctgtatatat a 911 <210> 46 <211> 3537 <212> DNA <213> Artificial Sequence <220> <223> 32.1 vector correction genome <400> 46 gcttcaggag cagttgtgcg aatagctgga gaacaccagg ctggatttaa acccagatcg 60 ctcttacatt tgctctttac ctgctgtgct cagcgttcac gtgccctcta gctgtagttt 120 tctgaagtca gcgcacagca aggcagtgtg cttagaggtt aacagaaggg aaaacaacaa 180 caacaaaaat ctaaatgaga atcctgactg tttcagctgg gggtaagggg ggcggattat 240 tcatataatt gttataccag acggtcgcag gcttagtcca attgcagaga actcgcttcc 300 caggcttctg agagtcccgg aagtgcctaa acctgtctaa tcgacggggc ttgggtggcc 360 cgtcgctccc tggcttcttc cctttaccca gggcgggcag cgaagtggtg cctcctgcgt 420 cccccacacc ctccctcagc ccctcccctc cggcccgtcc tgggcaggtg acctggagca 480 tccggcaggc tgccctggcc tcctgcgtca ggacaacgcc cacgaggggc gttactgtgc 540 ggagatgcac cacgcaagag acaccctttg taactctctt ctcctcccta gtgcgaggtt 600 aaaaccttca gccccacgtg ctgtttgcaa acctgcctgt acctgaggcc ctaaaaagcc 660 agagacctca ctcccgggga gccagcatgt ccactgcggt cctggaaaac ccaggcttgg 720 gcaggaaact ctctgacttt ggacaggtga gccacggcag cctgagctgc tcagttaggg 780 gaatttgggc ctccagagaa agagatccga agactgctgg tgcttcctgg tttcataagc 840 tcagtaagaa gtctgaattc gttggaagct gatgagaata tccaggaagt caacagacaa 900 atgtcctcaa caattgtttc taagtaggag aacatctgtc ctcggtggct ttcacaggaa 960 aagcttctga cctcttctct tcctcccaca gggcagcgga gctactaact tcagcctgct 1020 gaagcaggct ggagacgtgg aggagaaccc tggacctatg tccaccgctg tgctggagaa 1080 ccctgggctg gggaggaaac tgtcagactt cgggcaggag acttcataca ttgaggataa 1140 ctgtaaccag aatggcgcca tctctctgat cttcagcctg aaggaggaag tgggcgccct 1200 ggcaaaggtg ctgcgcctgt ttgaggagaa cgacgtgaat ctgacccaca tcgagtcccg 1260 gccttctaga ctgaagaagg acgagtacga gttctttacc cacctggata agcggtccct 1320 gccagccctg acaaacatca tcaagatcct gaggcacgac atcggagcaa ccgtgcacga 1380 gctgtctcgg gacaagaaga aggataccgt gccctggttc cctcggacaa tccaggagct 1440 ggatagattt gccaaccaga tcctgtctta cggagcagag ctggacgcag atcaccctgg 1500 cttcaaggac ccagtgtatc gggcccggag aaagcagttt gccgatatcg cctacaatta 1560 taggcacgga cagccaatcc ctcgcgtgga gtatatggag gaggagaaga agacctgggg 1620 cacagtgttc aagaccctga agagcctgta caagacacac gcctgctacg agtataacca 1680 catcttcccc ctgctggaga agtattgtgg ctttcacgag gacaatatcc ctcagctgga 1740 ggacgtgagc cagttcctgc agacctgcac aggctttagg ctgaggccag tggcaggact 1800 gctgagctcc cgggacttcc tgggaggact ggccttcaga gtgtttcact gcacccagta 1860 catcaggcac ggctccaagc caatgtatac accagagccc gacatctgtc acgagctgct 1920 gggccacgtg cccctgttta gcgatagatc cttcgcccag ttttcccagg agatcggact 1980 ggcatctctg ggagcacctg acgagtacat cgagaagctg gccaccatct attggttcac 2040 agtggagttt ggcctgtgca agcagggcga tagcatcaag gcctacggag caggactgct 2100 gtctagcttc ggcgagctgc agtattgtct gtccgagaag ccaaagctgc tgcccctgga 2160 gctggagaag accgccatcc agaactacac cgtgacagag ttccagcccc tgtactatgt 2220 ggccgagtct tttaacgatg ccaaggagaa ggtgagaaat ttcgccgcca caatccctag 2280 gcccttcagc gtgcggtacg acccttatac ccagaggatc gaggtgctgg ataatacaca 2340 gcagctgaag atcctggctg actcaatcaa tagcgaaatc ggaatcctgt gctccgccct 2400 gcagaaaatc aaatgaggta ccgatccaga catgataaga tacattgatg agtttggaca 2460 aaccacaact agaatgcagt gaaaaaaatg ctttatttgt gaaatttgtg atgctattgc 2520 tttatttgta accattataa gctgcaataa acaagttaac aacaacaatt gcattcattt 2580 tatgtttcag gttcaggggg aggtgtggga ggttttttaa ggatccctgg gatgggatgt 2640 ggaatccttc tagatttctt ttgtaatatt tataaagtgc tctcagcaag gtatcaaaat 2700 ggcaaaattg tgagtaacta tcctcctttc attttgggaa gaagatgagg catgaagaga 2760 attcagacag aaacttactc agaccagggg aggcagaaac taagcagaga ggaaaatgac 2820 caagagttag ccctgggcat ggaatgtgaa agaaccctaa acgtgacttg gaaataatgc 2880 ccaaggtata ttccattctc cgggatttgt tggcattttc ttgaggtgaa gaattgcaga 2940 atacattctt taatgtgacc tacatattta cccatgggag gaagtctgct cctggactct 3000 tgagattcag tcataaagcc caggccaggg aaataatgta agtctgcagg cccctgtcat 3060 cagtaggatt agggagaaga gttctcagta gaaaacaggg aggctggaga gaaaagaatg 3120 gttaatgtta acgttaatat aactagaaag actgcagaac ttaggactga tttttatttg 3180 aatccttaaa aaaaaaaatt tcttatgaaa atagtacatg gctcttagga gacagaactt 3240 attgtacaga ggaacagcgt gagagtcaga gtgatcccag aacaggtcct ggctccatcc 3300 tgcacatagt tttggtgctg ctggcaatac ggtccccaca actgtgggaa ggggttaggg 3360 gcagggatct catcaggaaa gcataggggt ttaaagttct ttatagagca cttagaagat 3420 tgagaatcca caaattatat taataacaaa caaagtagtg tcgtgttata tagtaaatgt 3480 gaatttgcag acacatttag ggaaaagtta taattaaaaa aataggctgt atatata 3537 <210> 47 <211> 3537 <212> DNA <213> Artificial Sequence <220> <223> 32.2 vector correction genome <400> 47 gcttcaggag cagttgtgcg aatagctgga gaacaccagg ctggatttaa acccagatcg 60 ctcttacatt tgctctttac ctgctgtgct cagcgttcac gtgccctcta gctgtagttt 120 tctgaagtca gcgcacagca aggcagtgtg cttagaggtt aacagaaggg aaaacaacaa 180 caacaaaaat ctaaatgaga atcctgactg tttcagctgg gggtaagggg ggcggattat 240 tcatataatt gttataccag acggtcgcag gcttagtcca attgcagaga actcgcttcc 300 caggcttctg agagtcccgg aagtgcctaa acctgtctaa tcgacggggc ttgggtggcc 360 cgtcgctccc tggcttcttc cctttaccca gggcgggcag cgaagtggtg cctcctgcgt 420 cccccacacc ctccctcagc ccctcccctc cggcccgtcc tgggcaggtg acctggagca 480 tccggcaggc tgccctggcc tcctgcgtca ggacaacgcc cacgaggggc gttactgtgc 540 ggagatgcac cacgcaagag acaccctttg taactctctt ctcctcccta gtgcgaggtt 600 aaaaccttca gccccacgtg ctgtttgcaa acctgcctgt acctgaggcc ctaaaaagcc 660 agagacctca ctcccgggga gccaccatgg cggcggcggt cctggaaaac ccaggcttgg 720 gcaggaaact ctctgacttt ggacaggtga gccacggcag cctgagctgc tcagttaggg 780 gaatttgggc ctccagagaa agagatccga agactgctgg tgcttcctgg tttcataagc 840 tcagtaagaa gtctgaattc gttggaagct gatgagaata tccaggaagt caacagacaa 900 atgtcctcaa caattgtttc taagtaggag aacatctgtc ctcggtggct ttcacaggaa 960 aagcttctga cctcttctct tcctcccaca gggcagcgga gctactaact tcagcctgct 1020 gaagcaggct ggagacgtgg aggagaaccc tggacctatg tccaccgctg tgctggagaa 1080 ccctgggctg gggaggaaac tgtcagactt cgggcaggag acttcataca ttgaggataa 1140 ctgtaaccag aatggcgcca tctctctgat cttcagcctg aaggaggaag tgggcgccct 1200 ggcaaaggtg ctgcgcctgt ttgaggagaa cgacgtgaat ctgacccaca tcgagtcccg 1260 gccttctaga ctgaagaagg acgagtacga gttctttacc cacctggata agcggtccct 1320 gccagccctg acaaacatca tcaagatcct gaggcacgac atcggagcaa ccgtgcacga 1380 gctgtctcgg gacaagaaga aggataccgt gccctggttc cctcggacaa tccaggagct 1440 ggatagattt gccaaccaga tcctgtctta cggagcagag ctggacgcag atcaccctgg 1500 cttcaaggac ccagtgtatc gggcccggag aaagcagttt gccgatatcg cctacaatta 1560 taggcacgga cagccaatcc ctcgcgtgga gtatatggag gaggagaaga agacctgggg 1620 cacagtgttc aagaccctga agagcctgta caagacacac gcctgctacg agtataacca 1680 catcttcccc ctgctggaga agtattgtgg ctttcacgag gacaatatcc ctcagctgga 1740 ggacgtgagc cagttcctgc agacctgcac aggctttagg ctgaggccag tggcaggact 1800 gctgagctcc cgggacttcc tgggaggact ggccttcaga gtgtttcact gcacccagta 1860 catcaggcac ggctccaagc caatgtatac accagagccc gacatctgtc acgagctgct 1920 gggccacgtg cccctgttta gcgatagatc cttcgcccag ttttcccagg agatcggact 1980 ggcatctctg ggagcacctg acgagtacat cgagaagctg gccaccatct attggttcac 2040 agtggagttt ggcctgtgca agcagggcga tagcatcaag gcctacggag caggactgct 2100 gtctagcttc ggcgagctgc agtattgtct gtccgagaag ccaaagctgc tgcccctgga 2160 gctggagaag accgccatcc agaactacac cgtgacagag ttccagcccc tgtactatgt 2220 ggccgagtct tttaacgatg ccaaggagaa ggtgagaaat ttcgccgcca caatccctag 2280 gcccttcagc gtgcggtacg acccttatac ccagaggatc gaggtgctgg ataatacaca 2340 gcagctgaag atcctggctg actcaatcaa tagcgaaatc ggaatcctgt gctccgccct 2400 gcagaaaatc aaatgaggta ccgatccaga catgataaga tacattgatg agtttggaca 2460 aaccacaact agaatgcagt gaaaaaaatg ctttatttgt gaaatttgtg atgctattgc 2520 tttatttgta accattataa gctgcaataa acaagttaac aacaacaatt gcattcattt 2580 tatgtttcag gttcaggggg aggtgtggga ggttttttaa ggatccctgg gatgggatgt 2640 ggaatccttc tagatttctt ttgtaatatt tataaagtgc tctcagcaag gtatcaaaat 2700 ggcaaaattg tgagtaacta tcctcctttc attttgggaa gaagatgagg catgaagaga 2760 attcagacag aaacttactc agaccagggg aggcagaaac taagcagaga ggaaaatgac 2820 caagagttag ccctgggcat ggaatgtgaa agaaccctaa acgtgacttg gaaataatgc 2880 ccaaggtata ttccattctc cgggatttgt tggcattttc ttgaggtgaa gaattgcaga 2940 atacattctt taatgtgacc tacatattta cccatgggag gaagtctgct cctggactct 3000 tgagattcag tcataaagcc caggccaggg aaataatgta agtctgcagg cccctgtcat 3060 cagtaggatt agggagaaga gttctcagta gaaaacaggg aggctggaga gaaaagaatg 3120 gttaatgtta acgttaatat aactagaaag actgcagaac ttaggactga tttttatttg 3180 aatccttaaa aaaaaaaatt tcttatgaaa atagtacatg gctcttagga gacagaactt 3240 attgtacaga ggaacagcgt gagagtcaga gtgatcccag aacaggtcct ggctccatcc 3300 tgcacatagt tttggtgctg ctggcaatac ggtccccaca actgtgggaa ggggttaggg 3360 gcagggatct catcaggaaa gcataggggt ttaaagttct ttatagagca cttagaagat 3420 tgagaatcca caaattatat taataacaaa caaagtagtg tcgtgttata tagtaaatgt 3480 gaatttgcag acacatttag ggaaaagtta taattaaaaa aataggctgt atatata 3537 <210> 48 <211> 3537 <212> DNA <213> Artificial Sequence <220> <223> 32.3 vector correction genome <400> 48 gcttcaggag cagttgtgcg aatagctgga gaacaccagg ctggatttaa acccagatcg 60 ctcttacatt tgctctttac ctgctgtgct cagcgttcac gtgccctcta gctgtagttt 120 tctgaagtca gcgcacagca aggcagtgtg cttagaggtt aacagaaggg aaaacaacaa 180 caacaaaaat ctaaatgaga atcctgactg tttcagctga gagtaagggg ggcggattat 240 tcatataatt gttataccag acggtcgcag gcttagtcca attgcagaga actcgcttcc 300 caggcttctg agagtcccgg aagtgcctaa acctgtctaa tcgacggggc ttgggtggcc 360 cgtcgctccc tggcttcttc cctttaccca gggcgggcag cgaagtggtg cctcctgcgt 420 cccccacacc ctccctcagc ccctcccctc cggcccgtcc tgggcaggtg acctggagca 480 tccggcaggc tgccctggcc tcctgcgtca ggacaacgcc cacgaggggc gttactgtgc 540 ggagatgcac cacgcaagag acaccctttg taactctctt ctcctcccta gtgcgaggtt 600 aaaaccttca gccccacgtg ctgtttgcaa acctgcctgt acctgaggcc ctaaaaagcc 660 agagacctca ctcccgggga gccagcatgt ccactgcggt cctggaaaac ccaggcttgg 720 gcaggaaact ctctgacttt ggacaggtga gccacggcag cctgagctgc tcagttaggg 780 gaatttgggc ctccagagaa agagatccga agactgctgg tgcttcctgg tttcataagc 840 tcagtaagaa gtctgaattc gttggaagct gatgagaata tccaggaagt caacagacaa 900 atgtcctcaa caattgtttc taagtaggag aacatctgtc ctcggtggct ttcacaggaa 960 aagcttctga cctcttctct tcctcccaca gggcagcgga gctactaact tcagcctgct 1020 gaagcaggct ggagacgtgg aggagaaccc tggacctatg tccaccgctg tgctggagaa 1080 ccctgggctg gggaggaaac tgtcagactt cgggcaggag acttcataca ttgaggataa 1140 ctgtaaccag aatggcgcca tctctctgat cttcagcctg aaggaggaag tgggcgccct 1200 ggcaaaggtg ctgcgcctgt ttgaggagaa cgacgtgaat ctgacccaca tcgagtcccg 1260 gccttctaga ctgaagaagg acgagtacga gttctttacc cacctggata agcggtccct 1320 gccagccctg acaaacatca tcaagatcct gaggcacgac atcggagcaa ccgtgcacga 1380 gctgtctcgg gacaagaaga aggataccgt gccctggttc cctcggacaa tccaggagct 1440 ggatagattt gccaaccaga tcctgtctta cggagcagag ctggacgcag atcaccctgg 1500 cttcaaggac ccagtgtatc gggcccggag aaagcagttt gccgatatcg cctacaatta 1560 taggcacgga cagccaatcc ctcgcgtgga gtatatggag gaggagaaga agacctgggg 1620 cacagtgttc aagaccctga agagcctgta caagacacac gcctgctacg agtataacca 1680 catcttcccc ctgctggaga agtattgtgg ctttcacgag gacaatatcc ctcagctgga 1740 ggacgtgagc cagttcctgc agacctgcac aggctttagg ctgaggccag tggcaggact 1800 gctgagctcc cgggacttcc tgggaggact ggccttcaga gtgtttcact gcacccagta 1860 catcaggcac ggctccaagc caatgtatac accagagccc gacatctgtc acgagctgct 1920 gggccacgtg cccctgttta gcgatagatc cttcgcccag ttttcccagg agatcggact 1980 ggcatctctg ggagcacctg acgagtacat cgagaagctg gccaccatct attggttcac 2040 agtggagttt ggcctgtgca agcagggcga tagcatcaag gcctacggag caggactgct 2100 gtctagcttc ggcgagctgc agtattgtct gtccgagaag ccaaagctgc tgcccctgga 2160 gctggagaag accgccatcc agaactacac cgtgacagag ttccagcccc tgtactatgt 2220 ggccgagtct tttaacgatg ccaaggagaa ggtgagaaat ttcgccgcca caatccctag 2280 gcccttcagc gtgcggtacg acccttatac ccagaggatc gaggtgctgg ataatacaca 2340 gcagctgaag atcctggctg actcaatcaa tagcgaaatc ggaatcctgt gctccgccct 2400 gcagaaaatc aaatgaggta ccgatccaga catgataaga tacattgatg agtttggaca 2460 aaccacaact agaatgcagt gaaaaaaatg ctttatttgt gaaatttgtg atgctattgc 2520 tttatttgta accattataa gctgcaataa acaagttaac aacaacaatt gcattcattt 2580 tatgtttcag gttcaggggg aggtgtggga ggttttttaa ggatccctgg gatgggatgt 2640 ggaatccttc tagatttctt ttgtaatatt tataaagtgc tctcagcaag gtatcaaaat 2700 ggcaaaattg tgagtaacta tcctcctttc attttgggaa gaagatgagg catgaagaga 2760 attcagacag aaacttactc agaccagggg aggcagaaac taagcagaga ggaaaatgac 2820 caagagttag ccctgggcat ggaatgtgaa agaaccctaa acgtgacttg gaaataatgc 2880 ccaaggtata ttccattctc cgggatttgt tggcattttc ttgaggtgaa gaattgcaga 2940 atacattctt taatgtgacc tacatattta cccatgggag gaagtctgct cctggactct 3000 tgagattcag tcataaagcc caggccaggg aaataatgta agtctgcagg cccctgtcat 3060 cagtaggatt agggagaaga gttctcagta gaaaacaggg aggctggaga gaaaagaatg 3120 gttaatgtta acgttaatat aactagaaag actgcagaac ttaggactga tttttatttg 3180 aatccttaaa aaaaaaaatt tcttatgaaa atagtacatg gctcttagga gacagaactt 3240 attgtacaga ggaacagcgt gagagtcaga gtgatcccag aacaggtcct ggctccatcc 3300 tgcacatagt tttggtgctg ctggcaatac ggtccccaca actgtgggaa ggggttaggg 3360 gcagggatct catcaggaaa gcataggggt ttaaagttct ttatagagca cttagaagat 3420 tgagaatcca caaattatat taataacaaa caaagtagtg tcgtgttata tagtaaatgt 3480 gaatttgcag acacatttag ggaaaagtta taattaaaaa aataggctgt atatata 3537 <210> 49 <211> 3537 <212> DNA <213> Artificial Sequence <220> <223> 32.4 vector correction genome <400> 49 gcttcaggag cagttgtgcg aatagctgga gaacaccagg ctggatttaa acccagatcg 60 ctcttacatt tgctctttac ctgctgtgct cagcgttcac gtgccctcta gctgtagttt 120 tctgaagtca gcgcacagca aggcagtgtg cttagaggtt aacagaaggg aaaacaacaa 180 caacaaaaat ctaaatgaga atcctgactg tttcagctgg gggtaagggg ggcggattat 240 tcatataatt gttataccag acggtcgcag gcttagtcca attgcagaga actcgcttcc 300 caggcttctg agagtcccgg aagtgcctaa acctgtctaa tcgacggggc ttgggtggcc 360 cgtcgctccc tggcttcttc cctttaccca gggcgggcag cgaagtggtg cctcctgcgt 420 cccccacacc ctccctcagc ccctcccctc cggcccgtcc tgggcaggtg acctggagca 480 tccggcaggc tgccctggcc tcctgagtca ggacaacgcc cacgaggggc gttactgtgc 540 ggagatgcac cacgcaagag acaccctttg taactctctt ctcctcccta gtgcgaggtt 600 aaaaccttca gccccacgtg ctgtttgcaa acctgcctgt acctgaggcc ctaaaaagcc 660 agagacctca ctcccgggga gccagcatgt ccactgcggt cctggaaaac ccaggcttgg 720 gcaggaaact ctctgacttt ggacaggtga gccacggcag cctgagctgc tcagttaggg 780 gaatttgggc ctccagagaa agagatccga agactgctgg tgcttcctgg tttcataagc 840 tcagtaagaa gtctgaattc gttggaagct gatgagaata tccaggaagt caacagacaa 900 atgtcctcaa caattgtttc taagtaggag aacatctgtc ctcggtggct ttcacaggaa 960 aagcttctga cctcttctct tcctcccaca gggcagcgga gctactaact tcagcctgct 1020 gaagcaggct ggagacgtgg aggagaaccc tggacctatg tccaccgctg tgctggagaa 1080 ccctgggctg gggaggaaac tgtcagactt cgggcaggag acttcataca ttgaggataa 1140 ctgtaaccag aatggcgcca tctctctgat cttcagcctg aaggaggaag tgggcgccct 1200 ggcaaaggtg ctgcgcctgt ttgaggagaa cgacgtgaat ctgacccaca tcgagtcccg 1260 gccttctaga ctgaagaagg acgagtacga gttctttacc cacctggata agcggtccct 1320 gccagccctg acaaacatca tcaagatcct gaggcacgac atcggagcaa ccgtgcacga 1380 gctgtctcgg gacaagaaga aggataccgt gccctggttc cctcggacaa tccaggagct 1440 ggatagattt gccaaccaga tcctgtctta cggagcagag ctggacgcag atcaccctgg 1500 cttcaaggac ccagtgtatc gggcccggag aaagcagttt gccgatatcg cctacaatta 1560 taggcacgga cagccaatcc ctcgcgtgga gtatatggag gaggagaaga agacctgggg 1620 cacagtgttc aagaccctga agagcctgta caagacacac gcctgctacg agtataacca 1680 catcttcccc ctgctggaga agtattgtgg ctttcacgag gacaatatcc ctcagctgga 1740 ggacgtgagc cagttcctgc agacctgcac aggctttagg ctgaggccag tggcaggact 1800 gctgagctcc cgggacttcc tgggaggact ggccttcaga gtgtttcact gcacccagta 1860 catcaggcac ggctccaagc caatgtatac accagagccc gacatctgtc acgagctgct 1920 gggccacgtg cccctgttta gcgatagatc cttcgcccag ttttcccagg agatcggact 1980 ggcatctctg ggagcacctg acgagtacat cgagaagctg gccaccatct attggttcac 2040 agtggagttt ggcctgtgca agcagggcga tagcatcaag gcctacggag caggactgct 2100 gtctagcttc ggcgagctgc agtattgtct gtccgagaag ccaaagctgc tgcccctgga 2160 gctggagaag accgccatcc agaactacac cgtgacagag ttccagcccc tgtactatgt 2220 ggccgagtct tttaacgatg ccaaggagaa ggtgagaaat ttcgccgcca caatccctag 2280 gcccttcagc gtgcggtacg acccttatac ccagaggatc gaggtgctgg ataatacaca 2340 gcagctgaag atcctggctg actcaatcaa tagcgaaatc ggaatcctgt gctccgccct 2400 gcagaaaatc aaatgaggta ccgatccaga catgataaga tacattgatg agtttggaca 2460 aaccacaact agaatgcagt gaaaaaaatg ctttatttgt gaaatttgtg atgctattgc 2520 tttatttgta accattataa gctgcaataa acaagttaac aacaacaatt gcattcattt 2580 tatgtttcag gttcaggggg aggtgtggga ggttttttaa ggatccctgg gatgggatgt 2640 ggaatccttc tagatttctt ttgtaatatt tataaagtgc tctcagcaag gtatcaaaat 2700 ggcaaaattg tgagtaacta tcctcctttc attttgggaa gaagatgagg catgaagaga 2760 attcagacag aaacttactc agaccagggg aggcagaaac taagcagaga ggaaaatgac 2820 caagagttag ccctgggcat ggaatgtgaa agaaccctaa acgtgacttg gaaataatgc 2880 ccaaggtata ttccattctc cgggatttgt tggcattttc ttgaggtgaa gaattgcaga 2940 atacattctt taatgtgacc tacatattta cccatgggag gaagtctgct cctggactct 3000 tgagattcag tcataaagcc caggccaggg aaataatgta agtctgcagg cccctgtcat 3060 cagtaggatt agggagaaga gttctcagta gaaaacaggg aggctggaga gaaaagaatg 3120 gttaatgtta acgttaatat aactagaaag actgcagaac ttaggactga tttttatttg 3180 aatccttaaa aaaaaaaatt tcttatgaaa atagtacatg gctcttagga gacagaactt 3240 attgtacaga ggaacagcgt gagagtcaga gtgatcccag aacaggtcct ggctccatcc 3300 tgcacatagt tttggtgctg ctggcaatac ggtccccaca actgtgggaa ggggttaggg 3360 gcagggatct catcaggaaa gcataggggt ttaaagttct ttatagagca cttagaagat 3420 tgagaatcca caaattatat taataacaaa caaagtagtg tcgtgttata tagtaaatgt 3480 gaatttgcag acacatttag ggaaaagtta taattaaaaa aataggctgt atatata 3537 <210> 50 <211> 3537 <212> DNA <213> Artificial Sequence <220> <223> 32.5 vector correction genome <400> 50 gcttcaggag cagttgtgcg aatagctgga gaacaccagg ctggatttaa acccagatcg 60 ctcttacatt tgctctttac ctgctgtgct cagcgttcac gtgccctcta gctgtagttt 120 tctgaagtca gcgcacagca aggcagtgtg cttagaggtt aacagaaggg aaaacaacaa 180 caacaaaaat ctaaatgaga atcctgactg tttcagctgg gggtaagggg ggcggattat 240 tcatataatt gttataccag acggtcgcag gcttagtcca attgcagaga actcgcttcc 300 caggcttctg agagtcccgg aagtgcctaa acctgtctaa tcgacggggc ttgggtggcc 360 cgtcgctccc tggcttcttc cctttaccca gggcgggcag cgaagtggtg cctcctgcgt 420 cccccacacc ctccctcagc ccctcccctc cggcccgtcc tgggcaggtg acgtcaagca 480 tccggcaggc tgccctggcc tcctgagtca ggacaacgcc cacgaggggc gttactgtgc 540 ggagatgcac cacgcaagag acaccctttg taactctctt ctcctcccta gtgcgaggtt 600 aaaaccttca gccccacgtg ctgtttgcaa acctgcctgt acctgaggcc ctaaaaagcc 660 agagacctca ctcccgggga gccagcatgt ccactgcggt cctggaaaac ccaggcttgg 720 gcaggaaact ctctgacttt ggacaggtga gccacggcag cctgagctgc tcagttaggg 780 gaatttgggc ctccagagaa agagatccga agactgctgg tgcttcctgg tttcataagc 840 tcagtaagaa gtctgaattc gttggaagct gatgagaata tccaggaagt caacagacaa 900 atgtcctcaa caattgtttc taagtaggag aacatctgtc ctcggtggct ttcacaggaa 960 aagcttctga cctcttctct tcctcccaca gggcagcgga gctactaact tcagcctgct 1020 gaagcaggct ggagacgtgg aggagaaccc tggacctatg tccaccgctg tgctggagaa 1080 ccctgggctg gggaggaaac tgtcagactt cgggcaggag acttcataca ttgaggataa 1140 ctgtaaccag aatggcgcca tctctctgat cttcagcctg aaggaggaag tgggcgccct 1200 ggcaaaggtg ctgcgcctgt ttgaggagaa cgacgtgaat ctgacccaca tcgagtcccg 1260 gccttctaga ctgaagaagg acgagtacga gttctttacc cacctggata agcggtccct 1320 gccagccctg acaaacatca tcaagatcct gaggcacgac atcggagcaa ccgtgcacga 1380 gctgtctcgg gacaagaaga aggataccgt gccctggttc cctcggacaa tccaggagct 1440 ggatagattt gccaaccaga tcctgtctta cggagcagag ctggacgcag atcaccctgg 1500 cttcaaggac ccagtgtatc gggcccggag aaagcagttt gccgatatcg cctacaatta 1560 taggcacgga cagccaatcc ctcgcgtgga gtatatggag gaggagaaga agacctgggg 1620 cacagtgttc aagaccctga agagcctgta caagacacac gcctgctacg agtataacca 1680 catcttcccc ctgctggaga agtattgtgg ctttcacgag gacaatatcc ctcagctgga 1740 ggacgtgagc cagttcctgc agacctgcac aggctttagg ctgaggccag tggcaggact 1800 gctgagctcc cgggacttcc tgggaggact ggccttcaga gtgtttcact gcacccagta 1860 catcaggcac ggctccaagc caatgtatac accagagccc gacatctgtc acgagctgct 1920 gggccacgtg cccctgttta gcgatagatc cttcgcccag ttttcccagg agatcggact 1980 ggcatctctg ggagcacctg acgagtacat cgagaagctg gccaccatct attggttcac 2040 agtggagttt ggcctgtgca agcagggcga tagcatcaag gcctacggag caggactgct 2100 gtctagcttc ggcgagctgc agtattgtct gtccgagaag ccaaagctgc tgcccctgga 2160 gctggagaag accgccatcc agaactacac cgtgacagag ttccagcccc tgtactatgt 2220 ggccgagtct tttaacgatg ccaaggagaa ggtgagaaat ttcgccgcca caatccctag 2280 gcccttcagc gtgcggtacg acccttatac ccagaggatc gaggtgctgg ataatacaca 2340 gcagctgaag atcctggctg actcaatcaa tagcgaaatc ggaatcctgt gctccgccct 2400 gcagaaaatc aaatgaggta ccgatccaga catgataaga tacattgatg agtttggaca 2460 aaccacaact agaatgcagt gaaaaaaatg ctttatttgt gaaatttgtg atgctattgc 2520 tttatttgta accattataa gctgcaataa acaagttaac aacaacaatt gcattcattt 2580 tatgtttcag gttcaggggg aggtgtggga ggttttttaa ggatccctgg gatgggatgt 2640 ggaatccttc tagatttctt ttgtaatatt tataaagtgc tctcagcaag gtatcaaaat 2700 ggcaaaattg tgagtaacta tcctcctttc attttgggaa gaagatgagg catgaagaga 2760 attcagacag aaacttactc agaccagggg aggcagaaac taagcagaga ggaaaatgac 2820 caagagttag ccctgggcat ggaatgtgaa agaaccctaa acgtgacttg gaaataatgc 2880 ccaaggtata ttccattctc cgggatttgt tggcattttc ttgaggtgaa gaattgcaga 2940 atacattctt taatgtgacc tacatattta cccatgggag gaagtctgct cctggactct 3000 tgagattcag tcataaagcc caggccaggg aaataatgta agtctgcagg cccctgtcat 3060 cagtaggatt agggagaaga gttctcagta gaaaacaggg aggctggaga gaaaagaatg 3120 gttaatgtta acgttaatat aactagaaag actgcagaac ttaggactga tttttatttg 3180 aatccttaaa aaaaaaaatt tcttatgaaa atagtacatg gctcttagga gacagaactt 3240 attgtacaga ggaacagcgt gagagtcaga gtgatcccag aacaggtcct ggctccatcc 3300 tgcacatagt tttggtgctg ctggcaatac ggtccccaca actgtgggaa ggggttaggg 3360 gcagggatct catcaggaaa gcataggggt ttaaagttct ttatagagca cttagaagat 3420 tgagaatcca caaattatat taataacaaa caaagtagtg tcgtgttata tagtaaatgt 3480 gaatttgcag acacatttag ggaaaagtta taattaaaaa aataggctgt atatata 3537 <210> 51 <211> 3537 <212> DNA <213> Artificial Sequence <220> <223> 32.6 vector correction genome <400> 51 gcttcaggag cagttgtgcg aatagctgga gaacaccagg ctggatttaa acccagatcg 60 ctcttacatt tgctctttac ctgctgtgct cagcgttcac gtgccctcta gctgtagttt 120 tctgaagtca gcgcacagca aggcagtgtg cttagaggtt aacagaaggg aaaacaacaa 180 caacaaaaat ctaaatgaga atcctgactg tttcagctgg gggtaagggg ggcggattat 240 tcatataatt gttataccag acggtcgcag gcttagtcca attgcagaga actcgcttcc 300 caggcttctg agagtcccgg aagtgcctaa acctgtctaa tcgacggggc ttgggtggcc 360 cgtcgctccc tggcttcttc cctttaccca gggcgggcag cgaagtggtg cctcctgcgt 420 cccccacacc ctccctcagc ccctcccctc cggcccgtcc tgggcaggtg acctggagca 480 tccggcaggc tgccctggcc tcctgcgtca ggacaacgcc cacgaggggc gttactgtgc 540 ggagatgcac cacgcaagag acaccctttg taactctctt ctcctcccta gtgcgaggtt 600 aaaaccttca gccccacgtg ctgtttgcaa acctgcctgt acctgaggcc ctaaaaagcc 660 agagacctca ctcccgggga gccagcatgt ccactgcggt cctggaaaac ccaggcttgg 720 gcaggaaact ctctgacttt ggacaggtga gccacggcag cctgagctgc tcagttaggg 780 gaatttgggc ctccagagaa agagatccga agactgctgg tgcttcctgg tttcataagc 840 tcagtaagaa gtctgaattc gttggaagct gatgagaatg tccaggaagt caacagacaa 900 atgtcctcaa caattgtttc taagtaggag aacatctgtc ctcggtggct ttcacaggaa 960 aagcttctga cctcttctct tcctcccaca gggcagcgga gctactaact tcagcctgct 1020 gaagcaggct ggagacgtgg aggagaaccc tggacctatg tccaccgctg tgctggagaa 1080 ccctgggctg gggaggaaac tgtcagactt cgggcaggag acttcataca ttgaggataa 1140 ctgtaaccag aatggcgcca tctctctgat cttcagcctg aaggaggaag tgggcgccct 1200 ggcaaaggtg ctgcgcctgt ttgaggagaa cgacgtgaat ctgacccaca tcgagtcccg 1260 gccttctaga ctgaagaagg acgagtacga gttctttacc cacctggata agcggtccct 1320 gccagccctg acaaacatca tcaagatcct gaggcacgac atcggagcaa ccgtgcacga 1380 gctgtctcgg gacaagaaga aggataccgt gccctggttc cctcggacaa tccaggagct 1440 ggatagattt gccaaccaga tcctgtctta cggagcagag ctggacgcag atcaccctgg 1500 cttcaaggac ccagtgtatc gggcccggag aaagcagttt gccgatatcg cctacaatta 1560 taggcacgga cagccaatcc ctcgcgtgga gtatatggag gaggagaaga agacctgggg 1620 cacagtgttc aagaccctga agagcctgta caagacacac gcctgctacg agtataacca 1680 catcttcccc ctgctggaga agtattgtgg ctttcacgag gacaatatcc ctcagctgga 1740 ggacgtgagc cagttcctgc agacctgcac aggctttagg ctgaggccag tggcaggact 1800 gctgagctcc cgggacttcc tgggaggact ggccttcaga gtgtttcact gcacccagta 1860 catcaggcac ggctccaagc caatgtatac accagagccc gacatctgtc acgagctgct 1920 gggccacgtg cccctgttta gcgatagatc cttcgcccag ttttcccagg agatcggact 1980 ggcatctctg ggagcacctg acgagtacat cgagaagctg gccaccatct attggttcac 2040 agtggagttt ggcctgtgca agcagggcga tagcatcaag gcctacggag caggactgct 2100 gtctagcttc ggcgagctgc agtattgtct gtccgagaag ccaaagctgc tgcccctgga 2160 gctggagaag accgccatcc agaactacac cgtgacagag ttccagcccc tgtactatgt 2220 ggccgagtct tttaacgatg ccaaggagaa ggtgagaaat ttcgccgcca caatccctag 2280 gcccttcagc gtgcggtacg acccttatac ccagaggatc gaggtgctgg ataatacaca 2340 gcagctgaag atcctggctg actcaatcaa tagcgaaatc ggaatcctgt gctccgccct 2400 gcagaaaatc aaatgaggta ccgatccaga catgataaga tacattgatg agtttggaca 2460 aaccacaact agaatgcagt gaaaaaaatg ctttatttgt gaaatttgtg atgctattgc 2520 tttatttgta accattataa gctgcaataa acaagttaac aacaacaatt gcattcattt 2580 tatgtttcag gttcaggggg aggtgtggga ggttttttaa ggatccctgg gatgggatgt 2640 ggaatccttc tagatttctt ttgtaatatt tataaagtgc tctcagcaag gtatcaaaat 2700 ggcaaaattg tgagtaacta tcctcctttc attttgggaa gaagatgagg catgaagaga 2760 attcagacag aaacttactc agaccagggg aggcagaaac taagcagaga ggaaaatgac 2820 caagagttag ccctgggcat ggaatgtgaa agaaccctaa acgtgacttg gaaataatgc 2880 ccaaggtata ttccattctc cgggatttgt tggcattttc ttgaggtgaa gaattgcaga 2940 atacattctt taatgtgacc tacatattta cccatgggag gaagtctgct cctggactct 3000 tgagattcag tcataaagcc caggccaggg aaataatgta agtctgcagg cccctgtcat 3060 cagtaggatt agggagaaga gttctcagta gaaaacaggg aggctggaga gaaaagaatg 3120 gttaatgtta acgttaatat aactagaaag actgcagaac ttaggactga tttttatttg 3180 aatccttaaa aaaaaaaatt tcttatgaaa atagtacatg gctcttagga gacagaactt 3240 attgtacaga ggaacagcgt gagagtcaga gtgatcccag aacaggtcct ggctccatcc 3300 tgcacatagt tttggtgctg ctggcaatac ggtccccaca actgtgggaa ggggttaggg 3360 gcagggatct catcaggaaa gcataggggt ttaaagttct ttatagagca cttagaagat 3420 tgagaatcca caaattatat taataacaaa caaagtagtg tcgtgttata tagtaaatgt 3480 gaatttgcag acacatttag ggaaaagtta taattaaaaa aataggctgt atatata 3537 <210> 52 <211> 3537 <212> DNA <213> Artificial Sequence <220> <223> 32.7 vector correction genome <400> 52 gcttcaggag cagttgtgcg aatagctgga gaacaccagg ctggatttaa acccagatcg 60 ctcttacatt tgctctttac ctgctgtgct cagcgttcac gtgccctcta gctgtagttt 120 tctgaagtca gcgcacagca aggcagtgtg cttagaggtt aacagaaggg aaaacaacaa 180 caacaaaaat ctaaatgaga atcctgactg tttcagctgg gggtaagggg ggcggattat 240 tcatataatt gttccaccag acggtcgcag gcttagtcca attgcagaga actcgcttcc 300 caggcttctg agagtcccgg aagtgcctaa acctgtctaa tcgacggggc ttgggtggcc 360 cgtcgctccc tggcttcttc cctttaccca gggcgggcag cgaagtggtg cctcctgcgt 420 cccccacacc ctccctcagc ccctcccctc cggcccgtcc tgggcaggtg acctggagca 480 tccggcaggc tgccctggcc tcctgcgtca ggacaacgcc cacgaggggc gttactgtgc 540 ggagatgcac cacgcaagag acaccctttg taactctctt ctcctcccta gtgcgaggtt 600 aaaaccttca gccccacgtg ctgtttgcaa acctgcctgt acctgaggcc ctaaaaagcc 660 agagacctca ctcccgggga gccagcatgt ccactgcggt cctggaaaac ccaggcttgg 720 gcaggaaact ctctgacttt ggacaggtga gccacggcag cctgagctgc tcagttaggg 780 gaatttgggc ctccagagaa agagatccga agactgctgg tgcttcctgg tttcataagc 840 tcagtaagaa gtctgaattc gttggaagct gatgagaata tccaggaagt caacagacaa 900 atgtcctcaa caattgtttc taagtaggag aacatctgtc ctcggtggct ttcacaggaa 960 aagcttctga cctcttctct tcctcccaca gggcagcgga gctactaact tcagcctgct 1020 gaagcaggct ggagacgtgg aggagaaccc tggacctatg tccaccgctg tgctggagaa 1080 ccctgggctg gggaggaaac tgtcagactt cgggcaggag acttcataca ttgaggataa 1140 ctgtaaccag aatggcgcca tctctctgat cttcagcctg aaggaggaag tgggcgccct 1200 ggcaaaggtg ctgcgcctgt ttgaggagaa cgacgtgaat ctgacccaca tcgagtcccg 1260 gccttctaga ctgaagaagg acgagtacga gttctttacc cacctggata agcggtccct 1320 gccagccctg acaaacatca tcaagatcct gaggcacgac atcggagcaa ccgtgcacga 1380 gctgtctcgg gacaagaaga aggataccgt gccctggttc cctcggacaa tccaggagct 1440 ggatagattt gccaaccaga tcctgtctta cggagcagag ctggacgcag atcaccctgg 1500 cttcaaggac ccagtgtatc gggcccggag aaagcagttt gccgatatcg cctacaatta 1560 taggcacgga cagccaatcc ctcgcgtgga gtatatggag gaggagaaga agacctgggg 1620 cacagtgttc aagaccctga agagcctgta caagacacac gcctgctacg agtataacca 1680 catcttcccc ctgctggaga agtattgtgg ctttcacgag gacaatatcc ctcagctgga 1740 ggacgtgagc cagttcctgc agacctgcac aggctttagg ctgaggccag tggcaggact 1800 gctgagctcc cgggacttcc tgggaggact ggccttcaga gtgtttcact gcacccagta 1860 catcaggcac ggctccaagc caatgtatac accagagccc gacatctgtc acgagctgct 1920 gggccacgtg cccctgttta gcgatagatc cttcgcccag ttttcccagg agatcggact 1980 ggcatctctg ggagcacctg acgagtacat cgagaagctg gccaccatct attggttcac 2040 agtggagttt ggcctgtgca agcagggcga tagcatcaag gcctacggag caggactgct 2100 gtctagcttc ggcgagctgc agtattgtct gtccgagaag ccaaagctgc tgcccctgga 2160 gctggagaag accgccatcc agaactacac cgtgacagag ttccagcccc tgtactatgt 2220 ggccgagtct tttaacgatg ccaaggagaa ggtgagaaat ttcgccgcca caatccctag 2280 gcccttcagc gtgcggtacg acccttatac ccagaggatc gaggtgctgg ataatacaca 2340 gcagctgaag atcctggctg actcaatcaa tagcgaaatc ggaatcctgt gctccgccct 2400 gcagaaaatc aaatgaggta ccgatccaga catgataaga tacattgatg agtttggaca 2460 aaccacaact agaatgcagt gaaaaaaatg ctttatttgt gaaatttgtg atgctattgc 2520 tttatttgta accattataa gctgcaataa acaagttaac aacaacaatt gcattcattt 2580 tatgtttcag gttcaggggg aggtgtggga ggttttttaa ggatccctgg gatgggatgt 2640 ggaatccttc tagatttctt ttgtaatatt tataaagtgc tctcagcaag gtatcaaaat 2700 ggcaaaattg tgagtaacta tcctcctttc attttgggaa gaagatgagg catgaagaga 2760 attcagacag aaacttactc agaccagggg aggcagaaac taagcagaga ggaaaatgac 2820 caagagttag ccctgggcat ggaatgtgaa agaaccctaa acgtgacttg gaaataatgc 2880 ccaaggtata ttccattctc cgggatttgt tggcattttc ttgaggtgaa gaattgcaga 2940 atacattctt taatgtgacc tacatattta cccatgggag gaagtctgct cctggactct 3000 tgagattcag tcataaagcc caggccaggg aaataatgta agtctgcagg cccctgtcat 3060 cagtaggatt agggagaaga gttctcagta gaaaacaggg aggctggaga gaaaagaatg 3120 gttaatgtta acgttaatat aactagaaag actgcagaac ttaggactga tttttatttg 3180 aatccttaaa aaaaaaaatt tcttatgaaa atagtacatg gctcttagga gacagaactt 3240 attgtacaga ggaacagcgt gagagtcaga gtgatcccag aacaggtcct ggctccatcc 3300 tgcacatagt tttggtgctg ctggcaatac ggtccccaca actgtgggaa ggggttaggg 3360 gcagggatct catcaggaaa gcataggggt ttaaagttct ttatagagca cttagaagat 3420 tgagaatcca caaattatat taataacaaa caaagtagtg tcgtgttata tagtaaatgt 3480 gaatttgcag acacatttag ggaaaagtta taattaaaaa aataggctgt atatata 3537 <210> 53 <211> 3545 <212> DNA <213> Artificial Sequence <220> <223> 32.8 vector correction genome <400> 53 gcttcaggag cagttgtgcg aatagctgga gaacaccagg ctggatttaa acccagatcg 60 ctcttacatt tgctctttac ctgctgtgct cagcgttcac gtgccctcta gctgtagttt 120 tctgaagtca gcgcacagca aggcagtgtg cttagaggtt aacagaaggg aaaacaacaa 180 caacaaaaat ctaaatgaga atcctgactg tttcagctgg gggtaagggg ggcggattat 240 tcatataatt gttccaccag acggtcgcag gcttagtcca attgcagaga acacgctgtt 300 cttcgcccca ggcttctgag agtcccggaa gtgcctaaac ctgtctaatc gacggggctt 360 gggtggcccg tcgctccctg gcttcttccc tttacccagg gcgggcagcg aagtggtgcc 420 tcctgcgtcc cccacaccct ccctcagccc ctcccctccg gcccgtcctg ggcaggtgac 480 ctggagcatc cggcaggctg ccctggcctc ctgcgtcagg acaacgccca cgaggggcgt 540 tactgtgcgg agatgcacca cgcaagagac accctttgta actctcttct cctccctagt 600 gcgaggttaa aaccttcagc cccacgtgct gtttgcaaac ctgcctgtac ctgaggccct 660 aaaaagccag agacctcact cccggggagc cagcatgtcc actgcggtcc tggaaaaccc 720 aggcttgggc aggaaactct ctgactttgg acaggtgagc cacggcagcc tgagctgctc 780 agttagggga atttgggcct ccagagaaag agatccgaag actgctggtg cttcctggtt 840 tcataagctc agtaagaagt ctgaattcgt tggaagctga tgagaatatc caggaagtca 900 acagacaaat gtcctcaaca attgtttcta agtaggagaa catctgtcct cggtggcttt 960 cacaggaaaa gcttctgacc tcttctcttc ctcccacagg gcagcggagc tactaacttc 1020 agcctgctga agcaggctgg agacgtggag gagaaccctg gacctatgtc caccgctgtg 1080 ctggagaacc ctgggctggg gaggaaactg tcagacttcg ggcaggagac ttcatacatt 1140 gaggataact gtaaccagaa tggcgccatc tctctgatct tcagcctgaa ggaggaagtg 1200 ggcgccctgg caaaggtgct gcgcctgttt gaggagaacg acgtgaatct gacccacatc 1260 gagtcccggc cttctagact gaagaaggac gagtacgagt tctttaccca cctggataag 1320 cggtccctgc cagccctgac aaacatcatc aagatcctga ggcacgacat cggagcaacc 1380 gtgcacgagc tgtctcggga caagaagaag gataccgtgc cctggttccc tcggacaatc 1440 caggagctgg atagatttgc caaccagatc ctgtcttacg gagcagagct ggacgcagat 1500 caccctggct tcaaggaccc agtgtatcgg gcccggagaa agcagtttgc cgatatcgcc 1560 tacaattata ggcacggaca gccaatccct cgcgtggagt atatggagga ggagaagaag 1620 acctggggca cagtgttcaa gaccctgaag agcctgtaca agacacacgc ctgctacgag 1680 tataaccaca tcttccccct gctggagaag tattgtggct ttcacgagga caatatccct 1740 cagctggagg acgtgagcca gttcctgcag acctgcacag gctttaggct gaggccagtg 1800 gcaggactgc tgagctcccg ggacttcctg ggaggactgg ccttcagagt gtttcactgc 1860 acccagtaca tcaggcacgg ctccaagcca atgtatacac cagagcccga catctgtcac 1920 gagctgctgg gccacgtgcc cctgtttagc gatagatcct tcgcccagtt ttcccaggag 1980 atcggactgg catctctggg agcacctgac gagtacatcg agaagctggc caccatctat 2040 tggttcacag tggagtttgg cctgtgcaag cagggcgata gcatcaaggc ctacggagca 2100 ggactgctgt ctagcttcgg cgagctgcag tattgtctgt ccgagaagcc aaagctgctg 2160 cccctggagc tggagaagac cgccatccag aactacaccg tgacagagtt ccagcccctg 2220 tactatgtgg ccgagtcttt taacgatgcc aaggagaagg tgagaaattt cgccgccaca 2280 atccctaggc ccttcagcgt gcggtacgac ccttataccc agaggatcga ggtgctggat 2340 aatacacagc agctgaagat cctggctgac tcaatcaata gcgaaatcgg aatcctgtgc 2400 tccgccctgc agaaaatcaa atgaggtacc gatccagaca tgataagata cattgatgag 2460 tttggacaaa ccacaactag aatgcagtga aaaaaatgct ttatttgtga aatttgtgat 2520 gctattgctt tatttgtaac cattataagc tgcaataaac aagttaacaa caacaattgc 2580 attcatttta tgtttcaggt tcagggggag gtgtgggagg ttttttaagg atccctggga 2640 tgggatgtgg aatccttcta gatttctttt gtaatattta taaagtgctc tcagcaaggt 2700 atcaaaatgg caaaattgtg agtaactatc ctcctttcat tttgggaaga agatgaggca 2760 tgaagagaat tcagacagaa acttactcag accaggggag gcagaaacta agcagagagg 2820 aaaatgacca agagttagcc ctgggcatgg aatgtgaaag aaccctaaac gtgacttgga 2880 aataatgccc aaggtatatt ccattctccg ggatttgttg gcattttctt gaggtgaaga 2940 attgcagaat acattcttta atgtgaccta catatttacc catgggagga agtctgctcc 3000 tggactcttg agattcagtc ataaagccca ggccagggaa ataatgtaag tctgcaggcc 3060 cctgtcatca gtaggattag ggagaagagt tctcagtaga aaacagggag gctggagaga 3120 aaagaatggt taatgttaac gttaatataa ctagaaagac tgcagaactt aggactgatt 3180 tttatttgaa tccttaaaaa aaaaaatttc ttatgaaaat agtacatggc tcttaggaga 3240 cagaacttat tgtacagagg aacagcgtga gagtcagagt gatcccagaa caggtcctgg 3300 ctccatcctg cacatagttt tggtgctgct ggcaatacgg tccccacaac tgtgggaagg 3360 ggttaggggc agggatctca tcaggaaagc ataggggttt aaagttcttt atagagcact 3420 tagaagattg agaatccaca aattatatta ataacaaaca aagtagtgtc gtgttatata 3480 gtaaatgtga atttgcagac acatttaggg aaaagttata attaaaaaaa taggctgtat 3540 atata 3545 <210> 54 <211> 3537 <212> DNA <213> Artificial Sequence <220> <223> 32.9 vector correction genome <400> 54 gcttcaggag cagttgtgcg aatagctgga gaacaccagg ctggatttaa acccagatcg 60 ctcttacatt tgctctttac ctgctgtgct cagcgttcac gtgccctcta gctgtagttt 120 tctgaagtca gcgcacagca aggcagtgtg cttagaggtt aacagaaggg aaaacaacaa 180 caacaaaaat ctaaatgaga atcctgactg tttcagctga gagtaagggg ggcggattat 240 tcatataatt gttataccag acggtcgcag gcttagtcca attgcagaga actcgcttcc 300 caggcttctg agagtcccgg aagtgcctaa acctgtctaa tcgacagagc ttgggtggcc 360 cgtcgctccc tggcttcttc cctttaccca gggcgggcag cgaagtggtg cctcctgcgt 420 cccccacacc ctccctcagc ccctcccctc cggcccgtcc taggcaggtg acctgaagca 480 tccagcaggc tgccctggcc tcctgcgtca ggacaacgcc cacgaggggc gttactgtgc 540 ggagatgcac cacgcaagag acaccctttg taactctctt ctcctcccta gtgcgaggtt 600 aaaaccttca gccccacgtg ctgtttgcaa acctgcctgt acctgaggcc ctaaaaagcc 660 agagacctca ctcccgggga gccagcatgt ccactgcggt cctggaaaac ccaggcttgg 720 gcaggaaact ctctgacttt ggacaggtga gccacggcag cctgagctgc tcagttaggg 780 gaatttgggc ctccagagaa agagatccga agactgctgg tgcttcctgg tttcataagc 840 tcagtaagaa gtctgaattc gttggaagct gatgagaata tccaggaagt caacagacaa 900 atgtcctcaa caattgtttc taagtaggag aacatctgtc ctcggtggct ttcacaggaa 960 aagcttctga cctcttctct tcctcccaca gggcagcgga gctactaact tcagcctgct 1020 gaagcaggct ggagacgtgg aggagaaccc tggacctatg tccaccgctg tgctggagaa 1080 ccctgggctg gggaggaaac tgtcagactt cgggcaggag acttcataca ttgaggataa 1140 ctgtaaccag aatggcgcca tctctctgat cttcagcctg aaggaggaag tgggcgccct 1200 ggcaaaggtg ctgcgcctgt ttgaggagaa cgacgtgaat ctgacccaca tcgagtcccg 1260 gccttctaga ctgaagaagg acgagtacga gttctttacc cacctggata agcggtccct 1320 gccagccctg acaaacatca tcaagatcct gaggcacgac atcggagcaa ccgtgcacga 1380 gctgtctcgg gacaagaaga aggataccgt gccctggttc cctcggacaa tccaggagct 1440 ggatagattt gccaaccaga tcctgtctta cggagcagag ctggacgcag atcaccctgg 1500 cttcaaggac ccagtgtatc gggcccggag aaagcagttt gccgatatcg cctacaatta 1560 taggcacgga cagccaatcc ctcgcgtgga gtatatggag gaggagaaga agacctgggg 1620 cacagtgttc aagaccctga agagcctgta caagacacac gcctgctacg agtataacca 1680 catcttcccc ctgctggaga agtattgtgg ctttcacgag gacaatatcc ctcagctgga 1740 ggacgtgagc cagttcctgc agacctgcac aggctttagg ctgaggccag tggcaggact 1800 gctgagctcc cgggacttcc tgggaggact ggccttcaga gtgtttcact gcacccagta 1860 catcaggcac ggctccaagc caatgtatac accagagccc gacatctgtc acgagctgct 1920 gggccacgtg cccctgttta gcgatagatc cttcgcccag ttttcccagg agatcggact 1980 ggcatctctg ggagcacctg acgagtacat cgagaagctg gccaccatct attggttcac 2040 agtggagttt ggcctgtgca agcagggcga tagcatcaag gcctacggag caggactgct 2100 gtctagcttc ggcgagctgc agtattgtct gtccgagaag ccaaagctgc tgcccctgga 2160 gctggagaag accgccatcc agaactacac cgtgacagag ttccagcccc tgtactatgt 2220 ggccgagtct tttaacgatg ccaaggagaa ggtgagaaat ttcgccgcca caatccctag 2280 gcccttcagc gtgcggtacg acccttatac ccagaggatc gaggtgctgg ataatacaca 2340 gcagctgaag atcctggctg actcaatcaa tagcgaaatc ggaatcctgt gctccgccct 2400 gcagaaaatc aaatgaggta ccgatccaga catgataaga tacattgatg agtttggaca 2460 aaccacaact agaatgcagt gaaaaaaatg ctttatttgt gaaatttgtg atgctattgc 2520 tttatttgta accattataa gctgcaataa acaagttaac aacaacaatt gcattcattt 2580 tatgtttcag gttcaggggg aggtgtggga ggttttttaa ggatccctgg gatgggatgt 2640 ggaatccttc tagatttctt ttgtaatatt tataaagtgc tctcagcaag gtatcaaaat 2700 ggcaaaattg tgagtaacta tcctcctttc attttgggaa gaagatgagg catgaagaga 2760 attcagacag aaacttactc agaccagggg aggcagaaac taagcagaga ggaaaatgac 2820 caagagttag ccctgggcat ggaatgtgaa agaaccctaa acgtgacttg gaaataatgc 2880 ccaaggtata ttccattctc cgggatttgt tggcattttc ttgaggtgaa gaattgcaga 2940 atacattctt taatgtgacc tacatattta cccatgggag gaagtctgct cctggactct 3000 tgagattcag tcataaagcc caggccaggg aaataatgta agtctgcagg cccctgtcat 3060 cagtaggatt agggagaaga gttctcagta gaaaacaggg aggctggaga gaaaagaatg 3120 gttaatgtta acgttaatat aactagaaag actgcagaac ttaggactga tttttatttg 3180 aatccttaaa aaaaaaaatt tcttatgaaa atagtacatg gctcttagga gacagaactt 3240 attgtacaga ggaacagcgt gagagtcaga gtgatcccag aacaggtcct ggctccatcc 3300 tgcacatagt tttggtgctg ctggcaatac ggtccccaca actgtgggaa ggggttaggg 3360 gcagggatct catcaggaaa gcataggggt ttaaagttct ttatagagca cttagaagat 3420 tgagaatcca caaattatat taataacaaa caaagtagtg tcgtgttata tagtaaatgt 3480 gaatttgcag acacatttag ggaaaagtta taattaaaaa aataggctgt atatata 3537 <210> 55 <211> 3943 <212> DNA <213> Artificial Sequence <220> <223> 32.1 vector correction genome (+ ITRs) <400> 55 ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 60 cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag agagggagtg 120 gccaactcca tcactagggg ttcctggagg ggtggagtcg tgacgtgaat tacgtcatag 180 ggttagggag gtcctgcata tgcggccgct tcaggagcag ttgtgcgaat agctggagaa 240 caccaggctg gatttaaacc cagatcgctc ttacatttgc tctttacctg ctgtgctcag 300 cgttcacgtg ccctctagct gtagttttct gaagtcagcg cacagcaagg cagtgtgctt 360 agaggttaac agaagggaaa acaacaacaa caaaaatcta aatgagaatc ctgactgttt 420 cagctggggg taaggggggc ggattattca tataattgtt ataccagacg gtcgcaggct 480 tagtccaatt gcagagaact cgcttcccag gcttctgaga gtcccggaag tgcctaaacc 540 tgtctaatcg acggggcttg ggtggcccgt cgctccctgg cttcttccct ttacccaggg 600 cgggcagcga agtggtgcct cctgcgtccc ccacaccctc cctcagcccc tcccctccgg 660 cccgtcctgg gcaggtgacc tggagcatcc ggcaggctgc cctggcctcc tgcgtcagga 720 caacgcccac gaggggcgtt actgtgcgga gatgcaccac gcaagagaca ccctttgtaa 780 ctctcttctc ctccctagtg cgaggttaaa accttcagcc ccacgtgctg tttgcaaacc 840 tgcctgtacc tgaggcccta aaaagccaga gacctcactc ccggggagcc agcatgtcca 900 ctgcggtcct ggaaaaccca ggcttgggca ggaaactctc tgactttgga caggtgagcc 960 acggcagcct gagctgctca gttaggggaa tttgggcctc cagagaaaga gatccgaaga 1020 ctgctggtgc ttcctggttt cataagctca gtaagaagtc tgaattcgtt ggaagctgat 1080 gagaatatcc aggaagtcaa cagacaaatg tcctcaacaa ttgtttctaa gtaggagaac 1140 atctgtcctc ggtggctttc acaggaaaag cttctgacct cttctcttcc tcccacaggg 1200 cagcggagct actaacttca gcctgctgaa gcaggctgga gacgtggagg agaaccctgg 1260 acctatgtcc accgctgtgc tggagaaccc tgggctgggg aggaaactgt cagacttcgg 1320 gcaggagact tcatacattg aggataactg taaccagaat ggcgccatct ctctgatctt 1380 cagcctgaag gaggaagtgg gcgccctggc aaaggtgctg cgcctgtttg aggagaacga 1440 cgtgaatctg acccacatcg agtcccggcc ttctagactg aagaaggacg agtacgagtt 1500 ctttacccac ctggataagc ggtccctgcc agccctgaca aacatcatca agatcctgag 1560 gcacgacatc ggagcaaccg tgcacgagct gtctcgggac aagaagaagg ataccgtgcc 1620 ctggttccct cggacaatcc aggagctgga tagatttgcc aaccagatcc tgtcttacgg 1680 agcagagctg gacgcagatc accctggctt caaggaccca gtgtatcggg cccggagaaa 1740 gcagtttgcc gatatcgcct acaattatag gcacggacag ccaatccctc gcgtggagta 1800 tatggaggag gagaagaaga cctggggcac agtgttcaag accctgaaga gcctgtacaa 1860 gacacacgcc tgctacgagt ataaccacat cttccccctg ctggagaagt attgtggctt 1920 tcacgaggac aatatccctc agctggagga cgtgagccag ttcctgcaga cctgcacagg 1980 ctttaggctg aggccagtgg caggactgct gagctcccgg gacttcctgg gaggactggc 2040 cttcagagtg tttcactgca cccagtacat caggcacggc tccaagccaa tgtatacacc 2100 agagcccgac atctgtcacg agctgctggg ccacgtgccc ctgtttagcg atagatcctt 2160 cgcccagttt tcccaggaga tcggactggc atctctggga gcacctgacg agtacatcga 2220 gaagctggcc accatctatt ggttcacagt ggagtttggc ctgtgcaagc agggcgatag 2280 catcaaggcc tacggagcag gactgctgtc tagcttcggc gagctgcagt attgtctgtc 2340 cgagaagcca aagctgctgc ccctggagct ggagaagacc gccatccaga actacaccgt 2400 gacagagttc cagcccctgt actatgtggc cgagtctttt aacgatgcca aggagaaggt 2460 gagaaatttc gccgccacaa tccctaggcc cttcagcgtg cggtacgacc cttataccca 2520 gaggatcgag gtgctggata atacacagca gctgaagatc ctggctgact caatcaatag 2580 cgaaatcgga atcctgtgct ccgccctgca gaaaatcaaa tgaggtaccg atccagacat 2640 gataagatac attgatgagt ttggacaaac cacaactaga atgcagtgaa aaaaatgctt 2700 tatttgtgaa atttgtgatg ctattgcttt atttgtaacc attataagct gcaataaaca 2760 agttaacaac aacaattgca ttcattttat gtttcaggtt cagggggagg tgtgggaggt 2820 tttttaagga tccctgggat gggatgtgga atccttctag atttcttttg taatatttat 2880 aaagtgctct cagcaaggta tcaaaatggc aaaattgtga gtaactatcc tcctttcatt 2940 ttgggaagaa gatgaggcat gaagagaatt cagacagaaa cttactcaga ccaggggagg 3000 cagaaactaa gcagagagga aaatgaccaa gagttagccc tgggcatgga atgtgaaaga 3060 accctaaacg tgacttggaa ataatgccca aggtatattc cattctccgg gatttgttgg 3120 cattttcttg aggtgaagaa ttgcagaata cattctttaa tgtgacctac atatttaccc 3180 atgggaggaa gtctgctcct ggactcttga gattcagtca taaagcccag gccagggaaa 3240 taatgtaagt ctgcaggccc ctgtcatcag taggattagg gagaagagtt ctcagtagaa 3300 aacagggagg ctggagagaa aagaatggtt aatgttaacg ttaatataac tagaaagact 3360 gcagaactta ggactgattt ttatttgaat ccttaaaaaa aaaaatttct tatgaaaata 3420 gtacatggct cttaggagac agaacttatt gtacagagga acagcgtgag agtcagagtg 3480 atcccagaac aggtcctggc tccatcctgc acatagtttt ggtgctgctg gcaatacggt 3540 ccccacaact gtgggaaggg gttaggggca gggatctcat caggaaagca taggggttta 3600 aagttcttta tagagcactt agaagattga gaatccacaa attatattaa taacaaacaa 3660 agtagtgtcg tgttatatag taaatgtgaa tttgcagaca catttaggga aaagttataa 3720 ttaaaaaaat aggctgtata tatacctgca ggtctagata cgtagataag tagcatggcg 3780 ggttaatcat taactacaag gaacccctag tgatggagtt ggccactccc tctctgcgcg 3840 ctcgctcgct cactgaggcc gggcgaccaa aggtcgcccg acgcccgggc tttgcccggg 3900 cggcctcagt gagcgagcga gcgcgcagag agggagtggc caa 3943 <210> 56 <211> 3943 <212> DNA <213> Artificial Sequence <220> <223> 32.2 vector correction genome (+ ITRs) <400> 56 ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 60 cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag agagggagtg 120 gccaactcca tcactagggg ttcctggagg ggtggagtcg tgacgtgaat tacgtcatag 180 ggttagggag gtcctgcata tgcggccgct tcaggagcag ttgtgcgaat agctggagaa 240 caccaggctg gatttaaacc cagatcgctc ttacatttgc tctttacctg ctgtgctcag 300 cgttcacgtg ccctctagct gtagttttct gaagtcagcg cacagcaagg cagtgtgctt 360 agaggttaac agaagggaaa acaacaacaa caaaaatcta aatgagaatc ctgactgttt 420 cagctggggg taaggggggc ggattattca tataattgtt ataccagacg gtcgcaggct 480 tagtccaatt gcagagaact cgcttcccag gcttctgaga gtcccggaag tgcctaaacc 540 tgtctaatcg acggggcttg ggtggcccgt cgctccctgg cttcttccct ttacccaggg 600 cgggcagcga agtggtgcct cctgcgtccc ccacaccctc cctcagcccc tcccctccgg 660 cccgtcctgg gcaggtgacc tggagcatcc ggcaggctgc cctggcctcc tgcgtcagga 720 caacgcccac gaggggcgtt actgtgcgga gatgcaccac gcaagagaca ccctttgtaa 780 ctctcttctc ctccctagtg cgaggttaaa accttcagcc ccacgtgctg tttgcaaacc 840 tgcctgtacc tgaggcccta aaaagccaga gacctcactc ccggggagcc accatggcgg 900 cggcggtcct ggaaaaccca ggcttgggca ggaaactctc tgactttgga caggtgagcc 960 acggcagcct gagctgctca gttaggggaa tttgggcctc cagagaaaga gatccgaaga 1020 ctgctggtgc ttcctggttt cataagctca gtaagaagtc tgaattcgtt ggaagctgat 1080 gagaatatcc aggaagtcaa cagacaaatg tcctcaacaa ttgtttctaa gtaggagaac 1140 atctgtcctc ggtggctttc acaggaaaag cttctgacct cttctcttcc tcccacaggg 1200 cagcggagct actaacttca gcctgctgaa gcaggctgga gacgtggagg agaaccctgg 1260 acctatgtcc accgctgtgc tggagaaccc tgggctgggg aggaaactgt cagacttcgg 1320 gcaggagact tcatacattg aggataactg taaccagaat ggcgccatct ctctgatctt 1380 cagcctgaag gaggaagtgg gcgccctggc aaaggtgctg cgcctgtttg aggagaacga 1440 cgtgaatctg acccacatcg agtcccggcc ttctagactg aagaaggacg agtacgagtt 1500 ctttacccac ctggataagc ggtccctgcc agccctgaca aacatcatca agatcctgag 1560 gcacgacatc ggagcaaccg tgcacgagct gtctcgggac aagaagaagg ataccgtgcc 1620 ctggttccct cggacaatcc aggagctgga tagatttgcc aaccagatcc tgtcttacgg 1680 agcagagctg gacgcagatc accctggctt caaggaccca gtgtatcggg cccggagaaa 1740 gcagtttgcc gatatcgcct acaattatag gcacggacag ccaatccctc gcgtggagta 1800 tatggaggag gagaagaaga cctggggcac agtgttcaag accctgaaga gcctgtacaa 1860 gacacacgcc tgctacgagt ataaccacat cttccccctg ctggagaagt attgtggctt 1920 tcacgaggac aatatccctc agctggagga cgtgagccag ttcctgcaga cctgcacagg 1980 ctttaggctg aggccagtgg caggactgct gagctcccgg gacttcctgg gaggactggc 2040 cttcagagtg tttcactgca cccagtacat caggcacggc tccaagccaa tgtatacacc 2100 agagcccgac atctgtcacg agctgctggg ccacgtgccc ctgtttagcg atagatcctt 2160 cgcccagttt tcccaggaga tcggactggc atctctggga gcacctgacg agtacatcga 2220 gaagctggcc accatctatt ggttcacagt ggagtttggc ctgtgcaagc agggcgatag 2280 catcaaggcc tacggagcag gactgctgtc tagcttcggc gagctgcagt attgtctgtc 2340 cgagaagcca aagctgctgc ccctggagct ggagaagacc gccatccaga actacaccgt 2400 gacagagttc cagcccctgt actatgtggc cgagtctttt aacgatgcca aggagaaggt 2460 gagaaatttc gccgccacaa tccctaggcc cttcagcgtg cggtacgacc cttataccca 2520 gaggatcgag gtgctggata atacacagca gctgaagatc ctggctgact caatcaatag 2580 cgaaatcgga atcctgtgct ccgccctgca gaaaatcaaa tgaggtaccg atccagacat 2640 gataagatac attgatgagt ttggacaaac cacaactaga atgcagtgaa aaaaatgctt 2700 tatttgtgaa atttgtgatg ctattgcttt atttgtaacc attataagct gcaataaaca 2760 agttaacaac aacaattgca ttcattttat gtttcaggtt cagggggagg tgtgggaggt 2820 tttttaagga tccctgggat gggatgtgga atccttctag atttcttttg taatatttat 2880 aaagtgctct cagcaaggta tcaaaatggc aaaattgtga gtaactatcc tcctttcatt 2940 ttgggaagaa gatgaggcat gaagagaatt cagacagaaa cttactcaga ccaggggagg 3000 cagaaactaa gcagagagga aaatgaccaa gagttagccc tgggcatgga atgtgaaaga 3060 accctaaacg tgacttggaa ataatgccca aggtatattc cattctccgg gatttgttgg 3120 cattttcttg aggtgaagaa ttgcagaata cattctttaa tgtgacctac atatttaccc 3180 atgggaggaa gtctgctcct ggactcttga gattcagtca taaagcccag gccagggaaa 3240 taatgtaagt ctgcaggccc ctgtcatcag taggattagg gagaagagtt ctcagtagaa 3300 aacagggagg ctggagagaa aagaatggtt aatgttaacg ttaatataac tagaaagact 3360 gcagaactta ggactgattt ttatttgaat ccttaaaaaa aaaaatttct tatgaaaata 3420 gtacatggct cttaggagac agaacttatt gtacagagga acagcgtgag agtcagagtg 3480 atcccagaac aggtcctggc tccatcctgc acatagtttt ggtgctgctg gcaatacggt 3540 ccccacaact gtgggaaggg gttaggggca gggatctcat caggaaagca taggggttta 3600 aagttcttta tagagcactt agaagattga gaatccacaa attatattaa taacaaacaa 3660 agtagtgtcg tgttatatag taaatgtgaa tttgcagaca catttaggga aaagttataa 3720 ttaaaaaaat aggctgtata tatacctgca ggtctagata cgtagataag tagcatggcg 3780 ggttaatcat taactacaag gaacccctag tgatggagtt ggccactccc tctctgcgcg 3840 ctcgctcgct cactgaggcc gggcgaccaa aggtcgcccg acgcccgggc tttgcccggg 3900 cggcctcagt gagcgagcga gcgcgcagag agggagtggc caa 3943 <210> 57 <211> 3943 <212> DNA <213> Artificial Sequence <220> <223> 32.3 vector correction genome (+ ITRs) <400> 57 ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 60 cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag agagggagtg 120 gccaactcca tcactagggg ttcctggagg ggtggagtcg tgacgtgaat tacgtcatag 180 ggttagggag gtcctgcata tgcggccgct tcaggagcag ttgtgcgaat agctggagaa 240 caccaggctg gatttaaacc cagatcgctc ttacatttgc tctttacctg ctgtgctcag 300 cgttcacgtg ccctctagct gtagttttct gaagtcagcg cacagcaagg cagtgtgctt 360 agaggttaac agaagggaaa acaacaacaa caaaaatcta aatgagaatc ctgactgttt 420 cagctgagag taaggggggc ggattattca tataattgtt ataccagacg gtcgcaggct 480 tagtccaatt gcagagaact cgcttcccag gcttctgaga gtcccggaag tgcctaaacc 540 tgtctaatcg acggggcttg ggtggcccgt cgctccctgg cttcttccct ttacccaggg 600 cgggcagcga agtggtgcct cctgcgtccc ccacaccctc cctcagcccc tcccctccgg 660 cccgtcctgg gcaggtgacc tggagcatcc ggcaggctgc cctggcctcc tgcgtcagga 720 caacgcccac gaggggcgtt actgtgcgga gatgcaccac gcaagagaca ccctttgtaa 780 ctctcttctc ctccctagtg cgaggttaaa accttcagcc ccacgtgctg tttgcaaacc 840 tgcctgtacc tgaggcccta aaaagccaga gacctcactc ccggggagcc agcatgtcca 900 ctgcggtcct ggaaaaccca ggcttgggca ggaaactctc tgactttgga caggtgagcc 960 acggcagcct gagctgctca gttaggggaa tttgggcctc cagagaaaga gatccgaaga 1020 ctgctggtgc ttcctggttt cataagctca gtaagaagtc tgaattcgtt ggaagctgat 1080 gagaatatcc aggaagtcaa cagacaaatg tcctcaacaa ttgtttctaa gtaggagaac 1140 atctgtcctc ggtggctttc acaggaaaag cttctgacct cttctcttcc tcccacaggg 1200 cagcggagct actaacttca gcctgctgaa gcaggctgga gacgtggagg agaaccctgg 1260 acctatgtcc accgctgtgc tggagaaccc tgggctgggg aggaaactgt cagacttcgg 1320 gcaggagact tcatacattg aggataactg taaccagaat ggcgccatct ctctgatctt 1380 cagcctgaag gaggaagtgg gcgccctggc aaaggtgctg cgcctgtttg aggagaacga 1440 cgtgaatctg acccacatcg agtcccggcc ttctagactg aagaaggacg agtacgagtt 1500 ctttacccac ctggataagc ggtccctgcc agccctgaca aacatcatca agatcctgag 1560 gcacgacatc ggagcaaccg tgcacgagct gtctcgggac aagaagaagg ataccgtgcc 1620 ctggttccct cggacaatcc aggagctgga tagatttgcc aaccagatcc tgtcttacgg 1680 agcagagctg gacgcagatc accctggctt caaggaccca gtgtatcggg cccggagaaa 1740 gcagtttgcc gatatcgcct acaattatag gcacggacag ccaatccctc gcgtggagta 1800 tatggaggag gagaagaaga cctggggcac agtgttcaag accctgaaga gcctgtacaa 1860 gacacacgcc tgctacgagt ataaccacat cttccccctg ctggagaagt attgtggctt 1920 tcacgaggac aatatccctc agctggagga cgtgagccag ttcctgcaga cctgcacagg 1980 ctttaggctg aggccagtgg caggactgct gagctcccgg gacttcctgg gaggactggc 2040 cttcagagtg tttcactgca cccagtacat caggcacggc tccaagccaa tgtatacacc 2100 agagcccgac atctgtcacg agctgctggg ccacgtgccc ctgtttagcg atagatcctt 2160 cgcccagttt tcccaggaga tcggactggc atctctggga gcacctgacg agtacatcga 2220 gaagctggcc accatctatt ggttcacagt ggagtttggc ctgtgcaagc agggcgatag 2280 catcaaggcc tacggagcag gactgctgtc tagcttcggc gagctgcagt attgtctgtc 2340 cgagaagcca aagctgctgc ccctggagct ggagaagacc gccatccaga actacaccgt 2400 gacagagttc cagcccctgt actatgtggc cgagtctttt aacgatgcca aggagaaggt 2460 gagaaatttc gccgccacaa tccctaggcc cttcagcgtg cggtacgacc cttataccca 2520 gaggatcgag gtgctggata atacacagca gctgaagatc ctggctgact caatcaatag 2580 cgaaatcgga atcctgtgct ccgccctgca gaaaatcaaa tgaggtaccg atccagacat 2640 gataagatac attgatgagt ttggacaaac cacaactaga atgcagtgaa aaaaatgctt 2700 tatttgtgaa atttgtgatg ctattgcttt atttgtaacc attataagct gcaataaaca 2760 agttaacaac aacaattgca ttcattttat gtttcaggtt cagggggagg tgtgggaggt 2820 tttttaagga tccctgggat gggatgtgga atccttctag atttcttttg taatatttat 2880 aaagtgctct cagcaaggta tcaaaatggc aaaattgtga gtaactatcc tcctttcatt 2940 ttgggaagaa gatgaggcat gaagagaatt cagacagaaa cttactcaga ccaggggagg 3000 cagaaactaa gcagagagga aaatgaccaa gagttagccc tgggcatgga atgtgaaaga 3060 accctaaacg tgacttggaa ataatgccca aggtatattc cattctccgg gatttgttgg 3120 cattttcttg aggtgaagaa ttgcagaata cattctttaa tgtgacctac atatttaccc 3180 atgggaggaa gtctgctcct ggactcttga gattcagtca taaagcccag gccagggaaa 3240 taatgtaagt ctgcaggccc ctgtcatcag taggattagg gagaagagtt ctcagtagaa 3300 aacagggagg ctggagagaa aagaatggtt aatgttaacg ttaatataac tagaaagact 3360 gcagaactta ggactgattt ttatttgaat ccttaaaaaa aaaaatttct tatgaaaata 3420 gtacatggct cttaggagac agaacttatt gtacagagga acagcgtgag agtcagagtg 3480 atcccagaac aggtcctggc tccatcctgc acatagtttt ggtgctgctg gcaatacggt 3540 ccccacaact gtgggaaggg gttaggggca gggatctcat caggaaagca taggggttta 3600 aagttcttta tagagcactt agaagattga gaatccacaa attatattaa taacaaacaa 3660 agtagtgtcg tgttatatag taaatgtgaa tttgcagaca catttaggga aaagttataa 3720 ttaaaaaaat aggctgtata tatacctgca ggtctagata cgtagataag tagcatggcg 3780 ggttaatcat taactacaag gaacccctag tgatggagtt ggccactccc tctctgcgcg 3840 ctcgctcgct cactgaggcc gggcgaccaa aggtcgcccg acgcccgggc tttgcccggg 3900 cggcctcagt gagcgagcga gcgcgcagag agggagtggc caa 3943 <210> 58 <211> 3943 <212> DNA <213> Artificial Sequence <220> <223> 32.4 vector correction genome (+ ITRs) <400> 58 ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 60 cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag agagggagtg 120 gccaactcca tcactagggg ttcctggagg ggtggagtcg tgacgtgaat tacgtcatag 180 ggttagggag gtcctgcata tgcggccgct tcaggagcag ttgtgcgaat agctggagaa 240 caccaggctg gatttaaacc cagatcgctc ttacatttgc tctttacctg ctgtgctcag 300 cgttcacgtg ccctctagct gtagttttct gaagtcagcg cacagcaagg cagtgtgctt 360 agaggttaac agaagggaaa acaacaacaa caaaaatcta aatgagaatc ctgactgttt 420 cagctggggg taaggggggc ggattattca tataattgtt ataccagacg gtcgcaggct 480 tagtccaatt gcagagaact cgcttcccag gcttctgaga gtcccggaag tgcctaaacc 540 tgtctaatcg acggggcttg ggtggcccgt cgctccctgg cttcttccct ttacccaggg 600 cgggcagcga agtggtgcct cctgcgtccc ccacaccctc cctcagcccc tcccctccgg 660 cccgtcctgg gcaggtgacc tggagcatcc ggcaggctgc cctggcctcc tgagtcagga 720 caacgcccac gaggggcgtt actgtgcgga gatgcaccac gcaagagaca ccctttgtaa 780 ctctcttctc ctccctagtg cgaggttaaa accttcagcc ccacgtgctg tttgcaaacc 840 tgcctgtacc tgaggcccta aaaagccaga gacctcactc ccggggagcc agcatgtcca 900 ctgcggtcct ggaaaaccca ggcttgggca ggaaactctc tgactttgga caggtgagcc 960 acggcagcct gagctgctca gttaggggaa tttgggcctc cagagaaaga gatccgaaga 1020 ctgctggtgc ttcctggttt cataagctca gtaagaagtc tgaattcgtt ggaagctgat 1080 gagaatatcc aggaagtcaa cagacaaatg tcctcaacaa ttgtttctaa gtaggagaac 1140 atctgtcctc ggtggctttc acaggaaaag cttctgacct cttctcttcc tcccacaggg 1200 cagcggagct actaacttca gcctgctgaa gcaggctgga gacgtggagg agaaccctgg 1260 acctatgtcc accgctgtgc tggagaaccc tgggctgggg aggaaactgt cagacttcgg 1320 gcaggagact tcatacattg aggataactg taaccagaat ggcgccatct ctctgatctt 1380 cagcctgaag gaggaagtgg gcgccctggc aaaggtgctg cgcctgtttg aggagaacga 1440 cgtgaatctg acccacatcg agtcccggcc ttctagactg aagaaggacg agtacgagtt 1500 ctttacccac ctggataagc ggtccctgcc agccctgaca aacatcatca agatcctgag 1560 gcacgacatc ggagcaaccg tgcacgagct gtctcgggac aagaagaagg ataccgtgcc 1620 ctggttccct cggacaatcc aggagctgga tagatttgcc aaccagatcc tgtcttacgg 1680 agcagagctg gacgcagatc accctggctt caaggaccca gtgtatcggg cccggagaaa 1740 gcagtttgcc gatatcgcct acaattatag gcacggacag ccaatccctc gcgtggagta 1800 tatggaggag gagaagaaga cctggggcac agtgttcaag accctgaaga gcctgtacaa 1860 gacacacgcc tgctacgagt ataaccacat cttccccctg ctggagaagt attgtggctt 1920 tcacgaggac aatatccctc agctggagga cgtgagccag ttcctgcaga cctgcacagg 1980 ctttaggctg aggccagtgg caggactgct gagctcccgg gacttcctgg gaggactggc 2040 cttcagagtg tttcactgca cccagtacat caggcacggc tccaagccaa tgtatacacc 2100 agagcccgac atctgtcacg agctgctggg ccacgtgccc ctgtttagcg atagatcctt 2160 cgcccagttt tcccaggaga tcggactggc atctctggga gcacctgacg agtacatcga 2220 gaagctggcc accatctatt ggttcacagt ggagtttggc ctgtgcaagc agggcgatag 2280 catcaaggcc tacggagcag gactgctgtc tagcttcggc gagctgcagt attgtctgtc 2340 cgagaagcca aagctgctgc ccctggagct ggagaagacc gccatccaga actacaccgt 2400 gacagagttc cagcccctgt actatgtggc cgagtctttt aacgatgcca aggagaaggt 2460 gagaaatttc gccgccacaa tccctaggcc cttcagcgtg cggtacgacc cttataccca 2520 gaggatcgag gtgctggata atacacagca gctgaagatc ctggctgact caatcaatag 2580 cgaaatcgga atcctgtgct ccgccctgca gaaaatcaaa tgaggtaccg atccagacat 2640 gataagatac attgatgagt ttggacaaac cacaactaga atgcagtgaa aaaaatgctt 2700 tatttgtgaa atttgtgatg ctattgcttt atttgtaacc attataagct gcaataaaca 2760 agttaacaac aacaattgca ttcattttat gtttcaggtt cagggggagg tgtgggaggt 2820 tttttaagga tccctgggat gggatgtgga atccttctag atttcttttg taatatttat 2880 aaagtgctct cagcaaggta tcaaaatggc aaaattgtga gtaactatcc tcctttcatt 2940 ttgggaagaa gatgaggcat gaagagaatt cagacagaaa cttactcaga ccaggggagg 3000 cagaaactaa gcagagagga aaatgaccaa gagttagccc tgggcatgga atgtgaaaga 3060 accctaaacg tgacttggaa ataatgccca aggtatattc cattctccgg gatttgttgg 3120 cattttcttg aggtgaagaa ttgcagaata cattctttaa tgtgacctac atatttaccc 3180 atgggaggaa gtctgctcct ggactcttga gattcagtca taaagcccag gccagggaaa 3240 taatgtaagt ctgcaggccc ctgtcatcag taggattagg gagaagagtt ctcagtagaa 3300 aacagggagg ctggagagaa aagaatggtt aatgttaacg ttaatataac tagaaagact 3360 gcagaactta ggactgattt ttatttgaat ccttaaaaaa aaaaatttct tatgaaaata 3420 gtacatggct cttaggagac agaacttatt gtacagagga acagcgtgag agtcagagtg 3480 atcccagaac aggtcctggc tccatcctgc acatagtttt ggtgctgctg gcaatacggt 3540 ccccacaact gtgggaaggg gttaggggca gggatctcat caggaaagca taggggttta 3600 aagttcttta tagagcactt agaagattga gaatccacaa attatattaa taacaaacaa 3660 agtagtgtcg tgttatatag taaatgtgaa tttgcagaca catttaggga aaagttataa 3720 ttaaaaaaat aggctgtata tatacctgca ggtctagata cgtagataag tagcatggcg 3780 ggttaatcat taactacaag gaacccctag tgatggagtt ggccactccc tctctgcgcg 3840 ctcgctcgct cactgaggcc gggcgaccaa aggtcgcccg acgcccgggc tttgcccggg 3900 cggcctcagt gagcgagcga gcgcgcagag agggagtggc caa 3943 <210> 59 <211> 3943 <212> DNA <213> Artificial Sequence <220> <223> 32.5 vector correction genome (+ ITRs) <400> 59 ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 60 cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag agagggagtg 120 gccaactcca tcactagggg ttcctggagg ggtggagtcg tgacgtgaat tacgtcatag 180 ggttagggag gtcctgcata tgcggccgct tcaggagcag ttgtgcgaat agctggagaa 240 caccaggctg gatttaaacc cagatcgctc ttacatttgc tctttacctg ctgtgctcag 300 cgttcacgtg ccctctagct gtagttttct gaagtcagcg cacagcaagg cagtgtgctt 360 agaggttaac agaagggaaa acaacaacaa caaaaatcta aatgagaatc ctgactgttt 420 cagctggggg taaggggggc ggattattca tataattgtt ataccagacg gtcgcaggct 480 tagtccaatt gcagagaact cgcttcccag gcttctgaga gtcccggaag tgcctaaacc 540 tgtctaatcg acggggcttg ggtggcccgt cgctccctgg cttcttccct ttacccaggg 600 cgggcagcga agtggtgcct cctgcgtccc ccacaccctc cctcagcccc tcccctccgg 660 cccgtcctgg gcaggtgacg tcaagcatcc ggcaggctgc cctggcctcc tgagtcagga 720 caacgcccac gaggggcgtt actgtgcgga gatgcaccac gcaagagaca ccctttgtaa 780 ctctcttctc ctccctagtg cgaggttaaa accttcagcc ccacgtgctg tttgcaaacc 840 tgcctgtacc tgaggcccta aaaagccaga gacctcactc ccggggagcc agcatgtcca 900 ctgcggtcct ggaaaaccca ggcttgggca ggaaactctc tgactttgga caggtgagcc 960 acggcagcct gagctgctca gttaggggaa tttgggcctc cagagaaaga gatccgaaga 1020 ctgctggtgc ttcctggttt cataagctca gtaagaagtc tgaattcgtt ggaagctgat 1080 gagaatatcc aggaagtcaa cagacaaatg tcctcaacaa ttgtttctaa gtaggagaac 1140 atctgtcctc ggtggctttc acaggaaaag cttctgacct cttctcttcc tcccacaggg 1200 cagcggagct actaacttca gcctgctgaa gcaggctgga gacgtggagg agaaccctgg 1260 acctatgtcc accgctgtgc tggagaaccc tgggctgggg aggaaactgt cagacttcgg 1320 gcaggagact tcatacattg aggataactg taaccagaat ggcgccatct ctctgatctt 1380 cagcctgaag gaggaagtgg gcgccctggc aaaggtgctg cgcctgtttg aggagaacga 1440 cgtgaatctg acccacatcg agtcccggcc ttctagactg aagaaggacg agtacgagtt 1500 ctttacccac ctggataagc ggtccctgcc agccctgaca aacatcatca agatcctgag 1560 gcacgacatc ggagcaaccg tgcacgagct gtctcgggac aagaagaagg ataccgtgcc 1620 ctggttccct cggacaatcc aggagctgga tagatttgcc aaccagatcc tgtcttacgg 1680 agcagagctg gacgcagatc accctggctt caaggaccca gtgtatcggg cccggagaaa 1740 gcagtttgcc gatatcgcct acaattatag gcacggacag ccaatccctc gcgtggagta 1800 tatggaggag gagaagaaga cctggggcac agtgttcaag accctgaaga gcctgtacaa 1860 gacacacgcc tgctacgagt ataaccacat cttccccctg ctggagaagt attgtggctt 1920 tcacgaggac aatatccctc agctggagga cgtgagccag ttcctgcaga cctgcacagg 1980 ctttaggctg aggccagtgg caggactgct gagctcccgg gacttcctgg gaggactggc 2040 cttcagagtg tttcactgca cccagtacat caggcacggc tccaagccaa tgtatacacc 2100 agagcccgac atctgtcacg agctgctggg ccacgtgccc ctgtttagcg atagatcctt 2160 cgcccagttt tcccaggaga tcggactggc atctctggga gcacctgacg agtacatcga 2220 gaagctggcc accatctatt ggttcacagt ggagtttggc ctgtgcaagc agggcgatag 2280 catcaaggcc tacggagcag gactgctgtc tagcttcggc gagctgcagt attgtctgtc 2340 cgagaagcca aagctgctgc ccctggagct ggagaagacc gccatccaga actacaccgt 2400 gacagagttc cagcccctgt actatgtggc cgagtctttt aacgatgcca aggagaaggt 2460 gagaaatttc gccgccacaa tccctaggcc cttcagcgtg cggtacgacc cttataccca 2520 gaggatcgag gtgctggata atacacagca gctgaagatc ctggctgact caatcaatag 2580 cgaaatcgga atcctgtgct ccgccctgca gaaaatcaaa tgaggtaccg atccagacat 2640 gataagatac attgatgagt ttggacaaac cacaactaga atgcagtgaa aaaaatgctt 2700 tatttgtgaa atttgtgatg ctattgcttt atttgtaacc attataagct gcaataaaca 2760 agttaacaac aacaattgca ttcattttat gtttcaggtt cagggggagg tgtgggaggt 2820 tttttaagga tccctgggat gggatgtgga atccttctag atttcttttg taatatttat 2880 aaagtgctct cagcaaggta tcaaaatggc aaaattgtga gtaactatcc tcctttcatt 2940 ttgggaagaa gatgaggcat gaagagaatt cagacagaaa cttactcaga ccaggggagg 3000 cagaaactaa gcagagagga aaatgaccaa gagttagccc tgggcatgga atgtgaaaga 3060 accctaaacg tgacttggaa ataatgccca aggtatattc cattctccgg gatttgttgg 3120 cattttcttg aggtgaagaa ttgcagaata cattctttaa tgtgacctac atatttaccc 3180 atgggaggaa gtctgctcct ggactcttga gattcagtca taaagcccag gccagggaaa 3240 taatgtaagt ctgcaggccc ctgtcatcag taggattagg gagaagagtt ctcagtagaa 3300 aacagggagg ctggagagaa aagaatggtt aatgttaacg ttaatataac tagaaagact 3360 gcagaactta ggactgattt ttatttgaat ccttaaaaaa aaaaatttct tatgaaaata 3420 gtacatggct cttaggagac agaacttatt gtacagagga acagcgtgag agtcagagtg 3480 atcccagaac aggtcctggc tccatcctgc acatagtttt ggtgctgctg gcaatacggt 3540 ccccacaact gtgggaaggg gttaggggca gggatctcat caggaaagca taggggttta 3600 aagttcttta tagagcactt agaagattga gaatccacaa attatattaa taacaaacaa 3660 agtagtgtcg tgttatatag taaatgtgaa tttgcagaca catttaggga aaagttataa 3720 ttaaaaaaat aggctgtata tatacctgca ggtctagata cgtagataag tagcatggcg 3780 ggttaatcat taactacaag gaacccctag tgatggagtt ggccactccc tctctgcgcg 3840 ctcgctcgct cactgaggcc gggcgaccaa aggtcgcccg acgcccgggc tttgcccggg 3900 cggcctcagt gagcgagcga gcgcgcagag agggagtggc caa 3943 <210> 60 <211> 3943 <212> DNA <213> Artificial Sequence <220> <223> 32.6 vector correction genome (+ ITRs) <400> 60 ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 60 cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag agagggagtg 120 gccaactcca tcactagggg ttcctggagg ggtggagtcg tgacgtgaat tacgtcatag 180 ggttagggag gtcctgcata tgcggccgct tcaggagcag ttgtgcgaat agctggagaa 240 caccaggctg gatttaaacc cagatcgctc ttacatttgc tctttacctg ctgtgctcag 300 cgttcacgtg ccctctagct gtagttttct gaagtcagcg cacagcaagg cagtgtgctt 360 agaggttaac agaagggaaa acaacaacaa caaaaatcta aatgagaatc ctgactgttt 420 cagctggggg taaggggggc ggattattca tataattgtt ataccagacg gtcgcaggct 480 tagtccaatt gcagagaact cgcttcccag gcttctgaga gtcccggaag tgcctaaacc 540 tgtctaatcg acggggcttg ggtggcccgt cgctccctgg cttcttccct ttacccaggg 600 cgggcagcga agtggtgcct cctgcgtccc ccacaccctc cctcagcccc tcccctccgg 660 cccgtcctgg gcaggtgacc tggagcatcc ggcaggctgc cctggcctcc tgcgtcagga 720 caacgcccac gaggggcgtt actgtgcgga gatgcaccac gcaagagaca ccctttgtaa 780 ctctcttctc ctccctagtg cgaggttaaa accttcagcc ccacgtgctg tttgcaaacc 840 tgcctgtacc tgaggcccta aaaagccaga gacctcactc ccggggagcc agcatgtcca 900 ctgcggtcct ggaaaaccca ggcttgggca ggaaactctc tgactttgga caggtgagcc 960 acggcagcct gagctgctca gttaggggaa tttgggcctc cagagaaaga gatccgaaga 1020 ctgctggtgc ttcctggttt cataagctca gtaagaagtc tgaattcgtt ggaagctgat 1080 gagaatgtcc aggaagtcaa cagacaaatg tcctcaacaa ttgtttctaa gtaggagaac 1140 atctgtcctc ggtggctttc acaggaaaag cttctgacct cttctcttcc tcccacaggg 1200 cagcggagct actaacttca gcctgctgaa gcaggctgga gacgtggagg agaaccctgg 1260 acctatgtcc accgctgtgc tggagaaccc tgggctgggg aggaaactgt cagacttcgg 1320 gcaggagact tcatacattg aggataactg taaccagaat ggcgccatct ctctgatctt 1380 cagcctgaag gaggaagtgg gcgccctggc aaaggtgctg cgcctgtttg aggagaacga 1440 cgtgaatctg acccacatcg agtcccggcc ttctagactg aagaaggacg agtacgagtt 1500 ctttacccac ctggataagc ggtccctgcc agccctgaca aacatcatca agatcctgag 1560 gcacgacatc ggagcaaccg tgcacgagct gtctcgggac aagaagaagg ataccgtgcc 1620 ctggttccct cggacaatcc aggagctgga tagatttgcc aaccagatcc tgtcttacgg 1680 agcagagctg gacgcagatc accctggctt caaggaccca gtgtatcggg cccggagaaa 1740 gcagtttgcc gatatcgcct acaattatag gcacggacag ccaatccctc gcgtggagta 1800 tatggaggag gagaagaaga cctggggcac agtgttcaag accctgaaga gcctgtacaa 1860 gacacacgcc tgctacgagt ataaccacat cttccccctg ctggagaagt attgtggctt 1920 tcacgaggac aatatccctc agctggagga cgtgagccag ttcctgcaga cctgcacagg 1980 ctttaggctg aggccagtgg caggactgct gagctcccgg gacttcctgg gaggactggc 2040 cttcagagtg tttcactgca cccagtacat caggcacggc tccaagccaa tgtatacacc 2100 agagcccgac atctgtcacg agctgctggg ccacgtgccc ctgtttagcg atagatcctt 2160 cgcccagttt tcccaggaga tcggactggc atctctggga gcacctgacg agtacatcga 2220 gaagctggcc accatctatt ggttcacagt ggagtttggc ctgtgcaagc agggcgatag 2280 catcaaggcc tacggagcag gactgctgtc tagcttcggc gagctgcagt attgtctgtc 2340 cgagaagcca aagctgctgc ccctggagct ggagaagacc gccatccaga actacaccgt 2400 gacagagttc cagcccctgt actatgtggc cgagtctttt aacgatgcca aggagaaggt 2460 gagaaatttc gccgccacaa tccctaggcc cttcagcgtg cggtacgacc cttataccca 2520 gaggatcgag gtgctggata atacacagca gctgaagatc ctggctgact caatcaatag 2580 cgaaatcgga atcctgtgct ccgccctgca gaaaatcaaa tgaggtaccg atccagacat 2640 gataagatac attgatgagt ttggacaaac cacaactaga atgcagtgaa aaaaatgctt 2700 tatttgtgaa atttgtgatg ctattgcttt atttgtaacc attataagct gcaataaaca 2760 agttaacaac aacaattgca ttcattttat gtttcaggtt cagggggagg tgtgggaggt 2820 tttttaagga tccctgggat gggatgtgga atccttctag atttcttttg taatatttat 2880 aaagtgctct cagcaaggta tcaaaatggc aaaattgtga gtaactatcc tcctttcatt 2940 ttgggaagaa gatgaggcat gaagagaatt cagacagaaa cttactcaga ccaggggagg 3000 cagaaactaa gcagagagga aaatgaccaa gagttagccc tgggcatgga atgtgaaaga 3060 accctaaacg tgacttggaa ataatgccca aggtatattc cattctccgg gatttgttgg 3120 cattttcttg aggtgaagaa ttgcagaata cattctttaa tgtgacctac atatttaccc 3180 atgggaggaa gtctgctcct ggactcttga gattcagtca taaagcccag gccagggaaa 3240 taatgtaagt ctgcaggccc ctgtcatcag taggattagg gagaagagtt ctcagtagaa 3300 aacagggagg ctggagagaa aagaatggtt aatgttaacg ttaatataac tagaaagact 3360 gcagaactta ggactgattt ttatttgaat ccttaaaaaa aaaaatttct tatgaaaata 3420 gtacatggct cttaggagac agaacttatt gtacagagga acagcgtgag agtcagagtg 3480 atcccagaac aggtcctggc tccatcctgc acatagtttt ggtgctgctg gcaatacggt 3540 ccccacaact gtgggaaggg gttaggggca gggatctcat caggaaagca taggggttta 3600 aagttcttta tagagcactt agaagattga gaatccacaa attatattaa taacaaacaa 3660 agtagtgtcg tgttatatag taaatgtgaa tttgcagaca catttaggga aaagttataa 3720 ttaaaaaaat aggctgtata tatacctgca ggtctagata cgtagataag tagcatggcg 3780 ggttaatcat taactacaag gaacccctag tgatggagtt ggccactccc tctctgcgcg 3840 ctcgctcgct cactgaggcc gggcgaccaa aggtcgcccg acgcccgggc tttgcccggg 3900 cggcctcagt gagcgagcga gcgcgcagag agggagtggc caa 3943 <210> 61 <211> 3943 <212> DNA <213> Artificial Sequence <220> <223> 32.7 vector correction genome (+ ITRs) <400> 61 ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 60 cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag agagggagtg 120 gccaactcca tcactagggg ttcctggagg ggtggagtcg tgacgtgaat tacgtcatag 180 ggttagggag gtcctgcata tgcggccgct tcaggagcag ttgtgcgaat agctggagaa 240 caccaggctg gatttaaacc cagatcgctc ttacatttgc tctttacctg ctgtgctcag 300 cgttcacgtg ccctctagct gtagttttct gaagtcagcg cacagcaagg cagtgtgctt 360 agaggttaac agaagggaaa acaacaacaa caaaaatcta aatgagaatc ctgactgttt 420 cagctggggg taaggggggc ggattattca tataattgtt ccaccagacg gtcgcaggct 480 tagtccaatt gcagagaact cgcttcccag gcttctgaga gtcccggaag tgcctaaacc 540 tgtctaatcg acggggcttg ggtggcccgt cgctccctgg cttcttccct ttacccaggg 600 cgggcagcga agtggtgcct cctgcgtccc ccacaccctc cctcagcccc tcccctccgg 660 cccgtcctgg gcaggtgacc tggagcatcc ggcaggctgc cctggcctcc tgcgtcagga 720 caacgcccac gaggggcgtt actgtgcgga gatgcaccac gcaagagaca ccctttgtaa 780 ctctcttctc ctccctagtg cgaggttaaa accttcagcc ccacgtgctg tttgcaaacc 840 tgcctgtacc tgaggcccta aaaagccaga gacctcactc ccggggagcc agcatgtcca 900 ctgcggtcct ggaaaaccca ggcttgggca ggaaactctc tgactttgga caggtgagcc 960 acggcagcct gagctgctca gttaggggaa tttgggcctc cagagaaaga gatccgaaga 1020 ctgctggtgc ttcctggttt cataagctca gtaagaagtc tgaattcgtt ggaagctgat 1080 gagaatatcc aggaagtcaa cagacaaatg tcctcaacaa ttgtttctaa gtaggagaac 1140 atctgtcctc ggtggctttc acaggaaaag cttctgacct cttctcttcc tcccacaggg 1200 cagcggagct actaacttca gcctgctgaa gcaggctgga gacgtggagg agaaccctgg 1260 acctatgtcc accgctgtgc tggagaaccc tgggctgggg aggaaactgt cagacttcgg 1320 gcaggagact tcatacattg aggataactg taaccagaat ggcgccatct ctctgatctt 1380 cagcctgaag gaggaagtgg gcgccctggc aaaggtgctg cgcctgtttg aggagaacga 1440 cgtgaatctg acccacatcg agtcccggcc ttctagactg aagaaggacg agtacgagtt 1500 ctttacccac ctggataagc ggtccctgcc agccctgaca aacatcatca agatcctgag 1560 gcacgacatc ggagcaaccg tgcacgagct gtctcgggac aagaagaagg ataccgtgcc 1620 ctggttccct cggacaatcc aggagctgga tagatttgcc aaccagatcc tgtcttacgg 1680 agcagagctg gacgcagatc accctggctt caaggaccca gtgtatcggg cccggagaaa 1740 gcagtttgcc gatatcgcct acaattatag gcacggacag ccaatccctc gcgtggagta 1800 tatggaggag gagaagaaga cctggggcac agtgttcaag accctgaaga gcctgtacaa 1860 gacacacgcc tgctacgagt ataaccacat cttccccctg ctggagaagt attgtggctt 1920 tcacgaggac aatatccctc agctggagga cgtgagccag ttcctgcaga cctgcacagg 1980 ctttaggctg aggccagtgg caggactgct gagctcccgg gacttcctgg gaggactggc 2040 cttcagagtg tttcactgca cccagtacat caggcacggc tccaagccaa tgtatacacc 2100 agagcccgac atctgtcacg agctgctggg ccacgtgccc ctgtttagcg atagatcctt 2160 cgcccagttt tcccaggaga tcggactggc atctctggga gcacctgacg agtacatcga 2220 gaagctggcc accatctatt ggttcacagt ggagtttggc ctgtgcaagc agggcgatag 2280 catcaaggcc tacggagcag gactgctgtc tagcttcggc gagctgcagt attgtctgtc 2340 cgagaagcca aagctgctgc ccctggagct ggagaagacc gccatccaga actacaccgt 2400 gacagagttc cagcccctgt actatgtggc cgagtctttt aacgatgcca aggagaaggt 2460 gagaaatttc gccgccacaa tccctaggcc cttcagcgtg cggtacgacc cttataccca 2520 gaggatcgag gtgctggata atacacagca gctgaagatc ctggctgact caatcaatag 2580 cgaaatcgga atcctgtgct ccgccctgca gaaaatcaaa tgaggtaccg atccagacat 2640 gataagatac attgatgagt ttggacaaac cacaactaga atgcagtgaa aaaaatgctt 2700 tatttgtgaa atttgtgatg ctattgcttt atttgtaacc attataagct gcaataaaca 2760 agttaacaac aacaattgca ttcattttat gtttcaggtt cagggggagg tgtgggaggt 2820 tttttaagga tccctgggat gggatgtgga atccttctag atttcttttg taatatttat 2880 aaagtgctct cagcaaggta tcaaaatggc aaaattgtga gtaactatcc tcctttcatt 2940 ttgggaagaa gatgaggcat gaagagaatt cagacagaaa cttactcaga ccaggggagg 3000 cagaaactaa gcagagagga aaatgaccaa gagttagccc tgggcatgga atgtgaaaga 3060 accctaaacg tgacttggaa ataatgccca aggtatattc cattctccgg gatttgttgg 3120 cattttcttg aggtgaagaa ttgcagaata cattctttaa tgtgacctac atatttaccc 3180 atgggaggaa gtctgctcct ggactcttga gattcagtca taaagcccag gccagggaaa 3240 taatgtaagt ctgcaggccc ctgtcatcag taggattagg gagaagagtt ctcagtagaa 3300 aacagggagg ctggagagaa aagaatggtt aatgttaacg ttaatataac tagaaagact 3360 gcagaactta ggactgattt ttatttgaat ccttaaaaaa aaaaatttct tatgaaaata 3420 gtacatggct cttaggagac agaacttatt gtacagagga acagcgtgag agtcagagtg 3480 atcccagaac aggtcctggc tccatcctgc acatagtttt ggtgctgctg gcaatacggt 3540 ccccacaact gtgggaaggg gttaggggca gggatctcat caggaaagca taggggttta 3600 aagttcttta tagagcactt agaagattga gaatccacaa attatattaa taacaaacaa 3660 agtagtgtcg tgttatatag taaatgtgaa tttgcagaca catttaggga aaagttataa 3720 ttaaaaaaat aggctgtata tatacctgca ggtctagata cgtagataag tagcatggcg 3780 ggttaatcat taactacaag gaacccctag tgatggagtt ggccactccc tctctgcgcg 3840 ctcgctcgct cactgaggcc gggcgaccaa aggtcgcccg acgcccgggc tttgcccggg 3900 cggcctcagt gagcgagcga gcgcgcagag agggagtggc caa 3943 <210> 62 <211> 3951 <212> DNA <213> Artificial Sequence <220> <223> 32.8 vector correction genome (+ ITRs) <400> 62 ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 60 cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag agagggagtg 120 gccaactcca tcactagggg ttcctggagg ggtggagtcg tgacgtgaat tacgtcatag 180 ggttagggag gtcctgcata tgcggccgct tcaggagcag ttgtgcgaat agctggagaa 240 caccaggctg gatttaaacc cagatcgctc ttacatttgc tctttacctg ctgtgctcag 300 cgttcacgtg ccctctagct gtagttttct gaagtcagcg cacagcaagg cagtgtgctt 360 agaggttaac agaagggaaa acaacaacaa caaaaatcta aatgagaatc ctgactgttt 420 cagctggggg taaggggggc ggattattca tataattgtt ccaccagacg gtcgcaggct 480 tagtccaatt gcagagaaca cgctgttctt cgccccaggc ttctgagagt cccggaagtg 540 cctaaacctg tctaatcgac ggggcttggg tggcccgtcg ctccctggct tcttcccttt 600 acccagggcg ggcagcgaag tggtgcctcc tgcgtccccc acaccctccc tcagcccctc 660 ccctccggcc cgtcctgggc aggtgacctg gagcatccgg caggctgccc tggcctcctg 720 cgtcaggaca acgcccacga ggggcgttac tgtgcggaga tgcaccacgc aagagacacc 780 ctttgtaact ctcttctcct ccctagtgcg aggttaaaac cttcagcccc acgtgctgtt 840 tgcaaacctg cctgtacctg aggccctaaa aagccagaga cctcactccc ggggagccag 900 catgtccact gcggtcctgg aaaacccagg cttgggcagg aaactctctg actttggaca 960 ggtgagccac ggcagcctga gctgctcagt taggggaatt tgggcctcca gagaaagaga 1020 tccgaagact gctggtgctt cctggtttca taagctcagt aagaagtctg aattcgttgg 1080 aagctgatga gaatatccag gaagtcaaca gacaaatgtc ctcaacaatt gtttctaagt 1140 aggagaacat ctgtcctcgg tggctttcac aggaaaagct tctgacctct tctcttcctc 1200 ccacagggca gcggagctac taacttcagc ctgctgaagc aggctggaga cgtggaggag 1260 aaccctggac ctatgtccac cgctgtgctg gagaaccctg ggctggggag gaaactgtca 1320 gacttcgggc aggagacttc atacattgag gataactgta accagaatgg cgccatctct 1380 ctgatcttca gcctgaagga ggaagtgggc gccctggcaa aggtgctgcg cctgtttgag 1440 gagaacgacg tgaatctgac ccacatcgag tcccggcctt ctagactgaa gaaggacgag 1500 tacgagttct ttacccacct ggataagcgg tccctgccag ccctgacaaa catcatcaag 1560 atcctgaggc acgacatcgg agcaaccgtg cacgagctgt ctcgggacaa gaagaaggat 1620 accgtgccct ggttccctcg gacaatccag gagctggata gatttgccaa ccagatcctg 1680 tcttacggag cagagctgga cgcagatcac cctggcttca aggacccagt gtatcgggcc 1740 cggagaaagc agtttgccga tatcgcctac aattataggc acggacagcc aatccctcgc 1800 gtggagtata tggaggagga gaagaagacc tggggcacag tgttcaagac cctgaagagc 1860 ctgtacaaga cacacgcctg ctacgagtat aaccacatct tccccctgct ggagaagtat 1920 tgtggctttc acgaggacaa tatccctcag ctggaggacg tgagccagtt cctgcagacc 1980 tgcacaggct ttaggctgag gccagtggca ggactgctga gctcccggga cttcctggga 2040 ggactggcct tcagagtgtt tcactgcacc cagtacatca ggcacggctc caagccaatg 2100 tatacaccag agcccgacat ctgtcacgag ctgctgggcc acgtgcccct gtttagcgat 2160 agatccttcg cccagttttc ccaggagatc ggactggcat ctctgggagc acctgacgag 2220 tacatcgaga agctggccac catctattgg ttcacagtgg agtttggcct gtgcaagcag 2280 ggcgatagca tcaaggccta cggagcagga ctgctgtcta gcttcggcga gctgcagtat 2340 tgtctgtccg agaagccaaa gctgctgccc ctggagctgg agaagaccgc catccagaac 2400 tacaccgtga cagagttcca gcccctgtac tatgtggccg agtcttttaa cgatgccaag 2460 gagaaggtga gaaatttcgc cgccacaatc cctaggccct tcagcgtgcg gtacgaccct 2520 tatacccaga ggatcgaggt gctggataat acacagcagc tgaagatcct ggctgactca 2580 atcaatagcg aaatcggaat cctgtgctcc gccctgcaga aaatcaaatg aggtaccgat 2640 ccagacatga taagatacat tgatgagttt ggacaaacca caactagaat gcagtgaaaa 2700 aaatgcttta tttgtgaaat ttgtgatgct attgctttat ttgtaaccat tataagctgc 2760 aataaacaag ttaacaacaa caattgcatt cattttatgt ttcaggttca gggggaggtg 2820 tgggaggttt tttaaggatc cctgggatgg gatgtggaat ccttctagat ttcttttgta 2880 atatttataa agtgctctca gcaaggtatc aaaatggcaa aattgtgagt aactatcctc 2940 ctttcatttt gggaagaaga tgaggcatga agagaattca gacagaaact tactcagacc 3000 aggggaggca gaaactaagc agagaggaaa atgaccaaga gttagccctg ggcatggaat 3060 gtgaaagaac cctaaacgtg acttggaaat aatgcccaag gtatattcca ttctccggga 3120 tttgttggca ttttcttgag gtgaagaatt gcagaataca ttctttaatg tgacctacat 3180 atttacccat gggaggaagt ctgctcctgg actcttgaga ttcagtcata aagcccaggc 3240 cagggaaata atgtaagtct gcaggcccct gtcatcagta ggattaggga gaagagttct 3300 cagtagaaaa cagggaggct ggagagaaaa gaatggttaa tgttaacgtt aatataacta 3360 gaaagactgc agaacttagg actgattttt atttgaatcc ttaaaaaaaa aaatttctta 3420 tgaaaatagt acatggctct taggagacag aacttattgt acagaggaac agcgtgagag 3480 tcagagtgat cccagaacag gtcctggctc catcctgcac atagttttgg tgctgctggc 3540 aatacggtcc ccacaactgt gggaaggggt taggggcagg gatctcatca ggaaagcata 3600 ggggtttaaa gttctttata gagcacttag aagattgaga atccacaaat tatattaata 3660 acaaacaaag tagtgtcgtg ttatatagta aatgtgaatt tgcagacaca tttagggaaa 3720 agttataatt aaaaaaatag gctgtatata tacctgcagg tctagatacg tagataagta 3780 gcatggcggg ttaatcatta actacaagga acccctagtg atggagttgg ccactccctc 3840 tctgcgcgct cgctcgctca ctgaggccgg gcgaccaaag gtcgcccgac gcccgggctt 3900 tgcccgggcg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca a 3951 <210> 63 <211> 3943 <212> DNA <213> Artificial Sequence <220> <223> 32.9 vector correction genome (+ ITRs) <400> 63 ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 60 cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag agagggagtg 120 gccaactcca tcactagggg ttcctggagg ggtggagtcg tgacgtgaat tacgtcatag 180 ggttagggag gtcctgcata tgcggccgct tcaggagcag ttgtgcgaat agctggagaa 240 caccaggctg gatttaaacc cagatcgctc ttacatttgc tctttacctg ctgtgctcag 300 cgttcacgtg ccctctagct gtagttttct gaagtcagcg cacagcaagg cagtgtgctt 360 agaggttaac agaagggaaa acaacaacaa caaaaatcta aatgagaatc ctgactgttt 420 cagctgagag taaggggggc ggattattca tataattgtt ataccagacg gtcgcaggct 480 tagtccaatt gcagagaact cgcttcccag gcttctgaga gtcccggaag tgcctaaacc 540 tgtctaatcg acagagcttg ggtggcccgt cgctccctgg cttcttccct ttacccaggg 600 cgggcagcga agtggtgcct cctgcgtccc ccacaccctc cctcagcccc tcccctccgg 660 cccgtcctag gcaggtgacc tgaagcatcc agcaggctgc cctggcctcc tgcgtcagga 720 caacgcccac gaggggcgtt actgtgcgga gatgcaccac gcaagagaca ccctttgtaa 780 ctctcttctc ctccctagtg cgaggttaaa accttcagcc ccacgtgctg tttgcaaacc 840 tgcctgtacc tgaggcccta aaaagccaga gacctcactc ccggggagcc agcatgtcca 900 ctgcggtcct ggaaaaccca ggcttgggca ggaaactctc tgactttgga caggtgagcc 960 acggcagcct gagctgctca gttaggggaa tttgggcctc cagagaaaga gatccgaaga 1020 ctgctggtgc ttcctggttt cataagctca gtaagaagtc tgaattcgtt ggaagctgat 1080 gagaatatcc aggaagtcaa cagacaaatg tcctcaacaa ttgtttctaa gtaggagaac 1140 atctgtcctc ggtggctttc acaggaaaag cttctgacct cttctcttcc tcccacaggg 1200 cagcggagct actaacttca gcctgctgaa gcaggctgga gacgtggagg agaaccctgg 1260 acctatgtcc accgctgtgc tggagaaccc tgggctgggg aggaaactgt cagacttcgg 1320 gcaggagact tcatacattg aggataactg taaccagaat ggcgccatct ctctgatctt 1380 cagcctgaag gaggaagtgg gcgccctggc aaaggtgctg cgcctgtttg aggagaacga 1440 cgtgaatctg acccacatcg agtcccggcc ttctagactg aagaaggacg agtacgagtt 1500 ctttacccac ctggataagc ggtccctgcc agccctgaca aacatcatca agatcctgag 1560 gcacgacatc ggagcaaccg tgcacgagct gtctcgggac aagaagaagg ataccgtgcc 1620 ctggttccct cggacaatcc aggagctgga tagatttgcc aaccagatcc tgtcttacgg 1680 agcagagctg gacgcagatc accctggctt caaggaccca gtgtatcggg cccggagaaa 1740 gcagtttgcc gatatcgcct acaattatag gcacggacag ccaatccctc gcgtggagta 1800 tatggaggag gagaagaaga cctggggcac agtgttcaag accctgaaga gcctgtacaa 1860 gacacacgcc tgctacgagt ataaccacat cttccccctg ctggagaagt attgtggctt 1920 tcacgaggac aatatccctc agctggagga cgtgagccag ttcctgcaga cctgcacagg 1980 ctttaggctg aggccagtgg caggactgct gagctcccgg gacttcctgg gaggactggc 2040 cttcagagtg tttcactgca cccagtacat caggcacggc tccaagccaa tgtatacacc 2100 agagcccgac atctgtcacg agctgctggg ccacgtgccc ctgtttagcg atagatcctt 2160 cgcccagttt tcccaggaga tcggactggc atctctggga gcacctgacg agtacatcga 2220 gaagctggcc accatctatt ggttcacagt ggagtttggc ctgtgcaagc agggcgatag 2280 catcaaggcc tacggagcag gactgctgtc tagcttcggc gagctgcagt attgtctgtc 2340 cgagaagcca aagctgctgc ccctggagct ggagaagacc gccatccaga actacaccgt 2400 gacagagttc cagcccctgt actatgtggc cgagtctttt aacgatgcca aggagaaggt 2460 gagaaatttc gccgccacaa tccctaggcc cttcagcgtg cggtacgacc cttataccca 2520 gaggatcgag gtgctggata atacacagca gctgaagatc ctggctgact caatcaatag 2580 cgaaatcgga atcctgtgct ccgccctgca gaaaatcaaa tgaggtaccg atccagacat 2640 gataagatac attgatgagt ttggacaaac cacaactaga atgcagtgaa aaaaatgctt 2700 tatttgtgaa atttgtgatg ctattgcttt atttgtaacc attataagct gcaataaaca 2760 agttaacaac aacaattgca ttcattttat gtttcaggtt cagggggagg tgtgggaggt 2820 tttttaagga tccctgggat gggatgtgga atccttctag atttcttttg taatatttat 2880 aaagtgctct cagcaaggta tcaaaatggc aaaattgtga gtaactatcc tcctttcatt 2940 ttgggaagaa gatgaggcat gaagagaatt cagacagaaa cttactcaga ccaggggagg 3000 cagaaactaa gcagagagga aaatgaccaa gagttagccc tgggcatgga atgtgaaaga 3060 accctaaacg tgacttggaa ataatgccca aggtatattc cattctccgg gatttgttgg 3120 cattttcttg aggtgaagaa ttgcagaata cattctttaa tgtgacctac atatttaccc 3180 atgggaggaa gtctgctcct ggactcttga gattcagtca taaagcccag gccagggaaa 3240 taatgtaagt ctgcaggccc ctgtcatcag taggattagg gagaagagtt ctcagtagaa 3300 aacagggagg ctggagagaa aagaatggtt aatgttaacg ttaatataac tagaaagact 3360 gcagaactta ggactgattt ttatttgaat ccttaaaaaa aaaaatttct tatgaaaata 3420 gtacatggct cttaggagac agaacttatt gtacagagga acagcgtgag agtcagagtg 3480 atcccagaac aggtcctggc tccatcctgc acatagtttt ggtgctgctg gcaatacggt 3540 ccccacaact gtgggaaggg gttaggggca gggatctcat caggaaagca taggggttta 3600 aagttcttta tagagcactt agaagattga gaatccacaa attatattaa taacaaacaa 3660 agtagtgtcg tgttatatag taaatgtgaa tttgcagaca catttaggga aaagttataa 3720 ttaaaaaaat aggctgtata tatacctgca ggtctagata cgtagataag tagcatggcg 3780 ggttaatcat taactacaag gaacccctag tgatggagtt ggccactccc tctctgcgcg 3840 ctcgctcgct cactgaggcc gggcgaccaa aggtcgcccg acgcccgggc tttgcccggg 3900 cggcctcagt gagcgagcga gcgcgcagag agggagtggc caa 3943 <210> 64 <211> 912 <212> DNA <213> Homo sapiens <400> 64 atgtccactg cggtcctgga aaacccaggc ttgggcagga aactctctga ctttggacag 60 gaaacaagct atattgaaga caactgcaat caaaatggtg ccatatcact gatcttctca 120 ctcaaagaag aagttggtgc attggccaaa gtattgcgct tatttgagga gaatgatgta 180 aacctgaccc acattgaatc tagaccttct cgtttaaaga aagatgagta tgaatttttc 240 acccatttgg ataaacgtag cctgcctgct ctgacaaaca tcatcaagat cttgaggcat 300 gacattggtg ccactgtcca tgagctttca cgagataaga agaaagacac agtgccctgg 360 ttcccaagaa ccattcaaga gctggacaga tttgccaatc agattctcag ctatggagcg 420 gaactggatg ctgaccaccc tggttttaaa gatcctgtgt accgtgcaag acggaagcag 480 tttgctgaca ttgcctacaa ctaccgccat gggcagccca tccctcgagt ggaatacatg 540 gaggaagaaa agaaaacatg gggcacagtg ttcaagactc tgaagtcctt gtataaaacc 600 catgcttgct atgagtacaa tcacattttt ccacttcttg aaaagtactg tggcttccat 660 gaagataaca ttccccagct ggaagacgtt tctcagttcc tgcagacttg cactggtttc 720 cgcctccgac ctgtggctgg cctgctttcc tctcgggatt tcttgggtgg cctggccttc 780 cgagtcttcc actgcacaca gtacatcaga catggatcca agcccatgta tacccccgaa 840 cctgacatct gccatgagct gttgggacat gtgcccttgt tttcagatcg cagctttgcc 900 cagttttccc ag 912 <210> 65 <211> 912 <212> DNA <213> Artificial Sequence <220> <223> from start codon to end of exon 8 of silently altered PAH coding sequence <400> 65 atgtccaccg ctgtgctgga gaaccctggg ctggggagga aactgtcaga cttcgggcag 60 gagacttcat acattgagga taactgtaac cagaatggcg ccatctctct gatcttcagc 120 ctgaaggagg aagtgggcgc cctggcaaag gtgctgcgcc tgtttgagga gaacgacgtg 180 aatctgaccc acatcgagtc ccggccttct agactgaaga aggacgagta cgagttcttt 240 acccacctgg ataagcggtc cctgccagcc ctgacaaaca tcatcaagat cctgaggcac 300 gacatcggag caaccgtgca cgagctgtct cgggacaaga agaaggatac cgtgccctgg 360 ttccctcgga caatccagga gctggataga tttgccaacc agatcctgtc ttacggagca 420 gagctggacg cagatcaccc tggcttcaag gacccagtgt atcgggcccg gagaaagcag 480 tttgccgata tcgcctacaa ttataggcac ggacagccaa tccctcgcgt ggagtatatg 540 gaggaggaga agaagacctg gggcacagtg ttcaagaccc tgaagagcct gtacaagaca 600 cacgcctgct acgagtataa ccacatcttc cccctgctgg agaagtattg tggctttcac 660 gaggacaata tccctcagct ggaggacgtg agccagttcc tgcagacctg cacaggcttt 720 aggctgaggc cagtggcagg actgctgagc tcccgggact tcctgggagg actggccttc 780 agagtgtttc actgcaccca gtacatcagg cacggctcca agccaatgta tacaccagag 840 cccgacatct gtcacgagct gctgggccac gtgcccctgt ttagcgatag atccttcgcc 900 cagttttccc ag 912 <210> 66 <211> 447 <212> DNA <213> Homo sapiens <400> 66 gaaattggcc ttgcctctct gggtgcacct gatgaataca ttgaaaagct cgccacaatt 60 tactggttta ctgtggagtt tgggctctgc aaacaaggag actccataaa ggcatatggt 120 gctgggctcc tgtcatcctt tggtgaatta cagtactgct tatcagagaa gccaaagctt 180 ctccccctgg agctggagaa gacagccatc caaaattaca ctgtcacgga gttccagccc 240 ctctattacg tggcagagag ttttaatgat gccaaggaga aagtaaggaa ctttgctgcc 300 acaatacctc ggcccttctc agttcgctac gacccataca cccaaaggat tgaggtcttg 360 gacaataccc agcagcttaa gattttggct gattccatta acagtgaaat tggaatcctt 420 tgcagtgccc tccagaaaat aaagtaa 447 <210> 67 <211> 447 <212> DNA <213> Artificial Sequence <220> <223> from start of exon 9 to stop codon of silently altered PAH coding sequence <400> 67 gagatcggac tggcatctct gggagcacct gacgagtaca tcgagaagct ggccaccatc 60 tattggttca cagtggagtt tggcctgtgc aagcagggcg atagcatcaa ggcctacgga 120 gcaggactgc tgtctagctt cggcgagctg cagtattgtc tgtccgagaa gccaaagctg 180 ctgcccctgg agctggagaa gaccgccatc cagaactaca ccgtgacaga gttccagccc 240 ctgtactatg tggccgagtc ttttaacgat gccaaggaga aggtgagaaa tttcgccgcc 300 acaatcccta ggcccttcag cgtgcggtac gacccttata cccagaggat cgaggtgctg 360 gataatacac agcagctgaa gatcctggct gactcaatca atagcgaaat cggaatcctg 420 tgctccgccc tgcagaaaat caaatga 447 <210> 68 <211> 15 <212> DNA <213> Artificial Sequence <220> <223> modification to glucocorticoid binding site <400> 68 acgctgttct tcgcc 15 <210> 69 <211> 800 <212> DNA <213> Homo sapiens <400> 69 tatcttccat ttactgagtg tttatgtgga agaactgtac taaattttaa tgcatttctt 60 tattcctatt cttaaaacct tccagcaagg tggctctacc accctctttt ccgagcttca 120 ggagcagttg tgcgaatagc tggagaacac caggctggat ttaaacccag atcgctctta 180 catttgctct ttacctgctg tgctcagcgt tcacgtgccc tctagctgta gttttctgaa 240 gtcagcgcac agcaaggcag tgtgcttaga ggttaacaga agggaaaaca acaacaacaa 300 aaatctaaat gagaatcctg actgtttcag ctgggggtaa ggggggcgga ttattcatat 360 aattgttata ccagacggtc gcaggcttag tccaattgca gagaactcgc ttcccaggct 420 tctgagagtc ccggaagtgc ctaaacctgt ctaatcgacg gggcttgggt ggcccgtcgc 480 tccctggctt cttcccttta cccagggcgg gcagcgaagt ggtgcctcct gcgtccccca 540 caccctccct cagcccctcc cctccggccc gtcctgggca ggtgacctgg agcatccggc 600 aggctgccct ggcctcctgc gtcaggacaa cgcccacgag gggcgttact gtgcggagat 660 gcaccacgca agagacaccc tttgtaactc tcttctcctc cctagtgcga ggttaaaacc 720 ttcagcccca cgtgctgttt gcaaacctgc ctgtacctga ggccctaaaa agccagagac 780 ctcactcccg gggagccagc 800 <210> 70 <211> 800 <212> DNA <213> Homo sapiens <400> 70 tccactgcgg tcctggaaaa cccaggcttg ggcaggaaac tctctgactt tggacaggtg 60 agccacggca gcctgagctg ctcagttagg ggaatttggg cctccagaga aagagatccg 120 aagactgctg gtgcttcctg gtttcataag ctcagtaaga agtctgaatt cgttggaagc 180 tgatgagaat atccaggaag tcaacagaca aatgtcctca acaattgttt ctaagtagga 240 gaacatctgt cctcggtggc tttcacagga atgaatgacc attgctttag ggggttgggg 300 atctggcctc cagaactgcc accaattagc tgtgtgtctt tggacaagtt actgtccctc 360 tctgttgtct gtttactctt ctgtacactg aaggggctgg tccctaatga tctgggatgg 420 gatgtggaat ccttctagat ttcttttgta atatttataa agtgctctca gcaaggtatc 480 aaaatggcaa aattgtgagt aactatcctc ctttcatttt gggaagaaga tgaggcatga 540 agagaattca gacagaaact tactcagacc aggggaggca gaaactaagc agagaggaaa 600 atgaccaaga gttagccctg ggcatggaat gtgaaagaac cctaaacgtg acttggaaat 660 aatgcccaag gtatattcca ttctccggga tttgttggca ttttcttgag gtgaagaatt 720 gcagaataca ttctttaatg tgacctacat atttacccat gggaggaagt ctgctcctgg 780 actcttgaga ttcagtcata 800 <210> 71 <211> 16 <212> DNA <213> Artificial Sequence <220> <223> targeted integration restriction cassette <400> 71 tacgtacgat cgtcga 16 <210> 72 <211> 800 <212> DNA <213> Homo sapiens <400> 72 aatggttcca aaattttcta tggttaagaa tcacctggga tggttttgaa atggcagatt 60 ctaagacaac ttgattcaac aggtttaggt aaagcccagg gaactgcatt ataagaagga 120 atcacctgta attttggagt caagatccaa ggaacactca ttgagaaaca ctgatttaca 180 aagtgcatgg agagaaatgg agcaagtgaa gggggatcag catggtgaaa tataggctgt 240 taggagtgct attgactaac tgtctggtga ctggaccaga gtaaatcttt tactttgcaa 300 gaaacaggac taaattccca tattatgtcc atagcaaagg gaattatgta gaaaaattga 360 taattaggag cctgagttct tgaccagcct ccactaccta tgtggcctca ggtgagttat 420 tttctccctt tggctctaag ttttccccat ctgtaatgta agggagttta actagatgag 480 cactaaggac aaatcaattt ctgtgagtca attattatga aataccatgt gggcatcaaa 540 tgccaagtgg aaagcataga taaagaagtg attgtgcacc tgggctgagg ggaacaaaca 600 tttcctaaga gaattgagac ccaaaagagc ctttaaggaa ggtgagatct tggaaaggga 660 aatttggtga atactctaat gaggagctaa aaaggcaaga aagaaagcag cttggctgga 720 aaggaggttc ctgtaggtgg gcctccagag attcggtacc acagaaactg ccaaacatca 780 gcaagaagcc atggggatgg 800 <210> 73 <211> 800 <212> DNA <213> Homo sapiens <400> 73 agcgtttgag ggattctaaa tagaaggaca agagtaaaaa tgtcaggctg gatcgatgca 60 ggccactaag aaatggattc aggtgatggc agtgggaaga aaggacctga tgcccagagg 120 catttctgga gaagatgaga tcagacttgt gattggctga acacacactg tagtggggtg 180 gggtttaggg ggtgactcaa cttcaagccc aggtacattc aagtctgaat tgccctagtc 240 aaaagtggca tctgtggatg tgtatcagaa atatcttact tttcttggaa gccaacagga 300 gaaaagagtg ctaccaagtg aactagagac aggaatatct tttgtcattt caaggaaact 360 ggaaagaaga aggctcagta ttctttagta ggaagaagac ttaagtcaga gactcatctg 420 tacctctctg gcagggttta aaagggggaa gaggaataga ggctgcaaga gattgtgatt 480 catggacagt atgcagagat caaatgacct gggttcagat cctggctcca ctgctaactg 540 tgtaactata ggcaagttcc ttaacctctc taagccttaa tcttgtcatc aataaaaggg 600 ggcacttggt gcctaataaa acctacctct taggttgttg ccaaattaca tgagataatc 660 caaatcaagt gcttattata atacccagaa attataggct ctaaataaat gtttatatag 720 gctctaaata aatgaagttt tttagaaaga taacatcatg atcaaaatgg gatatttaac 780 agtttagtct tccatttcat 800 <210> 74 <211> 72 <212> DNA <213> Artificial Sequence <220> <223> 2A element <400> 74 agatctggca gcggagaggg cagaggaagt cttctaacat gcggtgacgt ggaggagaat 60 cccggcccta gg 72 <210> 75 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> Ribosomal skipping peptide consensus sequence <220> <221> VARIANT <222> (1)..(1) <223> D or G <220> <221> VARIANT <222> (2)..(2) <223> V or I <220> <221> VARIANT <222> (4)..(4) <223> any amino acid residue <400> 75 Xaa Xaa Glu Xaa Asn Pro Gly Pro 1 5 <210> 76 <211> 18 <212> PRT <213> Artificial Sequence <220> <223> T2A peptide <400> 76 Glu Gly Arg Gly Ser Leu Leu Thr Cys Gly Asp Val Glu Glu Asn Pro 1 5 10 15 Gly Pro <210> 77 <211> 19 <212> PRT <213> Artificial Sequence <220> <223> P2A peptide <400> 77 Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp Val Glu Glu Asn 1 5 10 15 Pro Gly Pro <210> 78 <211> 54 <212> DNA <213> Artificial Sequence <220> <223> T2A element <400> 78 gagggcagag gaagtcttct aacatgcggt gacgtggagg agaatcccgg ccct 54 <210> 79 <211> 57 <212> DNA <213> Artificial Sequence <220> <223> P2A element <400> 79 gctactaact tcagcctgct gaagcaggct ggagacgtgg aggagaaccc tggacct 57 <210> 80 <211> 1489 <212> DNA <213> Artificial Sequence <220> <223> PAH intron-inserted silently altered coding sequence (human HBB first intron) <400> 80 atgtccaccg ctgtgctgga gaaccctggg ctggggagga aactgtcaga cttcgggcag 60 gagacttcat acattgagga taactgtaac cagaatggcg ccatctctct gatcttcagc 120 ctgaaggagg aagtgggcgc cctggcaaag gtgctgcgcc tgtttgagga gaacgacgtg 180 aatctgaccc acatcgagtc ccggccttct agactgaaga aggacgagta cgagttcttt 240 acccacctgg ataagcggtc cctgccagcc ctgacaaaca tcatcaagat cctgaggcac 300 gacatcggag caaccgtgca cgagctgtct cgggacaaga agaaggatac cgtgccctgg 360 ttccctcgga caatccagga gctggataga tttgccaacc agatcctgtc ttacggagca 420 gagctggacg cagatcaccc tggcttcaag gacccagtgt atcgggcccg gagaaagcag 480 tttgccgata tcgcctacaa ttataggcac ggacagccaa tccctcgcgt ggagtatatg 540 gaggaggaga agaagacctg gggcacagtg ttcaagaccc tgaagagcct gtacaagaca 600 cacgcctgct acgagtataa ccacatcttc cccctgctgg agaagtattg tggctttcac 660 gaggacaata tccctcagct ggaggacgtg agccagttcc tgcagacctg cacaggcttt 720 aggctgaggc cagtggcagg actgctgagc tcccgggact tcctgggagg actggccttc 780 agagtgtttc actgcaccca gtacatcagg cacggctcca agccaatgta tacaccagag 840 cccgacatct gtcacgagct gctgggccac gtgcccctgt ttagcgatag atccttcgcc 900 cagttttccc aggttggtat caaggttaca agacaggttt aaggagacca atagaaactg 960 ggcatgtgga gacagagaag actcttgggt ttctgatagg cactgactct ctctgcctat 1020 tggtctattt tcccaccctt aggagatcgg actggcatct ctgggagcac ctgacgagta 1080 catcgagaag ctggccacca tctattggtt cacagtggag tttggcctgt gcaagcaggg 1140 cgatagcatc aaggcctacg gagcaggact gctgtctagc ttcggcgagc tgcagtattg 1200 tctgtccgag aagccaaagc tgctgcccct ggagctggag aagaccgcca tccagaacta 1260 caccgtgaca gagttccagc ccctgtacta tgtggccgag tcttttaacg atgccaagga 1320 gaaggtgaga aatttcgccg ccacaatccc taggcccttc agcgtgcggt acgaccctta 1380 tacccagagg atcgaggtgc tggataatac acagcagctg aagatcctgg ctgactcaat 1440 caatagcgaa atcggaatcc tgtgctccgc cctgcagaaa atcaaatga 1489 <210> 81 <211> 1475 <212> DNA <213> Artificial Sequence <220> <223> PAH intron-inserted silently altered coding sequence (mouse HBB first intron) <400> 81 atgtccaccg ctgtgctgga gaaccctggg ctggggagga aactgtcaga cttcgggcag 60 gagacttcat acattgagga taactgtaac cagaatggcg ccatctctct gatcttcagc 120 ctgaaggagg aagtgggcgc cctggcaaag gtgctgcgcc tgtttgagga gaacgacgtg 180 aatctgaccc acatcgagtc ccggccttct agactgaaga aggacgagta cgagttcttt 240 acccacctgg ataagcggtc cctgccagcc ctgacaaaca tcatcaagat cctgaggcac 300 gacatcggag caaccgtgca cgagctgtct cgggacaaga agaaggatac cgtgccctgg 360 ttccctcgga caatccagga gctggataga tttgccaacc agatcctgtc ttacggagca 420 gagctggacg cagatcaccc tggcttcaag gacccagtgt atcgggcccg gagaaagcag 480 tttgccgata tcgcctacaa ttataggcac ggacagccaa tccctcgcgt ggagtatatg 540 gaggaggaga agaagacctg gggcacagtg ttcaagaccc tgaagagcct gtacaagaca 600 cacgcctgct acgagtataa ccacatcttc cccctgctgg agaagtattg tggctttcac 660 gaggacaata tccctcagct ggaggacgtg agccagttcc tgcagacctg cacaggcttt 720 aggctgaggc cagtggcagg actgctgagc tcccgggact tcctgggagg actggccttc 780 agagtgtttc actgcaccca gtacatcagg cacggctcca agccaatgta tacaccagag 840 cccgacatct gtcacgagct gctgggccac gtgcccctgt ttagcgatag atccttcgcc 900 cagttttccc aggttggtat ccaggttaca aggcagctca caagaagaag ttgggtgctt 960 ggagacagag gtctgctttc cagcagacac taactttcag tgtcccctgt ctatgtttcc 1020 ctttttagga gatcggactg gcatctctgg gagcacctga cgagtacatc gagaagctgg 1080 ccaccatcta ttggttcaca gtggagtttg gcctgtgcaa gcagggcgat agcatcaagg 1140 cctacggagc aggactgctg tctagcttcg gcgagctgca gtattgtctg tccgagaagc 1200 caaagctgct gcccctggag ctggagaaga ccgccatcca gaactacacc gtgacagagt 1260 tccagcccct gtactatgtg gccgagtctt ttaacgatgc caaggagaag gtgagaaatt 1320 tcgccgccac aatccctagg cccttcagcg tgcggtacga cccttatacc cagaggatcg 1380 aggtgctgga taatacacag cagctgaaga tcctggctga ctcaatcaat agcgaaatcg 1440 gaatcctgtg ctccgccctg cagaaaatca aatga 1475 <210> 82 <211> 1451 <212> DNA <213> Artificial Sequence <220> <223> PAH intron-inserted silently altered coding sequence (MVM intron) <400> 82 atgtccaccg ctgtgctgga gaaccctggg ctggggagga aactgtcaga cttcgggcag 60 gagacttcat acattgagga taactgtaac cagaatggcg ccatctctct gatcttcagc 120 ctgaaggagg aagtgggcgc cctggcaaag gtgctgcgcc tgtttgagga gaacgacgtg 180 aatctgaccc acatcgagtc ccggccttct agactgaaga aggacgagta cgagttcttt 240 acccacctgg ataagcggtc cctgccagcc ctgacaaaca tcatcaagat cctgaggcac 300 gacatcggag caaccgtgca cgagctgtct cgggacaaga agaaggatac cgtgccctgg 360 ttccctcgga caatccagga gctggataga tttgccaacc agatcctgtc ttacggagca 420 gagctggacg cagatcaccc tggcttcaag gacccagtgt atcgggcccg gagaaagcag 480 tttgccgata tcgcctacaa ttataggcac ggacagccaa tccctcgcgt ggagtatatg 540 gaggaggaga agaagacctg gggcacagtg ttcaagaccc tgaagagcct gtacaagaca 600 cacgcctgct acgagtataa ccacatcttc cccctgctgg agaagtattg tggctttcac 660 gaggacaata tccctcagct ggaggacgtg agccagttcc tgcagacctg cacaggcttt 720 aggctgaggc cagtggcagg actgctgagc tcccgggact tcctgggagg actggccttc 780 agagtgtttc actgcaccca gtacatcagg cacggctcca agccaatgta tacaccagag 840 cccgacatct gtcacgagct gctgggccac gtgcccctgt ttagcgatag atccttcgcc 900 cagttttccc agaagaggta agggtttaag ggatggttgg ttggtggggt attaatgttt 960 aattacctgg agcacctgcc tgaaatcact ttttttcagg ttgggagatc ggactggcat 1020 ctctgggagc acctgacgag tacatcgaga agctggccac catctattgg ttcacagtgg 1080 agtttggcct gtgcaagcag ggcgatagca tcaaggccta cggagcagga ctgctgtcta 1140 gcttcggcga gctgcagtat tgtctgtccg agaagccaaa gctgctgccc ctggagctgg 1200 agaagaccgc catccagaac tacaccgtga cagagttcca gcccctgtac tatgtggccg 1260 agtcttttaa cgatgccaag gagaaggtga gaaatttcgc cgccacaatc cctaggccct 1320 tcagcgtgcg gtacgaccct tatacccaga ggatcgaggt gctggataat acacagcagc 1380 tgaagatcct ggctgactca atcaatagcg aaatcggaat cctgtgctcc gccctgcaga 1440 aaatcaaatg a 1451 <210> 83 <211> 1607 <212> DNA <213> Artificial Sequence <220> <223> pHMI-hPAH-hAC-008 editing element <400> 83 atgtccaccg ctgtgctgga gaaccctggg ctggggagga aactgtcaga cttcgggcag 60 gagacttcat acattgagga taactgtaac cagaatggcg ccatctctct gatcttcagc 120 ctgaaggagg aagtgggcgc cctggcaaag gtgctgcgcc tgtttgagga gaacgacgtg 180 aatctgaccc acatcgagtc ccggccttct agactgaaga aggacgagta cgagttcttt 240 acccacctgg ataagcggtc cctgccagcc ctgacaaaca tcatcaagat cctgaggcac 300 gacatcggag caaccgtgca cgagctgtct cgggacaaga agaaggatac cgtgccctgg 360 ttccctcgga caatccagga gctggataga tttgccaacc agatcctgtc ttacggagca 420 gagctggacg cagatcaccc tggcttcaag gacccagtgt atcgggcccg gagaaagcag 480 tttgccgata tcgcctacaa ttataggcac ggacagccaa tccctcgcgt ggagtatatg 540 gaggaggaga agaagacctg gggcacagtg ttcaagaccc tgaagagcct gtacaagaca 600 cacgcctgct acgagtataa ccacatcttc cccctgctgg agaagtattg tggctttcac 660 gaggacaata tccctcagct ggaggacgtg agccagttcc tgcagacctg cacaggcttt 720 aggctgaggc cagtggcagg actgctgagc tcccgggact tcctgggagg actggccttc 780 agagtgtttc actgcaccca gtacatcagg cacggctcca agccaatgta tacaccagag 840 cccgacatct gtcacgagct gctgggccac gtgcccctgt ttagcgatag atccttcgcc 900 cagttttccc aggagatcgg actggcatct ctgggagcac ctgacgagta catcgagaag 960 ctggccacca tctattggtt cacagtggag tttggcctgt gcaagcaggg cgatagcatc 1020 aaggcctacg gagcaggact gctgtctagc ttcggcgagc tgcagtattg tctgtccgag 1080 aagccaaagc tgctgcccct ggagctggag aagaccgcca tccagaacta caccgtgaca 1140 gagttccagc ccctgtacta tgtggccgag tcttttaacg atgccaagga gaaggtgaga 1200 aatttcgccg ccacaatccc taggcccttc agcgtgcggt acgaccctta tacccagagg 1260 atcgaggtgc tggataatac acagcagctg aagatcctgg ctgactcaat caatagcgaa 1320 atcggaatcc tgtgctccgc cctgcagaaa atcaaatgag aattcaaggc ctctcgagcc 1380 tctagaacta tagtgagtcg tattacgtag atccagacat gataagatac attgatgagt 1440 ttggacaaac cacaactaga atgcagtgaa aaaaatgctt tatttgtgaa atttgtgatg 1500 ctattgcttt atttgtaacc attataagct gcaataaaca agttaacaac aacaattgca 1560 ttcattttat gtttcaggtt cagggggagg tgtgggaggt tttttaa 1607 <210> 84 <211> 1719 <212> DNA <213> Artificial Sequence <220> <223> pHMI-hPAH-h1C-007 editing element <400> 84 ctgacctctt ctcttcctcc cacagggcgg taccagatct ggcagcggag agggcagagg 60 aagtcttcta acatgcggtg acgtggagga gaatcccggc cctaggggta ccatgtccac 120 cgctgtgctg gagaaccctg ggctggggag gaaactgtca gacttcgggc aggagacttc 180 atacattgag gataactgta accagaatgg cgccatctct ctgatcttca gcctgaagga 240 ggaagtgggc gccctggcaa aggtgctgcg cctgtttgag gagaacgacg tgaatctgac 300 ccacatcgag tcccggcctt ctagactgaa gaaggacgag tacgagttct ttacccacct 360 ggataagcgg tccctgccag ccctgacaaa catcatcaag atcctgaggc acgacatcgg 420 agcaaccgtg cacgagctgt ctcgggacaa gaagaaggat accgtgccct ggttccctcg 480 gacaatccag gagctggata gatttgccaa ccagatcctg tcttacggag cagagctgga 540 cgcagatcac cctggcttca aggacccagt gtatcgggcc cggagaaagc agtttgccga 600 tatcgcctac aattataggc acggacagcc aatccctcgc gtggagtata tggaggagga 660 gaagaagacc tggggcacag tgttcaagac cctgaagagc ctgtacaaga cacacgcctg 720 ctacgagtat aaccacatct tccccctgct ggagaagtat tgtggctttc acgaggacaa 780 tatccctcag ctggaggacg tgagccagtt cctgcagacc tgcacaggct ttaggctgag 840 gccagtggca ggactgctga gctcccggga cttcctggga ggactggcct tcagagtgtt 900 tcactgcacc cagtacatca ggcacggctc caagccaatg tatacaccag agcccgacat 960 ctgtcacgag ctgctgggcc acgtgcccct gtttagcgat agatccttcg cccagttttc 1020 ccaggagatc ggactggcat ctctgggagc acctgacgag tacatcgaga agctggccac 1080 catctattgg ttcacagtgg agtttggcct gtgcaagcag ggcgatagca tcaaggccta 1140 cggagcagga ctgctgtcta gcttcggcga gctgcagtat tgtctgtccg agaagccaaa 1200 gctgctgccc ctggagctgg agaagaccgc catccagaac tacaccgtga cagagttcca 1260 gcccctgtac tatgtggccg agtcttttaa cgatgccaag gagaaggtga gaaatttcgc 1320 cgccacaatc cctaggccct tcagcgtgcg gtacgaccct tatacccaga ggatcgaggt 1380 gctggataat acacagcagc tgaagatcct ggctgactca atcaatagcg aaatcggaat 1440 cctgtgctcc gccctgcaga aaatcaaatg agaattcaag gcctctcgag cctctagaac 1500 tatagtgagt cgtattacgt agatccagac atgataagat acattgatga gtttggacaa 1560 accacaacta gaatgcagtg aaaaaaatgc tttatttgtg aaatttgtga tgctattgct 1620 ttatttgtaa ccattataag ctgcaataaa caagttaaca acaacaattg cattcatttt 1680 atgtttcagg ttcaggggga ggtgtgggag gttttttaa 1719 <210> 85 <211> 3227 <212> DNA <213> Artificial Sequence <220> <223> pHMI-hPAH-hAC-008 correction genome from 5' homology arm to 3' homology arm <400> 85 tatcttccat ttactgagtg tttatgtgga agaactgtac taaattttaa tgcatttctt 60 tattcctatt cttaaaacct tccagcaagg tggctctacc accctctttt ccgagcttca 120 ggagcagttg tgcgaatagc tggagaacac caggctggat ttaaacccag atcgctctta 180 catttgctct ttacctgctg tgctcagcgt tcacgtgccc tctagctgta gttttctgaa 240 gtcagcgcac agcaaggcag tgtgcttaga ggttaacaga agggaaaaca acaacaacaa 300 aaatctaaat gagaatcctg actgtttcag ctgggggtaa ggggggcgga ttattcatat 360 aattgttata ccagacggtc gcaggcttag tccaattgca gagaactcgc ttcccaggct 420 tctgagagtc ccggaagtgc ctaaacctgt ctaatcgacg gggcttgggt ggcccgtcgc 480 tccctggctt cttcccttta cccagggcgg gcagcgaagt ggtgcctcct gcgtccccca 540 caccctccct cagcccctcc cctccggccc gtcctgggca ggtgacctgg agcatccggc 600 aggctgccct ggcctcctgc gtcaggacaa cgcccacgag gggcgttact gtgcggagat 660 gcaccacgca agagacaccc tttgtaactc tcttctcctc cctagtgcga ggttaaaacc 720 ttcagcccca cgtgctgttt gcaaacctgc ctgtacctga ggccctaaaa agccagagac 780 ctcactcccg gggagccagc atgtccaccg ctgtgctgga gaaccctggg ctggggagga 840 aactgtcaga cttcgggcag gagacttcat acattgagga taactgtaac cagaatggcg 900 ccatctctct gatcttcagc ctgaaggagg aagtgggcgc cctggcaaag gtgctgcgcc 960 tgtttgagga gaacgacgtg aatctgaccc acatcgagtc ccggccttct agactgaaga 1020 aggacgagta cgagttcttt acccacctgg ataagcggtc cctgccagcc ctgacaaaca 1080 tcatcaagat cctgaggcac gacatcggag caaccgtgca cgagctgtct cgggacaaga 1140 agaaggatac cgtgccctgg ttccctcgga caatccagga gctggataga tttgccaacc 1200 agatcctgtc ttacggagca gagctggacg cagatcaccc tggcttcaag gacccagtgt 1260 atcgggcccg gagaaagcag tttgccgata tcgcctacaa ttataggcac ggacagccaa 1320 tccctcgcgt ggagtatatg gaggaggaga agaagacctg gggcacagtg ttcaagaccc 1380 tgaagagcct gtacaagaca cacgcctgct acgagtataa ccacatcttc cccctgctgg 1440 agaagtattg tggctttcac gaggacaata tccctcagct ggaggacgtg agccagttcc 1500 tgcagacctg cacaggcttt aggctgaggc cagtggcagg actgctgagc tcccgggact 1560 tcctgggagg actggccttc agagtgtttc actgcaccca gtacatcagg cacggctcca 1620 agccaatgta tacaccagag cccgacatct gtcacgagct gctgggccac gtgcccctgt 1680 ttagcgatag atccttcgcc cagttttccc aggagatcgg actggcatct ctgggagcac 1740 ctgacgagta catcgagaag ctggccacca tctattggtt cacagtggag tttggcctgt 1800 gcaagcaggg cgatagcatc aaggcctacg gagcaggact gctgtctagc ttcggcgagc 1860 tgcagtattg tctgtccgag aagccaaagc tgctgcccct ggagctggag aagaccgcca 1920 tccagaacta caccgtgaca gagttccagc ccctgtacta tgtggccgag tcttttaacg 1980 atgccaagga gaaggtgaga aatttcgccg ccacaatccc taggcccttc agcgtgcggt 2040 acgaccctta tacccagagg atcgaggtgc tggataatac acagcagctg aagatcctgg 2100 ctgactcaat caatagcgaa atcggaatcc tgtgctccgc cctgcagaaa atcaaatgag 2160 aattcaaggc ctctcgagcc tctagaacta tagtgagtcg tattacgtag atccagacat 2220 gataagatac attgatgagt ttggacaaac cacaactaga atgcagtgaa aaaaatgctt 2280 tatttgtgaa atttgtgatg ctattgcttt atttgtaacc attataagct gcaataaaca 2340 agttaacaac aacaattgca ttcattttat gtttcaggtt cagggggagg tgtgggaggt 2400 tttttaagct ttacgtacga tcgtcgatcc actgcggtcc tggaaaaccc aggcttgggc 2460 aggaaactct ctgactttgg acaggtgagc cacggcagcc tgagctgctc agttagggga 2520 atttgggcct ccagagaaag agatccgaag actgctggtg cttcctggtt tcataagctc 2580 agtaagaagt ctgaattcgt tggaagctga tgagaatatc caggaagtca acagacaaat 2640 gtcctcaaca attgtttcta agtaggagaa catctgtcct cggtggcttt cacaggaatg 2700 aatgaccatt gctttagggg gttggggatc tggcctccag aactgccacc aattagctgt 2760 gtgtctttgg acaagttact gtccctctct gttgtctgtt tactcttctg tacactgaag 2820 gggctggtcc ctaatgatct gggatgggat gtggaatcct tctagatttc ttttgtaata 2880 tttataaagt gctctcagca aggtatcaaa atggcaaaat tgtgagtaac tatcctcctt 2940 tcattttggg aagaagatga ggcatgaaga gaattcagac agaaacttac tcagaccagg 3000 ggaggcagaa actaagcaga gaggaaaatg accaagagtt agccctgggc atggaatgtg 3060 aaagaaccct aaacgtgact tggaaataat gcccaaggta tattccattc tccgggattt 3120 gttggcattt tcttgaggtg aagaattgca gaatacattc tttaatgtga cctacatatt 3180 tacccatggg aggaagtctg ctcctggact cttgagattc agtcata 3227 <210> 86 <211> 3345 <212> DNA <213> Artificial Sequence <220> <223> pHMI-hPAH-h1C-007 correction genome from 5' homology arm to 3' homology arm <400> 86 aatggttcca aaattttcta tggttaagaa tcacctggga tggttttgaa atggcagatt 60 ctaagacaac ttgattcaac aggtttaggt aaagcccagg gaactgcatt ataagaagga 120 atcacctgta attttggagt caagatccaa ggaacactca ttgagaaaca ctgatttaca 180 aagtgcatgg agagaaatgg agcaagtgaa gggggatcag catggtgaaa tataggctgt 240 taggagtgct attgactaac tgtctggtga ctggaccaga gtaaatcttt tactttgcaa 300 gaaacaggac taaattccca tattatgtcc atagcaaagg gaattatgta gaaaaattga 360 taattaggag cctgagttct tgaccagcct ccactaccta tgtggcctca ggtgagttat 420 tttctccctt tggctctaag ttttccccat ctgtaatgta agggagttta actagatgag 480 cactaaggac aaatcaattt ctgtgagtca attattatga aataccatgt gggcatcaaa 540 tgccaagtgg aaagcataga taaagaagtg attgtgcacc tgggctgagg ggaacaaaca 600 tttcctaaga gaattgagac ccaaaagagc ctttaaggaa ggtgagatct tggaaaggga 660 aatttggtga atactctaat gaggagctaa aaaggcaaga aagaaagcag cttggctgga 720 aaggaggttc ctgtaggtgg gcctccagag attcggtacc acagaaactg ccaaacatca 780 gcaagaagcc atggggatgg aagcttctga cctcttctct tcctcccaca gggcggtacc 840 agatctggca gcggagaggg cagaggaagt cttctaacat gcggtgacgt ggaggagaat 900 cccggcccta ggggtaccat gtccaccgct gtgctggaga accctgggct ggggaggaaa 960 ctgtcagact tcgggcagga gacttcatac attgaggata actgtaacca gaatggcgcc 1020 atctctctga tcttcagcct gaaggaggaa gtgggcgccc tggcaaaggt gctgcgcctg 1080 tttgaggaga acgacgtgaa tctgacccac atcgagtccc ggccttctag actgaagaag 1140 gacgagtacg agttctttac ccacctggat aagcggtccc tgccagccct gacaaacatc 1200 atcaagatcc tgaggcacga catcggagca accgtgcacg agctgtctcg ggacaagaag 1260 aaggataccg tgccctggtt ccctcggaca atccaggagc tggatagatt tgccaaccag 1320 atcctgtctt acggagcaga gctggacgca gatcaccctg gcttcaagga cccagtgtat 1380 cgggcccgga gaaagcagtt tgccgatatc gcctacaatt ataggcacgg acagccaatc 1440 cctcgcgtgg agtatatgga ggaggagaag aagacctggg gcacagtgtt caagaccctg 1500 aagagcctgt acaagacaca cgcctgctac gagtataacc acatcttccc cctgctggag 1560 aagtattgtg gctttcacga ggacaatatc cctcagctgg aggacgtgag ccagttcctg 1620 cagacctgca caggctttag gctgaggcca gtggcaggac tgctgagctc ccgggacttc 1680 ctgggaggac tggccttcag agtgtttcac tgcacccagt acatcaggca cggctccaag 1740 ccaatgtata caccagagcc cgacatctgt cacgagctgc tgggccacgt gcccctgttt 1800 agcgatagat ccttcgccca gttttcccag gagatcggac tggcatctct gggagcacct 1860 gacgagtaca tcgagaagct ggccaccatc tattggttca cagtggagtt tggcctgtgc 1920 aagcagggcg atagcatcaa ggcctacgga gcaggactgc tgtctagctt cggcgagctg 1980 cagtattgtc tgtccgagaa gccaaagctg ctgcccctgg agctggagaa gaccgccatc 2040 cagaactaca ccgtgacaga gttccagccc ctgtactatg tggccgagtc ttttaacgat 2100 gccaaggaga aggtgagaaa tttcgccgcc acaatcccta ggcccttcag cgtgcggtac 2160 gacccttata cccagaggat cgaggtgctg gataatacac agcagctgaa gatcctggct 2220 gactcaatca atagcgaaat cggaatcctg tgctccgccc tgcagaaaat caaatgagaa 2280 ttcaaggcct ctcgagcctc tagaactata gtgagtcgta ttacgtagat ccagacatga 2340 taagatacat tgatgagttt ggacaaacca caactagaat gcagtgaaaa aaatgcttta 2400 tttgtgaaat ttgtgatgct attgctttat ttgtaaccat tataagctgc aataaacaag 2460 ttaacaacaa caattgcatt cattttatgt ttcaggttca gggggaggtg tgggaggttt 2520 tttaagcttt acgtacgatc gtcgaagcgt ttgagggatt ctaaatagaa ggacaagagt 2580 aaaaatgtca ggctggatcg atgcaggcca ctaagaaatg gattcaggtg atggcagtgg 2640 gaagaaagga cctgatgccc agaggcattt ctggagaaga tgagatcaga cttgtgattg 2700 gctgaacaca cactgtagtg gggtggggtt tagggggtga ctcaacttca agcccaggta 2760 cattcaagtc tgaattgccc tagtcaaaag tggcatctgt ggatgtgtat cagaaatatc 2820 ttacttttct tggaagccaa caggagaaaa gagtgctacc aagtgaacta gagacaggaa 2880 tatcttttgt catttcaagg aaactggaaa gaagaaggct cagtattctt tagtaggaag 2940 aagacttaag tcagagactc atctgtacct ctctggcagg gtttaaaagg gggaagagga 3000 atagaggctg caagagattg tgattcatgg acagtatgca gagatcaaat gacctgggtt 3060 cagatcctgg ctccactgct aactgtgtaa ctataggcaa gttccttaac ctctctaagc 3120 cttaatcttg tcatcaataa aagggggcac ttggtgccta ataaaaccta cctcttaggt 3180 tgttgccaaa ttacatgaga taatccaaat caagtgctta ttataatacc cagaaattat 3240 aggctctaaa taaatgttta tataggctct aaataaatga agttttttag aaagataaca 3300 tcatgatcaa aatgggatat ttaacagttt agtcttccat ttcat 3345 <210> 87 <211> 3637 <212> DNA <213> Artificial Sequence <220> <223> pHMI-hPAH-hAC-008 correction genome from 5' ITR to 3' ITR <400> 87 ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 60 cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag agagggagtg 120 gccaactcca tcactagggg ttcctggagg ggtggagtcg tgacgtgaat tacgtcatag 180 ggttagggag gtcctgcata tgcggccgct atcttccatt tactgagtgt ttatgtggaa 240 gaactgtact aaattttaat gcatttcttt attcctattc ttaaaacctt ccagcaaggt 300 ggctctacca ccctcttttc cgagcttcag gagcagttgt gcgaatagct ggagaacacc 360 aggctggatt taaacccaga tcgctcttac atttgctctt tacctgctgt gctcagcgtt 420 cacgtgccct ctagctgtag ttttctgaag tcagcgcaca gcaaggcagt gtgcttagag 480 gttaacagaa gggaaaacaa caacaacaaa aatctaaatg agaatcctga ctgtttcagc 540 tgggggtaag gggggcggat tattcatata attgttatac cagacggtcg caggcttagt 600 ccaattgcag agaactcgct tcccaggctt ctgagagtcc cggaagtgcc taaacctgtc 660 taatcgacgg ggcttgggtg gcccgtcgct ccctggcttc ttccctttac ccagggcggg 720 cagcgaagtg gtgcctcctg cgtcccccac accctccctc agcccctccc ctccggcccg 780 tcctgggcag gtgacctgga gcatccggca ggctgccctg gcctcctgcg tcaggacaac 840 gcccacgagg ggcgttactg tgcggagatg caccacgcaa gagacaccct ttgtaactct 900 cttctcctcc ctagtgcgag gttaaaacct tcagccccac gtgctgtttg caaacctgcc 960 tgtacctgag gccctaaaaa gccagagacc tcactcccgg ggagccagca tgtccaccgc 1020 tgtgctggag aaccctgggc tggggaggaa actgtcagac ttcgggcagg agacttcata 1080 cattgaggat aactgtaacc agaatggcgc catctctctg atcttcagcc tgaaggagga 1140 agtgggcgcc ctggcaaagg tgctgcgcct gtttgaggag aacgacgtga atctgaccca 1200 catcgagtcc cggccttcta gactgaagaa ggacgagtac gagttcttta cccacctgga 1260 taagcggtcc ctgccagccc tgacaaacat catcaagatc ctgaggcacg acatcggagc 1320 aaccgtgcac gagctgtctc gggacaagaa gaaggatacc gtgccctggt tccctcggac 1380 aatccaggag ctggatagat ttgccaacca gatcctgtct tacggagcag agctggacgc 1440 agatcaccct ggcttcaagg acccagtgta tcgggcccgg agaaagcagt ttgccgatat 1500 cgcctacaat tataggcacg gacagccaat ccctcgcgtg gagtatatgg aggaggagaa 1560 gaagacctgg ggcacagtgt tcaagaccct gaagagcctg tacaagacac acgcctgcta 1620 cgagtataac cacatcttcc ccctgctgga gaagtattgt ggctttcacg aggacaatat 1680 ccctcagctg gaggacgtga gccagttcct gcagacctgc acaggcttta ggctgaggcc 1740 agtggcagga ctgctgagct cccgggactt cctgggagga ctggccttca gagtgtttca 1800 ctgcacccag tacatcaggc acggctccaa gccaatgtat acaccagagc ccgacatctg 1860 tcacgagctg ctgggccacg tgcccctgtt tagcgataga tccttcgccc agttttccca 1920 ggagatcgga ctggcatctc tgggagcacc tgacgagtac atcgagaagc tggccaccat 1980 ctattggttc acagtggagt ttggcctgtg caagcagggc gatagcatca aggcctacgg 2040 agcaggactg ctgtctagct tcggcgagct gcagtattgt ctgtccgaga agccaaagct 2100 gctgcccctg gagctggaga agaccgccat ccagaactac accgtgacag agttccagcc 2160 cctgtactat gtggccgagt cttttaacga tgccaaggag aaggtgagaa atttcgccgc 2220 cacaatccct aggcccttca gcgtgcggta cgacccttat acccagagga tcgaggtgct 2280 ggataataca cagcagctga agatcctggc tgactcaatc aatagcgaaa tcggaatcct 2340 gtgctccgcc ctgcagaaaa tcaaatgaga attcaaggcc tctcgagcct ctagaactat 2400 agtgagtcgt attacgtaga tccagacatg ataagataca ttgatgagtt tggacaaacc 2460 acaactagaa tgcagtgaaa aaaatgcttt atttgtgaaa tttgtgatgc tattgcttta 2520 tttgtaacca ttataagctg caataaacaa gttaacaaca acaattgcat tcattttatg 2580 tttcaggttc agggggaggt gtgggaggtt ttttaagctt tacgtacgat cgtcgatcca 2640 ctgcggtcct ggaaaaccca ggcttgggca ggaaactctc tgactttgga caggtgagcc 2700 acggcagcct gagctgctca gttaggggaa tttgggcctc cagagaaaga gatccgaaga 2760 ctgctggtgc ttcctggttt cataagctca gtaagaagtc tgaattcgtt ggaagctgat 2820 gagaatatcc aggaagtcaa cagacaaatg tcctcaacaa ttgtttctaa gtaggagaac 2880 atctgtcctc ggtggctttc acaggaatga atgaccattg ctttaggggg ttggggatct 2940 ggcctccaga actgccacca attagctgtg tgtctttgga caagttactg tccctctctg 3000 ttgtctgttt actcttctgt acactgaagg ggctggtccc taatgatctg ggatgggatg 3060 tggaatcctt ctagatttct tttgtaatat ttataaagtg ctctcagcaa ggtatcaaaa 3120 tggcaaaatt gtgagtaact atcctccttt cattttggga agaagatgag gcatgaagag 3180 aattcagaca gaaacttact cagaccaggg gaggcagaaa ctaagcagag aggaaaatga 3240 ccaagagtta gccctgggca tggaatgtga aagaacccta aacgtgactt ggaaataatg 3300 cccaaggtat attccattct ccgggatttg ttggcatttt cttgaggtga agaattgcag 3360 aatacattct ttaatgtgac ctacatattt acccatggga ggaagtctgc tcctggactc 3420 ttgagattca gtcataaacc tgcaggtcta gatacgtaga taagtagcat ggcgggttaa 3480 tcattaacta caaggaaccc ctagtgatgg agttggccac tccctctctg cgcgctcgct 3540 cgctcactga ggccgggcga ccaaaggtcg cccgacgccc gggctttgcc cgggcggcct 3600 cagtgagcga gcgagcgcgc agagagggag tggccaa 3637 <210> 88 <211> 3755 <212> DNA <213> Artificial Sequence <220> <223> pHMI-hPAH-h1C-007 correction genome from 5' ITR to 3' ITR <400> 88 ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 60 cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag agagggagtg 120 gccaactcca tcactagggg ttcctggagg ggtggagtcg tgacgtgaat tacgtcatag 180 ggttagggag gtcctgcata tgcggccgca atggttccaa aattttctat ggttaagaat 240 cacctgggat ggttttgaaa tggcagattc taagacaact tgattcaaca ggtttaggta 300 aagcccaggg aactgcatta taagaaggaa tcacctgtaa ttttggagtc aagatccaag 360 gaacactcat tgagaaacac tgatttacaa agtgcatgga gagaaatgga gcaagtgaag 420 ggggatcagc atggtgaaat ataggctgtt aggagtgcta ttgactaact gtctggtgac 480 tggaccagag taaatctttt actttgcaag aaacaggact aaattcccat attatgtcca 540 tagcaaaggg aattatgtag aaaaattgat aattaggagc ctgagttctt gaccagcctc 600 cactacctat gtggcctcag gtgagttatt ttctcccttt ggctctaagt tttccccatc 660 tgtaatgtaa gggagtttaa ctagatgagc actaaggaca aatcaatttc tgtgagtcaa 720 ttattatgaa ataccatgtg ggcatcaaat gccaagtgga aagcatagat aaagaagtga 780 ttgtgcacct gggctgaggg gaacaaacat ttcctaagag aattgagacc caaaagagcc 840 tttaaggaag gtgagatctt ggaaagggaa atttggtgaa tactctaatg aggagctaaa 900 aaggcaagaa agaaagcagc ttggctggaa aggaggttcc tgtaggtggg cctccagaga 960 ttcggtacca cagaaactgc caaacatcag caagaagcca tggggatgga agcttctgac 1020 ctcttctctt cctcccacag ggcggtacca gatctggcag cggagagggc agaggaagtc 1080 ttctaacatg cggtgacgtg gaggagaatc ccggccctag gggtaccatg tccaccgctg 1140 tgctggagaa ccctgggctg gggaggaaac tgtcagactt cgggcaggag acttcataca 1200 ttgaggataa ctgtaaccag aatggcgcca tctctctgat cttcagcctg aaggaggaag 1260 tgggcgccct ggcaaaggtg ctgcgcctgt ttgaggagaa cgacgtgaat ctgacccaca 1320 tcgagtcccg gccttctaga ctgaagaagg acgagtacga gttctttacc cacctggata 1380 agcggtccct gccagccctg acaaacatca tcaagatcct gaggcacgac atcggagcaa 1440 ccgtgcacga gctgtctcgg gacaagaaga aggataccgt gccctggttc cctcggacaa 1500 tccaggagct ggatagattt gccaaccaga tcctgtctta cggagcagag ctggacgcag 1560 atcaccctgg cttcaaggac ccagtgtatc gggcccggag aaagcagttt gccgatatcg 1620 cctacaatta taggcacgga cagccaatcc ctcgcgtgga gtatatggag gaggagaaga 1680 agacctgggg cacagtgttc aagaccctga agagcctgta caagacacac gcctgctacg 1740 agtataacca catcttcccc ctgctggaga agtattgtgg ctttcacgag gacaatatcc 1800 ctcagctgga ggacgtgagc cagttcctgc agacctgcac aggctttagg ctgaggccag 1860 tggcaggact gctgagctcc cgggacttcc tgggaggact ggccttcaga gtgtttcact 1920 gcacccagta catcaggcac ggctccaagc caatgtatac accagagccc gacatctgtc 1980 acgagctgct gggccacgtg cccctgttta gcgatagatc cttcgcccag ttttcccagg 2040 agatcggact ggcatctctg ggagcacctg acgagtacat cgagaagctg gccaccatct 2100 attggttcac agtggagttt ggcctgtgca agcagggcga tagcatcaag gcctacggag 2160 caggactgct gtctagcttc ggcgagctgc agtattgtct gtccgagaag ccaaagctgc 2220 tgcccctgga gctggagaag accgccatcc agaactacac cgtgacagag ttccagcccc 2280 tgtactatgt ggccgagtct tttaacgatg ccaaggagaa ggtgagaaat ttcgccgcca 2340 caatccctag gcccttcagc gtgcggtacg acccttatac ccagaggatc gaggtgctgg 2400 ataatacaca gcagctgaag atcctggctg actcaatcaa tagcgaaatc ggaatcctgt 2460 gctccgccct gcagaaaatc aaatgagaat tcaaggcctc tcgagcctct agaactatag 2520 tgagtcgtat tacgtagatc cagacatgat aagatacatt gatgagtttg gacaaaccac 2580 aactagaatg cagtgaaaaa aatgctttat ttgtgaaatt tgtgatgcta ttgctttatt 2640 tgtaaccatt ataagctgca ataaacaagt taacaacaac aattgcattc attttatgtt 2700 tcaggttcag ggggaggtgt gggaggtttt ttaagcttta cgtacgatcg tcgaagcgtt 2760 tgagggattc taaatagaag gacaagagta aaaatgtcag gctggatcga tgcaggccac 2820 taagaaatgg attcaggtga tggcagtggg aagaaaggac ctgatgccca gaggcatttc 2880 tggagaagat gagatcagac ttgtgattgg ctgaacacac actgtagtgg ggtggggttt 2940 agggggtgac tcaacttcaa gcccaggtac attcaagtct gaattgccct agtcaaaagt 3000 ggcatctgtg gatgtgtatc agaaatatct tacttttctt ggaagccaac aggagaaaag 3060 agtgctacca agtgaactag agacaggaat atcttttgtc atttcaagga aactggaaag 3120 aagaaggctc agtattcttt agtaggaaga agacttaagt cagagactca tctgtacctc 3180 tctggcaggg tttaaaaggg ggaagaggaa tagaggctgc aagagattgt gattcatgga 3240 cagtatgcag agatcaaatg acctgggttc agatcctggc tccactgcta actgtgtaac 3300 tataggcaag ttccttaacc tctctaagcc ttaatcttgt catcaataaa agggggcact 3360 tggtgcctaa taaaacctac ctcttaggtt gttgccaaat tacatgagat aatccaaatc 3420 aagtgcttat tataataccc agaaattata ggctctaaat aaatgtttat ataggctcta 3480 aataaatgaa gttttttaga aagataacat catgatcaaa atgggatatt taacagttta 3540 gtcttccatt tcataacctg caggtctaga tacgtagata agtagcatgg cgggttaatc 3600 attaactaca aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg 3660 ctcactgagg ccgggcgacc aaaggtcgcc cgacgcccgg gctttgcccg ggcggcctca 3720 gtgagcgagc gagcgcgcag agagggagtg gccaa 3755 <210> 89 <211> 20 <212> DNA <213> Homo sapiens <400> 89 ccaaatccca ccagctcact 20 <210> 90 <211> 21 <212> DNA <213> Homo sapiens <400> 90 tcccatgaaa ctgaggtgtg a 21 <210> 91 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> PAH_Genomic Set 1, primer F <400> 91 gctccatcct gcacatagtt 20 <210> 92 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> PAH_Genomic Set 1, primer R <400> 92 cctatgcttt cctgatgaga tcc 23 <210> 93 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> PAH_Genomic Set 1, probe <400> 93 ttggtgctgc tggcaatacg gtc 23 <210> 94 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> SV40_FAM Set 1, primer F <400> 94 gcaatagcat cacaaatttc ac 22 <210> 95 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> SV40_FAM Set 1, primer R <400> 95 gatccagaca tgataagata cattg 25 <210> 96 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> SV40_FAM Set 1, probe <400> 96 tcactgcatt ctagttgtgg tttgtcca 28 <210> 97 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> PAH_HA Set 1, primer F <400> 97 tccagtcacc agacagttag t 21 <210> 98 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> PAH_HA Set 1, primer R <400> 98 ggagagaaat ggagcaagtg aa 22 <210> 99 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> PAH_HA Set 1, probe <400> 99 acagcctata tttcaccatg ctgatccc 28 <210> 100 <211> 800 <212> DNA <213> Mus musculus <400> 100 agcattagct tccatttatg cagtgtaaat ggtgagaaca gccccgactg aatacccaga 60 gcatcatctc gtctgtgtca ttcatgcaca taacatatct cagcgaggtg gcccttctgt 120 cctctttgca gagacccagc caccatacta gtacctagag aactggctgg atttcagccc 180 cgatacctcc gggcttttgc tcatgttcgc ctcatagggt catctgggtg gttgcctaag 240 gaaaagtatg tcatggagac taacttgctt ggcattgaat aaaaggtgag ttgagagtgg 300 agcgtgttta aattgcaatc ctgcctctat ttctgtgctt gcagggaaca gtcatcctta 360 attgctatcc tccatcatca tcatgattat ttctggtttt tctctggttg cggagaatcc 420 atactccagg tattccaatg tctcagcatt gccaggcctg tctgagcgtc aggatgtagg 480 tagtctgggc tctctgcctt ctattcttgt ccaggatact ctgccaaaag aatcatgttg 540 tggctgccac ccctcccaca aagcctcccg cttgggtcag tccaggactg gagttgggta 600 tggactgttc atgtctatcc actgctacgt cagggcaaca cccactgaga gtgaccttgt 660 agactgcagt gggagacacc cttcaaaacc tctcctctcc tgtcctgaga gccaggttaa 720 aaccatcagc cccgcatcct gagtgcaaac ttttcctaac cctgctgcta agctagacac 780 ctcacttact gagagccagc 800 <210> 101 <211> 800 <212> DNA <213> Mus musculus <400> 101 gcagctgttg tcctggagaa cggagtcctg agcagaaaac tctcagactt tgggcaggta 60 agcctgttgg gcttccactg ctaggagaga attggttccc cacatgtgaa agcagtctgg 120 gaaatgctgg tatttccagt ctcctaaggc tactaagaaa tatgacttta tttagaggcg 180 aggaaaatgc ccaggaagtc aactgatgag actagtctta acaagttgag gatacagaaa 240 gttggggatc tgagctgcta ccaacatctg tgtgtctttg ggtggctcat tggtatcctc 300 tgcctattgg ctttatcttc tgtacactga aaggaaatgg ctggtcctta gtcacctggg 360 gtgggagtcc ctatctctcc agggatactt attcaatcct ttcttctggg tatcaaaatg 420 acaagcttgt aagaaactgt cctctttcgg ctttcaggag gtgatgtcgc atgaagagaa 480 tttggggggg gggacttact cagaaccaag gagggagaaa ttaaacagag agggaaatga 540 acaggagtta gcccggagcc tgaagcacct tggggattat gctgggggtg gagggaatcc 600 attgtcctcc ctagggaggg cttgcagaac atgttctttt ctgtgatatt tgtactttcc 660 ccagattgca aatcatggtt tgtacactga gattcagtct ctggaggtaa tatgcctttt 720 ctagcttttc cttggacagg actaaggggt tgagggttgc ctggagtcag agaaatttgt 780 gttaaagaag gttgatatga 800 <210> 102 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> mPAH_ATG_gDNA_FAM Set 1, primer F <400> 102 cagcatcaga agcagaacat tt 22 <210> 103 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> mPAH_ATG_gDNA_FAM Set 1, primer R <400> 103 aaagcacatc agcagtttca a 21 <210> 104 <211> 29 <212> DNA <213> Artificial Sequence <220> <223> mPAH_ATG_gDNA_FAM Set 1, probe <400> 104 agatgaaagc aactgaacat cgactacga 29 <210> 105 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> SV40_FAM Set 1, primer F <400> 105 gcaatagcat cacaaatttc ac 22 <210> 106 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> SV40_FAM Set 1, primer R <400> 106 gatccagaca tgataagata cattg 25 <210> 107 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> SV40_FAM Set 1, probe <400> 107 tcactgcatt ctagttgtgg tttgtcca 28 <210> 108 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> mPah_1C_LHA_FAM Set 3, primer F <400> 108 gcaagctcca gatcaccaat a 21 <210> 109 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> mPah_1C_LHA_FAM Set 3, primer R <400> 109 ctgagcaatg cattcagcaa taa 23 <210> 110 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> mPah_1C_LHA_FAM Set 3, probe <400> 110 ccctgaacat cccttgacag agca 24 <210> 111 <211> 800 <212> DNA <213> Mus musculus <400> 111 agcattagct tccatttatg cagtgtaaat ggtgagaaca gccccgactg aatacccaga 60 gcatcatctc gtctgtgtca ttcatgcaca taacatatct cagcgaggtg gcccttctgt 120 cctctttgca gagacccagc caccatacta gtacctagag aactggctgg atttcagccc 180 cgatacctcc gggcttttgc tcatgttcgc ctcatagggt catctgggtg gttgcctaag 240 gaaaagtatg tcatggagac taacttgctt ggcattgaat aaaaggtgag ttgagagtgg 300 agcgtgttta aattgcaatc ctgcctctat ttctgtgctt gcagggaaca gtcatcctta 360 attgctatcc tccatcatca tcatgattat ttctggtttt tctctggttg cggagaatcc 420 atactccagg tattccaatg tctcagcatt gccaggcctg tctgagcgtc aggatgtagg 480 tagtctgggc tctctgcctt ctattcttgt ccaggatact ctgccaaaag aatcatgttg 540 tggctgccac ccctcccaca aagcctcccg cttgggtcag tccaggactg gagttgggta 600 tggactgttc atgtctatcc actgctacgt cagggcaaca cccactgaga gtgaccttgt 660 agactgcagt gggagacacc cttcaaaacc tctcctctcc tgtcctgaga gccaggttaa 720 aaccatcagc cccgcatcct gagtgcaaac ttttcctaac cctgctgcta agctagacac 780 ctcacttact gagagccagc 800 <210> 112 <211> 800 <212> DNA <213> Mus musculus <400> 112 gcagctgttg tcctggagaa cggagtcctg agcagaaaac tctcagactt tgggcaggta 60 agcctgttgg gcttccactg ctaggagaga attggttccc cacatgtgaa agcagtctgg 120 gaaatgctgg tatttccagt ctcctaaggc tactaagaaa tatgacttta tttagaggcg 180 aggaaaatgc ccaggaagtc aactgatgag actagtctta acaagttgag gatacagaaa 240 gttggggatc tgagctgcta ccaacatctg tgtgtctttg ggtggctcat tggtatcctc 300 tgcctattgg ctttatcttc tgtacactga aaggaaatgg ctggtcctta gtcacctggg 360 gtgggagtcc ctatctctcc agggatactt attcaatcct ttcttctggg tatcaaaatg 420 acaagcttgt aagaaactgt cctctttcgg ctttcaggag gtgatgtcgc atgaagagaa 480 tttggggggg gggacttact cagaaccaag gagggagaaa ttaaacagag agggaaatga 540 acaggagtta gcccggagcc tgaagcacct tggggattat gctgggggtg gagggaatcc 600 attgtcctcc ctagggaggg cttgcagaac atgttctttt ctgtgatatt tgtactttcc 660 ccagattgca aatcatggtt tgtacactga gattcagtct ctggaggtaa tatgcctttt 720 ctagcttttc cttggacagg actaaggggt tgagggttgc ctggagtcag agaaatttgt 780 gttaaagaag gttgatatga 800 <210> 113 <211> 3227 <212> DNA <213> Artificial Sequence <220> <223> 006 vector correction genome <400> 113 agcattagct tccatttatg cagtgtaaat ggtgagaaca gccccgactg aatacccaga 60 gcatcatctc gtctgtgtca ttcatgcaca taacatatct cagcgaggtg gcccttctgt 120 cctctttgca gagacccagc caccatacta gtacctagag aactggctgg atttcagccc 180 cgatacctcc gggcttttgc tcatgttcgc ctcatagggt catctgggtg gttgcctaag 240 gaaaagtatg tcatggagac taacttgctt ggcattgaat aaaaggtgag ttgagagtgg 300 agcgtgttta aattgcaatc ctgcctctat ttctgtgctt gcagggaaca gtcatcctta 360 attgctatcc tccatcatca tcatgattat ttctggtttt tctctggttg cggagaatcc 420 atactccagg tattccaatg tctcagcatt gccaggcctg tctgagcgtc aggatgtagg 480 tagtctgggc tctctgcctt ctattcttgt ccaggatact ctgccaaaag aatcatgttg 540 tggctgccac ccctcccaca aagcctcccg cttgggtcag tccaggactg gagttgggta 600 tggactgttc atgtctatcc actgctacgt cagggcaaca cccactgaga gtgaccttgt 660 agactgcagt gggagacacc cttcaaaacc tctcctctcc tgtcctgaga gccaggttaa 720 aaccatcagc cccgcatcct gagtgcaaac ttttcctaac cctgctgcta agctagacac 780 ctcacttact gagagccagc atgtccaccg ctgtgctgga gaaccctggg ctggggagga 840 aactgtcaga cttcgggcag gagacttcat acattgagga taactgtaac cagaatggcg 900 ccatctctct gatcttcagc ctgaaggagg aagtgggcgc cctggcaaag gtgctgcgcc 960 tgtttgagga gaacgacgtg aatctgaccc acatcgagtc ccggccttct agactgaaga 1020 aggacgagta cgagttcttt acccacctgg ataagcggtc cctgccagcc ctgacaaaca 1080 tcatcaagat cctgaggcac gacatcggag caaccgtgca cgagctgtct cgggacaaga 1140 agaaggatac cgtgccctgg ttccctcgga caatccagga gctggataga tttgccaacc 1200 agatcctgtc ttacggagca gagctggacg cagatcaccc tggcttcaag gacccagtgt 1260 atcgggcccg gagaaagcag tttgccgata tcgcctacaa ttataggcac ggacagccaa 1320 tccctcgcgt ggagtatatg gaggaggaga agaagacctg gggcacagtg ttcaagaccc 1380 tgaagagcct gtacaagaca cacgcctgct acgagtataa ccacatcttc cccctgctgg 1440 agaagtattg tggctttcac gaggacaata tccctcagct ggaggacgtg agccagttcc 1500 tgcagacctg cacaggcttt aggctgaggc cagtggcagg actgctgagc tcccgggact 1560 tcctgggagg actggccttc agagtgtttc actgcaccca gtacatcagg cacggctcca 1620 agccaatgta tacaccagag cccgacatct gtcacgagct gctgggccac gtgcccctgt 1680 ttagcgatag atccttcgcc cagttttccc aggagatcgg actggcatct ctgggagcac 1740 ctgacgagta catcgagaag ctggccacca tctattggtt cacagtggag tttggcctgt 1800 gcaagcaggg cgatagcatc aaggcctacg gagcaggact gctgtctagc ttcggcgagc 1860 tgcagtattg tctgtccgag aagccaaagc tgctgcccct ggagctggag aagaccgcca 1920 tccagaacta caccgtgaca gagttccagc ccctgtacta tgtggccgag tcttttaacg 1980 atgccaagga gaaggtgaga aatttcgccg ccacaatccc taggcccttc agcgtgcggt 2040 acgaccctta tacccagagg atcgaggtgc tggataatac acagcagctg aagatcctgg 2100 ctgactcaat caatagcgaa atcggaatcc tgtgctccgc cctgcagaaa atcaaatgag 2160 aattcaaggc ctctcgagcc tctagaacta tagtgagtcg tattacgtag atccagacat 2220 gataagatac attgatgagt ttggacaaac cacaactaga atgcagtgaa aaaaatgctt 2280 tatttgtgaa atttgtgatg ctattgcttt atttgtaacc attataagct gcaataaaca 2340 agttaacaac aacaattgca ttcattttat gtttcaggtt cagggggagg tgtgggaggt 2400 tttttaagct ttacgtacga tcgtcgagca gctgttgtcc tggagaacgg agtcctgagc 2460 agaaaactct cagactttgg gcaggtaagc ctgttgggct tccactgcta ggagagaatt 2520 ggttccccac atgtgaaagc agtctgggaa atgctggtat ttccagtctc ctaaggctac 2580 taagaaatat gactttattt agaggcgagg aaaatgccca ggaagtcaac tgatgagact 2640 agtcttaaca agttgaggat acagaaagtt ggggatctga gctgctacca acatctgtgt 2700 gtctttgggt ggctcattgg tatcctctgc ctattggctt tatcttctgt acactgaaag 2760 gaaatggctg gtccttagtc acctggggtg ggagtcccta tctctccagg gatacttatt 2820 caatcctttc ttctgggtat caaaatgaca agcttgtaag aaactgtcct ctttcggctt 2880 tcaggaggtg atgtcgcatg aagagaattt gggggggggg acttactcag aaccaaggag 2940 ggagaaatta aacagagagg gaaatgaaca ggagttagcc cggagcctga agcaccttgg 3000 ggattatgct gggggtggag ggaatccatt gtcctcccta gggagggctt gcagaacatg 3060 ttcttttctg tgatatttgt actttcccca gattgcaaat catggtttgt acactgagat 3120 tcagtctctg gaggtaatat gccttttcta gcttttcctt ggacaggact aaggggttga 3180 gggttgcctg gagtcagaga aatttgtgtt aaagaaggtt gatatga 3227 <210> 114 <211> 3635 <212> DNA <213> Artificial Sequence <220> <223> 006 vector correction genome (+ ITRs) <400> 114 ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 60 cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag agagggagtg 120 gccaactcca tcactagggg ttcctggagg ggtggagtcg tgacgtgaat tacgtcatag 180 ggttagggag gtcctgcata tgcggccgca gcattagctt ccatttatgc agtgtaaatg 240 gtgagaacag ccccgactga atacccagag catcatctcg tctgtgtcat tcatgcacat 300 aacatatctc agcgaggtgg cccttctgtc ctctttgcag agacccagcc accatactag 360 tacctagaga actggctgga tttcagcccc gatacctccg ggcttttgct catgttcgcc 420 tcatagggtc atctgggtgg ttgcctaagg aaaagtatgt catggagact aacttgcttg 480 gcattgaata aaaggtgagt tgagagtgga gcgtgtttaa attgcaatcc tgcctctatt 540 tctgtgcttg cagggaacag tcatccttaa ttgctatcct ccatcatcat catgattatt 600 tctggttttt ctctggttgc ggagaatcca tactccaggt attccaatgt ctcagcattg 660 ccaggcctgt ctgagcgtca ggatgtaggt agtctgggct ctctgccttc tattcttgtc 720 caggatactc tgccaaaaga atcatgttgt ggctgccacc cctcccacaa agcctcccgc 780 ttgggtcagt ccaggactgg agttgggtat ggactgttca tgtctatcca ctgctacgtc 840 agggcaacac ccactgagag tgaccttgta gactgcagtg ggagacaccc ttcaaaacct 900 ctcctctcct gtcctgagag ccaggttaaa accatcagcc ccgcatcctg agtgcaaact 960 tttcctaacc ctgctgctaa gctagacacc tcacttactg agagccagca tgtccaccgc 1020 tgtgctggag aaccctgggc tggggaggaa actgtcagac ttcgggcagg agacttcata 1080 cattgaggat aactgtaacc agaatggcgc catctctctg atcttcagcc tgaaggagga 1140 agtgggcgcc ctggcaaagg tgctgcgcct gtttgaggag aacgacgtga atctgaccca 1200 catcgagtcc cggccttcta gactgaagaa ggacgagtac gagttcttta cccacctgga 1260 taagcggtcc ctgccagccc tgacaaacat catcaagatc ctgaggcacg acatcggagc 1320 aaccgtgcac gagctgtctc gggacaagaa gaaggatacc gtgccctggt tccctcggac 1380 aatccaggag ctggatagat ttgccaacca gatcctgtct tacggagcag agctggacgc 1440 agatcaccct ggcttcaagg acccagtgta tcgggcccgg agaaagcagt ttgccgatat 1500 cgcctacaat tataggcacg gacagccaat ccctcgcgtg gagtatatgg aggaggagaa 1560 gaagacctgg ggcacagtgt tcaagaccct gaagagcctg tacaagacac acgcctgcta 1620 cgagtataac cacatcttcc ccctgctgga gaagtattgt ggctttcacg aggacaatat 1680 ccctcagctg gaggacgtga gccagttcct gcagacctgc acaggcttta ggctgaggcc 1740 agtggcagga ctgctgagct cccgggactt cctgggagga ctggccttca gagtgtttca 1800 ctgcacccag tacatcaggc acggctccaa gccaatgtat acaccagagc ccgacatctg 1860 tcacgagctg ctgggccacg tgcccctgtt tagcgataga tccttcgccc agttttccca 1920 ggagatcgga ctggcatctc tgggagcacc tgacgagtac atcgagaagc tggccaccat 1980 ctattggttc acagtggagt ttggcctgtg caagcagggc gatagcatca aggcctacgg 2040 agcaggactg ctgtctagct tcggcgagct gcagtattgt ctgtccgaga agccaaagct 2100 gctgcccctg gagctggaga agaccgccat ccagaactac accgtgacag agttccagcc 2160 cctgtactat gtggccgagt cttttaacga tgccaaggag aaggtgagaa atttcgccgc 2220 cacaatccct aggcccttca gcgtgcggta cgacccttat acccagagga tcgaggtgct 2280 ggataataca cagcagctga agatcctggc tgactcaatc aatagcgaaa tcggaatcct 2340 gtgctccgcc ctgcagaaaa tcaaatgaga attcaaggcc tctcgagcct ctagaactat 2400 agtgagtcgt attacgtaga tccagacatg ataagataca ttgatgagtt tggacaaacc 2460 acaactagaa tgcagtgaaa aaaatgcttt atttgtgaaa tttgtgatgc tattgcttta 2520 tttgtaacca ttataagctg caataaacaa gttaacaaca acaattgcat tcattttatg 2580 tttcaggttc agggggaggt gtgggaggtt ttttaagctt tacgtacgat cgtcgagcag 2640 ctgttgtcct ggagaacgga gtcctgagca gaaaactctc agactttggg caggtaagcc 2700 tgttgggctt ccactgctag gagagaattg gttccccaca tgtgaaagca gtctgggaaa 2760 tgctggtatt tccagtctcc taaggctact aagaaatatg actttattta gaggcgagga 2820 aaatgcccag gaagtcaact gatgagacta gtcttaacaa gttgaggata cagaaagttg 2880 gggatctgag ctgctaccaa catctgtgtg tctttgggtg gctcattggt atcctctgcc 2940 tattggcttt atcttctgta cactgaaagg aaatggctgg tccttagtca cctggggtgg 3000 gagtccctat ctctccaggg atacttattc aatcctttct tctgggtatc aaaatgacaa 3060 gcttgtaaga aactgtcctc tttcggcttt caggaggtga tgtcgcatga agagaatttg 3120 ggggggggga cttactcaga accaaggagg gagaaattaa acagagaggg aaatgaacag 3180 gagttagccc ggagcctgaa gcaccttggg gattatgctg ggggtggagg gaatccattg 3240 tcctccctag ggagggcttg cagaacatgt tcttttctgt gatatttgta ctttccccag 3300 attgcaaatc atggtttgta cactgagatt cagtctctgg aggtaatatg ccttttctag 3360 cttttccttg gacaggacta aggggttgag ggttgcctgg agtcagagaa atttgtgtta 3420 aagaaggttg atatgacctg caggtctaga tacgtagata agtagcatgg cgggttaatc 3480 attaactaca aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg 3540 ctcactgagg ccgggcgacc aaaggtcgcc cgacgcccgg gctttgcccg ggcggcctca 3600 gtgagcgagc gagcgcgcag agagggagtg gccaa 3635 <210> 115 <211> 960 <212> DNA <213> Homo sapiens <400> 115 gcttcaggag cagttgtgcg aatagctgga gaacaccagg ctggatttaa acccagatcg 60 ctcttacatt tgctctttac ctgctgtgct cagcgttcac gtgccctcta gctgtagttt 120 tctgaagtca gcgcacagca aggcagtgtg cttagaggtt aacagaaggg aaaacaacaa 180 caacaaaaat ctaaatgaga atcctgactg tttcagctgg gggtaagggg ggcggattat 240 tcatataatt gttataccag acggtcgcag gcttagtcca attgcagaga actcgcttcc 300 caggcttctg agagtcccgg aagtgcctaa acctgtctaa tcgacggggc ttgggtggcc 360 cgtcgctccc tggcttcttc cctttaccca gggcgggcag cgaagtggtg cctcctgcgt 420 cccccacacc ctccctcagc ccctcccctc cggcccgtcc tgggcaggtg acctggagca 480 tccggcaggc tgccctggcc tcctgcgtca ggacaacgcc cacgaggggc gttactgtgc 540 ggagatgcac cacgcaagag acaccctttg taactctctt ctcctcccta gtgcgaggtt 600 aaaaccttca gccccacgtg ctgtttgcaa acctgcctgt acctgaggcc ctaaaaagcc 660 agagacctca ctcccgggga gccagcatgt ccactgcggt cctggaaaac ccaggcttgg 720 gcaggaaact ctctgacttt ggacaggtga gccacggcag cctgagctgc tcagttaggg 780 gaatttgggc ctccagagaa agagatctga agactgctgg tgcttcctgg tttcataagc 840 tcagtaagaa gtctgaattc gttggaagct gatgagaata tccaggaagt caacagacaa 900 atgtcctcaa caattgtttc taagtaggag aacatctgtc ctcggtggct ttcacaggaa 960 <210> 116 <211> 1353 <212> DNA <213> Artificial Sequence <220> <223> Silently altered PAH coding sequence <400> 116 tccaccgctg tgctggagaa ccctgggctg gggaggaaac tgtcagactt cgggcaggag 60 acttcataca ttgaggataa ctgtaaccag aatggcgcca tctctctgat cttcagcctg 120 aaggaggaag tgggcgccct ggcaaaggtg ctgcgcctgt ttgaggagaa cgacgtgaat 180 ctgacccaca tcgagtcccg gccttctaga ctgaagaagg acgagtacga gttctttacc 240 cacctggata agcggtccct gccagccctg acaaacatca tcaagatcct gaggcacgac 300 atcggagcaa ccgtgcacga gctgtctcgg gacaagaaga aggataccgt gccctggttc 360 cctcggacaa tccaggagct ggatagattt gccaaccaga tcctgtctta cggagcagag 420 ctggacgcag atcaccctgg cttcaaggac ccagtgtatc gggcccggag aaagcagttt 480 gccgatatcg cctacaatta taggcacgga cagccaatcc ctcgcgtgga gtatatggag 540 gaggagaaga agacctgggg cacagtgttc aagaccctga agagcctgta caagacacac 600 gcctgctacg agtataacca catcttcccc ctgctggaga agtattgtgg ctttcacgag 660 gacaatatcc ctcagctgga ggacgtgagc cagttcctgc agacctgcac aggctttagg 720 ctgaggccag tggcaggact gctgagctcc cgggacttcc tgggaggact ggccttcaga 780 gtgtttcact gcacccagta catcaggcac ggctccaagc caatgtatac accagagccc 840 gacatctgtc acgagctgct gggccacgtg cccctgttta gcgatagatc cttcgcccag 900 ttttcccagg agatcggact ggcatctctg ggagcacctg acgagtacat cgagaagctg 960 gccaccatct attggttcac agtggagttt ggcctgtgca agcagggcga tagcatcaag 1020 gcctacggag caggactgct gtctagcttc ggcgagctgc agtattgtct gtccgagaag 1080 ccaaagctgc tgcccctgga gctggagaag accgccatcc agaactacac cgtgacagag 1140 ttccagcccc tgtactatgt ggccgagtct tttaacgatg ccaaggagaa ggtgagaaat 1200 ttcgccgcca caatccctag gcccttcagc gtgcggtacg acccttatac ccagaggatc 1260 gaggtgctgg ataatacaca gcagctgaag atcctggctg actcaatcaa tagcgaaatc 1320 ggaatcctgt gctccgccct gcagaaaatc aaa 1353 <210> 117 <211> 910 <212> DNA <213> Homo sapiens <400> 117 ctgggatggg atgtggaatc cttctagatt tcttttgtaa tatttataaa gtgctctcag 60 caaggtatca aaatggcaaa attgtgagta actatcctcc tttcattttg ggaagaagat 120 gaggcatgaa gagaattcag acagaaactt actcagacca ggggaggcag aaactaagca 180 gagaggaaaa tgaccaagag ttagccctgg gcatggaatg tgaaagaacc ctaaacgtga 240 cttggaaata atgcccaagg tatattccat tctccgggat ttgttggcat tttcttgagg 300 tgaagaattg cagaatacat tctttaatgt gacctacata tttacccatg ggaggaagtc 360 tgctcctgga ctcttgagat tcagtcataa agcccaggcc agggaaataa tgtaagtctg 420 caggcccctg tcatcagtag gattagggag aagagttctc agtagaaaac agggaggctg 480 gagagaaaag aatggttaat gttaacgtta atataactag aaagactgca gaacttagga 540 ctgattttta tttgaatcct taaaaaaaaa atttcttatg aaaatagtac atggctctta 600 ggagacagaa cttattgtac agaggaacag cgtgagagtc agagtgatcc cagaacaggt 660 cctggctcca tcctgcacat agttttggtg ctgctggcaa tacggtcccc acaactgtgg 720 gaaggggtta ggggcaggga tctcatcagg aaagcatagg ggtttaaagt tctttataga 780 gcacttagaa gattgagaat ccacaaatta tattaataac aaacaaagta gtgtcgtgtt 840 atatagtaaa tgtgaatttg cagacacatt tagggaaaag ttataattaa aaaaataggc 900 tgtatatata 910 <210> 118 <211> 3713 <212> DNA <213> Artificial Sequence <220> <223> 032 correction vector genome <400> 118 gcttcaggag cagttgtgcg aatagctgga gaacaccagg ctggatttaa acccagatcg 60 ctcttacatt tgctctttac ctgctgtgct cagcgttcac gtgccctcta gctgtagttt 120 tctgaagtca gcgcacagca aggcagtgtg cttagaggtt aacagaaggg aaaacaacaa 180 caacaaaaat ctaaatgaga atcctgactg tttcagctgg gggtaagggg ggcggattat 240 tcatataatt gttataccag acggtcgcag gcttagtcca attgcagaga actcgcttcc 300 caggcttctg agagtcccgg aagtgcctaa acctgtctaa tcgacggggc ttgggtggcc 360 cgtcgctccc tggcttcttc cctttaccca gggcgggcag cgaagtggtg cctcctgcgt 420 cccccacacc ctccctcagc ccctcccctc cggcccgtcc tgggcaggtg acctggagca 480 tccggcaggc tgccctggcc tcctgcgtca ggacaacgcc cacgaggggc gttactgtgc 540 ggagatgcac cacgcaagag acaccctttg taactctctt ctcctcccta gtgcgaggtt 600 aaaaccttca gccccacgtg ctgtttgcaa acctgcctgt acctgaggcc ctaaaaagcc 660 agagacctca ctcccgggga gccagcatgt ccactgcggt cctggaaaac ccaggcttgg 720 gcaggaaact ctctgacttt ggacaggtga gccacggcag cctgagctgc tcagttaggg 780 gaatttgggc ctccagagaa agagatctga agactgctgg tgcttcctgg tttcataagc 840 tcagtaagaa gtctgaattc gttggaagct gatgagaata tccaggaagt caacagacaa 900 atgtcctcaa caattgtttc taagtaggag aacatctgtc ctcggtggct ttcacaggaa 960 aagcttctga cctcttctct tcctcccaca gggcggtacc agatctggca gcggagaggg 1020 cagaggaagt cttctaacat gcggtgacgt ggaggagaat cccggcccta ggggtacctc 1080 caccgctgtg ctggagaacc ctgggctggg gaggaaactg tcagacttcg ggcaggagac 1140 ttcatacatt gaggataact gtaaccagaa tggcgccatc tctctgatct tcagcctgaa 1200 ggaggaagtg ggcgccctgg caaaggtgct gcgcctgttt gaggagaacg acgtgaatct 1260 gacccacatc gagtcccggc cttctagact gaagaaggac gagtacgagt tctttaccca 1320 cctggataag cggtccctgc cagccctgac aaacatcatc aagatcctga ggcacgacat 1380 cggagcaacc gtgcacgagc tgtctcggga caagaagaag gataccgtgc cctggttccc 1440 tcggacaatc caggagctgg atagatttgc caaccagatc ctgtcttacg gagcagagct 1500 ggacgcagat caccctggct tcaaggaccc agtgtatcgg gcccggagaa agcagtttgc 1560 cgatatcgcc tacaattata ggcacggaca gccaatccct cgcgtggagt atatggagga 1620 ggagaagaag acctggggca cagtgttcaa gaccctgaag agcctgtaca agacacacgc 1680 ctgctacgag tataaccaca tcttccccct gctggagaag tattgtggct ttcacgagga 1740 caatatccct cagctggagg acgtgagcca gttcctgcag acctgcacag gctttaggct 1800 gaggccagtg gcaggactgc tgagctcccg ggacttcctg ggaggactgg ccttcagagt 1860 gtttcactgc acccagtaca tcaggcacgg ctccaagcca atgtatacac cagagcccga 1920 catctgtcac gagctgctgg gccacgtgcc cctgtttagc gatagatcct tcgcccagtt 1980 ttcccaggag atcggactgg catctctggg agcacctgac gagtacatcg agaagctggc 2040 caccatctat tggttcacag tggagtttgg cctgtgcaag cagggcgata gcatcaaggc 2100 ctacggagca ggactgctgt ctagcttcgg cgagctgcag tattgtctgt ccgagaagcc 2160 aaagctgctg cccctggagc tggagaagac cgccatccag aactacaccg tgacagagtt 2220 ccagcccctg tactatgtgg ccgagtcttt taacgatgcc aaggagaagg tgagaaattt 2280 cgccgccaca atccctaggc ccttcagcgt gcggtacgac ccttataccc agaggatcga 2340 ggtgctggat aatacacagc agctgaagat cctggctgac tcaatcaata gcgaaatcgg 2400 aatcctgtgc tccgccctgc agaaaatcaa aggtaagcct atccctaacc ctctcctcgg 2460 tctcgattct acgtgatctt gtggaaagga cgaaacaccg gggaattcaa ggcctctcga 2520 gcctctagaa tccccgagac gtttcgtctc gggatcacta tagtgagtcg tattacgtac 2580 acagtgcagg ggaaagaata gtagagatcc agacatgata agatacattg atgagtttgg 2640 acaaaccaca actagaatgc agtgaaaaaa atgctttatt tgtgaaattt gtgatgctat 2700 tgctttattt gtaaccatta taagctgcaa taaacaagtt aacaacaaca attgcattca 2760 ttttatgttt caggttcagg gggaggtgtg ggaggttttt taactgggat gggatgtgga 2820 atccttctag atttcttttg taatatttat aaagtgctct cagcaaggta tcaaaatggc 2880 aaaattgtga gtaactatcc tcctttcatt ttgggaagaa gatgaggcat gaagagaatt 2940 cagacagaaa cttactcaga ccaggggagg cagaaactaa gcagagagga aaatgaccaa 3000 gagttagccc tgggcatgga atgtgaaaga accctaaacg tgacttggaa ataatgccca 3060 aggtatattc cattctccgg gatttgttgg cattttcttg aggtgaagaa ttgcagaata 3120 cattctttaa tgtgacctac atatttaccc atgggaggaa gtctgctcct ggactcttga 3180 gattcagtca taaagcccag gccagggaaa taatgtaagt ctgcaggccc ctgtcatcag 3240 taggattagg gagaagagtt ctcagtagaa aacagggagg ctggagagaa aagaatggtt 3300 aatgttaacg ttaatataac tagaaagact gcagaactta ggactgattt ttatttgaat 3360 ccttaaaaaa aaaatttctt atgaaaatag tacatggctc ttaggagaca gaacttattg 3420 tacagaggaa cagcgtgaga gtcagagtga tcccagaaca ggtcctggct ccatcctgca 3480 catagttttg gtgctgctgg caatacggtc cccacaactg tgggaagggg ttaggggcag 3540 ggatctcatc aggaaagcat aggggtttaa agttctttat agagcactta gaagattgag 3600 aatccacaaa ttatattaat aacaaacaaa gtagtgtcgt gttatatagt aaatgtgaat 3660 ttgcagacac atttagggaa aagttataat taaaaaaata ggctgtatat ata 3713 <210> 119 <211> 4139 <212> DNA <213> Artificial Sequence <220> <223> 032 vector correction genome (+ ITRs) <400> 119 ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 60 cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag agagggagtg 120 gccaactcca tcactagggg ttcctggagg ggtggagtcg tgacgtgaat tacgtcatag 180 ggttagggag gtcctgcata tgcggccgct tcaggagcag ttgtgcgaat agctggagaa 240 caccaggctg gatttaaacc cagatcgctc ttacatttgc tctttacctg ctgtgctcag 300 cgttcacgtg ccctctagct gtagttttct gaagtcagcg cacagcaagg cagtgtgctt 360 agaggttaac agaagggaaa acaacaacaa caaaaatcta aatgagaatc ctgactgttt 420 cagctggggg taaggggggc ggattattca tataattgtt ataccagacg gtcgcaggct 480 tagtccaatt gcagagaact cgcttcccag gcttctgaga gtcccggaag tgcctaaacc 540 tgtctaatcg acggggcttg ggtggcccgt cgctccctgg cttcttccct ttacccaggg 600 cgggcagcga agtggtgcct cctgcgtccc ccacaccctc cctcagcccc tcccctccgg 660 cccgtcctgg gcaggtgacc tggagcatcc ggcaggctgc cctggcctcc tgcgtcagga 720 caacgcccac gaggggcgtt actgtgcgga gatgcaccac gcaagagaca ccctttgtaa 780 ctctcttctc ctccctagtg cgaggttaaa accttcagcc ccacgtgctg tttgcaaacc 840 tgcctgtacc tgaggcccta aaaagccaga gacctcactc ccggggagcc agcatgtcca 900 ctgcggtcct ggaaaaccca ggcttgggca ggaaactctc tgactttgga caggtgagcc 960 acggcagcct gagctgctca gttaggggaa tttgggcctc cagagaaaga gatctgaaga 1020 ctgctggtgc ttcctggttt cataagctca gtaagaagtc tgaattcgtt ggaagctgat 1080 gagaatatcc aggaagtcaa cagacaaatg tcctcaacaa ttgtttctaa gtaggagaac 1140 atctgtcctc ggtggctttc acaggaaaag cttctgacct cttctcttcc tcccacaggg 1200 cggtaccaga tctggcagcg gagagggcag aggaagtctt ctaacatgcg gtgacgtgga 1260 ggagaatccc ggccctaggg gtacctccac cgctgtgctg gagaaccctg ggctggggag 1320 gaaactgtca gacttcgggc aggagacttc atacattgag gataactgta accagaatgg 1380 cgccatctct ctgatcttca gcctgaagga ggaagtgggc gccctggcaa aggtgctgcg 1440 cctgtttgag gagaacgacg tgaatctgac ccacatcgag tcccggcctt ctagactgaa 1500 gaaggacgag tacgagttct ttacccacct ggataagcgg tccctgccag ccctgacaaa 1560 catcatcaag atcctgaggc acgacatcgg agcaaccgtg cacgagctgt ctcgggacaa 1620 gaagaaggat accgtgccct ggttccctcg gacaatccag gagctggata gatttgccaa 1680 ccagatcctg tcttacggag cagagctgga cgcagatcac cctggcttca aggacccagt 1740 gtatcgggcc cggagaaagc agtttgccga tatcgcctac aattataggc acggacagcc 1800 aatccctcgc gtggagtata tggaggagga gaagaagacc tggggcacag tgttcaagac 1860 cctgaagagc ctgtacaaga cacacgcctg ctacgagtat aaccacatct tccccctgct 1920 ggagaagtat tgtggctttc acgaggacaa tatccctcag ctggaggacg tgagccagtt 1980 cctgcagacc tgcacaggct ttaggctgag gccagtggca ggactgctga gctcccggga 2040 cttcctggga ggactggcct tcagagtgtt tcactgcacc cagtacatca ggcacggctc 2100 caagccaatg tatacaccag agcccgacat ctgtcacgag ctgctgggcc acgtgcccct 2160 gtttagcgat agatccttcg cccagttttc ccaggagatc ggactggcat ctctgggagc 2220 acctgacgag tacatcgaga agctggccac catctattgg ttcacagtgg agtttggcct 2280 gtgcaagcag ggcgatagca tcaaggccta cggagcagga ctgctgtcta gcttcggcga 2340 gctgcagtat tgtctgtccg agaagccaaa gctgctgccc ctggagctgg agaagaccgc 2400 catccagaac tacaccgtga cagagttcca gcccctgtac tatgtggccg agtcttttaa 2460 cgatgccaag gagaaggtga gaaatttcgc cgccacaatc cctaggccct tcagcgtgcg 2520 gtacgaccct tatacccaga ggatcgaggt gctggataat acacagcagc tgaagatcct 2580 ggctgactca atcaatagcg aaatcggaat cctgtgctcc gccctgcaga aaatcaaagg 2640 taagcctatc cctaaccctc tcctcggtct cgattctacg tgatcttgtg gaaaggacga 2700 aacaccgggg aattcaaggc ctctcgagcc tctagaatcc ccgagacgtt tcgtctcggg 2760 atcactatag tgagtcgtat tacgtacaca gtgcagggga aagaatagta gagatccaga 2820 catgataaga tacattgatg agtttggaca aaccacaact agaatgcagt gaaaaaaatg 2880 ctttatttgt gaaatttgtg atgctattgc tttatttgta accattataa gctgcaataa 2940 acaagttaac aacaacaatt gcattcattt tatgtttcag gttcaggggg aggtgtggga 3000 ggttttttaa ctgggatggg atgtggaatc cttctagatt tcttttgtaa tatttataaa 3060 gtgctctcag caaggtatca aaatggcaaa attgtgagta actatcctcc tttcattttg 3120 ggaagaagat gaggcatgaa gagaattcag acagaaactt actcagacca ggggaggcag 3180 aaactaagca gagaggaaaa tgaccaagag ttagccctgg gcatggaatg tgaaagaacc 3240 ctaaacgtga cttggaaata atgcccaagg tatattccat tctccgggat ttgttggcat 3300 tttcttgagg tgaagaattg cagaatacat tctttaatgt gacctacata tttacccatg 3360 ggaggaagtc tgctcctgga ctcttgagat tcagtcataa agcccaggcc agggaaataa 3420 tgtaagtctg caggcccctg tcatcagtag gattagggag aagagttctc agtagaaaac 3480 agggaggctg gagagaaaag aatggttaat gttaacgtta atataactag aaagactgca 3540 gaacttagga ctgattttta tttgaatcct taaaaaaaaa atttcttatg aaaatagtac 3600 atggctctta ggagacagaa cttattgtac agaggaacag cgtgagagtc agagtgatcc 3660 cagaacaggt cctggctcca tcctgcacat agttttggtg ctgctggcaa tacggtcccc 3720 acaactgtgg gaaggggtta ggggcaggga tctcatcagg aaagcatagg ggtttaaagt 3780 tctttataga gcacttagaa gattgagaat ccacaaatta tattaataac aaacaaagta 3840 gtgtcgtgtt atatagtaaa tgtgaatttg cagacacatt tagggaaaag ttataattaa 3900 aaaaataggc tgtatatata ctagatacgt agataagtag cctgcaggtc tagatacgta 3960 gataagtagc atggcgggtt aatcattaac tacaaggaac ccctagtgat ggagttggcc 4020 actccctctc tgcgcgctcg ctcgctcact gaggccgggc gaccaaaggt cgcccgacgc 4080 ccgggctttg cccgggcggc ctcagtgagc gagcgagcgc gcagagaggg agtggccaa 4139 <210> 120 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Chymeric MVM intron (ChiMVM) <400> 120 gtaagggttt aagggatggt tggttggtgg ggtattaatg tttaattacc tggagcacct 60 gcctgaaatc acctgacctc ttctcttcct cccacag 97 <210> 121 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> SV40 intron <400> 121 gtaagtttag tctttttgtc ttttatttca ggtcccggat ccggtggtgg tgcaaatcaa 60 agaactgctc ctcagtggat gttgccttta cttctag 97 <210> 122 <211> 521 <212> DNA <213> Artificial Sequence <220> <223> Adenovirus tripartite leader intron (AdTPL) <400> 122 gtcctcactc tcttccgcat cgctgtctgc gagggccagc tgttgggctc gcggttgagg 60 acaaactctt cgcggtcttt ccagtactct tggatcggaa acccgtcggc ctccgaacgg 120 tactccgcca ccgagggacc tgagcgagtc cgcatcgacc ggatcggaaa acctctcgag 180 aaaggcgtct aaccagtcac agtcgcaagg taggctgagc accgtggcgg gcggcagcgg 240 gtggcggtcg gggttgtttc tggcggaggt gctgctgatg atgtaattaa agtaggcggt 300 cttgagacgg cggatggtcg aggtgaggtg tggcaggctt gagatccagc tgttggggtg 360 agtactccct ctcaaaagcg ggcattactt ctgcgctaag attgtcagtt tccaaaaacg 420 aggaggattt gatattcacc tggcccgatc tggccataca cttgagtgac aatgacatcc 480 actttgcctt tctctccaca ggtgtccact cccaggtcca g 521 <210> 123 <211> 124 <212> DNA <213> Homo sapiens <400> 123 gtaagtatca aggttacaag acaggtttaa ggagaccaat agaaactggg catgtggaga 60 cagagaagac tcttgggttt ctgataggca ctgactctct tcctttgtcc tgttcccatt 120 tcag 124 <210> 124 <211> 230 <212> DNA <213> Artificial Sequence <220> <223> AdV/Ig chimeric intron (AdVIgG) <400> 124 gtgagtactc cctctcaaaa gcgggcatga cttctgcgct aagattgtca gtttccaaaa 60 acgaggagga tttgatattc acctggcccg cggtgatgcc tttgagggtg gccgcgtcca 120 tctggtcaga aaagacaatc tttttgttgt caagcttgag gtgtggcagg cttgagatct 180 ggccatacac ttgagtgaca atgacatcca ctttgccttt ctctccacag 230 <210> 125 <211> 133 <212> DNA <213> Artificial Sequence <220> <223> Beta globin Ig heavy chain intron (beta-globinIg) <400> 125 gtaagtatca aggttacaag acaggtttaa ggagaccaat agaaactggg cttgtcgaga 60 cagagaagac tcttgcgttt ctgataggca cctattggtc ttactgacat ccactttgcc 120 tttctctcca cag 133 <210> 126 <211> 82 <212> DNA <213> Artificial Sequence <220> <223> MVM intron <400> 126 gtaagggttt aagggatggt tggttggtgg ggtattaatg tttaattacc tggagcacct 60 gcctgaaatc actttttttc ag 82 <210> 127 <211> 618 <212> DNA <213> Artificial Sequence <220> <223> HCR1 element (OptHCR) <400> 127 gtaagtttta tggaatgtga atcataattc aatttttcaa catgcgttag gagggacatt 60 tcaaactctt ttttacccta gactttccta ccatcaccca gagtatccag ccaggagggg 120 aggggctaga gacaccagaa gtttagcagg gaggagggcg tagggattcg gggaatgaag 180 ggatgggatt cagactaggg ccaggaccca gggatggaga gaaagagatg agagtggttt 240 gggggcttgg tgacttagag aacagagctg caggctcaga ggcacacagg agtttctggg 300 ctggcccggc ccccttccaa cccctcatta tggaatccag cagctgtttg tgtgctgcct 360 ctgaagtcca cactgaacaa acttcagcct actcatgtcc catataaggg aaattatgga 420 atcagcaaac agcaaacaca cagccctccc tgcctgctga ccttggacct ggggcagagg 480 tcagagacct ccttggctct atgccacctc caacatccac tcgacccctt ggaatttcgg 540 tggagaggag cagaggttgt cctggcgtgg tttaggtagt gtgagagggc tgaccatgcc 600 ttcttctttt tcctacag 618 <210> 128 <211> 476 <212> DNA <213> Homo sapiens <400> 128 gtgagtctat gggacccttg atgttttctt tccccttctt ttctatggtt aagttcatgt 60 cataggaagg ggagaagtaa cagggtacac atattgacca aatcagggta attttgcatt 120 tgtaatttta aaaaatgctt tcttctttta atatactttt ttgtttatct tatttctaat 180 actttcccta atctctttct ttcagggcaa taatgataca atgtatcatg cctctttgca 240 ccattctaaa gaataacagt gataatttct gggttaaggc aatagcaata tttctgcata 300 taaatatttc tgcatataaa ttgtaactga tgtaagaggt ttcatattgc taatagcagc 360 tacaatccag ctaccattct gcttttattt tatggttggg ataaggctgg attattctga 420 gtccaagcta ggcccttttg ctaatcatgt tcatacctct tatcttcctc ccacag 476 <210> 129 <211> 299 <212> DNA <213> Artificial Sequence <220> <223> tFIX intron (FIX intron) <400> 129 gtaagtttcc ttttttaaaa tacattgagt atgcttgcct tttagatata gaaatatctg 60 atgctgtctt cttcactaaa ttttgattac atgatttgac agcaatattg aagagtctaa 120 cagccagcac gcaggttggc aactactgtg ggaacatcac agattttggc tccatgccct 180 aaagagaaat tggctttcag attatttgga ttaaaaacaa agactttctt aagagatgta 240 aaattttcat gatgttttct tttttgctaa aactaaagaa ttattctttt acatttcag 299 <210> 130 <211> 900 <212> DNA <213> Artificial Sequence <220> <223> ch2BLood intron (BloodEnh) <400> 130 gtaagtagtc tacactgggg ctaagtaaac atttactgag tgaaagaata aatacgtgca 60 gaacccagcc aacagagagc atccccggag gtggggccat gccctcaggc actcagagga 120 ggcaggcctc tggcagtagc taagcagatt cccgtctcag atgtcagccc tgcccaccct 180 tctgtgcccc cccgcccccc tggttggtgt ttgtgggaca gtttccactg tgttgcctgg 240 gaaacgaggc atcctgccac caccactccc cacctccggg ctgccaacac ctaccacgcc 300 cggcttgggg gttttggctg gtttcccttg tgtcctagtc agcttgagaa accctcggat 360 gcactcgcca cttttacagt gtggctttgc tcatctgggt gggaggtact gcctggggtg 420 agctcatcac ctctggttcc tcagtgcaag gcactaaagt ctcttggcac tgagttctta 480 caacttgttc caggggatat ttggtggttg atggtcacca cccatgtgtc atggtccctg 540 agcatccccc gccaccccac tgctccctat tttggcagtt actgtcaccc tctagggatg 600 cagggatgca gtttacctat ctagagtgcg gtgatcaggt ggggaagtac aaatggcaat 660 tgacagctag agagcttgaa accctcccac ttggctctgc tcaccctgga ctctgggaga 720 cctcagctgc ccagcagtgg aggctggggc agcagagggg ccagacctgg gagcccagaa 780 gcctggatct gagtctgact cactgctgac ctttgacccc tggaggcttg ggcaagctga 840 ggaacttctc tggtcttaat cctgtgggtg actgaccatg ccttcttctt tttcctacag 900 <210> 131 <211> 1977 <212> DNA <213> Artificial Sequence <220> <223> 006-HCR vector PAH coding sequence <400> 131 atgtccaccg ctgtgctgga gaaccctggg ctggggagga aactgtcaga cttcgggcag 60 gtaagtttta tggaatgtga atcataattc aatttttcaa catgcgttag gagggacatt 120 tcaaactctt ttttacccta gactttccta ccatcaccca gagtatccag ccaggagggg 180 aggggctaga gacaccagaa gtttagcagg gaggagggcg tagggattcg gggaatgaag 240 ggatgggatt cagactaggg ccaggaccca gggatggaga gaaagagatg agagtggttt 300 gggggcttgg tgacttagag aacagagctg caggctcaga ggcacacagg agtttctggg 360 ctggcccggc ccccttccaa cccctcatta tggaatccag cagctgtttg tgtgctgcct 420 ctgaagtcca cactgaacaa acttcagcct actcatgtcc catataaggg aaattatgga 480 atcagcaaac agcaaacaca cagccctccc tgcctgctga ccttggacct ggggcagagg 540 tcagagacct ccttggctct atgccacctc caacatccac tcgacccctt ggaatttcgg 600 tggagaggag cagaggttgt cctggcgtgg tttaggtagt gtgagagggc tgaccatgcc 660 ttcttctttt tcctacagga aacttcatac attgaggata actgtaacca gaatggcgcc 720 atctctctga tcttcagcct gaaggaggaa gtgggcgccc tggcaaaggt gctgcgcctg 780 tttgaggaga acgacgtgaa tctgacccac atcgagtccc ggccttctag actgaagaag 840 gacgagtacg agttctttac ccacctggat aagcggtccc tgccagccct gacaaacatc 900 atcaagatcc tgaggcacga catcggagca accgtgcacg agctgtctcg ggacaagaag 960 aaggataccg tgccctggtt ccctcggaca atccaggagc tggatagatt tgccaaccag 1020 atcctgtctt acggagcaga gctggacgca gatcaccctg gcttcaagga cccagtgtat 1080 cgggcccgga gaaagcagtt tgccgatatc gcctacaatt ataggcacga acagccaatc 1140 cctcgcgtgg agtatatgga ggaggagaag aagacctggg gcacagtgtt caagaccctg 1200 aagagcctgt acaagacaca cgcctgctac gagtataacc acatcttccc cctgctggag 1260 aagtattgtg gctttcacga ggacaatatc cctcagctgg aggacgtgag ccagttcctg 1320 cagacctgca caggctttag gctgaggcca gtggcaggac tgctgagctc ccgggacttc 1380 ctgggaggac tggccttcag agtgtttcac tgcacccagt acatcaggca cggctccaag 1440 ccaatgtata caccagagcc cgacatctgt cacgagctgc tgggccacgt gcccctgttt 1500 agcgatagat ccttcgccca gttttcccag gagatcggac tggcatctct gggagcacct 1560 gacgagtaca tcgagaagct ggccaccatc tattggttca cagtggagtt tggcctgtgc 1620 aagcagggcg atagcatcaa ggcctacgga gcaggactgc tgtctagctt cggcgagctg 1680 cagtattgtc tgtccgagaa gccaaagctg ctgcccctgg agctggagaa gaccgccatc 1740 cagaactaca ccgtgacaga gttccagccc ctgtactatg tggccgagtc ttttaacgat 1800 gccaaggaga aggtgagaaa tttcgccgcc acaatcccta ggcccttcag cgtgcggtac 1860 gacccttata cccagaggat cgaggtgctg gataatacac agcagctgaa gatcctggct 1920 gactcaatca atagcgaaat cggaatcctg tgctccgccc tgcagaaaat caaatga 1977 <210> 132 <211> 1971 <212> DNA <213> Artificial Sequence <220> <223> 032-HCR vector PAH coding sequence <400> 132 tccaccgctg tgctggagaa ccctgggctg gggaggaaac tgtcagactt cgggcaggta 60 agttttatgg aatgtgaatc ataattcaat ttttcaacat gcgttaggag ggacatttca 120 aactcttttt taccctagac tttcctacca tcacccagag tatccagcca ggaggggagg 180 ggctagagac accagaagtt tagcagggag gagggcgtag ggattcgggg aatgaaggga 240 tgggattcag actagggcca ggacccaggg atggagagaa agagatgaga gtggtttggg 300 ggcttggtga cttagagaac agagctgcag gctcagaggc acacaggagt ttctgggctg 360 gcccggcccc cttccaaccc ctcattatgg aatccagcag ctgtttgtgt gctgcctctg 420 aagtccacac tgaacaaact tcagcctact catgtcccat ataagggaaa ttatggaatc 480 agcaaacagc aaacacacag ccctccctgc ctgctgacct tggacctggg gcagaggtca 540 gagacctcct tggctctatg ccacctccaa catccactcg accccttgga atttcggtgg 600 agaggagcag aggttgtcct ggcgtggttt aggtagtgtg agagggctga ccatgccttc 660 ttctttttcc tacaggaaac ttcatacatt gaggataact gtaaccagaa tggcgccatc 720 tctctgatct tcagcctgaa ggaggaagtg ggcgccctgg caaaggtgct gcgcctgttt 780 gaggagaacg acgtgaatct gacccacatc gagtcccggc cttctagact gaagaaggac 840 gagtacgagt tctttaccca cctggataag cggtccctgc cagccctgac aaacatcatc 900 aagatcctga ggcacgacat cggagcaacc gtgcacgagc tgtctcggga caagaagaag 960 gataccgtgc cctggttccc tcggacaatc caggagctgg atagatttgc caaccagatc 1020 ctgtcttacg gagcagagct ggacgcagat caccctggct tcaaggaccc agtgtatcgg 1080 gcccggagaa agcagtttgc cgatatcgcc tacaattata ggcacggaca gccaatccct 1140 cgcgtggagt atatggagga ggagaagaag acctggggca cagtgttcaa gaccctgaag 1200 agcctgtaca agacacacgc ctgctacgag tataaccaca tcttccccct gctggagaag 1260 tattgtggct ttcacgagga caatatccct cagctggagg acgtgagcca gttcctgcag 1320 acctgcacag gctttaggct gaggccagtg gcaggactgc tgagctcccg ggacttcctg 1380 ggaggactgg ccttcagagt gtttcactgc acccagtaca tcaggcacgg ctccaagcca 1440 atgtatacac cagagcccga catctgtcac gagctgctgg gccacgtgcc cctgtttagc 1500 gatagatcct tcgcccagtt ttcccaggag atcggactgg catctctggg agcacctgac 1560 gagtacatcg agaagctggc caccatctat tggttcacag tggagtttgg cctgtgcaag 1620 cagggcgata gcatcaaggc ctacggagca ggactgctgt ctagcttcgg cgagctgcag 1680 tattgtctgt ccgagaagcc aaagctgctg cccctggagc tggagaagac cgccatccag 1740 aactacaccg tgacagagtt ccagcccctg tactatgtgg ccgagtcttt taacgatgcc 1800 aaggagaagg tgagaaattt cgccgccaca atccctaggc ccttcagcgt gcggtacgac 1860 ccttataccc agaggatcga ggtgctggat aatacacagc agctgaagat cctggctgac 1920 tcaatcaata gcgaaatcgg aatcctgtgc tccgccctgc agaaaatcaa a 1971 <210> 133 <211> 174 <212> DNA <213> Artificial Sequence <220> <223> ID cassette <400> 133 ggtaagccta tccctaaccc tctcctcggt ctcgattcta cgtgatcttg tggaaaggac 60 gaaacaccgg ggaattcaag gcctctcgag cctctagaat ccccgagacg tttcgtctcg 120 ggatcactat agtgagtcgt attacgtaca cagtgcaggg gaaagaatag taga 174 <210> 134 <211> 800 <212> DNA <213> Artificial Sequence <220> <223> 006-HCR vector correction genome <400> 134 gcagctgttg tcctggagaa cggagtcctg agcagaaaac tctcagactt tgggcaggta 60 agcctgttgg gcttccactg ctaggagaga attggttccc cacatgtgaa agcagtctgg 120 gaaatgctgg tatttccagt ctcctaaggc tactaagaaa tatgacttta tttagaggcg 180 aggaaaatgc ccaggaagtc aactgatgag actagtctta acaagttgag gatacagaaa 240 gttggggatc tgagctgcta ccaacatctg tgtgtctttg ggtggctcat tggtatcctc 300 tgcctattgg ctttatcttc tgtacactga aaggaaatgg ctggtcctta gtcacctggg 360 gtgggagtcc ctatctctcc agggatactt attcaatcct ttcttctggg tatcaaaatg 420 acaagcttgt aagaaactgt cctctttcgg ctttcaggag gtgatgtcgc atgaagagaa 480 tttggggggg gggacttact cagaaccaag gagggagaaa ttaaacagag agggaaatga 540 acaggagtta gcccggagcc tgaagcacct tggggattat gctgggggtg gagggaatcc 600 attgtcctcc ctagggaggg cttgcagaac atgttctttt ctgtgatatt tgtactttcc 660 ccagattgca aatcatggtt tgtacactga gattcagtct ctggaggtaa tatgcctttt 720 ctagcttttc cttggacagg actaaggggt tgagggttgc ctggagtcag agaaatttgt 780 gttaaagaag gttgatatga 800 <210> 135 <211> 4253 <212> DNA <213> Artificial Sequence <220> <223> 006-HCR vector correction genome (+ITRs) <400> 135 ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 60 cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag agagggagtg 120 gccaactcca tcactagggg ttcctggagg ggtggagtcg tgacgtgaat tacgtcatag 180 ggttagggag gtcctgcata tgcggccgca gcattagctt ccatttatgc agtgtaaatg 240 gtgagaacag ccccgactga atacccagag catcatctcg tctgtgtcat tcatgcacat 300 aacatatctc agcgaggtgg cccttctgtc ctctttgcag agacccagcc accatactag 360 tacctagaga actggctgga tttcagcccc gatacctccg ggcttttgct catgttcgcc 420 tcatagggtc atctgggtgg ttgcctaagg aaaagtatgt catggagact aacttgcttg 480 gcattgaata aaaggtgagt tgagagtgga gcgtgtttaa attgcaatcc tgcctctatt 540 tctgtgcttg cagggaacag tcatccttaa ttgctatcct ccatcatcat catgattatt 600 tctggttttt ctctggttgc ggagaatcca tactccaggt attccaatgt ctcagcattg 660 ccaggcctgt ctgagcgtca ggatgtaggt agtctgggct ctctgccttc tattcttgtc 720 caggatactc tgccaaaaga atcatgttgt ggctgccacc cctcccacaa agcctcccgc 780 ttgggtcagt ccaggactgg agttgggtat ggactgttca tgtctatcca ctgctacgtc 840 agggcaacac ccactgagag tgaccttgta gactgcagtg ggagacaccc ttcaaaacct 900 ctcctctcct gtcctgagag ccaggttaaa accatcagcc ccgcatcctg agtgcaaact 960 tttcctaacc ctgctgctaa gctagacacc tcacttactg agagccagca tgtccaccgc 1020 tgtgctggag aaccctgggc tggggaggaa actgtcagac ttcgggcagg taagttttat 1080 ggaatgtgaa tcataattca atttttcaac atgcgttagg agggacattt caaactcttt 1140 tttaccctag actttcctac catcacccag agtatccagc caggagggga ggggctagag 1200 acaccagaag tttagcaggg aggagggcgt agggattcgg ggaatgaagg gatgggattc 1260 agactagggc caggacccag ggatggagag aaagagatga gagtggtttg ggggcttggt 1320 gacttagaga acagagctgc aggctcagag gcacacagga gtttctgggc tggcccggcc 1380 cccttccaac ccctcattat ggaatccagc agctgtttgt gtgctgcctc tgaagtccac 1440 actgaacaaa cttcagccta ctcatgtccc atataaggga aattatggaa tcagcaaaca 1500 gcaaacacac agccctccct gcctgctgac cttggacctg gggcagaggt cagagacctc 1560 cttggctcta tgccacctcc aacatccact cgaccccttg gaatttcggt ggagaggagc 1620 agaggttgtc ctggcgtggt ttaggtagtg tgagagggct gaccatgcct tcttcttttt 1680 cctacaggaa acttcataca ttgaggataa ctgtaaccag aatggcgcca tctctctgat 1740 cttcagcctg aaggaggaag tgggcgccct ggcaaaggtg ctgcgcctgt ttgaggagaa 1800 cgacgtgaat ctgacccaca tcgagtcccg gccttctaga ctgaagaagg acgagtacga 1860 gttctttacc cacctggata agcggtccct gccagccctg acaaacatca tcaagatcct 1920 gaggcacgac atcggagcaa ccgtgcacga gctgtctcgg gacaagaaga aggataccgt 1980 gccctggttc cctcggacaa tccaggagct ggatagattt gccaaccaga tcctgtctta 2040 cggagcagag ctggacgcag atcaccctgg cttcaaggac ccagtgtatc gggcccggag 2100 aaagcagttt gccgatatcg cctacaatta taggcacgaa cagccaatcc ctcgcgtgga 2160 gtatatggag gaggagaaga agacctgggg cacagtgttc aagaccctga agagcctgta 2220 caagacacac gcctgctacg agtataacca catcttcccc ctgctggaga agtattgtgg 2280 ctttcacgag gacaatatcc ctcagctgga ggacgtgagc cagttcctgc agacctgcac 2340 aggctttagg ctgaggccag tggcaggact gctgagctcc cgggacttcc tgggaggact 2400 ggccttcaga gtgtttcact gcacccagta catcaggcac ggctccaagc caatgtatac 2460 accagagccc gacatctgtc acgagctgct gggccacgtg cccctgttta gcgatagatc 2520 cttcgcccag ttttcccagg agatcggact ggcatctctg ggagcacctg acgagtacat 2580 cgagaagctg gccaccatct attggttcac agtggagttt ggcctgtgca agcagggcga 2640 tagcatcaag gcctacggag caggactgct gtctagcttc ggcgagctgc agtattgtct 2700 gtccgagaag ccaaagctgc tgcccctgga gctggagaag accgccatcc agaactacac 2760 cgtgacagag ttccagcccc tgtactatgt ggccgagtct tttaacgatg ccaaggagaa 2820 ggtgagaaat ttcgccgcca caatccctag gcccttcagc gtgcggtacg acccttatac 2880 ccagaggatc gaggtgctgg ataatacaca gcagctgaag atcctggctg actcaatcaa 2940 tagcgaaatc ggaatcctgt gctccgccct gcagaaaatc aaatgagaat tcaaggcctc 3000 tcgagcctct agaactatag tgagtcgtat tacgtagatc cagacatgat aagatacatt 3060 gatgagtttg gacaaaccac aactagaatg cagtgaaaaa aatgctttat ttgtgaaatt 3120 tgtgatgcta ttgctttatt tgtaaccatt ataagctgca ataaacaagt taacaacaac 3180 aattgcattc attttatgtt tcaggttcag ggggaggtgt gggaggtttt ttaagcttta 3240 cgtacgatcg tcgagcagct gttgtcctgg agaacggagt cctgagcaga aaactctcag 3300 actttgggca ggtaagcctg ttgggcttcc actgctagga gagaattggt tccccacatg 3360 tgaaagcagt ctgggaaatg ctggtatttc cagtctccta aggctactaa gaaatatgac 3420 tttatttaga ggcgaggaaa atgcccagga agtcaactga tgagactagt cttaacaagt 3480 tgaggataca gaaagttggg gatctgagct gctaccaaca tctgtgtgtc tttgggtggc 3540 tcattggtat cctctgccta ttggctttat cttctgtaca ctgaaaggaa atggctggtc 3600 cttagtcacc tggggtggga gtccctatct ctccagggat acttattcaa tcctttcttc 3660 tgggtatcaa aatgacaagc ttgtaagaaa ctgtcctctt tcggctttca ggaggtgatg 3720 tcgcatgaag agaatttggg gggggggact tactcagaac caaggaggga gaaattaaac 3780 agagagggaa atgaacagga gttagcccgg agcctgaagc accttgggga ttatgctggg 3840 ggtggaggga atccattgtc ctccctaggg agggcttgca gaacatgttc ttttctgtga 3900 tatttgtact ttccccagat tgcaaatcat ggtttgtaca ctgagattca gtctctggag 3960 gtaatatgcc ttttctagct tttccttgga caggactaag gggttgaggg ttgcctggag 4020 tcagagaaat ttgtgttaaa gaaggttgat atgacctgca ggtctagata cgtagataag 4080 tagcatggcg ggttaatcat taactacaag gaacccctag tgatggagtt ggccactccc 4140 tctctgcgcg ctcgctcgct cactgaggcc gggcgaccaa aggtcgcccg acgcccgggc 4200 tttgcccggg cggcctcagt gagcgagcga gcgcgcagag agggagtggc caa 4253 <210> 136 <211> 4331 <212> DNA <213> Artificial Sequence <220> <223> 032-HCR vector correction genome <400> 136 gcttcaggag cagttgtgcg aatagctgga gaacaccagg ctggatttaa acccagatcg 60 ctcttacatt tgctctttac ctgctgtgct cagcgttcac gtgccctcta gctgtagttt 120 tctgaagtca gcgcacagca aggcagtgtg cttagaggtt aacagaaggg aaaacaacaa 180 caacaaaaat ctaaatgaga atcctgactg tttcagctgg gggtaagggg ggcggattat 240 tcatataatt gttataccag acggtcgcag gcttagtcca attgcagaga actcgcttcc 300 caggcttctg agagtcccgg aagtgcctaa acctgtctaa tcgacggggc ttgggtggcc 360 cgtcgctccc tggcttcttc cctttaccca gggcgggcag cgaagtggtg cctcctgcgt 420 cccccacacc ctccctcagc ccctcccctc cggcccgtcc tgggcaggtg acctggagca 480 tccggcaggc tgccctggcc tcctgcgtca ggacaacgcc cacgaggggc gttactgtgc 540 ggagatgcac cacgcaagag acaccctttg taactctctt ctcctcccta gtgcgaggtt 600 aaaaccttca gccccacgtg ctgtttgcaa acctgcctgt acctgaggcc ctaaaaagcc 660 agagacctca ctcccgggga gccagcatgt ccactgcggt cctggaaaac ccaggcttgg 720 gcaggaaact ctctgacttt ggacaggtga gccacggcag cctgagctgc tcagttaggg 780 gaatttgggc ctccagagaa agagatctga agactgctgg tgcttcctgg tttcataagc 840 tcagtaagaa gtctgaattc gttggaagct gatgagaata tccaggaagt caacagacaa 900 atgtcctcaa caattgtttc taagtaggag aacatctgtc ctcggtggct ttcacaggaa 960 aagcttctga cctcttctct tcctcccaca gggcggtacc agatctggca gcggagaggg 1020 cagaggaagt cttctaacat gcggtgacgt ggaggagaat cccggcccta ggggtacctc 1080 caccgctgtg ctggagaacc ctgggctggg gaggaaactg tcagacttcg ggcaggtaag 1140 ttttatggaa tgtgaatcat aattcaattt ttcaacatgc gttaggaggg acatttcaaa 1200 ctctttttta ccctagactt tcctaccatc acccagagta tccagccagg aggggagggg 1260 ctagagacac cagaagttta gcagggagga gggcgtaggg attcggggaa tgaagggatg 1320 ggattcagac tagggccagg acccagggat ggagagaaag agatgagagt ggtttggggg 1380 cttggtgact tagagaacag agctgcaggc tcagaggcac acaggagttt ctgggctggc 1440 ccggccccct tccaacccct cattatggaa tccagcagct gtttgtgtgc tgcctctgaa 1500 gtccacactg aacaaacttc agcctactca tgtcccatat aagggaaatt atggaatcag 1560 caaacagcaa acacacagcc ctccctgcct gctgaccttg gacctggggc agaggtcaga 1620 gacctccttg gctctatgcc acctccaaca tccactcgac cccttggaat ttcggtggag 1680 aggagcagag gttgtcctgg cgtggtttag gtagtgtgag agggctgacc atgccttctt 1740 ctttttccta caggaaactt catacattga ggataactgt aaccagaatg gcgccatctc 1800 tctgatcttc agcctgaagg aggaagtggg cgccctggca aaggtgctgc gcctgtttga 1860 ggagaacgac gtgaatctga cccacatcga gtcccggcct tctagactga agaaggacga 1920 gtacgagttc tttacccacc tggataagcg gtccctgcca gccctgacaa acatcatcaa 1980 gatcctgagg cacgacatcg gagcaaccgt gcacgagctg tctcgggaca agaagaagga 2040 taccgtgccc tggttccctc ggacaatcca ggagctggat agatttgcca accagatcct 2100 gtcttacgga gcagagctgg acgcagatca ccctggcttc aaggacccag tgtatcgggc 2160 ccggagaaag cagtttgccg atatcgccta caattatagg cacggacagc caatccctcg 2220 cgtggagtat atggaggagg agaagaagac ctggggcaca gtgttcaaga ccctgaagag 2280 cctgtacaag acacacgcct gctacgagta taaccacatc ttccccctgc tggagaagta 2340 ttgtggcttt cacgaggaca atatccctca gctggaggac gtgagccagt tcctgcagac 2400 ctgcacaggc tttaggctga ggccagtggc aggactgctg agctcccggg acttcctggg 2460 aggactggcc ttcagagtgt ttcactgcac ccagtacatc aggcacggct ccaagccaat 2520 gtatacacca gagcccgaca tctgtcacga gctgctgggc cacgtgcccc tgtttagcga 2580 tagatccttc gcccagtttt cccaggagat cggactggca tctctgggag cacctgacga 2640 gtacatcgag aagctggcca ccatctattg gttcacagtg gagtttggcc tgtgcaagca 2700 gggcgatagc atcaaggcct acggagcagg actgctgtct agcttcggcg agctgcagta 2760 ttgtctgtcc gagaagccaa agctgctgcc cctggagctg gagaagaccg ccatccagaa 2820 ctacaccgtg acagagttcc agcccctgta ctatgtggcc gagtctttta acgatgccaa 2880 ggagaaggtg agaaatttcg ccgccacaat ccctaggccc ttcagcgtgc ggtacgaccc 2940 ttatacccag aggatcgagg tgctggataa tacacagcag ctgaagatcc tggctgactc 3000 aatcaatagc gaaatcggaa tcctgtgctc cgccctgcag aaaatcaaag gtaagcctat 3060 ccctaaccct ctcctcggtc tcgattctac gtgatcttgt ggaaaggacg aaacaccggg 3120 gaattcaagg cctctcgagc ctctagaatc cccgagacgt ttcgtctcgg gatcactata 3180 gtgagtcgta ttacgtacac agtgcagggg aaagaatagt agagatccag acatgataag 3240 atacattgat gagtttggac aaaccacaac tagaatgcag tgaaaaaaat gctttatttg 3300 tgaaatttgt gatgctattg ctttatttgt aaccattata agctgcaata aacaagttaa 3360 caacaacaat tgcattcatt ttatgtttca ggttcagggg gaggtgtggg aggtttttta 3420 actgggatgg gatgtggaat ccttctagat ttcttttgta atatttataa agtgctctca 3480 gcaaggtatc aaaatggcaa aattgtgagt aactatcctc ctttcatttt gggaagaaga 3540 tgaggcatga agagaattca gacagaaact tactcagacc aggggaggca gaaactaagc 3600 agagaggaaa atgaccaaga gttagccctg ggcatggaat gtgaaagaac cctaaacgtg 3660 acttggaaat aatgcccaag gtatattcca ttctccggga tttgttggca ttttcttgag 3720 gtgaagaatt gcagaataca ttctttaatg tgacctacat atttacccat gggaggaagt 3780 ctgctcctgg actcttgaga ttcagtcata aagcccaggc cagggaaata atgtaagtct 3840 gcaggcccct gtcatcagta ggattaggga gaagagttct cagtagaaaa cagggaggct 3900 ggagagaaaa gaatggttaa tgttaacgtt aatataacta gaaagactgc agaacttagg 3960 actgattttt atttgaatcc ttaaaaaaaa aatttcttat gaaaatagta catggctctt 4020 aggagacaga acttattgta cagaggaaca gcgtgagagt cagagtgatc ccagaacagg 4080 tcctggctcc atcctgcaca tagttttggt gctgctggca atacggtccc cacaactgtg 4140 ggaaggggtt aggggcaggg atctcatcag gaaagcatag gggtttaaag ttctttatag 4200 agcacttaga agattgagaa tccacaaatt atattaataa caaacaaagt agtgtcgtgt 4260 tatatagtaa atgtgaattt gcagacacat ttagggaaaa gttataatta aaaaaatagg 4320 ctgtatatat a 4331 <210> 137 <211> 4737 <212> DNA <213> Artificial Sequence <220> <223> 032-HCR vector correction genome (+ ITRs) <400> 137 ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 60 cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag agagggagtg 120 gccaactcca tcactagggg ttcctggagg ggtggagtcg tgacgtgaat tacgtcatag 180 ggttagggag gtcctgcata tgcggccgct tcaggagcag ttgtgcgaat agctggagaa 240 caccaggctg gatttaaacc cagatcgctc ttacatttgc tctttacctg ctgtgctcag 300 cgttcacgtg ccctctagct gtagttttct gaagtcagcg cacagcaagg cagtgtgctt 360 agaggttaac agaagggaaa acaacaacaa caaaaatcta aatgagaatc ctgactgttt 420 cagctggggg taaggggggc ggattattca tataattgtt ataccagacg gtcgcaggct 480 tagtccaatt gcagagaact cgcttcccag gcttctgaga gtcccggaag tgcctaaacc 540 tgtctaatcg acggggcttg ggtggcccgt cgctccctgg cttcttccct ttacccaggg 600 cgggcagcga agtggtgcct cctgcgtccc ccacaccctc cctcagcccc tcccctccgg 660 cccgtcctgg gcaggtgacc tggagcatcc ggcaggctgc cctggcctcc tgcgtcagga 720 caacgcccac gaggggcgtt actgtgcgga gatgcaccac gcaagagaca ccctttgtaa 780 ctctcttctc ctccctagtg cgaggttaaa accttcagcc ccacgtgctg tttgcaaacc 840 tgcctgtacc tgaggcccta aaaagccaga gacctcactc ccggggagcc agcatgtcca 900 ctgcggtcct ggaaaaccca ggcttgggca ggaaactctc tgactttgga caggtgagcc 960 acggcagcct gagctgctca gttaggggaa tttgggcctc cagagaaaga gatctgaaga 1020 ctgctggtgc ttcctggttt cataagctca gtaagaagtc tgaattcgtt ggaagctgat 1080 gagaatatcc aggaagtcaa cagacaaatg tcctcaacaa ttgtttctaa gtaggagaac 1140 atctgtcctc ggtggctttc acaggaaaag cttctgacct cttctcttcc tcccacaggg 1200 cggtaccaga tctggcagcg gagagggcag aggaagtctt ctaacatgcg gtgacgtgga 1260 ggagaatccc ggccctaggg gtacctccac cgctgtgctg gagaaccctg ggctggggag 1320 gaaactgtca gacttcgggc aggtaagttt tatggaatgt gaatcataat tcaatttttc 1380 aacatgcgtt aggagggaca tttcaaactc ttttttaccc tagactttcc taccatcacc 1440 cagagtatcc agccaggagg ggaggggcta gagacaccag aagtttagca gggaggaggg 1500 cgtagggatt cggggaatga agggatggga ttcagactag ggccaggacc cagggatgga 1560 gagaaagaga tgagagtggt ttgggggctt ggtgacttag agaacagagc tgcaggctca 1620 gaggcacaca ggagtttctg ggctggcccg gcccccttcc aacccctcat tatggaatcc 1680 agcagctgtt tgtgtgctgc ctctgaagtc cacactgaac aaacttcagc ctactcatgt 1740 cccatataag ggaaattatg gaatcagcaa acagcaaaca cacagccctc cctgcctgct 1800 gaccttggac ctggggcaga ggtcagagac ctccttggct ctatgccacc tccaacatcc 1860 actcgacccc ttggaatttc ggtggagagg agcagaggtt gtcctggcgt ggtttaggta 1920 gtgtgagagg gctgaccatg ccttcttctt tttcctacag gaaacttcat acattgagga 1980 taactgtaac cagaatggcg ccatctctct gatcttcagc ctgaaggagg aagtgggcgc 2040 cctggcaaag gtgctgcgcc tgtttgagga gaacgacgtg aatctgaccc acatcgagtc 2100 ccggccttct agactgaaga aggacgagta cgagttcttt acccacctgg ataagcggtc 2160 cctgccagcc ctgacaaaca tcatcaagat cctgaggcac gacatcggag caaccgtgca 2220 cgagctgtct cgggacaaga agaaggatac cgtgccctgg ttccctcgga caatccagga 2280 gctggataga tttgccaacc agatcctgtc ttacggagca gagctggacg cagatcaccc 2340 tggcttcaag gacccagtgt atcgggcccg gagaaagcag tttgccgata tcgcctacaa 2400 ttataggcac ggacagccaa tccctcgcgt ggagtatatg gaggaggaga agaagacctg 2460 gggcacagtg ttcaagaccc tgaagagcct gtacaagaca cacgcctgct acgagtataa 2520 ccacatcttc cccctgctgg agaagtattg tggctttcac gaggacaata tccctcagct 2580 ggaggacgtg agccagttcc tgcagacctg cacaggcttt aggctgaggc cagtggcagg 2640 actgctgagc tcccgggact tcctgggagg actggccttc agagtgtttc actgcaccca 2700 gtacatcagg cacggctcca agccaatgta tacaccagag cccgacatct gtcacgagct 2760 gctgggccac gtgcccctgt ttagcgatag atccttcgcc cagttttccc aggagatcgg 2820 actggcatct ctgggagcac ctgacgagta catcgagaag ctggccacca tctattggtt 2880 cacagtggag tttggcctgt gcaagcaggg cgatagcatc aaggcctacg gagcaggact 2940 gctgtctagc ttcggcgagc tgcagtattg tctgtccgag aagccaaagc tgctgcccct 3000 ggagctggag aagaccgcca tccagaacta caccgtgaca gagttccagc ccctgtacta 3060 tgtggccgag tcttttaacg atgccaagga gaaggtgaga aatttcgccg ccacaatccc 3120 taggcccttc agcgtgcggt acgaccctta tacccagagg atcgaggtgc tggataatac 3180 acagcagctg aagatcctgg ctgactcaat caatagcgaa atcggaatcc tgtgctccgc 3240 cctgcagaaa atcaaaggta agcctatccc taaccctctc ctcggtctcg attctacgtg 3300 atcttgtgga aaggacgaaa caccggggaa ttcaaggcct ctcgagcctc tagaatcccc 3360 gagacgtttc gtctcgggat cactatagtg agtcgtatta cgtacacagt gcaggggaaa 3420 gaatagtaga gatccagaca tgataagata cattgatgag tttggacaaa ccacaactag 3480 aatgcagtga aaaaaatgct ttatttgtga aatttgtgat gctattgctt tatttgtaac 3540 cattataagc tgcaataaac aagttaacaa caacaattgc attcatttta tgtttcaggt 3600 tcagggggag gtgtgggagg ttttttaact gggatgggat gtggaatcct tctagatttc 3660 ttttgtaata tttataaagt gctctcagca aggtatcaaa atggcaaaat tgtgagtaac 3720 tatcctcctt tcattttggg aagaagatga ggcatgaaga gaattcagac agaaacttac 3780 tcagaccagg ggaggcagaa actaagcaga gaggaaaatg accaagagtt agccctgggc 3840 atggaatgtg aaagaaccct aaacgtgact tggaaataat gcccaaggta tattccattc 3900 tccgggattt gttggcattt tcttgaggtg aagaattgca gaatacattc tttaatgtga 3960 cctacatatt tacccatggg aggaagtctg ctcctggact cttgagattc agtcataaag 4020 cccaggccag ggaaataatg taagtctgca ggcccctgtc atcagtagga ttagggagaa 4080 gagttctcag tagaaaacag ggaggctgga gagaaaagaa tggttaatgt taacgttaat 4140 ataactagaa agactgcaga acttaggact gatttttatt tgaatcctta aaaaaaaaat 4200 ttcttatgaa aatagtacat ggctcttagg agacagaact tattgtacag aggaacagcg 4260 tgagagtcag agtgatccca gaacaggtcc tggctccatc ctgcacatag ttttggtgct 4320 gctggcaata cggtccccac aactgtggga aggggttagg ggcagggatc tcatcaggaa 4380 agcatagggg tttaaagttc tttatagagc acttagaaga ttgagaatcc acaaattata 4440 ttaataacaa acaaagtagt gtcgtgttat atagtaaatg tgaatttgca gacacattta 4500 gggaaaagtt ataattaaaa aaataggctg tatatatacc tgcaggtcta gatacgtaga 4560 taagtagcat ggcgggttaa tcattaacta caaggaaccc ctagtgatgg agttggccac 4620 tccctctctg cgcgctcgct cgctcactga ggccgggcga ccaaaggtcg cccgacgccc 4680 gggctttgcc cgggcggcct cagtgagcga gcgagcgcgc agagagggag tggccaa 4737 <210> 138 <211> 1359 <212> DNA <213> Artificial Sequence <220> <223> 006-SD.3 vector PAH coding sequence <400> 138 atgtccaccg ctgtgctgga gaaccctggg ctggggagga aactgtcaga cttcgggcag 60 gagacttcat acattgagga taactgtaac cagaatggcg ccatctctct gatcttcagc 120 ctgaaggagg aagtgggcgc cctggcaaag gtgctgcgcc tgtttgagga gaacgacgtg 180 aatctgaccc acatcgagtc ccggccttct agactgaaga aggacgagta cgagttcttt 240 acccacctgg ataagcggtc cctgccagcc ctgacaaaca tcatcaagat cctgaggcac 300 gacatcggag caaccgtgca cgagctgtct cgggacaaga agaaggatac cgtgccctgg 360 ttccctcgga caatccagga gctggataga tttgccaacc agatcctgtc ttacggagca 420 gagctggacg cagatcaccc tggcttcaag gacccagtgt atcgggcccg gagaaagcag 480 tttgccgata tcgcctacaa ttataggcac ggacagccaa tccctcgcgt ggagtatatg 540 gaggaggaga agaagacctg gggcacagtg ttcaagaccc tgaagagcct gtacaagaca 600 cacgcctgct acgagtataa ccacatcttc cccctgctgg agaagtattg tggctttcac 660 gaggacaata tccctcagct ggaggacgtg agccagttcc tgcagacctg cacaggcttt 720 aggctgaggc cagtggcagg actgctgagc tcccgggact tcctgggagg actggccttc 780 agagtgtttc actgcaccca gtacatcagg cacggctcca agccaatgta tacaccagag 840 cccgacatct gtcacgagct gctgggccac gtgcccctgt ttagcgatag atccttcgcc 900 cagttttccc aggagatcgg actggcatct ctgggagcac ctgacgagta catcgagaag 960 ctggccacca tctattggtt cacagtggag tttggcctgt gcaagcaggg cgatagcatc 1020 aaggcctacg gagcaggact gctgtctagc ttcggcgagc tgcagtattg tctgtccgag 1080 aagccaaagc tgctgcccct ggagctggag aagaccgcca tccagaacta caccgtgaca 1140 gagttccagc ccctgtacta tgtggccgag tcttttaacg atgccaagga gaaggtgaga 1200 aatttcgccg ccacaatccc taggcccttc agtgtgcgtt acgaccctta tacccagagg 1260 atcgaggtgc tggataatac acagcagctg aagatcctgg ctgactcaat caatagcgaa 1320 atcggaatcc tgtgctccgc cctgcagaaa atcaaatga 1359 <210> 139 <211> 1353 <212> DNA <213> Artificial Sequence <220> <223> 032-SD.3 vector PAH coding sequence <400> 139 tccaccgctg tgctggagaa ccctgggctg gggaggaaac tgtcagactt cgggcaggag 60 acttcataca ttgaggataa ctgtaaccag aatggcgcca tctctctgat cttcagcctg 120 aaggaggaag tgggcgccct ggcaaaggtg ctgcgcctgt ttgaggagaa cgacgtgaat 180 ctgacccaca tcgagtcccg gccttctaga ctgaagaagg acgagtacga gttctttacc 240 cacctggata agcggtccct gccagccctg acaaacatca tcaagatcct gaggcacgac 300 atcggagcaa ccgtgcacga gctgtctcgg gacaagaaga aggataccgt gccctggttc 360 cctcggacaa tccaggagct ggatagattt gccaaccaga tcctgtctta cggagcagag 420 ctggacgcag atcaccctgg cttcaaggac ccagtgtatc gggcccggag aaagcagttt 480 gccgatatcg cctacaatta taggcacgga cagccaatcc ctcgcgtgga gtatatggag 540 gaggagaaga agacctgggg cacagtgttc aagaccctga agagcctgta caagacacac 600 gcctgctacg agtataacca catcttcccc ctgctggaga agtattgtgg ctttcacgag 660 gacaatatcc ctcagctgga ggacgtgagc cagttcctgc agacctgcac aggctttagg 720 ctgaggccag tggcaggact gctgagctcc cgggacttcc tgggaggact ggccttcaga 780 gtgtttcact gcacccagta catcaggcac ggctccaagc caatgtatac accagagccc 840 gacatctgtc acgagctgct gggccacgtg cccctgttta gcgatagatc cttcgcccag 900 ttttcccagg agatcggact ggcatctctg ggagcacctg acgagtacat cgagaagctg 960 gccaccatct attggttcac agtggagttt ggcctgtgca agcagggcga tagcatcaag 1020 gcctacggag caggactgct gtctagcttc ggcgagctgc agtattgtct gtccgagaag 1080 ccaaagctgc tgcccctgga gctggagaag accgccatcc agaactacac cgtgacagag 1140 ttccagcccc tgtactatgt ggccgagtct tttaacgatg ccaaggagaa ggtgagaaat 1200 ttcgccgcca caatccctag gcccttcagt gtgcgttacg acccttatac ccagaggatc 1260 gaggtgctgg ataatacaca gcagctgaag atcctggctg actcaatcaa tagcgaaatc 1320 ggaatcctgt gctccgccct gcagaaaatc aaa 1353 <210> 140 <211> 37 <212> DNA <213> Artificial Sequence <220> <223> 37 bp additional 3' ITR sequence from wtAAV2 <400> 140 gtagataagt agcatggcgg gttaatcatt aactaca 37 <210> 141 <211> 180 <212> DNA <213> Artificial Sequence <220> <223> 3' ITR with additional 37 bp sequence <400> 141 gtagataagt agcatggcgg gttaatcatt aactacaagg aacccctagt gatggagttg 60 gccactccct ctctgcgcgc tcgctcgctc actgaggccg ggcgaccaaa ggtcgcccga 120 cgcccgggct ttgcccgggc ggcctcagtg agcgagcgag cgcgcagaga gggagtggcc 180 <210> 142 <211> 800 <212> DNA <213> Mus musculus <400> 142 agcattagct tccatttatg cagtgtaaat ggtgagaaca gccccgactg aatacccaga 60 gcatcatctc gtctgtgtca ttcatgcaca taacatatct cagcgaggtg gcccttctgt 120 cctctttgca gagacccagc caccatacta gtacctagag aactggctgg atttcagccc 180 cgatacctcc gggcttttgc tcatgttcgc ctcatagggt catctgggtg gttgcctaag 240 gaaaagtatg tcatggagac taacttgctt ggcattgaat aaaaggtgag ttgagagtgg 300 agcgtgttta aattgcaatc ctgcctctat ttctgtgctt gcagggaaca gtcatcctta 360 attgctatcc tccatcatca tcatgattat ttctggtttt tctctggttg cggagaatcc 420 atactccagg tattccaatg tctcagcatt gccaggcctg tctgagcgtc aggatgtagg 480 tagtctgggc tctctgcctt ctattcttgt ccaggatact ctgccaaaag aatcatgttg 540 tggctgccac ccctcccaca aagcctcccg cttgggtcag tccaggactg gagttgggta 600 tggactgttc atgtctatcc actgctacgt cagggcaaca cccactgaga gtgaccttgt 660 agactgcagt gggagacacc cttcaaaacc tctcatctcc tgtcctgaga gccaggttaa 720 aaccatcagc cccgcatcct gagtgcaaac ttttcctaac cctgctgcta agctagacac 780 ctcacttact gagagccagc 800 <210> 143 <211> 1475 <212> DNA <213> Artificial Sequence <220> <223> 006-HBB1 vector PAH coding sequence <400> 143 atgtccaccg ctgtgctgga gaaccctggg ctggggagga aactgtcaga cttcgggcag 60 gagacttcat acattgagga taactgtaac cagaatggcg ccatctctct gatcttcagc 120 ctgaaggagg aagtgggcgc cctggcaaag gtgctgcgcc tgtttgagga gaacgacgtg 180 aatctgaccc acatcgagtc ccggccttct agactgaaga aggacgagta cgagttcttt 240 acccacctgg ataagcggtc cctgccagcc ctgacaaaca tcatcaagat cctgaggcac 300 gacatcggag caaccgtgca cgagctgtct cgggacaaga agaaggatac cgtgccctgg 360 ttccctcgga caatccagga gctggataga tttgccaacc agatcctgtc ttacggagca 420 gagctggacg cagatcaccc tggcttcaag gacccagtgt atcgggcccg gagaaagcag 480 tttgccgata tcgcctacaa ttataggcac ggacagccaa tccctcgcgt ggagtatatg 540 gaggaggaga agaagacctg gggcacagtg ttcaagaccc tgaagagcct gtacaagaca 600 cacgcctgct acgagtataa ccacatcttc cccctgctgg agaagtattg tggctttcac 660 gaggacaata tccctcagct ggaggacgtg agccagttcc tgcagacctg cacaggcttt 720 aggctgaggc cagtggcagg actgctgagc tcccgggact tcctgggagg actggccttc 780 agagtgtttc actgcaccca gtacatcagg cacggctcca agccaatgta tacaccagag 840 cccgacatct gtcacgagct gctgggccac gtgcccctgt ttagcgatag atccttcgcc 900 cagttttccc aggttggtat ccaggttaca aggcagctca caagaagaag ttgggtgctt 960 ggagacagag gtctgctttc cagcagacac taactttcag tgtcccctgt ctatgtttcc 1020 ctttttagga gatcggactg gcatctctgg gagcacctga cgagtacatc gagaagctgg 1080 ccaccatcta ttggttcaca gtggagtttg gcctgtgcaa gcagggcgat agcatcaagg 1140 cctacggagc aggactgctg tctagcttcg gcgagctgca gtattgtctg tccgagaagc 1200 caaagctgct gcccctggag ctggagaaga ccgccatcca gaactacacc gtgacagagt 1260 tccagcccct gtactatgtg gccgagtctt ttaacgatgc caaggagaag gtgagaaatt 1320 tcgccgccac aatccctagg cccttcagcg tgcggtacga cccttatacc cagaggatcg 1380 aggtgctgga taatacacag cagctgaaga tcctggctga ctcaatcaat agcgaaatcg 1440 gaatcctgtg ctccgccctg cagaaaatca aatga 1475 <210> 144 <211> 800 <212> DNA <213> Mus musculus <400> 144 gcagctgttg tcctggagaa cggagtcctg agcagaaaac tctcagactt tgggcaggta 60 agcctgttgg gcttccactg ctaggagaga attggttccc cacatgtgaa agcagtctgg 120 gaaatgctgg tatttccagt ctcctaaggc tactaagaaa tatgacttta tttagaggcg 180 agaaaaatgc ccaggaagtc aactgatgag actagtctta acaagttgag gatacagaaa 240 gttggggatc tgagctgcta ccaacatctg tgtgtctttg ggtggctcat tggtatcctc 300 tgcctattgg ctttatcttc tgtacactga aaggaaatgg ctggtcctta gtcacctggg 360 gtgggagtcc ctatctctcc agggatactt attcaatcct ttcttctggg tatcaaaatg 420 acaagcttgt aagaaactgt cctctttcgg ctttcaggag gtgatgtcgc atgaagagaa 480 tttggggggg gggacttact cagaaccaag gagggagaaa ttaaacagag agggaaatga 540 acaggagtta gcccggagcc tgaagcacct tggggattat gctgggggtg gagggaatcc 600 attgtcctcc ctagggaggg cttgcagaac atgttctttt ctgtgatatt tgtactttcc 660 ccagattgca aatcatggtt tgtacactga gattcagtct ctggaggtaa tatgcctttt 720 ctagcttttc cttggacagg actaaggggt tgagggttgc ctggagtcag agaaatttgt 780 gttaaagaag gttgatatga 800 <210> 145 <211> 3343 <212> DNA <213> Artificial Sequence <220> <223> 006-HBB1 vector correction genome <400> 145 agcattagct tccatttatg cagtgtaaat ggtgagaaca gccccgactg aatacccaga 60 gcatcatctc gtctgtgtca ttcatgcaca taacatatct cagcgaggtg gcccttctgt 120 cctctttgca gagacccagc caccatacta gtacctagag aactggctgg atttcagccc 180 cgatacctcc gggcttttgc tcatgttcgc ctcatagggt catctgggtg gttgcctaag 240 gaaaagtatg tcatggagac taacttgctt ggcattgaat aaaaggtgag ttgagagtgg 300 agcgtgttta aattgcaatc ctgcctctat ttctgtgctt gcagggaaca gtcatcctta 360 attgctatcc tccatcatca tcatgattat ttctggtttt tctctggttg cggagaatcc 420 atactccagg tattccaatg tctcagcatt gccaggcctg tctgagcgtc aggatgtagg 480 tagtctgggc tctctgcctt ctattcttgt ccaggatact ctgccaaaag aatcatgttg 540 tggctgccac ccctcccaca aagcctcccg cttgggtcag tccaggactg gagttgggta 600 tggactgttc atgtctatcc actgctacgt cagggcaaca cccactgaga gtgaccttgt 660 agactgcagt gggagacacc cttcaaaacc tctcatctcc tgtcctgaga gccaggttaa 720 aaccatcagc cccgcatcct gagtgcaaac ttttcctaac cctgctgcta agctagacac 780 ctcacttact gagagccagc atgtccaccg ctgtgctgga gaaccctggg ctggggagga 840 aactgtcaga cttcgggcag gagacttcat acattgagga taactgtaac cagaatggcg 900 ccatctctct gatcttcagc ctgaaggagg aagtgggcgc cctggcaaag gtgctgcgcc 960 tgtttgagga gaacgacgtg aatctgaccc acatcgagtc ccggccttct agactgaaga 1020 aggacgagta cgagttcttt acccacctgg ataagcggtc cctgccagcc ctgacaaaca 1080 tcatcaagat cctgaggcac gacatcggag caaccgtgca cgagctgtct cgggacaaga 1140 agaaggatac cgtgccctgg ttccctcgga caatccagga gctggataga tttgccaacc 1200 agatcctgtc ttacggagca gagctggacg cagatcaccc tggcttcaag gacccagtgt 1260 atcgggcccg gagaaagcag tttgccgata tcgcctacaa ttataggcac ggacagccaa 1320 tccctcgcgt ggagtatatg gaggaggaga agaagacctg gggcacagtg ttcaagaccc 1380 tgaagagcct gtacaagaca cacgcctgct acgagtataa ccacatcttc cccctgctgg 1440 agaagtattg tggctttcac gaggacaata tccctcagct ggaggacgtg agccagttcc 1500 tgcagacctg cacaggcttt aggctgaggc cagtggcagg actgctgagc tcccgggact 1560 tcctgggagg actggccttc agagtgtttc actgcaccca gtacatcagg cacggctcca 1620 agccaatgta tacaccagag cccgacatct gtcacgagct gctgggccac gtgcccctgt 1680 ttagcgatag atccttcgcc cagttttccc aggttggtat ccaggttaca aggcagctca 1740 caagaagaag ttgggtgctt ggagacagag gtctgctttc cagcagacac taactttcag 1800 tgtcccctgt ctatgtttcc ctttttagga gatcggactg gcatctctgg gagcacctga 1860 cgagtacatc gagaagctgg ccaccatcta ttggttcaca gtggagtttg gcctgtgcaa 1920 gcagggcgat agcatcaagg cctacggagc aggactgctg tctagcttcg gcgagctgca 1980 gtattgtctg tccgagaagc caaagctgct gcccctggag ctggagaaga ccgccatcca 2040 gaactacacc gtgacagagt tccagcccct gtactatgtg gccgagtctt ttaacgatgc 2100 caaggagaag gtgagaaatt tcgccgccac aatccctagg cccttcagcg tgcggtacga 2160 cccttatacc cagaggatcg aggtgctgga taatacacag cagctgaaga tcctggctga 2220 ctcaatcaat agcgaaatcg gaatcctgtg ctccgccctg cagaaaatca aatgagaatt 2280 caaggcctct cgagcctcta gaactatagt gagtcgtatt acgtagatcc agacatgata 2340 agatacattg atgagtttgg acaaaccaca actagaatgc agtgaaaaaa atgctttatt 2400 tgtgaaattt gtgatgctat tgctttattt gtaaccatta taagctgcaa taaacaagtt 2460 aacaacaaca attgcattca ttttatgttt caggttcagg gggaggtgtg ggaggttttt 2520 taagctttac gtacgatcgt cgagcagctg ttgtcctgga gaacggagtc ctgagcagaa 2580 aactctcaga ctttgggcag gtaagcctgt tgggcttcca ctgctaggag agaattggtt 2640 ccccacatgt gaaagcagtc tgggaaatgc tggtatttcc agtctcctaa ggctactaag 2700 aaatatgact ttatttagag gcgagaaaaa tgcccaggaa gtcaactgat gagactagtc 2760 ttaacaagtt gaggatacag aaagttgggg atctgagctg ctaccaacat ctgtgtgtct 2820 ttgggtggct cattggtatc ctctgcctat tggctttatc ttctgtacac tgaaaggaaa 2880 tggctggtcc ttagtcacct ggggtgggag tccctatctc tccagggata cttattcaat 2940 cctttcttct gggtatcaaa atgacaagct tgtaagaaac tgtcctcttt cggctttcag 3000 gaggtgatgt cgcatgaaga gaatttgggg ggggggactt actcagaacc aaggagggag 3060 aaattaaaca gagagggaaa tgaacaggag ttagcccgga gcctgaagca ccttggggat 3120 tatgctgggg gtggagggaa tccattgtcc tccctaggga gggcttgcag aacatgttct 3180 tttctgtgat atttgtactt tccccagatt gcaaatcatg gtttgtacac tgagattcag 3240 tctctggagg taatatgcct tttctagctt ttccttggac aggactaagg ggttgagggt 3300 tgcctggagt cagagaaatt tgtgttaaag aaggttgata tga 3343 <210> 146 <211> 3751 <212> DNA <213> Artificial Sequence <220> <223> 006-HBB1 vector correction genome (+ ITRs) <400> 146 ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 60 cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag agagggagtg 120 gccaactcca tcactagggg ttcctggagg ggtggagtcg tgacgtgaat tacgtcatag 180 ggttagggag gtcctgcata tgcggccgca gcattagctt ccatttatgc agtgtaaatg 240 gtgagaacag ccccgactga atacccagag catcatctcg tctgtgtcat tcatgcacat 300 aacatatctc agcgaggtgg cccttctgtc ctctttgcag agacccagcc accatactag 360 tacctagaga actggctgga tttcagcccc gatacctccg ggcttttgct catgttcgcc 420 tcatagggtc atctgggtgg ttgcctaagg aaaagtatgt catggagact aacttgcttg 480 gcattgaata aaaggtgagt tgagagtgga gcgtgtttaa attgcaatcc tgcctctatt 540 tctgtgcttg cagggaacag tcatccttaa ttgctatcct ccatcatcat catgattatt 600 tctggttttt ctctggttgc ggagaatcca tactccaggt attccaatgt ctcagcattg 660 ccaggcctgt ctgagcgtca ggatgtaggt agtctgggct ctctgccttc tattcttgtc 720 caggatactc tgccaaaaga atcatgttgt ggctgccacc cctcccacaa agcctcccgc 780 ttgggtcagt ccaggactgg agttgggtat ggactgttca tgtctatcca ctgctacgtc 840 agggcaacac ccactgagag tgaccttgta gactgcagtg ggagacaccc ttcaaaacct 900 ctcatctcct gtcctgagag ccaggttaaa accatcagcc ccgcatcctg agtgcaaact 960 tttcctaacc ctgctgctaa gctagacacc tcacttactg agagccagca tgtccaccgc 1020 tgtgctggag aaccctgggc tggggaggaa actgtcagac ttcgggcagg agacttcata 1080 cattgaggat aactgtaacc agaatggcgc catctctctg atcttcagcc tgaaggagga 1140 agtgggcgcc ctggcaaagg tgctgcgcct gtttgaggag aacgacgtga atctgaccca 1200 catcgagtcc cggccttcta gactgaagaa ggacgagtac gagttcttta cccacctgga 1260 taagcggtcc ctgccagccc tgacaaacat catcaagatc ctgaggcacg acatcggagc 1320 aaccgtgcac gagctgtctc gggacaagaa gaaggatacc gtgccctggt tccctcggac 1380 aatccaggag ctggatagat ttgccaacca gatcctgtct tacggagcag agctggacgc 1440 agatcaccct ggcttcaagg acccagtgta tcgggcccgg agaaagcagt ttgccgatat 1500 cgcctacaat tataggcacg gacagccaat ccctcgcgtg gagtatatgg aggaggagaa 1560 gaagacctgg ggcacagtgt tcaagaccct gaagagcctg tacaagacac acgcctgcta 1620 cgagtataac cacatcttcc ccctgctgga gaagtattgt ggctttcacg aggacaatat 1680 ccctcagctg gaggacgtga gccagttcct gcagacctgc acaggcttta ggctgaggcc 1740 agtggcagga ctgctgagct cccgggactt cctgggagga ctggccttca gagtgtttca 1800 ctgcacccag tacatcaggc acggctccaa gccaatgtat acaccagagc ccgacatctg 1860 tcacgagctg ctgggccacg tgcccctgtt tagcgataga tccttcgccc agttttccca 1920 ggttggtatc caggttacaa ggcagctcac aagaagaagt tgggtgcttg gagacagagg 1980 tctgctttcc agcagacact aactttcagt gtcccctgtc tatgtttccc tttttaggag 2040 atcggactgg catctctggg agcacctgac gagtacatcg agaagctggc caccatctat 2100 tggttcacag tggagtttgg cctgtgcaag cagggcgata gcatcaaggc ctacggagca 2160 ggactgctgt ctagcttcgg cgagctgcag tattgtctgt ccgagaagcc aaagctgctg 2220 cccctggagc tggagaagac cgccatccag aactacaccg tgacagagtt ccagcccctg 2280 tactatgtgg ccgagtcttt taacgatgcc aaggagaagg tgagaaattt cgccgccaca 2340 atccctaggc ccttcagcgt gcggtacgac ccttataccc agaggatcga ggtgctggat 2400 aatacacagc agctgaagat cctggctgac tcaatcaata gcgaaatcgg aatcctgtgc 2460 tccgccctgc agaaaatcaa atgagaattc aaggcctctc gagcctctag aactatagtg 2520 agtcgtatta cgtagatcca gacatgataa gatacattga tgagtttgga caaaccacaa 2580 ctagaatgca gtgaaaaaaa tgctttattt gtgaaatttg tgatgctatt gctttatttg 2640 taaccattat aagctgcaat aaacaagtta acaacaacaa ttgcattcat tttatgtttc 2700 aggttcaggg ggaggtgtgg gaggtttttt aagctttacg tacgatcgtc gagcagctgt 2760 tgtcctggag aacggagtcc tgagcagaaa actctcagac tttgggcagg taagcctgtt 2820 gggcttccac tgctaggaga gaattggttc cccacatgtg aaagcagtct gggaaatgct 2880 ggtatttcca gtctcctaag gctactaaga aatatgactt tatttagagg cgagaaaaat 2940 gcccaggaag tcaactgatg agactagtct taacaagttg aggatacaga aagttgggga 3000 tctgagctgc taccaacatc tgtgtgtctt tgggtggctc attggtatcc tctgcctatt 3060 ggctttatct tctgtacact gaaaggaaat ggctggtcct tagtcacctg gggtgggagt 3120 ccctatctct ccagggatac ttattcaatc ctttcttctg ggtatcaaaa tgacaagctt 3180 gtaagaaact gtcctctttc ggctttcagg aggtgatgtc gcatgaagag aatttggggg 3240 gggggactta ctcagaacca aggagggaga aattaaacag agagggaaat gaacaggagt 3300 tagcccggag cctgaagcac cttggggatt atgctggggg tggagggaat ccattgtcct 3360 ccctagggag ggcttgcaga acatgttctt ttctgtgata tttgtacttt ccccagattg 3420 caaatcatgg tttgtacact gagattcagt ctctggaggt aatatgcctt ttctagcttt 3480 tccttggaca ggactaaggg gttgagggtt gcctggagtc agagaaattt gtgttaaaga 3540 aggttgatat gacctgcagg tctagatacg tagataagta gcatggcggg ttaatcatta 3600 actacaagga acccctagtg atggagttgg ccactccctc tctgcgcgct cgctcgctca 3660 ctgaggccgg gcgaccaaag gtcgcccgac gcccgggctt tgcccgggcg gcctcagtga 3720 gcgagcgagc gcgcagagag ggagtggcca a 3751 <210> 147 <211> 1607 <212> DNA <213> Artificial Sequence <220> <223> 006 vector editing element <400> 147 atgtccaccg ctgtgctgga gaaccctggg ctggggagga aactgtcaga cttcgggcag 60 gagacttcat acattgagga taactgtaac cagaatggcg ccatctctct gatcttcagc 120 ctgaaggagg aagtgggcgc cctggcaaag gtgctgcgcc tgtttgagga gaacgacgtg 180 aatctgaccc acatcgagtc ccggccttct agactgaaga aggacgagta cgagttcttt 240 acccacctgg ataagcggtc cctgccagcc ctgacaaaca tcatcaagat cctgaggcac 300 gacatcggag caaccgtgca cgagctgtct cgggacaaga agaaggatac cgtgccctgg 360 ttccctcgga caatccagga gctggataga tttgccaacc agatcctgtc ttacggagca 420 gagctggacg cagatcaccc tggcttcaag gacccagtgt atcgggcccg gagaaagcag 480 tttgccgata tcgcctacaa ttataggcac ggacagccaa tccctcgcgt ggagtatatg 540 gaggaggaga agaagacctg gggcacagtg ttcaagaccc tgaagagcct gtacaagaca 600 cacgcctgct acgagtataa ccacatcttc cccctgctgg agaagtattg tggctttcac 660 gaggacaata tccctcagct ggaggacgtg agccagttcc tgcagacctg cacaggcttt 720 aggctgaggc cagtggcagg actgctgagc tcccgggact tcctgggagg actggccttc 780 agagtgtttc actgcaccca gtacatcagg cacggctcca agccaatgta tacaccagag 840 cccgacatct gtcacgagct gctgggccac gtgcccctgt ttagcgatag atccttcgcc 900 cagttttccc aggagatcgg actggcatct ctgggagcac ctgacgagta catcgagaag 960 ctggccacca tctattggtt cacagtggag tttggcctgt gcaagcaggg cgatagcatc 1020 aaggcctacg gagcaggact gctgtctagc ttcggcgagc tgcagtattg tctgtccgag 1080 aagccaaagc tgctgcccct ggagctggag aagaccgcca tccagaacta caccgtgaca 1140 gagttccagc ccctgtacta tgtggccgag tcttttaacg atgccaagga gaaggtgaga 1200 aatttcgccg ccacaatccc taggcccttc agcgtgcggt acgaccctta tacccagagg 1260 atcgaggtgc tggataatac acagcagctg aagatcctgg ctgactcaat caatagcgaa 1320 atcggaatcc tgtgctccgc cctgcagaaa atcaaatgag aattcaaggc ctctcgagcc 1380 tctagaacta tagtgagtcg tattacgtag atccagacat gataagatac attgatgagt 1440 ttggacaaac cacaactaga atgcagtgaa aaaaatgctt tatttgtgaa atttgtgatg 1500 ctattgcttt atttgtaacc attataagct gcaataaaca agttaacaac aacaattgca 1560 ttcattttat gtttcaggtt cagggggagg tgtgggaggt tttttaa 1607 <210> 148 <211> 1837 <212> DNA <213> Artificial Sequence <220> <223> 032 vector editing element <400> 148 ctgacctctt ctcttcctcc cacagggcgg taccagatct ggcagcggag agggcagagg 60 aagtcttcta acatgcggtg acgtggagga gaatcccggc cctaggggta cctccaccgc 120 tgtgctggag aaccctgggc tggggaggaa actgtcagac ttcgggcagg agacttcata 180 cattgaggat aactgtaacc agaatggcgc catctctctg atcttcagcc tgaaggagga 240 agtgggcgcc ctggcaaagg tgctgcgcct gtttgaggag aacgacgtga atctgaccca 300 catcgagtcc cggccttcta gactgaagaa ggacgagtac gagttcttta cccacctgga 360 taagcggtcc ctgccagccc tgacaaacat catcaagatc ctgaggcacg acatcggagc 420 aaccgtgcac gagctgtctc gggacaagaa gaaggatacc gtgccctggt tccctcggac 480 aatccaggag ctggatagat ttgccaacca gatcctgtct tacggagcag agctggacgc 540 agatcaccct ggcttcaagg acccagtgta tcgggcccgg agaaagcagt ttgccgatat 600 cgcctacaat tataggcacg gacagccaat ccctcgcgtg gagtatatgg aggaggagaa 660 gaagacctgg ggcacagtgt tcaagaccct gaagagcctg tacaagacac acgcctgcta 720 cgagtataac cacatcttcc ccctgctgga gaagtattgt ggctttcacg aggacaatat 780 ccctcagctg gaggacgtga gccagttcct gcagacctgc acaggcttta ggctgaggcc 840 agtggcagga ctgctgagct cccgggactt cctgggagga ctggccttca gagtgtttca 900 ctgcacccag tacatcaggc acggctccaa gccaatgtat acaccagagc ccgacatctg 960 tcacgagctg ctgggccacg tgcccctgtt tagcgataga tccttcgccc agttttccca 1020 ggagatcgga ctggcatctc tgggagcacc tgacgagtac atcgagaagc tggccaccat 1080 ctattggttc acagtggagt ttggcctgtg caagcagggc gatagcatca aggcctacgg 1140 agcaggactg ctgtctagct tcggcgagct gcagtattgt ctgtccgaga agccaaagct 1200 gctgcccctg gagctggaga agaccgccat ccagaactac accgtgacag agttccagcc 1260 cctgtactat gtggccgagt cttttaacga tgccaaggag aaggtgagaa atttcgccgc 1320 cacaatccct aggcccttca gcgtgcggta cgacccttat acccagagga tcgaggtgct 1380 ggataataca cagcagctga agatcctggc tgactcaatc aatagcgaaa tcggaatcct 1440 gtgctccgcc ctgcagaaaa tcaaaggtaa gcctatccct aaccctctcc tcggtctcga 1500 ttctacgtga tcttgtggaa aggacgaaac accggggaat tcaaggcctc tcgagcctct 1560 agaatccccg agacgtttcg tctcgggatc actatagtga gtcgtattac gtacacagtg 1620 caggggaaag aatagtagag atccagacat gataagatac attgatgagt ttggacaaac 1680 cacaactaga atgcagtgaa aaaaatgctt tatttgtgaa atttgtgatg ctattgcttt 1740 atttgtaacc attataagct gcaataaaca agttaacaac aacaattgca ttcattttat 1800 gtttcaggtt cagggggagg tgtgggaggt tttttaa 1837 <210> 149 <211> 2225 <212> DNA <213> Artificial Sequence <220> <223> 006-HCR vector editing element <400> 149 atgtccaccg ctgtgctgga gaaccctggg ctggggagga aactgtcaga cttcgggcag 60 gtaagtttta tggaatgtga atcataattc aatttttcaa catgcgttag gagggacatt 120 tcaaactctt ttttacccta gactttccta ccatcaccca gagtatccag ccaggagggg 180 aggggctaga gacaccagaa gtttagcagg gaggagggcg tagggattcg gggaatgaag 240 ggatgggatt cagactaggg ccaggaccca gggatggaga gaaagagatg agagtggttt 300 gggggcttgg tgacttagag aacagagctg caggctcaga ggcacacagg agtttctggg 360 ctggcccggc ccccttccaa cccctcatta tggaatccag cagctgtttg tgtgctgcct 420 ctgaagtcca cactgaacaa acttcagcct actcatgtcc catataaggg aaattatgga 480 atcagcaaac agcaaacaca cagccctccc tgcctgctga ccttggacct ggggcagagg 540 tcagagacct ccttggctct atgccacctc caacatccac tcgacccctt ggaatttcgg 600 tggagaggag cagaggttgt cctggcgtgg tttaggtagt gtgagagggc tgaccatgcc 660 ttcttctttt tcctacagga aacttcatac attgaggata actgtaacca gaatggcgcc 720 atctctctga tcttcagcct gaaggaggaa gtgggcgccc tggcaaaggt gctgcgcctg 780 tttgaggaga acgacgtgaa tctgacccac atcgagtccc ggccttctag actgaagaag 840 gacgagtacg agttctttac ccacctggat aagcggtccc tgccagccct gacaaacatc 900 atcaagatcc tgaggcacga catcggagca accgtgcacg agctgtctcg ggacaagaag 960 aaggataccg tgccctggtt ccctcggaca atccaggagc tggatagatt tgccaaccag 1020 atcctgtctt acggagcaga gctggacgca gatcaccctg gcttcaagga cccagtgtat 1080 cgggcccgga gaaagcagtt tgccgatatc gcctacaatt ataggcacga acagccaatc 1140 cctcgcgtgg agtatatgga ggaggagaag aagacctggg gcacagtgtt caagaccctg 1200 aagagcctgt acaagacaca cgcctgctac gagtataacc acatcttccc cctgctggag 1260 aagtattgtg gctttcacga ggacaatatc cctcagctgg aggacgtgag ccagttcctg 1320 cagacctgca caggctttag gctgaggcca gtggcaggac tgctgagctc ccgggacttc 1380 ctgggaggac tggccttcag agtgtttcac tgcacccagt acatcaggca cggctccaag 1440 ccaatgtata caccagagcc cgacatctgt cacgagctgc tgggccacgt gcccctgttt 1500 agcgatagat ccttcgccca gttttcccag gagatcggac tggcatctct gggagcacct 1560 gacgagtaca tcgagaagct ggccaccatc tattggttca cagtggagtt tggcctgtgc 1620 aagcagggcg atagcatcaa ggcctacgga gcaggactgc tgtctagctt cggcgagctg 1680 cagtattgtc tgtccgagaa gccaaagctg ctgcccctgg agctggagaa gaccgccatc 1740 cagaactaca ccgtgacaga gttccagccc ctgtactatg tggccgagtc ttttaacgat 1800 gccaaggaga aggtgagaaa tttcgccgcc acaatcccta ggcccttcag cgtgcggtac 1860 gacccttata cccagaggat cgaggtgctg gataatacac agcagctgaa gatcctggct 1920 gactcaatca atagcgaaat cggaatcctg tgctccgccc tgcagaaaat caaatgagaa 1980 ttcaaggcct ctcgagcctc tagaactata gtgagtcgta ttacgtagat ccagacatga 2040 taagatacat tgatgagttt ggacaaacca caactagaat gcagtgaaaa aaatgcttta 2100 tttgtgaaat ttgtgatgct attgctttat ttgtaaccat tataagctgc aataaacaag 2160 ttaacaacaa caattgcatt cattttatgt ttcaggttca gggggaggtg tgggaggttt 2220 tttaa 2225 <210> 150 <211> 2455 <212> DNA <213> Artificial Sequence <220> <223> 032-HCR vector editing element <400> 150 ctgacctctt ctcttcctcc cacagggcgg taccagatct ggcagcggag agggcagagg 60 aagtcttcta acatgcggtg acgtggagga gaatcccggc cctaggggta cctccaccgc 120 tgtgctggag aaccctgggc tggggaggaa actgtcagac ttcgggcagg taagttttat 180 ggaatgtgaa tcataattca atttttcaac atgcgttagg agggacattt caaactcttt 240 tttaccctag actttcctac catcacccag agtatccagc caggagggga ggggctagag 300 acaccagaag tttagcaggg aggagggcgt agggattcgg ggaatgaagg gatgggattc 360 agactagggc caggacccag ggatggagag aaagagatga gagtggtttg ggggcttggt 420 gacttagaga acagagctgc aggctcagag gcacacagga gtttctgggc tggcccggcc 480 cccttccaac ccctcattat ggaatccagc agctgtttgt gtgctgcctc tgaagtccac 540 actgaacaaa cttcagccta ctcatgtccc atataaggga aattatggaa tcagcaaaca 600 gcaaacacac agccctccct gcctgctgac cttggacctg gggcagaggt cagagacctc 660 cttggctcta tgccacctcc aacatccact cgaccccttg gaatttcggt ggagaggagc 720 agaggttgtc ctggcgtggt ttaggtagtg tgagagggct gaccatgcct tcttcttttt 780 cctacaggaa acttcataca ttgaggataa ctgtaaccag aatggcgcca tctctctgat 840 cttcagcctg aaggaggaag tgggcgccct ggcaaaggtg ctgcgcctgt ttgaggagaa 900 cgacgtgaat ctgacccaca tcgagtcccg gccttctaga ctgaagaagg acgagtacga 960 gttctttacc cacctggata agcggtccct gccagccctg acaaacatca tcaagatcct 1020 gaggcacgac atcggagcaa ccgtgcacga gctgtctcgg gacaagaaga aggataccgt 1080 gccctggttc cctcggacaa tccaggagct ggatagattt gccaaccaga tcctgtctta 1140 cggagcagag ctggacgcag atcaccctgg cttcaaggac ccagtgtatc gggcccggag 1200 aaagcagttt gccgatatcg cctacaatta taggcacgga cagccaatcc ctcgcgtgga 1260 gtatatggag gaggagaaga agacctgggg cacagtgttc aagaccctga agagcctgta 1320 caagacacac gcctgctacg agtataacca catcttcccc ctgctggaga agtattgtgg 1380 ctttcacgag gacaatatcc ctcagctgga ggacgtgagc cagttcctgc agacctgcac 1440 aggctttagg ctgaggccag tggcaggact gctgagctcc cgggacttcc tgggaggact 1500 ggccttcaga gtgtttcact gcacccagta catcaggcac ggctccaagc caatgtatac 1560 accagagccc gacatctgtc acgagctgct gggccacgtg cccctgttta gcgatagatc 1620 cttcgcccag ttttcccagg agatcggact ggcatctctg ggagcacctg acgagtacat 1680 cgagaagctg gccaccatct attggttcac agtggagttt ggcctgtgca agcagggcga 1740 tagcatcaag gcctacggag caggactgct gtctagcttc ggcgagctgc agtattgtct 1800 gtccgagaag ccaaagctgc tgcccctgga gctggagaag accgccatcc agaactacac 1860 cgtgacagag ttccagcccc tgtactatgt ggccgagtct tttaacgatg ccaaggagaa 1920 ggtgagaaat ttcgccgcca caatccctag gcccttcagc gtgcggtacg acccttatac 1980 ccagaggatc gaggtgctgg ataatacaca gcagctgaag atcctggctg actcaatcaa 2040 tagcgaaatc ggaatcctgt gctccgccct gcagaaaatc aaaggtaagc ctatccctaa 2100 ccctctcctc ggtctcgatt ctacgtgatc ttgtggaaag gacgaaacac cggggaattc 2160 aaggcctctc gagcctctag aatccccgag acgtttcgtc tcgggatcac tatagtgagt 2220 cgtattacgt acacagtgca ggggaaagaa tagtagagat ccagacatga taagatacat 2280 tgatgagttt ggacaaacca caactagaat gcagtgaaaa aaatgcttta tttgtgaaat 2340 ttgtgatgct attgctttat ttgtaaccat tataagctgc aataaacaag ttaacaacaa 2400 caattgcatt cattttatgt ttcaggttca gggggaggtg tgggaggttt tttaa 2455 <210> 151 <211> 1723 <212> DNA <213> Artificial Sequence <220> <223> 006-HBB1 vector editing element <400> 151 atgtccaccg ctgtgctgga gaaccctggg ctggggagga aactgtcaga cttcgggcag 60 gagacttcat acattgagga taactgtaac cagaatggcg ccatctctct gatcttcagc 120 ctgaaggagg aagtgggcgc cctggcaaag gtgctgcgcc tgtttgagga gaacgacgtg 180 aatctgaccc acatcgagtc ccggccttct agactgaaga aggacgagta cgagttcttt 240 acccacctgg ataagcggtc cctgccagcc ctgacaaaca tcatcaagat cctgaggcac 300 gacatcggag caaccgtgca cgagctgtct cgggacaaga agaaggatac cgtgccctgg 360 ttccctcgga caatccagga gctggataga tttgccaacc agatcctgtc ttacggagca 420 gagctggacg cagatcaccc tggcttcaag gacccagtgt atcgggcccg gagaaagcag 480 tttgccgata tcgcctacaa ttataggcac ggacagccaa tccctcgcgt ggagtatatg 540 gaggaggaga agaagacctg gggcacagtg ttcaagaccc tgaagagcct gtacaagaca 600 cacgcctgct acgagtataa ccacatcttc cccctgctgg agaagtattg tggctttcac 660 gaggacaata tccctcagct ggaggacgtg agccagttcc tgcagacctg cacaggcttt 720 aggctgaggc cagtggcagg actgctgagc tcccgggact tcctgggagg actggccttc 780 agagtgtttc actgcaccca gtacatcagg cacggctcca agccaatgta tacaccagag 840 cccgacatct gtcacgagct gctgggccac gtgcccctgt ttagcgatag atccttcgcc 900 cagttttccc aggttggtat ccaggttaca aggcagctca caagaagaag ttgggtgctt 960 ggagacagag gtctgctttc cagcagacac taactttcag tgtcccctgt ctatgtttcc 1020 ctttttagga gatcggactg gcatctctgg gagcacctga cgagtacatc gagaagctgg 1080 ccaccatcta ttggttcaca gtggagtttg gcctgtgcaa gcagggcgat agcatcaagg 1140 cctacggagc aggactgctg tctagcttcg gcgagctgca gtattgtctg tccgagaagc 1200 caaagctgct gcccctggag ctggagaaga ccgccatcca gaactacacc gtgacagagt 1260 tccagcccct gtactatgtg gccgagtctt ttaacgatgc caaggagaag gtgagaaatt 1320 tcgccgccac aatccctagg cccttcagcg tgcggtacga cccttatacc cagaggatcg 1380 aggtgctgga taatacacag cagctgaaga tcctggctga ctcaatcaat agcgaaatcg 1440 gaatcctgtg ctccgccctg cagaaaatca aatgagaatt caaggcctct cgagcctcta 1500 gaactatagt gagtcgtatt acgtagatcc agacatgata agatacattg atgagtttgg 1560 acaaaccaca actagaatgc agtgaaaaaa atgctttatt tgtgaaattt gtgatgctat 1620 tgctttattt gtaaccatta taagctgcaa taaacaagtt aacaacaaca attgcattca 1680 ttttatgttt caggttcagg gggaggtgtg ggaggttttt taa 1723 <210> 152 <211> 1607 <212> DNA <213> Artificial Sequence <220> <223> 006-SD.3 vector editing element <400> 152 atgtccaccg ctgtgctgga gaaccctggg ctggggagga aactgtcaga cttcgggcag 60 gagacttcat acattgagga taactgtaac cagaatggcg ccatctctct gatcttcagc 120 ctgaaggagg aagtgggcgc cctggcaaag gtgctgcgcc tgtttgagga gaacgacgtg 180 aatctgaccc acatcgagtc ccggccttct agactgaaga aggacgagta cgagttcttt 240 acccacctgg ataagcggtc cctgccagcc ctgacaaaca tcatcaagat cctgaggcac 300 gacatcggag caaccgtgca cgagctgtct cgggacaaga agaaggatac cgtgccctgg 360 ttccctcgga caatccagga gctggataga tttgccaacc agatcctgtc ttacggagca 420 gagctggacg cagatcaccc tggcttcaag gacccagtgt atcgggcccg gagaaagcag 480 tttgccgata tcgcctacaa ttataggcac ggacagccaa tccctcgcgt ggagtatatg 540 gaggaggaga agaagacctg gggcacagtg ttcaagaccc tgaagagcct gtacaagaca 600 cacgcctgct acgagtataa ccacatcttc cccctgctgg agaagtattg tggctttcac 660 gaggacaata tccctcagct ggaggacgtg agccagttcc tgcagacctg cacaggcttt 720 aggctgaggc cagtggcagg actgctgagc tcccgggact tcctgggagg actggccttc 780 agagtgtttc actgcaccca gtacatcagg cacggctcca agccaatgta tacaccagag 840 cccgacatct gtcacgagct gctgggccac gtgcccctgt ttagcgatag atccttcgcc 900 cagttttccc aggagatcgg actggcatct ctgggagcac ctgacgagta catcgagaag 960 ctggccacca tctattggtt cacagtggag tttggcctgt gcaagcaggg cgatagcatc 1020 aaggcctacg gagcaggact gctgtctagc ttcggcgagc tgcagtattg tctgtccgag 1080 aagccaaagc tgctgcccct ggagctggag aagaccgcca tccagaacta caccgtgaca 1140 gagttccagc ccctgtacta tgtggccgag tcttttaacg atgccaagga gaaggtgaga 1200 aatttcgccg ccacaatccc taggcccttc agtgtgcgtt acgaccctta tacccagagg 1260 atcgaggtgc tggataatac acagcagctg aagatcctgg ctgactcaat caatagcgaa 1320 atcggaatcc tgtgctccgc cctgcagaaa atcaaatgag aattcaaggc ctctcgagcc 1380 tctagaacta tagtgagtcg tattacgtag atccagacat gataagatac attgatgagt 1440 ttggacaaac cacaactaga atgcagtgaa aaaaatgctt tatttgtgaa atttgtgatg 1500 ctattgcttt atttgtaacc attataagct gcaataaaca agttaacaac aacaattgca 1560 ttcattttat gtttcaggtt cagggggagg tgtgggaggt tttttaa 1607 <210> 153 <211> 1837 <212> DNA <213> Artificial Sequence <220> <223> 032-SD.3 vector editing element <400> 153 ctgacctctt ctcttcctcc cacagggcgg taccagatct ggcagcggag agggcagagg 60 aagtcttcta acatgcggtg acgtggagga gaatcccggc cctaggggta cctccaccgc 120 tgtgctggag aaccctgggc tggggaggaa actgtcagac ttcgggcagg agacttcata 180 cattgaggat aactgtaacc agaatggcgc catctctctg atcttcagcc tgaaggagga 240 agtgggcgcc ctggcaaagg tgctgcgcct gtttgaggag aacgacgtga atctgaccca 300 catcgagtcc cggccttcta gactgaagaa ggacgagtac gagttcttta cccacctgga 360 taagcggtcc ctgccagccc tgacaaacat catcaagatc ctgaggcacg acatcggagc 420 aaccgtgcac gagctgtctc gggacaagaa gaaggatacc gtgccctggt tccctcggac 480 aatccaggag ctggatagat ttgccaacca gatcctgtct tacggagcag agctggacgc 540 agatcaccct ggcttcaagg acccagtgta tcgggcccgg agaaagcagt ttgccgatat 600 cgcctacaat tataggcacg gacagccaat ccctcgcgtg gagtatatgg aggaggagaa 660 gaagacctgg ggcacagtgt tcaagaccct gaagagcctg tacaagacac acgcctgcta 720 cgagtataac cacatcttcc ccctgctgga gaagtattgt ggctttcacg aggacaatat 780 ccctcagctg gaggacgtga gccagttcct gcagacctgc acaggcttta ggctgaggcc 840 agtggcagga ctgctgagct cccgggactt cctgggagga ctggccttca gagtgtttca 900 ctgcacccag tacatcaggc acggctccaa gccaatgtat acaccagagc ccgacatctg 960 tcacgagctg ctgggccacg tgcccctgtt tagcgataga tccttcgccc agttttccca 1020 ggagatcgga ctggcatctc tgggagcacc tgacgagtac atcgagaagc tggccaccat 1080 ctattggttc acagtggagt ttggcctgtg caagcagggc gatagcatca aggcctacgg 1140 agcaggactg ctgtctagct tcggcgagct gcagtattgt ctgtccgaga agccaaagct 1200 gctgcccctg gagctggaga agaccgccat ccagaactac accgtgacag agttccagcc 1260 cctgtactat gtggccgagt cttttaacga tgccaaggag aaggtgagaa atttcgccgc 1320 cacaatccct aggcccttca gtgtgcgtta cgacccttat acccagagga tcgaggtgct 1380 ggataataca cagcagctga agatcctggc tgactcaatc aatagcgaaa tcggaatcct 1440 gtgctccgcc ctgcagaaaa tcaaaggtaa gcctatccct aaccctctcc tcggtctcga 1500 ttctacgtga tcttgtggaa aggacgaaac accggggaat tcaaggcctc tcgagcctct 1560 agaatccccg agacgtttcg tctcgggatc actatagtga gtcgtattac gtacacagtg 1620 caggggaaag aatagtagag atccagacat gataagatac attgatgagt ttggacaaac 1680 cacaactaga atgcagtgaa aaaaatgctt tatttgtgaa atttgtgatg ctattgcttt 1740 atttgtaacc attataagct gcaataaaca agttaacaac aacaattgca ttcattttat 1800 gtttcaggtt cagggggagg tgtgggaggt tttttaa 1837

Claims (154)

  1. 세포에서 페닐알라닌 히드록실라제 (PAH) 유전자 내 돌연변이를 교정하기 위한 방법으로서, 방법은
    (a) AAV 캡시드; 및
    (b) (i) PAH 유전자의 표적 유전자좌를 편집하기 위한 편집 엘리먼트; (ii) 표적 유전자좌에 대해 5'의 제1 게놈 영역에 대해 상동성을 갖는 편집 엘리먼트의 5'의 5' 상동성 팔부 뉴클레오티드 서열; 및 (iii) 표적 유전자좌에 대해 3'의 제2 게놈 영역에 대해 상동성을 갖는 편집 엘리먼트의 3'의 3' 상동성 팔부 뉴클레오티드 서열을 포함하는 교정 게놈
    을 포함하는 복제-결함 아데노-연관 바이러스 (AAV)로 세포를 형질도입시키는 단계를 포함하고,
    세포는 외생성 뉴클레아제 또는 외생성 뉴클레아제를 코딩하는 뉴클레오티드 서열의 동시-형질도입 또는 동시-투여없이 형질도입되는 것인, 교정 방법.
  2. 제1항에 있어서, 세포는 간세포, 신장 세포, 또는 뇌, 뇌하수체, 부신, 췌장, 방광, 담낭, 결장, 소장, 또는 유방의 세포인 교정 방법.
  3. 제1항 또는 제2항에 있어서, 세포는 포유동물 대상체에 존재하고, AAV는 대상체의 세포를 형질도입시키는데 유효한 양으로 대상체에게 투여되는 것인 교정 방법.
  4. PAH 유전자 돌연변이와 연관된 질환 또는 장애를 갖는 대상체를 치료하기 위한 방법으로서, 방법은
    (a) AAV 캡시드; 및
    (b) (i) PAH 유전자의 표적 유전자좌를 편집하기 위한 편집 엘리먼트; (ii) 표적 유전자좌에 대해 5'의 제1 게놈 영역에 대해 상동성을 갖는 편집 엘리먼트의 5'의 5' 상동성 팔부 뉴클레오티드 서열; 및 (iii) 표적 유전자좌에 대해 3'의 제2 게놈 영역에 대해 상동성을 갖는 편집 엘리먼트의 3'의 3' 상동성 팔부 뉴클레오티드 서열을 포함하는 교정 게놈,
    을 포함하는 복제-결함 AAV의 유효량을 대상체에게 투여하는 단계를 포함하고,
    외생성 뉴클레아제 또는 외생성 뉴클레아제를 코딩하는 뉴클레오티드 서열은 대상체에게 동시-투여되지 않는 것인, 치료 방법.
  5. 제4항에 있어서, 질환 또는 장애는 페닐케톤뇨증인 치료 방법.
  6. 제4항 또는 제5항에 있어서, 대상체는 인간 대상체인 치료 방법.
  7. 제1항 내지 제6항 중 어느 한 항에 있어서, 편집 엘리먼트는 PAH 코딩 서열의 적어도 일부분을 포함하는 것인 방법.
  8. 제7항에 있어서, 편집 엘리먼트는 PAH 코딩 서열을 포함하는 것인 방법.
  9. 제7항 또는 제8항에 있어서, PAH 코딩 서열은 SEQ ID NO: 23에 기재된 아미노산 서열을 코딩하는 것인 방법.
  10. 제7항 내지 제9항 중 어느 한 항에 있어서, PAH 코딩 서열은 SEQ ID NO: 24에 기재된 서열을 포함하는 것인 방법.
  11. 제7항 내지 제9항 중 어느 한 항에 있어서, PAH 코딩 서열은 침묵적으로 변경되는 것인 방법.
  12. 제11항에 있어서, PAH 코딩 서열은 SEQ ID NO: 25, 116, 131, 132, 138, 139, 또는 143에 기재된 서열을 포함하는 것인 방법.
  13. 제7항에 있어서, 편집 엘리먼트는 PAH 인트론-삽입된 코딩 서열을 포함하고, 임의로 PAH 인트론-삽입된 코딩 서열은 PAH 코딩 서열에 삽입된 비천연 인트론을 포함하는 것인 방법.
  14. 제13항에 있어서, 비천연 인트론은 헤모글로빈 베타 유전자의 제1 인트론 및 마우스의 미니트 바이러스 (MVM) 인트론으로 이루어진 군으로부터 선택되는 것인 방법.
  15. 제14항에 있어서, 비천연 인트론은 SEQ ID NO: 28-30, 및 120-130 중 어느 하나와 적어도 90%가 동일한 뉴클레오티드 서열로 이루어지는 것인 방법.
  16. 제15항에 있어서, 비천연 인트론은 SEQ ID NO: 28-30, 및 120-130 중 어느 하나에 기재된 뉴클레오티드 서열로 이루어지는 것인 방법.
  17. 제13항 내지 제16항 중 어느 한 항에 있어서, PAH 인트론-삽입된 코딩 서열은 SEQ ID NO: 23에 기재된 아미노산 서열을 코딩하는 것인 방법.
  18. 제13항 내지 제17항 중 어느 한 항에 있어서, PAH 인트론-삽입된 코딩 서열은 5'에서 3'으로 PAH 코딩 서열의 제1 부분, 인트론, 및 PAH 코딩 서열의 제2 부분을 포함하고, 제1 부분 및 제2 부분은 함께 스플라이싱될 때, 완전한 PAH 코딩 서열을 형성하는 것인 방법.
  19. 제18항에 있어서, PAH 코딩 서열은 SEQ ID NO: 24에 기재된 서열을 포함하는 것인 방법.
  20. 제18항에 있어서, PAH 코딩 서열은 침묵적으로 변경되는 것인 방법.
  21. 제20항에 있어서, PAH 코딩 서열은 SEQ ID NO: 25, 116, 131, 132, 138, 139, 또는 143에 기재된 서열을 포함하는 것인 방법.
  22. 제18항 내지 제21항 중 어느 한 항에 있어서, PAH 코딩 서열의 제1 부분은 SEQ ID NO: 64 또는 65에 기재된 아미노산 서열을 포함하고/하거나, PAH 코딩 서열의 제2 부분은 SEQ ID NO: 66 또는 67에 기재된 아미노산 서열을 포함하는 것인 방법.
  23. 제18항 내지 제22항 중 어느 한 항에 있어서, PAH 코딩 서열의 제1 부분은 SEQ ID NO: 64 또는 65에 기재된 아미노산 서열로 이루어지고, PAH 코딩 서열의 제2 부분은 SEQ ID NO: 66 또는 67에 기재된 아미노산 서열로 이루어지는 것인 방법.
  24. 제7항 내지 제23항 중 어느 한 항에 있어서, 편집 엘리먼트는 5'에서 3'으로 리보솜 스키핑 엘리먼트, 및 PAH 코딩 서열 또는 PAH 인트론-삽입된 코딩 서열을 포함하는 것인 방법.
  25. 제24항에 있어서, 편집 엘리먼트는 PAH 코딩 서열 또는 PAH 인트론-삽입된 코딩 서열에 대해 3'에 폴리아데닐화 서열을 더 포함하는 것인 방법.
  26. 제25항에 있어서, 폴리아데닐화 서열은 외생성 폴리아데닐화 서열이고, 임의로 외생성 폴리아데닐화 서열은 SV40 폴리아데닐화 서열인 방법.
  27. 제26항에 있어서, SV40 폴리아데닐화 서열은 SEQ ID NO: 31-34로 이루어진 군으로부터 선택되는 뉴클레오티드 서열을 포함하는 것인 방법.
  28. 제24항 내지 제27항 중 어느 한 항에 있어서, 표적 유전자좌에 대해 5'의 뉴클레오티드는 PAH 유전자의 엑손에 존재하는 것인 방법.
  29. 제24항 내지 제28항 중 어느 한 항에 있어서, 표적 유전자좌에 대해 5'의 뉴클레오티드는 PAH 유전자의 엑손 1에 존재하는 것인 방법.
  30. 제24항 내지 제27항 중 어느 한 항에 있어서, 편집 엘리먼트는 리보솜 스키핑 엘리먼트에 대해 5'에 스플라이스 억셉터를 더 포함하는 것인 방법.
  31. 제30항에 있어서, 표적 유전자좌에 대해 5'의 뉴클레오티드는 PAH 유전자의 인트론에 존재하는 것인 방법.
  32. 제30항 또는 제31항에 있어서, 표적 유전자좌에 대해 5'의 뉴클레오티드는 PAH 유전자의 인트론 1에 존재하는 것인 방법.
  33. 제1항 내지 제32항 중 어느 한 항에 있어서, 편집 엘리먼트는 SEQ ID NO: 35에 기재된 뉴클레오티드 서열을 포함하는 것인 방법.
  34. 제1항 내지 제33항 중 어느 한 항에 있어서, 5' 상동성 팔부 뉴클레오티드 서열은 제1 게놈 영역과 적어도 90%, 95%, 96%, 97%, 98%, 또는 99%가 동일한 것인 방법.
  35. 제1항 내지 제34항 중 어느 한 항에 있어서, 3' 상동성 팔부 뉴클레오티드 서열은 제2 게놈 영역과 적어도 90%, 95%, 96%, 97%, 98%, 또는 99%가 동일한 것인 방법.
  36. 제1항 내지 제35항 중 어느 한 항에 있어서, 제1 게놈 영역은 제1 편집창에 위치하고, 제2 게놈 영역은 제2 편집창에 위치하는 것인 방법.
  37. 제36항에 있어서, 제1 편집창은 SEQ ID NO: 36 또는 45에 기재된 뉴클레오티드 서열로 이루어지는 것인 방법.
  38. 제36항 또는 제37항에 있어서, 제2 편집창은 SEQ ID NO: 36 또는 45에 기재된 뉴클레오티드 서열로 이루어지는 것인 방법.
  39. 제36항 내지 제38항 중 어느 한 항에 있어서, 제1 편집창은 SEQ ID NO: 36에 기재된 뉴클레오티드 서열로 이루어지고, 제2 편집창은 SEQ ID NO: 45에 기재된 뉴클레오티드 서열로 이루어지는 것인 방법.
  40. 제1항 내지 제39항 중 어느 한 항에 있어서, 제1 게놈 영역은 SEQ ID NO: 36에 기재된 뉴클레오티드 서열로 이루어지는 것인 방법.
  41. 제1항 내지 제40항 중 어느 한 항에 있어서, 제2 게놈 영역은 SEQ ID NO: 45에 기재된 뉴클레오티드 서열로 이루어지는 것인 방법.
  42. 제1항 내지 제41항 중 어느 한 항에 있어서, 5' 및 3' 상동성 팔부 뉴클레오티드 서열의 각각은 독립적으로 약 100 내지 약 2000 뉴클레오티드의 길이를 갖는 것인 방법.
  43. 제1항 내지 제42항 중 어느 한 항에 있어서, 5' 상동성 팔부는 PAH 유전자의 뉴클레오티드 -2에 해당하는 C, PAH 유전자의 뉴클레오티드 4에 해당하는 G, PAH 유전자의 뉴클레오티드 6에 해당하는 G, PAH 유전자의 뉴클레오티드 7에 해당하는 G, PAH 유전자의 뉴클레오티드 9에 해당하는 G, PAH 유전자의 뉴클레오티드 -467에 해당하는 A, PAH 유전자의 뉴클레오티드 -465에 해당하는 A, PAH 유전자의 뉴클레오티드 -181에 해당하는 A, PAH 유전자의 뉴클레오티드 -214에 해당하는 G, PAH 유전자의 뉴클레오티드 -212에 해당하는 C, PAH 유전자의 뉴클레오티드 -211에 해당하는 A, PAH 유전자의 뉴클레오티드 194에 해당하는 G, PAH 유전자의 뉴클레오티드 -433에 해당하는 C, PAH 유전자의 뉴클레오티드 -432에 해당하는 C, PAH 유전자의 뉴클레오티드 -394 내지 -388에 해당하는 ACGCTGTTCTTCGCC (SEQ ID NO: 68), PAH 유전자의 뉴클레오티드 -341에 해당하는 A, PAH 유전자의 뉴클레오티드 -339에 해당하는 A, PAH 유전자의 뉴클레오티드 -225에 해당하는 A, PAH 유전자의 뉴클레오티드 -211에 해당하는 A, 및/또는 PAH 유전자의 뉴클레오티드 -203에 해당하는 A를 포함하는 것인 방법.
  44. 제1항 내지 제43항 중 어느 한 항에 있어서, 5' 상동성 팔부는
    (a) PAH 유전자의 뉴클레오티드 -2에 해당하는 C, PAH 유전자의 뉴클레오티드 4에 해당하는 G, PAH 유전자의 뉴클레오티드 6에 해당하는 G, PAH 유전자의 뉴클레오티드 7에 해당하는 G, 및 PAH 유전자의 뉴클레오티드 9에 해당하는 G;
    (b) PAH 유전자의 뉴클레오티드 -467에 해당하는 A, 및 PAH 유전자의 뉴클레오티드 -465에 해당하는 A;
    (c) PAH 유전자의 뉴클레오티드 -181에 해당하는 A;
    (d) PAH 유전자의 뉴클레오티드 -214에 해당하는 G, PAH 유전자의 뉴클레오티드 -212에 해당하는 C, 및 PAH 유전자의 뉴클레오티드 -211에 해당하는 A;
    (e) PAH 유전자의 뉴클레오티드 194에 해당하는 G;
    (f) PAH 유전자의 뉴클레오티드 -433에 해당하는 C, 및 PAH 유전자의 뉴클레오티드 -432에 해당하는 C;
    (g) PAH 유전자의 뉴클레오티드 -394 내지 -388에 해당하는 ACGCTGTTCTTCGCC (SEQ ID NO: 68); 및/또는
    (h) PAH 유전자의 뉴클레오티드 -341에 해당하는 A, PAH 유전자의 뉴클레오티드 -339에 해당하는 A, PAH 유전자의 뉴클레오티드 -225에 해당하는 A, PAH 유전자의 뉴클레오티드 -211에 해당하는 A, 및 PAH 유전자의 뉴클레오티드 -203에 해당하는 A
    를 포함하는 것인 방법.
  45. 제44항에 있어서, 5' 상동성 팔부는 (c) 및 (d), (f) 및 (g), 및/또는 (b) 및 (h)의 변형을 포함하는 것인 방법.
  46. 제1항 내지 제45항 중 어느 한 항에 있어서, 5' 상동성 팔부는 SEQ ID NO: 36-44, 111, 115, 및 142 중 어느 하나에 기재된 뉴클레오티드 서열로 이루어지는 것인 방법.
  47. 제1항 내지 제46항 중 어느 한 항에 있어서, 3' 상동성 팔부는 SEQ ID NO: 45, 112, 117, 144에 기재된 뉴클레오티드 서열로 이루어지는 것인 방법.
  48. 제1항 내지 제47항 중 어느 한 항에 있어서, 교정 게놈은 SEQ ID NO: 46-54, 113, 118, 134, 136, 및 145 중 어느 하나에 기재된 뉴클레오티드 서열을 포함하는 것인 방법.
  49. 제1항 내지 제48항 중 어느 한 항에 있어서, 교정 게놈은 5' 상동성 팔부 뉴클레오티드 서열의 5'에 5' 반전 말단 반복부 (5' ITR) 뉴클레오티드 서열, 및 3' 상동성 팔부 뉴클레오티드 서열의 3'에 3' 반전 말단 반복부 (3' ITR) 뉴클레오티드 서열을 더 포함하는 것인 방법.
  50. 제49항에 있어서, 5' ITR 뉴클레오티드 서열은 SEQ ID NO: 18과 적어도 95% 서열 동일성을 갖고, 3' ITR 뉴클레오티드 서열은 SEQ ID NO: 19와 적어도 95% 서열 동일성을 가지는 것인 방법.
  51. 제49항에 있어서, 5' ITR 뉴클레오티드 서열은 SEQ ID NO: 20과 적어도 95% 서열 동일성을 갖고, 3' ITR 뉴클레오티드 서열은 SEQ ID NO: 21과 적어도 95% 서열 동일성을 가지는 것인 방법.
  52. 제49항에 있어서, 5' ITR 뉴클레오티드 서열은 SEQ ID NO: 26과 적어도 95% 서열 동일성을 갖고, 3' ITR 뉴클레오티드 서열은 SEQ ID NO: 27과 적어도 95% 서열 동일성을 가지는 것인 방법.
  53. 제1항 내지 제52항 중 어느 한 항에 있어서, 교정 게놈은 SEQ ID NO: 55-63, 114, 119, 135, 137, 및 146 중 어느 하나에 기재된 뉴클레오티드 서열을 포함하는 것인 방법.
  54. 제1항 내지 제53항 중 어느 한 항에 있어서, 교정 게놈은 SEQ ID NO: 55-63, 114, 119, 135, 137, 및 146 중 어느 하나에 기재된 뉴클레오티드 서열로 이루어지는 것인 방법.
  55. 제1항 내지 제54항 중 어느 한 항에 있어서, AAV 캡시드는 AAV 분기군 F 캡시드 단백질을 포함하는 것인 방법.
  56. 제1항 내지 제55항 중 어느 한 항에 있어서, AAV 분기군 F 캡시드 단백질은 SEQ ID NO: 2, 3, 4, 6, 7, 10, 11, 12, 13, 15, 16, 또는 17의 아미노산 203-736의 아미노산 서열과 적어도 95% 서열 동일성을 갖는 아미노산 서열을 포함하는 것인 방법.
  57. 제56항에 있어서, SEQ ID NO: 2의 아미노산 206에 해당하는 캡시드 단백질의 아미노산은 C이거나; SEQ ID NO: 2의 아미노산 296에 해당하는 캡시드 단백질의 아미노산은 H이거나; SEQ ID NO: 2의 아미노산 312에 해당하는 캡시드 단백질의 아미노산은 Q이거나; SEQ ID NO: 2의 아미노산 346에 해당하는 캡시드 단백질의 아미노산은 A이거나; SEQ ID NO: 2의 아미노산 464에 해당하는 캡시드 단백질의 아미노산은 N이거나; SEQ ID NO: 2의 아미노산 468에 해당하는 캡시드 단백질의 아미노산은 S이거나; SEQ ID NO: 2의 아미노산 501에 해당하는 캡시드 단백질의 아미노산은 I이거나; SEQ ID NO: 2의 아미노산 505에 해당하는 캡시드 단백질의 아미노산은 R이거나; SEQ ID NO: 2의 아미노산 590에 해당하는 캡시드 단백질의 아미노산은 R이거나; SEQ ID NO: 2의 아미노산 626에 해당하는 캡시드 단백질의 아미노산은 G 또는 Y이거나; SEQ ID NO: 2의 아미노산 681에 해당하는 캡시드 단백질의 아미노산은 M이거나; SEQ ID NO: 2의 아미노산 687에 해당하는 캡시드 단백질의 아미노산은 R이거나; SEQ ID NO: 2의 아미노산 690에 해당하는 캡시드 단백질의 아미노산은 K이거나; SEQ ID NO: 2의 아미노산 706에 해당하는 캡시드 단백질의 아미노산은 C이거나; 또는, SEQ ID NO: 2의 아미노산 718에 해당하는 캡시드 단백질의 아미노산은 G인 방법.
  58. 제57항에 있어서,
    (a) SEQ ID NO: 2의 아미노산 626에 해당하는 캡시드 단백질의 아미노산은 G이고, SEQ ID NO: 2의 아미노산 718에 해당하는 캡시드 단백질의 아미노산은 G이거나;
    (b) SEQ ID NO: 2의 아미노산 296에 해당하는 캡시드 단백질의 아미노산은 H이고, SEQ ID NO: 2의 아미노산 464에 해당하는 캡시드 단백질의 아미노산은 N이고, SEQ ID NO: 2의 아미노산 505에 해당하는 캡시드 단백질의 아미노산은 R이고, SEQ ID NO: 2의 아미노산 681에 해당하는 캡시드 단백질의 아미노산은 M이거나;
    (c) SEQ ID NO: 2의 아미노산 505에 해당하는 캡시드 단백질의 아미노산은 R이고, SEQ ID NO: 2의 아미노산 687에 해당하는 캡시드 단백질의 아미노산은 R이거나;
    (d) SEQ ID NO: 2의 아미노산 346에 해당하는 캡시드 단백질의 아미노산은 A이고, SEQ ID NO: 2의 아미노산 505에 해당하는 캡시드 단백질의 아미노산은 R이거나; 또는
    (e) SEQ ID NO: 2의 아미노산 501에 해당하는 캡시드 단백질의 아미노산은 I이고, SEQ ID NO: 2의 아미노산 505에 해당하는 캡시드 단백질의 아미노산은 R이고, SEQ ID NO: 2의 아미노산 706에 해당하는 캡시드 단백질의 아미노산은 C인 방법.
  59. 제57항에 있어서, 캡시드 단백질은 SEQ ID NO: 2, 3, 4, 6, 7, 10, 11, 12, 13, 15, 16, 또는 17의 아미노산 203-736의 아미노산 서열을 포함하는 것인 방법.
  60. 제1항 내지 제59항 중 어느 한 항에 있어서, AAV 분기군 F 캡시드 단백질은 SEQ ID NO: 2, 3, 4, 5, 6, 7, 9, 10, 11, 12, 13, 15, 16, 또는 17의 아미노산 138-736의 아미노산 서열과 적어도 95% 서열 동일성을 갖는 아미노산 서열을 포함하는 것인 방법.
  61. 제60항에 있어서, SEQ ID NO: 2의 아미노산 151에 해당하는 캡시드 단백질의 아미노산은 R이거나; SEQ ID NO: 2의 아미노산 160에 해당하는 캡시드 단백질의 아미노산은 D이거나; SEQ ID NO: 2의 아미노산 206에 해당하는 캡시드 단백질의 아미노산은 C이거나; SEQ ID NO: 2의 아미노산 296에 해당하는 캡시드 단백질의 아미노산은 H이거나; SEQ ID NO: 2의 아미노산 312에 해당하는 캡시드 단백질의 아미노산은 Q이거나; SEQ ID NO: 2의 아미노산 346에 해당하는 캡시드 단백질의 아미노산은 A이거나; SEQ ID NO: 2의 아미노산 464에 해당하는 캡시드 단백질의 아미노산은 N이거나; SEQ ID NO: 2의 아미노산 468에 해당하는 캡시드 단백질의 아미노산은 S이거나; SEQ ID NO: 2의 아미노산 501에 해당하는 캡시드 단백질의 아미노산은 I이거나; SEQ ID NO: 2의 아미노산 505에 해당하는 캡시드 단백질의 아미노산은 R이거나; SEQ ID NO: 2의 아미노산 590에 해당하는 캡시드 단백질의 아미노산은 R이거나; SEQ ID NO: 2의 아미노산 626에 해당하는 캡시드 단백질의 아미노산은 G 또는 Y이거나; SEQ ID NO: 2의 아미노산 681에 해당하는 캡시드 단백질의 아미노산은 M이거나; SEQ ID NO: 2의 아미노산 687에 해당하는 캡시드 단백질의 아미노산은 R이거나; SEQ ID NO: 2의 아미노산 690에 해당하는 캡시드 단백질의 아미노산은 K이거나; SEQ ID NO: 2의 아미노산 706에 해당하는 캡시드 단백질의 아미노산은 C이거나; 또는 SEQ ID NO: 2의 아미노산 718에 해당하는 캡시드 단백질의 아미노산은 G인 방법.
  62. 제61항에 있어서,
    (a) SEQ ID NO: 2의 아미노산 626에 해당하는 캡시드 단백질의 아미노산은 G이고, SEQ ID NO: 2의 아미노산 718에 해당하는 캡시드 단백질의 아미노산은 G이거나;
    (b) SEQ ID NO: 2의 아미노산 296에 해당하는 캡시드 단백질의 아미노산은 H이고, SEQ ID NO: 2의 아미노산 464에 해당하는 캡시드 단백질의 아미노산은 N이고, SEQ ID NO: 2의 아미노산 505에 해당하는 캡시드 단백질의 아미노산은 R이고, SEQ ID NO: 2의 아미노산 681에 해당하는 캡시드 단백질의 아미노산은 M이거나;
    (c) SEQ ID NO: 2의 아미노산 505에 해당하는 캡시드 단백질의 아미노산은 R이고, SEQ ID NO: 2의 아미노산 687에 해당하는 캡시드 단백질의 아미노산은 R이거나;
    (d) SEQ ID NO: 2의 아미노산 346에 해당하는 캡시드 단백질의 아미노산은 A이고, SEQ ID NO: 2의 아미노산 505에 해당하는 캡시드 단백질의 아미노산은 R이거나; 또는
    (e) SEQ ID NO: 2의 아미노산 501에 해당하는 캡시드 단백질의 아미노산은 I이고, SEQ ID NO: 2의 아미노산 505에 해당하는 캡시드 단백질의 아미노산은 R이고, SEQ ID NO: 2의 아미노산 706에 해당하는 캡시드 단백질의 아미노산은 C인 방법.
  63. 제61항에 있어서, 캡시드 단백질은 SEQ ID NO: 2, 3, 4, 5, 6, 7, 9, 10, 11, 12, 13, 15, 16, 또는 17의 아미노산 138-736의 아미노산 서열을 포함하는 것인 방법.
  64. 제1항 내지 제63항 중 어느 한 항에 있어서, AAV 분기군 F 캡시드 단백질은 SEQ ID NO: 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 15, 16, 또는 17의 아미노산 1-736의 아미노산 서열과 적어도 95% 서열 동일성을 갖는 아미노산 서열을 포함하는 것인 방법.
  65. 제64항에 있어서, SEQ ID NO: 2의 아미노산 2에 해당하는 캡시드 단백질의 아미노산은 T이거나; SEQ ID NO: 2의 아미노산 65에 해당하는 캡시드 단백질의 아미노산은 I이거나; SEQ ID NO: 2의 아미노산 68에 해당하는 캡시드 단백질의 아미노산은 V이거나; SEQ ID NO: 2의 아미노산 77에 해당하는 캡시드 단백질의 아미노산은 R이거나; SEQ ID NO: 2의 아미노산 119에 해당하는 캡시드 단백질의 아미노산은 L이거나; SEQ ID NO: 2의 아미노산 151에 해당하는 캡시드 단백질의 아미노산은 R이거나; SEQ ID NO: 2의 아미노산 160에 해당하는 캡시드 단백질의 아미노산은 D이거나; SEQ ID NO: 2의 아미노산 206에 해당하는 캡시드 단백질의 아미노산은 C이거나; SEQ ID NO: 2의 아미노산 296에 해당하는 캡시드 단백질의 아미노산은 H이거나; SEQ ID NO: 2의 아미노산 312에 해당하는 캡시드 단백질의 아미노산은 Q이거나; SEQ ID NO: 2의 아미노산 346에 해당하는 캡시드 단백질의 아미노산은 A이거나; SEQ ID NO: 2의 아미노산 464에 해당하는 캡시드 단백질의 아미노산은 N이거나; SEQ ID NO: 2의 아미노산 468에 해당하는 캡시드 단백질의 아미노산은 S이거나; SEQ ID NO: 2의 아미노산 501에 해당하는 캡시드 단백질의 아미노산은 I이거나; SEQ ID NO: 2의 아미노산 505에 해당하는 캡시드 단백질의 아미노산은 R이거나; SEQ ID NO: 2의 아미노산 590에 해당하는 캡시드 단백질의 아미노산은 R이거나; SEQ ID NO: 2의 아미노산 626에 해당하는 캡시드 단백질의 아미노산은 G 또는 Y이거나; SEQ ID NO: 2의 아미노산 681에 해당하는 캡시드 단백질의 아미노산은 M이거나; SEQ ID NO: 2의 아미노산 687에 해당하는 캡시드 단백질의 아미노산은 R이거나; SEQ ID NO: 2의 아미노산 690에 해당하는 캡시드 단백질의 아미노산은 K이거나; SEQ ID NO: 2의 아미노산 706에 해당하는 캡시드 단백질의 아미노산은 C이거나; 또는 SEQ ID NO: 2의 아미노산 718에 해당하는 캡시드 단백질의 아미노산은 G인 방법.
  66. 제65항에 있어서,
    (a) SEQ ID NO: 2의 아미노산 2에 해당하는 캡시드 단백질의 아미노산은 T이고, SEQ ID NO: 2의 아미노산 312에 해당하는 캡시드 단백질의 아미노산은 Q이거나;
    (b) SEQ ID NO: 2의 아미노산 65에 해당하는 캡시드 단백질의 아미노산은 I이고, SEQ ID NO: 2의 아미노산 626에 해당하는 캡시드 단백질의 아미노산은 Y이거나;
    (c) SEQ ID NO: 2의 아미노산 77에 해당하는 캡시드 단백질의 아미노산은 R이고, SEQ ID NO: 2의 아미노산 690에 해당하는 캡시드 단백질의 아미노산은 K이거나;
    (d) SEQ ID NO: 2의 아미노산 119에 해당하는 캡시드 단백질의 아미노산은 L이고, SEQ ID NO: 2의 아미노산 468에 해당하는 캡시드 단백질의 아미노산은 S이거나;
    (e) SEQ ID NO: 2의 아미노산 626에 해당하는 캡시드 단백질의 아미노산은 G이고, SEQ ID NO: 2의 아미노산 718에 해당하는 캡시드 단백질의 아미노산은 G이거나;
    (f) SEQ ID NO: 2의 아미노산 296에 해당하는 캡시드 단백질의 아미노산은 H이고, SEQ ID NO: 2의 아미노산 464에 해당하는 캡시드 단백질의 아미노산은 N이고, SEQ ID NO: 2의 아미노산 505에 해당하는 캡시드 단백질의 아미노산은 R이고, SEQ ID NO: 2의 아미노산 681에 해당하는 캡시드 단백질의 아미노산은 M이거나;
    (g) SEQ ID NO: 2의 아미노산 505에 해당하는 캡시드 단백질의 아미노산 R이고, SEQ ID NO: 2의 아미노산 687에 해당하는 캡시드 단백질의 아미노산은 R이거나;
    (h) SEQ ID NO: 2의 아미노산 346에 해당하는 캡시드 단백질의 아미노산은 A이고, SEQ ID NO: 2의 아미노산 505에 해당하는 캡시드 단백질의 아미노산은 R이거나; 또는
    (i) SEQ ID NO: 2의 아미노산 501에 해당하는 캡시드 단백질의 아미노산은 I이고, SEQ ID NO: 2의 아미노산 505에 해당하는 캡시드 단백질의 아미노산은 R이고, SEQ ID NO: 2의 아미노산 706에 해당하는 캡시드 단백질의 아미노산은 C인 방법.
  67. 제65항에 있어서, 캡시드 단백질은 SEQ ID NO: 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 15, 16, 또는 17의 아미노산 1-736의 아미노산 서열을 포함하는 것인 방법.
  68. 제1항 내지 제67항 중 어느 한 항에 있어서, 표적 유전자좌로 편집 엘리먼트의 통합 효율은 AAV가 표준 AAV 투여 조건 하에서 외생성 뉴클레아제의 부재 하에 인간 간세포가 이식된 마우스에게 투여될 때 적어도 1%인 방법.
  69. 제1항 내지 제68항 중 어느 한 항에 있어서, 표적 유전자좌로 편집 엘리먼트의 통합의 대립유전자 빈도는 AAV가 표준 AAV 투여 조건 하에서 외생성 뉴클레아제의 부재 하에 인간 간세포가 이식된 마우스에게 투여될 때 적어도 0.5%인 방법.
  70. 복제-결함 아데노-연관 바이러스 (AAV)로서,
    (a) AAV 캡시드; 및
    (b) (i) PAH 유전자의 표적 유전자좌를 편집하기 위한 편집 엘리먼트; (ii) 표적 유전자좌에 대해 5'의 제1 게놈 영역에 대해 상동성을 갖는 편집 엘리먼트의 5'의 5' 상동성 팔부 뉴클레오티드 서열; 및 (iii) 표적 유전자좌에 대해 3'의 제2 게놈 영역에 대해 상동성을 갖는 편집 엘리먼트의 3'의 3' 상동성 팔부 뉴클레오티드 서열를 포함하는 교정 게놈
    을 포함하는, 복제-결함 아데노-연관 바이러스 (AAV).
  71. 제70항에 있어서, 편집 엘리먼트는 PAH 코딩 서열의 적어도 일부분을 포함하는 것인 AAV.
  72. 제70항 또는 제71항에 있어서, 편집 엘리먼트는 PAH 코딩 서열을 포함하는 것인 AAV.
  73. 제71항 또는 제72항에 있어서, PAH 코딩 서열은 SEQ ID NO: 23에 기재된 아미노산 서열을 코딩하는 것인 AAV.
  74. 제73항에 있어서, PAH 코딩 서열은 SEQ ID NO: 24에 기재된 서열을 포함하는 것인 AAV.
  75. 제73항에 있어서, PAH 코딩 서열은 침묵적으로 변경되는 것인 AAV.
  76. 제75항에 있어서, PAH 코딩 서열은 SEQ ID NO: 25, 116, 131, 132, 138, 139, 또는 143에 기재된 서열을 포함하는 것인 AAV.
  77. 제71항에 있어서, 편집 엘리먼트는 PAH 인트론-삽입된 코딩 서열을 포함하고, 임의로 PAH 인트론-삽입된 코딩 서열은 PAH 코딩 서열에 삽입된 비천연 인트론을 포함하는 것인 AAV.
  78. 제77항에 있어서, 비천연 인트론은 헤모글로빈 베타 유전자의 제1 인트론 및 마우스의 미니트 바이러스 (MVM) 인트론으로 이루어진 군으로부터 선택되는 것인 AAV.
  79. 제78항에 있어서, 비천연 인트론은 SEQ ID NO: 28-30, 및 120-130 중 어느 하나와 적어도 90%가 동일한 뉴클레오티드 서열로 이루어지는 것인 AAV.
  80. 제79항에 있어서, 비천연 인트론은 SEQ ID NO: 28-30, 및 120-130 중 어느 하나에 기재된 뉴클레오티드 서열로 이루어지는 것인 AAV.
  81. 제77항 내지 제80항 중 어느 한 항에 있어서, PAH 인트론-삽입된 코딩 서열은 SEQ ID NO: 23에 기재된 아미노산 서열을 코딩하는 것인 AAV.
  82. 제77항 내지 제81항 중 어느 한 항에 있어서, PAH 인트론-삽입된 코딩 서열은 5'에서 3'으로 PAH 코딩 서열의 제1 부분, 인트론, 및 PAH 코딩 서열의 제2 부분을 포함하고, 제1 부분 및 제2 부분은 함께 스플라이싱될 때 완전한 PAH 코딩 서열을 형성하는 것인 AAV.
  83. 제82항에 있어서, PAH 코딩 서열은 SEQ ID NO: 24에 기재된 서열을 포함하는 것인 AAV.
  84. 제82항에 있어서, PAH 코딩 서열은 침묵적으로 변경되는 것인 AAV.
  85. 제84항에 있어서, PAH 코딩 서열은 SEQ ID NO: 25, 116, 131, 132, 138, 139, 또는 143에 기재된 서열을 포함하는 것인 AAV.
  86. 제82항 내지 제85항 중 어느 한 항에 있어서, PAH 코딩 서열의 제1 부분은 SEQ ID NO: 64 또는 65에 기재된 아미노산 서열을 포함하고/하거나, PAH 코딩 서열의 제2 부분은 SEQ ID NO: 66 또는 67에 기재된 아미노산 서열을 포함하는 것인 AAV.
  87. 제82항 내지 제86항 중 어느 한 항에 있어서, PAH 코딩 서열의 제1 부분은 SEQ ID NO: 64 또는 65에 기재된 아미노산 서열로 이루어지고, PAH 코딩 서열의 제2 부분은 SEQ ID NO: 66 또는 67에 기재된 아미노산 서열로 이루어지는 것인 AAV.
  88. 제71항 내지 제87항 중 어느 한 항에 있어서, 편집 엘리먼트는 5'에서 3'으로 리보솜 스키핑 엘리먼트, 및 PAH 코딩 서열 또는 PAH 인트론-삽입된 코딩 서열을 포함하는 것인 AAV.
  89. 제88항에 있어서, 편집 엘리먼트는 PAH 코딩 서열 또는 PAH 인트론-삽입된 코딩 서열에 대해 3'에 폴리아데닐화 서열을 더 포함하는 것인 AAV.
  90. 제89항에 있어서, 폴리아데닐화 서열은 외생성 폴리아데닐화 서열이고, 임의로 외생성 폴리아데닐화 서열은 SV40 폴리아데닐화 서열인 AAV.
  91. 제90항에 있어서, SV40 폴리아데닐화 서열은 SEQ ID NO: 31-34로 이루어진 군으로부터 선택되는 뉴클레오티드 서열을 포함하는 것인 AAV.
  92. 제88항 내지 제91항 중 어느 한 항에 있어서, 표적 유전자좌에 대해 5'의 뉴클레오티드는 PAH 유전자의 엑손에 존재하는 것인 AAV.
  93. 제88항 내지 제92항 중 어느 한 항에 있어서, 표적 유전자좌에 대해 5'의 뉴클레오티드는 PAH 유전자의 엑손 1에 존재하는 것인 AAV.
  94. 제88항 내지 제91항 중 어느 한 항에 있어서, 편집 엘리먼트는 리보솜 스키핑 엘리먼트에 대해 5'에 스플라이스 억셉터를 더 포함하는 것인 AAV.
  95. 제94항에 있어서, 표적 유전자좌에 대해 5'의 뉴클레오티드는 PAH 유전자의 인트론에 존재하는 것인 AAV.
  96. 제94항 또는 제95항에 있어서, 표적 유전자좌에 대해 5'의 뉴클레오티드는 PAH 유전자의 인트론 1에 존재하는 것인 AAV.
  97. 제70항 내지 제96항 중 어느 한 항에 있어서, 편집 엘리먼트는 SEQ ID NO: 35에 기재된 뉴클레오티드 서열을 포함하는 것인 AAV.
  98. 제70항 내지 제97항 중 어느 한 항에 있어서, 5' 상동성 팔부 뉴클레오티드 서열은 제1 게놈 영역과 적어도 90%, 95%, 96%, 97%, 98%, 또는 99%가 동일한 것인 AAV.
  99. 제70항 내지 제98항 중 어느 한 항에 있어서, 3' 상동성 팔부 뉴클레오티드 서열은 제2 게놈 영역과 적어도 90%, 95%, 96%, 97%, 98%, 또는 99%가 동일한 것인 AAV.
  100. 제70항 내지 제99항 중 어느 한 항에 있어서, 제1 게놈 영역은 제1 편집창에 위치하고, 제2 게놈 영역은 제2 편집창에 위치하는 것인 AAV.
  101. 제100항에 있어서, 제1 편집창은 SEQ ID NO: 36 또는 45에 기재된 뉴클레오티드 서열로 이루어지는 것인 AAV.
  102. 제100항 또는 제101항에 있어서, 제2 편집창은 SEQ ID NO: 36 또는 45에 기재된 뉴클레오티드 서열로 이루어지는 것인 AAV.
  103. 제100항 내지 제102항 중 어느 한 항에 있어서, 제1 편집창은 SEQ ID NO: 36에 기재된 뉴클레오티드 서열로 이루어지고, 제2 편집창은 SEQ ID NO: 45에 기재된 뉴클레오티드 서열로 이루어지는 것인 AAV.
  104. 제70항 내지 제103항 중 어느 한 항에 있어서, 제1 게놈 영역은 SEQ ID NO: 36에 기재된 뉴클레오티드 서열로 이루어지는 것인 AAV.
  105. 제70항 내지 제104항 중 어느 한 항에 있어서, 제2 게놈 영역은 SEQ ID NO: 45에 기재된 뉴클레오티드 서열로 이루어지는 것인 AAV.
  106. 제70항 내지 제105항 중 어느 한 항에 있어서, 5' 및 3' 상동성 팔부 뉴클레오티드 서열의 각각은 독립적으로 약 100개 내지 약 2000개 뉴클레오티드의 길이를 갖는 것인 AAV.
  107. 제70항 내지 제106항 중 어느 한 항에 있어서, 5' 상동성 팔부는 PAH 유전자의 뉴클레오티드 -2에 해당하는 C, PAH 유전자의 뉴클레오티드 4에 해당하는 G, PAH 유전자의 뉴클레오티드 6에 해당하는 G, PAH 유전자의 뉴클레오티드 7에 해당하는 G, PAH 유전자의 뉴클레오티드 9에 해당하는 G, PAH 유전자의 뉴클레오티드 -467에 해당하는 A, PAH 유전자의 뉴클레오티드 -465에 해당하는 A, PAH 유전자의 뉴클레오티드 -181에 해당하는 A, PAH 유전자의 뉴클레오티드 -214에 해당하는 G, PAH 유전자의 뉴클레오티드 -212에 해당하는 C, PAH 유전자의 뉴클레오티드 -211에 해당하는 A, PAH 유전자의 뉴클레오티드 194에 해당하는 G, PAH 유전자의 뉴클레오티드 -433에 해당하는 C, PAH 유전자의 뉴클레오티드 -432에 해당하는 C, PAH 유전자의 뉴클레오티드 -394 내지 -388에 해당하는 ACGCTGTTCTTCGCC (SEQ ID NO: 68), PAH 유전자의 뉴클레오티드 -341에 해당하는 A, PAH 유전자의 뉴클레오티드 -339에 해당하는 A, PAH 유전자의 뉴클레오티드 -225에 해당하는 A, PAH 유전자의 뉴클레오티드 -211에 해당하는 A, 및/또는 PAH 유전자의 뉴클레오티드 -203에 해당하는 A를 포함하는 것인 AAV.
  108. 제70항 내지 제107항 중 어느 한 항에 있어서, 5' 상동성 팔부는
    (a) PAH 유전자의 뉴클레오티드 -2에 해당하는 C, PAH 유전자의 뉴클레오티드 4에 해당하는 G, PAH 유전자의 뉴클레오티드 6에 해당하는 G, PAH 유전자의 뉴클레오티드 7에 해당하는 G, 및 PAH 유전자의 뉴클레오티드 9에 해당하는 G;
    (b) PAH 유전자의 뉴클레오티드 -467에 해당하는 A, 및 PAH 유전자의 뉴클레오티드 -465에 해당하는 A;
    (c) PAH 유전자의 뉴클레오티드 -181에 해당하는 A;
    (d) PAH 유전자의 뉴클레오티드 -214에 해당하는 G, PAH 유전자의 뉴클레오티드 -212에 해당하는 C, 및 PAH 유전자의 뉴클레오티드 -211에 해당하는 A;
    (e) PAH 유전자의 뉴클레오티드 194에 해당하는 G;
    (f) PAH 유전자의 뉴클레오티드 -433에 해당하는 C, 및 PAH 유전자의 뉴클레오티드 -432에 해당하는 C;
    (g) PAH 유전자의 뉴클레오티드 -394 내지 -388에 해당하는 ACGCTGTTCTTCGCC (SEQ ID NO: 68); 및/또는
    (h) PAH 유전자의 뉴클레오티드 -341에 해당하는 A, PAH 유전자의 뉴클레오티드 -339에 해당하는 A, PAH 유전자의 뉴클레오티드 -225에 해당하는 A, PAH 유전자의 뉴클레오티드 -211에 해당하는 A, 및 PAH 유전자의 뉴클레오티드 -203에 해당하는 A
    를 포함하는 것인 AAV.
  109. 제108항에 있어서, 5' 상동성 팔부는 (c) 및 (d), (f) 및 (g), 및/또는 (b) 및 (h)의 변형을 포함하는 것인 AAV.
  110. 제70항 내지 제109항 중 어느 한 항에 있어서, 5' 상동성 팔부는 SEQ ID NO: 36-44, 111, 115, 및 142 중 어느 하나에 기재된 뉴클레오티드 서열로 이루어지는 것인 AAV.
  111. 제70항 내지 제110항 중 어느 한 항에 있어서, 3' 상동성 팔부는 SEQ ID NO: 45, 112, 117, 144에 기재된 뉴클레오티드 서열로 이루어지는 것인 AAV.
  112. 제70항 내지 제11항 중 어느 한 항에 있어서, 교정 게놈은 SEQ ID NO: 46-54, 113, 118, 134, 136, 및 145 중 어느 하나에 기재된 뉴클레오티드 서열을 포함하는 것인 AAV.
  113. 제70항 내지 제112항 중 어느 한 항에 있어서, 교정 게놈은 5' 상동성 팔부 뉴클레오티드 서열의 5'에 5' 반전 말단 반복부 (5' ITR) 뉴클레오티드 서열, 및 3' 상동성 팔부 뉴클레오티드 서열의 3'에 3' 반전 말단 반복부 (3' ITR) 뉴클레오티드 서열을 더 포함하는 것인 AAV.
  114. 제113항에 있어서, 5' ITR 뉴클레오티드 서열은 SEQ ID NO: 18과 적어도 95% 서열 동일성을 갖고, 3' ITR 뉴클레오티드 서열은 SEQ ID NO: 19와 적어도 95% 서열 동일성을 갖는 것인 AAV.
  115. 제113항에 있어서, 5' ITR 뉴클레오티드 서열은 SEQ ID NO: 20과 적어도 95% 서열 동일성을 갖고, 3' ITR 뉴클레오티드 서열은 SEQ ID NO: 21과 적어도 95% 서열 동일성을 갖는 것인 AAV.
  116. 제113항에 있어서, 5' ITR 뉴클레오티드 서열은 SEQ ID NO: 26과 적어도 95% 서열 동일성을 갖고, 3' ITR 뉴클레오티드 서열은 SEQ ID NO: 27과 적어도 95% 서열 동일성을 갖는 것인 AAV.
  117. 제70항 내지 제116항 중 어느 한 항에 있어서, 교정 게놈은 SEQ ID NO: 55-63, 114, 119, 135, 137, 및 146 중 어느 하나에 기재된 뉴클레오티드 서열을 포함하는 것인 AAV.
  118. 제70항 내지 제117항 중 어느 한 항에 있어서, 교정 게놈은 SEQ ID NO: 55-63, 114, 119, 135, 137, 및 146 중 어느 하나에 기재된 뉴클레오티드 서열로 이루어지는 것인 AAV.
  119. 제70항 내지 제118항 중 어느 한 항에 있어서, AAV 캡시드는 AAV 분기군 F 캡시드 단백질을 포함하는 것인 AAV.
  120. 제70항 내지 제119항 중 어느 한 항에 있어서, AAV 분기군 F 캡시드 단백질은 SEQ ID NO: 2, 3, 4, 6, 7, 10, 11, 12, 13, 15, 16, 또는 17의 아미노산 203-736의 아미노산 서열과 적어도 95% 서열 동일성을 갖는 아미노산 서열을 포함하는 것인 AAV.
  121. 제120항에 있어서, SEQ ID NO: 2의 아미노산 206에 해당하는 캡시드 단백질의 아미노산은 C이거나; SEQ ID NO: 2의 아미노산 296에 해당하는 캡시드 단백질의 아미노산은 H이거나; SEQ ID NO: 2의 아미노산 312에 해당하는 캡시드 단백질의 아미노산은 Q이거나; SEQ ID NO: 2의 아미노산 346에 해당하는 캡시드 단백질의 아미노산은 A이거나; SEQ ID NO: 2의 아미노산 464에 해당하는 캡시드 단백질의 아미노산은 N이거나; SEQ ID NO: 2의 아미노산 468에 해당하는 캡시드 단백질의 아미노산은 S이거나; SEQ ID NO: 2의 아미노산 501에 해당하는 캡시드 단백질의 아미노산은 I이거나; SEQ ID NO: 2의 아미노산 505에 해당하는 캡시드 단백질의 아미노산은 R이거나; SEQ ID NO: 2의 아미노산 590에 해당하는 캡시드 단백질의 아미노산은 R이거나; SEQ ID NO: 2의 아미노산 626에 해당하는 캡시드 단백질의 아미노산은 G 또는 Y이거나; SEQ ID NO: 2의 아미노산 681에 해당하는 캡시드 단백질의 아미노산은 M이거나; SEQ ID NO: 2의 아미노산 687에 해당하는 캡시드 단백질의 아미노산은 R이거나; SEQ ID NO: 2의 아미노산 690에 해당하는 캡시드 단백질의 아미노산은 K이거나; SEQ ID NO: 2의 아미노산 706에 해당하는 캡시드 단백질의 아미노산은 C이거나; 또는 SEQ ID NO: 2의 아미노산 718에 해당하는 캡시드 단백질의 아미노산은 G인 AAV.
  122. 제121항에 있어서,
    (a) SEQ ID NO: 2의 아미노산 626에 해당하는 캡시드 단백질의 아미노산은 G이고, SEQ ID NO: 2의 아미노산 718에 해당하는 캡시드 단백질의 아미노산은 G이거나;
    (b) SEQ ID NO: 2의 아미노산 296에 해당하는 캡시드 단백질의 아미노산은 H이고, SEQ ID NO: 2의 아미노산 464에 해당하는 캡시드 단백질의 아미노산은 N이고, SEQ ID NO: 2의 아미노산 505에 해당하는 캡시드 단백질의 아미노산은 R이고, SEQ ID NO: 2의 아미노산 681에 해당하는 캡시드 단백질의 아미노산은 M이거나;
    (c) SEQ ID NO: 2의 아미노산 505에 해당하는 캡시드 단백질의 아미노산은 R이고, SEQ ID NO: 2의 아미노산 687에 해당하는 캡시드 단백질의 아미노산은 R이거나;
    (d) SEQ ID NO: 2의 아미노산 346에 해당하는 캡시드 단백질의 아미노산은 A이고, SEQ ID NO: 2의 아미노산 505에 해당하는 캡시드 단백질의 아미노산은 R이거나; 또는
    (e) SEQ ID NO: 2의 아미노산 501에 해당하는 캡시드 단백질의 아미노산은 I이고, SEQ ID NO: 2의 아미노산 505에 해당하는 캡시드 단백질의 아미노산은 R이고, SEQ ID NO: 2의 아미노산 706에 해당하는 캡시드 단백질의 아미노산은 C인 AAV.
  123. 제121항에 있어서, 캡시드 단백질은 SEQ ID NO: 2, 3, 4, 6, 7, 10, 11, 12, 13, 15, 16, 또는 17의 아미노산 203-736의 아미노산 서열을 포함하는 것인 AAV.
  124. 제70항 내지 제123항 중 어느 한 항에 있어서, AAV 분기군 F 캡시드 단백질은 SEQ ID NO: 2, 3, 4, 5, 6, 7, 9, 10, 11, 12, 13, 15, 16, 또는 17의 아미노산 138-736의 아미노산 서열과 적어도 95% 서열 동일성을 갖는 아미노산 서열을 포함하는 것인 AAV.
  125. 제124항에 있어서, SEQ ID NO: 2의 아미노산 151에 해당하는 캡시드 단백질의 아미노산은 R이거나; SEQ ID NO: 2의 아미노산 160에 해당하는 캡시드 단백질의 아미노산은 D이거나; SEQ ID NO: 2의 아미노산 206에 해당하는 캡시드 단백질의 아미노산은 C이거나; SEQ ID NO: 2의 아미노산 296에 해당하는 캡시드 단백질의 아미노산은 H이거나; SEQ ID NO: 2의 아미노산 312에 해당하는 캡시드 단백질의 아미노산은 Q이거나; SEQ ID NO: 2의 아미노산 346에 해당하는 캡시드 단백질의 아미노산은 A이거나; SEQ ID NO: 2의 아미노산 464에 해당하는 캡시드 단백질의 아미노산은 N이거나; SEQ ID NO: 2의 아미노산 468에 해당하는 캡시드 단백질의 아미노산은 S이거나; SEQ ID NO: 2의 아미노산 501에 해당하는 캡시드 단백질의 아미노산은 I이거나; SEQ ID NO: 2의 아미노산 505에 해당하는 캡시드 단백질의 아미노산은 R이거나; SEQ ID NO: 2의 아미노산 590에 해당하는 캡시드 단백질의 아미노산은 R이거나; SEQ ID NO: 2의 아미노산 626에 해당하는 캡시드 단백질의 아미노산은 G 또는 Y이거나; SEQ ID NO: 2의 아미노산 681에 해당하는 캡시드 단백질의 아미노산은 M이거나; SEQ ID NO: 2의 아미노산 687에 해당하는 캡시드 단백질의 아미노산은 R이거나; SEQ ID NO: 2의 아미노산 690에 해당하는 캡시드 단백질의 아미노산은 K이거나; SEQ ID NO: 2의 아미노산 706에 해당하는 캡시드 단백질의 아미노산은 C이거나; 또는 SEQ ID NO: 2의 아미노산 718에 해당하는 캡시드 단백질의 아미노산은 G인 AAV.
  126. 제125항에 있어서,
    (a) SEQ ID NO: 2의 아미노산 626에 해당하는 캡시드 단백질의 아미노산은 G이고, SEQ ID NO: 2의 아미노산 718에 해당하는 캡시드 단백질의 아미노산은 G이거나;
    (b) SEQ ID NO: 2의 아미노산 296에 해당하는 캡시드 단백질의 아미노산은 H이고, SEQ ID NO: 2의 아미노산 464에 해당하는 캡시드 단백질의 아미노산은 N이고, SEQ ID NO: 2의 아미노산 505에 해당하는 캡시드 단백질의 아미노산은 R이고, SEQ ID NO: 2의 아미노산 681에 해당하는 캡시드 단백질의 아미노산은 M이거나;
    (c) SEQ ID NO: 2의 아미노산 505에 해당하는 캡시드 단백질의 아미노산은 R이고, SEQ ID NO: 2의 아미노산 687에 해당하는 캡시드 단백질의 아미노산은 R이거나;
    (d) SEQ ID NO: 2의 아미노산 346에 해당하는 캡시드 단백질의 아미노산은 A이고, SEQ ID NO: 2의 아미노산 505에 해당하는 캡시드 단백질의 아미노산은 R이거나; 또는
    (e) SEQ ID NO: 2의 아미노산 501에 해당하는 캡시드 단백질의 아미노산은 I이고, SEQ ID NO: 2의 아미노산 505에 해당하는 캡시드 단백질의 아미노산은 R이고, SEQ ID NO: 2의 아미노산 706에 해당하는 캡시드 단백질의 아미노산은 C인 AAV.
  127. 제125항에 있어서, 캡시드 단백질은 SEQ ID NO: 2, 3, 4, 5, 6, 7, 9, 10, 11, 12, 13, 15, 16, 또는 17의 아미노산 138-736의 아미노산 서열을 포함하는 것인 AAV.
  128. 제70항 내지 제127항 중 어느 한 항에 있어서, AAV 분기군 F 캡시드 단백질은 SEQ ID NO: 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 15, 16, 또는 17의 아미노산 1-736의 아미노산 서열과 적어도 95% 서열 동일성을 갖는 아미노산 서열을 포함하는 것인 AAV.
  129. 제128항에 있어서, SEQ ID NO: 2의 아미노산 2에 해당하는 캡시드 단백질의 아미노산은 T이거나; SEQ ID NO: 2의 아미노산 65에 해당하는 캡시드 단백질의 아미노산은 I이거나; SEQ ID NO: 2의 아미노산 68에 해당하는 캡시드 단백질의 아미노산은 V이거나; SEQ ID NO: 2의 아미노산 77에 해당하는 캡시드 단백질의 아미노산은 R이거나; SEQ ID NO: 2의 아미노산 119에 해당하는 캡시드 단백질의 아미노산은 L이거나; SEQ ID NO: 2의 아미노산 151에 해당하는 캡시드 단백질의 아미노산은 R이거나; SEQ ID NO: 2의 아미노산 160에 해당하는 캡시드 단백질의 아미노산은 D이거나; SEQ ID NO: 2의 아미노산 206에 해당하는 캡시드 단백질의 아미노산은 C이거나; SEQ ID NO: 2의 아미노산 296에 해당하는 캡시드 단백질의 아미노산은 H이거나; SEQ ID NO: 2의 아미노산 312에 해당하는 캡시드 단백질의 아미노산은 Q이거나; SEQ ID NO: 2의 아미노산 346에 해당하는 캡시드 단백질의 아미노산은 A이거나; SEQ ID NO: 2의 아미노산 464에 해당하는 캡시드 단백질의 아미노산은 N이거나; SEQ ID NO: 2의 아미노산 468에 해당하는 캡시드 단백질의 아미노산은 S이거나; SEQ ID NO: 2의 아미노산 501에 해당하는 캡시드 단백질의 아미노산은 I이거나; SEQ ID NO: 2의 아미노산 505에 해당하는 캡시드 단백질의 아미노산은 R이거나; SEQ ID NO: 2의 아미노산 590에 해당하는 캡시드 단백질의 아미노산은 R이거나; SEQ ID NO: 2의 아미노산 626에 해당하는 캡시드 단백질의 아미노산은 G 또는 Y이거나; SEQ ID NO: 2의 아미노산 681에 해당하는 캡시드 단백질의 아미노산은 M이거나; SEQ ID NO: 2의 아미노산 687에 해당하는 캡시드 단백질의 아미노산은 R이거나; SEQ ID NO: 2의 아미노산 690에 해당하는 캡시드 단백질의 아미노산은 K이거나; SEQ ID NO: 2의 아미노산 706에 해당하는 캡시드 단백질의 아미노산은 C이거나; 또는 SEQ ID NO: 2의 아미노산 718에 해당하는 캡시드 단백질의 아미노산은 G인 AAV.
  130. 제129항에 있어서,
    (a) SEQ ID NO: 2의 아미노산 2에 해당하는 캡시드 단백질의 아미노산은 T이고, SEQ ID NO: 2의 아미노산 312에 해당하는 캡시드 단백질의 아미노산은 Q이거나;
    (b) SEQ ID NO: 2의 아미노산 65에 해당하는 캡시드 단백질의 아미노산은 I이고, SEQ ID NO: 2의 아미노산 626에 해당하는 캡시드 단백질의 아미노산은 Y이거나;
    (c) SEQ ID NO: 2의 아미노산 77에 해당하는 캡시드 단백질의 아미노산은 R이고, SEQ ID NO: 2의 아미노산 690에 해당하는 캡시드 단백질의 아미노산은 K이거나;
    (d) SEQ ID NO: 2의 아미노산 119에 해당하는 캡시드 단백질의 아미노산은 L이고, SEQ ID NO: 2의 아미노산 468에 해당하는 캡시드 단백질의 아미노산은 S이거나;
    (e) SEQ ID NO: 2의 아미노산 626에 해당하는 캡시드 단백질의 아미노산은 G이고, SEQ ID NO: 2의 아미노산 718에 해당하는 캡시드 단백질의 아미노산은 G이거나;
    (f) SEQ ID NO: 2의 아미노산 296에 해당하는 캡시드 단백질의 아미노산은 H이고, SEQ ID NO: 2의 아미노산 464에 해당하는 캡시드 단백질의 아미노산은 N이고, SEQ ID NO: 2의 아미노산 505에 해당하는 캡시드 단백질의 아미노산은 R이고, SEQ ID NO: 2의 아미노산 681에 해당하는 캡시드 단백질의 아미노산은 M이거나;
    (g) SEQ ID NO: 2의 아미노산 505에 해당하는 캡시드 단백질의 아미노산은 R이고, SEQ ID NO: 2의 아미노산 687에 해당하는 캡시드 단백질의 아미노산은 R이거나;
    (h) SEQ ID NO: 2의 아미노산 346에 해당하는 캡시드 단백질의 아미노산은 A이고, SEQ ID NO: 2의 아미노산 505에 해당하는 캡시드 단백질의 아미노산은 R이거나; 또는
    (i) SEQ ID NO: 2의 아미노산 501에 해당하는 캡시드 단백질의 아미노산은 I이고, SEQ ID NO: 2의 아미노산 505에 해당하는 캡시드 단백질의 아미노산은 R이고, SEQ ID NO: 2의 아미노산 706에 해당하는 캡시드 단백질의 아미노산은 C인 AAV.
  131. 제129항에 있어서, 캡시드 단백질은 SEQ ID NO: 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 15, 16, 또는 17의 아미노산 1-736의 아미노산 서열을 포함하는 것인 AAV.
  132. 제70항 내지 제131항 중 어느 한 항에 있어서, 표적 유전자좌로 편집 엘리먼트의 통합 효율은 AAV가 표준 AAV 투여 조건 하에서 외생성 뉴클레아제의 부재 하에 인간 간세포가 이식된 마우스에게 투여될 때 적어도 1%인 AAV.
  133. 제70항 내지 제132항 중 어느 한 항에 있어서, 표적 유전자좌로 편집 엘리먼트의 통합의 대립유전자 빈도는 AAV가 표준 AAV 투여 조건 하에서 외생성 뉴클레아제의 부재 하에 인간 간세포가 이식된 마우스에게 투여될 때 적어도 0.5%인 AAV.
  134. 제70항 내지 제133항 중 어느 한 항의 AAV를 포함하는 약학 조성물.
  135. 복제-결함 AAV의 재조합 제조를 위한 패키징 시스템으로서, 패키징 시스템은
    (a) 하나 이상의 AAV Rep 단백질을 코딩하는 Rep 뉴클레오티드 서열;
    (b) 제119항 내지 제131항 중 어느 한 항에 기재된 바와 같은 하나 이상의 AAV 분기군 F 캡시드 단백질을 코딩하는 Cap 뉴클레오티드 서열; 및
    (c) 제70항 내지 제118항, 제132항, 및 제133항 중 어느 한 항에 기재된 바와 같은 교정 게놈을 포함하고,
    패키징 시스템은 AAV를 형성하도록 캡시드에 교정 게놈을 밀봉시키기 위해 세포에서 작동되는 것인 패키징 시스템.
  136. 제135항에 있어서, 패키징 시스템은 Rep 뉴클레오티드 서열 및 Cap 뉴클레오티드 서열을 포함하는 제1 벡터, 및 교정 게놈을 포함하는 제2 벡터를 포함하는 것인 패키징 시스템.
  137. 제135항 또는 제136항에 있어서, Rep 뉴클레오티드 서열은 AAV2 Rep 단백질을 코딩하는 것인 패키징 시스템.
  138. 제137항에 있어서, AAV2 Rep 단백질은 78/68 또는 Rep 68/52인 패키징 시스템.
  139. 제137항 또는 제138항에 있어서, AAV2 Rep 단백질은 SEQ ID NO: 22의 AAV2 Rep 아미노산 서열과 최소 백분율의 서열 동일성을 갖는 아미노산 서열을 포함하고, 최소 백분율의 서열 동일성은 AAV2 Rep 단백질을 코딩하는 아미노산 서열의 길이 전반에서 적어도 70%인 패키징 시스템.
  140. 제136항 내지 제139항 중 어느 한 항에 있어서, 제3 벡터를 더 포함하고, 제3 벡터는 헬퍼 바이러스 벡터인 패키징 시스템.
  141. 제140항에 있어서, 헬퍼 바이러스 벡터는 독립적인 제3 벡터인 패키징 시스템.
  142. 제140항에 있어서, 헬퍼 바이러스 벡터는 제1 벡터와 통합되는 것인 패키징 시스템.
  143. 제140항에 있어서, 헬퍼 바이러스 벡터는 제2 벡터와 통합되는 것인 패키징 시스템.
  144. 제140항 내지 제143항 중 어느 한 항에 있어서, 제3 벡터는 헬퍼 바이러스 단백질을 코딩하는 유전자를 포함하는 것인 패키징 시스템.
  145. 제140항 내지 제144항 중 어느 한 항에 있어서, 헬퍼 바이러스는 아데노바이러스, 헤르페스 바이러스, 백시니아 바이러스, 및 사이토메갈로바이러스 (CMV)로 이루어진 군으로부터 선택되는 것인 패키징 시스템.
  146. 제145항에 있어서, 헬퍼 바이러스는 아데노바이러스인 패키징 시스템.
  147. 제146항에 있어서, 아데노바이러스 게놈은 E1, E2, E4 및 VA로 이루어진 군으로부터 선택되는 하나 이상의 아데노바이러스 RNA 유전자를 포함하는 것인 패키징 시스템.
  148. 제145항에 있어서, 헬퍼 바이러스는 헤르페스 심플렉스 바이러스 (HSV)인 패키징 시스템.
  149. 제148항에 있어서, HSV 게놈은 UL5/8/52, ICPO, ICP4, ICP22 및 UL30/UL42로 이루어진 군으로부터 선택되는 하나 이상의 HSV 유전자를 포함하는 것인 패키징 시스템.
  150. 제140항 내지 제149항 중 어느 한 항에 있어서, 제1 벡터 및 제3 벡터는 제1 형질감염 플라스미드 내에 함유되는 것인 패키징 시스템.
  151. 제140항 내지 제149항 중 어느 한 항에 있어서, 제2 벡터 및 제3 벡터의 뉴클레오티드는 제2 형질감염 플라스미드 내에 함유되는 것인 패키징 시스템.
  152. 제140항 내지 제149항 중 어느 한 항에 있어서, 제1 벡터 및 제3 벡터의 뉴클레오티드는 재조합 헬퍼 바이러스에 클로닝되는 것인 패키징 시스템.
  153. 제140항 내지 제149항 중 어느 한 항에 있어서, 제2 벡터 및 제3 벡터의 뉴클레오티드는 재조합 헬퍼 바이러스에 클로닝되는 것인 패키징 시스템.
  154. 복제-결함 AAV의 재조합 제조를 위한 방법으로서, 방법은 AAV를 형성하도록 캡시드에 교정 게놈의 밀봉을 위해 작동되는 조건 하에서 세포에 제135항 내지 제153항 중 어느 한 항의 패키징 시스템을 도입시키는 단계를 포함하는 것인, 제조 방법.
KR1020207024199A 2018-02-01 2019-02-01 Pah 유전자 기능 복원을 위한 아데노-연관 바이러스 조성물 및 이의 사용 방법 Ceased KR20200127170A (ko)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201862625149P 2018-02-01 2018-02-01
US62/625,149 2018-02-01
US201862672377P 2018-05-16 2018-05-16
US62/672,377 2018-05-16
PCT/US2019/016354 WO2019152843A1 (en) 2018-02-01 2019-02-01 Adeno-associated virus compositions for restoring pah gene function and methods of use thereof

Publications (1)

Publication Number Publication Date
KR20200127170A true KR20200127170A (ko) 2020-11-10

Family

ID=67478926

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020207024199A Ceased KR20200127170A (ko) 2018-02-01 2019-02-01 Pah 유전자 기능 복원을 위한 아데노-연관 바이러스 조성물 및 이의 사용 방법

Country Status (14)

Country Link
US (3) US20190256867A1 (ko)
EP (1) EP3746101A4 (ko)
JP (1) JP2021512871A (ko)
KR (1) KR20200127170A (ko)
CN (1) CN111902164A (ko)
AU (1) AU2019215152A1 (ko)
BR (1) BR112020015798A2 (ko)
CA (1) CA3090226A1 (ko)
CL (1) CL2020002008A1 (ko)
CO (1) CO2020010793A2 (ko)
IL (1) IL276368A (ko)
MX (1) MX2020008133A (ko)
PE (1) PE20212076A1 (ko)
WO (1) WO2019152843A1 (ko)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TW202140791A (zh) * 2020-01-13 2021-11-01 美商霍蒙拉奇醫藥公司 治療苯酮尿症之方法
WO2021207077A1 (en) * 2020-04-06 2021-10-14 Homology Medicines, Inc. Adeno-associated virus compositions for ids gene transfer and methods of use thereof
TW202208632A (zh) 2020-05-27 2022-03-01 美商同源醫藥公司 用於恢復pah基因功能的腺相關病毒組成物及其使用方法
CA3193866A1 (en) 2020-10-01 2022-04-07 Sirkka R.M. Kyostio-Moore Human pah expression cassette for treatment of pku by liver-directed gene replacement therapy

Family Cites Families (172)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
IL71505A0 (en) 1983-04-14 1984-07-31 Hughes Howard Med Inst Phenylalanine hydroxylase cdna clones,their production and their use in the diagnosis of classical phenylketonuria
IL74761A0 (en) 1984-04-13 1985-06-30 Hughes Howard Med Inst Human phenylalanine hydroxylase cdna clones,their production and their use in diagnosing classical phenylketonuria
US5436146A (en) 1989-09-07 1995-07-25 The Trustees Of Princeton University Helper-free stocks of recombinant adeno-associated virus vectors
WO1991018088A1 (en) 1990-05-23 1991-11-28 The United States Of America, Represented By The Secretary, United States Department Of Commerce Adeno-associated virus (aav)-based eucaryotic vectors
US5173414A (en) 1990-10-30 1992-12-22 Applied Immune Sciences, Inc. Production of recombinant adeno-associated virus vectors
US5252479A (en) 1991-11-08 1993-10-12 Research Corporation Technologies, Inc. Safe vector for gene therapy
DE4339922C1 (de) 1993-09-03 1994-10-06 Max Planck Gesellschaft Vektor für Leber-Gentherapie
US6268212B1 (en) 1993-10-18 2001-07-31 Amgen Inc. Tissue specific transgene expression
DE4407859C1 (de) 1994-03-04 1995-03-02 Max Planck Gesellschaft Vektor für die leberspezifische Gentherapie
DE69535703T2 (de) 1994-04-13 2009-02-19 The Rockefeller University AAV-vermittelte Zufuhr von DNA an Zellen des Nervensystems
AU3718595A (en) 1994-09-16 1996-03-29 Uab Research Foundation, The Transduction of genes into human hematopoietic stem cells using recombinant adeno-associated viral vectors
JPH10506530A (ja) 1994-09-23 1998-06-30 ザ ジェネラル ホスピタル コーポレーション 哺乳類細胞において外来遺伝子を発現する非哺乳類dnaウイルスの使用
US6924128B2 (en) 1994-12-06 2005-08-02 Targeted Genetics Corporation Packaging cell lines for generation of high titers of recombinant AAV vectors
US5650309A (en) 1995-05-16 1997-07-22 The Regents Of The University Of California Viral vectors
US7001764B2 (en) 1995-06-27 2006-02-21 Cell Genesys, Inc. Compositions comprising tissue specific adenoviral vectors
DE19525900C1 (de) 1995-07-15 1996-12-12 Max Planck Gesellschaft Leberspezifischer Adenovirus-Expressionsvektor
US5622856A (en) 1995-08-03 1997-04-22 Avigen High efficiency helper system for AAV vector production
US5780447A (en) 1996-06-14 1998-07-14 St. Jude Children's Research Hospital Recombinant adeno-associated viral vectors
US6521225B1 (en) 1996-09-06 2003-02-18 Chiron Corporation AAV vectors
WO1998011244A2 (en) 1996-09-11 1998-03-19 The Government Of The United States Of America, Represented By The Secretary, Department Of Health And Human Services Aav4 vector and uses thereof
AU4266597A (en) 1996-09-11 1998-04-14 General Hospital Corporation, The Use of a non-mammalian dna virus to express an exogenous gene in a mammalian cell
DE19644500C2 (de) 1996-10-25 1998-11-05 Deutsches Krebsforsch AAV-DNA mit Helfervirus-Sequenzen
FR2755699B1 (fr) 1996-11-08 1998-12-18 Rhone Poulenc Rorer Sa Nouvelles constructions et vecteurs pour l'expression ciblee et inductible des genes
FR2756297B1 (fr) 1996-11-22 1999-01-08 Centre Nat Rech Scient Procede de production de virus recombinants
AU5588298A (en) 1996-12-02 1998-06-29 Cell Genesys, Inc. Adeno-associated viral vector-mediated delivery of dna to cells of the liver
CA2269661A1 (en) 1996-12-18 1998-06-25 Targeted Genetics Corporation Recombinase-activatable aav packaging cassettes for use in the production of aav vectors
EP0946718A1 (en) 1996-12-23 1999-10-06 Gene-Cell Nucleic acid constructs and uses thereof for direct nucleic acid incorporation into cells
US6153436A (en) 1997-01-10 2000-11-28 The Board Of Trustees Of The University Of Arkansas Method of gene delivery using wildtype adeno associated viral (AAV) vectors with insertions
DE69840439D1 (de) 1997-04-24 2009-02-26 Univ Washington Zielgerichtete genveraenderung mit parvoviralen vektoren
US6156303A (en) 1997-06-11 2000-12-05 University Of Washington Adeno-associated virus (AAV) isolates and AAV vectors derived therefrom
GB9715064D0 (en) 1997-07-17 1997-09-24 Ppl Therapeutics Scotland Ltd Protein expression
WO1999018227A1 (en) 1997-10-08 1999-04-15 Advanced Research And Technology Institute Chimeric parvovirus-based recombinant vector system that specifically targets the erythroid lineage
US6346415B1 (en) 1997-10-21 2002-02-12 Targeted Genetics Corporation Transcriptionally-activated AAV inverted terminal repeats (ITRS) for use with recombinant AAV vectors
US6953690B1 (en) 1998-03-20 2005-10-11 The Trustees Of The University Of Pennsylvania Compositions and methods for helper-free production of recombinant adeno-associated viruses
US6984517B1 (en) 1998-05-28 2006-01-10 The United States Of America As Represented By The Department Of Health And Human Services AAV5 vector and uses thereof
WO1999064569A1 (en) 1998-06-10 1999-12-16 Advanced Research And Technology Institute Methods and compositions for generating recombinant adeno-associated virus vectors
US6759237B1 (en) 1998-11-05 2004-07-06 The Trustees Of The University Of Pennsylvania Adeno-associated virus serotype 1 nucleic acid sequences, vectors and host cells containing same
ES2340230T3 (es) 1998-11-10 2010-05-31 University Of North Carolina At Chapel Hill Vectores viricos y sus procedimientos de preparacion y administracion.
US6919209B1 (en) 1998-12-04 2005-07-19 City Of Hope Method of genetically modifying very primitive quiescent human hematopoietic stem cells
US6200758B1 (en) 1999-02-19 2001-03-13 New York State Office Of Mental Health Phenylalanine hydroxylase gene variants, and amino acid and pterin homeostasis, in the definition, detection, treatment and prevention of psychotic, mood and personality disorders
JP4693244B2 (ja) 1999-03-18 2011-06-01 ザ・トラステイーズ・オブ・ザ・ユニバーシテイ・オブ・ペンシルベニア 組換えアデノ随伴ウイルスのヘルパー無しの生産のための組成物および方法
US6610906B1 (en) 1999-06-09 2003-08-26 The Regents Of The University Of Michigan Nucleotide sequences for gene regulation and methods of use thereof
DE60034478T2 (de) 1999-11-16 2008-01-10 Genzyme Corp., Cambridge Vektoren und transgene mit regulatorischen elementen zur genverabreichung in leber
AU5557501A (en) 2000-04-28 2001-11-12 Univ Pennsylvania Recombinant aav vectors with aav5 capsids and aav5 vectors pseudotyped in heterologous capsids
EP1290205B1 (en) 2000-06-01 2006-03-01 University Of North Carolina At Chapel Hill Duplexed parvovirus vectors
US7351813B2 (en) 2000-06-20 2008-04-01 The Board Of Trustees Of The Leland Stanford Junior University Liver-specific gene expression cassettes, and methods of use
US6329181B1 (en) 2000-08-07 2001-12-11 Neurologix, Inc. Helper functions for recombinant vector production
US7749492B2 (en) 2001-01-05 2010-07-06 Nationwide Children's Hospital, Inc. AAV vectors and methods
AU2002306539A1 (en) 2001-02-16 2002-09-04 The Board Of Trustees Of The Leland Stanford Junior University Minimal plasmid vectors that provide for persistent and high level gene expression and methods for using the same
DE10120265A1 (de) 2001-04-25 2002-11-14 Deutsches Krebsforsch AAV-Helferplasmide zur Helfervirus-freien Verpackung und Pseudotypisierung von AAV-Vektoren
US6808905B2 (en) 2001-05-14 2004-10-26 Cell Genesys, Inc. Lentiviral vectors encoding clotting factors for gene therapy
EP1402023A4 (en) 2001-05-31 2005-06-15 Univ Rockefeller PROCESS FOR GENERATING REPLICATION-DEFICIENT VIRUS VECTORS THAT ARE HELPFUL-FREE
US8241622B2 (en) 2001-07-13 2012-08-14 University Of Iowa Research Foundation Adeno-associated virus vectors with intravector heterologous terminal palindromic sequences
US20030129203A1 (en) 2001-08-27 2003-07-10 Nautilus Biotech S.A. Mutant recombinant adeno-associated viruses
EP1442125A4 (en) 2001-10-04 2004-12-08 Carlos Estuard Aguilar-Cordova CHIMERAL VIRUS VECTORS FOR GENE THERAPY
CA2361462A1 (en) 2001-11-07 2003-05-08 Katherine A. High Induction of tolerance to a therapeutic polypeptide
BR122016004944B8 (pt) 2001-11-13 2021-07-27 Univ Pennsylvania vírus adenoassociado recombinante, célula hospedeira procariótica, composição e método de geração do referido vírus
EP1453547B1 (en) * 2001-12-17 2016-09-21 The Trustees Of The University Of Pennsylvania Adeno-associated virus (aav) serotype 8 sequences, vectors containing same, and uses therefor
PT2573170T (pt) 2001-12-17 2018-03-26 Univ Pennsylvania Sequências de um vírus adenoassociado (aav) de serotipo 9, vetor contendo as mesmas, e suas utilizações
CA2369985A1 (en) 2002-01-18 2003-07-18 Duke University Generation of recombinant adeno-associated viral vectors by a complete adenovirus-mediated approach
US20030198620A1 (en) 2002-04-16 2003-10-23 Keiya Ozawa Method of treating amino acid metabolic disorders using recombinant adeno-associated virus virions
WO2003093460A1 (en) 2002-04-29 2003-11-13 The Trustees Of The University Of Pennsylvania Method for direct rescue and amplification of integrated viruses from cellular dna of tissues
WO2003093436A2 (en) 2002-04-30 2003-11-13 University Of Florida Treatment for phenylketonuria
WO2003104413A2 (en) 2002-06-05 2003-12-18 University Of Florida Production of pseudotyped recombinant aav virions
US7220577B2 (en) 2002-08-28 2007-05-22 University Of Florida Research Foundation, Inc. Modified AAV
US20070202587A1 (en) 2002-09-23 2007-08-30 Applied Genetic Technologies Corporation Recombinant AAV production in mammalian cells
US7091029B2 (en) 2002-09-23 2006-08-15 Applied Genetics Technologies Corporation High titer recombinant AAV production
SI2657247T1 (sl) 2003-06-19 2017-07-31 Genzyme Corporation AAV virioni z zmanjšano imunoreaktivnostjo in njihova uporaba
US9441244B2 (en) 2003-06-30 2016-09-13 The Regents Of The University Of California Mutant adeno-associated virus virions and methods of use thereof
EP3211085B1 (en) 2003-09-30 2021-03-31 The Trustees of The University of Pennsylvania Adeno-associated virus (aav) clades, sequences, vectors containing same, and uses therefor
US7482156B2 (en) 2003-10-15 2009-01-27 Cell Genesys, Inc. Hepatocellular carcinoma specific promoter and uses thereof
JP2007531537A (ja) 2004-04-06 2007-11-08 セダーズ−シナイ メディカル センター アポリポタンパク質a−iおよびアポリポタンパク質a−imilanoをコードする組換えアデノ随伴ウイルスベクターによる血管疾患の予防および処置
US8716461B2 (en) 2004-05-24 2014-05-06 Blood Systems, Inc. Human parvovirus
ATE549037T1 (de) 2004-09-22 2012-03-15 St Jude Childrens Res Hospital Verbesserte expression von faktor-ix in gentherapie-vektoren
TWI293307B (en) 2004-09-30 2008-02-11 Ind Tech Res Inst A liver-specific chimeric regulatory sequence and use thereof
WO2006096815A2 (en) 2005-03-09 2006-09-14 Board Of Regents, The University Of Texas System NOVEL hTMC PROMOTER AND VECTORS FOR THE TUMOR-SELECTIVE AND HIGH-EFFICIENT EXPRESSION OF CANCER THERAPEUTIC GENES
DK2383346T3 (en) 2005-04-07 2015-01-05 Univ Pennsylvania Modified AAVrh.64 capsids, compositions containing them and their uses
WO2006119432A2 (en) 2005-04-29 2006-11-09 The Government Of The U.S.A., As Rep. By The Sec., Dept. Of Health & Human Services Isolation, cloning and characterization of new adeno-associated virus (aav) serotypes
WO2007019646A1 (en) 2005-08-19 2007-02-22 University Of Technology, Sydney Liver-directed gene therapy
EP2311967B1 (en) 2005-10-20 2017-09-20 UniQure IP B.V. Improved AAV vectors produced in insect cells
WO2007084773A2 (en) 2006-01-20 2007-07-26 University Of North Carolina At Chapel Hill Enhanced production of infectious parvovirus vectors in insect cells
EP1979485A2 (en) 2006-01-31 2008-10-15 The Board Of Trustees Of The Leland Stanford Junior University Self-complementary parvoviral vectors, and methods for making and using the same
EP2007795B1 (en) 2006-03-30 2016-11-16 The Board Of Trustees Of The Leland Stanford Junior University Aav capsid proteins
US8298818B2 (en) 2006-04-28 2012-10-30 University Of Florida Research Foundation, Inc. Self-complementary adeno-associated virus having a truncated CMV-chicken β-actin promoter
US9725485B2 (en) 2012-05-15 2017-08-08 University Of Florida Research Foundation, Inc. AAV vectors with high transduction efficiency and uses thereof for gene therapy
HUE030719T2 (en) 2007-04-09 2017-05-29 Univ Florida RAAV vector formulations and methods comprising tyrosine-modified capsid proteins for their use
US10696983B2 (en) 2007-05-30 2020-06-30 The Trustees Of The University Of Pennsylvania Method for transducing cells with primary cilia
EP2008656A1 (en) 2007-06-28 2008-12-31 Bergen Teknologioverforing AS Compositions for the treatment of hyperphenylalaninemia
EP2058401A1 (en) 2007-10-05 2009-05-13 Genethon Widespread gene delivery to motor neurons using peripheral injection of AAV vectors
WO2009108274A2 (en) 2008-02-26 2009-09-03 The University Of North Carolina At Chapel Hill Methods and compositions for adeno-associated virus (aav) with hi loop mutations
EP2282764B2 (en) 2008-04-22 2024-06-12 Vib Vzw Liver-specific nucleic acid regulatory elements and methods and use thereof
WO2009134681A2 (en) 2008-04-30 2009-11-05 The Trustees Of The University Of Pennsylvania Aav7 viral vectors for targeted delivery of rpe cells
WO2009137006A2 (en) 2008-04-30 2009-11-12 The University Of North Carolina At Chapel Hill Directed evolution and in vivo panning of virus vectors
AU2009274482A1 (en) 2008-05-20 2010-01-28 Eos Neuroscience, Inc. Vectors for delivery of light-sensitive proteins and methods of use
US9217155B2 (en) 2008-05-28 2015-12-22 University Of Massachusetts Isolation of novel AAV'S and uses thereof
US20100316623A1 (en) 2009-04-23 2010-12-16 Andrew Turner Phenylalanine hydroxylase fusion protein and methods for treating phenylketonuria
ES2724122T3 (es) 2009-04-30 2019-09-06 Univ Pennsylvania Composiciones para dirigir células de las vías respiratorias de conducción que comprenden construcciones de virus adenoasociado
MX356669B (es) 2009-05-02 2018-06-08 Genzyme Corp Terapia genica para trastornos neurodegenerativos.
EP2772542B1 (en) 2009-05-28 2016-12-28 Deutsches Krebsforschungszentrum Modified AAV capsid polypeptides
PL3067417T3 (pl) 2009-06-16 2019-02-28 Genzyme Corporation Udoskonalone sposoby oczyszczania rekombinowanych wektorów AAV
GB0911870D0 (en) 2009-07-08 2009-08-19 Ucl Business Plc Optimised coding sequence and promoter
EP2287323A1 (en) 2009-07-31 2011-02-23 Association Institut de Myologie Widespread gene delivery to the retina using systemic administration of AAV vectors
WO2011038187A1 (en) 2009-09-25 2011-03-31 The Trustees Of The University Of Pennsylvania Controlled adeno-associated virus (aav) diversification and libraries prepared therefrom
WO2011041502A1 (en) 2009-10-01 2011-04-07 The Trustees Of The University Of Pennsylvania Aav vectors expressing sec1o for treating kidney damage
ES2683695T3 (es) 2010-01-12 2018-09-27 The University Of North Carolina At Chapel Hill Repeticiones terminales invertidas restrictivas para vectores virales
JP2013517798A (ja) 2010-01-28 2013-05-20 ザ チルドレンズ ホスピタル オブ フィラデルフィア ウイルスベクター精製における拡張可能な製造プラットフォームおよび遺伝子治療における使用のための高純度ウイルスベクター
WO2011117258A2 (en) 2010-03-22 2011-09-29 Association Institut De Myologie Methods of increasing efficiency of vector penetration of target tissue
US20130023033A1 (en) 2010-03-29 2013-01-24 The Trustees Of The University Of Pennsylvania Pharmacologically induced transgene ablation system
CA2833905C (en) 2010-04-23 2019-09-10 University Of Massachusetts Multicistronic expression constructs
US8628966B2 (en) * 2010-04-30 2014-01-14 City Of Hope CD34-derived recombinant adeno-associated vectors for stem cell transduction and systemic therapeutic gene transfer
US8927514B2 (en) 2010-04-30 2015-01-06 City Of Hope Recombinant adeno-associated vectors for targeted treatment
EP2394667A1 (en) 2010-06-10 2011-12-14 Laboratorios Del Dr. Esteve, S.A. Vectors and sequences for the treatment of diseases
US20120014932A1 (en) 2010-07-14 2012-01-19 Golden William J Methods for treating disorders of amino acid metabolism
US9409953B2 (en) 2011-02-10 2016-08-09 The University Of North Carolina At Chapel Hill Viral vectors with modified transduction profiles and methods of making and using the same
CA2827375C (en) 2011-02-14 2022-07-19 The Children's Hospital Of Philadelphia Improved aav8 vector with enhanced functional activity and methods of use thereof
ES2724800T3 (es) 2011-02-17 2019-09-16 Univ Pennsylvania Composiciones y métodos para alterar la especificidad de tejido y mejorar la transferencia génica mediada por AAV9
GB201103062D0 (en) 2011-02-22 2011-04-06 Isis Innovation Method
AU2012225749B2 (en) 2011-03-04 2015-01-22 Intrexon Corporation Vectors conditionally expressing protein
HUE049629T2 (hu) 2011-04-22 2020-09-28 Univ California Adeno-asszociált vírus virionok kapszid variánssal és eljárások alkalmazásukra
ES2857773T5 (es) 2011-08-24 2024-06-04 Univ Leland Stanford Junior Nuevas proteínas de la cápside de AAV para la transferencia de ácidos nucleicos
JP6188703B2 (ja) 2011-10-27 2017-08-30 サンガモ セラピューティクス, インコーポレイテッド Hprt遺伝子座を修飾するための方法および組成物
WO2013078400A1 (en) 2011-11-22 2013-05-30 The Children's Hospital Of Philadelphia Virus vectors for highly efficient transgene delivery
US20140359799A1 (en) 2011-12-23 2014-12-04 Case Western Reserve University Targeted gene modification using hybrid recombinant adeno-associated virus
MX367100B (es) 2012-02-17 2019-08-05 The Children´S Hospital Of Philadelphia Composiciones del vector aav y metodos para su transferencia genetica a celulas, organos y tejidos.
ES2862912T3 (es) 2012-04-18 2021-10-08 Childrens Hospital Philadelphia Composición y procedimientos para la transferencia genética de alta eficiencia utilizando variantes de cápside de VAA
EP2839013B1 (en) 2012-04-18 2020-08-26 The Board of Trustees of the Leland Stanford Junior University Non-disruptive gene targeting
US20150232836A1 (en) * 2012-05-16 2015-08-20 Rana Therapeutics, Inc. Compositions and methods for modulating gene expression
CA2878401C (en) 2012-07-06 2022-07-19 University Of Iowa Research Foundation Modified adeno-associated virus vector compositions
CA2880653C (en) 2012-08-01 2022-05-17 Nationwide Children's Hospital Intrathecal delivery of recombinant adeno-associated virus 9
US9636370B2 (en) 2012-09-28 2017-05-02 The University Of North Carolina At Chapel Hill AAV vectors targeted to oligodendrocytes
CA2888931C (en) 2012-10-26 2023-09-05 Vrije Universiteit Brussel Vector for liver-directed gene therapy of hemophilia and methods and use thereof
EP2929017A4 (en) 2012-12-05 2016-09-28 Sangamo Biosciences Inc METHOD AND COMPOSITIONS FOR REGULATING METABOLISM DISEASES
US9938541B2 (en) 2012-12-25 2018-04-10 Takara Bio Inc. AAV variant
US20150352228A1 (en) 2013-01-11 2015-12-10 Bruce TORBET Methods and compositions for enhancing transduction efficiency of retroviral vectors
US9567376B2 (en) 2013-02-08 2017-02-14 The Trustees Of The University Of Pennsylvania Enhanced AAV-mediated gene transfer for retinal therapies
EP2970946A4 (en) 2013-03-13 2016-09-07 Philadelphia Children Hospital ADENOASSOZED VIRUS VECTORS AND METHOD FOR USE THEREOF
US20140271550A1 (en) 2013-03-14 2014-09-18 The Trustees Of The University Of Pennsylvania Constructs and Methods for Delivering Molecules via Viral Vectors with Blunted Innate Immune Responses
HUE051373T2 (hu) 2013-03-15 2021-03-01 Univ Pennsylvania Készítmények MPSI kezelésére
US11427835B2 (en) 2013-03-15 2022-08-30 The Children's Hospital Of Philadelphia Vectors comprising stuffer/filler polynucleotide sequences and methods of use
SG10201709552XA (en) 2013-05-21 2018-01-30 Univ Florida Capsid-modified, raav3 vector compositions and uses in gene therapy of human liver cancer
ES2897508T3 (es) 2013-05-31 2022-03-01 Univ California Variantes de virus adenoasociados y métodos de uso de las mismas
US11408899B2 (en) 2013-07-12 2022-08-09 The Children's Hospital Of Philadelphia AAV vector and assay for anti-AAV (adeno-associated virus) neutralizing antibodies
SG11201600518WA (en) 2013-07-22 2016-02-26 Philadelphia Children Hospital Variant aav and compositions, methods and uses for gene transfer to cells, organs and tissues
ES2739288T3 (es) 2013-09-13 2020-01-30 California Inst Of Techn Recuperación selectiva
CN116836957A (zh) 2013-10-17 2023-10-03 桑格摩生物科学股份有限公司 用于核酸酶介导的基因组工程改造的递送方法和组合物
US9522176B2 (en) 2013-10-22 2016-12-20 Shire Human Genetic Therapies, Inc. MRNA therapy for phenylketonuria
BR112016019940A2 (pt) * 2014-03-21 2017-10-24 Univ Leland Stanford Junior edição de genoma sem nucleases
JP6983511B2 (ja) 2014-04-25 2021-12-17 ザ・トラステイーズ・オブ・ザ・ユニバーシテイ・オブ・ペンシルベニア 脳中の転移乳癌および他の癌を処置するための方法および組成物
DK3152312T3 (da) * 2014-06-06 2020-04-06 Regeneron Pharma Fremgangsmåder og sammensætninger til modifikation af et mållocus
CN107295802B (zh) 2014-09-24 2021-06-29 希望之城 用于高效基因组编辑的腺相关病毒载体变异体和其方法
EP3233131A1 (en) 2014-12-16 2017-10-25 Board of Regents of the University of Nebraska Gene therapy for juvenile batten disease
ES2784264T3 (es) 2014-12-17 2020-09-23 Fundacion Para La Investig Medica Aplicada Construcciones de ácido nucleico y vectores de terapia génica para su uso en el tratamiento de la enfermedad de Wilson y otras afecciones
SG11201704690TA (en) 2014-12-17 2017-07-28 Fundación Para La Investigación Mèdica Aplicada Nucleic acid constructs and gene therapy vectors for use in the treatment of wilson disease
JP6800863B2 (ja) 2015-02-06 2020-12-16 ザ・ユニヴァーシティ・オヴ・ノース・キャロライナ・アト・チャペル・ヒル 最適化されたヒト凝固第viii因子遺伝子発現カセットおよびその使用
US11007280B2 (en) 2015-03-17 2021-05-18 Vrije Universiteit Brussel Optimized liver-specific expression systems for FVIII and FIX
EP3283126B1 (en) 2015-04-16 2019-11-06 Emory University Recombinant promoters and vectors for protein expression in liver and use thereof
WO2016172008A1 (en) 2015-04-24 2016-10-27 University Of Massachusetts Modified aav constructions and uses thereof
US10792339B2 (en) 2015-07-17 2020-10-06 Children's National Medical Center Methods and compositions for treating phenylketonuria
PH12018500927B1 (en) 2015-10-28 2024-07-03 Sangamo Therapeutics Inc Liver-specific constructs, factor viii expression cassettes and methods of use thereof
WO2017100551A1 (en) 2015-12-09 2017-06-15 Alexion Pharmaceuticals, Inc. HETEROLOGOUS UTR SEQUENCES FOR ENHANCED mRNA EXPRESSION
US11241506B2 (en) * 2015-12-14 2022-02-08 The Trustees Of The University Of Pennsylvania Composition for treatment of Crigler-Najjar syndrome
IL300254B1 (en) 2016-02-05 2025-02-01 Univ Emory Administration of single-stranded or self-complementary adeno-associated virus 9 by injection into the cerebrospinal fluid for gene therapy in the central nervous system
GB201603577D0 (en) * 2016-03-01 2016-04-13 Oxford Genetics Ltd Promoter
EP3509628A1 (en) 2016-09-09 2019-07-17 Fondazione Telethon Combined therapy for mucopolysaccharidosis type vi (maroteaux-lamy-syndrome)
CA3048038A1 (en) * 2016-12-30 2018-07-05 The Trustees Of The University Of Pennsylvania Gene therapy for treating phenylketonuria
KR20230160411A (ko) 2016-12-30 2023-11-23 더 트러스티스 오브 더 유니버시티 오브 펜실베니아 윌슨병을 치료하기 위한 유전자 치료
AU2018207259B2 (en) 2017-01-10 2023-11-09 Children's Medical Research Institute Polynucleotides and vectors for the expression of transgenes
US20200056190A1 (en) 2017-03-16 2020-02-20 Pfizer Inc. Tyrosine prototrophy
WO2018187231A2 (en) 2017-04-03 2018-10-11 American Gene Technologies International Inc. Compositions and methods for treating phenylketonuria
WO2018206168A1 (en) 2017-05-11 2018-11-15 Zentrum Für Forschungsförderung In Der Pädiatrie Gmbh Concept for the treatment of monogenetic disorders
EP3630200A4 (en) 2017-05-31 2021-02-24 Arcturus Therapeutics, Inc. THERAPEUTICS FOR PHENYLKETONURIA
EP3714047A2 (en) * 2017-11-22 2020-09-30 ModernaTX, Inc. Polynucleotides encoding phenylalanine hydroxylase for the treatment of phenylketonuria

Also Published As

Publication number Publication date
EP3746101A1 (en) 2020-12-09
US20190256867A1 (en) 2019-08-22
CO2020010793A2 (es) 2020-11-20
JP2021512871A (ja) 2021-05-20
CN111902164A (zh) 2020-11-06
CA3090226A1 (en) 2019-08-08
MX2020008133A (es) 2020-10-14
CL2020002008A1 (es) 2021-02-12
US12203094B2 (en) 2025-01-21
AU2019215152A1 (en) 2020-08-20
EP3746101A4 (en) 2022-03-23
US20220325302A1 (en) 2022-10-13
BR112020015798A2 (pt) 2021-03-09
US20210130794A1 (en) 2021-05-06
PE20212076A1 (es) 2021-10-26
IL276368A (en) 2020-09-30
WO2019152843A1 (en) 2019-08-08

Similar Documents

Publication Publication Date Title
AU2023274083A1 (en) Compositions and methods for treating non-age-associated hearing impairment in a human subject
KR20230053735A (ko) 게놈의 조정을 위한 개선된 방법 및 조성물
CA2566256C (en) Genetic polymorphisms associated with liver fibrosis methods of detection and uses thereof
KR20190137126A (ko) 조직 선택적 트랜스진 발현
KR20210008491A (ko) 청소년 대상체에서 aav 벡터의 안정한 발현
AU2019377115A1 (en) Use of adeno-associated viral vectors to correct gene defects/ express proteins in hair cells and supporting cells in the inner ear
KR20200126997A (ko) 인간 대상체에서의 비-노화-관련 청각 손상의 치료를 위한 조성물 및 방법
KR20220038362A (ko) 재조합 ad35 벡터 및 관련 유전자 요법 개선
KR20200127170A (ko) Pah 유전자 기능 복원을 위한 아데노-연관 바이러스 조성물 및 이의 사용 방법
AU2018352855B2 (en) Adeno-associated virus compositions for restoring HBB gene function and methods of use thereof
KR20230029650A (ko) Pah 유전자 기능을 복구하기 위한 아데노-연관 바이러스 조성물 및 이의 사용 방법
JP2024099770A (ja) トランススプライシング分子
KR20220157944A (ko) 인간 대상체에서 비-연령-연관 청각 장애를 치료하기 위한 조성물 및 방법
CN112639108A (zh) 治疗非综合征性感觉神经性听力损失的方法
KR20210049833A (ko) Mma의 치료를 위한 비-붕괴적 유전자 요법
KR20220097414A (ko) X-연관 연소 망막층간분리 치료법을 위한 crispr 및 aav 전략
CN115175559A (zh) 包含人源化pnpla3基因座的非人动物及其使用方法
US11891619B2 (en) Adeno-associated virus compositions for restoring F8 gene function and methods of use thereof
KR20230173074A (ko) 향상된 이종이식편 생존 및 관용을 위한 하나 이상의 변형된 유전자를 갖는 세포, 조직, 기관, 및 동물
KR20230041965A (ko) Slc26a4-연관 청력손실을 치료하기 위한 조성물 및 방법
RU2792432C2 (ru) Стабильная экспрессия векторов на основе аденоассоциированного вируса у несовершеннолетних пациентов
EA046478B1 (ru) Быстрая и детерминистическая генерация микроглии из плюрипотентных стволовых клеток человека

Legal Events

Date Code Title Description
PA0105 International application

Patent event date: 20200821

Patent event code: PA01051R01D

Comment text: International Patent Application

PG1501 Laying open of application
PA0201 Request for examination

Patent event code: PA02012R01D

Patent event date: 20220128

Comment text: Request for Examination of Application

E902 Notification of reason for refusal
PE0902 Notice of grounds for rejection

Comment text: Notification of reason for refusal

Patent event date: 20240919

Patent event code: PE09021S01D

E601 Decision to refuse application
PE0601 Decision on rejection of patent

Patent event date: 20241204

Comment text: Decision to Refuse Application

Patent event code: PE06012S01D