[go: up one dir, main page]

CN113316639A - 用于治疗庞贝氏病的治疗性腺相关病毒 - Google Patents

用于治疗庞贝氏病的治疗性腺相关病毒 Download PDF

Info

Publication number
CN113316639A
CN113316639A CN201980089335.6A CN201980089335A CN113316639A CN 113316639 A CN113316639 A CN 113316639A CN 201980089335 A CN201980089335 A CN 201980089335A CN 113316639 A CN113316639 A CN 113316639A
Authority
CN
China
Prior art keywords
seq
nucleic acid
gaa
sequence
polypeptide
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201980089335.6A
Other languages
English (en)
Inventor
迈克尔·W·奥卡拉汉
阿基尔·弗朗索瓦斯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Asklepios Biopharmaceutical Inc
Original Assignee
Asklepios Biopharmaceutical Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Asklepios Biopharmaceutical Inc filed Critical Asklepios Biopharmaceutical Inc
Publication of CN113316639A publication Critical patent/CN113316639A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/86Viral vectors
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • A61K48/005Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'active' part of the composition delivered, i.e. the nucleic acid delivered
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • A61K48/005Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'active' part of the composition delivered, i.e. the nucleic acid delivered
    • A61K48/0058Nucleic acids adapted for tissue specific expression, e.g. having tissue specific promoters as part of a contruct
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P3/00Drugs for disorders of the metabolism
    • A61P3/08Drugs for disorders of the metabolism for glucose homeostasis
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/575Hormones
    • C07K14/65Insulin-like growth factors, i.e. somatomedins, e.g. IGF-1, IGF-2
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/24Hydrolases (3) acting on glycosyl compounds (3.2)
    • C12N9/2402Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing O- and S- glycosyl compounds (3.2.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y302/00Hydrolases acting on glycosyl compounds, i.e. glycosylases (3.2)
    • C12Y302/01Glycosidases, i.e. enzymes hydrolysing O- and S-glycosyl compounds (3.2.1)
    • C12Y302/0102Alpha-glucosidase (3.2.1.20)
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2217/00Genetically modified animals
    • A01K2217/07Animals genetically altered by homologous recombination
    • A01K2217/075Animals genetically altered by homologous recombination inducing loss of function, i.e. knock out
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2227/00Animals characterised by species
    • A01K2227/10Mammal
    • A01K2227/105Murine
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2267/00Animals characterised by purpose
    • A01K2267/03Animal model, e.g. for test or diseases
    • A01K2267/0306Animal model for genetic diseases
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2267/00Animals characterised by purpose
    • A01K2267/03Animal model, e.g. for test or diseases
    • A01K2267/035Animal model for multifactorial diseases
    • A01K2267/0362Animal model for lipid/glucose metabolism, e.g. obesity, type-2 diabetes
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/01Fusion polypeptide containing a localisation/targetting motif
    • C07K2319/02Fusion polypeptide containing a localisation/targetting motif containing a signal sequence
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2740/00Reverse transcribing RNA viruses
    • C12N2740/00011Details
    • C12N2740/10011Retroviridae
    • C12N2740/10041Use of virus, viral particle or viral elements as a vector
    • C12N2740/10043Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14111Dependovirus, e.g. adenoassociated viruses
    • C12N2750/14141Use of virus, viral particle or viral elements as a vector
    • C12N2750/14143Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14111Dependovirus, e.g. adenoassociated viruses
    • C12N2750/14171Demonstrated in vivo effect
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2830/00Vector systems having a special element relevant for transcription
    • C12N2830/001Vector systems having a special element relevant for transcription controllable enhancer/promoter combination
    • C12N2830/002Vector systems having a special element relevant for transcription controllable enhancer/promoter combination inducible enhancer/promoter combination, e.g. hypoxia, iron, transcription factor
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2830/00Vector systems having a special element relevant for transcription
    • C12N2830/008Vector systems having a special element relevant for transcription cell type or tissue specific enhancer/promoter combination

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Organic Chemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • Zoology (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Wood Science & Technology (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Medicinal Chemistry (AREA)
  • Animal Behavior & Ethology (AREA)
  • Veterinary Medicine (AREA)
  • Public Health (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Diabetes (AREA)
  • Microbiology (AREA)
  • Epidemiology (AREA)
  • Biophysics (AREA)
  • Endocrinology (AREA)
  • Plant Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Virology (AREA)
  • General Chemical & Material Sciences (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Obesity (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Hematology (AREA)
  • Emergency Medicine (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Toxicology (AREA)
  • Medicines Containing Material From Animals Or Micro-Organisms (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

包含rAVV基因组的重组AAV(rAAV)载体,所述rAVV基因组含有异源核酸,所述异源核酸编码融合至酸性α‑葡萄糖苷酶(GAA)多肽的任选的IGF‑2序列和信号肽,使GAA多肽能够从肝脏中分泌并靶向至溶酶体。具体的实施方式涉及编码α‑葡萄糖苷酶(GAA)多肽的重组AAV(rAAV)载体,所述载体具有肝分泌信号肽和结合人非阳离子依赖性甘露糖‑6‑磷酸受体(CI‑MPR)或IGF2受体的靶向IGF2序列,使GAA多肽能够恰当地亚细胞定位至溶酶体。还涵盖了用rAAV载体治疗糖原贮积症II型(GSD II)疾病和/或庞贝氏病的细胞和方法。

Description

用于治疗庞贝氏病的治疗性腺相关病毒
相关申请的交叉引用
根据35U.S.C.§119(e),本发明要求2018年11月16日提交的美国临时申请62/768,449和2018年11月20日提交的美国临时申请62/769,702 的权益,以引用的方式将其各自内容以其整体并入本文。
序列表
本申请包含序列表,所述序列表已以ASCII格式电子提交并且以引用的方式将其整体并入本文。所述ASCII副本创建于2019年11月15日,命名为046192-093900WOPT_SL.txt,并且大小为189,408字节。
技术领域
本发明涉及用于α-葡萄糖苷酶(GAA)多肽靶向易位的腺相关病毒 (AAV)颗粒、病毒体和载体,以及用于治疗庞贝氏病的方法。
背景技术
酸性α-葡萄糖苷酶(GAA)是一种溶酶体酶,所述溶酶体酶水解麦芽糖和其它线性低聚糖(包括糖原的外部分支)中的α-1,4连接,从而分解溶酶体中的过量糖原(Hirschhorn等,(2001)The Metabolic and Molecular Basis of Inherited Disease,Scriver等编著,(2001),McGraw-Hill: New York,第3389-3420页)。像其它哺乳动物的溶酶体酶一样,GAA在细胞质中合成,并穿过ER,在ER中被N-连接的高甘露糖型碳水化合物糖基化。在高尔基体中,高甘露糖碳水化合物通过添加将溶酶体蛋白靶向至溶酶体的甘露糖-6-磷酸(M6P)而被修饰在这些蛋白上。经M6P修饰的蛋白通过与两个M6P受体中的任意一个的相互作用而被递送至溶酶体。最有利的修饰形式是将两个M6P添加至高甘露糖碳水化合物。
溶酶体中GAA活性不足引发庞贝氏病,该病也被称为酸性麦芽糖酶缺乏症(AMD)、糖原贮积症II型(GSDII)、II型糖原症或GAA缺乏症。由于编码GAA的基因中的多种错义和无义突变,出现酶活性降低。因此,糖原在患有庞贝氏病的患者的所有细胞的溶酶体中累积。特别是,糖原累积在心肌和骨骼肌、肝和其它组织的溶酶体中最为明显。累积的糖原最终损害肌肉功能。在最严重的庞贝氏病形式中,由于心肺的衰竭而在两岁之前出现死亡。
因此存在对庞贝氏病的有效治疗的需求。庞贝氏病的酶替代疗法需要重组GAA蛋白,所述重组GAA蛋白将被给予并被受试者中的肌肉和肝细胞摄取,它随后在该处以M6P依赖的方式转运至那些细胞中的溶酶体。即,具有暴露的M6P的重组GAA蛋白结合至反式高尔基体中的M6P 受体,并被转运至核内体,之后被转运至溶酶体。然而,用于酶替代疗法的重组GAA蛋白的两个主要来源(在经工程化的CHO细胞中或转基因兔的奶中产生的重组GAA)含有极少的将该蛋白靶向至溶酶体所需的 M6P(Van Hove等,(1996)Proc Natl Acad SciUSA,93(1):65-70;以及U.S. Pat.No.6,537,785)。因此,重组GAA蛋白向溶酶体的M6P依赖的递送的效率不高,并且需要高剂量和频繁输注两者。
因此,尽管酶疗法已证明对严重的婴幼儿GSD II的合理的功效,但 GAA酶疗法的益处因需要频繁输注以及受试者产生针对重组hGAA蛋白的抑制物或中和抗体而受到限制(Amalfitano,A.等,(2001)Genet.In Med. 3:132-138)。
基因疗法不仅具有治愈遗传紊乱的潜力,而且还有助于使用病毒对获得性和退化性疾病进行长期的非侵入性治疗。一种基因治疗载体是腺相关病毒(AAV)。AAV本身是需要用于有效复制的辅助病毒的非致病性依赖性细小病毒。由于其安全性和简便性,AAV已被用作基因治疗的病毒载体。AAV具有广泛的宿主和细胞类型向性(tropism),能够转导分裂细胞和非分裂细胞。迄今为止,已鉴定出12种AAV血清型和超过 100种变体。已经显示出,不同AAV血清型在体内或体外可具有感染不同组织的细胞的不同能力,并且这些感染力的差异可能与位于每种AAV 血清型的细胞表面的特定受体和共受体(co-receptor)有关,或可能与细胞内运输途径本身有关。
因此,作为酶疗法的替代或补充,治疗GSD-II的基因疗法的可行性已经被研究(Amalfitano,A.等,(1999)Proc.Natl.Acad.Sci.USA 96:8861-8866;Ding,E.等,(2002)Mol.Ther.5:436-446;Fraites,T.J.等, (2002)Mol.Ther.5:571-578;Tsujino,S.等,(1998)Hum.Gene Ther. 9:1609-1616)。
然而,就报告经历糖血症(glycaemia)的患者而言,GAA多肽的 AAV递送对于在肝中实现充分表达和/或递送至溶酶体的方面具有一些挑战。据报道,在GAA-KO小鼠模型中使用编码靶向至小鼠的肝的hGAA 的腺病毒(Ad)载体的体内研究中,通过来自肝的hGAA的分泌以及其它组织中的摄取,在12天内逆转了骨骼肌和心肌中糖原的积累 (Amalfitano,A.等,(1999)Proc.Natl.Acad.Sci.USA 96:8861-8866)。编码GAA的腺相关病毒2(AAV2)载体的引入使经注射的骨骼肌和经注射的心肌中的GAA活性正常化,并且当伴随着改善的肌肉转导给予 AAV1假型载体时,肌肉中的糖原含量正常化(Fraites,T.J.等,(2002)Mol.Ther.5:571-578)。在日本鹌鹑模型中尝试了靶向肌肉的Ad载体基因疗法,尽管仅实现了载体注射部位处的糖原累积的局部逆转(Tsujino,S.等, (1998)Hum.Gene Ther.9:1609-1616)。
然而,在人类受试者中,由于细胞中的非特异更新,编码GAA多肽的rAAV载体的给予已导致许多患者经历低血糖症或变得高血糖(参见例如Byrne等,A study on thesafety and efficacy of Reveglucosidease alfa in patients with late-onsetPompe disease;Orphanet J.of Rare diseases;2017; 12:144)。
因此,本领域存在对在体外和体内产生溶酶体多肽(如GAA)的改进方法的需求,例如用以治疗溶酶体多肽缺陷。此外,存在对改善的来自肝的分泌以及改善的GAA对溶酶体的靶向的需求,以帮助减轻来自 GAA多肽过表达的任何副作用,并降低低血糖症的风险。此外,存在对引起GAA和其它溶酶体多肽全身性递送至受影响的组织和器官的方法的需求。特别地,仍然存在对如下的需求:用于向受试者给予GAA蛋白并将GAA蛋白靶向至患者的溶酶体,同时减少任何潜在副作用的更有效方法。
发明内容
本文所述的技术大体上涉及用于治疗庞贝氏病的基因治疗构建体、方法和组合物。更具体地,该技术涉及被配置用于将GAA多肽递送至受试者的腺相关(AAV)病毒体。因此,本文描述的是包含核苷酸序列的rAAV载体,所述核苷酸序列含有反向末端重复序列(ITR)、启动子、异源基因、poly-A尾和可能用于治疗庞贝氏症的其它调控元件,其中,所述异源基因编码酸性α-葡萄糖苷酶(GAA)蛋白,并且其中,表达GAA 蛋白的rAAV可以以治疗有效剂量给予患者,将其递送至适当的组织和/ 或器官以表达编码该GAA蛋白的异源基因来治疗患有庞贝氏病的受试者。
因此,本文所述的技术大体上涉及使用rAAV载体在肝中表达GAA 蛋白并将所表达的GAA蛋白有效靶向至哺乳动物细胞(例如人心肌和骨骼肌细胞)的溶酶体的手段。本文描述的是编码融合至信号肽的溶酶体多肽(如GAA)的分离的核酸组合物、rAAV载体和rAAV基因组,其中,信号肽增强了GAA多肽对分泌途径的靶向,并且其中,GAA多肽也可选地融合至靶向序列以帮助更新至溶酶体中。就这来说,该方法和组合物使得能够从细胞(例如肝细胞)分泌GAA多肽,以及将GAA蛋白溶酶体性靶向至肌肉的溶酶体。GAA蛋白的溶酶体性靶向提供了许多优势。例如,编码GAA多肽的rAAV载体的给予已导致许多患者由于细胞中的非特异性更新而经历低血糖症或变得高血糖(参见例如Byrne等, A study on the safety andefficacy of Reveglucosidease alfa in patients with late-onset Pompe disease;Orphanet J.of Rare diseases;2017;12:144)。最佳或改善的来自肝的分泌以及改善的GAA对溶酶体的靶向将使GAA能够以较低的水平表达,并有助于减少来自GAA多肽过表达的任何副作用,包括降低低血糖症的风险。
因此,本文中发明人描述了一种rAAV载体,所述rAAV载体在其基因组中包含编码嵌合基因的异源核酸,所述嵌合基因编码可操作地连接至IGF2序列(例如,靶向肽或TP)的分泌信号肽(SS),该IGF2序列在天然信号肽切割位点或合适的下游位点处融合至GAA多肽的N-端。此类嵌合基因的表达将指导重组GAA融合蛋白的生产,该融合蛋白以高水平分泌并且含有对M6P/IGF2受体的高亲和力的配体。
在本文描述的组合物和方法的一些实施方式中,本文公开的rAAV 载体在其基因组中包含:5'和3'AAV反向末端重复序列(ITR),以及位于5'和3'ITR之间的编码融合多肽的异源核酸序列,所述融合多肽包含 (i)分泌信号肽,(ii)IGF2序列,以及(iii)α-葡萄糖苷酶(GAA) 多肽,其中,所述异源核酸可操作地连接至启动子(例如但不限于肝特异性启动子)。在一些实施方式中,本文公开的rAAV载体在其基因组中包含:5'和3'AAV反向末端重复序列(ITR),以及位于5'和3'ITR之间的编码融合多肽的异源核酸序列,所述融合多肽包含(i)分泌信号肽和 (ii)α-葡萄糖苷酶(GAA)多肽,其中,所述异源核酸可操作地连接至启动子,例如肝特异性启动子。
在本文描述的组合物和方法的一些实施方式中,分泌信号肽选自以下中的任一者:AAT信号肽、纤连蛋白信号肽(FN1)、GAA信号肽或其具有分泌信号活性的活性片段。
在本文描述的组合物和方法的一些实施方式中,α-葡萄糖苷酶 (GAA)多肽在GAA多肽的N-末端连接至IGF2序列。在一些实施方式中,IGF2序列连接至人酸性α-葡萄糖苷酶(GAA)多肽(SEQ ID NO:10) 的第70位氨基酸处的N-末端(即,连接至人酸性α-葡萄糖苷酶(GAA) 多肽的第70-952位残基的N-末端)。在替代实施方式中,IGF2序列连接至人酸性α-葡萄糖苷酶(GAA)多肽(SEQ ID NO:10)的第40位氨基酸处的N-末端(即,连接至人酸性α-葡萄糖苷酶(GAA)多肽的第40-952 位残基的N-末端)。在本文描述的组合物和方法的一些实施方式中,GAA 多肽由野生型GAA核酸序列(例如,SEQ ID NO:11或SEQ ID NO:72) 编码,或者可为密码子优化的GAA核酸序列,例如,用以降低受试者中的固有免疫应答、减少CpG岛和/或在体内增加表达中的任一种。示例性的密码子优化的GAA核酸序列包括但不限于SEQ IDNO:73、SEQ ID NO: 74、SEQ ID NO:75和SEQ ID NO:76.
在本文描述的组合物和方法的一些实施方式中,IGF2序列是编码以下中的任一种的核酸序列:SEQ ID NO:5的野生型成熟的人胰岛素样生长因子II(IGF2)的后随着第8-67位残基的第1位残基(即IGF2-delta 2-7 或IGF2Δ2-7,其对应于SEQ ID NO:6);SEQ IDNO:5的野生型成熟的人胰岛素样生长因子II(IGF2)的第8-67位残基(即IGF2-delta 1-7或IGF2Δ1-7,其对应于SEQ ID NO:7);或SEQ ID NO:5的野生型成熟的人胰岛素样生长因子II(IGF2)的第43-67位残基(即IGF2 delta 1-42 或IGF2Δ1-42,其对应于SEQ ID NO:8)。在本文所述的组合物和方法的一些实施方式中,IGF2序列是具有第43位氨基酸残基的修饰的核酸序列,例如第43位残基被修饰成起始密码子,例如IGF2-V43M(对应于 SEQ ID NO:9)。
在本文描述的组合物和方法的一些实施方式中,IGF2序列是包含以下中的任一种的核酸序列:SEQ ID NO:2(即IGF2-delta 2-7);SEQ ID NO: 3(即IGF2-delta 1-7)或SEQID NO:4(即IGF2-V43M)。
在本文描述的组合物和方法的一些实施方式中,包含GAA多肽和 IGF2序列的融合蛋白包含人酸性α-葡萄糖苷酶(GAA)多肽(SEQ ID NO: 10)的第40-952位氨基酸残基或第70-952位残基,所述人酸性α-葡萄糖苷酶多肽附着至IGF2序列,所述IGF2序列包含野生型成熟的人胰岛素样生长因子II(IGF2)(SEQ ID NO:5)的后随着第8-67位残基的第1 位残基(即,成熟的人IGF2(SEQ ID NO:5)的第2-7位残基不存在),其中,IGF2序列连接至人GAA(SEQ ID NO 10)的第70位氨基酸残基。
在本文描述的组合物和方法的一些实施方式中,包含GAA多肽和 IGF2序列的融合蛋白包含人酸性α-葡萄糖苷酶(GAA)多肽(SEQ ID NO: 10)的第40-952位氨基酸残基或第70-952位残基,所述人酸性α-葡萄糖苷酶多肽附着至IGF2序列,所述IGF2序列包含野生型成熟的人胰岛素样生长因子II(IGF2)(SEQ ID NO:5)的第8-67位残基(即,成熟的人IGF2的第1-7位残基(即,Y R P S E T;SEQ ID NO:63)不存在),其中,IGF2序列连接至人GAA(SEQID NO 10)的第70位氨基酸残基。
在本文描述的组合物和方法的一些实施方式中,包含GAA多肽和 IGF2序列的融合蛋白包含人酸性α-葡萄糖苷酶(GAA)多肽(SEQ ID NO: 10)的第40-952位氨基酸残基或第70-952位残基,所述人酸性α-葡萄糖苷酶多肽附着至经修饰的IGF2序列,所述IGF2序列包含野生型成熟的人胰岛素样生长因子II(IGF2)(SEQ ID NO:5)的第43-67位残基(其中,成熟的人IGF2(SEQ ID NO:5)的第1-42位残基不存在),并且其中,IGF2序列连接至人GAA(SEQID NO 10)的第70位氨基酸残基。
在本文描述的组合物和方法的一些实施方式中,IGF2序列(即,本文公开的delta1-7、delta 2-7或delta 1-42)结合非阳离子依赖性甘露糖 -6-磷酸受体(CI-MPR)。在一个实施方式中,IGF2序列直接融合至GAA 多肽的N-末端或C-末端。在另一实施方式中,IGF2序列通过间隔区融合至GAA多肽的N-末端或C-末端。在一个具体的实施方式中,IGF2序列通过10-25个氨基酸的间隔区融合至GAA多肽。在另一具体的实施方式中,IGF2序列通过包含甘氨酸残基的间隔区融合至GAA多肽。在另一具体的实施方式中,IGF2序列通过包含螺旋结构的间隔区融合至GAA 多肽。在另一具体的实施方式中,IGF2序列通过与序列GGGTVGDDDDK(SEQ ID NO:35)具有至少50%同一性的间隔区融合至GAA多肽。
在本文描述的组合物和方法的一些实施方式中,如本文所述,分泌信号用于充当协助融合多肽(例如IGF2序列-GAA融合多肽)从肝细胞向血液中分泌的一般目的,它可在血液中移动并靶向至哺乳动物细胞(例如人心肌和骨骼肌细胞)的溶酶体。在一些实施方式中,分泌信号选自以下中的任一种:AAT信号肽,纤连蛋白信号肽(FN1),GAA信号肽,或具有分泌信号活性的AAT、FN1或GAA信号肽的活性片段。
下面讨论了本文公开技术的组合物和方法的所有方面。
在一些实施方式中,该技术涉及重组腺病毒相关的(AAV)载体组合物及其使用方法,所述rAAV载体在其基因组中包含:(a)5′和3′AAV 反向末端重复(ITR)序列,以及(b)位于5′和3′ITR之间的异源核酸序列,所述异源核酸序列编码包含分泌信号肽和α-葡萄糖苷酶(GAA) 多肽的融合多肽,其中,所述异源核酸可操作地连接至启动子。在本文公开的方法和组合物的一些实施方式中,rAAV组合物包含编码融合多肽的异源核酸序列,所述融合多肽进一步包含位于分泌信号肽和α-葡萄糖苷酶(GAA)多肽之间的IGF-2序列。在本文公开的方法和组合物的一些实施方式中,rAAV组合物包含AAV基因组,该基因组以5′至3′的方向包含:(a)5′ITR,(b)启动子序列,(c)内含子序列,(d)编码分泌信号肽的核酸,(e)编码IGF-2序列的核酸、编码α-葡萄糖苷酶(GAA) 多肽的核酸,(f)poly A序列,以及(g)3′ITR。
在一些实施方式中,该技术涉及重组腺病毒相关(AAV)载体组合物及其使用方法,其中,该重组AAV(rAAV)载体在其基因组中包含: (a)5′和3′AAV反向末端重复(ITR)序列,以及(b)位于5′和3′ITR 之间的编码包含α-葡萄糖苷酶(GAA)多肽的融合多肽的异源核酸序列,其中,所述异源核酸可操作地连接至肝特异性启动子,并且其中,重组 AAV载体包含AAV3b血清型的衣壳蛋白。在此类实施方式中,融合多肽进一步包含位于GAA多肽的N-末端的分泌信号肽。在本文公开的方法和组合物的一些实施方式中,此类重组AAV载体包含编码融合多肽的异源核酸序列,所述融合多肽进一步包含位于分泌信号肽和α-葡萄糖苷酶(GAA)多肽之间的IGF-2序列。
在本文公开的方法和组合物的一些实施方式中,重组AAV载体在其基因组中以5'至3'方向包含:(a)5'ITR,(b)肝特异性启动子序列,(c) 内含子序列,(d)编码分泌信号肽的核酸,(e)编码IGF-2序列的核酸, (f)编码α-葡萄糖苷酶(GAA)多肽的核酸,(g)poly A序列,以及(h) 3'ITR。
在本文公开的方法和组合物的一些实施方式中,rAAV载体组合物包含编码分泌信号肽的核酸,例如编码选自以下的分泌信号肽的核酸:AAT 信号肽(例如,SEQ ID NO:17)、纤连蛋白信号肽(FN)(例如,SEQ ID NO:18-SEQ ID NO:21)、GAA信号肽、hIGF2信号肽(例如SEQ ID NO: 22)、或其具有分泌信号活性的活性片段(例如编码与SEQ ID NO:17-SEQ IDNO:22具有至少约75%、或80%、或85%、或90%、或95%、或98%、或99%序列同一性的氨基酸序列的核酸)。在本文公开的方法和组合物的一些实施方式中,重组AAV载体包含异源核酸序列,所述异源核酸序列编码结合人非阳离子依赖性甘露糖-6-磷酸受体(CI-MPR)或IGF-2受体的IGF-2前导序列,例如,异源核酸序列编码结合至IGF-2受体的IGF-2 序列,所述IGF-2序列具有SEQ ID NO:5的氨基酸序列,或者在SEQ ID NO:5中包含至少一个氨基修饰。在一些实施方式中,重组AAV载体包含编码IGF-2前导序列的异源核酸序列,所述IGF-2前导序列在SEQ ID NO:5中具有至少一个氨基修饰,所述氨基修饰为V43M氨基酸修饰 (SEQID NO:8或SEQ ID NO:9)、或Δ2-7(SEQ ID NO:6)、或Δ1-7(SEQ ID NO:7),或为与SEQ IDNO:5-SEQ ID NO:9具有至少约75%、或80%、或85%、或90%、或95%、或98%、或99%序列同一性的IGF2肽。
在本文公开的方法和组合物的一些实施方式中,重组AAV载体包含组成型、细胞特异性或可诱导型的启动子。在本文公开的方法和组合物的一些实施方式中,重组AAV载体包含肝特异性启动子,例如但不限于,选自甲状腺素转运蛋白启动子(TTR)、LSP启动子(LSP)、合成型肝特异性启动子中的任一种的肝特异性启动子。
在本文公开的方法和组合物的一些实施方式中,重组AAV载体包含编码野生型GAA多肽(wtGAA)或经修饰的GAA多肽的异源核酸序列。在本文公开的方法和组合物的一些实施方式中,重组AAV载体包含编码 GAA多肽的异源核酸序列,所述核酸序列是人GAA基因或人密码子优化的GAA基因(coGAA)或经修饰的GAA核酸序列。在本文公开的方法和组合物的所有方面,编码GAA多肽的核酸序列针对以下任一项或多项进行密码子优化:增强体内表达、减少CpG岛或降低固有免疫应答。在本文公开的方法和组合物的所有方面,对编码GAA多肽的核酸序列进行密码子优化以减少CpG岛并降低固有免疫应答。
在本文公开的方法和组合物的一些实施方式中,重组AAV载体包含异源核酸序列,其中所编码的融合多肽进一步包含间隔区,所述间隔区包含位于GAA多肽的氨基末端和IGF-2序列的C-末端的至少1个氨基酸的核苷酸序列。在本文公开的方法和组合物的一些实施方式中,重组 AAV载体包含异源核酸序列,所述异源核酸序列包含编码至少1个氨基酸的间隔区的核酸,所述核酸位于编码IGF-2序列的核酸和编码GAA多肽的核酸之间。
在本文公开的方法和组合物的一些实施方式中,重组AAV载体包含位于编码GAA基因的核酸的3'端和3'ITR序列的5'端的至少一个polyA 序列。
在本文公开的方法和组合物的一些实施方式中,重组AAV载体包含异源核酸序列,所述异源核酸序列进一步包含位于编码GAA多肽的核酸的3'端和3'ITR序列的5'端之间的胶原蛋白稳定性(CS)序列。在本文公开的方法和组合物的一些实施方式中,重组AAV载体进一步包含编码胶原蛋白稳定性(CS)序列的核酸,所述核酸位于编码GAA多肽的核酸和polyA序列之间。
在本文公开的方法和组合物的一些实施方式中,重组AAV载体包含异源核酸序列,所述异源核酸序列进一步包含位于编码分泌信号肽的序列的5'端和启动子的3'端的内含子序列。在一些实施方式中,内含子序列包含MVM序列或HBB2序列,其中MVN序列包含SEQ IDNO:13 的核酸序列,或与SEQ ID NO:13具有至少约75%、或80%、或85%、或90%、或95%、或98%、或99%序列同一性的核酸序列,并且HBB2 序列包含SEQ ID NO:14的核酸序列,或与SEQ ID NO:14具有至少约75%、或80%、或85%、或90%、或95%、或98%、或99%序列同一性的核酸序列。
在本文公开的方法和组合物的一些实施方式中,重组AAV载体包含 ITR序列,所述ITR序列包含插入、缺失或置换。在本文公开的方法和组合物的一些实施方式中,重组AAV载体包含至少一个ITR序列,其中 ITR中的一个或多个CpG岛被去除。
在本文公开的方法和组合物的一些实施方式中,重组AAV载体包含编码分泌信号肽的异源核酸序列,所述分泌信号肽是纤连蛋白信号肽 (FN1)或其具有分泌信号活性的活性片段(例如,FN1信号肽具有SEQ ID NO:18-SEQ ID NO:21中任一项的序列,或与SEQ IDNO:18-SEQ ID NO:21中任一项序列具有至少约75%、或80%、或85%、或90%、或95%、或98%、或99%序列同一性的氨基酸序列),并且异源核酸序列编码选自以下任一项的IGF-2序列:SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、 SEQ ID NO:8或SEQ ID NO:9,或与SEQ IDNO:5-SEQ ID NO:9具有至少约75%、或80%、或85%、或90%、或95%、或98%、或99%序列同一性的IGF2肽。在本文公开的方法和组合物的一些实施方式中,重组 AAV载体包含编码分泌信号肽的异源核酸序列,所述分泌信号肽为AAT 信号肽或其具有分泌信号活性的活性片段(例如,AAT信号肽具有SEQ ID NO:17的序列,或与SEQ ID NO:17具有至少约75%、或80%、或 85%、或90%、或95%、或98%、或99%序列同一性的氨基酸序列),并且异源核酸序列编码选自以下任一项的IGF-2序列:SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ IDNO:8或SEQ ID NO:9,或与SEQ ID NO:5-SEQ ID NO:9具有至少约75%、或80%、或85%、或90%、或95%、或98%、或99%序列同一性的IGF2肽。
在本文公开的方法和组合物的一些实施方式中,重组AAV载体包含编码IGF2肽的异源核酸序列,其中IGF2肽序列为SEQ ID NO:8或SEQ ID NO:9,或与SEQ ID NO:8或SEQ IDNO:9具有至少约75%、或80%、或85%、或90%、或95%、或98%、或99%序列同一性的IGF2肽。
在本文公开的方法和组合物的一些实施方式中,重组AAV载体是嵌合AAV载体、单倍体AAV载体、杂合AAV载体或多倍体AAV载体,例如但不限于,其中重组AAV载体包含选自由表1中所列的那些及其任意组合所组成的组中的任意AAV血清型的衣壳蛋白。在本文公开的方法和组合物的一些实施方式中,重组AAV载体是AAV3b血清型。在本文公开的方法和组合物的一些实施方式中,重组AAV载体是AAV3b血清型,其在衣壳蛋白中包含选自以下任一项的一个或多个突变:265D、 549A、Q263Y。在本文公开的方法和组合物的一些实施方式中,重组AAV 载体为选自以下任一者的AAV3b血清型:AAV3b265D、 AAV3b265D549A、AAV3b549A、AAV3bQ263Y或AAV3bSASTG。
本文技术的另一方面涉及包含本文公开的任何重组AAV载体组合物和药学上可接受的辅料的药物组合物。
本文技术的另一方面涉及包含核酸序列的组合物,所述核酸序列包含:可操作地连接至如下的核酸序列的肝特异性启动子,所述核酸序列按以下顺序包含:(a)编码分泌信号肽的核酸,(b)编码IGF-2序列的核酸,以及(c)编码GAA多肽的核酸。
本文技术的另一方面涉及一种组合物,其包含重组腺病毒相关 (rAAV)载体基因组的核酸序列,该核酸序列包含:(a)5'和3'AAV反向末端重复(ITR)核酸序列,以及(b)位于5'和3'ITR序列之间的异源核酸序列,所述异源核酸序列编码包含分泌信号肽和α-葡萄糖苷酶 (GAA)多肽的融合多肽,其中该异源核酸可操作地连接至启动子。
在本文公开的方法和组合物的一些实施方式中,所述核酸序列包含编码融合多肽的异源核酸序列,所述融合多肽进一步包含位于分泌信号肽和α-葡萄糖苷酶(GAA)多肽之间的IGF-2序列。在本文公开的方法和组合物的一些实施方式中,所述核酸序列包含编码分泌信号的核酸,所述核酸选自SEQ ID NO:17、SEQ ID NO:22-SEQ ID NO:26中的任一项,或与SEQ ID NO:17或SEQ ID NO:22-SEQ ID NO:26中任一项具有至少约75%、或80%、或85%、或90%、或95%、或98%、或99%序列同一性的核酸序列。
在本文公开的方法和组合物的一些实施方式中,所述核酸序列包含编码IGF-2序列的异源核酸序列,所述异源核酸序列选自SEQ ID NO:2 (IGF2-Δ2-7)、SEQ ID NO:3(IGF2-Δ1-7)、或SEQ ID NO:4(IGF2 V43M) 中的任一项,或与SEQ ID NO:2、SEQ ID NO:3或SEQ ID NO:4中任一项具有至少约75%、或80%、或85%、或90%、或95%、或98%、或99%序列同一性的核酸序列。
在本文公开的方法和组合物的一些实施方式中,所述核酸序列包含编码GAA多肽的异源核酸序列,其中,所述核酸序列是人GAA基因或人密码子优化的GAA基因(coGAA)或经修饰的GAA核酸序列。在本文公开的方法和组合物的一些实施方式中,所述核酸序列包含异源核酸序列,所述异源核酸序列是对于以下的任一种或多种进行密码子优化的 (coGAA)GAA基因:增强的体内表达、减少CpG岛或降低固有免疫应答。在本文公开的方法和组合物的一些实施方式中,所述核酸序列包含异源核酸序列,所述异源核酸序列是密码子优化的(coGAA)GAA基因,以减少CpG岛并降低固有免疫应答。
在本文公开的方法和组合物的一些实施方式中,所述核酸序列包含编码GAA多肽的异源核酸序列,所述异源核酸序列选自SEQ ID NO:11 (全长hGAA)、SEQ ID NO:55(Dwight cDNA)、SEQ ID NO:56(hGAA Δ1-66)中的任一项,或与SEQ ID NO:11、SEQ ID NO:55或SEQ ID NO: 56中的任一项具有至少约75%、或80%、或85%、或90%、或95%、或98%、或99%序列同一性的核酸序列。
在本文公开的方法和组合物的一些实施方式中,所述核酸序列包含编码GAA多肽的异源核酸序列,其中编码GAA多肽的核酸选自SEQ ID NO:74(密码子优化的1)、SEQ IDNO:75(密码子优化的2)和SEQ ID NO:76(密码子优化的3)中的任一项,或与SEQ ID NO:74、SEQ ID NO: 75或SEQ ID NO:76中的任一项具有至少约75%、或80%、或85%、或 90%、或95%、或98%、或99%序列同一性的核酸序列。
在本文公开的方法和组合物的一些实施方式中,核酸序列选自以下中的任一项:SEQ ID NO:57(AAT-V43M-wtGAA(delta1-69aa))、SEQ ID NO:58(ratFN1-IGF2V43M-wtGAA(delta1-69aa))、SEQ ID NO:59 (hFN1-IGF2V43M-wtGAA(delta1-69aa))、SEQ ID NO:60(ATT-IGF2Δ2-7-wtGAA(delta 1-69))、SEQ ID NO:61 (FN1rat-IGFΔ2-7-wtGAA(delta1-69))、SEQ ID NO:62 (hFN1-IGFΔ2-7-wtGAA(delta 1-69))、SEQ ID NO:79 (AAT_hIGF2-V43M_wtGAA_del1-69_Stuffer.V02)、SEQ ID NO:80 (FIBrat_hIGF2-V43M_wtGAA_del1-69_Stuffer.V02)、SEQ ID NO:81 (FIBhum_hIGF2-V43M_wtGAA_del1-69_Stuffer.V02)、SEQ ID NO:82 (AAT_GILT_wtGAA_del1-69__Stuffer.V02)、SEQ ID NO:83(FIBrat_GILT_wtGAA_del1-69_Stuffer.V02)、SEQ ID NO:84 (FIBhum_GILT_wtGAA_del1-69_Stuffer.V02),或与SEQ ID No:57、SEQ ID No:58、SEQ ID No:59、SEQ ID No:60、SEQID No:61、SEQ ID No: 62、SEQ ID No:79、SEQ ID No:80、SEQ ID No:81、SEQ ID No:82、SEQ ID No:83或SEQ ID No:84具有至少80%、85%、90%、95%或98%同一性的核酸序列。
在本文公开的方法和组合物的一些实施方式中,rAAV载体包含选自以下任一项的核酸序列:SEQ ID NO:57(AAT-V43M-wtGAA (delta1-69aa))、SEQ ID NO:58(ratFN1-IGF2V43M-wtGAA (delta1-69aa))、SEQ ID NO:59(hFN1-IGF2V43M-wtGAA (delta1-69aa))、SEQ ID NO:60(ATT-IGF2Δ2-7-wtGAA(delta 1-69))、 SEQ ID NO:61(FN1rat-IGFΔ2-7-wtGAA(delta 1-69))、SEQ ID NO:62 (hFN1-IGFΔ2-7-wtGAA(delta 1-69))、SEQID NO:79 (AAT_hIGF2-V43M_wtGAA_del1-69_Stuffer.V02)、SEQ ID NO:80 (FIBrat_hIGF2-V43M_wtGAA_del1-69_Stuffer.V02)、SEQ ID NO:81 (FIBhum_hIGF2-V43M_wtGAA_del1-69_Stuffer.V02)、SEQ ID NO:82 (AAT_GILT_wtGAA_del1-69__Stuffer.V02)、SEQID NO:83 (FIBrat_GILT_wtGAA_del1-69_Stuffer.V02)、SEQ ID NO:84 (FIBhum_GILT_wtGAA_del1-69_Stuffer.V02),或与SEQ ID No:57、SEQ ID No:58、SEQ ID No:59、SEQ IDNo:60、SEQ ID No:61、SEQ ID No: 62、SEQ ID No:79、SEQ ID No:80、SEQ ID No:81、SEQID No:82、 SEQ ID No:83或SEQ ID No:84具有至少80%、85%、90%、95%或98%同一性的核酸序列。
本文技术的另一方面涉及本文公开的rAAV和核酸组合物在治疗疾病的方法中的用途。具体而言,本文技术的一个方面涉及本文公开的 rAAV载体组合物和核酸组合物在治疗患有糖原贮积症II型(GSD II、庞贝氏病、酸性麦芽糖酶缺乏症)或患有α-葡萄糖苷酶(GAA)多肽缺乏症的患者的方法中的用途,所述方法包括向受试者给予本文公开的任意重组AAV载体或rAAV基因组或核酸序列。在本文公开的方法的一些实施方式中,所表达的GAA多肽从受试者的肝脏分泌,并且分泌的GAA 被骨骼肌组织、心肌组织、膈肌组织或它们的组合摄取,其中对分泌的 GAA的摄取引起组织中溶酶体糖原存储的减少。在所公开的方法的一些实施方式中,重组AAV载体或rAAV基因组或核酸序列通过任何合适的给予方法而被给予至受试者,所述给予方法例如但不限于选自以下任一项的给予方法:肌内、皮下、椎管内、脑池内、鞘内、静脉内给予。在一些实施方式中,本文公开的药物组合物可以用于本文公开的方法中。
本文技术的另一方面涉及细胞,所述细胞包含本文公开的rAAV组合物、rAAV基因组组合物或核酸组合物中的任一种或多种。在一些实施方式中,细胞是人细胞、或非人细胞哺乳动物细胞、或昆虫细胞。
本文技术的另一方面涉及宿主动物,所述宿主动物包含本文公开的 rAAV组合物、rAAV基因组组合物或核酸组合物中的任一种或多种。在一些实施方式中,宿主动物是哺乳动物、非人类哺乳动物或人类。
本文技术的另一方面涉及包含至少一个细胞的宿主动物,所述细胞包含本文所公开的rAAV组合物、rAAV基因组组合物或核酸组合物中的任一种或多种。在一些实施方式中,包含此类经修饰的细胞的宿主动物是哺乳动物、非人类哺乳动物或人类。
本发明的各方面教导了在构造和使用上的某些益处,这些益处产生以下描述的示例性优点。
在一些实施方式中,本文公开了药物制剂,所述药物制剂包含本文公开的rAAV载体、编码rAAV基因组的核酸以及药学上可接受的辅料。
从以下更详细的描述中,结合附图,本发明各方面的其它特征和优点将变得显而易见,所述附图以示例的方式示出了本发明各方面的原理。
附图说明
本申请的文件包含至少一幅彩色附图。具有彩色附图的本专利申请公开文本副本将根据请求并支付必要的费用后由专利局提供。附图说明了本发明的各个方面。在此类附图中:
图1是示出如下的图:根据至少一个实施方式,如在全血中测量的,每个二倍体基因组的载体基因组的y轴,不同AAV血清型AAV3b、 AAV3ST、AAV8和AAV9的x轴。
图2是示出如下的图:根据至少一个实施方式,如在左肝叶、中肝叶和右肝叶中测量的,每个二倍体基因组的载体基因组的y轴,不同AAV 血清型AAV3b、AAV3ST、AAV8和AAV9的x轴。
图3是根据至少一个实施方式的腺相关病毒载体质粒的质粒图谱的示意图。
图4是根据至少一个实施方式的pAAV-LSPhGAA质粒的质粒图谱的示意图。
图5A-图5G是本文公开的rAAV基因组的示例性核酸构建体的示意图。图5A示出了rAAV基因组的核酸构建体,所述核酸构建体包含5'ITR,可操作地连接至编码分泌信号肽(SS)、靶向肽和人GAA多肽的核酸的启动子,以及3'ITR。图5A,rAAV基因组的核酸构建体,所述核酸构建体包含5'ITR,可操作地连接至编码分泌信号肽(SS)、靶向肽(TP) 和人GAA(hGAA)多肽的异源核酸的启动子,以及3'ITR。图5B示出了本文公开的rAAV基因组的示例性核酸构建体,所述核酸构建体包含与图5A相同的元件,并且额外包含位于hGAA多肽3'端和3'-ITR的5' 端的至少一个polyA信号。图5C示出了本文公开的rAAV基因组的示例性核酸构建体,所述核酸构建体包含与图5B相同的元件,不同之处在于其包含位于启动子3'端的内含子序列。图5D示出了本文公开的rAAV基因组的示例性核酸构建体,所述核酸构建体包含与图5C相同的元件,不同之处在于其包含位于hGAA多肽核酸序列的3'端并位于poly A序列之前的胶原蛋白稳定性(CS)序列。图5E示出了本文公开的rAAV基因组的示例性核酸构建体,所述核酸构建体包含与图5D相同的元件,不同之处在于其还包含编码至少1个氨基酸的间隔区的核酸,所述核酸位于编码hGAA多肽的核酸和编码靶向肽(TP)(例如IGF2序列)的核酸之间。图5F示出了本文公开的rAAV基因组的示例性核酸构建体,所述核酸构建体包含与图5E相同的元件,其中启动子是肝启动子,内含子序列选自 MVM或HBB2内含子序列,分泌信号肽选自FN1信号肽(例如,hFN1、 ratFN1)、AAT信号肽或hGAA信号肽中的任一种;靶向肽为本文公开的 IGF2序列,以及所述至少一个poly A序列选自hGHpA或synPA poly A 序列。图5G示出了本文公开的rAAV基因组的示例性核酸构建体,所述核酸构建体包含与图5F相同的元件,不同之处在于其中IGF2序列为选自SEQ ID NO:2(IGF2 Δ2-7)、SEQ ID NO:3(IGF2Δ1-7)或SEQ ID NO:4(IGF2 V43M)的核酸序列。
图6示出了rAAV基因组的示例性核酸构建体,所述核酸构建体包含5'ITR,可操作连接至内含子序列(例如,MVM或HBB2内含子序列) 的肝特异性启动子,编码选自FN1、ATT或GAA信号肽中的任一种的分泌信号肽的核酸,编码人GAA多肽的核酸,胶原蛋白稳定性(CS)序列,至少一个poly A序列(例如hGHpA和/或synPA poly A序列)和3'ITR。
图7示出了用以生成本文公开的rAAV基因组的Gibson克隆技术的示意图。具体而言,进行三重连接来将3个核酸序列区块(block)连接在一起,然后将所述区块与启动子(例如肝特异性启动子)以及5'ITR 和3'ITR克隆至载体中以生成rAAV基因组。Gibson克隆方法用于生成以下rAAV基因组:SEQ ID NO:57(AAT-V43M-wtGAA(delta1-69aa)); SEQ ID NO:58(ratFN1-IGF2V43M-wtGAA(delta1-69aa);SEQ ID NO: 59(hFN1-IGF2V43M-wtGAA(delta1-69aa));SEQ ID NO:60 (ATT-IGF2Δ2-7-wtGAA(delta 1-69));SEQ ID NO:61(FN1rat-IGFΔ2-7-wtGAA(delta 1-69));SEQ ID NO:62 (hFN1-IGFΔ2-7-wtGAA(delta1-69))。
图8示出了使用核酸序列区块(1、2和3)的Gibson克隆,生成包含AAT-V43M-wtGAA(delta1-69aa)的SEQ ID NO:57的示例性rAAV 基因组。AAT-V43M-wtGAA(delta1-69aa)载体中还示出了3个氨基酸 (3aa)的间隔区核酸序列(将示例性3aa序列“G-A-P”示出为SEQID NO:31)和填充区(stuffer)核酸序列(在图8中称为“间隔区”序列) 的位置,所述间隔区核酸序列位于编码IGF(V42M)靶向肽的核酸序列的3'端和编码wtGAA(Δ1-69)酶的核酸的5'端,所述填充区核酸序列位于poly A序列的3'端和3'ITR序列的5'端。
图9示出了使用核酸序列区块(4、2和3)的Gibson克隆,生成包含ratFN1-IGF2V43M-wtGAA(delta1-69aa)的SEQ ID NO:58的示例性 rAAV基因组。ratFN1-IGF2V43M-wtGAA(delta1-69aa)载体中还示出了 3个氨基酸(3aa)的间隔区核酸序列(将示例性3aa序列“G-A-P”示出为SEQ ID NO:31)和填充区核酸序列(在图9中称为“间隔区”序列) 的位置,所述间隔区核酸序列位于编码IGF(V42M)靶向肽的核酸序列的3'端和编码wtGAA(Δ1-69)酶的核酸的5'端,所述填充区核酸序列位于poly A序列的3'端和3'ITR序列的5'端。
图10示出了使用核酸序列区块(5、2和3)的Gibson克隆,生成包含hFN1-IGF2V43M-wtGAA(delta1-69aa)的SEQ ID NO:59的示例性rAAV基因组。hFN1-IGF2V43M-wtGAA(delta1-69aa)载体中还示出了3个氨基酸(3aa)的间隔区核酸序列(将示例性3aa序列“G-A-P”示出为SEQ ID NO:31)和填充区核酸序列(在图10中称为“间隔区”序列)的位置,所述间隔区核酸序列位于编码IGF(V42M)靶向肽的核酸序列的3'端和编码wtGAA(Δ1-69)酶的核酸的5'端,所述填充区核酸序列位于poly A序列的3'端和3'ITR序列的5'端。
图11示出了使用核酸序列区块(6、2和3)的Gibson克隆,生成包含ATT-IGF2Δ2-7-wtGAA(delta 1-69)的SEQ ID NO:60的示例性rAAV 基因组。ATT-IGF2Δ2-7-wtGAA(delta1-69)载体中还示出了3个氨基酸 (3aa)的间隔区核酸序列(将示例性3aa序列“G-A-P”示出为SEQ ID NO:31)和填充区核酸序列(在图11中称为“间隔区”序列)的位置,所述间隔区核酸序列位于编码IGF2Δ2-7靶向肽的核酸序列的3'端和编码 wtGAA(Δ1-69)酶的核酸的5'端,所述填充区核酸序列位于poly A序列的3'端和3'ITR序列的5'端。
图12示出了使用核酸序列区块(7、2和3)的Gibson克隆,生成包含FN1rat-IGFΔ2-7-wtGAA(delta 1-69)的SEQ ID NO:61的rAAV 基因组。FN1rat-IGFΔ2-7-wtGAA(delta 1-69)载体中还示出了3个氨基酸(3aa)的间隔区核酸序列(将示例性3aa序列“G-A-P”示出为SEQ ID NO:31)和填充区核酸序列(在图12中称为“间隔区”序列)的位置,所述间隔区核酸序列位于编码IGFΔ2-7靶向肽的核酸序列的3'端和编码 wtGAA(Δ1-69)酶的核酸的5'端,所述填充区核酸序列位于poly A序列的3'端和3'ITR序列的5'端。
图13示出了使用核酸序列区块(8、2和3)的Gibson克隆,生成包含hFN1-IGFΔ2-7-wtGAA(delta 1-69)的SEQ ID NO:62的rAAV基因组。hFN1-IGFΔ2-7-wtGAA(delta 1-69)载体中还示出了3个氨基酸 (3aa)的间隔区核酸序列(将示例性3aa序列“G-A-P”示出为SEQID NO:31)和填充区核酸序列(在图13中称为“间隔区”序列)的位置,所述间隔核酸序列位于编码IGFΔ2-7靶向肽的核酸序列的3'端和编码 wtGAA(Δ1-69)酶的核酸的5'端,所述填充区核酸序列位于poly A序列的3'端和3'ITR序列的5'端。
图14A-图14F示出了表达野生型GAA的rAAV基因组的示例性构建体的示意图。图14A示出了候选 1_AAT_hIGF2-V43M_wtGAA_del1-69_Stuffer.V02(SEQ ID NO:79)的示例性rAAV基因组构建体的示意图。图14B示出了候选 2_FIBrat_hIGF2-V43M_wtGAA_del1-69_Stuffer.V02(SEQ ID NO:80) 的示例性rAAV基因组构建体的示意图。图14C示出了候选 3_FIBhum_hIGF2-V43M_wtGAA_del1-69_Stuffer.V02(SEQ ID NO:81) 的示例性rAAV基因组构建体的示意图。图14D示出了候选 4_AAT_GILT_wtGAA_del1-69__Stuffer.V02(SEQ IDNO:82)的示例性 rAAV基因组构建体的示意图。图14E示出了候选 5_FIBrat_GILT_wtGAA_del1-69_Stuffer.V02(SEQ ID NO:83)的示例性 rAAV基因组构建体的示意图。图14F示出了候选 6_FIBhum_GILT_wtGAA_del1-69_Stuffer.V02(SEQ ID NO:84)的示例性rAAV基因组构建体的示意图。
上述的附图示出了本发明在至少一个示例性实施方式中的方面,在以下描述中进一步详细地定义了本发明的方面。根据一个或多个实施方式,在不同附图中由相同数字指代的本发明的特征、要素和方面表示相同、等同或相似的特征、要素或方面。
具体实施方式
本文所述的公开内容大体上涉及用于基因治疗的重组AAV(rAAV) 载体和rAAV基因组构建体,以将GAA多肽递送至受试者。具体而言,本文描述的技术大体上涉及用于产生GAA多肽的rAAV载体或rAAV基因组,所述GAA多肽在肝脏中表达并且有效地靶向至哺乳动物细胞(例如人心肌和骨骼肌细胞)的溶酶体。例如,该技术涉及用于转导肝细胞的rAAV载体,其中,经转导的肝细胞分泌GAA多肽,并且所分泌的 GAA多肽靶向至骨骼肌组织、心肌组织、膈肌组织或它们的组合中的溶酶体。
因此,本文描述的技术的一个方面提供了包含rAAV基因组的rAAV 载体,所述rAAV载体可用于产生GAA,所述GAA更有效地从细胞(例如肝细胞)中分泌,然后靶向至哺乳动物细胞(例如人的心肌和骨骼肌细胞)的溶酶体。
具体而言,在一些实施方式中,GAA多肽作为融合蛋白表达,所述融合蛋白至少包含促进GAA多肽从肝脏分泌的信号肽。在一些实施方式中,GAA多肽作为融合蛋白表达,所述融合蛋白至少包含促进GAA多肽从肝脏分泌的信号肽,以及使得能够有效靶向至哺乳动物细胞(例如肌肉细胞,例如人的心肌和骨骼肌细胞)中的溶酶体的靶向序列。在一些实施方式中,靶向肽是本文所述的IGF2序列。
本文所述技术的一个方面涉及用于治疗疾病(例如庞贝氏病)以及进一步地用于庞贝氏病的治疗的rAAV载体,所述rAAV载体包含含有反向末端重复序列(ITR)、启动子、异源基因、poly-A尾和潜在的其它调节元件的核苷酸序列,其中,所述异源基因是GAA,并且其中,rAAV GAA 可以以治疗有效剂量向患者给予,所述剂量被递送至适当的组织和/或器官以用于表达异源基因和治疗疾病。
本文所述技术的一个方面涉及一种rAAV载体,所述rAAV载体在其基因组中以5'至3'的方向包含:5'-和3'-AAV反向末端重复(ITR)序列,以及位于5'ITR和3'ITR之间的编码融合多肽的异源核酸序列,所述融合多肽包含(i)分泌信号肽(SS)、(ii)IGF2序列、以及(iii)α-葡萄糖苷酶(GAA)多肽,其中,所述异源核酸可操作地连接至启动子。在本文公开的方法和组合物的一些实施方式中,分泌信号肽选自AAT信号肽、纤连蛋白信号肽(FN1)、GAA信号肽或它们的具有分泌信号活性的活性片段中的任一种。
在一些实施方式中,本文所述的rAAV载体来自任意血清型。在一些实施方式中,rAAV载体是AAV3b血清型,包括但不限于AAV3b265D 病毒体、AAV3b265D549A病毒体、AAV3b549A病毒体、AAV3bQ263Y 病毒体或AAV3bSASTG病毒体(即,包含含有Q263A/T265突变的AAV3b 衣壳的病毒体)。
所述技术的方面涉及本文所述的rAAV载体在治疗受试者中的GAA 多肽缺乏的方法中的用途,包括在药学上可接受的辅料中以治疗有效剂量向受试者给予本文所公开的rAAV载体。在一些实施方式中,rAAV载体用于庞贝氏病(亦称为糖原贮积病2型或GSD II)的治疗或预防中。在一些实施方式中,受试者是哺乳动物,并且其中所述哺乳动物是人、灵长类、犬科动物、马、牛、猫科动物。
在一些实施方式中,rAAV载体包含编码至少含有N-端分泌信号肽的GAA多肽的核酸,其中,转导有rAAV载体的肝细胞表达GAA多肽和N-末端分泌肽,并且分泌该GAA多肽。此外,分泌的GAA多肽还可以任选地包含靶向序列,例如附着于GAA多肽的N-末端或C-末端的IGF2序列,以增强摄取以及GAA多肽对骨骼肌组织、心肌组织、膈肌组织、触发肌肉组织的神经细胞或它们的组合中的溶酶体的靶向。此外,在实施方式中,分泌的GAA多肽在肌肉细胞中的摄取引起组织中的溶酶体糖原贮积的减少以及庞贝氏病相关的症状的减少或消除。
在一个实施方式中,rAAV载体包含衣壳,并且衣壳内为在本文中称为“rAAV载体基因组”的核苷酸序列。rAAV载体基因组包含多个元件,包括但不限于两个反向末端重复序列(ITR,例如5'-ITR和3'-ITR),并且位于ITR之间的为额外的元件,包括启动子、异源基因和poly-A尾。在进一步的实施方式中,可在ITR之间存在额外的元件,包括用于miRNA 或shRNA序列的结合的种子区域序列。
I.定义
在本文的说明书和所附权利要求书中使用以下术语:
除非本文另有说明或与上下文明显矛盾,在描述本发明的上下文中 (特别是在如下权利要求的上下文中)使用的术语“一个/一种(a/an)”、“该/所述(the)”和类似的提法应解释为涵盖单数和复数两者。此外,除非另外特别说明,用于标识元件的顺序指示符(例如“第一”、“第二”、“第三”等)用于区分元件,而不指出或暗示此类元件的所需的数量或受限的数量,并且不指出此类元件的特定位置或顺序。除非本文另有指出或与上下文明显矛盾,否则本文描述的所有方法可以以任意合适的顺序施行。本文提供的任意和所有实例或示例性语言(例如,“如(such as)”)的使用,仅旨在更好地阐明本发明,而不对以其它方式请求保护的本发明的范围构成限制。本说明书中的任何语言都不应被解释为指出实施本发明必不可少的任何未请求保护的要素。
此外,本文所使用的术语“约”在涉及如多核苷酸或多肽序列的长度、剂量、时间、温度等的量的可测量值时,意在涵盖所指明量的±20%、±10%、±5%、±1%、±0.5%或甚至±0.1%的变化。
还如本文所使用的,“和/或”是指并涵盖相关的列出的项的一个或多个的任意和所有可能的组合,以及当以替代方式(“或”)解释时是指并涵盖组合的缺少。
如本文所使用的,过渡性短语“基本上由...组成”意味着权利要求的范围将被解释为涵盖权利要求中所述的指明的材料或步骤,以及“对所请求保护的发明的基本特性和新颖性特性没有实质影响的那些材料或步骤”。参见In re Herz,537F.2d 549,551-52,190USPQ 461,463(CCPA 1976)(原文中强调);另请参见MPEP§2111.03。因此,当在本发明的权利要求中使用时,术语“基本上由...组成”不旨在被解释为等同于“包括(comprising)”。除非上下文另有说明,否则特别意指可以以任意组合使用本文所述发明的各种特征。
此外,本发明还考虑的是在本发明的一些实施方式中,可以排除或省略本文所述的任何特征或特征的组合。
为了进一步说明,例如,如果说明书指出特定的氨基酸可以选自A、 G、I、L和/或V,则该语言还指出该氨基酸可以选自这些氨基酸的任何子集:例如A、G、I或L;A、G、I或V;A或G;只有L;等,视如每个此类子组合均在此处明确提出。此外,此类语言还指出可以放弃一个或多个指明的氨基酸(例如,通过否定的但书)。例如,在具体的实施方式中,氨基酸不是A、G或I;不是A;不是G或V;等,视如每个此类可能的放弃均在此处明确提出。
如本文所使用的术语“细小病毒”涵盖细小病毒科(Parvoviridae),包括自主复制细小病毒和依赖病毒。自主细小病毒包括细小病毒属 (Parvovirus)、红细胞病毒属(Erythrovirus)、浓核病毒属(Densovirus)、艾特拉病毒(Iteravirus)属和Contravirus属的成员。示例性自主细小病毒包括但不限于小鼠微小病毒、牛细小病毒、犬细小病毒、鸡细小病毒、猫泛白细胞减少症病毒、猫细小病毒、鹅细小病毒、H1细小病毒、番鸭细小病毒、B19病毒和目前已知或今后发现的任何其它自主细小病毒。其它自主细小病毒是本领域技术人员已知的。参见例如,BERNARD N. FIELDS等,VIROLOGY,第2卷,第69章(第4版,Lippincott-Raven Publishers)。
如本文所使用的,术语“腺相关病毒”(AAV)包括但不限于AAV 1 型、AAV 2型、AAV3型(包括3A型和3B型)、AAV 4型、AAV 5型、 AAV 6型、AAV 7型、AAV 8型、AAV 9型、AAV 10型、AAV 11型、禽类AAV、牛AAV、犬类AAV、马类AAV、绵羊AAV和目前已知或今后发现的任何其它AAV。参见例如,BERNARD N.FIELDS等, VIROLOGY,第2卷,第69章(第4版,Lippincott-Raven Publishers)。已经鉴定出许多相对新的AAV血清型和进化枝(参见例如,Gao等,(2004)J.Virology 78:6381-6388;Moris等,(2004)Virology 33-:375-383;和表1)。
本领域已知自主细小病毒和AAV的多种血清型的基因组序列、以及天然反向末端重复序列(ITR)、Rep蛋白和衣壳亚基的序列。此类序列可见于文献或公共数据库(如GenBank)中。参见例如GenBank登录号 NC_002077、NC_001401、NC_001729、NC_001863、NC_001829、 NC_001862、NC_000883、NC_001701、NC_001510、NC_006152、 NC_006261、AF063497、U89790、AF043303、AF028705、AF028704、 J02275、J01901、J02275、X01457、AF288061、AH009962、AY028226、 AY028223、NC_001358、NC_001540、AF513851、AF513852、AY530579;以引用的方式将其公开内容并入本文,以教导细小病毒和AAV核酸和氨基酸序列。还参见例如,Srivistava等,(1983)J Virology 45:555;Chiarini 等,(1998)J.Virology 71:6823;Chiarini等,(1999)J.Virology 73:1309; Bantel-Schaal等,(1999)J.Virology 73:939;Xiao等,(1999)J.Virology 73:3994;Muramatsu等,(1996)Virology 221:208;Shade等,(1986) J.Viral.58:921;Gao等,(2002)Proc.Nat.Acad.Sci.USA 99:11854; Morris等,(2004)Virology 33-:375-383;国际专利公开WO 00/28061, WO 99/61601,WO 98/11244;以及美国专利No.6,156,303;以引用的方式将其公开内容并入本文,以教导细小病毒和AAV核酸和氨基酸序列。还参见本文公开的表1和表5。
自主细小病毒和AAV的衣壳结构更详细地描述于BERNARD N. FIELDS等,VIROLOGY,第2卷,第69&70章(第4版,Lippincott-Raven Publishers)中。还参见AAV2的晶体结构的描述(Xie等,(2002)Proc.Nat. Acad.Sci.99:10405-10)、AAV4(Padron等,(2005)J.Viral.79:5047-58)、 AAV5(Walters等,(2004)J.Viral.78:3361-71)和CPV(Xie等,(1996) J.Mal.Biol.6:497-520以及Tsao等,(1991)Science 251:1456-64)。
如本文所使用的,术语“向性”是指病毒优先进入某些细胞或组织,随后可选地在细胞中表达(如转录和可选地翻译)病毒基因组所携带的序列,例如,对于重组病毒,表达感兴趣的异源核酸。
如本文所使用的,“系统性向性”和“系统性转导”(和等同的术语) 指出本发明的病毒衣壳或病毒载体对整个身体的组织(例如脑、肺、骨骼肌、心脏、肝、肾和/或胰)表现出向性和/或进行转导。在本发明的实施方式中,观察到对中枢神经系统(例如脑、神经元细胞等)的系统性转导。在其它实施方式中,实现了对心肌组织的系统性转导。
如本文所使用的,“选择性向性”或“特异性向性”是指将病毒载体递送至某些靶细胞和/或某些组织,和/或对某些靶细胞和/或某些组织的特异性转导。
在本发明的一些实施方式中,包含本发明的衣壳的AAV颗粒可表现出对30种特定组织/细胞的有效转导的多重表型,以及对某些组织/细胞 (对其的转导不期望)的极低水平的转导(例如,降低的转导)。
除非另有指出,如本文所使用的术语“多肽”涵盖肽和蛋白质。
“多核苷酸”为核苷酸碱基的序列,并且可以是RNA、DNA或 DNA-RNA杂合序列(包括天然存在和非天然存在的核苷酸两者),但在代表性的实施方式中为单链或双链DNA序列。
“嵌合核酸”包含共价连接在一起来编码融合多肽的两个以上的核酸序列。核酸可以是DNA、RNA或其杂合体。
术语“融合多肽”包括通常以肽键合共价连接在一起的两个以上的多肽。
如本文所使用的,“分离的”多核苷酸(例如,“分离的DNA”或“分离的RNA”)是指至少部分地与天然存在的有机体或病毒的至少一些其它组分相分离的多核苷酸,所述其它组分例如通常被发现与多核苷酸相关联的细胞或病毒结构组分或其它多肽或核酸。在代表性的实施方式中,与初始材料相比,“分离的”核苷酸富集至少约10倍、100倍、1000倍、 10,000倍或更多。
同样地,“分离的”多肽是指至少部分地与天然存在的有机体或病毒的至少一些其它组分相分离的多肽,所述其它组分例如通常被发现与多肽相关联的细胞或病毒结构组分或其它多肽或核酸。在代表性的实施方式中,与初始材料相比,“分离的”多肽富集至少约10倍、100倍、1000 倍、10,000倍或更多。
“分离的细胞”指与其它组分相分离的细胞,所述分离的细胞通常以其天然状态与所述其它组分相关联。例如,分离的细胞可为培养基中的细胞和/或本发明的药学上可接受的辅料中的细胞。因此,分离的细胞可被递送至和/或引入至受试者中。在一些实施方式中,分离的细胞可以是从受试者中移出并如本文所述进行离体操作后返回受试者的细胞。
如本文所使用的,“分离”或“纯化”(或语法等同物)病毒载体或病毒颗粒或病毒颗粒群意味着将该病毒载体或病毒颗粒或病毒颗粒群至少部分地与初始材料中的至少一些其它组分相分离。在代表性的实施方式中,与初始材料相比,“分离的”或“纯化的”病毒载体或病毒颗粒或病毒颗粒群富集至少约10倍、100倍、1000倍、10,000倍或更多。
除非另有说明,否则可以通过参考合适的对照来确定“有效转导”或“有效向性”或类似术语(例如分别为对照的转导或向性的至少约 10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、 65%、70%、75%、80%、85%、90%、95%、100%、125%、150%、175%、 200%、250%、300%、350%、400%、500%或更多)。在具体的实施方式中,病毒载体对于神经元细胞和心肌细胞有效转导或具有有效向性。合适的对照将取决于多种因素,包括期望的向性和/或转导概况。
“治疗性多肽”是指能够缓解、减少、预防、延迟和/或稳定由细胞或受试者中蛋白质缺乏或缺陷引起的症状的多肽,和/或是以其它方式赋予受试者益处的多肽,所述益处例如,酶替代以减少或消除疾病症状,或移植存活率的改善或免疫应答的诱导。
术语“治疗(treat/treating/treatment of)”(及其语法变体)意味着受试者病症的严重程度降低、至少部分改善或稳定;和/或实现了至少一种临床症状的一些缓解、减轻、减少或稳定;和/或疾病或紊乱的进展延迟。
术语“预防(prevent/preventing/prevention)”(及其语法变体)是指相对于在不存在本发明的方法时将会发生的情况,预防和/或延迟受试者中的疾病、紊乱和/或临床症状的发作;和/或降低疾病、紊乱和/或临床症状发作的严重程度。预防可以是完全的,例如,完全不存在疾病、紊乱和/或临床症状。预防也可以是部分的,使得受试者中的疾病、紊乱和/或临床症状的发生和/或发作的严重程度实质上小于在不存在本发明时将会发生的情况。
如本文所使用的,“治疗有效”量是足以向受试者提供一些改善或益处的量。或者说,“治疗有效”量是将在受试者中的至少一种临床症状提供一些缓解、减轻、减少或稳定的量。本领域技术人员将理解的是,只要向受试者提供了一些益处,治疗效果不必是完全的或治愈性的。
如本文所使用的“预防有效”量是相对于在不存在本发明的方法时将会发生的情况,足以预防和/或延迟受试者中的疾病、紊乱和/或临床症状的发作;和/或足以降低和/或延迟受试者中的疾病、紊乱和/或临床症状的发作的严重程度的量。本领域技术人员将理解,只要向受试者提供了一些预防益处,预防水平不必是完全的。
术语“异源核苷酸序列”和“异源核酸分子”在本文中可互换使用,并且指非天然存在于病毒中的核酸序列。通常,异源核酸分子或异源核苷酸序列包含开放阅读框,所述开放阅读编码感兴趣的多肽和/或非翻译的RNA(例如,用于递送至细胞和/或受试者),例如GAA多肽。
如本文所使用的,术语“病毒载体”、“载体”或“基因递送载体”是指作为核酸递送媒介物起作用,并且包含包装在病毒体中的载体基因组(例如病毒DNA[vDNA])的病毒(例如,AAV)颗粒。或者,在某些情况下,术语“载体”可用于指单独的载体基因组/vDNA。
“rAAV载体基因组”或“rAAV基因组”是包含一个或多个异源核酸序列的AAV基因组(即vDNA)。rAAV载体通常只需要反向末端重复序列(TR)处于顺式以产生病毒。所有其它病毒序列都是非必需的,并且可以以反式提供(Muzyczka,(1992)Curr.TopicsMicrobial.Immunol. 158:97)。通常,rAAV载体基因组将仅保留一个或多个TR序列,以使能够被载体有效包装的转基因的大小最大化。结构蛋白和非结构蛋白编码序列可以以反式提供(例如来自载体,例如质粒;或通过将序列稳定整合到包装细胞中)。在本发明的实施方式中,rAAV载体基因组包含至少一个ITR序列(例如,AAV TR序列),任选地为两个ITR(例如两个AAV TR),其通常将位于载体基因组的5'和3'端并侧接异源核酸,但不必与其邻接。TR可以彼此相同或不同。
术语“末端重复序列”或“TR”包括任何病毒末端重复序列和形成发夹结构并起到反向末端重复序列作用的合成序列(即介导期望的功能 (例如复制、病毒包装、整合和/或原病毒拯救等)的ITR)。TR可以是 AAV TR或非AAV TR。例如,非AAV TR序列(例如其它细小病毒(例如犬细小病毒(CPV)、小鼠细小病毒(MVM)、人细小病毒B-19)的非 AAV TR序列)或可以用作TR的任何其它合适的病毒序列(例如充当 SV40复制的起点的SV40发夹),其可以通过截短、置换、缺失、插入和/或添加而被进一步修饰。此外,TR可以是部分或完全合成的,例如 Samulski等的美国专利号5,478,745中所述的“双D序列”。
“AAV末端重复序列”或“AAV TR”(包括“AAV反向末端重复序列”或“AAV ITR”)可以来自任何AAV,包括但不限于血清型1、2、3、4、5、6、7、8、9、10、11或12或目前已知或今后发现的任何其它AAV (参见例如表3)。AAV末端重复序列不必具有天然的末端重复序列(例如,可以通过插入、缺失、截短和/或错义突变来改变天然的AAV TR或 AAV ITR序列),只要该末端重复序列介导期望的功能(例如复制、病毒包装、整合和/或原病毒拯救等)即可。
AAV蛋白VP1、VP2和VP3是一起相互作用而形成二十面体对称的 AAV衣壳的衣壳蛋白。VP1.5是美国公开号2014/0037585中描述的AAV 衣壳蛋白。
本发明的病毒载体还可为国际专利公开WO 00/28004和Chao等, (2000)Molecular Therapy 2:619中描述的“靶向的”病毒载体(例如,具有定向的向性)和/或“杂合的”细小病毒(即,其中病毒TR和病毒衣壳来自不同的细小病毒)。
本发明的病毒载体可以进一步如国际专利公开WO 01/92551(其公开内容通过引用的方式整体并入本文)中所述为双链体的细小病毒颗粒。因此,在一些实施方式中,可以将双链(双链体)基因组包装到本发明的病毒衣壳中。
此外,病毒衣壳或基因组元件可包含其它修饰,包括插入、缺失和/ 或置换。
本文所使用的“嵌合的”衣壳蛋白意味着通过相对于野生型而言的衣壳蛋白的氨基酸序列中的一个或多个(例如2个、3个、4个、5个、6 个、7个、8个、9个、10个等)氨基酸残基的置换,以及相对于野生型而言的氨基酸序列中的一个或多个(例如2个、3个、4个、5个、6个、 7个、8个、9个、10个等)氨基酸残基的插入和/或缺失进行修饰的AAV 衣壳蛋白。在一些实施方式中,来自一种AAV血清型的完整或部分的结构域、功能区域、表位等可以以任意组合替代不同的AAV血清型的相应的野生型结构域、功能区域、表位等,以产生本发明的嵌合的衣壳蛋白。嵌合的衣壳蛋白的产生可以根据本领域公知的方案进行,并且文献以及本文中已经描述了可被包含在本发明的衣壳中的大量的嵌合的衣壳蛋白。
如本文所使用的,术语“单倍体AAV”应意味着PCT/US18/22725 (将其并入本文)中描述的AAV。
术语“杂合”AAV载体或细小病毒是指其中病毒TR或ITR和病毒衣壳来自不同细小病毒的rAAV载体。杂合载体描述于国际专利公开WO 00/28004和Chao等,(2000)MolecularTherapy 2:619。例如,杂合AAV 载体通常包含足以进行腺病毒复制和包装的腺病毒5'和3'顺式ITR序列 (即,腺病毒末端重复序列和PAC序列)。
术语“多倍体AAV”是指由来自两种以上的AAV血清型的衣壳所组成的AAV载体,例如并可以利用各个血清型进行更强的转导,而不会在某些实施方式中消除来自亲本的向性。
如本文所使用的术语“GAA”或“GAA多肽”涵盖成熟(~76或~67kDa)GAA和前体(例如,~110kDa)GAA,以及经修饰的(例如,通过插入、缺失和/或置换而突变或截短的)GAA蛋白或其保留生物学功能的片段(即,具有天然GAA蛋白的至少一种生物学活性,例如如上定义的可以水解糖原)和GAA变体(例如,由Kunita等,(1997)Biochemica et BiophysicaActa 1362:269描述的GAA II;GAA多晶型和SNP描述于 Hirschhorn,R.和Reuser,A.J.(2001)The Metabolic and Molecular Basis for Inherited Disease(Scriver,C.R.,Beaudet.A.L.,Sly,W.S.&Valle,D.编著), pp.3389-3419,McGraw-Hill,New York,参见第3403-3405页,;以引用的方式将其整体各自并入本文)。可以使用本领域中已知的任何GAA编码序列,例如参见图8和图9的编码序列;GenBank登录号NM_00152和 Hoefsloot等,(1988)EMBO J.7:1697和Van Hove等,(1996)Proc.Natl. Acad.Sci.USA 93:65(人),GenBank登录号NM_008064(小鼠),和Kunita 等,(1997)Biochemica et Biophysics Acta1362:269(鹌鹑);由于它们对GAA编码和非编码序列的教导而以引用的方式将其公开内容并入本文。
如本文所使用的,术语“靶向肽”也称为“靶向序列”,旨在指靶向特定亚细胞区室(例如哺乳动物的溶酶体)的肽。本文涵盖以使用的靶向肽是不依赖于甘露糖-6-磷酸的溶酶体靶向肽。
术语“IGF2序列”或“IGF-2序列”与“IGF2前导序列”和“IGF-2 前导序列”结合使用,并且在本文中可互换使用,是指结合至细胞表面上的CI-MBR的IGF2多肽的序列。特别地,IGF2序列是包含SEQ ID NO: 5的IGF-2摄取(uptake)序列的部分或在SEQ ID NO:5的氨基酸中包含修饰的肽。IGF2序列是指结合至受体结构域的肽序列,所述结构域基本上由人非阳离子依赖性甘露糖-6-磷酸受体(CI-MPR或CA-M6P受体) 的第1508-1566位氨基酸、重复序列11-12或重复序列11组成。
术语“分泌信号序列”或“信号序列”或其变体在本文中可互换使用,并且旨在指发挥如下功能的氨基酸序列:与以天然多肽所见的分泌水平相比,增强(如上文所定义的)可操作连接的多肽(例如来自细胞的GAA或GAA融合蛋白)的分泌。如上文所定义的,“增强的”分泌意味着细胞分泌的、由细胞合成的溶酶体多肽的相对比例增加;分泌蛋白的绝对量不必也增加。在本发明的具体实施方式中,基本上全部(即,至少95%、97%、98%、99%或更多)的GAA多肽被分泌。然而,只要与天然的GAA多肽相比分泌水平增高,就没有必要分泌基本上全部或甚至大部分的GAA多肽。
如本文所使用的,术语“氨基酸”涵盖任何天然存在的氨基酸、其修饰形式和合成氨基酸。
并入本文以供参考的涉及、公开或描述AAV或AAV的方面(包括含有待表达的感兴趣的基因的DNA载体)的额外专利有:美国专利号 6,491,907;7,229,823;7,790,154;7,201898;7,071,172;7,892,809; 7,867,484;8,889,641;9,169,494;9,169,492;9,441,206;9,409,953;以及9,447,433;9,592,247;以及9,737,618。
II.rAAV基因组元件
如本文所公开的,所述技术的一个方面涉及一种rAAV载体,所述载体包含衣壳、以及在其衣壳内的称为“rAAV载体基因组”的核苷酸序列。rAAV载体基因组(也称为“rAAV基因组”)包含多个元件,包括但不限于两个反向末端重复序列(ITR,例如5'-ITR和3'-ITR),并且位于 ITR之间的为额外的元件,包括启动子、异源基因和poly-A尾。
在一些实施方式中,本文公开的rAAV基因组包含5'ITR和3'ITR 序列,以及位于5'ITR和3'ITR之间的启动子(例如肝特异性启动子序列),所述启动子可操作地连接至编码核酸(编码α-葡萄糖苷酶(GAA) 多肽)的异源核酸,其中,所述异源核酸序列可进一步包含以下元件中的一个或多个:内含子序列、编码分泌信号肽的核酸、编码IGF2序列的核酸和polyA序列。
在一些实施方式中,本文公开的rAAV基因组包含5'ITR和3'ITR 序列,以及位于5'ITR和3'ITR之间的启动子,所述启动子可操作地连接至编码分泌肽的异源核酸和编码α-葡萄糖苷酶(GAA)多肽的核酸(即,异源核酸编码包含信号肽-GAA多肽的GAA融合多肽),其中,rAAV基因组任选地进一步包含以下的一种或多种:内含子序列、胶原蛋白稳定性(CS)序列、polyA尾和编码至少1个氨基酸的间隔区的核酸。在一些实施方式中,本文公开的rAAV基因组包含5'ITR和3'ITR序列,以及位于5'ITR和3'ITR之间的肝启动子,所述肝启动子可操作地连接至编码分泌肽(例如,FIV、ATT或GAA信号肽)的异源核酸和编码α-葡萄糖苷酶(GAA)多肽的核酸,其中,rAAV基因组任选地进一步包含以下的一种或多种:内含子序列(例如MVM或HBB2内含子序列)、胶原蛋白稳定性(CS)序列、polyA尾和编码至少1个氨基酸的间隔区的核酸。
在一些实施方式中,本文公开的rAAV基因组包含5'ITR和3'ITR 序列,以及位于5'ITR和3'ITR之间的启动子,所述启动子可操作地连接至编码分泌肽、靶向肽和GAA多肽的异源核酸(即,异源核酸编码包含信号肽-靶向序列-GAA多肽的GAA融合多肽),其中,靶向肽是本文所述的IGF2序列,并且其中,rAAV基因组可以任选地进一步包含以下的一种或多种:内含子序列、胶原蛋白稳定性(CS)序列、polyA尾和编码至少1个氨基酸的间隔区的核酸。
本文讨论了rAAV基因组中的各个元件。
A.α-葡萄糖苷酶(GAA)多肽
α-葡萄糖苷酶(GAA)多肽是糖苷水解酶家族31的成员。人GAA 作为110kDal的前体合成(Wisselaar等,(1993)J.Biol.Chem.268(3): 2223-31)。酶的成熟形式是70kDal和76kDal的单体的混合物(Wisselaar 等,(1993)J.Biol.Chem.268(3):2223-31)。前体酶具有七个潜在的糖基化位点,并且其中四个保留在成熟酶中(Wisselaar等,(1993)J.Biol.Chem.268(3):2223-31)。产生成熟酶的蛋白切割事件发生在晚期内体中或溶酶体中(Wisselaar等,(1993)J.Biol.Chem.268(3):2223-31)。
rAAV载体基因组可以编码GAA多肽,所述GAA多肽可包括例如人GAA的第40-952位或第70-952位氨基酸残基,或较小的部分,例如第40-790位或第70-790位氨基酸残基。
在一个实施方式中,IGF2序列融合至第40位氨基酸或第70位氨基酸,或融合至第40或70位氨基酸的一个或两个位置内的氨基酸。在一些实施方式中,IGF2序列是细胞外受体的配体,例如IGF2序列结合至人非阳离子依赖性甘露糖-6-磷酸受体(CI-MPR)或IGF2受体。
人GAA多肽的前27个氨基酸是分泌蛋白和溶酶体的信号肽的代表。 GAA可以通过磷酸甘露糖基受体和/或通过与信号肽的延迟切割相关的序列而靶向至溶酶体(Hirschhorn,R.和Reuser,A.J.(2001),The Metabolic and Molecular Basis forInherited Disease,(编著,Scriver,C.R.等)第 3389-3419页(McGraw-Hill,New York)。在内质网腔中已鉴定了该酶的膜结合前体形式(即,被未切割的信号肽锚定)(参见例如,Wisselaar 等,(1993)J.Biol.Chem.268:2223-31)。
成熟的70kDal和76kDal GAA多肽类型不存在C末端的160个氨基酸。然而,导致GAA活性完全丧失的某些庞贝氏病等位基因映射到该区域,例如Val949Asp(Becker等,(1998)J.Hum.Genet.62:991)。该突变体的表型指明该蛋白的C末端部分尽管不是70kDal或76kDal类型的部分,但在该蛋白的功能中发挥重要作用。也已经报道了蛋白质的C-末端部分,尽管在加工过程中从该蛋白的其它部分中切割,但仍然与主要类型有关(Moreland等,(2004年11月1日)J.Biol.Chem.,底稿 404008200)。因此,C末端残基可以在该蛋白的催化活性中发挥直接作用,和/或可以参与促进该蛋白的N末端部分的适当折叠。
天然GAA基因编码具有如下的前体多肽:信号序列和相邻的推定的跨膜结构域、三叶草(trefoil)结构域(PFAM PF00088)(其为约45个氨基酸的富含半胱氨酸的结构域,包含3个二硫键)(Thim(1989)FEBS Lett.250:85)、由成熟的70/76kDal多肽限定的结构域和C末端结构域。已经报道,三叶草结构域和C-末端结构域都是产生功能性GAA所必需的,并且在蛋白质折叠过程中,C-末端结构域可与三叶草结构域相互作用,这可能促进了三叶草结构域中适当的二硫键的形成。
GAA多肽描述于美国专利5,962,313和6,537,785,以引用的方式将其整体并入本文。本领域普通技术人员能够知晓分泌信号肽(SS)或靶向肽(例如IGF2序列)可以融合至的GAA的特定位置。因此,一方面,本发明涉及GAA融合蛋白,其中SP或IGF2序列融合至人GAA或其部分的第40、68、69、70、71、72、779、787、789、790、791、792、793 或796位氨基酸。
在本文公开的方法和组合物的一些实施方式中,由AAV表达的人 GAA蛋白包括SEQID NO:10的氨基酸或其片段,例如从SEQ ID NO: 10的第40、68、69、70、71、72、779、787、789、790、791、792、793 或796位残基开始的人GAA蛋白。在本文公开的方法和组合物的一些实施方式中,由AAV表达的人GAA蛋白包含SEQ ID NO:10的氨基酸,或与SEQ ID NO:10具有至少60%、或70%、或80%、或85%、或90%、或95%、或98%、或99%同一性的蛋白质。在本文公开的方法和组合物的一些实施方式中,由AAV表达的人GAA蛋白包含从SEQ ID NO:10的第40、68、69、70、71、72、779、787、789、790、791、792、793 或796位残基开始的人GAA蛋白中的氨基酸,或与其具有至少60%、或 70%、或80%、或85%、或90%、或95%、或98%、或99%同一性的蛋白质中的氨基酸。
在一些实施方式中,本领域普通技术人员能够知晓分泌信号肽(SS) 或靶向肽(例如IGF2序列)可以融合至的GAA的特定位置。例如,国际专利申请WO2018046774A1(将其整体并入本文)公开了分泌信号肽 (SS)或靶向肽(例如IGF2序列)可以附着至的截短的GAA多肽,公开了如下的截短的GAA多肽变体:Δ1、Δ2、Δ3、Δ4、Δ5、Δ6、Δ7、Δ8、Δ9、Δ10、Δ11、Δ12、Δ13、Δ14、Δ15、Δ16、Δ17、Δ18、Δ19、Δ20、Δ21、Δ22、Δ23、Δ24、Δ25、Δ26、Δ27、Δ28、Δ29、Δ30、Δ31、Δ32、Δ33、Δ34、Δ35、Δ36、Δ37、Δ38、Δ39、Δ40、Δ41、Δ42、Δ43、Δ44、Δ45、Δ46、Δ47、Δ48、Δ49、Δ50、Δ51、Δ52、Δ53、Δ54、Δ55、Δ56、Δ57、Δ58、Δ59、Δ60、Δ61、Δ62、Δ63、Δ64、Δ65、Δ66、Δ67、Δ68、Δ69、Δ70、Δ71、Δ72、Δ73、Δ74或Δ75GAA截短形式。
在一些实施方式中,由本文所述的rAAV基因组编码的GAA融合多肽可包括例如人GAA的第40-952位氨基酸残基或第70-952位残基,或较小部分,例如第40-790位或第70-790位氨基酸残基。在一个实施方式中,将分泌信号肽(SS)或靶向肽(例如IGF2序列)融合至第40位氨基酸或融合至第70位氨基酸、或融合至第40或70位氨基酸的一个或两个位置内的氨基酸。
在一些实施方式中,包含分泌信号肽(SS)和GAA多肽以及任选的 IGF2序列的融合蛋白(即,SS-GAA融合多肽或SS-IGF2-GAA融合蛋白) 包含人酸性α-葡萄糖苷酶(GAA)(SEQID NO:10)的第40-952位氨基酸残基或第70-952位残基。在一些实施方式中,GAA多肽的N-末端附着至SS的C-末端,并且在一些实施方式中,GAA多肽的N-末端附着至IGF2序列的C-末端且IGF2序列的N-末端附着至分泌信号肽的C-末端。
在一个实施方式中,rAAV基因组包含编码分泌信号肽或IGF2序列的异源核酸序列,所述异源核酸序列框内(in frame)融合至编码整个 GAA多肽(例如,N-末端/催化结构域和C末端结构域)的GAA核酸序列的3'末端。例如,将编码分泌信号肽或IGF2序列的异源核酸序列框内融合至编码70kDa和76kDa GAA多肽的GAA核酸序列的3'末端,使得当rAAV载体转导哺乳动物细胞时此两种多肽均从rAAV基因组表达。在一些实施方式中,可以通过rAA基因组中的两个启动子或通过驱动双顺反子构建体表达的一个启动子来驱动GAA核酸的表达。
在本文公开的方法和组合物的一些实施方式中,rAAV载体包含编码 GAA蛋白的核酸序列,所述核酸序列是野生型GAA核酸序列,例如SEQ ID NO:11或SEQ ID NO:72。在本文公开的方法和组合物的一些实施方式中,rAAV载体包含编码GAA蛋白的核酸序列,所述核酸序列是经密码子优化的GAA核酸序列,用于增强体内表达和/或减少CpG岛和/ 或降低固有免疫应答。被涵盖以用于本文公开的方法和rAAV组合物中的示例性的密码子优化的GAA核酸序列可以选自以下中的任一种:SEQ ID NO:73、SEQ ID NO:74、SEQ ID NO:75和SEQ IDNO:76,或与SEQ ID NO:73、SEQ ID NO:74、SEQ ID NO:75和SEQ ID NO: 76具有至少60%、或70%、或80%、或85%、或90%、或95%、或98%、或99%序列同一性的核酸序列。
GAA的C-末端结构域以反式与70/76kDal类型结合而发挥功能,以生成活性GAA。催化结构域和C-末端结构域之间的边界看起来位于第 791位氨基酸残基处,依据为它存在于少于18个氨基酸的短区域中,所述区域在水解酶家族31的大多数成员中不存在,并且在GAA中含有4 个连续的脯氨酸残基。已经报道,与成熟类型相关的C-末端结构域始于第792位氨基酸残基(Moreland等,(2004年11月1日)J.Biol.Chem.,底稿404008200)。因此,在一些实施方式中,GAA核酸序列编码除了 C-末端结构域之外的整个GAA多肽。因此,在此类实施方式中,rAAV 载体可以用于转导将GAA的C-末端结构域作为单独的多肽来表达的哺乳动物细胞。
此外,患有庞贝氏病或GSD的患者可受益于优化形式的GAA的给予。例如,已经显示(Sun等,(2013)Mol Genet Metab 108(2):145; WO2010/005565)GAA的给予减少了糖原贮积病III型(GSD III)患者的原代成肌细胞中的糖原。
B.分泌信号肽
天然GAA信号肽在ER中未被切割,从而引起天然GAA多肽在ER 中被膜结合(Tsuji等,(1987)Biochem.Int.15(5):945-952)。在某些细胞类型中,可以发现GAA多肽与质膜结合,保留了ER的膜拓扑学,这可能是由于未能切割信号肽而引起的(Hirschhorn等,在TheMetabolic and Molecular Basis of Inherited Disease中,Valle编著,2001, McGraw-Hill,New York,pp.3389-3420)。
可以通过用GAA的替代信号肽替代内源性GAA信号肽(和任选的相邻序列)来实现GAA的膜结合的破坏。
因此,本文公开的rAAV基因组包含编码分泌信号肽的异源核酸序列。在代表性的实施方式中,本文公开的rAAV载体和rAAV基因组进一步包含编码待转移至靶细胞的GAA多肽的异源核酸。异源核酸与编码分泌信号肽的区段可操作地结合,从而在转录和翻译时产生融合多肽,所述融合多肽包含与GAA多肽可操作地结合(例如,指导GAA多肽的分泌)的分泌信号序列。
在一些实施方式中,分泌信号肽与感兴趣的多肽是异源的(即,外来的或外源的)。例如,如果分泌信号肽是纤连蛋白分泌信号肽,则感兴趣的多肽不是纤连蛋白。在一些实施方式中,分泌信号肽选自以下中的任一种:AAT信号肽、纤连蛋白信号肽(FN1),或AAT、FN1或GAA 信号肽具有分泌信号活性的活性片段。在替代实施方式中,分泌信号肽与GAA非异源,即信号肽是GAA信号肽(即,天然GAA多肽的第1-27 位残基)。
通常,分泌信号肽将位于融合多肽的氨基末端(N-末端)(即,编码分泌信号肽的核酸区段位于本文公开的rAAV载体或rAAV基因组中的编码GAA肽或GAA融合肽的异源核酸的5'端)。或者,分泌信号可以位于羧基末端或包埋在GAA多肽或GAA融合多肽(例如,IGF2-GAA融合多肽)内,只要该分泌信号可操作地与其结合并指导感兴趣的GAA多肽或GAA融合多肽(具有或没有来自GAA多肽的信号肽的切割)从细胞中分泌即可。
分泌信号与感兴趣的多肽可操作地结合,从而使GAA多肽或GAA 融合多肽靶向至分泌途径。换句话说,分泌信号与GAA多肽可操作地结合,从而使得与不存在分泌信号肽的情况相比,GAA多肽或GAA融合多肽以更高的水平(即,更大的量)从细胞中分泌。分泌信号肽指导GAA 多肽或GAA融合多肽分泌的程度并不关键,只要其提供期望水平的分泌和/或调节GAA多肽的表达即可。本领域技术人员将知晓,当分泌蛋白过度表达时,它们通常使细胞分泌机制饱和(saturate)并保留在细胞内。通常,至少约20%、30%、40%、50%、70%、80%、85%、90%、95%或更多的GAA多肽或IGF2-GAA融合多肽(单独和/或与信号肽融合)从细胞中分泌。在其它实施方式中,基本上所有可检测的多肽(单独和/或以融合多肽的形式)从细胞中分泌。
短语“从细胞中分泌”指多肽可被分泌到细胞外的任何区室(例如,流体或空间)中,包括但不限于:组织间隙(interstitial space)、血液、淋巴、脑脊液、肾小管、气道通道(例如肺泡、细支气管和支气管、鼻腔通道等)、胃肠道(例如食道、胃、小肠、结肠等)、眼睛中的玻璃体液和耳蜗内淋巴等。
在一个实施方式中,rAAV基因组包含异源核酸,所述异源核酸编码融合至GAA多肽的分泌信号肽(SP)。在替代的实施方式中,rAAV基因组包含异源核酸,所述异源核酸编码融合至GAA融合多肽的分泌信号肽(SP),其中GAA融合多肽包括融合至GAA多肽的靶向肽(例如IGF2 序列)。因此,本文公开的信号肽增加了GAA多肽或IGF2-GAA融合多肽从转导有rAAV载体或包含本文所述的rAAV基因组的细胞中分泌的功效。
因此,在一些实施方式中,本文公开的rAAV基因组包含5'ITR和 3'ITR序列,以及位于5'ITR和3'ITR之间的启动子,所述启动子可操作地连接至编码分泌肽的异源核酸和编码α-葡萄糖苷酶(GAA)多肽的核酸(即,异源核酸编码包含信号肽-GAA多肽的GAA融合多肽)。
在替代的实施方式中,本文公开的rAAV基因组包含5'ITR和3'ITR 序列,以及位于5'ITR和3'ITR之间的启动子,所述启动子可操作地连接至编码分泌肽的异源核酸和编码α-葡萄糖苷酶(GAA)融合多肽的核酸,其中,融合蛋白包含IGF2序列和GAA多肽(即,异源核酸编码包含信号肽-IGF2-GAA多肽的GAA融合多肽)。
在一些实施方式中,分泌信号肽(也称为信号肽)引起至少约50%、 60%、75%、85%、90%、95%、98%或更多的GAA多肽或GAA融合多肽从细胞中分泌。从rAAV基因组表达且从细胞中分泌的GAA多肽(例如,包含信号肽-GAA(SP-GAA)的融合多肽或包含信号肽-靶向肽-GAA (例如SP-IGF2-GAA融合多肽)的融合蛋白)的相对比例可以通过本领域已知的方法和如实施例中所述的方法(例如通过测量上清液中的GAA 活性)确定。分泌的蛋白可以在细胞培养基、血清、乳制品等中通过直接测量蛋白质本身(例如通过蛋白质免疫印迹)或通过蛋白质活性测定 (例如酶测定)来检测。
通常,分泌信号肽在内质网内切割,并且在一些实施方式中,分泌信号肽在分泌之前从GAA多肽切割。但是,只要GAA多肽或IGF2-GAA 融合多肽从细胞中的分泌增强并且GAA多肽具有功能,切割分泌信号肽不是必须的。因此,在一些实施方式中,分泌信号肽被部分或完全保留。
在一些实施方式中,本文公开的rAAV基因组或分离的核酸包含编码嵌合多肽的核酸,所述嵌合多肽包含可操作地连接至分泌信号肽的 GAA多肽,并且该嵌合多肽从转导有rAAV载体的细胞中表达和产生,并且GAA多肽从细胞中分泌。GAA多肽或GAA融合多肽(例如IGF2-GAA融合多肽)可在切割全部或部分的分泌信号肽后被分泌。或者,GAA多肽或GAA融合多肽(例如,IGF2-GAA融合多肽)可以保留分泌信号肽(即,分泌信号不被切割)。因此,在这种背景下,“GAA 多肽或GAA融合多肽”可以是包含分泌肽的嵌合多肽。
本领域技术人员将进一步理解,嵌合多肽可以包含额外的氨基酸,例如,作为核酸构建体的操纵(例如添加限制性位点)的结果,只要这些额外的氨基酸不使分泌信号序列或GAA多肽或GAA融合多肽(例如 IGF2-GAA融合多肽)失去功能。只要保留不产生非功能性GAA多肽,额外的氨基酸就可以被成熟的GAA多肽切割或保留。
在代表性的实施方式中,分泌信号肽替代见于天然GAA多肽中的大部分、基本上全部或全部序列。在具体实施方式中,只要增强了GAA多肽或GAA融合多肽(例如IGF2-GAA融合多肽)的分泌并且成熟GAA 多肽具有功能,就保留大部分或全部的GAA的天然序列。
不希望受理论的束缚,通常认为分泌信号序列指导新生多肽插入内质网中,它从内质网转运到高尔基体,然后与细胞膜融合以从细胞中分泌多肽。通常,分泌信号在加工过程中从多肽上切割下来,这被认为发生在内质网中。在本发明的融合多肽的情况下,分泌信号肽不必完全或根本不从嵌合GAA多肽或嵌合IGF2-GAA融合多肽上切割下来。在一些实施方式中,分泌信号肽可以被基本上完全切割;或者,在一些细胞中,可能存在不完全切割或基本上没有切割。尽管不希望限于任何特定的理论,但是在一些实施方式中,看起来一些或全部分泌信号肽的保留(即,未切割)使所得的嵌合GAA多肽或嵌合IGF2-GAA融合多肽稳定。
在一些实施方式中,分泌信号肽仅从多肽中部分地除去,即,至少约1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、12个或甚至15个或更多个氨基酸残基被分泌的多肽保留。仅出于说明目的,使用纤连蛋白信号肽作为示例性信号肽,SEQ ID NO:18的第22位(Val) 至第32位(Arg)、第23位(Arg)至第32位(Arg)、第24位(Cys) 至第32位(Arg)、第25位(Thr)至第32位(Arg)或第26位(Glu) 至第32位(Arg)氨基酸可以被分泌的多肽保留。
被涵盖以用于本文公开的rAAV基因组中的分泌信号肽可以全部或部分从分泌多肽的分泌信号衍生而来(即,来自前体)和/或可以全部或部分地合成。如本领域技术人员将知晓的,分泌信号序列通常跨物种地操作。因此,分泌信号肽可以来自任何来源的物种,包括动物(例如,禽类和哺乳动物,例如人、猿猴和其它非人灵长类动物、牛科动物、绵羊、山羊、马科动物、猪、犬科动物、猫科动物、大鼠、小鼠、兔类动物)、植物、酵母、细菌、原生动物或真菌。分泌信号序列的长度并不关键;通常,已知的分泌信号序列的长度为约10-15个至50-60个氨基酸。此外,可以改变或修饰来自分泌的多肽的已知分泌信号(例如,通过氨基酸的置换、缺失、截短或插入),只要所得的分泌信号序列起到增强可操作连接的GAA多肽或GAA融合多肽(例如,IGF2-GAA融合多肽) 的分泌的作用。
本发明的分泌信号序列不限于任何特定的长度,它们将感兴趣的多肽指导至分泌通路。在代表性的实施方式中,信号肽的长度至少为约6、 8、10、12、15、20、25、30或35个氨基酸,上至约40、50、60、75 或100个氨基酸的长度或更长。
在本文公开的rAAV载体中编码和由rAAV基因组编码的分泌信号肽可以包含天然存在的分泌信号序列或其修饰,基本上由天然存在的分泌信号序列或其修饰组成,或由天然存在的分泌信号序列或其修饰组成。指导从细胞分泌的大量的分泌的蛋白和序列是本领域已知的。示例性的分泌的蛋白(及它们的分泌信号)包括但不限于:红细胞生成素、凝血因子IX、胱抑素、乳转铁蛋白、血浆蛋白酶C1抑制剂、载脂蛋白(例如APO A、C、E)、MCP-1、α-2-HS-糖蛋白、α-1-微球蛋白、补体(例如C1Q、C3)、玻连蛋白、淋巴毒素-α、天青杀素(azurocidin)、VIP、金属蛋白酶抑制剂2、磷酯酰肌醇蛋白聚糖-1(glypican-1)、胰激素、簇集蛋白、肝细胞生长因子、胰岛素、α-1-抗胰凝乳蛋白酶、生长激素、IV 型胶原酶、鸟苷蛋白、备解素、脑啡肽原A、抑制素β(例如A链)、前白蛋白、血管生成素、促黄体素(例如β链)、胰岛素样生长因子结合蛋白1和2、激活剂前体多肽、纤维蛋白原(例如,β链)、胃三酰甘油脂肪酶、中期因子(midkine)、中性粒细胞防御素1、2和3、α-1-抗胰蛋白酶、基质gla-蛋白、α-类胰蛋白酶、胆盐活化的脂肪酶、胰凝乳蛋白酶原 B、弹性蛋白、IGλ链V区、血小板因子4变体、嗜铬粒蛋白A、WNT-1 原癌基因蛋白、抑瘤素M、β-新内啡肽-强啡肽、von Willebrand因子、血浆丝氨酸蛋白酶抑制剂、血清淀粉样A蛋白、巢蛋白、纤连蛋白、肾素、骨粘连蛋白、富组蛋白3(histatin 3)、磷脂酶A2、软骨基质蛋白、 GM-CSF、基质溶解因子、神经内分泌蛋白7B2、胎盘蛋白11、凝溶胶蛋白、M-CSF、转钴胺素I、乳糖酶-根皮苷水解酶、弹性蛋白酶2B、胃蛋白酶原A、MIP1-β、催乳素、胰蛋白酶原II、胃泌素释放肽2、心钠素、分泌性碱性磷酸酶、胰α-淀粉酶、分泌粒蛋白I、β-酪蛋白、血清转铁蛋白、组织因子途径抑制剂、促卵泡素β链、凝血因子XII、生长激素释放因子、前列腺精浆蛋白、白介素(例如2、3、4、5、9、11)、抑制素(例如α链)、血管紧张素原、甲状腺球蛋白、IG重链或轻链、纤溶酶原激活物抑制剂-1、溶菌酶C、纤溶酶原激活物、antileukoproteinase 1、富酪蛋白、纤蛋白-1、异构体(isoform)B、尿调节素、甲状腺素结合球蛋白、 axonin-1、子宫内膜α-2球蛋白、干扰素(如α、β、γ)、β-2-微球蛋白、胆囊收缩素原(procholecystokinin)、胃亚蛋白酶原(progastricsin)、前列腺酸磷酸酶、骨唾液蛋白2、共脂肪酶、阿尔兹海默氏淀粉样A4蛋白、 PDGF(例如A或B链)、凝血因子V、三酰基甘油脂酶、结合珠蛋白2、皮质类固醇结合球蛋白、三酰基甘油脂酶、松弛素原H2、卵泡抑素1和2、血小板糖蛋白IX、GCSF、VEGF、肝素辅因子II、抗凝血酶III、白血病抑制因子、间质胶原酶、多效生长因子、小诱导型细胞因子A1、黑色素浓缩激素、血管紧张素转化酶、胰蛋白酶抑制剂、凝血因子VIII、甲胎蛋白、α-乳清蛋白、senogelin II、κ酪蛋白、胰高血糖素、促甲状腺素β链、转钴胺素II、血小板反应蛋白1、甲状旁腺素、血管加压素和肽素、组织因子、胃动素、MPIF-1、激肽原、神经内分泌转化酶2、干细胞因子前胶原α1链、血浆激肽释放酶角化细胞生长因子,以及任何其它分泌的激素、生长因子、细胞因子、酶、凝血因子、乳蛋白、免疫球蛋白链等。
在一些实施方式中,在本文公开rAAV载体中编码和由rAAV基因组编码的其它的分泌信号肽可以选自但不限于来自以下的分泌信号序列:前组织蛋白酶原L(例如,GenBank登录号KHRTL,NP_037288、 NP_034114、AAB81616、AAA39984、P07154、CAA68691;以引用的方式将它们的公开内容整体并入本文),以及前α2型胶原蛋白原(例如, GenBank登录号CAA98969、CAA26320、CGHU2S、NP_000080、 BAA25383、P08123;以引用的方式将它们的公开内容整体并入本文)以及它们的等位基因变体、修饰和功能性片段(如上文关于纤连蛋白分泌信号序列所讨论的)。对于前组织蛋白酶原L(褐家鼠(Rattus norvegicus) 而言,示例性的分泌信号序列包括MTPLLLLAVLCLGTALA[SEQ ID NO: 27];登录号CAA68691),以及对于前α2型胶原蛋白原(智人(Homo sapiens)而言,示例性的分泌信号序列包括MLSFVDTRTLLLLAVTLCLATC[SEQ ID NO:28];登录号CAA98969)。还涵盖更长的氨基酸序列,其包含来自前组织蛋白酶原L和前α2型胶原蛋白原或它们的功能片段的全长分泌信号序列(如上文关于纤连蛋白分泌信号序列所讨论的)
在一些实施方式中,分泌信号肽部分地或全部地衍生自由肝细胞产生的分泌的多肽。在一些实施方式中,分泌信号肽可以进一步全部或部分为合成或人工的。合成或人工的分泌信号肽在本领域中是已知的,参见例如Barash等,“Human secretory signal peptidedescription by hidden Markov model and generation of a strong artificialsignal peptide for secreted protein expression”,Biochem.Biophys.Res.Comm.294:835-42(2002);以引用的方式将其公开内容整体并入本文。在具体实施方式中,分泌信号肽包含以下人工分泌信号、基本上由以下人工分泌信号组成或由以下人工分泌信号组成:MWWRLWWLLLLLLLLWPMVWA(SEQ ID NO:29) 或其具有1个、2个、3个、4个或5个氨基酸置换(可选地,保守氨基酸置换,保守氨基酸置换是本领域已知的)的变体。
纤连蛋白分泌信号肽
在一些实施方式中,分泌信号肽是纤连蛋白分泌信号肽,该术语包括天然存在的序列的修饰(如下文更详细描述)。
在一些实施方式中,分泌信号肽是纤连蛋白信号肽,例如人纤连蛋白的信号序列或来自大鼠纤连蛋白的信号序列。被涵盖以用于本文所述的rAAV基因组和rAAV载体中的纤连蛋白(FN1)信号序列和经修饰的 FN1信号肽在美国专利7,071,172中公开,以引用的方式将其整体并入本文。
因此,本发明的纤连蛋白分泌信号序列可以源自任何物种,包括但不限于禽类(例如,鸡、鸭、火鸡、鹌鹑等)、哺乳动物(例如,人、猿、小鼠、大鼠、牛科动物、绵羊、山羊、马科动物、猪、兔类动物、猫科动物、犬科动物等)和其它动物,包括秀丽隐杆线虫(Caenorhabditiselegans)、非洲爪蟾(Xenopus laevis)和斑马鱼(Danio rerio)。示例性的纤连蛋白分泌信号序列的实例包括但不限于美国专利7,071,172(以引用的方式将其整体并入本文)的表1中所列出的那些。
表3示例性的纤连蛋白(FN1)分泌信号肽
Figure BDA0003166136840000421
编码褐家鼠的纤连蛋白分泌信号序列的示例性的核苷酸序列见于 GenBank登录号X15906,以引用的方式将其公开内容并入本文。作为另一说明性序列,编码人纤连蛋白1、转录变体1的分泌信号肽的核苷酸序列(登录号NM_002026、第268-345位核苷酸;登录号NM_002026的公开内容以引用的方式整体并入本文)。另一个示例性的分泌信号序列由编码非洲爪蟾纤连蛋白的分泌信号肽的核苷酸序列编码(登录号M77820,第98-190位核苷酸,登录号M77820的公开内容以引用的方式整体并入本文)。
在另一实施方式中,纤连蛋白信号序列(FN1,第208-303位核苷酸, 5′-ATG CTCAGG GGT CCG GGA CCC GGG CGG CTG CTG CTG CTA GCA GTC CTG TGC CTG GGG ACA TCGGTG CGC TGC ACC GAA ACC GGG AAG AGC AAG AGG-3′,SEQ ID NO:23)衍生自大鼠纤连蛋白mRNA序列(Genbank登录#X15906),并编码以下肽信号序列: Met Leu Arg Gly Pro GlyPro Gly Arg Leu Leu Leu Leu Ala Val Leu Cys Leu Gly Thr Ser Val Arg Cys ThrGlu Thr Gly Lys Ser Lys Arg(SEQ ID NO:18)。
在一些实施方式中,编码大鼠纤连蛋白信号肽的核酸序列不包含切割位点的3′端的核苷酸序列(即,编码切割位点的C-末端的氨基酸)。如本领域技术人员将知晓的,纤连蛋白分泌信号肽通常通过细胞内肽酶的切割作用而从纤连蛋白前体中切割。
本领域技术人员将知晓,分泌信号序列可编码位于肽酶切割位点的 C-末端侧的一个、两个、三个、四个、五个或全部六个或更多个氨基酸 (由↑标识)(参见例如,表3中的SEQ ID NO:19和SEQ ID NO:24)。本领域技术人员将知晓,切割位点的羧基末端侧的额外的氨基酸(例如1 个、2个、3个、4个、5个、6个或更多个氨基酸)可以被包含在分泌信号序列中。
在一些实施方式中,rAAV基因组可编码来自不同于本文具体公开的那些的物种的纤连蛋白分泌信号肽,以及保留分泌信号活性的其等位基因变异和修饰(例如,与不存在分泌信号肽观察到的情况相比,赋予相关多肽更高的分泌水平[即,量],换句话说,具有本文具体公开的分泌信号肽的分泌信号活性的至少50%、70%、80%或90%或更多,或甚至具有更高水平的分泌信号活性)。仅出于说明目的,在本文公开的rAAV基因组中编码的纤连蛋白分泌信号肽还可以包含全长分泌信号肽的功能部分或片段(例如,表3中示出的氨基酸序列的功能片段(纤连蛋白信号序列))。片段的长度并非关键,只要它具有分泌信号活性即可(例如,与不存在分泌信号肽观察到的情况相比,赋予相关多肽更高的分泌水平 [即,量])。说明性片段包含全长分泌信号肽的至少10个、12个、15个、 18个、20个、25个或27个连续氨基酸(例如,表3中示出的氨基酸序列的片段,即SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:20、SEQ ID NO:22的FN1信号肽,分别由SEQ ID NO:23、SEQ ID NO:24、 SEQ ID NO:25和SEQID NO:26的核酸编码)。
在本发明的实施方式中,与本文具体公开的序列相比,功能片段具有至少约50%、70%、80%、90%或更高的分泌信号活性,或者甚至具有更高水平的分泌信号活性。
同样,本领域技术人员将知晓,根据本发明的术语“纤连蛋白信号序列”涵盖了包含全长纤连蛋白分泌信号(或其具有分泌信号活性的片段)的较长的氨基酸序列(和编码该序列的核苷酸序列)。可以将额外的氨基酸(例如1个、2个、4个、6个、8个、10个、15个或甚至更多个氨基酸)添加至纤连蛋白分泌信号序列,而不会不当地影响其分泌信号活性(与不存在分泌信号肽观察到的情况相比,赋予相关多肽更高的分泌水平[即,量],换句话说,与本文具体公开的序列相比,具有至少约 50%、70%、80%或90%或更高的分泌信号活性,或甚至具有更高水平的分泌信号活性)。例如,本领域技术人员将知晓,通常可以在分泌信号序列的任一端添加肽切割位点(如上所述)或限制酶位点。具有其它功能的额外序列也可以融合至纤连蛋白分泌信号序列(例如,编码促进多肽或间隔区序列纯化的多聚His尾或FLAG序列的序列)。另外,可以添加编码增强感兴趣的多肽的稳定性的多肽的序列,例如,编码麦芽糖结合蛋白(MBP)或谷胱甘肽-S-转移酶的序列。
分泌信号序列可以进一步来自与纤连蛋白分泌信号序列有关的上述任何物种。将纤连蛋白分泌信号序列与来自组织蛋白酶L和α2型胶原蛋白前体的分泌信号序列进行的比较引起对核心或经典的氨基酸序列的鉴定:LLLLAVLCLGT(SEQ ID NO:64)。因此,在一些实施方式中,rAAV 基因组包含嵌合核酸序列,该嵌合核酸序列包含经典的氨基酸序列LLLLAVLCLGT(SEQ ID NO:64)。
同样,本领域技术人员将知晓,本文具体公开的分泌信号序列将通常耐受氨基酸序列中的置换并保留分泌信号活性(例如,本文具体公开的分泌信号肽的至少50%、70%、80%、90%、95%或更高的分泌信号活性)。为了鉴定除本文具体公开的那些分泌信号肽之外的本发明的分泌信号肽,氨基酸置换可以基于本领域已知的任何特征,包括氨基酸侧链取代基的相对相似性或差异性,例如它们的疏水性、亲水性、电荷、尺寸等。
肽酶切割位点
在一些实施方式中,可将一个或多个外源肽酶切割位点插入分泌信号肽-GAA融合多肽中,例如,在分泌信号肽与GAA多肽之间。在具体的实施方式中,将自体蛋白酶(例如口蹄疫病毒2A自体蛋白酶)插入到分泌信号肽与GAA多肽或IGF2-GAA融合多肽之间。在其它实施方式中,采用可以通过添加外源蛋白酶来控制的蛋白酶识别位点(例如,胰蛋白酶的Lys-Arg识别位点、曲霉KEX2样蛋白酶的Lys-Arg识别位点、金属蛋白酶的识别位点、丝氨酸蛋白酶的识别位点等)。
在一些实施方式中,信号肽侧接有肽酶切割位点,所以可以将信号肽除去。因此,在一些实施方式中,rAAV基因组包含编码信号肽的核酸,所述信号肽具有N-末端或C-末端切割位点,或N-末端和C-末端切割位点。在一些实施方式中,N-末端切割位点被与C-末端切割位点相同的酶切割,以及在一些实施方式中,N-末端切割位点与C-末端切割位点被不同的酶切割。
尽管在本发明的特定实施方式中并非必需,但编码rAAV基因组的 GAA多肽的异源核酸编码GAA多肽的成熟形式(例如,排除在多肽加工期间通常去除的任何前体序列)。同样,可以修饰GAA多肽序列以删除或使天然靶向或加工信号失活(例如,如果它们干扰依据本发明的多肽的期望分泌水平)。
C.IGF2序列
在一个实施方式中,rAAV基因组包含编码融合至GAA多肽的靶向肽的异源核酸。在一些实施方式中,靶向肽是细胞外受体的配体。在一些实施方式中,靶向肽是结合靶细胞表面上的受体的胞外结构域的靶向结构域,并且在受体内化时,允许多肽在人溶酶体中定位。在一个实施方式中,靶向肽包含能够结合非阳离子依赖的甘露糖-6-磷酸受体的尿激酶型纤溶酶原受体部分。在一些实施方式中,靶向肽并入了IGF2序列的一个或多个氨基酸序列。
IGF2也以别名为人所知:11号染色体开放阅读框43、胰岛素样生长因子2、IGF-II、FLJ44734、IGF2、生长介素A和preptin。野生型人 IGF2序列的mRNA对应于:
GCTTACCGCCCCAGTGAGACCCTGTGCGGCGGGGAGCTGGTGGACACCCTCCAGTTCGTC TGTGGGGACCGCGGCTTCTACTTCAGCAGGCCCGCAAGCCGTGTGAGCCGTCGCAGCCGT GGCATCGTTGAGGAGTGCTGTTTCCGCAGCTGTGACCTGGCCCTCCTGGAGACGTACTGT GCTACCCCCGCCAAGTCCGAG(SEQ ID NO:1)。全长IGF2蛋白(包括IGF2 前导序列)由NM_000612.6的核酸序列编码,并且编码全长IGF2蛋白NP_000603.1。
人IGF2的编码序列在美国专利8,492,388(参见例如图2)中公开,以引用的方式将其整体并入本文。IGF2蛋白作为前蛋白原合成,其具有位于氨基末端的24个氨基酸的肽信号和89个氨基酸的羧基末端区域,二者均在翻译后被去除,综述于O′Dell等,(1998)Int.J.Biochem Cell Biol. 30(7):767-71。成熟的蛋白质是67个氨基酸。美国专利8,492,388(参见例如8,492,388的图3)(Langford等,(1992)Exp.Parasitol.74(3):360-1) 公开了成熟IGF2的利什曼原虫密码子优化形式。制成含有成熟多肽的第 1-7位氨基酸的缺失(Δ1-7)、第27位残基从酪氨酸变为亮氨酸(Y27L) 或这两种突变(Δ1-7、Y27L)的额外的盒,以产生如下所述仅对所期望的受体具有特异性的IGF-II盒。野生型、Y27L、Δ1-7和Y27LΔ1-7IGF2 变体被涵盖以用于本文中。
成熟的人IGF2序列如下所示:
Figure BDA0003166136840000461
在一些实施方式中,rAAV基因组包含编码融合蛋白的核酸,其中,将编码如下的核酸融合至编码GAA蛋白的核酸的5′端,创建融合蛋白(例如,IGF2-GAA融合多肽),所述融合蛋白可被多种细胞类型摄取并转运至溶酶体:成熟的IGF2多肽(SEQ ID NO:5)或IGF2序列变体(例如 SEQ ID NO:6(IGF2-Δ2-7)、SEQ ID NO:7(IGF2-Δ1-7)、SEQ ID NO:8 (IGF2--Δ1-42)、SEQ ID NO:9(IGF2-V43M)或与SEQ ID NO:5-SEQ ID NO:9具有至少85%或90%或95%的序列同一性的序列。或者,可将编码前体IGF2多肽的核酸融合至GAA基因的3′端;所述前体包含在哺乳动物细胞中被切割以产生成熟的IGF2多肽的羧基末端部分,但是优选地省略IGF2信号肽(或移至GAA基因的5′端)。与涉及糖基化的方法相比,该方法具有许多优点,包括简单性和成本效益,因为一旦分离出蛋白质,就无需进行进一步的修饰。
rAA基因组可以编码衍生自IGF2的靶向肽以靶向CI-MPR。或者,在一些实施方式中,可以采用优先结合于肌管表面上的受体的靶向肽。此类肽已经被描述(Samoylova等,(1999)Muscle and Nerve 22:460;U.S. Pat.No.6,329,501)。其它细胞表面受体(例如Fc受体、LDL受体或转铁蛋白受体)也是合适的靶标,并且可以促进GAA的靶向。
在一些实施方式中,被涵盖以用于本文中的IGF2序列在美国专利 7,785,856和9,873,868中描述,以引用的方式将它们的整体各自并入本文。
IGF2的缺失突变体
在一些实施方式中,IGF序列包含可以以高亲和力结合至M6P/IGF2 受体的IGF2的最小区域。在IGF2结合至M6P/IGF2受体中涉及的残基大部分聚集在IGF2的一个面上(Terasawa等,(1994)EMBO J.13(23): 5590-7)。尽管通常通过三个分子内二硫键维持IGF2的三级结构,但可以将并入了IGF2的M6P/IGF2受体结合表面上的氨基酸序列的肽设计为适当折叠,并具有结合活性。此类最小结合肽是高度优选的靶向部分。基于第48-55位氨基酸周围区域设计的肽可以测试对M6P/IGF2受体的结合。或者,可以通过酵母双杂交测定法或通过噬菌体展示型测定法对肽的随机文库筛选结合M6P/IGF2受体的能力。
在一些实施方式中,IGF2序列是可以以高亲和力结合至M6P/IGF2 受体的IGF2的最小区域。在IGF2结合至M6P/IGF2受体中涉及的残基大部分聚集在IGF2的一个面上(Terasawa等,(1994)EMBO J.13(23): 5590-7)。尽管通常通过三个分子内二硫键维持IGF2的三级结构,但可以将并入了IGF2的M6P/IGF2受体结合表面上的氨基酸序列的肽设计为适当折叠,并具有结合活性。此类最小结合肽是本文高度优选的IGF2序列。基于第43-55位或第48-55位氨基酸周围区域设计的肽可测试对 M6P/IGF2受体的结合。
在具体实施方式中,IGF2序列包含位于第43位缬氨酸处的修饰,其中,缬氨酸被修饰为met(V43M),从而使得翻译起始于第43位氨基酸。被涵盖以在本文中用作靶向肽或IGF2序列的具有V43M修饰的IGF2 序列结合非阳离子依赖性甘露糖-6-磷酸受体。在替代的实施方式中, IGF2是具有V43改变至Met的Δ1-42的IGF2(即,IGF2-Δ1-42(SEQ ID NO:8)或IGF2-V43M(SEQ ID NO:9))。
IGF-I和非阳离子依赖性M6P受体的结合表面在IGF2的分开的面上,并且可以构建功能性非阳离子依赖性M6P结合结构域,其实质上小于人IGF2。例如,可以删除或替换人IGF2蛋白的氨基末端第2-7位或第1-7位氨基酸和/或羧基末端第62-67位残基。另外,可以任选地消除或替换第29-40位氨基酸,而不改变多肽其余部分的折叠或与非阳离子依赖性M6P受体的结合。因此,在一些实施方式中,用于融合至GAA 多肽的IGF2序列可包含IGF2的第8-28位和第41-61位氨基酸。在一些实施方式中,这些氨基酸段可以直接连接或通过接头分开。或者,可以在分开的多肽链上提供第8-28位和第41-61位氨基酸。在一些实施方式中,IGF2的第8-28位氨基酸或其保守置换变体可以融合至GAA多肽以从rAVV载体表达IGF2-GAA融合蛋白,并且单独的rAAV载体可以表达IGF2第41-61位氨基酸、或其保守置换变体。
为了促进IGF2序列的正确呈现和折叠,可以使用IGF2蛋白的较长部分。例如,可以使用包含第1-67位、第1-87位氨基酸残基或整个前体形式的IGF2标签。
在一些实施方式中,IGF2序列是编码以下任一项的IGF2靶向肽的核酸序列:SEQID NO:5的野生型成熟人胰岛素样生长因子II(IGF2) 的后随着第8-67位残基的第1位残基(即SEQ ID NO:6;即IGF2-delta 2-7);SEQ ID NO:5的野生型成熟人胰岛素样生长因子II(IGF2)的第 8-67位残基(即SEQ ID NO:7;IGF2-delta 1-7)或SEQ ID NO:5的野生型成熟人胰岛素样生长因子II(IGF2)的第43-67位残基(即, IGF2-V43M(SEQ ID NO:9)或IGF-delta 1-42(SEQ ID NO:8))。
在本文公开的方法和组合物的一些实施方式中,IGF2序列是选自包含以下任一项的任意核酸序列的核酸序列:SEQ ID NO:2(即,IGF2-delta 2-7);SEQ ID NO:3(即IGF2-delta 1-7)或SEQ ID NO:4(即IGF2-V43M) 或与其具有至少85%、90%、95%、96%、97%、98%或99%序列同一性的序列。
SEQ ID NO:2(即,IGF2-delta 2-7)如下:
Figure BDA0003166136840000491
SEQ ID NO:3(即,IGF2-delta 1-7)如下:
Figure BDA0003166136840000492
SEQ ID NO:4(即,IGF2-V43M)如下:
Figure BDA0003166136840000493
在一些实施方式中,为了促进IGF2序列的恰当呈现和折叠,可以使用IGF2蛋白的较长部分。例如,可以使用包含第1-67位、第1-87位氨基酸残基或整个前体形式的IGF2序列。
经修饰的IGF2序列和IGF2同源物
在一些实施方式中,可以修饰编码IGF2的核酸以减少其对IGFBP 的亲和力,和/或降低与IGF-I受体结合的亲和力,从而增加对溶酶体的靶向并增加融合的GAA-多肽的生物利用度。
IGF2序列优选地特异性地靶向至M6P受体。特别有用的是在IGF2 多肽中具有突变的IGF2序列,其产生以高亲和力结合CI-MPR/M6P受体、而不再以明显的亲和力结合其它两个受体的蛋白。
还可以修饰IGF2序列以最小化对血清IGF结合蛋白(IGFBP)(Baxter (2000)Am,J.Physiol Endocrinol Metab,278(6):967-76)和对IGF-I 受体的结合,以避免IGF2构建体的螯合(sequestration)。许多研究已经定位了IGF-1和IGF2中结合至IGF结合蛋白所需的残基。可以对具有这些残基处的突变的构建体筛选对M6P/IGF2受体的高亲和力结合的保留、以及对IGF结合蛋白的降低的亲和力。例如,据报道,用Ser代替IGF2 的Phe 26降低了IGF2对IGFBP-1和IGFBP-6的亲和力,而对与M6P/IGF2 受体的结合没有影响(Bach等,(1993)J.Biol.Chem.268(13):9246-54)。其它置换(例如Ser替换Phe 19和Lys替换Glu 9)也可以是有利的。与 IGF2高度保守的IGF-I的区域中的相似突变单独地或组合地导致IGF-BP 结合的大幅降低(Magee等,(1999)Biochemistry 38(48):15863-70)。
IGF2以相对高的亲和力结合至IGF2/M6P和IGF-I受体,并以较低的亲和力结合至胰岛素受体。将IGF2的第48-50位残基(Phe Arg Ser) 置换为来自胰岛素的相应残基(ThrSer Ile)、或将第54-55位残基(Ala Leu)置换为来自IGF-I的相应残基(Arg Arg)引起降低的对IGF2/M6P 受体的结合,但是保留了对IGF-I和胰岛素受体的结合(Sakano等,(1991)J.Biol.Chem.266(31):20626-35)。
IGF2结合至非阳离子依赖性M6P受体的重复序列11。实际上,其中仅重复序列11融合至非阳离子依赖性M6P受体的跨膜结构域和胞质结构域的微型受体(minireceptor)能够(以约为全长受体的亲和力的十分之一的亲和力)结合IGF2,并介导IGF2的内化和其向溶酶体的递送 (Grimme等,(2000)J.Biol.Chem.275(43):33697-33703)。M6P受体的结构域11的结构是已知的(蛋白质数据库条目1GP0和1GP3;Brown 等,(2002)EMBO J.21(5):1054-1062)。推定的IGF2蛋白结合位点是被认为与IGF2的疏水氨基酸相互作用的疏水口袋;IGF2的候选氨基酸包括亮氨酸8、苯丙氨酸48、丙氨酸54和亮氨酸55。尽管重复序列 11对IGF2结合而言是足够的,但包含非阳离子依赖性M6P受体的较大部分(例如重复序列10-13或1-15)的构建体通常以更高的亲和力以及增加的pH依赖性结合IGF2(参见例如,Linnell等,(2001)J.Biol.Chem. 276(26):23986-23991)。
用Leu取代IGF2残基Tyr 27或用Phe取代Ser 26使IGF2对IGF-I 受体的亲和力分别降低94倍、56倍和4倍(Torres等,(1995)J.Mol.Biol. 248(2):385-401)。人IGF2的第1-7位残基的缺失导致对人IGF-I受体的亲和力降低30倍,并伴随着对大鼠IGF2受体的亲和力提高12倍(Hashimoto等,(1995)J.Biol.Chem.270(30):18013-8)。IGF2的C-末端的截短(第62-67位残基)也看起来将IGF2对IGF-I受体的亲和力降低了5倍(Roth等,(1991)Biochem.Biophys.Res.Commun.181(2): 907-14)。
用丝氨酸取代IGF2残基苯丙氨酸26使对IGFBP 1-5的结合降低了 5-75倍(Bach等,(1993)J.Biol.Chem.268(13):9246-54)。用苏氨酸-丝氨酸-异亮氨酸替代IGF2的第48-50位残基使对大多数IGFBP的结合降低了多于100倍(Bach,(1993)J.Biol.Chem.268(13):9246-54);然而,这些残基对于对非阳离子依赖性甘露糖-6-磷酸受体的结合也重要。破坏对IGF-I受体的结合的Y27L置换干扰与IGFBP3和酸不稳定亚基的三元复合物的形成(Hashimoto等,(1997)J.Biol.Chem.272(44): 27936-42);该三元复合物占循环中的IGF2的大部分(Yu等,(1999)J. Clin.Lab Anal.13(4):166-72)。IGF2的前六个残基的缺失也干扰IGFBP 结合(Luthi等,(1992)Eur.J.Biochem.205(2):483-90)。
关于IGF-I与IGFBP的相互作用的研究另外揭示了丝氨酸置换第16 位苯丙氨酸不影响二级结构,但是使IGFBP结合降低了40至300倍 (Magee等,(1999)Biochemistry 38(48):15863-70)。将第9位谷氨酸替换为赖氨酸也引起IGFBP结合的显著降低。此外,双突变第9位赖氨酸/第16位丝氨酸表现出对IGFBP的最低的亲和力。在IGF-I和IGF2 的该区域之间的序列的保守性表明,当在IGF2中进行相似突变(谷氨酸 12赖氨酸/苯丙氨酸19丝氨酸)时,将观察到类似的效果。
在一些实施方式中,IGF2序列至少包含第48-55位氨基酸;至少包含第8-28位和第41-61位氨基酸;或至少包含第8-87位氨基酸,或它们的序列变体(例如,R68A)或它们的截短形式(例如,从第62位进行 C-末端截短),其结合非阳离子依赖性甘露糖-6-磷酸受体。
降低IGF2序列对IGF-I受体的结合:用Leu置换IGF2残基Tyr 27、或用Phe置换Ser26使IGF2对IGF-I受体的亲和力分别降低94倍、56 倍和4倍(Torres等,(1995)J.Mol.Biol.248(2):385-401)。人IGF2 的第1-7位残基的缺失导致对人IGF-I受体的亲和力降低30倍,并且伴随着对大鼠IGF2受体的亲和力提高12倍(Hashimoto等,(1995)J.Biol.Chem.270(30):18013-8)。IGF2的NMR结构表明,Thr 7位于第48位残基Phe和第50位Ser附近以及第9位Cys-第47位Cys二硫键桥附近。 Thr 7与这些残基的相互作用被认为可以稳定IGF-I受体结合所需的柔性 N-末端六肽(Terasawa等,(1994)EMBO J.13(23)5590-7)。同时,这种相互作用可以调节对IGF2受体的结合。IGF2的C-末端的截短(第62-67 位残基)也看起来将IGF2对IGF-I受体的亲和力降低了5倍(Roth等, (1991)Biochem.Biophys.Res.Commun.181(2):907-14)。
在一些实施方式中,被涵盖以用于本文中的靶向肽(例如IGF2序列) 以亚微摩尔的解离常数结合至CI-MPR。一般而言,较低的解离常数(例如小于10-7M、小于10-8M、或小于10-9M)是优选的。解离常数的确认可由本领域普通技术人员确定,例如,如Linnell等,(2001)J.Biol.Chem. 276(26):23986-23991所述,通过表面等离子共振。在一些实施方式中,可以使用包含CI-MPR的胞外结构域(例如,非阳离子依赖性M6P受体的重复序列1-15)的可溶形式(其通过亲和素-生物素的相互作用固定至芯片)的测定,来确定对靶向肽(例如,IGF2序列)结合CI-MPR的能力的评估。靶向肽(如IGF2序列)穿过芯片,通过测量与芯片表面相关的质量变化来检测和计算动力学常数和平衡常数。
在本发明的另一实施方式中,将编码靶向肽(例如IGF2序列)的 rAAV基因组在成熟的70/76kDal多肽和C-末端结构域的连接处(例如在第791位处)插入到天然GAA编码序列中。这创建了单个嵌合多肽。因为靶向肽(例如IGF2序列)可能不能以此构型与其同源受体结合,可以将蛋白酶切割位点插入到紧邻靶向肽(例如IGF2序列)的下游。一旦蛋白质以正确的折叠形式产生,就可以通过蛋白酶处理来切割C-末端结构域。
采用通常见于人血清中的蛋白酶所作用的蛋白酶切割位点可能是期望的。以此种方式,靶向肽(例如,IGF2序列)加标签的GAA可以以前药形式引入到血流中,并被激活以供血清驻留蛋白酶摄取。这可以改善酶的分布。如前所述,肽标签可以是IGF2序列标签或肌肉特异性标签。
在本发明的另一实施方式中,靶向肽(例如IGF2序列)以保留酶活性的方式在GAA的N-末端融合。在N-端融合的情况下,有可能通过用异源信号肽替代天然GAA信号肽来影响酶的分泌水平。
在一些实施方式中,将编码靶向肽(例如,IGF2序列)的rAAV基因组在成熟的70/76kDal多肽和C-末端结构域的连接处(例如在第791 位处)插入到天然GAA编码序列中。这创建了单个融合(或嵌合)多肽。因为靶向肽(例如IGF2序列)可能不能以此构型与其同源受体结合,可以将蛋白酶切割位点插入到紧邻靶向肽(例如IGF2序列)的下游。一旦以正确的折叠形式产生了GAA多肽,就可以通过蛋白酶处理来切割C- 末端结构域。
因此,在一些实施方式中,采用通常见于人血清中的蛋白酶所作用的蛋白酶切割位点可能是期望的。以此种方式,融合至GAA多肽的靶向肽(例如,IGF2序列)可以以前药的形式引入到血流中,并被激活以供血清驻留蛋白酶摄取。这可以改善GAA多肽的分布。如前所述,靶向肽是本文所公开的IGF2序列或肌肉特异性序列。
在本发明的另一实施方式中,靶向肽(例如IGF2序列)以保留酶活性的方式在GAA的N-末端融合(例如,参见描述测量GAA活性的测定的实施例)。在N-末端融合的情况下,有可能通过用本文所述的异源信号肽代替天然GAA信号肽来增加GAA的分泌水平。
在一个实施方式中,将靶向肽(例如本文定义的IGF2序列)直接融合至GAA多肽的N-或C-末端。在另一实施方式中,IGF2序列通过间隔区融合至GAA多肽的N-或C-末端。在一个具体的实施方式中,IGF2序列通过10-25个氨基酸的间隔区融合至GAA多肽。在另一实施方式中, IGF2序列通过包含甘氨酸残基的间隔区融合至GAA多肽。
在一些实施方式中,IGF2序列通过至少1个、2个或3个氨基酸的间隔区融合至GAA多肽。在一些实施方式中,间隔区包含氨基酸GAP 或Gly-Ala-Pro(SEQ ID NO:31)、或与其至少50%相同的氨基酸序列。在一些实施方式中,间隔区是GGG或GA或AP或GP或其变体。在一些实施方式中,间隔区由核酸ggc gcg ccg(SEQ ID NO:30)编码。
在一些实施方式中,IGF2序列通过包含螺旋结构的间隔区融合至 GAA多肽。在另一具体的实施方式中,IGF2序列通过与序列GGGTVGDDDDK(SEQ ID NO:35)至少50%相同的间隔区融合至GAA 多肽。在本文公开的方法和组合物的一些实施方式中,所述间隔区是SEQID NO:31(由SEQ ID NO:30的核酸编码)。在本文公开的方法和组合物的一些实施方式中,所述间隔区选自以下中的任一种:SEQ ID NO: 31、SEQ ID NO:32、SEQ ID NO:33、SEQ IDNO:34或SEQ ID NO: 35,或与其具有至少85%、90%、95%、96%、97%、98%或99%序列同一性的序列。
非阳离子依赖性M6P受体
在一些实施方式中,靶向肽是溶酶体靶向肽或蛋白质,或以不依赖于甘露糖-6-磷酸的方式结合至非阳离子依赖性M6P/IGF2受体(CI-MPR) 的其它部分。有利地,该实施方式模拟了摄取LSD蛋白的正常生物学机制,也是以不依赖于甘露糖-6-磷酸的方式进行。
非阳离子依赖性M6P受体是在哺乳动物组织中普遍表达的275kDa 单链跨膜糖蛋白。它是结合M6P的两种哺乳动物受体之一:第二种被称为阳离子依赖性M6P受体。阳离子依赖性M6P受体需要二价阳离子用于结合M6P;非阳离子依赖性M6P受体则不需要。这些受体通过识别溶酶体酶上的高甘露糖碳水化合物上的M6P部分,在溶酶体酶的运输中发挥重要作用。非阳离子依赖性M6P受体的细胞外结构域包含15个同源结构域(“重复序列”),这些结构域在受体的离散的位置结合不同的配体的组。
非阳离子依赖性M6P受体(CI-MPR)包含M6P的两个结合位点:一个位于重复序列1-3中,且另一个位于重复序列7-9中。受体以μM范围内的解离常数结合单价M6P配体,而以nM范围内的解离常数结合二价M6P配体,这可能是由于受体寡聚化造成的。CI-MPR对IGF2的摄取受多价M6P配体(如溶酶体酶)与受体的伴随结合而增强。
CI-MPR还包含可用作靶向肽的至少三个不同配体的结合位点。如本文所公开的,IGF2配体主要通过与重复序列11的相互作用,以约14nM 的解离常数在pH 7.4或约pH 7.4时结合至CI-MPR。与其将IGF2靶向至溶酶体的功能一致,在pH 5.5或约pH 5.5时,解离常数增加了约100倍,促进了酸性晚期内体中的IGF2的解离。CI-MPR能够结合高分子量的O- 糖基化的IGF2形式。因此,在一些实施方式中,IGF2序列包含O-糖基化。
在替代的实施方式中,结合至CI-MPR的靶向肽为视黄酸。视黄酸以2.5nM的解离常数结合至受体。视黄酸与非阳离子依赖性M6P受体的亲和力光标记不干扰IGF2或M6P与受体的结合,表明视黄酸结合至受体上的不同位点。视黄酸与受体的结合改变了受体的细胞内分布(受体在细胞质囊泡中的积累量更大),并且还增强了M6P修饰的β-葡萄糖醛酸苷酶的摄取。视黄酸具有可光活化的部分,可用于将其连接至治疗剂,而不干扰其结合至非阳离子依赖性M6P受体的能力。
尿激酶型纤溶酶原受体(uPAR)也以9μM的解离常数结合CI-MPR。 uPAR是大多数细胞类型表面上的GPI锚定受体,在该处它作为粘附分子发挥作用,并在纤溶酶原和TGF-β的蛋白水解激活中发挥作用。uPAR 对CI-M6P受体的结合将其靶向至溶酶体,从而调节其活性。因此,将 uPAR的细胞外结构域或其能够结合非阳离子依赖性M6P受体的部分融合至治疗剂使该试剂靶向至溶酶体。
在一些实施方式中,IGF2序列被修饰为弗林酶(furin)耐受的,即对识别Arg-X-X-Arg切割位点的弗林蛋白酶的降解耐受。此类IGF2序列在美国申请22012/0213762中公开,以引用的方式将其整体并入本文。在一些实施方式中,用于本文所述的rAAV基因组中的弗林酶耐受性 IGF2序列在对应于SEQ ID NO:5(wt IGF2序列)的第30-40位氨基酸 (例如第31-40位、第32-40位、第33-40位、第34-40位、第30-39位、第31-39位、第32-39位、第34-37位、第32-39位、第33-39位、第34-39 位、第35-39位、第36-39位、第37-40位、第34-40位)的区域内包含突变,其可以被任何其它氨基酸置换或被删除。例如,在位置34处的置换可能影响弗林酶对第一切割位点的识别。在每个识别位点内插入一个或多个额外的氨基酸可消除一个或两个弗林酶切割位点。简并位置的一个或多个残基的缺失也可以消除两个弗林酶切割位点。
在一些实施方式中,弗林酶耐受性IGF2序列在对应于SEQ ID NO: 5的Arg37(R37)或Arg40(R40)的位置处含有氨基酸置换。在一些实施方式中,弗林酶耐受性IGF2序列在SEQID NO:5的Arg37或Arg40 位置处包含Lys(K)或Ala(A)置换。其它置换也是可能的,包括于第37位和第40位两者处的Lys和/或Ala突变的组合,或Lys(K)或 Ala(A)以外的氨基酸置换。在一些实施方式中,被涵盖以用于本文公开的rAVV基因组中的IGF2序列是IGFΔ2-7-K37、或IGFΔ2-7-K40、或 IGFΔ1-7-K37、或IGFΔ1-7-K40,这表明IGF2序列分别具有aa 2-7或1-7 的缺失和位于第37位的Arg(R)残基变为赖氨酸(即R37K修饰)或 R40K的修饰。在一些实施方式中,被涵盖以用于本文公开的rAVV基因组中的IGF2序列是IGFΔ2-7-K37-K40或IGFΔ1-7-R37K-R40K,表明IGF2 序列具有第2-7位残基或第1-7位残基的缺失以及在第37位和40位R 残基变为赖氨酸(R37K和R40K)的修饰。在一些实施方式中,被涵盖以用于本文公开的rAVV基因组中的IGF2序列选自以下中的任一项: IGFΔ2-7-R37A、或IGFΔ2-7-R40A、或IGFΔ1-7-R37A、或IGFΔ1-7-R40A、或IGFΔ2-7-R37A-R40A、或IGFΔ1-7-R37A-R40A。在美国申请 2012/0213762(以引用的方式将其整体并入本文)中公开了被涵盖以用于本文公开的rAVV基因组中的IGF2序列的示例性构建体。
在一些实施方式中,适用于本发明的弗林酶耐受性IGF-2序列可包含额外的突变。例如,可以改变多达30%或更多的SEQ ID NO:5的残基(例如,多达1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、 11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%或更多的残基可被改变)。因此,适用于本发明的弗林酶耐受性IGF2突变蛋白可具有与 SEQ ID NO:5至少70%(包括至少70%、71%、72%、73%、74%、75%、 76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、 87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、 98%、99%)相同的氨基酸序列。
此外,由于IGF2序列代替M6P作为靶向溶酶体的部分,因此本文公开的IGF2序列的使用在本领域中也被称为非糖基化依赖性溶酶体靶向(GILT)。GILT技术的详细信息描述于美国申请公开号2003/0082176、 2004/0006008、2004/0005309、2003/0072761、2005/0281805、2005/0244400,以及国际公开WO 03/032913、WO 03/032727、WO 02/087510、WO03/102583、WO 2005/078077,以引用的方式将其全部公开内容并入。
D.GAA多肽的间隔区和融合连接
当GAA表达为具有分泌信号肽(例如,SS-GAA多肽)或靶向肽(即, SS-IGF2-GAA多肽双融合多肽)的融合蛋白时,信号肽或IGF2序列可以直接融合至GAA多肽或可以通过接头与GAA多肽分开。氨基酸接头 (在本文中也称为“间隔区”)并入不同于天然蛋白质中的该位置处出现的一个或多个氨基酸。通常可以将间隔区设计成柔性的或设计为在两个蛋白部分之间插入结构,例如α-螺旋。
在一些实施方式中,间隔区或接头可以相对短,例如至少1个、2 个、3个、4个或5个氨基酸,或诸如序列Gly-Ala-Pro(SEQ ID NO:31) 或Gly-Gly-Gly-Gly-Gly-Pro(SEQ IDNO:32),或可以更长,例如长度为5-10个氨基酸或长度为10-25个氨基酸。例如,已经描述了序列 (GGGGS(SEQ ID NO:33))的3-4拷贝的柔性重复接头和序列(EAAAK (SEQ ID NO:34))的2-5拷贝的α-螺旋重复接头(Arai等,(2004) Proteins:Structure,Function andBioinformatics 57:829-838)。
还报道了在IGF2融合蛋白的背景下的另一种接头GGGTVGDDDDK (SEQ ID NO:35)的使用(DiFalco等,(1997)Biochem.J.326:407-413),并且被涵盖以进行使用。并入人血清蛋白的α-螺旋部分的接头可用于使接头区域的免疫原性最小化。
在一些实施方式中,间隔区由核酸ggc gcg ccg(SEQ ID NO:30) 编码,该核酸编码包含氨基酸GAP或Gly-Ala-Pro(SEQ ID NO:31)的氨基酸间隔区。
GAA多肽中与信号肽(以生成SS-GAA融合蛋白)或与靶向肽(例如,以生成SP-IGF2-GAA双融合多肽)融合的融合连接的位点应小心地选择以促进融合蛋白中的每个多肽的恰当折叠和活性,并防止信号肽与 GAA多肽的过早分离。
在一些实施方式中,将IGF2序列通过包含螺旋结构的间隔区融合至GAA多肽。在另一具体的实施方式中,IGF2序列通过与序列 GGGTVGDDDDK(SEQ ID NO:35)至少50%相同的间隔区融合至GAA 多肽。在本文公开的方法和组合物的一些实施方式中,所述间隔区是SEQID NO:31(由SEQ ID NO:30的核酸编码)。在本文公开的方法和组合物的一些实施方式中,所述间隔区选自以下的任一种:SEQ ID NO:31、 SEQ ID NO:32、SEQ ID NO:33、SEQ ID NO:34或SEQ ID NO:35。
可以生成用于创建IGF2-GAA融合蛋白的四种示例性策略,所述策略如下:
1.在GAA的氨基末端融合IGF2序列。
2.在GAA的成熟区和三叶草结构域之间插入IGF2序列。
3.在GAA的成熟区和GAA的C-末端结构域之间插入IGF2序列。
4.IGF2序列对截短的GAA多肽的C-末端的融合以及共表达C-末端结构域。
例如,靶向肽(例如,IGF2序列)可以直接或通过间隔区融合至 GAA的第40位氨基酸或第70位氨基酸,该位置允许蛋白质的表达、GAA 蛋白的催化活性、以及被如本文实施例中所述的IGF2序列恰当靶向。或者,靶向肽(例如,IGF2序列)可以于将GAA的C-末端结构域与成熟多肽分离的切割位点处或其附近融合。这允许具有内部靶向肽(例如IGF2 序列)的GAA蛋白的合成,根据切割位点的位置,所述蛋白可选地可被切割以将成熟多肽或C-末端结构域从靶向结构域释放。或者,成熟多肽可以在约第791位合成为融合蛋白,而不在表达构建体的开放阅读框中并入C-末端序列。
为了促进IGF2序列的折叠,可以修饰邻近融合连接的GAA氨基酸残基。例如,由于GAA半胱氨酸残基可能干扰靶向肽(例如IGF2序列) 的恰当折叠,因此可以删除末端GAA的第952位胱氨酸,或用丝氨酸置换以容纳C-末端的靶向肽(例如IGF2序列)。靶向肽(例如,IGF2序列) 也可以紧邻最终的Cys952之前融合。可以与最终的Cys952突变为丝氨酸一起,将倒数第二个cys938改变为脯氨酸。
E.CS序列
在一些实施方式中,本文公开的rAAV基因组包含异源核酸序列,所述异源核酸序列可以任选地包含位于GAA基因的3′端和polyA信号的 5′端的胶原蛋白稳定性序列(CS或CSS)。示例性的胶原蛋白稳定性序列包括CCCAGCCCACTTTTCCCCAA(SEQ ID NO:65)或与其具有至少85%、 90%、95%、96%、97%、98%或99%序列同一性的序列。示例性的胶原蛋白稳定性序列可以具有PSPLFP(SEQ ID NO:66)的氨基酸序列或与其具有至少85%、90%、95%、96%、97%、98%或99%序列同一性的氨基酸序列。CS序列公开于Holick和Liebhaber,Proc.Nat.Acad.Sci.94: 2410-2414,1997(参见例如图3,第5205页),以引用的方式将其整体并入本文。
在一些实施方式中,本文公开的rAAV基因组包含异源核酸序列,所述异源核酸序列可以任选地包含替代的稳定性序列来代替胶原蛋白稳定性序列(CS)。其它稳定性序列是本领域普通技术人员已知的,并且被涵盖以在rAAV基因组中使用来代替或补充本文公开的胶原蛋白稳定性序列。
F.启动子
在一些实施方式中,为了达到合适的GAA表达水平,rAAV基因型包含启动子。合适的启动子可以选自本领域普通技术人员已知的众多启动子中的任意一种。在一些实施方式中,启动子是细胞类型特异性启动子。在进一步的实施方式中,启动子是诱导型启动子。在实施方式中,启动子位于5′端的上游并且可操作地连接至异源核酸序列。在一些实施方式中,启动子是肝细胞类型特异性启动子、心肌细胞类型特异性启动子、神经元细胞类型特异性启动子、神经细胞类型特异性启动子、肌肉细胞类型特异性启动子或其它细胞类型特异性启动子。
在一些实施方式中,组成型启动子可以选自具有不同强度和组织特异性的组成型启动子的组。这些启动子的一些实例在表4中列出。rAAV 载体基因组可以包含一个或多个组成型启动子,例如病毒启动子或来自通常在促进转录中有活性的哺乳动物基因的启动子。组成型病毒启动子的实例为:单纯疱疹病毒(HSV)启动子、胸苷激酶(TK)启动子、劳氏肉瘤病毒(RSV)启动子、猿猴病毒40(SV40)启动子、小鼠乳腺瘤病毒(MMTV)启动子、Ad EIA启动子和巨细胞病毒(CMV)启动子。组成型哺乳动物启动子的实例包括各种看家基因启动子,以β-肌动蛋白启动子和鸡β-肌动蛋白(CB)启动子为例,其中,已证明CB启动子是对于表达GAA而言特别有用的组成型启动子。
在实施方式中,启动子是组织特异性启动子。可随着本发明的rAAV 载体基因组使用的组织特异性启动子的实例包括肌酸激酶启动子、肌细胞生成素启动子、α肌球蛋白重链启动子、肌细胞特异性增强因子2 (MEF2)启动子、myoD增强子元件、白蛋白、α-1-抗胰蛋白酶启动子和乙肝病毒核心蛋白启动子,其中,乙肝病毒核心蛋白启动子对肝细胞具有特异性。
在实施方式中,启动子是诱导型启动子。合适的诱导型启动子的实例包括来自如下基因的启动子(包括雌激素基因启动子),所述基因诸如细胞色素P450基因、热休克蛋白基因、金属硫蛋白基因和激素诱导型基因。诱导型启动子的另一实例是响应于四环素的tetVP16启动子。
根据本文公开内容的rAAV基因组中的启动子包括但不限于神经元特异性启动子(例如突触蛋白1(SYN)启动子)、肌肉肌酸激酶(MCK) 启动子和结蛋白(DES)启动子。在一个实施方式中,AAV介导的异源核酸(例如人GAA)的表达可以通过突触蛋白启动子在神经元中或通过 MCK启动子在骨骼肌中来实现。可以使用的其它启动子包括EF、B19p6、 CAG、神经元特异性烯醇化酶基因启动子、鸡β-肌动蛋白/CMV杂合启动子、血小板衍生生长因子基因启动子、bGH、EF1a、CamKIIa、GFAP、 RPE、ALB、TBG、MBP、MCK、TNT、aMHC、GFP、RFP、mCherry、 CFP和YFP启动子。
表4-示例性的启动子;
Figure BDA0003166136840000601
Figure BDA0003166136840000611
肝特异性启动子
在本文公开的方法和组合物的一些实施方式中,启动子是肝特异性启动子,并且可以选自任意肝特异性启动子,包括但不限于甲状腺素转运蛋白启动子(TTR)、肝特异性启动子(LSP)(例如在5,863,541中公开的(TTR启动子))或LSP启动子(PNAS,96:3906-3910,1999,参见例如第3906页,Materials and Methods,rAAV construction)、合成型肝启动子,其参考文献以引用的方式整体并入本文。可以使用其它肝启动子,例如合成型肝启动子。
在一些实施方式中,TTR启动子是截短的TTR启动子,例如,包含 SEQ ID NO:12或与其具有至少85%、90%、95%、96%、97%、98%或99%核苷酸序列同一性的变体。
其它肝特异性启动子包括但不限于LDL受体、因子VIII、因子IX、苯丙氨酸羟化酶(PAH)、鸟氨酸转氨甲酰酶(OTC)和α1-抗胰蛋白酶 (hAAT)的启动子,以及HCB启动子。其它肝特异性启动子包括AFP (甲胎蛋白)基因启动子和白蛋白基因启动子(如EP专利公开0415 731 中公开的)、α-1抗胰蛋白酶基因启动子(如Rettenger,Proc.Natl.Acad.Sci. 91(1994)1460-1464中公开的)、纤维蛋白原基因启动子、APO-A1(载脂蛋白A1)基因启动子以及肝转移酶(例如SGOT、SGPT和γ-谷氨酰转移酶)的启动子基因。还参见2001/0051611以及PCT专利公开WO 90/07936和WO 91/02805,以引用的方式将其整体并入本文。在一些实施方式中,肝特异性启动子是重组肝特异性启动子,例如,如 US20170326256A1(以引用的方式将其整体并入本文)中公开的。
在一些实施方式中,肝特异性启动子是乙型肝炎X基因启动子和乙型肝炎核心蛋白启动子。在一些实施方式中,肝特异性启动子可以随着它们各自的增强子使用。增强子元件可以在编码GAA多肽的核酸的5' 端或3'端处连接。可以利用Twu,J Virol.61(1987)3448-3453中描述的方法,从病毒基因组中获得作为332个碱基对的EcoRV-NcoI DNA片段的乙型肝炎X基因启动子及其增强子。可以利用Gerlach,Virol 189(1992) 59-66中描述的方法,从病毒基因组中获得作为584个碱基对的 BamHI-BgIII DNA片段的乙型肝炎核心蛋白启动子。在插入BamHI-BgIII 片段之前,可能需要去除其中的负调控序列。
G.内含子序列
在一些实施方式中,rAAV基因型包含位于启动子序列的3'端和分泌信号肽的5'端的内含子序列。内含子序列起增强如下的一项或多项的作用:mRNA稳定性、mRNA转运出细胞核和/或表达和/或所表达的GAA 融合多肽(例如SS-GAA融合多肽或SS-IGF2-GAA多肽)的调控。
在一些实施方式中,内含子序列是MVM内含子序列,例如但不限于SEQ ID NO:13的内含子序列或与其具有至少80%、85%、90%、95%、 96%、97%、98%或99%核苷酸序列同一性的核酸序列。
在一些实施方式中,内含子序列是HBB2内含子序列,例如但不限于SEQ ID NO:14的内含子序列或与其具有至少80%、85%、90%、95%、 96%、97%、98%或99%核苷酸序列同一性的核酸序列。
在一些实施方式中,rAAV基因型包含选自于由如下所组成的组中的内含子序列:人β球蛋白b2(或HBB2)内含子、FIX内含子、鸡β-球蛋白内含子和SV40内含子。在一些实施方式中,内含子任选地是经修饰的内含子,例如经修饰的HBB2内含子(参见例如,WO2018046774A1 的SEQ ID NO:17)、经修饰的FIX内含子(参见例如,WO2018046774A1 中的SEQ ID NO:19)、或经修饰的鸡β-球蛋白内含子(例如参见 WO2018046774A1中的SEQ IDNO:21)或WO2015/162302中公开的经修饰的HBB2或FIX内含子,以引用的方式将它们的整体并入本文。
H.poly-A
在一些实施方式中,rAAV载体基因组包含至少一个poly-A尾,所述poly-A尾位于3'端并位于在一个实施方式中编码GAA融合多肽(例如,SS-GAA融合多肽或SS-IGF2-GAA多肽)的异源核酸基因的下游。在一些实施方式中,polyA信号是如本文所定义的稳定性序列或CS序列的3'端。可以使用任何polyA序列,包括但不限于hGH polyA、synpA polyA 等。在一些实施方式中,polyA是合成型polyA序列。在一些实施方式中, rAAV载体基因组包含两个polyA尾,例如hGH polyA序列和另一个 polyA序列,其中间隔区核酸序列位于两个polyA序列之间。在一些实施方式中,rAAV基因组在编码GAA融合多肽(例如,SS-GAA融合多肽或SS-IGF2-GAA多肽)的核酸的3'端、或者在CS序列的3'端包含以下元件:第一polyA序列、间隔区核酸序列(100-400bp之间,或约250bp)、第二poly A序列、间隔区核酸序列和3'ITR。在一些实施方式中,第一和第二poly A序列是hGH poly A序列,并且在一些实施方式中,第一和第二poly A序列是合成型poly A序列。在一些实施方式中,第一poly A 序列是hGH polyA序列,且第二poly A序列是合成型序列,反之亦然——也就是说,在替代的实施方式中,第一poly A序列是合成型poly A序列,且第二poly A序列是hGH polyA序列。示例性的poly A序列为例如 SEQ ID NO:15(hGH poly A序列),或与SEQ ID NO:15具有至少80%、85%、90%、95%、96%、97%、98%或99%的核苷酸序列同一性的poly A 核酸序列。在一些实施方式中,被涵盖以使用的hGHpoly序列描述于 Anderson等,J.Biol.Chem 264(14);8222-8229,1989(参见例如,第8223 页,第二栏,第一段),以引用的方式将其整体并入本文。
在一些实施方式中,可以对poly-A尾进行工程化以稳定从rAAV载体基因组转录的RNA转录物,包括异源基因的转录物,在一个实施方式中该转录物是GAA;并且在替代的实施方式中,可以将poly-A尾工程化以包含去稳定元件。
在一个实施方式中,可以通过改变poly-A尾的长度将poly-A尾工程化为去稳定元件。在一个实施方式中,poly-A尾可以延长或缩短。在进一步的实施方式中,可以延长或缩短位于异源基因(在一个实施方式中为GAA)与poly-A尾之间的3'端非翻译区,以改变异源基因的表达水平或改变产生的最终的多肽。在一些实施方式中,3′端非翻译区包含GAA 3′UTR(SEQ ID NO:85)。
在另一实施方式中,去稳定元件是微小RNA(miRNA),其具有沉默(阻抑翻译和促进降解)RNA转录物的能力,miRNA结合至编码异源基因的RNA转录物。在一个实施方式中,可以通过修饰、添加或删除 miRNA所结合的poly-A尾内的种子区来进行异源基因的表达的调节。在实施方式中,在poly-A尾内的种子区的添加或删除可以增加或减少rAAV 载体基因组中的异源基因所编码的蛋白质(在一个实施方式中为GAA) 的表达。在进一步的实施方式中,由种子区的添加或删除引起的此类表达增加或减少取决于包含rAAV载体基因组的AAV所转导的细胞类型。例如,对于在肌肉和心脏细胞中表达但在肝细胞中未发现的miRNA具有特异性的种子区可用于允许在肝细胞中、而不是肌肉细胞或心脏细胞中产生异源基因编码的多肽(在一个实施方式中为GAA)。
在另一实施方式中,种子区也可以被工程化到位于异源基因和 poly-A尾之间的3'非翻译区中。在进一步的实施方式中,去稳定剂可以是siRNA。siRNA的编码区可以被包含在rAAV载体基因组中,并通常位于下游,poly-A尾的3'端。在实施方式中,异源基因(在一个实施方式中为GAA)的表达可以通过在rAAV盒中(例如下游,poly-A尾的3' 端、)包含siRNA的编码区来进行。在进一步的实施方式中,诱导siRNA 表达的启动子可以是组织特异性的,从而使得siRNA在不期望异源基因 (在一个实施方式中为GAA)表达的组织中沉默,且在期望异源基因(在一个实施方式中为GAA)的表达的组织中不发生siRNA表达。
在本文公开的方法和组合物的所有方面,rAAV基因组也可以包含填充区DNA核酸序列。示例性的填充区DNA序列是SEQ ID NO:71,或与其具有至少80%、85%、90%、95%、96%、97%、98%或99%核苷酸序列同一性的核酸序列。如图8-图13和图14A-图14E所示,填充区序列例如位于poly A尾的3'端,并位于3'ITR序列的5'端。在一些实施方式中,填充区DNA以反向取向包含合成型多聚腺苷酸化信号。
在一些实施方式中,填充区核酸序列(也称为“间隔区”核酸片段,参见图8-图14)可以位于poly A序列和3'ITR之间(即填充区核酸序列位于poly A序列的3'端和3'ITR的5'端)(参见例如,图8-图10)。此类填充区核酸序列可为约30bp、50pb、75bp、100bp、150bp、200bp、250bp、 300bp或长于300bp。在本文公开的方法和组合物的一些实施方式中,填充区核酸片段在20-50bp、50-100bp、100-200bp、200-300bp、300-500bp 之间、或为20-500bp之间的任何整数。示例性的填充区(或间隔区)核酸序列包括SEQ ID NO:16、SEQ ID NO:71或SEQ ID NO:78,或与 SEQ ID NO:16、SEQ ID NO:71或SEQ ID NO:78至少约70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、 83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、 94%、95%、96%、97%、98%、99%相同的核酸序列。
I.AAV ITRs
本文公开的rAAV基因组包含具有期望特征的AAV ITR,并且可以被设计为调节并入有ITR的载体的活性和对其的细胞应答。在另一实施方式中,AAV ITR是具有期望特征的合成型AAV ITR,并且可以被设计成操纵包含一个或两个合成型ITR的载体的活性和对其的细胞应答,包括如在美国专利号9,447433中阐明的,以引用的方式将其并入本文。
如本文所公开的,用于rAAV基因组中的AAV ITR可以具有适合于特定应用的任何血清型。在一些实施方式中,AAV载体基因组侧接有AAV ITR。在一些实施方式中,rAAV载体基因组侧接有AAV ITR,其中ITR 包含全长ITR序列、具有包含去除的CPG岛的序列的ITR、具有包含添加的CPG序列的序列的ITR、截短的ITR序列、具有ITR内的一个或多个缺失的ITR序列、具有ITR内的一个或多个添加的ITR序列、或包含前述ITR的任意部分连接在一起以形成杂合ITR的组合。
为了促进长期表达,在实施方式中,将编码GAA的多核苷酸插入 AAV反向末端重复序列(ITR)(例如,第一或5'和第二3'AAV ITR)之间。AAV ITR见于WT rAAV载体基因组的两端,并充当DNA复制的起点和引物。ITR需要处于顺式以用于AAV DNA复制以及从原核质粒中拯救或切除。在实施方式中,包含在rAAV基因组的核酸内的AAV ITR序列可以衍生自任意AAV血清型(例如1、2、3、3b、4、5、6、7、8、9 和10),或可以衍生自多于一种的血清型,包括组合两种以上的AAV血清型的部分以构建ITR。在实施方式中,为用于包括rAAV载体基因组的rAAV载体中,第一ITR和第二ITR应至少包含包装和复制所必需的WT ITR或经工程化的ITR的最小部分。在一些实施方式中,rAAV载体基因组侧接有AAV ITR。
在一些实施方式中,rAAV载体基因组包含至少一个AAV ITR,其中,所述ITR包含以下、基本上由以下组成或由以下组成:(a)AAV rep结合元件;(b)AAV末端拆解序列(resolution sequence);以及(c)AAV RBE (Rep结合元件);其中,所述ITR不包含任何其它AAV ITR序列。在另一实施方式中,元件(a)、(b)和(c)来自AAV2 ITR,并且ITR不包含任何其它AAV2 ITR序列。在进一步的实施方式中,元件(a)、(b) 和(c)来自任何AAV ITR,包括但不限于AAV2、AAV8和AAV9。在一些实施方式中,多核苷酸包含可能相同或不同的两个合成型ITR。
在一些实施方式中,包含rAAV载体基因组的rAAV载体中的多核苷酸包含可以相同或不同的两个ITR。已确定ITR中的三个元件对于ITR 功能而言是足够的。这种最小功能性ITR可用于AAV载体生产和转导的所有方面。额外的缺失可能定义甚至更小的最小功能性ITR。更短的长度有利地允许较大的转基因盒的包装和转导。
在另一实施方式中,存在于合成型ITR中的每个元件可以是天然存在的AAV ITR中存在的确切序列(WT序列),或者可以稍有不同(例如,通过添加、删除和/或置换1个、2个、3个、4个、5个或更多个核苷酸而不同),只要AAV ITR元件的功能继续以足够与在天然存在的AAV ITR 中存在的元件相同的元件的功能没有实质性差异的水平起作用。
在进一步的实施方式中,包含rAAV载体基因组的rAAV载体可以在 ITR之间包含一个或多个额外的非AAV顺式元件,例如,启动转录、介导增强子功能、允许在有丝分裂时的复制和对称分布、或改变经转导基因组的持久性和加工的元件。此类元件在本领域中是公知的,并且包括但不限于启动子、增强子、染色质附着序列、端粒序列、顺式作用微小 RNA(miRNA)及它们的组合。
在另一实施方式中,ITR相对于天然存在的ITR(例如来自AAV2 的ITR2)表现出修饰的转录活性。已知ITR2序列固有地具有启动子活性。它也固有地具有与poly(A)序列相似的终止活性。尽管相对于ITR2 处于降低的水平,本发明的最小功能性ITR表现出如实施例中所示的转录活性。因此,在一些实施方式中,ITR具有转录功能。在其它实施方式中,ITR对于转录而言是缺陷的。在某些实施方式中,ITR可以充当转录绝缘子,例如,当载体整合到宿主染色体中时,阻止载体中存在的转基因盒的转录。
本发明的一个方面涉及包含至少一个合成型AAV ITR的rAAV载体基因组,其中,相对于天然存在的AAV ITR(例如ITR2)的序列而言, ITR中的一个或多个转录因子结合位点的核苷酸序列被删除和/或置换。在一些实施方式中,其中一个或多个转录因子结合位点被删除和/或置换的是最小功能性ITR。在一些实施方式中,至少一个转录因子结合位点被删除和/或置换,例如,至少5个或更多或者10个或更多的转录因子结合位点,例如,至少1个、2个、3个、4个、5个、6个、7个、8个、 9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个或21个转录因子结合位点。
另一实施方式中,包含本文所述的rAAV载体基因组的rAAV载体包含含有至少一个合成型AAV ITR的多核苷酸,其中,通常出现在ITR中的转录起始位点处或其附近的一个或多个CpG岛(胞嘧啶碱基紧随着鸟嘌呤碱基(CpG),其中这样排列的胞嘧啶倾向于被甲基化)被删除和/ 或置换。在实施方式中,CpG岛数量的缺失或减少可降低rAAV载体的免疫原性。这是由于TLR-9结合rAAV载体DNA序列(发生在CpG岛处)的减少或完全抑制。CpG基序的甲基化导致转录沉默也是众所周知的。预期ITR中的CpG基序的去除将导致TLR-9识别的降低和/或甲基化的降低,以及因此转基因沉默的降低。在一些实施方式中,其中一个或多个CpG岛被删除和/或置换的是最小功能性ITR。在实施方式中,已知AAV ITR2包含16个CpG岛,其中一个或多个或全部16个可以被删除。
在一些实施方式中,至少1个CpG基序被删除和/或置换,例如至少 4个或更多或者8个或更多的CpG基序,例如至少1个、2个、3个、4 个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、 15个或16个CpG基序。本文所用的短语“删除和/或置换”意味着CpG 基序中的一个或两个核苷酸被删除、被不同的核苷酸置换、或删除和置换的任意组合。
在另一实施方式中,合成型ITR包含以下所列核苷酸序列之一,基本上由以下所列核苷酸序列之一组成或由以下所列核苷酸序列之一组成。在其它实施方式中,合成型ITR包含如下核苷酸序列,基本上由如下核苷酸序列组成或由如下核苷酸序列组成:所述核苷酸序列与以下所列核苷酸序列之一至少80%相同(例如至少85%、90%、95%、96%、97%、98%或99%相同)。
MH-257
Figure BDA0003166136840000681
MH-258
Figure BDA0003166136840000682
MH Delta 258
Figure BDA0003166136840000691
MH端粒-1ITR
Figure BDA0003166136840000692
MH端粒-2ITR
Figure BDA0003166136840000693
MH PolII 258ITR
Figure BDA0003166136840000694
MH 258Delta D保守
Figure BDA0003166136840000695
在某些实施方式中,本文所述的rAAV载体基因组包含能够产生可转导宿主细胞的AAV病毒颗粒的合成型ITR。此类ITR可以用于例如异源核酸的病毒递送。此类ITR的实例包括上面列出的MH-257、MH-258 和MH Delta 258。
在其它实施方式中,包含合成型ITR的如本文所述的rAAV载体基因组不能产生AAV病毒颗粒。此类ITR可以用于例如异源核酸的非病毒转移。此类ITR的实例包括上面列出的MH端粒-1、MH端粒-2和MH Pol II 258。
在进一步的实施方式中,包含本发明的合成型ITR的如本文所述的 rAAV载体基因组进一步包含可以与第一ITR相同或不同的第二ITR。在一个实施方式中,rAAV载体基因组进一步包含异源核酸,例如,编码蛋白质或功能性RNA的序列。在另外的实施方式中,第二ITR不能被Rep 蛋白拆解,即产生双链的病毒DNA。
在实施方式中,rAAV载体基因组包含含有本发明的合成型ITR的多核苷酸。在进一步的实施方式中,病毒载体可以是细小病毒载体,例如 AAV载体。在另一实施方式中,重组细小病毒颗粒(例如,重组AAV 颗粒)包含合成型ITR。
本发明的另一实施方式涉及增加AAV衣壳的转基因DNA包装能力的方法,所述方法包括生成包含至少一个合成型AAV ITR的rAAV载体基因组,其中,所述ITR包括:(a)AAV rep结合元件;(b)AAV终端拆解序列;以及(c)AAV RBE元件;其中,所述ITR不包含任何其它 AAVITR序列。
本发明的进一步的实施方式涉及通过rAAV载体基因组改变对感染的细胞应答的方法,所述方法包括生成包含至少一个合成型ITR的rAAV 载体基因组,其中,所述ITR中的一个或多个转录因子结合位点的核苷酸序列被删除和/或置换,并且进一步地,其中,rAAV载体基因组包含至少一个合成型ITR,其产生对感染的改变的细胞应答。
本发明的另外的实施方式涉及通过rAAV载体基因组改变对感染的细胞应答的方法,所述方法包括生成包含至少一个合成型ITR的rAAV 载体基因组,其中,所述ITR中的一个或多个CpG基序被删除和/或置换,其中,包含至少一个合成型ITR的载体产生对感染的改变的细胞应答。
III.载体和病毒体
在一个实施方式中,本文公开的rAAV载体(也称为rAAV病毒体) 包含衣壳蛋白和衣壳蛋白中的rAAV基因组。用于治疗庞贝氏病的rAAV 病毒体的rAAV衣壳是表1所列的衣壳中的任一种,或它们的任意组合。
表1:AAV血清型和示例性的已公布的相应的衣壳序列
Figure BDA0003166136840000701
Figure BDA0003166136840000711
Figure BDA0003166136840000721
Figure BDA0003166136840000731
Figure BDA0003166136840000741
Figure BDA0003166136840000751
Figure BDA0003166136840000761
Figure BDA0003166136840000771
Figure BDA0003166136840000781
Figure BDA0003166136840000791
Figure BDA0003166136840000801
Figure BDA0003166136840000811
Figure BDA0003166136840000821
Figure BDA0003166136840000831
Figure BDA0003166136840000841
Figure BDA0003166136840000851
表2描述了可以在本文所述的rAAV载体中用作AAV衣壳的示例性嵌合或变体衣壳蛋白,或与目前已知或今后鉴定的野生型衣壳蛋白和/或其它嵌合或变体衣壳蛋白的任意组合,并且每种均被并入本文。在一些实施方式中,被涵盖以使用的rAAV载体是嵌合载体,例如在9,012,224 和US 7,892,809中公开的,以引用的方式将它们的整体并入本文。
在一些实施方式中,rAAV载体是PCT/US18/22725中公开的单倍体 rAAV载体,或例如2018年7月31日提交的PCT/US2018/044632和美国申请16/151,110中公开的多倍体rAAV载体,以引用的方式将它们的整体各自并入本文。在一些实施方式中,rAAV载体是rAAV3载体,如 9,012,224和WO 2017/106236中所公开的,通过引用的方式将它们的整体并入本文。
表2:示例性的嵌合和rAAV变体衣壳
Figure BDA0003166136840000861
Figure BDA0003166136840000871
在一个实施方式中,本文公开的rAAV载体包含衣壳蛋白,所述衣壳蛋白与USPTO授权的专利和公开的申请的文档集中列出的以下生物学序列文件中的任意一项相关,所述文件描述了可以以与野生型衣壳蛋白和/或目前已知或今后鉴定的其它嵌合或变体衣壳蛋白的任意组合并入本发明的AAV衣壳中的嵌合衣壳蛋白或变体衣壳蛋白(出于说明性目的,11486254对应于美国专利申请No.11/486,254,并且其它生物序列文件将以类似的方式解读):11486254.raw、11932017.raw、12172121.raw、 12302206.raw、12308959.raw、12679144.raw、13036343.raw、 13121532.raw、13172915.raw、13583920.raw、13668120.raw、 13673351.raw、13679684.raw、14006954.raw、14149953.raw、14192101.raw、14194538.raw、14225821.raw、14468108.raw、 14516544.raw、14603469.raw、14680836.raw、14695644.raw、 14878703.raw、14956934.raw、15191357.raw、15284164.raw、 15368570.raw、15371188.raw、15493744.raw、15503120.raw、15660906.raw 和15675677.raw。
在实施方式中,本发明的AAV衣壳蛋白和病毒衣壳可以是嵌合的,其中,它们可以包含来自另一种病毒的衣壳亚基的全部或部分,所述病毒可选地为另一种细小病毒或AAV,例如,如国际专利公开WO 00/28004 中所述的,以引用的方式将其并入。
在一些实施方式中,rAAV载体基因组是单链的或单体的双链体,如美国专利号8,784,799所述的,将其并入本文。
作为进一步的实施方式,本发明的AAV衣壳蛋白和病毒衣壳可以是多倍体(也称为单倍体),其中,它们可以将VP1、VP2和VP3 AAV血清型的不同组合包含在单个AAV衣壳中,如PCT/US18/22725所述的,以引用的方式将其并入本文。
在实施方式中,在如本文公开的庞贝氏病的治疗中有用的rAAV载体是AAV3b衣壳。被涵盖以使用的AAV3b衣壳描述于2017/106236和 9,012,224和7,892,809中,以引用的方式将其整体并入本文。
在一些实施方式中,AAV3b衣壳包含SEQ ID NO:44。在实施方式中,用于庞贝氏病的治疗中的AAV衣壳可以是经修饰的AAV衣壳,其全部或部分地衍生自SEQ ID NO:44示出的AAV衣壳。在一些实施方式中,来自SEQ ID NO:44示出的AAV3b衣壳的氨基酸可以是来自不同的AAV血清型的另一种衣壳的氨基酸,或被来自不同的AAV血清型的另一种衣壳的氨基酸置换,其中,置换和/或插入的氨基酸可以来自任何AAV血清型,并且可以包括天然存在的氨基酸或部分或完全合成的氨基酸。
在另一实施方式中,用于庞贝氏病的治疗中的AAV衣壳是 AAV3b265D衣壳。在该特定的实施方式中,通过用D265替换AAV3b 衣壳的氨基酸G265,AAV3b265D衣壳包含AAV3b衣壳的二重轴环 (two-fold axis loop)的氨基酸序列中的修饰。在一些实施方式中,AAV3b265D衣壳包括SEQ ID NO:46。然而,本发明的经修饰的病毒衣壳不限于SEQ ID NO:46示出的AAV衣壳。在一些实施方式中,来自 SEQ ID NO:46示出的AAV3b265D的氨基酸可以是来自不同的血清型的AAV的衣壳的氨基酸,或被来自不同的血清型的AAV的衣壳的氨基酸置换,其中,置换和/或插入的氨基酸可以来自任何AAV血清型,并且可以包括天然存在的氨基酸或部分或完全合成的氨基酸。
在另一实施方式中,在如本文公开的庞贝氏病的治疗中有用的rAAV 载体是AAV3b265D549A衣壳。在该特定实施方式中,通过用D265替换 AAV3b衣壳的氨基酸G265以及用A549置换AAV3b衣壳的氨基酸T549, AAV3b265D549A衣壳包含AAV3b衣壳的二重轴环的氨基酸序列中的修饰。在一些实施方式中,AAV3b265D549A衣壳包括SEQ ID NO:50。然而,本发明的经修饰的病毒衣壳不限于SEQ ID NO:50示出的AAV 衣壳。在一些实施方式中,来自SEQID NO:50示出的AAV3b265D549A 的氨基酸可以是来自不同血清型的AAV的衣壳的氨基酸,或被来自不同血清型的AAV的衣壳的氨基酸置换,其中,置换和/或插入的氨基酸可以来自任何AAV血清型,并且可以包括天然存在的氨基酸或部分或完全合成的氨基酸。在一些实施方式中,来自AAV3bSASTG(即,包含 Q263A/T265突变的AAV3b衣壳)的氨基酸可以是来自不同血清型的 AAV的衣壳的氨基酸,或被来自不同血清型的AAV的衣壳的氨基酸置换,其中,置换和/或插入的氨基酸可以来自任何AAV血清型,并且可以包括天然存在的氨基酸或部分或完全合成的氨基酸。
在另一实施方式中,在如本文公开的庞贝氏病的治疗中有用的rAAV 载体是AAV3b549A衣壳。在该特定的实施方式中,通过用A549替换 AAV3b衣壳的氨基酸T549,AAV3b549A衣壳包含AAV3b衣壳的二重轴环的氨基酸序列中的修饰。在一些实施方式中,AAV3b549A衣壳包括 SEQ ID NO:52。然而,本发明的经修饰的病毒衣壳不限于SEQ ID NO:52示出的AAV衣壳。在一些实施方式中,来自SEQ ID NO:52示出的 AAV3b549A的氨基酸可以是来自不同血清型的AAV的衣壳的氨基酸,或被来自不同血清型的AAV的衣壳的氨基酸置换,其中,置换和/或插入的氨基酸可以来自任何AAV血清型,并且可以包括天然存在的氨基酸或部分或完全合成的氨基酸。
在另一实施方式中,在如本文公开的庞贝氏病的治疗中有用的rAAV 载体是AAV3bQ263Y衣壳。在该特定实施方式中,通过用Y263替换 AAV3b衣壳的氨基酸Q263,AAV3bQ263Y衣壳包含AAV3b衣壳的二重轴环的氨基酸序列中的修饰。在一些实施方式中,AAV3b549A衣壳包括 SEQ ID NO:54。然而,本发明的经修饰的病毒衣壳不限于SEQ ID NO:54示出的AAV衣壳。在一些实施方式中,来自SEQ ID NO:54示出的 AAV3bQ263Y的氨基酸可以是来自不同血清型的AAV的衣壳的氨基酸,或被来自不同血清型的AAV的衣壳的氨基酸置换,其中,置换和/或插入的氨基酸可以来自任何AAV血清型,并且可以包括天然存在的氨基酸或部分或完全合成的氨基酸。
在另一实施方式中,在如本文公开的庞贝氏病的治疗中有用的rAAV 载体是AAV3bSASTG血清型或包含AAV3bSASTG衣壳。在该特定实施方式中,AAV3bSASTG衣壳包含氨基酸序列中的修饰以包含SASTG突变,特别是通过在AAV3b衣壳的相似位置引入这些修饰,将AAV3b衣壳修饰成类似于AAV2 Q263A/T265亚型(如公开于Messina EL等, Adeno-associated viral vectors based on serotype 3b use components of thefibroblast growth factor receptor signaling complex for efficienttransduction. Hum.Gene Ther.2012Oct:23(10):1031-4;Piacentino III,Valentino等,"X-linked inhibitor of apoptosis protein-mediated attenuation of apoptosis,using a novel cardiac-enhanced adeno-associated viral vector."Human genetherapy 23.6(2012):635-646,以引用的方式将两者以其整体并入本文)。因此,在一些实施方式中,在如本文公开的庞贝氏病的治疗中有用的 rAAV载体是AAV3bSASTG血清型或包含含有AAV3b Q263A/T265衣壳的AAV3bSASTG衣壳。在一些实施方式中,来自AAV3bSASTG的氨基酸可以是来自不同血清型的AAV的衣壳的氨基酸,或被来自不同血清型的AAV的衣壳的氨基酸置换,其中,置换和/或插入的氨基酸可以来自任何AAV血清型,并且可以包括天然存在的氨基酸或部分或完全合成的氨基酸。
为了促进将其引入细胞中,在本发明中有用的rAAV载体基因组是重组核酸构建体,其包括:(1)待表达的异源序列(在一个实施方式中为编码GAA多肽的多核苷酸),以及(2)促进异源基因的整合和表达的病毒序列元件。病毒序列元件可包括DNA复制和将DNA包装(例如,功能性ITR)入AAV衣壳中所需的顺式的AAV载体基因组的那些序列。在一个实施方式中,异源基因编码GAA,其对于校正患有庞贝氏病的患者中的GAA缺乏而言是有用的。在实施方式中,此类rAAV载体基因组还可包含标记物或报告基因。在实施方式中,rAAV载体基因组可以具有一个或多个AAV3b野生型(WT)顺式基因,所述基因全部或部分被置换或删除,但是保留功能性侧翼ITR序列。
在一个实施方式中,在庞贝氏病的治疗中有用的如本文公开的rAAV 载体包含被AAV3b衣壳包裹的如本文公开的rAAV基因组。在一些实施方式中,在庞贝氏病的治疗中有用的如本文公开的rAAV载体包含如本文公开的rAAV基因组,所述基因组被选自以下的任意AAV3b衣壳包裹: AAV3b衣壳(SEQ ID NO:44)、AAV3b265D衣壳(SEQ ID NO:46)、 AAV3b ST(S663V+T492V)衣壳(SEQ ID NO:48)、AAV3b265D549A 衣壳(SEQ ID NO:50)、AAV3b549A衣壳(SEQ ID NO:52)、AAV3bQ263Y 衣壳(SEQ ID NO:54)或AAV3bSASTG(即Q263A/T265)衣壳。
在本文公开的方法和组合物的一些实施方式中,本文公开的rAAV 载体包含以下的任一种的核酸序列:SEQ ID NO:57(AAT-V43M-wtGAA (delta1-69aa))、SEQ ID NO:58(ratFN1-IGF2V43M-wtGAA (delta1-69aa))、SEQ ID NO:59(hFN1-IGF2V43M-wtGAA(delta1-69aa))、SEQ ID NO:60(ATT-IGF2Δ2-7-wtGAA(delta1-69))、 SEQ ID NO:61(FN1rat-IGFΔ2-7-wtGAA(delta1-69))、SEQ ID NO:62 (hFN1-IGFΔ2-7-wtGAA(delta1-69)),或与它们具有至少80%、85%、 90%、95%或98%同一性的核酸序列。在本文公开的方法和组合物的一些实施方式中,rAAV载体包含以下的任一种的核酸序列: AAT_hIGF2-V43M_wtGAA_del1-69_Stuffer.V02(SEQ ID NO:79)、 FIBrat_hIGF2-V43M_wtGAA_del1-69_Stuffer.V02(SEQ ID NO:80)、 FIBhum_hIGF2-V43M_wtGAA_del1-69_Stuffer.V02(SEQID NO:81)、 AAT_GILT_wtGAA_del1-69__Stuffer.V02(SEQ ID NO:82)、 FIBrat_GILT_wtGAA_del1-69_Stuffer.V02(SEQ ID NO:83)、 FIBhum_GILT_wtGAA_del1-69_Stuffer.V02(SEQ ID NO:84)或与其具有至少80%、85%、90%、95%或98%同一性的核酸序列。
IV.优化的rAAV载体基因组
在本文公开的方法和组合物的一些实施方式中,优化的rAAV载体基因组从本文公开的任何元件并以任意组合创建,包括:编码启动子、ITR、poly-A尾的核酸序列,能够增加或减少异源基因表达的元件,以及在一个实施方式中,对于GAA蛋白的体内表达进行密码子优化的核酸序列(即coGAA)、以及任选的用以降低免疫原性的一个或多个元件。此类经优化的rAAV载体基因组可随着对组织和细胞具有向性的任何AAV 衣壳使用,所述rAAV载体基因组在所述组织和细胞中的待被转导和表达。
AAV3b衣壳修饰
在本文公开的方法和组合物的一些实施方式中,用于本文公开的 rAAV载体的AAV3b衣壳与如下中的任一种具有范围在例如约75%至约 100%、约80%至约100%、约85%至约100%、约90%至约100%、约95%至约100%、约75%至约99%、约80%至约99%、约85%至约99%、约 90%至约99%、约95%至约99%、约75%至约97%、约80%至约97%、约85%至约97%、约90%至约97%、或约95%至约97%的氨基酸同一性: AAV3b衣壳(SEQID NO:44)、AAV3b265D衣壳(SEQ ID NO:46)、 AAV3b ST(S663V+T492V)衣壳(SEQ ID NO:48)、AAV3b265D549A 衣壳(SEQ ID NO:50)、AAV3b549A衣壳(SEQ ID NO:52)、AAV3bQ263Y衣壳(SEQ ID NO:54)或AAV3bSASTG衣壳(即,包含Q263A/T265 突变的AAV3b衣壳),所述衣壳在Nienaber等,Hum.Gen Ther,2012, 23(10);1031-42和Piacentino III,Valentino等,"X-linked inhibitor of apoptosis protein-mediated attenuation ofapoptosis,using a novel cardiac-enhanced adeno-associated viral vector."Humangene therapy 23.6 (2012):635-646中公开,两者均以引用的方式整体并入本文。在该实施方式的又一方面,衍生自AAV3b的AAV与如下的氨基酸序列中的任一种具有范围在例如约75%至约100%、约80%至约100%、约85%至约 100%、约90%至约100%、约95%至约100%、约75%至约99%、约80%至约99%、约85%至约99%、约90%至约99%、约95%至约99%、约75%至约97%、约80%至约97%、约85%至约97%、约90%至约97%或约95%至约97%的氨基酸同一性:AAV3b衣壳(SEQ ID NO:44)、AAV3b265D 衣壳(SEQ ID NO:46)、AAV3bST(S663V+T492V)衣壳(SEQ ID NO: 48)、AAV3b265D549A衣壳(SEQ ID NO:50)、AAV3b549A衣壳(SEQ ID NO:52)、AAV3bQ263Y衣壳(SEQ ID NO:54)或AAV3bSASTG衣壳(即,包含Q263A/T265突变的AAV3b衣壳),所述衣壳在Nienaber 等,Hum.Gen Ther,2012,23(10);1031-42和Piacentino III,Valentino等, "X-linked inhibitor of apoptosis protein-mediatedattenuation of apoptosis, using a novel cardiac-enhanced adeno-associatedviral vector."Human gene therapy 23.6(2012):635-646中公开,但衣壳仍然是具有功能活性的AAV 蛋白。
在本文公开的方法和组合物的一些实施方式中,AAV血清型(例如 AAV3b)包含SASTG突变,如Messina EL等,Adeno-associated viral vectors based on serotype 3buse components of the fibroblast growth factor receptor signaling complex forefficient transduction.Hum.Gene Ther.2012 Oct:23(10):1031-42所述,通过引用的方式将其整体并入本文。
在本文公开的方法和组合物的一些实施方式中,用于本文公开的 rAAV载体的AAV3b衣壳相对于如下的氨基酸序列中的任一种具有例如至少1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、15 个、20个、25个、30个、35个、40个、45个或50个连续氨基酸的缺失、添加和/或置换:AAV3b衣壳(SEQ ID NO:44)、AAV3b265D衣壳 (SEQ ID NO:46)、AAV3b ST(S663V+T492V)衣壳(SEQ ID NO:48)、 AAV3b265D549A衣壳(SEQ ID NO:50)、AAV3b549A衣壳(SEQ ID NO: 52)、AAV3bQ263Y衣壳(SEQ ID NO:54)或AAV3bSASTG衣壳(即,包含Q263A/T265突变的AAV3b衣壳)(如Nienaber等,Hum.Gen Ther, 2012,23(10);1031-42中所公开);或相对于如下的氨基酸序列中的任一种,具有最多1个、2个、3个、4个、5个、6个、7个、8个、9个、 10个、15个、20个、25个、30个、35个、40个、45个或50个连续氨基酸的缺失、添加和/或置换:AAV3b衣壳(SEQ ID NO:44)、AAV3b265D 衣壳(SEQ ID NO:46)、AAV3b ST(S663V+T492V)衣壳(SEQ ID NO: 48)、AAV3b265D549A衣壳(SEQ ID NO:50)、AAV3b549A衣壳(SEQ ID NO:52)、AAV3bQ263Y衣壳(SEQ ID NO:54)或AAV3bSASTG衣壳(即,包含Q263A/T265突变的AAV3b衣壳)(如Nienaber等,Hum.Gen Ther,2012,23(10);1031-42中所公开)。在又一实施方式中,用于本文公开的rAAV载体的AAV3b衣壳相对于如下的氨基酸序列中的任一种具有例如至少1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、 15个、20个、25个、30个、35个、40个、45个或50个连续氨基酸的缺失、添加和/或置换,但仍然是功能活性AAV:AAV3b衣壳(SEQ IDNO: 44)、AAV3b265D衣壳(SEQ ID NO:46)、AAV3b ST(S663V+T492V) 衣壳(SEQ ID NO:48)、AAV3b265D549A衣壳(SEQ ID NO:50)、 AAV3b549A衣壳(SEQ ID NO:52)、AAV3bQ263Y衣壳(SEQ ID NO:54) 或AAV3bSASTG衣壳(即,包含Q263A/T265突变的AAV3b衣壳)(如 Nienaber等,Hum.Gen Ther,2012,23(10);1031-42中所公开);或相对于如下的氨基酸序列中的任一种,具有最多1个、2个、3个、4个、5个、 6个、7个、8个、9个、10个、15个、20个、25个、30个、35个、40 个、45个或50个连续氨基酸的缺失、添加和/或置换,但仍然是功能活性AAV:AAV3b衣壳(SEQ ID NO:44)、AAV3b265D衣壳(SEQ ID NO: 46)、AAV3b ST(S663V+T492V)衣壳(SEQID NO:48)、AAV3b265D549A 衣壳(SEQ ID NO:50)、AAV3b549A衣壳(SEQ ID NO:52)、AAV3bQ263Y 衣壳(SEQ ID NO:54)或AAV3bSASTG衣壳(即,包含Q263A/T265 突变的AAV3b衣壳)(如Nienaber等,Hum.Gen Ther,2012,23(10); 1031-42中所公开)。
在本文公开的方法和组合物的一些实施方式中,用于本文公开的 rAAV载体的AAV3b衣壳与如下的氨基酸序列的任一项具有范围在例如约75%至约100%、约80%至约100%、约85%至约100%、约90%至约 100%、约95%至约100%、约75%至约99%、约80%至约99%、约85%至约99%、约90%至约99%、约95%至约99%、约75%至约97%、约80%至约97%、约85%至约97%、约90%至约97%或约95%至约97%的氨基酸同一性:AAV3b衣壳(SEQ ID NO:44)、AAV3b265D衣壳(SEQ ID NO: 46)、AAV3b ST(S663V+T492V)衣壳(SEQ IDNO:48)、AAV3b265D549A 衣壳(SEQ ID NO:50)、AAV3b549A衣壳(SEQ ID NO:52)、AAV3bQ263Y 衣壳(SEQ ID NO:54)或AAV3bSASTG衣壳(即,包含Q263A/T265 突变的AAV3b衣壳)(如Nienaber等,Hum.Gen Ther,2012,23(10); 1031-42中所公开)。在又一进一步的实施方式中,用于本文公开的rAAV 载体的AAV3b衣壳与如下的氨基酸序列的任一项具有范围在例如约75%至约100%、约80%至约100%、约85%至约100%、约90%至约100%、约95%至约100%、约75%至约99%、约80%至约99%、约85%至约99%、约90%至约99%、约95%至约99%、约75%至约97%、约80%至约97%、约85%至约97%、约90%至约97%或约95%至约97%的氨基酸同一性,但仍是功能活性的AAV:AAV3b衣壳(SEQ ID NO:44)、AAV3b265D衣壳(SEQ ID NO:46)、AAV3b ST(S663V+T492V)衣壳(SEQ ID NO: 48)、AAV3b265D549A衣壳(SEQ ID NO:50)、AAV3b549A衣壳(SEQ ID NO:52)、AAV3bQ263Y衣壳(SEQ ID NO:54)、AAV3bSASTG衣壳 (即,包含Q263A/T265突变的AAV3b衣壳)(如Nienaber等,Hum.Gen Ther,2012,23(10);1031-42中所公开)。
V.治疗方法
A.庞贝氏病
庞贝氏病是由分解糖原(用于供能的糖的储存形式)所需的酶--酸性α-葡萄糖苷酶(GAA)的缺乏引起的罕见的遗传性紊乱。庞贝氏病也被称为糖原贮积病II型、GSD II、II型糖原贮积病、糖原症II型、酸性麦芽糖酶缺乏症、α-1,4-葡萄糖苷酶缺乏症、弥漫性糖原性心肥大和全身性糖原增多症的心脏形式。糖原的增多导致全身的渐进式肌无力(肌病),并影响各种身体组织,特别是在心脏、骨骼肌、肝、呼吸系统和神经系统中。
根据疾病发作的年龄和残留的GAA活性,庞贝氏病呈现的临床表现可能有广泛差异。残留的GAA活性与糖原积累的量和组织分布以及疾病的严重程度相关。婴幼儿发作的庞贝氏病(少于正常GAA活性的1%) 是最严重的形式,并且其特征是肌张力减退、全身性肌肉无力和肥厚型心肌病、以及心肌和其它肌肉组织中的大量糖原积累。由于心肺衰竭,通常在出生后一年内发生死亡。Hirschhorn等,(2001)“Glycogen Storage Disease Type II:Acid Alpha-glucosidase(Acid Maltase)Deficiency”,在 Scriver等编著,TheMetabolic and Molecular Basis of Inherited Disease,第 8版,New York:McGraw-Hill,3389-3420中。青少年发作(正常GAA活性的1%-10%)和成年发作(正常GAA活性的10%-40%)庞贝氏病更为临床异质,在发病年龄、临床表现和疾病进展方面具有更大的变化。青少年发作的和成年发作的庞贝氏病的特征通常是没有严重的心脏累及、发病年龄较晚且疾病进展较慢,但最终呼吸肌或四肢肌肉累及导致显著的发病率和死亡率。虽然预期寿命可能会有所不同,但死亡通常是由于呼吸衰竭而导致的。Hirschhorn等,(2001)“Glycogen Storage Disease Type II:Acid Alpha-glucosidase(Acid Maltase)Deficiency”,在Scriver等编著, The Metabolic and Molecular Basis of InheritedDisease,第8版,New York: McGraw-Hill,3389-3420中。
在本文公开的方法和组合物的任何实施方式中,适用于治疗庞贝氏病的GAA酶包括野生型人GAA或其保留在线性低聚糖中切割α1-4连接键的能力的片段或序列变体。在本文公开的方法和组合物的一些实施方式中,GAA蛋白由野生型GAA核酸序列(例如SEQ IDNO:11或SEQ ID NO:72)编码。在本文公开的方法和组合物的一些实施方式中,GAA蛋白由例如为了以下任一项或多项进行密码子优化的GAA核酸序列编码: (1)增强体内表达,(2)减少CpG岛,或(3)降低固有免疫应答。在本文公开的方法和组合物的一些实施方式中,GAA蛋白由密码子优化的 GAA核酸序列编码,例如,选自以下任一种的任意核酸序列:SEQ ID NO:73、SEQ ID NO:74、SEQ ID NO:75和SEQ ID NO:76,或与SEQ ID NO: 73、SEQ ID NO:74、SEQID NO:75和SEQ ID NO:76具有至少60%、或70%、或80%、或85%、或90%、或95%、或98%、或99%序列同一性的核酸序列。
在本文公开的方法和组合物的一些实施方式中,本文所述的rAAV 载体转导受试者的肝,并将hGAA多肽分泌到灌注患者组织的血液中,在所述组织中在融合的IGF2-序列的帮助下,hGAA多肽被细胞摄取并转运至溶酶体,在所述溶酶体中该酶发挥作用以消除由于酶缺乏而积累在溶酶体中的物质。为了溶酶体酶替代疗法变得有效,必须将治疗的酶递送至在如下组织的合适细胞中的溶酶体,在所述组织中贮积缺陷显现。
术语“非阳离子依赖性甘露糖-6-磷酸受体(CI-MPR)”、“M6P/IGF-II 受体”、“CI-MPR/IGF-II受体”、“IGF-II受体”或“IGF2受体”或其缩写在本文可互换使用,是指结合M6P和IGF-II两者的细胞受体。
B.在离体细胞中调节GAA的水平
本文所述的核酸、载体和病毒体可用于调节细胞中的GAA的水平。该方法包括向细胞给予包含核酸的组合物步骤,所述核酸包括插入两个 AAV ITR之间的编码GAA的多核苷酸。该细胞可以来自可以向其中给予本发明的核酸的任何动物。来自患有GAA缺乏症的受试者的哺乳动物细胞(例如人、狗、猫、猪、绵羊、小鼠、大鼠、兔、牛、山羊等)是用于本发明的典型的靶细胞。在一些实施方式中,细胞是肝的细胞或心肌的细胞,例如心肌细胞。
在实施方式中,本文公开了转导有rAAV载体的细胞的离体递送。在进一步的实施方式中,离体基因递送可用于将本文公开的转导有rAAV 载体的细胞移植回宿主。在进一步的实施方式中,离体干细胞(例如,间充质干细胞)疗法可用于将本文公开的转导有rAAV载体的细胞移植回宿主。在另一实施方式中,合适的离体方案可以包括数个步骤。
在一些实施方式中,可从受试者收获一部分靶组织(例如,肌肉、肝组织),并且本文所述的rAAV载体用于将编码GAA的核酸转导至宿主细胞中。然后可以将这些经遗传修饰的细胞移植回宿主中。可以使用数种方法将细胞重新引入宿主中,包括静脉内注射、腹膜内注射、皮下注射或原位注射入靶组织中。如本文所述的转导或感染有rAAV载体的经修饰的离体细胞的微囊化是可在本发明中使用的另一项技术。可以根据本发明使用自体和同种异体细胞移植。
在又一实施方式中,本文公开了治疗受试者中的GAA缺乏的方法,所述方法包括以药学上可接受的辅料并以治疗有效量向受试者给予本文公开的表达GAA的细胞。在一些实施方式中,受试者是人。
C.增加受试者中的GAA活性
如本文所述的核酸、载体和病毒体可用于调节受试者(例如人类受试者或患有庞贝氏病或处于患庞贝氏病的风险中的受试者)中的功能性 GAA多肽的水平。该方法包括向受试者给予包含含有如本文所述的rAAV 基因组的rAAV载体的组合物,所述rAAV基因组包含插入两个AAV ITR 之间的编码GAA的异源核酸,其中所述hGAA连接至本文所述的信号肽、以及可选的如本文公开的IGF-2序列。受试者可以是任何动物,例如哺乳动物(例如,人类、狗、猫、猪、绵羊、小鼠、大鼠、兔、牛、山羊等)是合适的受试者。本发明的方法和组合物尤其可应用至GAA缺乏的人类受试者。
此外,本文所述的核酸、载体和病毒体可以通过任何合适的方法以任何合适的制剂给予至动物(包括人类)。例如,在本文公开的方法和组合物的任何实施方式中,本文公开的rAAV载体或rAAV基因组可以直接引入动物中,包括通过口服给予、直肠给予、经粘膜给予、鼻内给予、吸入给予(例如通过气溶胶)、颊给予(例如舌下)、阴道给予、鞘内给予、眼内给予、经皮给予、子宫内(或卵内)给予、肠胃外(例如,静脉内、皮下、皮内、肌肉内[包括向骨骼肌、膈肌和/或心肌的给予]、皮内、胸膜内、大脑内和关节内)给予、局部给予(例如,向皮肤和粘膜表面两者给予,包括气道表面和经皮给予)、淋巴内给予等,以及直接的组织或器官注射(例如,向肝、骨骼肌、心肌、膈肌或脑注射)或其它肠胃外途径,取决于期望的给予途径和所靶向的组织。
在本文公开的方法和组合物的任何实施方式中,根据本发明向骨骼肌给予包括但不限于向四肢(例如,上臂、下臂、大腿和/或小腿)、背部、颈部、头部(例如,舌)、胸部、腹部、骨盆/会阴和/或指(趾)(digit) 中的骨骼肌的给予。合适的骨骼肌包括但不限于小指展肌(在手中)、小趾展肌(在脚中)、拇展肌、第五跖骨外展肌、拇短展肌、拇长展肌、短收肌、拇趾收肌(adductor hallucis)、长收肌、大收肌、拇指收肌(adductor pollicis)、肘肌、前斜角肌、膝关节肌、肱二头肌、股二头肌、肱肌、肱桡肌、颊肌、喙肱肌、皱眉肌、三角肌、降口角肌、降下唇肌、二腹肌、骨间背侧肌(在手中)、骨间背侧肌(在脚中)、桡侧腕短伸肌、桡侧腕长伸肌、尺侧腕伸肌、小指伸肌、指伸肌、趾短伸肌、趾长伸肌、拇趾短伸肌(extensor hallucisbrevis)、拇趾长伸肌(extensor hallucis longus)、食指伸肌、拇指短伸肌(extensorpollicis brevis)、拇指长伸肌(extensor pollicis longus)、桡侧腕屈肌、尺侧腕屈肌、小指短屈肌(在手中)、小趾短屈肌(在脚中)、趾短屈肌、趾长屈肌、指深屈肌、指浅屈肌、拇趾短屈肌(flexor hallucis brevis)、拇趾长屈肌(flexor hallucis longus)、拇指短屈肌(flexor pollicis brevis)、拇指长屈肌(flexor pollicis longus)、额肌、腓肠肌、颏舌骨肌、臀大肌、臀中肌、臀小肌、股薄肌、颈髂肋肌、腰髂肋肌、胸髂肋肌、髂肌、下孖肌、下斜肌、下直肌、冈下肌、棘间肌、横突间肌、翼外肌、外直肌、背阔肌、提口角肌、提上唇肌、提上唇鼻翼肌、上睑提肌、肩胛提肌、长回旋肌、头最长肌、颈最长肌、胸最长肌、头长肌、颈长肌、蚓状肌(在手中)、蚓状肌(在脚中)、咬肌、翼内肌、内直肌、中斜角肌、多裂肌、下颌舌骨肌、头下斜肌、头上斜肌、闭孔外肌、闭孔内肌、枕肌、肩胛舌骨肌、小指对掌肌(opponensdigiti minimi)、拇对掌肌、眼轮匝肌、口轮匝肌、骨间掌侧肌、掌短肌、掌长肌、耻骨肌、胸大肌、胸小肌、腓骨短肌、腓骨长肌、第三腓骨肌、梨状肌、骨间足底肌、跖肌、颈阔肌、腘肌、后斜角肌、旋前方肌、旋前圆肌、腰大肌、股方肌、足底方肌、头前直肌、头外侧直肌、头后大直肌、头后小直肌、股直肌、大菱形肌、小菱形肌、笑肌、缝匠肌、小斜角肌、半膜肌、头半棘肌、颈半棘肌、胸半棘肌、半腱肌、前锯肌、短回旋肌、比目鱼肌、头棘肌、颈棘肌、胸棘肌、头夹肌、颈夹肌、胸锁乳突肌、胸骨舌骨肌、胸骨甲状肌、茎突舌骨肌、锁骨下肌、肩胛下肌、上孖肌、上斜肌、上直肌、旋后肌、冈上肌、颞肌、阔筋膜张肌、大圆肌、小圆肌、胸肌(thoracis)、甲状舌骨肌、胫骨前肌、胫骨后肌、斜方肌、肱三头肌、股中间肌、股外侧肌、股内侧肌、颧大肌和颧小肌以及本领域已知的任何其它合适的骨骼肌。
在本文公开的方法和组合物的任何实施方式中,向心肌给予包括向左心房、右心房、左心室、右心室和/或间隔(septum)给予。病毒载体和/或衣壳可以通过静脉内给予、动脉内给予(例如主动脉内给予)、直接心脏注射(例如,注入左心房、左心房、左心室、右心室)和/或冠状动脉灌注而递送至心肌。
在本文公开的方法和组合物的任何实施方式中,向膈肌的给予可以通过任何合适的方法进行,包括静脉内给予、动脉内给予和/或腹膜内给予。
在本文公开的方法和组合物的任何实施方式中,将本文公开的rAAV 载体和/或rAAV基因组给予至受试者的骨骼肌、肝、膈肌、肋肌和/或心肌细胞。例如,可以使用常规的注射器和针头将rAAV病毒体悬剂注射入动物中。通过注射的rAAV载体和/或rAAV基因组的胃肠外给予可以通过例如团注(bolus injection)或持续输注进行。注射制剂可以以单位剂量形式存在,例如随着加入的防腐剂存在于多剂量容器或安瓿中。该组合物可以采取诸如在油性或水性溶媒中的悬剂、溶液剂或乳剂的形式,并且可以包含用于药物制剂的试剂,例如助悬剂、稳定剂和/或分散剂。或者,本文公开的rAAV载体和/或rAAV基因组可以呈粉末形式(例如经冻干的),以在使用前与合适的溶媒(例如灭菌无热原水)一起构成。
在具体实施方式中,可以采用多于一次的给予(例如,两次、三次、四次、五次、六次、七次、八次、九次、十次等,或更多次给予),以在不同的时间间隔的时间段(如每小时、每天、每周、每月、每年等)内达到期望的基因表达水平。给药可以是单剂量或累积剂量(连续给药),并且可以由本领域技术人员容易地确定。例如,疾病或紊乱的治疗可以包含一次给予有效剂量的本文公开的药物组合物病毒载体。或者,疾病或紊乱的治疗可包含在时间段的范围内的有效剂量的病毒载体的多次给予,例如每天一次、每天两次、每天三次、每数天一次或每周一次。
取决于个体症状的严重程度等因素,给予时机因个体而异。例如,可以在不确定的时间段内每六个月一次向个体给予有效剂量的本文公开的病毒载体,或者直到个体不再需要治疗为止。本领域普通技术人员将认识到,可以在整个治疗过程中监测个体的状况,并且可以相应地调节所给予的本文公开的病毒载体的有效量。
注射剂可以以常规形式制备,作为液体溶液剂或悬剂、注射前的适合于溶液剂或悬剂的固体形式,或作为乳剂。或者,可以以局部而非全身的方式(例如以长效制剂或缓释制剂)给予本发明的病毒载体和/或病毒衣壳。此外,病毒载体和/或病毒衣壳可以附着到外科可植入基质而进行递送(例如,如美国专利公开号US-2004-0013645-A1中所述)。本文公开的病毒载体和/或病毒衣壳可以通过任何合适的方式给予至受试者的肺部,任选地通过给予由病毒载体和/或病毒衣壳构成的可吸入颗粒的气溶胶悬剂,由受试者吸入所述悬剂。可吸入颗粒可以是液体或固体。如本领域技术人员已知的,包含病毒载体和/或病毒衣壳的液体颗粒的气溶胶可以通过任何合适的方法产生,例如利用压力驱动的气溶胶雾化器或超声雾化器。参见例如,美国专利号4,501,729。包含病毒载体和/或衣壳的固体颗粒的气溶胶也可以同样地通过制药领域已知的技术用任何固体颗粒药物气溶胶发生器产生。
在一些实施方式中,本文公开的rAAV载体和/或rAAV基因组可以以足以溶解本文公开的rAAV载体的量在溶剂、乳剂或其它稀释剂中配制。在该实施方式的其它方面,本文公开的rAAV载体和/或rAAV基因组可以以如下的量在溶剂、乳剂或稀释剂中配制,例如小于约90%(v/v)、小于约80%(v/v)、小于约70%(v/v)、小于约65%(v/v)、小于约60% (v/v)、小于约55%(v/v)、小于约50%(v/v)、小于约45%(v/v)、小于约40%(v/v)、小于约35%(v/v)、小于约30%(v/v)、小于约25%(v/v)、小于约20%(v/v)、小于约15%(v/v)、小于约10%(v/v)、小于约5% (v/v)或小于约1%(v/v)。在其它方面,本文公开的rAAV载体和/或 rAAV基因组可以以处于如下范围内的量包含溶剂、乳剂或其它稀释剂,例如约1%(v/v)至90%(v)、约1%(v/v)至70%(v/v)、约1%(v/v) 至60%(v/v)、约1%(v/v)至50%(v/v)、约1%(v/v)至40%(v/v)、约1%(v/v)至30%(v/v)、约1%(v/v)至20%(v/v)、约1%(v/v) 至10%(v/v)、约2%(v/v)至50%(v/v)、约2%(v/v)至40%(v/v)、约2%(v/v)至30%(v/v)、约2%(v/v)至20%(v/v)、约2%(v/v) 至10%(v/v)、约4%(v/v)至50%(v/v)、约4%(v/v)至40%(v/v)、约4%(v/v)至30%(v/v)、约4%(v/v)至20%(v/v)、约4%(v/v) 至10%(v/v)、约6%(v/v)至50%(v/v)、约6%(v/v)至40%(v/v)、约6%(v/v)至30%(v/v)、约6%(v/v)至20%(v/v)、约6%(v/v) 至10%(v/v)、约8%(v/v)至50%(v/v)、约8%(v/v)到40%(v/v)、约8%(v/v)到30%(v/v)、约8%(v/v)至20%(v/v)、约8%(v/v) 至15%(v/v)或约8%(v/v)至12%(v/v)。
在本文公开的方法和组合物的任何实施方式中,本文公开的任意血清型的rAAV载体和/或rAAV基因组包括但不限于被选自以下的任何 AAV3b衣壳包裹:AAV3b衣壳(SEQ IDNO:44)、AAV3b265D衣壳(SEQ ID NO:46)、AAV3b ST(S663V+T492V)衣壳(SEQ ID NO:48)、AAV3b265D549A衣壳(SEQ ID NO:50)、AAV3b549A衣壳(SEQ ID NO: 52)、AAV3bQ263Y衣壳(SEQ ID NO:54)或AAV3bSASTG衣壳(即,包含Q263A/T265突变的AAV3b衣壳),可以包含治疗有效量的治疗化合物。在实施方式中,如本文所用的但不受限的,术语“有效量”与“治疗有效量”、“有效剂量”或“治疗有效剂量”同义。在实施方式中,本文公开的用于治疗庞贝氏病的治疗化合物的有效性可以不受限制地通过观察基于与庞贝氏病相关的一个或多个临床症状和/或生理指标的个体中的改善来确定。在实施方式中,可以通过对同步治疗减少的需求来表明与庞贝氏病相关的症状的改善。
示例性给予方式包括口服、直肠、经粘膜、鼻内、吸入(例如通过气溶胶)、颊(例如舌下)、阴道、鞘内、眼内、经皮、子宫内(或卵内)、肠胃外(例如,静脉内、皮下、皮内、肌肉内[包括向骨骼肌、膈肌和/ 或心肌的给予]、皮内、胸膜内、大脑内和关节内)、局部(例如,向皮肤和粘膜表面两者给予,包括气道表面和经皮给予)、淋巴内等,以及直接的组织或器官注射(例如,向肝、骨骼肌、心肌、膈肌或脑注射)。给予也可以给予至肿瘤(例如,在肿瘤或淋巴结中或附近)。在任意给定情况下,最合适的途径将取决于所治疗和/或预防的病症的性质和严重程度,以及取决于所使用的特定载体的性质。
为了促进本文公开的rAAV载体和/或rAAV基因组的递送,可以将其与辅料或赋形剂混合。可能使用的辅料和赋形剂包括盐水(特别是灭菌的无热原盐水)、盐水缓冲液(例如,柠檬酸盐缓冲液、磷酸盐缓冲液、乙酸盐缓冲液和碳酸氢盐缓冲液)、氨基酸、尿素、醇、抗坏血酸、磷脂、蛋白质(例如血清白蛋白)、EDTA、氯化钠、脂质体、甘露醇、山梨糖醇和甘油。USP级辅料和赋形剂对于将病毒体递送至人类受试者特别有用。
除了前述的制剂之外,本文公开的rAAV载体和/或rAAV基因组也可以被配制成长效制剂。此类长期作用配方可以通过植入(例如皮下或肌内)或通过IM注射来给予。因此,例如,本文公开的rAAV载体和/ 或rAAV基因组可以用合适的聚合材料或疏水材料(例如作为可接受的油中的乳剂)或离子交换树脂或作为微溶衍生物来配制。
在本文公开的方法和组合物的任何实施方式中,该方法针对治疗受试者中的由GAA缺乏引起的庞贝氏病,其中,将本文公开的rAAV载体和/或rAAV基因组给予至患有庞贝氏病的患者,并在给予后,GAA从肝脏中的细胞中分泌出来,并且分泌的GAA被骨骼肌组织、心肌组织、膈肌组织或它们的组合中的细胞摄取,其中,对分泌的GAA的摄取引起组织中溶酶体糖原存储的减少。在一些实施方式中,本文公开的rAAV载体和/或rAAV基因组被包裹在衣壳中,例如,被选自以下的任意AAV3b 衣壳包裹:AAV3b衣壳(SEQ ID NO:44)、AAV3b265D衣壳(SEQ ID NO: 46)、AAV3b ST(S663V+T492V)衣壳(SEQ ID NO:48)、AAV3b265D549A 衣壳(SEQ ID NO:50)、AAV3b549A衣壳(SEQ ID NO:52)、AAV3bQ263Y 衣壳(SEQ ID NO:54)。
在具体的实施方式中,将在药学上可接受的辅料中每剂给予至少约 102至约108个细胞或至少约103至约106个细胞。在进一步的实施方式中,待给予至受试者的病毒载体和/或衣壳的剂量取决于给予方式、待治疗和 /或预防的疾病或病症、个体受试者的状况、具体的病毒载体或衣壳、待递送的核酸等,并且可以用常规方式确定。用于达到治疗效果的示例性剂量是至少约105、106、107、108、109、1010、1011、1012、103、1014、 1015转导单位的滴度,任选地为约108-1013转导单位。
在另一方面,本文公开了向细胞给予编码GAA的核酸的方法,该方法包括在待将核酸引入细胞并表达以产生GAA的条件下,使细胞与本文公开的rAAV载体和/或rAAV基因组接触。在一些实施方式中,细胞是经培养的细胞。在一些实施方式中,细胞是体内细胞。在一些实施方式中,细胞是哺乳动物细胞。在一些实施方式中,向细胞给予编码GAA的核酸的方法进一步包括收集分泌到细胞培养基中的GAA。
D.增加哺乳动物中的运动神经元的功能
在本文公开的方法和组合物的任何实施方式中,本文公开的rAAV 载体和/或rAAV基因组在组合物和方法中有用,所述组合物和方法用于在患有庞贝氏病和/或具有不足的GAA水平的哺乳动物中增加膈神经活性。例如,本文公开的rAAV载体和/或rAAV基因组,例如,被包裹在衣壳中的rAAV载体和/或rAAV基因组,例如,被选自以下的任意AAV3b 衣壳包裹,可以被给予至中枢神经系统(例如神经元):AAV3b衣壳(SEQ ID NO:44)、AAV3b265D衣壳(SEQ ID NO:46)、AAV3b ST (S663V+T492V)衣壳(SEQ ID NO:48)、AAV3b265D549A衣壳(SEQID NO:50)、AAV3b549A衣壳(SEQ ID NO:52)、AAV3bQ263Y衣壳(SEQ ID NO:54)。在另一实施方式中,本文公开的编码GAA的rAAV载体和 /或rAAV基因组从膈肌(或其它肌肉)向膈神经或其它运动神经元的逆向转运可引起庞贝氏病的生化性和生理性校正。这些相同的原理可以应用至其它神经退行性疾病。
在实施方式中,如表1所述的任何血清型的rAAV GAA构建体,包括AAV8或AAV3、或AAV3b(包括但不限于AAV3b血清型AAV3b265D、 AAV3b265D549A、AAV3b549A、AAV3bQ263Y、AAV3bSASTG(即,包含Q263A/T265突变的AAV3b衣壳)血清型),能够降低患者的较下的肢体(lower extremity)(包括患有庞贝氏病的患者的腿、躯干和/或手臂) 的无力感,与未接受相同治疗的患者相比降低例如至少10%、至少15%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少 80%、至少85%、至少90%或至少95%。在该实施方式的其它方面,任何血清型的AAVGAA能够降低患者的较下的肢体(包括患有庞贝氏病的患者的腿、躯干和/或手臂)的无力感,与未接受相同治疗的患者相比降低例如约10%至约100%、约20%至约100%、约30%至约100%、约 40%至约100%、约50%至约100%、约60%至约100%、约70%至约100%、约80%至约100%、约10%至约90%、约20%至约90%、约30%至约90%、约40%至约90%、约50%至约90%、约60%至约90%、约70%至约90%、约10%至约80%、约20%至约80%、约30%至约80%、约40%至约80%、约50%至约80%、或约60%至约80%、约10%至约70%、约20%至约70%、约30%至约70%、约40%至约70%、或约50%至70%。
在本文公开的方法和组合物的任何实施方式中,如表1所述的任何血清型的rAAVGAA构建体,包括如本文公开的AAV8或AAV3b(包括但不限于AAV3b血清型AAV3b265D、AAV3b265D549A、AAV3b549A、 AAV3bQ263Y和AAV3bSASTG(即,包含Q263A/T265突变的AAV3b衣壳)),能够减少患有庞贝氏病的患者的以下的一种或多种,与未接受相同治疗的患者相比减少例如至少10%、至少15%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少 90%或至少95%:呼吸短促、运动困难、肺部感染、脊柱的大的弯曲、睡觉时呼吸困难、肝脏肿大、舌头肿大和/或关节僵硬。在该实施方式的方法和组合物的其它方面,本文公开的AAV3bQ263Y GAA能够减少患有庞贝氏病的患者的以下的一种或多种,与未接受相同治疗的患者相比减少例如约10%至约100%、约20%至约100%、约30%至约100%、40%至约100%、约50%至约100%、约60%至约100%、约70%至约100%、约80%至约100%、约10%至约90%、约20%至约90%、约30%至约90%、约40%至约90%、约50%至约90%、约60%至约90%、约70%至约90%、约10%至约80%、约20%至约80%、约30%至约80%、约40%至约80%、约50%至约80%、或约60%至约80%、约10%至约70%、约20%至约70%、约30%至约70%、约40%至约70%、或约50%至约70%:呼吸短促、运动困难、肺部感染、脊柱的大的弯曲、睡觉时呼吸困难、肝脏肿大、舌头肿大和/或关节僵硬。
在本文公开的方法和组合物的任何实施方式中,本文公开的任何血清型的如本文公开的rAAV载体和/或rAAV基因组能够减少患有庞贝氏病的患者的以下的一种或多种,与未接受相同治疗的患者相比减少例如至少10%、至少15%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少 70%、至少75%、至少80%、至少85%、至少90%或至少95%:呼吸短促、运动困难、肺部感染、脊柱的大的弯曲、睡觉时呼吸困难、肝脏肿大、舌头肿大和/或关节僵硬。在该实施方式的其它方面,本文公开的任何血清型的rAAV载体和/或rAAV基因组能够减少患有庞贝氏病的患者的以下的一种或多种,与未接受相同治疗的患者相比减少例如约10%至约100%、约20%至约100%、约30%至约100%、约40%至约100%、约 50%至约100%、约60%至约100%、约70%至约100%、约80%至约100%、约10%至约90%、约20%至约90%、约30%至约90%、约40%至约90%、约50%至约90%、约60%至约90%、约70%至约90%、约10%至约80%、约20%至约80%、约30%至约80%、约40%至约80%、约50%至约80%、或约60%至约80%、约10%至约70%、约20%至约70%、约30%至约70%、约40%至约70%或约50%至约70%:呼吸短促、运动困难、肺部感染、脊柱的大的弯曲、睡觉时呼吸困难、肝脏肿大、舌头肿大和/或关节僵硬。
在本文公开的方法和组合物的任何实施方式中,与庞贝氏病有关的症状减少至少10%、至少15%、至少20%、至少25%、至少30%、至少 35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%或至少95%,并且与庞贝氏病有关的症状的严重程度降低至少10%、至少15%、至少 20%、至少25%、至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%或至少95%。在另一实施方式中,与庞贝氏病有关的症状减少约10%至约100%、约20%至约100%、约30%至约100%、约40%至约100%、约50%至100%、约60%至约100%、约70%至约100%、约80%至约100%、约10%至约90%、约20%至约90%、约30%至约90%、约40%至约90%、约50%至约90%、约60%至约90%、约70%至约90%、约10%至约80%、约20%至约80%、约30%至约80%、约40%至约80%、约50%至约80%、或约60%至约80%、约10%至约70%、约20%至约70%、约30%至约70%、约40%至约70%或约50%至约70%。
在实施方式中,与庞贝氏病有关的不良反应减少至少10%、至少 15%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%或至少95%,并且与庞贝氏病有关的不良反应的严重程度降低至少10%、至少15%、至少20%、至少25%、至少 30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%或至少95%。在另一实施方式中,与庞贝氏病有关的不良反应减少约10%至约100%、约20%至约100%、约30%至约100%、约40%至约100%、约 50%至约100%、约60%至约100%、约70%至约100%、约80%至约100%、约10%至约90%、约20%至约90%、约30%至约90%、约40%至约90%、约50%至约90%、约60%至约90%、约70%至约90%、约10%至约80%、约20%至约80%、约30%至约80%、约40%至约80%、约50%至约80%、或约60%至约80%、约10%至约70%、约20%至约70%、约30%至约70%、约40%至约70%、或约50%至约70%。
D.小鼠模型
E.免疫抑制
在本文公开的方法和组合物的任何实施方式中,向给予了本文公开的rAAV载体或rAAV基因组的受试者给予免疫抑制剂。已知引起给予 AAV的患者的免疫应答的免疫抑制的多种方法。本领域已知的方法包括向患者给予免疫抑制剂,例如蛋白酶体抑制剂。本领域已知的一种此类蛋白酶体抑制剂是硼替佐米,例如美国专利号9,169,492和美国专利申请号15/796,137(二者均以引用的方式并入本文)中所公开。在另一实施方式中,免疫抑制剂可以是抗体,包括能够通过例如消除或抑制产生抗体的细胞来抑制免疫应答的多克隆抗体、单克隆抗体、scfv或其它由抗体衍生而来的分子。在进一步的实施方式中,免疫抑制元件可以是短发夹RNA(shRNA)。在此类实施方式中,shRNA的编码区被包含在rAAV 盒中,并且通常位于poly-A尾的3'端下游。shRNA可以被靶向以减少或消除免疫刺激剂的表达,所述免疫刺激剂例如细胞因子、生长因子(包括转化生长因子β1和β2、TNF和其它公知的因子)。
V.给予
待向受试者给予的本文公开的rAAV载体或rAAV基因组的剂量取决于给予方式、待治疗和/或预防的疾病或病症、个体受试者的状况、具体的病毒载体或衣壳和待递送的核酸等,且可以以常规方式来确定。用于达到治疗效果的示例性剂量是至少约105、106、107、108、109、1010、1011、 1012、1013、1014、1015转导单位的滴度,任选地为约108至约1013转导单位的滴度。
在进一步的实施方式中,向受试者给予如本文所公开的rAAV载体或rAAV基因组引起产生具有如下的循环半衰期的GAA蛋白:2小时、3 小时、4小时、5小时、6小时、7小时、8小时、9小时、10小时、11 小时、12小时、13小时、14小时、15小时、16小时、17小时、18小时、19小时、20小时、21小时、22小时、23小时、1天、2天、3天、4天、 5天、6天、7天、1周、2周、3周、4周、一个月、两个月、三个月、四个月或更久。
在实施方式中,将本文公开的rAAV载体或rAAV基因组给予至受试者的时间段为1天、2天、3天、4天、5天、6天、7天、8天、9天、 10天、11天、12天、13天、14天、3周、4周、5周、6周、7周、8 周、9周、10周、11周、12周、4个月、5个月、6个月、7个月、8个月、9个月、10个月、11个月、12个月或更久。在进一步的实施方式中,在其中停止给予的时间段为1天、2天、3天、4天、5天、6天、7天、 8天、9天、10天、11天、12天、13天、14天、3周、4周、5周、6 周、7周、8周、9周、10周、11周、12周、4个月、5个月、6个月、7 个月、8月、9个月、10个月、11个月、12个月或更久。
在另一实施方式中,如本文公开的用于治疗庞贝氏病的rAAV载体或rAAV基因组的给予引起体重增加,例如至少0.5磅、至少1磅、至少 1.5磅、至少2磅、至少2.5磅、至少3磅、至少3.5磅、至少4磅、至少4.5磅、至少5磅、至少5.5磅、至少6磅、至少6.5磅、至少7磅、至少7.5磅、至少8磅、至少8.5磅、至少9磅、至少9.5磅、至少10 磅、至少10.5磅、至少11磅、至少11.5磅、至少12磅、至少12.5磅、至少13磅、至少13.5磅、至少14磅、至少14.5磅、至少15磅、至少20磅、至少25磅、至少30磅、至少50磅。在另一实施方式中,如本文公开的用于治疗庞贝氏病的任何血清型的AAV GAA引起体重增加,例如0.5磅至50磅、0.5磅至30磅、从0.5磅至25磅、0.5磅至20磅、0.5 磅至15磅、0.5磅至10磅、0.5磅至7.5磅、0.5磅至5磅、1磅至15磅、 1磅至10磅、1磅至7.5磅、1磅至5磅、2磅至10磅、2磅至7.5磅。
本文公开的组合物和技术方法的所有方面可以在以下任意一个或多个编号的段落中定义:
1.一种重组腺病毒相关(AAV)载体,所述载体在其基因组中包含:
a.5'和3'AAV反向末端重复(ITR)序列;以及
b.位于5'和3'ITR之间的异源核酸序列,所述异源核酸序列编码包含分泌信号肽和α-葡萄糖苷酶(GAA)多肽的融合多肽,其中,所述异源核酸可操作地连接至启动子。
2.根据段落1所述的重组AAV载体,其中,编码融合多肽的所述异源核酸序列进一步包含位于所述分泌信号肽和所述α-葡萄糖苷酶 (GAA)多肽之间的IGF-2序列。
3.根据段落1或2所述的重组AAV载体,其中,所述AAV基因组以5'至3'的方向包含:
a.5'ITR;
b.启动子序列;
c.内含子序列;
d.编码分泌信号肽的核酸;
e.编码IGF-2序列的核酸;
f.编码α-葡萄糖苷酶(GAA)多肽的核酸;
g.poly A序列;以及
h.3'ITR。
4.根据段落1-3中任一段所述的重组AAV载体,其中,所述分泌信号肽选自AAT信号肽、纤连蛋白信号肽(FN)、GAA信号肽或它们的具有分泌信号活性的活性片段。
5.根据段落1-3中任一段所述的重组AAV载体,其中,所述IGF-2 前导序列结合人非阳离子依赖性甘露糖-6-磷酸受体(CI-MPR)或IGF-2 受体。
6.根据段落1-5中任一段所述的重组AAV载体,其中,所述IGF-2 序列包含SEQ IDNO:5或包含结合至IGF-2受体的SEQ ID NO:5中的至少一个氨基修饰。
7.根据段落1-6中任一段所述的重组AAV载体,其中,SEQ ID NO: 5中的所述至少一个氨基修饰是V43M氨基酸修饰(SEQ ID NO:8或SEQ ID NO:9)或Δ2-7(SEQ ID NO:6)或Δ1-7(SEQ ID NO:7)。
8.根据段落1-7中任一段所述的重组AAV载体,其中,所述启动子是组成型、细胞特异性或诱导型的。
9.根据段落1-8中任一段所述的重组AAV载体,其中,所述启动子是肝特异性启动子。
10.根据段落1-9中任一段所述的重组AAV载体,其中,所述肝特异性启动子选自以下中的任一项:甲状腺素转运蛋白启动子(TTR)、LSP 启动子(LSP)、合成型肝特异性启动子。
11.根据段落1-10中任一段所述的重组AAV载体,其中,所述核酸序列编码野生型GAA多肽或经修饰的GAA多肽。
12.根据段落1-11中任一段所述的重组AAV载体,其中,编码所述 GAA多肽的核酸序列是人GAA基因或人密码子优化的GAA基因 (CoGAA)或经修饰的GAA核酸序列。
13.根据段落1-12中任一段所述的重组AAV载体,其中,编码所述 GAA多肽的核酸序列经密码子优化以增强体内表达。
14.根据段落1-13中任一段所述的重组AAV载体,其中,编码所述 GAA多肽的核酸序列经密码子优化以减少CpG岛。
15.根据段落1-14中任一段所述的重组AAV载体,其中,编码所述 GAA多肽的核酸序列经密码子优化以降低固有免疫应答。
16.根据段落1-15中任一段所述的重组AAV载体,其中,编码所述 GAA多肽的核酸序列经密码子优化以减少CpG岛并降低固有免疫应答。
17.根据段落1-16中任一段所述的重组AAV载体,其中,经编码的所述融合多肽进一步包含间隔区,所述间隔区包含位于所述GAA多肽的氨基末端和所述IGF-2序列的C-末端的至少1个氨基酸的核苷酸序列。
18.根据段落1-7中任一段所述的重组AAV载体,所述重组AAV载体进一步包含编码至少1个氨基酸的间隔区的核酸,所述核酸位于编码所述IGF-2序列的核酸和编码所述GAA多肽的核酸之间。
19.根据段落1-8中任一段所述的重组AAV载体,所述重组AAV载体进一步包含位于编码所述GAA基因的核酸的3'端和所述3'ITR序列的 5'端的至少1个poly A序列。
20.根据段落1-19中任一段所述的重组AAV载体,其中,所述异源核酸序列进一步包含位于编码所述GAA多肽的核酸的3'端和所述3'ITR 序列的5'端的胶原蛋白稳定性(CS)序列。
21.根据段落1-20中任一段所述的重组AAV载体,所述重组AAV 载体进一步包含编码胶原蛋白稳定性(CS)序列的核酸,所述核酸位于编码所述GAA多肽的核酸与所述poly A序列之间。
22.根据段落1-21中任一段所述的重组AAV载体,所述重组AAV 载体进一步包含位于编码所述分泌信号肽的序列的5'端和所述启动子的 3'端的内含子序列。
23.根据段落1-22中任一段所述的重组AAV载体,其中,所述内含子序列包含MVM序列或HBB2序列,其中,所述MVN序列包含SEQ ID NO:13的核酸序列,或与SEQ ID NO:13具有至少约75%、或80%、或 85%、或90%、或95%、或98%、或99%序列同一性的核酸序列;并且所述HBB2序列包含SEQ ID NO:14的核酸序列,或与SEQ ID NO:14 具有至少约75%、或80%、或85%、或90%、或95%、或98%、或99%序列同一性的核酸序列。
24.根据段落1-23中任一段所述的重组AAV载体,其中,所述ITR 包含插入、缺失或置换。
25.根据段落1-24中任一段所述的重组AAV载体,其中,所述ITR 中的一个或多个CpG岛被去除。
26.根据段落1-25中任一段所述的重组AAV载体,其中,所述分泌信号肽是纤连蛋白信号肽(FN1)或其具有分泌信号活性的活性片段(例如,FN1信号肽具有SEQ ID NO:18-SEQ ID NO:21中的任一项的序列,或与SEQ ID NO:18-SEQ ID NO:21中的任一项具有至少约75%、或80%、或85%、或90%、或95%、或98%、或99%序列同一性的氨基酸序列),并且所述异源核酸序列编码IGF-2序列,所述IGF-2序列选自如下中的任一项:SEQ ID NO:5、SEQID NO:6、SEQ ID NO:7、SEQ ID NO:8 或SEQ ID NO:9,或与SEQ ID NO:5-SEQ ID NO:9具有至少约75%、或80%、或85%、或90%、或95%、或98%、或99%序列同一性的IGF2 肽。
27.根据段落1-3中任一段所述的重组AAV载体,其中,经编码的分泌信号肽是AAT信号肽或其具有分泌信号活性的活性片段(例如,AAT 信号肽具有SEQ ID NO:17的序列,或与SEQ ID NO:17具有至少约75%、或80%、或85%、或90%、或95%、或98%、或99%序列同一性的氨基酸序列),并且所述异源核酸序列编码IGF-2序列,所述IGF-2序列选自如下中的任一项:SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8或SEQ ID NO:9,或与SEQID NO:5-SEQ ID NO:9具有至少约 75%、或80%、或85%、或90%、或95%、或98%、或99%序列同一性的IGF2肽。
28.根据段落1-27中任一段所述的重组AAV载体,其中,所述IGF-2 序列是SEQ IDNO:8或SEQ ID NO:9,或与SEQ ID NO:8或SEQ ID NO: 9具有至少约75%、或80%、或85%、或90%、或95%、或98%、或99%序列同一性的IGF2肽。
29.根据段落1-28中任一段所述的重组AAV载体,其中,所述重组 AAV载体是嵌合AAV载体、单倍体AAV载体、杂合AAV载体或多倍体AAV载体。
30.根据段落1-29中任一段所述的重组AAV载体,其中,所述重组 AAV载体包含选自于由表1所列的AAV血清型所组成的组中的任意 AAV血清型及它们的任意组合的衣壳蛋白。
31.根据段落1-30中任一段所述的重组AAV载体,其中,所述血清型是AAV3b。
32.根据段落1-31中任一段所述的重组AAV载体,其中,所述 AAV3b血清型在衣壳蛋白中包含选自265D、549A、Q263Y中任意的一个或多个突变。
33.根据段落1-32中任一段所述的重组AAV载体,其中,所述 AAV3b血清型选自AAV3b265D、AAV3b265D549A、AAV3b549A或 AAV3bQ263Y或AAV3bSASTG中的任一种。
34.一种重组腺病毒相关(AAV)载体,所述载体在其基因组中包含:
a.5'和3'AAV反向末端重复(ITR)序列;以及
b.位于5'和3'ITR之间的异源核酸序列,所述异源核酸序列编码包含α-葡萄糖苷酶(GAA)多肽的融合多肽,其中,所述异源核酸可操作地连接至肝特异性启动子;
其中,所述重组AAV载体包含AAV3b血清型的衣壳蛋白。
35.根据段落34所述的重组AAV载体,其中,所述融合多肽进一步包含位于所述GAA多肽的N-末端的分泌信号肽。
36.根据段落34或35所述的重组AAV载体,其中,编码融合多肽的所述异源核酸序列进一步包含位于所述分泌信号肽和所述α-葡萄糖苷酶(GAA)多肽之间的IGF-2序列。
37.根据段落34所述的重组AAV载体,其中所述AAV基因组包含以5'至3'的方向包含:
a.5'ITR;
b.肝特异性启动子序列;
c.内含子序列;
d.编码分泌信号肽的核酸;
e.编码IGF-2序列的核酸;
f.编码α-葡萄糖苷酶(GAA)多肽的核酸;
g.poly A序列;以及
h.3'ITR。
38.根据段落34-37中任一段所述的重组AAV载体,其中,所述分泌信号肽选自AAT信号肽、纤连蛋白信号肽(FN)、GAA信号肽或它们的具有分泌信号活性的活性片段。
39.根据段落34-38中任一段所述的重组AAV载体,其中,所述IGF-2 前导序列结合人非阳离子依赖性甘露糖-6-磷酸受体(CI-MPR)或IGF-2 受体。
40.根据段落34-39中任一段所述的重组AAV载体,其中,所述IGF-2 序列包含SEQID NO:5或包含影响结合至IGF-2受体的SEQ ID NO:5 中的至少一个氨基修饰。
41.根据段落40所述的重组AAV载体,其中,SEQ ID NO:5中的所述至少一个氨基修饰是V43M氨基酸修饰(SEQ ID NO:8或SEQ ID NO:9)或Δ2-7(SEQ ID NO:6)或Δ1-7(SEQID NO:7)。
42.根据段落34-41中任一段所述的重组AAV载体,其中,所述肝特异性启动子选自以下中的任一项:甲状腺素转运蛋白启动子(TTR)、 LSP启动子(LSP)、合成型肝特异性启动子。
43.根据段落34-42中任一段所述的重组AAV载体,其中,所述核酸序列编码野生型GAA多肽或经修饰的GAA多肽。
44.根据段落34-43中任一段所述的重组AAV载体,其中,编码所述GAA多肽的核酸序列是人GAA基因或人密码子优化的GAA基因 (CoGAA)或经修饰的GAA核酸序列。
45.根据段落34-44中任一段所述的重组AAV载体,其中,编码所述GAA多肽的核酸序列经密码子优化以增强体内表达。
46.根据段落34-44中任一段所述的重组AAV载体,其中,编码所述GAA多肽的核酸序列经密码子优化以减少CpG岛。
47.根据段落34-44中任一段所述的重组AAV载体,其中,编码所述GAA多肽的核酸序列经密码子优化以降低固有免疫应答。
48.根据段落34-44中任一段所述的重组AAV载体,其中,编码所述GAA多肽的核酸序列经密码子优化以减少CpG岛并降低固有免疫应答。
49.根据段落34-49中任一段所述的重组AAV载体,其中,所述内含子序列包含MVM序列或HBB2序列,其中,所述MVN序列包含SEQ ID NO:13的核酸序列,或与SEQ ID NO:13具有至少约75%、或80%、或85%、或90%、或95%、或98%、或99%序列同一性的核酸序列;并且所述HBB2序列包含SEQ ID NO:14的核酸序列,或与SEQ ID NO:14 具有至少约75%、或80%、或85%、或90%、或95%、或98%、或99%序列同一性的核酸序列。
50.根据段落34-49中任一段所述的重组AAV载体,其中,所述ITR 包含插入、缺失或置换。
51.根据段落40所述的重组AAV载体,其中,所述ITR中的一个或多个CpG岛被去除。
52.根据段落34-49中任一段所述的重组AAV载体,其中,所述分泌信号肽是纤连蛋白信号肽(FN1)或其具有分泌信号活性的活性片段 (例如,FN1信号肽具有SEQ ID NO:18-SEQ ID NO:21中的任一项的序列,或与SEQ ID NO:18-SEQ ID NO:21具有至少约75%、或80%、或 85%、或90%、或95%、或98%、或99%序列同一性的氨基酸序列),并且所述异源核酸序列编码IGF-2序列,所述IGF-2序列选自如下中的任一项:SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8或 SEQ ID NO:9,或与SEQ ID NO:5-SEQ ID NO:9具有至少约75%、或 80%、或85%、或90%、或95%、或98%、或99%序列同一性的IGF2 肽。
53.根据段落34-49中任一段所述的重组AAV载体,其中,经编码的分泌信号肽是AAT信号肽或其具有分泌信号活性的活性片段(例如,AAT信号肽具有SEQ ID NO:17的序列,或与SEQ ID NO:17具有至少约75%、或80%、或85%、或90%、或95%、或98%、或99%序列同一性的氨基酸序列),并且所述异源核酸序列编码IGF-2序列,所述IGF-2 序列序列选自如下中的任一项:SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO: 7、SEQ ID NO:8或SEQ ID NO:9,或与SEQ ID NO:5-SEQ ID NO:9具有至少约75%、或80%、或85%、或90%、或95%、或98%、或99%序列同一性的IGF2肽。
54.根据段落34-49中任一段所述的重组AAV载体,其中,所述IGF-2 序列是SEQ IDNO:8或SEQ ID NO:9,或与SEQ ID NO:8或SEQ ID NO: 9具有至少约75%、或80%、或85%、或90%、或95%、或98%、或99%序列同一性的IGF2肽。
55.一种药物组合物,所述药物组合物包含处于药学上可接受的辅料中的前述段落中任一段所述的重组AAV载体。
56.一种核酸序列,所述核酸序列包含:
可操作地连接至如下核酸序列的肝特异性启动子,所述核酸序列按以下顺序包含:编码分泌信号肽的核酸、编码IGF-2序列的核酸、编码 GAA多肽的核酸。
57.一种重组腺病毒相关(rAAV)载体基因组的核酸序列,所述核酸序列包含:
a.5'和3'AAV反向末端重复(ITR)核酸序列;以及
b.位于5'和3'ITR之间的异源核酸序列,所述异源核酸序列编码包含分泌信号肽和α-葡萄糖苷酶(GAA)多肽的融合多肽,其中,所述异源核酸可操作地连接至启动子。
58.根据段落56或57所述的核酸序列,其中,编码融合多肽的所述异源核酸序列进一步包含位于所述分泌信号肽和所述α-葡萄糖苷酶 (GAA)多肽之间的IGF-2序列。
59.根据段落56或58所述的核酸序列,其中,编码所述分泌信号肽的核酸选自以下中的任一项:SEQ ID NO:17、SEQ ID NO:22-SEQ ID NO:26,或与SEQ ID NO:17或SEQ IDNO:22-SEQ ID NO:26具有至少约75%、或80%、或85%、或90%、或95%、或98%、或99%序列同一性的核酸序列。
60.根据段落56-59中任一段所述的核酸序列,其中,编码所述IGF-2 序列的核酸选自以下中的任一项:SEQ ID NO:2(IGF2-Δ2-7)、SEQ ID NO: 3(IGF2-Δ1-7)或SEQ IDNO:4(IGF2 V43M),或与SEQ ID NO:2、SEQ ID NO:3或SEQ ID NO:4具有至少约75%、或80%、或85%、或90%、或95%、或98%、或99%序列同一性的核酸序列。
61.根据段落56-60中任一段所述的核酸序列,其中,编码所述GAA 多肽的核酸序列是人GAA基因或人密码子优化的GAA基因(CoGAA) 或经修饰的GAA核酸序列。
62.根据段落56-61中任一段所述的核酸序列,其中,编码所述GAA 多肽的核酸序列经优化以增强体内表达。
63.根据段落56-62中任一段所述的核酸序列,其中,编码所述GAA 多肽的核酸序列经优化以减少CpG岛。
64.根据段落56-63中任一段所述的核酸序列,其中,编码所述GAA 多肽的核酸序列经优化以降低固有免疫应答。
65.根据段落56-64中任一段所述的核酸序列,其中,编码所述GAA 多肽的核酸序列经优化以减少CpG岛并降低固有免疫应答。
66.根据段落56-65中任一段所述的核酸序列,其中,编码所述GAA 多肽的核酸选自中的任一项:SEQ ID NO:11(全长hGAA)、SEQ ID NO: 55(Dwight cDNA)、SEQ ID NO:56(hGAAΔ1-66),或与SEQ ID NO:11、 SEQ ID NO:55或SEQ ID NO:56具有至少约75%、或80%、或85%、或90%、或95%、或98%、或99%序列同一性的核酸序列。
67.根据段落56或57所述的核酸序列,其中,编码所述GAA多肽的核酸选自以下中的任一项:SEQ ID NO:74(密码子优化的1)、SEQ ID NO:75(密码子优化的2)和SEQ ID NO:76(密码子优化的3),或与 SEQ ID NO:74、SEQ ID NO:75或SEQ ID NO:76具有至少约75%、或 80%、或85%、或90%、或95%、或98%、或99%序列同一性的核酸序列。
68.根据段落56或57所述的核酸序列,其中,所述核酸选自以下中的任一项:SEQID NO:57(AAT-V43M-wtGAA(delta1-69aa))、SEQ ID NO:58(ratFN1-IGF2V43M-wtGAA(delta1-69aa))、SEQ ID NO:59 (hFN1-IGF2V43M-wtGAA(delta1-69aa))、SEQ ID NO:60(ATT-IGF2Δ2-7-wtGAA(delta 1-69))、SEQ ID NO:61 (FN1rat-IGFΔ2-7-wtGAA(delta1-69))、SEQ ID NO:62 (hFN1-IGFΔ2-7-wtGAA(delta 1-69))、SEQ ID NO:79 (AAT_hIGF2-V43M_wtGAA_del1-69_Stuffer.V02)、SEQ ID NO:80 (FIBrat_hIGF2-V43M_wtGAA_del1-69_Stuffer.V02)、SEQ ID NO:81 (FIBhum_hIGF2-V43M_wtGAA_del1-69_Stuffer.V02)、SEQ ID NO:82 (AAT_GILT_wtGAA_del1-69__Stuffer.V02)、SEQ ID NO:83(FIBrat_GILT_wtGAA_del1-69_Stuffer.V02)、SEQ ID NO:84 (FIBhum_GILT_wtGAA_del1-69_Stuffer.V02),或与SEQ ID NO:57、 SEQ ID NO:58、SEQ ID NO:59、SEQ ID NO:60、SEQID NO:61、SEQ ID NO:62、SEQ ID NO:79、SEQ ID NO:80、SEQ ID NO:81、SEQ ID NO: 82、SEQ ID NO:83或SEQ ID NO:84具有至少80%、85%、90%、95%或98%同一性的核酸序列。
69.一种治疗患有糖原贮积病II型(GSD II、庞贝氏病、酸性麦芽糖酶缺乏症)或患有α-葡萄糖苷酶(GAA)多肽缺乏症的受试者的方法,所述方法包括向受试者给予前述段落1-58中任一段所述的任意的重组 AAV载体、或rAAV基因组或核酸序列。
70.根据段落69所述的方法,其中,所述GAA多肽从所述受试者的肝分泌,并且分泌的GAA被骨骼肌组织、心肌组织、膈肌组织或它们的组合摄取,其中,所述分泌的GAA的摄取引起组织中溶酶体糖原存储的减少。
71.根据段落69-70中任一段所述的方法,其中,向所述受试者进行的给予选自肌肉内、皮下、椎管内、脑池内、鞘内、静脉内给予中的任一种。
72.一种细胞,所述细胞包含段落56-68中任一段所述的核酸序列。
73.根据段72-73中任一段所述的细胞,其中,所述细胞是人细胞。
74.根据段72-73中任一段所述的细胞,其中,所述细胞是非人细胞哺乳动物细胞。
75.根据段72-73中任一段所述的细胞,其中,所述细胞是昆虫细胞。
76.一种细胞,所述细胞包含段落1-54中任一段所述的重组AAV载体。
77.一种宿主动物,所述细胞包含段落1-54中任一段所述的重组 AAV载体。
78.根据段落78所述的宿主动物,其中,所述宿主动物是哺乳动物。
79.根据段落78或79所述的宿主动物,其中,所述宿主动物是非人哺乳动物。
80.根据段落78所述的宿主动物,其中,所述宿主动物是人。
81.用于段落69-71中任一段所述的方法中的段落55所述的药物组合物。
82.一种宿主动物,所述宿主动物包含段落72-75中任一段所述的细胞。
83.一种宿主动物,所述宿主动物包含段落1-54中任一段所述的重组AAV载体。
84.根据段落78所述的宿主动物,其中,所述宿主动物是哺乳动物。
85.根据段落78或79所述的宿主动物,其中,所述宿主动物是非人哺乳动物。
86.根据段落78所述的宿主动物,其中,所述宿主动物是人。
实施例
仅出于说明性目的提供以下非限制性实施例,以促进对现在所考虑的代表性实施方式的更完善理解。这些实施例仅意在作为可以利用AAV 病毒体和rAAV载体的所有可能情况的子集。因此,这些实施例不应被解释为限制本申请文件中描述的任何实施方式,包括与AAV病毒体和 rAAV载体和/或其方法和用途有关的实施方式。最后,AAV病毒体和载体几乎可以在需要基因递送的任何情况下使用。
实施例1:rAAV基因组的构建
使用Gibson克隆方法构建了大量的rAAV基因组。产生了以下的 rAAV基因组:SEQID NO:57(AAT-V43M-wtGAA(delta1-69aa))、SEQ ID NO:58(ratFN1-IGF2V43M-wtGAA(delta1-69aa))、SEQ ID NO:59 (hFN1-IGF2V43M-wtGAA(delta1-69aa))、SEQ ID NO:60(ATT-IGF2Δ2-7-wtGAA(delta 1-69))、SEQ ID NO:61(FN1rat- IGFΔ2-7-wtGAA(delta1-69))、SEQ ID NO:62(hFN1-IGFΔ2-7-wtGAA (delta 1-69))。
Gibson克隆涉及将核酸序列的区块(例如3个区块)克隆在一起。通用方案如下:将以下试剂合并到单管反应中:(i)Gibson Assembly Master Mix(核酸外切酶、DNA聚合酶、DNA连接酶、缓冲液);(ii) 具有15-25bp的同源末端的DNA插入物(区块1-区块3)(参见图7); (iii)线性化的DNA主链,其具有最外侧DNA插入物的15-25bp同源末端(参见图7)。反应在50℃下孵育15-60分钟。将反应混合物转化入感受态细胞,并铺板在卡那霉素琼脂板上。通过限制性消化和/或菌落 PCR分析筛选完全组装的质粒DNA的少量制备(miniprep),并通过DNA 测序分析进行验证。对经验证的克隆进行扩增以用于大量制备 (maxiprep)的产生,并在悬浮的HEK293细胞中与腺病毒辅助因子 XX680 Kan和合适的Rep/Cap辅助因子一起瞬时转染,以产生rAAV。
图8-图13示出了克隆核酸区块以生成示例性的rAAV基因组。例如,图8示出了包含AAT-V43M-wtGAA(delta 1-69aa)的rAAV基因组的生成;图9示出了包含ratFN1-IGF2V43M-wtGAA(delta 1-69aa)的rAAV 基因组的生成;图10示出了包含hFN1-IGF2V43M-wtGAA(delta 1-69aa) 的rAAV基因组的生成;图11示出了包含ATT-IGF2Δ2-7-wtGAA(delta 1-69)的rAAV基因组的生成;图12示出了包含FN1rat-IGFΔ2-7-wtGAA (delta 1-69)的rAAV基因组的生成;以及图13示出了包含 hFN1-IGFΔ2-7-wtGAA(delta 1-69)的rAAV基因组的生成。
虽然图8-图13将wtGAA(Δ1-69)作为示例性的GAA酶示出,但是该核酸序列可以被本领域技术人员容易地替换为经密码子优化的核酸序列,以增强体内表达、和/或减轻免疫应答、和/或减少CpG岛。在图 8-图13中举例说明的克隆区块中还示出了3个氨基酸(3aa)的间隔区核酸序列和填充区核酸序列(在图8-图10中称为“间隔区”序列)的rAAV 基因组的生成,所述间隔区核酸序列位于编码IGF(V42M)或IGFΔ2-7 靶向肽的核酸序列的3'端和编码GAA酶的核酸的5'端,所述填充区核酸序列位于polyA序列的3'端和3'ITR序列的5'端。
实施例2:rAAV载体的生成
使用rAAV Pro10细胞系将rAAV基因组包装入衣壳中,以生成rAAV 载体。仅为证明rAAV载体构建的原理,所使用的衣壳是AAV3b衣壳。
制备rAAV Pro10细胞系:使用三重转染技术在悬浮的HEK293细胞中制备rAAV,这可以扩大规模以制备临床级载体。或者,可以使用不同的质粒,例如,1)pXX680-ad辅助因子,以及2)pXR3、Rep和Cap,以及3)转基因质粒(ITR-转基因-ITR)。
使用如美国专利9,441,206(以引用的方式将其整体并入本文)中所述的Pro10细胞系,将实施例1中生成的rAAV基因组用于生成rAVV载体。具体而言,rAAV载体或rAAV病毒体使用以下方法产生,所述方法包括:(a)向HEK293细胞(例如,ATTC No.PTA 13274)提供AAV表达系统;(b)在产生AAV颗粒的条件下培养细胞;以及(c)任选地分离AAV颗粒。可以用不同质粒比率的XX680、AAV rep/cap辅助因子和 TR质粒来优化转染混合物体积和质粒的三重转染比率,以确定用于产生 rAAV载体的最佳质粒比率。
在一些情况下,细胞在产生AAV颗粒的条件下悬浮培养。在另一实施方式中,在无动物成分的条件下培养细胞。无动物成分培养基可以是与HEK293细胞相容的任何无动物成分培养基(例如,无血清培养基)。实例包括但不限于SFM4Transfx-293(Hyclone)、Ex-Cell293(JRH Biosciences)、LC-SFM(Invitrogen)和Pro293-S(Lonza)。足以复制和包装AAV颗粒的条件可以是,例如,存在足以复制本文所述的rAAV基因组并包装(encapsidation)入AAV衣壳中的AAV序列(例如,AAV rep 序列和AAV cap序列)和来自腺病毒和/或疱疹病毒的辅助序列。
实施例3:评估rAAV载体
全血清除。图1示出了源自如下实验的结果,在所述实验中,将 3×1012vg/kg的不同的AAV血清型(AAV3b、AAV3ST、AAV8、AAV9) 静脉内注射到3kg的血清阴性雄性猕猴中。在给予不同的AAV血清型后60天对猕猴实施安乐死。在全血中搜索载体基因组,并且结果表明AAV3b在一周内被清除并且在处死时检测不到,而当猕猴被处死时,在全血中仍可检测到AAV8和AAV9。
肝特异性载体效力:图2示出了源自如下实验的结果,在所述实验中,将3×1012vg/kg的不同的AAV血清型(AAV3b、AAV3ST、AAV8、 AAV9)静脉内注射到3kg血清阴性的雄性猕猴中。在给予不同的AAV 血清型后60天对猕猴实施安乐死。对每只猕猴的肝脏的三个叶中的每个叶的载体基因组进行量化。定量的限值为0.002vg/dg。根据图2中示出的结果,发现AAV3b是有效的肝脏载体。AAV3b比AAV8更具肝脏特异性,并且比AAV9更快地从血液中清除。AAV3ST突变没有提供任何显著的有益影响。
实施例4:测量GAA向上清液中的分泌和GAA摄取测定
测量上清液中的GAA
因此,对实施例1生成的rAAV基因组关于GAA多肽向上清液中的分泌进行测试。如Kikuchi等中所述,可以使用4-甲基-伞形酮基-α-D-葡萄糖苷(4-MU)底物(4-MU测定法)评估上清液中的GAA的测量(Kikuchi, Tateki等,“Clinical and metabolic correction ofPompe disease by enzyme therapy in acid maltase-deficient quail.”The Journalof clinical investigation 101.4(1998):827-833)。
简而言之,HEK293细胞可以用rAAV基因组SEQ ID NO:57 (AAT-V43M-wtGAA(delta1-69aa))、SEQ ID NO:58 (ratFN1-IGF2V43M-wtGAA(delta 1-69aa))、SEQ ID NO:59(hFN1-IGF2V43M-wtGAA(delta 1-69aa))、SEQ ID NO:60 (ATT-IGF2Δ2-7-wtGAA(delta1-69))、SEQ ID NO:61 (FN1rat-IGFΔ2-7-wtGAA(delta 1-69))、SEQ ID NO:62 (hFN1-IGFΔ2-7-wtGAA(delta 1-69))进行转染。GAA活性基于24小时内的初始活性(t=0)的%来测量。基于荧光底物4-MU-α-葡萄糖在0、 3、6和24小时的水解,对样品测定GAA酶活性。将GAA活性表示为初始活性的%,即残留活性。
或者,在收取后,通过HIC色谱法部分地纯化培养物上清液。将所有样品在电泳前都用PNGase处理。可以使用SDS-PAGE和免疫印迹法评估细胞的GAA多肽表达。
GAA摄取测定和测量组织中的GAA的摄取。
接下来,对实施例1和2中生成的rAAV基因组测试向细胞中的摄取活性的保留。例如,HEK293细胞可以用rAAV基因组SEQ ID NO:57 (AAT-V43M-wtGAA(delta 1-69aa))、SEQID NO:58 (ratFN1-IGF2V43M-wtGAA(delta 1-69aa))、SEQ ID NO:59 (hFN1-IGF2V43M-wtGAA(delta 1-69aa))、SEQ ID NO:60 (ATT-IGF2Δ2-7-wtGAA(delta 1-69))、SEQ IDNO:61 (FN1rat-IGFΔ2-7-wtGAA(delta 1-69))、SEQ ID NO:62 (hFN1-IGFΔ2-7-wtGAA(delta 1-69))进行转染。
如美国专利申请US2009/0117091A1(以引用的方式将其整体并入本文)所述,4-MU测定法(如上所述)可以评估rhGAA向哺乳动物细胞中的摄取。将实施例1和2中生成的rAAV载体或rAAV基因组在含有 123mM乙酸钠(pH 4.0)和10mM 4-甲基伞形酮基α-D-葡萄糖苷酶底物(Sigma,目录号#M-9766)的20μL反应混合物中孵育。反应在37℃下孵育1小时,并用200μL缓冲液终止,该缓冲液含有267mM碳酸钠、 427mM甘氨酸,pH 10.7。在96孔微量滴定板中用355nm激发和460nm 过滤器测量荧光,并与源自4-甲基伞形酮(Sigma,目录号#M1381)的标准曲线进行比较。将1个GAA 4MU单位定义为每小时水解1nmole 4- 甲基伞形酮。评估了示例性的rAAV基因组在成纤维细胞中的比活力,例如,SEQ ID NO:57(AAT-V43M-wtGAA(delta 1-69aa))、SEQ ID NO: 58(ratFN1-IGF2V43M-wtGAA(delta 1-69aa))、SEQ ID NO:59 (hFN1-IGF2V43M-wtGAA(delta 1-69aa))、SEQ ID NO:60 (ATT-IGF2Δ2-7-wtGAA(delta 1-69))、SEQ ID NO:61 (FN1rat-IGFΔ2-7-wtGAA(delta 1-69))、SEQ ID NO:62(hFN1-IGFΔ2-7-wtGAA(delta 1-69))。评估IGF2-GAA融合多肽和/或 SS-IGF2-GAA双融合多肽的酶活性并与未加标签的GAA(wtGAA)进行比较。
还可以进行基于细胞的摄取测定来证明加IGF2标签的或未加标签的GAA进入靶细胞的能力。在摄取前24小时,将大鼠L6成肌细胞以每孔1×105个细胞的密度铺板在24孔板中。在实验开始时,从细胞中去除培养基并用含有实施例1和实施例2中生成的rAAV载体的0.5mL摄取培养基替换。为了证明摄取的特异性,一些孔中额外含有竞争物M6P(终浓度5mM)和/或IGF-2(终浓度18μg/mL)。18小时后,从细胞中吸出培养基,并用PBS洗涤细胞4次。然后用200μL CelLytic MTM裂解缓冲液裂解细胞。使用4MU底物如上所述地对裂解物测定GAA活性。使用Pierce BCATM蛋白质测定试剂盒确定蛋白质。
典型的摄取实验是在CHO细胞中进行,但也可以使用其它细胞系和成肌细胞系。预期GAA多肽向大鼠L6成肌细胞中的摄取将实际上不会受到添加大量摩尔过量的M6P的影响,而预期摄取会被过量的IGF-2显著破坏。相比之下,预期wtGAA的摄取将通过添加过量的M6P而显著破坏,但实际上不受与IGF2的竞争的影响。另外,预期IGF2V43M-wtGAA 和IGFdelta2-7wtGAA的摄取将不会受到过量IGF-2的显著影响。
实施例5:GAA在大鼠L6成肌细胞中的半衰期
用实施例1和实施例2中产生的rAAV载体在L6大鼠成肌细胞中进行如上所述(参见实施例3和实施例4)的摄取实验。18小时后,将来自转染有rAAV载体的细胞的培养基吸出,并用PBS洗涤细胞4次。此时,裂解二重复的孔(时间0)并将裂解物冷冻在-80下。此后每天裂解二重复的孔并储存用于分析。14天后,对所有裂解物测定GAA活性,以评估半衰期以及评估加IGF-2标签的GAA酶一旦处于细胞内是否持续存在与未加标签的GAA相似的动力学。
实施例6:摄取后GAA的加工
如Moreland等,(2005)J.Biol.Chem.,280:6780-6791和其中包含的参考文献所述,哺乳动物GAA通常在溶酶体中经历序贯的蛋白水解加工。经加工的蛋白质产生70kDa、20kDa、10kDa的一组的肽和一些较小的肽。为了确定IGF2-GAA融合多肽和/或SS-IGF2-GAA双融合多肽是否与未加标签的GAA类似地被加工,使用识别70kDa的IGF-2肽和带有IGF-2标签的较大中间体的单克隆抗体,通过蛋白免疫印迹分析来自上述摄取实验的裂解物的等分试样。本实验中鉴别的多肽的相似性质 (profile)表明,一旦进入细胞,IGF-2序列就会丢失,并且IGF-2-GAA 多肽与未加标签的GAA相似地进行加工,这表明一旦IGF-2序列处于细胞内,它对GAA的行为几乎没有或没有影响。
实施例7:药物代谢动力学
可在129只野生型小鼠中测量由rAAV载体产生的IGF2-GAA融合多肽和/或SS-IGF2-GAA双融合多肽的药物代谢动力学。向129只小鼠注射实施例1和实施例2中生成的rAAV载体。在注射前以及注射后 15min、30min、45min、60min、90min、120min、4小时和8小时采集血清样品。然后处死动物。通过定量蛋白质免疫印迹对血清样品进行测定。评估来自表达IGF2-GAA融合多肽或SS-IGF2-GAA双融合多肽的rAAV 载体的GAA的半衰期,以确定融合IGF-2的GAA多肽是否从循环中被过快地清除。
实施例8:GAA的组织半衰期
该实验的目的是确定从rAAV载体表达的IGF2-GAA融合多肽或 SS-IGF2-GAA双融合多肽一旦到达其靶组织,GAA活性丧失的速率。在庞贝氏病小鼠模型中,
Figure BDA0003166136840001241
表现出在各种肌肉组织中具有约6-7 天的组织半衰期(药物评价与研究中心和生物制剂评价与研究中心,药理学评论,申请号125141/0)。
用实施例1和实施例2中生成的rAAV载体注射到庞贝氏病小鼠(如 Raben(1998)JBC,273:19086-19092所述的庞贝氏病小鼠模型 6neo/6neo,以引用的方式将其公开内容并入本文)的颈静脉中。然后在注射后1天、5天、10天和15天处死小鼠。根据标准程序将组织样品进行均质化并测量GAA活性。来自IGF2-GAA融合多肽和/或SS-IGF2-GAA 双融合多肽和未加标签的GAA的GAA活性的组织半衰期由不同组织 (例如,股四头肌组织、心脏组织、膈肌组织和肝脏组织)中的衰变曲线计算,并计算每个组织的半衰期。这可以与大鼠L6成肌细胞中的半衰期进行比较,以确定一旦处于庞贝氏病小鼠的细胞内,从本文描述的 rAAV载体表达的IGF2-GAA融合多肽和/或SS-IGF2-GAA双融合多肽是否表现出以与未加标签的GAA相似的动力学持续存在。此外,对 IGF2-GAA融合多肽和/或SS-IGF2-GAA双融合多肽的衰变动力学的了解可有助于设计适当的给药间隔。
实施例9:IGF2-GAA融合多肽和/或SS-IGF2-GAA双融合多肽向C2C12 小鼠成肌细胞的溶酶体中的摄取
用实施例1和实施例2中产生的rAAV载体转导在多聚赖氨酸包被的载玻片(BDBiosciences)上生长的C2C12小鼠成肌细胞。洗涤细胞后,然后将细胞在生长培养基中孵育1小时,然后用D-PBS洗涤4次,再在室温下用甲醇固定15分钟。以下孵育都在室温下进行,各孵育通过D-PBS 中的3次洗涤分开。用0.1%triton X-100透化载玻片15分钟,然后用封闭缓冲液(D-PBS中的10%热灭活马血清(Invitrogen))封闭。将载玻片用初级小鼠单克隆抗GAA抗体3A6-1F2(封闭缓冲液中1:5,000)进行孵育,然后用二级兔抗小鼠IgG AF594缀合抗体(Invitrogen A11032,封闭缓冲液中1:200)孵育。将FITC缀合的大鼠抗小鼠LAMP-1(BDPharmingen 553793,封闭缓冲液中1:50)进行孵育。载玻片用含有DAPI 的封固溶液(Invitrogen)封固,并用尼康Eclipse 80i显微镜观察,该显微镜配有异硫氰酸荧光素、德州红和DAPI过滤器(Chroma Technology)。图像可以用通过MetaMorph软件(UniversalImaging)控制的光度计级联相机捕获,并使用Photoshop软件(Adobe)合并。可以评估通过抗 GAA抗体检测的信号与针对溶酶体标记物LAMP1的抗体检测的信号的共定位,以证明加IGF2标签的GAA被递送到溶酶体。
实施例10:在庞贝氏病小鼠模型中评估rAAV载体的治疗和逆转庞贝氏病病理学
实施例1中生成的rAAV载体可以在庞贝氏病小鼠模型中进行评估,例如,根据Peng等“Reveglucosidase alfa(BMN 701),an IGF2-Tagged rhAcidα-Glucosidase,ImprovesRespiratory Functional Parameters in a Murine Model of Pompe Disease.”Journalof Pharmacology and Experimental Therapeutics 360.2(2017):313-323中描述的方法,以引用的方式将其整体并入本文。
任何庞贝氏病小鼠模型均可用于评估rAAV载体在治疗庞贝氏病方面的效果。Raben等,JBC,1998,273(30);19086-19092中描述了庞贝氏病的一种小鼠模型,其描述了受破坏的GAA小鼠模型,并概括了该疾病的幼年形式和成年形式二者的关键特征。在其它情况下,可以使用庞贝氏病小鼠模型(Sidman等,2008),以及具有受破坏的酸性α-葡萄糖苷酶基因的小鼠品系(B6;129-GAAtm1Rabn/J;Pompe)(Jackson Laboratory,Bar Harbor,ME)。庞贝氏病小鼠发展出与人的成年庞贝氏病相同的细胞特征和临床特征(Raben等,1998)。将动物维持在12小时的光照/黑暗循环中,无限制提供标准的啮齿动物食物和淡水。
4.5-5个月龄的庞贝氏病小鼠可以被给予本文所述的rAAV载体,并在给药4周以上后评价糖原清除。进行宏观评估后,收集心脏(左心室)、股四头肌、膈、腰肌和比目鱼肌,称重,在液氮中快速冷冻,并在-60℃至-90℃下保存,然后进行源自糖原的葡萄糖的定量分析。使用陶瓷球将肌肉在处于冰上的缓冲液(0.2M NaOAc/0.5%NP40)中均质化。在37℃下将淀粉葡萄糖苷酶加入至澄清的裂解物,以将糖原消化成葡萄糖,用于使用过氧化物酶-葡萄糖氧化酶反应系统(Sigma-Aldrich,St.Louis, MO)进行后续的比色检测(430nm,SpectraMax,Molecular Devices, Sunnyvale,CA)。还测量了没有淀粉葡萄糖苷酶的配对样品,以校正收获时不处于糖原形式的内源性组织葡萄糖。葡萄糖值从六点标准曲线中推知。测得的葡萄糖浓度(mg/mL)与样品的糖原浓度成正比,并通过调整均质化步骤(每克组织添加5μL缓冲液)转换为mg糖原/g组织。
本文所述的rAAV载体对个体小鼠肌糖原水平的影响可以使用 Phoenix-WinNonlin classic PD模型(Phoenix build version 6.4,Certara,L.P., Princeton,NJ)来评估。可以获得心脏、膈、四头肌、腰肌和比目鱼肌中的hGAA结果。对于药物代谢动力学分析,可以向WT小鼠给予实施例 1中生成的rAAV载体,并在给药前、给药后0.083、0.5、1、2和4小时收集作为终末心脏穿刺的血样。血浆hGAA浓度可以使用桥接电化学发光方法进行量化,LOQ为100ng/mL。简而言之,0.5μg/mL钌标记的抗 rhGAA(亲和纯化的山羊多克隆抗体)和0.5μg/mL生物素标记的抗IGF2 (MAB792,R&D Systems,Minneapolis,MN)可与在缓冲液[Starting Block T20(PBS);ThermoFisher Scientific,Sunnyvale,CA]中1:10稀释的K2EDTA血浆样品结合并孵育1小时,然后转移到封闭的链霉亲和素测定板(Meso ScaleDiagnostics,Rockville,MD)。孵育30分钟后,将板进行洗涤,加入1×Read Buffer T(MesoScale Diagnostics),并在SECTOR Imager 2400(Meso Scale Diagnostics)上读取电化学发光信号。hGAA浓度可以从标准曲线中推知。
或者,可以收获心脏和膈组织匀浆并使用荧光底物(4-MUG)测量 rhGAA活性。
使用本文实施例1和实施例2中生成的rAAV载体产生的GAA多肽的治疗效果可以在体内与wt GAA进行比较。可以进行研究以比较实施例1中公开的rAAV载体与表达未加标签的wt GAA的载体从庞贝氏病小鼠的骨骼肌组织中清除糖原的能力(例如,使用庞贝氏病小鼠模型6neo/6neo动物(Raben(1998)JBC 273:19086-19092))。庞贝氏病小鼠组 (5只/组)接受两剂的wt GAA或实施例1中生成的rAAV载体或溶媒中的一种的IV注射。五只未经处理的动物可用作对照,并接受四次每周的生理盐水溶液注射。动物在第2、3和4次注射前1小时接受口服苯海拉明,5mg/kg。注射后一周处死小鼠,并收获组织(膈、心脏、肺、肝、比目鱼肌、股四头肌、腓肠肌、TA、EDL、舌)用于组织学和生化分析。组织匀浆中的糖原含量可以使用黑曲霉(A.niger)淀粉葡萄糖苷酶和 Amplex Red Glucose测定试剂盒测量,并使用标准程序评估不同组织匀浆中的GAA酶水平。
组织匀浆中的糖原含量可以使用黑曲霉淀粉葡萄糖苷酶和
Figure BDA0003166136840001272
RedGlucose测定试剂盒(Invitrogen)测量,基本如Zhu等,(2005)Biochem J.,389:619-628所述。
与IGF-2-GAA rAAV(即没有分泌信号序列)相比,预期本文中所述的通过实施例1和实施例2中的方法产生的rAAV载体ss-IGF2-GAA rAAV在庞贝氏病小鼠模型中将具有更多的向肌肉中的摄取和更高的治疗效果,这预期比wtGAA rAAV载体(即没有分泌信号和IGF2序列中的任一者)和/或
Figure BDA0003166136840001271
更高。考虑到所建立的庞贝氏病模型,这些结果被预期转化到临床,并与治疗庞贝氏病的治疗效果相关。
实施例11:糖原的体内清除
该实验的目的是确定在单次注射实施例1和实施例2中产生的表达 IGF2-GAA融合多肽和/或SS-IGF2-GAA双融合多肽的rAAV载体后,糖原从庞贝氏病小鼠的心脏组织中清除的速率。
将实施例1和实施例2中产生的rAAV载体注射到庞贝氏病小鼠(如Raben(1998)JBC,273:19086-19092中所述的庞贝氏病小鼠模型 6neo/6neo,以引用的方式将其公开内容并入本文)的颈静脉中。于注射后1、5、10、15天处死小鼠。按照标准程序将心脏组织样品均质化并分析糖原含量。这些组织匀浆中的糖原含量使用黑曲霉淀粉葡萄糖苷酶和
Figure BDA0003166136840001281
Red Glucose测定试剂盒(Invitrogen)进行测定,基本如Zhu 等,(2005)BiochemJ.,389:619-628中所述。对小鼠的心脏组织的评估可以确定,与给予其中的GAA未融合至本文所述的IGF2序列和/或SS的 rAAV的小鼠相比,给予实施例1和实施例2中产生的表达IGF2-GAA融合多肽和/或SS-IGF2-GAA双融合多肽的rAAV载体的小鼠中的糖原是否几乎完全清除,其中,糖原含量仅微小变化表示最小清除。
最后,关于如本文示出和描述的本发明的示例性实施方式,将理解,包含AAV(腺相关病毒)病毒性病毒体的基因组构建体被公开并被配置用于AAV载体的递送。因为本发明的原理可以以超出所示出和描述的多种配置来实践,应当理解本发明不以任何方式受示例性实施方式的限制,而是通常针对包括AAV(腺相关病毒)病毒体装置的基因组构建体,并且能够采取多种形式以这样做而不脱离本发明的精神和范围。
本文描述了本发明的某些实施方式,包括本发明人已知的用于实施本发明的最佳模式。当然,在阅读上述描述后,这些描述的实施方式的变化对于本领域普通技术人员而言显而易见。本发明人期望技术人员适当地采用此类变化,并且本发明人意图本发明以不同于本文具体描述的方式来实践。因此,本发明包括在适用的法律允许的情况下所附权利要求中记载的主题的所有修改和等同物。此外,除非本文另有说明或与上下文明显矛盾,否则本发明涵盖上述实施方式的所有可能变型的任意组合。
本发明的替代实施方式、要素或步骤的分组不应被解释为限制性的。各组成员可被单独地提及和要求保护,或与本文公开的其它组成员任意组合而被提及和要求保护。出于方便和/或可专利性的原因,预期组中的一个或多个成员可包括在组中或从组中删除。当发生任何此类包括或删除时,本说明书被视为包含经修饰的组,从而满足所附权利要求中使用的所有马库什组的书面描述。
除非另有说明,在本说明书和权利要求中使用的表达特征、项目、数量、参数、性质、术语等的所有数字应理解为在所有情况下被术语“约”修饰。如本文所使用的,术语“约”意味着如此限制的特征、项目、数量、参数、性质或术语涵盖高于和低于所述特征、项目、数量、参数、性质或术语的值的加减百分之十的范围。因此,除非另有相反说明,本说明书和所附权利要求书中所列的数值参数是可以变化的近似值。至少,并不是试图将等同原则的应用限制至权利要求的范围,每个数值指示至少应根据所报告的有效数字的数值并通过应用普通四舍五入技术加以解释。尽管阐述本发明的广泛范围的数值范围和值是近似值,但在具体实施例中阐述的数值范围和值尽可能精确地报告。然而,任何数值范围或值固有地包含必然由见于其各自测试测量中的标准偏差造成的某些误差。本文中的值的数值范围的叙述仅旨在用作分别指代范围内的各单独数值的简写方法。除非本文另有说明,否则将数值范围的各单独值并入本说明书中,如同在本文中单独引用一样。类似地,如本文所使用,除非另有相反说明,否则术语“基本上”是意在指示如此限制的特征、项目、数量、参数、性质或术语的近似性的程度的术语,其涵盖本领域普通技术人员可以理解和解释的范围。
涉及实施方式或实施方式的方面时的术语“可能”或“可以”的使用还随其带有“可能不”或“不能”的替代含义。就其而言,如果本说明书公开了实施方式或实施方式的方面可能或可以被包括作为本发明主题的部分,则否定性限制或排除性但书也明确表示、意指实施方式或实施方式的方面可能不会或不能被包括作为本发明主题的部分。以类似的方式,涉及实施方式或实施方式的方面的术语“任选地”的使用意味着此类实施方式或实施方式的方面可被包括作为本发明主题的部分或可不被包括作为本发明主题的一部分。此类否定性限制或排除性但书是否适用将基于要求保护的主题中是否叙述了否定性限制或排除性但书。
当在权利要求中使用时,无论是作为提交的还是通过修改添加的,开放式过渡术语“包含”(连同其等同的开放式过渡短语,例如“包括”、“含有”和“具有”)涵盖单独的或与未列举的主题组合的所有明确列举的要素、限制、步骤和/或特征;命名的要素、限制和/或特征是必不可少的,但可以添加其它未命名的要素、限制和/或特征,并且仍然形成权利要求范围内的构建体。本文公开的具体实施方式可以在权利要求中使用封闭式过渡短语“由……组成”或“基本上由……组成”代替“包含”或作为“包含”的修改而被进一步限制。当在权利要求中使用时,无论是作为提交的还是通过修改添加的,封闭式过渡短语“由……组成”排除权利要求中未明确记载的任何要素、限制、步骤或特征。封闭式过渡短语“基本上由……组成”将权利要求的范围限制为明确列举的要素、限制、步骤和/或特征,以及不会实质性影响所请求保护的主题的基本和新颖的特征的任何其它要素、限制、步骤和/或特征。因此,开放式过渡短语“包含”的含义被定义为涵盖所有具体列举的要素、限制、步骤和/ 或特征以及任何可选的、额外的未指定的要素、限制、步骤和/或特征。封闭式过渡短语“由……组成”的含义被定义为仅包括权利要求中具体列举的那些要素、限制、步骤和/或特征,而封闭式过渡短语“基本上由……组成”的含义被定义为仅包括权利要求中具体列举的那些要素、限制、步骤和/或特征,以及对所要求保护的主题的基本和新颖的特征没有实质性影响的那些要素、限制、步骤和/或特征。因此,作为限制性情况,开放式过渡短语“包含”(连同其等同的开放式过渡短语)在其含义内包括由封闭式过渡短语“由……组成”或“基本上由……组成”指定的要求保护的主题。就其而言,本文所述的或以短语“包含”请求保护的实施方式在本文中明确地或固有地毫无疑义地被描述为、允许和用于支持短语“基本上由……组成”和“由……组成”。
虽然已经参考至少一个示例性实施方式描述了本发明的方面,但是本领域技术人员应当清楚地理解,本发明不限于此。相反,本发明的范围将仅结合所附权利要求来解释,并且在此清楚的是,本发明人相信要求保护的主题是本发明。
参考文献
说明书和实施例中公开的参考文献(包括但不限于专利和专利申请、以及国际专利申请)均以引用的方式将它们的整体并入本文。
出于描述和公开的目的,将本说明书中引用和说明的所有专利、专利公开和其它出版物以引用的方式将它们的整体单独且明确地并入本文,例如,在此类出版物中描述的组合物和方法可与本发明联合使用。这些出版物仅由于它们的公开早于本申请的申请日而提供。在这一方面,任何内容都不应解释为承认本发明人由于在先的发明或任何其它原因而无权将此公开内容提前。关于这些文件的日期的所有声明或关于这些文件的内容的所有描述均基于申请人可获取的信息,而并不构成对这些文件的日期或内容的正确性的任何承认。
表2的参考文献
1.L Lisowski,AP Dane,K Chu,Y Zhang,SC Cunninghamm,EM Wilson,etal.Selection and evaluation of clinically relevant AAV variants in axenograft liver model Nature,506(2014),pp. 382-386(LK03 and others LK0-19)
2.Grimm D.Lee JS,Wang L,Desai T,Akache B Storm TA,Kay MA.In vitro andin vive gene therapy vector evolution via multispecies interbreeding andretargeting of adeno-associated viruses.J Virol.2008 Jun:82(12):5887-911.(AAV-DJ)
3.Powell SK,Khan N,Parker CL,Samulski RJ,Matsushima G,Gray SJ,McCownTJ. Characterization of a novel adeno-associated viral vector withpreferential oligodendrocyte tropism.Gene Ther.2016 Nov:23(11):807-814.(Olig001)
4.Tervo DG,Hwang BY,Viswanathan S,Gaj T,Lavzin M,Ritola KD,Lindo S,Michael S, Kuleshova E,Ojala D,Huang CC,Gerfen CR,Schiller J,Dudman JT,Hantman AW,Looger LL,Schaffer DV,Karpova AY.A Designer AAV Variant PermitsEfficient Retrograde Access to Projection Neurons.Neuron.2016 Oct 19:92(2):372-382.(rAAV2-retro)
5.Marsic D,Govindasamy L,CurrlinS,Markusic DM,Tseng YS,Herzog RW,Agbandje- McKenna M,Zolotukhin S.Vector design Tour de Force:integratingcombinatorial and rational approaches to derive novel adeno-associated virusvariants.Mol Ther.2014 Nov:22(11):1900-9. (AAV-LiC)
6.Sallach J,Di Pasquale G,Larcher F,NiehoffN,Rubsam M,Huber A,Chiarini J,Almarza D, Eming SA,Ulus H,Nishimura S,Hacker UT,Ballek M,NiessenCM,Buning H.Tropism- modified AAV vectors overcome barriers to successfulcutaneous therapy.Mol Ther.2014 May: 22(5):929-39.(AAV-Keral,AAV-Kera2,andAAV-Kera3)
7.Dalkara D,Byrue LC,Klimczak RR,Visel M,Yin L,Merigan WH,FlanneryJG,Schaffer DV. In vivo-directed evolution ef a new adeno-associated virusfor therapeutic outer retinal gene delivery from the vitreous.Sci TranslMed.2013 Jun 12:5(189):189ra76.(AAV 7m8)
8.Asuri P,Bartel MA,Vazin T,Jang JH,Wong TB,Schaffer DV.Directedevolution of adeno- associated virus for enhanced gene delivery and genetargeting in human pluripotent stem cells. Mol Ther.2012 Feb:20(2):329-38.(AAV1.9)
9.Jang JH,Koerber JT,Kim JS.Asuri P,Vazin T,Bartel M,Keung A,Kwon I,Park KI,Schaffer DV.An evolved adeno-associated viral variant enhances genedelivery and gene targeting in neural stem cells.Mol Ther.2011 Apr:19(4):667-75.doi:10.1038/mt.2010.287.(AAV r3.45)
10.Gray SJ,Blake BL,Criswell HE,Nicolson SC,Samulski RJ,McCown TJ,LiW.Directed evolution of a novel adeno-associated virus(AAV)vector thatcrosses the seizure-compromised blood-brain barrier(BBB).Mol Ther.2010 Mar:18(3):570-8(AAV clone 32 and 83)
11.Maguire CA,Gianni D,Meijer DH,Shaket LA,Wakimoto H,Rabkin SD,GaoG,Sena-Esteves M.Directed evolution of adeno-associated virus for glioma celltransduction.J Neurooncol.2010 Feb:96(3):337-47.(AAV-U87R7-C5)
12.Koerber JT,Klimczak R,Jang JH,Dalkara D,Flannery JG,SchafferDV.Molecular evolution of adeno-associated virus for enhanced glial genedelivery.Mol Ther.2009 Dec:17(12):2088-95. (AAV ShH13,AAV ShH19,AAV L1-12)
13.Li W,Zhang L,Johnson JS,Zhijian W,Grieger JC,Ping-Jie X,Drouin LM,Agbandje-McKenna M,Pickles RJ,Samulski RJ.Generation of novel AAV vahants bydirected evolution for improved CFTR delivery to human ciliated airwayepithelium.Mol Ther.2009 Dec: 17(12):2067-77.(AAV HAE-1,AAV HAE-2)
14.Klimczak RR,Koerber JT,Dalkara D,Flannery JG,Schaffer DV.A noveladeno-associated viral variant for efficient and selective intravitrealtransduction of rat Muller cells.PLoS One. 2009 Oct 14:4(10):e7467.(AAVvariant ShH10)
15.Excoffon KJ,Koerber JT,Dickey DD,Murtha M,Keshavjee S,Kaspar BK,Zabner J,Schaffer DV.Directed evolution of adeno-associated virus to aninfectious respiratory virus.Proc Natl Acad Sci US A.2009 Mar 10:106(10):3865-70.(AAV2.5T)
16.Sellner L,Stiefelhagen M,Kleinschmidt JA,Laufs S,Wenz F,FruehaufS,Zeller WJ,Veldwijk MR.Generation of effificient human blood progenitor-targeted recombinant adeno-associated viral vectors(AAV)by applying an AAVrandom peptide library on primary human hematopoietic progenitor cells.ExpHematol.2008Aug:36(8):957-64.(AAV LS1-4,AAV Lsm)
17.Li W,Asokan A,Wu Z,Van Dyke T,DiPrimio N,Johnson JS,GovindaswamyL,Agbandje- McKenna M,Leichtle S,Redmond DE Jr,McCown TJ,Petermann KB,Sharpless NE,Samulski RJ.Engineering and selection of shuffled AAV genomes:anew strategy for producing targeted biological nanoparticles.Mol Ther.2008Jul:16(7):1252-60.(AAV1289)
18.Charbel Issa P,De Silva SR,Lipinski DM,Singh MS,Mouravlev A,YouQ.Assessment of tropism and effectivcness of new primate-derived hybridrecombinant AAV serotypes in the mouse and primate retina.PLoS ONE.2013:8:e60361.(AAVHSC 1-17)
19.Huang W,McMurphy T,Liu X,Wang C,Cao L.Genetic Manipulation ofBrown Fat Via Oral Administration of an Engineered Recombinant Adeno-associated Viral Serotype Vector.Mol Ther.2016 Jun:24(6):1062-9.(AAV2 Rec 1-4)
20.Cronin T,Vandenberghe LH,Hantz P,et al.Efficient transduction andoptogenetic stimulation of retinal bipolar cells by a synthetic adeno-associated virus capsid and promoter.EMBO Mol Med 2014:6:1175-1190(AAV8BP2)
21.Choudhury SR,Fitzpatrick Z,Harris AF,Maitland SA,Ferreira JS,ZhangY,Ma S,Sharma RB, Gray-Edwards HL,Johnson JA,Johnson AK,Alonso LC,Punzo C,Wagner KR,Maguire CA, Katin RM,Martin DR,Sena-Esteves M.In Vivo SelectionYields AAV-B1 Capsid for Central Nervous System and Muscle Gene Therapy.MolTher.2016 Aug:24(7):1247-57.(AAV-B1)
22.Deverman BE,Pravda PL,Simpson BP,Kumar SR,Chan KY,Banerjee A,WuWL,,Yang B, Huber N,Pasca SP,Gradinaru V.Cre-dependent selection yields AAVvariants for widespread gene transfer to the adult brain.Nat Biotechnol.2016Feb:34(2):204-9.doi:10.1038/nbt.3440. (AAV-PHP.B)
23.Pulicherla N,Shen S,Yadav S,Debbink K,Govindasamy L,Agbandje-McKenna M,Asokan A. Engineering liver-detargeted AAV9 vectors for cardiac andmusculoskeletal gene transfer.Mol Ther.2011 Jun:19(6):1070-8.(AAV9 derivedmutants-AAV9.45,AAV9.61,AAV9.47)
24.Yang L,Jiang J,Drouin LM,Agbandje-McKenna M,Chen C,Qiao C,Pu D,HuX,Wang DZ, Li J,Xiao X.A myocardium tropic adeno-associated virus(AA V)evolved by DNA shuffling and in vivo selection.Proc Natl Acad Sci US A.2009Mar 10:106(10):3946-51.(AAVM41)
25.Korbelin J,Sieber T,Michelfelder S,Lunding L,Spies E,Hunger A,Alawi M,Rapti K, Indenbirken D,Muller OJ,Pasqualini R,Arap W,Kleinschmidt JA,Trepel M.Pulmonary Targeting of Adena-associated Viral Vectors by Next-generation Sequencing-guidcd Scrccning of Random Capsid Displayed PeptideLibraries.Mol Ther.2016 Jun:24(6):1050-61.(AAV2 displayed peptides)
26.Geoghegan JC,Keiser NW,Okulist A,Martins I,Wilson MS,DavidsonBL.Chondroitin Sulfate is the Primary Receptor for a Peptiide-Modified AAVThat Targets Brain Vascular Endothelium In Vivo.Mol Ther Nucleic Acids.2014Oct 14:3:e202.(AAV2-GMN)
27.Varadi K,Michelfelder S,Korff T,Hecker M,Trepel M,Katus HA,Kleinschmidt JA,Muller OJ.Novel random peptide libraries displayed on AAVserotype 9 for selection of endothelial cell-directed gene transfervectors.Gene Ther.2012 Aug:19(8):800-9.(AAV9-peptide displayed)
28.Michelfelder S,Varadi K,Raupp C,Hunger A,Korbelin J,Pahrmnann C,Schrepfer S,Muller OJ, Kleinschmidt JA,Trepel M.Peptide ligands incorporatedinto the threefold spike capsid domain to re-direct gene transduction of AAV8and AAV9.in vivo.PLoS One.2011:6(8):e23101. (AAV8 and AAV9 peptide displayed)
29.Yu CY,Yuan Z,Cao Z,Wang B,Qiao C,Li J,Xiao X.A muscle-targetingpeptide displayed on AAV2 improves muscle tropism on systemic delivery.GeneTher.2009 Aug:16(8):953-62.
30.Michelfelder S,Lee MK,deLima-Hahn E,Wilmes T,Kaul F,Muller 0,Kleinschmidt JA,Trepel M.Vectors selected from adeno-associated viral displaypeptide libraries for leukemia cell- targeted cytotoxic gene therapy.ExpHematol.2007 Dec:35(12):1766-76.
31.Muller OJ,Kaul F,Weitzman MD,Pasqualini R,Arap W,Kleinschmidt JA,Trepel M.Random peptide libraries displayed on adeno-associated virus toselect for targeted gene therapy vectors. Nat Biotechnol.2003 Sep:21(9):1040-6.
32.Ghfman M,Trepel M,Speece P,Gilbert LB,Arap W,Pasqualini R,WeitzmanMD. Incorporation of tumor-targeting peptides into recombinant adeno-associated virus capsids.Mol Ther.2001 Jun:3(6):964-75.
33.Anne Girod,Martin Ried,Christiane Wobus,Harald Lahm,Kristin Leike,Jurgen Kleinschmidt, Gilbert Deleage&Michael Ballek.Genetic capsidmodifications allow efficient re-targeting of adeno-associated virus type2.Nature Medicine,1052-1056(1999)
34.Bello A,Chand A,Aviles J,Soule G,Auricchio A,Kobinger GP.Noveladeno-associated viruses derived from pig tissues transduce most major organsin mice.Sci Rep.2014 Oct 22:4:6644.(AAVpo2.1,-po4,-poS,and-po6).
35.Gao G,Vandenberghe LH,Alvira MR,Lu Y,Calcedo R,Zhou X,WilsonJM.Clades of Adena- associated viruses are widely disseminated in humantissues.J Virol.2004 Jun:78(12):6381-8. (AAV rh and AAV Hu)
36.Arbetman AE,Lochrie M,Zhou S,Wellman J,Scallan C,Doroudchi MM,etal.Novel caprine adeno-associated virus(AAV)capsid(AAV-Go.l)is closelyrelated to the primate AAV-5 and has unique tropism and neutralizationproperties.J Virol.2005:79:15238-15245.(AAV-Go.1)
37.Lochrie MA,Tatsuno GP,Arbetman AE,Jones K,Pater C,Smith PH,etal.Adena-associated virus(AAV)capsid genes isolated from rat and mouse livergenomic DNA define two new AAV species distantly related to AAV-5.Virology.2006:353:68-82.(AAV-mo.1)
38.Schmidt M,Katano H,Bossis I,Chiarini JA.Cloning andcharacterization of a bovine adeno- associated virus.J Virol.2004:78:6509-6516.(BAAV)
39.Bossis I,Chiarini JA.Cloning of an avian adeno-associated virus(AAAV)and generation of recombinant AAAV particles.J Virol.2003:77:6799-6810.(AAAV)
40.Chen CL,Jensen RL,Schnepp BC,Connell MJ,Shell R,Sferra TJ,BartlettJS,Clark KR, Johnson PR.Molecular characterization of adeno-associatedviruses infecting children.J Virol. 2005 Dec:79(23):14781-92.(AAV variants)
41.Sen D,Gadkari RA,Sudha G,Gabriel N,Kumar YS,Selot R,Samuel R,Rajalingam S,Ramya V,Nair SC,Srinivasan N,Srivastava A,JayandharanGR.Targeted modifications in adeno- associated virus serotype 8 capsidimproves its hepatic gene transfer efficiency in vivo.Hum Gene TherMethods.2013 Apr:24(2):104-16.(AAV8 K137R)
42.Li B,Ma W,Ling C,Van Vliet K,Huang LY,Agbandje-McKenna M,Srivastava A,Aslanidi GV.Site-Directed Mutagenesis of Surface-Exposed LysineResidues Leads to Improved Transduction by AAV2,But Not AAV8,Vectors inMurine Hepatocytes In Vivo.Hum Gene Ther Methods.2015 Dec:26(6):211-20.
43.Gabriel N,Hareendran S,Sen D,Gadkari RA,Sudha G,Selot R,Hussain M,Dhaksnamoorthy R,Samuel R,Srinivasan N,et al.Bioengineering of AAV2 capsid atspecific serine,threonine, or lysine residues improves its transductionefficiency in vitro and in vivo.Hum Gene Ther Methods.2013 Apr:24(2):80-93.
44.Zinn E,Pacouret S,Khaychuk V,Turunen HT,Carvalho LS,Andres-MateosE,Shah S,Shelke R,Maurer AC,Plovie E,Xiao R,Vandenberghe LH.In SilicoReconstruction of the Viral Evolutionary Lineage Yields a Potent Gene TherapyVector.Cell Rep.2015 Aug 11:12(6):1056- 68.(AAV Anc80L65)
45.Shen S,Horowitz ED,Troupes AN,Brown SM,Pulicherla N,Sarnulski RJ,Agbandje-McKenna M,Asokan A.Engraftrnent of a galactose receptor footprintonto adeno-associated viral capsids improves transduction efficiency.J BiolChem.2013 Oct 4:288(40):28814-23.(AAV2G9)
46.Li C,Diprirnio N,Bowles DE,Hirsch ML,Monahan PE,Asokan A,Rabinowitz J,Agbandje- McKenna M,Sarnulski RJ.Single amino acid modificationof adeno-associated virus capsid changes transduction and humoral immuneprofiles.J Virol.2012Aug:86(15):7752-9.(AAV2 265 insertion-AAV2/265D)
47.Bowles DE,McPhee SW,Li C,Gray SJ,Sarnulski JJ,Camp AS,Li J,WangB.Monahan PE, Rabinowitz JE,et al.Phase 1 gene thcrapy for Duchenne musculardystrophy using a translational optimized AAV vector.Mol Ther.2012 Feb:20(2):443-55(AAV2.5)
48.Messina EL,Nienaber J,Daneshrnand M,Villamizar N,Samulski J,MilanoC,Bowles DE. Adena-associated viral vectors based on serotype 3b usecomponents of the fibroblast growth factor receptor signaling complex forefficient transduction.Hum.Gene Ther.2012 Oct: 23(10):1031-42.(AAV3 SASTG)
49.Asokan A,Conway JC,Phillips JL,Li C,Hcggc J,Sinnott R,Yadav S,DiPrirnio N,Nam HJ, Agbandje-McKenna M,McPhee S,Wolff J,SarnulskiRJ.Reengineering a receptor footprint of adeno-associated virus enablesselective and systemic gene transfer to muscle.Nat Biotechnol. 2010 Jan:28(1):79-82.(AAV2i8)
50.Vance M,Llanga T,Bennett W,Woodard K,Murlidharan G,Chungfat N,Asokan A,Gilger B, Kurtzberg J,Sarnulski RJ,Hirsch ML.AAV Gene Therapy forMPSl-associated Corneal Blindncss.Sci Rep.2016 Feb 22:6:22131.(AAV8G9)
51.Zhong L,Li B,Mah CS,Govindasarny L,Agbandje-McKenna M,Cooper M,Herzog RW, Zolotukhin I,Warrington KH Jr,Weigel-Van Aken KA,Hobbs JA,Zolotukhin S,Muzyczka N, Srivastava A.Next generation ofadeno-associatedvirus 2 vectors:point mutations in tyrosines lead to high-efficiencytransduction at 1ower doses.Proc Natl Acad Sci US A.2008 Jun 3:105(22):7827-32.(AAV2 tyrosine mutants AAV2 Y-F)
52.Pctrs-Silva H,Dinculescu A,Li Q,Min SH,Chiodo V,Pang JJ,Zhong L,Zolotukhin S, Srivastava A,Lewin AS,Hauswirth WW.High-efficiency transductionof the mouse retina by tyrosine-mutant AAV serotype vectors.Mol Ther.2009Mar:17(3):463-71.(AAV8 Y-F and AAV9 Y-F)
53.Qiao C,Zhang W,Yuan Z,Shin JH,Li J,Jayandharan GR,Zhong L,Srivastava A,Xiao X, Duan D.Adena-associated virus serotype 6 capsidtyrosine-to-phenylalanine mutations improve gene transfer to skeletalmuscle.Hum Gene Ther.2010 Oct:21(10):1343-8(AAV6 Y-F)
54.Catlon M,Toelen J,Van der Perren A,Vandenberghe LH,Reumers V,Sbragia L,Gijsbers R, Baekelandt V,Himmelreich U,Wilson JM,Deprest J,DebvserZ.Efficient gene transfer into the mouse lung by fetal intratrachealinjection of rAAV2/6.2.Mol Ther.2010 Dec:18(12):2130-8. (AAV6.2)PCTPublication No.WO2013158879Al(lysine mutants)
55.Piacentino III,Valentino,et al.″X-linked inhibitor ofapoptosisprotein-mediated attenuation of apoptosis,using a novel cardiac-enhancedadeno-associated viral vector.″Human gene therapy 23.6(2012):635-646.
序列表
<110> 阿斯克肋匹奥生物制药公司(ASKLEPIOS BIOPHARMACEUTICAL, INC.)
<120> 用于治疗庞贝氏病的治疗性腺相关病毒
<130> 046192-093900WOPT
<140>
<141>
<150> 62/769,702
<151> 2018-11-20
<150> 62/768,449
<151> 2018-11-16
<160> 85
<170> PatentIn version 3.5
<210> 1
<211> 201
<212> DNA
<213> 智人(Homo sapiens)
<400> 1
gcttaccgcc ccagtgagac cctgtgcggc ggggagctgg tggacaccct ccagttcgtc 60
tgtggggacc gcggcttcta cttcagcagg cccgcaagcc gtgtgagccg tcgcagccgt 120
ggcatcgttg aggagtgctg tttccgcagc tgtgacctgg ccctcctgga gacgtactgt 180
gctacccccg ccaagtccga g 201
<210> 2
<211> 183
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成
的多核苷酸
<400> 2
gctctgtgcg gcggggagct ggtggacacc ctccagttcg tctgtgggga ccgcggcttc 60
tacttcagca ggcccgcaag ccgtgtgagc cgtcgcagcc gtggcatcgt tgaggagtgc 120
tgtttccgca gctgtgacct ggccctcctg gagacgtact gtgctacccc cgccaagtcc 180
gag 183
<210> 3
<211> 180
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成
的多核苷酸
<400> 3
ctgtgcggcg gggagctggt ggacaccctc cagttcgtct gtggggaccg cggcttctac 60
ttcagcaggc ccgcaagccg tgtgagccgt cgcagccgtg gcatcgttga ggagtgctgt 120
ttccgcagct gtgacctggc cctcctggag acgtactgtg ctacccccgc caagtccgag 180
<210> 4
<211> 201
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成
的多核苷酸
<400> 4
gcttaccgcc ccagtgagac cctgtgcggc ggggagctgg tggacaccct ccagttcgtc 60
tgtggggacc gcggcttcta cttcagcagg cccgcaagcc gtgtgagccg tcgcagccgt 120
ggcatcatgg aggagtgctg tttccgcagc tgtgacctgg ccctcctgga gacgtactgt 180
gctacccccg ccaagtccga g 201
<210> 5
<211> 67
<212> PRT
<213> 智人(Homo sapiens)
<400> 5
Ala Tyr Arg Pro Ser Glu Thr Leu Cys Gly Gly Glu Leu Val Asp Thr
1 5 10 15
Leu Gln Phe Val Cys Gly Asp Arg Gly Phe Tyr Phe Ser Arg Pro Ala
20 25 30
Ser Arg Val Ser Arg Arg Ser Arg Gly Ile Val Glu Glu Cys Cys Phe
35 40 45
Arg Ser Cys Asp Leu Ala Leu Leu Glu Thr Tyr Cys Ala Thr Pro Ala
50 55 60
Lys Ser Glu
65
<210> 6
<211> 61
<212> PRT
<213> 人工序列
<220>
<223> 人工序列的描述:合成
的多肽
<400> 6
Ala Leu Cys Gly Gly Glu Leu Val Asp Thr Leu Gln Phe Val Cys Gly
1 5 10 15
Asp Arg Gly Phe Tyr Phe Ser Arg Pro Ala Ser Arg Val Ser Arg Arg
20 25 30
Ser Arg Gly Ile Val Glu Glu Cys Cys Phe Arg Ser Cys Asp Leu Ala
35 40 45
Leu Leu Glu Thr Tyr Cys Ala Thr Pro Ala Lys Ser Glu
50 55 60
<210> 7
<211> 60
<212> PRT
<213> 人工序列
<220>
<223> 人工序列的描述:合成
的多肽
<400> 7
Leu Cys Gly Gly Glu Leu Val Asp Thr Leu Gln Phe Val Cys Gly Asp
1 5 10 15
Arg Gly Phe Tyr Phe Ser Arg Pro Ala Ser Arg Val Ser Arg Arg Ser
20 25 30
Arg Gly Ile Val Glu Glu Cys Cys Phe Arg Ser Cys Asp Leu Ala Leu
35 40 45
Leu Glu Thr Tyr Cys Ala Thr Pro Ala Lys Ser Glu
50 55 60
<210> 8
<211> 24
<212> PRT
<213> 人工序列
<220>
<223> 人工序列的描述:合成
的肽
<400> 8
Glu Glu Cys Cys Phe Arg Ser Cys Asp Leu Ala Leu Leu Glu Thr Tyr
1 5 10 15
Cys Ala Thr Pro Ala Lys Ser Glu
20
<210> 9
<211> 67
<212> PRT
<213> 人工序列
<220>
<223> 人工序列的描述:合成
的多肽
<400> 9
Ala Tyr Arg Pro Ser Glu Thr Leu Cys Gly Gly Glu Leu Val Asp Thr
1 5 10 15
Leu Gln Phe Val Cys Gly Asp Arg Gly Phe Tyr Phe Ser Arg Pro Ala
20 25 30
Ser Arg Val Ser Arg Arg Ser Arg Gly Ile Met Glu Glu Cys Cys Phe
35 40 45
Arg Ser Cys Asp Leu Ala Leu Leu Glu Thr Tyr Cys Ala Thr Pro Ala
50 55 60
Lys Ser Glu
65
<210> 10
<211> 952
<212> PRT
<213> 智人(Homo sapiens)
<400> 10
Met Gly Val Arg His Pro Pro Cys Ser His Arg Leu Leu Ala Val Cys
1 5 10 15
Ala Leu Val Ser Leu Ala Thr Ala Ala Leu Leu Gly His Ile Leu Leu
20 25 30
His Asp Phe Leu Leu Val Pro Arg Glu Leu Ser Gly Ser Ser Pro Val
35 40 45
Leu Glu Glu Thr His Pro Ala His Gln Gln Gly Ala Ser Arg Pro Gly
50 55 60
Pro Arg Asp Ala Gln Ala His Pro Gly Arg Pro Arg Ala Val Pro Thr
65 70 75 80
Gln Cys Asp Val Pro Pro Asn Ser Arg Phe Asp Cys Ala Pro Asp Lys
85 90 95
Ala Ile Thr Gln Glu Gln Cys Glu Ala Arg Gly Cys Cys Tyr Ile Pro
100 105 110
Ala Lys Gln Gly Leu Gln Gly Ala Gln Met Gly Gln Pro Trp Cys Phe
115 120 125
Phe Pro Pro Ser Tyr Pro Ser Tyr Lys Leu Glu Asn Leu Ser Ser Ser
130 135 140
Glu Met Gly Tyr Thr Ala Thr Leu Thr Arg Thr Thr Pro Thr Phe Phe
145 150 155 160
Pro Lys Asp Ile Leu Thr Leu Arg Leu Asp Val Met Met Glu Thr Glu
165 170 175
Asn Arg Leu His Phe Thr Ile Lys Asp Pro Ala Asn Arg Arg Tyr Glu
180 185 190
Val Pro Leu Glu Thr Pro His Val His Ser Arg Ala Pro Ser Pro Leu
195 200 205
Tyr Ser Val Glu Phe Ser Glu Glu Pro Phe Gly Val Ile Val Arg Arg
210 215 220
Gln Leu Asp Gly Arg Val Leu Leu Asn Thr Thr Val Ala Pro Leu Phe
225 230 235 240
Phe Ala Asp Gln Phe Leu Gln Leu Ser Thr Ser Leu Pro Ser Gln Tyr
245 250 255
Ile Thr Gly Leu Ala Glu His Leu Ser Pro Leu Met Leu Ser Thr Ser
260 265 270
Trp Thr Arg Ile Thr Leu Trp Asn Arg Asp Leu Ala Pro Thr Pro Gly
275 280 285
Ala Asn Leu Tyr Gly Ser His Pro Phe Tyr Leu Ala Leu Glu Asp Gly
290 295 300
Gly Ser Ala His Gly Val Phe Leu Leu Asn Ser Asn Ala Met Asp Val
305 310 315 320
Val Leu Gln Pro Ser Pro Ala Leu Ser Trp Arg Ser Thr Gly Gly Ile
325 330 335
Leu Asp Val Tyr Ile Phe Leu Gly Pro Glu Pro Lys Ser Val Val Gln
340 345 350
Gln Tyr Leu Asp Val Val Gly Tyr Pro Phe Met Pro Pro Tyr Trp Gly
355 360 365
Leu Gly Phe His Leu Cys Arg Trp Gly Tyr Ser Ser Thr Ala Ile Thr
370 375 380
Arg Gln Val Val Glu Asn Met Thr Arg Ala His Phe Pro Leu Asp Val
385 390 395 400
Gln Trp Asn Asp Leu Asp Tyr Met Asp Ser Arg Arg Asp Phe Thr Phe
405 410 415
Asn Lys Asp Gly Phe Arg Asp Phe Pro Ala Met Val Gln Glu Leu His
420 425 430
Gln Gly Gly Arg Arg Tyr Met Met Ile Val Asp Pro Ala Ile Ser Ser
435 440 445
Ser Gly Pro Ala Gly Ser Tyr Arg Pro Tyr Asp Glu Gly Leu Arg Arg
450 455 460
Gly Val Phe Ile Thr Asn Glu Thr Gly Gln Pro Leu Ile Gly Lys Val
465 470 475 480
Trp Pro Gly Ser Thr Ala Phe Pro Asp Phe Thr Asn Pro Thr Ala Leu
485 490 495
Ala Trp Trp Glu Asp Met Val Ala Glu Phe His Asp Gln Val Pro Phe
500 505 510
Asp Gly Met Trp Ile Asp Met Asn Glu Pro Ser Asn Phe Ile Arg Gly
515 520 525
Ser Glu Asp Gly Cys Pro Asn Asn Glu Leu Glu Asn Pro Pro Tyr Val
530 535 540
Pro Gly Val Val Gly Gly Thr Leu Gln Ala Ala Thr Ile Cys Ala Ser
545 550 555 560
Ser His Gln Phe Leu Ser Thr His Tyr Asn Leu His Asn Leu Tyr Gly
565 570 575
Leu Thr Glu Ala Ile Ala Ser His Arg Ala Leu Val Lys Ala Arg Gly
580 585 590
Thr Arg Pro Phe Val Ile Ser Arg Ser Thr Phe Ala Gly His Gly Arg
595 600 605
Tyr Ala Gly His Trp Thr Gly Asp Val Trp Ser Ser Trp Glu Gln Leu
610 615 620
Ala Ser Ser Val Pro Glu Ile Leu Gln Phe Asn Leu Leu Gly Val Pro
625 630 635 640
Leu Val Gly Ala Asp Val Cys Gly Phe Leu Gly Asn Thr Ser Glu Glu
645 650 655
Leu Cys Val Arg Trp Thr Gln Leu Gly Ala Phe Tyr Pro Phe Met Arg
660 665 670
Asn His Asn Ser Leu Leu Ser Leu Pro Gln Glu Pro Tyr Ser Phe Ser
675 680 685
Glu Pro Ala Gln Gln Ala Met Arg Lys Ala Leu Thr Leu Arg Tyr Ala
690 695 700
Leu Leu Pro His Leu Tyr Thr Leu Phe His Gln Ala His Val Ala Gly
705 710 715 720
Glu Thr Val Ala Arg Pro Leu Phe Leu Glu Phe Pro Lys Asp Ser Ser
725 730 735
Thr Trp Thr Val Asp His Gln Leu Leu Trp Gly Glu Ala Leu Leu Ile
740 745 750
Thr Pro Val Leu Gln Ala Gly Lys Ala Glu Val Thr Gly Tyr Phe Pro
755 760 765
Leu Gly Thr Trp Tyr Asp Leu Gln Thr Val Pro Val Glu Ala Leu Gly
770 775 780
Ser Leu Pro Pro Pro Pro Ala Ala Pro Arg Glu Pro Ala Ile His Ser
785 790 795 800
Glu Gly Gln Trp Val Thr Leu Pro Ala Pro Leu Asp Thr Ile Asn Val
805 810 815
His Leu Arg Ala Gly Tyr Ile Ile Pro Leu Gln Gly Pro Gly Leu Thr
820 825 830
Thr Thr Glu Ser Arg Gln Gln Pro Met Ala Leu Ala Val Ala Leu Thr
835 840 845
Lys Gly Gly Glu Ala Arg Gly Glu Leu Phe Trp Asp Asp Gly Glu Ser
850 855 860
Leu Glu Val Leu Glu Arg Gly Ala Tyr Thr Gln Val Ile Phe Leu Ala
865 870 875 880
Arg Asn Asn Thr Ile Val Asn Glu Leu Val Arg Val Thr Ser Glu Gly
885 890 895
Ala Gly Leu Gln Leu Gln Lys Val Thr Val Leu Gly Val Ala Thr Ala
900 905 910
Pro Gln Gln Val Leu Ser Asn Gly Val Pro Val Ser Asn Phe Thr Tyr
915 920 925
Ser Pro Asp Thr Lys Val Leu Asp Ile Cys Val Ser Leu Leu Met Gly
930 935 940
Glu Gln Phe Leu Val Ser Trp Cys
945 950
<210> 11
<211> 3837
<212> DNA
<213> 智人(Homo sapiens)
<400> 11
gccccgcgac gagctcccgc cggtcacgtg acccgcctct gcgcgccccc gggcacgacc 60
ccggagtctc cgcgggcggc cagggcgcgc gtgcgcggag gtgagccggg ccggggctgc 120
ggggcttccc tgagcgcggg ccgggtcggt ggggcggtcg gctgcccgcg cggcctctca 180
gttgggaaag ctgaggttgt cgccggggcc gcgggtggag gtcggggatg aggcagcagg 240
taggacagtg acctcggtga cgcgaaggac cccggccacc tctaggttct cctcgtccgc 300
ccgttgttca gcgagggagg ctctgcgcgt gccgcagctg acggggaaac tgaggcacgg 360
agcgggcctg taggagctgt ccaggccatc tccaaccatg ggagtgaggc acccgccctg 420
ctcccaccgg ctcctggccg tctgcgccct cgtgtccttg gcaaccgctg cactcctggg 480
gcacatccta ctccatgatt tcctgctggt tccccgagag ctgagtggct cctccccagt 540
cctggaggag actcacccag ctcaccagca gggagccagc agaccagggc cccgggatgc 600
ccaggcacac cccggccgtc ccagagcagt gcccacacag tgcgacgtcc cccccaacag 660
ccgcttcgat tgcgcccctg acaaggccat cacccaggaa cagtgcgagg cccgcggctg 720
ttgctacatc cctgcaaagc aggggctgca gggagcccag atggggcagc cctggtgctt 780
cttcccaccc agctacccca gctacaagct ggagaacctg agctcctctg aaatgggcta 840
cacggccacc ctgacccgta ccacccccac cttcttcccc aaggacatcc tgaccctgcg 900
gctggacgtg atgatggaga ctgagaaccg cctccacttc acgatcaaag atccagctaa 960
caggcgctac gaggtgccct tggagacccc gcatgtccac agccgggcac cgtccccact 1020
ctacagcgtg gagttctccg aggagccctt cggggtgatc gtgcgccggc agctggacgg 1080
ccgcgtgctg ctgaacacga cggtggcgcc cctgttcttt gcggaccagt tccttcagct 1140
gtccacctcg ctgccctcgc agtatatcac aggcctcgcc gagcacctca gtcccctgat 1200
gctcagcacc agctggacca ggatcaccct gtggaaccgg gaccttgcgc ccacgcccgg 1260
tgcgaacctc tacgggtctc accctttcta cctggcgctg gaggacggcg ggtcggcaca 1320
cggggtgttc ctgctaaaca gcaatgccat ggatgtggtc ctgcagccga gccctgccct 1380
tagctggagg tcgacaggtg ggatcctgga tgtctacatc ttcctgggcc cagagcccaa 1440
gagcgtggtg cagcagtacc tggacgttgt gggatacccg ttcatgccgc catactgggg 1500
cctgggcttc cacctgtgcc gctggggcta ctcctccacc gctatcaccc gccaggtggt 1560
ggagaacatg accagggccc acttccccct ggacgtccag tggaacgacc tggactacat 1620
ggactcccgg agggacttca cgttcaacaa ggatggcttc cgggacttcc cggccatggt 1680
gcaggagctg caccagggcg gccggcgcta catgatgatc gtggatcctg ccatcagcag 1740
ctcgggccct gccgggagct acaggcccta cgacgagggt ctgcggaggg gggttttcat 1800
caccaacgag accggccagc cgctgattgg gaaggtatgg cccgggtcca ctgccttccc 1860
cgacttcacc aaccccacag ccctggcctg gtgggaggac atggtggctg agttccatga 1920
ccaggtgccc ttcgacggca tgtggattga catgaacgag ccttccaact tcatcagggg 1980
ctctgaggac ggctgcccca acaatgagct ggagaaccca ccctacgtgc ctggggtggt 2040
tggggggacc ctccaggcgg ccaccatctg tgcctccagc caccagtttc tctccacaca 2100
ctacaacctg cacaacctct acggcctgac cgaagccatc gcctcccaca gggcgctggt 2160
gaaggctcgg gggacacgcc catttgtgat ctcccgctcg acctttgctg gccacggccg 2220
atacgccggc cactggacgg gggacgtgtg gagctcctgg gagcagctcg cctcctccgt 2280
gccagaaatc ctgcagttta acctgctggg ggtgcctctg gtcggggccg acgtctgcgg 2340
cttcctgggc aacacctcag aggagctgtg tgtgcgctgg acccagctgg gggccttcta 2400
ccccttcatg cggaaccaca acagcctgct cagtctgccc caggagccgt acagcttcag 2460
cgagccggcc cagcaggcca tgaggaaggc cctcaccctg cgctacgcac tcctccccca 2520
cctctacaca ctgttccacc aggcccacgt cgcgggggag accgtggccc ggcccctctt 2580
cctggagttc cccaaggact ctagcacctg gactgtggac caccagctcc tgtgggggga 2640
ggccctgctc atcaccccag tgctccaggc cgggaaggcc gaagtgactg gctacttccc 2700
cttgggcaca tggtacgacc tgcagacggt gccagtagag gcccttggca gcctcccacc 2760
cccacctgca gctccccgtg agccagccat ccacagcgag gggcagtggg tgacgctgcc 2820
ggcccccctg gacaccatca acgtccacct ccgggctggg tacatcatcc ccctgcaggg 2880
ccctggcctc acaaccacag agtcccgcca gcagcccatg gccctggctg tggccctgac 2940
caagggtggg gaggcccgag gggagctgtt ctgggacgat ggagagagcc tggaagtgct 3000
ggagcgaggg gcctacacac aggtcatctt cctggccagg aataacacga tcgtgaatga 3060
gctggtacgt gtgaccagtg agggagctgg cctgcagctg cagaaggtga ctgtcctggg 3120
cgtggccacg gcgccccagc aggtcctctc caacggtgtc cctgtctcca acttcaccta 3180
cagccccgac accaaggtcc tggacatctg tgtctcgctg ttgatgggag agcagtttct 3240
cgtcagctgg tgttagccgg gcggagtgtg ttagtctctc cagagggagg ctggttcccc 3300
agggaagcag agcctgtgtg cgggcagcag ctgtgtgcgg gcctgggggt tgcatgtgtc 3360
acctggagct gggcactaac cattccaagc cgccgcatcg cttgtttcca cctcctgggc 3420
cggggctctg gcccccaacg tgtctaggag agctttctcc ctagatcgca ctgtgggccg 3480
gggccctgga gggctgctct gtgttaataa gattgtaagg tttgccctcc tcacctgttg 3540
ccggcatgcg ggtagtatta gccacccccc tccatctgtt cccagcaccg gagaaggggg 3600
tgctcaggtg gaggtgtggg gtatgcacct gagctcctgc ttcgcgcctg ctgctctgcc 3660
ccaacgcgac cgctgcccgg ctgcccagag ggctggatgc ctgccggtcc ccgagcaagc 3720
ctgggaactc aggaaaattc acaggacttg ggagattcta aatcttaagt gcaattattt 3780
ttaataaaag gggcatttgg aatcagcaaa aaaaaaaaaa aaaaaaaaaa aaaaaaa 3837
<210> 12
<211> 349
<212> DNA
<213> 未知
<220>
<223> 未知的描述:
TTR启动子(trunc)序列
<400> 12
tcgagcttgg gctgcaggtc gagggcactg ggaggatgtt gagtaagatg gaaaactact 60
gatgaccctt gcagagacag agtattagga catgtttgaa caggggccgg gcgatcagca 120
ggtagctcta gaggatcccc gtctgtctgc acatttcgta gagcgagtgt tccgatactc 180
taatctccct aggcaaggtt catatttgtg taggttactt attctccttt tgttgactaa 240
gtcaataatc agaatcagca ggtttggagt cagcttggca gggatcagca gcctgggttg 300
gaaggagggg gtataaaagc cccttcacca ggagaagccg tcacacaga 349
<210> 13
<211> 85
<212> DNA
<213> 小鼠细小病毒
<400> 13
ctagccctaa ggtaagttgg cgccgtttaa gggatggttg gttggtgggg tattaatgtt 60
taattacctt ttttacaggc ctgaa 85
<210> 14
<211> 441
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成
的多核苷酸
<400> 14
gtacacatat tgaccaaatc agggtaattt tgcatttgta attttaaaaa atgctttctt 60
cttttaatat acttttttgt ttatcttatt tctaatactt tccctaatct ctttctttca 120
gggcaataat gatacaatgt atcatgcctc tttgcaccat tctaaagaat aacagtgata 180
atttctgggt taaggcaata gcaatatttc tgcatataaa tatttctgca tataaattgt 240
aactgatgta agaggtttca tattgctaat agcagctaca atccagctac cattctgctt 300
ttattttctg gttgggataa ggctggatta ttctgagtcc aagctaggcc cttttgctaa 360
tcttgttcat acctcttatc ttcctcccac agctcctggg caacctgctg gtctctctgc 420
tggcccatca ctttggcaaa g 441
<210> 15
<211> 196
<212> DNA
<213> 智人(Homo sapiens)
<400> 15
gatctgtggc ttctagctgc ccgggtggca tccctgtgac ccctccccag tgcctctcct 60
ggccctggaa gttgccactc cagtgcccac cagccttgtc ctaataaaat taagttgcat 120
cattttgtct gactaggtgt ccttctataa tattatgggg tggagggggg tggtatggag 180
caaggggcaa gttggg 196
<210> 16
<211> 251
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成
的多核苷酸
<400> 16
aaggccgacc cgcgaatagt agatcccgcg agggcttgaa tctatcacct agagtacacc 60
ctagagaata gctagctctc aatgactaag gactaaactt ggtatttcga ctgaagcctg 120
tcccctcact gttggcgcta ggaggagagt tcgtagaaag gatagtacga tttaagtatc 180
tctaagcctt gtgaagcact aaggttgcgt acagacgtgc ttgaattacg gataattcgg 240
gaaccttggg a 251
<210> 17
<211> 72
<212> DNA
<213> 智人(Homo sapiens)
<400> 17
atgccgtctt ctgtctcgtg gggcatcctc ctgctggcag gcctgtgctg cctggtccct 60
gtctccctgg ct 72
<210> 18
<211> 32
<212> PRT
<213> 褐家鼠(Rattus norvegicus)
<400> 18
Met Leu Arg Gly Pro Gly Pro Gly Arg Leu Leu Leu Leu Ala Val Leu
1 5 10 15
Cys Leu Gly Thr Ser Val Arg Cys Thr Glu Thr Gly Lys Ser Lys Arg
20 25 30
<210> 19
<211> 38
<212> PRT
<213> 褐家鼠(Rattus norvegicus)
<400> 19
Met Leu Arg Gly Pro Gly Pro Gly Arg Leu Leu Leu Leu Ala Val Leu
1 5 10 15
Cys Leu Gly Thr Ser Val Arg Cys Thr Glu Thr Gly Lys Ser Lys Arg
20 25 30
Leu Ala Leu Gln Ile Val
35
<210> 20
<211> 26
<212> PRT
<213> 智人(Homo sapiens)
<400> 20
Met Leu Arg Gly Pro Gly Pro Gly Leu Leu Leu Leu Ala Val Gln Cys
1 5 10 15
Leu Gly Thr Ala Val Pro Ser Thr Gly Ala
20 25
<210> 21
<211> 31
<212> PRT
<213> 非洲爪蟾(Xenopus laevis)
<400> 21
Met Arg Arg Gly Ala Leu Thr Gly Leu Leu Leu Val Leu Cys Leu Ser
1 5 10 15
Val Val Leu Arg Ala Ala Pro Ser Ala Thr Ser Lys Lys Arg Arg
20 25 30
<210> 22
<211> 72
<212> DNA
<213> 智人(Homo sapiens)
<400> 22
atgggaatcc caatggggaa gtcgatgctg gtgcttctca ccttcttggc cttcgcctcg 60
tgctgcattg ct 72
<210> 23
<211> 96
<212> DNA
<213> 褐家鼠(Rattus norvegicus)
<400> 23
atgctcaggg gtccgggacc cgggcggctg ctgctgctag cagtcctgtg cctggggaca 60
tcggtgcgct gcaccgaaac cgggaagagc aagagg 96
<210> 24
<211> 114
<212> DNA
<213> 褐家鼠(Rattus norvegicus)
<400> 24
atgctcaggg gtccgggacc cgggcggctg ctgctgctag cagtcctgtg cctggggaca 60
tcggtgcgct gcaccgaaac cgggaagagc aagaggcagg ctcagcaaat cgtg 114
<210> 25
<211> 78
<212> DNA
<213> 智人(Homo sapiens)
<400> 25
atgcttaggg gtccggggcc cgggctgctg ctgctggccg tccagtgcct ggggacagcg 60
gtgccctcca cgggagcc 78
<210> 26
<211> 93
<212> DNA
<213> 非洲爪蟾(Xenopus laevis)
<400> 26
atgcgccggg gggccctgac cgggctgctc ctggtcctgt gcctgagtgt tgtgctacgt 60
gcagccccct ctgcaacaag caagaagcgc agg 93
<210> 27
<211> 17
<212> PRT
<213> 褐家鼠(Rattus norvegicus)
<400> 27
Met Thr Pro Leu Leu Leu Leu Ala Val Leu Cys Leu Gly Thr Ala Leu
1 5 10 15
Ala
<210> 28
<211> 22
<212> PRT
<213> 智人(Homo sapiens)
<400> 28
Met Leu Ser Phe Val Asp Thr Arg Thr Leu Leu Leu Leu Ala Val Thr
1 5 10 15
Leu Cys Leu Ala Thr Cys
20
<210> 29
<211> 21
<212> PRT
<213> 人工序列
<220>
<223> 人工序列的描述:合成
的肽
<400> 29
Met Trp Trp Arg Leu Trp Trp Leu Leu Leu Leu Leu Leu Leu Leu Trp
1 5 10 15
Pro Met Val Trp Ala
20
<210> 30
<211> 9
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成的
寡核苷酸
<400> 30
ggcgcgccg 9
<210> 31
<211> 3
<212> PRT
<213> 人工序列
<220>
<223> 人工序列的描述:合成
的肽
<400> 31
Gly Ala Pro
1
<210> 32
<211> 6
<212> PRT
<213> 人工序列
<220>
<223> 人工序列的描述:合成
的肽
<400> 32
Gly Gly Gly Gly Gly Pro
1 5
<210> 33
<211> 5
<212> PRT
<213> 人工序列
<220>
<223> 人工序列的描述:合成
的肽
<400> 33
Gly Gly Gly Gly Ser
1 5
<210> 34
<211> 5
<212> PRT
<213> 人工序列
<220>
<223> 人工序列的描述:合成
的肽
<400> 34
Glu Ala Ala Ala Lys
1 5
<210> 35
<211> 11
<212> PRT
<213> 人工序列
<220>
<223> 人工序列的描述:合成
的肽
<400> 35
Gly Gly Gly Thr Val Gly Asp Asp Asp Asp Lys
1 5 10
<210> 36
<211> 167
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成
的多核苷酸
<400> 36
aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg 60
caatttgata aaaatcgtca aattataaac aggctttgcc tgtttagcct cagtgagcga 120
gcgagcgcgc agagagggag tggccaactc catcactagg ggttcct 167
<210> 37
<211> 143
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成
的多核苷酸
<400> 37
aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg 60
gataaaaatc caggctttgc ctgcctcagt gagcgagcga gcgcgcagag agggagtggc 120
caactccatc actaggggtt cct 143
<210> 38
<211> 143
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成
的多核苷酸
<400> 38
aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg 60
gataaaaatc caggctttgc ctgcctcagt gagcgagcga gcgcgcagag agggagtggc 120
caactccatc actaggggtt cct 143
<210> 39
<211> 208
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成
的多核苷酸
<400> 39
aggaacccct agtgatggag ttggccactc cctctctggg attgggattg cgcgctcgct 60
cgcgggattg ggattgggat tgggattggg attgggattg ataaaaatca atcccaatcc 120
caatcccaat cccaatccca atcccgcgag cgagcgcgca atcccaatcc cagagaggga 180
gtggccaact ccatcactag gggttcct 208
<210> 40
<211> 199
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成
的多核苷酸
<400> 40
aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcgggattg 60
ggattgggat tgggattggg attgggattg ataaaaatca atcccaatcc caatcccaat 120
cccaatccca atcccgcgag cgagcgcgca ggagagggag tggccaactc catcactagg 180
ggttcctaag cttattata 199
<210> 41
<211> 154
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成
的多核苷酸
<400> 41
aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg 60
gcgcctataa agataaaaat ccaggctttg cctgcctcag ttagcgagcg agcgcgcaga 120
gagggagtgg ccaactccat cactaggggt tcct 154
<210> 42
<211> 127
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成
的多核苷酸
<400> 42
ctagtgatgg agttggccac tccctctctg cgcgctcgct cgctcactga gggataaaaa 60
tccaggcttt gcctgcctca gtgagcgagc gagcgcgcag agagggagtg gccaactcca 120
tcactag 127
<210> 43
<211> 2208
<212> DNA
<213> 腺相关病毒3B
<400> 43
atggctgctg acggttatct tccagattgg ctcgaggaca acctttctga aggcattcgt 60
gagtggtggg ctctgaaacc tggagtccct caacccaaag cgaaccaaca acaccaggac 120
aaccgtcggg gtcttgtgct tccgggttac aaatacctcg gacccggtaa cggactcgac 180
aaaggagagc cggtcaacga ggcggacgcg gcagccctcg aacacgacaa agcttacgac 240
cagcagctca aggccggtga caacccgtac ctcaagtaca accacgccga cgccgagttt 300
caggagcgtc ttcaagaaga tacgtctttt gggggcaacc ttggcagagc agtcttccag 360
gccaaaaaga ggatccttga gcctcttggt ctggttgagg aagcagctaa aacggctcct 420
ggaaagaaga ggcctgtaga tcagtctcct caggaaccgg actcatcatc tggtgttggc 480
aaatcgggca aacagcctgc cagaaaaaga ctaaatttcg gtcagactgg cgactcagag 540
tcagtcccag accctcaacc tctcggagaa ccaccagcag cccccacaag tttgggatct 600
aatacaatgg cttcaggcgg tggcgcacca atggcagaca ataacgaggg tgccgatgga 660
gtgggtaatt cctcaggaaa ttggcattgc gattcccaat ggctgggcga cagagtcatc 720
accaccagca ccagaacctg ggccctgccc acttacaaca accatctcta caagcaaatc 780
tccagccaat caggagcttc aaacgacaac cactactttg gctacagcac cccttggggg 840
tattttgact ttaacagatt ccactgccac ttctcaccac gtgactggca gcgactcatt 900
aacaacaact ggggattccg gcccaagaaa ctcagcttca agctcttcaa catccaagtt 960
aaagaggtca cgcagaacga tggcacgacg actattgcca ataaccttac cagcacggtt 1020
caagtgttta cggactcgga gtatcagctc ccgtacgtgc tcgggtcggc gcaccaaggc 1080
tgtctcccgc cgtttccagc ggacgtcttc atggtccctc agtatggata cctcaccctg 1140
aacaacggaa gtcaagcggt gggacgctca tccttttact gcctggagta cttcccttcg 1200
cagatgctaa ggactggaaa taacttccaa ttcagctata ccttcgagga tgtacctttt 1260
cacagcagct acgctcacag ccagagtttg gatcgcttga tgaatcctct tattgatcag 1320
tatctgtact acctgaacag aacgcaagga acaacctctg gaacaaccaa ccaatcacgg 1380
ctgcttttta gccaggctgg gcctcagtct atgtctttgc aggccagaaa ttggctacct 1440
gggccctgct accggcaaca gagactttca aagactgcta acgacaacaa caacagtaac 1500
tttccttgga cagcggccag caaatatcat ctcaatggcc gcgactcgct ggtgaatcca 1560
ggaccagcta tggccagtca caaggacgat gaagaaaaat ttttccctat gcacggcaat 1620
ctaatatttg gcaaagaagg gacaacggca agtaacgcag aattagataa tgtaatgatt 1680
acggatgaag aagagattcg taccaccaat cctgtggcaa cagagcagta tggaactgtg 1740
gcaaataact tgcagagctc aaatacagct cccacgacta gaactgtcaa tgatcagggg 1800
gccttacctg gcatggtgtg gcaagatcgt gacgtgtacc ttcaaggacc tatctgggca 1860
aagattcctc acacggatgg acactttcat ccttctcctc tgatgggagg ctttggactg 1920
aaacatccgc ctcctcaaat catgatcaaa aatactccgg taccggcaaa tcctccgacg 1980
actttcagcc cggccaagtt tgcttcattt atcactcagt actccactgg acaggtcagc 2040
gtggaaattg agtgggagct acagaaagaa aacagcaaac gttggaatcc agagattcag 2100
tacacttcca actacaacaa gtctgttaat gtggacttta ctgtagacac taatggtgtt 2160
tatagtgaac ctcgccctat tggaacccgg tatctcacac gaaacttg 2208
<210> 44
<211> 736
<212> PRT
<213> 腺相关病毒3B
<400> 44
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Val Pro Gln Pro
20 25 30
Lys Ala Asn Gln Gln His Gln Asp Asn Arg Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Ile Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Asp Gln Ser Pro Gln Glu Pro Asp Ser Ser Ser Gly Val Gly
145 150 155 160
Lys Ser Gly Lys Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Leu Gly Glu Pro Pro
180 185 190
Ala Ala Pro Thr Ser Leu Gly Ser Asn Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Ser Gln Ser Gly Ala Ser Asn Asp Asn His Tyr
260 265 270
Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His
275 280 285
Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn Trp
290 295 300
Gly Phe Arg Pro Lys Lys Leu Ser Phe Lys Leu Phe Asn Ile Gln Val
305 310 315 320
Lys Glu Val Thr Gln Asn Asp Gly Thr Thr Thr Ile Ala Asn Asn Leu
325 330 335
Thr Ser Thr Val Gln Val Phe Thr Asp Ser Glu Tyr Gln Leu Pro Tyr
340 345 350
Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala Asp
355 360 365
Val Phe Met Val Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly Ser
370 375 380
Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser
385 390 395 400
Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Thr Phe Glu
405 410 415
Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp Arg
420 425 430
Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Asn Arg Thr
435 440 445
Gln Gly Thr Thr Ser Gly Thr Thr Asn Gln Ser Arg Leu Leu Phe Ser
450 455 460
Gln Ala Gly Pro Gln Ser Met Ser Leu Gln Ala Arg Asn Trp Leu Pro
465 470 475 480
Gly Pro Cys Tyr Arg Gln Gln Arg Leu Ser Lys Thr Ala Asn Asp Asn
485 490 495
Asn Asn Ser Asn Phe Pro Trp Thr Ala Ala Ser Lys Tyr His Leu Asn
500 505 510
Gly Arg Asp Ser Leu Val Asn Pro Gly Pro Ala Met Ala Ser His Lys
515 520 525
Asp Asp Glu Glu Lys Phe Phe Pro Met His Gly Asn Leu Ile Phe Gly
530 535 540
Lys Glu Gly Thr Thr Ala Ser Asn Ala Glu Leu Asp Asn Val Met Ile
545 550 555 560
Thr Asp Glu Glu Glu Ile Arg Thr Thr Asn Pro Val Ala Thr Glu Gln
565 570 575
Tyr Gly Thr Val Ala Asn Asn Leu Gln Ser Ser Asn Thr Ala Pro Thr
580 585 590
Thr Arg Thr Val Asn Asp Gln Gly Ala Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Leu
625 630 635 640
Lys His Pro Pro Pro Gln Ile Met Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asn Pro Pro Thr Thr Phe Ser Pro Ala Lys Phe Ala Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn
690 695 700
Tyr Asn Lys Ser Val Asn Val Asp Phe Thr Val Asp Thr Asn Gly Val
705 710 715 720
Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730 735
<210> 45
<211> 2208
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成
的多核苷酸
<400> 45
atggctgctg acggttatct tccagattgg ctcgaggaca acctttctga aggcattcgt 60
gagtggtggg ctctgaaacc tggagtccct caacccaaag cgaaccaaca acaccaggac 120
aaccgtcggg gtcttgtgct tccgggttac aaatacctcg gacccggtaa cggactcgac 180
aaaggagagc cggtcaacga ggcggacgcg gcagccctcg aacacgacaa agcttacgac 240
cagcagctca aggccggtga caacccgtac ctcaagtaca accacgccga cgccgagttt 300
caggagcgtc ttcaagaaga tacgtctttt gggggcaacc ttggcagagc agtcttccag 360
gccaaaaaga ggatccttga gcctcttggt ctggttgagg aagcagctaa aacggctcct 420
ggaaagaaga ggcctgtaga tcagtctcct caggaaccgg actcatcatc tggtgttggc 480
aaatcgggca aacagcctgc cagaaaaaga ctaaatttcg gtcagactgg cgactcagag 540
tcagtcccag accctcaacc tctcggagaa ccaccagcag cccccacaag tttgggatct 600
aatacaatgg cttcaggcgg tggcgcacca atggcagaca ataacgaggg tgccgatgga 660
gtgggtaatt cctcaggaaa ttggcattgc gattcccaat ggctgggcga cagagtcatc 720
accaccagca ccagaacctg ggccctgccc acttacaaca accatctcta caagcaaatc 780
tccagccaat cagatgcttc aaacgacaac cactactttg gctacagcac cccttggggg 840
tattttgact ttaacagatt ccactgccac ttctcaccac gtgactggca gcgactcatt 900
aacaacaact ggggattccg gcccaagaaa ctcagcttca agctcttcaa catccaagtt 960
aaagaggtca cgcagaacga tggcacgacg actattgcca ataaccttac cagcacggtt 1020
caagtgttta cggactcgga gtatcagctc ccgtacgtgc tcgggtcggc gcaccaaggc 1080
tgtctcccgc cgtttccagc ggacgtcttc atggtccctc agtatggata cctcaccctg 1140
aacaacggaa gtcaagcggt gggacgctca tccttttact gcctggagta cttcccttcg 1200
cagatgctaa ggactggaaa taacttccaa ttcagctata ccttcgagga tgtacctttt 1260
cacagcagct acgctcacag ccagagtttg gatcgcttga tgaatcctct tattgatcag 1320
tatctgtact acctgaacag aacgcaagga acaacctctg gaacaaccaa ccaatcacgg 1380
ctgcttttta gccaggctgg gcctcagtct atgtctttgc aggccagaaa ttggctacct 1440
gggccctgct accggcaaca gagactttca aagactgcta acgacaacaa caacagtaac 1500
tttccttgga cagcggccag caaatatcat ctcaatggcc gcgactcgct ggtgaatcca 1560
ggaccagcta tggccagtca caaggacgat gaagaaaaat ttttccctat gcacggcaat 1620
ctaatatttg gcaaagaagg gacaacggca agtaacgcag aattagataa tgtaatgatt 1680
acggatgaag aagagattcg taccaccaat cctgtggcaa cagagcagta tggaactgtg 1740
gcaaataact tgcagagctc aaatacagct cccacgacta gaactgtcaa tgatcagggg 1800
gccttacctg gcatggtgtg gcaagatcgt gacgtgtacc ttcaaggacc tatctgggca 1860
aagattcctc acacggatgg acactttcat ccttctcctc tgatgggagg ctttggactg 1920
aaacatccgc ctcctcaaat catgatcaaa aatactccgg taccggcaaa tcctccgacg 1980
actttcagcc cggccaagtt tgcttcattt atcactcagt actccactgg acaggtcagc 2040
gtggaaattg agtgggagct acagaaagaa aacagcaaac gttggaatcc agagattcag 2100
tacacttcca actacaacaa gtctgttaat gtggacttta ctgtagacac taatggtgtt 2160
tatagtgaac ctcgccctat tggaacccgg tatctcacac gaaacttg 2208
<210> 46
<211> 736
<212> PRT
<213> 人工序列
<220>
<223> 人工序列的描述:合成
的多肽
<400> 46
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Val Pro Gln Pro
20 25 30
Lys Ala Asn Gln Gln His Gln Asp Asn Arg Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Ile Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Asp Gln Ser Pro Gln Glu Pro Asp Ser Ser Ser Gly Val Gly
145 150 155 160
Lys Ser Gly Lys Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Leu Gly Glu Pro Pro
180 185 190
Ala Ala Pro Thr Ser Leu Gly Ser Asn Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Ser Gln Ser Asp Ala Ser Asn Asp Asn His Tyr
260 265 270
Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His
275 280 285
Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn Trp
290 295 300
Gly Phe Arg Pro Lys Lys Leu Ser Phe Lys Leu Phe Asn Ile Gln Val
305 310 315 320
Lys Glu Val Thr Gln Asn Asp Gly Thr Thr Thr Ile Ala Asn Asn Leu
325 330 335
Thr Ser Thr Val Gln Val Phe Thr Asp Ser Glu Tyr Gln Leu Pro Tyr
340 345 350
Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala Asp
355 360 365
Val Phe Met Val Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly Ser
370 375 380
Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser
385 390 395 400
Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Thr Phe Glu
405 410 415
Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp Arg
420 425 430
Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Asn Arg Thr
435 440 445
Gln Gly Thr Thr Ser Gly Thr Thr Asn Gln Ser Arg Leu Leu Phe Ser
450 455 460
Gln Ala Gly Pro Gln Ser Met Ser Leu Gln Ala Arg Asn Trp Leu Pro
465 470 475 480
Gly Pro Cys Tyr Arg Gln Gln Arg Leu Ser Lys Thr Ala Asn Asp Asn
485 490 495
Asn Asn Ser Asn Phe Pro Trp Thr Ala Ala Ser Lys Tyr His Leu Asn
500 505 510
Gly Arg Asp Ser Leu Val Asn Pro Gly Pro Ala Met Ala Ser His Lys
515 520 525
Asp Asp Glu Glu Lys Phe Phe Pro Met His Gly Asn Leu Ile Phe Gly
530 535 540
Lys Glu Gly Thr Thr Ala Ser Asn Ala Glu Leu Asp Asn Val Met Ile
545 550 555 560
Thr Asp Glu Glu Glu Ile Arg Thr Thr Asn Pro Val Ala Thr Glu Gln
565 570 575
Tyr Gly Thr Val Ala Asn Asn Leu Gln Ser Ser Asn Thr Ala Pro Thr
580 585 590
Thr Arg Thr Val Asn Asp Gln Gly Ala Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Leu
625 630 635 640
Lys His Pro Pro Pro Gln Ile Met Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asn Pro Pro Thr Thr Phe Ser Pro Ala Lys Phe Ala Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn
690 695 700
Tyr Asn Lys Ser Val Asn Val Asp Phe Thr Val Asp Thr Asn Gly Val
705 710 715 720
Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730 735
<210> 47
<211> 2208
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成
的多核苷酸
<400> 47
atggctgctg acggttatct tccagattgg ctcgaggaca acctttctga aggcattcgt 60
gagtggtggg ctctgaaacc tggagtccct caacccaaag cgaaccaaca acaccaggac 120
aaccgtcggg gtcttgtgct tccgggttac aaatacctcg gacccggtaa cggactcgac 180
aaaggagagc cggtcaacga ggcggacgcg gcagccctcg aacacgacaa agcttacgac 240
cagcagctca aggccggtga caacccgtac ctcaagtaca accacgccga cgccgagttt 300
caggagcgtc ttcaagaaga tacgtctttt gggggcaacc ttggcagagc agtcttccag 360
gccaaaaaga ggatccttga gcctcttggt ctggttgagg aagcagctaa aacggctcct 420
ggaaagaaga ggcctgtaga tcagtctcct caggaaccgg actcatcatc tggtgttggc 480
aaatcgggca aacagcctgc cagaaaaaga ctaaatttcg gtcagactgg cgactcagag 540
tcagtcccag accctcaacc tctcggagaa ccaccagcag cccccacaag tttgggatct 600
aatacaatgg cttcaggcgg tggcgcacca atggcagaca ataacgaggg tgccgatgga 660
gtgggtaatt cctcaggaaa ttggcattgc gattcccaat ggctgggcga cagagtcatc 720
accaccagca ccagaacctg ggccctgccc acttacaaca accatctcta caagcaaatc 780
tccagccaat cagatgcttc aaacgacaac cactactttg gctacagcac cccttggggg 840
tattttgact ttaacagatt ccactgccac ttctcaccac gtgactggca gcgactcatt 900
aacaacaact ggggattccg gcccaagaaa ctcagcttca agctcttcaa catccaagtt 960
aaagaggtca cgcagaacga tggcacgacg actattgcca ataaccttac cagcacggtt 1020
caagtgttta cggactcgga gtatcagctc ccgtacgtgc tcgggtcggc gcaccaaggc 1080
tgtctcccgc cgtttccagc ggacgtcttc atggtccctc agtatggata cctcaccctg 1140
aacaacggaa gtcaagcggt gggacgctca tccttttact gcctggagta cttcccttcg 1200
cagatgctaa ggactggaaa taacttccaa ttcagctata ccttcgagga tgtacctttt 1260
cacagcagct acgctcacag ccagagtttg gatcgcttga tgaatcctct tattgatcag 1320
tatctgtact acctgaacag aacgcaagga acaacctctg gaacaaccaa ccaatcacgg 1380
ctgcttttta gccaggctgg gcctcagtct atgtctttgc aggccagaaa ttggctacct 1440
gggccctgct accggcaaca gagactttca aaggtagcta acgacaacaa caacagtaac 1500
tttccttgga cagcggccag caaatatcat ctcaatggcc gcgactcgct ggtgaatcca 1560
ggaccagcta tggccagtca caaggacgat gaagaaaaat ttttccctat gcacggcaat 1620
ctaatatttg gcaaagaagg gacaacggca agtaacgcag aattagataa tgtaatgatt 1680
acggatgaag aagagattcg taccaccaat cctgtggcaa cagagcagta tggaactgtg 1740
gcaaataact tgcagagctc aaatacagct cccacgacta gaactgtcaa tgatcagggg 1800
gccttacctg gcatggtgtg gcaagatcgt gacgtgtacc ttcaaggacc tatctgggca 1860
aagattcctc acacggatgg acactttcat ccttctcctc tgatgggagg ctttggactg 1920
aaacatccgc ctcctcaaat catgatcaaa aatactccgg taccggcaaa tcctccgacg 1980
actttcgtac cggccaagtt tgcttcattt atcactcagt actccactgg acaggtcagc 2040
gtggaaattg agtgggagct acagaaagaa aacagcaaac gttggaatcc agagattcag 2100
tacacttcca actacaacaa gtctgttaat gtggacttta ctgtagacac taatggtgtt 2160
tatagtgaac ctcgccctat tggaacccgg tatctcacac gaaacttg 2208
<210> 48
<211> 736
<212> PRT
<213> 人工序列
<220>
<223> 人工序列的描述:合成
的多肽
<400> 48
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Val Pro Gln Pro
20 25 30
Lys Ala Asn Gln Gln His Gln Asp Asn Arg Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Ile Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Asp Gln Ser Pro Gln Glu Pro Asp Ser Ser Ser Gly Val Gly
145 150 155 160
Lys Ser Gly Lys Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Leu Gly Glu Pro Pro
180 185 190
Ala Ala Pro Thr Ser Leu Gly Ser Asn Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Ser Gln Ser Gly Ala Ser Asn Asp Asn His Tyr
260 265 270
Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His
275 280 285
Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn Trp
290 295 300
Gly Phe Arg Pro Lys Lys Leu Ser Phe Lys Leu Phe Asn Ile Gln Val
305 310 315 320
Lys Glu Val Thr Gln Asn Asp Gly Thr Thr Thr Ile Ala Asn Asn Leu
325 330 335
Thr Ser Thr Val Gln Val Phe Thr Asp Ser Glu Tyr Gln Leu Pro Tyr
340 345 350
Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala Asp
355 360 365
Val Phe Met Val Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly Ser
370 375 380
Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser
385 390 395 400
Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Thr Phe Glu
405 410 415
Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp Arg
420 425 430
Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Asn Arg Thr
435 440 445
Gln Gly Thr Thr Ser Gly Thr Thr Asn Gln Ser Arg Leu Leu Phe Ser
450 455 460
Gln Ala Gly Pro Gln Ser Met Ser Leu Gln Ala Arg Asn Trp Leu Pro
465 470 475 480
Gly Pro Cys Tyr Arg Gln Gln Arg Leu Ser Lys Val Ala Asn Asp Asn
485 490 495
Asn Asn Ser Asn Phe Pro Trp Thr Ala Ala Ser Lys Tyr His Leu Asn
500 505 510
Gly Arg Asp Ser Leu Val Asn Pro Gly Pro Ala Met Ala Ser His Lys
515 520 525
Asp Asp Glu Glu Lys Phe Phe Pro Met His Gly Asn Leu Ile Phe Gly
530 535 540
Lys Glu Gly Thr Thr Ala Ser Asn Ala Glu Leu Asp Asn Val Met Ile
545 550 555 560
Thr Asp Glu Glu Glu Ile Arg Thr Thr Asn Pro Val Ala Thr Glu Gln
565 570 575
Tyr Gly Thr Val Ala Asn Asn Leu Gln Ser Ser Asn Thr Ala Pro Thr
580 585 590
Thr Arg Thr Val Asn Asp Gln Gly Ala Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Leu
625 630 635 640
Lys His Pro Pro Pro Gln Ile Met Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asn Pro Pro Thr Thr Phe Val Pro Ala Lys Phe Ala Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn
690 695 700
Tyr Asn Lys Ser Val Asn Val Asp Phe Thr Val Asp Thr Asn Gly Val
705 710 715 720
Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730 735
<210> 49
<211> 2134
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成
的多核苷酸
<400> 49
gaaacctgga gtccctcaac ccaaagcgaa ccaacaacac caggacaacc gtcggggtct 60
tgtgcttccg ggttacaaat acctcggacc cggtaacgga ctcgacaaag gagagccggt 120
caacgaggcg gacgcggcag ccctcgaaca cgacaaagct tacgaccagc agctcaaggc 180
cggtgacaac ccgtacctca agtacaacca cgccgacgcc gagtttcagg agcgtcttca 240
agaagatacg tcttttgggg gcaaccttgg cagagcagtc ttccaggcca aaaagaggat 300
ccttgagcct cttggtctgg ttgaggaagc agctaaaacg gctcctggaa agaagaggcc 360
tgtagatcag tctcctcagg aaccggactc atcatctggt gttggcaaat cgggcaaaca 420
gcctgccaga aaaagactaa atttcggtca gactggcgac tcagagtcag tcccagaccc 480
tcaacctctc ggagaaccac cagcagcccc cacaagtttg ggatctaata caatggcttc 540
aggcggtggc gcaccaatgg cagacaataa cgagggtgcc gatggagtgg gtaattcctc 600
aggaaattgg cattgcgatt cccaatggct gggcgacaga gtcatcacca ccagcaccag 660
aacctgggcc ctgcccactt acaacaacca tctctacaag caaatctcca gccaatcagg 720
agcttcaaac gacaaccact actttggcta cagcacccct tgggggtatt ttgactttaa 780
cagattccac tgccacttct caccacgtga ctggcagcga ctcattaaca acaactgggg 840
attccggccc aagaaactca gcttcaagct cttcaacatc caagttaaag aggtcacgca 900
gaacgatggc acgacgacta ttgccaataa ccttaccagc acggttcaag tgtttacgga 960
ctcggagtat cagctcccgt acgtgctcgg gtcggcgcac caaggctgtc tcccgccgtt 1020
tccagcggac gtcttcatgg tccctcagta tggatacctc accctgaaca acggaagtca 1080
agcggtggga cgctcatcct tttactgcct ggagtacttc ccttcgcaga tgctaaggac 1140
tggaaataac ttccaattca gctatacctt cgaggatgta ccttttcaca gcagctacgc 1200
tcacagccag agtttggatc gcttgatgaa tcctcttatt gatcagtatc tgtactacct 1260
gaacagaacg caaggaacaa cctctggaac aaccaaccaa tcacggctgc tttttagcca 1320
ggctgggcct cagtctatgt ctttgcaggc cagaaattgg ctacctgggc cctgctaccg 1380
gcaacagaga ctttcaaaga ctgctaacga caacaacaac agtaactttc cttggacagc 1440
ggccagcaaa tatcatctca atggccgcga ctcgctggtg aatccaggac cagctatggc 1500
cagtcacaag gacgatgaag aaaaattttt ccctatgcac ggcaatctaa tatttggcaa 1560
agaagggaca acggcaagta acgcagaatt agataatgta atgattacgg atgaagaaga 1620
gattcgtacc accaatcctg tggcaacaga gcagtatgga actgtggcaa ataacttgca 1680
gagctcaaat acagctccca cgactagaac tgtcaatgat cagggggcct tacctggcat 1740
ggtgtggcaa gatcgtgacg tgtaccttca aggacctatc tgggcaaaga ttcctcacac 1800
ggatggacac tttcatcctt ctcctctgat gggaggcttt ggactgaaac atccgcctcc 1860
tcaaatcatg atcaaaaata ctccggtacc ggcaaatcct ccgacgactt tcagcccggc 1920
caagtttgct tcatttatca ctcagtactc cactggacag gtcagcgtgg aaattgagtg 1980
ggagctacag aaagaaaaca gcaaacgttg gaatccagag attcagtaca cttccaacta 2040
caacaagtct gttaatgtgg actttactgt agacactaat ggtgtttata gtgaacctcg 2100
ccctattgga acccggtatc tcacacgaaa cttg 2134
<210> 50
<211> 736
<212> PRT
<213> 人工序列
<220>
<223> 人工序列的描述:合成
的多肽
<400> 50
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Val Pro Gln Pro
20 25 30
Lys Ala Asn Gln Gln His Gln Asp Asn Arg Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Ile Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Asp Gln Ser Pro Gln Glu Pro Asp Ser Ser Ser Gly Val Gly
145 150 155 160
Lys Ser Gly Lys Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Leu Gly Glu Pro Pro
180 185 190
Ala Ala Pro Thr Ser Leu Gly Ser Asn Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Ser Gln Ser Asp Ala Ser Asn Asp Asn His Tyr
260 265 270
Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His
275 280 285
Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn Trp
290 295 300
Gly Phe Arg Pro Lys Lys Leu Ser Phe Lys Leu Phe Asn Ile Gln Val
305 310 315 320
Lys Glu Val Thr Gln Asn Asp Gly Thr Thr Thr Ile Ala Asn Asn Leu
325 330 335
Thr Ser Thr Val Gln Val Phe Thr Asp Ser Glu Tyr Gln Leu Pro Tyr
340 345 350
Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala Asp
355 360 365
Val Phe Met Val Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly Ser
370 375 380
Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser
385 390 395 400
Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Thr Phe Glu
405 410 415
Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp Arg
420 425 430
Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Asn Arg Thr
435 440 445
Gln Gly Thr Thr Ser Gly Thr Thr Asn Gln Ser Arg Leu Leu Phe Ser
450 455 460
Gln Ala Gly Pro Gln Ser Met Ser Leu Gln Ala Arg Asn Trp Leu Pro
465 470 475 480
Gly Pro Cys Tyr Arg Gln Gln Arg Leu Ser Lys Thr Ala Asn Asp Asn
485 490 495
Asn Asn Ser Asn Phe Pro Trp Thr Ala Ala Ser Lys Tyr His Leu Asn
500 505 510
Gly Arg Asp Ser Leu Val Asn Pro Gly Pro Ala Met Ala Ser His Lys
515 520 525
Asp Asp Glu Glu Lys Phe Phe Pro Met His Gly Asn Leu Ile Phe Gly
530 535 540
Lys Glu Gly Thr Ala Ala Ser Asn Ala Glu Leu Asp Asn Val Met Ile
545 550 555 560
Thr Asp Glu Glu Glu Ile Arg Thr Thr Asn Pro Val Ala Thr Glu Gln
565 570 575
Tyr Gly Thr Val Ala Asn Asn Leu Gln Ser Ser Asn Thr Ala Pro Thr
580 585 590
Thr Arg Thr Val Asn Asp Gln Gly Ala Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Leu
625 630 635 640
Lys His Pro Pro Pro Gln Ile Met Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asn Pro Pro Thr Thr Phe Ser Pro Ala Lys Phe Ala Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn
690 695 700
Tyr Asn Lys Ser Val Asn Val Asp Phe Thr Val Asp Thr Asn Gly Val
705 710 715 720
Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730 735
<210> 51
<211> 2208
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成
的多核苷酸
<400> 51
atggctgctg acggttatct tccagattgg ctcgaggaca acctttctga aggcattcgt 60
gagtggtggg ctctgaaacc tggagtccct caacccaaag cgaaccaaca acaccaggac 120
aaccgtcggg gtcttgtgct tccgggttac aaatacctcg gacccggtaa cggactcgac 180
aaaggagagc cggtcaacga ggcggacgcg gcagccctcg aacacgacaa agcttacgac 240
cagcagctca aggccggtga caacccgtac ctcaagtaca accacgccga cgccgagttt 300
caggagcgtc ttcaagaaga tacgtctttt gggggcaacc ttggcagagc agtcttccag 360
gccaaaaaga ggatccttga gcctcttggt ctggttgagg aagcagctaa aacggctcct 420
ggaaagaaga ggcctgtaga tcagtctcct caggaaccgg actcatcatc tggtgttggc 480
aaatcgggca aacagcctgc cagaaaaaga ctaaatttcg gtcagactgg cgactcagag 540
tcagtcccag accctcaacc tctcggagaa ccaccagcag cccccacaag tttgggatct 600
aatacaatgg cttcaggcgg tggcgcacca atggcagaca ataacgaggg tgccgatgga 660
gtgggtaatt cctcaggaaa ttggcattgc gattcccaat ggctgggcga cagagtcatc 720
accaccagca ccagaacctg ggccctgccc acttacaaca accatctcta caagcaaatc 780
tccagccaat caggagcttc aaacgacaac cactactttg gctacagcac cccttggggg 840
tattttgact ttaacagatt ccactgccac ttctcaccac gtgactggca gcgactcatt 900
aacaacaact ggggattccg gcccaagaaa ctcagcttca agctcttcaa catccaagtt 960
aaagaggtca cgcagaacga tggcacgacg actattgcca ataaccttac cagcacggtt 1020
caagtgttta cggactcgga gtatcagctc ccgtacgtgc tcgggtcggc gcaccaaggc 1080
tgtctcccgc cgtttccagc ggacgtcttc atggtccctc agtatggata cctcaccctg 1140
aacaacggaa gtcaagcggt gggacgctca tccttttact gcctggagta cttcccttcg 1200
cagatgctaa ggactggaaa taacttccaa ttcagctata ccttcgagga tgtacctttt 1260
cacagcagct acgctcacag ccagagtttg gatcgcttga tgaatcctct tattgatcag 1320
tatctgtact acctgaacag aacgcaagga acaacctctg gaacaaccaa ccaatcacgg 1380
ctgcttttta gccaggctgg gcctcagtct atgtctttgc aggccagaaa ttggctacct 1440
gggccctgct accggcaaca gagactttca aagactgcta acgacaacaa caacagtaac 1500
tttccttgga cagcggccag caaatatcat ctcaatggcc gcgactcgct ggtgaatcca 1560
ggaccagcta tggccagtca caaggacgat gaagaaaaat ttttccctat gcacggcaat 1620
ctaatatttg gcaaagaagg gacaacggca agtaacgcag aattagataa tgtaatgatt 1680
acggatgaag aagagattcg taccaccaat cctgtggcaa cagagcagta tggaactgtg 1740
gcaaataact tgcagagctc aaatacagct cccacgacta gaactgtcaa tgatcagggg 1800
gccttacctg gcatggtgtg gcaagatcgt gacgtgtacc ttcaaggacc tatctgggca 1860
aagattcctc acacggatgg acactttcat ccttctcctc tgatgggagg ctttggactg 1920
aaacatccgc ctcctcaaat catgatcaaa aatactccgg taccggcaaa tcctccgacg 1980
actttcagcc cggccaagtt tgcttcattt atcactcagt actccactgg acaggtcagc 2040
gtggaaattg agtgggagct acagaaagaa aacagcaaac gttggaatcc agagattcag 2100
tacacttcca actacaacaa gtctgttaat gtggacttta ctgtagacac taatggtgtt 2160
tatagtgaac ctcgccctat tggaacccgg tatctcacac gaaacttg 2208
<210> 52
<211> 736
<212> PRT
<213> 人工序列
<220>
<223> 人工序列的描述:合成
的多肽
<400> 52
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Val Pro Gln Pro
20 25 30
Lys Ala Asn Gln Gln His Gln Asp Asn Arg Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Ile Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Asp Gln Ser Pro Gln Glu Pro Asp Ser Ser Ser Gly Val Gly
145 150 155 160
Lys Ser Gly Lys Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Leu Gly Glu Pro Pro
180 185 190
Ala Ala Pro Thr Ser Leu Gly Ser Asn Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Ser Gln Ser Gly Ala Ser Asn Asp Asn His Tyr
260 265 270
Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His
275 280 285
Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn Trp
290 295 300
Gly Phe Arg Pro Lys Lys Leu Ser Phe Lys Leu Phe Asn Ile Gln Val
305 310 315 320
Lys Glu Val Thr Gln Asn Asp Gly Thr Thr Thr Ile Ala Asn Asn Leu
325 330 335
Thr Ser Thr Val Gln Val Phe Thr Asp Ser Glu Tyr Gln Leu Pro Tyr
340 345 350
Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala Asp
355 360 365
Val Phe Met Val Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly Ser
370 375 380
Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser
385 390 395 400
Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Thr Phe Glu
405 410 415
Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp Arg
420 425 430
Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Asn Arg Thr
435 440 445
Gln Gly Thr Thr Ser Gly Thr Thr Asn Gln Ser Arg Leu Leu Phe Ser
450 455 460
Gln Ala Gly Pro Gln Ser Met Ser Leu Gln Ala Arg Asn Trp Leu Pro
465 470 475 480
Gly Pro Cys Tyr Arg Gln Gln Arg Leu Ser Lys Thr Ala Asn Asp Asn
485 490 495
Asn Asn Ser Asn Phe Pro Trp Thr Ala Ala Ser Lys Tyr His Leu Asn
500 505 510
Gly Arg Asp Ser Leu Val Asn Pro Gly Pro Ala Met Ala Ser His Lys
515 520 525
Asp Asp Glu Glu Lys Phe Phe Pro Met His Gly Asn Leu Ile Phe Gly
530 535 540
Lys Glu Gly Thr Ala Ala Ser Asn Ala Glu Leu Asp Asn Val Met Ile
545 550 555 560
Thr Asp Glu Glu Glu Ile Arg Thr Thr Asn Pro Val Ala Thr Glu Gln
565 570 575
Tyr Gly Thr Val Ala Asn Asn Leu Gln Ser Ser Asn Thr Ala Pro Thr
580 585 590
Thr Arg Thr Val Asn Asp Gln Gly Ala Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Leu
625 630 635 640
Lys His Pro Pro Pro Gln Ile Met Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asn Pro Pro Thr Thr Phe Ser Pro Ala Lys Phe Ala Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn
690 695 700
Tyr Asn Lys Ser Val Asn Val Asp Phe Thr Val Asp Thr Asn Gly Val
705 710 715 720
Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730 735
<210> 53
<211> 2208
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成
的多核苷酸
<400> 53
atggctgctg acggttatct tccagattgg ctcgaggaca acctttctga aggcattcgt 60
gagtggtggg ctctgaaacc tggagtccct caacccaaag cgaaccaaca acaccaggac 120
aaccgtcggg gtcttgtgct tccgggttac aaatacctcg gacccggtaa cggactcgac 180
aaaggagagc cggtcaacga ggcggacgcg gcagccctcg aacacgacaa agcttacgac 240
cagcagctca aggccggtga caacccgtac ctcaagtaca accacgccga cgccgagttt 300
caggagcgtc ttcaagaaga tacgtctttt gggggcaacc ttggcagagc agtcttccag 360
gccaaaaaga ggatccttga gcctcttggt ctggttgagg aagcagctaa aacggctcct 420
ggaaagaaga ggcctgtaga tcagtctcct caggaaccgg actcatcatc tggtgttggc 480
aaatcgggca aacagcctgc cagaaaaaga ctaaatttcg gtcagactgg cgactcagag 540
tcagtcccag accctcaacc tctcggagaa ccaccagcag cccccacaag tttgggatct 600
aatacaatgg cttcaggcgg tggcgcacca atggcagaca ataacgaggg tgccgatgga 660
gtgggtaatt cctcaggaaa ttggcattgc gattcccaat ggctgggcga cagagtcatc 720
accaccagca ccagaacctg ggccctgccc acttacaaca accatctcta caagcaaatc 780
tccagccaat caggagcttc aaacgacaac cactactttg gctacagcac cccttggggg 840
tattttgact ttaacagatt ccactgccac ttctcaccac gtgactggca gcgactcatt 900
aacaacaact ggggattccg gcccaagaaa ctcagcttca agctcttcaa catccaagtt 960
aaagaggtca cgcagaacga tggcacgacg actattgcca ataaccttac cagcacggtt 1020
caagtgttta cggactcgga gtatcagctc ccgtacgtgc tcgggtcggc gcaccaaggc 1080
tgtctcccgc cgtttccagc ggacgtcttc atggtccctc agtatggata cctcaccctg 1140
aacaacggaa gtcaagcggt gggacgctca tccttttact gcctggagta cttcccttcg 1200
cagatgctaa ggactggaaa taacttccaa ttcagctata ccttcgagga tgtacctttt 1260
cacagcagct acgctcacag ccagagtttg gatcgcttga tgaatcctct tattgatcag 1320
tatctgtact acctgaacag aacgcaagga acaacctctg gaacaaccaa ccaatcacgg 1380
ctgcttttta gccaggctgg gcctcagtct atgtctttgc aggccagaaa ttggctacct 1440
gggccctgct accggcaaca gagactttca aagactgcta acgacaacaa caacagtaac 1500
tttccttgga cagcggccag caaatatcat ctcaatggcc gcgactcgct ggtgaatcca 1560
ggaccagcta tggccagtca caaggacgat gaagaaaaat ttttccctat gcacggcaat 1620
ctaatatttg gcaaagaagg gacaacggca agtaacgcag aattagataa tgtaatgatt 1680
acggatgaag aagagattcg taccaccaat cctgtggcaa cagagcagta tggaactgtg 1740
gcaaataact tgcagagctc aaatacagct cccacgacta gaactgtcaa tgatcagggg 1800
gccttacctg gcatggtgtg gcaagatcgt gacgtgtacc ttcaaggacc tatctgggca 1860
aagattcctc acacggatgg acactttcat ccttctcctc tgatgggagg ctttggactg 1920
aaacatccgc ctcctcaaat catgatcaaa aatactccgg taccggcaaa tcctccgacg 1980
actttcagcc cggccaagtt tgcttcattt atcactcagt actccactgg acaggtcagc 2040
gtggaaattg agtgggagct acagaaagaa aacagcaaac gttggaatcc agagattcag 2100
tacacttcca actacaacaa gtctgttaat gtggacttta ctgtagacac taatggtgtt 2160
tatagtgaac ctcgccctat tggaacccgg tatctcacac gaaacttg 2208
<210> 54
<211> 736
<212> PRT
<213> 人工序列
<220>
<223> 人工序列的描述:合成
的多肽
<400> 54
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Val Pro Gln Pro
20 25 30
Lys Ala Asn Gln Gln His Gln Asp Asn Arg Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Ile Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Asp Gln Ser Pro Gln Glu Pro Asp Ser Ser Ser Gly Val Gly
145 150 155 160
Lys Ser Gly Lys Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Leu Gly Glu Pro Pro
180 185 190
Ala Ala Pro Thr Ser Leu Gly Ser Asn Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Ser Tyr Ser Gly Ala Ser Asn Asp Asn His Tyr
260 265 270
Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His
275 280 285
Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn Trp
290 295 300
Gly Phe Arg Pro Lys Lys Leu Ser Phe Lys Leu Phe Asn Ile Gln Val
305 310 315 320
Lys Glu Val Thr Gln Asn Asp Gly Thr Thr Thr Ile Ala Asn Asn Leu
325 330 335
Thr Ser Thr Val Gln Val Phe Thr Asp Ser Glu Tyr Gln Leu Pro Tyr
340 345 350
Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala Asp
355 360 365
Val Phe Met Val Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly Ser
370 375 380
Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser
385 390 395 400
Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Thr Phe Glu
405 410 415
Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp Arg
420 425 430
Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Asn Arg Thr
435 440 445
Gln Gly Thr Thr Ser Gly Thr Thr Asn Gln Ser Arg Leu Leu Phe Ser
450 455 460
Gln Ala Gly Pro Gln Ser Met Ser Leu Gln Ala Arg Asn Trp Leu Pro
465 470 475 480
Gly Pro Cys Tyr Arg Gln Gln Arg Leu Ser Lys Thr Ala Asn Asp Asn
485 490 495
Asn Asn Ser Asn Phe Pro Trp Thr Ala Ala Ser Lys Tyr His Leu Asn
500 505 510
Gly Arg Asp Ser Leu Val Asn Pro Gly Pro Ala Met Ala Ser His Lys
515 520 525
Asp Asp Glu Glu Lys Phe Phe Pro Met His Gly Asn Leu Ile Phe Gly
530 535 540
Lys Glu Gly Thr Thr Ala Ser Asn Ala Glu Leu Asp Asn Val Met Ile
545 550 555 560
Thr Asp Glu Glu Glu Ile Arg Thr Thr Asn Pro Val Ala Thr Glu Gln
565 570 575
Tyr Gly Thr Val Ala Asn Asn Leu Gln Ser Ser Asn Thr Ala Pro Thr
580 585 590
Thr Arg Thr Val Asn Asp Gln Gly Ala Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Leu
625 630 635 640
Lys His Pro Pro Pro Gln Ile Met Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asn Pro Pro Thr Thr Phe Ser Pro Ala Lys Phe Ala Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn
690 695 700
Tyr Asn Lys Ser Val Asn Val Asp Phe Thr Val Asp Thr Asn Gly Val
705 710 715 720
Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730 735
<210> 55
<211> 2859
<212> DNA
<213> 智人(Homo sapiens)
<400> 55
atgggagtga ggcacccgcc ctgctcccac cggctcctgg ccgtctgcgc cctcgtgtcc 60
ttggcaaccg ctgcactcct ggggcacatc ctactccatg atttcctgct ggttccccga 120
gagctgagtg gctcctcccc agtcctggag gagactcacc cagctcacca gcagggagcc 180
agcagaccag ggccccggga tgcccaggca caccccggcc gtcccagagc agtgcccaca 240
cagtgcgacg tcccccccaa cagccgcttc gattgcgccc ctgacaaggc catcacccag 300
gaacagtgcg aggcccgcgg ctgctgctac atccctgcaa agcaggggct gcagggagcc 360
cagatggggc agccctggtg cttcttccca cccagctacc ccagctacaa gctggagaac 420
ctgagctcct ctgaaatggg ctacacggcc accctgaccc gtaccacccc caccttcttc 480
cccaaggaca tcctgaccct gcggctggac gtgatgatgg agactgagaa ccgcctccac 540
ttcacgatca aagatccagc taacaggcgc tacgaggtgc ccttggagac cccgcgtgtc 600
cacagccggg caccgtcccc actctacagc gtggagttct ccgaggagcc cttcggggtg 660
atcgtgcacc ggcagctgga cggccgcgtg ctgctgaaca cgacggtggc gcccctgttc 720
tttgcggacc agttccttca gctgtccacc tcgctgccct cgcagtatat cacaggcctc 780
gccgagcacc tcagtcccct gatgctcagc accagctgga ccaggatcac cctgtggaac 840
cgggaccttg cgcccacgcc cggtgcgaac ctctacgggt ctcacccttt ctacctggcg 900
ctggaggacg gcgggtcggc acacggggtg ttcctgctaa acagcaatgc catggatgtg 960
gtcctgcagc cgagccctgc ccttagctgg aggtcgacag gtgggatcct ggatgtctac 1020
atcttcctgg gcccagagcc caagagcgtg gtgcagcagt acctggacgt tgtgggatac 1080
ccgttcatgc cgccatactg gggcctgggc ttccacctgt gccgctgggg ctactcctcc 1140
accgctatca cccgccaggt ggtggagaac atgaccaggg cccacttccc cctggacgtc 1200
caatggaacg acctggacta catggactcc cggagggact tcacgttcaa caaggatggc 1260
ttccgggact tcccggccat ggtgcaggag ctgcaccagg gcggccggcg ctacatgatg 1320
atcgtggatc ctgccatcag cagctcgggc cctgccggga gctacaggcc ctacgacgag 1380
ggtctgcgga ggggggtttt catcaccaac gagaccggcc agccgctgat tgggaaggta 1440
tggcccgggt ccactgcctt ccccgacttc accaacccca cagccctggc ctggtgggag 1500
gacatggtgg ctgagttcca tgaccaggtg cccttcgacg gcatgtggat tgacatgaac 1560
gagccttcca acttcatcag aggctctgag gacggctgcc ccaacaatga gctggagaac 1620
ccaccctacg tgcctggggt ggttgggggg accctccagg cggccaccat ctgtgcctcc 1680
agccaccagt ttctctccac acactacaac ctgcacaacc tctacggcct gaccgaagcc 1740
atcgcctccc acagggcgct ggtgaaggct cgggggacac gcccatttgt gatctcccgc 1800
tcgacctttg ctggccacgg ccgatacgcc ggccactgga cgggggacgt gtggagctcc 1860
tgggagcagc tcgcctcctc cgtgccagaa atcctgcagt ttaacctgct gggggtgcct 1920
ctggtcgggg ccgacgtctg cggcttcctg ggcaacacct cagaggagct gtgtgtgcgc 1980
tggacccagc tgggggcctt ctaccccttc atgcggaacc acaacagcct gctcagtctg 2040
ccccaggagc cgtacagctt cagcgagccg gcccagcagg ccatgaggaa ggccctcacc 2100
ctgcgctacg cactcctccc ccacctctac acactgttcc accaggccca cgtcgcgggg 2160
gagaccgtgg cccggcccct cttcctggag ttccccaagg actctagcac ctggactgtg 2220
gaccaccagc tcctgtgggg ggaggccctg ctcatcaccc cagtgctcca ggccgggaag 2280
gccgaagtga ctggctactt ccccttgggc acatggtacg acctgcagac ggtgccaata 2340
gaggcccttg gcagcctccc acccccacct gcagctcccc gtgagccagc catccacagc 2400
gaggggcagt gggtgacgct gccggccccc ctggacacca tcaacgtcca cctccgggct 2460
gggtacatca tccccctgca gggccctggc ctcacaacca cagagtcccg ccagcagccc 2520
atggccctgg ctgtggccct gaccaagggt ggagaggccc gaggggagct gttctgggac 2580
gatggagaga gcctggaagt gctggagcga ggggcctaca cacaggtcat cttcctggcc 2640
aggaataaca cgatcgtgaa tgagctggta cgtgtgacca gtgagggagc tggcctgcag 2700
ctgcagaagg tgactgtcct gggcgtggcc acggcgcccc agcaggtcct ctccaacggt 2760
gtccctgtct ccaacttcac ctacagcccc gacaccaagg tcctggacat ctgtgtctcg 2820
ctgttgatgg gagagcagtt tctcgtcagc tggtgttag 2859
<210> 56
<211> 2652
<212> DNA
<213> 智人(Homo sapiens)
<400> 56
gcacaccccg gccgtcccag agcagtgccc acacagtgcg acgtcccccc caacagccgc 60
ttcgattgcg cccctgacaa ggccatcacc caggaacagt gcgaggcccg cggctgctgc 120
tacatccctg caaagcaggg gctgcaggga gcccagatgg ggcagccctg gtgcttcttc 180
ccacccagct accccagcta caagctggag aacctgagct cctctgaaat gggctacacg 240
gccaccctga cccgtaccac ccccaccttc ttccccaagg acatcctgac cctgcggctg 300
gacgtgatga tggagactga gaaccgcctc cacttcacga tcaaagatcc agctaacagg 360
cgctacgagg tgcccttgga gaccccgcgt gtccacagcc gggcaccgtc cccactctac 420
agcgtggagt tctccgagga gcccttcggg gtgatcgtgc accggcagct ggacggccgc 480
gtgctgctga acacgacggt ggcgcccctg ttctttgcgg accagttcct tcagctgtcc 540
acctcgctgc cctcgcagta tatcacaggc ctcgccgagc acctcagtcc cctgatgctc 600
agcaccagct ggaccaggat caccctgtgg aaccgggacc ttgcgcccac gcccggtgcg 660
aacctctacg ggtctcaccc tttctacctg gcgctggagg acggcgggtc ggcacacggg 720
gtgttcctgc taaacagcaa tgccatggat gtggtcctgc agccgagccc tgcccttagc 780
tggaggtcga caggtgggat cctggatgtc tacatcttcc tgggcccaga gcccaagagc 840
gtggtgcagc agtacctgga cgttgtggga tacccgttca tgccgccata ctggggcctg 900
ggcttccacc tgtgccgctg gggctactcc tccaccgcta tcacccgcca ggtggtggag 960
aacatgacca gggcccactt ccccctggac gtccaatgga acgacctgga ctacatggac 1020
tcccggaggg acttcacgtt caacaaggat ggcttccggg acttcccggc catggtgcag 1080
gagctgcacc agggcggccg gcgctacatg atgatcgtgg atcctgccat cagcagctcg 1140
ggccctgccg ggagctacag gccctacgac gagggtctgc ggaggggggt tttcatcacc 1200
aacgagaccg gccagccgct gattgggaag gtatggcccg ggtccactgc cttccccgac 1260
ttcaccaacc ccacagccct ggcctggtgg gaggacatgg tggctgagtt ccatgaccag 1320
gtgcccttcg acggcatgtg gattgacatg aacgagcctt ccaacttcat cagaggctct 1380
gaggacggct gccccaacaa tgagctggag aacccaccct acgtgcctgg ggtggttggg 1440
gggaccctcc aggcggccac catctgtgcc tccagccacc agtttctctc cacacactac 1500
aacctgcaca acctctacgg cctgaccgaa gccatcgcct cccacagggc gctggtgaag 1560
gctcggggga cacgcccatt tgtgatctcc cgctcgacct ttgctggcca cggccgatac 1620
gccggccact ggacggggga cgtgtggagc tcctgggagc agctcgcctc ctccgtgcca 1680
gaaatcctgc agtttaacct gctgggggtg cctctggtcg gggccgacgt ctgcggcttc 1740
ctgggcaaca cctcagagga gctgtgtgtg cgctggaccc agctgggggc cttctacccc 1800
ttcatgcgga accacaacag cctgctcagt ctgccccagg agccgtacag cttcagcgag 1860
ccggcccagc aggccatgag gaaggccctc accctgcgct acgcactcct cccccacctc 1920
tacacactgt tccaccaggc ccacgtcgcg ggggagaccg tggcccggcc cctcttcctg 1980
gagttcccca aggactctag cacctggact gtggaccacc agctcctgtg gggggaggcc 2040
ctgctcatca ccccagtgct ccaggccggg aaggccgaag tgactggcta cttccccttg 2100
ggcacatggt acgacctgca gacggtgcca atagaggccc ttggcagcct cccaccccca 2160
cctgcagctc cccgtgagcc agccatccac agcgaggggc agtgggtgac gctgccggcc 2220
cccctggaca ccatcaacgt ccacctccgg gctgggtaca tcatccccct gcagggccct 2280
ggcctcacaa ccacagagtc ccgccagcag cccatggccc tggctgtggc cctgaccaag 2340
ggtggagagg cccgagggga gctgttctgg gacgatggag agagcctgga agtgctggag 2400
cgaggggcct acacacaggt catcttcctg gccaggaata acacgatcgt gaatgagctg 2460
gtacgtgtga ccagtgaggg agctggcctg cagctgcaga aggtgactgt cctgggcgtg 2520
gccacggcgc cccagcaggt cctctccaac ggtgtccctg tctccaactt cacctacagc 2580
cccgacacca aggtcctgga catctgtgtc tcgctgttga tgggagagca gtttctcgtc 2640
agctggtgtt ag 2652
<210> 57
<211> 4573
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成
的多核苷酸
<400> 57
ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 60
cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag agagggagtg 120
gccaactcca tcactagggg ttcctgagtt taaacttcgt cgacgattcg agcttgggct 180
gcaggtcgag ggcactggga ggatgttgag taagatggaa aactactgat gacccttgca 240
gagacagagt attaggacat gtttgaacag gggccgggcg atcagcaggt agctctagag 300
gatccccgtc tgtctgcaca tttcgtagag cgagtgttcc gatactctaa tctccctagg 360
caaggttcat atttgtgtag gttacttatt ctccttttgt tgactaagtc aataatcaga 420
atcagcaggt ttggagtcag cttggcaggg atcagcagcc tgggttggaa ggagggggta 480
taaaagcccc ttcaccagga gaagccgtca cacagactag ccctaaggta agttggcgcc 540
gtttaaggga tggttggttg gtggggtatt aatgtttaat tacctttttt acaggcctga 600
actaggcgcg ccaccgccac catgccgtct tctgtctcgt ggggcatcct cctgctggca 660
ggcctgtgct gcctggtccc tgtctccctg gctgcttacc gccccagtga gaccctgtgc 720
ggcggggagc tggtggacac cctccagttc gtctgtgggg accgcggctt ctacttcagc 780
aggcccgcaa gccgtgtgag ccgtcgcagc cgtggcatca tggaggagtg ctgtttccgc 840
agctgtgacc tggccctcct ggagacgtac tgtgctaccc ccgccaagtc cgagggcgcg 900
ccggcacacc ccggccgtcc cagagcagtg cccacacagt gcgacgtccc ccccaacagc 960
cgcttcgatt gcgcccctga caaggccatc acccaggaac agtgcgaggc ccgcggctgc 1020
tgctacatcc ctgcaaagca ggggctgcag ggagcccaga tggggcagcc ctggtgcttc 1080
ttcccaccca gctaccccag ctacaagctg gagaacctga gctcctctga aatgggctac 1140
acggccaccc tgacccgtac cacccccacc ttcttcccca aggacatcct gaccctgcgg 1200
ctggacgtga tgatggagac tgagaaccgc ctccacttca cgatcaaaga tccagctaac 1260
aggcgctacg aggtgccctt ggagaccccg cgtgtccaca gccgggcacc gtccccactc 1320
tacagcgtgg agttctccga ggagcccttc ggggtgatcg tgcaccggca gctggacggc 1380
cgcgtgctgc tgaacacgac ggtggcgccc ctgttctttg cggaccagtt ccttcagctg 1440
tccacctcgc tgccctcgca gtatatcaca ggcctcgccg agcacctcag tcccctgatg 1500
ctcagcacca gctggaccag gatcaccctg tggaaccggg accttgcgcc cacgcccggt 1560
gcgaacctct acgggtctca ccctttctac ctggcgctgg aggacggcgg gtcggcacac 1620
ggggtgttcc tgctaaacag caatgccatg gatgtggtcc tgcagccgag ccctgccctt 1680
agctggaggt cgacaggtgg gatcctggat gtctacatct tcctgggccc agagcccaag 1740
agcgtggtgc agcagtacct ggacgttgtg ggatacccgt tcatgccgcc atactggggc 1800
ctgggcttcc acctgtgccg ctggggctac tcctccaccg ctatcacccg ccaggtggtg 1860
gagaacatga ccagggccca cttccccctg gacgtccaat ggaacgacct ggactacatg 1920
gactcccgga gggacttcac gttcaacaag gatggcttcc gggacttccc ggccatggtg 1980
caggagctgc accagggcgg ccggcgctac atgatgatcg tggatcctgc catcagcagc 2040
tcgggccctg ccgggagcta caggccctac gacgagggtc tgcggagggg ggttttcatc 2100
accaacgaga ccggccagcc gctgattggg aaggtatggc ccgggtccac tgccttcccc 2160
gacttcacca accccacagc cctggcctgg tgggaggaca tggtggctga gttccatgac 2220
caggtgccct tcgacggcat gtggattgac atgaacgagc cttccaactt catcagaggc 2280
tctgaggacg gctgccccaa caatgagctg gagaacccac cctacgtgcc tggggtggtt 2340
ggggggaccc tccaggcggc caccatctgt gcctccagcc accagtttct ctccacacac 2400
tacaacctgc acaacctcta cggcctgacc gaagccatcg cctcccacag ggcgctggtg 2460
aaggctcggg ggacacgccc atttgtgatc tcccgctcga cctttgctgg ccacggccga 2520
tacgccggcc actggacggg ggacgtgtgg agctcctggg agcagctcgc ctcctccgtg 2580
ccagaaatcc tgcagtttaa cctgctgggg gtgcctctgg tcggggccga cgtctgcggc 2640
ttcctgggca acacctcaga ggagctgtgt gtgcgctgga cccagctggg ggccttctac 2700
cccttcatgc ggaaccacaa cagcctgctc agtctgcccc aggagccgta cagcttcagc 2760
gagccggccc agcaggccat gaggaaggcc ctcaccctgc gctacgcact cctcccccac 2820
ctctacacac tgttccacca ggcccacgtc gcgggggaga ccgtggcccg gcccctcttc 2880
ctggagttcc ccaaggactc tagcacctgg actgtggacc accagctcct gtggggggag 2940
gccctgctca tcaccccagt gctccaggcc gggaaggccg aagtgactgg ctacttcccc 3000
ttgggcacat ggtacgacct gcagacggtg ccaatagagg cccttggcag cctcccaccc 3060
ccacctgcag ctccccgtga gccagccatc cacagcgagg ggcagtgggt gacgctgccg 3120
gcccccctgg acaccatcaa cgtccacctc cgggctgggt acatcatccc cctgcagggc 3180
cctggcctca caaccacaga gtcccgccag cagcccatgg ccctggctgt ggccctgacc 3240
aagggtggag aggcccgagg ggagctgttc tgggacgatg gagagagcct ggaagtgctg 3300
gagcgagggg cctacacaca ggtcatcttc ctggccagga ataacacgat cgtgaatgag 3360
ctggtacgtg tgaccagtga gggagctggc ctgcagctgc agaaggtgac tgtcctgggc 3420
gtggccacgg cgccccagca ggtcctctcc aacggtgtcc ctgtctccaa cttcacctac 3480
agccccgaca ccaaggtcct ggacatctgt gtctcgctgt tgatgggaga gcagtttctc 3540
gtcagctggt gttagcgagc ggccgctctt agtagcagta tcgatcccag cccacttttc 3600
cccaatacga ctacgagatc tgtggcttct agctgcccgg gtggcatccc tgtgacccct 3660
ccccagtgcc tctcctggcc ctggaagttg ccactccagt gcccaccagc cttgtcctaa 3720
taaaattaag ttgcatcatt ttgtctgact aggtgtcctt ctataatatt atggggtgga 3780
ggggggtggt atggagcaag gggcaagttg ggaaggccga cccgcgaata gtagatcccg 3840
cgagggcttg aatctatcac ctagagtaca ccctagagaa tagctagctc tcaatgacta 3900
aggactaaac ttggtatttc gactgaagcc tgtcccctca ctgttggcgc taggaggaga 3960
gttcgtagaa aggatagtac gatttaagta tctctaagcc ttgtgaagca ctaaggttgc 4020
gtacagacgt gcttgaatta cggataattc gggaaccttg ggacacacaa aaaaccaaca 4080
cacagatcta atgaaaataa agatctttta tttaggcgcc tctgacttcc tggggattga 4140
cctgagttct actctagcgt ttgctggttc ggtgaactaa tctgtgagat ccccaactct 4200
ccgtttggga tctccactct ctggtgtcct aaccttggtg ccccactgtc tactgctagt 4260
gagaccttac gcgctgagaa acgtggcgtt actctaacta agcgacgcgc acttgcactc 4320
tgaatacttc taccgtaact aaccccggac ctcagaactc agacggatct acgctgtcca 4380
tcaacaccag acttagatta cctctgttaa gtttaattaa gctcgcgaag gaacccctag 4440
tgatggagtt ggccactccc tctctgcgcg ctcgctcgct cactgaggcc gggcgaccaa 4500
aggtcgcccg acgcccgggc tttgcccggg cggcctcagt gagcgagcga gcgcgcagag 4560
agggagtggc caa 4573
<210> 58
<211> 4597
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成
的多核苷酸
<400> 58
ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 60
cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag agagggagtg 120
gccaactcca tcactagggg ttcctgagtt taaacttcgt cgacgattcg agcttgggct 180
gcaggtcgag ggcactggga ggatgttgag taagatggaa aactactgat gacccttgca 240
gagacagagt attaggacat gtttgaacag gggccgggcg atcagcaggt agctctagag 300
gatccccgtc tgtctgcaca tttcgtagag cgagtgttcc gatactctaa tctccctagg 360
caaggttcat atttgtgtag gttacttatt ctccttttgt tgactaagtc aataatcaga 420
atcagcaggt ttggagtcag cttggcaggg atcagcagcc tgggttggaa ggagggggta 480
taaaagcccc ttcaccagga gaagccgtca cacagactag ccctaaggta agttggcgcc 540
gtttaaggga tggttggttg gtggggtatt aatgtttaat tacctttttt acaggcctga 600
actaggcgcg ccaccgccac catgctcagg ggtccgggac ccgggcggct gctgctgcta 660
gcagtcctgt gcctggggac atcggtgcgc tgcaccgaaa ccgggaagag caagagggct 720
taccgcccca gtgagaccct gtgcggcggg gagctggtgg acaccctcca gttcgtctgt 780
ggggaccgcg gcttctactt cagcaggccc gcaagccgtg tgagccgtcg cagccgtggc 840
atcatggagg agtgctgttt ccgcagctgt gacctggccc tcctggagac gtactgtgct 900
acccccgcca agtccgaggg cgcgccggca caccccggcc gtcccagagc agtgcccaca 960
cagtgcgacg tcccccccaa cagccgcttc gattgcgccc ctgacaaggc catcacccag 1020
gaacagtgcg aggcccgcgg ctgctgctac atccctgcaa agcaggggct gcagggagcc 1080
cagatggggc agccctggtg cttcttccca cccagctacc ccagctacaa gctggagaac 1140
ctgagctcct ctgaaatggg ctacacggcc accctgaccc gtaccacccc caccttcttc 1200
cccaaggaca tcctgaccct gcggctggac gtgatgatgg agactgagaa ccgcctccac 1260
ttcacgatca aagatccagc taacaggcgc tacgaggtgc ccttggagac cccgcgtgtc 1320
cacagccggg caccgtcccc actctacagc gtggagttct ccgaggagcc cttcggggtg 1380
atcgtgcacc ggcagctgga cggccgcgtg ctgctgaaca cgacggtggc gcccctgttc 1440
tttgcggacc agttccttca gctgtccacc tcgctgccct cgcagtatat cacaggcctc 1500
gccgagcacc tcagtcccct gatgctcagc accagctgga ccaggatcac cctgtggaac 1560
cgggaccttg cgcccacgcc cggtgcgaac ctctacgggt ctcacccttt ctacctggcg 1620
ctggaggacg gcgggtcggc acacggggtg ttcctgctaa acagcaatgc catggatgtg 1680
gtcctgcagc cgagccctgc ccttagctgg aggtcgacag gtgggatcct ggatgtctac 1740
atcttcctgg gcccagagcc caagagcgtg gtgcagcagt acctggacgt tgtgggatac 1800
ccgttcatgc cgccatactg gggcctgggc ttccacctgt gccgctgggg ctactcctcc 1860
accgctatca cccgccaggt ggtggagaac atgaccaggg cccacttccc cctggacgtc 1920
caatggaacg acctggacta catggactcc cggagggact tcacgttcaa caaggatggc 1980
ttccgggact tcccggccat ggtgcaggag ctgcaccagg gcggccggcg ctacatgatg 2040
atcgtggatc ctgccatcag cagctcgggc cctgccggga gctacaggcc ctacgacgag 2100
ggtctgcgga ggggggtttt catcaccaac gagaccggcc agccgctgat tgggaaggta 2160
tggcccgggt ccactgcctt ccccgacttc accaacccca cagccctggc ctggtgggag 2220
gacatggtgg ctgagttcca tgaccaggtg cccttcgacg gcatgtggat tgacatgaac 2280
gagccttcca acttcatcag aggctctgag gacggctgcc ccaacaatga gctggagaac 2340
ccaccctacg tgcctggggt ggttgggggg accctccagg cggccaccat ctgtgcctcc 2400
agccaccagt ttctctccac acactacaac ctgcacaacc tctacggcct gaccgaagcc 2460
atcgcctccc acagggcgct ggtgaaggct cgggggacac gcccatttgt gatctcccgc 2520
tcgacctttg ctggccacgg ccgatacgcc ggccactgga cgggggacgt gtggagctcc 2580
tgggagcagc tcgcctcctc cgtgccagaa atcctgcagt ttaacctgct gggggtgcct 2640
ctggtcgggg ccgacgtctg cggcttcctg ggcaacacct cagaggagct gtgtgtgcgc 2700
tggacccagc tgggggcctt ctaccccttc atgcggaacc acaacagcct gctcagtctg 2760
ccccaggagc cgtacagctt cagcgagccg gcccagcagg ccatgaggaa ggccctcacc 2820
ctgcgctacg cactcctccc ccacctctac acactgttcc accaggccca cgtcgcgggg 2880
gagaccgtgg cccggcccct cttcctggag ttccccaagg actctagcac ctggactgtg 2940
gaccaccagc tcctgtgggg ggaggccctg ctcatcaccc cagtgctcca ggccgggaag 3000
gccgaagtga ctggctactt ccccttgggc acatggtacg acctgcagac ggtgccaata 3060
gaggcccttg gcagcctccc acccccacct gcagctcccc gtgagccagc catccacagc 3120
gaggggcagt gggtgacgct gccggccccc ctggacacca tcaacgtcca cctccgggct 3180
gggtacatca tccccctgca gggccctggc ctcacaacca cagagtcccg ccagcagccc 3240
atggccctgg ctgtggccct gaccaagggt ggagaggccc gaggggagct gttctgggac 3300
gatggagaga gcctggaagt gctggagcga ggggcctaca cacaggtcat cttcctggcc 3360
aggaataaca cgatcgtgaa tgagctggta cgtgtgacca gtgagggagc tggcctgcag 3420
ctgcagaagg tgactgtcct gggcgtggcc acggcgcccc agcaggtcct ctccaacggt 3480
gtccctgtct ccaacttcac ctacagcccc gacaccaagg tcctggacat ctgtgtctcg 3540
ctgttgatgg gagagcagtt tctcgtcagc tggtgttagc gagcggccgc tcttagtagc 3600
agtatcgatc ccagcccact tttccccaat acgactacga gatctgtggc ttctagctgc 3660
ccgggtggca tccctgtgac ccctccccag tgcctctcct ggccctggaa gttgccactc 3720
cagtgcccac cagccttgtc ctaataaaat taagttgcat cattttgtct gactaggtgt 3780
ccttctataa tattatgggg tggagggggg tggtatggag caaggggcaa gttgggaagg 3840
ccgacccgcg aatagtagat cccgcgaggg cttgaatcta tcacctagag tacaccctag 3900
agaatagcta gctctcaatg actaaggact aaacttggta tttcgactga agcctgtccc 3960
ctcactgttg gcgctaggag gagagttcgt agaaaggata gtacgattta agtatctcta 4020
agccttgtga agcactaagg ttgcgtacag acgtgcttga attacggata attcgggaac 4080
cttgggacac acaaaaaacc aacacacaga tctaatgaaa ataaagatct tttatttagg 4140
cgcctctgac ttcctgggga ttgacctgag ttctactcta gcgtttgctg gttcggtgaa 4200
ctaatctgtg agatccccaa ctctccgttt gggatctcca ctctctggtg tcctaacctt 4260
ggtgccccac tgtctactgc tagtgagacc ttacgcgctg agaaacgtgg cgttactcta 4320
actaagcgac gcgcacttgc actctgaata cttctaccgt aactaacccc ggacctcaga 4380
actcagacgg atctacgctg tccatcaaca ccagacttag attacctctg ttaagtttaa 4440
ttaagctcgc gaaggaaccc ctagtgatgg agttggccac tccctctctg cgcgctcgct 4500
cgctcactga ggccgggcga ccaaaggtcg cccgacgccc gggctttgcc cgggcggcct 4560
cagtgagcga gcgagcgcgc agagagggag tggccaa 4597
<210> 59
<211> 4594
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成
的多核苷酸
<400> 59
ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 60
cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag agagggagtg 120
gccaactcca tcactagggg ttcctgagtt taaacttcgt cgacgattcg agcttgggct 180
gcaggtcgag ggcactggga ggatgttgag taagatggaa aactactgat gacccttgca 240
gagacagagt attaggacat gtttgaacag gggccgggcg atcagcaggt agctctagag 300
gatccccgtc tgtctgcaca tttcgtagag cgagtgttcc gatactctaa tctccctagg 360
caaggttcat atttgtgtag gttacttatt ctccttttgt tgactaagtc aataatcaga 420
atcagcaggt ttggagtcag cttggcaggg atcagcagcc tgggttggaa ggagggggta 480
taaaagcccc ttcaccagga gaagccgtca cacagactag ccctaaggta agttggcgcc 540
gtttaaggga tggttggttg gtggggtatt aatgtttaat tacctttttt acaggcctga 600
actaggcgcg ccaccgccac catgcttagg ggtccggggc ccgggctgct gctgctggcc 660
gtccagtgcc tggggacagc ggtgccctcc acgggagcct cgaagagcaa gagggcttac 720
cgccccagtg agaccctgtg cggcggggag ctggtggaca ccctccagtt cgtctgtggg 780
gaccgcggct tctacttcag caggcccgca agccgtgtga gccgtcgcag ccgtggcatc 840
atggaggagt gctgtttccg cagctgtgac ctggccctcc tggagacgta ctgtgctacc 900
cccgccaagt ccgagggcgc gccggcacac cccggccgtc ccagagcagt gcccacacag 960
tgcgacgtcc cccccaacag ccgcttcgat tgcgcccctg acaaggccat cacccaggaa 1020
cagtgcgagg cccgcggctg ctgctacatc cctgcaaagc aggggctgca gggagcccag 1080
atggggcagc cctggtgctt cttcccaccc agctacccca gctacaagct ggagaacctg 1140
agctcctctg aaatgggcta cacggccacc ctgacccgta ccacccccac cttcttcccc 1200
aaggacatcc tgaccctgcg gctggacgtg atgatggaga ctgagaaccg cctccacttc 1260
acgatcaaag atccagctaa caggcgctac gaggtgccct tggagacccc gcgtgtccac 1320
agccgggcac cgtccccact ctacagcgtg gagttctccg aggagccctt cggggtgatc 1380
gtgcaccggc agctggacgg ccgcgtgctg ctgaacacga cggtggcgcc cctgttcttt 1440
gcggaccagt tccttcagct gtccacctcg ctgccctcgc agtatatcac aggcctcgcc 1500
gagcacctca gtcccctgat gctcagcacc agctggacca ggatcaccct gtggaaccgg 1560
gaccttgcgc ccacgcccgg tgcgaacctc tacgggtctc accctttcta cctggcgctg 1620
gaggacggcg ggtcggcaca cggggtgttc ctgctaaaca gcaatgccat ggatgtggtc 1680
ctgcagccga gccctgccct tagctggagg tcgacaggtg ggatcctgga tgtctacatc 1740
ttcctgggcc cagagcccaa gagcgtggtg cagcagtacc tggacgttgt gggatacccg 1800
ttcatgccgc catactgggg cctgggcttc cacctgtgcc gctggggcta ctcctccacc 1860
gctatcaccc gccaggtggt ggagaacatg accagggccc acttccccct ggacgtccaa 1920
tggaacgacc tggactacat ggactcccgg agggacttca cgttcaacaa ggatggcttc 1980
cgggacttcc cggccatggt gcaggagctg caccagggcg gccggcgcta catgatgatc 2040
gtggatcctg ccatcagcag ctcgggccct gccgggagct acaggcccta cgacgagggt 2100
ctgcggaggg gggttttcat caccaacgag accggccagc cgctgattgg gaaggtatgg 2160
cccgggtcca ctgccttccc cgacttcacc aaccccacag ccctggcctg gtgggaggac 2220
atggtggctg agttccatga ccaggtgccc ttcgacggca tgtggattga catgaacgag 2280
ccttccaact tcatcagagg ctctgaggac ggctgcccca acaatgagct ggagaaccca 2340
ccctacgtgc ctggggtggt tggggggacc ctccaggcgg ccaccatctg tgcctccagc 2400
caccagtttc tctccacaca ctacaacctg cacaacctct acggcctgac cgaagccatc 2460
gcctcccaca gggcgctggt gaaggctcgg gggacacgcc catttgtgat ctcccgctcg 2520
acctttgctg gccacggccg atacgccggc cactggacgg gggacgtgtg gagctcctgg 2580
gagcagctcg cctcctccgt gccagaaatc ctgcagttta acctgctggg ggtgcctctg 2640
gtcggggccg acgtctgcgg cttcctgggc aacacctcag aggagctgtg tgtgcgctgg 2700
acccagctgg gggccttcta ccccttcatg cggaaccaca acagcctgct cagtctgccc 2760
caggagccgt acagcttcag cgagccggcc cagcaggcca tgaggaaggc cctcaccctg 2820
cgctacgcac tcctccccca cctctacaca ctgttccacc aggcccacgt cgcgggggag 2880
accgtggccc ggcccctctt cctggagttc cccaaggact ctagcacctg gactgtggac 2940
caccagctcc tgtgggggga ggccctgctc atcaccccag tgctccaggc cgggaaggcc 3000
gaagtgactg gctacttccc cttgggcaca tggtacgacc tgcagacggt gccaatagag 3060
gcccttggca gcctcccacc cccacctgca gctccccgtg agccagccat ccacagcgag 3120
gggcagtggg tgacgctgcc ggcccccctg gacaccatca acgtccacct ccgggctggg 3180
tacatcatcc ccctgcaggg ccctggcctc acaaccacag agtcccgcca gcagcccatg 3240
gccctggctg tggccctgac caagggtgga gaggcccgag gggagctgtt ctgggacgat 3300
ggagagagcc tggaagtgct ggagcgaggg gcctacacac aggtcatctt cctggccagg 3360
aataacacga tcgtgaatga gctggtacgt gtgaccagtg agggagctgg cctgcagctg 3420
cagaaggtga ctgtcctggg cgtggccacg gcgccccagc aggtcctctc caacggtgtc 3480
cctgtctcca acttcaccta cagccccgac accaaggtcc tggacatctg tgtctcgctg 3540
ttgatgggag agcagtttct cgtcagctgg tgttagcgag cggccgctct tagtagcagt 3600
atcgatccca gcccactttt ccccaatacg actacgagat ctgtggcttc tagctgcccg 3660
ggtggcatcc ctgtgacccc tccccagtgc ctctcctggc cctggaagtt gccactccag 3720
tgcccaccag ccttgtccta ataaaattaa gttgcatcat tttgtctgac taggtgtcct 3780
tctataatat tatggggtgg aggggggtgg tatggagcaa ggggcaagtt gggaaggccg 3840
acccgcgaat agtagatccc gcgagggctt gaatctatca cctagagtac accctagaga 3900
atagctagct ctcaatgact aaggactaaa cttggtattt cgactgaagc ctgtcccctc 3960
actgttggcg ctaggaggag agttcgtaga aaggatagta cgatttaagt atctctaagc 4020
cttgtgaagc actaaggttg cgtacagacg tgcttgaatt acggataatt cgggaacctt 4080
gggacacaca aaaaaccaac acacagatct aatgaaaata aagatctttt atttaggcgc 4140
ctctgacttc ctggggattg acctgagttc tactctagcg tttgctggtt cggtgaacta 4200
atctgtgaga tccccaactc tccgtttggg atctccactc tctggtgtcc taaccttggt 4260
gccccactgt ctactgctag tgagacctta cgcgctgaga aacgtggcgt tactctaact 4320
aagcgacgcg cacttgcact ctgaatactt ctaccgtaac taaccccgga cctcagaact 4380
cagacggatc tacgctgtcc atcaacacca gacttagatt acctctgtta agtttaatta 4440
agctcgcgaa ggaaccccta gtgatggagt tggccactcc ctctctgcgc gctcgctcgc 4500
tcactgaggc cgggcgacca aaggtcgccc gacgcccggg ctttgcccgg gcggcctcag 4560
tgagcgagcg agcgcgcaga gagggagtgg ccaa 4594
<210> 60
<211> 4555
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成
的多核苷酸
<400> 60
ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 60
cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag agagggagtg 120
gccaactcca tcactagggg ttcctgagtt taaacttcgt cgacgattcg agcttgggct 180
gcaggtcgag ggcactggga ggatgttgag taagatggaa aactactgat gacccttgca 240
gagacagagt attaggacat gtttgaacag gggccgggcg atcagcaggt agctctagag 300
gatccccgtc tgtctgcaca tttcgtagag cgagtgttcc gatactctaa tctccctagg 360
caaggttcat atttgtgtag gttacttatt ctccttttgt tgactaagtc aataatcaga 420
atcagcaggt ttggagtcag cttggcaggg atcagcagcc tgggttggaa ggagggggta 480
taaaagcccc ttcaccagga gaagccgtca cacagactag ccctaaggta agttggcgcc 540
gtttaaggga tggttggttg gtggggtatt aatgtttaat tacctttttt acaggcctga 600
actaggcgcg ccaccgccac catgccgtct tctgtctcgt ggggcatcct cctgctggca 660
ggcctgtgct gcctggtccc tgtctccctg gctgctctgt gcggcgggga gctggtggac 720
accctccagt tcgtctgtgg ggaccgcggc ttctacttca gcaggcccgc aagccgtgtg 780
agccgtcgca gccgtggcat cgttgaggag tgctgtttcc gcagctgtga cctggccctc 840
ctggagacgt actgtgctac ccccgccaag tccgagggcg cgccggcaca ccccggccgt 900
cccagagcag tgcccacaca gtgcgacgtc ccccccaaca gccgcttcga ttgcgcccct 960
gacaaggcca tcacccagga acagtgcgag gcccgcggct gctgctacat ccctgcaaag 1020
caggggctgc agggagccca gatggggcag ccctggtgct tcttcccacc cagctacccc 1080
agctacaagc tggagaacct gagctcctct gaaatgggct acacggccac cctgacccgt 1140
accaccccca ccttcttccc caaggacatc ctgaccctgc ggctggacgt gatgatggag 1200
actgagaacc gcctccactt cacgatcaaa gatccagcta acaggcgcta cgaggtgccc 1260
ttggagaccc cgcgtgtcca cagccgggca ccgtccccac tctacagcgt ggagttctcc 1320
gaggagccct tcggggtgat cgtgcaccgg cagctggacg gccgcgtgct gctgaacacg 1380
acggtggcgc ccctgttctt tgcggaccag ttccttcagc tgtccacctc gctgccctcg 1440
cagtatatca caggcctcgc cgagcacctc agtcccctga tgctcagcac cagctggacc 1500
aggatcaccc tgtggaaccg ggaccttgcg cccacgcccg gtgcgaacct ctacgggtct 1560
caccctttct acctggcgct ggaggacggc gggtcggcac acggggtgtt cctgctaaac 1620
agcaatgcca tggatgtggt cctgcagccg agccctgccc ttagctggag gtcgacaggt 1680
gggatcctgg atgtctacat cttcctgggc ccagagccca agagcgtggt gcagcagtac 1740
ctggacgttg tgggataccc gttcatgccg ccatactggg gcctgggctt ccacctgtgc 1800
cgctggggct actcctccac cgctatcacc cgccaggtgg tggagaacat gaccagggcc 1860
cacttccccc tggacgtcca atggaacgac ctggactaca tggactcccg gagggacttc 1920
acgttcaaca aggatggctt ccgggacttc ccggccatgg tgcaggagct gcaccagggc 1980
ggccggcgct acatgatgat cgtggatcct gccatcagca gctcgggccc tgccgggagc 2040
tacaggccct acgacgaggg tctgcggagg ggggttttca tcaccaacga gaccggccag 2100
ccgctgattg ggaaggtatg gcccgggtcc actgccttcc ccgacttcac caaccccaca 2160
gccctggcct ggtgggagga catggtggct gagttccatg accaggtgcc cttcgacggc 2220
atgtggattg acatgaacga gccttccaac ttcatcagag gctctgagga cggctgcccc 2280
aacaatgagc tggagaaccc accctacgtg cctggggtgg ttggggggac cctccaggcg 2340
gccaccatct gtgcctccag ccaccagttt ctctccacac actacaacct gcacaacctc 2400
tacggcctga ccgaagccat cgcctcccac agggcgctgg tgaaggctcg ggggacacgc 2460
ccatttgtga tctcccgctc gacctttgct ggccacggcc gatacgccgg ccactggacg 2520
ggggacgtgt ggagctcctg ggagcagctc gcctcctccg tgccagaaat cctgcagttt 2580
aacctgctgg gggtgcctct ggtcggggcc gacgtctgcg gcttcctggg caacacctca 2640
gaggagctgt gtgtgcgctg gacccagctg ggggccttct accccttcat gcggaaccac 2700
aacagcctgc tcagtctgcc ccaggagccg tacagcttca gcgagccggc ccagcaggcc 2760
atgaggaagg ccctcaccct gcgctacgca ctcctccccc acctctacac actgttccac 2820
caggcccacg tcgcggggga gaccgtggcc cggcccctct tcctggagtt ccccaaggac 2880
tctagcacct ggactgtgga ccaccagctc ctgtgggggg aggccctgct catcacccca 2940
gtgctccagg ccgggaaggc cgaagtgact ggctacttcc ccttgggcac atggtacgac 3000
ctgcagacgg tgccaataga ggcccttggc agcctcccac ccccacctgc agctccccgt 3060
gagccagcca tccacagcga ggggcagtgg gtgacgctgc cggcccccct ggacaccatc 3120
aacgtccacc tccgggctgg gtacatcatc cccctgcagg gccctggcct cacaaccaca 3180
gagtcccgcc agcagcccat ggccctggct gtggccctga ccaagggtgg agaggcccga 3240
ggggagctgt tctgggacga tggagagagc ctggaagtgc tggagcgagg ggcctacaca 3300
caggtcatct tcctggccag gaataacacg atcgtgaatg agctggtacg tgtgaccagt 3360
gagggagctg gcctgcagct gcagaaggtg actgtcctgg gcgtggccac ggcgccccag 3420
caggtcctct ccaacggtgt ccctgtctcc aacttcacct acagccccga caccaaggtc 3480
ctggacatct gtgtctcgct gttgatggga gagcagtttc tcgtcagctg gtgttagcga 3540
gcggccgctc ttagtagcag tatcgatccc agcccacttt tccccaatac gactacgaga 3600
tctgtggctt ctagctgccc gggtggcatc cctgtgaccc ctccccagtg cctctcctgg 3660
ccctggaagt tgccactcca gtgcccacca gccttgtcct aataaaatta agttgcatca 3720
ttttgtctga ctaggtgtcc ttctataata ttatggggtg gaggggggtg gtatggagca 3780
aggggcaagt tgggaaggcc gacccgcgaa tagtagatcc cgcgagggct tgaatctatc 3840
acctagagta caccctagag aatagctagc tctcaatgac taaggactaa acttggtatt 3900
tcgactgaag cctgtcccct cactgttggc gctaggagga gagttcgtag aaaggatagt 3960
acgatttaag tatctctaag ccttgtgaag cactaaggtt gcgtacagac gtgcttgaat 4020
tacggataat tcgggaacct tgggacacac aaaaaaccaa cacacagatc taatgaaaat 4080
aaagatcttt tatttaggcg cctctgactt cctggggatt gacctgagtt ctactctagc 4140
gtttgctggt tcggtgaact aatctgtgag atccccaact ctccgtttgg gatctccact 4200
ctctggtgtc ctaaccttgg tgccccactg tctactgcta gtgagacctt acgcgctgag 4260
aaacgtggcg ttactctaac taagcgacgc gcacttgcac tctgaatact tctaccgtaa 4320
ctaaccccgg acctcagaac tcagacggat ctacgctgtc catcaacacc agacttagat 4380
tacctctgtt aagtttaatt aagctcgcga aggaacccct agtgatggag ttggccactc 4440
cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc cgacgcccgg 4500
gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag agagggagtg gccaa 4555
<210> 61
<211> 4579
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成
的多核苷酸
<400> 61
ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 60
cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag agagggagtg 120
gccaactcca tcactagggg ttcctgagtt taaacttcgt cgacgattcg agcttgggct 180
gcaggtcgag ggcactggga ggatgttgag taagatggaa aactactgat gacccttgca 240
gagacagagt attaggacat gtttgaacag gggccgggcg atcagcaggt agctctagag 300
gatccccgtc tgtctgcaca tttcgtagag cgagtgttcc gatactctaa tctccctagg 360
caaggttcat atttgtgtag gttacttatt ctccttttgt tgactaagtc aataatcaga 420
atcagcaggt ttggagtcag cttggcaggg atcagcagcc tgggttggaa ggagggggta 480
taaaagcccc ttcaccagga gaagccgtca cacagactag ccctaaggta agttggcgcc 540
gtttaaggga tggttggttg gtggggtatt aatgtttaat tacctttttt acaggcctga 600
actaggcgcg ccaccgccac catgctcagg ggtccgggac ccgggcggct gctgctgcta 660
gcagtcctgt gcctggggac atcggtgcgc tgcaccgaaa ccgggaagag caagagggct 720
ctgtgcggcg gggagctggt ggacaccctc cagttcgtct gtggggaccg cggcttctac 780
ttcagcaggc ccgcaagccg tgtgagccgt cgcagccgtg gcatcgttga ggagtgctgt 840
ttccgcagct gtgacctggc cctcctggag acgtactgtg ctacccccgc caagtccgag 900
ggcgcgccgg cacaccccgg ccgtcccaga gcagtgccca cacagtgcga cgtccccccc 960
aacagccgct tcgattgcgc ccctgacaag gccatcaccc aggaacagtg cgaggcccgc 1020
ggctgctgct acatccctgc aaagcagggg ctgcagggag cccagatggg gcagccctgg 1080
tgcttcttcc cacccagcta ccccagctac aagctggaga acctgagctc ctctgaaatg 1140
ggctacacgg ccaccctgac ccgtaccacc cccaccttct tccccaagga catcctgacc 1200
ctgcggctgg acgtgatgat ggagactgag aaccgcctcc acttcacgat caaagatcca 1260
gctaacaggc gctacgaggt gcccttggag accccgcgtg tccacagccg ggcaccgtcc 1320
ccactctaca gcgtggagtt ctccgaggag cccttcgggg tgatcgtgca ccggcagctg 1380
gacggccgcg tgctgctgaa cacgacggtg gcgcccctgt tctttgcgga ccagttcctt 1440
cagctgtcca cctcgctgcc ctcgcagtat atcacaggcc tcgccgagca cctcagtccc 1500
ctgatgctca gcaccagctg gaccaggatc accctgtgga accgggacct tgcgcccacg 1560
cccggtgcga acctctacgg gtctcaccct ttctacctgg cgctggagga cggcgggtcg 1620
gcacacgggg tgttcctgct aaacagcaat gccatggatg tggtcctgca gccgagccct 1680
gcccttagct ggaggtcgac aggtgggatc ctggatgtct acatcttcct gggcccagag 1740
cccaagagcg tggtgcagca gtacctggac gttgtgggat acccgttcat gccgccatac 1800
tggggcctgg gcttccacct gtgccgctgg ggctactcct ccaccgctat cacccgccag 1860
gtggtggaga acatgaccag ggcccacttc cccctggacg tccaatggaa cgacctggac 1920
tacatggact cccggaggga cttcacgttc aacaaggatg gcttccggga cttcccggcc 1980
atggtgcagg agctgcacca gggcggccgg cgctacatga tgatcgtgga tcctgccatc 2040
agcagctcgg gccctgccgg gagctacagg ccctacgacg agggtctgcg gaggggggtt 2100
ttcatcacca acgagaccgg ccagccgctg attgggaagg tatggcccgg gtccactgcc 2160
ttccccgact tcaccaaccc cacagccctg gcctggtggg aggacatggt ggctgagttc 2220
catgaccagg tgcccttcga cggcatgtgg attgacatga acgagccttc caacttcatc 2280
agaggctctg aggacggctg ccccaacaat gagctggaga acccacccta cgtgcctggg 2340
gtggttgggg ggaccctcca ggcggccacc atctgtgcct ccagccacca gtttctctcc 2400
acacactaca acctgcacaa cctctacggc ctgaccgaag ccatcgcctc ccacagggcg 2460
ctggtgaagg ctcgggggac acgcccattt gtgatctccc gctcgacctt tgctggccac 2520
ggccgatacg ccggccactg gacgggggac gtgtggagct cctgggagca gctcgcctcc 2580
tccgtgccag aaatcctgca gtttaacctg ctgggggtgc ctctggtcgg ggccgacgtc 2640
tgcggcttcc tgggcaacac ctcagaggag ctgtgtgtgc gctggaccca gctgggggcc 2700
ttctacccct tcatgcggaa ccacaacagc ctgctcagtc tgccccagga gccgtacagc 2760
ttcagcgagc cggcccagca ggccatgagg aaggccctca ccctgcgcta cgcactcctc 2820
ccccacctct acacactgtt ccaccaggcc cacgtcgcgg gggagaccgt ggcccggccc 2880
ctcttcctgg agttccccaa ggactctagc acctggactg tggaccacca gctcctgtgg 2940
ggggaggccc tgctcatcac cccagtgctc caggccggga aggccgaagt gactggctac 3000
ttccccttgg gcacatggta cgacctgcag acggtgccaa tagaggccct tggcagcctc 3060
ccacccccac ctgcagctcc ccgtgagcca gccatccaca gcgaggggca gtgggtgacg 3120
ctgccggccc ccctggacac catcaacgtc cacctccggg ctgggtacat catccccctg 3180
cagggccctg gcctcacaac cacagagtcc cgccagcagc ccatggccct ggctgtggcc 3240
ctgaccaagg gtggagaggc ccgaggggag ctgttctggg acgatggaga gagcctggaa 3300
gtgctggagc gaggggccta cacacaggtc atcttcctgg ccaggaataa cacgatcgtg 3360
aatgagctgg tacgtgtgac cagtgaggga gctggcctgc agctgcagaa ggtgactgtc 3420
ctgggcgtgg ccacggcgcc ccagcaggtc ctctccaacg gtgtccctgt ctccaacttc 3480
acctacagcc ccgacaccaa ggtcctggac atctgtgtct cgctgttgat gggagagcag 3540
tttctcgtca gctggtgtta gcgagcggcc gctcttagta gcagtatcga tcccagccca 3600
cttttcccca atacgactac gagatctgtg gcttctagct gcccgggtgg catccctgtg 3660
acccctcccc agtgcctctc ctggccctgg aagttgccac tccagtgccc accagccttg 3720
tcctaataaa attaagttgc atcattttgt ctgactaggt gtccttctat aatattatgg 3780
ggtggagggg ggtggtatgg agcaaggggc aagttgggaa ggccgacccg cgaatagtag 3840
atcccgcgag ggcttgaatc tatcacctag agtacaccct agagaatagc tagctctcaa 3900
tgactaagga ctaaacttgg tatttcgact gaagcctgtc ccctcactgt tggcgctagg 3960
aggagagttc gtagaaagga tagtacgatt taagtatctc taagccttgt gaagcactaa 4020
ggttgcgtac agacgtgctt gaattacgga taattcggga accttgggac acacaaaaaa 4080
ccaacacaca gatctaatga aaataaagat cttttattta ggcgcctctg acttcctggg 4140
gattgacctg agttctactc tagcgtttgc tggttcggtg aactaatctg tgagatcccc 4200
aactctccgt ttgggatctc cactctctgg tgtcctaacc ttggtgcccc actgtctact 4260
gctagtgaga ccttacgcgc tgagaaacgt ggcgttactc taactaagcg acgcgcactt 4320
gcactctgaa tacttctacc gtaactaacc ccggacctca gaactcagac ggatctacgc 4380
tgtccatcaa caccagactt agattacctc tgttaagttt aattaagctc gcgaaggaac 4440
ccctagtgat ggagttggcc actccctctc tgcgcgctcg ctcgctcact gaggccgggc 4500
gaccaaaggt cgcccgacgc ccgggctttg cccgggcggc ctcagtgagc gagcgagcgc 4560
gcagagaggg agtggccaa 4579
<210> 62
<211> 4576
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成
的多核苷酸
<400> 62
ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 60
cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag agagggagtg 120
gccaactcca tcactagggg ttcctgagtt taaacttcgt cgacgattcg agcttgggct 180
gcaggtcgag ggcactggga ggatgttgag taagatggaa aactactgat gacccttgca 240
gagacagagt attaggacat gtttgaacag gggccgggcg atcagcaggt agctctagag 300
gatccccgtc tgtctgcaca tttcgtagag cgagtgttcc gatactctaa tctccctagg 360
caaggttcat atttgtgtag gttacttatt ctccttttgt tgactaagtc aataatcaga 420
atcagcaggt ttggagtcag cttggcaggg atcagcagcc tgggttggaa ggagggggta 480
taaaagcccc ttcaccagga gaagccgtca cacagactag ccctaaggta agttggcgcc 540
gtttaaggga tggttggttg gtggggtatt aatgtttaat tacctttttt acaggcctga 600
actaggcgcg ccaccgccac catgcttagg ggtccggggc ccgggctgct gctgctggcc 660
gtccagtgcc tggggacagc ggtgccctcc acgggagcct cgaagagcaa gagggctctg 720
tgcggcgggg agctggtgga caccctccag ttcgtctgtg gggaccgcgg cttctacttc 780
agcaggcccg caagccgtgt gagccgtcgc agccgtggca tcgttgagga gtgctgtttc 840
cgcagctgtg acctggccct cctggagacg tactgtgcta cccccgccaa gtccgagggc 900
gcgccggcac accccggccg tcccagagca gtgcccacac agtgcgacgt cccccccaac 960
agccgcttcg attgcgcccc tgacaaggcc atcacccagg aacagtgcga ggcccgcggc 1020
tgctgctaca tccctgcaaa gcaggggctg cagggagccc agatggggca gccctggtgc 1080
ttcttcccac ccagctaccc cagctacaag ctggagaacc tgagctcctc tgaaatgggc 1140
tacacggcca ccctgacccg taccaccccc accttcttcc ccaaggacat cctgaccctg 1200
cggctggacg tgatgatgga gactgagaac cgcctccact tcacgatcaa agatccagct 1260
aacaggcgct acgaggtgcc cttggagacc ccgcgtgtcc acagccgggc accgtcccca 1320
ctctacagcg tggagttctc cgaggagccc ttcggggtga tcgtgcaccg gcagctggac 1380
ggccgcgtgc tgctgaacac gacggtggcg cccctgttct ttgcggacca gttccttcag 1440
ctgtccacct cgctgccctc gcagtatatc acaggcctcg ccgagcacct cagtcccctg 1500
atgctcagca ccagctggac caggatcacc ctgtggaacc gggaccttgc gcccacgccc 1560
ggtgcgaacc tctacgggtc tcaccctttc tacctggcgc tggaggacgg cgggtcggca 1620
cacggggtgt tcctgctaaa cagcaatgcc atggatgtgg tcctgcagcc gagccctgcc 1680
cttagctgga ggtcgacagg tgggatcctg gatgtctaca tcttcctggg cccagagccc 1740
aagagcgtgg tgcagcagta cctggacgtt gtgggatacc cgttcatgcc gccatactgg 1800
ggcctgggct tccacctgtg ccgctggggc tactcctcca ccgctatcac ccgccaggtg 1860
gtggagaaca tgaccagggc ccacttcccc ctggacgtcc aatggaacga cctggactac 1920
atggactccc ggagggactt cacgttcaac aaggatggct tccgggactt cccggccatg 1980
gtgcaggagc tgcaccaggg cggccggcgc tacatgatga tcgtggatcc tgccatcagc 2040
agctcgggcc ctgccgggag ctacaggccc tacgacgagg gtctgcggag gggggttttc 2100
atcaccaacg agaccggcca gccgctgatt gggaaggtat ggcccgggtc cactgccttc 2160
cccgacttca ccaaccccac agccctggcc tggtgggagg acatggtggc tgagttccat 2220
gaccaggtgc ccttcgacgg catgtggatt gacatgaacg agccttccaa cttcatcaga 2280
ggctctgagg acggctgccc caacaatgag ctggagaacc caccctacgt gcctggggtg 2340
gttgggggga ccctccaggc ggccaccatc tgtgcctcca gccaccagtt tctctccaca 2400
cactacaacc tgcacaacct ctacggcctg accgaagcca tcgcctccca cagggcgctg 2460
gtgaaggctc gggggacacg cccatttgtg atctcccgct cgacctttgc tggccacggc 2520
cgatacgccg gccactggac gggggacgtg tggagctcct gggagcagct cgcctcctcc 2580
gtgccagaaa tcctgcagtt taacctgctg ggggtgcctc tggtcggggc cgacgtctgc 2640
ggcttcctgg gcaacacctc agaggagctg tgtgtgcgct ggacccagct gggggccttc 2700
taccccttca tgcggaacca caacagcctg ctcagtctgc cccaggagcc gtacagcttc 2760
agcgagccgg cccagcaggc catgaggaag gccctcaccc tgcgctacgc actcctcccc 2820
cacctctaca cactgttcca ccaggcccac gtcgcggggg agaccgtggc ccggcccctc 2880
ttcctggagt tccccaagga ctctagcacc tggactgtgg accaccagct cctgtggggg 2940
gaggccctgc tcatcacccc agtgctccag gccgggaagg ccgaagtgac tggctacttc 3000
cccttgggca catggtacga cctgcagacg gtgccaatag aggcccttgg cagcctccca 3060
cccccacctg cagctccccg tgagccagcc atccacagcg aggggcagtg ggtgacgctg 3120
ccggcccccc tggacaccat caacgtccac ctccgggctg ggtacatcat ccccctgcag 3180
ggccctggcc tcacaaccac agagtcccgc cagcagccca tggccctggc tgtggccctg 3240
accaagggtg gagaggcccg aggggagctg ttctgggacg atggagagag cctggaagtg 3300
ctggagcgag gggcctacac acaggtcatc ttcctggcca ggaataacac gatcgtgaat 3360
gagctggtac gtgtgaccag tgagggagct ggcctgcagc tgcagaaggt gactgtcctg 3420
ggcgtggcca cggcgcccca gcaggtcctc tccaacggtg tccctgtctc caacttcacc 3480
tacagccccg acaccaaggt cctggacatc tgtgtctcgc tgttgatggg agagcagttt 3540
ctcgtcagct ggtgttagcg agcggccgct cttagtagca gtatcgatcc cagcccactt 3600
ttccccaata cgactacgag atctgtggct tctagctgcc cgggtggcat ccctgtgacc 3660
cctccccagt gcctctcctg gccctggaag ttgccactcc agtgcccacc agccttgtcc 3720
taataaaatt aagttgcatc attttgtctg actaggtgtc cttctataat attatggggt 3780
ggaggggggt ggtatggagc aaggggcaag ttgggaaggc cgacccgcga atagtagatc 3840
ccgcgagggc ttgaatctat cacctagagt acaccctaga gaatagctag ctctcaatga 3900
ctaaggacta aacttggtat ttcgactgaa gcctgtcccc tcactgttgg cgctaggagg 3960
agagttcgta gaaaggatag tacgatttaa gtatctctaa gccttgtgaa gcactaaggt 4020
tgcgtacaga cgtgcttgaa ttacggataa ttcgggaacc ttgggacaca caaaaaacca 4080
acacacagat ctaatgaaaa taaagatctt ttatttaggc gcctctgact tcctggggat 4140
tgacctgagt tctactctag cgtttgctgg ttcggtgaac taatctgtga gatccccaac 4200
tctccgtttg ggatctccac tctctggtgt cctaaccttg gtgccccact gtctactgct 4260
agtgagacct tacgcgctga gaaacgtggc gttactctaa ctaagcgacg cgcacttgca 4320
ctctgaatac ttctaccgta actaaccccg gacctcagaa ctcagacgga tctacgctgt 4380
ccatcaacac cagacttaga ttacctctgt taagtttaat taagctcgcg aaggaacccc 4440
tagtgatgga gttggccact ccctctctgc gcgctcgctc gctcactgag gccgggcgac 4500
caaaggtcgc ccgacgcccg ggctttgccc gggcggcctc agtgagcgag cgagcgcgca 4560
gagagggagt ggccaa 4576
<210> 63
<211> 6
<212> PRT
<213> 智人(Homo sapiens)
<400> 63
Tyr Arg Pro Ser Glu Thr
1 5
<210> 64
<211> 11
<212> PRT
<213> 褐家鼠(Rattus norvegicus)
<400> 64
Leu Leu Leu Leu Ala Val Leu Cys Leu Gly Thr
1 5 10
<210> 65
<211> 20
<212> DNA
<213> 未知
<220>
<223> 未知的描述:
胶原蛋白稳定性(CS)序列
<400> 65
cccagcccac ttttccccaa 20
<210> 66
<211> 6
<212> PRT
<213> 未知
<220>
<223> 未知的描述:
胶原蛋白稳定性(CS)序列
<400> 66
Pro Ser Pro Leu Phe Pro
1 5
<210> 67
<211> 192
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成
的多核苷酸
<400> 67
gctctgtgcg gcggggagct ggtggacacc ctccagttcg tctgtgggga ccgcggcttc 60
tacttcagca ggcccgcaag ccgtgtgagc cgtcgcagcc gtggcatcgt tgaggagtgc 120
tgtttccgca gctgtgacct ggccctcctg gagacgtact gtgctacccc cgccaagtcc 180
gagggcgcgc cg 192
<210> 68
<211> 189
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成
的多核苷酸
<400> 68
ctgtgcggcg gggagctggt ggacaccctc cagttcgtct gtggggaccg cggcttctac 60
ttcagcaggc ccgcaagccg tgtgagccgt cgcagccgtg gcatcgttga ggagtgctgt 120
ttccgcagct gtgacctggc cctcctggag acgtactgtg ctacccccgc caagtccgag 180
ggcgcgccg 189
<210> 69
<211> 210
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成
的多核苷酸
<400> 69
gcttaccgcc ccagtgagac cctgtgcggc ggggagctgg tggacaccct ccagttcgtc 60
tgtggggacc gcggcttcta cttcagcagg cccgcaagcc gtgtgagccg tcgcagccgt 120
ggcatcatgg aggagtgctg tttccgcagc tgtgacctgg ccctcctgga gacgtactgt 180
gctacccccg ccaagtccga gggcgcgccg 210
<210> 70
<211> 264
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成
的多核苷酸
<400> 70
atgggaatcc caatggggaa gtcgatgctg gtgcttctca ccttcttggc cttcgcctcg 60
tgctgcattg ctgctctgtg cggcggggag ctggtggaca ccctccagtt cgtctgtggg 120
gaccgcggct tctacttcag caggcccgca agccgtgtga gccgtcgcag ccgtggcatc 180
gttgaggagt gctgtttccg cagctgtgac ctggccctcc tggagacgta ctgtgctacc 240
cccgccaagt ccgagggcgc gccg 264
<210> 71
<211> 300
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成
的多核苷酸
<400> 71
taggcgcctc tgacttcctg gggattgacc tgagttctac tctagcgttt gctggttcgg 60
tgaactaatc tgtgagatcc ccaactctcc gtttgggatc tccactctct ggtgtcctaa 120
ccttggtgcc ccactgtcta ctgctagtga gaccttacgc gctgagaaac gtggcgttac 180
tctaactaag cgacgcgcac ttgcactctg aatacttcta ccgtaactaa ccccggacct 240
cagaactcag acggatctac gctgtccatc aacaccagac ttagattacc tctgttaagt 300
<210> 72
<211> 2859
<212> DNA
<213> 智人(Homo sapiens)
<400> 72
atgggagtga ggcacccgcc ctgctcccac cggctcctgg ccgtctgcgc cctcgtgtcc 60
ttggcaaccg ctgcactcct ggggcacatc ctactccatg atttcctgct ggttccccga 120
gagctgagtg gctcctcccc agtcctggag gagactcacc cagctcacca gcagggagcc 180
agcagaccag ggccccggga tgcccaggca caccccggcc gtcccagagc agtgcccaca 240
cagtgcgacg tcccccccaa cagccgcttc gattgcgccc ctgacaaggc catcacccag 300
gaacagtgcg aggcccgcgg ctgttgctac atccctgcaa agcaggggct gcagggagcc 360
cagatggggc agccctggtg cttcttccca cccagctacc ccagctacaa gctggagaac 420
ctgagctcct ctgaaatggg ctacacggcc accctgaccc gtaccacccc caccttcttc 480
cccaaggaca tcctgaccct gcggctggac gtgatgatgg agactgagaa ccgcctccac 540
ttcacgatca aagatccagc taacaggcgc tacgaggtgc ccttggagac cccgcatgtc 600
cacagccggg caccgtcccc actctacagc gtggagttct ccgaggagcc cttcggggtg 660
atcgtgcgcc ggcagctgga cggccgcgtg ctgctgaaca cgacggtggc gcccctgttc 720
tttgcggacc agttccttca gctgtccacc tcgctgccct cgcagtatat cacaggcctc 780
gccgagcacc tcagtcccct gatgctcagc accagctgga ccaggatcac cctgtggaac 840
cgggaccttg cgcccacgcc cggtgcgaac ctctacgggt ctcacccttt ctacctggcg 900
ctggaggacg gcgggtcggc acacggggtg ttcctgctaa acagcaatgc catggatgtg 960
gtcctgcagc cgagccctgc ccttagctgg aggtcgacag gtgggatcct ggatgtctac 1020
atcttcctgg gcccagagcc caagagcgtg gtgcagcagt acctggacgt tgtgggatac 1080
ccgttcatgc cgccatactg gggcctgggc ttccacctgt gccgctgggg ctactcctcc 1140
accgctatca cccgccaggt ggtggagaac atgaccaggg cccacttccc cctggacgtc 1200
cagtggaacg acctggacta catggactcc cggagggact tcacgttcaa caaggatggc 1260
ttccgggact tcccggccat ggtgcaggag ctgcaccagg gcggccggcg ctacatgatg 1320
atcgtggatc ctgccatcag cagctcgggc cctgccggga gctacaggcc ctacgacgag 1380
ggtctgcgga ggggggtttt catcaccaac gagaccggcc agccgctgat tgggaaggta 1440
tggcccgggt ccactgcctt ccccgacttc accaacccca cagccctggc ctggtgggag 1500
gacatggtgg ctgagttcca tgaccaggtg cccttcgacg gcatgtggat tgacatgaac 1560
gagccttcca acttcatcag gggctctgag gacggctgcc ccaacaatga gctggagaac 1620
ccaccctacg tgcctggggt ggttgggggg accctccagg cggccaccat ctgtgcctcc 1680
agccaccagt ttctctccac acactacaac ctgcacaacc tctacggcct gaccgaagcc 1740
atcgcctccc acagggcgct ggtgaaggct cgggggacac gcccatttgt gatctcccgc 1800
tcgacctttg ctggccacgg ccgatacgcc ggccactgga cgggggacgt gtggagctcc 1860
tgggagcagc tcgcctcctc cgtgccagaa atcctgcagt ttaacctgct gggggtgcct 1920
ctggtcgggg ccgacgtctg cggcttcctg ggcaacacct cagaggagct gtgtgtgcgc 1980
tggacccagc tgggggcctt ctaccccttc atgcggaacc acaacagcct gctcagtctg 2040
ccccaggagc cgtacagctt cagcgagccg gcccagcagg ccatgaggaa ggccctcacc 2100
ctgcgctacg cactcctccc ccacctctac acactgttcc accaggccca cgtcgcgggg 2160
gagaccgtgg cccggcccct cttcctggag ttccccaagg actctagcac ctggactgtg 2220
gaccaccagc tcctgtgggg ggaggccctg ctcatcaccc cagtgctcca ggccgggaag 2280
gccgaagtga ctggctactt ccccttgggc acatggtacg acctgcagac ggtgccagta 2340
gaggcccttg gcagcctccc acccccacct gcagctcccc gtgagccagc catccacagc 2400
gaggggcagt gggtgacgct gccggccccc ctggacacca tcaacgtcca cctccgggct 2460
gggtacatca tccccctgca gggccctggc ctcacaacca cagagtcccg ccagcagccc 2520
atggccctgg ctgtggccct gaccaagggt ggggaggccc gaggggagct gttctgggac 2580
gatggagaga gcctggaagt gctggagcga ggggcctaca cacaggtcat cttcctggcc 2640
aggaataaca cgatcgtgaa tgagctggta cgtgtgacca gtgagggagc tggcctgcag 2700
ctgcagaagg tgactgtcct gggcgtggcc acggcgcccc agcaggtcct ctccaacggt 2760
gtccctgtct ccaacttcac ctacagcccc gacaccaagg tcctggacat ctgtgtctcg 2820
ctgttgatgg gagagcagtt tctcgtcagc tggtgttag 2859
<210> 73
<211> 2859
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成
的多核苷酸
<400> 73
atgggagtga ggcacccgcc ctgctcccac cggctcctgg ccgtctgcgc cctcgtgtcc 60
ttggcaaccg ctgcactcct ggggcacatc ctactccatg atttcctgct ggttccccga 120
gagctgagtg gctcctcccc agtcctggag gagactcacc cagctcacca gcagggagcc 180
agcagaccag ggccccggga tgcccaggca caccccggcc gtcccagagc agtgcccaca 240
cagtgcgacg tcccccccaa cagccgcttc gattgcgccc ctgacaaggc catcacccag 300
gaacagtgcg aggcccgcgg ctgctgctac atccctgcaa agcaggggct gcagggagcc 360
cagatggggc agccctggtg cttcttccca cccagctacc ccagctacaa gctggagaac 420
ctgagctcct ctgaaatggg ctacacggcc accctgaccc gtaccacccc caccttcttc 480
cccaaggaca tcctgaccct gcggctggac gtgatgatgg agactgagaa ccgcctccac 540
ttcacgatca aagatccagc taacaggcgc tacgaggtgc ccttggagac cccgcgtgtc 600
cacagccggg caccgtcccc actctacagc gtggagttct ccgaggagcc cttcggggtg 660
atcgtgcacc ggcagctgga cggccgcgtg ctgctgaaca cgacggtggc gcccctgttc 720
tttgcggacc agttccttca gctgtccacc tcgctgccct cgcagtatat cacaggcctc 780
gccgagcacc tcagtcccct gatgctcagc accagctgga ccaggatcac cctgtggaac 840
cgggaccttg cgcccacgcc cggtgcgaac ctctacgggt ctcacccttt ctacctggcg 900
ctggaggacg gcgggtcggc acacggggtg ttcctgctaa acagcaatgc catggatgtg 960
gtcctgcagc cgagccctgc ccttagctgg aggtcgacag gtgggatcct ggatgtctac 1020
atcttcctgg gcccagagcc caagagcgtg gtgcagcagt acctggacgt tgtgggatac 1080
ccgttcatgc cgccatactg gggcctgggc ttccacctgt gccgctgggg ctactcctcc 1140
accgctatca cccgccaggt ggtggagaac atgaccaggg cccacttccc cctggacgtc 1200
caatggaacg acctggacta catggactcc cggagggact tcacgttcaa caaggatggc 1260
ttccgggact tcccggccat ggtgcaggag ctgcaccagg gcggccggcg ctacatgatg 1320
atcgtggatc ctgccatcag cagctcgggc cctgccggga gctacaggcc ctacgacgag 1380
ggtctgcgga ggggggtttt catcaccaac gagaccggcc agccgctgat tgggaaggta 1440
tggcccgggt ccactgcctt ccccgacttc accaacccca cagccctggc ctggtgggag 1500
gacatggtgg ctgagttcca tgaccaggtg cccttcgacg gcatgtggat tgacatgaac 1560
gagccttcca acttcatcag aggctctgag gacggctgcc ccaacaatga gctggagaac 1620
ccaccctacg tgcctggggt ggttgggggg accctccagg cggccaccat ctgtgcctcc 1680
agccaccagt ttctctccac acactacaac ctgcacaacc tctacggcct gaccgaagcc 1740
atcgcctccc acagggcgct ggtgaaggct cgggggacac gcccatttgt gatctcccgc 1800
tcgacctttg ctggccacgg ccgatacgcc ggccactgga cgggggacgt gtggagctcc 1860
tgggagcagc tcgcctcctc cgtgccagaa atcctgcagt ttaacctgct gggggtgcct 1920
ctggtcgggg ccgacgtctg cggcttcctg ggcaacacct cagaggagct gtgtgtgcgc 1980
tggacccagc tgggggcctt ctaccccttc atgcggaacc acaacagcct gctcagtctg 2040
ccccaggagc cgtacagctt cagcgagccg gcccagcagg ccatgaggaa ggccctcacc 2100
ctgcgctacg cactcctccc ccacctctac acactgttcc accaggccca cgtcgcgggg 2160
gagaccgtgg cccggcccct cttcctggag ttccccaagg actctagcac ctggactgtg 2220
gaccaccagc tcctgtgggg ggaggccctg ctcatcaccc cagtgctcca ggccgggaag 2280
gccgaagtga ctggctactt ccccttgggc acatggtacg acctgcagac ggtgccaata 2340
gaggcccttg gcagcctccc acccccacct gcagctcccc gtgagccagc catccacagc 2400
gaggggcagt gggtgacgct gccggccccc ctggacacca tcaacgtcca cctccgggct 2460
gggtacatca tccccctgca gggccctggc ctcacaacca cagagtcccg ccagcagccc 2520
atggccctgg ctgtggccct gaccaagggt ggagaggccc gaggggagct gttctgggac 2580
gatggagaga gcctggaagt gctggagcga ggggcctaca cacaggtcat cttcctggcc 2640
aggaataaca cgatcgtgaa tgagctggta cgtgtgacca gtgagggagc tggcctgcag 2700
ctgcagaagg tgactgtcct gggcgtggcc acggcgcccc agcaggtcct ctccaacggt 2760
gtccctgtct ccaacttcac ctacagcccc gacaccaagg tcctggacat ctgtgtctcg 2820
ctgttgatgg gagagcagtt tctcgtcagc tggtgttag 2859
<210> 74
<211> 2859
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成
的多核苷酸
<400> 74
atgggagtaa ggcatccacc atgctctcat aggctcctcg ccgtatgcgc gttggtcagc 60
cttgcgaccg cagcccttct gggccacatt ctgctgcacg attttctcct cgttccgcga 120
gagttgtctg gaagctctcc agtactcgag gaaacgcatc cagcgcacca gcagggcgca 180
tctcggcccg gtccaagaga cgcacaagca caccccgggc ggccaagggc tgttccaact 240
cagtgcgatg ttccgcccaa ttcaagattc gattgcgcac ccgataaagc tattacgcaa 300
gagcagtgcg aagctcgcgg ctgctgttat atcccggcaa agcagggcct tcagggcgct 360
caaatgggac agccgtggtg tttttttcca ccgtcatatc catcctacaa gcttgagaac 420
ctgtcctcat ctgagatggg atacacggct accctgacac ggacaacgcc aaccttcttc 480
cccaaagaca ttcttacact gcgactggac gtgatgatgg aaacagagaa tcgactgcat 540
tttactataa aggacccggc taacaggcgg tacgaggttc ccctggagac ccctcgcgta 600
cattctcgag ctcctagccc gctctactcc gtggaatttt ccgaagagcc gtttggtgta 660
atagtgcatc gccaacttga cggtcgcgta ctgctcaaca ccacggtggc acctctgttc 720
tttgcggacc aattcttgca gctctctact tctctccctt cacaatatat aaccgggctc 780
gcagagcatc tgtccccgtt gatgttgtct acgtcatgga caagaatcac gctttggaac 840
cgagacctgg cccctacgcc gggagctaat ctgtacgggt cacatccatt ctatttggct 900
ctggaggatg gcggtagtgc acacggggta tttctgctta actctaatgc gatggatgtc 960
gtgctgcagc catcccctgc gctgtcttgg cgaagcaccg gcggcattct ggacgtgtat 1020
atctttcttg gacccgagcc aaagagcgtc gtacaacagt acctcgacgt agtggggtat 1080
cccttcatgc ccccctattg ggggctcggt ttccatttgt gcagatgggg ctactcatcc 1140
actgcaataa cacgccaggt agtagaaaat atgacccggg ctcactttcc tcttgacgtg 1200
cagtggaatg accttgacta catggatagt cgccgcgatt tcaccttcaa caaggacggt 1260
ttcagagatt tccctgctat ggtgcaagag ctgcaccaag ggggccgccg gtatatgatg 1320
atcgtagatc cggccatatc tagctctggc cctgccgggt cttatagacc gtatgatgaa 1380
ggtctgaggc gcggtgtctt catcacaaac gaaactggtc aaccactcat cggcaaggtc 1440
tggcccgggt caacggcgtt tcctgatttc actaatccga cggcgctggc ttggtgggaa 1500
gatatggttg ccgagtttca cgatcaagtt ccgtttgacg gaatgtggat tgatatgaat 1560
gagccatcta actttatacg cggtagtgaa gatggttgcc ctaataatga gttggaaaac 1620
ccaccctatg tacccggtgt cgtcggcggc acgcttcagg ccgctaccat atgcgctagc 1680
agtcaccaat tccttagtac gcactataac ctccataatt tgtacggact tactgaggcg 1740
attgctagtc atcgagcgct cgtaaaagct cgcggtaccc ggcccttcgt gattagtagg 1800
agtacattcg ccgggcatgg tcgatatgcg ggccactgga ctggggatgt ctggtccagc 1860
tgggagcagt tggcttcctc agtccctgaa attttgcaat ttaacctgct tggtgtgccg 1920
cttgttggcg cggacgtttg cgggtttttg ggtaatacca gtgaagaact gtgtgttagg 1980
tggacacagc ttggggcatt ctatcctttc atgcggaatc acaacagtct tctgtcattg 2040
ccgcaggaac cgtactcttt cagtgagcct gcccagcagg cgatgcggaa ggccctcaca 2100
ttgcgatacg cacttctccc gcatctttat acgcttttcc accaggccca tgttgcgggc 2160
gagacagtcg ccaggccact cttccttgag tttccgaaag acagcagcac ctggacggtt 2220
gaccatcagc tcctctgggg tgaagctttg ttgattaccc ccgtgctgca ggcgggcaag 2280
gcggaagtaa caggctactt cccgctggga acctggtatg accttcagac agtgccgatc 2340
gaagctcttg gctcactgcc accacctccg gcagccccgc gggaaccagc gattcactcc 2400
gagggccaat gggttacgct tccggctcca cttgacacca tcaatgtcca tcttcgcgcg 2460
ggatacatta tcccgcttca gggacctggc ttgactacta cagagtctcg ccaacagccg 2520
atggcactcg cagtagctct gactaaagga ggtgaggcgc ggggtgaact cttttgggat 2580
gatggggaat ccctggaggt tttggagagg ggtgcgtaca cgcaagtaat ctttctcgct 2640
cgaaacaata cgatcgtcaa tgagctcgtc agggtaacgt ctgagggggc cggtttgcaa 2700
cttcagaaag tcactgtact tggcgtagcc actgctcctc aacaagtcct ttcaaacggg 2760
gttcctgtgt caaactttac ctattcaccc gataccaagg ttttggacat atgcgtgtct 2820
ttgttgatgg gcgaacaatt tctggtttct tggtgctag 2859
<210> 75
<211> 2859
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成
的多核苷酸
<400> 75
atgggcgtta gacaccctcc atgctctcat agactgctgg ccgtgtgtgc tctggtgtct 60
cttgctacag ctgccctgct gggacatatc ctgctgcacg attttctgct ggtgcccaga 120
gagctgtctg gcagctctcc agtgctggaa gaaacacacc ctgcacatca gcagggcgcc 180
tctagacctg gacctagaga tgctcaagcc catcctggca gacctagagc cgtgcctaca 240
cagtgtgacg tgccacctaa cagcagattc gactgcgccc ctgacaaggc catcacacaa 300
gagcagtgtg aagccagagg ctgctgctac attcctgcca aacaaggact gcagggcgct 360
cagatgggac agccttggtg cttcttccca ccatcttacc ccagctacaa gctggaaaac 420
ctgagcagca gcgagatggg ctacaccgcc acactgacca gaaccacacc tacattcttc 480
ccaaaggaca tcctgacact gcggctggac gtgatgatgg aaaccgagaa ccggctgcac 540
ttcaccatca aggaccccgc caatagaaga tacgaggtgc ccctggaaac ccctagagtg 600
cattctagag ccccatctcc actgtacagc gtggaattca gcgaggaacc cttcggcgtg 660
atcgtgcaca gacagctgga tggcagagtg ctgctgaata ccacagtggc ccctctgttc 720
ttcgccgacc agtttctgca gctgagcaca agcctgccta gccagtatat cacaggcctg 780
gccgaacacc tgtctccact gatgctgagc accagctgga ccagaatcac cctgtggaac 840
agagatctgg cccctacacc tggcgccaat ctgtacggct ctcacccttt ttatctggcc 900
ctggaagatg gcggaagcgc ccacggtgtc tttctgctga acagcaacgc catggacgtg 960
gtgctgcaac catctcctgc tctgtcttgg agaagcaccg gcggcatcct ggacgtgtac 1020
atctttctgg gccctgagcc taagagcgtg gtgcagcagt atctggatgt cgtgggctac 1080
cccttcatgc ctccttattg gggcctgggc ttccacctgt gtagatgggg atacagctcc 1140
accgccatca ccagacaggt ggtggaaaac atgacccggg ctcacttccc actggatgtg 1200
cagtggaacg acctggacta catggacagc agacgggact tcaccttcaa caaggacggc 1260
ttcagagact tccccgccat ggtgcaagaa ctgcatcaag gcggcagacg gtacatgatg 1320
atcgtggatc ctgccatctc ttctagcggc cctgccggct cttacagacc ttatgatgag 1380
ggcctgagaa gaggcgtgtt catcaccaat gagacaggcc agcctctgat cggcaaagtg 1440
tggcctggat ccaccgcctt tccagacttc accaatccta ccgctctggc ttggtgggaa 1500
gatatggtgg ccgagtttca cgatcaggtg cccttcgacg gcatgtggat cgacatgaac 1560
gagcccagca acttcatcag aggcagcgag gacggctgcc ccaacaacga actggaaaat 1620
cctccttacg tgccaggcgt tgtcggagga acactgcagg ccgccacaat ttgtgccagc 1680
agccatcagt ttctgagcac ccactacaac ctgcacaacc tgtacggcct gaccgaggcc 1740
attgcttctc acagagccct ggttaaggcc agaggcacca gacctttcgt gatcagcaga 1800
agcacattcg ccggccacgg cagatatgct ggacattgga caggcgacgt gtggtctagt 1860
tgggagcagc tggctagctc tgtgcccgag atcctgcagt ttaatctgct gggagtgcct 1920
ctcgtgggcg ccgatgtttg tggctttctg ggaaacacct ccgaggaact gtgtgtgcgt 1980
tggacacagc tgggcgcctt ctatcccttc atgagaaacc acaacagcct gctgagcctg 2040
cctcaagagc cttacagctt tagcgaaccc gcacagcagg ccatgagaaa ggccctgact 2100
ctgagatacg ctctgctgcc ccacctgtac accctgtttc atcaggctca tgtggccggg 2160
gaaacagtgg ctagacccct gttcctggaa ttccccaagg atagcagcac ctggaccgtg 2220
gatcatcagc tgctttgggg cgaagctctg ctgattacac ctgtgctgca ggctggcaag 2280
gccgaagtga caggctattt tcccctcggc acttggtacg acctgcagac agtgcctatt 2340
gaggccctgg gatctcttcc tccacctcct gctgctccta gagagcctgc cattcactct 2400
gaaggccagt gggttacact gcccgctcct ctggacacca tcaatgtgca cctgagagcc 2460
ggctacatca tccctctgca aggccctgga ctgaccacaa ccgaaagcag acagcagcca 2520
atggctctgg ccgtggcact gacaaaaggc ggagaagcta gaggcgagct gttctgggat 2580
gatggcgagt ctctggaagt gctcgagaga ggcgcctaca cacaagtgat ctttctcgcc 2640
cggaacaaca ccatcgtgaa cgaactcgtc agagtgacca gtgaaggtgc cggactgcag 2700
ctccagaaag tgacagtgct tggagtggcc acagctcctc agcaggttct gtctaatggc 2760
gtgcccgtgt ccaacttcac atacagccct gacaccaagg tgctggatat ctgcgtgtca 2820
ctgctgatgg gcgagcagtt cctggtgtcc tggtgttga 2859
<210> 76
<211> 2859
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成
的多核苷酸
<400> 76
atgggcgtga ggcacccacc ttgctctcac aggctgctgg ccgtgtgcgc actggtgagc 60
ctggcaaccg ccgccctgct gggccacatc ctgctgcacg acttcctgct ggtgccaagg 120
gagctgtccg gaagctcccc agtgctggag gagacccacc cagcacacca gcagggagca 180
tctaggccag gccccagaga tgcacaggca cacccaggca gacccagagc agtgccaacc 240
cagtgcgacg tgccaccaaa cagccggttt gactgtgccc ccgataaggc catcacacag 300
gagcagtgcg aggccagagg ctgctgttat atccctgcaa agcagggact gcagggagca 360
cagatgggac agccatggtg tttctttcct ccatcttacc ccagctataa gctggagaat 420
ctgtctagct ccgagatggg ctacacagcc accctgacaa gaaccacacc aacattcttt 480
cccaaggata tcctgaccct gcggctggac gtgatgatgg agacagagaa cagactgcac 540
ttcaccatca aggatcccgc caatcggaga tatgaggtgc ctctggagac cccaagggtg 600
cactctaggg cacctagccc actgtactcc gtggagttct ctgaggagcc atttggcgtg 660
atcgtgcacc ggcagctgga tggcagagtg ctgctgaaca ccacagtggc ccccctgttc 720
tttgccgacc agttcctgca gctgagcaca tccctgccct cccagtatat caccggcctg 780
gccgagcacc tgtctcctct gatgctgtct accagctgga caaggatcac cctgtggaac 840
agggacctgg caccaacccc tggagcaaat ctgtacggca gccacccctt ctatctggcc 900
ctggaggatg gaggatccgc ccacggcgtg tttctgctga actctaatgc catggacgtg 960
gtgctgcagc caagccccgc cctgtcctgg aggtctaccg gaggcatcct ggacgtgtac 1020
atcttcctgg gccctgagcc aaagtccgtg gtgcagcagt acctggacgt ggtgggctat 1080
cctttcatgc ccccttactg gggactggga tttcacctgt gcagatgggg ctattctagc 1140
acagccatca cccggcaggt ggtggagaac atgaccagag cccactttcc actggatgtg 1200
cagtggaatg acctggatta catggactcc aggcgcgact tcaccttcaa caaggacggc 1260
ttccgggatt ttcccgccat ggtgcaggag ctgcaccagg gaggccggag atacatgatg 1320
atcgtggatc ctgcaatctc ctctagcgga cctgcaggaa gctacagacc atatgacgag 1380
ggcctgaggc gcggcgtgtt catcacaaac gagaccggcc agcctctgat cggcaaggtc 1440
tggccaggct ccaccgcctt cccagacttc accaatccaa ccgccctggc atggtgggag 1500
gacatggtgg ccgagttcca cgaccaggtg ccttttgatg gcatgtggat cgacatgaac 1560
gagccatcta atttcatcag gggaagcgag gacggatgcc caaacaatga gctggagaat 1620
ccaccatatg tgcctggagt ggtgggaggc acactgcagg cagcaaccat ctgtgcctcc 1680
tctcaccagt ttctgtctac acactataac ctgcacaatc tgtacggact gaccgaggca 1740
atcgcaagcc acagagccct ggtgaaggca aggggaacaa ggcctttcgt gatctccagg 1800
tctacctttg ccggacacgg ccgctacgca ggacactgga ccggcgacgt gtggagctcc 1860
tgggagcagc tggcctctag cgtgccagag atcctgcagt tcaacctgct gggagtgcca 1920
ctggtgggag cagacgtgtg cggctttctg ggcaatacaa gcgaggagct gtgcgtgcgg 1980
tggacccagc tgggagcctt ctatcccttt atgagaaacc acaatagcct gctgtccctg 2040
cctcaggagc catacagctt ctccgagcct gcacagcagg caatgaggaa ggccctgaca 2100
ctgagatatg ccctgctgcc acacctgtac accctgtttc accaggcaca cgtggcagga 2160
gagacagtgg ccaggcccct gttcctggag tttcctaagg attcctctac ctggacagtg 2220
gaccaccagc tgctgtgggg agaggccctg ctgatcaccc ccgtgctgca ggcaggcaag 2280
gcagaggtga caggctattt ccctctgggc acatggtacg atctgcagac cgtgccaatc 2340
gaggccctgg gaagcctgcc tccaccacct gcagcaccaa gggagcctgc catccactcc 2400
gagggacagt gggtgacact gccagcacct ctggacacca tcaacgtgca cctgagggcc 2460
ggctatatca tcccactgca gggacctgga ctgaccacaa ccgagagcag gcagcagcca 2520
atggcactgg cagtggccct gaccaaggga ggcgaggcca ggggcgagct gttctgggac 2580
gatggagagt ccctggaggt gctggagagg ggagcctaca cacaggtcat cttcctggcc 2640
aggaacaata caatcgtgaa tgagctggtg cgcgtgacct ctgagggagc aggactgcag 2700
ctgcagaagg tgacagtgct gggagtggca accgcaccac agcaggtgct gtccaacggc 2760
gtgcccgtga gcaatttcac atactcccct gataccaagg tgctggacat ctgcgtgagc 2820
ctgctgatgg gcgagcagtt tctggtgtcc tggtgttga 2859
<210> 77
<400> 77
000
<210> 78
<211> 2032
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成
的多核苷酸
<400> 78
aagtgccgac ccgtctgaat agtagatccc gtcgagggct tgaatctatc accatagagt 60
acacccatag agaatagcta gctctcaatt gactaaggac taaacttggt atttcgactg 120
aagcctgtca ctcctcactg ttggcgctag tgaggagagt tcgtagaaag gatagtacga 180
tttaagtatc tctaagcctt gtgaagcact aaggttgcgt acagacgtgc ttgaattacg 240
gataattcgt ggaaccttgg gatagtgcgc ctctgacttc tctgtgggta ttgacctgag 300
ttctactcta gcgtttgctg gttcgtgtga actaatctgt gagatcctca caactctccg 360
tttgggatct ccactctctg gtgtcctaac acttggtgcc acacactgtc tactgctagt 420
gagaccttat ctgtctgctg agaaactgtg tgctgttact ctaactaagc gatctgtctg 480
cacttgcact ctgaatactt ctaccgtaac taactctcac ggactctcag aactcagacg 540
gatctactgc tgtctcaaat caacaccaga cttagattac tctctgttaa gttgaaagac 600
tctctacaaa tccacactgt ggtctagttg aacaagcttg agagagtatc tgtctgcata 660
tcaagagtga gagtgtctct ggatttggag tagttgagaa gtggaaccat agcgagtcta 720
ctgcctgtgt caacttcaat tagagtgttg aatagaggac tgactctcga attgaagtat 780
cctgccaact gtctcaactt aattcaaacg ctattttcgt taactgtctc aactctcgtc 840
aagttgagag gaagagtaga gccatagttt gaagcctgat aagagttcgt ctgaggacgt 900
attgtgtgtc aagacgaact gaaggatttc aacaaataga gaagcttgac actgtccttc 960
aactgtctga actgtagcac tctggatagc tagctagcgt ttgtagatag tttcaaggat 1020
agcaaccaac aacacgatag tttagaaatt gttctagatc ttctgctact actcgagaga 1080
tagttgactt ctagaagact ctggatagag agcttcctgt ggtttctatt tcaacacttc 1140
tgagcgattt agatagaggc gtcaattgag aacaaaaact ggacacctgt ttctagaaca 1200
ctagtgctag tcttctcaag gcttgatact gtcctgccac tcaagagaaa tgttctggca 1260
cctgcacttg cactggggac agcctatttt gctagtttgt tttgtttcgt tttgttttga 1320
tggagagcgt atgttagtac tatcgattca cacaaaaaac caacacacag atgtaatgaa 1380
aataaagata ttttattaga gagcgagtgg atagtttaga gtcgcttgag acttatcctg 1440
tgtccaacta gccaagagta gagagagagt gactaggtgg atcgagagat cgtcgtctat 1500
ttgactgcta gcctgtgttc tcgtcgtagt ccaaatcttc aatactctgg cgactagtaa 1560
cttgaatctg tgtatctaac acgacaaggc tactcctttg agtttctagt gataagtgcg 1620
actggatcta gctagttgag tttctagaaa ctactgtcca aagctactag cactaaggtc 1680
tctctgtgaa agagtggtct acttttgagg agaagaaagt tctagcgtag tagcaattcc 1740
tttggtggaa gaggctatcg agagtcaact ctgccttcaa gtagcttcca aaagtaaaca 1800
actgtggatc gtttctaatc tcaagacgct tgaaagagca agagcttgta ttgatcgagg 1860
tggtattgag atagttaaga ctgtccaaga attacgacta ccaaagatct tcgttagcaa 1920
cgaaacttga gaacgtttct aagcctgtga cttaaactct cctgcttggt gcctgccttt 1980
gaatctggac tcgtagagca cgaggaagag aagtcgattt ctagagcctg ct 2032
<210> 79
<211> 4256
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成
的多核苷酸
<400> 79
tcgagcttgg gctgcaggtc gagggcactg ggaggatgtt gagtaagatg gaaaactact 60
gatgaccctt gcagagacag agtattagga catgtttgaa caggggccgg gcgatcagca 120
ggtagctcta gaggatcccc gtctgtctgc acatttcgta gagcgagtgt tccgatactc 180
taatctccct aggcaaggtt catatttgtg taggttactt attctccttt tgttgactaa 240
gtcaataatc agaatcagca ggtttggagt cagcttggca gggatcagca gcctgggttg 300
gaaggagggg gtataaaagc cccttcacca ggagaagccg tcacacagac tagccctaag 360
gtaagttggc gccgtttaag ggatggttgg ttggtggggt attaatgttt aattaccttt 420
tttacaggcc tgaactaggc gcgccaccgc caccatgccg tcttctgtct cgtggggcat 480
cctcctgctg gcaggcctgt gctgcctggt ccctgtctcc ctggctgctt accgccccag 540
tgagaccctg tgcggcgggg agctggtgga caccctccag ttcgtctgtg gggaccgcgg 600
cttctacttc agcaggcccg caagccgtgt gagccgtcgc agccgtggca tcatggagga 660
gtgctgtttc cgcagctgtg acctggccct cctggagacg tactgtgcta cccccgccaa 720
gtccgagggc gcgccggcac accccggccg tcccagagca gtgcccacac agtgcgacgt 780
cccccccaac agccgcttcg attgcgcccc tgacaaggcc atcacccagg aacagtgcga 840
ggcccgcggc tgctgctaca tccctgcaaa gcaggggctg cagggagccc agatggggca 900
gccctggtgc ttcttcccac ccagctaccc cagctacaag ctggagaacc tgagctcctc 960
tgaaatgggc tacacggcca ccctgacccg taccaccccc accttcttcc ccaaggacat 1020
cctgaccctg cggctggacg tgatgatgga gactgagaac cgcctccact tcacgatcaa 1080
agatccagct aacaggcgct acgaggtgcc cttggagacc ccgcgtgtcc acagccgggc 1140
accgtcccca ctctacagcg tggagttctc cgaggagccc ttcggggtga tcgtgcaccg 1200
gcagctggac ggccgcgtgc tgctgaacac gacggtggcg cccctgttct ttgcggacca 1260
gttccttcag ctgtccacct cgctgccctc gcagtatatc acaggcctcg ccgagcacct 1320
cagtcccctg atgctcagca ccagctggac caggatcacc ctgtggaacc gggaccttgc 1380
gcccacgccc ggtgcgaacc tctacgggtc tcaccctttc tacctggcgc tggaggacgg 1440
cgggtcggca cacggggtgt tcctgctaaa cagcaatgcc atggatgtgg tcctgcagcc 1500
gagccctgcc cttagctgga ggtcgacagg tgggatcctg gatgtctaca tcttcctggg 1560
cccagagccc aagagcgtgg tgcagcagta cctggacgtt gtgggatacc cgttcatgcc 1620
gccatactgg ggcctgggct tccacctgtg ccgctggggc tactcctcca ccgctatcac 1680
ccgccaggtg gtggagaaca tgaccagggc ccacttcccc ctggacgtcc aatggaacga 1740
cctggactac atggactccc ggagggactt cacgttcaac aaggatggct tccgggactt 1800
cccggccatg gtgcaggagc tgcaccaggg cggccggcgc tacatgatga tcgtggatcc 1860
tgccatcagc agctcgggcc ctgccgggag ctacaggccc tacgacgagg gtctgcggag 1920
gggggttttc atcaccaacg agaccggcca gccgctgatt gggaaggtat ggcccgggtc 1980
cactgccttc cccgacttca ccaaccccac agccctggcc tggtgggagg acatggtggc 2040
tgagttccat gaccaggtgc ccttcgacgg catgtggatt gacatgaacg agccttccaa 2100
cttcatcaga ggctctgagg acggctgccc caacaatgag ctggagaacc caccctacgt 2160
gcctggggtg gttgggggga ccctccaggc ggccaccatc tgtgcctcca gccaccagtt 2220
tctctccaca cactacaacc tgcacaacct ctacggcctg accgaagcca tcgcctccca 2280
cagggcgctg gtgaaggctc gggggacacg cccatttgtg atctcccgct cgacctttgc 2340
tggccacggc cgatacgccg gccactggac gggggacgtg tggagctcct gggagcagct 2400
cgcctcctcc gtgccagaaa tcctgcagtt taacctgctg ggggtgcctc tggtcggggc 2460
cgacgtctgc ggcttcctgg gcaacacctc agaggagctg tgtgtgcgct ggacccagct 2520
gggggccttc taccccttca tgcggaacca caacagcctg ctcagtctgc cccaggagcc 2580
gtacagcttc agcgagccgg cccagcaggc catgaggaag gccctcaccc tgcgctacgc 2640
actcctcccc cacctctaca cactgttcca ccaggcccac gtcgcggggg agaccgtggc 2700
ccggcccctc ttcctggagt tccccaagga ctctagcacc tggactgtgg accaccagct 2760
cctgtggggg gaggccctgc tcatcacccc agtgctccag gccgggaagg ccgaagtgac 2820
tggctacttc cccttgggca catggtacga cctgcagacg gtgccaatag aggcccttgg 2880
cagcctccca cccccacctg cagctccccg tgagccagcc atccacagcg aggggcagtg 2940
ggtgacgctg ccggcccccc tggacaccat caacgtccac ctccgggctg ggtacatcat 3000
ccccctgcag ggccctggcc tcacaaccac agagtcccgc cagcagccca tggccctggc 3060
tgtggccctg accaagggtg gagaggcccg aggggagctg ttctgggacg atggagagag 3120
cctggaagtg ctggagcgag gggcctacac acaggtcatc ttcctggcca ggaataacac 3180
gatcgtgaat gagctggtac gtgtgaccag tgagggagct ggcctgcagc tgcagaaggt 3240
gactgtcctg ggcgtggcca cggcgcccca gcaggtcctc tccaacggtg tccctgtctc 3300
caacttcacc tacagccccg acaccaaggt cctggacatc tgtgtctcgc tgttgatggg 3360
agagcagttt ctcgtcagct ggtgttagcg agcggccgct cttagtagca gtatcgatcc 3420
cagcccactt ttccccaata cgactacgag atctgtggct tctagctgcc cgggtggcat 3480
ccctgtgacc cctccccagt gcctctcctg gccctggaag ttgccactcc agtgcccacc 3540
agccttgtcc taataaaatt aagttgcatc attttgtctg actaggtgtc cttctataat 3600
attatggggt ggaggggggt ggtatggagc aaggggcaag ttggggtcct tcaacgtcga 3660
actgtagcac tctggatagc tagctagcgt ttgtagatag tttcaaggat agcaaccaac 3720
aacacgatag tttagaaatt gttctagatc ttctgctact actcgagaga tagttgactt 3780
ctagaagact ctggatagag agcttcctgt ggtttctatt tcaacacttc gagcgattta 3840
gatagaggcg tcaattgaga acaaaaactg gacacctgtt tctagaacac tagtgctagt 3900
cttctcaagg cttgatacgt cctgccactc acacacaaaa aaccaacaca cagattaatg 3960
aaaataaaga tcttttatta gagagcgagt ggatagttta gagtcgcttg agacttatcc 4020
tgtgtccaac tagccaagag tagagagaga gtgactaggt ggatcgagag atcgtcgtct 4080
atttgactgc tagcctgtgt tctcgtcgta gtccaaatct tcaatactct ggcgactagt 4140
aacttgaatc tgtgtatcta acacgacaag gctactcctt tgagtttcta gtgataagtg 4200
cgactggatc tagctagttg agtttctaga aactacgtcc aaagctacta gcacta 4256
<210> 80
<211> 4280
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成
的多核苷酸
<400> 80
tcgagcttgg gctgcaggtc gagggcactg ggaggatgtt gagtaagatg gaaaactact 60
gatgaccctt gcagagacag agtattagga catgtttgaa caggggccgg gcgatcagca 120
ggtagctcta gaggatcccc gtctgtctgc acatttcgta gagcgagtgt tccgatactc 180
taatctccct aggcaaggtt catatttgtg taggttactt attctccttt tgttgactaa 240
gtcaataatc agaatcagca ggtttggagt cagcttggca gggatcagca gcctgggttg 300
gaaggagggg gtataaaagc cccttcacca ggagaagccg tcacacagac tagccctaag 360
gtaagttggc gccgtttaag ggatggttgg ttggtggggt attaatgttt aattaccttt 420
tttacaggcc tgaactaggc gcgccaccgc caccatgctc aggggtccgg gacccgggcg 480
gctgctgctg ctagcagtcc tgtgcctggg gacatcggtg cgctgcaccg aaaccgggaa 540
gagcaagagg gcttaccgcc ccagtgagac cctgtgcggc ggggagctgg tggacaccct 600
ccagttcgtc tgtggggacc gcggcttcta cttcagcagg cccgcaagcc gtgtgagccg 660
tcgcagccgt ggcatcatgg aggagtgctg tttccgcagc tgtgacctgg ccctcctgga 720
gacgtactgt gctacccccg ccaagtccga gggcgcgccg gcacaccccg gccgtcccag 780
agcagtgccc acacagtgcg acgtcccccc caacagccgc ttcgattgcg cccctgacaa 840
ggccatcacc caggaacagt gcgaggcccg cggctgctgc tacatccctg caaagcaggg 900
gctgcaggga gcccagatgg ggcagccctg gtgcttcttc ccacccagct accccagcta 960
caagctggag aacctgagct cctctgaaat gggctacacg gccaccctga cccgtaccac 1020
ccccaccttc ttccccaagg acatcctgac cctgcggctg gacgtgatga tggagactga 1080
gaaccgcctc cacttcacga tcaaagatcc agctaacagg cgctacgagg tgcccttgga 1140
gaccccgcgt gtccacagcc gggcaccgtc cccactctac agcgtggagt tctccgagga 1200
gcccttcggg gtgatcgtgc accggcagct ggacggccgc gtgctgctga acacgacggt 1260
ggcgcccctg ttctttgcgg accagttcct tcagctgtcc acctcgctgc cctcgcagta 1320
tatcacaggc ctcgccgagc acctcagtcc cctgatgctc agcaccagct ggaccaggat 1380
caccctgtgg aaccgggacc ttgcgcccac gcccggtgcg aacctctacg ggtctcaccc 1440
tttctacctg gcgctggagg acggcgggtc ggcacacggg gtgttcctgc taaacagcaa 1500
tgccatggat gtggtcctgc agccgagccc tgcccttagc tggaggtcga caggtgggat 1560
cctggatgtc tacatcttcc tgggcccaga gcccaagagc gtggtgcagc agtacctgga 1620
cgttgtggga tacccgttca tgccgccata ctggggcctg ggcttccacc tgtgccgctg 1680
gggctactcc tccaccgcta tcacccgcca ggtggtggag aacatgacca gggcccactt 1740
ccccctggac gtccaatgga acgacctgga ctacatggac tcccggaggg acttcacgtt 1800
caacaaggat ggcttccggg acttcccggc catggtgcag gagctgcacc agggcggccg 1860
gcgctacatg atgatcgtgg atcctgccat cagcagctcg ggccctgccg ggagctacag 1920
gccctacgac gagggtctgc ggaggggggt tttcatcacc aacgagaccg gccagccgct 1980
gattgggaag gtatggcccg ggtccactgc cttccccgac ttcaccaacc ccacagccct 2040
ggcctggtgg gaggacatgg tggctgagtt ccatgaccag gtgcccttcg acggcatgtg 2100
gattgacatg aacgagcctt ccaacttcat cagaggctct gaggacggct gccccaacaa 2160
tgagctggag aacccaccct acgtgcctgg ggtggttggg gggaccctcc aggcggccac 2220
catctgtgcc tccagccacc agtttctctc cacacactac aacctgcaca acctctacgg 2280
cctgaccgaa gccatcgcct cccacagggc gctggtgaag gctcggggga cacgcccatt 2340
tgtgatctcc cgctcgacct ttgctggcca cggccgatac gccggccact ggacggggga 2400
cgtgtggagc tcctgggagc agctcgcctc ctccgtgcca gaaatcctgc agtttaacct 2460
gctgggggtg cctctggtcg gggccgacgt ctgcggcttc ctgggcaaca cctcagagga 2520
gctgtgtgtg cgctggaccc agctgggggc cttctacccc ttcatgcgga accacaacag 2580
cctgctcagt ctgccccagg agccgtacag cttcagcgag ccggcccagc aggccatgag 2640
gaaggccctc accctgcgct acgcactcct cccccacctc tacacactgt tccaccaggc 2700
ccacgtcgcg ggggagaccg tggcccggcc cctcttcctg gagttcccca aggactctag 2760
cacctggact gtggaccacc agctcctgtg gggggaggcc ctgctcatca ccccagtgct 2820
ccaggccggg aaggccgaag tgactggcta cttccccttg ggcacatggt acgacctgca 2880
gacggtgcca atagaggccc ttggcagcct cccaccccca cctgcagctc cccgtgagcc 2940
agccatccac agcgaggggc agtgggtgac gctgccggcc cccctggaca ccatcaacgt 3000
ccacctccgg gctgggtaca tcatccccct gcagggccct ggcctcacaa ccacagagtc 3060
ccgccagcag cccatggccc tggctgtggc cctgaccaag ggtggagagg cccgagggga 3120
gctgttctgg gacgatggag agagcctgga agtgctggag cgaggggcct acacacaggt 3180
catcttcctg gccaggaata acacgatcgt gaatgagctg gtacgtgtga ccagtgaggg 3240
agctggcctg cagctgcaga aggtgactgt cctgggcgtg gccacggcgc cccagcaggt 3300
cctctccaac ggtgtccctg tctccaactt cacctacagc cccgacacca aggtcctgga 3360
catctgtgtc tcgctgttga tgggagagca gtttctcgtc agctggtgtt agcgagcggc 3420
cgctcttagt agcagtatcg atcccagccc acttttcccc aatacgacta cgagatctgt 3480
ggcttctagc tgcccgggtg gcatccctgt gacccctccc cagtgcctct cctggccctg 3540
gaagttgcca ctccagtgcc caccagcctt gtcctaataa aattaagttg catcattttg 3600
tctgactagg tgtccttcta taatattatg gggtggaggg gggtggtatg gagcaagggg 3660
caagttgggg tccttcaacg tcgaactgta gcactctgga tagctagcta gcgtttgtag 3720
atagtttcaa ggatagcaac caacaacacg atagtttaga aattgttcta gatcttctgc 3780
tactactcga gagatagttg acttctagaa gactctggat agagagcttc ctgtggtttc 3840
tatttcaaca cttcgagcga tttagataga ggcgtcaatt gagaacaaaa actggacacc 3900
tgtttctaga acactagtgc tagtcttctc aaggcttgat acgtcctgcc actcacacac 3960
aaaaaaccaa cacacagatt aatgaaaata aagatctttt attagagagc gagtggatag 4020
tttagagtcg cttgagactt atcctgtgtc caactagcca agagtagaga gagagtgact 4080
aggtggatcg agagatcgtc gtctatttga ctgctagcct gtgttctcgt cgtagtccaa 4140
atcttcaata ctctggcgac tagtaacttg aatctgtgta tctaacacga caaggctact 4200
cctttgagtt tctagtgata agtgcgactg gatctagcta gttgagtttc tagaaactac 4260
gtccaaagct actagcacta 4280
<210> 81
<211> 4277
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成
的多核苷酸
<400> 81
tcgagcttgg gctgcaggtc gagggcactg ggaggatgtt gagtaagatg gaaaactact 60
gatgaccctt gcagagacag agtattagga catgtttgaa caggggccgg gcgatcagca 120
ggtagctcta gaggatcccc gtctgtctgc acatttcgta gagcgagtgt tccgatactc 180
taatctccct aggcaaggtt catatttgtg taggttactt attctccttt tgttgactaa 240
gtcaataatc agaatcagca ggtttggagt cagcttggca gggatcagca gcctgggttg 300
gaaggagggg gtataaaagc cccttcacca ggagaagccg tcacacagac tagccctaag 360
gtaagttggc gccgtttaag ggatggttgg ttggtggggt attaatgttt aattaccttt 420
tttacaggcc tgaactaggc gcgccaccgc caccatgctt aggggtccgg ggcccgggct 480
gctgctgctg gccgtccagt gcctggggac agcggtgccc tccacgggag cctcgaagag 540
caagagggct taccgcccca gtgagaccct gtgcggcggg gagctggtgg acaccctcca 600
gttcgtctgt ggggaccgcg gcttctactt cagcaggccc gcaagccgtg tgagccgtcg 660
cagccgtggc atcatggagg agtgctgttt ccgcagctgt gacctggccc tcctggagac 720
gtactgtgct acccccgcca agtccgaggg cgcgccggca caccccggcc gtcccagagc 780
agtgcccaca cagtgcgacg tcccccccaa cagccgcttc gattgcgccc ctgacaaggc 840
catcacccag gaacagtgcg aggcccgcgg ctgctgctac atccctgcaa agcaggggct 900
gcagggagcc cagatggggc agccctggtg cttcttccca cccagctacc ccagctacaa 960
gctggagaac ctgagctcct ctgaaatggg ctacacggcc accctgaccc gtaccacccc 1020
caccttcttc cccaaggaca tcctgaccct gcggctggac gtgatgatgg agactgagaa 1080
ccgcctccac ttcacgatca aagatccagc taacaggcgc tacgaggtgc ccttggagac 1140
cccgcgtgtc cacagccggg caccgtcccc actctacagc gtggagttct ccgaggagcc 1200
cttcggggtg atcgtgcacc ggcagctgga cggccgcgtg ctgctgaaca cgacggtggc 1260
gcccctgttc tttgcggacc agttccttca gctgtccacc tcgctgccct cgcagtatat 1320
cacaggcctc gccgagcacc tcagtcccct gatgctcagc accagctgga ccaggatcac 1380
cctgtggaac cgggaccttg cgcccacgcc cggtgcgaac ctctacgggt ctcacccttt 1440
ctacctggcg ctggaggacg gcgggtcggc acacggggtg ttcctgctaa acagcaatgc 1500
catggatgtg gtcctgcagc cgagccctgc ccttagctgg aggtcgacag gtgggatcct 1560
ggatgtctac atcttcctgg gcccagagcc caagagcgtg gtgcagcagt acctggacgt 1620
tgtgggatac ccgttcatgc cgccatactg gggcctgggc ttccacctgt gccgctgggg 1680
ctactcctcc accgctatca cccgccaggt ggtggagaac atgaccaggg cccacttccc 1740
cctggacgtc caatggaacg acctggacta catggactcc cggagggact tcacgttcaa 1800
caaggatggc ttccgggact tcccggccat ggtgcaggag ctgcaccagg gcggccggcg 1860
ctacatgatg atcgtggatc ctgccatcag cagctcgggc cctgccggga gctacaggcc 1920
ctacgacgag ggtctgcgga ggggggtttt catcaccaac gagaccggcc agccgctgat 1980
tgggaaggta tggcccgggt ccactgcctt ccccgacttc accaacccca cagccctggc 2040
ctggtgggag gacatggtgg ctgagttcca tgaccaggtg cccttcgacg gcatgtggat 2100
tgacatgaac gagccttcca acttcatcag aggctctgag gacggctgcc ccaacaatga 2160
gctggagaac ccaccctacg tgcctggggt ggttgggggg accctccagg cggccaccat 2220
ctgtgcctcc agccaccagt ttctctccac acactacaac ctgcacaacc tctacggcct 2280
gaccgaagcc atcgcctccc acagggcgct ggtgaaggct cgggggacac gcccatttgt 2340
gatctcccgc tcgacctttg ctggccacgg ccgatacgcc ggccactgga cgggggacgt 2400
gtggagctcc tgggagcagc tcgcctcctc cgtgccagaa atcctgcagt ttaacctgct 2460
gggggtgcct ctggtcgggg ccgacgtctg cggcttcctg ggcaacacct cagaggagct 2520
gtgtgtgcgc tggacccagc tgggggcctt ctaccccttc atgcggaacc acaacagcct 2580
gctcagtctg ccccaggagc cgtacagctt cagcgagccg gcccagcagg ccatgaggaa 2640
ggccctcacc ctgcgctacg cactcctccc ccacctctac acactgttcc accaggccca 2700
cgtcgcgggg gagaccgtgg cccggcccct cttcctggag ttccccaagg actctagcac 2760
ctggactgtg gaccaccagc tcctgtgggg ggaggccctg ctcatcaccc cagtgctcca 2820
ggccgggaag gccgaagtga ctggctactt ccccttgggc acatggtacg acctgcagac 2880
ggtgccaata gaggcccttg gcagcctccc acccccacct gcagctcccc gtgagccagc 2940
catccacagc gaggggcagt gggtgacgct gccggccccc ctggacacca tcaacgtcca 3000
cctccgggct gggtacatca tccccctgca gggccctggc ctcacaacca cagagtcccg 3060
ccagcagccc atggccctgg ctgtggccct gaccaagggt ggagaggccc gaggggagct 3120
gttctgggac gatggagaga gcctggaagt gctggagcga ggggcctaca cacaggtcat 3180
cttcctggcc aggaataaca cgatcgtgaa tgagctggta cgtgtgacca gtgagggagc 3240
tggcctgcag ctgcagaagg tgactgtcct gggcgtggcc acggcgcccc agcaggtcct 3300
ctccaacggt gtccctgtct ccaacttcac ctacagcccc gacaccaagg tcctggacat 3360
ctgtgtctcg ctgttgatgg gagagcagtt tctcgtcagc tggtgttagc gagcggccgc 3420
tcttagtagc agtatcgatc ccagcccact tttccccaat acgactacga gatctgtggc 3480
ttctagctgc ccgggtggca tccctgtgac ccctccccag tgcctctcct ggccctggaa 3540
gttgccactc cagtgcccac cagccttgtc ctaataaaat taagttgcat cattttgtct 3600
gactaggtgt ccttctataa tattatgggg tggagggggg tggtatggag caaggggcaa 3660
gttggggtcc ttcaacgtcg aactgtagca ctctggatag ctagctagcg tttgtagata 3720
gtttcaagga tagcaaccaa caacacgata gtttagaaat tgttctagat cttctgctac 3780
tactcgagag atagttgact tctagaagac tctggataga gagcttcctg tggtttctat 3840
ttcaacactt cgagcgattt agatagaggc gtcaattgag aacaaaaact ggacacctgt 3900
ttctagaaca ctagtgctag tcttctcaag gcttgatacg tcctgccact cacacacaaa 3960
aaaccaacac acagattaat gaaaataaag atcttttatt agagagcgag tggatagttt 4020
agagtcgctt gagacttatc ctgtgtccaa ctagccaaga gtagagagag agtgactagg 4080
tggatcgaga gatcgtcgtc tatttgactg ctagcctgtg ttctcgtcgt agtccaaatc 4140
ttcaatactc tggcgactag taacttgaat ctgtgtatct aacacgacaa ggctactcct 4200
ttgagtttct agtgataagt gcgactggat ctagctagtt gagtttctag aaactacgtc 4260
caaagctact agcacta 4277
<210> 82
<211> 4238
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成
的多核苷酸
<400> 82
tcgagcttgg gctgcaggtc gagggcactg ggaggatgtt gagtaagatg gaaaactact 60
gatgaccctt gcagagacag agtattagga catgtttgaa caggggccgg gcgatcagca 120
ggtagctcta gaggatcccc gtctgtctgc acatttcgta gagcgagtgt tccgatactc 180
taatctccct aggcaaggtt catatttgtg taggttactt attctccttt tgttgactaa 240
gtcaataatc agaatcagca ggtttggagt cagcttggca gggatcagca gcctgggttg 300
gaaggagggg gtataaaagc cccttcacca ggagaagccg tcacacagac tagccctaag 360
gtaagttggc gccgtttaag ggatggttgg ttggtggggt attaatgttt aattaccttt 420
tttacaggcc tgaactaggc gcgccaccgc caccatgccg tcttctgtct cgtggggcat 480
cctcctgctg gcaggcctgt gctgcctggt ccctgtctcc ctggctgctc tgtgcggcgg 540
ggagctggtg gacaccctcc agttcgtctg tggggaccgc ggcttctact tcagcaggcc 600
cgcaagccgt gtgagccgtc gcagccgtgg catcgttgag gagtgctgtt tccgcagctg 660
tgacctggcc ctcctggaga cgtactgtgc tacccccgcc aagtccgagg gcgcgccggc 720
acaccccggc cgtcccagag cagtgcccac acagtgcgac gtccccccca acagccgctt 780
cgattgcgcc cctgacaagg ccatcaccca ggaacagtgc gaggcccgcg gctgctgcta 840
catccctgca aagcaggggc tgcagggagc ccagatgggg cagccctggt gcttcttccc 900
acccagctac cccagctaca agctggagaa cctgagctcc tctgaaatgg gctacacggc 960
caccctgacc cgtaccaccc ccaccttctt ccccaaggac atcctgaccc tgcggctgga 1020
cgtgatgatg gagactgaga accgcctcca cttcacgatc aaagatccag ctaacaggcg 1080
ctacgaggtg cccttggaga ccccgcgtgt ccacagccgg gcaccgtccc cactctacag 1140
cgtggagttc tccgaggagc ccttcggggt gatcgtgcac cggcagctgg acggccgcgt 1200
gctgctgaac acgacggtgg cgcccctgtt ctttgcggac cagttccttc agctgtccac 1260
ctcgctgccc tcgcagtata tcacaggcct cgccgagcac ctcagtcccc tgatgctcag 1320
caccagctgg accaggatca ccctgtggaa ccgggacctt gcgcccacgc ccggtgcgaa 1380
cctctacggg tctcaccctt tctacctggc gctggaggac ggcgggtcgg cacacggggt 1440
gttcctgcta aacagcaatg ccatggatgt ggtcctgcag ccgagccctg cccttagctg 1500
gaggtcgaca ggtgggatcc tggatgtcta catcttcctg ggcccagagc ccaagagcgt 1560
ggtgcagcag tacctggacg ttgtgggata cccgttcatg ccgccatact ggggcctggg 1620
cttccacctg tgccgctggg gctactcctc caccgctatc acccgccagg tggtggagaa 1680
catgaccagg gcccacttcc ccctggacgt ccaatggaac gacctggact acatggactc 1740
ccggagggac ttcacgttca acaaggatgg cttccgggac ttcccggcca tggtgcagga 1800
gctgcaccag ggcggccggc gctacatgat gatcgtggat cctgccatca gcagctcggg 1860
ccctgccggg agctacaggc cctacgacga gggtctgcgg aggggggttt tcatcaccaa 1920
cgagaccggc cagccgctga ttgggaaggt atggcccggg tccactgcct tccccgactt 1980
caccaacccc acagccctgg cctggtggga ggacatggtg gctgagttcc atgaccaggt 2040
gcccttcgac ggcatgtgga ttgacatgaa cgagccttcc aacttcatca gaggctctga 2100
ggacggctgc cccaacaatg agctggagaa cccaccctac gtgcctgggg tggttggggg 2160
gaccctccag gcggccacca tctgtgcctc cagccaccag tttctctcca cacactacaa 2220
cctgcacaac ctctacggcc tgaccgaagc catcgcctcc cacagggcgc tggtgaaggc 2280
tcgggggaca cgcccatttg tgatctcccg ctcgaccttt gctggccacg gccgatacgc 2340
cggccactgg acgggggacg tgtggagctc ctgggagcag ctcgcctcct ccgtgccaga 2400
aatcctgcag tttaacctgc tgggggtgcc tctggtcggg gccgacgtct gcggcttcct 2460
gggcaacacc tcagaggagc tgtgtgtgcg ctggacccag ctgggggcct tctacccctt 2520
catgcggaac cacaacagcc tgctcagtct gccccaggag ccgtacagct tcagcgagcc 2580
ggcccagcag gccatgagga aggccctcac cctgcgctac gcactcctcc cccacctcta 2640
cacactgttc caccaggccc acgtcgcggg ggagaccgtg gcccggcccc tcttcctgga 2700
gttccccaag gactctagca cctggactgt ggaccaccag ctcctgtggg gggaggccct 2760
gctcatcacc ccagtgctcc aggccgggaa ggccgaagtg actggctact tccccttggg 2820
cacatggtac gacctgcaga cggtgccaat agaggccctt ggcagcctcc cacccccacc 2880
tgcagctccc cgtgagccag ccatccacag cgaggggcag tgggtgacgc tgccggcccc 2940
cctggacacc atcaacgtcc acctccgggc tgggtacatc atccccctgc agggccctgg 3000
cctcacaacc acagagtccc gccagcagcc catggccctg gctgtggccc tgaccaaggg 3060
tggagaggcc cgaggggagc tgttctggga cgatggagag agcctggaag tgctggagcg 3120
aggggcctac acacaggtca tcttcctggc caggaataac acgatcgtga atgagctggt 3180
acgtgtgacc agtgagggag ctggcctgca gctgcagaag gtgactgtcc tgggcgtggc 3240
cacggcgccc cagcaggtcc tctccaacgg tgtccctgtc tccaacttca cctacagccc 3300
cgacaccaag gtcctggaca tctgtgtctc gctgttgatg ggagagcagt ttctcgtcag 3360
ctggtgttag cgagcggccg ctcttagtag cagtatcgat cccagcccac ttttccccaa 3420
tacgactacg agatctgtgg cttctagctg cccgggtggc atccctgtga cccctcccca 3480
gtgcctctcc tggccctgga agttgccact ccagtgccca ccagccttgt cctaataaaa 3540
ttaagttgca tcattttgtc tgactaggtg tccttctata atattatggg gtggaggggg 3600
gtggtatgga gcaaggggca agttggggtc cttcaacgtc gaactgtagc actctggata 3660
gctagctagc gtttgtagat agtttcaagg atagcaacca acaacacgat agtttagaaa 3720
ttgttctaga tcttctgcta ctactcgaga gatagttgac ttctagaaga ctctggatag 3780
agagcttcct gtggtttcta tttcaacact tcgagcgatt tagatagagg cgtcaattga 3840
gaacaaaaac tggacacctg tttctagaac actagtgcta gtcttctcaa ggcttgatac 3900
gtcctgccac tcacacacaa aaaaccaaca cacagattaa tgaaaataaa gatcttttat 3960
tagagagcga gtggatagtt tagagtcgct tgagacttat cctgtgtcca actagccaag 4020
agtagagaga gagtgactag gtggatcgag agatcgtcgt ctatttgact gctagcctgt 4080
gttctcgtcg tagtccaaat cttcaatact ctggcgacta gtaacttgaa tctgtgtatc 4140
taacacgaca aggctactcc tttgagtttc tagtgataag tgcgactgga tctagctagt 4200
tgagtttcta gaaactacgt ccaaagctac tagcacta 4238
<210> 83
<211> 4262
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成
的多核苷酸
<400> 83
tcgagcttgg gctgcaggtc gagggcactg ggaggatgtt gagtaagatg gaaaactact 60
gatgaccctt gcagagacag agtattagga catgtttgaa caggggccgg gcgatcagca 120
ggtagctcta gaggatcccc gtctgtctgc acatttcgta gagcgagtgt tccgatactc 180
taatctccct aggcaaggtt catatttgtg taggttactt attctccttt tgttgactaa 240
gtcaataatc agaatcagca ggtttggagt cagcttggca gggatcagca gcctgggttg 300
gaaggagggg gtataaaagc cccttcacca ggagaagccg tcacacagac tagccctaag 360
gtaagttggc gccgtttaag ggatggttgg ttggtggggt attaatgttt aattaccttt 420
tttacaggcc tgaactaggc gcgccaccgc caccatgctc aggggtccgg gacccgggcg 480
gctgctgctg ctagcagtcc tgtgcctggg gacatcggtg cgctgcaccg aaaccgggaa 540
gagcaagagg gctctgtgcg gcggggagct ggtggacacc ctccagttcg tctgtgggga 600
ccgcggcttc tacttcagca ggcccgcaag ccgtgtgagc cgtcgcagcc gtggcatcgt 660
tgaggagtgc tgtttccgca gctgtgacct ggccctcctg gagacgtact gtgctacccc 720
cgccaagtcc gagggcgcgc cggcacaccc cggccgtccc agagcagtgc ccacacagtg 780
cgacgtcccc cccaacagcc gcttcgattg cgcccctgac aaggccatca cccaggaaca 840
gtgcgaggcc cgcggctgct gctacatccc tgcaaagcag gggctgcagg gagcccagat 900
ggggcagccc tggtgcttct tcccacccag ctaccccagc tacaagctgg agaacctgag 960
ctcctctgaa atgggctaca cggccaccct gacccgtacc acccccacct tcttccccaa 1020
ggacatcctg accctgcggc tggacgtgat gatggagact gagaaccgcc tccacttcac 1080
gatcaaagat ccagctaaca ggcgctacga ggtgcccttg gagaccccgc gtgtccacag 1140
ccgggcaccg tccccactct acagcgtgga gttctccgag gagcccttcg gggtgatcgt 1200
gcaccggcag ctggacggcc gcgtgctgct gaacacgacg gtggcgcccc tgttctttgc 1260
ggaccagttc cttcagctgt ccacctcgct gccctcgcag tatatcacag gcctcgccga 1320
gcacctcagt cccctgatgc tcagcaccag ctggaccagg atcaccctgt ggaaccggga 1380
ccttgcgccc acgcccggtg cgaacctcta cgggtctcac cctttctacc tggcgctgga 1440
ggacggcggg tcggcacacg gggtgttcct gctaaacagc aatgccatgg atgtggtcct 1500
gcagccgagc cctgccctta gctggaggtc gacaggtggg atcctggatg tctacatctt 1560
cctgggccca gagcccaaga gcgtggtgca gcagtacctg gacgttgtgg gatacccgtt 1620
catgccgcca tactggggcc tgggcttcca cctgtgccgc tggggctact cctccaccgc 1680
tatcacccgc caggtggtgg agaacatgac cagggcccac ttccccctgg acgtccaatg 1740
gaacgacctg gactacatgg actcccggag ggacttcacg ttcaacaagg atggcttccg 1800
ggacttcccg gccatggtgc aggagctgca ccagggcggc cggcgctaca tgatgatcgt 1860
ggatcctgcc atcagcagct cgggccctgc cgggagctac aggccctacg acgagggtct 1920
gcggaggggg gttttcatca ccaacgagac cggccagccg ctgattggga aggtatggcc 1980
cgggtccact gccttccccg acttcaccaa ccccacagcc ctggcctggt gggaggacat 2040
ggtggctgag ttccatgacc aggtgccctt cgacggcatg tggattgaca tgaacgagcc 2100
ttccaacttc atcagaggct ctgaggacgg ctgccccaac aatgagctgg agaacccacc 2160
ctacgtgcct ggggtggttg gggggaccct ccaggcggcc accatctgtg cctccagcca 2220
ccagtttctc tccacacact acaacctgca caacctctac ggcctgaccg aagccatcgc 2280
ctcccacagg gcgctggtga aggctcgggg gacacgccca tttgtgatct cccgctcgac 2340
ctttgctggc cacggccgat acgccggcca ctggacgggg gacgtgtgga gctcctggga 2400
gcagctcgcc tcctccgtgc cagaaatcct gcagtttaac ctgctggggg tgcctctggt 2460
cggggccgac gtctgcggct tcctgggcaa cacctcagag gagctgtgtg tgcgctggac 2520
ccagctgggg gccttctacc ccttcatgcg gaaccacaac agcctgctca gtctgcccca 2580
ggagccgtac agcttcagcg agccggccca gcaggccatg aggaaggccc tcaccctgcg 2640
ctacgcactc ctcccccacc tctacacact gttccaccag gcccacgtcg cgggggagac 2700
cgtggcccgg cccctcttcc tggagttccc caaggactct agcacctgga ctgtggacca 2760
ccagctcctg tggggggagg ccctgctcat caccccagtg ctccaggccg ggaaggccga 2820
agtgactggc tacttcccct tgggcacatg gtacgacctg cagacggtgc caatagaggc 2880
ccttggcagc ctcccacccc cacctgcagc tccccgtgag ccagccatcc acagcgaggg 2940
gcagtgggtg acgctgccgg cccccctgga caccatcaac gtccacctcc gggctgggta 3000
catcatcccc ctgcagggcc ctggcctcac aaccacagag tcccgccagc agcccatggc 3060
cctggctgtg gccctgacca agggtggaga ggcccgaggg gagctgttct gggacgatgg 3120
agagagcctg gaagtgctgg agcgaggggc ctacacacag gtcatcttcc tggccaggaa 3180
taacacgatc gtgaatgagc tggtacgtgt gaccagtgag ggagctggcc tgcagctgca 3240
gaaggtgact gtcctgggcg tggccacggc gccccagcag gtcctctcca acggtgtccc 3300
tgtctccaac ttcacctaca gccccgacac caaggtcctg gacatctgtg tctcgctgtt 3360
gatgggagag cagtttctcg tcagctggtg ttagcgagcg gccgctctta gtagcagtat 3420
cgatcccagc ccacttttcc ccaatacgac tacgagatct gtggcttcta gctgcccggg 3480
tggcatccct gtgacccctc cccagtgcct ctcctggccc tggaagttgc cactccagtg 3540
cccaccagcc ttgtcctaat aaaattaagt tgcatcattt tgtctgacta ggtgtccttc 3600
tataatatta tggggtggag gggggtggta tggagcaagg ggcaagttgg ggtccttcaa 3660
cgtcgaactg tagcactctg gatagctagc tagcgtttgt agatagtttc aaggatagca 3720
accaacaaca cgatagttta gaaattgttc tagatcttct gctactactc gagagatagt 3780
tgacttctag aagactctgg atagagagct tcctgtggtt tctatttcaa cacttcgagc 3840
gatttagata gaggcgtcaa ttgagaacaa aaactggaca cctgtttcta gaacactagt 3900
gctagtcttc tcaaggcttg atacgtcctg ccactcacac acaaaaaacc aacacacaga 3960
ttaatgaaaa taaagatctt ttattagaga gcgagtggat agtttagagt cgcttgagac 4020
ttatcctgtg tccaactagc caagagtaga gagagagtga ctaggtggat cgagagatcg 4080
tcgtctattt gactgctagc ctgtgttctc gtcgtagtcc aaatcttcaa tactctggcg 4140
actagtaact tgaatctgtg tatctaacac gacaaggcta ctcctttgag tttctagtga 4200
taagtgcgac tggatctagc tagttgagtt tctagaaact acgtccaaag ctactagcac 4260
ta 4262
<210> 84
<211> 4259
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成
的多核苷酸
<400> 84
tcgagcttgg gctgcaggtc gagggcactg ggaggatgtt gagtaagatg gaaaactact 60
gatgaccctt gcagagacag agtattagga catgtttgaa caggggccgg gcgatcagca 120
ggtagctcta gaggatcccc gtctgtctgc acatttcgta gagcgagtgt tccgatactc 180
taatctccct aggcaaggtt catatttgtg taggttactt attctccttt tgttgactaa 240
gtcaataatc agaatcagca ggtttggagt cagcttggca gggatcagca gcctgggttg 300
gaaggagggg gtataaaagc cccttcacca ggagaagccg tcacacagac tagccctaag 360
gtaagttggc gccgtttaag ggatggttgg ttggtggggt attaatgttt aattaccttt 420
tttacaggcc tgaactaggc gcgccaccgc caccatgctt aggggtccgg ggcccgggct 480
gctgctgctg gccgtccagt gcctggggac agcggtgccc tccacgggag cctcgaagag 540
caagagggct ctgtgcggcg gggagctggt ggacaccctc cagttcgtct gtggggaccg 600
cggcttctac ttcagcaggc ccgcaagccg tgtgagccgt cgcagccgtg gcatcgttga 660
ggagtgctgt ttccgcagct gtgacctggc cctcctggag acgtactgtg ctacccccgc 720
caagtccgag ggcgcgccgg cacaccccgg ccgtcccaga gcagtgccca cacagtgcga 780
cgtccccccc aacagccgct tcgattgcgc ccctgacaag gccatcaccc aggaacagtg 840
cgaggcccgc ggctgctgct acatccctgc aaagcagggg ctgcagggag cccagatggg 900
gcagccctgg tgcttcttcc cacccagcta ccccagctac aagctggaga acctgagctc 960
ctctgaaatg ggctacacgg ccaccctgac ccgtaccacc cccaccttct tccccaagga 1020
catcctgacc ctgcggctgg acgtgatgat ggagactgag aaccgcctcc acttcacgat 1080
caaagatcca gctaacaggc gctacgaggt gcccttggag accccgcgtg tccacagccg 1140
ggcaccgtcc ccactctaca gcgtggagtt ctccgaggag cccttcgggg tgatcgtgca 1200
ccggcagctg gacggccgcg tgctgctgaa cacgacggtg gcgcccctgt tctttgcgga 1260
ccagttcctt cagctgtcca cctcgctgcc ctcgcagtat atcacaggcc tcgccgagca 1320
cctcagtccc ctgatgctca gcaccagctg gaccaggatc accctgtgga accgggacct 1380
tgcgcccacg cccggtgcga acctctacgg gtctcaccct ttctacctgg cgctggagga 1440
cggcgggtcg gcacacgggg tgttcctgct aaacagcaat gccatggatg tggtcctgca 1500
gccgagccct gcccttagct ggaggtcgac aggtgggatc ctggatgtct acatcttcct 1560
gggcccagag cccaagagcg tggtgcagca gtacctggac gttgtgggat acccgttcat 1620
gccgccatac tggggcctgg gcttccacct gtgccgctgg ggctactcct ccaccgctat 1680
cacccgccag gtggtggaga acatgaccag ggcccacttc cccctggacg tccaatggaa 1740
cgacctggac tacatggact cccggaggga cttcacgttc aacaaggatg gcttccggga 1800
cttcccggcc atggtgcagg agctgcacca gggcggccgg cgctacatga tgatcgtgga 1860
tcctgccatc agcagctcgg gccctgccgg gagctacagg ccctacgacg agggtctgcg 1920
gaggggggtt ttcatcacca acgagaccgg ccagccgctg attgggaagg tatggcccgg 1980
gtccactgcc ttccccgact tcaccaaccc cacagccctg gcctggtggg aggacatggt 2040
ggctgagttc catgaccagg tgcccttcga cggcatgtgg attgacatga acgagccttc 2100
caacttcatc agaggctctg aggacggctg ccccaacaat gagctggaga acccacccta 2160
cgtgcctggg gtggttgggg ggaccctcca ggcggccacc atctgtgcct ccagccacca 2220
gtttctctcc acacactaca acctgcacaa cctctacggc ctgaccgaag ccatcgcctc 2280
ccacagggcg ctggtgaagg ctcgggggac acgcccattt gtgatctccc gctcgacctt 2340
tgctggccac ggccgatacg ccggccactg gacgggggac gtgtggagct cctgggagca 2400
gctcgcctcc tccgtgccag aaatcctgca gtttaacctg ctgggggtgc ctctggtcgg 2460
ggccgacgtc tgcggcttcc tgggcaacac ctcagaggag ctgtgtgtgc gctggaccca 2520
gctgggggcc ttctacccct tcatgcggaa ccacaacagc ctgctcagtc tgccccagga 2580
gccgtacagc ttcagcgagc cggcccagca ggccatgagg aaggccctca ccctgcgcta 2640
cgcactcctc ccccacctct acacactgtt ccaccaggcc cacgtcgcgg gggagaccgt 2700
ggcccggccc ctcttcctgg agttccccaa ggactctagc acctggactg tggaccacca 2760
gctcctgtgg ggggaggccc tgctcatcac cccagtgctc caggccggga aggccgaagt 2820
gactggctac ttccccttgg gcacatggta cgacctgcag acggtgccaa tagaggccct 2880
tggcagcctc ccacccccac ctgcagctcc ccgtgagcca gccatccaca gcgaggggca 2940
gtgggtgacg ctgccggccc ccctggacac catcaacgtc cacctccggg ctgggtacat 3000
catccccctg cagggccctg gcctcacaac cacagagtcc cgccagcagc ccatggccct 3060
ggctgtggcc ctgaccaagg gtggagaggc ccgaggggag ctgttctggg acgatggaga 3120
gagcctggaa gtgctggagc gaggggccta cacacaggtc atcttcctgg ccaggaataa 3180
cacgatcgtg aatgagctgg tacgtgtgac cagtgaggga gctggcctgc agctgcagaa 3240
ggtgactgtc ctgggcgtgg ccacggcgcc ccagcaggtc ctctccaacg gtgtccctgt 3300
ctccaacttc acctacagcc ccgacaccaa ggtcctggac atctgtgtct cgctgttgat 3360
gggagagcag tttctcgtca gctggtgtta gcgagcggcc gctcttagta gcagtatcga 3420
tcccagccca cttttcccca atacgactac gagatctgtg gcttctagct gcccgggtgg 3480
catccctgtg acccctcccc agtgcctctc ctggccctgg aagttgccac tccagtgccc 3540
accagccttg tcctaataaa attaagttgc atcattttgt ctgactaggt gtccttctat 3600
aatattatgg ggtggagggg ggtggtatgg agcaaggggc aagttggggt ccttcaacgt 3660
cgaactgtag cactctggat agctagctag cgtttgtaga tagtttcaag gatagcaacc 3720
aacaacacga tagtttagaa attgttctag atcttctgct actactcgag agatagttga 3780
cttctagaag actctggata gagagcttcc tgtggtttct atttcaacac ttcgagcgat 3840
ttagatagag gcgtcaattg agaacaaaaa ctggacacct gtttctagaa cactagtgct 3900
agtcttctca aggcttgata cgtcctgcca ctcacacaca aaaaaccaac acacagatta 3960
atgaaaataa agatctttta ttagagagcg agtggatagt ttagagtcgc ttgagactta 4020
tcctgtgtcc aactagccaa gagtagagag agagtgacta ggtggatcga gagatcgtcg 4080
tctatttgac tgctagcctg tgttctcgtc gtagtccaaa tcttcaatac tctggcgact 4140
agtaacttga atctgtgtat ctaacacgac aaggctactc ctttgagttt ctagtgataa 4200
gtgcgactgg atctagctag ttgagtttct agaaactacg tccaaagcta ctagcacta 4259
<210> 85
<211> 165
<212> DNA
<213> 智人(Homo sapiens)
<400> 85
ccgggcggag tgtgttagtc tctccagagg gaggctggtt ccccagggaa gcagagcctg 60
tgtgcgggca gcagctgtgt gcgggcctgg gggttgttaa gtgcaattat ttttaataaa 120
aggggcattt ggaaaaaaaa aaaaaaggta gcagtcgaca gatga 165

Claims (71)

1.一种重组腺病毒相关(AAV)载体,所述载体在其基因组中包含:
a.5'和3'AAV反向末端重复(ITR)序列;以及
b.位于5'和3'ITR之间的异源核酸序列,所述异源核酸序列编码包含分泌信号肽和α-葡萄糖苷酶(GAA)多肽的融合多肽,其中,所述异源核酸可操作地连接至启动子。
2.根据权利要求1所述的重组AAV载体,其中,编码融合多肽的所述异源核酸序列进一步包含位于所述分泌信号肽和所述α-葡萄糖苷酶(GAA)多肽之间的IGF-2序列。
3.根据权利要求2所述的重组AAV载体,其中,所述AAV基因组以5'至3'的方向包含:
a.5'ITR;
b.启动子序列;
c.内含子序列;
d.编码分泌信号肽的核酸;
e.编码IGF-2序列的核酸;
f.编码α-葡萄糖苷酶(GAA)多肽的核酸;
g.poly A序列;以及
h.3'ITR。
4.根据权利要求1-3中任一项所述的重组AAV载体,其中,所述分泌信号肽选自AAT信号肽、纤连蛋白信号肽(FN)、GAA信号肽或它们的具有分泌信号活性的活性片段。
5.根据权利要求1-3中任一项所述的重组AAV载体,其中,所述IGF-2前导序列结合人非阳离子依赖性甘露糖-6-磷酸受体(CI-MPR)或IGF-2受体。
6.根据权利要求5所述的重组AAV载体,其中,所述IGF-2序列包含SEQ ID NO:5或包含结合至IGF-2受体的SEQ ID NO:5中的至少一个氨基修饰。
7.根据权利要求6所述的重组AAV载体,其中,SEQ ID NO:5中的所述至少一个氨基修饰是V43M氨基酸修饰(SEQ ID NO:8或SEQ ID NO:9)或Δ2-7(SEQ ID NO:6)或Δ1-7(SEQ IDNO:7)。
8.根据权利要求1-3中任一项所述的重组AAV载体,其中,所述启动子是组成型、细胞特异性或诱导型的。
9.根据权利要求1-3中任一项所述的重组AAV载体,其中,所述启动子是肝特异性启动子。
10.根据权利要求9所述的重组AAV载体,其中,所述肝特异性启动子选自以下中的任一项:甲状腺素转运蛋白启动子(TTR)、LSP启动子(LSP)、合成型肝特异性启动子。
11.根据权利要求1或2所述的重组AAV载体,其中,所述核酸序列编码野生型GAA多肽或经修饰的GAA多肽。
12.根据权利要求1-3中任一项所述的重组AAV载体,其中,编码所述GAA多肽的核酸序列是人GAA基因或人密码子优化的GAA基因(CoGAA)或经修饰的GAA核酸序列。
13.根据权利要求1-3或权利要求12中任一项所述的重组AAV载体,其中,编码所述GAA多肽的核酸序列经密码子优化以增强体内表达。
14.根据权利要求1-3或权利要求12中任一项所述的重组AAV载体,其中,编码所述GAA多肽的核酸序列经密码子优化以减少CpG岛。
15.根据权利要求1-3或权利要求12中任一项所述的重组AAV载体,其中,编码所述GAA多肽的核酸序列经密码子优化以降低固有免疫应答。
16.根据权利要求1-3或权利要求12中任一项所述的重组AAV载体,其中,编码所述GAA多肽的核酸序列经密码子优化以减少CpG岛并降低固有免疫应答。
17.根据权利要求1-3中任一项所述的重组AAV载体,其中,经编码的融合多肽进一步包含间隔区,所述间隔区包含位于所述GAA多肽的氨基末端和所述IGF-2序列的C-末端的至少1个氨基酸的核苷酸序列。
18.根据权利要求3所述的重组AAV载体,所述重组AAV载体进一步包含编码至少1个氨基酸的间隔区的核酸,所述核酸位于编码所述IGF-2序列的核酸和编码所述GAA多肽的核酸之间。
19.根据权利要求1-3中任一项所述的重组AAV载体,所述重组AAV载体进一步包含位于编码所述GAA基因的核酸的3'端和所述3'ITR序列的5'端的至少1个poly A序列。
20.根据权利要求1-3中任一项所述的重组AAV载体,其中,所述异源核酸序列进一步包含位于编码所述GAA多肽的核酸的3'端和所述3'ITR序列的5'端的胶原蛋白稳定性(CS)序列。
21.根据权利要求3或20所述的重组AAV载体,所述重组AAV载体进一步包含编码胶原蛋白稳定性(CS)序列的核酸,所述核酸位于编码所述GAA多肽的核酸与所述poly A序列之间。
22.根据权利要求1-3中任一项所述的重组AAV载体,所述重组AAV载体进一步包含位于编码所述分泌信号肽的序列的5'端和所述启动子的3'端的内含子序列。
23.根据权利要求22所述的重组AAV载体,其中,所述内含子序列包含MVM序列或HBB2序列。
24.根据权利要求1-3中任一项所述的重组AAV载体,其中,所述ITR包含插入、缺失或置换。
25.根据权利要求24所述的重组AAV载体,其中,所述ITR中的一个或多个CpG岛被去除。
26.根据权利要求1-3中任一项所述的重组AAV载体,其中,所述分泌信号肽是纤连蛋白信号肽(FN1)或其具有分泌信号活性的活性片段,并且所述IGF-2序列选自SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8或SEQ ID NO:9中的任一项。
27.根据权利要求1-3中任一项所述的重组AAV载体,其中,经编码的分泌信号肽是AAT信号肽或其具有分泌信号活性的活性片段,并且所述IGF-2序列选自SEQ ID NO:5、SEQ IDNO:6、SEQ ID NO:7、SEQ ID NO:8或SEQ ID NO:9中的任一项。
28.根据权利要求26或27所述的重组AAV载体,其中,所述IGF-2序列是SEQ ID NO:8或SEQ ID NO:9。
29.根据权利要求1-3中任一项所述的重组AAV载体,其中,所述重组AAV载体是嵌合AAV载体、单倍体AAV载体、杂合AAV载体或多倍体AAV载体。
30.根据权利要求1-3中任一项所述的重组AAV载体,其中,所述重组AAV载体包含选自于由表1所列的AAV血清型所组成的组中的任意AAV血清型及它们的任意组合的衣壳蛋白。
31.根据权利要求30所述的重组AAV载体,其中,所述血清型是AAV3b。
32.根据权利要求31所述的重组AAV载体,其中,所述AAV3b血清型在衣壳蛋白中包含选自265D、549A、Q263Y中任意的一个或多个突变。
33.根据权利要求31所述的重组AAV载体,其中,所述AAV3b血清型选自AAV3b265D、AAV3b265D549A、AAV3b549A或AAV3bQ263Y或AAV3bSASTG中的任一种。
34.一种重组腺病毒相关(AAV)载体,所述载体在其基因组中包含:
a.5'和3'AAV反向末端重复(ITR)序列;以及
b.位于5'和3'ITR之间的异源核酸序列,所述异源核酸序列编码包含α-葡萄糖苷酶(GAA)多肽的融合多肽,其中,所述异源核酸可操作地连接至肝特异性启动子;
其中,所述重组AAV载体包含AAV3b血清型的衣壳蛋白。
35.根据权利要求34所述的重组AAV载体,其中,所述融合多肽进一步包含位于所述GAA多肽的N-末端的分泌信号肽。
36.根据权利要求34所述的重组AAV载体,其中,编码融合多肽的所述异源核酸序列进一步包含位于所述分泌信号肽和所述α-葡萄糖苷酶(GAA)多肽之间的IGF-2序列。
37.根据权利要求34所述的重组AAV载体,其中,所述AAV基因组以5'至3'的方向包含:
a.5'ITR;
b.肝特异性启动子序列;
c.内含子序列;
d.编码分泌信号肽的核酸;
e.编码IGF-2序列的核酸;
f.编码α-葡萄糖苷酶(GAA)多肽的核酸;
g.poly A序列;以及
h.3'ITR。
38.根据权利要求34-37中任一项所述的重组AAV载体,其中,所述分泌信号肽选自AAT信号肽、纤连蛋白信号肽(FN)、GAA信号肽或它们的具有分泌信号活性的活性片段。
39.根据权利要求34-37中任一项所述的重组AAV载体,其中,所述IGF-2前导序列结合人非阳离子依赖性甘露糖-6-磷酸受体(CI-MPR)或IGF-2受体。
40.根据权利要求39所述的重组AAV载体,其中,所述IGF-2序列包含SEQ ID NO:5或包含SEQ ID NO:5中影响结合至IGF-2受体的至少一个氨基修饰。
41.根据权利要求40所述的重组AAV载体,其中,SEQ ID NO:5中的所述至少一个氨基修饰是V43M氨基酸修饰(SEQ ID NO:8或SEQ ID NO:9)或Δ2-7(SEQ ID NO:6)或Δ1-7(SEQID NO:7)。
42.根据权利要求34-41中任一项所述的重组AAV载体,其中,所述肝特异性启动子选自以下中的任一项:甲状腺素转运蛋白启动子(TTR)、LSP启动子(LSP)、合成型肝特异性启动子。
43.根据权利要求34-42中任一项所述的重组AAV载体,其中,所述核酸序列编码野生型GAA多肽或经修饰的GAA多肽。
44.根据权利要求34-43中任一项所述的重组AAV载体,其中,编码所述GAA多肽的核酸序列是人GAA基因或人密码子优化的GAA基因(CoGAA)或经修饰的GAA核酸序列。
45.根据权利要求34-44中任一项所述的重组AAV载体,其中,编码所述GAA多肽的核酸序列经密码子优化以增强体内表达。
46.根据权利要求34-44中任一项所述的重组AAV载体,其中,编码所述GAA多肽的核酸序列经密码子优化以减少CpG岛。
47.根据权利要求34-44中任一项所述的重组AAV载体,其中,编码所述GAA多肽的核酸序列经密码子优化以降低固有免疫应答。
48.根据权利要求34-44中任一项所述的重组AAV载体,其中,编码所述GAA多肽的核酸序列经密码子优化以减少CpG岛并降低固有免疫应答。
49.根据权利要求34-49中任一项所述的重组AAV载体,其中,所述内含子序列包含MVM序列或HBB2序列。
50.根据权利要求34-49中任一项所述的重组AAV载体,其中,所述ITR包含插入、缺失或置换。
51.根据权利要求40所述的重组AAV载体,其中,所述ITR中的一个或多个CpG岛被去除。
52.根据权利要求34-49中任一项所述的重组AAV载体,其中,所述分泌信号肽是纤连蛋白信号肽(FN1)或其具有分泌信号活性的活性片段,并且所述IGF-2序列选自SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8或SEQ ID NO:9中的任一项。
53.根据权利要求34-49中任一项所述的重组AAV载体,其中,经编码的分泌信号肽是AAT信号肽或其具有分泌信号活性的活性片段,并且所述IGF-2序列选自SEQ ID NO:5、SEQID NO:6、SEQ ID NO:7、SEQ ID NO:8或SEQ ID NO:9中的任一项。
54.根据权利要求34-49中任一项所述的重组AAV载体,其中,所述IGF-2序列是SEQ IDNO:8或SEQ ID NO:9。
55.一种药物组合物,所述药物组合物包含处于药学上可接受的辅料中的前述权利要求中任一项所述的重组AAV载体。
56.一种核酸序列,所述核酸序列包含:
可操作地连接至如下核酸序列的肝特异性启动子,所述核酸序列按以下顺序包含:编码分泌信号肽的核酸、编码IGF-2序列的核酸、编码GAA多肽的核酸。
57.一种重组腺病毒相关(rAAV)载体基因组的核酸序列,所述核酸序列包含:
a.5'和3'AAV反向末端重复(ITR)核酸序列;以及
b.位于5'和3'ITR之间的异源核酸序列,所述异源核酸序列编码包含分泌信号肽和α-葡萄糖苷酶(GAA)多肽的融合多肽,其中,所述异源核酸可操作地连接至启动子。
58.根据权利要求57所述的核酸序列,其中,编码融合多肽的所述异源核酸序列进一步包含位于所述分泌信号肽和所述α-葡萄糖苷酶(GAA)多肽之间的IGF-2序列。
59.根据权利要求56或57所述的核酸序列,其中,编码所述分泌信号肽的核酸选自以下中的任一项:SEQ ID NO:17、SEQ ID NO:22-SEQ ID NO:26,或与它们具有至少85%序列同一性的核酸。
60.根据权利要求59所述的核酸序列,其中,编码所述IGF-2序列的核酸选自以下中的任一项:SEQ ID NO:2(IGF2-Δ2-7)、SEQ ID NO:3(IGF2-Δ1-7)或SEQ ID NO:4(IGF2V43M),或与它们具有至少85%序列同一性的核酸。
61.根据权利要求56或57所述的核酸序列,其中,编码所述GAA多肽的核酸序列是人GAA基因或人密码子优化的GAA基因(CoGAA)或经修饰的GAA核酸序列。
62.根据权利要求56或57所述的核酸序列,其中,编码所述GAA多肽的核酸序列经密码子优化以增强体内表达。
63.根据权利要求56或57所述的核酸序列,其中,编码所述GAA多肽的核酸序列经密码子优化以减少CpG岛。
64.根据权利要求56或57所述的核酸序列,其中,编码所述GAA多肽的核酸序列经密码子优化以降低固有免疫应答。
65.根据权利要求56或57所述的核酸序列,其中,编码所述GAA多肽的核酸序列经密码子优化以减少CpG岛并降低固有免疫应答。
66.根据权利要求56或57所述的核酸序列,其中,编码所述GAA多肽的核酸选自SEQ IDNO:11(全长hGAA)、SEQ ID NO:55(Dwight cDNA)、SEQ ID NO:56(hGAAΔ1-66)中的任一项。
67.根据权利要求56或57所述的核酸序列,其中,编码所述GAA多肽的核酸选自SEQ IDNO:74(密码子优化的1)、SEQ ID NO:75(密码子优化的2)和SEQ ID NO:76(密码子优化的3)中的任一项。
68.根据权利要求56或57所述的核酸序列,其中,所述核酸选自以下中的任一项:SEQID NO:57(AAT-V43M-wtGAA(delta1-69aa))、SEQ ID NO:58(ratFN1-IGF2V43M-wtGAA(delta1-69aa))、SEQ ID NO:59(hFN1-IGF2V43M-wtGAA(delta1-69aa))、SEQ ID NO:60(ATT-IGF2Δ2-7-wtGAA(delta 1-69))、SEQ ID NO:61(FN1rat-IGFΔ2-7-wtGAA(delta 1-69))、SEQ ID NO:62(hFN1-IGFΔ2-7-wtGAA(delta 1-69))、SEQ ID NO:79(AAT_hIGF2-V43M_wtGAA_del1-69_Stuffer.V02)、SEQ ID NO:80(FIBrat_hIGF2-V43M_wtGAA_del1-69_Stuffer.V02)、SEQ ID NO:81(FIBhum_hIGF2-V43M_wtGAA_del1-69_Stuffer.V02)、SEQ IDNO:82(AAT_GILT_wtGAA_del1-69__Stuffer.V02)、SEQ ID NO:83(FIBrat_GILT_wtGAA_del1-69_Stuffer.V02)、SEQ ID NO:84(FIBhum_GILT_wtGAA_del1-69_Stuffer.V02),或与它们具有至少80%、85%、90%、95%或98%同一性的核酸序列。
69.一种治疗患有糖原贮积病II型(GSD II、庞贝氏病、酸性麦芽糖酶缺乏症)或患有α-葡萄糖苷酶(GAA)多肽缺乏症的受试者的方法,所述方法包括向受试者给予前述权利要求中任一项所述的任意的重组AAV载体、或rAAV基因组、或核酸序列。
70.根据权利要求69所述的方法,其中,所述GAA多肽从所述受试者的肝分泌,并且分泌的GAA被骨骼肌组织、心肌组织、膈肌组织或它们的组合摄取,其中,所述分泌的GAA的摄取引起组织中溶酶体糖原存储的减少。
71.根据权利要求69所述的方法,其中,向所述受试者进行的给予选自肌肉内、皮下、椎管内、脑池内、鞘内、静脉内给予中的任一种。
CN201980089335.6A 2018-11-16 2019-11-15 用于治疗庞贝氏病的治疗性腺相关病毒 Pending CN113316639A (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201862768449P 2018-11-16 2018-11-16
US62/768,449 2018-11-16
US201862769702P 2018-11-20 2018-11-20
US62/769,702 2018-11-20
PCT/US2019/061653 WO2020102645A1 (en) 2018-11-16 2019-11-15 Therapeutic adeno-associated virus for treating pompe disease

Publications (1)

Publication Number Publication Date
CN113316639A true CN113316639A (zh) 2021-08-27

Family

ID=70730744

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201980089335.6A Pending CN113316639A (zh) 2018-11-16 2019-11-15 用于治疗庞贝氏病的治疗性腺相关病毒

Country Status (7)

Country Link
US (1) US20220054656A1 (zh)
EP (1) EP3880823A4 (zh)
JP (2) JP2022513067A (zh)
CN (1) CN113316639A (zh)
AU (1) AU2019381776A1 (zh)
CA (1) CA3120105A1 (zh)
WO (1) WO2020102645A1 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112334489A (zh) * 2018-05-16 2021-02-05 星火治疗有限公司 密码子优化的酸性α-葡萄糖苷酶表达盒及其使用方法
CN115772520A (zh) * 2021-09-08 2023-03-10 北京锦篮基因科技有限公司 用于治疗庞贝氏病的基因治疗构建体、药物组合物和方法

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7348844B2 (ja) 2017-06-07 2023-09-21 リジェネロン・ファーマシューティカルズ・インコーポレイテッド 内部移行酵素のための組成物および方法
WO2019157224A1 (en) 2018-02-07 2019-08-15 Regeneron Pharmaceuticals, Inc. Methods and compositions for therapeutic protein delivery
EP3793591A1 (en) 2018-05-17 2021-03-24 Regeneron Pharmaceuticals, Inc. Anti-cd63 antibodies, conjugates, and uses thereof
PH12022551229A1 (en) * 2019-11-19 2023-07-31 Asklepios Biopharmaceutical Inc Therapeutic adeno-associated virus comprising liver-specific promoters for treating pompe disease and lysosomal disorders
CN112225793B (zh) * 2020-10-14 2022-08-23 舒泰神(北京)生物制药股份有限公司 一种溶酶体靶向肽及其融合蛋白、携带融合蛋白编码序列的腺相关病毒载体及其应用
WO2022104261A1 (en) * 2020-11-16 2022-05-19 Avrobio, Inc. Compositions and methods for treating pompe disease
CA3203090A1 (en) * 2020-12-26 2022-06-30 Baodong Sun Compositions and methods for treating and/or preventing glycogen storage diseases
CN112980857A (zh) * 2021-04-26 2021-06-18 重庆医科大学附属儿童医院 一种编码分泌性野生型gaa蛋白的核苷酸组合物、腺相关病毒载体及其药物和应用
CN113336825B (zh) * 2021-07-20 2022-04-05 浙江农林大学 一种具有α-葡萄糖苷酶和α-淀粉酶抑制活性的六肽及其应用
US20250032642A1 (en) * 2022-02-02 2025-01-30 Regeneron Pharmaceuticals, Inc. Crispr-mediated transgene insertion in neonatal cells
NL2031676B1 (en) * 2022-04-22 2023-11-07 Univ Erasmus Med Ct Rotterdam Gene therapy for Pompe Disease
WO2024212961A1 (en) * 2023-04-10 2024-10-17 Skyline Therapeutics (Shanghai) Co., Ltd. Recombinant aav for the gene therapy of pompe disease

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006066066A2 (en) * 2004-12-15 2006-06-22 University Of North Carolina At Chapel Hill Chimeric vectors
CN102066422A (zh) * 2008-05-07 2011-05-18 齐斯特治疗公司 溶酶体靶向肽及其应用
CN103160530A (zh) * 2013-03-19 2013-06-19 苏州工业园区唯可达生物科技有限公司 一种融合基因及其应用
EP3293260A1 (en) * 2016-09-12 2018-03-14 Genethon Acid-alpha glucosidase variants and uses thereof
CN116096895A (zh) * 2019-11-19 2023-05-09 阿斯克肋匹奥生物制药公司 用于治疗庞贝氏病和溶酶体紊乱的包含肝特异性启动子的治疗性腺相关病毒
CN116096734A (zh) * 2020-05-13 2023-05-09 沃雅戈治疗公司 Aav衣壳的向性的重定向

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
SG10202108118RA (en) * 2001-11-13 2021-08-30 Univ Pennsylvania A method of detecting and/or identifying adeno-associated virus (aav) sequences and isolating novel sequences identified thereby
ES2371913T3 (es) * 2003-01-22 2012-01-11 Duke University Constructos mejorados para expresar polipéptidos lisosomales.
WO2008103993A2 (en) * 2007-02-23 2008-08-28 University Of Florida Research Foundation, Inc. Compositions and methods for treating glycogen storage diseases
ES2628889T3 (es) * 2010-02-05 2017-08-04 The University Of North Carolina At Chapel Hill Composiciones y métodos para la transducción mejorada del parvovirus
DK2673289T3 (da) * 2011-02-10 2023-07-24 Univ North Carolina Chapel Hill Virusvektorer med modificerede transduktionsprofiler og fremgangsmåder til fremstilling og anvendelse deraf
US20140271550A1 (en) * 2013-03-14 2014-09-18 The Trustees Of The University Of Pennsylvania Constructs and Methods for Delivering Molecules via Viral Vectors with Blunted Innate Immune Responses
GB201403684D0 (en) * 2014-03-03 2014-04-16 King S College London Vector
EP3283126B1 (en) * 2015-04-16 2019-11-06 Emory University Recombinant promoters and vectors for protein expression in liver and use thereof
MX2018005084A (es) * 2015-11-05 2019-05-16 Bamboo Therapeutics Inc Genes de ataxia de friedreich modificados y vectores para terapia genica.
BR112018011881A2 (pt) * 2015-12-14 2018-12-04 The University Of North Carolina At Chapel Hill proteínas capsidiais modificadas para liberação aumentada de vetores de parvovírus
EP3293259A1 (en) * 2016-09-12 2018-03-14 Genethon Acid-alpha glucosidase variants and uses thereof

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006066066A2 (en) * 2004-12-15 2006-06-22 University Of North Carolina At Chapel Hill Chimeric vectors
CN102066422A (zh) * 2008-05-07 2011-05-18 齐斯特治疗公司 溶酶体靶向肽及其应用
CN103160530A (zh) * 2013-03-19 2013-06-19 苏州工业园区唯可达生物科技有限公司 一种融合基因及其应用
EP3293260A1 (en) * 2016-09-12 2018-03-14 Genethon Acid-alpha glucosidase variants and uses thereof
CN116096895A (zh) * 2019-11-19 2023-05-09 阿斯克肋匹奥生物制药公司 用于治疗庞贝氏病和溶酶体紊乱的包含肝特异性启动子的治疗性腺相关病毒
CN116096734A (zh) * 2020-05-13 2023-05-09 沃雅戈治疗公司 Aav衣壳的向性的重定向

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
HOEFSLOOT LH等: "H.sapiens GAA mRNA for lysosomal alpha-glucosidase(acid maltase)", GENBANK DATABASE, 25 July 2016 (2016-07-25), pages 00839 *
PIACENTINO V 3RD等等: "X-linked inhibitor of apoptosis protein-mediated attenuation of apoptosis, using a novel cardiac-enhanced adeno-associated viral vector", 《HUMAN GENE THERAPY》, vol. 23, no. 6, 30 June 2012 (2012-06-30), pages 643, XP055938932, DOI: 10.1089/hum.2011.186 *
SCHNEIDER JL等: "Homo sapiens glucosidase alpha,acid(GAA), ranscript variant 1, mRNA", GENBANK DATABASE, 25 September 2018 (2018-09-25), pages 000152 *
SUN B等: "Enhanced efficacy of an AAV vector encoding chimeric, highly secreted acid alpha-glucosidase in glycogen storage disease type II", 《MOLECULAR THERAPY》, vol. 14, no. 6, 31 December 2006 (2006-12-31), pages 822 - 830, XP005726585, DOI: 10.1016/j.ymthe.2006.08.001 *
VERCAUTEREN K等: "Superior in vivo transduction of human hepatocytes using engineered AAV3 capsid", 《MOLECULAR THERAPY》, vol. 24, no. 6, 30 June 2016 (2016-06-30), XP055634254, DOI: 10.1038/mt.2016.61 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112334489A (zh) * 2018-05-16 2021-02-05 星火治疗有限公司 密码子优化的酸性α-葡萄糖苷酶表达盒及其使用方法
CN115772520A (zh) * 2021-09-08 2023-03-10 北京锦篮基因科技有限公司 用于治疗庞贝氏病的基因治疗构建体、药物组合物和方法
WO2023035687A1 (zh) * 2021-09-08 2023-03-16 北京锦篮基因科技有限公司 用于治疗庞贝氏病的基因治疗构建体、药物组合物和方法
CN115772520B (zh) * 2021-09-08 2023-11-21 北京锦篮基因科技有限公司 用于治疗庞贝氏病的基因治疗构建体、药物组合物和方法

Also Published As

Publication number Publication date
CA3120105A1 (en) 2020-05-22
WO2020102645A1 (en) 2020-05-22
JP2025032149A (ja) 2025-03-11
JP2022513067A (ja) 2022-02-07
AU2019381776A1 (en) 2021-07-01
EP3880823A1 (en) 2021-09-22
EP3880823A4 (en) 2022-08-17
US20220054656A1 (en) 2022-02-24

Similar Documents

Publication Publication Date Title
CN113316639A (zh) 用于治疗庞贝氏病的治疗性腺相关病毒
JP7208133B2 (ja) 酸性αグルコシダーゼ変異体及びその使用
CN109843930B (zh) 酸性α-葡萄糖苷酶变体及其用途
JP7245155B2 (ja) 酸性αグルコシダーゼ変異体及びその使用
US20230038520A1 (en) Therapeutic adeno-associated virus comprising liver-specific promoters for treating pompe disease and lysosomal disorders
CN112225793B (zh) 一种溶酶体靶向肽及其融合蛋白、携带融合蛋白编码序列的腺相关病毒载体及其应用
CN113631182B (zh) 二硫键稳定的多肽组合物和使用方法
KR20210053902A (ko) 글리코겐 저장 질환 iii 의 치료를 위한 미니-gde
US20220133906A1 (en) Vectors comprising a nucleic acid encoding lysosomal enzymes fused to a lysosomal teargeting sequence
CN114555808A (zh) 嵌合多肽及其用途
CN116917471A (zh) 溶酶体酸性脂肪酶变体及其用途
RU2780329C2 (ru) Варианты кислой альфа-глюкозидазы и их использование
RU2780410C2 (ru) Варианты кислой альфа-глюкозидазы и их использование
WO2021078834A1 (en) Chimeric acid-alpha glucosidase polypeptides and uses thereof

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40059690

Country of ref document: HK

CB02 Change of applicant information
CB02 Change of applicant information

Country or region after: U.S.A.

Address after: Delaware, USA

Applicant after: Ask Biotech Co.,Ltd.

Address before: North Carolina, USA

Applicant before: ASKLEPIOS BIOPHARMACEUTICAL, Inc.

Country or region before: U.S.A.