[go: up one dir, main page]

TW202246505A - 編碼凝血因子ix蛋白的密碼子優化的核酸及其用途 - Google Patents

編碼凝血因子ix蛋白的密碼子優化的核酸及其用途 Download PDF

Info

Publication number
TW202246505A
TW202246505A TW111108106A TW111108106A TW202246505A TW 202246505 A TW202246505 A TW 202246505A TW 111108106 A TW111108106 A TW 111108106A TW 111108106 A TW111108106 A TW 111108106A TW 202246505 A TW202246505 A TW 202246505A
Authority
TW
Taiwan
Prior art keywords
aav5
asn
gly
thr
ser
Prior art date
Application number
TW111108106A
Other languages
English (en)
Inventor
亞歷山大 普洛可菲
保羅 葛后菲
安娜 史翠寇法
娜塔莉亞 史畢瑞那
塔提安娜 蘇嘉瓦
狄密崔 摩羅佐
Original Assignee
俄羅斯聯邦商亞那拜恩有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from RU2021105703A external-priority patent/RU2831751C2/ru
Application filed by 俄羅斯聯邦商亞那拜恩有限公司 filed Critical 俄羅斯聯邦商亞那拜恩有限公司
Publication of TW202246505A publication Critical patent/TW202246505A/zh

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/67General methods for enhancing the expression
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K35/00Medicinal preparations containing materials or reaction products thereof with undetermined constitution
    • A61K35/66Microorganisms or materials therefrom
    • A61K35/76Viruses; Subviral particles; Bacteriophages
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K38/00Medicinal preparations containing peptides
    • A61K38/16Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • A61K38/43Enzymes; Proenzymes; Derivatives thereof
    • A61K38/46Hydrolases (3)
    • A61K38/48Hydrolases (3) acting on peptide bonds (3.4)
    • A61K38/482Serine endopeptidases (3.4.21)
    • A61K38/4846Factor VII (3.4.21.21); Factor IX (3.4.21.22); Factor Xa (3.4.21.6); Factor XI (3.4.21.27); Factor XII (3.4.21.38)
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • A61K48/005Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'active' part of the composition delivered, i.e. the nucleic acid delivered
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • A61K48/005Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'active' part of the composition delivered, i.e. the nucleic acid delivered
    • A61K48/0058Nucleic acids adapted for tissue specific expression, e.g. having tissue specific promoters as part of a contruct
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P7/00Drugs for disorders of the blood or the extracellular fluid
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P7/00Drugs for disorders of the blood or the extracellular fluid
    • A61P7/04Antihaemorrhagics; Procoagulants; Haemostatic agents; Antifibrinolytic agents
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/86Viral vectors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/48Hydrolases (3) acting on peptide bonds (3.4)
    • C12N9/50Proteinases, e.g. Endopeptidases (3.4.21-3.4.25)
    • C12N9/64Proteinases, e.g. Endopeptidases (3.4.21-3.4.25) derived from animal tissue
    • C12N9/6421Proteinases, e.g. Endopeptidases (3.4.21-3.4.25) derived from animal tissue from mammals
    • C12N9/6424Serine endopeptidases (3.4.21)
    • C12N9/644Coagulation factor IXa (3.4.21.22)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y304/00Hydrolases acting on peptide bonds, i.e. peptidases (3.4)
    • C12Y304/21Serine endopeptidases (3.4.21)
    • C12Y304/21022Coagulation factor IXa (3.4.21.22)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14111Dependovirus, e.g. adenoassociated viruses
    • C12N2750/14122New viral proteins or individual genes, new structural or functional aspects of known viral proteins or genes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14111Dependovirus, e.g. adenoassociated viruses
    • C12N2750/14141Use of virus, viral particle or viral elements as a vector
    • C12N2750/14143Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/22Vectors comprising a coding region that has been codon optimised for expression in a respective host

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Organic Chemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Biomedical Technology (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Medicinal Chemistry (AREA)
  • Biochemistry (AREA)
  • Veterinary Medicine (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Public Health (AREA)
  • Animal Behavior & Ethology (AREA)
  • Microbiology (AREA)
  • Epidemiology (AREA)
  • Plant Pathology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Virology (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Diabetes (AREA)
  • Hematology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Mycology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Immunology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Medicines Containing Material From Animals Or Micro-Organisms (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Peptides Or Proteins (AREA)

Abstract

本申請涉及遺傳學、基因療法和分子生物學領域。更具體地說,本發明涉及編碼FIX (凝血因子IX)蛋白的分離的密碼子優化的核酸,基於其的表達盒和載體,以及用於增加FIX基因在靶細胞中表達的基於AAV5 (腺相關病毒血清型5)的重組病毒,及它們的用途。

Description

編碼凝血因子IX蛋白的密碼子優化的核酸及其用途
本申請涉及遺傳學、基因療法和分子生物學領域。更具體地說,本發明涉及編碼FIX (凝血因子IX)蛋白的分離的密碼子優化的核酸,基於其的表達盒和載體,以及用於增加靶細胞中FIX基因表達的基於AAV5 (腺相關病毒血清型5)的重組病毒,及它們的用途。
基因療法是現代醫學最有前途的領域之一。它主要針對用於治療遺傳疾病的有效解決方案的開發,因為只有基因療法方法才有可能特定地影響這些疾病的病因。在大量的遺傳疾病中,一組與止血障礙相關的病理學是最常見的。 血友病為與血漿凝血因子的缺乏或顯著缺陷相關的X連鎖的疾病;其特徵為凝血障礙,該障礙臨床表現為自發或可誘發的頻繁不受控的進入關節、肌肉和內臟等的流血的形式。 血友病B由血漿凝血因子IX的缺乏或缺陷引起。在大多數案例中,該疾病具有家族史,但在一些案例中鑒定到散發突變。患血友病的患者絕大多數為男性,在女性中存在已鑒定的血友病案例,但其極為罕見。凝血因子IX (FIX,克裡斯馬斯因子)為絲氨酸蛋白酶酶原,其在Ca 2+和膜磷脂的存在下水解因子X分子中的精氨酸-異亮氨酸鍵以形成活化的因子X (FXa)。在結合輔助因子,即活化的凝血因子VIII (FVIIIa)後,因子IXa的催化效率增加。 因子IX在肝臟中作為非活性前體蛋白產生,該前體蛋白在內質網和高爾基體中進行加工,其中它經歷了多種不同類型的翻譯後修飾並在前肽的蛋白水解裂解後被分泌至血流中。在凝血級聯中,因子IX在蛋白水解裂解後被活化的因子XI (內在途徑)或活化的因子VII (外在途徑)活化,伴隨由二硫鍵連接的兩條多肽鏈的形成。活化的因子IX緩慢地失活,通常是通過與抗凝血酶III、連接蛋白-2、蛋白Z依賴的蛋白酶抑制劑和內吞肝細胞受體的緩慢結合,以及被嗜中性粒細胞彈性蛋白酶降解。 目前使用替代療法。在1966年開發冷沉技術後,衍生自供體血漿的首個凝血因子產品得到註冊。在1980年代,發現了血漿衍生的凝血因子產品可能感染有病毒(HIV、丙型肝炎),且其導致了約20,000患者受感染。此事實提供了開發在血漿產品的產生中病毒消除和失活的方法以及創造新型非血漿產品的推動力。在血漿衍生產品(血漿衍生的pdFIX)的生產過程中包括熱處理的步驟;其使得消除產品感染成為可能。在改善生產血漿衍生產品的過程的同時,使用重組DNA技術實施了對凝血因子開發的研究。在此技術的基礎上,在1997年產生並註冊了重組凝血因子IX (rFIX)產品。用於產生治療性產品的重組DNA技術使得顯著減少產品病毒污染的風險變為可能。目前,用於血友病的替代療法的治療性產品為血漿衍生的和重組的產品;然而它們具有許多缺點。 生產血漿衍生的產品中主要的問題是需要大量的血漿。進一步地,儘管從1980年代後期起,在使用pdFIX時並沒有感染患者的案例,但這些治療性產品的生產商在理論上不能排除他們受病毒感染的可能性。 目前用於治療血友病的FIX治療性產品的主要缺點包括以下: •    患者通過血漿衍生的產品而受病毒感染的理論上的可能性; •     血漿衍生的和重組的產品的高免疫原性; •     重組產品較低的(相較於血漿衍生的產品)效力; •     凝血因子的短的血液迴圈週期; •     需要頻繁的靜脈內輸注(每週2-3次); •     缺乏終身替代療法的廣泛可用性。 與現有治療選項相比,使用基因療法治療性產品用於因子IX基因轉導為全新的且具有前景的方法:通過靜脈內輸注施用的基因療法治療性產品恢復患者體內凝血因子的產生。 使用病毒載體(比如基於AAV的載體)將靶基因遞送至生物體的細胞內為主要的基因療法方法之一。 腺相關病毒(AAV)為小型(25 nm)獨立複製缺陷的無包膜病毒。在人類和靈長類中已描述許多不同的AAV血清型。腺相關病毒基因組由約4,700個核苷酸長的(+或-)單鏈DNA (ssDNA)組成。在基因組DNA分子的末端存在容納的末端反向重複(ITR)。該基因組包含兩個開放閱讀框(ORF),Rep和Cap,其包含編碼各種蛋白產物的幾個可變閱讀框。rep產物對AAV複製是必需的,而三種衣殼蛋白(VP1、VP2和VP3)與其他備選的產物由Cap基因編碼。VP1、VP2和VP3以1:1:10的比率存在以形成二十面體的衣殼(Xie Q.等人,The atomic structure of adeno-associated virus (AAV-2), a vector for human gene therapy. Proc Natl Acad Sci USA, 2002; 99:10405-10410)。在重組AAV (rAAV)載體生產期間,側翼為ITR的表達盒被包裝至AAV衣殼內。該盒不包括AAV複製所需的基因。重組AAV被認為是用於體內基因轉移最安全和最廣泛使用的病毒載體之一。載體可感染多種組織類型的細胞以提供強烈而持久的轉基因表達。它們也是非致病的,且具有低免疫原性譜(High KA等人,"rAAV human trial experience" Methods Mol Biol. 2011; 807:429-57)。 在開發有效基因療法的領域中,研究的迫切目標之一是對載體中目標基因進行密碼子優化以實現目標基因最大水準的表達,這反過來將允許使用更低劑量的載體以實現顯著的效果。 遺傳密碼的特性之一為簡並性,即不同密碼子(三核苷酸)編碼相同氨基酸的能力。此類翻譯為相同氨基酸的密碼子被稱為同義密碼子。在天然序列中,在演化的過程中隨機選擇了同義密碼子的其中一種,但同義密碼子使用的頻率不同:各氨基酸具有較優選和較不優選的密碼子。密碼子優化為廣泛使用的增加蛋白分子生產的技術,其向蛋白序列中各氨基酸提供一種適合的同義密碼子的合理映射。密碼子優化的常用原則之一涉及最頻繁密碼子的使用,而其他方法比如協調化(再現密碼子使用頻率的分佈)是其後引入的,但它們並不總是增加生產率。除密碼子頻率外,序列的GC含量(鳥嘌呤和胞嘧啶相對於序列總長度的比率)可影響生產效率,具體而言,據顯示,高GC含量與哺乳動物細胞中增加的mRNA水準相關(Grzegorz Kudla等人,High Guanine and Cytosine Content Increases mRNA Levels in Mammalian Cells,2006年6月,第4卷,第6期,e180,933-942頁)。值得進一步注意的是,mRNA的穩定二級結構元件(即具有低自由折疊能的那些)可降低效率。 目標基因序列的密碼子優化的不同變體可導致以下(相較於野生型基因): a) 目標基因的表達水準將輕微增加; b) 目標基因的表達水準將顯著增加; c) 目標基因的表達水準將大約保持在相同的水準; d) 目標基因的表達水準將更低。 因此,存在對於產生密碼子優化的FIX基因序列以增加靶細胞中FIX基因的表達和創造基於其的基因療法治療性產品的需要。
本組發明的作者發現,相較於編碼凝血因子IX的野生型基因(hFIX-wt),根據本發明的密碼子優化的編碼FIX蛋白(凝血因子IX)的核酸驚人地顯示出增加數倍的FIX基因表達水準和增加數倍的凝血因子IX蛋白產生水準,所述密碼子優化的核酸具有SEQ ID NO: 2 (hFIXco-v1)或SEQ ID NO: 4 (hFIXco-v2)的核苷酸序列。根據本發明的密碼子優化的核酸的這些變體(具有SEQ ID NO: 2 (hFIXco-v1)和SEQ ID NO: 4 (hFIXco-v2)的核苷酸序列)被包括在基於其的表達盒和載體內,以及在基於AAV5 (腺相關病毒血清型5)的重組病毒內。 發明說明 在一個方面,本發明涉及分離的密碼子優化的核酸,其編碼具有SEQ ID NO:1氨基酸序列的FIX (凝血因子IX)蛋白,並包括選自SEQ ID NO: 2或SEQ ID NO: 4的核苷酸序列。 在一個方面,本發明涉及包括上述密碼子優化的核酸的表達盒。 在一些實施方案中,該表達盒在5'末端到3'末端方向包括以下元件: 左側(第一) ITR (反向末端重複); TTR啟動子(運甲狀腺素蛋白啟動子); hBG1基因內含子(人類β-珠蛋白基因的攜內含子片段); 上述密碼子優化的核酸; hGH1多聚腺苷酸化信號(人類生長激素基因多聚腺苷酸化信號); 右側(第二) ITR。 在一些實施方案中,表達盒包括選自SEQ ID NO: 3或SEQ ID NO: 5的核苷酸序列。 在一個方面,本發明涉及包括上述密碼子優化的核酸或任意上述表達盒的表達載體。 在一個方面,本發明涉及分離的基於AAV5 (腺相關病毒血清型5)的重組病毒,用於增加靶細胞中FIX基因的表達,所述病毒包含上述密碼子優化的核酸或任意上述表達盒。 在一些實施方案中,基於AAV5的重組病毒具有包括AAV5蛋白VP1的衣殼。 在一些實施方案中,基於AAV5的重組病毒具有包括AAV5蛋白VP1的衣殼,所述VP1具有SEQ ID NO: 11的氨基酸序列。 在一些實施方案中,基於AAV5的重組病毒具有包括AAV5蛋白VP1的衣殼,所述VP1具有含一個或多個點突變的SEQ ID NO: 11的氨基酸序列。 在一些實施方案中,基於AAV5的重組病毒具有包括AAV5蛋白VP1的衣殼,所述VP1具有SEQ ID NO: 14的氨基酸序列。 在一些實施方案中,基於AAV5的重組病毒具有包括AAV5蛋白VP1的衣殼,所述VP1具有SEQ ID NO: 11的氨基酸序列或含一個或多個點突變的SEQ ID NO: 11的氨基酸序列;且表達盒在5'末端至3'末端方向包括以下元件: 左側(第一) ITR (反向末端重複); TTR啟動子(運甲狀腺素蛋白啟動子); hBG1基因內含子(人類β-珠蛋白基因的攜內含子片段); 上述密碼子優化的核酸; hGH1多聚腺苷酸化信號(人類生長激素基因多聚腺苷酸化信號); 右側(第二) ITR。 在一些實施方案中,基於AAV5的重組病毒具有包括AAV5蛋白VP1的衣殼,所述VP1具有SEQ ID NO: 11的氨基酸序列或含一個或多個點突變的SEQ ID NO: 11的氨基酸序列,且表達盒包含選自SEQ ID NO: 3或SEQ ID NO: 5的核苷酸序列。 在一些實施方案中,基於AAV5的重組病毒具有包括AAV5蛋白VP1的衣殼,所述VP1具有含一個或多個點突變的SEQ ID NO: 11的氨基酸序列,即SEQ ID NO: 14的氨基酸序列。 在一個方面,本發明涉及用於將FIX基因遞送至靶細胞的藥物組合物,其包括與一種或多種藥學上可接受的賦形劑組合的任意上述基於AAV5的重組病毒。 在一個方面,本發明涉及任意上述基於AAV5的重組病毒或上述組合物用於將FIX基因遞送至靶細胞的用途。 在一個方面,本發明涉及任意上述基於AAV5的重組病毒或上述組合物用於將FIX蛋白提供至患有血友病B和/或沒有功能完整的FIX基因拷貝的受試者的用途。 在一個方面,本發明涉及任意上述基於AAV5的重組病毒或上述組合物用於治療患有血友病B的受試者中的血友病B的用途。 在一個方面,本發明涉及用於將FIX蛋白提供至患有血友病B的受試者的方法,所述方法包含施用治療有效量的任意上述基於AAV5的重組病毒或上述組合物至需要其的受試者的細胞內。 在一個方面,本發明涉及用於將FIX基因遞送至患有血友病B的受試者的靶細胞的方法,所述方法包含施用任意上述基於AAV5的重組病毒或上述組合物至受試者的細胞內。 在一個方面,本發明涉及用於治療受試者中的血友病B的方法,所述方法包含施用治療有效量的任意上述基於AAV5的重組病毒或上述組合物至患有血友病B的受試者內。
定義和一般方法 除非本文另有定義,否則關於本發明使用的所有技術和科學術語將具有與本領域技術人員通常理解的含義相同的含義。 此外,除非上下文另有要求,否則單數術語應當包括複數術語,且複數術語應當包括單數術語。通常,本文所述的細胞培養、分子生物學、免疫學、微生物學、遺傳學、分析化學、有機合成化學、醫學和藥物化學以及蛋白和核酸雜交和化學的本分類和方法為技術人員周知且在本領域中被廣泛使用。酶反應和純化方法根據製造商的指導實施(如在本領域是常見的)或如本文所述實施。 “分離的”意為改變或移動自天然狀態。例如,天然存在於動物中的核酸或肽不是“分離的”,但與其天然狀態下共同存在的材料中部分或完全分離的相同的核酸或肽是“分離的”。分離的核酸或蛋白可基本上以純化形式存在,或可在非原生環境(例如遺傳修飾的細胞)中存在。 術語“天然存在的”、“原生的”或“野生型”被用於描述不同於人工產生的可在自然中找到的物體。例如,可分離自天然來源且未在實驗室中被人有意地修飾的存在於生物體(包括病毒)中的蛋白或核苷酸序列是天然存在的。 術語“基因組”是指生物體的完整遺傳材料。 如在本說明書和以下權利要求中所使用的,除非上下文另有規定,否則詞語“包括(include)”和“包含(comprise)”或其變體,比如“具有”、“包括(includes)”“包括(including)”“包含(comprises)”或“包含(comprising)”,將被理解為意指包括所述整數或整數組,但不排除任意其他整數或整數組。 蛋白(肽) 如在本說明中所使用的,術語“肽”、“多肽”和“蛋白”可互換使用,且它們指由通過肽鍵共價結合的氨基酸殘基組成的化合物。蛋白或肽必須含有至少兩個氨基酸,且對可組成蛋白或肽序列的氨基酸的最大數目沒有限制。多肽包括包含通過肽鍵彼此連接的兩個或更多個氨基酸的任意肽或蛋白。如在本說明書中所使用的,該術語是指短鏈(在本領域中通常也稱為例如肽、寡肽和寡聚體)和長鏈(在本領域中通常稱為蛋白,其中存在許多種類)二者。“多肽”特別包括例如生物學活性片段、基本同源多肽、寡肽、同二聚體、異二聚體、多肽的變體、修飾的多肽、衍生物、類似物、融合蛋白。多肽包括天然肽、重組肽、合成肽或其組合。 核酸分子 在本說明書中可互換使用的術語“核酸”、“核酸序列(nucleic sequence)”、“核酸序列(nucleic acid sequence)”、“多核苷酸”、“寡核苷酸”、“多核苷酸序列”和“核苷酸序列”意為核苷酸的準確序列,無論所述序列被修飾與否,確定核酸片段還是區域,含有非天然核苷酸與否,以及是雙鏈DNA或RNA、單鏈DNA或RNA還是所述DNA的轉錄產物。 如在本說明書中所使用的,作為非限制性實例,多核苷酸包括通過本領域中可用的任意手段獲得的所有核酸序列,作為非限制性實例,所述本領域中可用的任意手段包括重組手段,即使用普通克隆技術和PCR等從重組文庫或細胞基因組克隆核酸序列,以及合成手段。 還應包括於此的是,本發明不涉及在其天然染色體環境中(即處於天然狀態)的核苷酸序列。本發明的序列已被分離和/或純化,即它們被直接或間接地取樣(例如通過複製),它們的環境已至少部分被改變。因此,還應當在此提及通過重組遺傳學(例如通過宿主細胞)或通過化學合成獲得的分離的核酸。 除非另有規定,否則術語核苷酸序列涵蓋其互補物。因此,具有特定序列的核酸應被理解為涵蓋具有其互補序列的其互補物鏈的核酸。 腺相關病毒(AAV) 細小病毒科(Parvoviridae)的病毒為小型含DNA動物病毒。細小病毒科可被分為兩個亞科:其成員感染脊椎動物的細小病毒亞科(Parvovirinae),和其成員感染昆蟲的濃病毒亞科(Densovirinae)。到2006年,已描述了腺相關病毒的11種血清型(Mori, S.等人,2004年,"Two novel adeno-associated viruses from cynomolgus monkey: pseudotyping characterization of capsid protein", Virology, Т. 330 (2): 375-83)。所有已知的血清型都可感染來自多種組織類型的細胞。組織特異性通過衣殼蛋白血清型而確定;因此,基於腺相關病毒的載體通過指定所期望的血清型而構建。細小病毒科的細小病毒和其他成員的進一步的資訊在文獻(Kenneth I. Berns, «Parvoviridae: The Viruses and Their Replication», Fields Virology中第69章(1996年第3版))中進行描述。 所有已知AAV血清型的基因組組織非常相似。AAV的基因組為長度少於約5000個核苷酸(nt)的線性單鏈DNA分子。反向末端重複(ITR)在非結構蛋白(Rep)和結構蛋白(Cap)複製的獨特編碼核苷酸序列的側翼。Cap基因編碼形成衣殼的VP蛋白(VP1、VP2和VP3)。末端的145個核苷酸是自互補的並且被組織起來,使得形成T形髮夾的能量穩定的分子內雙鏈體可以形成。此類髮夾結構作為病毒DNA複製的起點發揮作用,充當細胞DNA聚合酶複合體的引物。野生型AAV (wtAAV)感染哺乳動物細胞後,Rep基因(例如Rep78和Rep52)分別使用P5啟動子和P19啟動子進行表達,且這兩種Rep蛋白在病毒基因組複製中都具有一定功能。Rep開放閱讀框(Rep ORF)中的剪接事件導致了實際上四種Rep蛋白(例如Rep78、Rep68、Rep52和Rep40)的表達。然而,已顯示未剪接的編碼Rep78和Rep52蛋白的mRNA足以在哺乳動物細胞中產生AAV載體。 載體 如本文所使用的,術語“載體”意為能夠運輸已與其連接的另一種核酸的核酸分子。此外,本文中術語“載體”是指能夠運輸核酸的病毒顆粒。 如在本說明書中所使用的,術語“表達”被定義為特定核苷酸序列由其啟動子驅動的轉錄和/或翻譯。 用途 “基因療法”是將基因插入受試者的細胞和/或組織內以治療疾病,通常為遺傳疾病,其中缺陷型突變等位基因被功能性等位基因替代。 “治療(treat)”、“治療(treating)”和“治療(treatment)”是指減輕或消除生物的障礙和/或至少一種其伴隨的症狀的方法。如本文所使用的,“減輕”疾病、障礙或狀況意為減少疾病、障礙或狀況的症狀的嚴重性和/或其發生頻率。進一步地,本文提及的“治療”包括提及治療性、緩解性和預防性治療。 在一個方面,治療的受試者或患者為哺乳動物,優選人類受試者。所述受試者可為任意年齡的雄性或雌性。 術語“障礙”意為可從用本發明的化合物的治療中受益的任意狀況。 “疾病”為受試者的健康狀態,其中該受試者不能維持穩態,且其中若疾病未得到改善,則該受試者的健康持續惡化。 術語“受試者”、“患者”“個體”等等在本說明書中可互換使用,且他們是指適合於本說明書中所述方法的任意動物。在某些非限制性實施方案中,受試者、患者或個體為人類。所述受試者可為任意年齡的雄性或雌性。 “治療有效量”或“有效量”是指將在一定程度上緩和治療中疾病一個或多個症狀的正在施用的治療劑的量。 發明詳述核酸 在一個方面,本發明涉及分離的密碼子優化的核酸,其編碼具有以下氨基酸序列的FIX蛋白(凝血因子IX): MQRVNMIMAESPGLITICLLGYLLSAECTVFLDHENANKILNRPKRYNSGKLEEFVQGNLERECMEEKCSFEEAREVFENTERTTEFWKQYVDGDQCESNPCLNGGSCKDDINSYECWCPFGFEGKNCELDVTCNIKNGRCEQFCKNSADNKVVCSCTEGYRLAENQKSCEPAVPFPCGRVSVSQTSKLTRAETVFPDVDYVNSTEAETILDNITQSTQSFNDFTRVVGGEDAKPGQFPWQVVLNGKVDAFCGGSIVNEKWIVTAAHCVETGVKITVVAGEHNIEETEHTEQKRNVIRIIPHHNYNAAINKYNHDIALLELDEPLVLNSYVTPICIADKEYTNIFLKFGSGYVSGWGRVFHKGRSALVLQYLRVPLVDRATCLLSTKFTIYNNMFCAGFHEGGRDSCQGDSGGPHVTEVEGTSFLTGIISWGEECAMKGKYGIYTKVSRYVNWIKEKTKLT (SEQ ID NO:1),並包括選自以下的核苷酸序列:ATGCAGCGGGTCAACATGATCATGGCGGAGTCGCCGGGCCTGATCACGATCTGCCTCCTCGGGTACCTGCTCTCCGCCGAGTGCACCGTGTTCCTGGACCACGAGAACGCCAACAAGATCCTCAACCGGCCCAAGCGCTACAACTCCGGCAAGCTGGAGGAGTTCGTGCAGGGGAACCTCGAGCGCGAGTGCATGGAGGAGAAGTGCTCGTTCGAGGAGGCGCGGGAGGTGTTCGAGAACACCGAGCGCACCACGGAGTTCTGGAAGCAGTACGTGGACGGGGACCAGTGCGAGTCGAACCCGTGCCTCAACGGGGGGTCGTGCAAGGACGACATCAACTCGTACGAGTGCTGGTGCCCCTTCGGCTTCGAGGGCAAGAACTGCGAGCTGGACGTGACCTGCAACATCAAGAACGGGCGCTGCGAGCAGTTCTGCAAGAACAGCGCCGACAACAAGGTGGTCTGCTCCTGCACCGAGGGGTACCGCCTCGCGGAGAACCAGAAGTCCTGCGAGCCGGCCGTGCCCTTCCCCTGCGGCCGCGTGTCCGTCAGCCAGACGTCGAAGCTGACGCGCGCCGAGACCGTCTTCCCGGACGTGGACTACGTGAACTCGACGGAGGCCGAGACCATCCTGGACAACATCACCCAGAGCACCCAGTCCTTCAACGACTTCACGCGGGTGGTCGGCGGCGAGGACGCCAAGCCCGGGCAGTTCCCGTGGCAGGTCGTCCTCAACGGGAAGGTCGACGCGTTCTGCGGCGGGAGCATCGTGAACGAGAAGTGGATCGTGACCGCCGCGCACTGCGTCGAGACGGGCGTGAAGATCACCGTGGTGGCCGGGGAGCACAACATCGAGGAGACGGAGCACACCGAGCAGAAGCGGAACGTGATCCGCATCATCCCGCACCACAACTACAACGCCGCCATCAACAAGTACAACCACGACATCGCGCTCCTCGAGCTGGACGAGCCGCTGGTCCTCAACTCCTACGTCACGCCGATCTGCATCGCCGACAAGGAGTACACGAACATCTTCCTGAAGTTCGGGAGCGGCTACGTCTCGGGCTGGGGCCGCGTGTTCCACAAGGGGCGCAGCGCGCTCGTGCTCCAGTACCTGCGGGTCCCCCTGGTCGACCGCGCGACCTGCCTCCTCTCCACGAAGTTCACGATCTACAACAACATGTTCTGCGCGGGGTTCCACGAGGGCGGCCGGGACAGCTGCCAGGGCGACAGCGGGGGCCCGCACGTGACGGAGGTGGAGGGCACGAGCTTCCTGACCGGGATCATCTCGTGGGGCGAGGAGTGCGCGATGAAGGGGAAGTACGGCATCTACACCAAGGTCAGCCGGTACGTGAACTGGATCAAGGAGAAGACGAAGCTGACG (SEQ ID NO: 2) 或 ATGCAGCGGGTGAACATGATCATGGCCGAGTCCCCAGGCCTGATTACCATCTGTCTGCTGGGCTACCTGCTGAGCGCCGAATGCACCGTGTTTCTGGACCACGAGAACGCCAACAAGATCCTGAACCGCCCTAAGCGGTACAACTCCGGCAAGCTGGAGGAGTTTGTGCAGGGCAATCTGGAGCGGGAGTGTATGGAGGAGAAGTGCAGCTTCGAGGAGGCCAGGGAGGTGTTCGAGAACACCGAGAGGACCACCGAGTTCTGGAAGCAGTATGTGGACGGCGACCAGTGCGAGTCTAATCCTTGTCTGAATGGCGGGAGCTGCAAGGACGACATCAACAGCTACGAGTGCTGGTGCCCTTTCGGCTTCGAGGGCAAGAATTGCGAGCTGGACGTGACCTGCAACATCAAGAACGGCCGGTGTGAGCAGTTCTGCAAGAACAGCGCCGACAACAAGGTGGTGTGCTCCTGCACCGAGGGATACAGGCTGGCCGAGAATCAGAAGAGCTGTGAGCCCGCCGTGCCATTCCCCTGTGGCAGAGTGTCTGTGAGCCAGACCAGCAAGCTGACCAGAGCCGAGACCGTGTTTCCAGACGTGGACTACGTGAACAGCACCGAGGCCGAGACCATCCTGGATAATATCACCCAGTCCACCCAGAGCTTCAACGACTTCACCAGAGTGGTGGGAGGCGAGGATGCCAAGCCAGGACAGTTTCCCTGGCAGGTGGTGCTGAATGGCAAGGTGGACGCCTTCTGCGGAGGCAGCATCGTGAACGAGAAGTGGATTGTGACCGCAGCCCACTGCGTGGAGACTGGCGTGAAGATTACCGTGGTCGCCGGCGAGCACAATATCGAAGAGACCGAGCACACCGAGCAGAAGCGCAACGTGATCCGGATCATCCCTCACCACAACTACAACGCAGCCATCAACAAGTACAACCACGACATCGCCCTGCTGGAGCTGGACGAGCCACTGGTGCTGAACTCTTACGTGACCCCTATCTGCATCGCCGACAAGGAGTACACCAACATCTTCCTGAAGTTCGGCAGCGGCTACGTGAGCGGATGGGGCAGAGTGTTTCACAAGGGCAGGAGCGCCCTGGTGCTGCAGTATCTGAGAGTGCCACTGGTGGACAGAGCTACCTGCCTGCTGAGCACCAAGTTCACCATCTACAACAACATGTTCTGCGCCGGCTTCCACGAGGGGGGAAGAGACTCTTGCCAGGGCGATTCCGGCGGACCACACGTGACCGAAGTGGAGGGCACCAGCTTCCTGACCGGCATCATCTCCTGGGGCGAGGAATGCGCCATGAAGGGCAAGTACGGCATCTACACCAAGGTGAGCAGGTACGTGAACTGGATCAAGGAGAAGACCAAGCTGACC (SEQ ID NO: 4)。 “分離的”核酸分子為鑒定和分離自至少一種核酸分子-雜質的核酸分子,前者通常在核酸酶核酸的天然來源中結合所述核酸分子-雜質。分離的核酸分子不同於該分子被發現在天然條件下處於其中的形式或集合。因此,分離的核酸分子不同於在天然條件下存在於細胞中的核酸分子。然而分離的核酸分子包括例如位於細胞(其中核酸酶正常表達)中的核酸分子,如果該核酸分子具有不同於其在天然條件下在細胞中的定位的染色體定位。 上述密碼子優化的核酸通過對具有以下核苷酸序列的野生型核酸進行密碼子優化而獲得: ATGCAGCGCGTGAACATGATCATGGCAGAATCACCAGGCCTCATCACCATCTGCCTTTTAGGATATCTACTCAGTGCTGAATGTACAGTTTTTCTTGATCATGAAAACGCCAACAAAATTCTGAATCGGCCAAAGAGGTATAATTCAGGTAAATTGGAAGAGTTTGTTCAAGGGAACCTTGAGAGAGAATGTATGGAAGAAAAGTGTAGTTTTGAAGAAGCACGAGAAGTTTTTGAAAACACTGAAAGAACAACTGAATTTTGGAAGCAGTATGTTGATGGAGATCAGTGTGAGTCCAATCCATGTTTAAATGGCGGCAGTTGCAAGGATGACATTAATTCCTATGAATGTTGGTGTCCCTTTGGATTTGAAGGAAAGAACTGTGAATTAGATGTAACATGTAACATTAAGAATGGCAGATGCGAGCAGTTTTGTAAAAATAGTGCTGATAACAAGGTGGTTTGCTCCTGTACTGAGGGATATCGACTTGCAGAAAACCAGAAGTCCTGTGAACCAGCAGTGCCATTTCCATGTGGAAGAGTTTCTGTTTCACAAACTTCTAAGCTCACCCGTGCTGAGACTGTTTTTCCTGATGTGGACTATGTAAATTCTACTGAAGCTGAAACCATTTTGGATAACATCACTCAAAGCACCCAATCATTTAATGACTTCACTCGGGTTGTTGGTGGAGAAGATGCCAAACCAGGTCAATTCCCTTGGCAGGTTGTTTTGAATGGTAAAGTTGATGCATTCTGTGGAGGCTCTATCGTTAATGAAAAATGGATTGTAACTGCTGCCCACTGTGTTGAAACTGGTGTTAAAATTACAGTTGTCGCAGGTGAACATAATATTGAGGAGACAGAACATACAGAGCAAAAGCGAAATGTGATTCGAATTATTCCTCACCACAACTACAATGCAGCTATTAATAAGTACAACCATGACATTGCCCTTCTGGAACTGGACGAACCCTTAGTGCTAAACAGCTACGTTACACCTATTTGCATTGCTGACAAGGAATACACGAACATCTTCCTCAAATTTGGATCTGGCTATGTAAGTGGCTGGGGAAGAGTCTTCCACAAAGGGAGATCAGCTTTAGTTCTTCAGTACCTTAGAGTTCCACTTGTTGACCGAGCCACATGTCTTCTATCTACAAAGTTCACCATCTATAACAACATGTTCTGTGCTGGCTTCCATGAAGGAGGTAGAGATTCATGTCAAGGAGATAGTGGGGGACCCCATGTTACTGAAGTGGAAGGGACCAGTTTCTTAACTGGAATTATTAGCTGGGGTGAAGAGTGTGCAATGAAAGGCAAATATGGAATATATACCAAGGTATCCCGGTATGTCAACTGGATTAAGGAAAAAACAAAGCTCACT (SEQ ID NO: 17)。 作為具有SEQ ID NO: 17的核苷酸序列的編碼FIX蛋白的野生型核酸密碼子優化的結果,獲得了大量密碼子優化的核酸,所述密碼子優化的核酸進一步對於相較於對照(具有SEQ ID NO:17的野生型核酸)的蛋白產生水準進行了測試。 所有密碼子優化的核酸都顯示了相較於野生型增加的FIX蛋白產生水準;進一步地,具有SEQ ID NO: 2的核苷酸序列的本發明的密碼子優化的核酸(hFIXco-v1)和具有SEQ ID NO: 4的核苷酸序列的本發明的密碼子優化的核酸(hFIXco-v2)驚人地顯示了最佳結果,具體而言為相較於野生型增加的FIX基因表達水準、數倍增加的FIX蛋白產生水準(參見實施例2、3和4)。 表達盒. 表達載體. 在一個方面,本發明涉及表達盒,其包括編碼FIX蛋白(凝血因子IX)的上述密碼子優化的核酸。 如本文所使用的,術語“表達……的盒”或“表達盒”具體而言是指DNA片段,其在適當的條件下能夠觸發包括於所述表達盒中的編碼目標多肽的多核苷酸的表達。當被引入宿主細胞內時,該表達盒特別是能夠使用細胞機制將編碼目標多肽的多核苷酸轉錄為RNA,其隨後通常進一步進行加工並最終翻譯為目標多肽。該表達盒可被包含在表達載體中。 本發明的表達盒包含啟動子作為元件。如本文所使用的,術語“啟動子”具體而言是指促進與啟動子可操作地連接的多核苷酸轉錄的DNA元件。啟動子可進一步地形成啟動子/增強子元件的一部分。儘管“啟動子”和“增強子”元件之間的物理邊界並不總是清晰的,但術語“啟動子”通常是指核酸分子上RNA聚合酶和/或任意相關的因子與之結合以及轉錄在此開始的位點。增強子在時間以及空間上增強啟動子活性。許多啟動子在本領域中已知在廣泛範圍的細胞類型中具有轉錄活性。啟動子可被分為兩類,即組成性地發揮功能的那些和通過誘導或去阻遏進行調節的那些。兩類都適合於蛋白表達。用於在真核細胞,特別是哺乳動物細胞中高水準產生多肽的啟動子應當為強的,並優選在廣泛範圍的細胞類型中具有活性。能夠在許多細胞類型中驅動表達的強組成型啟動子在本領域中周知,並且因此在本文中無需對它們進行詳述。根據本發明的想法,優選使用TTR啟動子。TTR啟動子或TTR啟動子/增強子特別適合在本發明的表達盒中作為啟動子。根據本發明的一個實施方案,TTR啟動子被用於本發明的表達盒中。 在本發明的一些實施方案中,表達盒在5'末端至3'末端方向包括以下元件: 左側(第一) ITR (反向末端重複); TTR啟動子(運甲狀腺素蛋白啟動子); hBG1基因內含子(人類β-珠蛋白基因的攜內含子片段); 編碼FIX蛋白(凝血因子IX)的上述密碼子優化的核酸; hGH1多聚腺苷酸化信號(人類生長激素基因多聚腺苷酸化信號); 右側(第二) ITR。 在本發明的一些實施方案中,左側(第一) ITR具有以下核酸序列: Cctgcaggcagctgcgcgctcgctcgctcactgaggccgcccgggcgtcgggcgacctttggtcgcccggcctcagtgagcgagcgagcgcgcagagagggagtggccaactccatcactaggggttcct (SEQ ID NO: 6)。 在本發明的一些實施方案中,TTR啟動子具有以下核酸序列: tcgagcttgggctgcaggtcgagggcactgggaggatgttgagtaagatggaaaactactgatgacccttgcagagacagagtattaggacatgtttgaacaggggccggcgatcagcaggtagctctagaggatccccgtctgtctgcacatttcgtagagcgagtgttccgatactctaatctccctaggcaaggttcatatttgtgtaggttacttattctccttttgttgactaagtcaataatcagaatcagcaggtttggagtcagcttggcagggatcagcagcctgggttggaaggagggggtataaaagccccttcaccaggagaagccgtcacacagatccacaagctcctgacaggaagct (SEQ ID NO: 7)。 在本發明的一些實施方案中,hBG1基因內含子具有以下核酸序列: cgaatcccggccgggaacggtgcattggaacgcggattccccgtgccaagagtgacgtaagtaccgcctatagagtctataggcccacaaaaaatgctttcttcttttaatatacttttttgtttatcttatttctaatactttccctaatctctttctttcagggcaataatgatacaatgtatcatgcctctttgcaccattctaaagaataacagtgataatttctgggttaaggcaatagcaatatttctgcatataaatatttctgcatataaattgtaactgatgtaagaggtttcatattgctaatagcagctacaatccagctaccattctgcttttattttatggttgggataaggctggattattctgagtccaagctaggcccttttgctaatcatgttcatacctcttatcttcctcccacagctcctgggcaacgtgctggtctgtgtgctggcccatcactttggcaaagaattgggat (SEQ ID NO: 8)。 在本發明的一些實施方案中,hGH1多聚腺苷酸化信號具有以下核酸序列: acgggtggcatccctgtgacccctccccagtgccCctcctggccctggaagttgccactccagtgcccaccagccttgtcctaataaaattaagttgcatcattttgtctgactaggtgtccttctataatattatggggtggaggggggtggtatggagcaaggggcaagttgggaagacaacctgtagggcctgcggggtctattgggaaccaagctggagtgcagtggcacaatcttggctcactgcaatctccgcctcctgggttcaagcgattctcctgcctcagcctcccgagttgttgggattccaggcatgcatgaccaggctcagctaatttttgtttttttggtagagacggggtttcaccatattggccaggctggtctccaactcctaatctcaggtgatctacccaccttggcctcccaaattgctgggattacaggcgtgaaccactgctcccttccctgtcctt (SEQ ID NO: 9)。 在本發明的一些實施方案中,右側(第二) ITR具有以下核酸序列: aggaacccctagtgatggagttggccactccctctctgcgcgctcgctcgctcactgaggccgggcgaccaaaggtcgcccgacgcccgggctttgcccgggcggcctcagtgagcgagcgagcgcgcagctgcctgcagg (SEQ ID NO: 10)。 在本發明的一些實施方案中,表達盒包括選自以下的核苷酸序列: cctgcaggcagctgcgcgctcgctcgctcactgaggccgcccgggcgtcgggcgacctttggtcgcccggcctcagtgagcgagcgagcgcgcagagagggagtggccaactccatcactaggggttcctgcggccgcacgcgtgccgccaccATGGtcgagcttgggctgcaggtcgagggcactgggaggatgttgagtaagatggaaaactactgatgacccttgcagagacagagtattaggacatgtttgaacaggggccggcgatcagcaggtagctctagaggatccccgtctgtctgcacatttcgtagagcgagtgttccgatactctaatctccctaggcaaggttcatatttgtgtaggttacttattctccttttgttgactaagtcaataatcagaatcagcaggtttggagtcagcttggcagggatcagcagcctgggttggaaggagggggtataaaagccccttcaccaggagaagccgtcacacagatccacaagctcctgacaggaagctctaggtgactctcttaaggtagcctccgcggattcgaatcccggccgggaacggtgcattggaacgcggattccccgtgccaagagtgacgtaagtaccgcctatagagtctataggcccacaaaaaatgctttcttcttttaatatacttttttgtttatcttatttctaatactttccctaatctctttctttcagggcaataatgatacaatgtatcatgcctctttgcaccattctaaagaataacagtgataatttctgggttaaggcaatagcaatatttctgcatataaatatttctgcatataaattgtaactgatgtaagaggtttcatattgctaatagcagctacaatccagctaccattctgcttttattttatggttgggataaggctggattattctgagtccaagctaggcccttttgctaatcatgttcatacctcttatcttcctcccacagctcctgggcaacgtgctggtctgtgtgctggcccatcactttggcaaagaattgggattcgaacatCGATATGCAGCGGGTCAACATGATCATGGCGGAGTCGCCGGGCCTGATCACGATCTGCCTCCTCGGGTACCTGCTCTCCGCCGAGTGCACCGTGTTCCTGGACCACGAGAACGCCAACAAGATCCTCAACCGGCCCAAGCGCTACAACTCCGGCAAGCTGGAGGAGTTCGTGCAGGGGAACCTCGAGCGCGAGTGCATGGAGGAGAAGTGCTCGTTCGAGGAGGCGCGGGAGGTGTTCGAGAACACCGAGCGCACCACGGAGTTCTGGAAGCAGTACGTGGACGGGGACCAGTGCGAGTCGAACCCGTGCCTCAACGGGGGGTCGTGCAAGGACGACATCAACTCGTACGAGTGCTGGTGCCCCTTCGGCTTCGAGGGCAAGAACTGCGAGCTGGACGTGACCTGCAACATCAAGAACGGGCGCTGCGAGCAGTTCTGCAAGAACAGCGCCGACAACAAGGTGGTCTGCTCCTGCACCGAGGGGTACCGCCTCGCGGAGAACCAGAAGTCCTGCGAGCCGGCCGTGCCCTTCCCCTGCGGCCGCGTGTCCGTCAGCCAGACGTCGAAGCTGACGCGCGCCGAGACCGTCTTCCCGGACGTGGACTACGTGAACTCGACGGAGGCCGAGACCATCCTGGACAACATCACCCAGAGCACCCAGTCCTTCAACGACTTCACGCGGGTGGTCGGCGGCGAGGACGCCAAGCCCGGGCAGTTCCCGTGGCAGGTCGTCCTCAACGGGAAGGTCGACGCGTTCTGCGGCGGGAGCATCGTGAACGAGAAGTGGATCGTGACCGCCGCGCACTGCGTCGAGACGGGCGTGAAGATCACCGTGGTGGCCGGGGAGCACAACATCGAGGAGACGGAGCACACCGAGCAGAAGCGGAACGTGATCCGCATCATCCCGCACCACAACTACAACGCCGCCATCAACAAGTACAACCACGACATCGCGCTCCTCGAGCTGGACGAGCCGCTGGTCCTCAACTCCTACGTCACGCCGATCTGCATCGCCGACAAGGAGTACACGAACATCTTCCTGAAGTTCGGGAGCGGCTACGTCTCGGGCTGGGGCCGCGTGTTCCACAAGGGGCGCAGCGCGCTCGTGCTCCAGTACCTGCGGGTCCCCCTGGTCGACCGCGCGACCTGCCTCCTCTCCACGAAGTTCACGATCTACAACAACATGTTCTGCGCGGGGTTCCACGAGGGCGGCCGGGACAGCTGCCAGGGCGACAGCGGGGGCCCGCACGTGACGGAGGTGGAGGGCACGAGCTTCCTGACCGGGATCATCTCGTGGGGCGAGGAGTGCGCGATGAAGGGGAAGTACGGCATCTACACCAAGGTCAGCCGGTACGTGAACTGGATCAAGGAGAAGACGAAGCTGACGTGATGAAgatctacgggtggcatccctgtgacccctccccagtgccCctcctggccctggaagttgccactccagtgcccaccagccttgtcctaataaaattaagttgcatcattttgtctgactaggtgtccttctataatattatggggtggaggggggtggtatggagcaaggggcaagttgggaagacaacctgtagggcctgcggggtctattgggaaccaagctggagtgcagtggcacaatcttggctcactgcaatctccgcctcctgggttcaagcgattctcctgcctcagcctcccgagttgttgggattccaggcatgcatgaccaggctcagctaatttttgtttttttggtagagacggggtttcaccatattggccaggctggtctccaactcctaatctcaggtgatctacccaccttggcctcccaaattgctgggattacaggcgtgaaccactgctcccttccctgtccttctgattttgtaggtaaccacgtgcggaccgagcggccgcaggaacccctagtgatggagttggccactccctctctgcgcgctcgctcgctcactgaggccgggcgaccaaaggtcgcccgacgcccgggctttgcccgggcggcctcagtgagcgagcgagcgcgcagctgcctgcagg (SEQ ID NO: 3) 或 cctgcaggcagctgcgcgctcgctcgctcactgaggccgcccgggcgtcgggcgacctttggtcgcccggcctcagtgagcgagcgagcgcgcagagagggagtggccaactccatcactaggggttcctgcggccgcacgcgtgccgccaccATGGtcgagcttgggctgcaggtcgagggcactgggaggatgttgagtaagatggaaaactactgatgacccttgcagagacagagtattaggacatgtttgaacaggggccggcgatcagcaggtagctctagaggatccccgtctgtctgcacatttcgtagagcgagtgttccgatactctaatctccctaggcaaggttcatatttgtgtaggttacttattctccttttgttgactaagtcaataatcagaatcagcaggtttggagtcagcttggcagggatcagcagcctgggttggaaggagggggtataaaagccccttcaccaggagaagccgtcacacagatccacaagctcctgacaggaagctctaggtgactctcttaaggtagcctccgcggattcgaatcccggccgggaacggtgcattggaacgcggattccccgtgccaagagtgacgtaagtaccgcctatagagtctataggcccacaaaaaatgctttcttcttttaatatacttttttgtttatcttatttctaatactttccctaatctctttctttcagggcaataatgatacaatgtatcatgcctctttgcaccattctaaagaataacagtgataatttctgggttaaggcaatagcaatatttctgcatataaatatttctgcatataaattgtaactgatgtaagaggtttcatattgctaatagcagctacaatccagctaccattctgcttttattttatggttgggataaggctggattattctgagtccaagctaggcccttttgctaatcatgttcatacctcttatcttcctcccacagctcctgggcaacgtgctggtctgtgtgctggcccatcactttggcaaagaattgggattcgaacatcgatataaATGCAGCGGGTGAACATGATCATGGCCGAGTCCCCAGGCCTGATTACCATCTGTCTGCTGGGCTACCTGCTGAGCGCCGAATGCACCGTGTTTCTGGACCACGAGAACGCCAACAAGATCCTGAACCGCCCTAAGCGGTACAACTCCGGCAAGCTGGAGGAGTTTGTGCAGGGCAATCTGGAGCGGGAGTGTATGGAGGAGAAGTGCAGCTTCGAGGAGGCCAGGGAGGTGTTCGAGAACACCGAGAGGACCACCGAGTTCTGGAAGCAGTATGTGGACGGCGACCAGTGCGAGTCTAATCCTTGTCTGAATGGCGGGAGCTGCAAGGACGACATCAACAGCTACGAGTGCTGGTGCCCTTTCGGCTTCGAGGGCAAGAATTGCGAGCTGGACGTGACCTGCAACATCAAGAACGGCCGGTGTGAGCAGTTCTGCAAGAACAGCGCCGACAACAAGGTGGTGTGCTCCTGCACCGAGGGATACAGGCTGGCCGAGAATCAGAAGAGCTGTGAGCCCGCCGTGCCATTCCCCTGTGGCAGAGTGTCTGTGAGCCAGACCAGCAAGCTGACCAGAGCCGAGACCGTGTTTCCAGACGTGGACTACGTGAACAGCACCGAGGCCGAGACCATCCTGGATAATATCACCCAGTCCACCCAGAGCTTCAACGACTTCACCAGAGTGGTGGGAGGCGAGGATGCCAAGCCAGGACAGTTTCCCTGGCAGGTGGTGCTGAATGGCAAGGTGGACGCCTTCTGCGGAGGCAGCATCGTGAACGAGAAGTGGATTGTGACCGCAGCCCACTGCGTGGAGACTGGCGTGAAGATTACCGTGGTCGCCGGCGAGCACAATATCGAAGAGACCGAGCACACCGAGCAGAAGCGCAACGTGATCCGGATCATCCCTCACCACAACTACAACGCAGCCATCAACAAGTACAACCACGACATCGCCCTGCTGGAGCTGGACGAGCCACTGGTGCTGAACTCTTACGTGACCCCTATCTGCATCGCCGACAAGGAGTACACCAACATCTTCCTGAAGTTCGGCAGCGGCTACGTGAGCGGATGGGGCAGAGTGTTTCACAAGGGCAGGAGCGCCCTGGTGCTGCAGTATCTGAGAGTGCCACTGGTGGACAGAGCTACCTGCCTGCTGAGCACCAAGTTCACCATCTACAACAACATGTTCTGCGCCGGCTTCCACGAGGGGGGAAGAGACTCTTGCCAGGGCGATTCCGGCGGACCACACGTGACCGAAGTGGAGGGCACCAGCTTCCTGACCGGCATCATCTCCTGGGGCGAGGAATGCGCCATGAAGGGCAAGTACGGCATCTACACCAAGGTGAGCAGGTACGTGAACTGGATCAAGGAGAAGACCAAGCTGACCtgaagatctacgggtggcatccctgtgacccctccccagtgccCctcctggccctggaagttgccactccagtgcccaccagccttgtcctaataaaattaagttgcatcattttgtctgactaggtgtccttctataatattatggggtggaggggggtggtatggagcaaggggcaagttgggaagacaacctgtagggcctgcggggtctattgggaaccaagctggagtgcagtggcacaatcttggctcactgcaatctccgcctcctgggttcaagcgattctcctgcctcagcctcccgagttgttgggattccaggcatgcatgaccaggctcagctaatttttgtttttttggtagagacggggtttcaccatattggccaggctggtctccaactcctaatctcaggtgatctacccaccttggcctcccaaattgctgggattacaggcgtgaaccactgctcccttccctgtccttctgattttgtaggtaaccacgtgcggaccgagcggccgcaggaacccctagtgatggagttggccactccctctctgcgcgctcgctcgctcactgaggccgggcgaccaaaggtcgcccgacgcccgggctttgcccgggcggcctcagtgagcgagcgagcgcgcagctgcctgcagg (SEQ ID NO: 5)。 在一個方面,本發明涉及包括上述密碼子優化的核酸或任意上述表達盒的表達載體。 在本發明的一些實施方案中,該載體為質粒,即環狀雙鏈DNA片段,另外的DNA區段可連接至該片段內。 在本發明的一些實施方案中,載體為病毒載體,其中另外的DNA區段可連接至病毒基因組內。 在本發明的一些實施方案中,載體能夠在該載體被引入其中的宿主細胞中自主複製(例如具有細菌複製起點位點的細菌載體和哺乳動物附加型載體)。在本發明進一步的實施方案中,載體(例如哺乳動物非附加型載體)可在引入宿主細胞內後被整合至宿主細胞基因組內,並且因此隨宿主基因一起複製。此外,某些載體能夠指導它們與之可操作地連接的基因的表達。此類載體在本文中被稱為重組表達載體(或被簡稱為“表達載體”)。 表達載體包括質粒、逆轉錄病毒、腺病毒、腺相關病毒(AAV)、植物病毒(比如花椰菜花葉病毒、煙草花葉病毒)、黏粒、YAC、EBV衍生的附加體等等。可將DNA分子連接至載體內,以使載體內轉錄和翻譯控制序列發揮它們預期的調節DNA轉錄和翻譯的功能。可選擇與所使用的表達宿主細胞相容的表達載體和表達控制序列。可通過標準方法(例如互補限制性位點的連接,或者如果不存在限制性位點則為平末端連接)將DNA分子引入表達載體內。 重組表達載體也可編碼促進目標蛋白從宿主細胞分泌的引導肽(信號肽)。目標蛋白的基因可被克隆至載體內,以使信號肽在框內地連接至目標蛋白的氨基末端。引導肽(或信號肽)可為免疫球蛋白引導肽或其他引導肽(即非免疫球蛋白引導肽)。 除本發明的FIX基因外,本發明的重組表達載體可攜帶控制FIX基因在宿主細胞中表達的調節序列。本領域技術人員將理解表達載體的設計,包括調節序列的選擇,可取決於諸如待轉化的宿主細胞的選擇、所期望蛋白的表達水準等因素。哺乳動物中表達宿主細胞優選的控制序列包括保證哺乳動物細胞中蛋白高水準表達的病毒元件,比如啟動子和/或增強子,其衍生自逆轉錄病毒LTR、巨細胞病毒(CMV) (比如CMV啟動子/增強子)、猿猴病毒40 (SV40) (比如SV40啟動子/增強子)、腺病毒(例如腺病毒主要晚期啟動子(AdMLP))、多瘤病毒,以及哺乳動物強啟動子,比如TTR啟動子、天然免疫球蛋白啟動子或肌動蛋白啟動子。 術語“控制序列”是指特定宿主生物體中可操作地連接的編碼序列的表達所必需的DNA序列。適合於原核生物的控制序列為例如啟動子,任選地為操縱子序列和核糖體結合位點。已知真核細胞包括啟動子、多聚腺苷酸化信號和增強子。 如在本說明書中所使用的,術語“啟動子”或“轉錄調節序列”或“調節序列”是指核酸片段,其控制一個或多個編碼序列的轉錄,並位於編碼序列的轉錄起始位元點關於閱讀方向(相對於轉錄方向)的上游,且在結構上通過以下的存在進行鑒定:DNA依賴的RNA聚合酶結合位點、轉錄起始位點和任意其他DNA序列,包括但不限於轉錄因子結合位點、阻遏和啟動蛋白結合位點和本領域技術人員已知的直接地或間接地用所述啟動子調節轉錄水準的任意其他核苷酸序列。“組成型”啟動子為在典型生理和發育條件下在大多數組織中具有活性的啟動子。“誘導型”啟動子為生理上或發育上(例如在化學誘導劑的影響下)受調節的啟動子。“組織特異性”啟動子僅在特定類型的組織或細胞中具有活性。 如本文所使用的,術語“增強子(enhancers)”或“增強子(enhancer)”可指位於編碼重組產物的DNA序列鄰近處的DNA序列。增強子元件通常位於啟動子元件的5'方向,或可位於編碼DNA序列(例如轉錄或翻譯為一種或多種重組產物的DNA序列)下游或位於編碼DNA序列中。因此增強子元件可位於編碼重組產物的DNA序列上游或所述序列下游100個堿基對、200個堿基對或300個或更多個堿基對處。增強子元件可增加從DNA序列表達的重組產物的量,達高於與單一啟動子元件相關的表達水準。多種增強子元件對本領域普通技術人員容易可得。 除上述基因和調節序列外,本發明的重組表達載體可攜帶另外的序列,比如調節載體在宿主細胞中複製的序列(例如複製起點)和選擇性標記基因。選擇性標記基因促進對載體已引入其中的宿主細胞的選擇(參見例如美國專利號4,399,216、4,634,665和5,179,017)。例如,選擇性標記基因通常將對藥劑(比如G418、氨苄青黴素、潮黴素或氨甲喋呤)的抗性賦予載體已引入其中的宿主細胞。例如,選擇性標記基因包括二氫葉酸還原酶(DHFR)基因(用於在dhfr-宿主細胞中在氨甲喋呤選擇/擴增期間使用)、neo基因(用於G418選擇)和谷氨酸合成酶基因。 如本說明書所使用的,術語“表達控制序列”是指對影響它們所連接的編碼序列的表達和加工而言必需的多核苷酸序列。表達控制序列包括適當的轉錄起始、終止、啟動子和增強子序列;有效的RNA加工信號,比如剪接和多聚腺苷酸化信號;穩定細胞質mRNA的序列;增強翻譯效率的序列(即Kozak共有序列);增強蛋白穩定性的序列;和當期望時增強蛋白分泌的序列。此類控制序列的性質取決於宿主生物體而不同;在原核生物中,此類控制序列通常包括具有核糖體結合位點的啟動子和轉錄終止序列;在真核生物中,此類控制序列通常包括啟動子和轉錄終止序列。術語“控制序列”至少包括其存在對表達和加工至關重要的所有成分,並且還可包括另外的成分,其存在為有利的,例如引導序列和融合伴侶序列。 如本文所使用的,術語“可操作地連接”是指多核苷酸(或多肽)元件呈功能性關係的連接。當核酸在功能性關係的條件下與另一個核酸序列一起存在時,該核酸為“可操作地連接”的。例如,如果轉錄調節序列影響編碼序列的轉錄,則該轉錄調節序列可操作地連接至所述編碼序列。術語“可操作地連接”意為所連接的DNA序列通常為連續的,並且在需要連接兩個蛋白編碼區域時也是連續的並存在於閱讀框中。 在本發明的一個實施方案中,“表達載體”涉及包含側翼為細小病毒序列或反向末端重複(ITR)序列的一種或多種目標多核苷酸序列、目標基因或“轉基因”的載體。 本發明的盒和載體都不包含編碼腺相關病毒非結構蛋白(Rep)和結構蛋白(Cap)的基因的核苷酸序列。 基於AAV5(腺相關病毒血清型5)的重組病毒 在一個方面,本發明涉及分離的基於AAV5(腺相關病毒血清型5)的重組病毒,用於增加靶細胞中FIX基因的表達,所述重組病毒包含上述密碼子優化的核酸或任意上述表達盒。 如在此說明書中使用的,術語“基於AAV的重組病毒”(或“基於AAV的病毒樣顆粒”或“AAV重組病毒株”或“AAV重組載體”或“rAAV載體”)是指包裹在AAV衣殼內的上述表達盒(或上述表達載體)。 Cap基因,除其他備選產物外,編碼3種衣殼蛋白(VP1、VP2和VP3)。VP1、VP2和VP3以1:1:10的比率存在以形成二十面體衣殼(Xie Q.等人,The atomic structure of adeno-associated virus (AAV-2), a vector for human gene therapy. Proc Natl Acad Sci USA, 2002; 99:10405-10410)。這些基因的轉錄從單一啟動子p40開始。相應蛋白(VP1、VP2和VP3)的分子量分別為87、72和62 kDa。所有三種蛋白都翻譯自單個mRNA。轉錄後,前mRNA可以兩種不同方式進行剪接,其中將較長或較短的內含子切除以形成具有各種核苷酸長度的mRNA。 在產生基於AAV (rAAV)的重組病毒期間,側翼為ITR的表達盒被包裝至AAV衣殼內。該盒中不包括如上文所述的AAV複製所需的基因。 表達盒DNA以大約3000個核苷酸長的單鏈DNA分子(ssDNA)的形式被包裝至病毒衣殼中。一旦細胞被病毒感染,該單鏈DNA轉換為雙鏈DNA (dsDNA)形式。該dsDNA僅可被細胞蛋白使用,其將本發明的一種或多種基因轉錄為RNA。 在本發明的一些實施方案中,基於AAV5的重組病毒具有包括AAV5蛋白VP1的衣殼。 在本發明的一些實施方案中,基於AAV5的重組病毒具有衣殼,其包括具有以下氨基酸序列的AAV5蛋白VP1: MSFVDHPPDWLEEVGEGLREFLGLEAGPPKPKPNQQHQDQARGLVLPGYNYLGPGNGLDRGEPVNRADEVAREHDISYNEQLEAGDNPYLKYNHADAEFQEKLADDTSFGGNLGKAVFQAKKRVLEPFGLVEEGAKTAPTGKRIDDHFPKRKKARTEEDSKPSTSSDAEAGPSGSQQLQIPAQPASSLGADTMSAGGGGPLGDNNQGADGVGNASGDWHCDSTWMGDRVVTKSTRTWVLPSYNNHQYREIKSGSVDGSNANAYFGYSTPWGYFDFNRFHSHWSPRDWQRLINNYWGFRPRSLRVKIFNIQVKEVTVQDSTTTIANNLTSTVQVFTDDDYQLPYVVGNGTEGCLPAFPPQVFTLPQYGYATLNRDNTENPTERSSFFCLEYFPSKMLRTGNNFEFTYNFEEVPFHSSFAPSQNLFKLANPLVDQYLYRFVSTNNTGGVQFNKNLAGRYANTYKNWFPGPMGRTQGWNLGSGVNRASVSAFATTNRMELEGASYQVPPQPNGMTNNLQGSNTYALENTMIFNSQPANPGTTATYLEGNMLITSESETQPVNRVAYNVGGQMATNNQSSTTAPATGTYNLQEIVPGSVWMERDVYLQGPIWAKIPETGAHFHPSPAMGGFGLKHPPPMMLIKNTPVPGNITSFSDVPVSSFITQYSTGQVTVEMEWELKKENSKRWNPEIQYTNNYNDPQFVDFAPDSTGEYRTTRPIGTRYLTRPL (SEQ ID NO: 11)。 在本發明的一些實施方案中,基於AAV5的重組病毒具有包括AAV5蛋白VP2的衣殼。 在本發明的一些實施方案中,基於AAV5的重組病毒具有衣殼,其包括具有以下氨基酸序列的AAV5蛋白VP2: TAPTGKRIDDHFPKRKKARTEEDSKPSTSSDAEAGPSGSQQLQIPAQPASSLGADTMSAGGGGPLGDNNQGADGVGNASGDWHCDSTWMGDRVVTKSTRTWVLPSYNNHQYREIKSGSVDGSNANAYFGYSTPWGYFDFNRFHSHWSPRDWQRLINNYWGFRPRSLRVKIFNIQVKEVTVQDSTTTIANNLTSTVQVFTDDDYQLPYVVGNGTEGCLPAFPPQVFTLPQYGYATLNRDNTENPTERSSFFCLEYFPSKMLRTGNNFEFTYNFEEVPFHSSFAPSQNLFKLANPLVDQYLYRFVSTNNTGGVQFNKNLAGRYANTYKNWFPGPMGRTQGWNLGSGVNRASVSAFATTNRMELEGASYQVPPQPNGMTNNLQGSNTYALENTMIFNSQPANPGTTATYLEGNMLITSESETQPVNRVAYNVGGQMATNNQSSTTAPATGTYNLQEIVPGSVWMERDVYLQGPIWAKIPETGAHFHPSPAMGGFGLKHPPPMMLIKNTPVPGNITSFSDVPVSSFITQYSTGQVTVEMEWELKKENSKRWNPEIQYTNNYNDPQFVDFAPDSTGEYRTTRPIGTRYLTRPL (SEQ ID NO: 12)。 在本發明的一些實施方案中,基於AAV5的重組病毒具有包括AAV5蛋白VP3的衣殼。 在本發明的一些實施方案中,基於AAV5的重組病毒具有衣殼,其包括具有以下氨基酸序列的AAV5蛋白VP3: MSAGGGGPLGDNNQGADGVGNASGDWHCDSTWMGDRVVTKSTRTWVLPSYNNHQYREIKSGSVDGSNANAYFGYSTPWGYFDFNRFHSHWSPRDWQRLINNYWGFRPRSLRVKIFNIQVKEVTVQDSTTTIANNLTSTVQVFTDDDYQLPYVVGNGTEGCLPAFPPQVFTLPQYGYATLNRDNTENPTERSSFFCLEYFPSKMLRTGNNFEFTYNFEEVPFHSSFAPSQNLFKLANPLVDQYLYRFVSTNNTGGVQFNKNLAGRYANTYKNWFPGPMGRTQGWNLGSGVNRASVSAFATTNRMELEGASYQVPPQPNGMTNNLQGSNTYALENTMIFNSQPANPGTTATYLEGNMLITSESETQPVNRVAYNVGGQMATNNQSSTTAPATGTYNLQEIVPGSVWMERDVYLQGPIWAKIPETGAHFHPSPAMGGFGLKHPPPMMLIKNTPVPGNITSFSDVPVSSFITQYSTGQVTVEMEWELKKENSKRWNPEIQYTNNYNDPQFVDFAPDSTGEYRTTRPIGTRYLTRPL (SEQ ID NO: 13)。 在本發明的一些實施方案中,基於AAV5的重組病毒具有包括AAV5蛋白VP1、VP2和VP3的衣殼。 在本發明的一些實施方案中,基於AAV5的重組病毒具有衣殼,其包括以下蛋白:具有SEQ ID NO: 11的氨基酸序列的VP1、具有SEQ ID NO: 12的氨基酸序列的VP2和具有SEQ ID NO: 13的氨基酸序列的VP3。 在本發明的一些實施方案中,基於AAV5的重組病毒具有衣殼,其包括具有含一個或多個點突變的SEQ ID NO: 11的氨基酸序列的AAV5蛋白VP1。 在本發明的一些實施方案中,基於AAV5的重組病毒具有包括AAV5蛋白VP1的衣殼,所述VP1具有在野生型AAV5 VP1 (SEQ ID NO: 11)的S2A和T711S位置處包括氨基酸取代並具有以下氨基酸序列的氨基酸序列:MAFVDHPPDWLEEVGEGLREFLGLEAGPPKPKPNQQHQDQARGLVLPGYNYLGPGNGLDRGEPVNRADEVAREHDISYNEQLEAGDNPYLKYNHADAEFQEKLADDTSFGGNLGKAVFQAKKRVLEPFGLVEEGAKTAPTGKRIDDHFPKRKKARTEEDSKPSTSSDAEAGPSGSQQLQIPAQPASSLGADTMSAGGGGPLGDNNQGADGVGNASGDWHCDSTWMGDRVVTKSTRTWVLPSYNNHQYREIKSGSVDGSNANAYFGYSTPWGYFDFNRFHSHWSPRDWQRLINNYWGFRPRSLRVKIFNIQVKEVTVQDSTTTIANNLTSTVQVFTDDDYQLPYVVGNGTEGCLPAFPPQVFTLPQYGYATLNRDNTENPTERSSFFCLEYFPSKMLRTGNNFEFTYNFEEVPFHSSFAPSQNLFKLANPLVDQYLYRFVSTNNTGGVQFNKNLAGRYANTYKNWFPGPMGRTQGWNLGSGVNRASVSAFATTNRMELEGASYQVPPQPNGMTNNLQGSNTYALENTMIFNSQPANPGTTATYLEGNMLITSESETQPVNRVAYNVGGQMATNNQSSTTAPATGTYNLQEIVPGSVWMERDVYLQGPIWAKIPETGAHFHPSPAMGGFGLKHPPPMMLIKNTPVPGNITSFSDVPVSSFITQYSTGQVTVEMEWELKKENSKRWNPEIQYTNNYNDPQFVDFAPDSTGEYRSTRPIGTRYLTRPL (SEQ ID NO: 14)。 在本發明的一些實施方案中,基於AAV5的重組病毒具有衣殼,其包括具有含一個或多個點突變的SEQ ID NO: 12的氨基酸序列的AAV5蛋白VP2。 在本發明的一些實施方案中,基於AAV5的重組病毒具有包括AAV5蛋白VP2的衣殼,所述VP2具有在野生型AAV5 VP2 (SEQ ID NO: 12)的T575S位置處包括氨基酸取代並具有以下氨基酸序列的氨基酸序列: TAPTGKRIDDHFPKRKKARTEEDSKPSTSSDAEAGPSGSQQLQIPAQPASSLGADTMSAGGGGPLGDNNQGADGVGNASGDWHCDSTWMGDRVVTKSTRTWVLPSYNNHQYREIKSGSVDGSNANAYFGYSTPWGYFDFNRFHSHWSPRDWQRLINNYWGFRPRSLRVKIFNIQVKEVTVQDSTTTIANNLTSTVQVFTDDDYQLPYVVGNGTEGCLPAFPPQVFTLPQYGYATLNRDNTENPTERSSFFCLEYFPSKMLRTGNNFEFTYNFEEVPFHSSFAPSQNLFKLANPLVDQYLYRFVSTNNTGGVQFNKNLAGRYANTYKNWFPGPMGRTQGWNLGSGVNRASVSAFATTNRMELEGASYQVPPQPNGMTNNLQGSNTYALENTMIFNSQPANPGTTATYLEGNMLITSESETQPVNRVAYNVGGQMATNNQSSTTAPATGTYNLQEIVPGSVWMERDVYLQGPIWAKIPETGAHFHPSPAMGGFGLKHPPPMMLIKNTPVPGNITSFSDVPVSSFITQYSTGQVTVEMEWELKKENSKRWNPEIQYTNNYNDPQFVDFAPDSTGEYRSTRPIGTRYLTRPL (SEQ ID NO: 15)。 在本發明的一些實施方案中,基於AAV5的重組病毒具有衣殼,其包括具有含一個或多個點突變的SEQ ID NO: 13的氨基酸序列的AAV5蛋白VP3。 在本發明的一些實施方案中,基於AAV5的重組病毒具有包括AAV5蛋白VP3的衣殼,所述VP3具有在野生型AAV5 VP3 (SEQ ID NO: 13)的T519S位置處包括氨基酸取代並具有以下氨基酸序列的氨基酸序列: MSAGGGGPLGDNNQGADGVGNASGDWHCDSTWMGDRVVTKSTRTWVLPSYNNHQYREIKSGSVDGSNANAYFGYSTPWGYFDFNRFHSHWSPRDWQRLINNYWGFRPRSLRVKIFNIQVKEVTVQDSTTTIANNLTSTVQVFTDDDYQLPYVVGNGTEGCLPAFPPQVFTLPQYGYATLNRDNTENPTERSSFFCLEYFPSKMLRTGNNFEFTYNFEEVPFHSSFAPSQNLFKLANPLVDQYLYRFVSTNNTGGVQFNKNLAGRYANTYKNWFPGPMGRTQGWNLGSGVNRASVSAFATTNRMELEGASYQVPPQPNGMTNNLQGSNTYALENTMIFNSQPANPGTTATYLEGNMLITSESETQPVNRVAYNVGGQMATNNQSSTTAPATGTYNLQEIVPGSVWMERDVYLQGPIWAKIPETGAHFHPSPAMGGFGLKHPPPMMLIKNTPVPGNITSFSDVPVSSFITQYSTGQVTVEMEWELKKENSKRWNPEIQYTNNYNDPQFVDFAPDSTGEYRSTRPIGTRYLTRPL (SEQ ID NO: 16)。 在本發明的一些實施方案中,基於AAV5的重組病毒具有衣殼,其包括以下蛋白:具有含一個或多個點突變的SEQ ID NO: 11的氨基酸序列的VP1、具有含一個或多個點突變的SEQ ID NO: 12的氨基酸序列的VP2和具有含一個或多個點突變的SEQ ID NO: 13的氨基酸序列的VP3。 在本發明的一些實施方案中,基於AAV5的重組病毒具有衣殼,其包括以下蛋白:具有SEQ ID NO: 14的氨基酸序列的VP1、具有SEQ ID NO: 15的氨基酸序列的VP2和具有SEQ ID NO: 16的氨基酸序列的VP3。 短語“多個點突變”是指二、三、四、五、六、七、八、九或十個點的取代。 特別優選的實施方案包括性質上保守的取代(突變),即在以其側鏈加入的氨基酸家族內發生的取代。具體而言,氨基酸通常被分為四個家族:(1)酸性氨基酸為天冬氨酸和谷氨酸;(2)鹼性氨基酸為賴氨酸、精氨酸、組氨酸;(3)非極性氨基酸為丙氨酸、纈氨酸、亮氨酸、異亮氨酸、脯氨酸、苯丙氨酸、甲硫氨酸、色氨酸;以及(4)不荷電極性氨基酸為甘氨酸、天冬醯胺、穀氨醯胺、半胱氨酸、絲氨酸、蘇氨酸、酪氨酸。苯丙氨酸、色氨酸和酪氨酸有時被分類為芳香族氨基酸。例如,可合理地推測單獨地將亮氨酸取代為異亮氨酸或纈氨酸、將天冬氨酸取代為谷氨酸、將蘇氨酸取代為絲氨酸或將氨基酸取代為結構上相關的氨基酸的類似的保守取代將不會對生物活性產生重大影響。例如,目標多肽可包括多達約5-10個保守或不保守的氨基酸取代,只要分子期望的功能保持完整。 AAV5蛋白VP1、VP2或VP3序列中使用氨基酸取代的點突變的變體是將AAV5蛋白VP1、VP2或VP3中至少一個氨基酸殘基取代為另一個氨基酸殘基。 保守取代在表A中顯示於“優選取代”下。
表A
初始残基 示例性取代 優選取代
Ala (A) Val;Leu;Ile Val
Arg (R) Lys;Gin;Asn Lys
Asn (N) Gin;His;Asp;Lys;Arg Gin
Asp (D) Glu;Asn Glu
Cys (C) Ser;Ala Ser
Gln (Q) Asn;Glu Asn
Glu (E) Asp;Gin Asp
Gly (G) Ala Ala
His (H) Asn;Gin;Lys;Arg Arg
Ile (I) Leu;Val;Met;Ala;Phe;正亮氨酸 Leu
Leu (L) 正亮氨酸;Ile;Val;Met;Ala;Phe Ile
Lys (K) Arg;Gin;Asn Arg
Met (M) Leu;Phe;Ile Leu
Phe (F) Trp;Leu;Val;Ile;Ala;Tyr Tyr
Pro (P) Ala Ala
Ser (S) Thr Thr
Thr (T) Val;Ser Ser
Trp (W) Tyr;Phe Tyr
Tyr (Y) Trp;Phe;Thr;Ser Phe
Val (V) Ile;Leu;Met;Phe;Ala;正亮氨酸 Leu
在本發明的一些實施方案中,基於AAV5的重組病毒具有衣殼,其包括具有SEQ ID NO: 11的氨基酸序列或含一個或多個點突變的SEQ ID NO: 11的氨基酸序列的AAV5蛋白VP1;且表達盒在5'末端至3'末端方向包括以下元件: 左側(第一) ITR (反向末端重複); TTR啟動子(運甲狀腺素蛋白啟動子); hBG1基因內含子(人類β-珠蛋白基因的攜內含子片段); 上述密碼子優化的核酸; hGH1多聚腺苷酸化信號(人類生長激素基因多聚腺苷酸化信號); 右側(第二) ITR。 在本發明的一些實施方案中,基於AAV5的重組病毒具有衣殼,其包括具有SEQ ID NO: 11的氨基酸序列的AAV5蛋白VP1、具有SEQ ID NO: 12的氨基酸序列的AAV5蛋白VP2和具有SEQ ID NO: 13的氨基酸序列的AAV5蛋白VP3;且表達盒在5'末端至3'末端方向包括以下元件: 左側(第一) ITR (反向末端重複); TTR啟動子(運甲狀腺素蛋白啟動子); hBG1基因內含子(人類β-珠蛋白基因的攜內含子片段); 上述密碼子優化的核酸; hGH1多聚腺苷酸化信號(人類生長激素基因多聚腺苷酸化信號); 右側(第二) ITR。 在本發明的一些實施方案中,基於AAV5的重組病毒具有衣殼,其包括具有含一個或多個點突變的SEQ ID NO: 11的氨基酸序列的AAV5蛋白VP1、具有含一個或多個點突變的SEQ ID NO: 12的氨基酸序列的AAV5蛋白VP2和具有含一個或多個點突變的SEQ ID NO: 13的氨基酸序列的AAV5蛋白VP3;且表達盒在5'末端至3'末端方向包括以下元件: 左側(第一) ITR (反向末端重複); TTR啟動子(運甲狀腺素蛋白啟動子); hBG1基因內含子(人類β-珠蛋白基因的攜內含子片段); 上述密碼子優化的核酸; hGH1多聚腺苷酸化信號(人類生長激素基因多聚腺苷酸化信號); 右側(第二) ITR。 在本發明的一些實施方案中,基於AAV5的重組病毒具有衣殼,其包括具有SEQ ID NO: 14的氨基酸序列的AAV5蛋白VP1、具有SEQ ID NO: 15的氨基酸序列的AAV5蛋白VP2和具有SEQ ID NO: 16的氨基酸序列的AAV5蛋白VP3;且表達盒在5'末端至3'末端方向包括以下元件: 左側(第一) ITR (反向末端重複); TTR啟動子(運甲狀腺素蛋白啟動子); hBG1基因內含子(人類β-珠蛋白基因的攜內含子片段); 上述密碼子優化的核酸; hGH1多聚腺苷酸化信號(人類生長激素基因多聚腺苷酸化信號); 右側(第二) ITR。 在本發明的一些實施方案中,基於AAV5的重組病毒具有衣殼,其包括具有SEQ ID NO: 11的氨基酸序列或含一個或多個點突變的SEQ ID NO: 11的氨基酸序列的AAV5蛋白VP1;以及表達盒包括選自SEQ ID NO: 3或SEQ ID NO: 5的核苷酸序列。 在本發明的一些實施方案中,基於AAV5的重組病毒具有衣殼,其包括以下蛋白:具有SEQ ID NO: 11的氨基酸序列的VP1、具有SEQ ID NO: 12的氨基酸序列的VP2和具有SEQ ID NO: 13的氨基酸序列的VP3;以及表達盒包括選自SEQ ID NO: 3或SEQ ID NO: 5的核苷酸序列。 在本發明的一些實施方案中,基於AAV5的重組病毒具有衣殼,其包括以下蛋白:具有含一個或多個點突變的SEQ ID NO: 11的氨基酸序列的VP1、具有含一個或多個點突變的SEQ ID NO: 12的氨基酸序列的VP2和具有含一個或多個點突變的SEQ ID NO: 13的氨基酸序列的VP3;以及表達盒包括選自SEQ ID NO: 3或SEQ ID NO: 5的核苷酸序列。 在本發明的一些實施方案中,基於AAV5的重組病毒具有衣殼,其包括以下蛋白:具有SEQ ID NO: 14的氨基酸序列的VP1、具有SEQ ID NO: 15的氨基酸序列的VP2和具有SEQ ID NO: 16的氨基酸序列的VP3;以及表達盒包括選自SEQ ID NO: 3或SEQ ID NO: 5的核苷酸序列。 藥物組合物 在一個方面,本發明涉及用於將FIX基因遞送至靶細胞的藥物組合物,其包括與一種或多種藥學上可接受的賦形劑組合的任意上述基於AAV5的重組病毒。 上述組合物中的活性物質以有效量,例如以生物學上有效的量存在。 在特定實施方案中,本發明涉及藥物組合物,其包含在藥學上可接受的載劑中或在其他藥劑、佐劑、稀釋劑等中的本發明的基於AAV5的重組病毒。對於注射,載劑將通常為液體載劑。對於其他施用方法,載劑可為固體或液體,比如無菌無熱源水或無菌無熱源磷酸緩衝鹽水溶液。對於吸入施用,載劑為可吸入的,並優選呈固體或液體微粒形式。作為注射介質,優選使用含有常用於注射溶液的添加劑(比如穩定劑、鹽或鹽水和/或緩衝劑)的水。 “藥物組合物”意為包含本發明的上述基於AAV5的重組病毒和至少一種選自藥學上可接受的和藥理學上相容的賦形劑(比如填料、溶劑、稀釋劑、載劑、輔助劑、分散劑、遞送劑、防腐劑、穩定劑、乳化劑、懸浮劑、增稠劑、延長遞送控制劑)的成分的組合物,所述賦形劑的選擇和比例取決於施用種類和途徑以及劑量。本發明的藥物組合物和其製備方法對本領域技術人員無疑會是顯而易見的。藥物組合物應優選遵照GMP (良好生產規範)的要求進行生產。組合物可包含緩衝組合物、張度劑、穩定劑和增溶劑。 “藥學上可接受的”意為沒有生物學的或其他負面副作用的材料,例如該材料可被施用至受試者而不引起任何不期望的生物學作用。因此,可例如在離體細胞轉染中或在直接體內施用本發明的基於AAV5的重組病毒至受試者中使用此類藥物組合物。 本文使用術語“賦形劑”來描述除本發明的上述成分之外的任意成分。這些是用在藥品生產/製造中以給予藥物產品必要的理化特性的具有無機或有機性質的物質。 “穩定劑”是指為活性劑提供物理和/或化學穩定性的一種賦形劑或兩種或更多種賦形劑的混合物。 術語“緩衝液”、“緩衝組合物”、“緩衝劑”是指能夠通過其酸-堿共軛成分的作用抵抗pH變化的溶液,這允許rAAV5載體產品抵抗pH的變化。通常來說,藥物組合物優選具有4.0至8.0範圍內的pH。所使用緩衝劑的實例包括但不限於醋酸鹽、磷酸鹽、檸檬酸鹽、組氨酸、琥珀酸鹽等緩衝溶液。 若活性劑在規定保存期限內在例如2-8℃的儲存溫度下保持其物理穩定性和/或化學穩定性和/或生物學活性,則藥物組合物為“穩定的”。優選地,活性劑保持物理和化學兩者的穩定性,以及生物學活性。儲存期根據在加速或天然老化條件下的穩定性測試的結果進行調整。 根據本發明的藥物組合物可以現成製劑的形式以單一單位劑量或多個單一單位劑量的形式進行製造、包裝或廣泛銷售。如本文所使用的,術語“單一單位劑量”是指含有預定量的活性成分的藥物組合物的離散量。活性成分的量通常等於待施用於受試者的活性成分的劑量,或此劑量的便利的一部份,例如此劑量的一半或三分之一。 用途 在一個方面,本發明涉及任意上述基於AAV5的重組病毒或上述組合物用於將FIX基因遞送至靶細胞的用途。 在一個方面,本發明涉及任意上述基於AAV5的重組病毒或上述組合物用於將FIX蛋白提供至患有血友病B和/或不具有功能完整的FIX基因拷貝的受試者的用途。 在一個方面,本發明涉及任意上述基於AAV5的重組病毒或上述組合物用於治療患有血友病B的受試者中的血友病B的用途。 在一個方面,本發明涉及用於將FIX蛋白提供至患有血友病B的受試者的方法,所述方法包含將治療有效量的任意上述基於AAV5的重組病毒或上述組合物施用至需要其的受試者的細胞內。 在一個方面,本發明涉及用於FIX基因遞送至患有血友病B的受試者的靶細胞的方法,所述方法包含將任意上述基於AAV5的重組病毒或上述組合物施用至受試者的細胞內。 在一個方面,本發明涉及用於治療受試者中的血友病B的方法,所述方法包含將治療有效量的任意上述基於AAV5的重組病毒或上述組合物施用至患有血友病B的受試者內。 血友病B是指由凝血因子IX (FIX)的缺陷或完全缺乏引起的遺傳性凝血障礙。血友病B的發病率為約每40,000名新生男嬰中1人。凝血因子缺陷伴隨著關節、肌肉和內臟中自發的或誘發的出血。 缺乏功能完整的FIX基因拷貝是指在基因組中FIX基因的所有拷貝中的失活突變或缺失,這導致了FIX基因功能的缺失或缺陷。 受試者是指適合於本說明書中所提供技術的任意動物。在某些非限制性實施方案中,受試者為人類。所述受試者可為任意年齡的雄性或雌性。 需要將FIX基因遞送至靶細胞的受試者,或需要對其提供FIX蛋白的受試者是指患有血友病B的受試者,或指具有凝血因子IX缺陷的受試者,或指FIX基因中具有導致FIX基因功能缺失或缺陷的失活突變或缺失的受試者。 示例性施用模式包括局部應用、鼻內、吸入、經粘膜、經皮、腸內(例如經口、直腸)、腸胃外(例如靜脈內、皮下、皮內、肌肉內)施用,以及直接組織或器官注射。 注射劑可以常規形式進行製備,作為液體溶液或懸浮液、適合於注射前製備呈液態的溶液或懸浮液的固體形式,或作為乳劑。備選地,可以局部而非全身方式(例如在貯庫或緩釋製劑中)施用本發明的上述基於AAV5的重組病毒。 基於AAV5的重組病毒以有效量引入生物體內。基於AAV5的重組病毒優選以生物學上有效的量引入生物體內。重組病毒的“生物學上有效的”量為足以引起核酸序列在細胞中轉導和表達的量。若將病毒體內施用至細胞(例如將病毒如下文所述施用至受試者),則病毒載體的“生物學上有效的”量為足以引起核酸序列在靶細胞中轉導和表達的量。 本發明的上述基於AAV5的重組病毒的劑量將取決於施用模式、具體的病毒載體,且它們可以常規方式進行確定。用於實現治療性效果的示例性劑量為至少約10 5、10 6、10 7、10 8、10 9、10 10、10 11、10 12、10 13、10 14、10 15、10 16轉導單位或更多,優選約10 9至10 15轉導單位,再更優選10 14轉導單位每千克的病毒滴度。 用於施用本發明的上述基於AAV5的重組病毒的細胞可為任意種類的細胞,包括但不限於上皮細胞(例如皮膚、呼吸道和腸上皮細胞)、肝細胞、肌肉細胞、胰腺細胞(包括胰島細胞)、肝細胞、脾細胞、成纖維細胞、內皮細胞等等。 本發明的上述基於AAV5的重組病毒不用於修飾人類生殖系細胞的遺傳完整性。 實施例提供以下實施例用於更好地理解本發明。這些實施例僅用於說明性目的且不應解釋為以任何方式限制本發明的範圍。 在此說明書中引述的所有公開、專利和專利申請都通過參考併入本文。儘管為了清楚地理解的目的,已通過說明和實例的方式對前述發明進行了相當詳細描述,但根據此發明的教導,對本領域普通技術人員將為顯而易見的是,在不偏離所附實施方案的精神或範圍的情況下可對其進行某些改變和修飾。 材料和一般方法 重組 DNA 技術如Sambrook, J.等人,Molecular cloning: A laboratory manual; Cold Spring Harbor Laboratory Press, Cold Spring Harbor, New York, 1989中所述使用標準方法來操作DNA。根據製造商的方案使用分子生物學試劑。簡而言之,產生用於在生長於選擇性抗生素壓力下的大腸桿菌細胞中進行進一步操作的質粒DNA,以使該質粒不會在細胞群體中丟失。我們使用商業試劑盒從細胞中分離了質粒DNA,測量了濃度並將其用於通過限制性核酸內切酶處理或PCR擴增進行克隆。使用連接酶將DNA片段彼此連接並將其轉化至細菌細胞內,用於克隆的選擇和進一步的生產。所有所得遺傳構建體都通過限制性圖譜和完整Sanger測序進行確認。 基因合成所期望的基因區段製備自通過化學合成製作的寡核苷酸。通過使寡核苷酸彼此覆蓋地複性,隨後從邊界引物進行PCR擴增,收集了側翼為獨特限制性位點的300至1000 bp長的基因區段。作為結果,產生了包括所期望片段的片段混合物。在限制性位點處將片段克隆至中間載體內,在此之後通過DNA測序確認亞克隆片段的DNA序列。 DNA 序列的確定通過Sanger測序確定DNA序列。分析DNA和蛋白序列,並將序列資料在SnapGene Viewer 4.2或更高版本中進行處理,用於序列生成、映射、分析、注釋和說明。 培養細胞培養物本實驗使用HEK293 (人胚腎克隆293)和HUH7 (人肝細胞癌)細胞系。在37℃和5% CO 2的標準條件下,用於產生AAV的懸浮的HEK293細胞在不含FBS和抗生素的完全培養基上進行培養。在37℃和5% CO 2的標準條件下,用於測試AAV產品效力的附著型Huh7細胞在補充有10% FBS、抗生素/抗真菌劑的完全DMEM培養基上進行培養。達到80-90%匯合度後,將Huh7細胞進行亞培養。使用TrypLE Select酶(10x)解離細胞單層。使用Trypan Blue染色和一次性細胞計數室使用自動Countess II計數器評價細胞活力。 AAV 重組載體的病毒顆粒的組裝和純化包含FIX基因的密碼子優化的變體(hFIXco-v1和hFIXco-v2)的AAV病毒顆粒使用HEK293生產細胞進行組裝,所述細胞用如下的3種質粒進行了轉染: 質粒pAAV-hFIXco-v1和pAAV-hFIXco-v2,其分別包含用於表達hFIXco-v1和hFIXco-v2轉基因的AAV表達盒(圖1); 用於表達AAV5血清型Cap基因和AAV2血清型Rep基因的質粒。各基因使用可變的閱讀框編碼幾種蛋白產物; 用於表達組裝和包裝AAV衣殼所需的Ad5 (腺病毒血清型5)基因的質粒。 72小時後,裂解細胞並使用過濾、色譜和超離心方法純化和濃縮病毒顆粒。用對重組病毒基因組區域特異的引物和樣品通過定量PCR確定病毒顆粒的滴度,並將滴度表達為每1 ml的病毒基因組拷貝數。 細胞培養物的轉導將HUH7細胞系以10,000細胞/cm 2的密度預先接種至12孔板的孔內。細胞附著至粘附基質上後,以500,000 vg/細胞的MOI引入AAV製備物。如上文所述,在轉導後第七天,通過ELISA確定培養液體中FIX蛋白的含量和活性,且通過逆轉錄-定量PCR確定細胞中凝血因子IX基因的表達水準。在6個獨立實驗中實施涉及評價培養液體中FIX蛋白水準的研究。在3個獨立實驗中實施涉及評價細胞中所分泌FIX蛋白的活性和凝血因子IX基因表達水準的研究。使用完整細胞作為陰性對照。 確定凝血因子 IX 基因表達水準通過逆轉錄-定量PCR確定轉導(或轉染)後細胞培養物中 FIX基因表達的水準。簡而言之,根據製造商的方案使用RNeasy Plus mini試劑盒(Qiagen)從細胞沉澱物分離RNA。根據製造商的方案使用GoScript試劑盒(Promega)實施逆轉錄;具體而言,首先取樣500ng的RNA用於逆轉錄反應,使用隨機和寡聚dT引物產生cDNA;逆轉錄後,將cDNA的體積用無菌水調整至50 µl。在StepOne儀器(Applied Biosystems)上,根據製造商的實驗使用qPCRmix-HS HighROX反應混合物(Eurogene)使用TaqMan技術實施定量PCR。我們選擇對靶基因( FIX)和對管家基因( GAPDH)有特異性的引物和探針。使用攜相應基因的質粒DNA (plDNA)樣品繪製標準曲線。對於繪製各標準曲線,製備了7個標準樣品。一系列稀釋:兩千萬至200拷貝plDNA/反應(稀釋係數為1:10)。對各測試樣品,在三個技術重複中實施分析,且所述分析包括進行RT減性對照(以測試處於研究下的RNA樣品中無DNA污染)和陰性對照。確定mRNA表達水準的結果按以下形式呈現:針對 GAPDH基因mRNA拷貝數進行歸一化的在樣品中的靶基因mRNA拷貝數。 通過 ELISA 確定凝血因子 IX 蛋白水準使用商業試劑盒,通過非競爭性固相酶免疫測定(ELISA)的夾心法,評價用靶AAV5-FIX候選物轉導HUH7後培養液體中凝血因子IX蛋白的含量,以及引入靶病毒產品後動物血漿中所述蛋白含量。簡而言之,將在稀釋緩衝劑中稀釋的培養液體和血漿的樣品引入96孔板的孔中,所述孔用對凝血因子IX有特異性的一抗進行敏化。同一板中載入有用於繪製校準曲線的標準品、陽性和陰性對照。將該板在室溫下孵育2小時。用洗滌緩衝液洗滌板孔,然後引入生物素化的抗體、鏈酶親和素過氧化物酶綴合物溶液和TMB。引入含有對因子IX有特異性的生物素化的檢測抗體的溶液,並將該板在室溫下孵育1小時。然後將鏈酶親和素過氧化物酶綴合物溶液添加至所得複合物,並將該板在室溫下孵育30分鐘。引入TMB溶液以使酶反應視覺化。在染色強度達到所需程度後,向所有孔中加入停止溶液以停止反應。然後測量板孔中溶液的光密度。考慮樣品的預稀釋,通過校準曲線確定測試樣品中凝血因子IX的濃度。 確定凝血因子 IX 蛋白活性凝血因子IX是維生素K依賴的,且通過細胞培養合成因子IX的活性形式需要生長培養基中維生素K的存在。關於這一方面,在HUH7的轉導期間,將500 ng/ml濃度的維生素K1添加至完全生長培養基的組合物。 使用商業試劑盒,通過生色法評價用靶產品轉導HUH7後培養液體中凝血因子IX蛋白的活性。 簡而言之,將在Tris-BSA反應緩衝液中稀釋的培養液體樣品、標準品和對照溶液引入96孔板孔內。然後將試劑1 (FX-FVIII)加入其中。在37℃的溫度下孵育2分鐘後,引入試劑2 (啟動劑)。將該板在37℃的溫度下孵育3分鐘。然後將試劑3 (生色底物)引入板孔內,並將該板孵育2分鐘。然後添加20%乙酸溶液以停止反應。所得FXa水解生色底物,因此導致對硝基苯胺的釋放,對硝基苯胺的量(通過光密度檢測)與樣品中因子IX (FIX)的濃度成正比。 對實驗室動物的體內研究對C57BL/6小鼠(6-8周齡的雄性)實施實驗。通過單次靜脈內注射至尾靜脈內的方式將產品施用至動物。將不含AAV的緩衝溶液施用至陰性對照組的動物內。在施用該產品前,在注射當天收集血漿,並然後在施用該產品後第7、14、21、28、35和42天收集血漿。 實施例1. 使用密碼子優化算法修饰FIX基因序列 我們所開發的產品為攜表達盒的腺相關病毒血清型5 (AAV5)的修飾的重組衣殼的懸浮液,所述表達盒在肝臟組織特異性運甲狀腺素蛋白(TTR)啟動子的控制下編碼人類凝血因子IX (hFIX)基因。 所採用的野生型核酸為編碼含天然存在的R338L突變(已知為Padua突變)的野生型人類凝血因子IX的核酸,並且包括SEQ ID NO: 17的核苷酸序列。該給定野生型核酸被用作對照。 進一步地,為增加表達效率,使用密碼子優化演算法修飾凝血因子IX基因的天然序列。 對具有SEQ ID NO: 17的核苷酸序列的凝血因子IX的野生型核酸進行密碼子優化導致產生大量密碼子優化的核酸,在基於AAV5的產品內進一步對所述密碼子優化的核酸測試相較於對照(具有SEQ ID NO: 17的野生型核酸)的凝血因子IX蛋白表達水準和活性。 相較於野生型,所有密碼子優化的核酸都顯示了增加的凝血因子IX蛋白產生水準;進一步地,相較於野生型,大部分密碼子優化的核酸顯示輕微增加的凝血因子IX蛋白產生水準,且僅有兩種根據本發明的核酸的密碼子優化的變體(具有SEQ ID NO: 2 (hFIXco-v1)和SEQ ID NO: 4 (hFIXco-v2)的核苷酸序列)驚人地顯示了最佳的結果,具體而言為增加的凝血因子IX基因表達水準和數倍增加的凝血因子IX蛋白產生水準,這實際上反過來導致了包含SEQ ID NO: 2 (hFIXco-v1)或SEQ ID NO: 4 (hFIXco-v2)的基於AAV5的產品的活性增加(參見實施例2、3和4)。 相較於具有SEQ ID NO: 17的核苷酸序列的野生型核酸,具有SEQ ID NO: 2和SEQ ID NO: 4的核苷酸序列的密碼子優化的核酸具有增加的對於哺乳動物細胞的密碼子適應指數(用於評估序列的密碼子使用頻率的標準度量)。 具有SEQ ID NO: 2和SEQ ID NO: 4的核苷酸序列的密碼子優化的核酸在以下實施例中分別被稱為hFIXco-v1和hFIXco-v2。 實施例 2. 組裝包含具有重組的密碼子優化的凝血因子 IX 基因變體 (hFIXco-v1 hFIXco-v2) AAV 表達盒的遺傳構建體。使用限制性酶連接酶的克隆方法,通過將原始構建體pAAV-GFP中修飾的綠色螢光蛋白序列和CMV啟動子相繼地分別替換為密碼子優化的凝血因子IX基因序列和TTR啟動子(從頭合成自通過化學合成產生的寡核苷酸),產生預期用於產生AAV5病毒載體的靶質粒pAAV-hFIXco-v1或pAAV-hFIXco-v2 (圖1),所述載體具有包含凝血因子IX基因密碼子優化的變體(SEQ ID NO: 2或SEQ ID NO: 4)的表達盒。 最終載體含有用於重組AAV基因組中基因表達和組裝的所有必需元件: 1) 在被包裹於病毒衣殼內的序列末端的ITR; 2) 用於表達靶基因的元件(啟動子、增強子、內含子、Kozak序列、轉基因、多聚腺苷酸化位點); 3) 在細菌細胞中產生質粒DNA的細菌複製起點和抗生素抗性基因。 實施例 3. 生成表達凝血因子 IX 的病毒產品靶質粒pAAV-hFIXco-v1和pAAV-hFIXco-v2 (圖1)連同產生重組AAV病毒顆粒必需的其他質粒(參見上文)一起被用於產生攜凝血因子IX基因密碼子優化的版本(分別為 hFIXco-v1hFIXco-v2)的AAV5-hFIXco-v1和AAV5-hFIXco-v2產品。生物加工導致了重組AAV5-hFIXco-v1和AAV5-hFIXco-v2病毒顆粒,其包含具有凝血因子IX基因密碼子優化的變體( hFIXco-v1hFIXco-v2)的表達盒。使用安全且不改變AAV特性的標準緩衝劑和賦形劑製備用於體外和體內研究的純化的AAV5-hFIXco-v1和AAV5-hFIXco-v2產品。使用上述技術進一步產生包含具有天然存在的凝血因子IX基因(包括天然存在的R338L突變的野生型基因,參見實施例1)的表達盒的AAV5-hFIX-wt產品以充當參考產品。 實施例 4. 測試 AAV5-hFIXco-v1 AAV5-hFIXco-v2 產品的體外表現動物測試前,在體外測試了純化的AAV5-hFIXco-v1和AAV5-hFIXco-v2產品。使用HUH7附著型細胞系實施了該實驗(圖2、3和4)。將該細胞系細胞以10,000細胞/cm 2的密度鋪板至12孔板的孔內。細胞附著至粘附基質後,將AAV製備物以500,000 vg/細胞的MOI引入。轉導後第7天,如上文所述,通過ELISA確定培養液體中FIX蛋白的含量和活性,並通過逆轉錄-定量PCR確定細胞中凝血因子IX基因的表達水準。所有樣品以三次重複運行。將完整細胞用作陰性對照。 已顯示我們開發的攜凝血因子IX基因密碼子優化的版本( hFIXco-v1hFIXco-v2)的AAV5-hFIXco-v1和AAV5-hFIXco-v2產品提供凝血因子IX轉基因進入細胞內的有效遞送並確保靶蛋白的產生,該事實通過定量即時PCR的資料、ELISA和凝血因子IX蛋白活性的分析進行了確認(圖2、3和4)。關於這一方面,當使用包含密碼子優化的凝血因子IX基因序列的AAV5-hFIXco-v1和AAV5-hFIXco-v2產品時,相較於使用具有凝血因子IX基因天然存在的版本的產品(AAV5-hFIX-wt),AAV5-hFIXco-v1產品的凝血因子IX基因的表達水準為1.8倍高,而AAV5-hFIXco-v2產品的凝血因子IX基因的表達水準為2.8倍高(圖2)。此外,當使用包含密碼子優化的凝血因子IX基因序列的AAV5-hFIXco-v1和AAV5-hFIXco-v2產品時,相較於使用具有凝血因子IX基因天然存在的版本的產品(AAV5-hFIX-wt),AAV5-hFIXco-v1產品的凝血因子IX蛋白產生水準為1.6倍高,而AAV5-hFIXco-v2產品的凝血因子IX蛋白產生水準為2.1倍高(圖3)。應當注意到,當使用包含密碼子優化的凝血因子IX基因序列的AAV5-hFIXco-v1和AAV5-hFIXco-v2產品時,相較於使用具有凝血因子IX基因天然存在的版本的產品(AAV5-hFIX-wt),AAV5-hFIXco-v1產品的凝血因子IX蛋白活性水準為2.1倍高,而AAV5-hFIXco-v2產品的凝血因子IX蛋白活性水準為2.9倍高(圖4)。 實施例 5. 測試 AAV5-hFIXco-v1 AAV5-hFIXco-v2 產品的體內表現AAV5-hFIXco-v1和AAV5-hFIXco-v2產品的體內研究使用C57BL/6品系實驗小鼠。研究中使用的AAV產品劑量為4x10 11VG/小鼠。將不含AAV的對照溶液用作陰性對照。通過單次靜脈內注射至尾靜脈內的方式將產品施用至動物。施用該產品前,在注射當天收集血漿,並然後在施用該產品後第7、14、21、28、35和42天收集血漿。如上文所述,通過ELISA確定血漿樣品中凝血因子IX蛋白的水準。 體內研究已顯示,相較於使用具有凝血因子IX基因天然存在的版本的產品(AAV5-hFIX-wt),使用包含密碼子優化的凝血因子IX基因序列hFIXco-v1的AAV5-hFIXco-v1產品顯示了在產品施用後第21和28天時,在動物血液中顯著更高的凝血因子IX蛋白水準(2.2至2.3倍高) (圖4A)。通過使用包含密碼子優化的凝血因子IX基因序列hFIXco-v2的AAV5-hFIXco-v2產品,相較於使用具有凝血因子FIX基因天然存在的版本的產品(AAV5-hFIX-wt),觀察到了在產品施用後第14、21、28、35和42天時,在動物血液中顯著更高的凝血因子IX蛋白水準(1.8至2.5倍高) (圖5)。 因此,我們開發的攜凝血因子IX基因的密碼子優化版本的基於AAV5的重組病毒(AAV5-hFIXco-v1或AAV5-hFIXco-v2)具有超越具有凝血因子IX基因天然存在的版本的AAV5載體的優勢,並具有用於血友病B基因療法的潛力。
[圖1]為預期產生含表達盒的AAV載體的質粒pAAV-hFIXco-v1和pAAV-hFIXco-v2的圖示,所述表達盒分別包含密碼子優化的人類凝血因子IX (FIX)基因序列hFIXco-v1和hFIXco-v2,其中 hFIXco-v1為密碼子優化的人類凝血因子IX基因序列(變體No. 1); hFIXco-v2為密碼子優化的人類凝血因子IX基因序列(變體No. 2); AmpR為提供對氨苄青黴素的抗性的β-內醯胺酶基因; pUC起點為細菌中的pUC複製起點; ITR為反向末端重複; TTR啟動子為運甲狀腺素蛋白基因啟動子(運甲狀腺素蛋白啟動子); 多聚A為多聚腺苷酸化信號序列,用於增加mRNA穩定性; HBG內含子為人類β珠蛋白內含子。 [圖2]為顯示用攜野生型FIX基因的AAV5-FIX病毒產品(AAV5-hFIX-wt)、用攜密碼子優化的基因hFIXco-v1的AAV5-FIX產品(AAV5-hFIXco-v1)和用攜密碼子優化的基因hFIXco-v2的AAV5-FIX產品(AAV5-hFIXco-v2)轉導細胞後7天在Huh7細胞中FIX基因表達水準的圖表(AAV-FIX產品中FIX基因的所有變體都含有天然存在的Padua,R338L突變)。* - p值< 0.05。使用雙因素ANOVA和Dunnett檢驗實施統計分析。 [圖3]為顯示用攜野生型FIX基因的AAV5-FIX病毒產品(AAV5-hFIX-wt)、用攜密碼子優化的基因hFIXco-v1的AAV5-FIX產品(AAV5-hFIXco-v1)和用攜密碼子優化的基因hFIXco-v2的AAV5-FIX產品(AAV5-hFIXco-v2)轉導Huh7細胞後7天培養液體中FIX蛋白濃度的圖表(AAV-FIX產品中FIX基因的所有變體都含有天然存在的Padua,R338L突變)。使用未轉導Huh7細胞作為對照。*** - p值< 0.001。使用雙因素ANOVA和Dunnett檢驗實施統計分析。 [圖4]為顯示用攜野生型FIX基因的AAV5-FIX病毒產品(AAV5-hFIX-wt)、用攜密碼子優化的基因hFIXco-v1的AAV5-FIX產品(AAV5-hFIXco-v1)和用攜密碼子優化的基因hFIXco-v2的AAV5-FIX產品(AAV5-hFIXco-v2)轉導Huh7細胞後7天培養液體中FIX蛋白活性的圖表(AAV-FIX產品中FIX基因的所有變體都含有天然存在的Padua,R338L突變)。使用未轉導Huh7細胞作為對照。*** - p值< 0.001。使用雙因素ANOVA和Dunnett檢驗實施統計分析。 [圖5]為顯示靜脈內施用攜野生型FIX基因的AAV5-FIX產品(AAV5-hFIX-wt)和攜密碼子優化的基因hFIXco-v1的AAV5-FIX產品(AAV5-hFIXco-v1)後實驗動物血漿中凝血因子IX蛋白含量的圖表(AAV-FIX產品中FIX基因的所有版本都含有天然存在的Padua,R338L突變)。平均值±標準差(n=10)。*** - p值< 0.001;** - p值< 0.01;* - p值< 0.05。使用單因素ANOVA和Dunnett檢驗實施統計分析。 [圖6]為顯示靜脈內施用攜野生型FIX基因的AAV5-FIX產品(AAV5-hFIX-wt)和攜密碼子優化的基因hFIXco-v2的AAV5-FIX產品(AAV5-hFIXco-v2)後實驗動物血漿中凝血因子IX蛋白含量的圖表(AAV-FIX產品中FIX基因的所有版本都含有天然存在的Padua,R338L突變)。平均值±標準差(n=10)。*** - p值< 0.001;** - p值< 0.01;* - p值< 0.05。使用單因素ANOVA和Dunnett檢驗實施統計分析。

          <![CDATA[<110> 俄羅斯聯邦商亞那拜恩有限公司 (Limited Liability Company <<ANABION>>)]]>
          <![CDATA[<120> 編碼凝血因子IX蛋白的密碼子優化的核酸及其用途]]>
          <![CDATA[<140> TW 111108106]]>
          <![CDATA[<141> 2022-03-04]]>
          <![CDATA[<150> RU2021105703]]>
          <![CDATA[<151> 2021-03-05]]>
          <![CDATA[<160> 17]]>
          <![CDATA[<170> BiSSAP 1.3.6]]>
          <![CDATA[<210> 1]]>
          <![CDATA[<211> 461]]>
          <![CDATA[<212> PRT]]>
          <![CDATA[<213> 天然序列]]>
          <![CDATA[<220> ]]>
          <![CDATA[<223> 含R338L突變的重組凝血因子IX蛋白的氨基酸序列]]>
          <![CDATA[<400> 1]]>
          Met Gln Arg Val Asn Met Ile Met Ala Glu Ser Pro Gly Leu Ile Thr 
          1               5                   10                  15      
          Ile Cys Leu Leu Gly Tyr Leu Leu Ser Ala Glu Cys Thr Val Phe Leu 
                      20                  25                  30          
          Asp His Glu Asn Ala Asn Lys Ile Leu Asn Arg Pro Lys Arg Tyr Asn 
                  35                  40                  45              
          Ser Gly Lys Leu Glu Glu Phe Val Gln Gly Asn Leu Glu Arg Glu Cys 
              50                  55                  60                  
          Met Glu Glu Lys Cys Ser Phe Glu Glu Ala Arg Glu Val Phe Glu Asn 
          65                  70                  75                  80  
          Thr Glu Arg Thr Thr Glu Phe Trp Lys Gln Tyr Val Asp Gly Asp Gln 
                          85                  90                  95      
          Cys Glu Ser Asn Pro Cys Leu Asn Gly Gly Ser Cys Lys Asp Asp Ile 
                      100                 105                 110         
          Asn Ser Tyr Glu Cys Trp Cys Pro Phe Gly Phe Glu Gly Lys Asn Cys 
                  115                 120                 125             
          Glu Leu Asp Val Thr Cys Asn Ile Lys Asn Gly Arg Cys Glu Gln Phe 
              130                 135                 140                 
          Cys Lys Asn Ser Ala Asp Asn Lys Val Val Cys Ser Cys Thr Glu Gly 
          145                 150                 155                 160 
          Tyr Arg Leu Ala Glu Asn Gln Lys Ser Cys Glu Pro Ala Val Pro Phe 
                          165                 170                 175     
          Pro Cys Gly Arg Val Ser Val Ser Gln Thr Ser Lys Leu Thr Arg Ala 
                      180                 185                 190         
          Glu Thr Val Phe Pro Asp Val Asp Tyr Val Asn Ser Thr Glu Ala Glu 
                  195                 200                 205             
          Thr Ile Leu Asp Asn Ile Thr Gln Ser Thr Gln Ser Phe Asn Asp Phe 
              210                 215                 220                 
          Thr Arg Val Val Gly Gly Glu Asp Ala Lys Pro Gly Gln Phe Pro Trp 
          225                 230                 235                 240 
          Gln Val Val Leu Asn Gly Lys Val Asp Ala Phe Cys Gly Gly Ser Ile 
                          245                 250                 255     
          Val Asn Glu Lys Trp Ile Val Thr Ala Ala His Cys Val Glu Thr Gly 
                      260                 265                 270         
          Val Lys Ile Thr Val Val Ala Gly Glu His Asn Ile Glu Glu Thr Glu 
                  275                 280                 285             
          His Thr Glu Gln Lys Arg Asn Val Ile Arg Ile Ile Pro His His Asn 
              290                 295                 300                 
          Tyr Asn Ala Ala Ile Asn Lys Tyr Asn His Asp Ile Ala Leu Leu Glu 
          305                 310                 315                 320 
          Leu Asp Glu Pro Leu Val Leu Asn Ser Tyr Val Thr Pro Ile Cys Ile 
                          325                 330                 335     
          Ala Asp Lys Glu Tyr Thr Asn Ile Phe Leu Lys Phe Gly Ser Gly Tyr 
                      340                 345                 350         
          Val Ser Gly Trp Gly Arg Val Phe His Lys Gly Arg Ser Ala Leu Val 
                  355                 360                 365             
          Leu Gln Tyr Leu Arg Val Pro Leu Val Asp Arg Ala Thr Cys Leu Leu 
              370                 375                 380                 
          Ser Thr Lys Phe Thr Ile Tyr Asn Asn Met Phe Cys Ala Gly Phe His 
          385                 390                 395                 400 
          Glu Gly Gly Arg Asp Ser Cys Gln Gly Asp Ser Gly Gly Pro His Val 
                          405                 410                 415     
          Thr Glu Val Glu Gly Thr Ser Phe Leu Thr Gly Ile Ile Ser Trp Gly 
                      420                 425                 430         
          Glu Glu Cys Ala Met Lys Gly Lys Tyr Gly Ile Tyr Thr Lys Val Ser 
                  435                 440                 445             
          Arg Tyr Val Asn Trp Ile Lys Glu Lys Thr Lys Leu Thr 
              450                 455                 460     
          <![CDATA[<210> 2]]>
          <![CDATA[<211> 1383]]>
          <![CDATA[<212> DNA]]>
          <![CDATA[<213> 人工序列]]>
          <![CDATA[<220> ]]>
          <![CDATA[<223> 編碼重組凝血因子IX的密碼子優化的核酸(hFIXco-v1變體)]]>
          <![CDATA[<400> 2]]>
          atgcagcggg tcaacatgat catggcggag tcgccgggcc tgatcacgat ctgcctcctc      60
          gggtacctgc tctccgccga gtgcaccgtg ttcctggacc acgagaacgc caacaagatc     120
          ctcaaccggc ccaagcgcta caactccggc aagctggagg agttcgtgca ggggaacctc     180
          gagcgcgagt gcatggagga gaagtgctcg ttcgaggagg cgcgggaggt gttcgagaac     240
          accgagcgca ccacggagtt ctggaagcag tacgtggacg gggaccagtg cgagtcgaac     300
          ccgtgcctca acggggggtc gtgcaaggac gacatcaact cgtacgagtg ctggtgcccc     360
          ttcggcttcg agggcaagaa ctgcgagctg gacgtgacct gcaacatcaa gaacgggcgc     420
          tgcgagcagt tctgcaagaa cagcgccgac aacaaggtgg tctgctcctg caccgagggg     480
          taccgcctcg cggagaacca gaagtcctgc gagccggccg tgcccttccc ctgcggccgc     540
          gtgtccgtca gccagacgtc gaagctgacg cgcgccgaga ccgtcttccc ggacgtggac     600
          tacgtgaact cgacggaggc cgagaccatc ctggacaaca tcacccagag cacccagtcc     660
          ttcaacgact tcacgcgggt ggtcggcggc gaggacgcca agcccgggca gttcccgtgg     720
          caggtcgtcc tcaacgggaa ggtcgacgcg ttctgcggcg ggagcatcgt gaacgagaag     780
          tggatcgtga ccgccgcgca ctgcgtcgag acgggcgtga agatcaccgt ggtggccggg     840
          gagcacaaca tcgaggagac ggagcacacc gagcagaagc ggaacgtgat ccgcatcatc     900
          ccgcaccaca actacaacgc cgccatcaac aagtacaacc acgacatcgc gctcctcgag     960
          ctggacgagc cgctggtcct caactcctac gtcacgccga tctgcatcgc cgacaaggag    1020
          tacacgaaca tcttcctgaa gttcgggagc ggctacgtct cgggctgggg ccgcgtgttc    1080
          cacaaggggc gcagcgcgct cgtgctccag tacctgcggg tccccctggt cgaccgcgcg    1140
          acctgcctcc tctccacgaa gttcacgatc tacaacaaca tgttctgcgc ggggttccac    1200
          gagggcggcc gggacagctg ccagggcgac agcgggggcc cgcacgtgac ggaggtggag    1260
          ggcacgagct tcctgaccgg gatcatctcg tggggcgagg agtgcgcgat gaaggggaag    1320
          tacggcatct acaccaaggt cagccggtac gtgaactgga tcaaggagaa gacgaagctg    1380
          acg                                                                  1383
          <![CDATA[<210> 3]]>
          <![CDATA[<211> 3122]]>
          <![CDATA[<212> DNA]]>
          <![CDATA[<213> 人工序列]]>
          <![CDATA[<220> ]]>
          <![CDATA[<223> 含密碼子優化的重組凝血因子IX基因的表達盒(變體AAV5-hFIXco-v1)]]>
          <![CDATA[<400> 3]]>
          cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcgtcg ggcgaccttt      60
          ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact     120
          aggggttcct gcggccgcac gcgtgccgcc accatggtcg agcttgggct gcaggtcgag     180
          ggcactggga ggatgttgag taagatggaa aactactgat gacccttgca gagacagagt     240
          attaggacat gtttgaacag gggccggcga tcagcaggta gctctagagg atccccgtct     300
          gtctgcacat ttcgtagagc gagtgttccg atactctaat ctccctaggc aaggttcata     360
          tttgtgtagg ttacttattc tccttttgtt gactaagtca ataatcagaa tcagcaggtt     420
          tggagtcagc ttggcaggga tcagcagcct gggttggaag gagggggtat aaaagcccct     480
          tcaccaggag aagccgtcac acagatccac aagctcctga caggaagctc taggtgactc     540
          tcttaaggta gcctccgcgg attcgaatcc cggccgggaa cggtgcattg gaacgcggat     600
          tccccgtgcc aagagtgacg taagtaccgc ctatagagtc tataggccca caaaaaatgc     660
          tttcttcttt taatatactt ttttgtttat cttatttcta atactttccc taatctcttt     720
          ctttcagggc aataatgata caatgtatca tgcctctttg caccattcta aagaataaca     780
          gtgataattt ctgggttaag gcaatagcaa tatttctgca tataaatatt tctgcatata     840
          aattgtaact gatgtaagag gtttcatatt gctaatagca gctacaatcc agctaccatt     900
          ctgcttttat tttatggttg ggataaggct ggattattct gagtccaagc taggcccttt     960
          tgctaatcat gttcatacct cttatcttcc tcccacagct cctgggcaac gtgctggtct    1020
          gtgtgctggc ccatcacttt ggcaaagaat tgggattcga acatcgatat gcagcgggtc    1080
          aacatgatca tggcggagtc gccgggcctg atcacgatct gcctcctcgg gtacctgctc    1140
          tccgccgagt gcaccgtgtt cctggaccac gagaacgcca acaagatcct caaccggccc    1200
          aagcgctaca actccggcaa gctggaggag ttcgtgcagg ggaacctcga gcgcgagtgc    1260
          atggaggaga agtgctcgtt cgaggaggcg cgggaggtgt tcgagaacac cgagcgcacc    1320
          acggagttct ggaagcagta cgtggacggg gaccagtgcg agtcgaaccc gtgcctcaac    1380
          ggggggtcgt gcaaggacga catcaactcg tacgagtgct ggtgcccctt cggcttcgag    1440
          ggcaagaact gcgagctgga cgtgacctgc aacatcaaga acgggcgctg cgagcagttc    1500
          tgcaagaaca gcgccgacaa caaggtggtc tgctcctgca ccgaggggta ccgcctcgcg    1560
          gagaaccaga agtcctgcga gccggccgtg cccttcccct gcggccgcgt gtccgtcagc    1620
          cagacgtcga agctgacgcg cgccgagacc gtcttcccgg acgtggacta cgtgaactcg    1680
          acggaggccg agaccatcct ggacaacatc acccagagca cccagtcctt caacgacttc    1740
          acgcgggtgg tcggcggcga ggacgccaag cccgggcagt tcccgtggca ggtcgtcctc    1800
          aacgggaagg tcgacgcgtt ctgcggcggg agcatcgtga acgagaagtg gatcgtgacc    1860
          gccgcgcact gcgtcgagac gggcgtgaag atcaccgtgg tggccgggga gcacaacatc    1920
          gaggagacgg agcacaccga gcagaagcgg aacgtgatcc gcatcatccc gcaccacaac    1980
          tacaacgccg ccatcaacaa gtacaaccac gacatcgcgc tcctcgagct ggacgagccg    2040
          ctggtcctca actcctacgt cacgccgatc tgcatcgccg acaaggagta cacgaacatc    2100
          ttcctgaagt tcgggagcgg ctacgtctcg ggctggggcc gcgtgttcca caaggggcgc    2160
          agcgcgctcg tgctccagta cctgcgggtc cccctggtcg accgcgcgac ctgcctcctc    2220
          tccacgaagt tcacgatcta caacaacatg ttctgcgcgg ggttccacga gggcggccgg    2280
          gacagctgcc agggcgacag cgggggcccg cacgtgacgg aggtggaggg cacgagcttc    2340
          ctgaccggga tcatctcgtg gggcgaggag tgcgcgatga aggggaagta cggcatctac    2400
          accaaggtca gccggtacgt gaactggatc aaggagaaga cgaagctgac gtgatgaaga    2460
          tctacgggtg gcatccctgt gacccctccc cagtgcccct cctggccctg gaagttgcca    2520
          ctccagtgcc caccagcctt gtcctaataa aattaagttg catcattttg tctgactagg    2580
          tgtccttcta taatattatg gggtggaggg gggtggtatg gagcaagggg caagttggga    2640
          agacaacctg tagggcctgc ggggtctatt gggaaccaag ctggagtgca gtggcacaat    2700
          cttggctcac tgcaatctcc gcctcctggg ttcaagcgat tctcctgcct cagcctcccg    2760
          agttgttggg attccaggca tgcatgacca ggctcagcta atttttgttt ttttggtaga    2820
          gacggggttt caccatattg gccaggctgg tctccaactc ctaatctcag gtgatctacc    2880
          caccttggcc tcccaaattg ctgggattac aggcgtgaac cactgctccc ttccctgtcc    2940
          ttctgatttt gtaggtaacc acgtgcggac cgagcggccg caggaacccc tagtgatgga    3000
          gttggccact ccctctctgc gcgctcgctc gctcactgag gccgggcgac caaaggtcgc    3060
          ccgacgcccg ggctttgccc gggcggcctc agtgagcgag cgagcgcgca gctgcctgca    3120
          gg                                                                   3122
          <![CDATA[<210> 4]]>
          <![CDATA[<211> 1383]]>
          <![CDATA[<212> DNA]]>
          <![CDATA[<213> 人工序列]]>
          <![CDATA[<220> ]]>
          <![CDATA[<223> 編碼重組凝血因子IX的密碼子優化的核酸(hFIXco-v2變體)]]>
          <![CDATA[<400> 4]]>
          atgcagcggg tgaacatgat catggccgag tccccaggcc tgattaccat ctgtctgctg      60
          ggctacctgc tgagcgccga atgcaccgtg tttctggacc acgagaacgc caacaagatc     120
          ctgaaccgcc ctaagcggta caactccggc aagctggagg agtttgtgca gggcaatctg     180
          gagcgggagt gtatggagga gaagtgcagc ttcgaggagg ccagggaggt gttcgagaac     240
          accgagagga ccaccgagtt ctggaagcag tatgtggacg gcgaccagtg cgagtctaat     300
          ccttgtctga atggcgggag ctgcaaggac gacatcaaca gctacgagtg ctggtgccct     360
          ttcggcttcg agggcaagaa ttgcgagctg gacgtgacct gcaacatcaa gaacggccgg     420
          tgtgagcagt tctgcaagaa cagcgccgac aacaaggtgg tgtgctcctg caccgaggga     480
          tacaggctgg ccgagaatca gaagagctgt gagcccgccg tgccattccc ctgtggcaga     540
          gtgtctgtga gccagaccag caagctgacc agagccgaga ccgtgtttcc agacgtggac     600
          tacgtgaaca gcaccgaggc cgagaccatc ctggataata tcacccagtc cacccagagc     660
          ttcaacgact tcaccagagt ggtgggaggc gaggatgcca agccaggaca gtttccctgg     720
          caggtggtgc tgaatggcaa ggtggacgcc ttctgcggag gcagcatcgt gaacgagaag     780
          tggattgtga ccgcagccca ctgcgtggag actggcgtga agattaccgt ggtcgccggc     840
          gagcacaata tcgaagagac cgagcacacc gagcagaagc gcaacgtgat ccggatcatc     900
          cctcaccaca actacaacgc agccatcaac aagtacaacc acgacatcgc cctgctggag     960
          ctggacgagc cactggtgct gaactcttac gtgaccccta tctgcatcgc cgacaaggag    1020
          tacaccaaca tcttcctgaa gttcggcagc ggctacgtga gcggatgggg cagagtgttt    1080
          cacaagggca ggagcgccct ggtgctgcag tatctgagag tgccactggt ggacagagct    1140
          acctgcctgc tgagcaccaa gttcaccatc tacaacaaca tgttctgcgc cggcttccac    1200
          gaggggggaa gagactcttg ccagggcgat tccggcggac cacacgtgac cgaagtggag    1260
          ggcaccagct tcctgaccgg catcatctcc tggggcgagg aatgcgccat gaagggcaag    1320
          tacggcatct acaccaaggt gagcaggtac gtgaactgga tcaaggagaa gaccaagctg    1380
          acc                                                                  1383
          <![CDATA[<210> 5]]>
          <![CDATA[<211> 3123]]>
          <![CDATA[<212> DNA]]>
          <![CDATA[<213> 人工序列]]>
          <![CDATA[<220> ]]>
          <![CDATA[<223> 含重組凝血因子IX的密碼子優化的基因的表達盒(變體AAV5-hFIXco-v2)]]>
          <![CDATA[<400> 5]]>
          cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcgtcg ggcgaccttt      60
          ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact     120
          aggggttcct gcggccgcac gcgtgccgcc accatggtcg agcttgggct gcaggtcgag     180
          ggcactggga ggatgttgag taagatggaa aactactgat gacccttgca gagacagagt     240
          attaggacat gtttgaacag gggccggcga tcagcaggta gctctagagg atccccgtct     300
          gtctgcacat ttcgtagagc gagtgttccg atactctaat ctccctaggc aaggttcata     360
          tttgtgtagg ttacttattc tccttttgtt gactaagtca ataatcagaa tcagcaggtt     420
          tggagtcagc ttggcaggga tcagcagcct gggttggaag gagggggtat aaaagcccct     480
          tcaccaggag aagccgtcac acagatccac aagctcctga caggaagctc taggtgactc     540
          tcttaaggta gcctccgcgg attcgaatcc cggccgggaa cggtgcattg gaacgcggat     600
          tccccgtgcc aagagtgacg taagtaccgc ctatagagtc tataggccca caaaaaatgc     660
          tttcttcttt taatatactt ttttgtttat cttatttcta atactttccc taatctcttt     720
          ctttcagggc aataatgata caatgtatca tgcctctttg caccattcta aagaataaca     780
          gtgataattt ctgggttaag gcaatagcaa tatttctgca tataaatatt tctgcatata     840
          aattgtaact gatgtaagag gtttcatatt gctaatagca gctacaatcc agctaccatt     900
          ctgcttttat tttatggttg ggataaggct ggattattct gagtccaagc taggcccttt     960
          tgctaatcat gttcatacct cttatcttcc tcccacagct cctgggcaac gtgctggtct    1020
          gtgtgctggc ccatcacttt ggcaaagaat tgggattcga acatcgatat aaatgcagcg    1080
          ggtgaacatg atcatggccg agtccccagg cctgattacc atctgtctgc tgggctacct    1140
          gctgagcgcc gaatgcaccg tgtttctgga ccacgagaac gccaacaaga tcctgaaccg    1200
          ccctaagcgg tacaactccg gcaagctgga ggagtttgtg cagggcaatc tggagcggga    1260
          gtgtatggag gagaagtgca gcttcgagga ggccagggag gtgttcgaga acaccgagag    1320
          gaccaccgag ttctggaagc agtatgtgga cggcgaccag tgcgagtcta atccttgtct    1380
          gaatggcggg agctgcaagg acgacatcaa cagctacgag tgctggtgcc ctttcggctt    1440
          cgagggcaag aattgcgagc tggacgtgac ctgcaacatc aagaacggcc ggtgtgagca    1500
          gttctgcaag aacagcgccg acaacaaggt ggtgtgctcc tgcaccgagg gatacaggct    1560
          ggccgagaat cagaagagct gtgagcccgc cgtgccattc ccctgtggca gagtgtctgt    1620
          gagccagacc agcaagctga ccagagccga gaccgtgttt ccagacgtgg actacgtgaa    1680
          cagcaccgag gccgagacca tcctggataa tatcacccag tccacccaga gcttcaacga    1740
          cttcaccaga gtggtgggag gcgaggatgc caagccagga cagtttccct ggcaggtggt    1800
          gctgaatggc aaggtggacg ccttctgcgg aggcagcatc gtgaacgaga agtggattgt    1860
          gaccgcagcc cactgcgtgg agactggcgt gaagattacc gtggtcgccg gcgagcacaa    1920
          tatcgaagag accgagcaca ccgagcagaa gcgcaacgtg atccggatca tccctcacca    1980
          caactacaac gcagccatca acaagtacaa ccacgacatc gccctgctgg agctggacga    2040
          gccactggtg ctgaactctt acgtgacccc tatctgcatc gccgacaagg agtacaccaa    2100
          catcttcctg aagttcggca gcggctacgt gagcggatgg ggcagagtgt ttcacaaggg    2160
          caggagcgcc ctggtgctgc agtatctgag agtgccactg gtggacagag ctacctgcct    2220
          gctgagcacc aagttcacca tctacaacaa catgttctgc gccggcttcc acgagggggg    2280
          aagagactct tgccagggcg attccggcgg accacacgtg accgaagtgg agggcaccag    2340
          cttcctgacc ggcatcatct cctggggcga ggaatgcgcc atgaagggca agtacggcat    2400
          ctacaccaag gtgagcaggt acgtgaactg gatcaaggag aagaccaagc tgacctgaag    2460
          atctacgggt ggcatccctg tgacccctcc ccagtgcccc tcctggccct ggaagttgcc    2520
          actccagtgc ccaccagcct tgtcctaata aaattaagtt gcatcatttt gtctgactag    2580
          gtgtccttct ataatattat ggggtggagg ggggtggtat ggagcaaggg gcaagttggg    2640
          aagacaacct gtagggcctg cggggtctat tgggaaccaa gctggagtgc agtggcacaa    2700
          tcttggctca ctgcaatctc cgcctcctgg gttcaagcga ttctcctgcc tcagcctccc    2760
          gagttgttgg gattccaggc atgcatgacc aggctcagct aatttttgtt tttttggtag    2820
          agacggggtt tcaccatatt ggccaggctg gtctccaact cctaatctca ggtgatctac    2880
          ccaccttggc ctcccaaatt gctgggatta caggcgtgaa ccactgctcc cttccctgtc    2940
          cttctgattt tgtaggtaac cacgtgcgga ccgagcggcc gcaggaaccc ctagtgatgg    3000
          agttggccac tccctctctg cgcgctcgct cgctcactga ggccgggcga ccaaaggtcg    3060
          cccgacgccc gggctttgcc cgggcggcct cagtgagcga gcgagcgcgc agctgcctgc    3120
          agg                                                                  3123
          <![CDATA[<210> 6]]>
          <![CDATA[<211> 130]]>
          <![CDATA[<212> DNA]]>
          <![CDATA[<213> 人工序列]]>
          <![CDATA[<220> ]]>
          <![CDATA[<223> 左側(第一) ITR (反向末端重複)]]>
          <![CDATA[<400> 6]]>
          cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcgtcg ggcgaccttt     60
          ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact    120
          aggggttcct                                                           130
          <![CDATA[<210> 7]]>
          <![CDATA[<211> 372]]>
          <![CDATA[<212> DNA]]>
          <![CDATA[<213> 天然序列]]>
          <![CDATA[<220> ]]>
          <![CDATA[<223> TTR啟動子序列(運甲狀腺素蛋白啟動子)]]>
          <![CDATA[<400> 7]]>
          tcgagcttgg gctgcaggtc gagggcactg ggaggatgtt gagtaagatg gaaaactact      60
          gatgaccctt gcagagacag agtattagga catgtttgaa caggggccgg cgatcagcag     120
          gtagctctag aggatccccg tctgtctgca catttcgtag agcgagtgtt ccgatactct     180
          aatctcccta ggcaaggttc atatttgtgt aggttactta ttctcctttt gttgactaag     240
          tcaataatca gaatcagcag gtttggagtc agcttggcag ggatcagcag cctgggttgg     300
          aaggaggggg tataaaagcc ccttcaccag gagaagccgt cacacagatc cacaagctcc     360
          tgacaggaag ct                                                         372
          <![CDATA[<210> 8]]>
          <![CDATA[<211> 493]]>
          <![CDATA[<212> DNA]]>
          <![CDATA[<213> 天然序列]]>
          <![CDATA[<220> ]]>
          <![CDATA[<223> hBG1基因內含子(攜帶內含子的人類β珠蛋白基因片段)]]>
          <![CDATA[<400> 8]]>
          cgaatcccgg ccgggaacgg tgcattggaa cgcggattcc ccgtgccaag agtgacgtaa      60
          gtaccgccta tagagtctat aggcccacaa aaaatgcttt cttcttttaa tatacttttt     120
          tgtttatctt atttctaata ctttccctaa tctctttctt tcagggcaat aatgatacaa     180
          tgtatcatgc ctctttgcac cattctaaag aataacagtg ataatttctg ggttaaggca     240
          atagcaatat ttctgcatat aaatatttct gcatataaat tgtaactgat gtaagaggtt     300
          tcatattgct aatagcagct acaatccagc taccattctg cttttatttt atggttggga     360
          taaggctgga ttattctgag tccaagctag gcccttttgc taatcatgtt catacctctt     420
          atcttcctcc cacagctcct gggcaacgtg ctggtctgtg tgctggccca tcactttggc     480
          aaagaattgg gat                                                        493
          <![CDATA[<210> 9]]>
          <![CDATA[<211> 479]]>
          <![CDATA[<212> DNA]]>
          <![CDATA[<213> 天然序列]]>
          <![CDATA[<220> ]]>
          <![CDATA[<223> hGH1多聚腺苷酸化信號(人類生長激素基因多聚腺苷酸化信號)]]>
          <![CDATA[<400> 9]]>
          acgggtggca tccctgtgac ccctccccag tgcccctcct ggccctggaa gttgccactc      60
          cagtgcccac cagccttgtc ctaataaaat taagttgcat cattttgtct gactaggtgt     120
          ccttctataa tattatgggg tggagggggg tggtatggag caaggggcaa gttgggaaga     180
          caacctgtag ggcctgcggg gtctattggg aaccaagctg gagtgcagtg gcacaatctt     240
          ggctcactgc aatctccgcc tcctgggttc aagcgattct cctgcctcag cctcccgagt     300
          tgttgggatt ccaggcatgc atgaccaggc tcagctaatt tttgtttttt tggtagagac     360
          ggggtttcac catattggcc aggctggtct ccaactccta atctcaggtg atctacccac     420
          cttggcctcc caaattgctg ggattacagg cgtgaaccac tgctcccttc cctgtcctt      479
          <![CDATA[<210> 10]]>
          <![CDATA[<211> 141]]>
          <![CDATA[<212> DNA]]>
          <![CDATA[<213> 人工序列]]>
          <![CDATA[<220> ]]>
          <![CDATA[<223> 右側(第二) ITR]]>
          <![CDATA[<400> 10]]>
          aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg     60
          ccgggcgacc aaaggtcgcc cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc    120
          gagcgcgcag ctgcctgcag g                                              141
          <![CDATA[<210> 11]]>
          <![CDATA[<211> 724]]>
          <![CDATA[<212> PRT]]>
          <![CDATA[<213> 天然序列]]>
          <![CDATA[<220> ]]>
          <![CDATA[<223> 野生型AAV5衣殼蛋白VP1的天然序列]]>
          <![CDATA[<400> 11]]>
          Met Ser Phe Val Asp His Pro Pro Asp Trp Leu Glu Glu Val Gly Glu 
          1               5                   10                  15      
          Gly Leu Arg Glu Phe Leu Gly Leu Glu Ala Gly Pro Pro Lys Pro Lys 
                      20                  25                  30          
          Pro Asn Gln Gln His Gln Asp Gln Ala Arg Gly Leu Val Leu Pro Gly 
                  35                  40                  45              
          Tyr Asn Tyr Leu Gly Pro Gly Asn Gly Leu Asp Arg Gly Glu Pro Val 
              50                  55                  60                  
          Asn Arg Ala Asp Glu Val Ala Arg Glu His Asp Ile Ser Tyr Asn Glu 
          65                  70                  75                  80  
          Gln Leu Glu Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala Asp 
                          85                  90                  95      
          Ala Glu Phe Gln Glu Lys Leu Ala Asp Asp Thr Ser Phe Gly Gly Asn 
                      100                 105                 110         
          Leu Gly Lys Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro Phe 
                  115                 120                 125             
          Gly Leu Val Glu Glu Gly Ala Lys Thr Ala Pro Thr Gly Lys Arg Ile 
              130                 135                 140                 
          Asp Asp His Phe Pro Lys Arg Lys Lys Ala Arg Thr Glu Glu Asp Ser 
          145                 150                 155                 160 
          Lys Pro Ser Thr Ser Ser Asp Ala Glu Ala Gly Pro Ser Gly Ser Gln 
                          165                 170                 175     
          Gln Leu Gln Ile Pro Ala Gln Pro Ala Ser Ser Leu Gly Ala Asp Thr 
                      180                 185                 190         
          Met Ser Ala Gly Gly Gly Gly Pro Leu Gly Asp Asn Asn Gln Gly Ala 
                  195                 200                 205             
          Asp Gly Val Gly Asn Ala Ser Gly Asp Trp His Cys Asp Ser Thr Trp 
              210                 215                 220                 
          Met Gly Asp Arg Val Val Thr Lys Ser Thr Arg Thr Trp Val Leu Pro 
          225                 230                 235                 240 
          Ser Tyr Asn Asn His Gln Tyr Arg Glu Ile Lys Ser Gly Ser Val Asp 
                          245                 250                 255     
          Gly Ser Asn Ala Asn Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr 
                      260                 265                 270         
          Phe Asp Phe Asn Arg Phe His Ser His Trp Ser Pro Arg Asp Trp Gln 
                  275                 280                 285             
          Arg Leu Ile Asn Asn Tyr Trp Gly Phe Arg Pro Arg Ser Leu Arg Val 
              290                 295                 300                 
          Lys Ile Phe Asn Ile Gln Val Lys Glu Val Thr Val Gln Asp Ser Thr 
          305                 310                 315                 320 
          Thr Thr Ile Ala Asn Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp 
                          325                 330                 335     
          Asp Asp Tyr Gln Leu Pro Tyr Val Val Gly Asn Gly Thr Glu Gly Cys 
                      340                 345                 350         
          Leu Pro Ala Phe Pro Pro Gln Val Phe Thr Leu Pro Gln Tyr Gly Tyr 
                  355                 360                 365             
          Ala Thr Leu Asn Arg Asp Asn Thr Glu Asn Pro Thr Glu Arg Ser Ser 
              370                 375                 380                 
          Phe Phe Cys Leu Glu Tyr Phe Pro Ser Lys Met Leu Arg Thr Gly Asn 
          385                 390                 395                 400 
          Asn Phe Glu Phe Thr Tyr Asn Phe Glu Glu Val Pro Phe His Ser Ser 
                          405                 410                 415     
          Phe Ala Pro Ser Gln Asn Leu Phe Lys Leu Ala Asn Pro Leu Val Asp 
                      420                 425                 430         
          Gln Tyr Leu Tyr Arg Phe Val Ser Thr Asn Asn Thr Gly Gly Val Gln 
                  435                 440                 445             
          Phe Asn Lys Asn Leu Ala Gly Arg Tyr Ala Asn Thr Tyr Lys Asn Trp 
              450                 455                 460                 
          Phe Pro Gly Pro Met Gly Arg Thr Gln Gly Trp Asn Leu Gly Ser Gly 
          465                 470                 475                 480 
          Val Asn Arg Ala Ser Val Ser Ala Phe Ala Thr Thr Asn Arg Met Glu 
                          485                 490                 495     
          Leu Glu Gly Ala Ser Tyr Gln Val Pro Pro Gln Pro Asn Gly Met Thr 
                      500                 505                 510         
          Asn Asn Leu Gln Gly Ser Asn Thr Tyr Ala Leu Glu Asn Thr Met Ile 
                  515                 520                 525             
          Phe Asn Ser Gln Pro Ala Asn Pro Gly Thr Thr Ala Thr Tyr Leu Glu 
              530                 535                 540                 
          Gly Asn Met Leu Ile Thr Ser Glu Ser Glu Thr Gln Pro Val Asn Arg 
          545                 550                 555                 560 
          Val Ala Tyr Asn Val Gly Gly Gln Met Ala Thr Asn Asn Gln Ser Ser 
                          565                 570                 575     
          Thr Thr Ala Pro Ala Thr Gly Thr Tyr Asn Leu Gln Glu Ile Val Pro 
                      580                 585                 590         
          Gly Ser Val Trp Met Glu Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp 
                  595                 600                 605             
          Ala Lys Ile Pro Glu Thr Gly Ala His Phe His Pro Ser Pro Ala Met 
              610                 615                 620                 
          Gly Gly Phe Gly Leu Lys His Pro Pro Pro Met Met Leu Ile Lys Asn 
          625                 630                 635                 640 
          Thr Pro Val Pro Gly Asn Ile Thr Ser Phe Ser Asp Val Pro Val Ser 
                          645                 650                 655     
          Ser Phe Ile Thr Gln Tyr Ser Thr Gly Gln Val Thr Val Glu Met Glu 
                      660                 665                 670         
          Trp Glu Leu Lys Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln 
                  675                 680                 685             
          Tyr Thr Asn Asn Tyr Asn Asp Pro Gln Phe Val Asp Phe Ala Pro Asp 
              690                 695                 700                 
          Ser Thr Gly Glu Tyr Arg Thr Thr Arg Pro Ile Gly Thr Arg Tyr Leu 
          705                 710                 715                 720 
          Thr Arg Pro Leu 
          <![CDATA[<210> 12]]>
          <![CDATA[<211> 588]]>
          <![CDATA[<212> PRT]]>
          <![CDATA[<213> 天然序列]]>
          <![CDATA[<220> ]]>
          <![CDATA[<223> 野生型AAV5衣殼蛋白VP2的天然序列]]>
          <![CDATA[<400> 12]]>
          Thr Ala Pro Thr Gly Lys Arg Ile Asp Asp His Phe Pro Lys Arg Lys 
          1               5                   10                  15      
          Lys Ala Arg Thr Glu Glu Asp Ser Lys Pro Ser Thr Ser Ser Asp Ala 
                      20                  25                  30          
          Glu Ala Gly Pro Ser Gly Ser Gln Gln Leu Gln Ile Pro Ala Gln Pro 
                  35                  40                  45              
          Ala Ser Ser Leu Gly Ala Asp Thr Met Ser Ala Gly Gly Gly Gly Pro 
              50                  55                  60                  
          Leu Gly Asp Asn Asn Gln Gly Ala Asp Gly Val Gly Asn Ala Ser Gly 
          65                  70                  75                  80  
          Asp Trp His Cys Asp Ser Thr Trp Met Gly Asp Arg Val Val Thr Lys 
                          85                  90                  95      
          Ser Thr Arg Thr Trp Val Leu Pro Ser Tyr Asn Asn His Gln Tyr Arg 
                      100                 105                 110         
          Glu Ile Lys Ser Gly Ser Val Asp Gly Ser Asn Ala Asn Ala Tyr Phe 
                  115                 120                 125             
          Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His Ser 
              130                 135                 140                 
          His Trp Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Tyr Trp Gly 
          145                 150                 155                 160 
          Phe Arg Pro Arg Ser Leu Arg Val Lys Ile Phe Asn Ile Gln Val Lys 
                          165                 170                 175     
          Glu Val Thr Val Gln Asp Ser Thr Thr Thr Ile Ala Asn Asn Leu Thr 
                      180                 185                 190         
          Ser Thr Val Gln Val Phe Thr Asp Asp Asp Tyr Gln Leu Pro Tyr Val 
                  195                 200                 205             
          Val Gly Asn Gly Thr Glu Gly Cys Leu Pro Ala Phe Pro Pro Gln Val 
              210                 215                 220                 
          Phe Thr Leu Pro Gln Tyr Gly Tyr Ala Thr Leu Asn Arg Asp Asn Thr 
          225                 230                 235                 240 
          Glu Asn Pro Thr Glu Arg Ser Ser Phe Phe Cys Leu Glu Tyr Phe Pro 
                          245                 250                 255     
          Ser Lys Met Leu Arg Thr Gly Asn Asn Phe Glu Phe Thr Tyr Asn Phe 
                      260                 265                 270         
          Glu Glu Val Pro Phe His Ser Ser Phe Ala Pro Ser Gln Asn Leu Phe 
                  275                 280                 285             
          Lys Leu Ala Asn Pro Leu Val Asp Gln Tyr Leu Tyr Arg Phe Val Ser 
              290                 295                 300                 
          Thr Asn Asn Thr Gly Gly Val Gln Phe Asn Lys Asn Leu Ala Gly Arg 
          305                 310                 315                 320 
          Tyr Ala Asn Thr Tyr Lys Asn Trp Phe Pro Gly Pro Met Gly Arg Thr 
                          325                 330                 335     
          Gln Gly Trp Asn Leu Gly Ser Gly Val Asn Arg Ala Ser Val Ser Ala 
                      340                 345                 350         
          Phe Ala Thr Thr Asn Arg Met Glu Leu Glu Gly Ala Ser Tyr Gln Val 
                  355                 360                 365             
          Pro Pro Gln Pro Asn Gly Met Thr Asn Asn Leu Gln Gly Ser Asn Thr 
              370                 375                 380                 
          Tyr Ala Leu Glu Asn Thr Met Ile Phe Asn Ser Gln Pro Ala Asn Pro 
          385                 390                 395                 400 
          Gly Thr Thr Ala Thr Tyr Leu Glu Gly Asn Met Leu Ile Thr Ser Glu 
                          405                 410                 415     
          Ser Glu Thr Gln Pro Val Asn Arg Val Ala Tyr Asn Val Gly Gly Gln 
                      420                 425                 430         
          Met Ala Thr Asn Asn Gln Ser Ser Thr Thr Ala Pro Ala Thr Gly Thr 
                  435                 440                 445             
          Tyr Asn Leu Gln Glu Ile Val Pro Gly Ser Val Trp Met Glu Arg Asp 
              450                 455                 460                 
          Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro Glu Thr Gly Ala 
          465                 470                 475                 480 
          His Phe His Pro Ser Pro Ala Met Gly Gly Phe Gly Leu Lys His Pro 
                          485                 490                 495     
          Pro Pro Met Met Leu Ile Lys Asn Thr Pro Val Pro Gly Asn Ile Thr 
                      500                 505                 510         
          Ser Phe Ser Asp Val Pro Val Ser Ser Phe Ile Thr Gln Tyr Ser Thr 
                  515                 520                 525             
          Gly Gln Val Thr Val Glu Met Glu Trp Glu Leu Lys Lys Glu Asn Ser 
              530                 535                 540                 
          Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Asn Asn Tyr Asn Asp Pro 
          545                 550                 555                 560 
          Gln Phe Val Asp Phe Ala Pro Asp Ser Thr Gly Glu Tyr Arg Thr Thr 
                          565                 570                 575     
          Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Pro Leu 
                      580                 585             
          <![CDATA[<210> 13]]>
          <![CDATA[<211> 532]]>
          <![CDATA[<212> PRT]]>
          <![CDATA[<213> 天然序列]]>
          <![CDATA[<220> ]]>
          <![CDATA[<223> 野生型AAV5衣殼蛋白VP3的天然序列]]>
          <![CDATA[<400> 13]]>
          Met Ser Ala Gly Gly Gly Gly Pro Leu Gly Asp Asn Asn Gln Gly Ala 
          1               5                   10                  15      
          Asp Gly Val Gly Asn Ala Ser Gly Asp Trp His Cys Asp Ser Thr Trp 
                      20                  25                  30          
          Met Gly Asp Arg Val Val Thr Lys Ser Thr Arg Thr Trp Val Leu Pro 
                  35                  40                  45              
          Ser Tyr Asn Asn His Gln Tyr Arg Glu Ile Lys Ser Gly Ser Val Asp 
              50                  55                  60                  
          Gly Ser Asn Ala Asn Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr 
          65                  70                  75                  80  
          Phe Asp Phe Asn Arg Phe His Ser His Trp Ser Pro Arg Asp Trp Gln 
                          85                  90                  95      
          Arg Leu Ile Asn Asn Tyr Trp Gly Phe Arg Pro Arg Ser Leu Arg Val 
                      100                 105                 110         
          Lys Ile Phe Asn Ile Gln Val Lys Glu Val Thr Val Gln Asp Ser Thr 
                  115                 120                 125             
          Thr Thr Ile Ala Asn Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp 
              130                 135                 140                 
          Asp Asp Tyr Gln Leu Pro Tyr Val Val Gly Asn Gly Thr Glu Gly Cys 
          145                 150                 155                 160 
          Leu Pro Ala Phe Pro Pro Gln Val Phe Thr Leu Pro Gln Tyr Gly Tyr 
                          165                 170                 175     
          Ala Thr Leu Asn Arg Asp Asn Thr Glu Asn Pro Thr Glu Arg Ser Ser 
                      180                 185                 190         
          Phe Phe Cys Leu Glu Tyr Phe Pro Ser Lys Met Leu Arg Thr Gly Asn 
                  195                 200                 205             
          Asn Phe Glu Phe Thr Tyr Asn Phe Glu Glu Val Pro Phe His Ser Ser 
              210                 215                 220                 
          Phe Ala Pro Ser Gln Asn Leu Phe Lys Leu Ala Asn Pro Leu Val Asp 
          225                 230                 235                 240 
          Gln Tyr Leu Tyr Arg Phe Val Ser Thr Asn Asn Thr Gly Gly Val Gln 
                          245                 250                 255     
          Phe Asn Lys Asn Leu Ala Gly Arg Tyr Ala Asn Thr Tyr Lys Asn Trp 
                      260                 265                 270         
          Phe Pro Gly Pro Met Gly Arg Thr Gln Gly Trp Asn Leu Gly Ser Gly 
                  275                 280                 285             
          Val Asn Arg Ala Ser Val Ser Ala Phe Ala Thr Thr Asn Arg Met Glu 
              290                 295                 300                 
          Leu Glu Gly Ala Ser Tyr Gln Val Pro Pro Gln Pro Asn Gly Met Thr 
          305                 310                 315                 320 
          Asn Asn Leu Gln Gly Ser Asn Thr Tyr Ala Leu Glu Asn Thr Met Ile 
                          325                 330                 335     
          Phe Asn Ser Gln Pro Ala Asn Pro Gly Thr Thr Ala Thr Tyr Leu Glu 
                      340                 345                 350         
          Gly Asn Met Leu Ile Thr Ser Glu Ser Glu Thr Gln Pro Val Asn Arg 
                  355                 360                 365             
          Val Ala Tyr Asn Val Gly Gly Gln Met Ala Thr Asn Asn Gln Ser Ser 
              370                 375                 380                 
          Thr Thr Ala Pro Ala Thr Gly Thr Tyr Asn Leu Gln Glu Ile Val Pro 
          385                 390                 395                 400 
          Gly Ser Val Trp Met Glu Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp 
                          405                 410                 415     
          Ala Lys Ile Pro Glu Thr Gly Ala His Phe His Pro Ser Pro Ala Met 
                      420                 425                 430         
          Gly Gly Phe Gly Leu Lys His Pro Pro Pro Met Met Leu Ile Lys Asn 
                  435                 440                 445             
          Thr Pro Val Pro Gly Asn Ile Thr Ser Phe Ser Asp Val Pro Val Ser 
              450                 455                 460                 
          Ser Phe Ile Thr Gln Tyr Ser Thr Gly Gln Val Thr Val Glu Met Glu 
          465                 470                 475                 480 
          Trp Glu Leu Lys Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln 
                          485                 490                 495     
          Tyr Thr Asn Asn Tyr Asn Asp Pro Gln Phe Val Asp Phe Ala Pro Asp 
                      500                 505                 510         
          Ser Thr Gly Glu Tyr Arg Thr Thr Arg Pro Ile Gly Thr Arg Tyr Leu 
                  515                 520                 525             
          Thr Arg Pro Leu 
              530         
          <![CDATA[<210> 14]]>
          <![CDATA[<211> 724]]>
          <![CDATA[<212> PRT]]>
          <![CDATA[<213> 人工序列]]>
          <![CDATA[<220> ]]>
          <![CDATA[<223> 包括S2A和T711S取代的修飾的AAV5衣殼VP1蛋白]]>
          <![CDATA[<400> 14]]>
          Met Ala Phe Val Asp His Pro Pro Asp Trp Leu Glu Glu Val Gly Glu 
          1               5                   10                  15      
          Gly Leu Arg Glu Phe Leu Gly Leu Glu Ala Gly Pro Pro Lys Pro Lys 
                      20                  25                  30          
          Pro Asn Gln Gln His Gln Asp Gln Ala Arg Gly Leu Val Leu Pro Gly 
                  35                  40                  45              
          Tyr Asn Tyr Leu Gly Pro Gly Asn Gly Leu Asp Arg Gly Glu Pro Val 
              50                  55                  60                  
          Asn Arg Ala Asp Glu Val Ala Arg Glu His Asp Ile Ser Tyr Asn Glu 
          65                  70                  75                  80  
          Gln Leu Glu Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala Asp 
                          85                  90                  95      
          Ala Glu Phe Gln Glu Lys Leu Ala Asp Asp Thr Ser Phe Gly Gly Asn 
                      100                 105                 110         
          Leu Gly Lys Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro Phe 
                  115                 120                 125             
          Gly Leu Val Glu Glu Gly Ala Lys Thr Ala Pro Thr Gly Lys Arg Ile 
              130                 135                 140                 
          Asp Asp His Phe Pro Lys Arg Lys Lys Ala Arg Thr Glu Glu Asp Ser 
          145                 150                 155                 160 
          Lys Pro Ser Thr Ser Ser Asp Ala Glu Ala Gly Pro Ser Gly Ser Gln 
                          165                 170                 175     
          Gln Leu Gln Ile Pro Ala Gln Pro Ala Ser Ser Leu Gly Ala Asp Thr 
                      180                 185                 190         
          Met Ser Ala Gly Gly Gly Gly Pro Leu Gly Asp Asn Asn Gln Gly Ala 
                  195                 200                 205             
          Asp Gly Val Gly Asn Ala Ser Gly Asp Trp His Cys Asp Ser Thr Trp 
              210                 215                 220                 
          Met Gly Asp Arg Val Val Thr Lys Ser Thr Arg Thr Trp Val Leu Pro 
          225                 230                 235                 240 
          Ser Tyr Asn Asn His Gln Tyr Arg Glu Ile Lys Ser Gly Ser Val Asp 
                          245                 250                 255     
          Gly Ser Asn Ala Asn Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr 
                      260                 265                 270         
          Phe Asp Phe Asn Arg Phe His Ser His Trp Ser Pro Arg Asp Trp Gln 
                  275                 280                 285             
          Arg Leu Ile Asn Asn Tyr Trp Gly Phe Arg Pro Arg Ser Leu Arg Val 
              290                 295                 300                 
          Lys Ile Phe Asn Ile Gln Val Lys Glu Val Thr Val Gln Asp Ser Thr 
          305                 310                 315                 320 
          Thr Thr Ile Ala Asn Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp 
                          325                 330                 335     
          Asp Asp Tyr Gln Leu Pro Tyr Val Val Gly Asn Gly Thr Glu Gly Cys 
                      340                 345                 350         
          Leu Pro Ala Phe Pro Pro Gln Val Phe Thr Leu Pro Gln Tyr Gly Tyr 
                  355                 360                 365             
          Ala Thr Leu Asn Arg Asp Asn Thr Glu Asn Pro Thr Glu Arg Ser Ser 
              370                 375                 380                 
          Phe Phe Cys Leu Glu Tyr Phe Pro Ser Lys Met Leu Arg Thr Gly Asn 
          385                 390                 395                 400 
          Asn Phe Glu Phe Thr Tyr Asn Phe Glu Glu Val Pro Phe His Ser Ser 
                          405                 410                 415     
          Phe Ala Pro Ser Gln Asn Leu Phe Lys Leu Ala Asn Pro Leu Val Asp 
                      420                 425                 430         
          Gln Tyr Leu Tyr Arg Phe Val Ser Thr Asn Asn Thr Gly Gly Val Gln 
                  435                 440                 445             
          Phe Asn Lys Asn Leu Ala Gly Arg Tyr Ala Asn Thr Tyr Lys Asn Trp 
              450                 455                 460                 
          Phe Pro Gly Pro Met Gly Arg Thr Gln Gly Trp Asn Leu Gly Ser Gly 
          465                 470                 475                 480 
          Val Asn Arg Ala Ser Val Ser Ala Phe Ala Thr Thr Asn Arg Met Glu 
                          485                 490                 495     
          Leu Glu Gly Ala Ser Tyr Gln Val Pro Pro Gln Pro Asn Gly Met Thr 
                      500                 505                 510         
          Asn Asn Leu Gln Gly Ser Asn Thr Tyr Ala Leu Glu Asn Thr Met Ile 
                  515                 520                 525             
          Phe Asn Ser Gln Pro Ala Asn Pro Gly Thr Thr Ala Thr Tyr Leu Glu 
              530                 535                 540                 
          Gly Asn Met Leu Ile Thr Ser Glu Ser Glu Thr Gln Pro Val Asn Arg 
          545                 550                 555                 560 
          Val Ala Tyr Asn Val Gly Gly Gln Met Ala Thr Asn Asn Gln Ser Ser 
                          565                 570                 575     
          Thr Thr Ala Pro Ala Thr Gly Thr Tyr Asn Leu Gln Glu Ile Val Pro 
                      580                 585                 590         
          Gly Ser Val Trp Met Glu Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp 
                  595                 600                 605             
          Ala Lys Ile Pro Glu Thr Gly Ala His Phe His Pro Ser Pro Ala Met 
              610                 615                 620                 
          Gly Gly Phe Gly Leu Lys His Pro Pro Pro Met Met Leu Ile Lys Asn 
          625                 630                 635                 640 
          Thr Pro Val Pro Gly Asn Ile Thr Ser Phe Ser Asp Val Pro Val Ser 
                          645                 650                 655     
          Ser Phe Ile Thr Gln Tyr Ser Thr Gly Gln Val Thr Val Glu Met Glu 
                      660                 665                 670         
          Trp Glu Leu Lys Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln 
                  675                 680                 685             
          Tyr Thr Asn Asn Tyr Asn Asp Pro Gln Phe Val Asp Phe Ala Pro Asp 
              690                 695                 700                 
          Ser Thr Gly Glu Tyr Arg Ser Thr Arg Pro Ile Gly Thr Arg Tyr Leu 
          705                 710                 715                 720 
          Thr Arg Pro Leu 
          <![CDATA[<210> 15]]>
          <![CDATA[<211> 588]]>
          <![CDATA[<212> PRT]]>
          <![CDATA[<213> 人工序列]]>
          <![CDATA[<220> ]]>
          <![CDATA[<223> 包括T575S取代的修飾的AAV5衣殼VP2蛋白]]>
          <![CDATA[<400> 15]]>
          Thr Ala Pro Thr Gly Lys Arg Ile Asp Asp His Phe Pro Lys Arg Lys 
          1               5                   10                  15      
          Lys Ala Arg Thr Glu Glu Asp Ser Lys Pro Ser Thr Ser Ser Asp Ala 
                      20                  25                  30          
          Glu Ala Gly Pro Ser Gly Ser Gln Gln Leu Gln Ile Pro Ala Gln Pro 
                  35                  40                  45              
          Ala Ser Ser Leu Gly Ala Asp Thr Met Ser Ala Gly Gly Gly Gly Pro 
              50                  55                  60                  
          Leu Gly Asp Asn Asn Gln Gly Ala Asp Gly Val Gly Asn Ala Ser Gly 
          65                  70                  75                  80  
          Asp Trp His Cys Asp Ser Thr Trp Met Gly Asp Arg Val Val Thr Lys 
                          85                  90                  95      
          Ser Thr Arg Thr Trp Val Leu Pro Ser Tyr Asn Asn His Gln Tyr Arg 
                      100                 105                 110         
          Glu Ile Lys Ser Gly Ser Val Asp Gly Ser Asn Ala Asn Ala Tyr Phe 
                  115                 120                 125             
          Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His Ser 
              130                 135                 140                 
          His Trp Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Tyr Trp Gly 
          145                 150                 155                 160 
          Phe Arg Pro Arg Ser Leu Arg Val Lys Ile Phe Asn Ile Gln Val Lys 
                          165                 170                 175     
          Glu Val Thr Val Gln Asp Ser Thr Thr Thr Ile Ala Asn Asn Leu Thr 
                      180                 185                 190         
          Ser Thr Val Gln Val Phe Thr Asp Asp Asp Tyr Gln Leu Pro Tyr Val 
                  195                 200                 205             
          Val Gly Asn Gly Thr Glu Gly Cys Leu Pro Ala Phe Pro Pro Gln Val 
              210                 215                 220                 
          Phe Thr Leu Pro Gln Tyr Gly Tyr Ala Thr Leu Asn Arg Asp Asn Thr 
          225                 230                 235                 240 
          Glu Asn Pro Thr Glu Arg Ser Ser Phe Phe Cys Leu Glu Tyr Phe Pro 
                          245                 250                 255     
          Ser Lys Met Leu Arg Thr Gly Asn Asn Phe Glu Phe Thr Tyr Asn Phe 
                      260                 265                 270         
          Glu Glu Val Pro Phe His Ser Ser Phe Ala Pro Ser Gln Asn Leu Phe 
                  275                 280                 285             
          Lys Leu Ala Asn Pro Leu Val Asp Gln Tyr Leu Tyr Arg Phe Val Ser 
              290                 295                 300                 
          Thr Asn Asn Thr Gly Gly Val Gln Phe Asn Lys Asn Leu Ala Gly Arg 
          305                 310                 315                 320 
          Tyr Ala Asn Thr Tyr Lys Asn Trp Phe Pro Gly Pro Met Gly Arg Thr 
                          325                 330                 335     
          Gln Gly Trp Asn Leu Gly Ser Gly Val Asn Arg Ala Ser Val Ser Ala 
                      340                 345                 350         
          Phe Ala Thr Thr Asn Arg Met Glu Leu Glu Gly Ala Ser Tyr Gln Val 
                  355                 360                 365             
          Pro Pro Gln Pro Asn Gly Met Thr Asn Asn Leu Gln Gly Ser Asn Thr 
              370                 375                 380                 
          Tyr Ala Leu Glu Asn Thr Met Ile Phe Asn Ser Gln Pro Ala Asn Pro 
          385                 390                 395                 400 
          Gly Thr Thr Ala Thr Tyr Leu Glu Gly Asn Met Leu Ile Thr Ser Glu 
                          405                 410                 415     
          Ser Glu Thr Gln Pro Val Asn Arg Val Ala Tyr Asn Val Gly Gly Gln 
                      420                 425                 430         
          Met Ala Thr Asn Asn Gln Ser Ser Thr Thr Ala Pro Ala Thr Gly Thr 
                  435                 440                 445             
          Tyr Asn Leu Gln Glu Ile Val Pro Gly Ser Val Trp Met Glu Arg Asp 
              450                 455                 460                 
          Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro Glu Thr Gly Ala 
          465                 470                 475                 480 
          His Phe His Pro Ser Pro Ala Met Gly Gly Phe Gly Leu Lys His Pro 
                          485                 490                 495     
          Pro Pro Met Met Leu Ile Lys Asn Thr Pro Val Pro Gly Asn Ile Thr 
                      500                 505                 510         
          Ser Phe Ser Asp Val Pro Val Ser Ser Phe Ile Thr Gln Tyr Ser Thr 
                  515                 520                 525             
          Gly Gln Val Thr Val Glu Met Glu Trp Glu Leu Lys Lys Glu Asn Ser 
              530                 535                 540                 
          Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Asn Asn Tyr Asn Asp Pro 
          545                 550                 555                 560 
          Gln Phe Val Asp Phe Ala Pro Asp Ser Thr Gly Glu Tyr Arg Ser Thr 
                          565                 570                 575     
          Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Pro Leu 
                      580                 585             
          <![CDATA[<210> 16]]>
          <![CDATA[<211> 532]]>
          <![CDATA[<212> PRT]]>
          <![CDATA[<213> 人工序列]]>
          <![CDATA[<220> ]]>
          <![CDATA[<223> 包括T519S取代的修飾的AAV5 衣殼VP3蛋白]]>
          <![CDATA[<400> 16]]>
          Met Ser Ala Gly Gly Gly Gly Pro Leu Gly Asp Asn Asn Gln Gly Ala 
          1               5                   10                  15      
          Asp Gly Val Gly Asn Ala Ser Gly Asp Trp His Cys Asp Ser Thr Trp 
                      20                  25                  30          
          Met Gly Asp Arg Val Val Thr Lys Ser Thr Arg Thr Trp Val Leu Pro 
                  35                  40                  45              
          Ser Tyr Asn Asn His Gln Tyr Arg Glu Ile Lys Ser Gly Ser Val Asp 
              50                  55                  60                  
          Gly Ser Asn Ala Asn Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr 
          65                  70                  75                  80  
          Phe Asp Phe Asn Arg Phe His Ser His Trp Ser Pro Arg Asp Trp Gln 
                          85                  90                  95      
          Arg Leu Ile Asn Asn Tyr Trp Gly Phe Arg Pro Arg Ser Leu Arg Val 
                      100                 105                 110         
          Lys Ile Phe Asn Ile Gln Val Lys Glu Val Thr Val Gln Asp Ser Thr 
                  115                 120                 125             
          Thr Thr Ile Ala Asn Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp 
              130                 135                 140                 
          Asp Asp Tyr Gln Leu Pro Tyr Val Val Gly Asn Gly Thr Glu Gly Cys 
          145                 150                 155                 160 
          Leu Pro Ala Phe Pro Pro Gln Val Phe Thr Leu Pro Gln Tyr Gly Tyr 
                          165                 170                 175     
          Ala Thr Leu Asn Arg Asp Asn Thr Glu Asn Pro Thr Glu Arg Ser Ser 
                      180                 185                 190         
          Phe Phe Cys Leu Glu Tyr Phe Pro Ser Lys Met Leu Arg Thr Gly Asn 
                  195                 200                 205             
          Asn Phe Glu Phe Thr Tyr Asn Phe Glu Glu Val Pro Phe His Ser Ser 
              210                 215                 220                 
          Phe Ala Pro Ser Gln Asn Leu Phe Lys Leu Ala Asn Pro Leu Val Asp 
          225                 230                 235                 240 
          Gln Tyr Leu Tyr Arg Phe Val Ser Thr Asn Asn Thr Gly Gly Val Gln 
                          245                 250                 255     
          Phe Asn Lys Asn Leu Ala Gly Arg Tyr Ala Asn Thr Tyr Lys Asn Trp 
                      260                 265                 270         
          Phe Pro Gly Pro Met Gly Arg Thr Gln Gly Trp Asn Leu Gly Ser Gly 
                  275                 280                 285             
          Val Asn Arg Ala Ser Val Ser Ala Phe Ala Thr Thr Asn Arg Met Glu 
              290                 295                 300                 
          Leu Glu Gly Ala Ser Tyr Gln Val Pro Pro Gln Pro Asn Gly Met Thr 
          305                 310                 315                 320 
          Asn Asn Leu Gln Gly Ser Asn Thr Tyr Ala Leu Glu Asn Thr Met Ile 
                          325                 330                 335     
          Phe Asn Ser Gln Pro Ala Asn Pro Gly Thr Thr Ala Thr Tyr Leu Glu 
                      340                 345                 350         
          Gly Asn Met Leu Ile Thr Ser Glu Ser Glu Thr Gln Pro Val Asn Arg 
                  355                 360                 365             
          Val Ala Tyr Asn Val Gly Gly Gln Met Ala Thr Asn Asn Gln Ser Ser 
              370                 375                 380                 
          Thr Thr Ala Pro Ala Thr Gly Thr Tyr Asn Leu Gln Glu Ile Val Pro 
          385                 390                 395                 400 
          Gly Ser Val Trp Met Glu Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp 
                          405                 410                 415     
          Ala Lys Ile Pro Glu Thr Gly Ala His Phe His Pro Ser Pro Ala Met 
                      420                 425                 430         
          Gly Gly Phe Gly Leu Lys His Pro Pro Pro Met Met Leu Ile Lys Asn 
                  435                 440                 445             
          Thr Pro Val Pro Gly Asn Ile Thr Ser Phe Ser Asp Val Pro Val Ser 
              450                 455                 460                 
          Ser Phe Ile Thr Gln Tyr Ser Thr Gly Gln Val Thr Val Glu Met Glu 
          465                 470                 475                 480 
          Trp Glu Leu Lys Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln 
                          485                 490                 495     
          Tyr Thr Asn Asn Tyr Asn Asp Pro Gln Phe Val Asp Phe Ala Pro Asp 
                      500                 505                 510         
          Ser Thr Gly Glu Tyr Arg Ser Thr Arg Pro Ile Gly Thr Arg Tyr Leu 
                  515                 520                 525             
          Thr Arg Pro Leu 
              530         
          <![CDATA[<210> 17]]>
          <![CDATA[<211> 1383]]>
          <![CDATA[<212> DNA]]>
          <![CDATA[<213> 天然序列]]>
          <![CDATA[<220> ]]>
          <![CDATA[<223> 編碼含突變R338L的野生型重組凝血因子IX的核酸(hFIX-wt)]]>
          <![CDATA[<400> 17]]>
          atgcagcgcg tgaacatgat catggcagaa tcaccaggcc tcatcaccat ctgcctttta      60
          ggatatctac tcagtgctga atgtacagtt tttcttgatc atgaaaacgc caacaaaatt     120
          ctgaatcggc caaagaggta taattcaggt aaattggaag agtttgttca agggaacctt     180
          gagagagaat gtatggaaga aaagtgtagt tttgaagaag cacgagaagt ttttgaaaac     240
          actgaaagaa caactgaatt ttggaagcag tatgttgatg gagatcagtg tgagtccaat     300
          ccatgtttaa atggcggcag ttgcaaggat gacattaatt cctatgaatg ttggtgtccc     360
          tttggatttg aaggaaagaa ctgtgaatta gatgtaacat gtaacattaa gaatggcaga     420
          tgcgagcagt tttgtaaaaa tagtgctgat aacaaggtgg tttgctcctg tactgaggga     480
          tatcgacttg cagaaaacca gaagtcctgt gaaccagcag tgccatttcc atgtggaaga     540
          gtttctgttt cacaaacttc taagctcacc cgtgctgaga ctgtttttcc tgatgtggac     600
          tatgtaaatt ctactgaagc tgaaaccatt ttggataaca tcactcaaag cacccaatca     660
          tttaatgact tcactcgggt tgttggtgga gaagatgcca aaccaggtca attcccttgg     720
          caggttgttt tgaatggtaa agttgatgca ttctgtggag gctctatcgt taatgaaaaa     780
          tggattgtaa ctgctgccca ctgtgttgaa actggtgtta aaattacagt tgtcgcaggt     840
          gaacataata ttgaggagac agaacataca gagcaaaagc gaaatgtgat tcgaattatt     900
          cctcaccaca actacaatgc agctattaat aagtacaacc atgacattgc ccttctggaa     960
          ctggacgaac ccttagtgct aaacagctac gttacaccta tttgcattgc tgacaaggaa    1020
          tacacgaaca tcttcctcaa atttggatct ggctatgtaa gtggctgggg aagagtcttc    1080
          cacaaaggga gatcagcttt agttcttcag taccttagag ttccacttgt tgaccgagcc    1140
          acatgtcttc tatctacaaa gttcaccatc tataacaaca tgttctgtgc tggcttccat    1200
          gaaggaggta gagattcatg tcaaggagat agtgggggac cccatgttac tgaagtggaa    1260
          gggaccagtt tcttaactgg aattattagc tggggtgaag agtgtgcaat gaaaggcaaa    1320
          tatggaatat ataccaaggt atcccggtat gtcaactgga ttaaggaaaa aacaaagctc    1380
          act                                                                  1383
          
Figure 12_A0101_SEQ_0001
Figure 12_A0101_SEQ_0002
Figure 12_A0101_SEQ_0003
Figure 12_A0101_SEQ_0004
Figure 12_A0101_SEQ_0005
Figure 12_A0101_SEQ_0006
Figure 12_A0101_SEQ_0007
Figure 12_A0101_SEQ_0008
Figure 12_A0101_SEQ_0009
Figure 12_A0101_SEQ_0010
Figure 12_A0101_SEQ_0011
Figure 12_A0101_SEQ_0012
Figure 12_A0101_SEQ_0013
Figure 12_A0101_SEQ_0014
Figure 12_A0101_SEQ_0015
Figure 12_A0101_SEQ_0016
Figure 12_A0101_SEQ_0017
Figure 12_A0101_SEQ_0018
Figure 12_A0101_SEQ_0019
Figure 12_A0101_SEQ_0020
Figure 12_A0101_SEQ_0021
Figure 12_A0101_SEQ_0022
Figure 12_A0101_SEQ_0023

Claims (20)

  1. 一種分離的密碼子優化的核酸,其編碼具有SEQ ID NO:1的氨基酸序列的FIX (凝血因子IX)蛋白,所述核酸包括選自SEQ ID NO: 2或SEQ ID NO: 4的核苷酸序列。
  2. 一種表達盒,其包括如請求項1中所要求的密碼子優化的核酸。
  3. 如請求項2中所要求的表達盒,其在5'末端至3'末端方向包含以下元件: 左側(第一) ITR (反向末端重複); TTR啟動子(運甲狀腺素蛋白啟動子); hBG1基因內含子(人類β-珠蛋白基因的攜內含子片段); 如請求項1中所要求的密碼子優化的核酸; hGH1多聚腺苷酸化信號(人類生長激素基因多聚腺苷酸化信號); 右側(第二) ITR。
  4. 如請求項3中所要求的表達盒,其包括選自SEQ ID NO: 3或SEQ ID NO: 5的核苷酸序列。
  5. 一種表達載體,其包括如請求項1中所要求的密碼子優化的核酸或如請求項2至4中任一項所要求的表達盒。
  6. 一種用於增加FIX基因在靶細胞中表達的分離的基於AAV5 (腺相關病毒血清型5)的重組病毒,其包括如請求項1中所要求的密碼子優化的核酸或如請求項2至4中任一項所要求的表達盒。
  7. 如請求項6中所要求的基於AAV5的重組病毒,其中衣殼包括AAV5蛋白VP1。
  8. 如請求項7中所要求的基於AAV5的重組病毒,其中所述衣殼包括具有SEQ ID NO: 11的氨基酸序列的AAV5蛋白VP1。
  9. 如請求項7中所要求的基於AAV5的重組病毒,其中所述衣殼包括具有含一個或多個點突變的SEQ ID NO: 11的氨基酸序列的AAV5蛋白VP1。
  10. 如請求項9中所要求的基於AAV5的重組病毒,其中所述衣殼包括具有SEQ ID NO: 14的氨基酸序列的AAV5蛋白VP1。
  11. 如請求項6至10中任一項所要求的基於AAV5的重組病毒,其中所述衣殼包括具有SEQ ID NO: 11的氨基酸序列或含一個或多個點突變的SEQ ID NO: 11的氨基酸序列的AAV5蛋白VP1;且所述表達盒在5'末端至3'末端方向包括以下元件: 左側(第一) ITR (反向末端重複); TTR啟動子; hBG1基因內含子(人類β-珠蛋白基因的攜內含子片段); 如請求項1中所要求的密碼子優化的核酸; hGH1多聚腺苷酸化信號(人類生長激素基因多聚腺苷酸化信號); 右側(第二) ITR。
  12. 如請求項11中所要求的基於AAV5的重組病毒,其中所述衣殼包括具有SEQ ID NO: 11的氨基酸序列或含一個或多個點突變的SEQ ID NO: 11的氨基酸序列的AAV5蛋白VP1;且所述表達盒包含選自SEQ ID NO: 3或SEQ ID NO: 5的核苷酸序列。
  13. 如請求項11至12中任一項所要求的基於AAV5的重組病毒,其中具有含一個或多個點突變的SEQ ID NO: 11的氨基酸序列的AAV5蛋白VP1為SEQ ID NO: 14的氨基酸序列。
  14. 一種用於將FIX基因遞送至靶細胞的藥物組合物,其包含與一種或多種藥學上可接受的賦形劑相組合的如請求項6至13中任一項所要求的基於AAV5的重組病毒。
  15. 如請求項6至13中任一項所要求的基於AAV5的重組病毒或如請求項14中所要求的組合物用於將FIX基因遞送至靶細胞的用途。
  16. 一種如請求項6至13中任一項所要求的基於AAV5的重組病毒或如請求項14中所要求的組合物用於將FIX蛋白提供至患有血友病B和/或不具有FIX基因的功能完整的拷貝的受試者的用途。
  17. 一種如請求項6至13中任一項所要求的基於AAV5的重組病毒或如請求項14中所要求的組合物用於治療患有血友病B的受試者中的血友病B的用途。
  18. 一種用於將FIX蛋白提供至患有血友病B的受試者的方法,其包含將治療有效量的如請求項6至13中所要求的基於AAV5的重組病毒或如請求項14中所要求的組合物施用至需要其的受試者的細胞內。
  19. 一種將FIX基因遞送至患有血友病B的受試者的靶細胞的方法,其包含將如請求項6至13中任一項所要求的基於AAV5的重組病毒或如請求項14中所要求的組合物施用至所述受試者的細胞內。
  20. 一種用於治療受試者的血友病B的方法,其包含將治療有效量的如請求項6至13中任一項所要求的基於AAV5的重組病毒或如請求項14中所要求的組合物施用至患有血友病B的受試者內。
TW111108106A 2021-03-05 2022-03-04 編碼凝血因子ix蛋白的密碼子優化的核酸及其用途 TW202246505A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
RURU2021105703 2021-03-05
RU2021105703A RU2831751C2 (ru) 2021-03-05 Кодон-оптимизированная нуклеиновая кислота, которая кодирует белок фактора свёртывания крови IX, и ее применение

Publications (1)

Publication Number Publication Date
TW202246505A true TW202246505A (zh) 2022-12-01

Family

ID=83154378

Family Applications (1)

Application Number Title Priority Date Filing Date
TW111108106A TW202246505A (zh) 2021-03-05 2022-03-04 編碼凝血因子ix蛋白的密碼子優化的核酸及其用途

Country Status (20)

Country Link
US (1) US20240076691A1 (zh)
EP (1) EP4288549A1 (zh)
JP (1) JP2024509224A (zh)
KR (1) KR20230154067A (zh)
CN (1) CN117716038A (zh)
AR (1) AR125041A1 (zh)
AU (1) AU2022230548A1 (zh)
BR (1) BR112023018003A2 (zh)
CA (1) CA3212809A1 (zh)
CL (1) CL2023002629A1 (zh)
CO (1) CO2023011679A2 (zh)
CR (1) CR20230429A (zh)
EC (1) ECSP23067213A (zh)
IL (1) IL305679A (zh)
MA (1) MA62371A1 (zh)
MX (1) MX2023010350A (zh)
PE (1) PE20242117A1 (zh)
TW (1) TW202246505A (zh)
UY (1) UY39659A (zh)
WO (1) WO2022186734A1 (zh)

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6458563B1 (en) * 1996-06-26 2002-10-01 Emory University Modified factor VIII
GB0911870D0 (en) * 2009-07-08 2009-08-19 Ucl Business Plc Optimised coding sequence and promoter
KR102551733B1 (ko) * 2017-05-22 2023-07-06 다케다 야쿠힌 고교 가부시키가이샤 B형 혈우병 유전자 요법을 위한 증가된 발현을 가지는 재조합 fix 변이체를 암호화하는 바이러스 벡터

Also Published As

Publication number Publication date
PE20242117A1 (es) 2024-10-28
US20240076691A1 (en) 2024-03-07
CA3212809A1 (en) 2022-09-09
AU2022230548A1 (en) 2023-09-28
CO2023011679A2 (es) 2024-01-15
CR20230429A (es) 2024-03-08
EP4288549A1 (en) 2023-12-13
MX2023010350A (es) 2023-09-22
CN117716038A (zh) 2024-03-15
MA62371A1 (fr) 2024-03-29
CL2023002629A1 (es) 2024-04-01
WO2022186734A1 (en) 2022-09-09
ECSP23067213A (es) 2023-10-31
UY39659A (es) 2022-09-30
JP2024509224A (ja) 2024-02-29
BR112023018003A2 (pt) 2023-12-26
IL305679A (en) 2023-11-01
KR20230154067A (ko) 2023-11-07
AR125041A1 (es) 2023-05-31

Similar Documents

Publication Publication Date Title
US20200390866A1 (en) Factor viii sequences
JP2021121638A (ja) 変異体キャプシドを有するアデノ関連ウイルスビリオンおよびその使用方法
JP2020096642A (ja) 減少した免疫反応性を有するaavビリオン、およびその使用
KR20160010617A (ko) 캡시드-변형된 raav3 벡터 조성물, 및 인간 간암의 유전자 요법에서의 용도
US20240091383A1 (en) Synergistic effect of smn1 and mir-23a in treating spinal muscular atrophy
TW202120690A (zh) 腺相關病毒血清型5(aav5)的衣殼的分離的修飾的vp1蛋白、基於其的衣殼及載體
US20230321220A1 (en) Aav5-based vaccine against sars-cov-2
JP2022166181A (ja) ヒト肝臓への遺伝子導入のためのアデノ随伴ウイルスビリオン
EP4159863A1 (en) Codon-optimized nucleic acid encoding smn1 protein
JP7371954B2 (ja) ヒト肝臓への遺伝子導入のためのアデノ随伴ウイルスビリオン
CN111718420A (zh) 一种用于基因治疗的融合蛋白及其应用
CN111718418A (zh) 一种增强基因编辑的融合蛋白及其应用
RU2831751C2 (ru) Кодон-оптимизированная нуклеиновая кислота, которая кодирует белок фактора свёртывания крови IX, и ее применение
TW202246505A (zh) 編碼凝血因子ix蛋白的密碼子優化的核酸及其用途
JP4863874B2 (ja) 関節リウマチのインビボ遺伝子治療のためのaavベクター
OA21369A (en) Codon-optimized nucleic acid encoding the fix protein.
EA048549B1 (ru) Кодон-оптимизированная нуклеиновая кислота, которая кодирует белок фактора свёртывания крови ix, и ее применение
JP2022506174A (ja) 改変第ix因子ポリペプチド
RU2807158C2 (ru) Генотерапевтические конструкции для лечения болезни вильсона
OA21075A (en) Codon-optimized nucleic acid that encodes SMN1 protein, and use thereof
OA21365A (en) Synergistic effect of SMN1 and MIR-23A in treating spinal muscular atrophy.
WO2020187272A1 (zh) 一种用于基因治疗的融合蛋白及其应用
CN115836128A (zh) 用于基因疗法的编码葡萄糖-6-磷酸酶(G6Pase-a)的载体
EA045749B1 (ru) Кодон-оптимизированная нуклеиновая кислота, кодирующая белок smn1, и ее применение
JP2024521537A (ja) 血友病bを処置するための組成物および方法