CN114641570A - 具有靶向kras的反义寡核苷酸的细胞外囊泡 - Google Patents
具有靶向kras的反义寡核苷酸的细胞外囊泡 Download PDFInfo
- Publication number
- CN114641570A CN114641570A CN202080070752.9A CN202080070752A CN114641570A CN 114641570 A CN114641570 A CN 114641570A CN 202080070752 A CN202080070752 A CN 202080070752A CN 114641570 A CN114641570 A CN 114641570A
- Authority
- CN
- China
- Prior art keywords
- aso
- seq
- extracellular vesicle
- aspects
- kras
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/113—Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
- C12N15/1137—Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing against enzymes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/113—Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P35/00—Antineoplastic agents
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/10—Type of nucleic acid
- C12N2310/11—Antisense
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/30—Chemical structure
- C12N2310/31—Chemical structure of the backbone
- C12N2310/315—Phosphorothioates
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/30—Chemical structure
- C12N2310/32—Chemical structure of the sugar
- C12N2310/321—2'-O-R Modification
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/30—Chemical structure
- C12N2310/32—Chemical structure of the sugar
- C12N2310/323—Chemical structure of the sugar modified ring structure
- C12N2310/3231—Chemical structure of the sugar modified ring structure having an additional ring, e.g. LNA, ENA
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/30—Chemical structure
- C12N2310/33—Chemical structure of the base
- C12N2310/334—Modified C
- C12N2310/3341—5-Methylcytosine
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/30—Chemical structure
- C12N2310/34—Spatial arrangement of the modifications
- C12N2310/346—Spatial arrangement of the modifications having a combination of backbone and sugar modifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2320/00—Applications; Uses
- C12N2320/30—Special therapeutic applications
- C12N2320/32—Special delivery means, e.g. tissue-specific
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Engineering & Computer Science (AREA)
- Genetics & Genomics (AREA)
- Biomedical Technology (AREA)
- Organic Chemistry (AREA)
- Chemical & Material Sciences (AREA)
- Zoology (AREA)
- Biotechnology (AREA)
- General Engineering & Computer Science (AREA)
- Molecular Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Wood Science & Technology (AREA)
- General Health & Medical Sciences (AREA)
- Biochemistry (AREA)
- Microbiology (AREA)
- Plant Pathology (AREA)
- Biophysics (AREA)
- Physics & Mathematics (AREA)
- Public Health (AREA)
- Veterinary Medicine (AREA)
- Medicinal Chemistry (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Pharmacology & Pharmacy (AREA)
- Animal Behavior & Ethology (AREA)
- Chemical Kinetics & Catalysis (AREA)
- General Chemical & Material Sciences (AREA)
- Virology (AREA)
- Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
- Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
- Medicinal Preparation (AREA)
- Peptides Or Proteins (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Medicines Containing Antibodies Or Antigens For Use As Internal Diagnostic Agents (AREA)
- Medicines Containing Material From Animals Or Micro-Organisms (AREA)
Abstract
本公开涉及包含能够降低和/或抑制KRAS mRNA和/或KRAS蛋白的表达的反义寡核苷酸(ASO)的修饰的细胞外囊泡,例如外泌体。还公开了能够与所述修饰的细胞外囊泡一起使用的ASO。本文还提供了用于使用所述外泌体和所述ASO来治疗和/或预防疾病诸如癌症的方法。
Description
相关申请的交叉引用
本PCT申请要求2019年8月14日提交的美国临时申请第62/886,885号的优先权,所述申请以引用方式并入本文。
通过EFS-WEB以电子方式提交的序列表的引用
在本申请中提交的以电子方式提交的序列表(名称:4000_062PC02_Seqlisting_ST25.txt;大小:432,896字节;以及创建日期:2020年8月14日)的内容以引用方式整体并入本文。
发明领域
本公开涉及包含KRAS拮抗剂的细胞外囊泡(EV),例如外泌体。在一些方面,KRAS拮抗剂包含反义寡核苷酸(ASO)。在本公开的某些方面,细胞外囊泡还包含支架蛋白。
背景技术
外泌体是由每个真核细胞自然产生的小细胞外囊泡。外泌体包含包封内部空间(即,腔)的膜。作为药物递送媒介物,EV(例如,外泌体)作为新的治疗方式在许多治疗领域中提供了优于传统药物递送方法的许多有利方面。特别地,外泌体具有固有的低免疫原性,即使施用于不同的物种也是如此。
反义寡核苷酸已成为体内或体外调控靶基因表达的有力手段。然而,仍需要提高体内ASO的稳定性和靶向性。
因此,新的且更有效的工程化的EV(例如,外泌体),特别是可用于递送可降低与疾病相关的基因(例如,针对癌症的KRAS)的表达的治疗剂的那些,对于更好地实现基于EV的技术的治疗用途和其他应用是必要的。
发明内容
本文公开了一种包含反义寡核苷酸(ASO)的细胞外囊泡(EV),所述反义寡核苷酸(ASO)包含与KRAS G12D转录物(SEQ ID NO:1)的核苷酸5,568至5,606内的核酸序列互补的长度为10至30个核苷酸的连续核苷酸序列。在某些方面,所述连续核苷酸序列与所述KRASG12D转录物内的所述核酸序列至少约80%、至少约85%、至少约90%、至少约95%或约100%互补。
在一些方面,所述EV靶向巨噬细胞。
在一些方面,本文所公开的EV(例如,外泌体)的ASO能够降低人细胞(例如,免疫细胞或肿瘤细胞)中的KRAS G12D蛋白表达,其中所述人细胞表达所述KRAS G12D蛋白。在某些方面,与未暴露于所述ASO的人细胞中的KRAS G12D蛋白表达相比,所述KRAS G12D蛋白表达降低至少约30%、至少约35%、至少约40%、至少约45%、至少约50%、至少约55%、至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%或约100%。
在一些方面,本文所公开的EV(例如,外泌体)的ASO能够降低人细胞(例如,免疫细胞或肿瘤细胞)中的KRAS G12D mRNA的水平,其中所述人细胞表达所述KRAS G12D mRNA。在某些方面,与未暴露于所述ASO的人细胞中的所述KRAS G12D mRNA的水平相比,KRAS G12DmRNA的所述水平降低至少约30%、至少约35%、至少约40%、至少约45%、至少约50%、至少约55%、至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%或约100%。
本文还公开了一种包含反义寡核苷酸(ASO)的细胞外囊泡(EV),所述反义寡核苷酸(ASO)包含与KRAS突变转录物的核酸序列的区域互补的长度为10至30个核苷酸的连续核苷酸序列,其中所述ASO与之互补的所述核酸序列的所述区域与野生型KRAS转录物的对应区域相比包含突变。
在一些方面,所述ASO能够降低人细胞(例如,免疫细胞或肿瘤细胞)中由所述KRAS突变转录物编码的蛋白(“KRAS突变蛋白”)的表达,其中所述人细胞表达所述KRAS突变蛋白。在某些方面,与未暴露于所述ASO的人细胞中的对应表达相比,所述KRAS突变蛋白的所述表达降低至少约30%、至少约35%、至少约40%、至少约45%、至少约50%、至少约55%、至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%或约100%。
在一些方面,所述ASO能够降低人细胞(例如,免疫细胞或肿瘤细胞)中的所述KRAS突变转录物的表达,其中所述人细胞表达所述KRAS突变转录物。在某些方面,与未暴露于所述ASO的人细胞中的对应表达相比,所述KRAS突变转录物的所述表达降低至少约30%、至少约35%、至少约40%、至少约45%、至少约50%、至少约55%、至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%或约100%。
在一些方面,本文所公开的EV的ASO能够降低人细胞(例如,免疫细胞或肿瘤细胞)中的野生型KRAS蛋白表达,其中所述人细胞表达所述野生型KRAS蛋白。在某些方面,与未暴露于所述ASO的人细胞中的野生型KRAS蛋白表达相比,所述野生型KRAS蛋白表达降低至少约30%、至少约35%、至少约40%、至少约45%、至少约50%、至少约55%、至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%或约100%。
在一些方面,本文所公开的EV的ASO能够降低人细胞(例如,免疫细胞或肿瘤细胞)中的野生型KRAS mRNA的水平,其中所述人细胞表达所述野生型KRAS mRNA。在某些方面,与未暴露于所述ASO的人细胞中的所述野生型KRAS mRNA的水平相比,野生型KRAS mRNA的所述水平降低至少约30%、至少约35%、至少约40%、至少约45%、至少约50%、至少约55%、至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%或约100%。
在一些方面,本文所公开的EV的ASO不降低人细胞(例如,免疫细胞或肿瘤细胞)中的野生型KRAS mRNA的水平,其中所述人细胞表达所述野生型KRAS mRNA。
在一些方面,本文所公开的EV(例如,外泌体)的ASO是间隔体、混合体(mixmer)或全聚体(totalmer)。
在一些方面,本文所公开的EV的ASO(例如,外泌体)包含一种或多种核苷类似物。在某些方面,所述核苷类似物中的一者或多者包含2'-O-烷基-RNA;2'-O-甲基RNA(2'-OMe);2'-烷氧基-RNA;2'-O-甲氧基乙基-RNA(2'-MOE);2'-氨基-DNA;2'-氟-RNA;2'-氟-DNA;阿拉伯核酸(ANA);2’-氟-ANA双环核苷类似物;或它们的任何组合。在一些方面,所述核苷类似物中的一者或多者是糖修饰的核苷。在另外的方面,所述糖修饰的核苷是增强亲和力的2'糖修饰的核苷。在一些方面,所述核苷类似物中的一者或多者包含含有双环糖的核苷。在一些方面,所述核苷类似物中的一者或多者包含LNA。在另外的方面,所述核苷类似物中的一者或多者选自由以下各项组成的组:约束乙基核苷(cEt)、2',4'-约束2'-O-甲氧基乙基(cMOE)、α-L-LNA、β-D-LNA、2'-O,4'-C-亚乙基-桥接核酸(ENA)、氨基-LNA、氧基-LNA、硫代-LNA以及它们的任何组合。
在一些方面,本文所公开的EV(例如,外泌体)的ASO包含一个或多个5'-甲基-胞嘧啶核碱基。
在一些方面,本文所公开的EV(例如,外泌体)的ASO包含连续核苷酸序列,其中所述连续核苷酸序列包含与选自图1中的序列的序列互补的核苷酸序列。在某些方面,所述连续核苷酸序列与所述KRAS G12D转录物内的核苷酸序列完全互补。
在一些方面,本文所公开的EV的ASO(例如,外泌体)包含选自SEQ ID NO:4-85的核苷酸序列,任选地具有一个或两个错配。
在一些方面,本文所公开的EV(例如,外泌体)的ASO具有选自LLLDnLLL、LLLLDnLLLL、LLLLLDnLLLLL、LLLMMDnMMLLL、LLLMDnMLLL、LLLLMMDnMMLLLL、LLLLMDnMLLLL、LLLLLLMMDnMMLLLLL、LLLLLLMDnMLLLLL或它们的组合的设计,其中L是核苷类似物(例如,LNA),D是DNA,M是2'-MOE,并且n可以是4与24之间(例如,3与15之间)的任何整数。在一些方面,所述ASO的长度为14至20个核苷酸。
在一些方面,本文所公开的EV的ASO(例如,外泌体)包含连续核苷酸序列,其中所述连续核苷酸序列包含一个或多个修饰的核苷间键联。在某些方面,所述一个或多个修饰的核苷间键联是硫代磷酸酯键联。在一些方面,至少约75%、至少约80%、至少约85%、至少约90%、至少约95%或约100%的核苷间键联是修饰的。在某些方面,所述ASO中的所述核苷间键联中的每一者是硫代磷酸酯键联。
在一些方面,本文所公开的EV(例如,外泌体)还包含锚定部分。在某些方面,本文所公开的EV(例如,外泌体)的ASO连接至所述锚定部分。
在另外的方面,本文所公开的EV(例如,外泌体)还包含外源靶向部分。在某些方面,所述外源靶向部分包括肽、抗体或其抗原结合片段、化学化合物、RNA适体或它们的任何组合。在某些方面,所述外源靶向部分包括肽。在一些方面,所述外源靶向部分包括微蛋白、设计的锚蛋白重复蛋白(darpin)、anticalin、adnectin、适体、肽模拟分子、受体的天然配体、骆驼纳米抗体或它们的任何组合。在某些方面,所述外源靶向部分包括全长抗体、单结构域抗体、只有重链的抗体、单链抗体、只有重链的鲨鱼抗体、scFv、Fv、Fab、Fab'、F(ab')2或它们的任何组合。在某些方面,所述抗体是单链抗体。在某些方面,所述抗体是单结构域抗体。在一些方面,所述单结构域抗体包括纳米抗体、vNAR或两者。
在一些方面,所述外源靶向部分使所述EV靶向肝、心、肺、脑、肾、中枢神经系统、外周神经系统、脑脊髓液(CSF)、肌肉、骨、骨髓、血液、脾脏、淋巴结、胃、食道、膈膜、膀胱、结肠、胰腺、甲状腺、唾液腺、肾上腺、垂体、乳腺、皮肤、卵巢、子宫、前列腺、睾丸、子宫颈或它们的任何组合。在某些方面,所述外源靶向部分使所述EV靶向肿瘤细胞、树突细胞、T细胞、B细胞、巨噬细胞、NK细胞、血小板、神经元、肝细胞、造血干细胞、脂肪细胞或它们的任何组合。
在一些方面,所述外源靶向部分与肿瘤抗原结合。在某些方面,所述肿瘤抗原包括间皮素、CD22、MAGEA、MAGEB、MAGEC、BAGE、GAGE、NY-ESO1、SSX、GRP78、CD33、CD123、WT1或它们的任何组合。在一些方面,所述肿瘤抗原是间皮素。
在一些方面,本文所公开的EV(例如,外泌体)包含将所述外源靶向部分连接至所述细胞外囊泡的支架部分。
在一些方面,所述锚定部分和/或所述支架部分是支架X。在某些方面,所述锚定部分和/或所述支架部分是支架Y。
在一些方面,所述支架X是能够将所述ASO锚定在所述细胞外囊泡的腔表面上和/或所述细胞外囊泡的外表面上的支架蛋白。在某些方面,所述支架X选自由以下各项组成的组:前列腺素F2受体负调节因子(PTGFRN蛋白);basigin(BSG蛋白);免疫球蛋白超家族成员2(IGSF2蛋白);免疫球蛋白超家族成员3(IGSF3蛋白);免疫球蛋白超家族成员8(IGSF8蛋白);整联蛋白β-1(ITGB1蛋白);整联蛋白α-4(ITGA4蛋白);4F2细胞表面抗原重链(SLC3A2蛋白);一类ATP转运蛋白(ATP1A1、ATP1A2、ATP1A3、ATP1A4、ATP1B3、ATP2B1、ATP2B2、ATP2B3、ATP2B4蛋白);它们的功能性片段;以及它们的任何组合。
在一些方面,所述锚定部分和/或所述支架部分是PTGFRN蛋白或其功能性片段。在某些方面,所述锚定部分和/或所述支架部分包含如SEQ ID NO:302所示的氨基酸序列。在一些方面,所述锚定部分和/或所述支架部分包含与SEQ ID NO:301至少50%、至少60%、至少70%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或约100%同一的氨基酸序列。
在一些方面,所述支架Y是能够将所述ASO锚定在所述细胞外囊泡的腔表面上和/或所述细胞外囊泡的外表面上的支架蛋白。在某些方面,所述支架Y选自由以下各项组成的组:富含肉豆蔻酰化丙氨酸的蛋白激酶C底物(MARCKS)蛋白、富含肉豆蔻酰化丙氨酸的蛋白激酶C底物样1(MARCKSL1蛋白)、脑酸可溶性蛋白1(BASP1蛋白)、它们的功能性片段,以及它们的任何组合。在一些方面,所述支架Y是BASP1蛋白或其功能性片段。
在一些方面,所述支架Y包含N末端结构域(ND)和效应结构域(ED),其中所述ND和/或所述ED与所述细胞外囊泡的所述腔表面缔合。在某些方面,所述ND通过肉豆蔻酰化与所述EV的所述腔表面缔合。在某些方面,所述ED通过离子相互作用与所述EV的所述腔表面缔合。
在一些方面,所述ED包含(i)碱性氨基酸或(ii)按顺序的两个或更多个碱性氨基酸,其中所述碱性氨基酸选自由以下各项组成的组:Lys、Arg、His以及它们的任何组合。在某些方面,所述碱性氨基酸是(Lys)n,其中n是1与10之间的整数。在一些方面,所述ED包含Lys(K)、KK、KKK、KKKK(SEQ ID NO:405)、KKKKK(SEQ ID NO:406)、Arg(R)、RR、RRR、RRRR(SEQID NO:407);RRRRR(SEQ ID NO:408)、KR、RK、KKR、KRK、RKK、KRR、RRK、(K/R)(K/R)(K/R)(K/R)(SEQ ID NO:409)、(K/R)(K/R)(K/R)(K/R)(K/R)(SEQ ID NO:410)或它们的任何组合。
在一些方面,所述ND包含如G:X2:X3:X4:X5:X6所示的氨基酸序列,其中G代表Gly;其中“:”代表肽键,其中所述X2至所述X6中的每一者独立地是氨基酸,并且其中所述X6包含碱性氨基酸。在某些方面,(i)所述X2选自由Pro、Gly、Ala和Ser组成的组;(ii)所述X4选自由Pro、Gly、Ala、Ser、Val、Ile、Leu、Phe、Trp、Tyr、Gln和Met组成的组;(iii)所述X5选自由Pro、Gly、Ala和Ser组成的组;(iv)所述X6选自由Lys、Arg和His组成的组;或(v)(i)-(iv)的任何组合。
在一些方面,所述ND包含G:X2:X3:X4:X5:X6的氨基酸序列,其中(i)G代表Gly;(ii)“:”代表肽键;(iii)所述X2是选自由Pro、Gly、Ala和Ser组成的组的氨基酸;(iv)所述X3是氨基酸;(v)所述X4是选自由Pro、Gly、Ala、Ser、Val、Ile、Leu、Phe、Trp、Tyr、Gln和Met组成的组的氨基酸;(vi)所述X5是选自由Pro、Gly、Ala和Ser组成的组的氨基酸;并且(vii)所述X6是选自由Lys、Arg和His组成的组的氨基酸。在某些方面,所述X3选自由Asn、Gln、Ser、Thr、Asp、Glu、Lys、His和Arg组成的组。
在一些方面,所述ND和所述ED通过接头连接。在某些方面,所述接头包含一个或多个氨基酸。
在一些方面,所述ND包含选自由以下各项组成的组的氨基酸序列:GGKLSKK(SEQID NO:411)、(ii)GAKLSKK(SEQ ID NO:412)、(iii)GGKQSKK(SEQ ID NO:413)、(iv)GGKLAKK(SEQ ID NO:414)、(v)GGKLSK(SEQ ID NO:415)以及(vi)它们的任何组合。在某些方面,所述ND包含选自由以下各项组成的组的氨基酸序列:(i)GGKLSKKK(SEQ ID NO:438)、(ii)GGKLSKKS(SEQ ID NO:439)、(iii)GAKLSKKK(SEQ ID NO:440)、(iv)GAKLSKKS(SEQ ID NO:441)、(v)GGKQSKKK(SEQ ID NO:442)、(vi)GGKQSKKS(SEQ ID NO:443)、(vii)GGKLAKKK(SEQID NO:444)、(viii)GGKLAKKS(SEQ ID NO:445)以及(ix)它们的任何组合。在另外的方面,所述ND包含氨基酸序列GGKLSKK(SEQ ID NO:411)。
在一些方面,本文所公开的EV(例如,外泌体)的支架Y的长度为至少约8个、至少约9个、至少约10个、至少约11个、至少约12个、至少约13个、至少约14个、至少约15个、至少约16个、至少约17个、至少约18个、至少约19个、至少约20个、至少约21个、至少约22个、至少约23个、至少约24个、至少约25个、至少约30个、至少约35个、至少约40个、至少约45个、至少约50个、至少约55个、至少约60个、至少约65个、至少约70个、至少约75个、至少约80个、至少约85个、至少约90个、至少约95个、至少约100个、至少约105个、至少约110个、至少约120个、至少约130个、至少约140个、至少约150个、至少约160个、至少约170个、至少约180个、至少约190个或至少约200个氨基酸。
在一些方面,所述支架Y包含(i)GGKLSKKKKGYNVN(SEQ ID NO:446)、(ii)GAKLSKKKKGYNVN(SEQ ID NO:447)、(iii)GGKQSKKKKGYNVN(SEQ ID NO:448)、(iv)GGKLAKKKKGYNVN(SEQ ID NO:449)、(v)GGKLSKKKKGYSGG(SEQ ID NO:450)、(vi)GGKLSKKKKGSGGS(SEQ ID NO:451)、(vii)GGKLSKKKKSGGSG(SEQ ID NO:452)、(viii)GGKLSKKKSGGSGG(SEQ ID NO:453)、(ix)GGKLSKKSGGSGGS(SEQ ID NO:454)、(x)GGKLSKSGGSGGSV(SEQ ID NO:455)或(xi)GAKKSKKRFSFKKS(SEQ ID NO:456)。在另外的方面,所述支架Y由(i)GGKLSKKKKGYNVN(SEQ ID NO:446)、(ii)GAKLSKKKKGYNVN(SEQ ID NO:447)、(iii)GGKQSKKKKGYNVN(SEQ ID NO:448)、(iv)GGKLAKKKKGYNVN(SEQ ID NO:449)、(v)GGKLSKKKKGYSGG(SEQ ID NO:450)、(vi)GGKLSKKKKGSGGS(SEQ ID NO:451)、(vii)GGKLSKKKKSGGSG(SEQ ID NO:452)、(viii)GGKLSKKKSGGSGG(SEQ ID NO:453)、(ix)GGKLSKKSGGSGGS(SEQ ID NO:454)、(x)GGKLSKSGGSGGSV(SEQ ID NO:455)或(xi)GAKKSKKRFSFKKS(SEQ ID NO:456)组成。
在一些方面,本文所公开的EV(例如,外泌体)的支架Y在N末端不包含Met。在某些方面,所述支架Y在所述支架蛋白的N末端包含肉豆蔻酰化氨基酸残基。在另外的方面,所述支架Y的N末端的氨基酸残基是Gly。
在一些方面,本文所公开的EV(例如,外泌体)的ASO连接至所述细胞外囊泡的所述外表面上的所述锚定部分和/或所述支架部分。在某些方面,所述ASO连接至EV的所述腔表面上的所述锚定部分和/或所述支架部分。
在一些方面,本文所公开的EV的锚定部分(例如,外泌体)包括甾醇、GM1、脂质、维生素、小分子、肽或它们的组合。在某些方面,所述锚定部分包括胆固醇。在一些方面,所述锚定部分包括磷脂、溶血磷脂、脂肪酸、维生素(例如,维生素D和/或维生素E)或它们的任何组合。
在一些方面,本文所公开的EV(例如,外泌体)的ASO通过接头连接至所述锚定部分和/或所述支架部分。在一些方面,所述ASO通过接头连接至所述细胞外囊泡。在某些方面,所述接头是多肽。在其他方面,所述接头是非多肽部分。在另外的方面,所述接头包括乙二醇。在某些方面,所述接头包括HEG、TEG、PEG或它们的任何组合。在又另外的方面,所述接头包括丙烯酸亚磷酰胺(例如,ACRYDITETM)、腺苷酸化、叠氮化物(NHS酯)、地高辛(NHS酯)、胆固醇-TEG、I-LINKERTM、氨基修饰剂(例如,氨基修饰剂C6、氨基修饰剂C12、氨基修饰剂C6 dT或Uni-LinkTM氨基修饰剂)、炔烃、5'己炔基、5-辛二炔基dU、生物素化(例如,生物素、生物素(叠氮化物)、生物素dT、生物素-TEG、双生物素、PC生物素或脱硫生物素)、硫醇修饰(硫醇修饰剂C3 S-S、二硫醇或硫醇修饰剂C6 S-S)或它们的任何组合。在一些方面,所述接头是可切割的接头。在某些方面,所述接头包含(i)马来酰亚胺部分和(ii)缬氨酸-丙氨酸-对氨基苄基氨基甲酸酯或缬氨酸-瓜氨酸-对氨基苄基氨基甲酸酯。在一些方面,所述接头包含缬氨酸-丙氨酸-对氨基苄基氨基甲酸酯或缬氨酸-瓜氨酸-对氨基苄基氨基甲酸酯。
在一些方面,所述细胞外囊泡是外泌体。
本文还公开了一种反义寡核苷酸(ASO),所述反义寡核苷酸(ASO)包含与KRASG12D转录物(SEQ ID NO:1)的核苷酸5,568至5,606内的核酸序列互补的长度为10至30个核苷酸的连续核苷酸序列。在一些方面,所述连续核苷酸序列与所述KRAS G12D转录物内的所述核酸序列至少约80%、至少约85%、至少约90%、至少约95%或约100%互补。
在一些方面,本文所公开的ASO能够降低人细胞(例如,免疫细胞或肿瘤细胞)中的KRAS G12D蛋白表达,其中所述人细胞表达所述KRAS G12D蛋白。在某些方面,与未暴露于所述ASO的人细胞中的KRAS G12D蛋白表达相比,所述KRAS G12D蛋白表达降低至少约30%、至少约35%、至少约40%、至少约45%、至少约50%、至少约55%、至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%或约100%。
在一些方面,所述ASO能够降低人细胞(例如,免疫细胞或肿瘤细胞)中的KRASG12D mRNA的水平,其中所述人细胞表达所述KRAS G12D mRNA。在某些方面,与未暴露于所述ASO的人细胞中的所述KRAS G12D mRNA的水平相比,KRAS G12D mRNA的所述水平降低至少约30%、至少约35%、至少约40%、至少约45%、至少约50%、至少约55%、至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%或约100%。
在一些方面,所述ASO能够降低人细胞(例如,免疫细胞或肿瘤细胞)中的野生型KRAS蛋白表达,其中所述人细胞表达所述野生型KRAS蛋白。在某些方面,与未暴露于所述ASO的人细胞中的野生型KRAS蛋白表达相比,所述野生型KRAS蛋白表达降低至少约30%、至少约35%、至少约40%、至少约45%、至少约50%、至少约55%、至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%或约100%。
在一些方面,所述ASO能够降低人细胞(例如,免疫细胞或肿瘤细胞)中的野生型KRAS mRNA的水平,其中所述人细胞表达所述野生型KRAS mRNA。在某些方面,与未暴露于所述ASO的人细胞中的所述野生型KRAS mRNA的水平相比,野生型KRAS mRNA的所述水平降低至少约30%、至少约35%、至少约40%、至少约45%、至少约50%、至少约55%、至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%或约100%。
在一些方面,所述ASO不降低人细胞(例如,免疫细胞或肿瘤细胞)中的野生型KRASmRNA的水平,其中所述人细胞表达所述野生型KRAS mRNA。
在一些方面,所述ASO是间隔体、混合体或全聚体。
在一些方面,所述ASO包含一种或多种核苷类似物。在某些方面,所述核苷类似物中的一者或多者包含2'-O-烷基-RNA;2'-O-甲基RNA(2'-OMe);2'-烷氧基-RNA;2'-O-甲氧基乙基-RNA(2'-MOE);2'-氨基-DNA;2'-氟-RNA;2'-氟-DNA;阿拉伯核酸(ANA);2’-氟-ANA双环核苷类似物(LNA);或它们的任何组合。在某些方面,所述核苷类似物中的一者或多者是糖修饰的核苷。在另外的方面,所述糖修饰的核苷是增强亲和力的2'糖修饰的核苷。在一些方面,所述核苷类似物中的一者或多者包含含有双环糖的核苷。在某些方面,所述核苷类似物中的一者或多者包含LNA。在另外的方面,所述核苷类似物中的一者或多者选自由以下各项组成的组:约束乙基核苷(cEt)、2',4'-约束2'-O-甲氧基乙基(cMOE)、α-L-LNA、β-D-LNA、2'-O,4'-C-亚乙基-桥接核酸(ENA)、氨基-LNA、氧基-LNA、硫代-LNA以及它们的任何组合。
在一些方面,所述ASO包含一个或多个5’-甲基-胞嘧啶核碱基。在一些方面,所述ASO包含SEQ ID NO:4至SEQ ID NO:85中的任一者。在某些方面,所述ASO具有选自LLLDnLLL、LLLLDnLLLL、LLLLLDnLLLLL、LLLMMDnMMLLL、LLLMDnMLLL、LLLLMMDnMMLLLL、LLLLMDnMLLLL、LLLLLLMMDnMMLLLLL、LLLLLLMDnMLLLLL或它们的组合的设计,其中L是核苷类似物(例如,LNA),D是DNA,M是2'-MOE,并且n可以是4与24之间(例如,3与15之间)的任何整数。在一些方面,所述ASO的长度为14至20个核苷酸。
在一些方面,本文所公开的ASO的连续核苷酸序列包含一个或多个修饰的核苷间键联。在某些方面,所述一个或多个修饰的核苷间键联是硫代磷酸酯键联。在另外的方面,至少75%、至少80%、至少85%、至少90%、至少95%或100%的核苷间键联是修饰的。在一些方面,所述ASO中的所述核苷间键联中的每一者是硫代磷酸酯键联。
本公开还提供了包含本文所公开的任何ASO的缀合物,其中所述ASO与至少一个非核苷酸或非多核苷酸部分共价连接。在一些方面,所述非核苷酸或非多核苷酸部分包含蛋白质、脂肪酸链、糖残基、糖蛋白、聚合物或它们的任何组合。
本文提供了包含本文所公开的ASO或缀合物中任一者的细胞外囊泡。
还提供了一种药物组合物,所述药物组合物包含本文所公开的细胞外囊泡(例如,外泌体)、ASO或缀合物,以及药学上可接受的稀释剂、载体、盐或佐剂。在某些方面,所述药学上可接受的盐包括钠盐、钾盐、铵盐或它们的任何组合。
在一些方面,所述药物组合物还包含至少一种另外的治疗剂。在某些方面,所述另外的治疗剂是KRAS G12D拮抗剂。在一些方面,所述KRAS G12D拮抗剂是化学化合物、siRNA、shRNA、反义寡核苷酸、蛋白质或它们的任何组合。在另外的方面,所述KRAS G12D拮抗剂是抗KRAS G12D抗体或其片段。
本文公开了一种药盒,所述药盒包括本文所公开的细胞外囊泡、ASO、缀合物或药物组合物,以及使用说明书。还公开了一种诊断试剂盒,所述诊断试剂盒包括本文所公开的细胞外囊泡、ASO、缀合物或药物组合物,以及使用说明书。
本公开提供了一种抑制或降低细胞中的KRAS G12D蛋白表达的方法,所述方法包括将本文所公开的细胞外囊泡、ASO、缀合物或药物组合物施用至表达KRAS G12D蛋白的细胞,其中所述细胞中的所述KRAS G12D蛋白表达在所述施用后被抑制或降低。
在一些方面,在所述施用后所述ASO抑制或降低所述细胞中的KRAS G12D mRNA表达。在某些方面,与未暴露于所述ASO的细胞中的KRAS G12D mRNA表达相比,在所述施用后所述KRAS G12D mRNA表达降低至少约20%、至少约30%、至少约40%、至少约50%、至少约60%、至少约70%、至少约80%、至少约90%或约100%。
在一些方面,与未暴露于所述ASO的细胞中的KRAS G12D蛋白表达相比,在所述施用后所述KRAS G12D蛋白表达降低至少约60%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或约100%。
本文公开了一种治疗有需要的受试者的癌症的方法,所述方法包括向所述受试者施用有效量的本文所公开的细胞外囊泡、ASO、缀合物或药物组合物。本公开还提供了本文所公开的细胞外囊泡、ASO、缀合物或药物组合物在制造用于治疗有需要的受试者的癌症的药物中的用途。本公开还提供了用于治疗有需要的受试者的癌症的细胞外囊泡、ASO、缀合物或药物组合物。
在一些方面,静脉内、瘤内、心内、口服、肠胃外、鞘内、脑室内、经肺、局部或心室内施用本文所公开的细胞外囊泡、ASO、缀合物或药物组合物。在一些方面,可用本文所公开的细胞外囊泡、ASO、缀合物或药物组合物治疗的癌症包括结肠直肠癌、肺癌(例如,非小细胞肺癌(NSCLC))、胰腺癌(例如,胰腺导管腺癌)、白血病、子宫癌、卵巢癌、膀胱癌、胆管癌、胃癌(gastric cancer)、胃癌(stomach cancer)、睾丸癌、食道癌、胆管癌、宫颈癌、急性髓性白血病(AML)、弥漫性大B细胞淋巴瘤(DLBC)、肉瘤、黑素瘤、胶质瘤(例如,低级别胶质瘤,例如胶质母细胞瘤)、间皮瘤、肝癌、乳腺癌(例如,浸润性乳腺癌)、肾癌(例如,乳头状肾细胞癌(pRCC)和嫌色性肾细胞癌)、头颈癌、前列腺癌、腺样囊性癌(ACC)、胸腺癌、甲状腺癌、透明细胞肾细胞癌(CCRCC)、神经内分泌赘瘤(例如,嗜铬细胞瘤/副神经节瘤)、葡萄膜黑素瘤或它们的任何组合。
本公开还提供了一种治疗有需要的受试者的纤维化的方法,所述方法包括施用有效量的本文所公开的细胞外囊泡、ASO、缀合物或药物组合物中的任一者。本文还公开了本文所公开的细胞外囊泡、ASO、缀合物或药物组合物中的任一者在制造用于治疗有需要的受试者的纤维化的药物中的用途。还提供了用于治疗有需要的受试者的纤维化的本文所公开的细胞外囊泡、ASO、缀合物或药物组合物中的任一者。
在一些方面,本文所公开的治疗方法、用途或使用的组合物包括向受试者静脉内、瘤内、心内、口服、肠胃外、鞘内、脑室内、经肺、局部或心室内施用细胞外囊泡、ASO、缀合物或药物组合物。
在一些方面,可用本公开治疗的纤维化包括肝纤维化(NASH)、肝硬化、肺纤维化、囊性纤维化、慢性溃疡性结肠炎/IBD、膀胱纤维化、肾纤维化、CAPS(穆-韦二氏综合征,Muckle-Wells syndrome)、心房纤维化、心内膜心肌纤维化、陈旧性心肌梗死、胶质瘢痕、动脉僵硬、关节纤维化、克罗恩氏病、迪皮特伦氏挛缩(Dupuytren's contracture)、瘢痕疙瘩纤维化、纵隔纤维化、骨髓纤维化、佩罗尼氏病(Peyronie's disease)、肾原性系统性纤维化、进行性大块纤维化、腹膜后纤维化、硬皮病/系统性硬化、粘连性关节囊炎、1型神经纤维瘤病(NF1)或它们的任何组合。
附图说明
图1提供了列出靶向KRAS突变转录物的示例性ASO的表。该表包括以下信息(从左到右):(i)仅为ASO序列指定的SEQ ID号(第1列),(ii)KRAS突变基因组序列(SEQ ID NO:1)上的靶起始位置和结束位置(分别为第2列和第3列),(iii)KRAS突变mRNA序列(SEQ ID NO:3)上的靶起始位置和结束位置(分别为第4列和第5列),(iv)没有任何特定设计或化学结构的ASO序列(第6列),和(v)具有化学结构的ASO序列。ASO是从5'到3'(最后一列)。化学结构式中的符号如下:Nb意指LNA;dN意指DNA;5MdC意指5-甲基-dC;Nm意指MOE;并且s意指硫代磷酸酯。
图2A、图2B、图2C、图2D、图2E、图2F、图2G、图2H、图2I、图2J、图2K和图2L提供了如使用Hepa1-6报告基因测定测量的野生型(圆形)和G12D突变(方形)KRAS mRNA转录物的ASO敲减的抑制曲线。测试的ASO包括:(i)ASO-0007(图2A)、(ii)ASO-0008(图2B)、(iii)ASO-0009(图2C)、(iv)ASO-0021(图2D)、(v)ASO-0022(图2E)、(vi)ASO-0023(图2F)、(vii)ASO-0036(图2G)、(viii)ASO-0037(图2H)、(ix)ASO-0038(图2I)、(x)ASO-0039(图2J)、(xi)ASO-0059(图2K)和(xii)ASO-0071(图2L)。每个ASO的ASO敲减显示为用含有野生型或G12D突变序列的双glo报告基因质粒转染的经ASO处理的小鼠Hepa1-6细胞中的KRAS mRNA表达百分比。显示KRAS mRNA表达百分比针对用对照/模拟ASO处理的对应Hepa1-6细胞中野生型和G12D突变KRAS mRNA转录物的敲减归一化。
图3提供了显示如使用Hepa1-6报告基因测定测量的本公开所述的不同ASO的KRASmRNA敲减效率的表。敲减效率显示为在用不同ASO转染的细胞中观察到的野生型或G12DKRAS mRNA表达的量。ASO的选择性还通过从野生型KRAS mRNA表达中减去G12D KRAS mRNA表达水平来提供(参见标记为“KRAS野生型减KRAS G12D”的列)。
图4A和图4B提供了在用本文所公开的不同ASO处理48小时后胰腺癌细胞系中的KRAS mRNA表达。测试的ASO显示在图表的右侧。在图4A中,在对于G12D突变是杂合的Panc-1细胞中评估了ASO抑制G12D KRAS mRNA表达的能力。在图4B中,在不包含任何KRAS突变的BxPC-3细胞中评估了ASO抑制野生型KRAS mRNA表达的能力。在图4A和4B中,KRAS mRNA表达使用PCR测定进行测量,并显示为针对RPS13归一化。
图5A、图5B和图5C显示了在三种不同的胰腺癌细胞系中两种示例性ASO(即,ASO-0082和ASO-0009)抑制KRAS mRNA表达的能力:BxPC-3(无KRAS突变)(实心圆圈)、AsPC-1(对于G12D突变是纯合的)(三角形)和Panc-1(对于G12D突变是杂合的)(空心圆圈)。用8种不同浓度的ASO处理细胞,并在ASO转染48小时后使用qPCR测定测量KRAS mRNA表达。图5A提供了ASO-0082的结果。图5B提供了ASO-0009的结果。图5C提供了不同细胞系中ASO的IC50值。
图6A和图6B提供了在用不同浓度的本文所公开的两种示例性ASO(即,ASO-0082(浅灰色条)和ASO-0009(黑色条))转染的两种不同的猴肾细胞系(即,分别为FrHK-4和Cos-7)中的KRAS mRNA表达。经加扰对照ASO转染的细胞用作对照(深灰色条,即,每个图中的最后两个条)。KRAS mRNA表达在转染后48小时使用qPCR测定进行测量,并显示为针对GADPH和未处理细胞归一化。
图7A和图7B提供了可用于缀合本文所公开的ASO的两个示例性胆固醇部分的图解。图7A提供了Chol2的结构。图7B提供了Chol4的结构。
图8A和图8B显示了本文所公开的示例性带胆固醇标签的ASO分别对Panc-1(对于G12D突变是杂合的)和HEP3B(无KRAS突变)胰腺癌细胞生长的影响。图8A顶部的三行和图8B顶部的两行显示了用不同浓度(即,0nM、111nM、333nM或1,000nM)的带胆固醇标签的ASO-0009处理的细胞的集落形成。图8A底部的三行和图8B底部的两行显示了用带胆固醇标签的加扰对照处理的细胞的结果。
图9A和图9B显示了在用包含以下胆固醇缀合的ASO之一的表面工程化EV(例如,外泌体)处理的Panc-1(对于G12D突变是杂合的)胰腺癌细胞中的KRAS G12D mRNA表达:(i)ASO-0009,(ii)ASO-0082,或(iii)加扰控制ASO。KRAS G12D mRNA表达显示为针对未处理细胞和RPS13归一化。图9A显示了使用包含以下浓度之一的ASO-0009的EV的结果:6,700nM;2,200nM;700nM;200nM;和80nM(前五个条,从左到右)。在将ASO装载到EV上后测量EV中的ASO的量。包含加扰对照ASO(“scr”)和最高ASO浓度(即,6,700nM)的游离ASO-0009(即,不是EV的一部分)(“游离”)的EV用作对照。图9B显示了使用包含以下浓度之一的ASO-0082的EV的结果:4,100nM;1,367nM;456nM;152nM;和51nM(前五个条,从左到右)。在将ASO装载到EV上后测量EV中的ASO的量。包含加扰对照ASO(“scr”)和最高ASO浓度(即,4,100nM)的游离ASO-0082(“游离”)的EV用作对照。
图10显示了在用包含以下胆固醇缀合的ASO之一的表面工程化EV(例如,外泌体)处理的Panc8.13(对于G12D突变是杂合的)胰腺癌细胞中的KRAS G12D mRNA表达:(i)ASO-0009,(ii)ASO-0082,或(iii)加扰控制ASO。装载后,ASO以下列浓度之一存在于EV中:1,600nM;533.3nM;177.8nM;59.3nM;和19.8nM。作为对照,使用游离ASO-0009、游离ASO-0082和游离加扰对照ASO(均为1,600nM)。KRAS G12D mRNA表达显示为针对未处理细胞和RPS13归一化。
图11显示了在用包含以下胆固醇缀合的ASO之一的表面工程化EV(例如,外泌体)处理的AsPC-1(对于G12D突变是杂合的)胰腺癌细胞中的KRAS G12D mRNA表达:(i)ASO-0009,(ii)ASO-0082,或(iii)加扰控制ASO。装载后,ASO以下列浓度之一存在于EV中:500nM、166.7nM、55.6nM、18.5nM和6.2nM。游离ASO-0009、游离ASO-0082和游离加扰对照ASO用作对照(浓度均为500nM)。
图12显示了在用包含以下胆固醇缀合的ASO之一的表面工程化EV(例如,外泌体)处理的AsPC-1细胞的活力:(i)ASO-0009,(ii)ASO-0082,或(iii)加扰控制ASO。EV包含以下浓度之一的KRAS ASO:3,000nM、600nM、120nM、24nM和1nM。游离ASO-0082(白色条)和游离ASO-0009(实心灰色条)用作对照(浓度均为3,000nM)。活力显示为与未处理细胞或用空EV(即,不包含ASO)处理的细胞中的对应值相比,在不同处理组中观察到的细胞的相对数量(如通过使用CTG测量ATP水平确定)。
图13A和图13B显示了本文所公开的EV(例如,外泌体)分别对以下两种不同胰腺癌细胞系中的pERK表达的影响:Panc8.13(对于G12D突变是纯合的)和Panc-1(对于G12D突变是杂合的)。胰腺癌细胞用包含以下胆固醇缀合的ASO之一的表面工程化EV(例如,外泌体)处理:(i)ASO-0009,(ii)ASO-0082,或(iii)加扰控制ASO。EV中存在的ASO的浓度沿x轴显示。空EV(即,不包含ASO的表面工程化EV;“仅PrX”)(1,500nM或500nM)和未处理的细胞用作对照。pERK表达显示为针对Cell-Titer-Glo2.0读数和未处理细胞归一化。
图14显示了本文所公开的ASO抑制AsPC-1(对于G12D突变是纯合的)(左图)和Panc-1(对于G12D突变是杂合的)(右图)胰腺癌细胞中pERK表达的能力。胰腺癌细胞用以下胆固醇结合的ASO之一处理:(i)ASO-0009(“0009”),(ii)ASO-0082(“0082”),或(iii)加扰对照ASO(“scrm”)。ASO以下列浓度使用:50nM、100nM和200nM。使用蛋白质印迹在转染后72小时测量pERK表达。为进行比较,还同时测量了纽蛋白、KRAS G12D蛋白和总ERK的表达。
图15A、图15B、图15C和图15D是各种CD47-支架X融合构建体的示意图。图15A显示了包含野生型CD47(具有C15S取代)的细胞外结构域的构建体,所述结构域融合至带flag标签的(1083和1084)或不带flag标签的(1085和1086)全长支架X(1083和1086)或截短的支架X(1084和1085)。图15B显示了包含Velcro-CD47的细胞外结构域的构建体,所述结构域融合至带flag标签的(1087和1088)或不带flag标签的(1089和1090)全长支架X(1087和1090)或截短的支架X(1088和1089)。图15C显示了构建体,其中野生型CD47(具有C15S取代;1127和1128)或Velcro-CD47(1129和1130)的第一跨膜结构域用支架X的片段替代,所述片段包括支架X的跨膜结构域和第一细胞外基序。图15D显示了包含最小“自身”肽(GNYTCEVTELTREGETIIELK;SEQ ID NO:600)的各种构建体,所述肽融合至带flag标签的(1158和1159)或不带flag标签的(1160和1161)全长支架X(1158和1161)或截短的支架X(1159和1160)。
图16显示了可在修饰的外泌体(连同本文所述的靶向KRAS转录物的ASO)表面上表达的示例性小鼠CD47-支架X融合构建体的表达。所述构建体包含融合至带flag标签的(1923和1925)或不带flag标签的(1924和1922)全长支架X(1923和1922)或截短的支架X(1925和1924)的野生型鼠CD47(具有C15S取代)的细胞外结构域。
图17A显示了示例性细胞外囊泡(例如,外泌体)的示意图,所述细胞外囊泡使用可与任何其他部分(例如,生物活性部分)一起递送的神经营养因子-支架X融合构建体靶向Trks。神经营养因子以同型二聚体的形式与Trk受体结合,并允许EV靶向感觉神经元。
图17B显示了示例性细胞外囊泡(例如,外泌体)的示意图,所述细胞外囊泡具有在EV外表面上的(i)向神经性以及(ii)抗吞噬信号,例如CD47和/或CD24,它们可与(iii)靶向KRAS转录物的ASO一起递送。
具体实施方式
本公开的某些方面涉及包含靶向KRAS G12D突变体的反义寡核苷酸的细胞外囊泡(EV),例如外泌体。在一些方面,ASO包含与KRAS G12D突变转录物内的核酸序列互补的长度为10至30个核苷酸的连续核苷酸序列。
I.定义
为了更容易理解本说明,首先定义某些术语。在整个具体实施方式中阐述了另外的定义。
需要注意的是,术语“一个(a或an)”实体是指一个或多个该实体;例如,“核苷酸序列”被理解为表示一个或多个核苷酸序列。因此,术语“一个(a或an)”、“一个或多个”和“至少一个”在本文中可以互换使用。
此外,本文使用的“和/或”应被视为具体地公开两个指定特征或组分中的每个与或不与另一个一起存在。因此,如在诸如“A和/或B”的短语中使用的术语“和/或”旨在包括“A和B”、“A或B”、“A”(单独的)和“B”(单独的)。同样,如在诸如“A、B和/或C”的短语中使用术语“和/或”旨在包括以下方面的每一方面:A、B和C;A、B或C;A或C;A或B;B或C;A和C;A和B;B和C;A(单独的);B(单独的);和C(单独的)。
应当理解,本文无论在何处用措辞“包含/包括(comprising)”来描述方面,都还提供了以“由......组成”和/或“基本上由......组成”描述的其他类似方面。
除非另有定义,否则本文使用的所有技术和科学术语具有与本公开相关的领域的普通技术人员通常理解的相同的含义。例如,the Concise Dictionary of Biomedicineand Molecular Biology,Juo,Pei-Show,第2版,2002,CRCPress;The Dictionary of Celland Molecular Biology,第3版,1999,Academic Press;和the Oxford Dictionary OfBiochemistry And Molecular Biology,Revised,2000,Oxford University Press为技术人员提供了本公开中使用的许多术语的通用词典。
单位、前缀和符号以它们的国际单位制(Système International de Unites)(SI)认可的形式表示。数值范围包括限定范围的数值。除非另有说明,否则核苷酸序列从左至右以5’至3’方向书写。氨基酸序列从左至右以氨基至羧基的方向书写。本文提供的标题不限制本公开的各个方面,这些方面可通过整体参考本说明书而获知。因此,如下直接定义的术语通过整体参考说明书被更详细地定义。
术语“约”在本文中用于意指大致近似地、左右或在......范围内。当术语“约”与数值范围结合使用时,它通过扩展所示的数值的上限和下限来修饰该范围。一般而言,术语“约”可以通过例如10%、之上或之下(更高或更低)的方差来修饰大于和小于所述值的数值。例如,如果陈述“在施用ASO之后ASO使细胞中KRAS蛋白的表达降低至少约60%”,则意味着KRAS蛋白的表达降低了50%至70%。
术语“反义寡核苷酸”(ASO)是指通过核苷酸间键联相互共价连接的核苷如天然存在的核苷或其修饰形式的寡聚物或聚合物。可用于本公开的ASO包括至少一种非天然存在的核苷。ASO与靶核酸至少部分互补,使得ASO与靶核酸序列杂交。
术语“核酸”或“核苷酸”旨在涵盖多个核酸。在一些方面,术语“核酸”或“核苷酸”是指体内或体外的靶序列,例如前体mRNA、mRNA或DNA。当该术语指靶序列中的核酸或核苷酸时,核酸或核苷酸可以是细胞内天然存在的序列。在其他方面,“核酸”或“核苷酸”是指本公开的ASO中的序列。当该术语指ASO中的序列时,核酸或核苷酸可以是非天然存在的,即化学合成的、酶促产生的、重组产生的或它们的任何组合。在一些方面,ASO中的核酸或核苷酸是合成产生或重组产生的,而不是天然存在的序列或其片段。在一些方面,ASO中的核酸或核苷酸不是天然存在的,因为它们含有至少一种非自然中天然存在的核苷类似物。
如本文所用,术语“核苷酸”是指包含糖部分、碱基部分和共价连接基团(键联基团)如磷酸酯或硫代磷酸酯核苷酸间键联基团的糖苷,并且涵盖天然存在的核苷酸(如DNA或RNA)和包含修饰的糖部分和/或碱基部分的非天然存在的核苷酸(它们在本文中也称为“核苷酸类似物”)。本文中,单个核苷酸可称为单体或单元。在某些方面,术语“核苷酸类似物”是指具有修饰的糖部分的核苷酸。具有修饰的糖部分(例如,LNA)的核苷酸的非限制性实例在本文别处公开。在其他方面,术语“核苷酸类似物”是指具有修饰的核碱基部分的核苷酸。具有修饰的核碱基部分的核苷酸包括但不限于5-甲基-胞嘧啶、异胞嘧啶、假异胞嘧啶、5-溴尿嘧啶、5-丙炔基尿嘧啶、6-氨基嘌呤、2-氨基嘌呤、肌苷、二氨基嘌呤和2-氯-6-氨基嘌呤。在一些方面,术语“核苷酸”、“单元”和“单体”可互换使用。应当认识到,当提及核苷酸或单体的序列时,所指的是碱基,如A、T、G、C或U及其类似物的序列。
如本文所用,术语“核苷”用于指包含糖部分和碱基部分的糖苷,因此可用于指通过ASO的核苷酸之间的核苷酸间键联共价连接的核苷酸单元。在生物技术领域,术语“核苷酸”通常用于指代核酸单体或单元。在ASO的上下文中,术语“核苷酸”可指单独的碱基,即,包含胞嘧啶(DNA和RNA)、鸟嘌呤(DNA和RNA)、腺嘌呤(DNA和RNA)、胸腺嘧啶(DNA)和尿嘧啶(RNA)的核碱基序列,其中糖骨架和核苷酸间键联的存在是隐含的。同样,特别是在一个或多个核苷酸间键联基团被修饰的寡核苷酸的情况下,术语“核苷酸”可指“核苷”。例如,可使用术语“核苷酸”,即使是在指明核苷之间的键联的存在或性质时。
如本文所用,术语“核苷酸长度”是指给定序列中核苷酸(单体)的总数目。例如,tcagctccaactac(SEQ ID NO:4)的序列具有14个核苷酸;因此该序列的核苷酸长度为14。因此,术语“核苷酸长度”在本文中可与“核苷酸数目”互换使用。
如本领域普通技术人员将认识到的,寡核苷酸的5'末端核苷酸不包含5'核苷酸间键联基团,但是它可包含5'末端基团。
本文所述的化合物可包含几个不对称中心并且可以光学纯的对映异构体、对映异构体混合物(例如像外消旋体)、非对映异构体混合物、非对映异构外消旋体或非对映异构外消旋体混合物的形式存在。在一些方面,不对称中心可以是不对称碳原子。术语“不对称碳原子”意指具有四个不同取代基的碳原子。根据Cahn-Ingold-Prelog公约,不对称碳原子可为“R”或“S”构型。
如本文所用,术语“双环糖部分”是指包含4至7元环的修饰的糖部分,所述糖部分包含连接4至7元环的两个原子以形成第二个环,从而产生双环结构的桥。在一些方面,桥连接核苷的核糖环的C2'和C4'(即,2'-4'桥),如在LNA核苷中观察到的。
如本文所用,“编码区”或“编码序列”是多核苷酸的一部分,其由可翻译成氨基酸的密码子组成。虽然“终止密码子”(TAG、TGA或TAA)通常不翻译成氨基酸,但它可被认为是编码区的一部分,但任何侧翼序列,例如启动子、核糖体结合位点、转录终止子、内含子、非翻译区(“UTR”)等不是编码区的一部分。编码区的边界通常由5'末端的起始密码子(编码所得多肽的氨基末端)和3'末端的翻译终止密码子(编码所得多肽的羧基末端)确定。
如本文所用,术语“非编码区”是指不是编码区的核苷酸序列。非编码区的实例包括但不限于启动子、核糖体结合位点、转录终止子、内含子、非翻译区(“UTR”)、非编码外显子等。一些外显子可为每个转录物的5'非翻译区(5'UTR)或3'非翻译区(3'UTR)的全部或部分。非翻译区对于转录物的有效翻译以及转录物的翻译速率和半衰期的控制至关重要。
当用于核苷酸序列的上下文中时,术语“区域”是指该序列的一部分。例如,短语“核苷酸序列内的区域”或“核苷酸序列的互补序列内的区域”是指比核苷酸序列短但分别比位于特定核苷酸序列或核苷酸序列互补序列内的至少10个核苷酸长的序列。术语“亚序列(sub-sequence)”或“亚序列(subsequence)”也可指核苷酸序列的区域。
当提及核苷酸序列时,术语“下游”是指核酸或核苷酸序列位于参考核苷酸序列的3'。在某些方面,下游核苷酸序列涉及转录起始点之后的序列。例如,基因的翻译起始密码子位于转录起始位点的下游。
术语“上游”是指位于参考核苷酸序列的5'的核苷酸序列。
如本文所用,术语“调控区”是指位于编码区上游(5'非编码序列)、内部或下游(3'非编码序列)并且影响相关编码区的转录、RNA加工、稳定性或翻译的的核苷酸序列。调控区可包括启动子、翻译前导序列、内含子、聚腺苷酸化识别序列、RNA加工位点、效应子结合位点、UTR和茎环结构。如果编码区意欲在真核细胞中表达,则聚腺苷酸化信号和转录终止序列通常位于编码序列的3'。
如本文所用,术语“转录物”可指通过DNA转录合成并在加工后变成信使RNA(mRNA)的初级转录物,即前体信使RNA(前体mRNA),以及加工后的mRNA本身。术语“转录物”可与“前体mRNA”和“mRNA”互换使用。在DNA链转录成初级转录物后,新合成的初级转录物会以多种方式进行修饰,以转化为其成熟的功能形式,从而产生不同的蛋白质和RNA,如mRNA、tRNA、rRNA、lncRNA、miRNA等。因此,术语“转录物”可包括外显子、内含子、5'UTR和3'UTR。
如本文所用,术语“表达”是指多核苷酸产生基因产物例如RNA或多肽的过程。它包括但不限于将多核苷酸转录成信使RNA(mRNA)和将mRNA翻译成多肽。表达产生“基因产物”。如本文所用,基因产物可为核酸,例如,由基因转录产生的信使RNA,或从转录物翻译的多肽。本文所述的基因产物还包括具有转录后修饰(例如,聚腺苷酸化或剪接)的核酸,或具有翻译后修饰(例如,甲基化、糖基化、脂质添加、与其他蛋白质亚单位缔合或蛋白水解切割)的多肽。
在两个或更多个核酸的上下文中,术语“同一”或“同一性”百分比是指为了获得最大对应性比较和比对(如果需要则引入空位)时,相同或具有指定百分比的相同核苷酸或氨基酸残基的两个或更多个序列,不考虑任何保守氨基酸取代作为序列同一性的部分。同一性百分比可使用序列比较软件或算法或通过目视检查来测量。本领域中已知可用于获得氨基酸或核苷酸序列比对的各种算法和软件。
序列比对算法的这样一个非限制性实例是描述于Karlin等人,1990,Proc.Natl.Acad.Sci.,87:2264-2268中,如Karlin等人,1993,Proc.Natl.Acad.Sci.,90:5873-5877修改且并入NBLAST和XBLAST程序(Altschul等人,1991,Nucleic Acids Res.,25:3389-3402)中的算法。在某些方面,Gapped BLAST可如Altschul等人,1997,NucleicAcids Res.25:3389-3402中所述而使用。BLAST-2、WU-BLAST-2(Altschul等人,1996,Methods in Enzymology,266:460-480)、ALIGN、ALIGN-2(Genentech,South SanFrancisco,California)或Megalign(DNASTAR)是可用于比对序列的其他公开获得的软件程序。在某些方面,使用GCG软件包中的GAP程序(例如,使用NWSgapdna.CMP矩阵,以及40、50、60、70或90的空位权重和1、2、3、4、5或6的长度权重)测定两个核苷酸序列之间的同一性百分比。在某些替代方面,GCG软件包中的GAP程序结合了Needleman和Wunsch的算法(J.Mol.Biol.(48):444-453(1970)),可用于测定两个氨基酸序列之间的同一性百分比(例如,使用BLOSUM 62矩阵或PAM250矩阵,以及16、14、12、10、8、6或4的空位权重和1、2、3、4、5的长度权重)。或者,在某些方面,使用Myers和Miller的算法(CABIOS,4:11-17(1989))测定核苷酸或氨基酸序列之间的同一性百分比。例如,可使用ALIGN程序(版本2.0)并且使用带有残基表的PAM120,以12的空位长度罚分和4的空位罚分来测定同一性百分比。本领域技术人员可确定用于通过特定比对软件获得最大比对的适当参数。在某些方面,使用比对软件的默认参数。
在某些方面,第一核苷酸序列与第二核苷酸序列的同一性百分比“X”被计算成100x(Y/Z),其中Y为在第一序列和第二序列比对(如通过目测或特殊的序列比对程序比对)中被评分为相同匹配的氨基酸残基数并且Z为第二序列中的残基总数。如果第一序列的长度长于第二序列,则第一序列与第二序列的同一性百分比将高于第二序列与第一序列的同一性百分比。
与多核苷酸参考序列比对的单个多核苷酸靶序列内的不同区域可各自具有其自身的序列同一性百分比。应注意,序列同一性百分比值四舍五入到十分位。例如,80.11、80.12、80.13和80.14向下舍入到80.1,而80.15、80.16、80.17、80.18和80.19向上舍入到80.2。还应注意,长度值将始终是整数。
如本文所用,术语“同源”和“同源性”可与术语“同一性”和“同一”互换。
术语“其天然存在的变体”是指KRAS多肽序列或KRAS核酸序列(例如,转录物)的天然存在于限定的分类群如哺乳动物,如小鼠、猴子和人类中的变体。通常,当提及多核苷酸的“天然存在的变体”时,该术语还可涵盖通过染色体易位或复制产生的在染色体位置12p12.1(即,GenBank登录号NC_000012的25,204,789-25,250,936)发现的编码KRAS的基因组DNA的任何等位基因变体,以及RNA(如源自其的mRNA)。“天然存在的变体”还可包括源自KRAS mRNA的可变剪接的变体。例如,当提及特定的多肽序列时,该术语还包括天然存在的蛋白质形式,这些蛋白质形式因此可例如通过共翻译或翻译后修饰(如信号肽切割、蛋白水解切割、糖基化等)来加工。
在确定本公开的ASO(或其区域)与编码哺乳动物KRAS(例如,KRAS基因)的核酸的靶区域(如本文所公开的那些)之间的“互补性”程度,“互补性”(也称为“同源性”或“同一性”)的程度表示为最佳对齐的ASO(或其区域)的序列与靶区域的序列(或靶区域的反向互补序列)之间的同一性百分比(或同源性百分比)。百分比的计算方法是计算两个序列之间相同的对齐碱基数,除以ASO中连续单体的总数,然后乘以100。在这样的比较中,如果存在空位,则优选的是这种空位仅仅是错配,而不是在本公开的ASO和靶区域之间空位内单体数不同的区域。
如本文所用,术语“互补序列”指示与参考序列互补的序列。众所周知,互补性是DNA复制和转录的基本原理,因为它是两个DNA或RNA序列之间共有的性质,因此当它们彼此反平行排列时,序列中每个位置处的核苷酸碱基将是互补,就像照镜子时看到事物的反面。因此,例如,序列5'"ATGC"3'的互补序列可写成3'"TACG"5'或5'"GCAT"3’。如本文所用,术语“反向互补序列”、“反向互补”和“反向互补性”可与术语“互补序列”、“互补”和“互补性”互换。在一些方面,术语“互补”是指与KRAS转录物内的连续核酸序列100%匹配或互补(即,完全互补)。在一些方面,术语“互补”是指与KRAS转录物内的连续核酸序列至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%的匹配或互补性。
当提及两个单独的核酸或核苷酸序列时,术语“对应”和“对应于”可用于阐明基于同源性和/或功能性彼此对应或相似的序列的区域,但是具体的序列可以不同方式编号。例如,基因转录物的不同同种型可具有核苷酸序列的相似或保守部分,其编号基于可变剪接和/或其他修饰在各个同种型中可不同。此外,已经认识到在表征核酸或核苷酸序列(例如,基因转录物,以及是否从翻译起始密码子开始对序列编号或是否包括5'UTR)时可采用不同的编号系统。此外,已经认识到基因或基因转录物的不同变体的核酸或核苷酸序列可变化。然而,如本文所用,共享核酸或核苷酸序列同源性和/或功能性的变体区域被视为彼此“对应”。例如,对应于SEQ ID NO:1或SEQ ID NO:3(“参考序列”)的核苷酸X至Y的KRAS转录物的核苷酸序列是指具有与SEQ ID NO:1或SEQ ID NO:3的核苷酸X至Y相同的序列或相似的序列的KRAS转录物序列(例如,KRAS前体mRNA或mRNA),其中X是起始位点并且Y是末端位点(如图1所示)。本领域普通技术人员可通过将KRAS转录物序列与SEQ ID NO:1或SEQ ID NO:3进行比对来鉴别KRAS转录物序列中对应的X和Y残基。
术语“对应的核苷酸类似物”和“对应的核苷酸”旨在表示核苷酸类似物和天然存在的核苷酸中的核碱基具有相同的配对或杂交能力。例如,当核苷酸的2-脱氧核糖单元连接至腺嘌呤时,“对应的核苷酸类似物”含有连接至腺嘌呤的戊糖单元(不同于2-脱氧核糖)。
ASO化学注释如下:Beta-D-oxy LNA核苷酸由OxyB指定,其中B表示核苷酸碱基,如胸腺嘧啶(T)、尿苷(U)、胞嘧啶(C)、5-甲基胞嘧啶(MC)、腺嘌呤(A)或鸟嘌呤(G),并且由此包括OxyA、OxyT、OxyMC、OxyC和OxyG。DNA核苷酸由DNAb指定,其中小写b表示核苷酸碱基,如胸腺嘧啶(T)、尿苷(U)、胞嘧啶(C)、5-甲基胞嘧啶(Mc)、腺嘌呤(A)或鸟嘌呤(G),并且由此包括DNAa、DNAt、DNA和DNAg。C或c前的字母M表示5-甲基胞嘧啶。字母“s”表示硫代磷酸酯核苷酸间键联。
如本文所用,术语“ASO编号”或“ASO No.”是指给予具有详细组分化学结构的核苷酸序列的唯一编号,例如核苷(例如,DNA)、核苷类似物(例如,β-D-氧基-LNA)、核碱基(例如,A、T、G、C、U或MC)和骨架结构(例如,硫代磷酸酯或磷酸二酯)。例如,ASO-0004可指TbsCbsAbsdGs(5MdC)sdTs(5MdC)s(5MdC)sdAsdAs(5MdC)sTbsAbsCb,其中Nb意指LNA;dN意指DNA;5MdC意指5-甲基-dC;Nm意指MOE;并且s意指硫代磷酸酯。
除非另外指出,否则“效力”通常表示为IC50或EC50值,以μM、nM或pM为单位。效力也可用抑制百分比来表示。IC50是治疗性分子的半数抑制浓度。EC50是治疗性分子相对于媒介物或对照物(例如,盐水)的半数有效浓度。在功能测定中,IC50是将治疗性分子所达到的生物反应(例如,mRNA转录或蛋白质表达)减少所述生物反应的50%的治疗性分子浓度。在功能测定中,EC50是产生50%的生物反应(例如,mRNA转录或蛋白质表达)的治疗性分子浓度。IC50或EC50可通过本领域中已知的任何数量的方法来计算。
如本文所用,术语“抑制”例如KRAS基因转录物和/或KRAS蛋白的表达是指ASO降低KRAS基因转录物和/或KRAS蛋白在细胞或组织中的表达。在一些方面,术语“抑制”是指对KRAS基因转录物或KRAS蛋白的完全抑制(100%抑制或不可检测水平)。在其他方面,术语“抑制”是指对细胞或组织中KRAS基因转录物和/或KRAS蛋白表达的至少5%、至少10%、至少15%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%、至少50%、至少60%、至少70%、至少80%、至少90%、至少95%或至少99%的抑制。
如本文所用,术语“细胞外囊泡”或“EV”是指包含包封内部空间的膜的细胞源性囊泡。细胞外囊泡包括所有与膜结合的囊泡(例如,外泌体、纳米囊泡),其直径小于其所源自的细胞的直径。在一些方面,细胞外囊泡的直径在20nm至1000nm的范围内,并且可包含在内部空间(即,腔)内、展示在细胞外囊泡的外表面上和/或跨膜的各种大分子有效载荷。在一些方面,有效载荷可包括核酸、蛋白质、碳水化合物、脂质、小分子和/或它们的组合。在某些方面,细胞外媒介物包含支架部分。举例而言并且非限制性地,细胞外囊泡包括凋亡小体、细胞片段、通过直接或间接操纵(例如,通过连续挤出或用碱性溶液进行的处理)而源自细胞的囊泡、含有小囊的胞器和由活细胞产生(例如,通过直接质膜出芽(plasma membranebudding)或融合晚期胞内体与质膜)的囊泡。胞外囊泡可源自活的或死的生物体、外植组织或器官、原核或真核细胞和/或培养的细胞。在一些方面,细胞外囊泡由表达一种或多种转基因产物的细胞产生。
如本文所用,术语“外泌体”是指直径在20-300nm之间(例如,在40-200nm之间)的细胞外囊泡。外泌体包含包封内部空间(即,腔)的膜,并且在一些方面,可以通过直接质膜出芽或通过晚期胞内体与质膜的融合从细胞(例如,生产细胞)产生。在某些方面,外泌体包含支架部分。如下文所述,外泌体可源自生产细胞,并且基于其尺寸、密度、生物化学参数或它们的组合从生产细胞中分离。在一些方面,本公开的EV(例如,外泌体)由表达一种或多种转基因产物的细胞产生。
如本文所用,术语“纳米囊泡”是指直径在约20-250nm之间(例如,在30-150nm之间)的细胞外囊泡,并且通过直接或间接操纵从细胞(例如,生产细胞)产生,使得未操纵的细胞不会产生纳米囊泡。为了产生纳米囊泡而对细胞进行的适当操纵包括但不限于连续挤出、用碱性溶液进行的处理、超声处理或它们的组合。在一些方面,纳米囊泡的产生可以导致生产细胞的破坏。在一些方面,本文所述的纳米囊泡群基本上不含通过从质膜直接出芽或晚期胞内体与质膜的融合而源自细胞的囊泡。在某些方面,纳米囊泡包含支架部分。一旦纳米囊泡源自生产细胞,则它们即可基于其尺寸、密度、生物化学参数或它们的组合从生产细胞中分离。
如本文所用,术语“表面工程化的EV(例如,外泌体)”(例如,支架X工程化的EV(例如,外泌体))是指EV(例如,外泌体)的膜或EV(例如,外泌体)的表面在其组成上被修饰,使得工程化的EV(例如,外泌体)的表面不同于修饰前的EV(例如,外泌体)或天然存在的EV(例如,外泌体)的表面。工程化可在EV(例如,外泌体)的表面上或在EV(例如,外泌体)的膜中进行,使得EV(例如,外泌体)的表面被改变。例如,对膜的蛋白质、脂质、小分子、碳水化合物等的组成进行修饰。组成可以通过化学、物理或生物方法来改变,或者通过由预先或同时通过化学、物理或生物方法修饰的细胞产生而改变。具体而言,组成可以通过基因工程来改变,或者通过由预先通过基因工程修饰的细胞产生而改变。在一些方面,表面工程化的EV(例如,外泌体)包含外源性蛋白质(即,EV(例如,外泌体)不天然表达的蛋白质)或其片段或变体,它们可以暴露于EV(例如,外泌体)的表面,或者可以是暴露在EV(例如,外泌体)的表面上的部分的锚定点(连接)。在其他方面,表面工程化的EV(例如,外泌体)包含更高表达(例如,更高数量)的天然外泌体蛋白(例如,支架X)或其片段或变体,它们可以暴露于EV(例如,外泌体)的表面,或者可以是暴露在EV(例如,外泌体)的表面上的部分的锚定点(连接)。
如本文所用,术语“腔工程化的外泌体”(例如,支架Y工程化的外泌体)是指EV(例如,外泌体)的膜或EV(例如,外泌体)的腔在其组成上被修饰,使得工程化的EV(例如,外泌体)的腔不同于修饰前的EV(例如,外泌体)或天然存在的EV(例如,外泌体)的表面。工程化可直接在EV(例如,外泌体)的腔中或在EV(例如,外泌体)的膜中进行,使得EV(例如,外泌体)的腔被改变。例如,对膜的蛋白质、脂质、小分子、碳水化合物等的组成进行修饰,使得EV(例如,外泌体)的腔被修饰。组成可以通过化学、物理或生物方法来改变,或者通过由预先通过化学、物理或生物方法修饰的细胞产生而改变。具体而言,组成可以通过基因工程来改变,或者通过由预先通过基因工程修饰的细胞产生而改变。在一些方面,腔工程化的外泌体包含外源性蛋白质(即,EV(例如,外泌体)不天然表达的蛋白质)或其片段或变体,它们可以暴露于EV(例如,外泌体)的腔中,或者可以是暴露在EV(例如,外泌体)的内层上的部分的锚定点(连接)。在其他方面,腔工程化的EV(例如,外泌体)包含更高表达的天然外泌体蛋白(例如,支架X或支架Y)或其片段或变体,它们可以暴露于外泌体的腔,或者可以是暴露在外泌体的腔中的部分的锚定点(连接)。
术语“修饰的”,当在本文所述的EV(例如,外泌体)的上下文中使用时,是指对EV(例如,外泌体)和/或其生产细胞的改变或工程化,使得修饰的EV(例如,外泌体)不同于天然存在的EV(例如,外泌体)。在一些方面,本文所述的修饰的EV(例如,外泌体)包含与天然存在的EV(例如,外泌体)的膜相比在蛋白质、脂质、小分子、碳水化合物等组成上不同的膜(例如,膜包含更高密度或数量的天然外泌体蛋白并且/或者膜包含在外泌体(例如,SAO)中非天然存在的蛋白质)。在某些方面,对膜的这种修饰改变了EV(例如,外泌体)的外表面(例如,本文所述的表面工程化的EV,例如外泌体)。在某些方面,对膜的这种修饰改变了EV(例如,外泌体)的腔(例如,本文所述的腔工程化的EV,例如外泌体)。
如本文所用,术语“支架部分”是指可用于将有效载荷或任何其他目标化合物(例如,本文所公开的ASO)在EV(例如,外泌体)的腔表面上或外表面上锚定至EV(例如,外泌体)的分子。在某些方面,支架部分包含合成分子。在一些方面,支架部分包含非多肽部分。在其他方面,支架部分包含天然存在于EV(例如,外泌体)中的脂质、碳水化合物或蛋白质。在一些方面,支架部分包含不天然存在于EV(例如,外泌体)中的脂质、碳水化合物或蛋白质。在某些方面,支架部分是支架X。在一些方面,支架部分是支架Y。在另外的方面,支架部分包括支架X和支架Y两者。可用于本公开的其他支架部分的非限制性实例包括:氨基肽酶N(CD13);脑啡肽酶,AKA膜金属内肽酶(MME);外核苷酸焦磷酸酶/磷酸二酯酶家族成员1(ENPP1);神经纤毛蛋白-1(NRP1);CD9、CD63、CD81、PDGFR、GPI锚蛋白、乳凝集素(MFGE8)、LAMP2和LAMP2B。
如本文所用,术语“支架X”是指最近在外泌体表面上鉴定的外泌体蛋白。参见,例如,美国专利号10,195,290,其以引用方式整体并入本文。支架X蛋白的非限制性实例包括:前列腺素F2受体负调节因子(“PTGFRN蛋白”);basigin(“BSG蛋白”);免疫球蛋白超家族成员2(“IGSF2蛋白”);免疫球蛋白超家族成员3(“IGSF3蛋白”);免疫球蛋白超家族成员8(“IGSF8蛋白”);整联蛋白β-1(“ITGB1蛋白”);整联蛋白α-4(“ITGA4蛋白”);4F2细胞表面抗原重链(“SLC3A2蛋白”);一类ATP转运蛋白(“ATP1A1蛋白”、“ATP1A2蛋白”、“ATP1A3蛋白”、“ATP1A4蛋白”、“ATP1B3蛋白”、“ATP2B1蛋白”、“ATP2B2蛋白”、“ATP2B3蛋白”、“ATP2B蛋白”);以及它们的功能性片段。在一些方面,支架X蛋白可以是完整的蛋白质或其片段(例如,功能性片段,例如,能够将另一部分锚定在EV(例如,外泌体)的外表面上或腔表面上的最小片段)。在一些方面,支架X可将部分(例如,ASO)锚定至外泌体的外表面或腔表面。
如本文所用,术语“支架Y”是指在外泌体的腔内新鉴定的外泌体蛋白。参见,例如,国际公布第WO/2019/099942号,其以引用方式整体并入本文。支架蛋白Y的非限制性实例包括:富含肉豆蔻酰化丙氨酸的蛋白激酶C底物(“MARCKS蛋白”);富含肉豆蔻酰化丙氨酸的蛋白激酶C底物1(“MARCKSL 1蛋白”);和脑酸溶性蛋白1(“BASP1蛋白”)。在一些方面,支架Y蛋白可以是完整蛋白质或其片段(例如,功能性片段,例如,能够将一个部分锚定至外泌体的腔表面的最小片段)。在一些方面,支架Y可将部分或有效载荷(例如,ASO)锚定至EV(例如,外泌体)的腔表面。在一些方面,支架Y可将部分或有效载荷(例如,ASO)锚定至EV(例如,外泌体)的外表面。
如本文所用,术语蛋白质(例如,治疗性蛋白质、支架X或支架Y)的“片段”是指这样的蛋白质的氨基酸序列,其比天然存在的序列短,与天然存在的蛋白质相比,蛋白质的N末端和/或C末端缺失或任何部分缺失。如本文所用,术语“功能性片段”是指保留蛋白质功能的蛋白质片段。因此,在一些方面,支架X蛋白的功能性片段保留了将一个部分锚定在EV(例如,外泌体)的腔表面或外表面上的能力。类似地,在某些方面,支架Y蛋白的功能性片段保留了将一个部分锚定在EV(例如,外泌体)的腔表面或外表面上的能力。片段是否是功能性片段可以通过任何本领域已知的测定EV(例如,外泌体)的蛋白质含量的方法来评估,所述方法包括蛋白质印迹、FACS分析和片段与自发荧光蛋白(如例如GFP)的融合。在某些方面,支架X蛋白的功能性片段保留了天然存在的支架X蛋白的至少约50%、至少约60%、至少约70%、至少约80%、至少约90%或至少约100%的能力,例如锚定一个部分的能力。在一些方面,支架Y蛋白的功能性片段保留了天然存在的支架Y蛋白的至少约50%、至少约60%、至少约70%、至少约80%、至少约90%或至少约100%的能力,例如锚定另一分子的能力。
如本文所用,术语分子(例如,功能性分子、抗原、支架X和/或支架Y)的“变体”是指通过本领域已知的方法进行比较后与另一分子共有某些结构和功能属性的分子。例如,蛋白质的变体可包括另一蛋白质中的取代、插入、缺失、移码或重排。
在一些方面,支架X的变体包括与全长、成熟PTGFRN、BSG、IGSF2、IGSF3、IGSF8、ITGB1、ITGA4、SLC3A2或ATP转运蛋白或PTGFRN、BSG、IGSF2、IGSF3、IGSF8、ITGB1、ITGA4、SLC3A2或ATP转运蛋白的片段(例如,功能性片段)具有至少约70%同一性的变体。在一些方面,PTGFRN的变体或片段的变体与根据SEQ ID NO:301的PTGFRN或其功能性片段共有至少约70%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性。在一些方面,BSG的变体或片段的变体与根据SEQ ID NO:303的BSG或其功能性片段共有至少约70%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性。在一些方面,IGSF2的变体或片段的变体与根据SEQ ID NO:308的IGSF2或其功能性片段共有至少约70%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性。在一些方面,IGSF3的变体或片段的变体与根据SEQ ID NO:309的IGSF3或其功能性片段共有至少约70%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性。在一些方面,IGSF8的变体或片段变体与根据SEQ ID NO:304的IGSF8或其功能性片段共有至少约70%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性。在一些方面,ITGB1的变体或片段的变体与根据SEQ ID NO:305的ITGB1或其功能性片段共有至少约70%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性。在一些方面,ITGA4的变体或片段的变体与根据SEQ ID NO:306的ITGA4或其功能性片段共有至少约70%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性。在一些方面,SLC3A2的变体或片段的变体与根据SEQ ID NO:307的SLC3A2或其功能性片段共有至少约70%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性。在一些方面,ATP1A1的变体或片段的变体与根据SEQ ID NO:310的ATP1A1或其功能性片段共有至少约70%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性。在一些方面,ATP1A2的变体或片段的变体与根据SEQ ID NO:311的ATP1A2或其功能性片段共有至少约70%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性。在一些方面,ATP1A3的变体或片段的变体与根据SEQ ID NO:312的ATP1A3或其功能性片段共有至少约70%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性。在一些方面,ATP1A4的变体或片段的变体与根据SEQ ID NO:313的ATP1A4或其功能性片段共有至少约70%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性。在一些方面,ATP1B3的变体或片段的变体与根据SEQ ID NO:314的ATP1B3或其功能性片段共有至少约70%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性。在一些方面,ATP2B1的变体或片段的变体与根据SEQ ID NO:315的ATP2B1或其功能性片段共有至少约70%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性。在一些方面,ATP2B2的变体或片段的变体与根据SEQ ID NO:316的ATP2B2或其功能性片段共有至少约70%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性。在一些方面,ATP2B3的变体或片段的变体与根据SEQ ID NO:317的ATP2B3或其功能性片段共有至少约70%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性。在一些方面,ATP2B4的变体或片段的变体与根据SEQ ID NO:318的ATP2B4或其功能性片段共有至少约70%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性。在一些方面,本文所公开的支架X蛋白的变体或片段变体保留了特异性靶向EV(例如,外泌体)的能力。在一些方面,支架X包括一个或多个突变,例如保守氨基酸取代。
在一些方面,支架Y的变体包括与MARCKS、MARCKSL1、BASP1或MARCKS、MARCKSL1或BASP1的片段具有至少70%同一性的变体。在一些方面,MARCKS的变体或片段的变体与根据SEQ ID NO:401的MARCKS或其功能性片段具有至少约70%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性。在一些方面,MARCKSL 1的变体或片段的变体与根据SEQ ID NO:402的MARCKSL 1或其功能性片段共有至少约70%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性。在一些方面,BASP1的变体或片段的变体与根据SEQ ID NO:403的BASP1或其功能性片段共有至少约70%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性。在一些方面,支架Y蛋白的变体或片段变体保留了特异性靶向EV(例如,外泌体)的腔表面的能力。在一些方面,支架Y包括一个或多个突变,例如保守氨基酸取代。
“保守氨基酸取代”是氨基酸残基被具有相似侧链的氨基酸残基替代。本领域已经定义了具有相似侧链的氨基酸残基家族,包括碱性侧链(例如,赖氨酸、精氨酸、组氨酸)、酸性侧链(例如,天冬氨酸、谷氨酸)、不带电荷的极性侧链(例如,甘氨酸、天冬酰胺、谷氨酰胺、丝氨酸、苏氨酸、酪氨酸、半胱氨酸)、非极性侧链(例如,丙氨酸、缬氨酸、亮氨酸、异亮氨酸、脯氨酸、苯丙氨酸、甲硫氨酸、色氨酸)、β-支链侧链(例如,苏氨酸、缬氨酸、异亮氨酸)和芳族侧链(例如,酪氨酸、苯丙氨酸、色氨酸、组氨酸)。因此,如果多肽中的一个氨基酸被来自同一侧链家族的另一个氨基酸替代,则这种取代被认为是保守的。在另一个方面,氨基酸串可以被侧链家族成员的顺序和/或组成不同而结构上类似的串保守取代。
术语两个多核苷酸或多肽序列之间的“序列同一性百分比”或“同一性百分比”是指在考虑到了为了两个序列的最佳比对而必须引入的添加或缺失(即,空位)的情况下,比较窗口内序列所共有的相同匹配位置的数量。匹配位置是指其中在靶序列和参考序列中都出现相同核苷酸或氨基酸的任何位置。由于空位不是核苷酸或氨基酸,所以不计算靶序列中出现的空位。同样,由于计数靶序列核苷酸或氨基酸,而不计数来自参考序列的核苷酸或氨基酸,所以不计数参考序列中出现的空位。
通过以下计算序列同一性百分比:确定其中在两个序列中都出现相同氨基酸残基或核酸碱基的位置数,以得到匹配位置数,将匹配位置数除以比较窗口中的位置总数,并将结果乘以100,得到序列同一性百分比。序列的比较和两个序列之间序列同一性百分比的确定可使用易用于在线使用和下载的软件来完成。合适的软件程序可从各种来源获得,用于蛋白质和核苷酸序列的比对。确定序列同一性百分比的一个合适的程序是bl2seq,其为可从美国政府的国家生物技术信息中心BLAST网站(blast.ncbi.nlm.nih.gov)上获得的BLAST程序套件的一部分。Bl2seq使用BLASTN或BLASTP算法进行两个序列之间的比较。BLASTN用于比较核酸序列,而BLASTP用于比较氨基酸序列。其他合适的程序是,例如,Needle、Stretcher、Water或Matcher、生物信息学程序的EMBOSS套件的一部分,并且也可在worldwideweb.ebi.ac.uk/Tools/psa上从欧洲生物信息学研究所(EBI)获得。
与多核苷酸或多肽参考序列比对的单个多核苷酸或多肽靶序列内的不同区域可以各自具有它们自己的序列同一性百分比。应注意,序列同一性百分比值四舍五入到十分位。例如,80.11、80.12、80.13和80.14向下舍入到80.1,而80.15、80.16、80.17、80.18和80.19向上舍入到80.2。还应注意,长度值将始终是整数。
本领域技术人员将理解,用于计算序列同一性百分比的序列比对的生成不限于仅由一级序列数据驱动的二进制序列-序列比较。序列比对可源自多重序列比对。产生多重序列比对的一个合适的程序是ClustalW2,可从www.clustal.org获得。另一个合适的程序是MUSCLE,可从www.drive5.com/muscle/获得。ClustalW2和MUSCLE可以例如从EBI选择获得。
还应当理解,序列比对可通过将序列数据与来自异构源的数据(诸如结构数据(例如,晶体学蛋白质结构)、功能数据(例如,突变的位置)或系统发育数据)整合而产生。整合异构数据以生成多重序列比对的合适程序是可在www.tcoffee.org上获得,以及另选地可以例如从EBI获得的T-Coffee。还应当理解,可以自动或手动策划用于计算序列同一性百分比的最终比对。
多核苷酸变体可在编码区、非编码区或两者中包含改变。在一个方面,多核苷酸变体包含产生沉默取代、添加或缺失的改变,但不改变所编码多肽的性质或活性。在另一个方面,由于遗传密码的简并性,通过沉默取代产生核苷酸变体。在其他方面,其中以任意组合取代、删除或添加5-10个、1-5个或1-2个氨基酸的变体。可以出于多种原因产生多核苷酸变体,例如,为了优化用于特定宿主的密码子表达(将人mRNA中的密码子改变为其他密码子,例如,细菌宿主诸如大肠杆菌(E.coli))。
天然存在的变体被称为“等位基因变体”,是指占据生物体的染色体上给定基因座的基因的几种替代形式之一(Genes II,Lewin,B.,编辑,John Wiley&Sons,New York(1985))。这些等位基因变体可在多核苷酸和/或多肽水平上变化,并且包含在本公开中。或者,非天然存在的变体可通过诱变技术或直接合成产生。
使用蛋白质工程和重组DNA技术的已知方法,能产生变体来改善或改变多肽的特征。例如,可从分泌蛋白质的N末端或C末端使一个或多个氨基酸缺失,而基本上不损失生物功能。Ron等人,J.Biol.Chem.268:2984-2988(1993)(以引用方式整体并入本文)报道了变体KGF蛋白即便是在删除3个、8个或27个氨基末端氨基酸残基之后仍具有肝素结合活性。类似地,干扰素γ在从该蛋白的羧基端删除8-10个氨基酸残基后显示出高达十倍的活性。(Dobeli等人,J.Biotechnology 7:199-216(1988),以引用方式整体并入本文)。
此外,大量的证据表明,变体通常保留着与天然存在的蛋白质相似的生物活性。例如,Gayle及同事(J.Biol.Chem 268:22105-22111(1993),以引用方式整体并入本文)对人细胞因子IL-1a进行了广泛的突变分析。他们利用随机诱变生成了3,500多种单独的IL-1a突变体,在分子的整个长度上每种变体平均有2.5个氨基酸的变化。在每个可能的氨基酸位置都检查到多重突变。研究人员发现,“大多数分子可被改变,而对[结合或生物活性]几乎没有影响。”(见摘要)。事实上,在检查的3,500多个核苷酸序列中,只有23个独特的氨基酸序列产生了与野生型活性显著不同的蛋白质。
如上所述,多肽变体包括例如修饰的多肽。修饰包括,例如,乙酰化、酰化、ADP-核糖基化、酰胺化、黄素的共价连接、血红素部分的共价连接、核苷酸或核苷酸衍生物的共价连接、脂质或脂质衍生物的共价连接、磷脂酰肌醇的共价连接、交联、环化、二硫键形成、去甲基化、共价交联的形成、半胱氨酸的形成、焦谷氨酸盐的形成、甲酰化、γ-羧化、糖基化、GPI锚形成、羟基化、碘化、甲基化、肉豆蔻酰化、氧化、聚乙二醇化(Mei等人,Blood 116:270-79(2010),其以引用方式整体并入本文)、蛋白水解加工、磷酸化、异戊二烯化、外消旋化、硒酰化、硫酸化、转运RNA介导的向蛋白质中添加氨基酸,诸如精氨酰化和遍在蛋白化。在一些方面,可在任何方便的位置修饰支架X和/或支架Y。
如本文所用,术语“与……连接”或“与……缀合”可互换使用,是指第一部分与第二部分(例如,分别为支架X和ASO,例如,在细胞外囊泡中或细胞外囊泡上表达的支架部分和ASO,例如,分别在细胞外囊泡的腔表面中或外表面上表达的支架X(例如,PTGFRN蛋白))之间形成的共价键或非共价键。
术语“囊封的”,或该术语的语法上不同的形式(例如,囊封(encapsulation)或囊封(encapsulating)),是指在第二部分(例如,EV,例如,外泌体)内具有第一部分(例如,ASO)而两个部分没有化学或物理地连接的状态或过程。在一些方面,术语“囊封的”可以与“在……腔中”互换使用。在本文别处公开了将第一部分(例如,ASO)囊封到第二部分(例如,EV,例如,外泌体)中的非限制性实例。
如本文所用,术语“生产细胞”是指用于产生EV(例如,外泌体)的细胞。生产细胞可以是体外培养的细胞,也可以是体内细胞。生产细胞包括但不限于已知能够有效产生EV(例如,外泌体)的细胞,例如,HEK293细胞、中国仓鼠卵巢(CHO)细胞、间充质干细胞(MSC)、BJ人包皮成纤维细胞、fHDF成纤维细胞、AGE.神经元前体细胞、羊水细胞、脂肪间充质干细胞、RPTEC/TERT1细胞。在某些方面,生产细胞不是抗原呈递细胞。在一些方面,生产细胞不是树突细胞、B细胞、肥大细胞、巨噬细胞、嗜中性粒细胞、Kupffer-Browicz细胞、源自这些细胞中的任一者的细胞或它们的任何组合。在一些方面,可用于本公开的EV(例如,外泌体)不携带暴露在EV(例如,外泌体)的表面上的MHC I类或II类分子上的抗原,但可通过连接至支架X和/或支架Y在EV(例如,外泌体)的腔中或在EV(例如,外泌体)的表面上携带抗原。
如本文所用,术语“分离(isolate)”、“分离的(isolated)”和“分离(isolating)”或“纯化(purify)”、“纯化的(purified)”和“纯化(purifying)”以及“提取的(extracted)”和“提取(extracting)”可互换使用,是指已经过一个或多个纯化过程的所需EV的制剂状态(例如,多个已知或未知的量和/或浓度),所述纯化过程例如是所需EV制剂的选择或富集。在一些方面,如本文所用的分离或纯化是从含有生产细胞的样品中除去、部分除去(例如,一部分)EV的过程。在一些方面,分离的EV组合物没有可检测的不希望的活性,或另选地,不希望的活性的水平或量处于或低于可接受的水平或量。在其他方面,分离的EV组合物的所需EV的量和/或浓度等于或高于可接受的量和/或浓度。在其他方面,与从中获得组合物的原料(例如,生产细胞制备物)相比,分离的EV组合物是富集的。与原料相比,这种富集可以是富集10%、20%、30%、40%、50%、60%、70%、80%、90%、95%、96%、97%、98%、99%、99.9%、99.99%、99.999%、99.9999%或大于99.9999%。在一些方面,分离的EV制剂基本上不含残留的生物产物。在一些方面,分离的EV制剂100%不含、99%不含、98%不含、97%不含、96%不含、95%不含、94%不含、93%不含、92%不含、91%不含或90%不含任何污染性生物物质。残留生物产物可以包括非生物材料(包括化学物质)或不合需要的核酸、蛋白质、脂类或代谢物。基本上不含残留生物产物也可意味着EV组合物不含可检测的生产细胞,并且只有EV是可检测的。
如本文所用,术语“有效载荷”是指作用于与EV接触的靶标(例如,靶细胞)的剂。可包含在EV(例如,外泌体)上的有效载荷的非限制性实例是ASO。可引入到EV(例如,外泌体)和/或生产细胞中的有效载荷包括剂,诸如核苷酸(例如,包含可检测部分或毒素或破坏转录的核苷酸)、核酸(例如,编码多肽诸如酶的DNA或mRNA分子,或具有调控功能的RNA分子诸如miRNA、dsDNA、lncRNA和siRNA)、氨基酸(例如,包含可检测部分或毒素或破坏翻译的氨基酸)、多肽(例如,酶)、脂质、碳水化合物和小分子(例如,小分子药物和毒素)。在某些方面,有效载荷包括ASO。如本文所用,术语“抗体”涵盖不论天然或部分或全部以合成方式产生的免疫球蛋白及其片段。该术语还涵盖任何具有与免疫球蛋白结合结构域同源的结合结构域的蛋白质。“抗体”还包括多肽,所述多肽包含来自免疫球蛋白基因或其片段的特异性结合和识别抗原的框架区。如本文所用,术语“抗原”是指当引入受试者时引发针对自身的免疫应答(细胞或体液)的任何剂。术语抗体的使用意在包括完全抗体、多克隆抗体、单克隆抗体和重组抗体、它们的片段,并且还包括单链抗体、人源化抗体、鼠抗体、嵌合单克隆抗体、小鼠-人类单克隆抗体、小鼠-灵长类动物单克隆抗体、灵长类动物-人类单克隆抗体、抗独特型抗体、抗体片段(诸如(例如)scFv、(scFv)2、Fab、Fab'和F(ab')2、F(ab1)2、Fv、dAb和Fd片段)、双体和抗体相关多肽。抗体包括双特异性抗体和多特异性抗体,只要它们表现出所需的生物活性或功能。
术语“个体”、“受试者”、“宿主”和“患者”在本文中可互换使用并且是指希望诊断、治疗或疗法的任何哺乳动物受试者,具体是人。本文所述的组合物和方法适用于人的疗法和兽医应用。在一些方面,受试者是哺乳动物,并且在其他方面,受试者是人。如本文所用,“哺乳动物受试者”包括所有哺乳动物,包括但不限于人、家畜(例如,狗、猫等)、农场动物(例如,牛、绵羊、猪、马等)和实验室动物(例如,猴子、大鼠、小鼠、兔、豚鼠等)。
术语“药物组合物”是指以允许活性成分的生物活性有效的形式的制剂,并且其不含有对将施用组合物的受试者具有不可接受的毒性的其他组分。这种组合物可为无菌的。
如本文所用,术语“基本上不含”是指包含EV(例如,外泌体)的样品包含按质量/体积(m/v)百分比浓度计小于10%的大分子。一些级分可含有少于0.001%、少于0.01%、少于0.05%、少于0.1%、少于0.2%、少于0.3%、少于0.4%、少于0.5%、少于0.6%、少于0.7%、少于0.8%、少于0.9%、少于1%、少于2%、少于3%、少于4%、少于5%、少于6%、少于7%、少于8%、少于9%或少于10%(m/v)的大分子。
如本文所用,术语“大分子”意指核酸、污染物蛋白质、脂质、碳水化合物、代谢物或它们的组合。
如本文所用,术语“常规外泌体蛋白”意指此前已知富集于外泌体中的蛋白质,所述蛋白质包括但不限于CD9、CD63、CD81、PDGFR、GPI锚定蛋白、乳凝集素(MFGE8)、LAMP2和LAMP2B、它们的片段、或与它们结合的肽。
如本文所用,“施用”意指通过药学上可接受的途径向给予受试者包含本文所公开的EV(例如,外泌体)的组合物。施用途径可以是静脉内的,例如,静脉内注射和静脉内输注。其他施用途径包括例如皮下、肌内、口服、鼻腔和肺部施用。EV(例如,外泌体)可作为包含至少一种赋形剂的药物组合物的一部分施用。
例如,如本文所公开的ASO或细胞外囊泡的“有效量”是足以实现特别陈述的目的的量。“有效量”可根据所述目的以经验和常规方式确定。
如本文所用,术语“治疗(treat)”、“治疗(treatment)”或“治疗(treating)”是指例如疾病或疾患的严重度降低;病程持续时间的缩短;与疾病或疾患相关的一种或多种症状的改善或消除;向患有疾病或疾患的受试者提供有益作用,但不一定治愈所述疾病或疾患。该术语还包括疾病或疾患或其症状的防御或预防。在一个方面,或“治疗(treating)”或“治疗(treatment)”包括在有需要的受试者中诱导造血。在一些方面,所述疾病或疾患与造血或其缺陷相关。在某些方面,所述疾病或疾患是癌症。在一些方面,治疗增强患有癌症的受试者的造血,其中增强的造血包括受试者中一种或多种免疫细胞的增殖和/或分化增加。
如本文所用,术语“预防(prevent)”或“预防(preventing)”是指减少或降低特定结果的发生或严重度。在一些方面,通过预防性治疗来实现预防结局。在一些方面,将本文所述的包含ASO的EV(例如,外泌体)预防性地施用于受试者。在一些方面,受试者有患癌症的风险。在一些方面,受试者有发展造血障碍的风险。
II.反义寡核苷酸(ASO)
本公开采用反义寡核苷酸(ASO)用于调节编码哺乳动物KRAS的核酸分子(诸如KRAS核酸,例如KRAS转录物,包括KRAS前体mRNA和KRAS mRNA)或编码哺乳动物KRAS的此类核酸分子的天然存在的变体的功能。在本公开的上下文中,术语“ASO”是指由两个或更多个核苷酸(即,寡核苷酸)的共价连接形成的分子。
本公开的ASO包含长度为约10至约30个,诸如10-20个、14-20个、16-20个或15-25个核苷酸的连续核苷酸序列。在某些方面,ASO的长度为20个核苷酸。在某些方面,ASO的长度为18个核苷酸。在某些方面,ASO的长度为19个核苷酸。在某些方面,ASO的长度为17个核苷酸。在某些方面,ASO的长度为16个核苷酸。在某些方面,ASO的长度为15个核苷酸。在本公开别处提供了与ASO长度有关的其他公开内容(参见,例如,章节II.C“ASO长度”)。如本文所用,术语“反义ASO”、“反义寡核苷酸”和“寡聚体”可与术语“ASO”互换。可用于本公开的ASO不是天然存在的,也不能在自然界中找到。在一些方面,ASO是化学修饰的。
提及SEQ ID编号包括特定的核碱基序列,但不包括任何设计或完整的化学结构。此外,除非另外指明,否则显示的与本文所公开的ASO相关的任何设计都不是限制性的。例如,当权利要求(或本说明书)提及SEQ ID NO:4时,它仅包括tcagctccaactac的核苷酸序列。本文所公开的任何ASO的设计都可写成,例如,SEQ ID NO:4,其中从5’端起第一个核苷酸、第二个核苷酸、第三个核苷酸、第12个核苷酸、第13个核苷酸和第14个核苷酸是修饰的核苷酸(例如,LNA),其他每个核苷酸是未修饰的核苷酸(例如,DNA)。
在各个方面,本公开的ASO不包含RNA(单元)。在一些方面,ASO包含一个或多个DNA单元。在一个方面,根据本公开的ASO是线性分子或被合成为线性分子。在一些方面,ASO是单链分子,并且不包含与相同ASO内的等效区域(即,双链体)互补的例如至少3、4或5个连续核苷酸的短区域——在这方面,ASO(实质上)不是双链的。在一些方面,ASO实质上不是双链的。在一些方面,ASO不是siRNA。在各个方面,本公开的ASO可完全由连续核苷酸区域组成。因此,在一些方面,ASO基本上不是自互补的。
在其他方面,本公开包括ASO的片段。例如,本公开包括本文所公开的ASO的至少一个核苷酸、至少两个连续核苷酸、至少三个连续核苷酸、至少四个连续核苷酸、至少五个连续核苷酸、至少六个连续核苷酸、至少七个连续核苷酸、至少八个连续核苷酸或至少九个连续核苷酸。本文所公开的任何序列的片段都被认为是本公开的一部分。
在一些方面,用于本公开的ASO包括磷酰二胺吗啉代寡聚物(PMO)或肽缀合的磷酰二胺吗啉代寡聚物(PPMO)。
II.A.靶标
合适地,本公开的ASO能够下调(例如,减少或抑制)KRAS mRNA或蛋白质的表达。在这方面,本公开的ASO可通过降低KRAS mRNA水平,通常是在哺乳动物细胞,诸如人细胞,诸如肿瘤细胞中的水平来影响对KRAS蛋白的间接抑制。在一些方面,本公开涉及靶向KRAS前体mRNA的一个或多个区域(例如,内含子区域、外显子区域和/或外显子-内含子接合区域)的ASO。在另外的方面,本文所公开的ASO可靶向KRAS mRNA的区域。除非另外指明,如本文所用的术语“KRAS”可指来自一种或多种物种(例如,人、非人灵长类动物、狗、猫、豚鼠、兔、大鼠、小鼠、马、牛和熊)的KRAS。此外,除非另外指明,否则术语“KRAS”可指野生型或其变体形式(例如,包含G12D氨基酸取代)。因此,在某些方面,本文所公开的ASO能够下调野生型KRASmRNA(或其编码的蛋白质)在细胞(例如,胰腺癌细胞)中的表达。在一些方面,本文所公开的ASO能够下调变体KRAS mRNA(或其编码的蛋白质)(例如,包含G12D突变)在细胞(例如,胰腺癌细胞)中的表达。在一些方面,本文所公开的ASO能够下调野生型KRAS mRNA和变体KRASmRNA(例如,包含G12D突变)(或其编码的蛋白质)在细胞(例如,胰腺癌细胞)中的表达。
不受任何一种理论的束缚,在一些方面,KRAS mRNA表达(或其编码的蛋白质)的下调导致细胞活力、细胞增殖或两者降低。因此,在一些方面,本文所公开的ASO能够降低表达KRAS转录物(例如,mRNA)的细胞的活力、增殖或两者。在一些方面,细胞表达异常的KRAS活性或者包含KRAS转录物变体,诸如KRAS G12D mRNA。在一些方面,细胞的活力、增殖或两者与未用ASO处理的对应细胞的活力、增殖或两者相比降低至少约5%、至少约10%、至少约20%、至少约30%、至少约40%、至少约50%、至少约60%、至少约70%、至少约80%、至少约90%或约100%。
Kirsten大鼠肉瘤病毒致癌基因同源物(KRAS)是鸟苷5-三磷酸酶(GTPase)蛋白超家族的成员,所述蛋白还包括NRAS和HRAS。该超家族成员的主要作用是将来自上游细胞表面受体(例如,EGFR、FGFR和ERBB2-4)的信号传递到下游增殖和存活途径,诸如RAF-MEK-ERK、PI3K-AKT-mTOR和RALGDS-RA。Adderley,H.等人,EBioMedicine 41:711-716(2019)。KRAS突变与许多类型的癌症有关,包括超过90%的胰腺癌、35%-45%的结肠直肠癌和大约25%的肺癌。Zeitouni,D.等人,Cancers 8(4):45(2016);Tan,C.等人,World JGastroenterol 18(37):5171-5180(2012);和Roman,M.等人,Molecular Cancer 17:33(2018)。KRAS突变也与极差的预后(例如,胰腺癌的5年存活率为约9%)相关,并且许多具有KRAS突变的患者对各种癌症疗法具有抗性。Del Re,M.等人,Oncotarget 9(5):6630-6643(2017)。因此,对于与KRAS突变相关的癌症,需要新的和改进的治疗选择。如本文所述,本公开提供了可用于治疗与异常KRAS活性相关的癌症的ASO和包含此类ASO的EV(例如,外泌体)。
KRAS在本领域中有多个名称。这些名称包括:KRAS原癌基因、GTPase;V-Ki-Ras2Kirsten大鼠肉瘤2病毒致癌基因同源物;GTP酶KRas;C-Ki-Ras;K-Ras 2;KRAS2;RASK2;V-Ki-Ras2 Kirsten大鼠肉瘤病毒致癌基因同源物;Kirsten大鼠肉瘤病毒原癌基因;细胞转化原癌基因;细胞C-Ki-Ras2原癌基因;转化蛋白P21;PR310C-K-Ras致癌基因;C-Kirsten-Ras蛋白;K-Ras P21蛋白;和致癌基因KRAS2。
人KRAS基因的序列可见于染色体位置12p12.1和公开获得的GenBank登录号NC_000012(25,204,789–25,250,936)。人野生型KRAS转录物的基因组序列对应于NC_000012(SEQ ID NO:87)的残基25,204,789-25,250,936的反向互补序列。SEQ ID NO:1中提供的KRAS G12D基因组序列与SEQ ID NO:87的不同之处在于其在核苷酸位置5,587处具有鸟嘌呤至腺嘌呤取代。示例性KRAS G12D mRNA序列在SEQ ID NO:3中提供,不同的是SEQ ID NO:3中的核苷酸“t”在该mRNA中显示为“u”。SEQ ID NO:3中提供的KRAS G12D mRNA与野生型mRNA序列(例如,GenBank登录号NM_004985.5;SEQ ID NO:89)的不同之处在于其在核苷酸位置225处具有鸟嘌呤至腺嘌呤取代。人KRAS蛋白的序列可见于公开获得的登录号:P01116(规范序列)、A8K8Z5、B0LPF9、P01118和Q96D10,它们各自以引用方式整体并入本文。
人野生型KRAS蛋白(P01116)有两种同种型,它们是由可变剪接产生。同种型2A(登录号:P01116-1;SEQ ID NO:90)是规范序列。它也被称为K-Ras4A。同种型2B(登录号:P01116-2;也称为K-Ras4B;SEQ ID NO:88)与规范序列的区别如下:(i)151-153:RVE→GVD;和(ii)165-189:QYRLKKISKEEKTPGCVKIKKCIIM→KHKEKMSKDGKKKKKKSKTKCVIM。在一些方面,本文所公开的ASO可降低或抑制KRAS蛋白同种型2A、同种型2B或两者的表达。
表1.示例性KRAS mRNA和蛋白质序列
人KRAS基因产物的天然变体是已知的。例如,人KRAS蛋白的天然变体可含有一个或多个选自以下的氨基酸取代:K5E、K5N、G10GG、G10V、G12A、G12C、G12F、G12I、G12L、G12R、G12S、G12V、G13C、G13D、G13E、G13R、G13V、V14I、L19F、T20M、Q22E、Q22H、Q22K、Q22R、Q25H、N26Y、F28L、E31K、D33E、P34L、P34Q、P34R、I36M、R41K、D57N、T58I、A59T、G60D、G60R、G60S、G60V、Q61A、Q61H、Q61K、Q61L、Q61P、Q61R、E63K、S65N、R68S、Y71H、T74A、L79I、R97I、Q99E、M111L、K117N、K117R、D119G、S122F、T144P、A146P、A146T、A146V、K147E、K147T、R149K、L159S、I163S、R164Q、I183N、I84M或它们的组合。对KRAS蛋白同种型2B特异的天然变体含有一个或多个选自以下的氨基酸取代:V152G、D153V、F156I、F156L或它们的组合。本公开的ASO可设计成降低或抑制KRAS蛋白的一种或多种变体(例如,本领域中已知的任何变体和/或本文所述的那些)的表达。如本文所证明的,在一些方面,本文所述的ASO可降低或抑制野生型KRAS蛋白的表达。在一些方面,KRAS突变体具有G12D的氨基酸取代。在一些方面,本公开的ASO靶向一种或多种KRAS突变体。在其他方面,ASO靶向的KRAS突变体是KRAS G12D(SEQID NO:2)。在一些方面,本公开的ASO可靶向具有G12C氨基酸取代的KRAS突变体。在一些方面,本公开的ASO可靶向具有G12V氨基酸取代的KRAS突变体。在一些方面,本公开的ASO可靶向具有G13D突变体的KRAS突变体。虽然KRAS G12D突变体用于描述本公开的各个方面,但对本领域技术人员来说显而易见的是,本文所提供的公开内容同样适用于其他KRAS突变体(例如,上文描述的那些)。
如本文所用,术语“KRAS突变体”和“KRAS变体”可互换使用,并且是指在序列上不同于野生型KRAS转录物和/或蛋白质(例如,SEQ ID NO:87-90)的KRAS。例如,KRAS突变体包含上述任何取代。因此,术语“KRAS突变转录物”是指与野生型KRAS转录物相比包含一个或多个突变的KRAS转录物(例如,mRNA)。类似地,术语“KRAS突变蛋白”是指与野生型KRAS蛋白相比包含一个或多个突变(例如,上述那些)的KRAS蛋白。如本文所用,当ASO“与KRAS突变转录物的核酸序列区域互补”时,所述区域包含KRAS突变转录物的特定突变/变体(例如,上述那些)。因此,本文所公开的ASO并非设计用来特异性靶向野生型KRAS转录物。
在一些方面,本文所公开的ASO的靶核酸序列包含KRAS前体mRNA的一个或多个区域。例如,SEQ ID NO:1(如上所述)与KRAS G12D前体mRNA序列相同,不同的是SEQ ID NO:1中的核苷酸“t”在前体mRNA中显示为“u”。如本文所用,术语“靶核酸序列”是指与本文所公开的ASO互补的核酸序列。在某些方面,靶核酸序列包含编码KRAS蛋白的核酸或其天然存在的变体的外显子区,以及源自其的RNA核酸,例如,前体mRNA。在一些方面,靶核酸序列包含编码KRAS蛋白的核酸或其天然存在的变体的内显子区,以及源自其的RNA核酸,例如,前体mRNA。在另外的方面,靶核酸序列包含编码KRAS蛋白的核酸或其天然存在的变体的外显子-内含子接合点,以及源自其的RNA核酸,例如,前体mRNA。在一些方面,例如,当用于研究或诊断时,靶核酸可以是源自本文所述的DNA或RNA核酸靶标的cDNA或合成寡核苷酸。在一些方面,靶核酸包含编码KRAS蛋白的核酸或其天然存在的变体的非翻译区,例如,5'UTR、3'UTR或两者。
因此,在一些方面,本文所公开的ASO与KRAS转录物(例如,SEQ ID NO:1)的外显子区域杂交。在一些方面,本公开的ASO与KRAS转录物(例如,SEQ ID NO:1)的内含子区域杂交。在一些方面,ASO与KRAS转录物(例如,SEQ ID NO:1)的外显子-内含子接合点杂交。在一些方面,本公开的ASO与KRAS转录物(例如,SEQ ID NO:1)内的区域(例如,内含子、外显子或外显子-内含子接合点)杂交,其中ASO具有本文别处所述的设计(例如,章节II.G)。
在一些方面,本文所公开的ASO的靶核酸序列是KRAS mRNA,例如,SEQ ID NO:3。因此,在某些方面,本文所公开的ASO可与KRAS mRNA的一个或多个区域杂交。在一些方面,本公开的ASO靶向编码KRAS蛋白的特定同种型(例如,同种型2A或同种型2B)的mRNA。在某些方面,本文所公开的ASO可靶向KRAS蛋白的所有同种型,包括其任何变体(例如,本文所述的那些)。在一些方面,可被本公开的ASO靶向的KRAS蛋白包含G12D氨基酸取代。
在一些方面,本公开的ASO包含与KRAS转录物(例如,SEQ ID NO:1或SEQ ID NO:3)内的核酸序列互补的连续核苷酸序列(例如,长度为10至30个核苷酸)。
在一些方面,ASO包含与KRAS转录物的核酸序列或该序列内的区域(“靶区”)杂交的连续核苷酸序列,其中所述核酸序列对应于SEQ ID NO:1的核苷酸5,468至5,706。在一些方面,ASO任选地具有本文所述的设计之一或本文别处所示的化学结构(例如,图1)。在一些方面,靶区对应于SEQ ID NO:1的核苷酸5,568至5,606。在一些方面,靶区对应于SEQ IDNO:1的核苷酸5,518至5,656。在一些方面,靶区对应于核苷酸SEQ ID NO:1的5,568至5,606在3'端和/或5'端的±10、±20、±30、±40、±50、±60、±70、±80或±90个核苷酸。
在一些方面,ASO包含与KRAS转录物的核酸序列或该序列内的区域(“靶区”)杂交的连续核苷酸序列,其中所述核酸序列对应于SEQ ID NO:3的核苷酸106至344。在某些方面,ASO任选地具有本文所述的设计之一(例如,章节II.G)或本文别处所示的化学结构(例如,图1)。在一些方面,靶区对应于SEQ ID NO:3的核苷酸206至244。在一些方面,靶区对应于SEQ ID NO:3的核苷酸256至299。在一些方面,靶区对应于SEQ ID NO:3的核苷酸206至244在3'端和/或5'端的±10、±20、±30、±40、±50、±60、±70、±80或±90个核苷酸。
在一些方面,靶区对应于SEQ ID NO:3的核苷酸212-225(例如,ASO-0004;SEQ IDNO:4)。在一些方面,靶区对应于SEQ ID NO:3的核苷酸213-226(例如,ASO-0005;SEQ IDNO:5)。在一些方面,靶区对应于SEQ ID NO:3的核苷酸214-227(例如,ASO-0006;SEQ IDNO:6)。在一些方面,靶区对应于SEQ ID NO:3的核苷酸215-228(例如,ASO-0007;SEQ IDNO:7)。在一些方面,靶区对应于SEQ ID NO:3的核苷酸216-229(例如,ASO-0008;SEQ IDNO:8)。在一些方面,靶区对应于SEQ ID NO:3的核苷酸217-230(例如,ASO-0009;SEQ IDNO:9)。在一些方面,靶区对应于SEQ ID NO:3的核苷酸218-231(例如,ASO-0010;SEQ IDNO:10)。在一些方面,靶区对应于SEQ ID NO:3的核苷酸219-232(例如,ASO-0011;SEQ IDNO:11)。在一些方面,靶区对应于SEQ ID NO:3的核苷酸220-233(例如,ASO-0012;SEQ IDNO:12)。在一些方面,靶区对应于SEQ ID NO:3的核苷酸221-234(例如,ASO-0013;SEQ IDNO:13)。在一些方面,靶区对应于SEQ ID NO:3的核苷酸222-235(例如,ASO-0014;SEQ IDNO:14)。在一些方面,靶区对应于SEQ ID NO:3的核苷酸223-236(例如,ASO-0015;SEQ IDNO:15)。在一些方面,靶区对应于SEQ ID NO:3的核苷酸224-237(例如,ASO-0016;SEQ IDNO:16)。在一些方面,靶区对应于SEQ ID NO:3的核苷酸225-238(例如,ASO-0017;SEQ IDNO:17)。在一些方面,靶区对应于SEQ ID NO:3的核苷酸211-225(例如,ASO-0018;SEQ IDNO:18)。在一些方面,靶区对应于SEQ ID NO:3的核苷酸212-226(例如,ASO-0019;SEQ IDNO:19)。在一些方面,靶区对应于SEQ ID NO:3的核苷酸213-227(例如,ASO-0020;SEQ IDNO:20)。在一些方面,靶区对应于SEQ ID NO:3的核苷酸214-228(例如,ASO-0021;SEQ IDNO:21)。在一些方面,靶区对应于SEQ ID NO:3的核苷酸215-229(例如,ASO-0022;SEQ IDNO:22)。在一些方面,靶区对应于SEQ ID NO:3的核苷酸216-230(例如,ASO-0023;SEQ IDNO:23)。在一些方面,靶区对应于SEQ ID NO:3的核苷酸217-231(例如,ASO-0024;SEQ IDNO:24)。在一些方面,靶区对应于SEQ ID NO:3的核苷酸218-232(例如,ASO-0025;SEQ IDNO:25)。在一些方面,靶区对应于SEQ ID NO:3的核苷酸219-233(例如,ASO-0026;SEQ IDNO:26)。在一些方面,靶区对应于SEQ ID NO:3的核苷酸220-234(例如,ASO-0027;SEQ IDNO:27)。在一些方面,靶区对应于SEQ ID NO:3的核苷酸221-235(例如,ASO-0028;SEQ IDNO:28)。在一些方面,靶区对应于SEQ ID NO:3的核苷酸222-236(例如,ASO-0029;SEQ IDNO:29)。在一些方面,靶区对应于SEQ ID NO:3的核苷酸223-237(例如,ASO-0030;SEQ IDNO:30)。在一些方面,靶区对应于SEQ ID NO:3的核苷酸224-238(例如,ASO-0031;SEQ IDNO:31)。在一些方面,靶区对应于SEQ ID NO:3的核苷酸225-239(例如,ASO-0032;SEQ IDNO:32)。在一些方面,靶区对应于SEQ ID NO:3的核苷酸210-225(例如,ASO-0033;SEQ IDNO:33)。在一些方面,靶区对应于SEQ ID NO:3的核苷酸211-226(例如,ASO-0034;SEQ IDNO:34)。在一些方面,靶区对应于SEQ ID NO:3的核苷酸212-227(例如,ASO-0035;SEQ IDNO:35)。在一些方面,靶区对应于SEQ ID NO:3的核苷酸213-228(例如,ASO-0036;SEQ IDNO:36)。在一些方面,靶区对应于SEQ ID NO:3的核苷酸214-229(例如,ASO-0037;SEQ IDNO:37)。在一些方面,靶区对应于SEQ ID NO:3的核苷酸215-230(例如,ASO-0038;SEQ IDNO:38)。在一些方面,靶区对应于SEQ ID NO:3的核苷酸216-231(例如,ASO-0039;SEQ IDNO:39)。在一些方面,靶区对应于SEQ ID NO:3的核苷酸217-232(例如,ASO-0040;SEQ IDNO:40)。在一些方面,靶区对应于SEQ ID NO:3的核苷酸218-233(例如,ASO-0041;SEQ IDNO:41)。在一些方面,靶区对应于SEQ ID NO:3的核苷酸219-234(例如,ASO-0042;SEQ IDNO:42)。在一些方面,靶区对应于SEQ ID NO:3的核苷酸220-235(例如,ASO-0043;SEQ IDNO:43)。在一些方面,靶区对应于SEQ ID NO:3的核苷酸221-236(例如,ASO-0044;SEQ IDNO:44)。在一些方面,靶区对应于SEQ ID NO:3的核苷酸222-237(例如,ASO-0045;SEQ IDNO:45)。在一些方面,靶区对应于SEQ ID NO:3的核苷酸223-238(例如,ASO-0046;SEQ IDNO:46)。在一些方面,靶区对应于SEQ ID NO:3的核苷酸224-239(例如,ASO-0047;SEQ IDNO:47)。在一些方面,靶区对应于SEQ ID NO:3的核苷酸225-240(例如,ASO-0048;SEQ IDNO:48)。在一些方面,靶区对应于SEQ ID NO:3的核苷酸209-225(例如,ASO-0049;SEQ IDNO:49)。在一些方面,靶区对应于SEQ ID NO:3的核苷酸210-226(例如,ASO-0050;SEQ IDNO:50)。在一些方面,靶区对应于SEQ ID NO:3的核苷酸211-227(例如,ASO-0051;SEQ IDNO:51)。在一些方面,靶区对应于SEQ ID NO:3的核苷酸212-228(例如,ASO-0052;SEQ IDNO:52)。在一些方面,靶区对应于SEQ ID NO:3的核苷酸213-229(例如,ASO-0053;SEQ IDNO:53)。在一些方面,靶区对应于SEQ ID NO:3的核苷酸214-230(例如,ASO-0054;SEQ IDNO:54)。在一些方面,靶区对应于SEQ ID NO:3的核苷酸215-231(例如,ASO-0055;SEQ IDNO:55)。在一些方面,靶区对应于SEQ ID NO:3的核苷酸216-232(例如,ASO-0056;SEQ IDNO:56)。在一些方面,靶区对应于SEQ ID NO:3的核苷酸217-233(例如,ASO-0057;SEQ IDNO:57)。在一些方面,靶区对应于SEQ ID NO:3的核苷酸218-234(例如,ASO-0058;SEQ IDNO:58)。在一些方面,靶区对应于SEQ ID NO:3的核苷酸219-235(例如,ASO-0059;SEQ IDNO:59)。在一些方面,靶区对应于SEQ ID NO:3的核苷酸220-236(例如,ASO-0060;SEQ IDNO:60)。在一些方面,靶区对应于SEQ ID NO:3的核苷酸221-237(例如,ASO-0061;SEQ IDNO:61)。在一些方面,靶区对应于SEQ ID NO:3的核苷酸222-238(例如,ASO-0062;SEQ IDNO:62)。在一些方面,靶区对应于SEQ ID NO:3的核苷酸223-239(例如,ASO-0063;SEQ IDNO:63)。在一些方面,靶区对应于SEQ ID NO:3的核苷酸224-240(例如,ASO-0064;SEQ IDNO:64)。在一些方面,靶区对应于SEQ ID NO:3的核苷酸225-241(例如,ASO-0065;SEQ IDNO:65)。在一些方面,靶区对应于SEQ ID NO:3的核苷酸206-225(例如,ASO-0066;SEQ IDNO:66)。在一些方面,靶区对应于SEQ ID NO:3的核苷酸207-226(例如,ASO-0067;SEQ IDNO:67)。在一些方面,靶区对应于SEQ ID NO:3的核苷酸208-227(例如,ASO-0068;SEQ IDNO:68)。在一些方面,靶区对应于SEQ ID NO:3的核苷酸209-228(例如,ASO-0069;SEQ IDNO:69)。在一些方面,靶区对应于SEQ ID NO:3的核苷酸210-229(例如,ASO-0070;SEQ IDNO:70)。在一些方面,靶区对应于SEQ ID NO:3的核苷酸211-230(例如,ASO-0071;SEQ IDNO:71)。在一些方面,靶区对应于SEQ ID NO:3的核苷酸212-231(例如,ASO-0072;SEQ IDNO:72)。在一些方面,靶区对应于SEQ ID NO:3的核苷酸213-232(例如,ASO-0073;SEQ IDNO:73)。在一些方面,靶区对应于SEQ ID NO:3的核苷酸214-233(例如,ASO-0074;SEQ IDNO:74)。在一些方面,靶区对应于SEQ ID NO:3的核苷酸215-234(例如,ASO-0075;SEQ IDNO:75)。在一些方面,靶区对应于SEQ ID NO:3的核苷酸216-235(例如,ASO-0076;SEQ IDNO:76)。在一些方面,靶区对应于SEQ ID NO:3的核苷酸217-236(例如,ASO-0077;SEQ IDNO:77)。在一些方面,靶区对应于SEQ ID NO:3的核苷酸218-237(例如,ASO-0078;SEQ IDNO:78)。在一些方面,靶区对应于SEQ ID NO:3的核苷酸219-238(例如,ASO-0079;SEQ IDNO:79)。在一些方面,靶区对应于SEQ ID NO:3的核苷酸220-239(例如,ASO-0080;SEQ IDNO:80)。在一些方面,靶区对应于SEQ ID NO:3的核苷酸221-240(例如,ASO-0081;SEQ IDNO:81)。在一些方面,靶区对应于SEQ ID NO:3的核苷酸222-241(例如,ASO-0082;SEQ IDNO:82)。在一些方面,靶区对应于SEQ ID NO:3的核苷酸223-242(例如,ASO-0083;SEQ IDNO:83)。在一些方面,靶区对应于SEQ ID NO:3的核苷酸224-243(例如,ASO-0084;SEQ IDNO:84)。在一些方面,靶区对应于SEQ ID NO:3的核苷酸225-244(例如,ASO-0085;SEQ IDNO:85)。
在一些方面,靶区对应于SEQ ID NO:3的核苷酸212-225(例如,ASO-0004;SEQ IDNO:4)在3'端和/或5’端的±10、±20、±30、±40、±50、±60、±70、±80或±90个核苷酸。在一些方面,靶区对应于SEQ ID NO:3的核苷酸213-226(例如,ASO-0005;SEQ ID NO:5)在3'端和/或5’端的±10、±20、±30、±40、±50、±60、±70、±80或±90个核苷酸。在一些方面,靶区对应于SEQ ID NO:3的核苷酸214-227(例如,ASO-0006;SEQ ID NO:6)在3'端和/或5’端的±10、±20、±30、±40、±50、±60、±70、±80或±90个核苷酸。在一些方面,靶区对应于SEQ ID NO:3的核苷酸215-228(例如,ASO-0007;SEQ ID NO:7)在3'端和/或5’端的±10、±20、±30、±40、±50、±60、±70、±80或±90个核苷酸。在一些方面,靶区对应于SEQID NO:3的核苷酸216-229(例如,ASO-0008;SEQ ID NO:8)在3'端和/或5’端的±10、±20、±30、±40、±50、±60、±70、±80或±90个核苷酸。在一些方面,靶区对应于SEQ ID NO:3的核苷酸217-230(例如,ASO-0009;SEQ ID NO:9)在3'端和/或5’端的±10、±20、±30、±40、±50、±60、±70、±80或±90个核苷酸。在一些方面,靶区对应于SEQ ID NO:3的核苷酸218-231(例如,ASO-0010;SEQ ID NO:10)在3'端和/或5’端的±10、±20、±30、±40、±50、±60、±70、±80或±90个核苷酸。在一些方面,靶区对应于SEQ ID NO:3的核苷酸219-232(例如,ASO-0011;SEQ ID NO:11)在3'端和/或5’端的±10、±20、±30、±40、±50、±60、±70、±80或±90个核苷酸。在一些方面,靶区对应于SEQ ID NO:3的核苷酸220-233(例如,ASO-0012;SEQ ID NO:12)在3'端和/或5’端的±10、±20、±30、±40、±50、±60、±70、±80或±90个核苷酸。在一些方面,靶区对应于SEQ ID NO:3的核苷酸221-234(例如,ASO-0013;SEQ ID NO:13)在3'端和/或5’端的±10、±20、±30、±40、±50、±60、±70、±80或±90个核苷酸。在一些方面,靶区对应于SEQ ID NO:3的核苷酸222-235(例如,ASO-0014;SEQ ID NO:14)在3'端和/或5’端的±10、±20、±30、±40、±50、±60、±70、±80或±90个核苷酸。在一些方面,靶区对应于SEQ ID NO:3的核苷酸223-236(例如,ASO-0015;SEQ IDNO:15)在3'端和/或5’端的±10、±20、±30、±40、±50、±60、±70、±80或±90个核苷酸。在一些方面,靶区对应于SEQ ID NO:3的核苷酸224-237(例如,ASO-0016;SEQ ID NO:16)在3'端和/或5’端的±10、±20、±30、±40、±50、±60、±70、±80或±90个核苷酸。在一些方面,靶区对应于SEQ ID NO:3的核苷酸225-238(例如,ASO-0017;SEQ ID NO:17)在3'端和/或5’端的±10、±20、±30、±40、±50、±60、±70、±80或±90个核苷酸。在一些方面,靶区对应于SEQ ID NO:3的核苷酸211-225(例如,ASO-0018;SEQ ID NO:18)在3'端和/或5’端的±10、±20、±30、±40、±50、±60、±70、±80或±90个核苷酸。在一些方面,靶区对应于SEQ ID NO:3的核苷酸212-226(例如,ASO-0019;SEQ ID NO:19)在3'端和/或5’端的±10、±20、±30、±40、±50、±60、±70、±80或±90个核苷酸。在一些方面,靶区对应于SEQ IDNO:3的核苷酸213-227(例如,ASO-0020;SEQ ID NO:20)在3'端和/或5’端的±10、±20、±30、±40、±50、±60、±70、±80或±90个核苷酸。在一些方面,靶区对应于SEQ ID NO:3的核苷酸214-228(例如,ASO-0021;SEQ ID NO:21)在3'端和/或5’端的±10、±20、±30、±40、±50、±60、±70、±80或±90个核苷酸。在一些方面,靶区对应于SEQ ID NO:3的核苷酸215-229(例如,ASO-0022;SEQ ID NO:22)在3'端和/或5’端的±10、±20、±30、±40、±50、±60、±70、±80或±90个核苷酸。在一些方面,靶区对应于SEQ ID NO:3的核苷酸216-230(例如,ASO-0023;SEQ ID NO:23)在3'端和/或5’端的±10、±20、±30、±40、±50、±60、±70、±80或±90个核苷酸。在一些方面,靶区对应于SEQ ID NO:3的核苷酸217-231(例如,ASO-0024;SEQ ID NO:24)在3'端和/或5’端的±10、±20、±30、±40、±50、±60、±70、±80或±90个核苷酸。在一些方面,靶区对应于SEQ ID NO:3的核苷酸218-232(例如,ASO-0025;SEQ ID NO:25)在3'端和/或5’端的±10、±20、±30、±40、±50、±60、±70、±80或±90个核苷酸。在一些方面,靶区对应于SEQ ID NO:3的核苷酸219-233(例如,ASO-0026;SEQ ID NO:26)在3'端和/或5’端的±10、±20、±30、±40、±50、±60、±70、±80或±90个核苷酸。在一些方面,靶区对应于SEQ ID NO:3的核苷酸220-234(例如,ASO-0027;SEQ IDNO:27)在3'端和/或5’端的±10、±20、±30、±40、±50、±60、±70、±80或±90个核苷酸。在一些方面,靶区对应于SEQ ID NO:3的核苷酸221-235(例如,ASO-0028;SEQ ID NO:28)在3'端和/或5’端的±10、±20、±30、±40、±50、±60、±70、±80或±90个核苷酸。在一些方面,靶区对应于SEQ ID NO:3的核苷酸222-236(例如,ASO-0029;SEQ ID NO:29)在3'端和/或5’端的±10、±20、±30、±40、±50、±60、±70、±80或±90个核苷酸。在一些方面,靶区对应于SEQ ID NO:3的核苷酸223-237(例如,ASO-0030;SEQ ID NO:30)在3'端和/或5’端的±10、±20、±30、±40、±50、±60、±70、±80或±90个核苷酸。在一些方面,靶区对应于SEQ ID NO:3的核苷酸224-238(例如,ASO-0031;SEQ ID NO:31)在3'端和/或5’端的±10、±20、±30、±40、±50、±60、±70、±80或±90个核苷酸。在一些方面,靶区对应于SEQ IDNO:3的核苷酸225-239(例如,ASO-0032;SEQ ID NO:32)在3'端和/或5’端的±10、±20、±30、±40、±50、±60、±70、±80或±90个核苷酸。在一些方面,靶区对应于SEQ ID NO:3的核苷酸210-225(例如,ASO-0033;SEQ ID NO:33)在3'端和/或5’端的±10、±20、±30、±40、±50、±60、±70、±80或±90个核苷酸。在一些方面,靶区对应于SEQ ID NO:3的核苷酸211-226(例如,ASO-0034;SEQ ID NO:34)在3'端和/或5’端的±10、±20、±30、±40、±50、±60、±70、±80或±90个核苷酸。在一些方面,靶区对应于SEQ ID NO:3的核苷酸212-227(例如,ASO-0035;SEQ ID NO:35)在3'端和/或5’端的±10、±20、±30、±40、±50、±60、±70、±80或±90个核苷酸。在一些方面,靶区对应于SEQ ID NO:3的核苷酸213-228(例如,ASO-0036;SEQ ID NO:36)在3'端和/或5’端的±10、±20、±30、±40、±50、±60、±70、±80或±90个核苷酸。在一些方面,靶区对应于SEQ ID NO:3的核苷酸214-229(例如,ASO-0037;SEQ ID NO:37)在3'端和/或5’端的±10、±20、±30、±40、±50、±60、±70、±80或±90个核苷酸。在一些方面,靶区对应于SEQ ID NO:3的核苷酸215-230(例如,ASO-0038;SEQ ID NO:38)在3'端和/或5’端的±10、±20、±30、±40、±50、±60、±70、±80或±90个核苷酸。在一些方面,靶区对应于SEQ ID NO:3的核苷酸216-231(例如,ASO-0039;SEQ IDNO:39)在3'端和/或5’端的±10、±20、±30、±40、±50、±60、±70、±80或±90个核苷酸。在一些方面,靶区对应于SEQ ID NO:3的核苷酸217-232(例如,ASO-0040;SEQ ID NO:40)在3'端和/或5’端的±10、±20、±30、±40、±50、±60、±70、±80或±90个核苷酸。在一些方面,靶区对应于SEQ ID NO:3的核苷酸218-233(例如,ASO-0041;SEQ ID NO:41)在3'端和/或5’端的±10、±20、±30、±40、±50、±60、±70、±80或±90个核苷酸。在一些方面,靶区对应于SEQ ID NO:3的核苷酸219-234(例如,ASO-0042;SEQ ID NO:42)在3'端和/或5’端的±10、±20、±30、±40、±50、±60、±70、±80或±90个核苷酸。在一些方面,靶区对应于SEQ ID NO:3的核苷酸220-235(例如,ASO-0043;SEQ ID NO:43)在3'端和/或5’端的±10、±20、±30、±40、±50、±60、±70、±80或±90个核苷酸。在一些方面,靶区对应于SEQ IDNO:3的核苷酸221-236(例如,ASO-0044;SEQ ID NO:44)在3'端和/或5’端的±10、±20、±30、±40、±50、±60、±70、±80或±90个核苷酸。在一些方面,靶区对应于SEQ ID NO:3的核苷酸222-237(例如,ASO-0045;SEQ ID NO:45)在3'端和/或5’端的±10、±20、±30、±40、±50、±60、±70、±80或±90个核苷酸。在一些方面,靶区对应于SEQ ID NO:3的核苷酸223-238(例如,ASO-0046;SEQ ID NO:46)在3'端和/或5’端的±10、±20、±30、±40、±50、±60、±70、±80或±90个核苷酸。在一些方面,靶区对应于SEQ ID NO:3的核苷酸224-239(例如,ASO-0047;SEQ ID NO:47)在3'端和/或5’端的±10、±20、±30、±40、±50、±60、±70、±80或±90个核苷酸。在一些方面,靶区对应于SEQ ID NO:3的核苷酸225-240(例如,ASO-0048;SEQ ID NO:48)在3'端和/或5’端的±10、±20、±30、±40、±50、±60、±70、±80或±90个核苷酸。在一些方面,靶区对应于SEQ ID NO:3的核苷酸209-225(例如,ASO-0049;SEQ ID NO:49)在3'端和/或5’端的±10、±20、±30、±40、±50、±60、±70、±80或±90个核苷酸。在一些方面,靶区对应于SEQ ID NO:3的核苷酸210-226(例如,ASO-0050;SEQ ID NO:50)在3'端和/或5’端的±10、±20、±30、±40、±50、±60、±70、±80或±90个核苷酸。在一些方面,靶区对应于SEQ ID NO:3的核苷酸211-227(例如,ASO-0051;SEQ IDNO:51)在3'端和/或5’端的±10、±20、±30、±40、±50、±60、±70、±80或±90个核苷酸。在一些方面,靶区对应于SEQ ID NO:3的核苷酸212-228(例如,ASO-0052;SEQ ID NO:52)在3'端和/或5’端的±10、±20、±30、±40、±50、±60、±70、±80或±90个核苷酸。在一些方面,靶区对应于SEQ ID NO:3的核苷酸213-229(例如,ASO-0053;SEQ ID NO:53)在3'端和/或5’端的±10、±20、±30、±40、±50、±60、±70、±80或±90个核苷酸。在一些方面,靶区对应于SEQ ID NO:3的核苷酸214-230(例如,ASO-0054;SEQ ID NO:54)在3'端和/或5’端的±10、±20、±30、±40、±50、±60、±70、±80或±90个核苷酸。在一些方面,靶区对应于SEQ ID NO:3的核苷酸215-231(例如,ASO-0055;SEQ ID NO:55)在3'端和/或5’端的±10、±20、±30、±40、±50、±60、±70、±80或±90个核苷酸。在一些方面,靶区对应于SEQ IDNO:3的核苷酸216-232(例如,ASO-0056;SEQ ID NO:56)在3'端和/或5’端的±10、±20、±30、±40、±50、±60、±70、±80或±90个核苷酸。在一些方面,靶区对应于SEQ ID NO:3的核苷酸217-233(例如,ASO-0057;SEQ ID NO:57)在3'端和/或5’端的±10、±20、±30、±40、±50、±60、±70、±80或±90个核苷酸。在一些方面,靶区对应于SEQ ID NO:3的核苷酸218-234(例如,ASO-0058;SEQ ID NO:58)在3'端和/或5’端的±10、±20、±30、±40、±50、±60、±70、±80或±90个核苷酸。在一些方面,靶区对应于SEQ ID NO:3的核苷酸219-235(例如,ASO-0059;SEQ ID NO:59)在3'端和/或5’端的±10、±20、±30、±40、±50、±60、±70、±80或±90个核苷酸。在一些方面,靶区对应于SEQ ID NO:3的核苷酸220-236(例如,ASO-0060;SEQ ID NO:60)在3'端和/或5’端的±10、±20、±30、±40、±50、±60、±70、±80或±90个核苷酸。在一些方面,靶区对应于SEQ ID NO:3的核苷酸221-237(例如,ASO-0061;SEQ ID NO:61)在3'端和/或5’端的±10、±20、±30、±40、±50、±60、±70、±80或±90个核苷酸。在一些方面,靶区对应于SEQ ID NO:3的核苷酸222-238(例如,ASO-0062;SEQ ID NO:62)在3'端和/或5’端的±10、±20、±30、±40、±50、±60、±70、±80或±90个核苷酸。在一些方面,靶区对应于SEQ ID NO:3的核苷酸223-239(例如,ASO-0063;SEQ IDNO:63)在3'端和/或5’端的±10、±20、±30、±40、±50、±60、±70、±80或±90个核苷酸。在一些方面,靶区对应于SEQ ID NO:3的核苷酸224-240(例如,ASO-0064;SEQ ID NO:64)在3'端和/或5’端的±10、±20、±30、±40、±50、±60、±70、±80或±90个核苷酸。在一些方面,靶区对应于SEQ ID NO:3的核苷酸225-241(例如,ASO-0065;SEQ ID NO:65)在3'端和/或5’端的±10、±20、±30、±40、±50、±60、±70、±80或±90个核苷酸。在一些方面,靶区对应于SEQ ID NO:3的核苷酸206-225(例如,ASO-0066;SEQ ID NO:66)在3'端和/或5’端的±10、±20、±30、±40、±50、±60、±70、±80或±90个核苷酸。在一些方面,靶区对应于SEQ ID NO:3的核苷酸207-226(例如,ASO-0067;SEQ ID NO:67)在3'端和/或5’端的±10、±20、±30、±40、±50、±60、±70、±80或±90个核苷酸。在一些方面,靶区对应于SEQ IDNO:3的核苷酸208-227(例如,ASO-0068;SEQ ID NO:68)在3'端和/或5’端的±10、±20、±30、±40、±50、±60、±70、±80或±90个核苷酸。在一些方面,靶区对应于SEQ ID NO:3的核苷酸209-228(例如,ASO-0069;SEQ ID NO:69)在3'端和/或5’端的±10、±20、±30、±40、±50、±60、±70、±80或±90个核苷酸。在一些方面,靶区对应于SEQ ID NO:3的核苷酸210-229(例如,ASO-0070;SEQ ID NO:70)在3'端和/或5’端的±10、±20、±30、±40、±50、±60、±70、±80或±90个核苷酸。在一些方面,靶区对应于SEQ ID NO:3的核苷酸211-230(例如,ASO-0071;SEQ ID NO:71)在3'端和/或5’端的±10、±20、±30、±40、±50、±60、±70、±80或±90个核苷酸。在一些方面,靶区对应于SEQ ID NO:3的核苷酸212-231(例如,ASO-0072;SEQ ID NO:72)在3'端和/或5’端的±10、±20、±30、±40、±50、±60、±70、±80或±90个核苷酸。在一些方面,靶区对应于SEQ ID NO:3的核苷酸213-232(例如,ASO-0073;SEQ ID NO:73)在3'端和/或5’端的±10、±20、±30、±40、±50、±60、±70、±80或±90个核苷酸。在一些方面,靶区对应于SEQ ID NO:3的核苷酸214-233(例如,ASO-0074;SEQ ID NO:74)在3'端和/或5’端的±10、±20、±30、±40、±50、±60、±70、±80或±90个核苷酸。在一些方面,靶区对应于SEQ ID NO:3的核苷酸215-234(例如,ASO-0075;SEQ IDNO:75)在3'端和/或5’端的±10、±20、±30、±40、±50、±60、±70、±80或±90个核苷酸。在一些方面,靶区对应于SEQ ID NO:3的核苷酸216-235(例如,ASO-0076;SEQ ID NO:76)在3'端和/或5’端的±10、±20、±30、±40、±50、±60、±70、±80或±90个核苷酸。在一些方面,靶区对应于SEQ ID NO:3的核苷酸217-236(例如,ASO-0077;SEQ ID NO:77)在3'端和/或5’端的±10、±20、±30、±40、±50、±60、±70、±80或±90个核苷酸。在一些方面,靶区对应于SEQ ID NO:3的核苷酸218-237(例如,ASO-0078;SEQ ID NO:78)在3'端和/或5’端的±10、±20、±30、±40、±50、±60、±70、±80或±90个核苷酸。在一些方面,靶区对应于SEQ ID NO:3的核苷酸219-238(例如,ASO-0079;SEQ ID NO:79)在3'端和/或5’端的±10、±20、±30、±40、±50、±60、±70、±80或±90个核苷酸。在一些方面,靶区对应于SEQ IDNO:3的核苷酸220-239(例如,ASO-0080;SEQ ID NO:80)在3'端和/或5’端的±10、±20、±30、±40、±50、±60、±70、±80或±90个核苷酸。在一些方面,靶区对应于SEQ ID NO:3的核苷酸221-240(例如,ASO-0081;SEQ ID NO:81)在3'端和/或5’端的±10、±20、±30、±40、±50、±60、±70、±80或±90个核苷酸。在一些方面,靶区对应于SEQ ID NO:3的核苷酸222-241(例如,ASO-0082;SEQ ID NO:82)在3'端和/或5’端的±10、±20、±30、±40、±50、±60、±70、±80或±90个核苷酸。在一些方面,靶区对应于SEQ ID NO:3的核苷酸223-242(例如,ASO-0083;SEQ ID NO:83)在3'端和/或5’端的±10、±20、±30、±40、±50、±60、±70、±80或±90个核苷酸。在一些方面,靶区对应于SEQ ID NO:3的核苷酸224-243(例如,ASO-0084;SEQ ID NO:84)在3'端和/或5’端的±10、±20、±30、±40、±50、±60、±70、±80或±90个核苷酸。在一些方面,靶区对应于SEQ ID NO:3的核苷酸225-244(例如,ASO-0085;SEQ ID NO:85)在3'端和/或5’端的±10、±20、±30、±40、±50、±60、±70、±80或±90个核苷酸。
在一些方面,本公开的ASO能够在生理条件(即,在体内条件)下与靶核酸(例如,KRAS转录物)杂交。在一些方面,本公开的ASO能够在体外与靶核酸(例如,KRAS转录物)杂交。在一些方面,本公开的ASO能够在体外在严格条件下与靶核酸(例如,KRAS转录物)杂交。体外杂交的严格条件取决于(尤其是)生产性细胞摄取、RNA可及性、温度、缔合自由能、盐浓度和时间(参见,例如,Stanley T Crooke,Antisense Drug Technology:Principles,Strategies and Applications,第2版,CRC Press(2007))。通常,对于体外杂交使用高至中等严格条件,以实现基本相似的核酸之间的杂交,而不是不同的核酸之间的杂交。严格杂交条件的一个实例包括在40℃下在5X盐水-柠檬酸钠(SSC)缓冲液(0.75M氯化钠/0.075M柠檬酸钠)中杂交1小时,随后在40℃下在1X SSC中洗涤样品10次以及在室温下在1X SSC缓冲液中洗涤5次。体内杂交条件由控制反义寡核苷酸与靶序列的杂交的细胞内条件(例如,生理pH值和细胞内离子条件)组成。体内条件可在体外通过相对较低的严格条件模拟。例如,可在体外在37℃下在2X SSC(0.3M氯化钠/0.03M柠檬酸钠)、0.1%SDS中进行杂交。可在37℃下使用含有4X SSC、0.1%SDS的洗涤溶液,最后在45℃下在1X SSC中洗涤。
在一些方面,本公开的ASO能够靶向来自一种或多种物种(例如,人、非人灵长类动物、狗、猫、豚鼠、兔、大鼠、小鼠、马、牛和熊)的KRAS转录物。因此,在一些方面,ASO能够下调(例如,减少或抑制)KRAS mRNA或蛋白质在人和其他非人物种(例如,啮齿动物,例如,小鼠或大鼠)中的表达。在一些方面,本文所述的任何ASO是包含与至少一种非核苷酸或非多核苷酸共价连接的ASO的缀合物的一部分。
本公开的某些方面涉及包含本文所述的ASO的缀合物。在某些方面,缀合物包含与至少一种非核苷酸共价连接的ASO。在某些方面,缀合物包含与至少非多核苷酸部分共价连接的ASO。在一些方面,非核苷酸或非多核苷酸部分包含蛋白质、脂肪酸链、糖残基、糖蛋白、聚合物或它们的任何组合。
II.B.ASO序列
本公开的ASO包含对应于KRAS转录物的区域的互补序列的连续核苷酸序列,例如,对应于SEQ ID NO:1或SEQ ID NO:3的核苷酸序列。
在某些方面,本公开提供了长度为10-50个核苷酸,例如10-30个,诸如10-15个核苷酸、10-20个核苷酸或10-25个核苷酸的ASO,其中连续核苷酸序列与KRAS转录物(诸如SEQID NO:1或SEQ ID NO:3或其天然存在的变体)的互补序列内的区域具有至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或约100%序列同一性。因此,在一些方面,ASO与具有SEQ ID NO:1序列或其部分的单链核酸分子杂交。在一些方面,ASO与具有SEQ ID NO:3序列或其部分的单链核酸分子杂交。
ASO可包含与编码哺乳动物KRAS蛋白的核酸的等效区域完全互补(完美互补)的连续核苷酸序列。ASO可包含与核酸序列或该序列内的区域完全互补(完美互补)的连续核苷酸序列,其对应于SEQ ID NO:1或SEQ ID NO:3的核苷酸X-Y,其中X和Y分别是起始位点和结束位点,如图1所示。
在一些方面,本公开的ASO的核苷酸序列或连续核苷酸序列与选自SEQ ID NO:4至85的序列(即,图1中的序列)具有至少约80%序列同一性,诸如至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%序列同一性、至少约97%序列同一性、至少约98%序列同一性、至少约99%序列同一性,诸如约100%序列同一性(同源的)。在一些方面,ASO具有本文别处所述的设计(例如,章节II.G)或本文别处所示的化学结构(例如,图1)。
在一些方面,ASO(或其连续核苷酸部分)选自或包含选自由SEQ ID NO:4至85或其至少10个连续核苷酸的区域组成的组的序列中的一者,其中所述ASO(或其连续核苷酸部分)当与对应KRAS转录物(例如,SEQ ID NO:1或SEQ ID NO:3)相比时可任选地包含一个、两个、三个或四个错配。
在一些方面,ASO包含选自由SEQ ID NO:4至17组成的组的序列。在一些方面,ASO包含如SEQ ID NO:4所示的序列(例如,ASO-0004)。在一些方面,ASO包含如SEQ ID NO:5所示的序列(例如,ASO-0005)。在一些方面,ASO包含如SEQ ID NO:6所示的序列(例如,ASO-0006)。在一些方面,ASO包含如SEQ ID NO:7所示的序列(例如,ASO-0007)。在一些方面,ASO包含如SEQ ID NO:8所示的序列(例如,ASO-0008)。在一些方面,ASO包含如SEQ ID NO:9所示的序列(例如,ASO-0009)。在一些方面,ASO包含如SEQ ID NO:10所示的序列(例如,ASO-0010)。在一些方面,ASO包含如SEQ ID NO:11所示的序列(例如,ASO-0011)。在一些方面,ASO包含如SEQ ID NO:12所示的序列(例如,ASO-0012)。在一些方面,ASO包含如SEQ ID NO:13所示的序列(例如,ASO-0013)。在一些方面,ASO包含如SEQ ID NO:14所示的序列(例如,ASO-0014)。在一些方面,ASO包含如SEQ ID NO:15所示的序列(例如,ASO-0015)。在一些方面,ASO包含如SEQ ID NO:16所示的序列(例如,ASO-0016)。在一些方面,ASO包含如SEQ IDNO:17所示的序列(例如,ASO-0017)。在一些方面,ASO包含选自由SEQ ID NO:18-32组成的组的序列。在一些方面,ASO包含如SEQ ID NO:18所示的序列(例如,ASO-0018)。在一些方面,ASO包含如SEQ ID NO:19所示的序列(例如,ASO-0019)。在一些方面,ASO包含如SEQ IDNO:20所示的序列(例如,ASO-0020)。在一些方面,ASO包含如SEQ ID NO:21所示的序列(例如,ASO-0021)。在一些方面,ASO包含如SEQ ID NO:22所示的序列(例如,ASO-0022)。在一些方面,ASO包含如SEQ ID NO:23所示的序列(例如,ASO-0023)。在一些方面,ASO包含如SEQID NO:24所示的序列(例如,ASO-0024)。在一些方面,ASO包含如SEQ ID NO:25所示的序列(例如,ASO-0025)。在一些方面,ASO包含如SEQ ID NO:26所示的序列(例如,ASO-0026)。在一些方面,ASO包含如SEQ ID NO:27所示的序列(例如,ASO-0027)。在一些方面,ASO包含如SEQ ID NO:28所示的序列(例如,ASO-0028)。在一些方面,ASO包含如SEQ ID NO:29所示的序列(例如,ASO-0029)。在一些方面,ASO包含如SEQ ID NO:30所示的序列(例如,ASO-0030)。在一些方面,ASO包含如SEQ ID NO:31所示的序列(例如,ASO-0031)。在一些方面,ASO包含如SEQ ID NO:32所示的序列(例如,ASO-0032)。在一些方面,ASO包含选自由SEQ IDNO:33-48组成的组的序列。在一些方面,ASO包含如SEQ ID NO:33所示的序列(例如,ASO-0033)。在一些方面,ASO包含如SEQ ID NO:34所示的序列(例如,ASO-0034)。在一些方面,ASO包含如SEQ ID NO:35所示的序列(例如,ASO-0035)。在一些方面,ASO包含如SEQ ID NO:36所示的序列(例如,ASO-0036)。在一些方面,ASO包含如SEQ ID NO:37所示的序列(例如,ASO-0037)。在一些方面,ASO包含如SEQ ID NO:38所示的序列(例如,ASO-0038)。在一些方面,ASO包含如SEQ ID NO:39所示的序列(例如,ASO-0039)。在一些方面,ASO包含如SEQ IDNO:40所示的序列(例如,ASO-0040)。在一些方面,ASO包含如SEQ ID NO:41所示的序列(例如,ASO-0041)。在一些方面,ASO包含如SEQ ID NO:42所示的序列(例如,ASO-0042)。在一些方面,ASO包含如SEQ ID NO:43所示的序列(例如,ASO-0043)。在一些方面,ASO包含如SEQID NO:44所示的序列(例如,ASO-0044)。在一些方面,ASO包含如SEQ ID NO:45所示的序列(例如,ASO-0045)。在一些方面,ASO包含如SEQ ID NO:46所示的序列(例如,ASO-0046)。在一些方面,ASO包含如SEQ ID NO:47所示的序列(例如,ASO-0047)。在一些方面,ASO包含如SEQ ID NO:48所示的序列(例如,ASO-0048)。在一些方面,ASO包含选自由SEQ ID NO:49-65组成的组的序列。在一些方面,ASO包含如SEQ ID NO:49所示的序列(例如,ASO-0049)。在一些方面,ASO包含如SEQ ID NO:50所示的序列(例如,ASO-0050)。在一些方面,ASO包含如SEQID NO:51所示的序列(例如,ASO-0051)。在一些方面,ASO包含如SEQ ID NO:52所示的序列(例如,ASO-0052)。在一些方面,ASO包含如SEQ ID NO:53所示的序列(例如,ASO-0053)。在一些方面,ASO包含如SEQ ID NO:54所示的序列(例如,ASO-0054)。在一些方面,ASO包含如SEQ ID NO:55所示的序列(例如,ASO-0055)。在一些方面,ASO包含如SEQ ID NO:56所示的序列(例如,ASO-0056)。在一些方面,ASO包含如SEQ ID NO:57所示的序列(例如,ASO-0057)。在一些方面,ASO包含如SEQ ID NO:58所示的序列(例如,ASO-0058)。在一些方面,ASO包含如SEQ ID NO:59所示的序列(例如,ASO-0059)。在一些方面,ASO包含如SEQ ID NO:60所示的序列(例如,ASO-0060)。在一些方面,ASO包含如SEQ ID NO:61所示的序列(例如,ASO-0061)。在一些方面,ASO包含如SEQ ID NO:62所示的序列(例如,ASO-0062)。在一些方面,ASO包含如SEQ ID NO:63所示的序列(例如,ASO-0063)。在一些方面,ASO包含如SEQ IDNO:64所示的序列(例如,ASO-0064)。在一些方面,ASO包含如SEQ ID NO:65所示的序列(例如,ASO-0065)。在一些方面,ASO包含选自由SEQ ID NO:66-85组成的组的序列。在一些方面,ASO包含如SEQ ID NO:66所示的序列(例如,ASO-0066)。在一些方面,ASO包含如SEQ IDNO:67所示的序列(例如,ASO-0067)。在一些方面,ASO包含如SEQ ID NO:68所示的序列(例如,ASO-0068)。在一些方面,ASO包含如SEQ ID NO:69所示的序列(例如,ASO-0069)。在一些方面,ASO包含如SEQ ID NO:70所示的序列(例如,ASO-0070)。在一些方面,ASO包含如SEQID NO:71所示的序列(例如,ASO-0071)。在一些方面,ASO包含如SEQ ID NO:72所示的序列(例如,ASO-0072)。在一些方面,ASO包含如SEQ ID NO:73所示的序列(例如,ASO-0073)。在一些方面,ASO包含如SEQ ID NO:74所示的序列(例如,ASO-0074)。在一些方面,ASO包含如SEQ ID NO:75所示的序列(例如,ASO-0075)。在一些方面,ASO包含如SEQ ID NO:76所示的序列(例如,ASO-0076)。在一些方面,ASO包含如SEQ ID NO:77所示的序列(例如,ASO-0077)。在一些方面,ASO包含如SEQ ID NO:78所示的序列(例如,ASO-0078)。在一些方面,ASO包含如SEQ ID NO:79所示的序列(例如,ASO-0079)。在一些方面,ASO包含如SEQ ID NO:80所示的序列(例如,ASO-0080)。在一些方面,ASO包含如SEQ ID NO:81所示的序列(例如,ASO-0081)。在一些方面,ASO包含如SEQ ID NO:82所示的序列(例如,ASO-0082)。在一些方面,ASO包含如SEQ ID NO:83所示的序列(例如,ASO-0083)。在一些方面,ASO包含如SEQ IDNO:84所示的序列(例如,ASO-0084)。在一些方面,ASO包含如SEQ ID NO:85所示的序列(例如,ASO-0085)。
在一些方面,本公开的ASO结合至靶核酸序列(例如,KRAS转录物),并且能够将KRAS转录物的表达相较于细胞中的正常(即,对照)表达水平抑制或降低至少10%或20%,例如,相较于正常表达水平(例如,未暴露于ASO的细胞中的表达水平)抑制或降低至少约30%、至少约40%、至少约50%、至少约60%、至少约70%、至少约80%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或约100%。
在某些方面,本公开的ASO具有至少一种选自由以下各项组成的组的性质:(i)降低哺乳动物细胞(例如,肿瘤细胞)中编码KRAS蛋白的mRNA水平;(ii)降低哺乳动物细胞(例如,肿瘤细胞)中KRAS的蛋白质水平;(iii)减轻、改善或治疗癌症的一种或多种症状,以及(iv)它们的任何组合。
在一些方面,本公开的ASO能够在细胞与ASO接触时相较于细胞未与ASO接触(例如,与盐水或对照ASO接触)时将靶细胞中的KRAS mRNA的表达,例如体外表达降低至少约20%、至少约30%、至少约40%、至少约50%、至少约60%、至少约70%、至少约80%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或约100%。如本文所用,术语“对照ASO”是指对本文所公开的KRAS转录物不具特异性(即,不能够结合至KRAS转录物)的ASO。在某些方面,KRAS mRNA是野生型KRAS mRNA(SEQ ID NO:89)。在某些方面,KRAS mRNA是KRAS G12D mRNA(SEQ ID NO:3)。在一些方面,ASO能够降低野生型KRAS和G12DKRAS mRNA的表达。
在一些方面,本公开的ASO能够在细胞与ASO接触时相较于细胞未与ASO接触(例如,与盐水或对照ASO接触)时将靶细胞中的KRAS蛋白的表达,例如体外表达降低至少约20%、至少约30%、至少约40%、至少约50%、至少约60%、至少约70%、至少约80%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或约100%。在一些方面,KRAS蛋白是野生型KRAS蛋白(SEQ ID NO:90(同种型2A)或SEQ ID NO:88(同种型2B))。在一些方面,KRAS蛋白包含G12D突变(SEQ ID NO:86(同种型2A)或SEQ ID NO:2(同种型2B))。在某些方面,ASO能够降低野生型和G12D KRAS蛋白的表达。
如本公开别处所示,在一些方面,本公开的ASO表现出抑制KRAS转录物表达的高效力。如本文所用,术语“高效力”或“高效的”是指能够降低KRAS转录物(例如,mRNA)表达的ASO,其IC50值小于约10nM,如使用本文所述的Hepa1-6报告基因测定所测量的(参见,例如,实施例4)。例如,在某些方面,具有高效力的本公开的ASO可降低KRAS G12D mRNA表达,其IC50值小于约10nM、小于约9nM、小于约8nM、小于约7nM、小于约6nM、小于约5nM、小于约4nM、小于约3nM、小于约2nM或小于约1nM,如使用Hepa1-6报告基因测定所测量的。在一些方面,本公开的高效ASO可降低KRAS mRNA的多个变体(例如,本领域中已知和/或本文所述的那些)的表达。在某些方面,高效ASO可降低野生型和G12D KRAS mRNA的表达,例如,其IC50值小于约10nM,如使用Hepa1-6报告基因测定所测量的。
在一些方面,本公开的ASO在它们所杂交或结合的靶标中具有高度选择性。如本文所用,术语“高度选择性”或“高选择性”是指ASO对某些KRAS转录物具有特异性。例如,在一些方面,本文所述的高度选择性ASO对KRAS G12D mRNA具有特异性,并且因此能够下调KRASG12D mRNA的表达,但对其他KRAS mRNA(例如,野生型)的表达的影响极小。
如本文所证明的,在一些方面,降低的KRAS转录物表达(或其编码的蛋白质)与靶细胞(例如,表现出异常的KRAS活性的肿瘤细胞)的活力和/或增殖降低相关。因此,在某些方面,本公开的ASO能够降低表达KRAS转录物(例如,KRAS G12D mRNA)的细胞的活力和/或增殖。在某些方面,在细胞与ASO接触时相较于细胞未与ASO接触(例如,与盐水或对照ASO接触)时靶细胞中的活力和/或增殖降低至少约5%、至少约10%、至少约20%、至少约30%、至少约40%、至少约50%、至少约60%、至少约70%、至少约80%、至少约90%或约100%。
如本文还证明的,在一些方面,降低的KRAS转录物表达(或其编码的蛋白质)与MAP激酶途径相关蛋白质的表达降低相关。在某些方面,与MAP激酶途径相关的蛋白质是磷酸化的ERK(pERK)。因此,在某些方面,本文所述的ASO能够降低与MAP激酶途径相关的蛋白质(例如,pERK)的表达。在某些方面,在细胞与ASO接触时相较于细胞未与ASO接触(例如,与盐水或对照ASO接触)时靶细胞中的表达降低至少约5%、至少约10%、至少约20%、至少约30%、至少约40%、至少约50%、至少约60%、至少约70%、至少约80%、至少约90%或约100%。
在一些方面,当与靶序列杂交时ASO可容忍1、2、3或4个(或更多)错配,并且仍与靶标充分结合以显示所需效果,即,靶mRNA和/或蛋白质的下调。例如,错配可通过增加ASO核苷酸序列的长度并且/或者增加核苷酸类似物的数量来补偿,这在本文别处公开。
在一些方面,当与靶序列杂交时,本公开的ASO包含不超过3个错配。在其他方面,当与靶序列杂交时,连续核苷酸序列包含不超过2个错配。在其他方面,当与靶序列杂交时,连续核苷酸序列包含不超过1个错配。
II.C.ASO长度
ASO可包含长度为总共10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个、28个、29个或30个连续核苷酸的连续核苷酸序列。应当理解,当给出ASO或连续核苷酸序列长度的范围时,该范围包括在该范围内提供的下限和上限长度,例如从(或介于)10-30,包括10和30。
在一些方面,ASO包含长度为总共约14-20个、14个、15个、16个、17个、18个、19个或20个连续核苷酸的连续核苷酸序列。在某些方面,本公开的ASO的长度为14个核苷酸。在一些方面,本文所公开的ASO的长度为15个核苷酸。在其他方面,ASO的长度为16个核苷酸。在另外的方面,本公开中提供的ASO的长度为17个核苷酸。在某些方面,本公开的ASO的长度为18个核苷酸。在某些方面,本公开的ASO的长度为19个核苷酸。在更另外的方面,ASO的长度为20个核苷酸。在一些方面,ASO的长度为14个核苷酸。在某些方面,ASO的长度为13个核苷酸。在某些方面,ASO的长度为12个核苷酸。在某些方面,ASO的长度为11个核苷酸。在某些方面,ASO的长度为10个核苷酸。
在一些方面,ASO包含长度为约10至约50个(例如,约10至约45个、约10至约40个、约10或约35个、或约10至约30个)核苷酸的连续核苷酸序列。在某些方面,ASO的长度为21个核苷酸。在某些方面,ASO的长度为22个核苷酸。在某些方面,ASO的长度为23个核苷酸。在某些方面,ASO的长度为24个核苷酸。在某些方面,ASO的长度为25个核苷酸。在某些方面,ASO的长度为26个核苷酸。在某些方面,ASO的长度为27个核苷酸。在某些方面,ASO的长度为28个核苷酸。在某些方面,ASO的长度为29个核苷酸。在某些方面,ASO的长度为30个核苷酸。在某些方面,ASO的长度为31个核苷酸。在某些方面,ASO的长度为32个核苷酸。在某些方面,ASO的长度为33个核苷酸。在某些方面,ASO的长度为34个核苷酸。在某些方面,ASO的长度为35个核苷酸。在某些方面,ASO的长度为36个核苷酸。在某些方面,ASO的长度为37个核苷酸。在某些方面,ASO的长度为38个核苷酸。在某些方面,ASO的长度为39个核苷酸。在某些方面,ASO的长度为40个核苷酸。在某些方面,ASO的长度为41个核苷酸。在某些方面,ASO的长度为42个核苷酸。在某些方面,ASO的长度为43个核苷酸。在某些方面,ASO的长度为44个核苷酸。在某些方面,ASO的长度为45个核苷酸。在某些方面,ASO的长度为46个核苷酸。在某些方面,ASO的长度为47个核苷酸。在某些方面,ASO的长度为48个核苷酸。在某些方面,ASO的长度为49个核苷酸。在某些方面,ASO的长度为50个核苷酸。
II.D.核苷和核苷类似物
在本公开的一个方面,ASO包含一种或多种非天然存在的核苷类似物。如本文所用,“核苷类似物”是通过对糖部分和/或碱基部分的修饰得到的天然核苷诸如DNA或RNA核苷的变体。就寡核苷酸而言,类似物在原则上可能只是“沉默的”或“等效于”天然核苷,即对寡核苷酸抑制靶基因表达的方式没有功能性影响。然而,例如如果此类“等效”类似物制造起来更容易或更便宜,或者在储存或制造条件下更稳定,或者代表标签或标记,则它们仍然是有用的。然而,在一些方面,类似物将对ASO抑制表达的方式产生功能性影响;例如通过增加与靶标的结合亲和力和/或增加对细胞内核酸酶的抗性和/或增加转运进入细胞的容易程度。核苷类似物的具体实例描述于例如Freier&Altmann;Nucl.Acid Res.,1997,25,4429-4443和Uhlmann;Curr.Opinion in Drug Development,2000,3(2),293-213和方案1中。本公开的ASO可包含超过一种、超过两种、超过三种、超过四种、超过五种、超过六种、超过七种、超过八种、超过九种、超过10种、超过11种、超过12种、超过13种、超过14种、超过15种、超过16种、超过18种、超过19或超过20种核苷类似物。在一些方面,ASO中的核苷类似物是相同的。在其他方面,ASO中的核苷类似物是不同的。ASO中的核苷酸类似物可以是以下核苷类似物中的任一者或它们的组合。
在一些方面,核苷类似物包含2'-O-烷基-RNA;2'-O-甲基RNA(2'-OMe);2'-烷氧基-RNA;2'-O-甲氧基乙基-RNA(2'-MOE);2'-氨基-DNA;2'-氟-RNA;2'-氟-DNA;阿拉伯核酸(ANA);2'-氟-ANA;双环核苷类似物;或它们的任何组合。在一些方面,核苷类似物包含糖修饰的核苷。在一些方面,核苷类似物包含含有双环糖的核苷。在一些方面,核苷类似物包含LNA。在一些方面,核苷类似物包含2'-MOE。
在一些方面,核苷类似物选自由以下各项组成的组:约束乙基核苷(cEt)、2',4'-约束2'-O-甲氧基乙基(cMOE)、α-L-LNA、β-D-LNA、2'-O,4'-C-亚乙基-桥接核酸(ENA)、氨基-LNA、氧基-LNA、硫代-LNA以及它们的任何组合。在一些方面,ASO包含一个或多个5’-甲基-胞嘧啶核碱基。
II.D.1.核碱基
术语核碱基包括存在于核苷和核苷酸中的在核酸杂交中形成氢键的嘌呤(例如,腺嘌呤和鸟嘌呤)和嘧啶(例如,尿嘧啶、胸腺嘧啶和胞嘧啶)部分。在本公开的上下文中,术语核碱基还涵盖修饰的核碱基,其可能不同于天然存在的核碱基,但在核酸杂交期间是具功能性的。在一些方面,通过修饰或替代核碱基来修饰核碱基部分。在本文上下文中,“核碱基”是指天然存在的核碱基诸如腺嘌呤、鸟嘌呤、胞嘧啶、胸苷、尿嘧啶、黄嘌呤和次黄嘌呤,以及非天然存在的变体。此类变体例如描述于Hirao等人,(2012)Accounts of ChemicalResearch第45卷第2055页和Bergstrom(2009)Current Protocols in Nucleic AcidChemistry增刊37 1.4.1。
在一些方面,通过如下方式来修饰核碱基部分:将嘌呤或嘧啶改变为修饰的嘌呤或嘧啶,诸如取代的嘌呤或取代的嘧啶,诸如选自异胞嘧啶、假异胞嘧啶、5-甲基-胞嘧啶、5-噻唑并-胞嘧啶、5-丙炔基-胞嘧啶、5-丙炔基-尿嘧啶、5-溴尿嘧啶、5-噻唑并-尿嘧啶、2-硫代-尿嘧啶、2'硫代-胸腺嘧啶、肌苷、二氨基嘌呤、6-氨基嘌呤、2-氨基嘌呤、2,6-二氨基嘌呤和2-氯-6-氨基嘌呤的核碱基。
核碱基部分可由每个对应核碱基的字母代码来表示,例如A、T、G、C或U,其中每个字母可任选地包括具有等效功能的修饰的核碱基。例如,在示例性寡核苷酸中,核碱基部分选自A、T、G、C和5-甲基-胞嘧啶。任选地,对于LNA间隔体,可使用5-甲基-胞嘧啶LNA核苷。
II.D.2.糖修饰
本公开的ASO可包含一种或多种具有修饰的糖部分的核苷,即当与在DNA和RNA中存在的核糖部分相比时糖部分的修饰。已经制备了具有许多核糖部分修饰的核苷,主要目的是改善寡核苷酸的某些性质,诸如亲和力和/或核酸酶抗性。
此类修饰包括其中核糖环结构被修饰的那些,例如通过用己糖环(HNA)或双环替代(它通常在核糖环(LNA)上的C2'和C4'碳之间具有双自由基桥),或者未连接的核糖环(它通常在C2'和C3'碳之间缺乏键(例如,UNA))。其他糖修饰的核苷包括例如双环己糖核酸(WO2011/017521)或三环核酸(WO2013/154798)。修饰的核苷还包括其中糖部分被非糖部分替代的核苷,例如在肽核酸(PNA)或吗啉核酸的情况下。
糖修饰还包括通过将核糖环上的取代基更改为除氢以外的基团或RNA核苷中天然存在的2'-OH基团进行的修饰。例如,可在2’、3'、4'或5'位置引入取代基。具有修饰的糖部分的核苷还包括2'修饰的核苷,诸如2'取代的核苷。事实上,很多注意力都集中在开发2’取代的核苷上,并且发现许多2'取代的核苷在掺入寡核苷酸时具有有益的性质,诸如增强的核苷抗性和增强的亲和力。
II.D.2.a 2’修饰的核苷
2’糖修饰的核苷是在2'位置具有除H或-OH之外的取代基(2’取代核苷)或包含2'连接双自由基的核苷,并且包括2'取代核苷和LNA(2'-4'双自由基桥接)核苷。例如,2'修饰的糖可以提供增强的结合亲和力(例如,增强亲和力的2'糖修饰的核苷)和/或增强的对寡核苷酸的核酸酶抗性。2'取代的修饰的核苷的实例是2'-O-烷基-RNA、2'-O-甲基-RNA、2'-烷氧基-RNA、2'-O-甲氧基乙基-RNA(MOE)、2'-氨基-DNA、2'-氟-RNA、2'-氟-DNA、阿拉伯核酸(ANA)和2'-氟-ANA核苷。对于另外的实例,参见,例如,Freier&Altmann;Nucl.AcidRes.,1997,25,4429-4443;Uhlmann,Curr.Opinion in Drug Development,2000,3(2),293-213;以及Deleavey和Damha,Chemistry and Biology 2012,19,937。下面是一些2'取代的修饰的核苷的图示。
II.D.2.b锁定的核酸核苷(LNA)
LNA核苷是修饰的核苷,它在核苷的核糖环(即,2'-4’桥)的C2'和C4'之间包含接头基团(称为双自由基或桥),它限制或锁定核糖环的构象。这些核苷在文献中也称为桥接核酸或双环核酸(BNA)。当LNA掺入互补RNA或DNA分子的寡核苷酸中时,核糖构象的锁定与增强的杂交亲和力(双链体稳定)有关。这可以通过测量寡核苷酸/互补双链体的解链温度来常规确定。
非限制性示例性LNA核苷在WO 99/014226、WO 00/66604、WO 98/039352、WO 2004/046160、WO 00/047599、WO 2007/134181、WO 2010/077578、WO 2010/036698、WO 2007/090071、WO 2009/006478、WO 2011/156202、WO 2008/154401、WO 2009/067647、WO 2008/150729,Morita等人,Bioorganic&Med.Chem.Lett.12,73-76,Seth等人,J.Org.Chem.2010,第75(5)卷,第1569-81页和Mitsuoka等人,Nucleic Acids Research 2009,37(4),1225-1238中有所公开。
在一些方面,本公开的ASO的修饰的核苷或LNA核苷具有式I或II的通式结构:
其中
W选自-O-、-S-、-N(Ra)-、-C(RaRb)-,特别地是-O-;
B是核碱基或修饰的核碱基部分;
Z是与相邻的核苷或5'末端基团的核苷间键联;
Z*是与相邻的核苷或3'末端基团的核苷间键联;
R1、R2、R3、R5和R5*独立地选自氢、卤素、烷基、烯基、炔基、羟基、烷氧基、烷氧基烷基、烯氧基、羧基、烷氧基羰基、烷基羰基、甲酰基、叠氮、杂环和芳基;并且
X、Y、Ra和Rb如本文所定义。
在-X-Y-的一些方面,Ra是氢或烷基,特别地是氢或甲基。在-X-Y-的一些方面,Rb是氢或烷基,特别地是氢或甲基。在-X-Y-的其他方面,Ra和Rb中的一者或两者是氢。在-X-Y-的其他方面,Ra和Rb中仅一者是氢。在-X-Y-的一些方面,Ra和Rb中的一者是甲基,并且另一者是氢。在-X-Y-的某些方面,Ra和Rb同时都是甲基。
在-X-的一些方面,Ra是氢或烷基,特别地是氢或甲基。在-X-的一些方面,Rb是氢或烷基,特别地是氢或甲基。在-X-的其他方面,Ra和Rb中的一者或两者是氢。在-X-的某些方面,Ra和Rb中仅一者是氢。在-X-的某些方面,Ra和Rb中的一者是甲基,并且另一者是氢。在-X-的其他方面,Ra和Rb同时都是甲基。
在-Y-的一些方面,Ra是氢或烷基,特别地是氢或甲基。在-Y-的某些方面,Rb是氢或烷基,特别地是氢或甲基。在-Y-的其他方面,Ra和Rb中的一者或两者是氢。在-Y-的一些方面,Ra和Rb中仅一者是氢。在-Y-的其他方面,Ra和Rb中的一者是甲基,并且另一者是氢。在-Y-的一些方面,Ra和Rb同时都是甲基。
在一些方面,R1、R2、R3、R5和R5*独立地选自氢和烷基,特别地是氢和甲基。
在一些方面,R1、R2、R3、R5和R5*同时都是氢。
在一些方面,R1、R2、R3同时都是氢,R5和R5*中的一者是氢,并且另一者如上文所定义,特别地是烷基,更特别地是甲基。
在一些方面,R1、R2、R3同时都是氢,R5和R5*中的一者是氢,并且另一者是叠氮化物。
在一些方面,-X-Y-是-O-CH2-,W是氧,并且R1、R2、R3、R5和R5*同时都是氢。此类LNA核苷公开于WO 99/014226、WO 00/66604、WO 98/039352和WO 2004/046160(特此均以引用方式并入)中,并且包括本领域公知的β-D-氧基LNA和α-L-氧基LNA核苷。
在一些方面,-X-Y-是-S-CH2-,W是氧,并且R1、R2、R3、R5和R5*同时都是氢。此类硫代LNA核苷公开于WO 99/014226和WO 2004/046160中,所述申请特此以引用方式并入。
在一些方面,-X-Y-是-NH-CH2-,W是氧,并且R1、R2、R3、R5和R5*同时都是氢。此类氨基LNA核苷公开于WO 99/014226和WO 2004/046160(特此以引用方式并入)中。
在一些方面,-X-Y-是-O-CH2CH2-或-OCH2CH2CH2-,W是氧,并且R1、R2、R3、R5和R5*同时都是氢。此类LNA核苷公开于WO 00/047599和Morita等人,Bioorganic&Med.Chem.Lett.12,73-76(特此以引用方式并入)中,并且包括本领域公知的2'-O-4'C-乙烯桥接核酸(ENA)。
在一些方面,-X-Y-是-O-CH2-,W是氧,R1、R2、R3同时都是氢,R5和R5*中的一者是氢并且另一者不是氢,诸如是烷基,例如甲基。此类5'取代的LNA核苷公开于WO 2007/134181(特此以引用方式并入)中。
在一些方面,-X-Y-是-O-CRaRb-,其中Ra和Rb中的一者或两者不是氢,特别地是烷基诸如甲基,W是氧,R1、R2、R3同时都是氢,R5和R5*中的一者是氢并且另一者不是氢,特别地是烷基,例如甲基。此类双修饰的LNA核苷公开于WO 2010/077578(特此以引用方式并入)中。
在一些方面,-X-Y-是-O-CH(CH2-O-CH3)-(“2’O-甲氧基乙基二环核酸”,Seth等人,J.Org.Chem.2010,第75(5)卷第1569-81页)。
在一些方面,-X-Y-是-O-CHRa-,W是氧,并且R1、R2、R3、R5和R5*同时都是氢。此类6'取代的LNA核苷公开于WO 2010/036698和WO 2007/090071(两者均特此以引用方式并入)中。在此类6'取代的LNA核苷中,Ra特别地是C1-C6烷基,诸如甲基。
在一些方面,-X-Y-是-O-CH(CH2-O-CH3)-,W是氧,并且R1、R2、R3、R5和R5*同时都是氢。此类LNA核苷在本领域中也称为环状MOE(cMOE)并且公开于WO 2007/090071中。
在一些方面,-X-Y-是-O-CH(CH3)-。
在一些方面,-X-Y-是-O-CH2-O-CH2-(Seth等人,J.Org.Chem 2010同上)。
在一些方面,-X-Y-是-O-CH(CH3)-,W是氧,并且R1、R2、R3、R5和R5*同时都是氢。此类6'-甲基LNA核苷在本领域中也称为cET核苷,并且可以是(S)-cET或(R)-cET非对映异构体,如WO 2007/090071(β-D)和WO 2010/036698(α-L)中所公开,所述专利两者均特此以引用方式并入。
在一些方面,-X-Y-是-O-CRaRb-,其中Ra或Rb都不是氢,W是氧,并且R1、R2、R3、R5和R5*同时都是氢。在某些方面,Ra和Rb同时都是烷基,特别地同时都是甲基。此类6'二取代的LNA核苷公开于WO 2009/006478(特此以引用方式并入)中。
在一些方面,-X-Y-是-S-CHRa-,W是氧,并且R1、R2、R3、R5和R5*同时都是氢。此类6'取代的硫代LNA核苷公开于WO 2011/156202(特此以引用方式并入)中。在此类6'取代的硫代LNA的某些方面,Ra是烷基,特别地是甲基。
在一些方面,-X-Y-是-C(=CH2)C(RaRb)-,诸如W是氧,并且R1、R2、R3、R5和R5*同时都是氢。此类乙烯基碳LNA核苷公开于WO 2008/154401和WO 2009/067647(两者均特此以引用方式并入)中。
在一些方面,-X-Y-是-N(ORa)-CH2-,W是氧,并且R1、R2、R3、R5和R5*同时都是氢。在一些方面,Ra是烷基,诸如甲基。此类LNA核苷也称为N取代的LNA,并且公开于WO 2008/150729(特此以引用方式并入本文)中。
在一些方面,-X-Y-是-O-NCH3-(Seth等人,J.Org.Chem 2010同上)。
在一些方面,-X-Y-是ON(Ra)-–N(Ra)-O-、-NRa-CRaRb-CRaRb-或–NRa-CRaRb-,W是氧,并且R1、R2、R3、R5和R5*同时都是氢。在某些方面,Ra是烷基,诸如甲基。(Seth等人,J.Org.Chem 2010同上)。
在一些方面,R5和R5*同时都是氢。在其他方面,R5和R5*中的一者是氢,并且另一者是烷基,诸如甲基。在此类方面,R1、R2和R3可特别地是氢,并且-X-Y-可特别地是-O-CH2-或-O-CHC(Ra)3-,诸如-O-CH(CH3)-。
在一些方面,-X-Y-是-CRaRb-O-CRaRb-,诸如-CH2-O-CH2-,W是氧,并且R1、R2、R3、R5和R5*同时都是氢。在这些方面,Ra可特别地是烷基,诸如甲基。此类LNA核苷也称为构象限制核苷酸(CRN),并且公开于WO 2013/036868(特此以引用方式并入本文)中。
在一些方面,-X-Y-是-O-CRaRb-O-CRaRb-,诸如-O-CH2-O-CH2-,W是氧,并且R1、R2、R3、R5和R5*同时都是氢。在某些方面,Ra可特别地是烷基,诸如甲基。此类LNA核苷也称为COC核苷酸,并且公开于Mitsuoka等人,Nucleic Acids Research 2009,37(4),1225-1238(特此以引用方式并入本文)中。
应当认识到,除非另外指明,否则LNA核苷可以是β-D或α-L立体异构体。
方案1中提供了LNA核苷的某些实例。
方案1
如别处所示,在本公开的一些方面,寡核苷酸中的LNA核苷是β-D-氧基-LNA核苷。
II.E.核酸酶介导的降解
核酸酶介导的降解是指在与互补核苷酸序列形成双链体时能够介导互补核苷酸序列降解的寡核苷酸。
在一些方面,寡核苷酸可通过核酸酶介导的靶核酸降解起作用,其中本公开的寡核苷酸能够募集核酸酶,特别是核酸内切酶,优选是核糖核酸内切酶(RNase),诸如RNaseH。通过核酸酶介导的机制起作用的寡核苷酸设计的实例是寡核苷酸,其通常包含至少5或6个DNA核苷的区域并且在一侧或两侧侧接增强亲和力的核苷,例如间隔体。
II.F.RNase H活性和募集
反义寡核苷酸的RNase H活性是指其在与互补RNA分子形成双链体时募集RNase H并诱导互补RNA分子降解的能力。WO01/23613提供了用于体外确定RNase H活性的方法,所述方法可用于确定募集RNase H的能力。通常,如果当与互补靶核酸序列一起提供时,以pmol/l/min测量的寡核苷酸的初始速率是在使用与待测修饰寡核苷酸具有相同碱基序列但仅含有DNA单体、在寡核苷酸中的所有单体之间具有硫代磷酸酯键联的寡核苷酸并使用WO01/23613的实施例91-95提供的方法时所确定的初始速率的至少5%,诸如至少10%或超过20%时,则认为寡核苷酸能够募集RNase H。
在一些方面,如果当与互补靶核酸一起提供时,以pmol/l/min测量的RNase H初始速率是在使用与待测寡核苷酸具有相同碱基序列但仅含有DNA单体、没有2'取代、在寡核苷酸中的所有单体之间具有硫代磷酸酯键联的寡核苷酸并使用WO01/23613的实施例91-95提供的方法时所确定的初始速率的小于20%,诸如小于10%,诸如小于5%时,则认为寡核苷酸基本上不能募集RNase H。
II.G.ASO设计
本公开的ASO可包含含有核苷和核苷类似物的核苷酸序列,并且可以是间隔体、混合体或全聚体的形式。在一些方面,ASO是间隔体。在一些方面,ASO是混合体。在一些方面,ASO是全聚体。可用于本公开的ASO的间隔体、混合体或全聚体的构形的实例描述于美国专利申请公布第2012/0322851号中,其以引用方式整体并入本文。
如本文所用,术语“间隔体”是指包含RNase H募集寡核苷酸(间隙)区域的反义寡核苷酸,其5'和3'侧接一个或多个增强亲和力的修饰的核苷(侧翼)。术语“LNA间隔体”是间隔体寡核苷酸,其中至少一种增强亲和力的修饰的核苷是LNA核苷。术语“混合翼间隔体”是指LNA间隔体,其中侧翼区包含至少一种LNA核苷和至少一种DNA核苷或非LNA修饰的核苷,诸如至少一种2'取代的修饰的核苷,诸如例如,2'-O-烷基-RNA、2'-O-甲基-RNA、2'-烷氧基-RNA、2'-O-甲氧基乙基-RNA(MOE)、2’-氨基-DNA、2'-氟-RNA、2'-氟-DNA、阿拉伯核酸(ANA)和2'-氟-ANA核苷。
其他“嵌合”ASO,称为“混合体”,由(i)可被RNase识别和切割的DNA单体或核苷类似物单体和(ii)非募集RNase的核苷类似物单体的交替组成组成。
“全聚体”是仅包含非天然存在的核苷酸或核苷酸类似物的单链ASO。
在一些方面,除了增强ASO对靶区的亲和力外,一些核苷类似物还介导RNase(例如,RNase H)结合和切割。由于α-L-LNA单体在一定程度上募集RNase H活性,因此在一些方面,含有α-L-LNA单体的ASO的间隙区域(例如,区域B,如本文所指)由较少的可被RNase H识别和切割的单体组成,并在全聚体构建中引入了更大的灵活性。
II.G.1.间隔体设计
在一些方面,本公开的ASO是间隔体并且包含能够募集RNase(诸如RNase H)的连续核苷酸段(例如,一个或多个DNA)(在本文中称为区域B(B)),其中区域B在5'和3’侧接在区域B的连续核苷酸段的5'和3’的核苷类似物区域——这些区域分别称为区域A(A)和区域C(C)。在一些方面,核苷类似物是糖修饰的核苷(例如,高亲和力糖修饰的核苷)。在某些方面,区域A和C的糖修饰的核苷增强ASO对靶核酸的亲和力(即,增强亲和力的2'糖修饰的核苷)。在一些方面,糖修饰的核苷是2'糖修饰的核苷,诸如高亲和力2'糖修饰,诸如LNA和/或2’-MOE。
在间隔体中,区域B的5'和3’的大部分核苷是DNA核苷,并且分别位于区域A和区域C的核苷类似物(例如,高亲和力糖修饰的核苷)附近。在一些方面,区域A和区域C可通过在距离区域B最远的末端(即,区域A的5'端和区域C的3'端)具有核苷类似物来进一步限定。
在一些方面,本公开的ASO包含式(5'至3')A-B-C的核苷酸序列,其中:(A)(5'区或第一翼序列)包含至少一个核苷类似物(例如,3-5个LNA单元);(B)包含至少四个连续的核苷(例如,4-24个DNA单元),它们能够募集RNase(当与互补RNA分子,诸如前体mRNA或mRNA靶标形成双链体时);并且(C)(3'区或第二翼序列)包含至少一个核苷类似物(例如,3-5个LNA单元)。
在一些方面,区域A包含3-5个核苷酸类似物(诸如LNA),区域B由6-24个(例如,6、7、8、9、10、11、12、13或14个)DNA单元组成,并且区域C由3或4个核苷酸类似物(诸如LNA)组成。此类设计的非限制性实例包括(ABC)、3-8-3、3-9-3、3-10-3、3-11-3、3-12-3、3-13-3、3-14-3、4-9-4、4-10-4、4-11-4、4-12-4和5-10-5。在一些方面,ASO具有LLLDnLLL、LLLLDnLLLL或LLLLLDnLLLLL的设计,其中L是核苷类似物,D是DNA,并且n可以是4与24之间的任何整数。在一些方面,n可以是6与14之间的任何整数。在一些方面,n可以是8与12之间的任何整数。在一些方面,ASO具有LLLMMDnMMLLL、LLLMDnMLLL、LLLLMMDnMMLLLL、LLLLMDnMLLLL、LLLLLLMMDnMMLLLLL或LLLLLLMDnMLLLLL的设计,其中D是DNA,n可以是3与15之间的任何整数,L是LNA,并且M是2'MOE。
另外的间隔体设计公开于WO2004/046160、WO 2007/146511和WO2008/113832中,所述专利各自特此以引用方式整体并入。
II.H.核苷酸间键联
本文所述的ASO单体通过键联基团偶联在一起。合适地,每个单体通过键联基团与3'相邻单体连接。
本领域普通技术人员将理解,在本公开的上下文中,ASO末端的5'单体不包含5'键联基团,但它可能包含或可能不包含5'末端基团。
在一些方面,连续核苷酸序列包含一个或多个修饰的核苷间键联。术语“键联基团”或“核苷间键联”旨在意指能够将两个核苷共价偶联在一起的基团。非限制性实例包括磷酸酯基团和硫代磷酸酯基团。
本公开的ASO的核苷或其连续核苷序列通过键联基团偶联在一起。合适地,每个核苷通过键联基团与3'相邻核苷连接。
在一些方面,核苷间键联从其正常磷酸二酯修饰为更耐核酸酶攻击的一种,诸如可被RNase H切割的硫代磷酸酯,也允许反义抑制途径降低靶基因的表达。在一些方面,至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%的核苷间键联是修饰的。
III.细胞外囊泡,例如,外泌体
本文所公开的是能够降低和/或抑制KRAS转录物(例如,KRAS mRNA)或KRAS蛋白在例如哺乳动物细胞(例如,肿瘤细胞,例如胰腺肿瘤细胞)中的表达的EV(例如,外泌体)。可用于本公开的EV(例如,外泌体)已被工程化以产生ASO(例如,本文所述的)。在一些方面,EV(例如,外泌体)包含ASO(例如,本文所述的)。如本文所述,在一些方面,EV包含与KRAS突变转录物的核酸序列区域互补的ASO,其中ASO与之互补的核酸序列区域与野生型KRAS转录物的对应区域相比包含突变。此类突变的非限制性实例在本公开别处公开。在某些方面,本文所公开的EV(例如,外泌体)包含与KRAS G12D转录物的核酸序列区域互补的ASO,其中该区域编码G12D突变/变体。
在一些方面,本文所述的EV(例如,外泌体)包含至少一个ASO。在一些方面,EV(例如,外泌体)包含至少两个ASO,例如,包含第一核苷酸序列的第一ASO和包含第二核苷酸序列的第二ASO。在一些方面,EV(例如,外泌体)包含至少三个ASO、至少四个ASO、至少五个ASO、至少六个ASO或超过六个ASO。在一些方面,第一ASO、第二ASO、第三ASO、第四ASO、第五ASO、第六ASO和/或第N个ASO中的每一者是不同的(例如,包含不同的连续核苷酸序列、不同的设计或本文所公开的任何其他修饰)。
在一些方面,EV(例如,外泌体)包含第一ASO和第二ASO,其中第一ASO包含与第一转录物中的第一靶序列互补的第一连续核苷酸序列,并且其中第二ASO包含与第一转录物中的第二靶序列互补的第二核苷酸序列。在一些方面,第一靶序列不与第二靶序列重叠。在一些方面,第一靶序列包含至少一个在转录物的5'UTR内的核苷酸,并且第二靶序列不包含在5'UTR内的核苷酸。在一些方面,第一靶序列包含至少一个在转录物的3'UTR内的核苷酸,并且第二靶序列不包含在3'UTR内的核苷酸。在一些方面,第一靶序列包含至少一个在转录物的5'UTR内的核苷酸,并且第二靶序列包含至少一个在3'UTR内的核苷酸。
在一些方面,第一ASO靶向外显子-内含子接点内的序列,并且第二ASO靶向外显子-内含子接点内的序列。在一些方面,第一ASO靶向外显子-内含子接点内的序列,并且第二ASO靶向外显子内的序列。在一些方面,第一ASO靶向外显子-内含子接点内的序列,并且第二ASO靶向内含子内的序列。在一些方面,第一ASO靶向外显子内的序列,并且第二ASO靶向外显子内的序列。在一些方面,第一ASO靶向内含子内的序列,并且第二ASO靶向外显子内的序列。在一些方面,第一ASO靶向内含子内的序列,并且第二ASO靶向内含子内的序列。
在一些方面,EV(例如,外泌体)包含第一ASO和第二ASO,其中第一ASO包含与第一转录物中的第一靶序列互补的第一核苷酸序列,并且其中第二ASO包含与第二转录物中的第二靶序列互补的第二核苷酸序列,其中第一转录物不是与第二转录物相同的基因的产物。
在某些方面,本公开的EV(例如,外泌体)可被工程化以靶向受试者内的特定细胞或组织。例如,在一些方面,本公开的EV(例如,外泌体)可被修饰以在EV的表面上展示一个或多个靶向/向性部分。如本文所述,此类部分可改变和/或增强EV向特定细胞或组织的运动。在本公开别处提供了关于此类EV的其他公开内容。
可用本文所公开的EV(例如,外泌体)靶向的细胞的非限制性实例包括:肿瘤细胞、树突细胞、T细胞、B细胞、嗜中性粒细胞、髓源性抑制细胞(MDSC,例如,单核细胞MDSC或粒细胞MDSC)、单核细胞、巨噬细胞、NK细胞、血小板、神经元、肝细胞、造血干细胞、脂肪细胞、嗜碱性粒细胞、嗜酸性粒细胞或它们的任何组合。在一些方面,本文所公开的EV(例如,包含靶向KRAS的ASO的外泌体)靶向肿瘤细胞。在一些方面,肿瘤细胞源自选自以下的癌症:结肠直肠癌、肺癌(例如,非小细胞肺癌(NSCLC))、胰腺癌(例如,胰腺导管腺癌(PDAC))、白血病、子宫癌、卵巢癌、膀胱癌、胆管癌、胃癌(gastric cancer)、胃癌(stomach cancer)、睾丸癌、食道癌、胆管癌、宫颈癌、急性髓性白血病(AML)、弥漫性大B细胞淋巴瘤(DLBC)、肉瘤、黑素瘤、胶质瘤(例如,低级别胶质瘤,例如胶质母细胞瘤)、间皮瘤、肝癌、乳腺癌(例如,侵袭性乳腺癌)、肾癌(例如,乳头状肾细胞癌(pRCC)和嫌色性肾细胞癌)、头颈癌、前列腺癌、腺样囊性癌(ACC)、胸腺癌、甲状腺癌、透明细胞肾细胞癌(CCRCC)、神经内分泌赘瘤(例如,嗜铬细胞瘤/副神经节瘤)、葡萄膜黑素瘤或它们的任何组合。在某些方面,肿瘤细胞是胰腺癌细胞。在某些方面,本公开的EV靶向巨噬细胞。可用本公开的EV(例如,外泌体)靶向的组织的非限制性实例包括肝、心、肺、脑、肾、中枢神经系统、外周神经系统、脑脊髓液(CSF)、肌肉(例如,骨骼肌、心肌)、骨、骨髓、血液、脾脏、淋巴结、胃、食道、膈膜、膀胱、结肠、胰腺、甲状腺、唾液腺、肾上腺、垂体、乳腺、皮肤、卵巢、子宫、前列腺、睾丸、子宫颈或它们的任何组合。
如前文所述,本文所述的EV(例如,外泌体)是直径在约20-300nm之间的细胞外囊泡。在某些方面,本公开的EV(例如,外泌体)的直径在约20-290nm、20-280nm、20-270nm、20-260nm、20-250nm、20-240nm、20-230nm、20-220nm、20-210nm、20-200nm、20-190nm、20-180nm、20-170nm、20-160nm、20-150nm、20-140nm、20-130nm、20-120nm、20-110nm、20-100nm、20-90nm、20-80nm、20-70nm、20-60nm、20-50nm、20-40nm、20-30nm、30-300nm、30-290nm、30-280nm、30-270nm、30-260nm、30-250nm、30-240nm、30-230nm、30-220nm、30-210nm、30-200nm、30-190nm、30-180nm、30-170nm、30-160nm、30-150nm、30-140nm、30-130nm、30-120nm、30-110nm、30-100nm、30-90nm、30-80nm、30-70nm、30-60nm、30-50nm、30-40nm、40-300nm、40-290nm、40-280nm、40-270nm、40-260nm、40-250nm、40-240nm、40-230nm、40-220nm、40-210nm、40-200nm、40-190nm、40-180nm、40-170nm、40-160nm、40-150nm、40-140nm、40-130nm、40-120nm、40-110nm、40-100nm、40-90nm、40-80nm、40-70nm、40-60nm、40-50nm、50-300nm、50-290nm、50-280nm、50-270nm、50-260nm、50-250nm、50-240nm、50-230nm、50-220nm、50-210nm、50-200nm、50-190nm、50-180nm、50-170nm、50-160nm、50-150nm、50-140nm、50-130nm、50-120nm、50-110nm、50-100nm、50-90nm、50-80nm、50-70nm、50-60nm、60-300nm、60-290nm、60-280nm、60-270nm、60-260nm、60-250nm、60-240nm、60-230nm、60-220nm、60-210nm、60-200nm、60-190nm、60-180nm、60-170nm、60-160nm、60-150nm、60-140nm、60-130nm、60-120nm、60-110nm、60-100nm、60-90nm、60-80nm、60-70nm、70-300nm、70-290nm、70-280nm、70-270nm、70-260nm、70-250nm、70-240nm、70-230nm、70-220nm、70-210nm、70-200nm、70-190nm、70-180nm、70-170nm、70-160nm、70-150nm、70-140nm、70-130nm、70-120nm、70-110nm、70-100nm、70-90nm、70-80nm、80-300nm、80-290nm、80-280nm、80-270nm、80-260nm、80-250nm、80-240nm、80-230nm、80-220nm、80-210nm、80-200nm、80-190nm、80-180nm、80-170nm、80-160nm、80-150nm、80-140nm、80-130nm、80-120nm、80-110nm、80-100nm、80-90nm、90-300nm、90-290nm、90-280nm、90-270nm、90-260nm、90-250nm、90-240nm、90-230nm、90-220nm、90-210nm、90-200nm、90-190nm、90-180nm、90-170nm、90-160nm、90-150nm、90-140nm、90-130nm、90-120nm、90-110nm、90-100nm、100-300nm、110-290nm、120-280nm、130-270nm、140-260nm、150-250nm、160-240nm、170-230nm、180-220nm或190-210nm之间。本文所述的EV(例如,外泌体)的大小可根据下文所述的方法来测量。
在一些方面,本公开的EV(例如,外泌体)包含双脂膜(“EV(例如,外泌体)膜”),所述双脂膜包含内(腔)表面和外表面。在某些方面,内(腔)表面面向EV(例如,外泌体)的内核(即,腔)。在某些方面,外表面可与胞内体、多囊泡体或生产细胞或靶细胞的膜/细胞质接触。
在一些方面,EV(例如,外泌体)膜包含脂质和脂肪酸。在一些方面,EV(例如,外泌体)膜包含磷脂、糖脂、脂肪酸、鞘脂、磷酸甘油酯、甾醇、胆固醇和磷脂酰丝氨酸。
在一些方面,EV(例如,外泌体)膜包含内小叶和外小叶。内部小叶和外部小叶的组成可通过本领域中已知的跨双层分布测定来确定,参见,例如,Kuypers等人,BiohimBiophys Acta 1985 819:170。在一些方面,外部小叶的组成为在约70%-90%之间的胆碱磷脂、在约0%-15%之间的酸性磷脂和在约5%-30%之间的磷脂酰乙醇胺。在一些方面,内部小叶的组成为在约15%-40%之间的胆碱磷脂、在约10%-50%之间的酸性磷脂和在约30%-60%之间的磷脂酰乙醇胺。
在一些方面,EV(例如,外泌体)膜包含一种或多种多糖,诸如聚糖。
在一些方面,本公开的EV(例如,外泌体)包含ASO,其中ASO通过支架部分连接至EV,连接在EV的外表面上或EV的腔表面上。
在一些方面,包含ASO的EV(例如,外泌体)在ASO与外泌体膜之间包含锚定部分,所述锚定部分任选地包含接头。接头的非限制性实例在本文别处公开。
III.A.锚定部分(AM)
一个或多个锚定部分(AM)可用于将ASO锚定至本公开的EV。在一些方面,ASO直接与锚定部分连接或通过接头连接。在一些方面,ASO可通过“反应性基团”(RG;例如,胺、硫醇、羟基、羧酸或叠氮化物)与“反应性部分”(RM;例如,马来酰亚胺、琥珀酸酯、NHS)之间的反应连接至锚定部分或接头组合。设想了几种潜在的合成路线,例如:
[AM]-/反应性部分/+/反应性基团/-[ASO]
[AM]-[接头]n-/反应性部分/+/反应性基团/-[ASO]
[AM]-/反应性部分/+/反应性基团/-[接头]n-[ASO]
[AM]-[接头]n-/反应性部分/+/反应性基团/-[接头]n-[ASO]
锚定部分可插入EV(例如,外泌体)的脂质双层,从而允许外泌体装载ASO。目前,外泌体作为极性ASO的递送媒介物的商业化的主要障碍是非常低效的装载。在将极性ASO装载到外泌体中之前,可通过修饰极性ASO来克服这一障碍。因此,如本文所述,ASO的修饰有助于将它们装载到外泌体中。
与先前报告的通过例如电穿孔或阳离子脂质转染将未修饰的ASO引入外泌体中的装载效率相比,本文阐述的向外泌体装载修饰的极性ASO的方法显著提高了装载效率。
在一些方面,相对于天然(未修饰的)ASO,修饰使ASO的疏水性增加至少约1、至少约2、至少约3、至少约4、至少约5、至少约6、至少约7、至少约8、至少约9或至少约10倍。在一些方面,相对于天然(未修饰的)ASO,修饰使ASO的疏水性增加至少约1、至少约2、至少约3、至少约4、至少约5、至少约6、至少约7、至少约8、至少约9或至少约10个数量级。
在一些方面,相对于天然(未修饰的)ASO,例如对应的未修饰的ASO,修饰使ASO的疏水性增加至少约10%、至少约20%、至少约30%、至少约40%、至少约50%、至少约60%、至少约70%、至少约80%、至少约90%、至少约100%、至少约125%、至少约150%、至少约175%、至少约200%、至少约250%、至少约300%、至少约350%、至少约400%、至少约450%、至少约500%、至少约600%、至少约700%、至少约800%、至少约900%或至少约1000%。可使用任何合适的方法来评估疏水性的增加。例如,疏水性可通过测量在有机溶剂诸如辛醇中的溶解度百分比相比于在水性溶剂诸如水中的溶解度来确定。
在一些方面,锚定部分可与ASO化学缀合以增强其疏水特性。在示例性方面,锚定部分是甾醇(例如,胆固醇)、GM1、脂质、维生素、小分子、肽或它们的组合。在一些方面,所述部分是脂质。在一些方面,锚定部分是甾醇,例如胆固醇。另外的疏水部分包括例如磷脂、溶血磷脂、脂肪酸或维生素(例如,维生素D或维生素E)。
在一些方面,锚定部分直接或通过一个或多个接头缀合在ASO的末端(即,“末端修饰”)。在其他方面,锚定部分与ASO的其他部分缀合。
在一些方面,ASO可包括可检测标记。示例性标记包括荧光标记和/或放射性标记。在一些方面,当ASO被荧光标记时,可检测标记可以是例如Cy3。向ASO添加可检测标记可用作标记外泌体并跟踪其生物分布的一种方式。在其他方面,可检测标记可直接连接至外泌体,例如,通过标记外泌体脂质和/或外泌体肽来实现。
ASO的不同组分(即,锚定部分、接头和接头组合,以及ASO)可通过酰胺、酯、醚、硫醚、二硫化物、氨基磷酸酯、磷酸三酯、二硫代磷酸酯、膦酸甲酯、磷酸二酯或硫代磷酸酯键联或可替代地任何或其他键联连接。
在一些方面,ASO的不同组分可以是使用双功能接头(即,含有两个官能团的接头)的接头,诸如N-琥珀酰亚胺基-3-(2-吡啶基二硫代)丙酸酯、N-4-马来酰亚胺丁酸、S-(2-吡啶基二硫代)半胱胺、碘乙酰氧基琥珀酰亚胺、N-(4-马来酰亚胺丁氧基)琥珀酰亚胺、N-[5-(3'-马来酰亚胺丙酰胺)-1-羧基戊基]亚氨基二乙酸、N-(5-氨基戊基)-亚氨基二乙酸等。
III.A.1.锚定部分
如下文详细描述的,能够将ASO锚定至EV(例如,外泌体)表面的合适锚定部分包括例如甾醇(例如,胆固醇)、脂质、溶血磷脂、脂肪酸或脂溶性维生素。
在一些方面,锚定部分可以是脂质。脂质锚定部分可以是本领域已知的任何脂质,例如棕榈酸或糖基磷脂酰肌醇。在一些方面,脂质是脂肪酸、磷脂、磷脂(例如,磷脂酰胆碱、磷脂酰丝氨酸或磷脂酰乙醇胺)或它们的类似物(例如,磷脂酰胆碱、卵磷脂、磷脂酰乙醇胺、脑磷脂或磷脂酰丝氨酸或者它们的类似物或部分,诸如它们的部分水解的部分)。在某些方面,锚定部分是胆固醇。可用于本公开的胆固醇分子的非限制性实例提供于图6A和图6B中。在一些方面,锚定部分是图6A所示的胆固醇(在本文中也称为“Chol2”)。在一些方面,锚定部分是图6B所示的胆固醇(在本文中也称为“Chol4”)。下文进一步提供了与胆固醇锚定部分有关的其他公开内容。
通常,锚定部分是化学连接的。然而,锚定部分可酶促连接至ASO。在一些方面,可通过改变细胞培养条件将锚定部分连接至ASO。例如,通过使用限制肉豆蔻酸的培养基,一些其他脂肪酸,包括短链和不饱和脂肪酸,可以连接至N末端甘氨酸。例如,在BK通道中,据报道肉豆蔻酸酯在翻译后通过羟基酯键联连接至内部丝氨酸/苏氨酸或酪氨酸残基。
锚定部分可直接或间接地通过接头组合在任何化学上可行的位置,例如在ASO的5'和/或3'端与ASO缀合。在一个方面,锚定部分仅缀合至ASO的3'端。在一个方面,锚定部分仅缀合至ASO的5'端。在一个方面,锚定部分缀合在ASO的非3'端或5'端的位置。
可用于实践本公开的方法的一些类型的膜锚呈现于下表中:
在一些方面,本公开的锚定部分可包含本文所公开的两种或更多种类型的锚定部分。例如,在一些方面,锚定部分可以包含两种脂质,例如,一种磷脂和一种脂肪酸,或两种磷脂,或两种脂肪酸,或一种脂质和一种维生素,或一种胆固醇和一种维生素等。它们共同具有6-80个碳原子(即,6-80的当量碳数(ECN))。
在一些方面,锚定部分的组合,例如脂质(例如,脂肪酸)的组合具有6-80、8-80、10-80、12-80、14-80、16-80、18-80、20-80、22-80、24-80、26-80、28-80、30-80、4-76、6-76、8-76、10-76、12-76、14-76、16-76、18-76、20-76、22-76、24-76、26-76、28-76、30-76、6-72、8-72、10-72、12-72、14-72、16-72、18-72、20-72、22-72、24-72、26-72、28-72、30-72、6-68、8-68、10-68、12-68、14-68、16-68、18-68、20-68、22-68、24-68、26-68、28-68、30-68、6-64、8-64、10-64、12-64、14-64、16-64、18-64、20-64、22-64、24-64、26-64、28-64、30-64、6-60、8-60、10-60、12-56、14-56、16-56、18-56、20-56、22-56、24-56、26-56、28-56、30-56、6-52、8-52、10-52、12-52、14-52、16-52、18-52、20-52、22-52、24-52、26-52、28-52、30-52、6-48、8-48、10-48、12-48、14-48、16-48、18-48、20-48、22-48、24-48、26-48、28-48、30-48、6-44、8-44、10-44、12-44、14-44、16-44、18-44、20-44、22-44、24-44、26-44、28-44、30-44、6-40、8-40、10-40、12-40、14-40、16-40、18-40、20-40、22-40、24-40、26-40、28-40、30-40、6-36、8-36、10-36、12-36、14-36、16-36、18-36、20-36、22-36、24-36、26-36、28-36、30-36、6-32、8-32、10-32、12-32、14-32、16-32、18-32、20-32、22-32、24-32、26-32、28-32或30-32的ECN。
III.A.1.a.胆固醇和其他甾醇
在一些方面,锚定部分包含甾醇、类固醇、藿烷、羟基类固醇、开环甾体或它们的具有亲脂性的类似物。在一些方面,锚定部分包含甾醇,诸如植物甾醇、霉菌甾醇或动物甾醇。示例性动物甾醇包括胆固醇和24S-羟基胆固醇;示例性植物甾醇包括麦角甾醇(mycosterol)、菜油甾醇、谷甾醇和豆甾醇。在一些方面,甾醇选自麦角甾醇、7-脱氢胆固醇、胆固醇、24S-羟基胆固醇、羊毛甾醇、环木蒿醇、岩藻甾醇、沙林甾醇、菜油甾醇、β-谷甾醇、谷甾烷醇、粪甾烷醇、燕麦甾醇或豆甾醇。甾醇可以以游离甾醇、酰化(甾醇酯)、烷基化(甾醇烷基醚)、硫酸化(甾醇硫酸盐)存在或连接至糖苷部分(甾醇糖苷),糖苷部分本身可以被酰化(酰化甾醇糖苷)。
在一些方面,锚定部分包含类固醇。在一些方面,类固醇选自二氢睾酮、乌苏醇、龙舌兰皂苷配基、薯蓣皂苷配基、黄体酮或皮质醇。
例如,甾醇可直接或通过甾醇的可用-OH基团处的接头组合与ASO缀合。示例性甾醇具有如下所示的一般骨架:
作为另一个实例,麦角甾醇具有以下结构:
胆固醇具有以下结构:
因此,在一些方面,甾醇或类固醇的游离-OH基团用于将ASO直接或通过接头组合缀合至甾醇(例如,胆固醇)或类固醇。
III.A.1.b.脂肪酸
在一些方面,锚定部分是脂肪酸。在一些方面,脂肪酸是短链、中链或长链脂肪酸。在一些方面,脂肪酸是饱和脂肪酸。在一些方面,脂肪酸是不饱和脂肪酸。在一些方面,脂肪酸是单不饱和脂肪酸。在一些方面,脂肪酸是多不饱和脂肪酸,诸如ω-3(omega-3)或ω-6(omega-6)脂肪酸。
在一些方面,脂质(例如,脂肪酸)具有C2-C60链。在一些方面,脂质(例如,脂肪酸)具有C2-C28链。在一些方面,脂肪酸具有C2-C40链。在一些方面,脂肪酸具有C2-C12或C4-C12链。在一些方面,脂肪酸具有C4-C40链。在一些方面,脂肪酸具有C4-C40、C2-C38、C2-C36、C2-C34、C2-C32、C2-C30、C4-C30、C2-C28、C4-C28、C2-C26、C4-C26、C2-C24、C4-C24、C6-C24、C8-C24、C10-C24、C2-C22、C4-C22、C6-C22、C8-C22、C10-C22、C2-C20、C4-C20、C6-C20、C8-C20、C10-C20、C2-C18、C4-C18、C6-C18、C8-C18、C10-C18、C12-C18、C14-C18、C16-C18、C2-C16、C4-C16、C6-C16、C8-C16、C10-C16、C12-C16、C14-C16、C2-C15、C4-C15、C6-C15、C8-C15、C9-C15、C10-C15、C11-C15、C12-C15、C13-C15、C2-C14、C4-C14、C6-C14、C8-C14、C9-C14、C10-C14、C11-C14、C12-C14、C2-C13、C4-C13、C6-C13、C7-C13、C8-C13、C9-C13、C10-C13、C10-C13、C11-C13、C2-C12、C4-C12、C6-C12、C7-C12、C8-C12、C9-C12、C10-C12、C2-C11、C4-C11、C6-C11、C7-C11、C8-C11、C9-C11、C2-C10、C4-C10、C2-C9、C4-C9、C2-C8、C2-C7、C4-C7、C2-C6或C4-C6链。在一些方面,脂肪酸具有C2、C3、C4、C5、C6、C7、C8、C9、C10、C11、C12、C13、C14、C15、C16、C17、C18、C19、C20、C21、C22、C23、C24、C25、C26、C27、C28、C29、C30、C31、C32、C33、C34、C35、C36、C37、C38、C39、C40、C41、C42、C43、C44、C45、C46、C47、C48、C49、C50、C51、C52、C53、C54、C55、C56、C57、C58、C59或C60链。
在一些方面,锚定部分包含两种脂肪酸,其中每种独立地选自具有含有前述碳原子数范围或数量中的任一者的链的脂肪酸。在一些方面,脂肪酸之一独立地是具有C6-C21链的脂肪酸,并且一种脂肪酸独立地是具有C12-C36链的脂肪酸。在一些方面,每种脂肪酸独立地具有11、12、13、14、15、16或17个碳原子的链。
合适的脂肪酸包括饱和直链脂肪酸、饱和支链脂肪酸、不饱和脂肪酸、羟基脂肪酸和多元羧酸。在一些方面,此类脂肪酸具有多达32个碳原子。
可用的饱和直链脂肪酸的实例包括具有偶数个碳原子的那些,诸如丁酸、己酸、辛酸、癸酸、月桂酸、肉豆蔻酸、棕榈酸、硬脂酸、花生酸、山萮酸、木蜡酸、二十六碳酸、二十八碳酸、三十碳酸和正三十二碳酸,以及具有奇数个碳原子的那些,诸如丙酸、正戊酸、庚酸、壬酸、十一碳酸、十三碳酸、十五碳酸、十七碳酸、十九碳酸、二十一碳酸、二十三碳酸、二十五碳酸和二十七碳酸。
合适的饱和支链脂肪酸的实例包括异丁酸、异己酸、异辛酸、异癸酸、异月桂酸、11-甲基十二碳酸、异肉豆蔻酸、13-甲基-十四碳酸、异棕榈酸、15-甲基-十六碳酸、异硬脂酸、17-甲基十八碳酸、异花生酸、19-甲基-二十碳酸、α-乙基-己酸、α-己基癸酸、α-庚基十一碳酸、2-癸基十四碳酸、2-十一烷基十四碳酸、2-癸基十五碳酸、2-十一烷基十五碳酸和Fine oxocol 1800 acid(Nissan Chemical Industries,Ltd.的产品)。合适的饱和奇数碳支链脂肪酸包括以异丁基封端的反异脂肪酸,诸如6-甲基-辛酸、8-甲基-癸酸、10-甲基-十二碳酸、12-甲基-十四碳酸、14-甲基-十六碳酸、16-甲基-十八碳酸、18-甲基-二十碳酸、20-甲基-二十二碳酸、22-甲基-二十四碳酸、24-甲基-二十六碳酸和26-甲基-二十八碳酸。
合适的不饱和脂肪酸的实例包括4-癸烯酸、己酸、4-十二碳烯酸、5-十二碳烯酸、月桂油酸、4-十四碳烯酸、5-十四碳烯酸、9-十四碳烯酸、棕榈油酸、6-十八碳烯酸、油酸、9-十八碳烯酸、11-十八碳烯酸、9-二十碳烯酸、顺-11-二十碳烯酸、鲸蜡油酸、13-二十二碳烯酸、15-二十四碳烯酸、17-二十六碳烯酸、6,9,12,15-十六碳四烯酸、亚油酸、亚麻酸、α-桐酸、β-桐酸、石榴酸、6,9,12,15-十八碳四烯酸、十八碳四烯酸、5,8,11,14-二十碳四烯酸、5,8,11,14,17-二十碳五烯酸、7,10,13,16,19-二十二碳五烯酸、4,7,10,13,16,19-二十二碳六烯酸等。
合适的羟基脂肪酸的实例包括α-羟基月桂酸、α-羟基肉豆蔻酸、α-羟基棕榈酸、α-羟基硬脂酸、ω-羟基月桂酸、α-羟基花生酸、9-羟基-12-十八碳烯酸、蓖麻油酸、α-羟基二十二碳酸、9-羟基-反式-10,12-十八碳二烯酸、甘草酸、异丙酸、9,10-二羟基硬脂酸、12-羟基硬脂酸等。
合适的多元羧酸的实例包括草酸、丙二酸、琥珀酸、戊二酸、己二酸、庚二酸、辛二酸、壬二酸、癸二酸、D,L-苹果酸等。
在一些方面,每种脂肪酸独立地选自丙酸、丁酸、戊酸、己酸、庚酸、辛酸、壬酸、癸酸、十一碳酸、月桂酸、十三碳酸、肉豆蔻酸、十五碳酸、棕榈酸、十七碳酸、硬脂酸、十九碳酸、花生酸、二十二碳酸、山萮酸、二十三碳酸、木蜡酸、二十五碳酸、蜡酸、二十七碳酸、褐煤酸、二十九碳酸、蜂花酸、三十一碳酸、木香酸、三十三碳酸、蜡质酸、三十六碳酸、三十七碳酸或三十八碳酸。
在一些方面,每种脂肪酸独立地选自α-亚麻酸、十八碳四烯酸、二十碳五烯酸、二十二碳六烯酸、亚油酸、γ-亚油酸、二高-γ-亚油酸、花生四烯酸、二十二碳四烯酸、棕榈油酸、异油酸、桐酸、油酸、反油酸、二十碳烯酸、芥酸、神经酸、米德酸、肾上腺素酸、伯色五烯酸、奧佐朋德酸、沙丁鱼酸、鲱鱼酸、二十二碳六烯酸或二十四醇五烯酸或者其他单不饱和或多不饱和脂肪酸。
在一些方面,一种或两种脂肪酸是必需脂肪酸。鉴于某些必需脂肪酸的有益健康作用,可通过在治疗剂中包含此类脂肪酸来增加所公开的负载治疗剂的外泌体的治疗益处。在一些方面,必需脂肪酸是选自由以下各项组成的组的n-6或n-3必需脂肪酸:亚麻酸、γ-亚麻酸、二高-γ-亚麻酸、花生四烯酸、肾上腺素酸、二十二碳五烯n-6酸、α-亚麻酸、硬脂酸、20:4n-3酸、二十碳五烯酸、二十二碳五烯n-3酸或二十二碳六烯酸。
在一些方面,每种脂肪酸独立地选自全顺-7,10,13-十六碳三烯酸、α-亚麻酸、十八碳四烯酸、二十碳三烯酸、二十碳四烯酸、二十碳五烯酸(EPA)、二十二碳五烯酸、二十二碳六烯酸(DHA)、二十四碳五烯酸、二十四碳六烯酸或硫辛酸。在其他方面,脂肪酸选自二十碳五烯酸、二十二碳六烯酸或硫辛酸。脂肪酸的其他实例包括全顺-7,10,13-十六碳三烯酸、α-亚麻酸(ALA或全顺-9,12,15-十八碳三烯酸)、硬脂酸(STD或全顺-6,9,12,15-十八碳四烯酸)、二十碳三烯酸(ETE或全顺-11,14,17-二十碳三烯酸)、二十碳四烯酸(ETA或全顺-8,11,14,17-二十碳四烯酸)、二十碳五烯酸(EPA)、二十二碳五烯酸(DPA、二十二碳五烯酸或全顺-7,10,13,16,19-二十二碳五烯酸)、二十二碳六烯酸(DHA或全顺-4,7,10,13,16,19-二十二碳六烯酸)、二十碳五烯酸(全顺-9,12,15,18,21-二十二碳六烯酸)或二十二碳六烯酸(壬二酸或全顺-6,9,12,15,18,21-二十四碳烯酸)。在一些方面,脂肪酸是中链脂肪酸,诸如硫辛酸。
脂肪酸链的链长差异很大,可根据链长进行分类,例如从短到很长。短链脂肪酸(SCFA)是具有约五个或更少个碳链的脂肪酸(例如,丁酸)。在一些方面,脂肪酸是SCFA。中链脂肪酸(MCFA)包括具有约6-12个碳链的脂肪酸,可形成中链甘油三酯。在一些方面,脂肪酸是MCFA。长链脂肪酸(LCFA)包括具有13-21个碳链的脂肪酸。在一些方面,脂肪酸是LCFA。在一些方面,脂肪酸是LCFA。极长链脂肪酸(VLCFA)包括具有22个或更多个碳(诸如22-60、22-50或22-40个碳)的链的脂肪酸。在一些方面,脂肪酸是VLCFA。
III.A.1.c.磷脂
在一些方面,锚定部分包含磷脂。磷脂是一类作为所有细胞膜的主要组分的脂质。由于它们的两亲特征,它们可以形成脂质双层。磷脂分子的结构一般由两个疏水性脂肪酸“尾部”和一个由磷酸基团组成的亲水性“头部”组成。例如,磷脂可以是根据下式的脂质:
其中Rp代表磷脂部分,并且R1和R2代表具有或不具有可相同或不同的不饱和度的脂肪酸部分。
磷脂部分可选自例如由磷脂酰胆碱、磷脂酰乙醇胺、磷脂酰甘油、磷脂酰丝氨酸、磷脂酸、2-溶血磷脂酰胆碱和鞘磷脂组成的非限制性组。
特定的磷脂可促进与脂质双层的融合,例如,外泌体膜的脂质双层。例如,阳离子磷脂可与膜的一种或多种带负电荷的磷脂相互作用。磷脂与膜的融合可允许含脂质组合物的一种或多种组分与膜结合或穿过膜。
脂肪酸部分可选自例如由月桂酸、肉豆蔻酸、肉豆蔻油酸、棕榈酸、棕榈油酸、硬脂酸、油酸、亚油酸、α-亚麻酸、芥酸、植烷酸、花生酸、花生四烯酸、二十碳五烯酸、山萮酸、二十二碳五烯酸和二十二碳六烯酸组成的非限制性组。
在本公开中用作锚定部分的磷脂可以是天然或非天然磷脂。还设想了非天然磷脂种类,它包括具有修饰和取代的天然种类,包括支链、氧化、环化和炔烃。例如,磷脂可用一种或多种炔烃(例如,其中一个或多个双键被三键取代的烯基)官能化或交联。在适当的反应条件下,炔基基团可以在暴露于叠氮化物时发生铜催化的环加成反应。
磷脂包括但不限于甘油磷脂,诸如磷脂酰胆碱、磷脂酰乙醇胺、磷脂酰丝氨酸、磷脂酰肌醇、磷脂酰甘油和磷脂酸。
可用于本文所公开的锚定部分的磷脂的实例包括
·磷脂酰乙醇胺:例如,二月桂酰磷脂酰乙醇胺、二肉豆蔻酰磷脂酰乙醇胺、二棕榈酰磷脂酰乙醇胺、二硬脂酰磷脂酰乙醇胺、二油酰磷脂酰乙醇胺、1-棕榈酰-2-油酰磷脂酰乙醇胺、1-油酰-2棕榈酰磷脂酰乙醇胺和二芥酸酰磷脂酰乙醇胺;
·磷脂酰甘油:例如,二月桂酰磷脂酰甘油、二肉豆蔻酰磷脂酰甘油、二棕榈酰磷脂酰甘油、二硬脂酰磷脂酰甘油、二油酰磷脂酰甘油、1-棕榈酰-2-油酰-磷脂酰甘油、1-油酰-2-棕榈酰-磷脂酰甘油和二芥酸酰磷脂酰甘油;
·磷脂酰丝氨酸:例如,二月桂酰磷脂酰丝氨酸、二肉豆蔻酰磷脂酰丝氨酸、二棕榈酰磷脂酰丝氨酸、二硬脂酰磷脂酰丝氨酸、二油酰磷脂酰丝氨酸、1-棕榈酰-2-油酰-磷脂酰丝氨酸、1-油酰-2-棕榈酰-磷脂酰丝氨酸和二芥酸酰磷脂酰丝氨酸;
·磷脂酸:例如,二月桂酰磷脂酸、二肉豆蔻酰磷脂酸、二棕榈酰磷脂酸、二硬脂酰磷脂酸、二油酰磷脂酸、1-棕榈酰-2-油酰磷脂酸、1-油酰-2-棕榈酰磷脂酸和二芥酸酰磷脂酸;以及
·磷脂酰肌醇:例如,二月桂酰磷脂酰肌醇、二肉豆蔻酰磷脂酰肌醇、二棕榈酰磷脂酰肌醇、二硬脂酰磷脂酰肌醇、二油酰磷脂酰肌醇、1-棕榈酰-2-油酰-磷脂酰肌醇、1-油酰-2-棕榈酰磷脂酰肌醇和二芥酸酰磷脂酰肌醇。
磷脂可以是对称的或不对称的类型。如本文所用,术语“对称磷脂”包括具有匹配脂肪酸部分的甘油磷脂和鞘脂,其中可变脂肪酸部分和鞘氨醇主链的烃链包括相当数量的碳原子。如本文所用,术语“不对称磷脂”包括溶血脂、具有不同脂肪酸部分(例如,具有不同碳原子数和/或不饱和度(例如,双键)的脂肪酸部分)的甘油磷脂和鞘脂,其中可变脂肪酸部分和鞘氨醇主链的烃链包括不同数量的碳原子(例如,可变脂肪酸部分包括比烃链多至少两个碳原子或比烃链少至少两个碳原子)。
在一些方面,锚定部分包含至少一种对称磷脂。对称磷脂可以选自由以下各项组成的非限制性组:
1,2-二丙酰-sn-甘油-3-磷酸胆碱(03:0 PC)、
1,2-二丁酰-sn-甘油-3-磷酸胆碱(04:0 PC)、
1,2-二戊酰-sn-甘油-3-磷酸胆碱(05:0 PC)、
1,2-二己酰-sn-甘油-3-磷酸胆碱(06:0 PC)、
1,2-二庚酰-sn-甘油-3-磷酸胆碱(07:0 PC)、
1,2-二辛酰-sn-甘油-3-磷酸胆碱(08:0 PC)、
1,2-二壬酰-sn-甘油-3-磷酸胆碱(09:0 PC)、
1,2-二癸酰-sn-甘油-3-磷酸胆碱(10:0 PC)、
1,2-二-十一碳酰-sn-甘油-3-磷酸胆碱(11:0 PC、DUPC)、
1,2-二月桂酰-sn-甘油-3-磷酸胆碱(12:0 PC)、
1,2-二-十三碳酰-sn-甘油-3-磷酸胆碱(13:0 PC)、
1,2-二豆蔻酰-sn-甘油-3-磷酸胆碱(14:0 PC、DMPC)、
1,2-二-十五碳酰-sn-甘油-3-磷酸胆碱(15:0 PC)、
1,2-二棕榈酰-sn-甘油-3-磷酸胆碱(16:0 PC、DPPC)、
1,2-二植烷酰-sn-甘油-3-磷酸胆碱(4ME 16:0 PC)、
1,2-二-十七碳酰-sn-甘油-3-磷酸胆碱(17:0 PC)、
1,2-二硬脂酰-sn-甘油-3-磷酸胆碱(18:0 PC、DSPC)、
1,2-二-十九碳酰-sn-甘油-3-磷酸胆碱(19:0 PC)、
1,2-二花生四烯酰-sn-甘油-3-磷酸胆碱(20:0 PC)、
1,2-二-二十一碳酰-sn-甘油-3-磷酸胆碱(21:0 PC)、
1,2-二-二十二碳酰-sn-甘油-3-磷酸胆碱(22:0 PC)、
1,2-二-二十三碳酰-sn-甘油-3-磷酸胆碱(23:0 PC)、
1,2-二-木蜡酰-sn-甘油-3-磷酸胆碱(24:0 PC)、
1,2-二豆蔻顺油酰-sn-甘油-3-磷酸胆碱(14:1(Δ9-Cis)PC)、
1,2-二豆蔻反油酰-sn-甘油-3-磷酸胆碱(14:1(Δ9-Trans)PC)、
1,2-二棕榈顺油酰-sn-甘油-3-磷酸胆碱(16:1(Δ9-Cis)PC)、
1,2-二棕榈反油酰-sn-甘油-3-磷酸胆碱(16:1(Δ9-Trans)PC)、
1,2-二石油烯酰-sn-甘油-3-磷酸胆碱(18:1(Δ6-Cis)PC)、
1,2-二顺油酰-sn-甘油-3-磷酸胆碱(18:1(Δ9-Cis)PC、DOPC)、
1,2-二反油酰-sn-甘油-3-磷酸胆碱(18:1(Δ9-Trans)PC)、
1,2-二亚油酰-sn-甘油-3-磷酸胆碱(18:2(Cis)PC、DLPC)、
1,2-二亚油烯酰-sn-甘油-3-磷酸胆碱(18:3(Cis)PC、DLnPC)、
1,2-二-二十碳烯酰-sn-甘油-3-磷酸胆碱(20:1(Cis)PC)、
1,2-二花生四烯酰-sn-甘油-3-磷酸胆碱(20:4(Cis)PC、DAPC)、
1,2-二芥酸酰-sn-甘油-3-磷酸胆碱(22:1(Cis)PC)、
1,2-二-二十二碳六烯酰-sn-甘油-3-磷酸胆碱(22:6(Cis)PC、DHAPC)、
1,2-二神经酰-sn-甘油-3-磷酸胆碱(24:1(Cis)PC)、
1,2-二己酰-sn-甘油-3-磷酸乙醇胺(06:0 PE)、
1,2-二辛酰-sn-甘油-3-磷酸乙醇胺(08:0 PE)、
1,2-二癸酰-sn-甘油-3-磷酸乙醇胺(10:0 PE)、
1,2-二月桂酰-sn-甘油-3-磷酸乙醇胺(12:0 PE)、
1,2-二豆蔻酰-sn-甘油-3-磷酸乙醇胺(14:0 PE)、
1,2-二-十五碳酰-sn-甘油-3-磷酸乙醇胺(15:0 PE)、
1,2-二棕榈酰-sn-甘油-3-磷酸乙醇胺(16:0 PE)、
1,2-二植酰-sn-甘油-3-磷酸乙醇胺(4ME 16:0 PE)、
1,2-二-十七碳酰-sn-甘油-3-磷酸乙醇胺(17:0 PE)、
1,2-二硬脂酰-sn-甘油-3-磷酸乙醇胺(18:0 PE、DSPE)、
1,2-二棕榈油酰-sn-甘油-3-磷酸乙醇胺(16:1 PE)、
1,2-二顺油酰-sn-甘油-3-磷酸乙醇胺(18:1(Δ9-Cis)PE、DOPE)、
1,2-二反油酰-sn-甘油-3-磷酸乙醇胺(18:1(Δ9-Trans)PE)、
1,2-二亚油酰-sn-甘油-3-磷酸乙醇胺(18:2 PE、DLPE)、
1,2-二亚油烯酰-sn-甘油-3-磷酸乙醇胺(18:3 PE、DLnPE)、
1,2-二花生四烯酰-sn-甘油-3-磷酸乙醇胺(20:4 PE、DAPE)、
1,2-二十二碳六烯酰-sn-甘油-3-磷酸乙醇胺(22:6 PE、DHAPE)、
1,2-二-O-十八碳烯基-sn-甘油-3-磷酸胆碱(18:0二醚PC)、
1,2-二油酰-sn-甘油-3-磷酸-rac-(1-甘油)钠盐(DOPG)以及它们的任何组合。
在一些方面,锚定部分包含至少一种选自由以下各项组成的非限制性组的对称磷脂:DLPC、DMPC、DOPC、DPPC、DSPC、DUPC、18:0二醚PC、DLnPC、DAPC、DHAPC、DOPE、4ME 16:0PE、DSPE、DLPE、DLnPE、DAPE、DHAPE、DOPG以及它们的任何组合。
在一些方面,锚定部分包含至少一种不对称磷脂。不对称磷脂可以选自由以下各项组成的非限制性组:
1-豆蔻酰-2-棕榈酰-sn-甘油-3-磷酸胆碱(14:0-16:0 PC、MPPC)、
1-豆蔻酰-2-硬脂酰-sn-甘油-3-磷酸胆碱(14:0-18:0 PC、MSPC)、
1-棕榈酰-2-乙酰-sn-甘油-3-磷酸胆碱(16:0-02:0 PC)、
1-棕榈酰-2-豆蔻酰-sn-甘油-3-磷酸胆碱(16:0-14:0 PC、PMPC)、
1-棕榈酰-2-硬脂酰-sn-甘油-3-磷酸胆碱(16:0-18:0 PC、PSPC)、
1-棕榈酰-2-油酰-sn-甘油-3-磷酸胆碱(16:0-18:1 PC、POPC)、
1-棕榈酰-2-亚油酰-sn-甘油-3-磷酸胆碱(16:0-18:2 PC、PLPC)、
1-棕榈酰-2-花生四烯酰-sn-甘油-3-磷酸胆碱(16:0-20:4 PC)、
1-棕榈酰-2-二十二碳六烯酰-sn-甘油-3-磷酸胆碱(14:0-22:6 PC)、
1-硬脂酰-2-肉豆蔻酰-sn-甘油-3-磷酸胆碱(18:0-14:0 PC、SMPC)、
1-硬脂酰-2-棕榈酰-sn-甘油-3-磷酸胆碱(18:0-16:0 PC、SPPC)、
1-硬脂酰-2-油酰-sn-甘油-3-磷酸胆碱(18:0-18:1 PC、SOPC)、
1-硬脂酰-2-亚油酰-sn-甘油-3-磷酸胆碱(18:0-18:2 PC)、
1-硬脂酰-2-花生四烯酰-sn-甘油-3-磷酸胆碱(18:0-20:4 PC)、
1-硬脂酰-2-二十二碳六烯酰-sn-甘油-3-磷酸胆碱(18:0-22:6 PC)、
1-油酰-2-豆蔻酰-sn-甘油-3-磷酸胆碱(18:1-14:0 PC、OMPC)、
1-油酰-2-棕榈酰-sn-甘油-3-磷酸胆碱(18:1-16:0 PC、OPPC)、
1-油酰-2-硬脂酰-sn-甘油-3-磷酸胆碱(18:1-18:0 PC、OSPC)、
1-棕榈酰-2-油酰-sn-甘油-3-磷酸乙醇胺(16:0-18:1 PE、POPE)、
1-棕榈酰-2-亚油酰-sn-甘油-3-磷酸乙醇胺(16:0-18:2 PE)、
1-棕榈酰-2-花生四烯酰-sn-甘油-3-磷酸乙醇胺(16:0-20:4 PE)、
1-棕榈酰-2-二十二碳六烯酰-sn-甘油-3-磷酸乙醇胺(16:0-22:6 PE)、
1-硬脂酰-2-油酰-sn-甘油-3-磷酸乙醇胺(18:0-18:1 PE)、
1-硬脂酰-2-亚油酰-sn-甘油-3-磷酸乙醇胺(18:0-18:2 PE)、
1-硬脂酰-2-花生四烯酰-sn-甘油-3-磷酸乙醇胺(18:0-20:4 PE)、
1-硬脂酰-2-二十二碳六烯酰-sn-甘油-3-磷酸乙醇胺(18:0-22:6 PE)、
1-油酰-2-胆固醇半琥珀酰-sn-甘油-3-磷酸胆碱(OChemsPC)以及它们的任何组合。
为了提供更显著的核酸酶抗性、细胞摄取效率和更显著的RNA干扰效果,可以使用磷脂酰乙醇胺作为锚定部分,例如二豆蔻酰磷脂酰乙醇胺、二棕榈酰磷脂酰乙醇胺、1-棕榈酰-2-油酰-磷脂酰乙醇胺和二油酰磷脂酰乙醇胺。
可根据脂质和接头或ASO的类型适当地选择脂质(例如,磷脂)和接头组合或BAM(例如,SAO)的结合位点。除脂质疏水基团以外的任何位置都可以通过化学键与接头或ASO连接。例如,当使用磷脂酰乙醇胺时,可以通过在磷脂酰乙醇胺的氨基与接头或ASO之间形成酰胺键等来形成连接。当使用磷脂酰甘油时,可以通过在甘油残基的羟基与接头或ASO之间形成酯键、醚键等来形成连接。当使用磷脂酰丝氨酸时,可以通过在丝氨酸残基的氨基或羧基与接头或ASO之间形成酰胺键或酯键等来形成连接。当使用磷脂酸时,可以通过在磷酸残基和接头或ASO之间形成磷酸酯键等来形成连接。当使用磷脂酰肌醇时,可以通过在肌醇残基的羟基与接头或ASO之间形成酯键、醚键等来形成连接。
III.A.1.d.溶血脂(例如,溶血磷脂)
在一些方面,锚定部分包含溶血脂,例如溶血磷脂。溶血脂是脂质的衍生物,其中一个或两个脂肪酰基链通常通过水解除去。溶血磷脂是磷脂的衍生物,其中一个或两个脂肪酰基链通过水解除去。
在一些方面,锚定部分包含上文公开的任何磷脂,其中一个或两个酰基链通过水解除去,因此所得的溶血磷脂包含一个脂肪酸酰基链或不包含脂肪酸酰基链。
在一些方面,锚定部分包含溶血甘油磷脂、溶血糖鞘脂、溶血磷脂酰胆碱、溶血磷脂酰乙醇胺、溶血磷脂酰肌醇或溶血磷脂酰丝氨酸。
在一些方面,锚定部分包含选自由以下各项组成的非限制性组的溶血脂:
1-己酰-2-羟基-sn-甘油-3-磷酸胆碱(06:0 Lyso PC)、
1-庚酰-2-羟基-sn-甘油-3-磷酸胆碱(07:0 Lyso PC)、
1-辛酰-2-羟基-sn-甘油-3-磷酸胆碱(08:0 Lyso PC)、
1-壬酰-2-羟基-sn-甘油-3-磷酸胆碱(09:0 Lyso PC)、
1-癸酰-2-羟基-sn-甘油-3-磷酸胆碱(10:0 Lyso PC)、
1-十一碳酰-2-羟基-sn-甘油-3-磷酸胆碱(11:0 Lyso PC)、
1-月桂酰-2-羟基-sn-甘油-3-磷酸胆碱(12:0 Lyso PC)、
1-十三碳酰-2-羟基-sn-甘油-3-磷酸胆碱(13:0 Lyso PC)、
1-豆蔻酰-2-羟基-sn-甘油-3-磷酸胆碱(14:0 Lyso PC)、
1-十五碳酰-2-羟基-sn-甘油-3-磷酸胆碱(15:0 Lyso PC)、
1-棕榈酰-2-羟基-sn-甘油-3-磷酸胆碱(16:0 Lyso PC)、
1-十七碳酰-2-羟基-sn-甘油-3-磷酸胆碱(17:0 Lyso PC)、
1-硬脂酰-2-羟基-sn-甘油-3-磷酸胆碱(18:0 Lyso PC)、
1-油酰-2-羟基-sn-甘油-3-磷酸胆碱(18:1 Lyso PC)、
1-十九碳酰-2-羟基-sn-甘油-3-磷酸胆碱(19:0 Lyso PC)、
1-二十碳酰-2-羟基-sn-甘油-3-磷酸胆碱(20:0 Lyso PC)、
1-二十二碳酰-2-羟基-sn-甘油-3-磷酸胆碱(22:0 Lyso PC)、
1-二十四碳酰-2-羟基-sn-甘油-3-磷酸胆碱(24:0 Lyso PC)、
1-二十六碳酰-2-羟基-sn-甘油-3-磷酸胆碱(26:0 Lyso PC)、
1-豆蔻酰-2-羟基-sn-甘油-3-磷酸乙醇胺(14:0 Lyso PE)、
1-棕榈酰-2-羟基-sn-甘油-3-磷酸乙醇胺(16:0 Lyso PE)、
1-硬脂酰-2-羟基-sn-甘油-3-磷酸乙醇胺(18:0 Lyso PE)、
1-油酰-2-羟基-sn-甘油-3-磷酸乙醇胺(18:1 Lyso PE)、
1-十六烷基-sn-甘油-3-磷酸胆碱(C16 Lyso PC)以及
它们的任何组合。
III.A.1.e.维生素
在一些方面,锚定部分包含亲脂性维生素,例如叶酸、维生素A、维生素E或维生素K。
在一些方面,锚定部分包含维生素A。维生素A是一组不饱和营养有机化合物,包括视黄醇、视黄醛、视黄酸和几种维生素A原类胡萝卜素(最显著的是β-胡萝卜素)。在一些方面,锚定部分包含视黄醇。在一些方面,锚定部分包含类维生素A。类维生素A是一类作为维生素A的同效维生素或与其有化学关系的化学化合物。在一些方面,锚定部分包含第一代类维生素A(例如,视黄醇、维A酸、异维A酸或阿利维A酸)、第二代类维生素A(例如,依曲替酯或阿曲汀)、第三代类维生素A(例如,阿达帕林、贝沙罗汀、或他扎罗汀)或它们的任何组合。
在一些方面,锚定部分包含维生素E。生育酚是一类甲基化酚,其中许多具有维生素E活性。因此,在一些方面,锚定部分包含α-生育酚、β-生育酚、γ-生育酚、δ-生育酚或它们的组合。
生育三烯酚也具有维生素E活性。生育三烯酚和生育酚之间的关键化学结构差异在于生育三烯酚具有具有三个碳-碳双键的不饱和类异戊二烯侧链,而生育酚的侧链则是饱和的。在一些方面,锚定部分包含α-生育三烯酚、β-生育三烯酚、γ-生育三烯酚、δ-生育三烯酚或它们的组合。生育三烯酚可用下式表示
alpha(α)-生育三烯酚:R1=Me,R2=Me,R3=Me;
beta(β)-生育三烯酚:R1=Me,R2=H,R3=Me;
gamma(γ)-生育三烯酚:R1=H,R2=Me,R3=Me;
delta(δ)-生育三烯酚:R1=H,R2=H,R3=Me。
在一些方面,锚定部分包含维生素K。在化学上,维生素K家族包含2-甲基-1.4-萘醌(3-)衍生物。维生素K包括两种天然维生素:维生素K1和维生素K2。维生素K1(也称为植物酮二酮、叶绿醌或(E)-植物酮二酮)的结构以存在植基为特征。维生素K2(甲基萘醌)的结构以分子中存在的聚异戊二烯基侧链为标志,所述侧链可包含六至13个异戊二烯基单元。因此,维生素K2由许多相关的化学亚型组成,具有由类异戊二烯原子基团构成的不同长度的碳侧链。MK-4是最常见的维生素K2形式。长链形式,诸如MK-7、MK-8和MK-9在发酵食品中占主导地位。较长链形式的维生素K2(诸如MK-10至MK-13)是由细菌合成的,但它们吸收不好,几乎没有生物学功能。除天然形式的维生素K外,还有多种合成形式的维生素K,诸如维生素K3(甲萘醌;2-甲基萘-1,4-二酮)、维生素K4和维生素K5。
因此,在一些方面,锚定部分包含维生素K1、K2(例如,MK-4、MK-5、MK-6、MK-7、MK-8、MK-9、MK-10、MK-11、MK-12或MK-13)、K3、K4、K5或它们的任何组合。
IV.A.2.接头组合
在一些方面,ASO通过接头组合与本文所公开的疏水膜锚定部分连接,所述接头组合可包含可切割和/或不可切割的接头的任何组合。接头组合的主要功能是提供一个或多个锚定部分与BAM靶标之间的最适间距。例如,在ASO的情况下,接头组合应减少空间位阻并定位ASO,以便它可与靶核酸(例如,mRNA或miRNA)相互作用。
接头可以对切割敏感(“可切割的接头”),从而促进生物活性分子的释放。因此,在一些方面,本文所公开的接头组合可包含可切割的接头。在生物活性分子保持活性的条件下,此类可切割的接头可以对例如酸诱导的切割、光诱导的切割、肽酶诱导的切割、酯酶诱导的切割和二硫键切割敏感。或者,接头可以基本上抗切割(“不可切割的接头”)。在一些方面,可切割的接头包含间隔子。在一些方面,间隔子是PEG。
在一些方面,接头组合包含至少2个、至少3个、至少4个、至少5个或至少6个或更多个本文所公开的不同接头。在一些方面,接头组合中的接头可通过酯键联(例如,磷酸二酯或硫代磷酸酯)连接。
在一些方面,接头是锚定部分与BAM例如ASO之间的直接键。
III.A.2.a.不可切割的接头
在一些方面,接头组合包含“不可切割的接头”。不可切割的接头是能够以稳定的共价方式连接本公开的修饰的生物活性分子的两个或更多个组分(例如,生物活性分子和锚定部分;生物活性分子和可切割的接头;锚定部分和可切割的接头)的任何化学部分,并且不落入上面列出的可切割接头的类别内。因此,不可切割的接头基本上耐受酸诱导的切割、光诱导的切割、肽酶诱导的切割、酯酶诱导的切割和二硫键切割。
此外,不可切割是指在环状二核苷酸和/或抗体不失去其活性的条件下,接头中或与接头相邻的化学键承受由酸、光不稳定切割剂、肽酶、酯酶或切割二硫键的化学或生理化合物诱导的切割的能力。在一些方面,生物活性分子通过另一个接头例如自分解接头连接至接头。
在一些方面,接头组合包括不可切割的接头,所述不可切割的接头包括例如四乙二醇(TEG)、六乙二醇(HEG)、聚乙二醇(PEG)、琥珀酰亚胺或它们的任何组合。在一些方面,所述不可切割的接头包含将所述生物活性分子连接至所述不可切割的接头的间隔子单元。
在一些方面,一个或多个不可切割的接头包含连接在一起的较小单元(例如,HEG、TEG、甘油、C2至C12烷基等)。在一个方面,键联是酯键联(例如,磷酸二酯或硫代磷酸酯)或其他键联。
III.A.2.b.乙二醇(HEG、TEG、PEG)
在一些方面,接头组合包括不可切割的接头,其中所述不可切割的接头包含聚乙二醇(PEG),其特征在于式R3-(O-CH2-CH2)n-或R3-(0-CH2-CH2)n-O-,其中R3是氢、甲基或乙基,并且n的值为2至200。在一些方面,可切割的接头包含间隔子。在一些方面,间隔子是PEG。
在一些方面,PEG接头是低聚乙二醇,例如二乙二醇、三乙二醇、四乙二醇(TEG)、五乙二醇或六乙二醇(HEG)接头。
在一些方面,n的值为2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17,18,19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101、102、103、104、105、106、107、108、109、110、111、112、113、114、115、116、117、118、119、120、121、122、123、124、125、126、127、128、129、130、131、132、133、134、135、136、137、138、139、140、141、142、143、144、145、146、147、148、149、150、151、152、153、154、155、156、157、158、159、160、161、162、163、164、165、166、167、168、169、170、171、172、173、174、175、176、177、178、179、189、181、182、183、184、185、186、187、188、189、190、191、192、193、194、195、196、197、198、199或200。
在一些方面,n在2和10之间、在10和20之间、在20和30之间、在30和40之间、在40和50之间、在50和60之间、在60和70之间、在70和80之间、在80和90之间、在90和100之间、在100和110之间、在110和120之间、在120和130之间、在130和140之间、在140和150之间、在150和160之间、在160和170之间、在170和180之间、在180和190之间或在190和200之间。
在一些特定方面,n的值为3至200、3至20、10至30或9至45。
在一些方面,PEG是支链PEG。支链PEG具有三至十条从一个中央核心基团发出的PEG链。
在某些方面,PEG部分是单分散聚乙二醇。在本公开的上下文中,单分散聚乙二醇(mdPEG)是具有单一的、确定的链长和分子量的PEG。mdPEG通常通过色谱法从聚合混合物中分离产生。在某些式中,单分散PEG部分被指定为缩写mdPEG。
在一些方面,PEG是星形PEG。星形PEG具有10至100条从一个中央核心基团发出的PEG链。
在一些方面,PEG是梳状PEG。梳状PEG具有多个通常接枝到聚合物主链上的PEG链。
在某些方面,PEG的摩尔质量在100g/mol和3000g/mol之间,特别是在100g/mol和2500g/mol之间,更特别是约100g/mol至2000g/mol。在某些方面,PEG的摩尔质量在200g/mol和3000g/mol之间,特别是在300g/mol和2500g/mol之间,更特别是约400g/mol至2000g/mol。
在一些方面,PEG是PEG100、PEG200、PEG300、PEG400、PEG500、PEG600、PEG700、PEG800、PEG900、PEG1000、PEG1100、PEG1200、PEG1300、PEG1400、PEG1500、PEG1600、PEG1700、PEG1800、PEG1900、PEG2000、PEG2100、PEG2200、PEG2300、PEG2400、PEG2500、PEG1600、PEG1700、PEG1800、PEG1900、PEG2000、PEG2100、PEG2200、PEG2300、PEG2400、PEG2500、PEG2600、PEG2700、PEG2800、PEG2900或PEG3000。在一个特定方面,PEG是PEG400。在另一个特定方面,PEG是PEG2000。
在一些方面,本公开的接头组合可包含数个PEG接头,例如侧接PEG、HEG或TEG接头的可切割的接头。
在一些方面,接头组合包含(HEG)n和/或(TEG)n,其中n是在1和50之间的整数,并且每个单元例如经由磷酸酯接头、硫代磷酸酯键或它们的组合连接。
III.A.2.c.甘油和聚甘油(PG)
在一些方面,接头组合包含不可切割的接头,所述不可切割的接头包含甘油单元或由式((R3-O-(CH2-CHOH-CH2O)n-)描述的聚甘油(PG),其中R3是氢、甲基或乙基,并且n的值为3至200。在一些方面,n的值为3至20。在一些方面,n的值为10至30。
在一些方面,PG接头是双甘油、三甘油、四甘油(TG)、五甘油或六甘油(HG)接头。
在一些方面,n的值为2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17,18,19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101、102、103、104、105、106、107、108、109、110、111、112、113、114、115、116、117、118、119、120、121、122、123、124、125、126、127、128、129、130、131、132、133、134、135、136、137、138、139、140、141、142、143、144、145、146、147、148、149、150、151、152、153、154、155、156、157、158、159、160、161、162、163、164、165、166、167、168、169、170、171、172、173、174、175、176、177、178、179、189、181、182、183、184、185、186、187、188、189、190、191、192、193、194、195、196、197、198、199或200。
在一些方面,n在2和10之间、在10和20之间、在20和30之间、在30和40之间、在40和50之间、在50和60之间、在60和70之间、在70和80之间、在80和90之间、在90和100之间、在100和110之间、在110和120之间、在120和130之间、在130和140之间、在140和150之间、在150和160之间、在160和170之间、在170和180之间、在180和190之间或在190和200之间。
在这些方面的一些替代方案中,n的值为9至45。在一些方面,异源性部分是由式(R3-O-(CH2-CHOR5-CH2-O)n-)描述的支链聚甘油,其中R5是氢或由式(R3-O-(CH2-CHOH-CH2-O)n-)描述的直链甘油链,并且R3为氢、甲基或乙基。在一些方面,异源性部分是由式(R3-O-(CH2-CHOR5-CH2-O)n-)描述的超支链聚甘油,其中R5是氢或由式(R3-O-(CH2-CHOR6-CH2-O)n-)描述的甘油链,其中R6是氢或由式(R3-O-(CH2-CHOR7-CH2-O)n-)描述的甘油链,其中R7是氢或由式(R3-O-(CH2-CHOH-CH2-O)n-)描述的线性甘油链,并且R3是氢、甲基或乙基。超支链甘油及其合成方法在Oudshorn等人(2006)Biomaterials 27:5471-5479;Wilms等人(20100Acc.Chem.Res.43,129-41和本文引用的参考文献中有所描述。
在某些方面,PG的摩尔质量在100g/mol和3000g/mol之间,特别是在100g/mol和2500g/mol之间,更特别是约100g/mol至2000g/mol。在某些方面,PG的摩尔质量在200g/mol和3000g/mol之间,特别是在300g/mol和2500g/mol之间,更特别是约400g/mol至2000g/mol。
在一些方面,PG是PG100、PG200、PG300、PG400、PG500、PG600、PG700、PG800、PG900、PG1000、PG1100、PG1200、PG1300、PG1400、PG1500、PG1600、PG1700、PG1800、PG1900、PG2000、PG2100、PG2200、PG2300、PG2400、PG2500、PG1600、PG1700、PG1800、PG1900、PG2000、PG2100、PG2200、PG2300、PG2400、PG2500、PG2600、PG2700、PG2800、PG2900或PG3000。在一个特定方面,PG是PG400。在另一个特定方面,PG是PG2000。
在一些方面,接头组合包含(甘油)n、和/或(HG)n和/或(TG)n,其中n是在1和50之间的整数,并且每个单元例如经由磷酸酯接头、硫代磷酸酯键或它们的组合连接。
III.A.2.d.脂族(烷基)接头
在一些方面,接头组合包含至少一个脂族(烷基)接头,例如丙基、丁基、己基或C2-C12烷基(诸如C2-C10烷基或C2-C6烷基)。
在一些方面,接头组合包含烷基链,例如未取代的烷基。在一些方面,接头组合包含取代的或未取代的烯基、取代的或未取代的炔基、芳基烷基、芳基烯基、芳基炔基、杂芳基烷基、杂芳基烯基、杂芳基炔基、杂环烷基烷基、杂环烷基烯基、杂环烷基炔基、芳基、杂芳基、杂环基、环烯基、烷基芳基烷基、烷基芳基烯基、烷基芳基炔基、烯基芳基烷基、烯基Reyl烯基、烯基芳基炔基、炔基芳基烷基、炔基芳基烯基、炔基芳基炔基、烷基杂芳基烷基、烷基杂芳基烷基、烷基杂芳基烯基、烷基杂芳基烯基、烷基杂芳基炔基、烯基杂芳基烷基、烯基杂芳基烯基、烯基杂芳基炔基、炔基杂芳基烷基、炔基杂芳基烯基、炔基杂芳基炔基、烷基杂环基烷基、烷基杂环基烯基、烷基杂环基炔基、烯基杂环基烷基、烯基杂环基烯基或烯基杂环基炔基。
任选地,这些组分是取代的。取代基包括醇、烷氧基(诸如甲氧基、乙氧基和丙氧基)、直链或支链烷基(诸如C1-C12烷基)、胺、氨基烷基(诸如氨基C1-C12烷基)、亚磷酰胺、磷酸酯、氨基磷酸酯、二硫代磷酸酯、硫代磷酸酯、酰肼、肼、卤素(诸如F、Cl、Br或I)、酰胺、烷基酰胺(诸如酰胺C1-C12烷基)、羧酸、羧酸酯、羧酸酐、羧酸卤化物、醚、磺酰卤、亚氨酸酯、异氰酸酯、异硫氰酸酯、卤代甲酸酯、碳二亚胺加合物、醛、酮、巯基、卤代乙酰基、卤代烷、烷基磺酸酯、C(=O)CH=CHC(=O)(马来酰亚胺)、硫醚、氰基、糖(诸如甘露糖、半乳糖和葡萄糖)、α,β-不饱和羰基、烷基汞或α,β-不饱和砜。
除非另有说明,否则本身或作为另一个取代基的部分的术语“烷基”意指具有指定碳原子数的直链或支链烃基(例如,C1-C10意指一至十个碳原子)。通常,烷基将具有1至24个碳原子,例如具有1至10个碳原子、1至8个碳原子或1至6个碳原子。“低级烷基”为具有1至4个碳原子的烷基。术语“烷基”包括二价和多价基团。例如,在合适的情况下,例如,当该式表示烷基是二价时或者当取代基连接在一起形成环时,术语“烷基”包括“亚烷基”。烷基基团的实例包括但不限于甲基、乙基、正丙基、异丙基、正丁基、叔丁基、异丁基、仲丁基以及例如正戊基、正己基、正庚基和正辛基的同源物和异构体。
术语“亚烷基”本身或作为另一个取代基的一部分是指二价(双基)烷基基团,其中烷基如本文所定义。“亚烷基”例如但不限于-CH2CH2CH2CH2-。通常,“亚烷基”基团将具有1至24个碳原子,例如具有10个或更少的碳原子(例如,1至8个或1至6个碳原子)。“低级亚烷基”为具有1至4个碳原子的亚烷基。
术语“链烯基”,本身或作为另一个取代基的一部分,是指具有2至24个碳原子和至少一个双键的直链或支链烃基。典型的链烯基具有2至10个碳原子和至少一个双键。在一个方面,链烯基具有2至8个碳原子或2至6个碳原子和1至3个双键。示例性链烯基包括乙烯基、2-丙烯基、1-丁-3-烯基、巴豆基、2-(丁二烯基)、2,4-戊二烯基、3-(1,4-戊二烯基)、2-异戊烯基、1-戊-3-烯基、1-己-5-烯基等。
术语“炔基”,本身或作为另一个取代基的一部分,是指具有2至24个碳原子和至少一个三键的直链或支链、不饱和或多不饱和烃基。典型的“炔基”具有2至10个碳原子和至少一个三键。在本发明的一个方面,炔基具有2至6个碳原子和至少一个三键。示例性炔基包括丙-1-炔基、丙-2-炔基(即,炔丙基)、乙炔基和3-丁炔基。
术语“烷氧基”、“烷基氨基”和“烷硫基”(或硫代烷氧基)以其常规含义使用,并且是指分别通过氧原子、氨基或硫原子连接至分子的其余部分的烷基。
本身或与另一个术语联用的术语“杂烷基”意指由指定数目的碳原子(例如,C2-C10或C2-C8)和选自例如N、O、S、Si、B和P(在一个方面,N、O和S)的至少一个杂原子组成的稳定的、直链或支链烃基团,其中氮、硫和磷原子任选被氧化,并且一个(多个)氮原子任选被季铵化。一个(多个)杂原子被置于杂烷基的任何内部位置。杂烷基的实例包括但不限于-CH2-CH2-O-CH3、-CH2-CH2-NH-CH3、-CH2-CH2-N(CH3)-CH3、-CH2-S-CH2-CH3、-CH2-CH2-S(O)-CH3、-CH2-CH2-S(O)2-CH3、-CH=CH-O-CH3、-CH2-Si(CH3)3、-CH2-CH=N-OCH3和-CH=CH-N(CH3)-CH3。至多两个杂原子可以是连续的,诸如例如-CH2-NH-OCH3和–CH2-O-Si(CH3)3。
类似地,否则本身或作为另一个取代基的一部分的术语“杂亚烷基”意指从杂烷基衍生的二价基,例如但不限于-CH2-CH2-S-CH2-CH2-和-CH2-S-CH2-CH2-NH-CH2-。通常,杂烷基将具有3至24个原子(碳和杂原子,不包括氢)(3至24元杂烷基)。在另一个实例中,杂烷基总共具有3至10个原子(3-至10-元杂烷基)或3至8个原子(3-至8-元杂烷基)。在合适的情况下,例如,当该式表示杂烷基是二价时或者当取代基连接在一起形成环时,术语“杂烷基”包括“杂亚烷基”。
术语“环烷基”本身或与其他术语组合表示具有3至24个碳原子,例如具有3至12个碳原子(例如,C3-C8环烷基或C3-C6环烷基)。环烃基的实例包括但不限于环丙基、环丁基、环戊基、环己基、环庚基、1-环己烯基、3-环己烯基、环庚基等。术语“环烃基”也包括桥接的、多环(例如,双环)结构,诸如降冰片基、金刚烷基和双环[2.2.1]庚基。“环烃基”可以与至少一个(例如,1至3个)选自芳基(例如,苯基)、杂芳基(例如,吡啶基)和非芳族(例如,碳环或杂环)环的其他环稠合。当“环烃基”包括稠合的芳基、杂芳基或杂环时,则“环烃基”通过碳环连接至分子的其余部分。
本身或与其他术语联用的术语“杂环烃基”、“杂环的”、“杂环”或“杂环基”表示本领域技术人员已知的稳定组合的含有至少一个并且多达5个选自例如,N、O、S、Si、B和P(例如,N、O和S)的杂原子的碳环非芳环(例如,3-至8-元环和例如,4-、5-、6-或7-元环),其中氮、硫和磷原子任选被氧化,并且一个(多个)氮原子任选被季铵化(例如,1至4个选自氮、氧和硫的杂原子),或含有至少一个并且多达10个杂原子(例如,1至5个选自N、O和S的杂原子)的4-至8-元环的稠环系统。示例性的杂环烃基包括稠合的苯基环。当“杂环”基包括稠合的芳基、杂芳基或环烃基环时,则“杂环”基通过杂环连接至分子的其余部分。杂原子可以占据杂环与分子的其余部分连接的位置。
本发明的示例性杂环烃基或杂环基包括吗啉基、硫代吗啉基、硫代吗啉基S-氧化物、硫代吗啉基S,S-二氧化物、哌嗪基、高哌嗪基、吡咯烷基、吡咯啉基、咪唑烷基、四氢吡喃基、哌啶基、四氢呋喃基、四氢噻吩基、哌啶基、高哌啶基、高吗啉基、高硫代吗啉基(homothiomorpholinyl)、高硫代吗啉基S,S-二氧化物、噁唑烷酮基、二氢吡唑基、二氢吡咯基、二氢吡唑基、二氢吡啶基、二氢嘧啶基、二氢呋喃基、二氢吡喃基、四氢噻吩基S-氧化物、四氢噻吩基S,S-二氧化物、高硫代吗啉基S-氧化物、1-(1,2,5,6-四氢吡啶基)、1-哌啶基、2-哌啶基、3-哌啶基、4-吗啉基、3-吗啉基、四氢呋喃-2-基、四氢呋喃-3-基、四氢噻吩-2-基、四氢噻吩-3-基、1-哌嗪基、2-哌嗪基等。
“芳基”意指具有单环(例如,苯基)或稠合到其他芳族或非芳族环(例如,1至3个其他环)的5-、6-或7-元芳族碳环基。当“芳基”包括非芳环(诸如在1,2,3,4-四氢萘基中)或杂芳基时,则“芳基”通过芳环(例如,苯环)连接至分子的其余部分。芳基为任选取代的(例如,具有本文所述的1至5个取代基)。在一个实例中,芳基具有6至10个碳原子。芳基的非限制性实例包括苯基、1-萘基、2-萘基、喹啉、茚满基、茚基、二氢萘基、芴基、四氢萘基、苯并[d][1,3]二氧杂环戊烯基或6,7,8,9-四氢-5H-苯并[a]环庚烯基。在一个方面,芳基选自苯基、苯并[d][1,3]二氧杂环戊烯基和萘基。在又一个方面,芳基为苯基。
术语“芳基烷基(arylalkyl)”或“芳烷基(aralkyl)”旨在包括其中芳基或杂芳基与烷基连接以生成基团-烷基-芳基和-烷基-杂芳基(其中烷基、芳基和杂芳基如本文所定义)的那些基团。示例性的“芳基烷基”或“芳烷基”包括苄基、苯乙基、吡啶基甲基等。
“芳氧基”意指基团-O-芳基,其中芳基如本文所定义。在一个实例中,芳氧基的芳基部分是苯基或萘基。在一个方面,芳氧基的芳基部分为苯基。
术语“杂芳基”或“杂芳族”是指含有至少一个选自N、O、S、Si和B(例如,N、O和S)的杂原子(例如,1至5个杂原子,诸如1-3个杂原子)的多不饱和的5-、6-或7-元芳族部分,其中氮和硫原子任选被氧化,并且一个(多个)氮原子任选被季铵化。“杂芳基”可以是单环或与其他芳基、杂芳基、环烃基或杂环烃基环(例如,1至3个其他环)稠合。当“杂芳基”包括稠合的芳基、环烃基或杂环烃基环时,则“杂芳基”通过杂芳环连接至分子的其余部分。杂芳基基团可以通过碳或杂原子连接至分子的其余部分。
在一个实例中,杂芳基基团具有4至10个碳原子和1至5个选自O、S和N的杂原子。杂芳基的非限制性实例包括吡啶基、嘧啶基、喹啉基、苯并噻吩基、吲哚基、二氢吲哚基、哒嗪基、吡嗪基、异吲哚基、异喹啉基、喹唑啉基、喹喔啉基、酞嗪基、咪唑基、异噁唑基、吡唑基、噁唑基、噻唑基、吲哚嗪基、吲唑基、苯并噻唑基、苯并咪唑基、苯并呋喃基、呋喃基、噻吩基、吡咯基、噁二唑基、噻二唑基、三唑基、四唑基、异噻唑基、萘啶基、异色满基、色满基、四氢异喹啉基、异二氢吲哚基、异苯并四氢呋喃基、异苯并四氢噻吩基、异苯并噻吩基、苯并噁唑基、吡啶并吡啶基、苯并四氢呋喃基、苯并四氢噻吩基、嘌呤基、苯并间二氧杂环戊烯基(benzodioxolyl)、三嗪基、蝶啶基、苯并噻唑基、咪唑并吡啶基、咪唑并噻唑基、二氢苯并异噁嗪基(dihydrobenzisoxazinyl)、苯并异噁嗪基(benzisoxazinyl)、苯并噁嗪基、二氢苯并异噻嗪基(dihydrobenzisothiazinyl)、苯并吡喃基、苯并噻喃基、色酮基、色满酮基(chromanonyl)、吡啶基-N-氧化物、四氢喹啉基、二氢喹啉基、二氢喹啉酮基、二氢异喹啉酮基、二氢香豆素基、二氢异香豆素基、异二氢吲哚酮基(isoindolinonyl)、苯并二噁烷基、苯并噁唑啉酮基(benzoxazolinonyl)、吡咯基N-氧化物、嘧啶基N-氧化物、哒嗪基N-氧化物、吡嗪基-N-氧化物、喹啉基-N-氧化物、吲哚基N-氧化物、二氢吲哚基N-氧化物、异喹啉基N-氧化物、喹唑啉基N-氧化物、喹喔啉基N-氧化物、酞嗪基N-氧化物、咪唑基N-氧化物、异噁唑基N-氧化物、噁唑基N-氧化物、噻唑基N-氧化物、吲哚嗪基N-氧化物、吲唑基N-氧化物、苯并噻唑基N-氧化物、苯并咪唑基N-氧化物、吡咯基N-氧化物、噁二唑基N-氧化物、噻二唑基N-氧化物、三唑基N-氧化物、四唑基N-氧化物、苯并噻喃基S-氧化物、苯并噻喃基S,S-二氧化物。示例性杂芳基包括咪唑基、吡唑基、噻二唑基、三唑基、异噁唑基、异噻唑基、咪唑基、噻唑基、噁二唑基和吡啶基。其他示例性杂芳基包括1-吡咯基、2-吡咯基、3-吡咯基、3-吡唑基、2-咪唑基、4-咪唑基、吡嗪基、2-噁唑基、4-噁唑基、2-苯基-4-噁唑基、5-噁唑基、3-异噁唑基、4-异噁唑基、5-异噁唑基、2-噻唑基、4-噻唑基、5-噻唑基、2-呋喃基、3-呋喃基、2-噻吩基、3-噻吩基、2-吡啶基、3-吡啶基、吡啶-4-基、2-嘧啶基、4-嘧啶基、5-苯并噻唑基、嘌呤基、2-苯并咪唑基、5-吲哚基、1-异喹啉基、5-异喹啉基、2-喹喔啉基、5-喹喔啉基、3-喹啉基、6-喹啉基。以上所提到的芳环和杂芳环体系中每个的取代基选自由以下所述的可接受的芳基基团取代基组成的组。
脂族接头的实例包括以下结构:
—O—CO—O—
—NH—CO—O—
—NH—CO—NH—
—NH—(CH2)n1—
—S—(CH2)n1—
—CO—(CH2)n1—CO—
—CO—(CH2)n1—NH—
—NH—(CH2)n1—NH—
—CO—NH—(CH2)n1—NH—CO—
—C(=S)—NH—(CH2)n1—NH—CO—
—C(=S)—NH—(CH2)n1—NH—C—(=S)—
—CO—O—(CH2)n1—O—CO—
—C(=S)—O—(CH2)n1—O—CO—
—C(=S)—O—(CH2)n1—O—C—(=S)—
—CO—NH—(CH2)n1—O—CO—
—C(=S)—NH—(CH2)n1—O—CO—
—C(=S)—NH—(CH2)n1—O—C—(=S)—
—CO—NH—(CH2)n1—O—CO—
—C(=S)—NH—(CH2)n1—CO—
—C(=S)—O—(CH2)n1—NH—CO—
—C(=S)—NH—(CH2)n1—O—C—(=S)—
—NH—(CH2CH2O)n2—CH(CH2OH)—
—NH—(CH2CH2O)n2—CH2—
—NH—(CH2CH2O)n2—CH2—CO—
—O—(CH2)n3—S—S—(CH2)n4—O—P(=O)2—
—CO—(CH2)n3—O—CO—NH—(CH2)n4—
—CO—(CH2)n3—CO—NH—(CH2)n4—
—(CH2)n1NH—
—C(O)(CH2)n1NH—
—C(O)—(CH2)n1-C(O)—
—C(O)—(CH2)n1-C(O)O—
—C(O)—O—
—C(O)—(CH2)n1-NH—C(O)—
—C(O)—(CH2)n1—
—C(O)—NH—
—C(O)—
—(CH2)n1-C(O)—
—(CH2)n1-C(O)O—
—(CH2)n1—
—(CH2)n1-NH—C(O)—
n1是1和40之间的整数(例如,2至20,或2至12);n2是1和20之间的整数(例如,1至10,或1至6);n3和n4可相同或不同,并且是1和20之间的整数(例如,1至10,或1至6)。
在一些方面,接头组合包含(C3)n、(C4)n、(C5)n、(C6)n、(C7)n或(C8)n或它们的组合,其中n是在1和50之间的整数,并且每个单元例如经由磷酸酯接头、硫代磷酸酯键或它们的组合连接。
III.A.3.可切割的接头
在一些方面,本文所公开的ASO的不同组分可通过可切割的接头连接。术语可切割的接头是指包含至少一个可断裂或切割的键联或化学键的接头。如本文所用,术语切割是指以产生两个或更多个相对较小分子的方式破坏相对大分子中的一个或多个化学键。切割可以由例如核酸酶、肽酶、蛋白酶、磷酸酶、氧化酶或还原酶介导,例如,或由特定的物理化学条件介导,例如氧化还原环境、pH、活性氧物质的存在或特定波长的光。
在一些方面,如本文所用,术语“可切割的”是指例如可快速降解的接头,例如,磷酸二酯和二硫键,而术语“不可切割的”是指例如更稳定的连接,例如,抗核酸酶的硫代磷酸酯。
在一些方面,可切割的接头是二核苷酸或三核苷酸接头、二硫化物、亚胺、硫缩酮、val-cit二肽或它们的任何组合。在一些方面,可切割的接头包括缬氨酸-丙氨酸-对氨基苄基氨基甲酸酯或缬氨酸-瓜氨酸-对氨基苄基氨基甲酸酯。
III.A.3.a.氧化还原可切割的接头
在一些方面,接头组合包含氧化还原可切割的接头。作为非限制性实例,一种类型的可切割的接头是在还原或氧化时切割的氧化还原可切割的连接基团。
在一些方面,氧化还原可切割的接头包含二硫键,即,它是二硫键可切割的接头。
氧化还原可切割的接头可以被还原,例如,通过细胞内硫醇、氧化酶或还原酶。
III.A.3.b.活性氧物质(ROS)可切割的接头
在一些方面,接头组合可包含可切割的接头,它可被活性氧物质(ROS),诸如超氧化物(Of)或过氧化氢(H2O2)切割,例如由炎症过程诸如活化的中性粒细胞产生。在一些方面,ROS可切割的接头是硫缩酮可切割的接头。参见,例如,美国专利8,354,455B2,其以引用的方式整体并入本文。
III.A.3.c.pH依赖性可切割的接头
在一些方面,接头是包含酸可切割的连接基团的“酸不稳定型接头”,所述酸可切割的连接基团是在酸性条件(pH<7)下选择性切割的连接基团。
作为非限制性实例,酸可切割的连接基团在酸性环境中被切割,例如约6.0、5.5、5.0或更小。在一些方面,pH值为约6.5或更小。在一些方面,接头被剂诸如酶切割,所述酶可以充当通用酸,例如肽酶(其可以是底物特异性的)或磷酸酶。在细胞内,某些低pH细胞器,诸如胞内体和溶酶体可以为酸可切割的连接基团提供切割环境。虽然人血清的pH值为7.4,但细胞内的平均pH值略低,约为7.1至7.3。内体也具有酸性pH值,范围从5.5至6.0,而溶酶体在更酸性的pH值下约为5.0。因此,本领域有时将pH依赖性可切割的接头称为胞内体不稳定的接头。
酸可切割的基团可具有通式-C=NN-、C(O)O或-OC(O)。在另一个非限制性实例中,当碳连接至酯氧(烷氧基)时,它连接至芳基、取代的烷基或叔烷基基团,例如二甲基戊基或叔丁基。酸可切割的连接基团的实例包括但不限于胺、亚胺、氨基酯、苯甲亚胺、二原酸酯、聚磷酸酯、聚磷腈、乙缩醛、乙烯基醚、腙、顺乌头酸酯、酰肼、硫代氨基甲酰基、亚胺、叠氮甲基-甲基马来酸酸酐、硫代丙酸盐、掩蔽的胞内体溶解剂、柠康基或它们的任何组合。二硫键联也易受pH影响。
在一些方面,接头包含低pH不稳定的腙键。此类酸不稳定键已广泛用于缀合物领域,例如抗体-药物缀合物。参见,例如,Zhou等人,Biomacromolecules 2011,12,1460-7;Yuan等人,Acta Biomater.2008,4,1024-37;Zhang等人,Acta Biomater.2007,6,838-50;Yang等人,J.Pharmacol.Exp.Ther.2007,321,462-8;Reddy等人,CancerChemother.Pharmacol.2006,58,229-36;Doronina等人,Nature Biotechnol.2003,21,778-84。
在某些方面,接头包含选自以下的低pH不稳定键:在酸性环境(例如,pH小于7,大于约4)中不稳定以形成二醇和酮的缩酮;在酸性环境(例如,pH小于7,大于约4)中不稳定形成二醇和醛的缩醛;在酸性环境(例如,pH小于7,大于约4)中不稳定形成胺和醛或酮的亚胺或亚胺鎓;在酸性条件下不稳定的硅-氧-碳键联;硅-氮(硅氮烷)键联;硅-碳键联(例如,芳基硅烷、乙烯基硅烷和烯丙基硅烷);马来酸酯(由马来酸酐衍生物和胺合成的酰胺键);原酸酯;腙;被设计用于进行酸催化水解的活化羧酸衍生物(例如,酯、酰胺);或乙烯基醚。
另外的实例可见于美国专利号9,790,494B2和8,137,695B2,所述专利的内容以引用方式整体并入本文。
III.A.3.d.酶促可切割的接头
在一些方面,接头组合可包含可由细胞内或细胞外酶(例如蛋白酶、酯酶、核酸酶、酰胺酶)切割的接头。可以切割接头组合中特定接头的酶的范围取决于接头的特定键和化学结构。因此,肽接头可以被例如肽酶切割,含有酯键联的接头可以被例如酯酶切割;含有酰胺键联的接头可以被例如酰胺酶切割;等等。
III.A.3.e.蛋白酶可切割的接头
在一些方面,接头组合包括蛋白酶可切割的接头,即,可以被内源性蛋白酶切割的接头。只有某些肽容易在细胞内或细胞外切割。参见,例如,Trout等人,79Proc.Natl.Acad.Sci.USA,626-629(1982)和Umemoto等人43 Int.J.Cancer,677-684(1989)。可切割的接头可包含由α-氨基酸单元和肽键组成的可切割位点,它们在化学上是一个氨基酸的羧酸和第二个氨基酸的氨基基团之间的酰胺键。其他酰胺键,诸如羧酸和赖氨酸的α-氨基酸基团之间的键,被理解为不是肽键并且被认为是不可切割的。
在一些方面,蛋白酶可切割的接头包含蛋白酶的切割位点:例如,中性溶酶(CALLA或CDIO)、甲拌磷寡肽酶(TOP)、白三烯A4水解酶、内皮缩血管肽转化酶、ste24蛋白酶、溶神经素、线粒体中间肽酶、间质胶原酶、胶原酶、溶基质素、巨噬细胞弹性酶、基质溶解因子、明胶酶、跨膜肽酶(meprins)、前胶原C-内肽酶、前胶原N-内肽酶、ADAM和ADAMT金属蛋白酶、髓磷脂相关的金属蛋白酶、釉质溶素(enamelysin)、肿瘤坏死因子α-转换酶、胰岛素溶酶(insulysin)、nardilysin、线粒体处理肽酶、magnolysin、dactylysin样金属蛋白酶、嗜中性粒细胞胶原酶、基质金属蛋白酶、膜型基质金属蛋白酶、SP2内肽酶、前列腺特异性抗原(PSA)、纤溶酶、尿激酶、人成纤维细胞活化蛋白质(FAPα)、胰蛋白酶、糜蛋白酶、降钙蛋白酶(caldecrin)、胰弹性蛋白酶、胰内肽酶、肠肽酶、白细胞弹性蛋白酶、成髓细胞、糜蛋白酶类(chymases)、类胰蛋白酶、粒酶、角质层糜蛋白酶、顶体蛋白酶、激肽释放酶、补体成分和因子、替代补体途径c3/c5转换酶、甘露糖结合蛋白相关的丝氨酸蛋白酶、凝固因子、凝血酶、蛋白c、u和t型纤溶酶原活性剂、组织蛋白酶G、肝丝酶(hepsin)、丝氨酸蛋白水解酶(prostasin)、肝细胞生长因子活化内肽酶、枯草杆菌蛋白酶/kexin型前蛋白转化酶、弗林蛋白酶、前蛋白转化酶、脯氨酰肽酶、酰基氨基酰基肽酶、肽基-glycaminase、信号肽酶、n末端亲核试剂氨基水解酶、20s蛋白酶体、γ-谷氨酰转肽基酶、线粒体内肽酶、线粒体内肽酶Ia、htra2肽酶、蛋白裂解酶(matriptase)、位点1蛋白酶、天冬酰胺内肽酶(legumain)、组织蛋白酶、半胱氨酸组织蛋白酶、钙蛋白酶、泛素异肽酶T、胱天蛋白酶、糖基磷脂酰肌醇蛋白转酰胺基酶、癌症促凝血剂、激素原硫醇蛋白酶、γ-谷氨酰基水解酶、博莱霉素水解酶、成纤维细胞活化蛋白(seprase)、组织蛋白酶B、组织蛋白酶D、组织蛋白酶L、组织蛋白酶M、组织蛋白酶K、胃蛋白酶(pepsins)、凝乳酶(chymosyn)、胃亚蛋白酶(gastricsin)、肾素、酵母天冬酶(yapsin)和/或mapsin、前列腺特异性抗原(PSA)或一般的任何Asp-N、Glu-C、Lys-C或Arg-C蛋白酶。参见,例如,Cancer Res.77(24):7027-7037(2017),该文献以引用的方式整体并入本文。
在一些方面,可切割的接头组分包括含有一至十个氨基酸残基的肽。在这些方面,肽允许通过蛋白酶对接头进行切割,从而在暴露于细胞内蛋白酶(诸如溶酶体酶)时促进生物活性分子的释放(Doronina等人(2003)Nat.Biotechnol.21:778-784)。示例性的肽包括但不限于二肽、三肽、四肽、五肽和六肽。
肽可包含天然存在的和/或非天然的氨基酸残基。术语“天然存在的氨基酸”是指Ala、Asp、Cys、Glu、Phe、Gly、His、He、Lys、Leu、Met、Asn、Pro、Gin、Arg、Ser、Thr、Val、Trp和Tyr。“非天然氨基酸”(即,氨基酸不是天然存在的)包括,作为非限制性实例,高丝氨酸、高精氨酸、瓜氨酸、苯基甘氨酸、牛磺酸、碘酪氨酸、硒代半胱氨酸、正亮氨酸(“Nle”)、正缬氨酸(“Nva”)、β-丙氨酸、L-或D-萘氨酸、鸟氨酸(“Orn”)等。肽可被设计和优化以供特定酶进行酶促裂解,所述特定酶例如,肿瘤相关的蛋白酶、组织蛋白酶B、C和D或纤维蛋白溶酶蛋白酶。
氨基酸还包括天然和非天然氨基酸的D型。“D-”表示具有“D”(右旋)构型的氨基酸,与天然存在的(“L-”)氨基酸中的构型相反。天然和非天然氨基酸可以商购获得(SigmaChemical Co.,Advanced Chemtech)或使用本领域已知的方法合成。
示例性的二肽包括但不限于缬氨酸-丙氨酸、缬氨酸-瓜氨酸、苯丙氨酸-赖氨酸、N-甲基-缬氨酸-瓜氨酸、环己基丙氨酸-赖氨酸和β-丙氨酸-赖氨酸。示例性三肽包括但不限于甘氨酸-缬氨酸-瓜氨酸(gly-val-cit)和甘氨酸-甘氨酸-甘氨酸(gly-gly-gly)。
III.A.3.f.酯酶可切割的接头
一些接头被酯酶切割(“酯酶可切割的接头”)。只有某些酯可以被细胞内外存在的酯酶和酰胺酶切割。酯是由羧酸和醇缩合形成的。简单酯是用简单醇(诸如脂肪醇)和小环和小芳香醇产生的酯。基于酯的可切割的连接基团的实例包括但不限于亚烷基、亚烯基和亚炔基的酯。酯可切割的连接基团具有通式-C(O)O-或-OC(O)-。
III.A.3.g.磷酸酶可切割的接头
在一些方面,接头组合可以包括由降解或水解磷酸基团的试剂切割的基于磷酸酯的可切割连接基团。切割细胞内磷酸基团的试剂的实例是诸如细胞内磷酸酶。基于磷酸酯的连接基团的实例是—O—P(O)(ORk)—O—、—O—P(S)(ORk)—O—、—O—P(S)(SRk)—O-、-S-P(O)(ORk)-O-、-O-P(O)(ORk)-S-、-S-P(O)(ORk)-S-、-O-P(S)(ORk)-S-、-SP(S)(ORk)-O-、-OP(O)(Rk)-O-、-OP(S)(Rk)-O-、-SP(O)(Rk)-O-、-SP(S)(Rk)-O-、-SP(O)(Rk)-S-或-OP(S)(Rk)-S-。
在各个方面,Rk是以下各项中的任一者:NH2、BH3、CH3、C1-6烷基、C6-10芳基、C1-6烷氧基和C6-10芳基-氧基。在一些方面,C1-6烷基和C6-10芳基是未取代的。另外的非限制性实例是-O-P(O)(OH)-O-、-O-P(S)(OH)-O-、-O-P(S)(SH)-O-、-S-P(O)(OH)-O-、-O-P(O)(OH)-S-、-S-P(O)(OH)-S-、-O-P(S)(OH)-S-、-S-P(S)(OH)-O-、-O-P(O)(H)-O-、-O-P(S)(H)-O-、-S-P(O)(H)-O-、-SP(S)(H)-O-、-SP(O)(H)-S-、-OP(S)(H)-S-或-O-P(O)(OH)-O-。
III.A.3.h.光活化的可切割的接头
在一些方面,组合接头包含光活化的可切割的接头,例如硝基苄基接头或包含硝基苄基反应性基团的接头。
III.A.3.i.自分解接头
在一些方面,接头组合包含自分解接头。在一些方面,本公开的EV(例如,外泌体)中的自分解接头在蛋白酶可切割的接头的酶促切割之后经历1,4消除。在一些方面,本公开的EV(例如,外泌体)中的自分解接头在蛋白酶可切割的接头的酶促切割之后经历1,6消除。在一些方面,自分解接头是例如对氨基苄基(pAB)衍生物,诸如对氨基苄基氨基甲酸酯(pABC)、对氨基苄基醚(PABE)、对氨基苄基碳酸酯,或它们的组合。
在某些方面,自分解接头包含芳基。在一些方面,芳基选自苄基、肉桂基、萘基和联苯基。在一些方面,芳基是杂环的。在其他方面,芳基包含至少一个取代基。在一些方面,至少一个取代基选自由以下各项组成的组:F、Cl、I、Br、OH、甲基、甲氧基、NO2、NH2、NO3+、NHCOCH3、N(CH3)2、NHCOCF3、烷基、卤代烷基、C1-C8烷基卤、羧酸酯、硫酸酯、氨基磺酸酯和磺酸酯。在其他方面,芳族基团中的至少一个C被N、O或C-R*取代,其中R*独立地选自H、F、Cl、I、Br、OH、甲基、甲氧基、NO2、NH2、NO3+、NHCOCH3、N(CH3)2、NHCOCF3、烷基、卤代烷基、C1-C8烷基卤、羧酸酯、硫酸酯、氨基磺酸酯和磺酸酯。
在一些方面,自分解接头包含氨基苄基氨基甲酸酯基团(例如,对氨基苄基氨基甲酸酯)、氨基苄基醚基团或氨基苄基碳酸酯基团。在一个方面,自分解接头是对氨基苄基氨基甲酸酯(pABC)。
pABC是用于自分解性位点特异性前药活化的最有效和最广泛的连接子连接(参见,例如,Carl等人J.Med.Chem.24:479-480(1981);WO 1981/001145;Rautio等人,NatureReviews Drug Discovery 7:255-270(2008);Simplicio等人,Molecules 13:519-547(2008))。
在一些方面,自分解接头将生物活性分子(例如,ASO)连接至蛋白酶可切割的底物(例如,Val-Cit)。在特定方面,pABC自分解接头的氨基甲酸酯基团连接至生物活性分子(例如,ASO)的氨基,并且pABC自分解接头的氨基连接至蛋白酶可切割的底物。
氨基苄基的芳环可任选地被芳环上的一个或多个(例如,R1和/或R2)取代基取代,其替代连接至形成环的四个未取代的碳中的一个的氢。本文使用的符号“Rx”(例如,R1、R2、R3、R4)是表示如本文所述取代基的一般缩写。
取代基可改善对氨基苄基的自分解能力(Hay等人,J.Chem Soc.,PerkinTrans.1:2759-2770(1999);还可参见,Sykes等人J.Chem.Soc.,Perkin Trans.1:1601-1608(2000))。
可以例如通过1,4消除、1,6消除(例如,pABC)、1,8消除(例如,对氨基肉桂醇)、β-消除、环化消除(例如,4-氨基丁醇酯和乙二胺)、环化/内酯化、环化/内酯化等。参见,例如,Singh等人Curr.Med.Chem.15:1802-1826(2008);Greenwald等人J.Med.Chem.43:475-487(2000)。
在一些方面,自分解接头可以包含例如肉桂基、萘基或联苯基(参见,例如,Blencowe等人Polym.Chem.2:773-790(2011))。在一些方面,自分解接头包含杂环(参见,例如,美国专利号7,375,078、7,754,681)。许多同源芳族(参见,例如,Carl等人J.Med.Chem.24:479(1981);Senter等人J.Org.Chem.55:2975(1990);Taylor等人J.Org.Chem.43:1197(1978);Andrianomenjanahary等人Bioorg.Med.Chem.Lett.2:1903(1992))和香豆素(参见,例如,Weinstein等人Chem.Commun.46:553(2010))、呋喃、噻吩、噻唑、噁唑、异噁唑、吡咯、吡唑(参见,例如,Hay等人J.Med.Chem.46:5533(2003))、吡啶(参见,例如,Perry-Feigenbaum等人Org.Biomol.Chem.7:4825(2009))、吡啶(参见,例如,Nailor等人Bioorg.Med.Chem.Lett.Z:1267(1999);Hay和Denny,Tetrahedron Lett.38:8425(1997))和三唑(参见,例如,Bertrand和Gesson,J.Org.Chem.72:3596(2007))的杂芳族基团在水和生理条件下是自分解的,并且是本领域已知的。另外参见,美国专利号7,691,962、7,091,186;美国专利公布号US2006/0269480;US2010/0092496;US2010/0145036;US2003/0130189;US2005/0256030)。
在一些方面,本文所公开的接头组合包含多于一个串联的自分解接头,例如两个或更多个pABC单元。参见,例如,de Groot等人J.Org.Chem.66:8815-8830(2001)。在一些方面,本文所公开的接头组合可包含与荧光探针连接的自分解接头(例如,对羧基苯甲醛或乙醛酸的对氨基苯甲醇或半硫氨基衍生物)(参见,例如,Meyer等人Org.Biomol.Chem.8:1777-1780(2010))。
在通过其常规化学式(从左到右书写)规定自分解接头中的取代基的情况下,其同样涵盖从右到左书写结构得到的化学上相同的取代基。例如,“-CH2O-”也旨在称为“-OCH2-”。
如上文所讨论的自分解例如对氨基苄基自分解接头中的R1和/或R2取代基中的取代基基团可以包括例如烷基、亚烷基、烯基、炔基、烷氧基、烷基氨基、烷硫基、杂烷基、环烷基、杂环烷基、芳基、芳烷基、芳氧基、杂芳基等。当本公开的化合物包含多于一个取代基时,则独立地选择每个取代基。
在一些具体方面,连接至可切割的肽接头的自分解接头具有下式,所述组合具有下式:
-Aa-Yy-
其中每个-A-独立地是氨基酸单元,a独立地为1至12的整数;并且-Y-是自分解间隔子,并且y为1或2。在一些方面,-Aa-是二肽、三肽、四肽、五肽或六肽。在一些方面,-Aa-选自由以下各项组成的组:缬氨酸-丙氨酸、缬氨酸-瓜氨酸、苯丙氨酸-赖氨酸、N-甲基缬氨酸-瓜氨酸、环己基丙氨酸-赖氨酸和β-丙氨酸-赖氨酸。在一些方面,-Aa-是缬氨酸-丙氨酸或缬氨酸-瓜氨酸。
在一些方面,自分解接头-Yy–具有下式:
其中每个R2独立地是C1-8烷基、-O-(C1-8烷基)、卤素、硝基或氰基;并且m为0至4的整数。在一些方面,m为0、1或2。在一些方面,m为0。
在一些方面,可切割的接头是缬氨酸-丙氨酸-对氨基苄基氨基甲酸酯或缬氨酸-瓜氨酸-对氨基苄基氨基甲酸酯。
III.A.4.反应部分(RM)
本公开的ASO通过化学合成或通过其组分之间的化学反应而产生。例如,在一些方面,包含反应性基团(例如,马来酰亚胺)的锚定部分可与包含马来酰亚胺反应基团的ASO反应,以产生本公开的疏水修饰的ASO,其中该锚定部分可插入到外泌体膜的脂质双层中,从而将ASO连接至外泌体的表面。
本公开的疏水修饰的ASO的任何组分或组分组可包含至少一个RG和/或RM,这将允许各组分通过一个反应或一系列反应连接,以产生本公开的疏水修饰的ASO。用于产生疏水修饰的ASO的示例性合成方案包括:
[AM]-/RG/+/RM/-[ASO]→[AM]-[ASO]
[AM]-/RM/+/RG/-[ASO]→[AM]-[ASO]
[AM]-[L]-/RM/+/RG/-[ASO]→[AM]-[L]-[ASO]
[AM]-[L]-/RG/+/RM/-[ASO]→[AM]-[L]-[ASO]
[AM]-/RM/+/RG/-[L]-[ASO]→[AM]-[L]-[ASO]
[AM]-/RG/+/RM/-[L]-[ASO]→[AM]-[L]-[ASO]
[AM]-[L]-/RM/+/RG/-[L]-[ASO]→[AM]-[L]-[L]-[ASO]
[AM]-[L]-/RG/+/RM/-[L]-[ASO]→[AM]-[L]-[L]-[ASO]
其中[AM]是锚定部分,[ASO]是反义寡核苷酸,[L]是接头或接头组合,/RM/是反应性部分,并且/RG/是反应性基团。在所提供的任何示意图中,可例如通过ASO的5'端或3'端连接ASO。
在ASO的合成中产生中间体的示例性合成方案包括:
[AM]-/RM/+/RG/-[L]→[AM]-[L]
[AM]-/RG/+/RM/-[L]→[AM]-[L]
[L]-/RM/+/RG/-[L]→[L]-[L]
[L]-/RG/+/RM/-[L]→[L]-[L]
[L]-/RM/+/RG/-[ASO]→[L]-[ASO]
[L]-/RG/+/RM/-[ASO]→[L]-[ASO]
其中[AM]是锚定部分,[ASO]是反义寡核苷酸,[L]是接头或接头组合,/RM/是反应性部分,并且/RG/是反应性基团。在所提供的任何示意图中,可例如通过ASO的5'端或3'端连接ASO。
在一些方面,反应性基团“/RG/”可以是例如氨基、硫醇基、羟基、羧酸基团或叠氮基。可与这些反应性基团反应的特定反应性部分“/RM/”在下文更详细地描述。
[AM]-(/RM/)n+(/RG/-[L]-[ASO])n→[AM]-[L]-[ASO]
本文所公开的任何锚定部分、接头或接头组合或ASO可缀合至反应性部分,例如氨基反应性部分(例如,NHS-酯、对硝基苯酚、异硫氰酸酯、异氰酸酯或醛)、硫醇反应性部分(例如,丙烯酸酯、马来酰亚胺或吡啶基二硫化物)、羟基反应性部分(例如,异硫氰酸酯或异氰酸酯)、羧酸反应性部分(例如,环氧化物)或叠氮化物反应性部分(例如,炔烃)。
可用于共价结合本文所公开的两种组分(例如,锚定部分和ASO,或锚定部分和接头,或锚定部分和接头,或两个接头,或接头和ASO,或两个锚定部分)的示例性反应性部分包括例如N-琥珀酰亚胺基-3-(2-吡啶基二硫代)丙酸酯、N-4-马来酰亚胺丁酸、S-(2-吡啶基二硫代)半胱胺、碘乙酰氧基琥珀酰亚胺、N-(4-马来酰亚胺丁酰氧基)琥珀酰亚胺、N-[5-(3'-马来酰亚胺丙酰胺)-1-羧基戊基]亚氨基二乙酸、N-(5-氨基戊基)亚氨基二乙酸和1′-[(2-氰乙基)-(N,N-二异丙基)]-亚磷酰胺)。双功能接头(含有两个官能团的接头)也是可用的。
在一些方面,锚定部分、接头或ASO可包含末端羟亚胺基,例如-ONH2、肼基、-NHNH2、巯基(即,SH或硫醇基)或烯烃(例如,CH=CH2)。在一些方面,锚定部分、接头或ASO可例如在末端位置包含亲电子部分,例如醛、卤代烷、甲磺酸酯、甲苯磺酸酯、苯磺酸酯或溴磺酸酯,或活化的羧酸酯,例如NHS酯、亚磷酰胺或五氟苯基酯。在一些方面,可通过将配体的亲核基团(例如羟基、硫醇基或氨基)与亲电子基团偶联来形成共价键。
本发明适用于所有方式的反应性基团和反应性部分,包括但不限于本领域中已知的那些。
如本文所用,术语“保护基团”是指本领域中已知的保护反应性基团(包括但不限于羟基、氨基和硫醇基)免受合成程序中不希望的反应的不稳定的化学部分。保护基团通常被选择性地和/或正交地用于在反应期间在其他反应位点处保护位点,然后可将保护基团除去以留下未受保护的基团原样或可用于进一步反应。本领域中已知的保护基团一般描述于Greene和Wuts,Protective Groups in Organic Synthesis,第3版,John Wiley&Sons,New York(1999)中。
另外,可以交替的顺序或次序进行各种合成步骤以得到所需的化合物。可用于合成本文所述化合物的合成化学转化和保护基团方法(保护和去保护)在本领域中是已知的并且包括例如如在R.Larock,Comprehensive Organic Transformations,VCH Publishers(1989);T.W.Greene和P.G.M.Wuts,Protective Groups in Organic Synthesis,第2版,John Wiley and Sons(1991);L.Fieser和M.Fieser,Fieser and Fieser's Reagents forOrganic Synthesis,John Wiley and Sons(1994);和L.Paquette编辑,Encyclopedia ofReagents for Organic Synthesis,John Wiley and Sons(1995),以及它们的后续版本。
可另外地或替代地使用本领域中已知的固相合成。合适的固相技术,包括自动化合成技术,描述于F.Eckstein(编辑),Oligonucleotides and Analogues,a PracticalApproach,Oxford University Press,New York(1991)and Toy,P.H.;Lam,Y(编辑),Solid-Phase Organic synthesis,concepts,Strategies,and Applications,JohnWiley&Sons,Inc.New Jersey(2012)中。
在一些方面,反应性基团可替代地与多于一种的下述反应性部分反应。
III.A.4.a.胺反应性部分
在一些方面,反应性部分是胺反应性部分。如本文所用,术语“胺反应性部分”是指可与具有氨基部分的反应性基团(例如,伯胺)反应的化学基团。示例性的胺反应性部分是N-羟基琥珀酰亚胺酯(NHS-酯)、对硝基苯酚、异硫氰酸酯、异氰酸酯和醛。与伯胺反应的替代性反应性部分在本领域中也是众所周知的。在一些方面,胺反应性部分可连接至本公开的锚定部分、接头组合或ASO的末端位置。
在一些方面,胺反应性部分是NHS-酯。通常,NHS-酯反应性部分与反应性基团的伯胺反应生成稳定的酰胺键和N-羟基琥珀酰亚胺(NHS)。
在一些方面,胺反应性部分是对硝基苯酚基团。通常,对硝基苯酚反应性部分是与反应性基团的伯胺反应生成稳定的氨基甲酸酯部分和对硝基苯酚的活化氨基甲酸酯。
在一些方面,胺反应性部分是异硫氰酸酯。通常,异硫氰酸酯与反应性基团的伯胺反应生成稳定的硫脲部分。
在一些方面,胺反应性部分是异氰酸酯。通常,异氰酸酯与反应性基团的伯胺反应生成稳定的脲部分。
在一些方面,胺反应性部分是醛。通常,醛与伯胺反应形成席夫碱,席夫碱可被进一步还原,通过还原胺化形成共价键。
III.A.4.b.硫醇反应性部分
在一些方面,反应性部分是硫醇反应性部分。如本文所用,术语“硫醇反应性部分”是指可与具有硫醇部分的反应性基团(或巯基)反应的化学基团。示例性的硫醇反应性部分是丙烯酸酯、马来酰亚胺和吡啶基二硫化物。与硫醇反应的替代反应性部分也是本领域公知的。在一些方面,硫醇反应性部分可连接至本公开的锚定部分、接头组合或ASO的末端位置。
在一些方面,硫醇反应性部分是丙烯酸酯。通常,丙烯酸酯在丙烯酸酯羰基β位碳处与硫醇反应形成稳定的硫键。
在一些方面,硫醇反应性部分是马来酰亚胺。通常,马来酰亚胺在任一羰基β位碳处与硫醇反应形成稳定的硫键。
在一些方面,硫醇反应性部分是吡啶基二硫化物。通常,吡啶基二硫化物在吡啶基β位硫原子处与硫醇反应形成稳定的二硫键和吡啶-2-硫酮。
III.A.4.c.羟基反应性部分
在一些方面,反应性部分是羟基反应性部分。如本文所用,术语“羟基反应性部分”是指可与具有羟基部分的反应性基团反应的化学基团。示例性的羟基反应性部分是异硫氰酸酯和异氰酸酯。与羟基部分反应的替代反应性部分也是本领域公知的。在一些方面,羟基反应性部分可连接至本公开的锚定部分、接头组合或ASO的末端位置。
在一些方面,羟基反应性部分是异硫氰酸酯。通常,异硫氰酸酯与反应性基团的羟基反应生成稳定的硫代氨基甲酸酯部分。
在一些方面,胺反应性部分是异氰酸酯。通常,异氰酸酯与反应性基团的羟基反应生成稳定的氨基甲酸酯部分。
III.A.4.d.羧酸反应性部分
在一些方面,反应性部分是羧酸反应性部分。如本文所用,术语“羧酸反应性部分”是指可与具有羧酸部分的反应性基团反应的化学基团。示例性的羧酸反应性部分是环氧化物。与羧酸部分反应的替代反应性部分也是本领域公知的。在一些方面,羧酸反应性部分可连接至本公开的锚定部分、接头组合或ASO的末端位置。
在一些方面,羧酸反应性部分是环氧化物。通常,环氧化物在环氧化物的任一碳原子处与反应性基团的羧酸反应形成乙酸2-羟乙酯部分。
III.A.4.e.叠氮化物反应性部分
在一些方面,反应性部分是叠氮化物反应性部分。如本文所用,术语“叠氮化物反应性部分”是指可与具有叠氮化物部分的反应性基团反应的化学基团。示例性的叠氮化物反应性部分是炔烃。与叠氮化物部分反应的替代反应性部分也是本领域公知的。在一些方面,羧酸反应性部分可连接至本公开的锚定部分、接头组合或ASO的末端位置。
在一些方面,叠氮化物反应性部分是炔烃。通常,炔烃通过1,3-偶极环加成反应(也称为“点击化学”)与反应性基团的叠氮化物反应形成1,2,3-三唑部分。
III.A.5.具体实例和拓扑结构
在本公开的具体方面,接头组合由下式的接头组成
[烷基接头]m-[PEG1]n-[PEG2]o
其中m、n和o为0或1,并且m、n或o中的至少一者不为零。根据此式的示例性接头组合是C6-TEG-HEG、C6-HEG、C6-TEG、C6、TEG-HEG、TEG、C8-TEG-HEG、C8-HEG、C8-TEG和C8。
在一些方面,接头组合包含与一种或多种可切割的接头(例如,酶促可切割的接头和自分解接头)组合的不可切割的接头(例如,TEG或HEG)。
在具体方面,接头组合接头组合包括接头组合TEG(不可切割的接头)-Val-Cit(可切割的接头)-pAB(自分解接头),如下所示
锚定部分和接头组合的具体组合示于下表中。
表2.
表3.
下面举例说明本公开的特定寡核苷酸,诸如ASO
[胆固醇]-[TEG]-[HEG]-[ASO]
[胆固醇]-[SMal]-[Val-Cit]-[pAB]-[ASO]
[胆固醇]-[TEG]-[Val-Cit]-[C6]-[ASO]
[胆固醇]-[TEG]-[SS]-[C6]-[ASO]
其中[胆固醇]是胆固醇锚定部分,[TEG]是TEG不可切割的接头,[HEG]是HEG不可切割的接头,[SS]是二硫化物氧化还原可切割的接头,[C6]是烷基不可切割的接头,[SMal]是S-马来酰亚胺,[Val-Cit]是缬氨酸-瓜氨酸可切割的接头,[pAB]是pAB自分解接头。在一些方面,本公开的ASO具有根据上面提供的实例性结构的结构,其中一个或多个组分已被与实例中描绘的那些相同类别的组分替代。例如,[胆固醇]锚定部分可被本文所公开的另一锚定部分取代,[TEG]可被本文所公开的另一聚合的不可切割的接头(例如,HEG、PEG、PG)取代,[Val-Cit]可被另一肽酶可切割的接头替代,或者[pAB]可被另一自分解接头取代。
III.B.支架部分
一个或多个支架部分可在EV中表达。在一些方面,一个或多个支架部分用于将ASO锚定至本公开的EV(例如,外泌体)。在其他方面,一个或多个支架部分用于将蛋白质或分子锚定至除ASO之外的EV。因此,本公开的EV包含连接ASO和支架部分的锚定部分,所述支架部分连接蛋白质或分子,例如靶向部分。在一些方面,ASO与支架部分连接。在一些方面,EV包含多于一个支架部分。在一些方面,第一ASO与第一支架部分连接,并且第二ASO与第二支架部分连接。在一些方面,第一支架部分和第二支架部分是相同类型的支架部分,例如,第一支架部分和第二支架部分都是支架X蛋白。在一些方面,第一支架部分和第二支架部分是不同类型的支架部分,例如,第一支架部分是支架Y蛋白,而第二支架部分是支架X蛋白。在一些方面,第一支架部分是本文所公开的支架Y。在一些方面,第一支架部分是本文所公开的支架X。在一些方面,第二支架部分是本文所公开的支架Y。在一些方面,第二支架部分是本文所公开的支架X。
在一些方面,EV包含一个或多个支架部分,所述一个或多个支架部分能够将ASO锚定至EV例如外泌体(例如,锚定在腔表面或外表面上)。在某些方面,支架部分是多肽(“支架蛋白”)。在某些方面,支架蛋白包含外泌体蛋白或其片段。在其他方面,支架部分是非多肽部分。在一些方面,支架蛋白包括各种膜蛋白,诸如跨膜蛋白、整合蛋白和外周蛋白,它们在外泌体膜上富集。它们可包括各种CD蛋白、转运蛋白、整联蛋白、凝集素和钙粘蛋白。在某些方面,支架部分(例如,支架蛋白)包含支架X。在其他方面,支架部分(例如,外泌体蛋白)包含支架Y。在另外的方面,支架部分(例如,外泌体蛋白)包含支架X和支架Y。
III.B.1.支架X工程化的EV,例如外泌体
在一些方面,本公开的EV(例如,外泌体)包含在其组成中经过修饰的膜。例如,可通过改变膜的蛋白质、脂质或聚糖含量来改变它们的膜组成。
在一些方面,通过化学和/或物理方法,诸如PEG诱导的融合和/或超声融合,产生表面工程化EV(例如,外泌体)。在其他方面,表面工程化的EV(例如,外泌体)通过遗传工程产生。从遗传修饰的生产细胞或遗传修饰的细胞的后代产生的EV(例如,外泌体)可以包含改变的膜组成。在一些方面,表面工程化的EV(例如,外泌体)具有较高或较低密度(例如,较高数目)的支架部分(例如,外泌体蛋白,例如,支架X),或包括支架部分的变体或片段。
例如,表面(例如,支架X)工程化的EV可以从用编码支架部分(例如,外泌体蛋白,例如,支架X)或其变体或片段的外源序列转化的细胞(例如,HEK293细胞)产生。包括由外源序列表达的支架部分的EV可包括改变的膜组成。
支架部分的各种修饰或片段可用于本公开的方面。例如,经修饰而对结合剂具有增强的亲和力的支架部分可用于产生可使用结合剂纯化的表面工程化EV。可使用经修饰而更有效地靶向EV和/或膜的支架部分。还可使用经修饰而包含特异性且有效地靶向外泌体膜所需的最小片段的支架部分。
支架部分可设计来表达为融合分子,例如,支架X与ASO的融合分子。例如,融合分子可包含连接至ASO的本文所公开的支架部分(例如,支架X,例如PTGFRN、BSG、IGSF2、IGSF3、IGSF8、ITGB1、ITGA4、SLC3A2、ATP转运蛋白或其片段或变体)。
在一些方面,本文所述的表面(例如,支架X)工程化的EV,与本领域已知的EV相比,表现出优异的特征。例如,表面(例如,支架X)工程化的EV在其表面上包含富集程度比在天然存在的EV或使用常规外泌体蛋白产生的EV上的富集程度更高的修饰的蛋白。此外,本公开的表面(例如,支架X)工程化的EV,与天然存在的EV或使用常规外泌体蛋白产生的EV相比,可具有更大、更特异或更可控的生物活性。
在一些方面,支架X包含前列腺素F2受体负调节因子(PTGFRN多肽)。PTGFRN蛋白也可称为CD9配偶体1(CD9P-1)、含Glu-Trp-Ile EWI基序的蛋白F(EWI-F)、前列腺素F2-α受体调节蛋白、前列腺素F2-α受体相关蛋白或CD315。人PTGFRN蛋白(Uniprot登录号Q9P2B2)的全长氨基酸序列在表2中显示为SEQ ID NO:301。PTGFRN多肽含有信号肽(SEQ ID NO:301的氨基酸1至25)、细胞外结构域(SEQ ID NO:301的氨基酸26至832)、跨膜结构域(SEQ ID NO:301的氨基酸833至853)和胞质结构域(SEQ ID NO:301的氨基酸854至879)。成熟PTGFRN多肽由SEQ ID NO:301组成,不含信号肽,即SEQ ID NO:301的氨基酸26至879。在一些方面,可用于本公开的PTGFRN多肽片段包含PTGFRN多肽的跨膜结构域。在其他方面,可用于本公开的PTGFRN多肽片段包含PTGFRN多肽的跨膜结构域并且(i)在跨膜结构域的N末端包含至少5个、至少10个、至少15个、至少20个、至少25个、至少30个、至少40个、至少50个、至少70个、至少80个、至少90个、至少100个、至少110个、至少120个、至少130个、至少140个、至少150个氨基酸,(ii)在跨膜结构域的C末端包含至少5个、至少10个、至少15个、至少20个或至少25个氨基酸,或(i)和(ii)两者。
在一些方面,PTGFRN多肽的片段缺少一个或多个功能性或结构性结构域,诸如IgV。
在其他方面,支架X包含与SEQ ID NO:301的氨基酸26至879具有至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或约100%同一性的氨基酸序列。在其他方面,支架X包含与SEQ ID NO:302具有至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或约100%同一性的氨基酸序列。在其他方面,支架X包含SEQ ID NO:302的氨基酸序列,不同的是有1个氨基酸突变、2个氨基酸突变、3个氨基酸突变、4个氨基酸突变、5个氨基酸突变、6个氨基酸突变或7个氨基酸突变。突变可以是取代、插入、缺失或它们的任何组合。在一些方面,支架X包含SEQ ID NO:302的氨基酸序列并且在SEQ ID NO:302的N末端和/或C末端包含1个氨基酸、2个氨基酸、3个氨基酸、4个氨基酸、5个氨基酸、6个氨基酸、7个氨基酸、8个氨基酸、9个氨基酸、10个氨基酸、11个氨基酸、12个氨基酸、13个氨基酸、14个氨基酸、15个氨基酸、16个氨基酸、17个氨基酸、18个氨基酸、19个氨基酸、或20个氨基酸或更多个氨基酸。
在其他方面,支架X包含与SEQ ID NO:301、302、303、304、305、306、307、308、309、310、311、312、313、314、315、316、317或318具有至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或约100%同一性的氨基酸序列。在其他方面,支架X包含SEQ ID NO:301、302、303、304、305、306、307、308、309、310、311、312、313、314、315、316、317或318的氨基酸序列,不同的是有1个氨基酸突变、2个氨基酸突变、3个氨基酸突变、4个氨基酸突变、5个氨基酸突变、6个氨基酸突变或7个氨基酸突变。突变可以是取代、插入、缺失或它们的任何组合。在一些方面,支架X包含SEQ ID NO:301、302、303、304、305、306、307、308、309、310、311、312、313、314、315、316、317或318的氨基酸序列并且在SEQ ID NO:301、302、303、304、305、306、307、308、309、310、311、312、313、314、315、316、317或318的N末端和/C末端包含1个氨基酸、2个氨基酸、3个氨基酸、4个氨基酸、5个氨基酸、6个氨基酸、7个氨基酸、8个氨基酸、9个氨基酸、10个氨基酸、11个氨基酸、12个氨基酸、13个氨基酸、14个氨基酸、15个氨基酸、16个氨基酸、17个氨基酸、18个氨基酸、19个氨基酸或20个氨基酸或更多个氨基酸。
表6A.示例性支架X蛋白序列
在其他方面,支架X包含与SEQ ID NO:319、320、321、322、323、323或325具有至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或约100%同一性的氨基酸序列。在其他方面,支架X包含SEQ ID NO:319、320、321、322、323、323或325的氨基酸序列,不同的是有1个氨基酸突变、2个氨基酸突变、3个氨基酸突变、4个氨基酸突变、5个氨基酸突变、6个氨基酸突变或7个氨基酸突变外。突变可以是取代、插入、缺失或它们的任何组合。在一些方面,支架X包含SEQ IDNO:319、320、321、322、323、323或325的氨基酸序列并且在SEQ ID NO:319、320、321、322、323、323或325的N末端和/或C末端包含1个氨基酸、2个氨基酸、3个氨基酸、4个氨基酸、5个氨基酸、6个氨基酸、7个氨基酸、8个氨基酸、9个氨基酸、10个氨基酸、11个氨基酸、12个氨基酸、13个氨基酸、14个氨基酸、15个氨基酸、16个氨基酸、17个氨基酸、18个氨基酸、19个氨基酸、或20个氨基酸或更多个氨基酸。
表6B.示例性支架X蛋白序列
在一些方面,支架X包含由SEQ ID NO:303表示的Basigin(BSG蛋白)。BSG蛋白也称为5F7、胶原蛋白酶刺激因子、细胞外基质金属蛋白酶诱导物(EMMPRIN)、白细胞活化抗原M6、OK血型抗原、肿瘤细胞源性胶原蛋白酶刺激因子(TCSF)或CD147。人BSG蛋白的Uniprot编号是P35613。BSG蛋白的信号肽是SEQ ID NO:303的氨基酸1至21。SEQ ID NO:303的氨基酸138-323是细胞外结构域,氨基酸324至344是跨膜结构域,并且SEQ ID NO:303的氨基酸345至385是胞质结构域。
在其他方面,支架X包含与SEQ ID NO:303的氨基酸22至385具有至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或约100%同一性的氨基酸序列。在一些方面,BSG多肽的片段缺少一个或多个功能性或结构性结构域,诸如IgV,例如SEQ ID NO:303的氨基酸221至315。在其他方面,支架X包含与SEQ ID NO:326、327或328具有至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或约100%同一性的氨基酸序列。在其他方面,支架X包含SEQ ID NO:326、327或328的氨基酸序列,不同的是有1个氨基酸突变、2个氨基酸突变、3个氨基酸突变、4个氨基酸突变、5个氨基酸突变、6个氨基酸突变或7个氨基酸突变。突变可以是取代、插入、缺失或它们的任何组合。在一些方面,支架X包含SEQ ID NO:326、327或328的氨基酸序列并且在SEQ ID NO:326、327或328的N末端和/或C末端包含1个氨基酸、2个氨基酸、3个氨基酸、4个氨基酸、5个氨基酸、6个氨基酸、7个氨基酸、8个氨基酸、9个氨基酸、10个氨基酸、11个氨基酸、12个氨基酸、13个氨基酸、14个氨基酸、15个氨基酸、16个氨基酸、17个氨基酸、18个氨基酸、19个氨基酸、或20个氨基酸或更多个氨基酸。
在一些方面,支架X包含免疫球蛋白超家族成员8(IgSF8或IGSF8蛋白)(其也被称为CD81配偶体3)、含Glu-Trp-Ile EWI基序的蛋白2(EWI-2)、角质形成细胞相关跨膜蛋白4(KCT-4)、LIR-D1、前列腺素调控样蛋白(PGRL)或CD316。全长人IGSF8蛋白在Uniprot中的登录号为Q969P0,在本文中显示为SEQ ID NO:304。人IGSF8蛋白具有信号肽(SEQ ID NO:304的氨基酸1至27)、细胞外结构域(SEQ ID NO:304的氨基酸28至579)、跨膜结构域(SEQ IDNO:304的氨基酸580至600)和胞质结构域(SEQ ID NO:304的氨基酸601至613)。
在其他方面,支架X包含与SEQ ID NO:304的氨基酸28至613具有至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或约100%同一性的氨基酸序列。在一些方面,IGSF8蛋白缺少一个或多个功能性或结构结性构域,诸如IgV。在其他方面,支架X包含与SEQ ID NO:330、331、332或333具有至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或约100%同一性的氨基酸序列。在其他方面,支架X包含SEQ ID NO:330、331、332或333的氨基酸序列,不同的是有1个氨基酸突变、2个氨基酸突变、3个氨基酸突变、4个氨基酸突变、5个氨基酸突变、6个氨基酸突变或7个氨基酸突变。突变可以是取代、插入、缺失或它们的任何组合。在一些方面,支架X包含SEQ IDNO:330、331、332或333的氨基酸序列并且在SEQ ID NO:330、331、332或333的N末端和/或C末端包含1个氨基酸、2个氨基酸、3个氨基酸、4个氨基酸、5个氨基酸、6个氨基酸、7个氨基酸、8个氨基酸、9个氨基酸、10个氨基酸、11个氨基酸、12个氨基酸、13个氨基酸、14个氨基酸、15个氨基酸、16个氨基酸、17个氨基酸、18个氨基酸、19个氨基酸、或20个氨基酸或更多个氨基酸。
在一些方面,用于本公开的支架X包含免疫球蛋白超家族成员3(IgSF3或IGSF3蛋白),其也被称为含Glu-Trp-Ile EWI基序的蛋白3(EWI-3),并显示为SEQ ID NO:309的氨基酸序列。人IGSF3蛋白具有信号肽(SEQ ID NO:309的氨基酸1至19)、细胞外结构域(SEQ IDNO:309的氨基酸20至1124)、跨膜结构域(SEQ ID NO:309的氨基酸1125至1145)和胞质结构域(SEQ ID NO:309的氨基酸1146至1194)。
在其他方面,支架X包含与SEQ ID NO:309的氨基酸28至613具有至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或约100%同一性的氨基酸序列。在一些方面,IGSF3蛋白缺少一个或多个功能性或结构结性构域,诸如IgV。
在一些方面,用于本公开的支架X包含整联蛋白β-1(ITGB1蛋白)(其也被称为纤连蛋白受体亚单位β)、糖蛋白IIa(GPIIA)、VLA-4亚单位β或CD29,并显示为SEQ ID NO:305的氨基酸序列。人ITGB1蛋白具有信号肽(SEQ ID NO:305的氨基酸1至20)、细胞外结构域(SEQID NO:305的氨基酸21至728)、跨膜结构域(SEQ ID NO:305的氨基酸729至751)和胞质结构域(SEQ ID NO:305的氨基酸752至798)。
在其他方面,支架X包含与SEQ ID NO:305的氨基酸21至798具有至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或约100%同一性的氨基酸序列。在一些方面,ITGB1蛋白缺少一个或多个功能性或结构结性构域,诸如IgV。
在其他方面,支架X包含ITGA4蛋白,其包含与SEQ ID NO:306具有至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或约100%同一性但不含信号肽(SEQ ID NO:306的氨基酸1至33)的氨基酸序列。在一些方面,ITGA4蛋白缺少一个或多个功能性或结构结性构域,诸如IgV。
在其他方面,支架X包含SLC3A2蛋白,其包含与SEQ ID NO:307具有至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或约100%同一性但不含信号肽的氨基酸序列。在一些方面,SLC3A2蛋白缺少一个或多个功能性或结构结性构域,诸如IgV。
在其他方面,支架X包含ATP1A1蛋白,其包含与SEQ ID NO:310具有至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或约100%同一性但不含信号肽的氨基酸序列。在一些方面,ATP1A1蛋白缺少一个或多个功能性或结构结性构域,诸如IgV。
在其他方面,支架X包含ATP1A2蛋白,其包含与SEQ ID NO:311具有至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或约100%同一性但不含信号肽的氨基酸序列。在一些方面,ATP1A2蛋白缺少一个或多个功能性或结构结性构域,诸如IgV。
在其他方面,支架X包含ATP1A3蛋白,其包含与SEQ ID NO:312具有至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或约100%同一性但不含信号肽的氨基酸序列。在一些方面,ATP1A3蛋白缺少一个或多个功能性或结构结性构域,诸如IgV。
在其他方面,支架X包含ATP1A4蛋白,其包含与SEQ ID NO:313具有至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或约100%同一性但不含信号肽的氨基酸序列。在一些方面,ATP1A4蛋白缺少一个或多个功能性或结构结性构域,诸如IgV。
在其他方面,支架X包含ATP2B1蛋白,其包含与SEQ ID NO:314具有至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或约100%同一性但不含信号肽的氨基酸序列。在一些方面,ATP2B1蛋白缺少一个或多个功能性或结构结性构域,诸如IgV。
在其他方面,支架X包含ATP2B2蛋白,其包含与SEQ ID NO:315具有至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或约100%同一性但不含信号肽的氨基酸序列。在一些方面,ATP2B2蛋白缺少一个或多个功能性或结构结性构域,诸如IgV。
在其他方面,支架X包含ATP2B3蛋白,其包含与SEQ ID NO:316具有至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或约100%同一性但不含信号肽的氨基酸序列。在一些方面,ATP2B3蛋白缺少一个或多个功能性或结构结性构域,诸如IgV。
在其他方面,支架X包含ATP2B4蛋白,其包含与SEQ ID NO:317具有至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或约100%同一性但不含信号肽的氨基酸序列。在一些方面,ATP2B4蛋白缺少一个或多个功能性或结构结性构域,诸如IgV。
在其他方面,支架X包含IGSF2蛋白,其包含与SEQ ID NO:318具有至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或约100%同一性但不含信号肽的氨基酸序列。在一些方面,IGSF2蛋白缺少一个或多个功能性或结构结性构域,诸如IgV。
其他支架X蛋白的非限制性实例可见于2019年2月5日发布的美国专利号US10195290B1,所述专利以引用方式整体并入。
在一些方面,所述序列编码缺少来自天然蛋白的N末端的至少5个、10个、50个、100个、200个、300个、400个、500个、600个、700个或800个氨基酸的支架部分的片段。在一些方面,所述序列编码缺少来自天然蛋白的C末端的至少5个、10个、50个、100个、200个、300个、400个、500个、600个、700个或800个氨基酸的支架部分的片段。在一些方面,所述序列编码缺少来自天然蛋白的N末端和C末端的至少5个、10个、50个、100个、200个、300个、400个、500个、600个、700个或800个氨基酸的支架部分的片段。在一些方面,所述序列编码缺少天然蛋白的一个或多个功能性或结构性结构域的支架部分的片段。
在一些方面,支架部分(例如,支架X),例如PTGFRN蛋白,与一个或多个异源性蛋白连接。一个或多个异源性蛋白可以连接至支架部分的N末端。一个或多个异源性蛋白可以连接至支架部分的C末端。在一些方面,一个或多个异源性蛋白与支架部分的N末端和C末端连接。在一些方面,异源性蛋白是哺乳动物蛋白。在一些方面,异源性蛋白是人类蛋白。
在一些方面,支架X可用于将任何部分(例如,ASO)同时连接至EV(例如,外泌体)的腔表面和外表面上。例如,除EV(例如,外泌体)的外表面之外,PTGFRN多肽还可用于将ASO连接至腔内部(例如,腔表面上)。因此,在某些方面,支架X可用于双重目的,例如,EV(例如,外泌体)的腔表面上的ASO和外表面上的ASO。在一些方面,支架X是能够将ASO锚定在EV的腔表面和/或EV的外表面上的支架蛋白。
III.B.2.支架Y工程化的EV,例如外泌体
在一些方面,本公开的EV(例如,外泌体)包括不同于天然存在的EV的内部空间的内部空间(即,腔)。例如,可改变EV,使得EV(例如,外泌体)的腔表面上的组成具有与天然存在的外泌体的蛋白质、脂质或聚糖含量不同的蛋白质、脂质或聚糖含量。
在一些方面,可从用编码支架部分(例如,外泌体蛋白,例如,支架Y)或改变EV(例如,外泌体)的腔表面的组成或内容物的支架部分的修饰或片段的外源序列转化的细胞产生工程化EV(例如,外泌体)。可在EV(例如,外泌体)的腔表面中表达的外泌体蛋白质的各种修饰或片段可用于本公开的方面。
在一些方面,可改变EV(例如,外泌体)的腔表面的外泌体蛋白包括但不限于富含肉豆蔻酰化丙氨酸的蛋白激酶C底物(MARCKS)蛋白、富含肉豆蔻酰化丙氨酸的蛋白激酶C底物样1(MARCKSL1)蛋白、脑酸可溶性蛋白1(BASP1)蛋白质或它们的任何组合。
在一些方面,支架Y包含MARCKS蛋白(Uniprot登录号P29966;SEQ ID NO:401)。MARCKS蛋白也称为蛋白激酶C底物,80kDa蛋白,轻链。全长人MARCKS蛋白的长度为332个氨基酸,并在氨基酸残基152-176处包含钙调素结合结构域。在一些方面,支架Y包含MARCKSL1蛋白(Uniprot登录号P49006;SEQ ID NO:402)。MARCKSL1蛋白也称为MARCKS样蛋白1,以及富含巨噬细胞肉豆蔻酰化丙氨酸的C激酶底物。全长人MARCKSL1蛋白的长度为195个氨基酸。MARCKSL1蛋白在氨基酸残基87-110处具有参与脂质结合和钙调蛋白结合的效应结构域。在一些方面,支架Y包含BASP1蛋白(Uniprot登录号P80723;SEQ ID NO:403)。BASP1蛋白也称为22kDa神经元组织富集的酸性蛋白或神经元轴突膜蛋白NAP-22。全长人BASP1蛋白质序列(异构体1)的长度为227个氨基酸。通过可变剪接产生的异构体缺少SEQ ID NO:403的氨基酸88至141(异构体1)。表7提供了本文所公开的示例性支架Y的全长序列(即,MARCKS、MARCKSL1和BASP1蛋白)。
表7.示例性支架Y蛋白序列
成熟BASP1蛋白序列缺少SEQ ID NO:403的第一个Met,因此含有SEQ ID NO:403的氨基酸2至227。类似地,成熟MARCKS和MARCKSL1蛋白也分别缺乏来自SEQ ID NO:401和402的第一个Met。因此,成熟MARCKS蛋白含有SEQ ID NO:401的氨基酸2至332。成熟MARCKSL1蛋白含有SEQ ID NO:402的氨基酸2至227。
在其他方面,可用于本公开的支架Y包含与SEQ ID NO:403的氨基酸2至227具有至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或约100%同一性的氨基酸序列。在其他方面,支架Y包含与SEQ ID NO:404-567中任一者具有至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或约100%同一性的氨基酸序列。在其他方面,可用于本公开的支架Y包含SEQ ID NO:403的氨基酸序列,不同的是有1个氨基酸突变、2个氨基酸突变、3个氨基酸突变、4个氨基酸突变、5个氨基酸突变、6个氨基酸突变或7个氨基酸突变。在其他方面,可用于本公开的支架Y包含SEQ ID NO:403的氨基酸序列,在SEQ ID NO:403的氨基酸残基1处没有Met,不同的是有1个氨基酸突变、2个氨基酸突变、3个氨基酸突变、4个氨基酸突变、5个氨基酸突变、6个氨基酸突变或7个氨基酸突变。突变可以是取代、插入、缺失或它们的任何组合。在一些方面,可用于本公开的支架Y包含SEQ ID NO:404-567中任一者的氨基酸序列并且在SEQ ID NO:404-567的N末端和/或C末端包含1个氨基酸、2个氨基酸、3个氨基酸、4个氨基酸、5个氨基酸、6个氨基酸、7个氨基酸、8个氨基酸、9个氨基酸、10个氨基酸、11个氨基酸、12个氨基酸、13个氨基酸、14个氨基酸、15个氨基酸、16个氨基酸、17个氨基酸、18个氨基酸、19个氨基酸或20个氨基酸或更多个氨基酸。
在一些方面,SEQ ID NO:404-567中任一者的蛋白质序列足以作为本公开的支架Y(例如,与ASO连接的支架部分)。
在一些方面,可用于本公开的支架Y包含具有MGXKLSKKK的的肽,其中X为丙氨酸或任何其他氨基酸(SEQ ID NO:404)。在一些方面,EV(例如,外泌体)包含具有序列(G)(π)(ξ)(Φ/π)(S/A/G/N)(+)(+)的肽,其中每个括号位置代表氨基酸,并且其中π为选自由(Pro、Gly、Ala、Ser)组成的组的任意氨基酸,ξ为选自由(Asn、Gln、Ser、Thr、Asp、Glu、Lys、His、Arg)组成的组的任意氨基酸,Φ为选自由(Val、Ile、Leu、Phe、Trp、Tyr、Met)组成的组的任意氨基酸,并且(+)为选自由(Lys、Arg、His)组成的组的任意氨基酸;并且其中位置5不是(+)并且位置6既不是(+)也不是(Asp或Glu)。在其他方面,本文所述的外泌体(例如,工程化的外泌体)包含具有序列(G)(π)(X)(Φ/π)(π)(+)(+)的肽,其中每个括号位置代表氨基酸,并且其中π为选自由(Pro、Gly、Ala、Ser)组成的组的任意氨基酸,X为任意氨基酸,Φ为选自由(Val、Ile、Leu、Phe、Trp、Tyr、Met)组成的组的任意氨基酸,并且(+)为选自由(Lys、Arg、His)组成的组的任意氨基酸;并且其中第五位不是(+)并且第六位既不是(+)也不是(Asp或Glu)。氨基酸命名参见Aasland等人,FEBS Letters 513(2002)141-144。
在其他方面,支架X包含与SEQ ID NO:404-567中任一者具有至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或约100%同一性的氨基酸序列。
本文所述的支架Y工程化的EV(例如,外泌体)可从用SEQ ID NO:404-567所示的序列转化的细胞中产生。
在一些方面,可用于本公开的支架Y蛋白包含“N末端结构域”(ND)和“效应结构域”(ED),其中ND和/或ED与EV(例如,外泌体)的腔表面缔合。在一些方面,可用于本公开的支架Y蛋白包含细胞内结构域、跨膜结构域和细胞外结构域;其中细胞内结构域包括“N末端结构域”(ND)和“效应结构域”(ED);其中ND和/或ED与EV(例如,外泌体)的腔表面缔合。如本文所用,术语“与……缔合”是指支架蛋白与EV(例如,外泌体)的腔表面之间的相互作用,它不涉及与膜组分的共价连接。例如,可用于本公开的支架可以与EV的腔表面缔合,例如借助脂质锚(例如,肉豆蔻酸)和/或与带负电荷的膜磷脂头部静电相互作用的多元结构域。在其他方面,支架Y蛋白包含N末端结构域(ND)和效应结构域(ED),其中ND通过离子相互作用与EV的腔表面缔合,而ED与EV的腔表面缔合,其中ED包含按顺序的至少两个、至少三个、至少四个、至少五个、至少六个或至少七个连续的碱性氨基酸,例如赖氨酸(Lys)。
在其他方面,支架Y蛋白包含N末端结构域(ND)和效应结构域(ED),其中ND通过离子相互作用与EV(例如,外泌体)的腔表面缔合,而ED与EV的腔表面缔合,其中ED包含按顺序的至少两个、至少三个、至少四个、至少五个、至少六个或至少七个连续的碱性氨基酸,例如赖氨酸(Lys)。
在一些方面,ND通过脂化,例如通过肉豆蔻酰化与EV(例如,外泌体)的腔表面缔合。在一些方面,ND在N末端具有Gly。在一些方面,N末端Gly是肉豆蔻酰化的。
在一些方面,ED通过离子相互作用与EV(例如,外泌体)的腔表面缔合。在一些方面,ED通过静电相互作用,特别是吸引静电相互作用,与EV(例如,外泌体)的腔表面缔合。
在一些方面,ED在多肽序列中包含(i)碱性氨基酸(例如,赖氨酸),或(ii)两个或更多个彼此相邻的碱性氨基酸(例如,赖氨酸)。在一些方面,碱性氨基酸是赖氨酸(Lys;K)、精氨酸(Arg,R)或组氨酸(His,H)。在一些方面,碱性氨基酸是(Lys)n,其中n是在1和10之间的整数。
在其他方面,如果ED的N末端与ND的C末端的赖氨酸直接连接,即,赖氨酸在ED的N末端并且与ND的C末端的赖氨酸融合,则ED至少包含赖氨酸,并且ND包含C末端的赖氨酸ED。在其他方面,当ED的N末端与ND的C末端通过接头(例如,一个或多个氨基酸)连接时,ED包含至少两个赖氨酸、至少三个赖氨酸、至少四个赖氨酸、至少五个赖氨酸、至少六个赖氨酸或至少七个赖氨酸。
在一些方面,ED包含K、KK、KKK、KKKK(SEQ ID NO:405)、KKKKK(SEQ ID NO:406)、R、RR、RRR、RRRR(SEQ ID NO:407);RRRRR(SEQ ID NO:408)、KR、RK、KKR、KRK、RKK、KRR、RRK、(K/R)(K/R)(K/R)(K/R)(SEQ ID NO:409)、(K/R)(K/R)(K/R)(K/R)(K/R)(SEQ ID NO:410)或它们的任何组合。在一些方面,ED包含KK、KKK、KKKK(SEQ ID NO:405)、KKKKK(SEQ ID NO:406)或它们的任何组合。在一些方面,ND包含如G:X2:X3:X4:X5:X6所示的氨基酸序列,其中G代表Gly;其中“:”代表肽键;其中X2至X6中的每个独立地代表氨基酸;并且其中X6代表碱性氨基酸。在一些方面,X6氨基酸选自由以下各项组成的组:Lys、Arg和His。在一些方面,X5氨基酸选自由以下各项组成的组:Pro、Gly、Ala和Ser。在一些方面,X2氨基酸选自由以下各项组成的组:Pro、Gly、Ala和Ser。在一些方面,X4选自由Pro、Gly、Ala、Ser、Val、Ile、Leu、Phe、Trp、Tyr、Gln和Met组成的组。
在一些方面,支架Y蛋白包含N末端结构域(ND)和效应结构域(ED),其中ND包含如G:X2:X3:X4:X5:X6所示的氨基酸序列,其中G代表Gly;其中“:”代表肽键;其中X2至X6中的每个独立地为氨基酸;其中X6包含碱性氨基酸,并且其中ED通过肽键与X6连接,并且在ED的N末端包含至少一个赖氨酸。
在一些方面,支架Y蛋白的ND包含氨基酸序列G:X2:X3:X4:X5:X6,其中G代表Gly;“:”代表肽键;X2代表选自由Pro、Gly、Ala和Ser组成的组的氨基酸;X3代表任何氨基酸;X4代表选自由Pro、Gly、Ala、Ser、Val、Ile、Leu、Phe、Trp、Tyr、Gln和Met组成的组的氨基酸;X5代表选自由Pro、Gly、Ala和Ser组成的组的氨基酸;并且X6代表选自由Lys、Arg和His组成的组的氨基酸。
在一些方面,X3氨基酸选自由以下各项组成的组:Asn、Gln、Ser、Thr、Asp、Glu、Lys、His和Arg。
在一些方面,ND和ED通过接头连接。在一些方面,接头包含一个或多个氨基酸。在一些方面,术语“接头”是指肽或多肽序列(例如,合成肽或多肽序列)或非多肽,例如烷基链。在一些方面,可将两个或更多个接头串联连接。一般来说,接头提供了灵活性或防止/改善了空间障碍。接头通常不被切割;然而,在某些方面,这种切割可以是想要的。因此,在一些方面,接头可包含一个或多个蛋白酶可切割位点,其可以位于接头序列内或接头序列任一端的接头侧翼。当ND和ED通过接头连接时,ED包含至少两个赖氨酸、至少三个赖氨酸、至少四个赖氨酸、至少五个赖氨酸、至少六个赖氨酸或至少七个赖氨酸。
在一些方面,接头是肽接头。在一些方面,肽接头可包含至少约两个、至少约三个、至少约四个、至少约五个、至少约10个、至少约15个、至少约20个、至少约25个、至少约30个、至少约35个、至少约40个、至少约45个、至少约50个、至少约55个、至少约60个、至少约65个、至少约70个、至少约75个、至少约80、至少约85、至少约90、至少约95或至少约100个氨基酸。
在一些方面,接头是甘氨酸/丝氨酸接头。在一些方面,肽接头是根据式[(Gly)n-Ser]m的甘氨酸/丝氨酸接头,其中n为1至100的任何整数,并且m为1至100的任何整数。在其他方面,甘氨酸/丝氨酸接头是根据式[(Gly)x-Sery]z的接头,其中x为1至4的整数,y为0或1,并且z为1至50的整数。在一个方面,肽接头包含序列Gn,其中n可以是1至100的整数。在一些方面,肽接头可以包含序列(GlyAla)n,其中n为在1和100之间的整数。在其他方面,肽接头可以包含序列(GlyGlySer)n,其中n为在1和100之间的整数。
在一些方面,肽接头是合成的,即非天然存在的。在一个方面,肽接头包括肽(或多肽)(例如,天然或非天然存在的肽),其包含将第一线性氨基酸序列与第二线性氨基酸序列连接或遗传融合,所述第一线性氨基酸序列在自然界中与所述第二线性氨基酸序列不是天然连接或遗传融合的。例如,在一个方面,肽接头可包含非天然存在的多肽,其是天然存在的多肽的修饰形式(例如,包含突变诸如添加、取代或缺失)。
在其他方面,肽接头可以包含非天然存在的氨基酸。在另外其他方面,肽接头可包含天然存在的氨基酸,其存在于不存在于自然界的直链序列中。在另外其他方面,肽接头可以包含天然存在的多肽序列。
本公开还提供了包含与支架Y蛋白连接的ASO的分离的细胞外囊泡(EV)(例如,外泌体),其中支架Y蛋白包含ND—ED,其中:ND包含G:X2:X3:X4:X5:X6;其中:G代表Gly;“:”代表肽键;X2代表选自由Pro、Gly、Ala和Ser组成的组的氨基酸;X3代表任何氨基酸;X4代表选自由Pro、Gly、Ala、Ser、Val、Ile、Leu、Phe、Trp、Tyr、Glu和Met组成的组的氨基酸;X5代表选自由Pro、Gly、Ala和Ser组成的组的氨基酸;X6代表选自由Lys、Arg和His组成的组的氨基酸;“—”代表任选的接头;ED是效应结构域,包含(i)至少两个连续赖氨酸(Lys),它们通过肽键或一个或多个氨基酸与X6连接,或(ii)至少一个赖氨酸,它通过肽键直接连接至X6。
在一些方面,X2氨基酸选自由Gly和Ala组成的组。在一些方面,X3氨基酸是Lys。在一些方面,X4氨基酸是Leu或Glu。在一些方面,X5氨基酸选自由Ser和Ala组成的组。在一些方面,X6氨基酸是Lys。在一些方面,X2氨基酸是Gly、Ala或Ser;X3氨基酸是Lys或Glu;X4氨基酸是Leu、Phe、Ser或Glu;X5氨基酸是Ser或Ala;X6氨基酸是Lys。在一些方面,“—”接头包含肽键或者一个或多个氨基酸。
在一些方面,支架蛋白中的ED包含Lys(K)、KK、KKK、KKKK(SEQ ID NO:405)、KKKKK(SEQ ID NO:406)、Arg(R)、RR、RRR、RRRR(SEQ ID NO:407);RRRRR(SEQ ID NO:408)、KR、RK、KKR、KRK、RKK、KRR、RRK、(K/R)(K/R)(K/R)(K/R)(SEQ ID NO:409)、(K/R)(K/R)(K/R)(K/R)(K/R)(SEQ ID NO:410)或它们的任何组合。
在一些方面,支架Y蛋白包含选自由以下各项组成的组的氨基酸序列:(i)GGKLSKK(SEQ ID NO:411)、(ii)GAKLSKK(SEQ ID NO:412)、(iii)GGKQSKK(SEQ ID NO:413),(iv)GGKLAKK(SEQ ID NO:414)或(v)它们的任何组合。
在一些方面,支架Y蛋白中的ND包含选自由以下各项组成的组的氨基酸序列:(i)GGKLSK(SEQ ID NO:415)、(ii)GAKLSK(SEQ ID NO:416)、(iii)GGKQSK(SEQ ID NO:417)、(iv)GGKLAK(SEQ ID NO:418)或(v)它们的任何组合;并且支架蛋白中的ED包含K、KK、KKK、KKKG(SEQ ID NO:419)、KKKGY(SEQ ID NO:420)、KKKGYN(SEQ ID NO:421)、KKKGYNV(SEQ IDNO:422)、KKKGYNVN(SEQ ID NO:423)、KKKGYS(SEQ ID NO:424)、KKKGYG(SEQ ID NO:425)、KKKGYGG(SEQ ID NO:426)、KKKGS(SEQ ID NO:427)、KKKGSG(SEQ ID NO:428)、KKKGSGS(SEQID NO:429)、KKKS(SEQ ID NO:430)、KKKSG(SEQ ID NO:431)、KKKSGG(SEQ ID NO:432)、KKKSGGS(SEQ ID NO:433)、KKKSGGSG(SEQ ID NO:434)、KKSGGSGG(SEQ ID NO:435)、KKKSGGSGGS(SEQ ID NO:436)、KRFSFKKS(SEQ ID NO:437)。
在一些方面,可用于本公开的支架Y蛋白的多肽序列由选自由以下各项组成的组的氨基酸序列组成:(i)GGKLSKK(SEQ ID NO:411)、(ii)GAKLSKK(SEQ ID NO:412)、(iii)GGKQSKK(SEQ ID NO:413)、(iv)GGKLAKK(SEQ ID NO:414)或(v)它们的任何组合。
在一些方面,支架Y蛋白包含选自由以下各项组成的组的氨基酸序列:(i)GGKLSKKK(SEQ ID NO:438)、(ii)GGKLSKKS(SEQ ID NO:439)、(iii)GAKLSKKK(SEQ ID NO:440)、(iv)GAKLSKKS(SEQ ID NO:441)、(v)GGKQSKKK(SEQ ID NO:442)、(vi)GGKQSKKS(SEQID NO:443)、(vii)GGKLAKKK(SEQ ID NO:444)、(viii)GGKLAKKS(SEQ ID NO:445)以及(ix)它们的任何组合。
在一些方面,可用于本公开的支架Y蛋白的多肽序列由选自由以下各项组成的组的氨基酸序列组成:(i)GGKLSKKK(SEQ ID NO:438)、(ii)GGKLSKKS(SEQ ID NO:439)、(iii)GAKLSKKK(SEQ ID NO:440)、(iv)GAKLSKKS(SEQ ID NO:441)、(v)GGKQSKKK(SEQ ID NO:442)、(vi)GGKQSKKS(SEQ ID NO:443)、(vii)GGKLAKKK(SEQ ID NO:444)、(viii)GGKLAKKS(SEQ ID NO:445)以及(ix)它们的任何组合。
在一些方面,支架Y蛋白的长度为至少约8个、至少约9个、至少约10个、至少约11个、至少约12个、至少约13个、至少约14个、至少约15个、至少约16个、至少约17个、至少约18个、至少约19个、至少约20个、至少约21个、至少约22个、至少约23个、至少约24个、至少约25个、至少约26个、至少约27个、至少约28个、至少约29个、至少约30个、至少31个、至少约32个、至少约33个、至少约34个、至少约35个、至少约36个、至少约37个、至少约38个、至少约39个、至少约39个、至少约40个、至少约41个、至少约42个、至少约43个、至少约44个、至少约50个、至少约46个、至少约47个、至少约48个、至少约49个、至少约50个、至少约55个、至少约60个、至少约65个、至少约70个、至少约75个、至少约80个、至少85个、至少约90个、至少约95个、至少约100个、至少约105个、至少约110个、至少约115个、至少约120个、至少约125个、至少约130个、至少约135个、至少约140个、至少约145个、至少约150个、至少约155个、至少约160个、至少约165个、至少约170个、至少约175个、至少约180个、至少约185个、至少约190个、至少约195个、至少约200个、至少约205个、至少约210个、至少约215个、至少约220个、至少约225个、至少约230个、至少约235个、至少约240个、至少约245个、至少约250个、至少约255个、至少约260个、至少约265个、至少约270个、至少约275个、至少约280个、至少约285个、至少约290个、至少约295个、至少约300个、至少约305个、至少约310个、至少约315个、至少约320个、至少约325个、至少约330个、至少约335个、至少约340个、至少约345个或至少约350个氨基酸。
在一些方面,支架Y蛋白的长度在约5和约10个氨基酸之间、在约10和约20个氨基酸之间、在约20和约30个氨基酸之间、在约30和约40个氨基酸之间、在约40和约50个氨基酸之间、在约50和约60个氨基酸之间、在约60和约70个氨基酸之间、在约70和约80个氨基酸之间、在约80和约90个氨基酸之间、在约90和约100个氨基酸之间、在约100和约110个氨基酸之间、在约110和约120个氨基酸之间、在约120和约130个氨基酸之间、在约130和约140个氨基酸之间、在约140和约150个氨基酸之间、在约150和约160个氨基酸之间、在约160和约170个氨基酸之间、在约170和约180个氨基酸之间、在约180和约190个氨基酸之间、在约190和约200个氨基酸之间、在约200和约210个氨基酸之间、在约210和约220个氨基酸之间、在约220和约230个氨基酸之间、在约230和约240个氨基酸之间、在约240和约250个氨基酸之间、在约250和约260个氨基酸之间、在约260和约270个氨基酸之间、在约270和约280个氨基酸之间、在约280和约290个氨基酸之间、在约290和约300个氨基酸之间、在约300和约310个氨基酸之间、在约310和约320个氨基酸之间、在约320和约330个氨基酸之间、在约330和约340个氨基酸之间或者在约340和约350个氨基酸之间。
在一些方面,支架Y蛋白包含(i)GGKLSKKKKGYNVN(SEQ ID NO:446)、(ii)GAKLSKKKKGYNVN(SEQ ID NO:447)、(iii)GGKQSKKKKGYNVN(SEQ ID NO:448)、(iv)GGKLAKKKKGYNVN(SEQ ID NO:449)、(v)GGKLSKKKKGYSGG(SEQ ID NO:450)、(vi)GGKLSKKKKGSGGS(SEQ ID NO:451)、(vii)GGKLSKKKKSGGSG(SEQ ID NO:452)、(viii)GGKLSKKKSGGSGG(SEQ ID NO:453)、(ix)GGKLSKKSGGSGGS(SEQ ID NO:454)、(x)GGKLSKSGGSGGSV(SEQ ID NO:455)或(xi)GAKKSKKRFSFKKS(SEQ ID NO:456)。
在一些方面,用于本公开的支架Y蛋白的多肽序列由(i)GGKLSKKKKGYNVN(SEQ IDNO:446)、(ii)GAKLSKKKKGYNVN(SEQ ID NO:447)、(iii)GGKQSKKKKGYNVN(SEQ ID NO:448)、(iv)GGKLAKKKKGYNVN(SEQ ID NO:449)、(v)GGKLSKKKKGYSGG(SEQ ID NO:450)、(vi)GGKLSKKKKGSGGS(SEQ ID NO:451)、(vii)GGKLSKKKKSGGSG(SEQ ID NO:452)、(viii)GGKLSKKKSGGSGG(SEQ ID NO:453)、(ix)GGKLSKKSGGSGGS(SEQ ID NO:454)、(x)GGKLSKSGGSGGSV(SEQ ID NO:455)或(xi)GAKKSKKRFSFKKS(SEQ ID NO:456)组成。
下面列出了可用于本公开的支架Y蛋白的非限制性实例。在一些方面,支架Y蛋白包含SEQ ID NO:411、438、446和456-567中任一者所示的氨基酸序列。在一些方面,支架Y蛋白由SEQ ID NO:411、438、446和456-567中任一者所示的氨基酸序列组成。
在一些方面,可用于本公开的支架Y蛋白不包含N末端Met。在一些方面,支架Y蛋白在支架蛋白的N末端包含脂化的氨基酸,例如肉豆蔻酰化的氨基酸,它可用作脂质锚。在一些方面,支架蛋白的N末端的氨基酸残基是Gly。N末端甘氨酸的存在是N-肉豆蔻酰化的绝对要求。在一些方面,支架蛋白的N末端的氨基酸残基是合成的。在一些方面,支架蛋白的N末端的氨基酸残基是甘氨酸类似物,例如烯丙基甘氨酸、丁基甘氨酸或炔丙基甘氨酸。
支架蛋白的非限制性实例可见于2019年5月23日公布的WO/2019/099942和2020年5月22日公布的WO/2020/101740,所述专利以引用方式整体并入本文。
在其他方面,脂质锚可以是本领域已知的任何脂质,例如棕榈酸或糖基磷脂酰肌醇。在不寻常的情况下,例如,通过使用限制肉豆蔻酸的培养基,一些其他脂肪酸,包括短链和不饱和脂肪酸,可以连接至N末端甘氨酸。例如,在BK通道中,据报道肉豆蔻酸酯在翻译后通过羟基酯键联连接至内部丝氨酸/苏氨酸或酪氨酸残基。本领域中已知的膜锚在下表中给出:
III.C.接头
如上文所述,本公开的细胞外囊泡(EV)(例如,外泌体和纳米囊泡)可包含一个或多个将目标分子(例如,ASO)连接至EV(例如,连接至外表面或腔表面上)的接头。在一些方面,ASO直接或通过支架部分(例如,支架X或支架Y)连接至EV。在某些方面,ASO通过接头连接至支架部分。在某些方面,ASO通过接头连接至第二支架部分。
在某些方面,ASO通过支架X连接至外泌体的外表面。在另外的方面,ASO通过支架X或支架Y连接至外泌体的腔表面。接头可以是本领域中已知的任何化学部分。
如本文所用,术语“接头”是指肽或多肽序列(例如,合成肽或多肽序列)或非多肽,例如烷基链。在一些方面,可将两个或更多个接头串联连接。当存在多个接头时,每个接头可相同或不同。一般来说,接头提供了灵活性或防止/改善了空间障碍。接头通常不被切割;然而,在某些方面,这种切割可以是想要的。因此,在一些方面,接头可包含一个或多个蛋白酶可切割的位点,其可以位于接头序列内或接头序列任一端的接头侧翼。
在一些方面,接头是肽接头。在一些方面,肽接头可包含至少约2个、至少约3个、至少约4个、至少约5个、至少约10个、至少约15个、至少约20个、至少约25个、至少约30个、至少约35个、至少约40个、至少约45个、至少约50个、至少约55个、至少约60个、至少约65个、至少约70个、至少约75个、至少约80个、至少约85个、至少约90个、至少约95个或至少约100个氨基酸。v
在一些方面,肽接头是合成的,即非天然存在的。在一个方面,肽接头包括肽(或多肽)(例如,天然或非天然存在的肽),其包含将第一线性氨基酸序列与第二线性氨基酸序列连接或遗传融合,所述第一线性氨基酸序列在自然界中与所述第二线性氨基酸序列不是天然连接或遗传融合的。例如,在一个方面,肽接头可包含非天然存在的多肽,其是天然存在的多肽的修饰形式(例如,包含突变诸如添加、取代或缺失)。
接头可易于被切割(“可切割的接头”),从而促进生物活性分子(例如,ASO)的释放。
在一些方面,接头是“还原敏感型接头”。在一些方面,还原敏感型接头含有二硫键。在一些方面,接头是“酸不稳定型接头”。在一些方面,酸不稳定型接头含有腙。合适的酸不稳定型接头还包括,例如,顺式乌头酸接头、酰肼接头、硫代氨甲酰基接头或其任意组合。
在一些方面,接头包含不可切割的接头。
在一些方面,接头包含丙烯酸亚磷酰胺(例如,ACRYDITETM)、腺苷酸化、叠氮化物(NHS酯)、地高辛(NHS酯)、胆固醇-TEG、I-LINKERTM、氨基修饰剂(例如,氨基修饰剂C6、氨基修饰剂C12、氨基修饰剂C6 dT或Uni-LinkTM氨基修饰剂)、炔烃、5'己炔基、5-辛二炔基dU、生物素化(例如,生物素、生物素(叠氮化物)、生物素dT、生物素-TEG、双生物素、PC生物素或脱硫生物素)、硫醇修饰(硫醇修饰剂C3 S-S、二硫醇或硫醇修饰剂C6 S-S)或它们的任何组合。
在一些方面,接头包含萜烯,诸如橙花叔醇、法尼醇、柠檬烯、芳樟醇、香叶醇、香芹酮、小茴香酮或薄荷醇;脂质,诸如棕榈酸或肉豆蔻酸;胆固醇;油基;视黄基;胆固醇基残基;胆酸;金刚烷乙酸;1-芘丁酸;双氢睾酮;1,3-双-O(十六烷基)甘油;香叶基氧基己基;十六烷基甘油;冰片;1,3-丙二醇;十七烷基;O3-(油酰基)石胆酸;O3-(油酰基)胆酸;二甲氧基三苯甲基;吩噁嗪、马来酰亚胺部分、葡萄糖醛酸酶类型、CL2A-SN38类型、叶酸;碳水化合物;维生素A;维生素E;维生素K,或它们的任何组合。
III.D.靶向部分
在一些方面,EV(例如,外泌体),包含靶向部分,例如外源靶向部分。在一些方面,靶向部分包括肽、抗体或其抗原结合片段、化合物或它们的任何组合。在一些方面,靶向部分包括微蛋白、设计的锚蛋白重复蛋白(darpin)、anticalin、adnectin、适体、肽模拟分子、受体的天然配体、骆驼纳米抗体或它们的任何组合。在一些方面,靶向部分包含全长抗体、单结构域抗体、只有重链的抗体、单链抗体、只有重链的鲨鱼抗体、scFv、Fv、Fab、Fab'、F(ab')2或它们的任何组合。在一些方面,抗体是单链抗体。在一些方面,可用作靶向部分的抗体是单结构域抗体(例如,VHH或vNAR)。
在一些方面,靶向部分使EV(例如,外泌体)靶向肝、心、肺、脑、肾、中枢神经系统、外周神经系统、肌肉、骨、关节、皮肤、肠、膀胱、胰腺、淋巴结、脾脏或它们的任何组合。在一些方面,靶向部分使EV(例如,外泌体)靶向肿瘤细胞、肿瘤微环境、树突细胞、T细胞、B细胞、巨噬细胞、神经元、肝细胞、Kupffer细胞、骨髓谱系细胞(例如,嗜中性粒细胞、单核细胞或巨噬细胞)、造血干细胞或它们的任何组合。
在一些方面,靶向部分使EV(例如,外泌体)靶向肿瘤细胞。不受任何一种理论的束缚,在一些方面,靶向部分通过与在肿瘤细胞上表达的一种或多种肿瘤抗原结合来促进对肿瘤细胞的靶向。在一些方面,肿瘤抗原包括间皮素、CD22、MAGEA、MAGEB、MAGEC、BAGE、GAGE、NY-ESO1、SSX、GRP78、CD33、CD123、WT1或它们的任何组合。
在一些方面,靶向部分通过支架蛋白连接至EV(例如,外泌体)。在一些方面,支架蛋白是本文所公开的任何支架蛋白。在一些方面,支架蛋白是支架X(例如,PTGFRN)。在一些方面,支架蛋白是支架Y。
如本文所述,在一些方面,可与本文所述的EV(例如,外泌体)一起使用的靶向部分包括单结构域抗原结合部分。如本文所用,术语“单结构域抗原结合部分”是指能够与靶分子(例如,CD33、间皮素或两者)可逆地相互作用的多肽。如本文所述,在一些方面,单结构域抗原结合部分包含单个单体可变抗体结合片段,诸如在单结构域抗体(例如,纳米抗体)中观察到的那些。在一些方面,单结构域抗原结合部分包含单链抗体,诸如单链Fab(scFab)抗体。
在一些方面,单结构域抗原结合部分源自抗体。在某些方面,单结构域抗原结合部分源自骆驼抗体。在一些方面,源自骆驼抗体的单结构域抗原结合部分是VHH。如本文所用,“VHH”(也称为纳米抗体)是缺乏恒定区的重链抗体的单可变结构域。在自然界中,VHH是只有重链的抗体(HcAb)的抗原结合部分,诸如在鲨鱼和骆驼中自然产生的抗体(参见,例如,Bever等人,Anal.Bioananl Chem 408(22):5985-6002(2016),其以引用方式整体并入本文)。骆驼抗体的特征是由两条重链组成的同源二聚体,每条重链具有一个可变重链区(VHH)和两个恒定重链区。
本领域中已知的任何VHH都可用于本文所公开的方法中。在一些方面,VHH源自骆驼抗体。在一些方面,VHH是骆驼抗体的片段。在一些方面,VHH是合成多肽。在一些方面,VHH是重组多肽。在一些方面,VHH包含一个或多个突变以增强VHH对靶抗原的结合亲和力。在一些方面,VHH包含一个或多个突变以增强VHH的稳定性。
在一些方面,单结构域抗原结合部分是vNAR。如本文所用,“vNAR”是指包含IgNAR抗体的可变区的多肽。IgNAR抗体是由两条重链组成的重链同源二聚体,每条重链具有一个可变重链区(vNAR)和五个恒定重链区。IgNAR在软骨鱼和鲨鱼中自然表达(参见,例如,Dooley等人,Molecular Immunology 40:25-33(2003);和国际公布第2016/077840 A2号;其各自以引用方式整体并入本文)。
本领域中已知的任何vNAR都可用于本文所公开的方法中。在一些方面,vNAR源自IgNAR。在一些方面,vNAR源自IgNAR。在一些方面,vNAR是鲨鱼IgNAR抗体的片段。在一些方面,vNAR是合成多肽。在一些方面,vNAR是重组多肽。在一些方面,vNAR包含一个或多个突变以增强vNAR对靶抗原的结合亲和力。在一些方面,vNAR包含一个或多个突变以增强vNAR的稳定性。
在一些方面,本文所公开的单结构域抗原结合部分小于常规人抗体及其scFc片段,从而允许产生具有更高表面装载的抗原结合部分浓度的EV(例如,外泌体)。例如,VHH和vNAR抗原结合结构域各自具有约12-15kDa的分子量(IgG大小的十分之一,scFv大小的近一半)。
不受任何特定机制的束缚,本文所公开的单抗原结合部分更有效地由产生外泌体的细胞表达,并且与常规抗体相比它们在EV(例如,外泌体)的腔和/或外表面上占据更少的空间。这允许表面上的结合分子的密度更大。对于内部装载,这提供了至少两个好处。首先,具有更高密度的抗原结合部分使得能够装载更高密度的可与该抗原结合部分结合的特定货物。其次,由于抗原结合部分比传统抗体小,EV可装载更大的货物,而抗原结合部分占用的空间更少。对于外部装载,使用本文所公开的较小的抗原结合部分还允许通过与抗原结合部分的相互作用结合更大密度的货物。较高的密度还有助于增加EV对靶抗原的整体向性,并增加EV和靶抗原之间相互作用的可能性。
因此,在一些方面,本文所述的EV(例如,外泌体)(例如,包含对KRAS G12D mRNA具特异性的ASO)包含在表面(例如,外表面)上的一种或多种单结构域抗原结合部分(例如,VHH和/或vNAR),其中表面上的一种或多种单结构域抗原结合部分的浓度为至少约100个拷贝/EV、至少约150个拷贝/EV、至少约200个拷贝/EV、至少约250个拷贝/EV、至少约300个拷贝/EV、至少约350个拷贝/EV、至少约400个拷贝/EV、至少约450个拷贝/EV、至少约500个拷贝/EV、至少约600个拷贝/EV、至少约700个拷贝/EV、至少约800个拷贝/EV、至少约900个拷贝/EV、至少约1000个拷贝/EV、至少约1250个拷贝/EV、至少约1500个拷贝/EV、至少约2000个拷贝/EV、至少约2500个拷贝/EV、至少约3000个拷贝/EV、至少约3500个拷贝/EV、至少约4000个拷贝/EV、至少约4500个拷贝/EV或至少约5000个拷贝/EV。
在一些方面,单结构域抗原结合部分(例如,VHH和/或vNAR)与定位于EV(例如,外泌体)的外表面的蛋白质融合。在某些方面,EV(例如,外泌体)包含至少约100个与EV(例如,外泌体)外表面上的支架X蛋白融合的VHH的拷贝。在某些方面,EV(例如,外泌体)包含至少约1000个与EV(例如,外泌体)外表面上的支架X蛋白融合的VHH的拷贝。在某些方面,EV(例如,外泌体)包含至少约100个与EV(例如,外泌体)外表面上的支架X蛋白融合的vNAR的拷贝。在某些方面,EV(例如,外泌体)包含至少约1000个与EV(例如,外泌体)外表面上的支架X蛋白融合的vNAR的拷贝。
在一些方面,EV包含在EV外表面上的至少约100个单结构域抗原结合部分(例如,VHH或vNAR)的拷贝。在一些方面,EV包含在EV外表面上的至少约150个单结构域抗原结合部分(例如,VHH或vNAR)的拷贝。在一些方面,EV包含在EV外表面上的至少约200个单结构域抗原结合部分(例如,VHH或vNAR)的拷贝。在一些方面,EV包含在EV外表面上的至少约250个单结构域抗原结合部分(例如,VHH或vNAR)的拷贝。在一些方面,EV包含在EV外表面上的至少约300个单结构域抗原结合部分(例如,VHH或vNAR)的拷贝。在一些方面,EV包含在EV外表面上的至少约350个单结构域抗原结合部分(例如,VHH或vNAR)的拷贝。在一些方面,EV包含在EV外表面上的至少约400个单结构域抗原结合部分(例如,VHH或vNAR)的拷贝。在一些方面,EV包含在EV外表面上的至少约450个单结构域抗原结合部分(例如,VHH或vNAR)的拷贝。在一些方面,EV包含在EV外表面上的至少约500个单结构域抗原结合部分(例如,VHH或vNAR)的拷贝。在一些方面,EV包含在EV外表面上的至少约600个单结构域抗原结合部分(例如,VHH或vNAR)的拷贝。在一些方面,EV包含在EV外表面上的至少约700个单结构域抗原结合部分(例如,VHH或vNAR)的拷贝。在一些方面,EV包含在EV外表面上的至少约800个单结构域抗原结合部分(例如,VHH或vNAR)的拷贝。在一些方面,EV包含在EV外表面上的至少约900个单结构域抗原结合部分(例如,VHH或vNAR)的拷贝。在一些方面,EV包含在EV外表面上的至少约1000个单结构域抗原结合部分(例如,VHH或vNAR)的拷贝。在一些方面,EV包含在EV外表面上的至少约1100个单结构域抗原结合部分(例如,VHH或vNAR)的拷贝。在一些方面,EV包含在EV外表面上的至少约1200个单结构域抗原结合部分(例如,VHH或vNAR)的拷贝。在一些方面,EV包含在EV外表面上的至少约1300个单结构域抗原结合部分(例如,VHH或vNAR)的拷贝。在一些方面,EV包含在EV外表面上的至少约1400个单结构域抗原结合部分(例如,VHH或vNAR)的拷贝。在一些方面,EV包含在EV外表面上的至少约1500个单结构域抗原结合部分(例如,VHH或vNAR)的拷贝。在一些方面,EV包含在EV外表面上的至少约1600个单结构域抗原结合部分(例如,VHH或vNAR)的拷贝。在一些方面,EV包含在EV外表面上的至少约1700个单结构域抗原结合部分(例如,VHH或vNAR)的拷贝。在一些方面,EV包含在EV外表面上的至少约1800个单结构域抗原结合部分(例如,VHH或vNAR)的拷贝。在一些方面,EV包含在EV外表面上的至少约1900个单结构域抗原结合部分(例如,VHH或vNAR)的拷贝。在一些方面,EV包含在EV外表面上的至少约2000个单结构域抗原结合部分(例如,VHH或vNAR)的拷贝。在一些方面,EV包含在EV外表面上的至少约2250个单结构域抗原结合部分(例如,VHH或vNAR)的拷贝。在一些方面,EV包含在EV外表面上的至少约2500个单结构域抗原结合部分(例如,VHH或vNAR)的拷贝。在一些方面,EV包含在EV外表面上的至少约2750个单结构域抗原结合部分(例如,VHH或vNAR)的拷贝。在一些方面,EV包含在EV外表面上的至少约3000个单结构域抗原结合部分(例如,VHH或vNAR)的拷贝。在一些方面,EV包含在EV外表面上的至少约3250个单结构域抗原结合部分(例如,VHH或vNAR)的拷贝。在一些方面,EV包含在EV外表面上的至少约3500个单结构域抗原结合部分(例如,VHH或vNAR)的拷贝。在一些方面,EV包含在EV外表面上的至少约3750个单结构域抗原结合部分(例如,VHH或vNAR)的拷贝。在一些方面,EV包含在EV外表面上的至少约4000个单结构域抗原结合部分(例如,VHH或vNAR)的拷贝。在一些方面,EV包含在EV外表面上的至少约4250个单结构域抗原结合部分(例如,VHH或vNAR)的拷贝。在一些方面,EV包含在EV外表面上的至少约4500个单结构域抗原结合部分(例如,VHH或vNAR)的拷贝。在一些方面,EV包含在EV外表面上的至少约4750个单结构域抗原结合部分(例如,VHH或vNAR)的拷贝。在一些方面,EV包含在EV外表面上的至少约5000个单结构域抗原结合部分(例如,VHH或vNAR)的拷贝。
在一些方面,单结构域抗原结合部分装载在EV(例如,外泌体)的腔(即,内)表面上。因为单结构域抗原结合部分比常规的基于IgG的抗体及其片段小得多,所以本文所公开的方法允许有更高浓度的抗原结合部分定位到EV的腔表面。这在装载EV(例如,外泌体)时非常有用,带有货物,允许将更大密度的货物装载到单个EV中,并允许更大的货物(诸如AAV)与腔表面相缔合,同时最大限度地减少抗原结合部分所占用的空间。因此,在一些方面,单结构域抗原结合部分与本文所公开的且定位于EV(例如,外泌体)的腔表面的支架Y蛋白连接。
在一些方面,单结构域抗原结合部分(例如,VHH和/或vNAR)与定位于EV(例如,外泌体)的腔表面的蛋白质融合。在一些方面,EV(例如,外泌体)包含至少约100个与EV(例如,外泌体)腔表面上的支架Y蛋白融合的VHH的拷贝。在一些方面,EV(例如,外泌体)包含至少约1000个与EV(例如,外泌体)腔表面上的支架Y蛋白融合的VHH的拷贝。在一些方面,EV(例如,外泌体)包含至少约100个与EV(例如,外泌体)腔表面上的支架Y蛋白融合的vNAR的拷贝。在一些方面,EV(例如,外泌体)包含至少约1000个与EV(例如,外泌体)腔表面上的支架Y蛋白融合的vNAR的拷贝。
本公开的某些方面涉及将高密度的靶向部分装载到EV(例如,外泌体)的腔表面上的方法,所述方法包括将一个或多个单结构域抗原结合部分与EV支架蛋白融合。在一些方面,本文所公开的方法允许产生EV(例如,外泌体),所述EV在EV腔表面上的单结构域抗原结合部分的密度为至少约100个拷贝/EV、至少约150个拷贝/EV、至少约200个拷贝/EV、至少约250个拷贝/EV、至少约300个拷贝/EV、至少约350个拷贝/EV、至少约400个拷贝/EV、至少约450个拷贝/EV、至少约500个拷贝/EV、至少约600个拷贝/EV、至少约700个拷贝/EV、至少约800个拷贝/EV、至少约900个拷贝/EV、至少约1000个拷贝/EV、至少约1250个拷贝/EV、至少约1500个拷贝/EV、至少约2000个拷贝/EV、至少约2500个拷贝/EV、至少约3000个拷贝/EV、至少约3500个拷贝/EV、至少约4000个拷贝/EV、至少约4500个拷贝/EV或至少约5000个拷贝/EV。
在一些方面,EV包含在EV腔表面上的至少约100个单结构域抗原结合部分(例如,VHH或vNAR)的拷贝。在一些方面,EV包含在EV腔表面上的至少约150个单结构域抗原结合部分(例如,VHH或vNAR)的拷贝。在一些方面,EV包含在EV腔表面上的至少约200个单结构域抗原结合部分(例如,VHH或vNAR)的拷贝。在一些方面,EV包含在EV腔表面上的至少约250个单结构域抗原结合部分(例如,VHH或vNAR)的拷贝。在一些方面,EV包含在EV腔表面上的至少约300个单结构域抗原结合部分(例如,VHH或vNAR)的拷贝。在一些方面,EV包含在EV腔表面上的至少约350个单结构域抗原结合部分(例如,VHH或vNAR)的拷贝。在一些方面,EV包含在EV腔表面上的至少约400个单结构域抗原结合部分(例如,VHH或vNAR)的拷贝。在一些方面,EV包含在EV腔表面上的至少约450个单结构域抗原结合部分(例如,VHH或vNAR)的拷贝。在一些方面,EV包含在EV腔表面上的至少约500个单结构域抗原结合部分(例如,VHH或vNAR)的拷贝。在一些方面,EV包含在EV腔表面上的至少约600个单结构域抗原结合部分(例如,VHH或vNAR)的拷贝。在一些方面,EV包含在EV腔表面上的至少约700个单结构域抗原结合部分(例如,VHH或vNAR)的拷贝。在一些方面,EV包含在EV腔表面上的至少约800个单结构域抗原结合部分(例如,VHH或vNAR)的拷贝。在一些方面,EV包含在EV腔表面上的至少约900个单结构域抗原结合部分(例如,VHH或vNAR)的拷贝。在一些方面,EV包含在EV腔表面上的至少约1000个单结构域抗原结合部分(例如,VHH或vNAR)的拷贝。在一些方面,EV包含在EV腔表面上的至少约1100个单结构域抗原结合部分(例如,VHH或vNAR)的拷贝。在一些方面,EV包含在EV腔表面上的至少约1200个单结构域抗原结合部分(例如,VHH或vNAR)的拷贝。在一些方面,EV包含在EV腔表面上的至少约1300个单结构域抗原结合部分(例如,VHH或vNAR)的拷贝。在一些方面,EV包含在EV腔表面上的至少约1400个单结构域抗原结合部分(例如,VHH或vNAR)的拷贝。在一些方面,EV包含在EV腔表面上的至少约1500个单结构域抗原结合部分(例如,VHH或vNAR)的拷贝。在一些方面,EV包含在EV腔表面上的至少约1600个单结构域抗原结合部分(例如,VHH或vNAR)的拷贝。在一些方面,EV包含在EV腔表面上的至少约1700个单结构域抗原结合部分(例如,VHH或vNAR)的拷贝。在一些方面,EV包含在EV腔表面上的至少约1800个单结构域抗原结合部分(例如,VHH或vNAR)的拷贝。在一些方面,EV包含在EV腔表面上的至少约1900个单结构域抗原结合部分(例如,VHH或vNAR)的拷贝。在一些方面,EV包含在EV腔表面上的至少约2000个单结构域抗原结合部分(例如,VHH或vNAR)的拷贝。在一些方面,EV包含在EV腔表面上的至少约2250个单结构域抗原结合部分(例如,VHH或vNAR)的拷贝。在一些方面,EV包含在EV腔表面上的至少约2500个单结构域抗原结合部分(例如,VHH或vNAR)的拷贝。在一些方面,EV包含在EV腔表面上的至少约2750个单结构域抗原结合部分(例如,VHH或vNAR)的拷贝。在一些方面,EV包含在EV腔表面上的至少约3000个单结构域抗原结合部分(例如,VHH或vNAR)的拷贝。在一些方面,EV包含在EV腔表面上的至少约3250个单结构域抗原结合部分(例如,VHH或vNAR)的拷贝。在一些方面,EV包含在EV腔表面上的至少约3500个单结构域抗原结合部分(例如,VHH或vNAR)的拷贝。在一些方面,EV包含在EV腔表面上的至少约3750个单结构域抗原结合部分(例如,VHH或vNAR)的拷贝。在一些方面,EV包含在EV腔表面上的至少约4000个单结构域抗原结合部分(例如,VHH或vNAR)的拷贝。在一些方面,EV包含在EV腔表面上的至少约4250个单结构域抗原结合部分(例如,VHH或vNAR)的拷贝。在一些方面,EV包含在EV腔表面上的至少约4500个单结构域抗原结合部分(例如,VHH或vNAR)的拷贝。在一些方面,EV包含在EV腔表面上的至少约4750个单结构域抗原结合部分(例如,VHH或vNAR)的拷贝。在一些方面,EV包含在EV腔表面上的至少约5000个单结构域抗原结合部分(例如,VHH或vNAR)的拷贝。
在一些方面,EV(例如,外泌体)包含的单结构域抗原结合部分的拷贝数是使用类似技术装载到EV上的常规抗体的拷贝数的至少约2倍。在一些方面,EV(例如,外泌体)包含的单结构域抗原结合部分的拷贝数是使用类似技术装载到EV上的常规抗体的拷贝数的至少约3倍。在一些方面,EV(例如,外泌体)包含的单结构域抗原结合部分的拷贝数是使用类似技术装载到EV上的常规抗体的拷贝数的至少约4倍。在一些方面,EV(例如,外泌体)包含的单结构域抗原结合部分的拷贝数是使用类似技术装载到EV上的常规抗体的拷贝数的至少约5倍。在一些方面,EV(例如,外泌体)包含的单结构域抗原结合部分的拷贝数是使用类似技术装载到EV上的常规抗体的拷贝数的至少约10倍。在一些方面,EV(例如,外泌体)包含的单结构域抗原结合部分的拷贝数是使用类似技术装载到EV上的常规抗体的拷贝数的至少约15倍。在一些方面,EV(例如,外泌体)包含的单结构域抗原结合部分的拷贝数是使用类似技术装载到EV上的常规抗体的拷贝数的至少约20倍。在一些方面,EV(例如,外泌体)包含的单结构域抗原结合部分的拷贝数是使用类似技术装载到EV上的常规抗体的拷贝数的至少约25倍。在一些方面,EV(例如,外泌体)包含的单结构域抗原结合部分的拷贝数是使用类似技术装载到EV上的常规抗体的拷贝数的至少约30倍。在一些方面,EV(例如,外泌体)包含的单结构域抗原结合部分的拷贝数是使用类似技术装载到EV上的常规抗体的拷贝数的至少约35倍。在一些方面,EV(例如,外泌体)包含的单结构域抗原结合部分的拷贝数是使用类似技术装载到EV上的常规抗体的拷贝数的至少约40倍。在一些方面,EV(例如,外泌体)包含的单结构域抗原结合部分的拷贝数是使用类似技术装载到EV上的常规抗体的拷贝数的至少约45倍。在一些方面,EV(例如,外泌体)包含的单结构域抗原结合部分的拷贝数是使用类似技术装载到EV上的常规抗体的拷贝数的至少约50倍。
在一些方面,单结构域抗原结合部分可结合至本文所公开的任何靶抗原。如本文所述,在一些方面,单结构域抗原结合部分结合至间皮素。因此,在某些方面,本公开的EV(例如,外泌体)包含靶向KRAS转录物(例如,KRAS G12D mRNA)的ASO和与间皮素结合的单结构域抗原结合部分。在一些方面,单结构域抗原结合部分是VHH。在一些方面,单结构域抗原结合部分是单链Fab(scFab)。在一些方面,ASO通过接头(例如,TEG接头)与胆固醇缀合。在一些方面,ASO、单结构域抗原结合部分或两者直接连接至EV(例如,外泌体)的外表面。在一些方面,ASO、单结构域抗原结合部分或两者使用支架部分(例如,支架X,例如PTGFRN)连接至EV(例如,外泌体))的外表面。
III.D.1.具有修饰的靶向能力的EV(例如,外泌体)
如本文所述,本公开的EV(例如,外泌体)(例如,包含靶向KRAS转录物的ASO)可被工程化以调节其性质(例如,生物分布),例如,通过免疫亲和配体或同源受体配体的结合。例如,本文所述的EV(例如,外泌体)可被工程化以将它们引导至特定的细胞类型,例如,胰腺细胞、结肠直肠细胞、肺细胞、子宫细胞、胃细胞、睾丸生殖细胞、卵巢细胞、食道细胞、膀胱细胞、宫颈细胞、皮肤细胞、肝细胞、乳腺细胞、前列腺细胞、雪旺氏细胞、感觉神经元、运动神经元、脑膜巨噬细胞、肿瘤细胞或它们的组合。在某些方面,本公开的EV(例如,外泌体)被工程化以将它们引导至胰腺细胞、结肠直肠细胞、肺细胞以及它们的组合。在某些方面,本文所述的EV(例如,外泌体)可被工程化以增强它们向特定隔室的迁移,例如,迁移至CNS(为了改善鞘内隔室保留)或迁移至肿瘤微环境。
在一些方面,EV(例如,外泌体)包含(i)本文所公开的ASO和(ii)生物分布调节剂或靶向部分。在一些方面,生物分布调节剂或靶向部分包含单结构域抗原结合部分,例如VHH和/或vNAR。在本公开别处提供了与此类单结构域抗原结合部分有关的其他公开内容。如本文所用,术语“生物分布调节剂”和“靶向部分”可互换使用,是指可以在体内或体外(例如,在不同品种细胞的混合培养物中)调节细胞外囊泡(例如,外泌体、纳米囊泡)的分布的剂。在一些方面,靶向部分改变EV(例如,外泌体)的向性,即,靶部分是“向性部分”。如本文所用,术语“向性部分”是指当在EV(例如,外泌体)上表达时改变和/或增强EV的自然运动的靶向部分。例如,在一些方面,向性部分可促进EV(例如,外泌体)被特定细胞、组织或器官(例如,胰腺细胞)摄取。因此,除非另外指明,否则在一些方面,术语“靶向部分”和“向性部分”可互换使用。
在一些方面,本文所述的EV(例如,外泌体)在离散的细胞类型和组织中表现出优先摄取,并且可通过在其表面添加与靶细胞表面上的受体相互作用的蛋白质来指导它们的向性。向性部分可包含生物分子,诸如蛋白质、肽、脂质或碳水化合物,或合成分子。例如,在一些方面,向性部分可包含亲和配体,例如,抗体(诸如抗CD19纳米抗体、抗CD22纳米抗体、抗CLEC9A纳米抗体或抗CD3纳米抗体)、VHH结构域、噬菌体展示肽、纤连蛋白结构域、骆驼纳米抗体和/或vNAR。在一些方面,向性部分可包含例如合成聚合物(例如,PEG)、天然配体/分子(例如,CD40L、白蛋白、CD47、CD24、CD55、CD59)和/或重组蛋白(例如,XTEN)。
在一些方面,向性部分可增加细胞对EV(例如,外泌体)的摄取。在一些方面,可增加细胞对EV(例如,外泌体)的摄取的向性部分包含淋巴细胞抗原75(也称为DEC205或CD205)、C型凝集素结构域家族9成员A(CLEC9A)、C型凝集素结构域家族6(CLEC6)、C型凝集素结构域家族4成员A(也称为DCIR或CLEC4A)、树突状细胞特异性细胞间粘附分子-3-抓取非整联蛋白(也称为DC-SIGN或CD209)、凝集素型氧化LDL受体1(LOX-1)、具有胶原结构的巨噬细胞受体(MARCO)、C型凝集素结构域家族12成员A(CLEC12A)、C型凝集素结构域家族10成员A(CLEC10A)、DC-脱唾液酸糖蛋白受体(DC-ASGPR)、DC免疫受体2(DCIR2)、Dectin-1、巨噬细胞甘露糖受体(MMR)、BDCA-2(CD303、CLEC4C)、Dectin-2、BST-2(CD317)、Langerin、CD206、CD11b、CD11c、CD123、CD304、XCR1、AXL、SIGLEC 6、CD209、SIRPA、CX3CR1、GPR182、CD14、CD16、CD32、CD34、CD38、CD10、抗CD3抗体或它们的任何组合。
在一些方面,当对胰腺的向性是所期望的时,本文所述的EV(例如,外泌体)可被修饰以包含增加EV(例如,外泌体)对胰腺内特定隔室或胰腺细胞的向性的组织或细胞特异性靶配体。在一些方面,当对结肠直肠组织的向性是所期望的时,本文所述的EV(例如,外泌体)可被修饰以包含增加EV(例如,外泌体)对结肠直肠组织内特定隔室或结肠直肠细胞的向性的组织或细胞特异性靶配体。在一些方面,当对肺的向性是所期望的时,本文所述的EV(例如,外泌体)可被修饰以包含增加EV(例如,外泌体)对肺组织内特定隔室或肺细胞的向性的组织或细胞特异性靶配体。
在一些方面,当对中枢神经系统(CNS)的向性是所期望的时,本公开的EV(例如,外泌体)可包含增加EV(例如,外泌体)对特定中枢神经系统组织或细胞的向性的组织或细胞特异性靶配体。在一些方面,细胞是神经胶质细胞。在一些方面,神经胶质细胞是少突胶质细胞、星形胶质细胞、室管膜细胞、小神经胶质细胞、雪旺氏细胞、卫星神经胶质细胞、嗅鞘细胞或它们的组合。在一些方面,细胞是神经干细胞。在一些方面,细胞是感觉神经元。
在一些方面,增加EV(例如,外泌体)对雪旺氏细胞的向性的细胞特异性靶配体(即,靶向/向性部分)结合至雪旺氏细胞表面标志物,诸如髓鞘碱性蛋白(MBP)、髓鞘蛋白零(P0)、P75NTR、NCAM、PMP22、转铁蛋白受体(TfR)(例如,TfR1或TfR2)、载脂蛋白D(ApoD)、半乳凝素1(LGALS1)、髓磷蛋白脂蛋白(PLP)、磷脂酰肌醇蛋白聚糖-1、多配体聚糖-3或它们的任何组合。在一些方面,细胞特异性向性部分包含抗体或其抗原结合部分、适体或在雪旺氏细胞表面上表达的受体的激动剂或拮抗剂。在一些方面,增加EV(例如,外泌体)对雪旺氏细胞的向性的靶向部分包含转铁蛋白(或其变体和/或片段)。可用于本公开的转铁蛋白的非限制性实例包括血清转铁蛋白、乳转铁蛋白(乳铁蛋白)、卵转铁蛋白、黑素转铁蛋白以及它们的组合。在一些方面,可靶向转铁蛋白受体的向性部分包含抗转铁蛋白受体可变新抗原受体(vNAR),例如具有一般基序结构的结合域(FW1-CDR1-FW2-3-CDR3-FW4)。参见,例如,US2017/0348416,其以引用方式整体并入本文。在一些方面,可用作靶向部分的靶向转铁蛋白受体的抗体包括US 2019/0202936中描述的低亲和力抗转铁蛋白受体抗体,所述专利以引用方式整体并入本文。
在一些方面,增加EV(例如,外泌体)对CNS的向性的靶向部分与感觉神经元上表达的配体结合。例如,在某些方面,靶向部分结合原肌球蛋白受体激酶(Trk)受体(例如,TrkA、TrkB、TrkC或它们的组合)。在一些方面,结合Trk受体的靶向部分包含神经营养因子。神经营养因子的非限制性实例包括神经生长因子(NGF)、脑源性神经营养因子(BDNF)、神经营养因子-3(NT-3)、神经营养因子-4(NT-415)、神经营养因子-6(NT-5)、成纤维细胞生长因子(FGF)-2和其他FGF、促红细胞生成素(EPO)、肝细胞生长因子(HGF)、表皮生长因子(EGF)、转化生长因子(TGF)-α、TGF-β、血管内皮生长因子(VEGF)、白介素-1受体拮抗剂(IL-lra)、睫状神经营养因子(CNTF)、神经胶质源性神经营养因子(GDNF)、神经秩蛋白(neurturin)、血小板源性生长因子(PDGF)、调蛋白、神经调节蛋白、artemin、persephin、白介素、粒细胞集落刺激因子(CSF)、粒细胞-巨噬细胞-CSF、netrins(神经生长因子)、心脏营养蛋白-1、刺猬(hedgehogs)、白血病抑制因子(LIF)、中期因子(midlcine)、多效生长因子、骨形态发生蛋白(BMP)、netrins(神经生长因子)、鞘脂酶激活蛋白(saposins)、信号素(semaphorins)和干细胞因子(SCF),包括其片段和/或变体,以及它们的组合。参见,例如,US 8,053,569;Leibrock,J.等人,Nature,341:149-152(1989);Ernfors,P.等人,Neuron 1:983-996(1990);Ibanez等人,EMBO J.,10,2105-2110,(1991);LeSauteur等人J.Biol.Chem.270,6564-6569(1995);Longo等人,J.Neurosci.Res.,48,1-17(1997);所述文献各自以引用方式并入本文。在一些方面,可与Trk受体结合的靶向部分包含单克隆抗体5C3、MC192或两者,如例如,Kramer等人,Eur.J.Cancer,33,2090-2091,(1997),其以引用方式整体并入本文。在一些方面,增加EV(例如,外泌体)对感觉神经元的向性的靶向部分包含水痘带状疱疹病毒(VZV)肽。
在一些方面,增加EV(例如,外泌体)对CNS的向性的靶向部分与运动神经元上表达的配体结合。此类靶向部分的非限制性实例包括狂犬病病毒糖蛋白(RVG)肽、靶向轴突输入(TAxI)肽、P75R肽、Tet-C肽或它们的组合。参见,例如,US 2014/00294727;US 9,757,470;US 9,056,892;Sellers等人,Proc.Natl.Acad.Sci.USA 113:2514-2519(2016);其各自以引用方式整体并入本文。在一些方面,可用于本公开的靶向部分包含表8(下文)中提供的肽BBB梭。参见,例如,Oller-Salvia等人(2016)Chem.Soc.Rev.45,4690-4707和Jafari等人(2019)Expert Opinion on Drug Delivery 16:583-605,其各自以引用方式整体并入本文。
表8.肽BBB梭
环肽(&)的命名法适应于Spengler等人.Pept.Res.,2005,65,550–555所描述的三字母氨基酸代码。
[Dap]代表二氨基丙酸
在一些方面,当对肿瘤细胞和/或肿瘤微环境的向性是所期望的时,本文所述的EV(例如,外泌体)可被修饰以包含结合在肿瘤细胞和/或肿瘤微环境上表达的抗原的靶向部分。从本公开将显而易见,在一些方面,与没有靶向部分的对应EV相比,此类靶向部分增加了EV(例如,外泌体)对肿瘤细胞和/或肿瘤微环境的向性。
在一些方面,靶向部分包含与间皮素或其片段结合的抗原结合部分。本领域中已知的能够与间皮素或其片段结合的任何抗原结合部分都可与本文所公开的EV(例如,包含对KRAS G12D mRNA具特异性的ASO的外泌体)一起使用。
间皮素是一种膜锚定蛋白,其在肺间皮细胞中表达,在心脏、胎盘和肾脏中低水平表达,间皮素可能参与细胞粘附。间皮素也在间皮瘤、卵巢癌和一些鳞状细胞癌的肿瘤细胞中表达,使间皮素成为可能的肿瘤抗原靶标。间皮素的序列在本领域中是已知的。例如,人间皮素的规范氨基酸序列一SEQ ID NO:91(UniProt标识号:Q13421-1)示出。存在至少三种人间皮素同种型,它们是可变剪接的结果:(i)同种型2(UniProt标识号:Q13421-3;SEQ IDNO:92);(ii)同种型3(UniProt标识号:Q13421-2;SEQ ID NO:93);(iii)同种型4(UniProt标识号:Q13421-4;SEQ ID NO:94)。在一些方面,本文所公开的靶向部分能够结合至本文所公开的一种或多种人间皮素蛋白。
原则上,包含ASO和至少一个向性部分的本公开的EV(例如,外泌体)可使用本领域中已知的任何合适的施用方法(例如,静脉内注射或输注)来施用,因为向性部分的存在(单独或与抗吞噬信号(诸如CD47)的存在和特定施用途径的使用组合)将诱导EV(例如,外泌体)朝向所期望的靶细胞或组织(例如,胰腺、结肠直肠组织或肺)的向性。
在某些方面,向性部分连接(例如,经由马来酰亚胺部分化学连接)至EV(例如,外泌体)外表面上的支架部分,例如支架X蛋白或其片段。向性可以通过将抗吞噬信号(例如,CD47和/或CD24)、半衰期延长部分(例如,白蛋白或PEG)或它们的任何组合连接至本公开的EV(例如,外泌体)的外表面来进一步改善。在某些方面,抗吞噬信号连接(例如,经由马来酰亚胺部分化学连接)至EV(例如,外泌体)外表面上的支架部分,例如支架X蛋白或其片段。
还可以通过选择合适的施用途径(例如,鞘内施用或眼内施用,以改善对中枢神经系统的向性)来实现药代动力学、生物分布,特别是向性和在所期望的组织或解剖位置中的滞留。
在一些方面,EV(例如,外泌体)包含至少两个不同的向性部分。在一些方面,EV(例如,外泌体)包含至少三个不同的向性部分。在一些方面,EV(例如,外泌体)包含至少四个不同的向性部分。在一些方面,EV(例如,外泌体)包含五个或更多个不同的向性部分。在一些方面,向性部分中的一个或多个增加细胞对EV(例如,外泌体)的摄取。在一些方面,每个向性部分连接至支架部分,例如支架X蛋白或其片段。在一些方面,多个向性部分可连接至相同的支架部分,例如支架X蛋白或其片段。在一些方面,若干向性部分可串联连接至支架部分,例如支架X蛋白或其片段。在一些方面,本文所公开的向性部分或它们的组合通过接头或间隔子连接至支架部分,例如支架X蛋白或其片段。在一些方面,接头或间隔子或它们的组合插置在两个本文所公开的向性部分之间。
下文公开了能够将本公开的EV(例如,外泌体)引导至不同神经系统细胞类型的向性部分的非限制性实例。
III.E.抗吞噬信号
身体的免疫系统清除所施用的EV(例如,外泌体)会降低所施用的EV(例如,外泌体)疗法的功效。在一些方面,EV(例如,外泌体)的表面被修饰以限制或阻断免疫系统的细胞(例如,巨噬细胞)对EV(例如,外泌体)的摄取。在一些方面,EV(例如,外泌体)的表面被修饰以表达一种或多种抑制巨噬细胞对EV(例如,外泌体)的摄取的表面抗原。在一些方面,表面抗原与EV(例如,外泌体)的外表面缔合。
可用于本公开的表面抗原包括但不限于将细胞标记为“自身”细胞的抗原。在一些方面,表面抗原包含抗吞噬信号。在一些方面,抗吞噬信号选自CD47、CD24、其片段以及它们的任何组合。在某些方面,抗吞噬信号包含CD24,例如人CD24。在一些方面,抗吞噬信号包含CD24的片段,例如人CD24。在某些方面,EV(例如,外泌体)被修饰以在EV(例如,外泌体)的外表面上表达CD47或其片段。
如本文所用,CD47,也称为白细胞表面抗原CD47和整联蛋白相关蛋白(IAP),是在体内许多细胞上发现的跨膜蛋白。CD47通常被称为“不要吃我”信号,因为它向免疫细胞,特别是骨髓细胞发出信号,表明表达CD47的特定细胞不是外来细胞。CD47是SIRPA的受体,与其结合可防止未成熟树突状细胞成熟并抑制成熟树突状细胞产生细胞因子。CD47与SIRPG的相互作用介导细胞-细胞粘附,增强超抗原依赖性T细胞介导的增殖并共同刺激T细胞活化。还已知CD47通过作为血小板上THBS1的粘附受体在细胞粘附中起作用,并且在整联蛋白的调节中起作用。CD47在海马体的记忆形成和突触可塑性中也起着重要作用(通过相似性)。此外,CD47可在膜转运和/或整联蛋白依赖性信号转导中发挥作用,防止红细胞过早清除,并参与病毒感染后诱导的膜通透性变化。
在一些方面,本文所公开的EV(例如,外泌体)被修饰以在EV(例如,外泌体)的表面上表达人CD47。人CD47和各种已知同种型的规范氨基酸序列显示在表9中(UniProtKB-Q08722;SEQ ID NO:629-632)。在一些方面,EV(例如,外泌体)被修饰以表达包含SEQ IDNO:629所示氨基酸序列或其片段的多肽。在一些方面,EV(例如,外泌体)被修饰以表达包含SEQ ID NO:630所示氨基酸序列或其片段的多肽。在一些方面,EV(例如,外泌体)被修饰以表达包含SEQ ID NO:631所示氨基酸序列或其片段的多肽。在一些方面,EV(例如,外泌体)被修饰以表达包含SEQ ID NO:632所示氨基酸序列或其片段的多肽。
表9:人CD47氨基酸序列
在一些方面,EV(例如,外泌体)被修饰以在EV(例如,外泌体)的表面上表达全长CD47。在一些方面,EV(例如,外泌体)被修饰以在EV(例如,外泌体)的表面上表达CD47的片段,其中所述片段包含CD47(例如人CD47)的细胞外结构域。保留阻断和/或抑制巨噬细胞吞噬作用的能力的任何CD47片段都可用于本文所公开的EV(例如,外泌体)。在一些方面,所述片段包含规范人CD47序列的氨基酸19至约141(例如,SEQ ID NO 629的氨基酸19-141)。在一些方面,所述片段包含规范人CD47序列的氨基酸19至约135(例如,SEQ ID NO 629的氨基酸19-135)。在一些方面,所述片段包含规范人CD47序列的氨基酸19至约130(例如,SEQ IDNO 629的氨基酸19-130)。在一些方面,所述片段包含规范人CD47序列的氨基酸19至约125(例如,SEQ ID NO 629的氨基酸19-125)。
在一些方面,EV(例如,外泌体)被修饰以表达与规范人CD47序列的氨基酸19至约141(例如,SEQ ID NO 629的氨基酸19-141)具有至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的多肽。在一些方面,EV(例如,外泌体)被修饰以表达与规范人CD47序列的氨基酸19至约135(例如,SEQ ID NO 629的氨基酸19-135)具有至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的多肽。在一些方面,EV(例如,外泌体)被修饰以表达与规范人CD47序列的氨基酸19至约130(例如,SEQ ID NO 629的氨基酸19-130)具有至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的多肽。在一些方面,EV(例如,外泌体)被修饰以表达与规范人CD47序列的氨基酸19至约125(例如,SEQ ID NO 629的氨基酸19-125)具有至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的多肽。
在一些方面,CD47或其片段被修饰以增加CD47及其配体SIRPα的亲和力。在一些方面,CD47的片段包含Velcro-CD47(参见,例如,Ho等人,JBC 290:12650-63(2015),其以引用方式整体并入本文)。在一些方面,Velcro-CD47包含相对于野生型人CD47序列(SEQ ID NO:629)的C15S取代。
在一些方面,EV(例如,外泌体)包含在EV(例如,外泌体)的表面上以高于未修饰的EV(例如,外泌体)的水平表达的CD47或其片段。在一些方面,CD47或其片段与支架蛋白融合。本文所公开的任何支架蛋白均可用于在EV(例如,外泌体)的表面上表达CD47或其片段。在一些方面,EV(例如,外泌体)被修饰以表达与支架X蛋白的N末端融合的CD47的片段。在一些方面,EV(例如,外泌体)被修饰以表达与PTGFRN的N末端融合的CD47的片段。
在一些方面,EV(例如,外泌体)包含在EV(例如,外泌体)的表面上的至少约20个分子、至少约30个分子、至少约40个、至少约50个、至少约75个、至少约100个、至少约125个、至少约150个、至少约200个、至少约250个、至少约300个、至少约350个、至少约400个、至少约450个、至少约500个、至少约750个或至少约1000个CD47分子。在一些方面,EV(例如,外泌体)包含在EV(例如,外泌体)的表面上的至少约20个CD47分子。在一些方面,EV(例如,外泌体)包含在EV(例如,外泌体)的表面上的至少约30个CD47分子。在一些方面,EV(例如,外泌体)包含在EV(例如,外泌体)的表面上的至少约40个CD47分子。在一些方面,EV(例如,外泌体)包含在EV(例如,外泌体)的表面上的至少约50个CD47分子。在一些方面,EV(例如,外泌体)包含在EV(例如,外泌体)的表面上的至少约100个CD47分子。在一些方面,EV(例如,外泌体)包含在EV(例如,外泌体)的表面上的至少约200个CD47分子。在一些方面,EV(例如,外泌体)包含在EV(例如,外泌体)的表面上的至少约300个CD47分子。在一些方面,EV(例如,外泌体)包含在EV(例如,外泌体)的表面上的至少约400个CD47分子。在一些方面,EV(例如,外泌体)包含在EV(例如,外泌体)的表面上的至少约500个CD47分子。在一些方面,EV(例如,外泌体)包含在EV(例如,外泌体)的表面上的至少约1000个CD47分子。
在一些方面,与不表达CD47或其片段的EV(例如,外泌体)相比,在EV(例如,外泌体)的表面上表达CD47或其片段导致骨髓细胞对EV(例如,外泌体)的摄取减少。在一些方面,相对于骨髓细胞对不表达CD47或其片段的EV(例如,外泌体)的摄取,骨髓细胞对表达CD47或其片段的EV(例如,外泌体)的摄取减少至少约5%、至少约10%、至少约15%、至少约20%、至少约25%、至少约30%、至少约35%、至少约40%、至少约45%、至少约50%、至少约60%、至少约70%、至少约80%、至少约90%或至少约95%。
在一些方面,与不表达CD47或其片段的EV(例如,外泌体)相比,在EV(例如,外泌体)的表面上表达CD47或其片段导致EV(例如,外泌体)到肝脏的定位减少。在一些方面,相对于不表达CD47或其片段的EV(例如,外泌体)到肝脏的定位,表达CD47或其片段的EV(例如,外泌体)到肝脏的定位减少至少约5%、至少约10%、至少约15%、至少约20%、至少约25%、至少约30%、至少约35%、至少约40%、至少约45%、至少约50%、至少约60%、至少约70%、至少约80%、至少约90%或至少约95%。
在一些方面,相对于不表达CD47或其片段的EV(例如,外泌体)的体内半衰期,表达CD47或其片段的EV(例如,外泌体)的体内半衰期增加。在一些方面,相对于不表达CD47或其片段的EV(例如,外泌体)的体内半衰期,表达CD47或其片段的EV(例如,外泌体)的体内半衰期增加至少约1.5倍、至少约2倍、至少约2.5倍、至少约3倍、至少约3.5倍、至少约4倍、至少约4.5倍、至少约5倍、至少约6倍、至少约7倍、至少约为8倍、至少约9倍或至少约10倍。
在一些方面,相对于不表达CD47或其片段的EV(例如,外泌体)在循环(例如,血浆)中的保留,表达CD47或其片段的EV(例如,外泌体)在循环(例如血浆)中的保留增加。在一些方面,相对于不表达CD47或其片段的EV(例如,外泌体)在循环(例如,血浆)中的保留,表达CD47或其片段的EV(例如,外泌体)在循环(例如,血浆)中的保留增加至少约1.5倍、至少约2倍、至少约2.5倍、至少约3倍、至少约3.5倍、至少约4倍、至少约4.5倍、至少约5倍、至少约6倍、至少约7倍、至少约8倍、至少约9倍或至少约10倍。
在一些方面,与不表达CD47或其片段的外泌体相比,表达CD47或其片段的EV(例如,外泌体)具有改变的生物分布。在一些方面,改变的生物分布导致内皮细胞、T细胞的摄取增加,或各种组织中的积聚增加,所述组织包括但不限于肝、心、肺、脑、肾、中枢神经系统、外周神经系统、脑脊髓液(CSF)、肌肉(例如,骨骼肌、心肌)、骨、骨髓、血液、脾脏、淋巴结、胃、食道、膈膜、膀胱、结肠、胰腺、甲状腺、唾液腺、肾上腺、垂体、乳腺、皮肤、卵巢、子宫、前列腺、睾丸、子宫颈或它们的任何组合。
IV.用于生产工程化外泌体的生产细胞
本公开的EV(例如,外泌体)可从体外生长的细胞或受试者的体液中产生。当从体外细胞培养物产生外泌体时,可使用各种生产细胞,例如HEK293细胞、CHO细胞和MSC。在某些方面,生产细胞不是树突细胞、巨噬细胞、B细胞、肥大细胞、嗜中性粒细胞、Kupffer-Browicz细胞、源自这些细胞中的任一者的细胞或它们的任何组合。
在一些方面,生产细胞是人胚肾293细胞。人胚肾293细胞,通常也称为HEK 293、HEK-293、293细胞,或更准确地说是HEK细胞,是最初源自在组织培养物中生长的人胚肾细胞的特定细胞系。
HEK 293细胞是1973年在荷兰莱顿的Alex van der Eb实验室通过用剪切的腺病毒5DNA转染正常人胚胎肾细胞培养物而产生的。培养细胞并用腺病毒转染。随后的分析表明,这种转化是通过从病毒基因组的左臂插入约4.5千碱基来实现的,所述基因组被并入人第19号染色体中。
对HEK 293和五个衍生细胞系的基因组和转录组的综合研究将HEK 293转录组与人肾、肾上腺、垂体和中枢神经组织的转录组进行了比较。HEK 293模式与肾上腺细胞最相似,肾上腺细胞具有许多神经元性质。
HEK 293细胞具有复杂的核型,每条染色体有两个或更多个拷贝,染色体模态数为64。它们被描述为亚三倍体,包含的染色体数量不到人单倍体配子的三倍。染色体异常包括总共三个拷贝的X染色体和四个拷贝的17号染色体和22号染色体。
可用于生产EV的HEK293细胞的变体包括但不限于HEK 293F、HEK 293FT和HEK293T。
可对生产细胞进行遗传修饰以包含编码ASO的外源序列从而生产本文所述的EV。遗传修饰的生产细胞可通过瞬时或稳定转化包含外源序列。外源序列可转化为质粒。在一些方面,外源序列是载体。可将外源序列在靶位点或随机位点稳定地整合到生产细胞的基因组序列中。在一些方面,产生稳定的细胞系用于产生腔工程化的外泌体。
可将外源序列插入到生产细胞的基因组序列中,位于编码外泌体蛋白的内源序列内、其上游(5’端)或下游(3’端)。可将本领域已知的各种方法用于将外源序列引入生产细胞。例如,使用各种基因编辑方法(例如,使用同源重组、转座子介导系统、loxP-Cre系统、CRISPR/Cas9或TALEN的方法)修饰的细胞在本公开的范围内。
外源序列可包含编码本文所公开的支架部分或其片段或变体的序列。可引入编码支架部分的序列的额外拷贝以产生本文所述的外泌体(例如,在EV例如外泌体的表面或腔表面上具有更高密度的支架部分)。可引入编码支架部分的修饰或片段的外源序列以产生含有支架部分的修饰或片段的腔工程化和/或表面工程化的外泌体。
在一些方面,可对生产细胞进行修饰,例如,用一种或多种编码连接至ASO的支架部分的载体转染。
在一些方面,本公开的EV(例如,外泌体)(例如,表面工程化和/或腔工程化的外泌体)可由用编码本文所公开的全长成熟支架部分或连接至ASO的支架部分的序列转化的细胞产生。本文所述的支架部分中的任一种都可以从质粒、插入基因组中的外源序列或其他外源核酸诸如合成信使RNA(mRNA)中表达。
V.药物组合物
本文提供了药物组合物,所述药物组合物包含具有所需纯度的本公开的EV(例如,外泌体),以及药学上可接受的载剂或赋形剂,所述药物组合物呈适合施用于受试者的形式。药学上可接受的赋形剂或载体部分可以由所施用的特定组合物以及由用于施用组合物的特定方法决定。因此,存在多种多样的包含多个细胞外囊泡的药物组合物的合适制剂。(参见例如Remington's Pharmaceutical Sciences,Mack Publishing Co.,Easton,Pa.第21版(2005))。药物组合物通常是无菌配制的,完全符合美国食品和药物管理局的所有良好生产规范(GMP)规程。
在一些方面,药物组合物包含一种或多种治疗剂和本文所述的外泌体。在某些方面,EV(例如,外泌体)与一种或多种另外的治疗剂在药学上可接受的载剂中共同施用。在一些方面,用于本公开的ASO和一种或多种另外的治疗剂可在相同的EV中施用。在其他方面,用于本公开的ASO和一种或多种另外的治疗剂在不同的EV中施用。例如,本公开包括一种药物组合物,所述药物组合物包含含有ASO的EV和含有另外的治疗剂的EV。在一些方面,包含EV(例如,外泌体)的药物组合物在施用另外的治疗剂之前施用。在其他方面,包含EV(例如,外泌体)的药物组合物在施用另外的治疗剂之后施用。在其他方面,包含EV(例如,外泌体)的药物组合物与另外的治疗剂同时施用。
可接受的载体、赋形剂或稳定剂在采用的剂量和浓度下对接受者(例如,动物或人)是无毒的,并且包括缓冲液如磷酸盐、柠檬酸盐和其他有机酸;抗氧化剂(包括抗坏血酸和甲硫氨酸);防腐剂(例如十八烷基二甲基苄基氯化铵;氯化六甲双铵;苯扎氯铵;苄索氯铵;苯酚、丁基或苄基醇;对羟基苯甲酸烷基酯如对羟基苯甲酸甲酯或对羟基苯甲酸丙酯;儿茶酚;间苯二酚;环己醇;3-戊醇;和间甲酚);低分子量(小于约10个残基)的多肽;蛋白质如血清白蛋白、明胶或免疫球蛋白;亲水性聚合物如聚乙烯吡咯烷酮;氨基酸如甘氨酸、谷氨酰胺、天冬酰胺、组氨酸、精氨酸或赖氨酸;单糖、二糖及其他碳水化合物(包括葡萄糖、甘露糖或糊精);螯合剂如EDTA;糖,诸如蔗糖、甘露糖醇、海藻糖或山梨糖醇;成盐抗衡离子如钠离子;金属络合物(如Zn-蛋白质络合物);和/或非离子型表面活性剂如TWEENTM、PLURONICSTM或聚乙二醇(PEG)。
载剂或稀释剂的实例包括但不限于水、盐水、林格氏溶液、右旋糖溶液和5%人血清白蛋白。此类介质和化合物用于药学活性物质的用途在本领域中众所周知。除非任何常规介质或化合物与本文所述的细胞外囊泡不相容,否则考虑其在组合物中的使用。还可将补充治疗剂掺入组合物中。通常,将药物组合物配制成可与其预期施用途径相容。EV(例如,外泌体)可以通过肠胃外、局部、静脉内、口服、皮下、动脉内、皮内、透皮、直肠、颅内、腹膜内、鼻内、瘤内、肌肉内途径或作为吸入剂施用。在某些方面,静脉内施用(例如通过注射)包含外泌体的药物组合物。可将EV(例如,外泌体)任选地与在治疗所述EV(例如,外泌体)所要治疗的疾病、病症或病状方面至少部分有效的其他治疗剂联合施用。
溶液或悬浮液可以包括以下组分:诸如水、盐水溶液、固定油、聚乙二醇、甘油、丙二醇或其他合成溶剂的无菌稀释剂;诸如苄醇或对羟基苯甲酸甲酯的抗菌化合物;诸如抗坏血酸或亚硫酸氢钠的抗氧化剂;诸如乙二胺四乙酸(EDTA)的螯合化合物;诸如乙酸酯、柠檬酸酯或磷酸酯的缓冲剂;以及诸如氯化钠或右旋糖的用于调整张力的化合物。pH可用诸如盐酸或氢氧化钠的酸或碱来调整。制剂可封闭在安瓿、一次性注射器或由玻璃或塑料制成的多剂量小瓶中。
适用于可注射用途的药物组合物包括无菌水溶液(如果是水溶性)或分散液和无菌散剂。对于静脉内施用,合适载体包括生理盐水、抑菌水、Cremophor ELTM(BASF,Parsippany,N.J.)或磷酸盐缓冲盐水(PBS)。组合物通常是无菌的并且具有达到容易注射的程度的流动性。载剂可以是含有例如水、乙醇、多元醇(例如甘油、丙二醇和液体聚乙二醇等)以及它们的合适混合物的溶剂或分散介质。可例如通过使用诸如卵磷脂的包衣、通过在分散液的情况下维持所需粒度以及通过使用表面活性剂来维持适当的流动性。对微生物体行动的防止可通过例如对羟基苯甲酸酯、氯丁醇、苯酚、抗坏血酸、硫柳汞等的各种抗细菌化合物和抗真菌化合物来实现。如果需要,可将例如糖、多元醇(诸如甘露糖醇、山梨糖醇)和氯化钠的等张化合物添加至组合物中。可注射组合物的延长吸收可通过在组合物中包含延迟吸收的化合物(例如,单硬脂酸铝和明胶)来实现。
可按需要,通过将有效量的EV(例如,外泌体)在合适的溶剂中与本文列举的或本领域中已知的一种或多种成分混合来制备无菌注射溶液。一般地,通过将EV(例如,外泌体)并入含有基础分散介质和任何所需其他组分的无菌媒介物中来制备分散体。在用于制备无菌注射溶液的无菌粉末的情况下,制备方法是真空干燥和冷冻干燥,所述方法从其预先无菌过滤的溶液中产生活性组分加上任何另外的所需组分的粉末。可将EV(例如,外泌体)以贮库注射或植入制剂的形式施用,所述制剂可以以允许EV(例如,外泌体)的持续或脉冲释放的方式配制。
包含外泌体的组合物的全身性施用还可通过经粘膜手段来进行。对于经粘膜施用,在制剂中使用适合于待渗透的障壁的渗透剂。此类渗透剂在本领域中是公知的,并且对于经粘膜施用,包括例如清洁剂、胆汁盐和梭链孢酸衍生物。经粘膜施用可经由使用例如鼻喷剂来实现。
在某些方面,将包含EV(例如,外泌体)的药物组合物静脉内施用于将受益于该药物组合物的受试者。在某些其他方面,例如通过淋巴管内注射或通过结节内注射(参见例如Senti等人,PNAS 105(46):17908(2008))或通过肌内注射、通过皮下施用、通过瘤内注射、通过直接注射至胸腺中或至肝脏中来将组合物施用至淋巴系统。
在某些方面,将包含外泌体的药物组合物以液体悬浮液的形式施用。在某些方面,将药物组合物以能够在施用后形成贮库的制剂的形式施用。在某些优选的方面,贮库缓慢释放EV(例如,外泌体),进入循环,或保持贮库形式。
通常,药学上可接受的组合物被高度纯化为不含污染物,具有生物相容性并且不具有毒性,并且适合于施用于受试者。如果水是载剂的组分,则水经高度纯化并且被处理为不含例如内毒素的污染物。
药学上可接受的载体可以是乳糖、右旋糖、蔗糖、山梨糖醇、甘露糖醇、淀粉、阿拉伯树胶、磷酸钙、藻酸盐、明胶、硅酸钙、微晶纤维素、聚乙烯吡咯啶酮、纤维素、水、糖浆、甲基纤维素、苯甲酸甲基羟酯、苯甲酸丙基羟酯、滑石、硬脂酸镁和/或矿物油,但不限于此。药物组合物可还包含润滑剂、润湿剂、甜味剂、香味增强剂、乳化剂、悬浮剂和/或防腐剂。
在一些方面,本文所述的药物组合物包含药学上可接受的盐。在一些方面,药学上可接受的盐包括钠盐、钾盐、铵盐或它们的任何组合。
本文所述的药物组合物包含本文所述的EV(例如,外泌体)和任选地另外的药物活性剂或治疗剂。另外的治疗剂可以是生物剂、小分子剂或核酸剂。在一些方面,另外的治疗剂是另外的KRAS拮抗剂。在一些方面,KRAS拮抗剂是本文所公开的任何KRAS拮抗剂。在一些方面,另外的KRAS拮抗剂是抗KRAS抗体。在一些方面,另外的KRAS拮抗剂是小分子。在一些方面,另外的KRAS拮抗剂是小分子。在某些方面,另外的治疗剂是抗癌疗法。此类抗癌疗法的非限制性实例包括手术疗法、化学疗法、放射疗法、冷冻疗法、激素疗法、免疫疗法或它们的组合。
在一些方面,另外的KRAS拮抗剂包含ASO。在一些方面,另外的KRAS拮抗剂包含本文所述的任何ASO。
提供了包含药物组合物的剂型,所述药物组合物包含本文所述的EV(例如,外泌体)。在一些方面,剂型被配制为液体悬浮液以用于静脉内注射。在一些方面,剂型被配制为液体悬浮液以用于瘤内注射。
在某些方面,使外泌体制剂经受例如X射线、γ射线、β粒子、α粒子、中子、质子、元素核、UV射线的放射以便损坏残余复制胜任型核酸。
在某些方面,使用超过1、5、10、15、20、25、30、35、40、50、60、70、80、90、100或超过100kGy的照射剂量使外泌体制剂经受γ照射。
在某些方面,使用超过0.1、0.5、1、5、10、15、20、25、30、35、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000、2000、3000、4000、5000、6000、7000、8000、9000、10000或超过10000mSv的照射剂量使外泌体制剂经受X射线照射。
VI.药盒
本文还提供了包含本文所述的一种或多种EV(例如,外泌体)的药盒。在一些方面,本文提供了药物包或药盒,所述药物包或药盒包括一个或多个容器,所述容器填充有本文所述的药物组合物的一种或多种成分,如本文所提供的一种或多种外泌体,任选的使用说明书。在一些方面,药盒包括本文所述的药物组合物和任何预防剂或治疗剂,诸如本文所述的那些。在一些方面,所述药盒还包括根据本文所公开的任何方法施用EV的说明书。在一些方面,所述药盒用于治疗与造血相关的疾病或疾患。在一些方面,所述药盒是诊断试剂盒。
VII.生产EV的方法
在一些方面,本公开还涉及生产本文所述的EV的方法。在一些方面,所述方法包括:从生产细胞中获得EV(例如,外泌体),其中所述生产细胞含有EV(例如,外泌体)的一种或多种组分(例如,ASO);以及任选地分离所获得的EV(例如,外泌体)。在一些方面,所述方法包括:通过引入本文所公开的EV的一种或多种组分(例如,ASO)来修饰生产细胞;从修饰的生产细胞中获得EV(例如,外泌体);以及任选地分离所获得的EV(例如,外泌体)。在另外的方面,所述方法包括:从生产细胞中获得EV;分离所获得的EV;并对分离的EV进行修饰。在某些方面,所述方法还包括将分离的EV配制成药物组合物。
VII.A.修饰生产细胞的方法
如上文所述,在一些方面,生产EV的方法包括用一个或多个部分(例如,ASO)修饰生产细胞。在某些方面,所述一个或多个部分包括ASO。在一些方面,所述一个或多个部分还包括本文所公开的支架部分(例如,支架X或支架Y)。
在一些方面,生产细胞可以是哺乳动物细胞系、植物细胞系、昆虫细胞系、真菌细胞系或原核细胞系。在某些方面,生产细胞是哺乳动物细胞系。哺乳动物细胞系的非限制性实例包括:人胚肾(HEK)细胞系、中国仓鼠卵巢(CHO)细胞系、HT-1080细胞系、海拉细胞系(HeLa cell line)、PERC-6细胞系、CEVEC细胞系、成纤维细胞系、羊水细胞系、上皮细胞系和间充质干细胞(MSC)细胞系以及它们的组合。在某些方面,哺乳动物细胞系包含HEK-293细胞、BJ人包皮成纤维细胞、fHDF成纤维细胞、AGE.神经元前体细胞、羊水细胞、脂肪间充质干细胞、RPTEC/TERT1细胞或它们的组合。在一些方面,生产细胞是原代细胞。在某些方面,原代细胞可以是原代哺乳动物细胞、原代植物细胞、原代昆虫细胞、原代真菌细胞或原代原核细胞。
在一些方面,生产细胞不是免疫细胞,诸如抗原呈递细胞、T细胞、B细胞、自然杀伤细胞(NK细胞)、巨噬细胞、T辅助细胞或调节性T细胞(Treg细胞)。在其他方面,生产细胞不是抗原呈递细胞(例如,树突状细胞、巨噬细胞、B细胞、肥大细胞、嗜中性粒细胞、Kupffer-Browicz细胞或源自任何此类细胞的细胞)。
在一些方面,一个或多个部分可以是转基因或mRNA,并且通过转染、病毒转导、电穿孔、挤出、超声处理、细胞融合或本领域技术人员已知的其他方法引入生产细胞中。
在一些方面,通过转染将一个或多个部分引入生产细胞中。在一些方面,可使用合成大分子,诸如阳离子脂质和聚合物,将一个或多个部分引入合适的生产细胞中(Papapetrou等人,Gene Therapy 12:S118-S130(2005))。在一些方面,阳离子脂质通过电荷相互作用与一个或多个部分形成复合物。在这些实施方案中的一些方面,带正电的复合物结合至带负电的细胞表面并且由细胞通过内吞作用摄取。在一些其他方面,阳离子型聚合物可用于转染生产细胞。在这些实施方案中的一些方面,阳离子型聚合物是聚乙烯亚胺(PEI)。在某些方面,诸如磷酸钙、环糊精或聚芳烃等的化学物质可用于将一个或多个部分引入生产细胞中。还可使用物理方法将一个或多个部分引入生产细胞中,所述物理方法为例如粒子介导的转染、“基因枪”、生物弹道技术(biolistics)或粒子轰击技术(Papapetrou等人,Gene Therapy 12:S118-S130(2005))。报告基因诸如β-半乳糖苷酶、氯霉素乙酰基转移酶、荧光素酶或绿色荧光蛋白可用于评估生产细胞的转染效率。
在某些方面,通过病毒转导将一个或多个部分引入生产细胞中。许多病毒可用作基因转移媒介物,包括莫洛尼鼠白血病病毒(MMLV)、腺病毒、腺相关病毒(AAV)、单纯疱疹病毒(HSV)、慢病毒和泡沫病毒(spumavirus)。病毒介导的基因转移媒介物包括基于DNA病毒诸如腺病毒、腺相关病毒和疱疹病毒的载体以及基于逆转录病毒的载体。
在某些方面,通过电穿孔将一个或多个部分引入生产细胞中。电穿孔在细胞膜中产生瞬时孔隙,允许将各种分子引入细胞中。在一些方面,可通过电穿孔将DNA和RNA以及多肽和非多肽治疗剂引入生产细胞中。
在某些方面,通过显微注射将一个或多个部分引入生产细胞中。在一些方面,可将玻璃微量移液器用于在显微水平上将一个或多个部分注射到生产细胞中。
在某些方面,通过挤出将一个或多个部分引入生产细胞中。
在某些方面,通过超声处理将一个或多个部分引入生产细胞中。在一些方面,将生产细胞暴露于高强度声波,引起细胞膜的瞬时破坏,从而允许装载一个或多个部分。
在某些方面,通过细胞融合将一个或多个部分引入生产细胞中。在一些方面,通过电细胞融合引入一个或多个部分。在其他方面,将聚乙二醇(PEG)用于融合生产细胞。在另外的方面,将仙台病毒用于融合生产细胞。
在一些方面,通过低渗裂解将一个或多个部分引入生产细胞中。在此类方面,可将生产细胞暴露于低离子强度缓冲液,使其破裂,从而允许装载一个或多个部分。在其他方面,针对低渗溶液的受控透析可用于使生产细胞膨胀并在生产细胞膜中产生孔。随后将生产细胞暴露于允许膜重新密封的条件下。
在一些方面,通过去垢剂处理将一个或多个部分引入生产细胞中。在某些方面,用温和去垢剂处理生产细胞,所述去垢剂通过产生孔而暂时损伤生产细胞膜,从而允许装载一个或多个部分。在对生产细胞进行装载后,洗掉去垢剂,从而重新密封膜。
在一些方面,通过受体介导的内吞作用将一个或多个部分引入生产细胞中。在某些方面,生产细胞具有表面受体,其在结合一个或多个部分时诱导受体和相关部分的内化。
在一些方面,通过过滤将一个或多个部分引入生产细胞中。在某些方面,可将生产细胞和一个或多个部分强制通过孔径小于生产细胞的过滤器,从而引起生产细胞膜的暂时破坏并允许一个或多个部分进入生产细胞。
在一些方面,使生产细胞经历几次冻融循环,导致细胞膜破裂,从而允许装载一个或多个部分。
VII.B.修饰EV(例如,外泌体)的方法
在一些方面,生产VE(例如,外泌体)的方法包括通过将一个或多个部分直接引入EV中来修饰分离的EV。在某些方面,所述一个或多个部分包括ASO。在一些方面,所述一个或多个部分包括本文所公开的支架部分(例如,支架X或支架Y)。
在某些方面,通过转染将一个或多个部分引入EV中。在一些方面,可以使用合成大分子(诸如阳离子型脂质和聚合物)将一个或多个部分引入EV中(Papapetrou等人,GeneTherapy 12:S118-S130(2005))。在某些方面,诸如磷酸钙、环糊精或聚芳烃等的化学物质可用于将一个或多个部分引入EV中。
在某些方面,通过电穿孔将一个或多个部分引入EV中。在一些方面,使EV暴露于电场,此举在EV膜中产生瞬时孔,从而允许装载一个或多个部分。
在某些方面,通过显微注射将一个或多个部分引入EV中。在一些方面,可将玻璃微量移液器用于在显微水平上将一个或多个部分直接注射到EV中。
在某些方面,通过挤出将一个或多个部分引入EV中。
在某些方面,通过超声处理将一个或多个部分引入EV中。在一些方面,将EV暴露于高强度声波,引起EV膜的瞬时破坏,从而允许装载一个或多个部分。
在一些方面,一个或多个部分可缀合至EV的表面。缀合可通过本领域中已知的方法以化学方式或以酶方式实现。
在一些方面,EV包含一个或多个化学缀合的部分。化学缀合可通过在使用或不使用接头的情况下共价键合一个或多个部分与另一分子来实现。此类缀合物的形成是在技术人员的技能内并且已知用于实现缀合的各种技术,并且选择由待缀合的材料所导引的特定技术。在某些方面,使多肽缀合至EV。在一些方面,使诸如脂质、碳水化合物、核酸和小分子的非多肽缀合至EV。
在一些方面,通过低渗裂解将一个或多个部分引入EV中。在此类方面,可将EV暴露于低离子强度缓冲液,使其破裂,从而允许装载一个或多个部分。在其他方面,针对低渗溶液的受控透析可用于使EV膨胀并在EV膜中产生孔。随后,使EV暴露于允许再密封膜的条件。
在一些方面,通过去垢剂处理将一个或多个部分引入EV中。在某些方面,用温和去垢剂处理EV,所述去垢剂通过产生孔而暂时损伤EV膜,从而允许装载一个或多个部分。在对EV进行装载后,洗掉去垢剂,从而重新密封膜。
在一些方面,通过受体介导的内吞作用将一个或多个部分引入EV中。在某些方面,EV具有表面受体,其在结合一个或多个部分时诱导受体和相关部分的内化。
在一些方面,通过机械燃烧将一个或多个部分引入EV中。在某些方面,可用连接至诸如金微载体的重粒子或带电粒子的一个或多个部分轰击细胞外囊泡。在这些实施方案中的一些方面,可以机械方式或以电气方式加速粒子以使得粒子横穿EV膜。
在一些方面,使细胞外囊泡经历几次冻融循环,导致EV膜破裂,从而允许装载一个或多个部分。
VII.C.分离EV(例如,外泌体)的方法
在一些方面,本文所公开的生产EV的方法包括从生产细胞中分离EV。在某些方面,EV由生产细胞释放至细胞培养基中。预期分离EV的所有已知方式均视为适用于本文中。举例而言,可采用EV的物理特性以将EV与介质或其他源材料分离,所述分离包括基于电荷的分离(例如电泳分离)、基于尺寸的分离(例如过滤、分子筛分等)、基于密度的分离(例如常规离心或梯度离心)、基于Svedberg常数的分离(例如在具有或不具有外力的情况下的沉降等)。可替代地或除此之外,分离可基于一种或多种生物特性,并且包括可采用表面标记物的方法(例如用于沉淀、与固相的可逆结合、FACS分离、特异性配体结合、非特异性配体结合、亲和纯化等)。
分离和富集可按通常包括连续离心的一般并且非选择性方式进行。可替代地,分离和富集可按诸如使用EV或生产细胞特异性表面标志物的更具特异性和选择性的方式进行。举例而言,特异性表面标记物可用于免疫沉淀、FACS分选、亲和纯化和与珠粒结合配体的磁力分离。
在一些方面,可利用尺寸排阻色谱法以分离EV。尺寸排阻色谱技术是本领域已知的。本文提供了示例性非限制性技术。在一些方面,空隙体积级分经分离并且包含目标EV。此外,在一些方面,可在如本领域中公知的通过离心技术(对一种或多种色谱法级分)进行色谱分离之后进一步分离EV。在一些方面,举例而言,可利用密度梯度离心以进一步分离细胞外囊泡。在某些方面,可能需要进一步将生产细胞来源的EV与其他来源的EV分离。举例而言,可通过使用对生产细胞具有特异性的抗原抗体进行免疫吸附捕获来使生产细胞来源的EV与非生产细胞来源的EV分离。
在一些方面,EV分离可涉及多种方法的组合,所述方法包括但不限于差速离心、基于尺寸的膜过滤、免疫沉淀、FACS分选和磁力分离。
VIII.使用方法
本公开还提供了预防和/或治疗有需要的受试者的疾病或病症的方法,所述方法包括将本文所公开的EV(例如,外泌体)(例如,包含本公开的ASO)施用于受试者。本公开还提供了减少和/或抑制细胞(例如,肿瘤细胞)中的KRAS转录物(例如,mRNA)和/或KRAS蛋白表达的方法(体外或体内)。在某些方面,减少和/或抑制KRAS转录物(例如,mRNA)和/或KRAS蛋白表达的体外方法包括使本文所公开的EV、ASO、缀合物或药物组合物与表达KRAS转录物和/或KRAS蛋白的细胞接触。在某些方面,减少和/或抑制KRAS转录物(例如,mRNA)和/或KRAS蛋白表达的体内方法包括将本公开的EV、ASO、缀合物或药物组合物施用于有需要的受试者。
在一些方面,接触细胞或施用于受试者导致KRAS mRNA和/或KRAS蛋白表达的减少和/或抑制。在某些方面,与未暴露于ASO的细胞中的KRAS mRNA表达相比,在施用后KRASmRNA减少至少约20%、至少约30%、至少约40%、至少约50%、至少约60%、至少约70%、至少约80%、至少约90%或约100%。在一些方面,与未暴露于ASO的细胞中的KRAS蛋白的表达相比,在施用后KRAS蛋白减少至少约60%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或约100%。如本文所述,KRAS mRNA和/或KRAS蛋白可以是野生型或其变体(例如,包含G12D突变)。
如本文所述,在一些方面,降低的KRAS mRNA和/或KRAS蛋白表达导致细胞(例如,表现出异常的KRAS活性的肿瘤细胞)的活力和/或增殖降低。在某些方面,与未用本公开的EV、ASO、缀合物或药物组合物处理的对应细胞的活力和/或增殖相比,所述细胞的活力和/或增殖降低至少约5%、至少约10%、至少约20%、至少约30%、至少约40%、至少约50%、至少约60%、至少约70%、至少约80%、至少约90%或约100%。
在一些方面,KRAS mRNA和/或KRAS蛋白表达减少导致细胞(例如,表现出异常的KRAS活性的肿瘤细胞)中与MAP激酶途径相关的蛋白质(例如,pERK)的表达减少。在某些方面,与未用本公开的EV、ASO、缀合物或药物组合物处理的对应细胞的与MAP激酶途径相关的蛋白质相比,与MAP激酶途径相关的蛋白质的表达减少至少约5%、至少约10%、至少约20%、至少约30%、至少约40%、至少约50%、至少约60%、至少约70%、至少约80%、至少约90%或约100%。在某些方面,蛋白质表达减少导致通过MAP激酶途径的信号传导被降低和/或被抑制。
如本文所述,可用于本公开的ASO可与KRAS转录物(例如,前体mRNA或mRNA)的一个或多个区域特异性杂交,导致细胞中KRAS蛋白的表达被减少和/或被抑制。因此,包含这种ASO的EV(例如,外泌体)(例如,本文所公开的EV)可用于预防和/或治疗与KRAS蛋白的表达增加和/或活性异常相关的任何疾病或病症。
在一些方面,可用本方法治疗的疾病或病症包括癌症。在一些方面,癌症与实体瘤相关。在一些方面,癌症与液体瘤相关。如本文所用,术语“实体瘤”是指不包含囊肿或液体区域的异常组织块,并且通常发生在骨骼、肌肉和器官中。如本文所用,术语“液体瘤”是指发生在体液(例如,血液和骨髓)中的肿瘤。在某些方面,癌症与KRAS蛋白表达增加相关。在一些方面,KRAS蛋白包含突变,例如G12D。
可用本公开治疗的癌症的非限制性实例包括结肠直肠癌、肺癌(例如,非小细胞肺癌(NSCLC))、胰腺癌(例如,胰腺导管腺癌)、白血病、子宫癌、卵巢癌、膀胱癌、胆管癌、胃癌(gastric cancer)、胃癌(stomach cancer)、睾丸癌、食道癌、胆管癌、宫颈癌、急性髓性白血病(AML)、弥漫性大B细胞淋巴瘤(DLBC)、肉瘤、黑素瘤、胶质瘤(例如,低级别胶质瘤,例如胶质母细胞瘤)、间皮瘤、肝癌、乳腺癌(例如,侵袭性乳腺癌)、肾癌(例如,乳头状肾细胞癌(pRCC)和嫌色性肾细胞癌)、头颈癌、前列腺癌、腺样囊性癌(ACC)、胸腺癌、甲状腺癌、透明细胞肾细胞癌(CCRCC)、神经内分泌赘瘤(例如,嗜铬细胞瘤/副神经节瘤)、葡萄膜黑素瘤或它们的任何组合。在某些方面,癌症是胰腺癌。在一些方面,癌症是结肠直肠癌。在一些方面,癌症是肺癌。
当施用于患有癌症的受试者时,在某些方面,本公开的EV(例如,外泌体)可以上调免疫应答并且增强受试者免疫系统的肿瘤靶向。在一些方面,所治疗的癌症的特征在于白细胞(T细胞、B细胞、巨噬细胞、树突细胞、单核细胞)向肿瘤微环境或所谓的“热肿瘤”或“炎性肿瘤”中的浸润。在一些方面,所治疗的癌症的特征在于低水平或不可检测的水平的白细胞至肿瘤微环境的浸润,或所谓的“冷肿瘤(cold tumor)”或“非炎性肿瘤”。在一些方面,以足以将“冷肿瘤”转化为“热肿瘤”的量和持续时间施用EV,即,所述施用导致白细胞(诸如T细胞)至肿瘤微环境的浸润。在某些方面,癌症包括膀胱癌、宫颈癌、肾细胞癌、睾丸癌、结直肠癌、肺癌、头颈癌以及卵巢癌、淋巴瘤、肝癌、胶质母细胞瘤、黑素瘤、骨髓瘤、白血病、胰腺癌或其组合。在其他术语中,“远端肿瘤(distal tumor)”或“远处肿瘤(distant tumor)”是指从原始(或原发)肿瘤扩散到远处器官或远处组织例如淋巴结的肿瘤。在一些方面,本公开的EV治疗转移扩散后的肿瘤。
在一些方面,施用本文所公开的EV(例如,外泌体)(例如,包含靶向KRAS G12DmRNA的ASO)抑制和/或减少受试者的肿瘤的生长。在一些方面,肿瘤生长(例如,肿瘤体积或重量)与参考(例如,无ASO的EV(例如,外泌体)施用后对应受试者中的肿瘤体积)相比减少至少约5%、少约10%、至少约20%、至少约30%、至少约40%、至少约50%、至少约60%、至少约70%、至少约80%、至少约90%或约100%。
在一些方面,本文所公开的EV(例如,外泌体)可用于治疗纤维化。可治疗的纤维化的非限制性实例包括肝纤维化(NASH)、肝硬化、肺纤维化、囊性纤维化、慢性溃疡性结肠炎/IBD、膀胱纤维化、肾纤维化、CAPS(穆-韦二氏综合征,Muckle-Wells syndrome)、心房纤维化、心内膜心肌纤维化、陈旧性心肌梗死、胶质瘢痕、动脉僵硬、关节纤维化、克罗恩病、杜普伊特伦挛缩(Dupuytren's contracture)、瘢痕疙瘩纤维化、纵隔纤维化、骨髓纤维化、佩罗尼氏病(Peyronie's disease)、肾原性系统性纤维化、进行性大块纤维化、腹膜后纤维化、硬皮病/系统性硬化、粘连性关节囊炎、1型神经纤维瘤病(NF1)或它们的任何组合。在某些方面,纤维化与癌症(例如,胰腺导管腺癌(PDAC))相关联。
在一些方面,EV(例如,外泌体)通过静脉内施用至受试者的循环系统。在一些方面,EV输注到合适的液体中并且施用到受试者的静脉中。
在一些方面,EV(例如,外泌体)动脉内施用至受试者的循环系统。在一些方面,EV输注到合适的液体中并且施用到受试者的动脉中。
在一些方面,EV(例如,外泌体)通过鞘内施用来施用于受试者。在一些方面,EV通过注射到椎管或蛛网膜下腔中以使其到达脑脊液(CSF)来施用。在一些方面,EV(例如,外泌体)通过鞘内施用来施用,随后对躯干施加机械对流力。参见,例如,Verma等人,Alzheimer's Dement.12:e12030(2020);其以引用方式整体并入本文)。因此,本公开的某些方面涉及向有需要的受试者施用EV(例如,外泌体)的方法,所述方法包括通过鞘内注射向受试者施用EV(例如,外泌体),随后向受试者的躯干施加机械对流力。在一些方面,机械对流力是使用高频胸壁或腰胸振荡呼吸清除装置(例如,Smart Vest或Smart Wrap,ELECTROMED INC,New Prague,MN,USA)。在一些方面,机械对流力(例如,振荡背心)促进鞘内给予的EV(例如,外泌体)沿神经进一步扩散,从而更好地将EV(例如,外泌体)递送至神经。
在一些方面,外泌体的隔室内和跨隔室生物分布可通过在隔室递送外泌体后作用于受试者的外源性体外力来操纵。这包括施加机械对流,例如通过对身体隔室或整个身体施加敲击、振动、摇荡或按摩的方式。例如,在鞘内给药后,通过包括振荡机械夹套在内的多种方式施加的胸壁振动可沿着神经轴或沿着颅神经和脊神经传播外泌体的生物分布,这有助于通过携带药物的外泌体治疗神经病症。
在一些方面,通过振荡夹套或其他类似方式施加外部机械对流力可用于从鞘内空间的脑脊液中去除外泌体和其他物质并移出至外周循环。这方面可帮助将内源性有毒外泌体和其他有害大分子诸如β-淀粉样蛋白、tau、α-突触核蛋白、TDP43、神经丝和过多的脑脊液从鞘内空间清除到外周进行消除。
在一些方面,通过同时结合腰椎穿刺并允许脑室-腰椎灌注可使通过脑室内途径递送的外泌体在整个神经轴中移位,其中在外泌体给药后将额外的流体注入脑室,而允许现有的CSF神经轴柱退出则是腰椎穿刺。脑室-腰椎灌注可使ICV给予的外泌体沿整个神经轴扩散并完全覆盖蛛网膜下腔,以治疗软脑膜癌和其他疾病。
在一些方面,外部体外聚焦超声、热能(热)或冷的应用可用于操纵被设计为对这些现象敏感的外泌体的隔室药代动力学和药物释放特性。
在一些方面,经工程化而含有顺磁性材料的外泌体的室内行为和生物分布可通过外部施加磁体或磁场来操纵。
在一些方面,EV(例如,外泌体)瘤内施用到受试者的一个或多个肿瘤中。
在一些方面,EV(例如,外泌体)通过鼻内施用来施用于受试者。在一些方面,可以局部施用或全身性施用的形式经由鼻吹入EV。在某些方面,EV作为鼻喷雾剂施用。
在一些方面,EV(例如,外泌体)通过腹膜内施用来施用于受试者。在一些方面,EV输注到合适的液体并且注射到受试者的腹膜中。在一些方面,腹膜内施用导致EV分布至淋巴。在一些方面,腹膜内施用导致EV分布至胸腺、脾和/或骨髓。在一些方面,腹膜内施用导致EV分布至一个或多个淋巴结。在一些方面,腹膜内施用导致EV分布至颈淋巴结、腹股沟淋巴结、纵隔淋巴结或胸骨淋巴结中的一个或多个。在一些方面,腹膜内施用导致EV分布至胰腺。
在一些方面,EV(例如,外泌体)通过眼周施用来施用于受试者。在一些方面,将s注射到眼周组织中。眼周药物施用包括结膜下、前房眼球筋膜囊下、后房眼球筋膜囊下和眼球后施用途径。
除非另外指明,否则本公开的实践将采用细胞生物学、细胞培养、分子生物学、转基因生物学、微生物学、重组DNA和免疫学的常规技术,这些技术在本领域的技术范围内。这些技术在文献中有充分的解释。参见,例如,Sambrook等人编,(1989)Molecular Cloning ALaboratory Manual(第2版;Cold Spring Harbor Laboratory Press);Sambrook等人编,(1992)Molecular Cloning:A Laboratory Manual,(Cold Springs Harbor Laboratory,NY);D.N.Glover编,(1985)DNA Cloning,第I卷和第II卷;Gait编,(1984)OligonucleotideSynthesis;Mullis等人,美国专利号4,683,195;Hames和Higgins编,(1984)Nucleic AcidHybridization;Hames和Higgins编,(1984)Transcription And Translation;Freshney(1987)Culture Of Animal Cells(Alan R.Liss,Inc.);Immobilized Cells And Enzymes(IRL Press)(1986);Perbal(1984)A Practical Guide To Molecular Cloning;thetreatise,Methods In Enzymology(Academic Press,Inc.,N.Y.);Miller和Calos编(1987)Gene Transfer Vectors For Mammalian Cells,(Cold Spring HarborLaboratory);Wu等人编,Methods In Enzymology,第154和155卷;Mayer和Walker编,(1987)Immunochemical Methods In Cell And Molecular Biology(Academic Press,London);Weir和Blackwell编,(1986)Handbook Of Experimental Immunology,第I-IV卷;Manipulating the Mouse Embryo,Cold Spring Harbor Laboratory Press,Cold SpringHarbor,N.Y.,(1986);Crooke,Antisense drug Technology:Principles,Strategies andApplications,第2版CRC Press(2007)以及Ausubel等人(1989)Current Protocols inMolecular Biology(John Wiley and Sons,Baltimore,Md.)。
上文引用的所有参考文献以及本文引用的所有参考文献全文以引用的方式并入本文。
以下实施例以说明方式而不是限制方式提供。
实施例
实施例1:外泌体的构建
为了产生本文所述的外泌体,将使用人胚胎肾(HEK)细胞系(例如,HEK293SF)。将细胞用支架X、支架Y和/或连接至目标剂的锚定部分稳定转染。
转染后,经7天将HEK细胞在化学成分确定的培养基中生长至高密度。然后将收集条件细胞培养基,并在室温下以300–800x g离心5分钟,以除去细胞和大碎片。将用1000U/L的补充培养基上清液,并在37℃水浴中孵育1小时。将收集上清液,并在4℃下以16,000x g离心30分钟,以除去残留的细胞碎片和其他大的污染物。然后将上清液以133,900x g于4℃超速离心3小时,以沉淀出外泌体。将丢弃上清液,并将任何残留的培养基从管底部吸出。将沉淀重悬于200–1000μL PBS(-Ca-Mg)中。
为了进一步富集外泌体群体,通过密度梯度纯化(蔗糖或OPTIPREPTM)处理沉淀。
在4℃下将梯度以200,000x g在置于SW 41 Ti转子中的12mL Ultra-Clear(344059)管中旋转16小时,以分离外泌体级分。
然后将从顶层轻轻取出外泌体层,并将其在38.5mL的Ultra-Clear(344058)管中于约32.5mL PBS中稀释,在4℃下以133,900x g再次超速离心3小时,以沉淀纯化的外泌体。将所得沉淀重悬于最小体积的PBS(约200μL)中,并在4℃下储存。
对于OPTIPREPTM梯度,将在用于SW 41 Ti转子的12mL Ultra-Clear(344059)管中,用等体积的10%、30%和45%的OPTIPREPTM制备3层无菌梯度。将沉淀加入OPTIPREPTM梯度中,并在4℃下以200,000x g超速离心16小时,以分离外泌体级分。然后将从管的顶部约3mL轻轻收集外泌体层。
将外泌体级分在38.5mL Ultra-Clear(344058)管中于约32mL PBS中稀释,并在4℃下以133,900x g超速离心3小时,以沉淀出纯化的外泌体。然后将成团外泌体重悬浮于最小体积的PBS(约200μL)中并且储存在4℃下,直至准备使用。
实施例2:KRAS mRNA和/或KRAS蛋白还原的体外分析
本文所公开的示例性ASO被设计为特异性靶向编码具有G12D突变的KRAS蛋白的KRAS转录物。参见图1。将测试所公开的ASO在含有海肾荧光素酶上游的人KRAS mRNA的野生型(WT)或G12D等位基因的报告细胞系中敲减KRAS mRNA和/或KRAS蛋白表达的能力。为了控制一般细胞毒性,细胞系还将包含萤火虫荧光素酶。KRAS特异性siRNA将用作阳性对照。
简而言之,表达WT或G12D突变KRAS蛋白的报告细胞系将在细胞培养基中生长并接种到96孔板上。然后,将用不同浓度的包含本文所公开的一种或多种ASO的EV(例如,外泌体)(“EV-ASO”)处理细胞。EV-ASO处理后大约3天,将收获细胞并从细胞中纯化RNA和/或蛋白质。然后,细胞中的KRAS mRNA和/或KRAS蛋白表达水平将使用诸如qPCR和蛋白质印记的测定来定量。
实施例3:KRAS mRNA/KRAS蛋白还原的体内分析
为了评估包含一种或多种本文所公开的ASO的EV(例如,外泌体)在降低体内KRASmRNA和/或KRAS蛋白水平方面的效力,将使用肿瘤小鼠模型。本文所公开的ASO将以各种给药方案施用于肿瘤小鼠。定期监测小鼠的肿瘤生长。最终将处死小鼠,并在各种细胞中评估KRAS mRNA和/或KRAS蛋白水平。
实施例4:靶向KRAS转录物的ASO的构建和表征
在生产本公开的工程化EV(例如,外泌体)中,构建了靶向包含G12D突变的KRAS转录物的ASO。为了生成不同长度的ASO,进行了跨越G12D突变的ASO的拼接。这导致ASO的长度为14个、15个、16个、17个和20个核苷酸,并覆盖参考KRAS mRNA序列(NM_004985.5;SEQ IDNO:89)的核苷酸206-245。图1提供了一个表格,列出了已构建的示例性ASO。
为了表征构建的ASO抑制KRAS G12D转录物的能力,使用KRAS报告基因构建体和ASO方法的双重转染。KRAS报告基因构建体(双glo报告基因质粒)包含在海肾荧光素酶上游的人KRAS mRNA的野生型(WT)或G12D等位基因。海肾荧光素酶表达被用作KRAS mRNA敲减水平的替代指标。KRAS报告基因构建体还包含萤火虫荧光素酶,以控制一般细胞毒性。作为阳性对照,使用了两种不同的KRAS G12D siRNA(一种为选择性,一种为非选择性)。
然后将上述KRAS报告基因构建体用于用本文所述的ASO转染Hepa1-6细胞。用不同浓度的ASO转染细胞(使用的最高最终ASO浓度=10nM)。在转染后24小时,通过使用双glo测定测量海肾荧光素酶水平来评估WT或G12D KRAS mRNA表达。
图2A至图2L显示了本文所公开的12种不同的示例性ASO的归一化WT和G12D KRASmRNA表达。表10(下)提供了测试的不同ASO的长度、IC50(nM)值以及WT与G12D KRAS mRNA表达的比率。还可参见图3。如图所示,ASO在敲减G12D KRAS mRNA表达方面通常比敲减WTKRAS mRNA表达更有效。这些结果证明,本文所公开的ASO能够特异性靶向KRAS mRNA,特别是包含G12D突变的KRAS mRNA。
表10.WT和G12D KRAS mRNA在Hepa1-6报告细胞中的表达
实施例5:人胰腺癌细胞中KRAS mRNA敲减的分析
如本文所述,KRAS突变与许多类型的癌症相关,这些癌症包括胰腺癌。因此,为了评估本文所公开的ASO是否可特异性抑制胰腺癌细胞中的KRAS mRNA表达,使用了多种胰腺癌细胞系。
简而言之,将Panc-1细胞(对于G12D突变是杂合的)或BxPC-3细胞(不包含KRAS突变)接种到96孔板(5,000个细胞/孔)上。然后,大约24小时后,使用RNAiMAX用本文所公开的示例性ASO(以五种不同浓度)转染细胞。在转染后48小时,使用qPCR测定来测量KRAS G12DmRNA表达(在Panc-1细胞中)或总KRAS mRNA表达(在BxPC-3细胞中)。
如图4A所示,测试的ASO都能够以剂量依赖性方式降低Panc-1细胞中的KRAS G12DmRNA表达。相比之下,许多测试的ASO对BxPC-3细胞(不包含任何KRAS突变)中的KRAS mRNA表达的影响很小(参见图4B)。如图5A至图5C所示,一些ASO更有效(例如,能够同时敲减WT和G12D KRAS mRNA),而另一些则更具选择性(例如,能够敲减G12D KRAS mRNA,但对WT KRASmRNA的影响很小)。这些结果突出了本文所公开的ASO的特异性和/或效力,表明它们可用于治疗本文所公开的疾病,诸如与KRAS G12D突变相关的疾病(例如,胰腺癌)。
实施例6:猴肾细胞中KRAS mRNA敲减的分析
为了评估本文所公开的ASO是否可靶向来自其他物种的KRAS,使用了猴肾细胞。简而言之,将FrHK-4细胞(胎儿恒河猴肾细胞)或Cos-7(非洲绿猴肾成纤维细胞样细胞)接种到96孔板上并用不同浓度的ASO(ASO-0009、ASO-0082或加扰对照)转染,并如实施例5所述评估KRAS mRNA表达。
如图6A和图6B所示,ASO-0009对FrHK-4细胞中的KRAS mRNA表达没有影响,并且在Cos-7细胞中显示出有限的敲减。与ASO-0009相比,ASO-0082对FrHK-4细胞和Cos-7细胞中KRAS mRNA表达的影响更大,在Cos-7细胞中观察到的敲减略大(参见图6A和图6B)。然而,与人细胞相比(参见图5C),ASO-0082在敲减猴肾细胞中的KRAS mRNA表达方面效率较低(FrHK-4中的IC50=50nM;Cos-7中的IC50=20nM)。
上述数据进一步支持实施例5的结果,证明本文所公开的一些ASO(例如,ASO-0082)非常有效,并且不仅能够敲减WT和G12D KRAS mRNA,还能敲减来自其他物种(例如,猴)的KRAS mRNA。上述结果还证明了本文所公开的一些ASO(例如,ASO-0009)的选择性。
实施例7:带胆固醇标签的ASO
如本文所述,可使用锚定部分将ASO连接至工程化EV(例如,外泌体)的表面。锚定部分,诸如胆固醇,可帮助增强ASO的疏水性,并允许在EV表面更好地表达。因此,评估了将ASO缀合到胆固醇部分是否对ASO的活性有任何影响。特别地,评估了胆固醇部分对ASO抑制胰腺癌细胞生长以及抑制胰腺癌细胞中KRAS表达的能力的影响。图7A和图7B提供了可用于标记本文所公开的ASO的两种示例性胆固醇分子的结构。
为了评估本文所公开的ASO对细胞生长的影响,使用带胆固醇标签的ASO转染两种不同的人胰腺癌细胞系:Panc-1(对于G12D突变是杂合的)细胞和HEP3B(无KRAS突变)细胞。简而言之,将细胞接种到12孔板(500个细胞/孔)上,然后在大约24小时后用不同浓度的带胆固醇标签的ASO-0009或带胆固醇标签的加扰对照ASO处理细胞。然后将细胞培养16天(在转染后第6天更新培养基和处理)。在转染后第16天,固定细胞,用结晶紫染色,并定量集落形成。
如图8A所示,当用1,000nM的带胆固醇标签的ASO-0009转染Panc-1细胞时,集落形成的数量显著减少。相比之下,在所有测试浓度下,用带胆固醇标签的对照ASO观察到的抑制作用最小。此外,集落形成的减少在HEP3B细胞中不太明显,如上所述,HEP3B细胞包含野生型KRAS转录物(参见图8B)。这些结果有助于证明本文所公开的ASO的效力和选择性。
为了评估带胆固醇标签的ASO的敲减效率,将AsPC-1(对于G12D突变是纯合的)和Panc-1(对于G12D突变是杂合的)细胞接种到6孔板(200,000个细胞/孔)上并用本文所述的不同浓度的带胆固醇标签的ASO(ASO-0009、ASO-0082或加扰对照)转染。然后,在转染后72小时,收获细胞并使用RIPA缓冲液制备蛋白质裂解物,随后进行蛋白质印迹。评估了以下蛋白质的表达:纽蛋白(对照)、KRAS G12D、pERK和总ERK。
如图14所示,与对照ASO相比,在AsPC-1和Panc-1细胞中,带胆固醇标签的ASO-0082和带胆固醇标签的ASO-0009的KRAS G12蛋白表达降低。与上面提供的细胞生长数据一致,用带胆固醇标签的ASO-0082和带胆固醇标签的ASO-0009转染的细胞中的pERK表达也降低了。
上述结果共同证明胆固醇部分具有最小的影响,并且本公开的带胆固醇标签的ASO的功能完全,例如,能够抑制胰腺癌细胞的生长并敲减胰腺癌细胞中的KRAS表达。
实施例8:包含ASO的工程话EV的敲减效率
为了评估ASO是否可使用EV(例如,外泌体)有效地递送至细胞并抑制KRAS表达,将带胆固醇标签的ASO(即,ASO-0009、ASO-0082或加扰对照)装载到表面工程化的EV(例如,外泌体)上。可使用本领域中已知的任何合适的方法来装载具有ASO的EV,诸如在本公开别处描述的那些。然后,使用不同浓度的EV转染三种不同的人胰腺癌细胞系:(i)Panc-1(对于G12D突变是杂合的)细胞,(ii)Panc8.13(对于G12D突变是纯合的)细胞和(iii)AsPC-1(对于G12D突变是纯合的)细胞。一天前将细胞接种到96孔板上(5,000个细胞/孔)。将游离的(即,不是EV的一部分)带胆固醇标签的ASO-0009和ASO-0082ASO用作对照。在转染后第4天,使用qPCR评估KRAS G12D mRNA表达。
如分别在图9A和图9B中所示,在用包含带胆固醇标签的ASO-0009或带胆固醇标签的ASO-0082的EV转染的细胞中观察到KRAS G12D mRNA表达的显著敲减(在较高浓度下为约90%)。在较高的EV浓度下,敲减效率与使用游离ASO观察到的敲减效率相似,这表明将ASO装载到EV上不会损害ASO的活性。在Panc8.13细胞(在较高浓度下约80%的敲减)(参见图10)和AsPC-1细胞(在较高浓度下约50%的敲减)都观察到类似的结果(参见图11)。
上述结果证明本文所述的工程化EV(例如,外泌体)(例如,包含靶向KRAS G12D转录物的ASO)可用于有效地敲减胰腺癌细胞中的KRAS mRNA表达。
实施例9:包含ASO的工程化EV对细胞生长的影响
为了进一步表征本文所述的工程化EV(例如,包含带胆固醇标签的ASO),使用3DCTG测定测量用包含带胆固醇标签的ASO的EV转染的细胞的活力。简而言之,将AsPC-1(对于G12D突变是纯合的)细胞接种到超低附着板(Corning,目录号7007)上,然后在一天后用不同浓度的上述工程化EV转染。将游离的(即,不是EV的一部分)带胆固醇标签的ASO-0009和ASO-0082用作对照。在转染后第5天,更新培养基和EV处理。在转染后第10天,使用CELLTITER-3D细胞活力测定(Promega,目录号G9683)评估细胞活力。
正如使用前面描述的带胆固醇标签的ASO所观察到的(参见实施例7),包含带胆固醇标签的ASO-0009或带胆固醇标签的ASO-0082的工程化EV也能够降低转染的AsPC-1细胞的活力(参见图12)。
为了证实上述结果,在转染的Panc8.13(对于G12D突变是纯合的)和Panc-1(对于G12D突变是杂合的)细胞中测量pERK表达。简而言之,将细胞接种到96孔板(5,000个细胞/孔)上,然后用不同浓度的包含带胆固醇标签的ASO(即,ASO-0009、ASO-0082和加扰对照)的上述工程化EV转染。在转染后第4天,使用pERK aLISA试剂盒(Perkin Elmer,目录号ALSU-PAKT-B500)评估细胞中的pERK表达。
与细胞活力数据一致,与对照细胞(即,用空EV或包含带胆固醇标签的加扰对照ASO的EV转染)相比,用包含带胆固醇标签的ASO-0009或带胆固醇标签的ASO-0082的工程EV转染的Panc8.13和Panc-1细胞表达的pERK表达水平显著降低(参见图13A和图13B)。
总的来说,上述结果证明了本文所述的EV(例如,包含带胆固醇标签的ASO),例如,通过减少某些癌细胞(例如,胰腺癌细胞)的生长并抑制KRAS mRNA(特别地包含G12D突变)的表达实现的治疗潜力。
实施例10:包含靶向KRAS转录物的ASO和抗间皮素靶向部分的EV的构建和表征
除以上提供的实例外,将产生包含靶向KRAS转录物的ASO和抗间皮素靶向部分的EV(例如,外泌体)。在一些方面,抗间皮素靶向部分将融合至支架X(例如,PTGFRN或其片段)并连接至EV(例如,外泌体)的外表面。在一些方面,ASO将通过接头(例如,TEG)用胆固醇分子标记,并使用支架部分连接至EV的表面(例如,使用支架X诸如PTGFRN或其片段连接至EV的外表面)。
上述EV(例如,外泌体)将使用本领域中已知的各种方法来表征,所述方法包括本公开中描述的那些。例如,将评估以下一项或多项性质:(i)Ev朝向间皮素+细胞的向性;(ii)EV的摄取;(iii)KRAS G12D转录物和/或KRAS G12D蛋白敲减;和(iv)抗肿瘤功效。
以引用方式并入
在本申请中引用的所有出版物、专利、专利申请和其他文件出于所有目的特此以引用方式整体并入,其并入程度如同每个单独出版物、专利或专利申请或其他文件被单独地指示出于所有目的以引用方式并入一般。
等同物
虽然已经示出和描述了各种具体方面,但上述说明不是限制性的。应当理解,在不脱离所述一项或多项发明的精神和范围的情况下,可进行各种改变。通过阅读本说明书,许多变化对于本领域技术人员来说将变得显而易见。
序列表
<110> 科迪亚克生物科学公司
<120> 具有靶向KRAS的反义寡核苷酸的细胞外囊泡
<130> 4000.062PC02
<150> US 62/886,885
<151> 2019-08-14
<160> 632
<170> PatentIn version 3.5
<210> 1
<211> 46148
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> KRAS G12D基因组序列
<400> 1
gattttccta ggcggcggcc gcggcggcgg aggcagcagc ggcggcggca gtggcggcgg 60
cgaaggtggc ggcggctcgg ccagtactcc cggcccccgc catttcggac tgggagcgag 120
cgcggcgcag gcactgaagg cggcggcggg gccagaggct cagcggctcc caggtgcggg 180
agagaggtac ggagcggacc acccctcctg ggcccctgcc cgggtcccga ccctctttgc 240
cggcgccggg cggggccggc ggcgagtgaa tgaattaggg gtccccggag gggcgggtgg 300
ggggcgcggg cgcggggtcg gggcgggctg ggtgagaggg gtctgcaggg gggaggcgcg 360
cggacgcggc ggcgcgggga gtgaggaatg ggcggtgcgg ggctgaggag ggtgaggctg 420
gaggcggtcg ccgctggtgc tgcttcctgg acggggaacc ccttccttcc tcctccccga 480
gagccgcggc tggaggcttc tggggagaaa ctcgggccgg gccggctgcc cctcggagcg 540
gtggggtgcg gtggaggtta ctcccgcggc gccccggcct cccctccccc tctccccgct 600
cccgcacctc ttgcctccct ttccagcact cggctgcctc ggtccagcct tccctgctgc 660
atttggcatc tctaggacga aggtataaac ttctccctcg agcgcaggct ggacggatag 720
tggtcctttt ccgtgtgtag gggatgtgtg agtaagaggg gaggtcacgt tttggaagag 780
cataggaaag tgcttagaga ccactgtttg aggttattgt gtttggaaaa aaatgcatct 840
gcctccgagt tcctgaatgc tcccctcccc catgtatggg ctgtgacatt gctgtggcca 900
caaaggagga ggtggaggta gagatggtgg aagaacaggt ggccaacacc ctacacgtag 960
agcctgtgac ctacagtgaa aaggaaaaag ttaatcccag atggtctgtt ttgcttggtc 1020
aagttaaacc cgaagaaaac ccgcagagca gaagcaaggc tttttccttg ctagttgagt 1080
gtagacagca atagcaaaaa tagtacttga agtttaattt acctgttctt gtcctttccc 1140
ctatttctta tgtattaccc tcatcccctc gtctctttta tactaccctc attttgcaga 1200
tgtgttctac atctcaagag ttattacagt actccaaaac agcacttaca tgatttttta 1260
aacttacaga ggaattgtag caatccacca gctaaccgcc tgaaatagac ttaaacatgt 1320
gcatctcctt tttttttttt tttttgagac acagtctcgc tctgttgccc aggctggagt 1380
gcaatggcgc ggtatcggct cactgaaacc tccgcctcct gggttcaagc aattctcctg 1440
cctcagcctc ccgagtagct gggactagta ggtgcacgcc accatgccca gctaattttt 1500
gtatttttag tagagacaga gtttcatcat gttggtcagg atggtctcca tctgctctgt 1560
tgcccaggct ggagtgcagt ggcgccgtct cggctcactg caacctctgc ctcctgcatt 1620
caagcaattc tcctgcctca gcctcccgaa taactgggat tacaggtgtc tgctgccatg 1680
cccggctaat tttttgtatt tttagtagag acgggggttt caccatgttg gtcaggctgg 1740
tctagaactc ctgacctcgt gatctgcccg cctcggcctc ccacagtggc atgtgcatct 1800
tatagctgaa gtctaagcct tcttaaatct tgagatccat caaaacagac aggttttcta 1860
attgttatac aatgtatatg ttatgtttat aatagaaatc attttacaaa taagttataa 1920
atgggaaagg tctatttgta attatcagct cagaattaac cataaaactg gtgtcactga 1980
agtgactgag gtccaaaatg ctgactctgc atgttataga ctacagatat caaatatggt 2040
tgctaacaat agtttacttt gagactgtag ccatccacag tatatttgct tttaagagat 2100
ggtagatggt aattcagttt tatgaaaaat aaaaatgaat tttcttccat tacaaaattg 2160
ttggattcga gtccagtcca ctccttacta gcttttctaa ctctcggtga gggatcccct 2220
cccagcccat gatcttcatt tggtaagact cctttggaac ccagttctct ctagtggatt 2280
taaatgtgat ttggttttaa aaatctcatt caaggaattt tttttttttc tggaaacaac 2340
caccgcataa acaagtaaac cggaagatac atgtggctct gaattcatat atatacacaa 2400
actctaatcc aatgtctgtc cacagtattt cctaggctag taaacttttt ggccttaacg 2460
acccctctac cctctttgtt tttttgagag agagagtctc actctgtcac ccaggccgga 2520
atgcagtggc gcgatctcgg cccgctacta cctccgactc tcaggctcaa gcgattctcc 2580
cgcctcagct tcccgagtag ccgggattac aggctcccgc caccgggcta attgtatttt 2640
tagatacggg atttcaccat gttggccagg ctggtctcga cctcctgacc tcaggtgatc 2700
cgcccgccta agcctcccaa agtgctggga ttacaggcca ccacacccgg cctacactct 2760
taaaaattat cgaaggggcc gggcacattg gctcttatct gtaatcccag cactttggga 2820
gactgaggcg ggaggatcgc ttgaggccag gagttggaga ccagcgtact caacatagtg 2880
agaccttgtt ataaagaaaa aaaaaatcca ggattaaaaa aaatctttga tttgtttggg 2940
atttattaat atttaccgta ttggaaatta aaacaatttt ttaaaatgta ttcatttaaa 3000
aataataagc ccattacttg gtaacatgaa taaaatattt tatgaaaaat aactattttc 3060
caaaacaaaa ccaaaactta gaaaagtggt attgtttcac acttcagtaa atctctttaa 3120
tgatgtggct taatagaaga tatggattct tatatctgca tctgcattca atctattatg 3180
atcacacatc tggaaaactt gtgaaagaat gggagttaaa agggtaaagg acatcttaat 3240
gttattatga aaacagtttt gacctcttgc acaccagaaa agtcttagta acctgagggg 3300
ttcctagacc acattttgag aactgtttta ggctatgcaa actggttggg gggaggttgg 3360
ggtaggcaga gagctagaag atacatttta gtgtaattct cctcatctat tcctaattgc 3420
tttggcctac atttgaaata aagcgtggag gcaaacggga taagatacat gtttgtagtg 3480
gttgttaact tcaccctaga caagcagcca ataagtctag gtagagcaga gtaaggcggg 3540
gaactatgcc gtgaccgtgt gtgatacaat ttttctagcc tgtggtgctt tttgcggcag 3600
ggcttaggag taaggttagt atgttatcat ttgggaaacc aaattattat tttgggtctt 3660
cagtcaatta tgatgctgtg tatatttagt gtttatctac aatatatgca cattcattaa 3720
tttggagcta ctcatcctat aataaatagt tgtgcattta ctcccatttt tttctgcatt 3780
tctctcctta tttataatta tgtgttacat gagggaaagg aggtgaaatt aaacattcat 3840
attatttcaa aaaatttgaa acaactaact aaaaaatatg ttttattttc tgtatggtgt 3900
ttgttataca atctgtcaat attcatgcac ctcttgggag acagtgtatg aaaagcaaag 3960
agtaacagtc acatggatta ctgattactg agatatattc acttgcatct tttttttttt 4020
ttgagacgga gtggctctgt cgcccaggct ggagtgcagt ggcgtgatct cggctcactg 4080
caagctccgc ctcctgggtt cacgccattc ttctgcctca gcctcccaag tagctgggac 4140
tacaggcgcc cgccaccacg cccggctaat ttttttatat ttttagtaga gacggggttt 4200
caccgggtta gccaggatgg tcttgatctc ctgacctcgt gatccaccct cctcggcctc 4260
ccaaagtgct aggattatag gcgtgagcca ccgtgcccgg ctcacttgca tctcttaaca 4320
gctgttttct tactaaaaac agtgtttatc tctaatcttt ttgtttgttt gtttgttttg 4380
agatggagtc ttactccgtc acccaatctg gagtgcagtg gcgtgatctg ggctcactgc 4440
aacctctgcc tcccgggttc aagtgattct ccttcctcag cctccccagt agctaggact 4500
acaggagagc gccaccacgc ctgattaatt tttgtatttt tagtagagag agggtttcac 4560
catattggcc aggctggtct tgaactcctg gcctcaggtg atccacccgc cttggcctct 4620
gaaagtgctg ggattacagg catgagccgc cgcacccggc tttctaatct ttatcttttt 4680
ttgtgcagcg gtgatacagg attatgtatt gtactgaaca gttaattcgg agttctcttg 4740
gtttttagct ttattttccc cagagatttt tttttttttt tttttttttg agacggagtc 4800
ttgctctatc gccaggctgg agtgcagtgg cgccatctcg gctcattgca acctcggact 4860
cctattttcc ccagagatat ttcacacatt aaaatgtcgt caaatattgt tcttctttgc 4920
ctcagtgttt aaatttttat ttccccatga cacaatccag ctttatttga cactcattct 4980
ctcaactctc atctgattct tactgttaat atttatccaa gagaactact gccatgatgc 5040
tttaaaagtt tttctgtagc tgttgcatat tgacttctaa cacttagagg tgggggtcca 5100
ctaggaaaac tgtaacaata agagtggaga tagctgtcag caacttttgt gagggtgtgc 5160
tacagggtgt agagcactgt gaagtctcta catgagtgaa gtcatgatat gatcctttga 5220
gagcctttag ccgccgcaga acagcagtct ggctatttag atagaacaac ttgattttaa 5280
gataaaagaa ctgtctatgt agcatttatg catttttctt aagcgtcgat ggaggagttt 5340
gtaaatgaag tacagttcat tacgatacac gtctgcagtc aactggaatt ttcatgattg 5400
aattttgtaa ggtattttga aataattttt catataaagg tgagtttgta ttaaaaggta 5460
ctggtggagt atttgatagt gtattaacct tatgtgtgac atgttctaat atagtcacat 5520
tttcattatt tttattataa ggcctgctga aaatgactga atataaactt gtggtagttg 5580
gagctgatgg cgtaggcaag agtgccttga cgatacagct aattcagaat cattttgtgg 5640
acgaatatga tccaacaata gaggtaaatc ttgttttaat atgcatatta ctggtgcagg 5700
accattcttt gatacagata aaggtttctc tgaccatttt catgagtact tattacaaga 5760
taattatgct gaaagttaag ttatctgaaa tgtaccttgg gtttcaagtt atatgtaacc 5820
attaatatgg gaactttact ttccttggga gtatgtcagg gtccatgatg ttcactctct 5880
gtgcattttg attggaagtg tatttcagag tttcgtgaga gggtagaaat ttgtatccta 5940
tctggaccta aaagacaatc tttttattgt aacttttatt tttatgggtt tcttggtatt 6000
gtgacatcat atgtaaaggt tagatttaat tgtactagtg aaatataatt gtttgatggt 6060
tgattttttt aaacttcatc agcagtattt tcctatcttc ttctcaacat tagagaacct 6120
acaactaccg gataaatttt acaaaatgaa ttatttgcct aaggtgtggt ttatataaag 6180
gtactattac caactttacc tttgctttgt tgtcattttt aaatttactc aaggaaatac 6240
taggatttaa aaaaaaattc cttgagtaaa tttaaattgt tatcatgttt ttgaggatta 6300
ttttcagatt tttttagttt aatgaaaatt taccaaagta aagaccagca gcagaatgat 6360
aagtaaagac ctgtaagaca ccttgaaggt catggagtag aacttccatc ccaagcagat 6420
gaggatttat ttaatctcaa agacctccag gaggggacat tccccaactg tccttgttaa 6480
ctcattttca gaacatattt attagcatat tttacatgta atttggatct tcatgttaaa 6540
tttaacatca gtggagatgg aaaataagca tatcgccttg tctttgaaat agccctatat 6600
tgttagattg tttcttaggc ttctttaccc tgggttaagc agtcctaata ctttagcatt 6660
tattctacat ctagtgtact aatttaaaaa aatcagttct gaaaaatttc taagaacttt 6720
cttcaagttc caagctgtga aatctagaac aggtcaaagt gccttattaa cgtactgtac 6780
tgtgtagtgt cttgaagaga cactttgcgc tgaggcaagt tctgagggca ttgggtggcc 6840
ttgggaagat atttatgcag tttagaacct ggagaattga ttagataact aatcataagg 6900
aaacgtcaca tatttttggt actataaaaa agtggagaaa taatgcctat ttgcaaagat 6960
ttgatttaaa catagaaaca actttatttg gcttccaatt ttaagaattt acagcagtaa 7020
aggggaacag tctaattgaa gtagactgcc tatgcaatag tctctgtata tttacttttg 7080
acaagttaat tcaatgtgta ctatagtttt gtttctttga agaggtttga atagtgcacc 7140
cattttaatc tgtattgcaa attcagggtt acttggcaga ctctactatt taaatcagat 7200
gtaaaaggaa gttttaatat aattcacttt atgcctgaaa gttttcctgg gattttggaa 7260
ggtgatttta ctggaaatgc tgtctgtctt ccctgaaaat ctgagaaatt ccattacact 7320
ttgtttccaa tcagaggtca tgagtgctat atgagtatat acagcatgac gtcatgaatg 7380
tgataaagtg ggttaggaaa ccttttgcta atgattgtta aaatgcaata taaatgttga 7440
agaaataaag ctaacagtta agcctttatt tgggcggaag gctgaaaaag tttataaact 7500
taaacctata actctgctta tgatttctgc caaaccagaa gacttgactc tgggaagcat 7560
tggttacctg tgaactttga aactgacggt ccctgacgta gtttagtcac ctgggaaaag 7620
gtatctgaga ttatctctta tctcccaagt tacagtgagt ctctgaggga actgacacat 7680
tacattaagt tcttggtgta gttaaactgt aagaaaggca ggagaactta gtagttaaat 7740
agttggttaa atggaaatgc tgactccatg ttattgtaaa aagttaaaaa tttaggagga 7800
tatggggatt tcactgccat tgcaggtttt gattggtatt taccaatccg tgtgggtcag 7860
agagaaaatt agaaaggata tgactgcaca ttttggaatt attagcagtt tttctacatt 7920
taaaatggaa ataaattttt taaaaattta aatcaagtaa tactgtattt tttggtgatt 7980
tagatttttc aaaatttaca ctaagagata gtaaggaggg tggctattgt ttctttcaat 8040
aatgtctctg agaggttgta actcatctaa ggatacgtag ctaataagtg gtaggatttc 8100
aatttaaatt ctctgagacc aagttaagta gaatttgcac tgtactcttg tataactttt 8160
taaaactgaa aattagctat ctttcaaatt aagaaaatat ttactaatgg agactaattc 8220
agatttgtaa gtataccaaa atttgaactt agcctgctat ctaatggcaa cttagtggca 8280
gaggtatgat gtaaaatcat tcaggtatga cacatagatg gagtatgttt gtattcgagg 8340
ctgtgcacat aatcaccttt acttgtattg tgaagtatat attgttatct tttatgaagc 8400
ccactaaaga gataatgaaa tacctcgtta ttagggcaag attattgaaa actcaaaata 8460
gcccccaaac acaatacttg gctagaaata tataccttta tagttcagag atcatttatt 8520
atcaaaaccc tgaagttttt tttctaaggt aaaatttggt ggaagaggaa aagtctcgtt 8580
ttaaaaaaat gtaggtagtt acagagatca gaatgattag ttgatcactt accaaatata 8640
tattaagtat ctactgtata taatatgcta gtaagaataa atatagcagg aagtattttt 8700
tcccaggctc taattgtttg acatcagcat gcttttattg tggcacttat aattcagttc 8760
aagtattatg cccctctttg atggaacagt ttcctattca gtaaggaaga ccagattaat 8820
cattggattg gtttgtttca tctttagtgt tctgagctgt agagtattta tttaccaagg 8880
tttattttaa tttttatttt atttttattt ttccatgttc attgtagaat tcattttacc 8940
tacgaatgaa gtatgtagat tatagagaga aaatttgtaa aattaaactg atactgaaga 9000
ctggtataag aaaagcctta tgtaatttgt aagctgctat tcttctgagt ttatacatat 9060
atctttagta atcaatgagg gatggttggg tgactgccct ccaggggaca tttggcaaca 9120
tctggagatg tttttggttg ccacaacttg gggagagagt actgctactg gcatctattg 9180
agtagatgct attactttaa atggcaaagc tgcagttacc tttgcaccaa cctaatatta 9240
aacttcctgc agtgcacggg aaagccccca caacagggtt atctgacccc aaacctcaat 9300
ggtgttaaga tccaaacctt gatatgttaa cctgtagctt taaacatcct ttaaattgtc 9360
aaattcatgt ccctgacata aggtttatgt tagattttca agtataacaa agatttaaac 9420
tttaactttt gtacgttaat gatatgttag cttactccag tcttctatta aaacattctg 9480
tttttaaaat cagagacaca cagcaatttt ataaatcatt tctcttcaag gctgtgaagc 9540
tctccccact tttgtgagtg ccctctactg gtcaaattat ttgctttata acaagtaaca 9600
gtgaaatcct aagtttgtgt agtttcgctg tttaaattat gggtggcatc aatttataaa 9660
tatattcgtt ttatttaaaa gtcttatatg attgatttcg tatcattttt gctctctgct 9720
aatattaata taaagattac tgtctgtatt agttaggcct aactaagtag gtgagtatag 9780
tgaactaaga aaggaaacga ggcagtatat aagaaaatag ggtggttcag ttgttaacac 9840
ttactgagct tactttgttg aagggactaa aaggcagcag tgtggctctc tgagcttctt 9900
tgcatgcact caggagctgc ttaatggagt ccaaggcttg gtggtgtgtt acaggggatg 9960
ataggagggt cctattcaga agtggcaaat tgtgaaagtg cacattttgt agagttttat 10020
aggactgtag aatagttgtg agcacctgat ttttagaata aacagaaaac tcaggtactg 10080
tatttaggtc aaattaagaa taagtattta ttaagacctg aatataaaac tttactggtc 10140
atggtttttt tctaccttgg gtttttataa atccaaagat ttaaaaacat acaaatggaa 10200
gttggtaatg gaattaagtg aaaggaaaaa atgattttat ggtttggaat ctcctaagat 10260
tctggtttta acaatacaac taattcctta atcctagaaa tgttcttcac tgcccacttt 10320
gtaccatgca gtcttcctgt gggctagaga tacactgagg cgcaaaacag accagattcc 10380
tgccttcatg gagcttatta gttttaggta tctctagatt tcttgtaata cctattacaa 10440
tgcctgcaca tcagttcatt catgtgggtt caacgtagta ctcagtacat ggcaaattca 10500
agttttactt ttcggaactt catggatttt tttcctcaga atatctttta tccataattg 10560
gttgaatctg tagatgcagt acccatggat atggatggcc cactttattt tgaagagcag 10620
tgtttctagg caatcatgct aattatatat gacttaattt agaggcttta tacttaagag 10680
cattacattt ctggcgtctc ttaaccatta ttatttcata atgtgtaggt tatggaacag 10740
ttaaattatt gggatcttaa tatagaaatt agtagaaata agccagatat ggtggctcat 10800
gcctgtaatc ttagcacttt gggaggctga ggctattcgc tgtactattt tttactactt 10860
ttctataggt ttgaaatttt ttcaaaataa aacattgaaa aaagtaaggt aggtagtgtg 10920
tccctcctta atcctttcaa atattttatt ttcactattt ctattaattt ttttttttgt 10980
ttttgagatg gagtctcgct ctgttgccca ggctggagtg cagtggcgcg atcttggctc 11040
actgcagcct ccacctcctg ggttccagcc attctcctgc ctcagcctcc tgggtagctg 11100
gtattacagg catgcaccac cacacccaat tactttttgt atttttagta gagacggggt 11160
ttcaccatgt tggccaggct agtctcgaac tcctgacctc gtgatctgcc cgcctcagca 11220
gtgtcactgc ttctagaccg ttttcaaggc acagagctta gaaatgcatg ttactaagaa 11280
atcaagagtt aactattttt caccttcttt ctcccgcagt gagaaccctg gttctaccct 11340
gtttctcctt gtgtaaattt taatgctaaa ctatacactt gtgaaataaa aatgataatg 11400
tcattcttaa attatggatc ttgcagtgtt atctaagtaa catagattga gtgatttaac 11460
tttaggtttc cttatttgtg gaatttggat aaatattttt cacccttgag aaaagtgaga 11520
ctcctttctc atcatcagag tatccttaaa ccattaaggc aaacatttgg gaaaaaactg 11580
agctatctgg ctgcataaaa attaagtttt ctttaacaaa gatagaagac aaatgaaaac 11640
ctagaaaaac catttggttc aagtaacagg aagctatctt atatatgaat tagagaaaag 11700
caaacacaca aatagaaaaa aagggatggg gggtactaaa gatataaata gcttgtctac 11760
caaaaaagaa ataaaataaa taacatgaac atataaaaag acacttactt catgaatgtg 11820
atgcaagttc aaacaataaa taacatttct gtactttcat attggctaag gttaaaatga 11880
taactgctag gaagggtatg gagaagtgtg cgccttgcac tgtagtggga gtatagaccc 11940
tcagacttta tggaggtcag tctggaaata tgtttcaaaa tgtaaactac atgtcctttg 12000
accaggtaat tcaacttctt gaaatttatc caaggattta attggataaa tgtttaagat 12060
gtatatataa gaatgtttac tgcagtgttg tttatgattt taaaaaaatg gaaatcatct 12120
tcatgtctac caatagagaa tgggtgaata aattatggta tgtccatata tacaaattac 12180
atagttgttg gaaatattag gtagatttag atatactgat gttcaaaaat gtccattatg 12240
taagtgaagc tgggtcacag caccttgtgt tgagtatgat ttcatctaga aacaaaatta 12300
ctccctcatc ctttgttgtg ttttagtttt ttaaaataag cttataccat tgggctgggg 12360
gaaaagtaaa tactcgtttt ggagagagaa aagggcacta aagtttcaga taccgttaga 12420
ttatttcatg cttatttttc aagcctcaat aaattacata attcacatgt agtcttggat 12480
taaggaaatt gctattaagg ctaaataaat aatatgagag gtatataata taaaatatga 12540
acattatatt ggcattaaga ttggatccac ggtcattcca gcctctcatt cttacctgga 12600
cttcaagtga tcacttgtgg gcaaatgcca tctgacttga acaggttaca catgtatgct 12660
cattatatcg ttattttcaa aatttgtcat ataaattttc cttgagttca ttcagatttt 12720
tgaactagtt ttttctcttg ggagtagtac acacttaatt ctctctagta ctaagctaat 12780
gttcaccatt cttataattt taagtatcca gcatttagta aagaagtctt tgttttcttt 12840
atccttactt ttagtgaatg tcttagtttt taattgaaaa ttctgccatg aaaataagct 12900
ctttaacatc ttcactccct aatcaaaaca gaaatccttc atagccttca gttgtagcta 12960
tccttccctg tgatttgtcc agctccatta tatttatttt gaaatatggt gaccagtttt 13020
gcaaaattat ttcaactgta ggtgcccagt gattttgtaa ggagaagata ctgtttctga 13080
acagttctca gtagccagtg gcctgcccct actttttggc ctgcgtgtag tatataaaat 13140
aatgcagtta actttttata gcacttttca ttttataaag agattttcat ggtctttaat 13200
attaatctat gtataaagtc ctgtatgcag ttttacctac tttcacagct gaaggaacaa 13260
tagcttagag aagatgtgag ataaagtagt ttgcccaagc ccatagcaca aataagtgaa 13320
gttcttcggc tgtccatgga tcgaagactc ccaagtctat ctctagcctg gacttctgtc 13380
ctgagcacca gacatgtatg tatatcaaga tgcctgcagg tcatatccac caggacaacc 13440
catgagtaca gggaattcaa catgcccaat atcactcatc ttttccttcg ccctcccctt 13500
tgtactcatc ccctgtcggt aagctctgtt attttaaaaa attgaaatgt attcacatag 13560
catacaattt acacttttca agtgtacatg gtttttagta tattcacaag ggttgtgcag 13620
tcattactac taattccaga atgttattat caccccaaaa gtcccacatc cattagcagc 13680
cactccccaa tcccttctcc caccagcctc taaaaactgc taatttttcc atctctgtgg 13740
atttgtccac tctgattatt tcatataaag agaatcgtac agacgtggcc ttttgtgtct 13800
ggcatcctcc acacaggatg atattttcag agttcgtcta tgtttttgct tgttgatcat 13860
tccttcattc ctttttctgg ctgaataata ctctgttata tggatatacc ttattttgtt 13920
tatctgttca tttgatgggc atttgagtga tttcctcttt ttggcaattt tgaataatgc 13980
cactataaac atttatgtac acgtttttgt gtgaccatat gttttcactt ctctcgggtg 14040
tatatctaag gtacagttgc tgggttatat ggtagctctg tctttgactt tttgaggaac 14100
tgccaagtgg ttttggtagt gattgtactg tttacattcc taccaacaat tttacctaag 14160
tatttctcaa atctatttaa tcttttcggt ccatactgct gttgctgcct tagttcagat 14220
tttgtcattt cttgtaataa ttcgtagctc atctcccagt ctctgctccc ctctctccct 14280
ccctccccct tcttctctct cttatttcca cccattttta acatttatag aagtcaaaag 14340
tctagttcag aaagcagaaa ccatactaga tatttcagca cagagaacta attaggtgtt 14400
ggaagactga aaggcaaaaa aacactgaag taacacagta acatcaagaa tgggcactac 14460
tcctaagatt cagggaatgc tgggaagatt tggggtttat cagaactgga agctcagagg 14520
aggggcccct tgtcgctgag gcttaatccc tgcagaggtg cctttggctg ctactggtga 14580
atctgagtgg gtatgatgag tcagtgtctg ggaagggcca aaacattttg tccctttcta 14640
taatttgtca tgataatgct agtaatgaat ctgatctccc ttcctatttt aaaaaccttt 14700
tagtgatttt gtataggatg aagtttaaaa ctccttactt aatatacaca tgaccctccg 14760
taagctggcc cctgcttgat tgtccagttt cacttcttgg tgcttattct aaggcctcta 14820
agccttagag atcctctaag cctttgagat ccccaaaccc tggactgcgg actggtaccc 14880
acctgtgtgg cctgtgagga actgggctgc acagccggaa ggaggtgagc attacttgcc 14940
ttagctcctg tcagatcggc agcattagat tctaatagga gcgtgaaccg tgttgtgaac 15000
tgcccatgca aggatctagg ttgcatactc cttaggagaa tctaactaat gcttgatggt 15060
ctgaggtgaa acagtttcat cctgaaatca cccccaactc ggtccttgga aaaattgtct 15120
tccacgaaac tggtccctga tgccggaaaa gttggggacc gctgttctaa gctaaagtta 15180
tatggagctc cttggttctg tgtcctcaac atgctgttct atgtttttta cattctgttt 15240
gctccttcct gcttggaatg tccttcccct ccccgtcttt cttaatgcat acaaagttga 15300
tctctcctgt gtgccaccat tgtacttcgt cttgcatatg gtgttacatt cattttattt 15360
taattattta tttacgttca tgtctcttcc actcacctta gttgcttgag gtcagaaact 15420
atataatgtg tgacacggaa tgtgacacct agattttcaa taagtgtttc tatgatacaa 15480
gggagactga tgtgggtaga tgggaatgaa ctcatcaacc tctgtttaca taccctaaat 15540
tccctgtttc ttccctatta taattctgac agtctacaac cgtctttgat ggcttataaa 15600
cggaaagtgc ggaacacatc attctacagt gaatttaaat aacctttcgg aagagtaacg 15660
taaagtactt gagcattaat tgagtaaaag tttctcatct tttcctacag gtgttattaa 15720
gcagtatgta aaaagtcctt acaatactta atacattaag aaaacataca atttcaagag 15780
gaaatccccg agtaatacat tattgacatt ttcagcagtt ctagttatat tgagaagagc 15840
atctcatgga attggcagaa tgaagatgga gattaaatga gatgatgttt gtaatatgct 15900
tatgacagta tctggcatat aagtaagggc tcagtaaatg ttgactgctg taattactat 15960
taatagtaat atgattacct ttagtaaaag ttattagttt ctttaggttt tttgtttact 16020
acaatatagt aaacaaaatc tatacttgga atgtatatat tgttttgttt tgatacatgg 16080
aatatgtctc tgtgtcagag tcactgcctg agttggaaaa cccatactcg agtatgttaa 16140
aaggtgaaca cactgaataa tttagttatt aattataatg gaaaaatgac aaacttgatg 16200
ttctggttaa tgaggttatc ttatcttgaa tgagttagct tttaaattcc tcaaaataaa 16260
ggcatttaat aaaccaggaa acacttcatt aaaaaaatta tgcaagtcag tgtaaaagaa 16320
gattaaaatt ccacatgggc aaaggacaca cgttggcgat aaatatgcag ataagaaaaa 16380
aaacctatat aacattatta ctcctcaaag aaattggtat gaaaacaata aaaatgtgta 16440
gcttatcaaa ccaacaaaaa tttaaaaata tgaaatccat tttaagtaat gataaaatgg 16500
gtgcactctt agtgctttat agaatagtag tataatgaac ctcatgtgtg taccaaccag 16560
ctctttcata tcttaacatt tagcaacatt tgatttagct ctttcttttt tccaagatag 16620
aaaagttaat attgttgaag actcctgcat tcttttccct agtcttattt tcttccctcc 16680
cataaatgtg ttaaaatctc tgtgtgtatt gttttggttg tatttttaca taaaacttta 16740
catattatat aaaatttaat tgaaggtaaa atttattaaa ttattcttaa tatatattgt 16800
aatttaaaaa ttaacagctt cattgtcttg ataaaattta tggtatctta aacatgtgct 16860
tgtttttcta agagaacatt gaaacataga ttttaaaaca aattgttgaa agattaaaaa 16920
atctgccttt gcacactgtt acattgaaag tggggcattt gtcgtgaaca ttcatttcaa 16980
atatgtagta tcttcagaat atttgagaag gatttgtatt atataattga aaaatctgtt 17040
aaattgtatt tatgttaact gcttaattct aataaaattt ccattcattt tttagtatct 17100
gcatatattt acatcaaatg gattcattca cttatttaag aggcagtact aattacctat 17160
agcgttcaag actgttaggt agagggtgtg tagtggtgag tacaacaggc gtgagcccta 17220
ccaacacgga gtttaaagcc tagtagagga tatagactta aacaatttca caagtaaata 17280
cataattaca aattataata catgctatga aggaaacata ggaggtacca gagaaggaag 17340
agtgctttgc atttttattt ttaagaccga agagtgctat tggaggactt tgagcaagtg 17400
aatgacatga tctaacctac cttcgttcat tcattcattc attcattttc ttccttcctg 17460
gctcaagcag tcctcccacc tgagctcccc aaatagctgg gactacaggt acacactacc 17520
acacctaatt tttttttgta ttttttgtat ttttgatggg attttaccat gttggccagg 17580
ctggtcttga actcttgacc tcaggtgatc cacctgtctc ggcctcccaa ggtgttggga 17640
ttataggtgc ctagcccatg gtgcctagcc ctaacctaca tttataaact atcacttgct 17700
gctgtgtgga gactatattg tgagattaac agcagggata cctgctagga agcaattgct 17760
gcagattgcc tgagacaaaa tagttatcat ggactagggg gatggtggtg gtggtggtgg 17820
taggtggttg gatgtaggat atattttgaa gataggtaaa tggtgcaaga ttatgggtca 17880
gttttaaatg cttaagtaaa ttttctttgt aagacatttt aggatgccat gttaagaatc 17940
tctttataac tgtcatttaa aaaaaaacca catattttct tagcataatt tcccatagta 18000
acattactat gtcaaaggct atgaacattt gaatgacttt agataaatac tgtaattgct 18060
ttccaaaaat attgtgctta ttatgtcacc agaaatgttt gaattctgtc tacaattcag 18120
tcttgccagt atagtacatt tcatttagaa aaatttttta ctatgtagat ggaaaaaata 18180
atattttagc tgggagtggg gggactatgg ggaataactt tccttcattt aatattttat 18240
tgtgagttag tttaagttac tttattttat cgtagtttcc taaggctaca aattagtaac 18300
cttggtaact tatgtaccta atttaaaagt ttactttttt gaaaggctgg aaatactaat 18360
taaaaacgta acaccttcat ccttgtcttt gctccattat taactagttt cattacagaa 18420
tctctgtgtt ttaaaatcag atgggttttc ataaccagta ctttctcaga gtggtaaatt 18480
taaaaaaata tataaagaga ataaataata tttgttgaga atacttcaaa taatgtgaag 18540
agttattaac ttacagcagg agttggcaaa cttttctata aagggccata tgggtctttg 18600
tcacaaagtc ttgggttttt gtttttgttt ttttaaacag ctatttaact attcctagct 18660
aatgggcaat acaaaaacag tgggcaagat ttggcctgtg ggcagtagct tgctgaaacc 18720
ttatttagac tctaaatttt ttgaaagagt ctacattgat gcatattttt ttttcttcct 18780
ccaaatacag ttgacccttg aacaacatgc gtttgagtga ccatgggtcc acttgtgata 18840
cacgtttttt tcccaaccaa atgcagatat ggagggctga cttttcatat acctggatgt 18900
tcctgggcca actgtaggac tagaggctgg gggggtcttg gaaccaatgc cgtgtgtata 18960
ccagggatga ctgtttctta tggcctgacc tgaagttgga acagaatctt tattaatata 19020
taatttttgt tgcgtttgtt ttctctttat atttatccat tctttttaga tcgtatttca 19080
tttaacactt tttcttcttt agtttttacc aagttgcact gaaaatagct cagtgactaa 19140
ttgcacttct aagagtgagg accctagtta aaattaactc taaaaatact gaatttttaa 19200
cctaaacctt ttatttctaa tcaacagtat tatttatgag taggttatag attactttga 19260
aacggaatgt gtctcagaac tttgctatcg atatttttaa ggtctggtag ggaaaagata 19320
ataggaatga gatttatcag tgaatagggg actgctttcc cagtttctcg gtcgcactgg 19380
tgtattcacc atggaagcat cttatgaaat atgtacataa actactaata tcccacatta 19440
caggttgact attctttatc tgaaatgctt aggacctaga agtatttttg gattttggtt 19500
tttcagagta gggatactca gcctacattg gtaagtaaag aatgtgaggt gacaggctgg 19560
gcgcgatggt tgacgcctgt aatcccagca ctttgggagg ccgaggcgga tcacctgagg 19620
tcaggagttg aagaccagcc tggccaatct gtactaaaaa tacaaaaatt agctggacac 19680
agtggcacgt gccagtagtc ccagctactc aggaggctga ggtaggagaa tcgcttgaac 19740
ctgggaggcg gaggttgcag tgactcgaga tcgtgtcact gccctccagc ctaggcaaca 19800
gagcaagact ccatctcaaa aaaaaaaaaa aaaaaaaaaa aaaagaatgt gaggtggcag 19860
caataggtag gaagagtctt tggtcagctt tacatgctct gtagccatgc ctgggtaatg 19920
ggttgactct aagactctgt gctttgctcc cacctcctgc tttttcatta ctctttagaa 19980
tggtttttaa tttgtgatct ataggagttc tttcaagtat ttaataagag aataggctaa 20040
attaagtaaa tgtcaactga atgctcaaat ctctactaaa gagcctctta tttagaaaat 20100
aaatatccat cttttttttc tgactggtga gataattaat ttttattaca gatggtttgg 20160
aaaataccat atgctttaaa agataagcac aaaattatag tctaatatgt aggttttcat 20220
actttaaaaa attgaaaacc aaagaaaaac atttaacata gcatctagta caaagaaaag 20280
agataagcaa gagataaatg tcttttttgg gacagagttt tgctgttgtt gcccaggctg 20340
gagtgcaatg gcacaatctc agctcaccgt aacctccacc tcccgggttc aagtgattct 20400
cctgcctcag cctcccgagt agctgggatt acagtcatgc accaccaggc ccaggtaatt 20460
ttgtatgttt agtagagatg gggtttctcc gtgttggtca ggctgatctc aaactcccga 20520
cctcaggtga tctgcccacc ttggcctccc aaagtgctgg gattacagac atgagccatc 20580
gcacccggcc aagataaatg tcttttaaat tatctccatt aaagacataa cctttataac 20640
attttgatgt atatattacc agtttttaaa cacatagtag atttgtataa atacataaac 20700
acatattatt gtgatcatgc tgcacttaga catctttata ttctccttat actgtaaaca 20760
ttttgaaata ctttactaac aacatttgta atgaccattc tttctctctt tctccctctg 20820
atagaatggt ctacagagta attcataaac taaacatact ttagaggctg ggcgcagtgg 20880
ctcatgcctg taatcccagc actttgagag gctgaggcgt gcagatcacg aggtcaggag 20940
ttagagacca gcctgactaa catggtgaaa ccccatctct actaaaaaaa cagtacaaaa 21000
attagccggg cgtggtggcg tgcacctaga atcccagcta ctcaagaggc tgaggcagga 21060
gaatcactcg agcccaggag gcagaggttg tagtgagccg agattgcacc acagcactcc 21120
agcctgggcg acagagcgag actccatctc aaaaaaaaaa aaaaaagata cattaatact 21180
atagcctaca tgtggaacat taagaaaata attgctttta tgtttatgct ttatacctgt 21240
tgttagccct gcttcttatt tcatgatttc atggcttcac attgtaacat ccctttacca 21300
tattttttga ggactgtttt ggcagaatgt gtgaaatctt gagcagaagt attacccaaa 21360
agtcagaaga aaatcagatt tttatttcaa gattctgtta aagttaccca ctcccttctt 21420
ttacttaatc ttatagttgc agttctctct ctttttagaa aagaaaaaag aggcccctca 21480
ggatttgcag atgaaacaat attgctcttt agagatatcc atctggctgt tagattattt 21540
ttccacagtt ttcagaagtg gatgaggcca ttagaatctt gagtattgcc catttcctta 21600
tgtgtgcctt tgactataga taaaatagat gcatgacaat tatttataag ttgattgatt 21660
tttcttgtca tttaaatcat cttgaataat agagttggta gagctatccc atttttgaaa 21720
ttattttgtt ttgtcaataa ctttttgtta ccagcatgta cacttgcatt gttgactctc 21780
catataatac ctttaaaaaa tttttttttg tggtaaaata tgcataacat aaagtttacc 21840
atggtagttt tctttcattt gttttgtttt tgtttttttg agacggagcc ttgctctgtt 21900
gccaggctgg agtgcagtgg agcgatcttg gctcactgca acctccgcct cccgggttca 21960
agcaattccc ctgcctcagc ctcctgagta gctgggacta caggcgcccg ccaccacgcc 22020
cggctaatat tttgtatttt aatagagatg gggtttcacc atgttggcca ggatgttctt 22080
gatctcctga cctcatgatc cgcccacctc ggcctcccaa agtgttggga ttgcaagtgt 22140
gagccaccgc gcctagacca tggtagttaa ttttaagtgt tcaattcagt gaccttaagt 22200
gtgttcataa tgttgtgcaa ccatcaccat gttgtctaac cattagcact atctgttttg 22260
agaacttttt tttatcatcc caaattagaa ttctgtacct gtcaaatagt ccccagtaat 22320
cctccctccc ccagcccctg gtaatctgta gtctactttt cgtctttttg aatttgccta 22380
ttttaggttc ctcatataag tggaattatg tggtatttgt ccttttgtgt tggcttactt 22440
catttagcat aatgttttca aggttcatct gtgttgtagc atgtatatac aggttgaagc 22500
atccgttatc caaaatggtt gtgaccagaa gtggtttgga tttcagattt tttttttgga 22560
ttttggaata ttcatagata cttaactggt tcagcatccc tcgtccaaaa atccaaaatc 22620
agatggagct cagtggctca tgcttgtaat cccaacacgt tgggtggcca aggcaggagg 22680
atcgcttgag cccaggagtt caaccagcct gagcaacaca agaccctatc tctccaaaaa 22740
aaaaaaaaaa aaaaaaaaga tgaaagaaaa aaaaatccaa aatcaaatgc tccagtgagc 22800
atttcctttt agcatcatgt caggctctaa aagttacagg ttttggagca ttttggattt 22860
cagatttttg gattaacctg cattaatgct caacctatat gaaattttat tcctttttat 22920
ggctgaataa tgttccactg tatgtatata ctacattttg tttatccatt catctgttaa 22980
cagacactta agttatttcc acattttggg tattataaat agtgctgctg cgaacattgg 23040
tgtacatgta tctgtttgag tccctgtttt tagttatttt ggttatatac ctaggaatgg 23100
aattgctgat catatggtaa ttctgtgttt aactttttga ggaactacca ctgttttcca 23160
caatggcatc accattttac attcccacca gcaatgcaca aagatttcag tgtctgtatc 23220
cttgctaaca cttattttcc attttttgag tttttttgtt ttgttttttt aataatagcc 23280
aatcctaatg ggtatgtggt agcatctcat ggttttgatt ttattttcct gactattgat 23340
gatgttgagc atcttttcag gtgcttagtg gccatttgtc cgtcatcttt ggagcaggaa 23400
caatgtcttt tcaagtcctt tgcccatttt taaattgaat tttttgttgt tgagttgtat 23460
ataacacctt ttttgaagta aaaggtgcac tgtaataatc cagactgtgt ttctcccttc 23520
tcaggattcc tacaggaagc aagtagtaat tgatggagaa acctgtctct tggatattct 23580
cgacacagca ggtcaagagg agtacagtgc aatgagggac cagtacatga ggactgggga 23640
gggctttctt tgtgtatttg ccataaataa tactaaatca tttgaagata ttcaccatta 23700
taggtgggtt taaattgaat ataataagct gacattaagg agtaattata gtttttattt 23760
tttgagtctt tgctaatgcc atgcatataa tatttaataa aaatttttaa ataatgttta 23820
tgaggtaggt aatatccctg ttttataaat gaagttcttg ggggattaga gcagtggagt 23880
aacttgctcc agactgcatc ggtagtggtg gtgctgggat tgaaacctag gcctgtttga 23940
ctccacagcc ttctgtactc ttgactattc tacaaaagca agactttaaa ctttttagat 24000
acatcattaa aaaagaaaac cataaaaaag aatatgaaaa gatgatttga gatggtgtca 24060
ctttaacagt cttaaaagca atcgtgtgta tagcatagaa ttgcttggat tggataaaca 24120
gtggcattat atattttaaa aaataaaagt tttgaaagat tgaagaattt gggcattaca 24180
gttctcttaa atctgacaaa gctgcataaa actattaaaa taatcattat tatactattt 24240
tatattctat ttctttgagg gtttagtttt ccaaaaacta catattaagc aaatgaatca 24300
ctcagtggct atgtcatata ataacgagtt agcctagtta taagaagttt aacattttat 24360
ttaagaacat tgttacagca tgtttactgt atagtctagt aatagaggaa aagacatttg 24420
ggtgggtggt agtggtagta tttttataga ggagttacca aatttcagct ctattatcca 24480
agtttaccca gctaatggtg ttcggaaccg ggaatttgag ccaattctga ctctgttgtc 24540
tgctctgctc cttcttttgt gctgtgtctt tgaaagtcac ctaaaattgt gagggaatgt 24600
aatttcaccc caaatttaga gtttatgcac ttgttatatt gaaaatgatt aacatgtaga 24660
agggctttta atggaataag tggtgtagta acttcagtgt tgcctaccta gaaatcaaaa 24720
tctttctagt tgtccacttt gttttttgaa aaagtaatat gaaaattatg ttaatgcttt 24780
aattcaggtt tttgtaaaat attttttatc tttacacatt taacatacgt ttctaaaatt 24840
atagtctgtt atatagcact ttgggtctag aatttttcag tagtttctgt tttactatta 24900
tgatctacct gcatattaac ctattaggtt atagttttac tatacttcta ggtatttgat 24960
cttttgagag agatacaagg tttctgttta aaaaggtaaa gaaacaaaat aactagtaga 25020
agaaggaagg aaaatttggt gtagtggaaa ctaggaatta cattgttttc tttcagccaa 25080
attttatgac aaaagttgtg gacaggtttt gaaagatatt tgtgttacta atgactgtgc 25140
tataactttt ttttctttcc cagagaacaa attaaaagag ttaaggactc tgaagatgta 25200
cctatggtcc tagtaggaaa taaatgtgat ttgccttcta gaacagtaga cacaaaacag 25260
gctcaggact tagcaagaag ttatggaatt ccttttattg aaacatcagc aaagacaaga 25320
caggtaagta acactgaaat aaatacagat ctgttttctg caaaatcata actgttatgt 25380
catttaatat atcagttttt ctctcaatta tgctatacta ggaaataaaa caatatttag 25440
taaatgtttt tgtctcttga gagggcattg cttcttaatc cagtgtccat ggtactgctt 25500
ttggctttgg tttctttcta cattgaaaat ttctcttcaa ttctgagcac atgttaacat 25560
ttagaattca agaggtgggg attttttttt cccatggtta catatatata tatatatata 25620
tatatatata tatatatata tatatatata aagaacaggg caacaaattt ttgcgttttc 25680
tatttcggta gtacttttaa accattatgt catgtttcta ggttaaacgt tgttgtattt 25740
gaagaatttt actttggcag aatttttttg aggatgtgtt tatttctgga gaaaggtctc 25800
attaaagaaa gacaataccc agaaagccaa cagaaattct gttactcatt taatgcattt 25860
ttctgacaaa aattattgcc agagagaacc tgaattttgt ttcaaaaatc atctttgttt 25920
taaaaatgac tttttcttca ggtaaaataa aataatttca gttgctatta tttaacctgt 25980
ttgtatgaag agtttaacat ataggaaatg aatacataaa gataggaagg aattaattgt 26040
tatatgtagt catatgtctc ttaatgacag ggatactttc taagaaatac attgttaggt 26100
gattttgtca ttgtgcaaac atcatagaat atacttacac aaaccttggt agtataacct 26160
actatacacc tgggatatgt agtatagtct cttgccccag ggatacaaac ctgtacagta 26220
tgtaactgta ctaatgacta taaggcaatt gttaacacaa tggtaagttt tgtgtgtcta 26280
aacctacact tgggctaccc taagtttata tattttttta aatttctgtt caataataaa 26340
ttaaccttac tttactgtaa ctttttaaac tttttaattt ttcctaacat tttgactttt 26400
gtaatacagc ttaaaacaca cattatacag ctatacaaat ttttctttcc ttatatcttt 26460
attctgtaag cttttttcca tatttaaaat tttttgtttg tttttactta ttaaactttt 26520
ttgttaaaaa ctaagacatg catgcacatt aacctaggcc tacacagggt caggaccatc 26580
aatatcattg tcttccactt ccacatcttg tcccactgga agatcttcag gggcagtaac 26640
acacgtggag ctgtcatctc ctataataac attgccttct tttggaatac ctcctgaagg 26700
acctatccaa ggctgtttat agttaacttt tttttttttt tttttttttt tttagtaaat 26760
aggaggagta cactataaaa taacaatata ggtgctatac cattatacaa ctgacagtgc 26820
agtaggtttg tttacaccag catcaccaca aacacgtgag caatgtgtcg tactacagtg 26880
ttaggatggc tataacatca ctaagcaata ggaactttta aactccatta taatcttatg 26940
ggaccactat cacatatgca atctcctgtg gaccaaaatg tcattatgtg gtacatgact 27000
gtactaagaa attgatccat ctatattcca tcaatttgtt tagggctttt tctggttaca 27060
tttacctgtg agcccagaaa accagttttg tagaaattaa cttctgtaat gctaggagtt 27120
aaaaaaaatt gctgaacaac ttttacattg ttaaacattt aaaaacaagc gttctagaag 27180
tttatcaaat ttcataaagg tgcaaaaatg taaatgtaaa tcattatcca gctaatatat 27240
atgttgtatt tccctagtag gagagcatat gtacctcttc ctagttatac aaatttgata 27300
tatagtaaag aaacagtaaa ttctacttca agtcattttg ggaggattaa aaactgaatt 27360
tctctagttt gaccattgta cagatttatc tggcaatttt actaaaacct gatttatagg 27420
ttaaacttgg tgtatatcat atatcacttt actttagagg aattaagatt tcacataaat 27480
ccatttccag gttccaaaga ccaggaagag gcttggtttt tgtttttctt tttactgtct 27540
ttacagtctc cttgactttt cttaggagag aaggtactga gaaaacatga ttctaatatt 27600
tattattttt tcttccaaca ttttcttatg aaacattttc aaatacaaaa ttgagtttta 27660
tttaaaacat ttgcaaatat actacctaga ttctaccatt gttgttttat atttgcttta 27720
cttacaactt ttaaaagatg ctttttatac cactgaacat tttagcttac atttcacaaa 27780
gaaaagaaaa aatttaagag actttgcata atgttttaag gggttgcagt aaagaagtgc 27840
ttcttatatt ttcttatgca tacaaatcag ctgggcttat taaaatccag attctaattc 27900
agaaggttta ggtggggacc gagtctgcat ttctaacaaa ctcctaggtg gtatttttct 27960
tggtacttgg accatacttt gagtagaaaa gcagtagagg acataaaaag agtcttgtta 28020
gtcccacttt gttgctgtcc acttctcatt tgataatatc ctaaaatagc tgtgtctcct 28080
ttttggtggt tgtatgatta ctacctcaga agtactaatt gattcttgct atttgacctt 28140
aatactttaa tataacacag cattcatatt tgatcagaaa actatctggc ttccttttat 28200
aagagatttt taggttttat acagttttgt ggccttgggt ttttttgttt gatttgtttt 28260
tttgaaggta tataatatgt aagtagataa acaaatttga tttgtagaca tttttatgtg 28320
gatcatctaa ttaaaaatgg agggatacag tatgaaagaa tacttgtact tcttaacaga 28380
gcactcaacc tttcttttac atcctgtttc actgatgtta ttatgtaatt tatgttgcta 28440
aactataaat tagatattta atttctgttc tttgatttcc ttttattatt aaatggactt 28500
gttgatttgc ctagaaatta atttgccttt caaaagtctt attaatcttc ctccgttgaa 28560
attaatttga tatttgcatg cttctggaag actttaaaga gctattccga gtaactgtag 28620
agattataaa atgaaatatg ggaattttaa taaattttac atctccagtt actggtgaaa 28680
atgtcaagtc ctcctttctg cagagtattt tgttactcat ctgttattca gcttatttat 28740
ttatttattt atttatttat ttttctttct ttcttgtttt ttttttttga gacggagtct 28800
tgctttgtcg cccaggctgg agtacagtgg tgggatcttg gctcactgca ggctccgcct 28860
cccgggttca caccattctt ctgcctcagc ctcccaagta gctgggacta caggcacccg 28920
ccaccatgcc ttgctaaatt tttgtatttt tagtagagac gggtttcact gtgttagcca 28980
ggatggtctc gatctcttga cctcgtgatc cacctgcctc ggcctcccaa agtgctggga 29040
ttacaggcat gagccaccgc gcctggccct tatttgtttt ttaaacaaaa ttagtgtgca 29100
tatccttgtt gtattttatc ggcaagttgt tttatgccct aacttttggg gtcttgatca 29160
tgagcctaaa acacgtaaac acccaaaaag aattatattc cggttaaagg aacaaaacat 29220
tcatttagaa gttctcatcc atgtaaatca gaggctggca aatattttct gtaaagggcc 29280
aagatagtaa atgttttagg ctttgagggc cacaagtggt atctgttgca ttttttttta 29340
attatgaccc tttaaaatgc aaaaatcgtt gttagcttgt gcatagtata aaaataggct 29400
ggccgcatgc tgtggctcat gcctgtaatc ccagaaatga ggtgggaagc cgaggtgggc 29460
acaccacctg aggtcaggag ttcgaggcca gcctggccaa cgtggttgaa accccgtctc 29520
tactaaaaat acaaaactta gccaggcgtg gtggcgggtg cctgttatcc tggctactca 29580
aggggctgag gcagtagaat tgcttgaacc tgagaggcag aggctgtagt gagcccagat 29640
caagccagtg cacaccagcc tggacgaccg agcgagactc tgtctcaaaa aaaaaaaaaa 29700
aaggctgtgg ctgcatttgg tccattggct gtaatatgct gattcctaat tctctgggta 29760
actttagtgt ttgattagct actagaagtt aggttaaact tttgtatttt acaggctaac 29820
tttaataatc ttaaagtaaa acttaacata gttcatggaa aggaaataga aattttaccc 29880
tagtactctt tttttttttt tttttttttt ttgaggcaga gtctccctct gtcacccagg 29940
ctggagtgca gtggtgggat cttggctgat tgcaacctcc tcctcctggg ttcaagcaat 30000
tcttgtgcct cagcctcccg agcagctggg actacaggca cgcaccacca cacctgactg 30060
atttttgtat ttttagtaga gacagggttt cgccatgttg gccaggctgg tcttgaactc 30120
ctggcatcaa gtgatcctcc catctgagcc tcccagtgtg ctgggattac agacgtgagt 30180
cactgtgcct ggtctctagt attttttttt tttttgagac ggtctcactg ttgccaggct 30240
ggagtgcagt ggcgcgatcc tggctcactg caacctccgc ttcccggatt caagcgattt 30300
tcctgcctca gcctcctgag tagctgggac tatgggtgca caccaccacg cccagctaat 30360
ttttgtattt ttagtagaga cggggtttca ccatgttggc caatatggtc tcaatctctt 30420
gacctcgtga tctgcccgtc tcggcctccc aaagtgctgg gattacaggc gtgagccact 30480
gtgcccagct gtacttttta agataagaat tgcagggtat atatttttac caacttaata 30540
acttataatt ttaaaaagct aattacttgg ctagaatata atgcgttaca tattctttac 30600
actcagttca gtccatatct gaaaggcaaa tagaattatt ttctgctagt acattgtgta 30660
gtccctatgt tcctagtgta taaggactgt tacctagttc acatttatct gggttgttga 30720
cagattttcc tggtcccttt ggacagtgca tggccatgtt ggcaaaagct gtcaaaattg 30780
aaacattgac accatgagaa ttgtgtgttt tccagtctgc taaaatcaaa agtgggaggg 30840
ttcagtaagg tgaataacag aagcagagtt ttcggggtat ctgttactcc tcattcggct 30900
tttctgctct ctgggggtct caatttaaat ataatgtgaa aattagtttt acgaacctaa 30960
aaatgttgag tgattcattt cctggttttg ttgttaattt ctagatattt aaattaattg 31020
ttagaagaac cccgttaaag aatgctttgc aaaacaacct ccttatgtgc tatgtctctg 31080
tttaatagta gttgagtttg tgtacatgag atcaatattt tgaactatag ctttttatga 31140
gttaaaaatt gacggaacag ttactgtgca cttgctgtgc accatggtag tctcccaagt 31200
agtggttttt ctgcatttca atagtacatg agataggctg tgggtggcaa ggtttcttga 31260
gaaagtgagg gatgcacagt tgggttttag aatacatctt gttcctccat gcccttcccc 31320
accaaaaggc tggtagtctt gcatttgtat atagttaggg tatttgatgt gttgcttcct 31380
tgacagagtt ttgcaagaat ttgcagattt aacaggaaca aaaacttact taaaacaaaa 31440
tctcttagta aaagcatagt ctagcaagat ttagaatgat actttggcta acagtacttt 31500
ctctatatgg agtgctttgt ttccatagcc tcacaagtat gttttcagat aatagttgag 31560
ttgaaaatgt tgtcaatctc ttgattttaa aaaatttaca tatttaaagt tgtatacttt 31620
tgttcctacg tattttcagt tgttcttaaa gtttaataag tgacatttga aaatgagtat 31680
atgtgtataa aaacaaaagt aggctaggca cggtggctca tgcctataat cctagcactt 31740
tgggaggctg aggcaggcgg atcacaaggt caggagtttg agaccagcct gggcaatatg 31800
gtgaaacccc cctctactaa aaatacaaaa attagctggg tgtggtggtg catgcctgta 31860
gtcccagcta ctcaggaggc tgaggcagga gaatcgcttg aacccggagg tggcggttgc 31920
agtgagccga gattgcacca ctgcagtcca gcctgggcgg cagagcgaga ctccatctca 31980
aaaaaaaaaa acaaaaaaag aaaaagttaa aaaaaaacaa aaaaccccca caaaatgagt 32040
atatgtggca acaagtccta ttctcaaaaa aattattgtg tgctagttaa gagcttaatg 32100
agtagccagt cggtattaaa tatctgtttc agctatattt tatctttaaa aattatctac 32160
agattttgga atgtgaaaaa ctagtgtttt gtttcatagg tatatactgt aggcatttta 32220
aaaataagag ccagtgccag tggtttacag tgtacacaag gataatgttc tcatgttctc 32280
ttgatgtcag tatgacttta aagcatatta tcaagaaata actaagtctg aaaaactgtg 32340
gtaaataact ggtactctaa aacctaagtt tcttattact aaaaataaga aatggtaaaa 32400
gtcaccctgt gctgttaatt atatgagcca ctgaggtcct gacactgaat tcttggtggt 32460
ggataataat ctcttctttt taattattgg cttccaattc tctctgcatt gctggaaaca 32520
aaaatcatat atttcactat tggtggtggg gatgctgtca ctgaaaaagt agacacattc 32580
atattgattt tagaaataag ttaaaatcaa aatttgcttc tgctaaatta gtagaggacc 32640
aatactgttt ttctccttca tagtatgttt tggtacttct acattgacat tataactttt 32700
ttttttttaa acagaaatag aagtttacat tcttagaaaa tttatgaaaa tatgagcttt 32760
tacctggttt gtgtgtgtgc gtatatatat acacatattt ttaaatttct tacattgatt 32820
ttcaaattga aagagaacca tttgtgaaag tatcttaaca gagctcatgc tttacatttt 32880
acatgctaca aagttatttt agtgccttaa attatttatg ttgcttatta atgaaaattt 32940
tggatacata attttttcaa gacaaaggta aaaataataa accctttcct tctgaggatt 33000
aatgataaat ataaacttta aaacgattaa aaaaattttt ttagagacag ggtcttgctc 33060
tgttgcccag actgaagtgc agtggtgcag tcatagctca atgaagcctc aaactcctgg 33120
gcccaggcaa ccctcctgcc tcagcctttt gagtagctgg gacttcaggc tcatgccaac 33180
atgcctaatt tatcttattt ttagtagaga tgaggtctca aactcctggc atctcttgcc 33240
ctctcaaagt gctggtacta caggcattag tcaccacacc tgacacttaa aatcttttat 33300
atacaggtgt aagtgggtat ctaacttaaa gtgccaacga atgtagttga aagtttgtag 33360
ttggcttagc taactagtta actaaattga ttccattaaa aataagataa gactgctctt 33420
agaatataat gatttttgtt attcgttaaa tataaatata tcactggata gtatatgtta 33480
atgacttgag atacgcattt taacatataa tcacgttact taaatgcctg cctttgaact 33540
gaaacttaac attatgaatt taaattaaag tttgacttta gaggtaaatt tctgtacttt 33600
actaaagcag ttcttaatat aattctgaga tttctaaaaa ttagtgtgcc ctaaagaatt 33660
gaggtgtgtt tttcttaact actgtaggca gtagatgtac agatgacttc tgcatgcaaa 33720
aattaagccc tagccattgg tttacttcaa ctaatactta gttgccaatt ctctgtgtgt 33780
gattgaattt aaaactgcaa atggtactgg tgatacatta actttttagg tgctaggtcc 33840
actttgttac atttggttca gtagaaacat tgatgttacc aatctcagaa agctaaaata 33900
tgtatgccaa tccccaaatt aggtaattta ttcttaattt taagataaaa gaatagaatt 33960
cccttaaaat taaatgtgga gtaaaatata ccagctttaa aaaatattca cctttctgtt 34020
agaagaatga acataatatt acatctttta atttgcacta tatatagatt aatatttctg 34080
tgtatttctc tgtgccccta ctttgatggt atgcttttct gaacaaacta gcagcacagt 34140
taactaagca ctttgccccg tttgatgact gcctaatttt ctagattgga aaatattaaa 34200
aacttttatc tccatatggc caatatatga ttgtacctgt tgtcatagct ctcttatgtt 34260
taagcaagaa aaaccctatt aagagtattt aaattagaat ggaaggcaca cagccagtat 34320
gattgaacac tgttctaaaa attattttta agacttgtag taaggccagg tttggtggct 34380
catggctgta atcccagccc ttaggaggcc aaggtgggcg gatcacttgt gctcaggagt 34440
ttgagaccag cccgggcaac atggcaaaac cctgtctcta cgaaaaatac aaaaatcagt 34500
caggtgtggt ggtgcttgcc tgtagtccca gctatttgag aggctgaggc agggggatca 34560
cctagcctgg gaggtcgagg ctgcagtcat gatcgtgcca ttgcactcca tcctgggcaa 34620
cccagtgaga ccctgtctct aaaacaaaaa aataaaaaaa gaacttgtag taaggataca 34680
aaatgctcct attttgtgtg tgtcctttaa ttcatgatgt ttttatatta tggtaagcag 34740
ctctcattta agattttaat aatgtaatta aacatgtaca gaagacccag tctcagcttc 34800
acttgtatac cctggaaata gactgaaagg tgttaaaatt taagataaaa ctcaaggttc 34860
cagtttcttg actcaccttt gagattcttt tatgtttttg ttgtttttta acaaaggttt 34920
cacgtccata ttttaccatt tttcttctca ttctcccctg gaggagggtg tgggaatcga 34980
tagtatataa atcacttttt tcctaagtca aagaagtaat ttaaagctaa cttcagttta 35040
ggctttaatt ccaggactag caaactaaaa tggttgcatt aattgacaaa cagatgctaa 35100
tacctgtgtt taggcttgtc ataatctctc ctaattccta atttaaaaat tttaaaattt 35160
aattccatta gaaaacaaaa ctgactttta agaacaaacc aggattctag cccatatttt 35220
aaaactgcat cctcagtttt attcaaacag tctgatgtct gtttaaaaaa aaaaaaatct 35280
caagctcata atctcaaact tcttgcacat ggctttccca gtaaattact cttaccaatg 35340
caacagactt taaagaagtt gtgttttaca atgcagagag tggaggatgc tttttataca 35400
ttggtgagag agatccgaca atacagattg aaaaaaatca gcaaagaaga aaagactcct 35460
ggctgtgtga aaattaaaaa atgcattata atgtaatctg gtaagtttaa gttcagcaca 35520
ttaattttgg cagaaagcag atgtctttta aaggtaacaa ggtggcaacc actttagaac 35580
tacttaggtg tagtattcta acttgaagta ttaaaagata agaaacttgt ttccataatt 35640
agtacattta tttttaatct agtgggaatt aattataatt gagacaattt tgatggctgt 35700
agtagactaa tctatatttg gcataaagtc taatgattta atgagtctta agtaaactaa 35760
atatttggaa actgatattt acctttattt ttaagggaaa agttttgaga taatcagcag 35820
cttttttttt tttttttttt tttttagtag ggagaaaaag atatgagcta tagtagacag 35880
cagtaatatt gaatggccca gaaggtggga aaaagccact cttaaatgta ttttttcttt 35940
tggatatttt acaagcaaat aataacttct gcctaagttc gccatctcag tggcatcagc 36000
agcacagcac tttcttatcc cagtgagaaa cctgggaatt ttaggatgac tcctaccgcc 36060
ctcttttccc cctggtttgg aagtatccac aaattcctgt gacgttacat tctgtgtctt 36120
ttatgtcatc attagttcag gcccctatca tttcttgttg gactgttaga acctcctatt 36180
tggtttacca gttgctgcca tcattcattg tgaaaccgga gagatacact ttaaagaaat 36240
gtcatttttg gccgggcgcg gtggctcacg cctgtaatcc cagcactttg ggaggcctag 36300
gcgggtgatc acctgaggtc aggagttcaa gaccagcctg gctaacatgg tgaaacccta 36360
tttctactaa aaatacaaaa aattagccgg gcgtggtggc acgtgcctgt aatcccagct 36420
acttgggagg ctgaggcagg agaattgctt gaacctggga ggcagaggtt gcagtgagct 36480
gagaatgcac cattgcactc cagcttgagc aacaagagcg aaactctgtc tcaaaaaaaa 36540
aaaaaaaaag tcattttagc tatagaataa aatctcatgt tccacatgtg ttgcagatag 36600
tccttactac cttcccacca ctccagctct tttttggtct tatatctaaa aacgtcatct 36660
tgcctgaatt tcttttgttc ttctataaat aaataccatg ttatttccta ccttcccttg 36720
agtcttggct cttgtttgga atgccagtat ttttatccct agtcttacta attagctaac 36780
actctcatga ttccccagtc tcctactctc taaaaacctt tctttaaacc cttagactag 36840
gcatggagcc cttcctgtgt attcccagaa tactattctt aactattata tgcttcccat 36900
gttatgttga aataactaac ctcttctgtt tcattcctat attacttgac agcaaaatct 36960
tagccagaat tacatatttt taatctttgc acacccattg cctagtaagg ttcctgggac 37020
atagtaacta cccagtaaat atttattgcg tggaattctc attttcgttt ctaaacccgt 37080
attaaactct gtcttgctca gaaaatactt cactaggtat cataaagttc atggcagagc 37140
ttaagctttg gatgcatatt gtttgtaata tatcatgttc ttaagaatag gcaataaaat 37200
tacagttttc aaaaactact acatttatta tatttattac aagttggtgt tctttattac 37260
atgaatttta ggtatttccc aaaagtataa aatatacatt tgaatagtag actcaatccc 37320
aaaagatact acgtggtgta ctaatctact aaactcagaa acaaagcatg actggcatta 37380
atttttgttg aaatttatga actctgaatg tttttgaata tcattctgta aagcaatatt 37440
ttgcaattaa agcaattttg catgttaaat tttaccacaa cctctaaaat attgcaaatt 37500
taacaataca gtttgaaaag ttacacattt taaataacag taccatgacc agatttaggt 37560
ggtggtttta attttttatt ttctcctcct attgtctcac cattagatga ttttaaaaat 37620
agaattgttt agagtaaaat aagtgttatg ctctaattta tatttaaaat gaaggtttaa 37680
gcacgtacta ttctaaaatt tctaatttgt gcaaattatg ttttatacag tgactgtagg 37740
tgaatgtcac aattgtttga tgtgacgaat ccttgttttt cagtacacgt ggaagtaatt 37800
catataaaag agaagtatac ttggtaatta aaaatttaaa attaaataca atttaaaaaa 37860
aaatttattt gacaagctgg ctgtggtgtg tgtgcctgta gtatcagctg cttgggagcc 37920
tgaggcagga ggattgcctg accccaggag tttgaggttg aagggagcta tgatggtgcc 37980
atggcactgt agcctaggca acagaaagag actccatctc ttaaaaaaag taaaaataaa 38040
aaaattttgg cacagggaca gtggctcaca cttataatgc cagaacttta ggagtccaca 38100
gcgcgaggac tgcttgaggc caggagttta agaccagact gggcaacgta atgagacccc 38160
acctttagga aataaataca taaataaaaa tttgacaatg ataaacatat ataaattagc 38220
ttttcttagt cctgaaaaag ataatgttat gtgtatgtgt gagaatgatt agttctcata 38280
tgagaaaaaa agaattcatt gctctgtgta ggttgtgaca tttccttcac gattgaaatt 38340
aattaatttt tttttattac ttatttattt ttaaaataga gacaggttct tgctgtgttg 38400
cccaggctgg tctcaaactc ctggcctcaa gcagttctcc tgcctcagcc tcccaaattg 38460
ctgtgactgt aggtgtgagc cactgcactg ggccaaaatt acttaatttt aacaagatga 38520
tgtagagagg agagttcatt gcaacataag cctagaatct ttgtcagaat cttaggaagt 38580
aatgttttca aattctgtgt tttcaccata aaatgtgtct tctctgtgtc catcacatgg 38640
tttttcattg ttttctgctt taccatttta gtaccattgg catttttctt cattgtaaaa 38700
gtagtagaaa tggagtagat tacataagga tgtgatcaga gggaatttat tcattcaggg 38760
taagggagtt agatcctctt ttaagattct atcacattct aagggtttat gattctaaac 38820
tgtcaagtaa attgtcaagt gctggcaagc tacagaataa tttttattgt atcattggaa 38880
attttcccct ctatatgtgt taaagagttt agcctgaagg gatacataca catacatata 38940
tgtaatcaaa ccttgatggt attgtattgc tgataaatta tttcttacca cttttccttt 39000
ctcctgtggg agaaacaaaa gcatatgttt gtgtagtatc agtaatgata ttagagagtg 39060
ggaaacatca gtgagtgcag tttggggact ttattggaga ctttcactag tgctcaaata 39120
aataatgctg gtttttatcc tactgtttgc ttaatgtgga ctagcctctt attcccattc 39180
tatgtttacc tctcttaaaa tattggtcac gctttcttga attatagatc tattaggaaa 39240
attcatgaac tgtagctaat tttcattgtt catgctccag atttattttg aaatatcgtt 39300
aatcttagta gtacagtaaa ggagaaatac cacttaacat tttttgtttt tttttctttg 39360
agacagagtc atgctctgtc acccagtctg gagtgcagtg gtgctatctc ggctcactgc 39420
aatgcacttc gcctctccgg gttcagcaat tctcctgcct cagcctcctg agtagctggg 39480
attacaggca cctgctacca cacccagcta atttttgtat ttttagtaga gacagggttt 39540
caccatgttg gccaggctgg tctgaaactc ctcacctcaa gtgatccacc cgtcttggcc 39600
tcccaaagtg ctgggattac aggcttgagc caccgcaccc cgcccactta acattttaaa 39660
ttaatttcaa gataatatca cttgaatatt tttacacata taattttttt aatacattta 39720
tttacacagt ttataatatc ctacaaagtg attacaatga gtaaaaaccc agttttcatt 39780
gttcctaaag tggcttgatt tatacaactt aatgtgttgg gtatttgttt ctaagactcc 39840
ctctgctgtc taggtttgga agtattgtga ggttaacaga ttttcttttt atagttacta 39900
ctcagttgaa caggctttaa aatacagaga gaatcatatt ttttcttcat tttttgcttt 39960
tatttatatt tttcttttaa ttggagacat gacaagaatt gacttgtgta tggatcttgc 40020
ataatttaag tactgcaggt ttaaaatcta ctaccagttt gagagtgcca tttttcacac 40080
tgtagattat taggttgaaa agtattatgg cttaaaatcg cttttagcca ttaaatttaa 40140
ataaccttgc tttaatcata aatagatggt ggtcacaatg actaactgtt aaactctttg 40200
aagacaggat atttggcttt atatggcaag cttttgaata caacagaaat taaaacttta 40260
tgggatagaa agaatctcct ccaaattggt aaactataag acctttcaaa tgatttagct 40320
aatttctcca caaatctgag gtattagtgt tttttttaaa gtggtattct cctgtgttgg 40380
ggtcacttta aacctttttc ttaatgataa atatatgaat tgaaactaat cccttaatat 40440
atatcatttg aaaactgaaa taatatgttt agatactgtt tacttgttga taaattattg 40500
gaataggatg ttcgaatact gtttacttct tggtaaattt ttaaatccaa tggattttac 40560
gtaagtatag aactggagct caaatactgt tactgtgtgt gaagatatat gaacatagtt 40620
tacagttgca tggcttatat ctaaagtcca gaaacataag gacaattaag tgtacacaca 40680
cacacatgca tttggatttt gatgacttag gtttgccaat gtggaaaaaa tagtagcaaa 40740
ttaagttctc ctgtgaaaaa gtcgttacct tatttaaaat tctgtgccat tggttatcct 40800
tgtcttttgt gaaaattagt gttcctgttt ataatattga caaaacacct atgcggatga 40860
catttaagaa ttctaaaagt cctaatatat gtaatatata ttcagttgcc tgaagagaaa 40920
cataaagaat cctttcttaa tattttttcc attaatgaaa tttgttacct gtacacatga 40980
agccatcgta tatattcaca ttttaatact ttttatgtat ttcagggtgt tgatgatgcc 41040
ttctatacat tagttcgaga aattcgaaaa cataaagaaa agatgagcaa agatggtaaa 41100
aagaagaaaa agaagtcaaa gacaaagtgt gtaattatgt aaatacaatt tgtacttttt 41160
tcttaaggca tactagtaca agtggtaatt tttgtacatt acactaaatt attagcattt 41220
gttttagcat tacctaattt ttttcctgct ccatgcagac tgttagcttt taccttaaat 41280
gcttatttta aaatgacagt ggaagttttt ttttcctcta agtgccagta ttcccagagt 41340
tttggttttt gaactagcaa tgcctgtgaa aaagaaactg aatacctaag atttctgtct 41400
tggggctttt ggtgcatgca gttgattact tcttattttt cttaccaatt gtgaatgttg 41460
gtgtgaaaca aattaatgaa gcttttgaat catccctatt ctgtgtttta tctagtcaca 41520
taaatggatt aattactaat ttcagttgag accttctaat tggtttttac tgaaacattg 41580
agggaacaca aatttatggg cttcctgatg atgattcttc taggcatcat gtcctatagt 41640
ttgtcatccc tgatgaatgt aaagttacac tgttcacaaa ggttttgtct cctttccact 41700
gctattagtc atggtcactc tccccaaaat attatatttt ttctataaaa agaaaaaaat 41760
ggaaaaaaat tacaaggcaa tggaaactat tataaggcca tttccttttc acattagata 41820
aattactata aagactccta atagcttttc ctgttaaggc agacccagta tgaaatgggg 41880
attattatag caaccatttt ggggctatat ttacatgcta ctaaattttt ataataattg 41940
aaaagatttt aacaagtata aaaaattctc ataggaatta aatgtagtct ccctgtgtca 42000
gactgctctt tcatagtata actttaaatc ttttcttcaa cttgagtctt tgaagatagt 42060
tttaattctg cttgtgacat taaaagatta tttgggccag ttatagctta ttaggtgttg 42120
aagagaccaa ggttgcaagg ccaggccctg tgtgaacctt tgagctttca tagagagttt 42180
cacagcatgg actgtgtccc cacggtcatc cagtgttgtc atgcattggt tagtcaaaat 42240
ggggagggac tagggcagtt tggatagctc aacaagatac aatctcactc tgtggtggtc 42300
ctgctgacaa atcaagagca ttgcttttgt ttcttaagaa aacaaactct tttttaaaaa 42360
ttacttttaa atattaactc aaaagttgag attttggggt ggtggtgtgc caagacatta 42420
attttttttt taaacaatga agtgaaaaag ttttacaatc tctaggtttg gctagttctc 42480
ttaacactgg ttaaattaac attgcataaa cacttttcaa gtctgatcca tatttaataa 42540
tgctttaaaa taaaaataaa aacaatcctt ttgataaatt taaaatgtta cttattttaa 42600
aataaatgaa gtgagatggc atggtgaggt gaaagtatca ctggactagg aagaaggtga 42660
cttaggttct agataggtgt cttttaggac tctgattttg aggacatcac ttactatcca 42720
tttcttcatg ttaaaagaag tcatctcaaa ctcttagttt ttttttttta caactatgta 42780
atttatattc catttacata aggatacact tatttgtcaa gctcagcaca atctgtaaat 42840
ttttaaccta tgttacacca tcttcagtgc cagtcttggg caaaattgtg caagaggtga 42900
agtttatatt tgaatatcca ttctcgtttt aggactcttc ttccatatta gtgtcatctt 42960
gcctccctac cttccacatg ccccatgact tgatgcagtt ttaatacttg taattcccct 43020
aaccataaga tttactgctg ctgtggatat ctccatgaag ttttcccact gagtcacatc 43080
agaaatgccc tacatcttat ttcctcaggg ctcaagagaa tctgacagat accataaagg 43140
gatttgacct aatcactaat tttcaggtgg tggctgatgc tttgaacatc tctttgctgc 43200
ccaatccatt agcgacagta ggatttttca aacctggtat gaatagacag aaccctatcc 43260
agtggaagga gaatttaata aagatagtgc tgaaagaatt ccttaggtaa tctataacta 43320
ggactactcc tggtaacagt aatacattcc attgttttag taaccagaaa tcttcatgca 43380
atgaaaaata ctttaattca tgaagcttac tttttttttt tggtgtcaga gtctcgctct 43440
tgtcacccag gctggaatgc agtggcgcca tctcagctca ctgcaacctc catctcccag 43500
gttcaagcga ttctcgtgcc tcggcctcct gagtagctgg gattacaggc gtgtgccact 43560
acactcaact aatttttgta tttttaggag agacggggtt tcaccctgtt ggccaggctg 43620
gtctcgaact cctgacctca agtgattcac ccaccttggc ctcataaacc tgttttgcag 43680
aactcattta ttcagcaaat atttattgag tgcctaccag atgccagtca ccacacaagg 43740
cactgggtat atggtatccc caaacaagag acataatccc ggtccttagg tagtgctagt 43800
gtggtctgta atatcttact aaggcctttg gtatacgacc cagagataac acgatgcgta 43860
ttttagtttt gcaaagaagg ggtttggtct ctgtgccagc tctataattg ttttgctacg 43920
attccactga aactcttcga tcaagctact ttatgtaaat cacttcattg ttttaaagga 43980
ataaacttga ttatattgtt tttttatttg gcataactgt gattctttta ggacaattac 44040
tgtacacatt aaggtgtatg tcagatattc atattgaccc aaatgtgtaa tattccagtt 44100
ttctctgcat aagtaattaa aatatactta aaaattaata gttttatctg ggtacaaata 44160
aacaggtgcc tgaactagtt cacagacaag gaaacttcta tgtaaaaatc actatgattt 44220
ctgaattgct atgtgaaact acagatcttt ggaacactgt ttaggtaggg tgttaagact 44280
tacacagtac ctcgtttcta cacagagaaa gaaatggcca tacttcagga actgcagtgc 44340
ttatgagggg atatttaggc ctcttgaatt tttgatgtag atgggcattt ttttaaggta 44400
gtggttaatt acctttatgt gaactttgaa tggtttaaca aaagatttgt ttttgtagag 44460
attttaaagg gggagaattc tagaaataaa tgttacctaa ttattacagc cttaaagaca 44520
aaaatccttg ttgaagtttt tttaaaaaaa gctaaattac atagacttag gcattaacat 44580
gtttgtggaa gaatatagca gacgtatatt gtatcatttg agtgaatgtt cccaagtagg 44640
cattctaggc tctatttaac tgagtcacac tgcataggaa tttagaacct aacttttata 44700
ggttatcaaa actgttgtca ccattgcaca attttgtcct aatatataca tagaaacttt 44760
gtggggcatg ttaagttaca gtttgcacaa gttcatctca tttgtattcc attgattttt 44820
tttttcttct aaacattttt tcttcaaaca gtatataact ttttttaggg gatttttttt 44880
tagacagcaa aaactatctg aagatttcca tttgtcaaaa agtaatgatt tcttgataat 44940
tgtgtagtaa tgttttttag aacccagcag ttaccttaaa gctgaattta tatttagtaa 45000
cttctgtgtt aatactggat agcatgaatt ctgcattgag aaactgaata gctgtcataa 45060
aatgaaactt tctttctaaa gaaagatact cacatgagtt cttgaagaat agtcataact 45120
agattaagat ctgtgtttta gtttaatagt ttgaagtgcc tgtttgggat aatgataggt 45180
aatttagatg aatttagggg aaaaaaaagt tatctgcaga tatgttgagg gcccatctct 45240
ccccccacac ccccacagag ctaactgggt tacagtgttt tatccgaaag tttccaattc 45300
cactgtcttg tgttttcatg ttgaaaatac ttttgcattt ttcctttgag tgccaatttc 45360
ttactagtac tatttcttaa tgtaacatgt ttacctggaa tgtattttaa ctatttttgt 45420
atagtgtaaa ctgaaacatg cacattttgt acattgtgct ttcttttgtg ggacatatgc 45480
agtgtgatcc agttgttttc catcatttgg ttgcgctgac ctaggaatgt tggtcatatc 45540
aaacattaaa aatgaccact cttttaattg aaattaactt ttaaatgttt ataggagtat 45600
gtgctgtgaa gtgatctaaa atttgtaata tttttgtcat gaactgtact actcctaatt 45660
attgtaatgt aataaaaata gttacagtga ctatgagtgt gtatttattc atgaaatttg 45720
aactgtttgc cccgaaatgg atatggaata ctttataagc catagacact atagtatacc 45780
agtgaatctt ttatgcagct tgttagaagt atcctttatt tctaaaaggt gctgtggata 45840
ttatgtaaag gcgtgtttgc ttaaacttaa aaccatattt agaagtagat gcaaaacaaa 45900
tctgccttta tgacaaaaaa ataggataac attatttatt tatttccttt tatcaaagaa 45960
ggtaattgat acacaacagg tgacttggtt ttaggcccaa aggtagcagc agcaacatta 46020
ataatggaaa taattgaata gttagttatg tatgttaatg ccagtcacca gcaggctatt 46080
tcaaggtcag aagtaatgac tccatacata ttatttattt ctataactac atttaaatca 46140
ttaccagg 46148
<210> 2
<211> 188
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> KRAS G12D蛋白同种型2B
<400> 2
Met Thr Glu Tyr Lys Leu Val Val Val Gly Ala Asp Gly Val Gly Lys
1 5 10 15
Ser Ala Leu Thr Ile Gln Leu Ile Gln Asn His Phe Val Asp Glu Tyr
20 25 30
Asp Pro Thr Ile Glu Asp Ser Tyr Arg Lys Gln Val Val Ile Asp Gly
35 40 45
Glu Thr Cys Leu Leu Asp Ile Leu Asp Thr Ala Gly Gln Glu Glu Tyr
50 55 60
Ser Ala Met Arg Asp Gln Tyr Met Arg Thr Gly Glu Gly Phe Leu Cys
65 70 75 80
Val Phe Ala Ile Asn Asn Thr Lys Ser Phe Glu Asp Ile His His Tyr
85 90 95
Arg Glu Gln Ile Lys Arg Val Lys Asp Ser Glu Asp Val Pro Met Val
100 105 110
Leu Val Gly Asn Lys Cys Asp Leu Pro Ser Arg Thr Val Asp Thr Lys
115 120 125
Gln Ala Gln Asp Leu Ala Arg Ser Tyr Gly Ile Pro Phe Ile Glu Thr
130 135 140
Ser Ala Lys Thr Arg Gln Gly Val Asp Asp Ala Phe Tyr Thr Leu Val
145 150 155 160
Arg Glu Ile Arg Lys His Lys Glu Lys Met Ser Lys Asp Gly Lys Lys
165 170 175
Lys Lys Lys Lys Ser Lys Thr Lys Cys Val Ile Met
180 185
<210> 3
<211> 5306
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> KRAS G12D mRNA
<400> 3
ctaggcggcg gccgcggcgg cggaggcagc agcggcggcg gcagtggcgg cggcgaaggt 60
ggcggcggct cggccagtac tcccggcccc cgccatttcg gactgggagc gagcgcggcg 120
caggcactga aggcggcggc ggggccagag gctcagcggc tcccaggtgc gggagagagg 180
cctgctgaaa atgactgaat ataaacttgt ggtagttgga gctgatggcg taggcaagag 240
tgccttgacg atacagctaa ttcagaatca ttttgtggac gaatatgatc caacaataga 300
ggattcctac aggaagcaag tagtaattga tggagaaacc tgtctcttgg atattctcga 360
cacagcaggt caagaggagt acagtgcaat gagggaccag tacatgagga ctggggaggg 420
ctttctttgt gtatttgcca taaataatac taaatcattt gaagatattc accattatag 480
agaacaaatt aaaagagtta aggactctga agatgtacct atggtcctag taggaaataa 540
atgtgatttg ccttctagaa cagtagacac aaaacaggct caggacttag caagaagtta 600
tggaattcct tttattgaaa catcagcaaa gacaagacag ggtgttgatg atgccttcta 660
tacattagtt cgagaaattc gaaaacataa agaaaagatg agcaaagatg gtaaaaagaa 720
gaaaaagaag tcaaagacaa agtgtgtaat tatgtaaata caatttgtac ttttttctta 780
aggcatacta gtacaagtgg taatttttgt acattacact aaattattag catttgtttt 840
agcattacct aatttttttc ctgctccatg cagactgtta gcttttacct taaatgctta 900
ttttaaaatg acagtggaag tttttttttc ctctaagtgc cagtattccc agagttttgg 960
tttttgaact agcaatgcct gtgaaaaaga aactgaatac ctaagatttc tgtcttgggg 1020
cttttggtgc atgcagttga ttacttctta tttttcttac caattgtgaa tgttggtgtg 1080
aaacaaatta atgaagcttt tgaatcatcc ctattctgtg ttttatctag tcacataaat 1140
ggattaatta ctaatttcag ttgagacctt ctaattggtt tttactgaaa cattgaggga 1200
acacaaattt atgggcttcc tgatgatgat tcttctaggc atcatgtcct atagtttgtc 1260
atccctgatg aatgtaaagt tacactgttc acaaaggttt tgtctccttt ccactgctat 1320
tagtcatggt cactctcccc aaaatattat attttttcta taaaaagaaa aaaatggaaa 1380
aaaattacaa ggcaatggaa actattataa ggccatttcc ttttcacatt agataaatta 1440
ctataaagac tcctaatagc ttttcctgtt aaggcagacc cagtatgaaa tggggattat 1500
tatagcaacc attttggggc tatatttaca tgctactaaa tttttataat aattgaaaag 1560
attttaacaa gtataaaaaa ttctcatagg aattaaatgt agtctccctg tgtcagactg 1620
ctctttcata gtataacttt aaatcttttc ttcaacttga gtctttgaag atagttttaa 1680
ttctgcttgt gacattaaaa gattatttgg gccagttata gcttattagg tgttgaagag 1740
accaaggttg caaggccagg ccctgtgtga acctttgagc tttcatagag agtttcacag 1800
catggactgt gtccccacgg tcatccagtg ttgtcatgca ttggttagtc aaaatgggga 1860
gggactaggg cagtttggat agctcaacaa gatacaatct cactctgtgg tggtcctgct 1920
gacaaatcaa gagcattgct tttgtttctt aagaaaacaa actctttttt aaaaattact 1980
tttaaatatt aactcaaaag ttgagatttt ggggtggtgg tgtgccaaga cattaatttt 2040
ttttttaaac aatgaagtga aaaagtttta caatctctag gtttggctag ttctcttaac 2100
actggttaaa ttaacattgc ataaacactt ttcaagtctg atccatattt aataatgctt 2160
taaaataaaa ataaaaacaa tccttttgat aaatttaaaa tgttacttat tttaaaataa 2220
atgaagtgag atggcatggt gaggtgaaag tatcactgga ctaggaagaa ggtgacttag 2280
gttctagata ggtgtctttt aggactctga ttttgaggac atcacttact atccatttct 2340
tcatgttaaa agaagtcatc tcaaactctt agtttttttt ttttacaact atgtaattta 2400
tattccattt acataaggat acacttattt gtcaagctca gcacaatctg taaattttta 2460
acctatgtta caccatcttc agtgccagtc ttgggcaaaa ttgtgcaaga ggtgaagttt 2520
atatttgaat atccattctc gttttaggac tcttcttcca tattagtgtc atcttgcctc 2580
cctaccttcc acatgcccca tgacttgatg cagttttaat acttgtaatt cccctaacca 2640
taagatttac tgctgctgtg gatatctcca tgaagttttc ccactgagtc acatcagaaa 2700
tgccctacat cttatttcct cagggctcaa gagaatctga cagataccat aaagggattt 2760
gacctaatca ctaattttca ggtggtggct gatgctttga acatctcttt gctgcccaat 2820
ccattagcga cagtaggatt tttcaaacct ggtatgaata gacagaaccc tatccagtgg 2880
aaggagaatt taataaagat agtgctgaaa gaattcctta ggtaatctat aactaggact 2940
actcctggta acagtaatac attccattgt tttagtaacc agaaatcttc atgcaatgaa 3000
aaatacttta attcatgaag cttacttttt ttttttggtg tcagagtctc gctcttgtca 3060
cccaggctgg aatgcagtgg cgccatctca gctcactgca acctccatct cccaggttca 3120
agcgattctc gtgcctcggc ctcctgagta gctgggatta caggcgtgtg ccactacact 3180
caactaattt ttgtattttt aggagagacg gggtttcacc ctgttggcca ggctggtctc 3240
gaactcctga cctcaagtga ttcacccacc ttggcctcat aaacctgttt tgcagaactc 3300
atttattcag caaatattta ttgagtgcct accagatgcc agtcaccaca caaggcactg 3360
ggtatatggt atccccaaac aagagacata atcccggtcc ttaggtagtg ctagtgtggt 3420
ctgtaatatc ttactaaggc ctttggtata cgacccagag ataacacgat gcgtatttta 3480
gttttgcaaa gaaggggttt ggtctctgtg ccagctctat aattgttttg ctacgattcc 3540
actgaaactc ttcgatcaag ctactttatg taaatcactt cattgtttta aaggaataaa 3600
cttgattata ttgttttttt atttggcata actgtgattc ttttaggaca attactgtac 3660
acattaaggt gtatgtcaga tattcatatt gacccaaatg tgtaatattc cagttttctc 3720
tgcataagta attaaaatat acttaaaaat taatagtttt atctgggtac aaataaacag 3780
gtgcctgaac tagttcacag acaaggaaac ttctatgtaa aaatcactat gatttctgaa 3840
ttgctatgtg aaactacaga tctttggaac actgtttagg tagggtgtta agacttacac 3900
agtacctcgt ttctacacag agaaagaaat ggccatactt caggaactgc agtgcttatg 3960
aggggatatt taggcctctt gaatttttga tgtagatggg cattttttta aggtagtggt 4020
taattacctt tatgtgaact ttgaatggtt taacaaaaga tttgtttttg tagagatttt 4080
aaagggggag aattctagaa ataaatgtta cctaattatt acagccttaa agacaaaaat 4140
ccttgttgaa gtttttttaa aaaaagctaa attacataga cttaggcatt aacatgtttg 4200
tggaagaata tagcagacgt atattgtatc atttgagtga atgttcccaa gtaggcattc 4260
taggctctat ttaactgagt cacactgcat aggaatttag aacctaactt ttataggtta 4320
tcaaaactgt tgtcaccatt gcacaatttt gtcctaatat atacatagaa actttgtggg 4380
gcatgttaag ttacagtttg cacaagttca tctcatttgt attccattga tttttttttt 4440
cttctaaaca ttttttcttc aaacagtata taactttttt taggggattt ttttttagac 4500
agcaaaaact atctgaagat ttccatttgt caaaaagtaa tgatttcttg ataattgtgt 4560
agtaatgttt tttagaaccc agcagttacc ttaaagctga atttatattt agtaacttct 4620
gtgttaatac tggatagcat gaattctgca ttgagaaact gaatagctgt cataaaatga 4680
aactttcttt ctaaagaaag atactcacat gagttcttga agaatagtca taactagatt 4740
aagatctgtg ttttagttta atagtttgaa gtgcctgttt gggataatga taggtaattt 4800
agatgaattt aggggaaaaa aaagttatct gcagatatgt tgagggccca tctctccccc 4860
cacaccccca cagagctaac tgggttacag tgttttatcc gaaagtttcc aattccactg 4920
tcttgtgttt tcatgttgaa aatacttttg catttttcct ttgagtgcca atttcttact 4980
agtactattt cttaatgtaa catgtttacc tggaatgtat tttaactatt tttgtatagt 5040
gtaaactgaa acatgcacat tttgtacatt gtgctttctt ttgtgggaca tatgcagtgt 5100
gatccagttg ttttccatca tttggttgcg ctgacctagg aatgttggtc atatcaaaca 5160
ttaaaaatga ccactctttt aattgaaatt aacttttaaa tgtttatagg agtatgtgct 5220
gtgaagtgat ctaaaatttg taatattttt gtcatgaact gtactactcc taattattgt 5280
aatgtaataa aaatagttac agtgac 5306
<210> 4
<211> 14
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 反义寡核苷酸
<400> 4
tcagctccaa ctac 14
<210> 5
<211> 14
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 反义寡核苷酸
<400> 5
atcagctcca acta 14
<210> 6
<211> 14
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 反义寡核苷酸
<400> 6
catcagctcc aact 14
<210> 7
<211> 14
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 反义寡核苷酸
<400> 7
ccatcagctc caac 14
<210> 8
<211> 14
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 反义寡核苷酸
<400> 8
gccatcagct ccaa 14
<210> 9
<211> 14
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 反义寡核苷酸
<400> 9
cgccatcagc tcca 14
<210> 10
<211> 14
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 反义寡核苷酸
<400> 10
acgccatcag ctcc 14
<210> 11
<211> 14
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 反义寡核苷酸
<400> 11
tacgccatca gctc 14
<210> 12
<211> 14
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 反义寡核苷酸
<400> 12
ctacgccatc agct 14
<210> 13
<211> 14
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 反义寡核苷酸
<400> 13
cctacgccat cagc 14
<210> 14
<211> 14
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 反义寡核苷酸
<400> 14
gcctacgcca tcag 14
<210> 15
<211> 14
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 反义寡核苷酸
<400> 15
tgcctacgcc atca 14
<210> 16
<211> 14
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 反义寡核苷酸
<400> 16
ttgcctacgc catc 14
<210> 17
<211> 14
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 反义寡核苷酸
<400> 17
cttgcctacg ccat 14
<210> 18
<211> 15
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 反义寡核苷酸
<400> 18
tcagctccaa ctacc 15
<210> 19
<211> 15
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 反义寡核苷酸
<400> 19
atcagctcca actac 15
<210> 20
<211> 15
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 反义寡核苷酸
<400> 20
catcagctcc aacta 15
<210> 21
<211> 15
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 反义寡核苷酸
<400> 21
ccatcagctc caact 15
<210> 22
<211> 15
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 反义寡核苷酸
<400> 22
gccatcagct ccaac 15
<210> 23
<211> 15
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 反义寡核苷酸
<400> 23
cgccatcagc tccaa 15
<210> 24
<211> 15
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 反义寡核苷酸
<400> 24
acgccatcag ctcca 15
<210> 25
<211> 15
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 反义寡核苷酸
<400> 25
tacgccatca gctcc 15
<210> 26
<211> 15
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 反义寡核苷酸
<400> 26
ctacgccatc agctc 15
<210> 27
<211> 15
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 反义寡核苷酸
<400> 27
cctacgccat cagct 15
<210> 28
<211> 15
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 反义寡核苷酸
<400> 28
gcctacgcca tcagc 15
<210> 29
<211> 15
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 反义寡核苷酸
<400> 29
tgcctacgcc atcag 15
<210> 30
<211> 15
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 反义寡核苷酸
<400> 30
ttgcctacgc catca 15
<210> 31
<211> 15
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 反义寡核苷酸
<400> 31
cttgcctacg ccatc 15
<210> 32
<211> 15
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 反义寡核苷酸
<400> 32
tcttgcctac gccat 15
<210> 33
<211> 16
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 反义寡核苷酸
<400> 33
tcagctccaa ctacca 16
<210> 34
<211> 16
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 反义寡核苷酸
<400> 34
atcagctcca actacc 16
<210> 35
<211> 16
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 反义寡核苷酸
<400> 35
catcagctcc aactac 16
<210> 36
<211> 16
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 反义寡核苷酸
<400> 36
ccatcagctc caacta 16
<210> 37
<211> 16
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 反义寡核苷酸
<400> 37
gccatcagct ccaact 16
<210> 38
<211> 16
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 反义寡核苷酸
<400> 38
cgccatcagc tccaac 16
<210> 39
<211> 16
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 反义寡核苷酸
<400> 39
acgccatcag ctccaa 16
<210> 40
<211> 16
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 反义寡核苷酸
<400> 40
tacgccatca gctcca 16
<210> 41
<211> 16
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 反义寡核苷酸
<400> 41
ctacgccatc agctcc 16
<210> 42
<211> 16
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 反义寡核苷酸
<400> 42
cctacgccat cagctc 16
<210> 43
<211> 16
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 反义寡核苷酸
<400> 43
gcctacgcca tcagct 16
<210> 44
<211> 16
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 反义寡核苷酸
<400> 44
tgcctacgcc atcagc 16
<210> 45
<211> 16
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 反义寡核苷酸
<400> 45
ttgcctacgc catcag 16
<210> 46
<211> 16
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 反义寡核苷酸
<400> 46
cttgcctacg ccatca 16
<210> 47
<211> 16
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 反义寡核苷酸
<400> 47
tcttgcctac gccatc 16
<210> 48
<211> 16
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 反义寡核苷酸
<400> 48
ctcttgccta cgccat 16
<210> 49
<211> 17
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 反义寡核苷酸
<400> 49
tcagctccaa ctaccac 17
<210> 50
<211> 17
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 反义寡核苷酸
<400> 50
atcagctcca actacca 17
<210> 51
<211> 17
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 反义寡核苷酸
<400> 51
catcagctcc aactacc 17
<210> 52
<211> 17
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 反义寡核苷酸
<400> 52
ccatcagctc caactac 17
<210> 53
<211> 17
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 反义寡核苷酸
<400> 53
gccatcagct ccaacta 17
<210> 54
<211> 17
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 反义寡核苷酸
<400> 54
cgccatcagc tccaact 17
<210> 55
<211> 17
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 反义寡核苷酸
<400> 55
acgccatcag ctccaac 17
<210> 56
<211> 17
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 反义寡核苷酸
<400> 56
tacgccatca gctccaa 17
<210> 57
<211> 17
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 反义寡核苷酸
<400> 57
ctacgccatc agctcca 17
<210> 58
<211> 17
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 反义寡核苷酸
<400> 58
cctacgccat cagctcc 17
<210> 59
<211> 17
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 反义寡核苷酸
<400> 59
gcctacgcca tcagctc 17
<210> 60
<211> 17
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 反义寡核苷酸
<400> 60
tgcctacgcc atcagct 17
<210> 61
<211> 17
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 反义寡核苷酸
<400> 61
ttgcctacgc catcagc 17
<210> 62
<211> 17
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 反义寡核苷酸
<400> 62
cttgcctacg ccatcag 17
<210> 63
<211> 17
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 反义寡核苷酸
<400> 63
tcttgcctac gccatca 17
<210> 64
<211> 17
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 反义寡核苷酸
<400> 64
ctcttgccta cgccatc 17
<210> 65
<211> 17
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 反义寡核苷酸
<400> 65
actcttgcct acgccat 17
<210> 66
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 反义寡核苷酸
<400> 66
tcagctccaa ctaccacaag 20
<210> 67
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 反义寡核苷酸
<400> 67
atcagctcca actaccacaa 20
<210> 68
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 反义寡核苷酸
<400> 68
catcagctcc aactaccaca 20
<210> 69
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 反义寡核苷酸
<400> 69
ccatcagctc caactaccac 20
<210> 70
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 反义寡核苷酸
<400> 70
gccatcagct ccaactacca 20
<210> 71
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 反义寡核苷酸
<400> 71
cgccatcagc tccaactacc 20
<210> 72
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 反义寡核苷酸
<400> 72
acgccatcag ctccaactac 20
<210> 73
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 反义寡核苷酸
<400> 73
tacgccatca gctccaacta 20
<210> 74
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 反义寡核苷酸
<400> 74
ctacgccatc agctccaact 20
<210> 75
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 反义寡核苷酸
<400> 75
cctacgccat cagctccaac 20
<210> 76
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 反义寡核苷酸
<400> 76
gcctacgcca tcagctccaa 20
<210> 77
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 反义寡核苷酸
<400> 77
tgcctacgcc atcagctcca 20
<210> 78
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 反义寡核苷酸
<400> 78
ttgcctacgc catcagctcc 20
<210> 79
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 反义寡核苷酸
<400> 79
cttgcctacg ccatcagctc 20
<210> 80
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 反义寡核苷酸
<400> 80
tcttgcctac gccatcagct 20
<210> 81
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 反义寡核苷酸
<400> 81
ctcttgccta cgccatcagc 20
<210> 82
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 反义寡核苷酸
<400> 82
actcttgcct acgccatcag 20
<210> 83
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 反义寡核苷酸
<400> 83
cactcttgcc tacgccatca 20
<210> 84
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 反义寡核苷酸
<400> 84
gcactcttgc ctacgccatc 20
<210> 85
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 反义寡核苷酸
<400> 85
ggcactcttg cctacgccat 20
<210> 86
<211> 189
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> KRAS G12D蛋白同种型2A
<400> 86
Met Thr Glu Tyr Lys Leu Val Val Val Gly Ala Asp Gly Val Gly Lys
1 5 10 15
Ser Ala Leu Thr Ile Gln Leu Ile Gln Asn His Phe Val Asp Glu Tyr
20 25 30
Asp Pro Thr Ile Glu Asp Ser Tyr Arg Lys Gln Val Val Ile Asp Gly
35 40 45
Glu Thr Cys Leu Leu Asp Ile Leu Asp Thr Ala Gly Gln Glu Glu Tyr
50 55 60
Ser Ala Met Arg Asp Gln Tyr Met Arg Thr Gly Glu Gly Phe Leu Cys
65 70 75 80
Val Phe Ala Ile Asn Asn Thr Lys Ser Phe Glu Asp Ile His His Tyr
85 90 95
Arg Glu Gln Ile Lys Arg Val Lys Asp Ser Glu Asp Val Pro Met Val
100 105 110
Leu Val Gly Asn Lys Cys Asp Leu Pro Ser Arg Thr Val Asp Thr Lys
115 120 125
Gln Ala Gln Asp Leu Ala Arg Ser Tyr Gly Ile Pro Phe Ile Glu Thr
130 135 140
Ser Ala Lys Thr Arg Gln Arg Val Glu Asp Ala Phe Tyr Thr Leu Val
145 150 155 160
Arg Glu Ile Arg Gln Tyr Arg Leu Lys Lys Ile Ser Lys Glu Glu Lys
165 170 175
Thr Pro Gly Cys Val Lys Ile Lys Lys Cys Ile Ile Met
180 185
<210> 87
<211> 46148
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> KRAS (WT)的基因组序列
<400> 87
gattttccta ggcggcggcc gcggcggcgg aggcagcagc ggcggcggca gtggcggcgg 60
cgaaggtggc ggcggctcgg ccagtactcc cggcccccgc catttcggac tgggagcgag 120
cgcggcgcag gcactgaagg cggcggcggg gccagaggct cagcggctcc caggtgcggg 180
agagaggtac ggagcggacc acccctcctg ggcccctgcc cgggtcccga ccctctttgc 240
cggcgccggg cggggccggc ggcgagtgaa tgaattaggg gtccccggag gggcgggtgg 300
ggggcgcggg cgcggggtcg gggcgggctg ggtgagaggg gtctgcaggg gggaggcgcg 360
cggacgcggc ggcgcgggga gtgaggaatg ggcggtgcgg ggctgaggag ggtgaggctg 420
gaggcggtcg ccgctggtgc tgcttcctgg acggggaacc ccttccttcc tcctccccga 480
gagccgcggc tggaggcttc tggggagaaa ctcgggccgg gccggctgcc cctcggagcg 540
gtggggtgcg gtggaggtta ctcccgcggc gccccggcct cccctccccc tctccccgct 600
cccgcacctc ttgcctccct ttccagcact cggctgcctc ggtccagcct tccctgctgc 660
atttggcatc tctaggacga aggtataaac ttctccctcg agcgcaggct ggacggatag 720
tggtcctttt ccgtgtgtag gggatgtgtg agtaagaggg gaggtcacgt tttggaagag 780
cataggaaag tgcttagaga ccactgtttg aggttattgt gtttggaaaa aaatgcatct 840
gcctccgagt tcctgaatgc tcccctcccc catgtatggg ctgtgacatt gctgtggcca 900
caaaggagga ggtggaggta gagatggtgg aagaacaggt ggccaacacc ctacacgtag 960
agcctgtgac ctacagtgaa aaggaaaaag ttaatcccag atggtctgtt ttgcttggtc 1020
aagttaaacc cgaagaaaac ccgcagagca gaagcaaggc tttttccttg ctagttgagt 1080
gtagacagca atagcaaaaa tagtacttga agtttaattt acctgttctt gtcctttccc 1140
ctatttctta tgtattaccc tcatcccctc gtctctttta tactaccctc attttgcaga 1200
tgtgttctac atctcaagag ttattacagt actccaaaac agcacttaca tgatttttta 1260
aacttacaga ggaattgtag caatccacca gctaaccgcc tgaaatagac ttaaacatgt 1320
gcatctcctt tttttttttt tttttgagac acagtctcgc tctgttgccc aggctggagt 1380
gcaatggcgc ggtatcggct cactgaaacc tccgcctcct gggttcaagc aattctcctg 1440
cctcagcctc ccgagtagct gggactagta ggtgcacgcc accatgccca gctaattttt 1500
gtatttttag tagagacaga gtttcatcat gttggtcagg atggtctcca tctgctctgt 1560
tgcccaggct ggagtgcagt ggcgccgtct cggctcactg caacctctgc ctcctgcatt 1620
caagcaattc tcctgcctca gcctcccgaa taactgggat tacaggtgtc tgctgccatg 1680
cccggctaat tttttgtatt tttagtagag acgggggttt caccatgttg gtcaggctgg 1740
tctagaactc ctgacctcgt gatctgcccg cctcggcctc ccacagtggc atgtgcatct 1800
tatagctgaa gtctaagcct tcttaaatct tgagatccat caaaacagac aggttttcta 1860
attgttatac aatgtatatg ttatgtttat aatagaaatc attttacaaa taagttataa 1920
atgggaaagg tctatttgta attatcagct cagaattaac cataaaactg gtgtcactga 1980
agtgactgag gtccaaaatg ctgactctgc atgttataga ctacagatat caaatatggt 2040
tgctaacaat agtttacttt gagactgtag ccatccacag tatatttgct tttaagagat 2100
ggtagatggt aattcagttt tatgaaaaat aaaaatgaat tttcttccat tacaaaattg 2160
ttggattcga gtccagtcca ctccttacta gcttttctaa ctctcggtga gggatcccct 2220
cccagcccat gatcttcatt tggtaagact cctttggaac ccagttctct ctagtggatt 2280
taaatgtgat ttggttttaa aaatctcatt caaggaattt tttttttttc tggaaacaac 2340
caccgcataa acaagtaaac cggaagatac atgtggctct gaattcatat atatacacaa 2400
actctaatcc aatgtctgtc cacagtattt cctaggctag taaacttttt ggccttaacg 2460
acccctctac cctctttgtt tttttgagag agagagtctc actctgtcac ccaggccgga 2520
atgcagtggc gcgatctcgg cccgctacta cctccgactc tcaggctcaa gcgattctcc 2580
cgcctcagct tcccgagtag ccgggattac aggctcccgc caccgggcta attgtatttt 2640
tagatacggg atttcaccat gttggccagg ctggtctcga cctcctgacc tcaggtgatc 2700
cgcccgccta agcctcccaa agtgctggga ttacaggcca ccacacccgg cctacactct 2760
taaaaattat cgaaggggcc gggcacattg gctcttatct gtaatcccag cactttggga 2820
gactgaggcg ggaggatcgc ttgaggccag gagttggaga ccagcgtact caacatagtg 2880
agaccttgtt ataaagaaaa aaaaaatcca ggattaaaaa aaatctttga tttgtttggg 2940
atttattaat atttaccgta ttggaaatta aaacaatttt ttaaaatgta ttcatttaaa 3000
aataataagc ccattacttg gtaacatgaa taaaatattt tatgaaaaat aactattttc 3060
caaaacaaaa ccaaaactta gaaaagtggt attgtttcac acttcagtaa atctctttaa 3120
tgatgtggct taatagaaga tatggattct tatatctgca tctgcattca atctattatg 3180
atcacacatc tggaaaactt gtgaaagaat gggagttaaa agggtaaagg acatcttaat 3240
gttattatga aaacagtttt gacctcttgc acaccagaaa agtcttagta acctgagggg 3300
ttcctagacc acattttgag aactgtttta ggctatgcaa actggttggg gggaggttgg 3360
ggtaggcaga gagctagaag atacatttta gtgtaattct cctcatctat tcctaattgc 3420
tttggcctac atttgaaata aagcgtggag gcaaacggga taagatacat gtttgtagtg 3480
gttgttaact tcaccctaga caagcagcca ataagtctag gtagagcaga gtaaggcggg 3540
gaactatgcc gtgaccgtgt gtgatacaat ttttctagcc tgtggtgctt tttgcggcag 3600
ggcttaggag taaggttagt atgttatcat ttgggaaacc aaattattat tttgggtctt 3660
cagtcaatta tgatgctgtg tatatttagt gtttatctac aatatatgca cattcattaa 3720
tttggagcta ctcatcctat aataaatagt tgtgcattta ctcccatttt tttctgcatt 3780
tctctcctta tttataatta tgtgttacat gagggaaagg aggtgaaatt aaacattcat 3840
attatttcaa aaaatttgaa acaactaact aaaaaatatg ttttattttc tgtatggtgt 3900
ttgttataca atctgtcaat attcatgcac ctcttgggag acagtgtatg aaaagcaaag 3960
agtaacagtc acatggatta ctgattactg agatatattc acttgcatct tttttttttt 4020
ttgagacgga gtggctctgt cgcccaggct ggagtgcagt ggcgtgatct cggctcactg 4080
caagctccgc ctcctgggtt cacgccattc ttctgcctca gcctcccaag tagctgggac 4140
tacaggcgcc cgccaccacg cccggctaat ttttttatat ttttagtaga gacggggttt 4200
caccgggtta gccaggatgg tcttgatctc ctgacctcgt gatccaccct cctcggcctc 4260
ccaaagtgct aggattatag gcgtgagcca ccgtgcccgg ctcacttgca tctcttaaca 4320
gctgttttct tactaaaaac agtgtttatc tctaatcttt ttgtttgttt gtttgttttg 4380
agatggagtc ttactccgtc acccaatctg gagtgcagtg gcgtgatctg ggctcactgc 4440
aacctctgcc tcccgggttc aagtgattct ccttcctcag cctccccagt agctaggact 4500
acaggagagc gccaccacgc ctgattaatt tttgtatttt tagtagagag agggtttcac 4560
catattggcc aggctggtct tgaactcctg gcctcaggtg atccacccgc cttggcctct 4620
gaaagtgctg ggattacagg catgagccgc cgcacccggc tttctaatct ttatcttttt 4680
ttgtgcagcg gtgatacagg attatgtatt gtactgaaca gttaattcgg agttctcttg 4740
gtttttagct ttattttccc cagagatttt tttttttttt tttttttttg agacggagtc 4800
ttgctctatc gccaggctgg agtgcagtgg cgccatctcg gctcattgca acctcggact 4860
cctattttcc ccagagatat ttcacacatt aaaatgtcgt caaatattgt tcttctttgc 4920
ctcagtgttt aaatttttat ttccccatga cacaatccag ctttatttga cactcattct 4980
ctcaactctc atctgattct tactgttaat atttatccaa gagaactact gccatgatgc 5040
tttaaaagtt tttctgtagc tgttgcatat tgacttctaa cacttagagg tgggggtcca 5100
ctaggaaaac tgtaacaata agagtggaga tagctgtcag caacttttgt gagggtgtgc 5160
tacagggtgt agagcactgt gaagtctcta catgagtgaa gtcatgatat gatcctttga 5220
gagcctttag ccgccgcaga acagcagtct ggctatttag atagaacaac ttgattttaa 5280
gataaaagaa ctgtctatgt agcatttatg catttttctt aagcgtcgat ggaggagttt 5340
gtaaatgaag tacagttcat tacgatacac gtctgcagtc aactggaatt ttcatgattg 5400
aattttgtaa ggtattttga aataattttt catataaagg tgagtttgta ttaaaaggta 5460
ctggtggagt atttgatagt gtattaacct tatgtgtgac atgttctaat atagtcacat 5520
tttcattatt tttattataa ggcctgctga aaatgactga atataaactt gtggtagttg 5580
gagctggtgg cgtaggcaag agtgccttga cgatacagct aattcagaat cattttgtgg 5640
acgaatatga tccaacaata gaggtaaatc ttgttttaat atgcatatta ctggtgcagg 5700
accattcttt gatacagata aaggtttctc tgaccatttt catgagtact tattacaaga 5760
taattatgct gaaagttaag ttatctgaaa tgtaccttgg gtttcaagtt atatgtaacc 5820
attaatatgg gaactttact ttccttggga gtatgtcagg gtccatgatg ttcactctct 5880
gtgcattttg attggaagtg tatttcagag tttcgtgaga gggtagaaat ttgtatccta 5940
tctggaccta aaagacaatc tttttattgt aacttttatt tttatgggtt tcttggtatt 6000
gtgacatcat atgtaaaggt tagatttaat tgtactagtg aaatataatt gtttgatggt 6060
tgattttttt aaacttcatc agcagtattt tcctatcttc ttctcaacat tagagaacct 6120
acaactaccg gataaatttt acaaaatgaa ttatttgcct aaggtgtggt ttatataaag 6180
gtactattac caactttacc tttgctttgt tgtcattttt aaatttactc aaggaaatac 6240
taggatttaa aaaaaaattc cttgagtaaa tttaaattgt tatcatgttt ttgaggatta 6300
ttttcagatt tttttagttt aatgaaaatt taccaaagta aagaccagca gcagaatgat 6360
aagtaaagac ctgtaagaca ccttgaaggt catggagtag aacttccatc ccaagcagat 6420
gaggatttat ttaatctcaa agacctccag gaggggacat tccccaactg tccttgttaa 6480
ctcattttca gaacatattt attagcatat tttacatgta atttggatct tcatgttaaa 6540
tttaacatca gtggagatgg aaaataagca tatcgccttg tctttgaaat agccctatat 6600
tgttagattg tttcttaggc ttctttaccc tgggttaagc agtcctaata ctttagcatt 6660
tattctacat ctagtgtact aatttaaaaa aatcagttct gaaaaatttc taagaacttt 6720
cttcaagttc caagctgtga aatctagaac aggtcaaagt gccttattaa cgtactgtac 6780
tgtgtagtgt cttgaagaga cactttgcgc tgaggcaagt tctgagggca ttgggtggcc 6840
ttgggaagat atttatgcag tttagaacct ggagaattga ttagataact aatcataagg 6900
aaacgtcaca tatttttggt actataaaaa agtggagaaa taatgcctat ttgcaaagat 6960
ttgatttaaa catagaaaca actttatttg gcttccaatt ttaagaattt acagcagtaa 7020
aggggaacag tctaattgaa gtagactgcc tatgcaatag tctctgtata tttacttttg 7080
acaagttaat tcaatgtgta ctatagtttt gtttctttga agaggtttga atagtgcacc 7140
cattttaatc tgtattgcaa attcagggtt acttggcaga ctctactatt taaatcagat 7200
gtaaaaggaa gttttaatat aattcacttt atgcctgaaa gttttcctgg gattttggaa 7260
ggtgatttta ctggaaatgc tgtctgtctt ccctgaaaat ctgagaaatt ccattacact 7320
ttgtttccaa tcagaggtca tgagtgctat atgagtatat acagcatgac gtcatgaatg 7380
tgataaagtg ggttaggaaa ccttttgcta atgattgtta aaatgcaata taaatgttga 7440
agaaataaag ctaacagtta agcctttatt tgggcggaag gctgaaaaag tttataaact 7500
taaacctata actctgctta tgatttctgc caaaccagaa gacttgactc tgggaagcat 7560
tggttacctg tgaactttga aactgacggt ccctgacgta gtttagtcac ctgggaaaag 7620
gtatctgaga ttatctctta tctcccaagt tacagtgagt ctctgaggga actgacacat 7680
tacattaagt tcttggtgta gttaaactgt aagaaaggca ggagaactta gtagttaaat 7740
agttggttaa atggaaatgc tgactccatg ttattgtaaa aagttaaaaa tttaggagga 7800
tatggggatt tcactgccat tgcaggtttt gattggtatt taccaatccg tgtgggtcag 7860
agagaaaatt agaaaggata tgactgcaca ttttggaatt attagcagtt tttctacatt 7920
taaaatggaa ataaattttt taaaaattta aatcaagtaa tactgtattt tttggtgatt 7980
tagatttttc aaaatttaca ctaagagata gtaaggaggg tggctattgt ttctttcaat 8040
aatgtctctg agaggttgta actcatctaa ggatacgtag ctaataagtg gtaggatttc 8100
aatttaaatt ctctgagacc aagttaagta gaatttgcac tgtactcttg tataactttt 8160
taaaactgaa aattagctat ctttcaaatt aagaaaatat ttactaatgg agactaattc 8220
agatttgtaa gtataccaaa atttgaactt agcctgctat ctaatggcaa cttagtggca 8280
gaggtatgat gtaaaatcat tcaggtatga cacatagatg gagtatgttt gtattcgagg 8340
ctgtgcacat aatcaccttt acttgtattg tgaagtatat attgttatct tttatgaagc 8400
ccactaaaga gataatgaaa tacctcgtta ttagggcaag attattgaaa actcaaaata 8460
gcccccaaac acaatacttg gctagaaata tataccttta tagttcagag atcatttatt 8520
atcaaaaccc tgaagttttt tttctaaggt aaaatttggt ggaagaggaa aagtctcgtt 8580
ttaaaaaaat gtaggtagtt acagagatca gaatgattag ttgatcactt accaaatata 8640
tattaagtat ctactgtata taatatgcta gtaagaataa atatagcagg aagtattttt 8700
tcccaggctc taattgtttg acatcagcat gcttttattg tggcacttat aattcagttc 8760
aagtattatg cccctctttg atggaacagt ttcctattca gtaaggaaga ccagattaat 8820
cattggattg gtttgtttca tctttagtgt tctgagctgt agagtattta tttaccaagg 8880
tttattttaa tttttatttt atttttattt ttccatgttc attgtagaat tcattttacc 8940
tacgaatgaa gtatgtagat tatagagaga aaatttgtaa aattaaactg atactgaaga 9000
ctggtataag aaaagcctta tgtaatttgt aagctgctat tcttctgagt ttatacatat 9060
atctttagta atcaatgagg gatggttggg tgactgccct ccaggggaca tttggcaaca 9120
tctggagatg tttttggttg ccacaacttg gggagagagt actgctactg gcatctattg 9180
agtagatgct attactttaa atggcaaagc tgcagttacc tttgcaccaa cctaatatta 9240
aacttcctgc agtgcacggg aaagccccca caacagggtt atctgacccc aaacctcaat 9300
ggtgttaaga tccaaacctt gatatgttaa cctgtagctt taaacatcct ttaaattgtc 9360
aaattcatgt ccctgacata aggtttatgt tagattttca agtataacaa agatttaaac 9420
tttaactttt gtacgttaat gatatgttag cttactccag tcttctatta aaacattctg 9480
tttttaaaat cagagacaca cagcaatttt ataaatcatt tctcttcaag gctgtgaagc 9540
tctccccact tttgtgagtg ccctctactg gtcaaattat ttgctttata acaagtaaca 9600
gtgaaatcct aagtttgtgt agtttcgctg tttaaattat gggtggcatc aatttataaa 9660
tatattcgtt ttatttaaaa gtcttatatg attgatttcg tatcattttt gctctctgct 9720
aatattaata taaagattac tgtctgtatt agttaggcct aactaagtag gtgagtatag 9780
tgaactaaga aaggaaacga ggcagtatat aagaaaatag ggtggttcag ttgttaacac 9840
ttactgagct tactttgttg aagggactaa aaggcagcag tgtggctctc tgagcttctt 9900
tgcatgcact caggagctgc ttaatggagt ccaaggcttg gtggtgtgtt acaggggatg 9960
ataggagggt cctattcaga agtggcaaat tgtgaaagtg cacattttgt agagttttat 10020
aggactgtag aatagttgtg agcacctgat ttttagaata aacagaaaac tcaggtactg 10080
tatttaggtc aaattaagaa taagtattta ttaagacctg aatataaaac tttactggtc 10140
atggtttttt tctaccttgg gtttttataa atccaaagat ttaaaaacat acaaatggaa 10200
gttggtaatg gaattaagtg aaaggaaaaa atgattttat ggtttggaat ctcctaagat 10260
tctggtttta acaatacaac taattcctta atcctagaaa tgttcttcac tgcccacttt 10320
gtaccatgca gtcttcctgt gggctagaga tacactgagg cgcaaaacag accagattcc 10380
tgccttcatg gagcttatta gttttaggta tctctagatt tcttgtaata cctattacaa 10440
tgcctgcaca tcagttcatt catgtgggtt caacgtagta ctcagtacat ggcaaattca 10500
agttttactt ttcggaactt catggatttt tttcctcaga atatctttta tccataattg 10560
gttgaatctg tagatgcagt acccatggat atggatggcc cactttattt tgaagagcag 10620
tgtttctagg caatcatgct aattatatat gacttaattt agaggcttta tacttaagag 10680
cattacattt ctggcgtctc ttaaccatta ttatttcata atgtgtaggt tatggaacag 10740
ttaaattatt gggatcttaa tatagaaatt agtagaaata agccagatat ggtggctcat 10800
gcctgtaatc ttagcacttt gggaggctga ggctattcgc tgtactattt tttactactt 10860
ttctataggt ttgaaatttt ttcaaaataa aacattgaaa aaagtaaggt aggtagtgtg 10920
tccctcctta atcctttcaa atattttatt ttcactattt ctattaattt ttttttttgt 10980
ttttgagatg gagtctcgct ctgttgccca ggctggagtg cagtggcgcg atcttggctc 11040
actgcagcct ccacctcctg ggttccagcc attctcctgc ctcagcctcc tgggtagctg 11100
gtattacagg catgcaccac cacacccaat tactttttgt atttttagta gagacggggt 11160
ttcaccatgt tggccaggct agtctcgaac tcctgacctc gtgatctgcc cgcctcagca 11220
gtgtcactgc ttctagaccg ttttcaaggc acagagctta gaaatgcatg ttactaagaa 11280
atcaagagtt aactattttt caccttcttt ctcccgcagt gagaaccctg gttctaccct 11340
gtttctcctt gtgtaaattt taatgctaaa ctatacactt gtgaaataaa aatgataatg 11400
tcattcttaa attatggatc ttgcagtgtt atctaagtaa catagattga gtgatttaac 11460
tttaggtttc cttatttgtg gaatttggat aaatattttt cacccttgag aaaagtgaga 11520
ctcctttctc atcatcagag tatccttaaa ccattaaggc aaacatttgg gaaaaaactg 11580
agctatctgg ctgcataaaa attaagtttt ctttaacaaa gatagaagac aaatgaaaac 11640
ctagaaaaac catttggttc aagtaacagg aagctatctt atatatgaat tagagaaaag 11700
caaacacaca aatagaaaaa aagggatggg gggtactaaa gatataaata gcttgtctac 11760
caaaaaagaa ataaaataaa taacatgaac atataaaaag acacttactt catgaatgtg 11820
atgcaagttc aaacaataaa taacatttct gtactttcat attggctaag gttaaaatga 11880
taactgctag gaagggtatg gagaagtgtg cgccttgcac tgtagtggga gtatagaccc 11940
tcagacttta tggaggtcag tctggaaata tgtttcaaaa tgtaaactac atgtcctttg 12000
accaggtaat tcaacttctt gaaatttatc caaggattta attggataaa tgtttaagat 12060
gtatatataa gaatgtttac tgcagtgttg tttatgattt taaaaaaatg gaaatcatct 12120
tcatgtctac caatagagaa tgggtgaata aattatggta tgtccatata tacaaattac 12180
atagttgttg gaaatattag gtagatttag atatactgat gttcaaaaat gtccattatg 12240
taagtgaagc tgggtcacag caccttgtgt tgagtatgat ttcatctaga aacaaaatta 12300
ctccctcatc ctttgttgtg ttttagtttt ttaaaataag cttataccat tgggctgggg 12360
gaaaagtaaa tactcgtttt ggagagagaa aagggcacta aagtttcaga taccgttaga 12420
ttatttcatg cttatttttc aagcctcaat aaattacata attcacatgt agtcttggat 12480
taaggaaatt gctattaagg ctaaataaat aatatgagag gtatataata taaaatatga 12540
acattatatt ggcattaaga ttggatccac ggtcattcca gcctctcatt cttacctgga 12600
cttcaagtga tcacttgtgg gcaaatgcca tctgacttga acaggttaca catgtatgct 12660
cattatatcg ttattttcaa aatttgtcat ataaattttc cttgagttca ttcagatttt 12720
tgaactagtt ttttctcttg ggagtagtac acacttaatt ctctctagta ctaagctaat 12780
gttcaccatt cttataattt taagtatcca gcatttagta aagaagtctt tgttttcttt 12840
atccttactt ttagtgaatg tcttagtttt taattgaaaa ttctgccatg aaaataagct 12900
ctttaacatc ttcactccct aatcaaaaca gaaatccttc atagccttca gttgtagcta 12960
tccttccctg tgatttgtcc agctccatta tatttatttt gaaatatggt gaccagtttt 13020
gcaaaattat ttcaactgta ggtgcccagt gattttgtaa ggagaagata ctgtttctga 13080
acagttctca gtagccagtg gcctgcccct actttttggc ctgcgtgtag tatataaaat 13140
aatgcagtta actttttata gcacttttca ttttataaag agattttcat ggtctttaat 13200
attaatctat gtataaagtc ctgtatgcag ttttacctac tttcacagct gaaggaacaa 13260
tagcttagag aagatgtgag ataaagtagt ttgcccaagc ccatagcaca aataagtgaa 13320
gttcttcggc tgtccatgga tcgaagactc ccaagtctat ctctagcctg gacttctgtc 13380
ctgagcacca gacatgtatg tatatcaaga tgcctgcagg tcatatccac caggacaacc 13440
catgagtaca gggaattcaa catgcccaat atcactcatc ttttccttcg ccctcccctt 13500
tgtactcatc ccctgtcggt aagctctgtt attttaaaaa attgaaatgt attcacatag 13560
catacaattt acacttttca agtgtacatg gtttttagta tattcacaag ggttgtgcag 13620
tcattactac taattccaga atgttattat caccccaaaa gtcccacatc cattagcagc 13680
cactccccaa tcccttctcc caccagcctc taaaaactgc taatttttcc atctctgtgg 13740
atttgtccac tctgattatt tcatataaag agaatcgtac agacgtggcc ttttgtgtct 13800
ggcatcctcc acacaggatg atattttcag agttcgtcta tgtttttgct tgttgatcat 13860
tccttcattc ctttttctgg ctgaataata ctctgttata tggatatacc ttattttgtt 13920
tatctgttca tttgatgggc atttgagtga tttcctcttt ttggcaattt tgaataatgc 13980
cactataaac atttatgtac acgtttttgt gtgaccatat gttttcactt ctctcgggtg 14040
tatatctaag gtacagttgc tgggttatat ggtagctctg tctttgactt tttgaggaac 14100
tgccaagtgg ttttggtagt gattgtactg tttacattcc taccaacaat tttacctaag 14160
tatttctcaa atctatttaa tcttttcggt ccatactgct gttgctgcct tagttcagat 14220
tttgtcattt cttgtaataa ttcgtagctc atctcccagt ctctgctccc ctctctccct 14280
ccctccccct tcttctctct cttatttcca cccattttta acatttatag aagtcaaaag 14340
tctagttcag aaagcagaaa ccatactaga tatttcagca cagagaacta attaggtgtt 14400
ggaagactga aaggcaaaaa aacactgaag taacacagta acatcaagaa tgggcactac 14460
tcctaagatt cagggaatgc tgggaagatt tggggtttat cagaactgga agctcagagg 14520
aggggcccct tgtcgctgag gcttaatccc tgcagaggtg cctttggctg ctactggtga 14580
atctgagtgg gtatgatgag tcagtgtctg ggaagggcca aaacattttg tccctttcta 14640
taatttgtca tgataatgct agtaatgaat ctgatctccc ttcctatttt aaaaaccttt 14700
tagtgatttt gtataggatg aagtttaaaa ctccttactt aatatacaca tgaccctccg 14760
taagctggcc cctgcttgat tgtccagttt cacttcttgg tgcttattct aaggcctcta 14820
agccttagag atcctctaag cctttgagat ccccaaaccc tggactgcgg actggtaccc 14880
acctgtgtgg cctgtgagga actgggctgc acagccggaa ggaggtgagc attacttgcc 14940
ttagctcctg tcagatcggc agcattagat tctaatagga gcgtgaaccg tgttgtgaac 15000
tgcccatgca aggatctagg ttgcatactc cttaggagaa tctaactaat gcttgatggt 15060
ctgaggtgaa acagtttcat cctgaaatca cccccaactc ggtccttgga aaaattgtct 15120
tccacgaaac tggtccctga tgccggaaaa gttggggacc gctgttctaa gctaaagtta 15180
tatggagctc cttggttctg tgtcctcaac atgctgttct atgtttttta cattctgttt 15240
gctccttcct gcttggaatg tccttcccct ccccgtcttt cttaatgcat acaaagttga 15300
tctctcctgt gtgccaccat tgtacttcgt cttgcatatg gtgttacatt cattttattt 15360
taattattta tttacgttca tgtctcttcc actcacctta gttgcttgag gtcagaaact 15420
atataatgtg tgacacggaa tgtgacacct agattttcaa taagtgtttc tatgatacaa 15480
gggagactga tgtgggtaga tgggaatgaa ctcatcaacc tctgtttaca taccctaaat 15540
tccctgtttc ttccctatta taattctgac agtctacaac cgtctttgat ggcttataaa 15600
cggaaagtgc ggaacacatc attctacagt gaatttaaat aacctttcgg aagagtaacg 15660
taaagtactt gagcattaat tgagtaaaag tttctcatct tttcctacag gtgttattaa 15720
gcagtatgta aaaagtcctt acaatactta atacattaag aaaacataca atttcaagag 15780
gaaatccccg agtaatacat tattgacatt ttcagcagtt ctagttatat tgagaagagc 15840
atctcatgga attggcagaa tgaagatgga gattaaatga gatgatgttt gtaatatgct 15900
tatgacagta tctggcatat aagtaagggc tcagtaaatg ttgactgctg taattactat 15960
taatagtaat atgattacct ttagtaaaag ttattagttt ctttaggttt tttgtttact 16020
acaatatagt aaacaaaatc tatacttgga atgtatatat tgttttgttt tgatacatgg 16080
aatatgtctc tgtgtcagag tcactgcctg agttggaaaa cccatactcg agtatgttaa 16140
aaggtgaaca cactgaataa tttagttatt aattataatg gaaaaatgac aaacttgatg 16200
ttctggttaa tgaggttatc ttatcttgaa tgagttagct tttaaattcc tcaaaataaa 16260
ggcatttaat aaaccaggaa acacttcatt aaaaaaatta tgcaagtcag tgtaaaagaa 16320
gattaaaatt ccacatgggc aaaggacaca cgttggcgat aaatatgcag ataagaaaaa 16380
aaacctatat aacattatta ctcctcaaag aaattggtat gaaaacaata aaaatgtgta 16440
gcttatcaaa ccaacaaaaa tttaaaaata tgaaatccat tttaagtaat gataaaatgg 16500
gtgcactctt agtgctttat agaatagtag tataatgaac ctcatgtgtg taccaaccag 16560
ctctttcata tcttaacatt tagcaacatt tgatttagct ctttcttttt tccaagatag 16620
aaaagttaat attgttgaag actcctgcat tcttttccct agtcttattt tcttccctcc 16680
cataaatgtg ttaaaatctc tgtgtgtatt gttttggttg tatttttaca taaaacttta 16740
catattatat aaaatttaat tgaaggtaaa atttattaaa ttattcttaa tatatattgt 16800
aatttaaaaa ttaacagctt cattgtcttg ataaaattta tggtatctta aacatgtgct 16860
tgtttttcta agagaacatt gaaacataga ttttaaaaca aattgttgaa agattaaaaa 16920
atctgccttt gcacactgtt acattgaaag tggggcattt gtcgtgaaca ttcatttcaa 16980
atatgtagta tcttcagaat atttgagaag gatttgtatt atataattga aaaatctgtt 17040
aaattgtatt tatgttaact gcttaattct aataaaattt ccattcattt tttagtatct 17100
gcatatattt acatcaaatg gattcattca cttatttaag aggcagtact aattacctat 17160
agcgttcaag actgttaggt agagggtgtg tagtggtgag tacaacaggc gtgagcccta 17220
ccaacacgga gtttaaagcc tagtagagga tatagactta aacaatttca caagtaaata 17280
cataattaca aattataata catgctatga aggaaacata ggaggtacca gagaaggaag 17340
agtgctttgc atttttattt ttaagaccga agagtgctat tggaggactt tgagcaagtg 17400
aatgacatga tctaacctac cttcgttcat tcattcattc attcattttc ttccttcctg 17460
gctcaagcag tcctcccacc tgagctcccc aaatagctgg gactacaggt acacactacc 17520
acacctaatt tttttttgta ttttttgtat ttttgatggg attttaccat gttggccagg 17580
ctggtcttga actcttgacc tcaggtgatc cacctgtctc ggcctcccaa ggtgttggga 17640
ttataggtgc ctagcccatg gtgcctagcc ctaacctaca tttataaact atcacttgct 17700
gctgtgtgga gactatattg tgagattaac agcagggata cctgctagga agcaattgct 17760
gcagattgcc tgagacaaaa tagttatcat ggactagggg gatggtggtg gtggtggtgg 17820
taggtggttg gatgtaggat atattttgaa gataggtaaa tggtgcaaga ttatgggtca 17880
gttttaaatg cttaagtaaa ttttctttgt aagacatttt aggatgccat gttaagaatc 17940
tctttataac tgtcatttaa aaaaaaacca catattttct tagcataatt tcccatagta 18000
acattactat gtcaaaggct atgaacattt gaatgacttt agataaatac tgtaattgct 18060
ttccaaaaat attgtgctta ttatgtcacc agaaatgttt gaattctgtc tacaattcag 18120
tcttgccagt atagtacatt tcatttagaa aaatttttta ctatgtagat ggaaaaaata 18180
atattttagc tgggagtggg gggactatgg ggaataactt tccttcattt aatattttat 18240
tgtgagttag tttaagttac tttattttat cgtagtttcc taaggctaca aattagtaac 18300
cttggtaact tatgtaccta atttaaaagt ttactttttt gaaaggctgg aaatactaat 18360
taaaaacgta acaccttcat ccttgtcttt gctccattat taactagttt cattacagaa 18420
tctctgtgtt ttaaaatcag atgggttttc ataaccagta ctttctcaga gtggtaaatt 18480
taaaaaaata tataaagaga ataaataata tttgttgaga atacttcaaa taatgtgaag 18540
agttattaac ttacagcagg agttggcaaa cttttctata aagggccata tgggtctttg 18600
tcacaaagtc ttgggttttt gtttttgttt ttttaaacag ctatttaact attcctagct 18660
aatgggcaat acaaaaacag tgggcaagat ttggcctgtg ggcagtagct tgctgaaacc 18720
ttatttagac tctaaatttt ttgaaagagt ctacattgat gcatattttt ttttcttcct 18780
ccaaatacag ttgacccttg aacaacatgc gtttgagtga ccatgggtcc acttgtgata 18840
cacgtttttt tcccaaccaa atgcagatat ggagggctga cttttcatat acctggatgt 18900
tcctgggcca actgtaggac tagaggctgg gggggtcttg gaaccaatgc cgtgtgtata 18960
ccagggatga ctgtttctta tggcctgacc tgaagttgga acagaatctt tattaatata 19020
taatttttgt tgcgtttgtt ttctctttat atttatccat tctttttaga tcgtatttca 19080
tttaacactt tttcttcttt agtttttacc aagttgcact gaaaatagct cagtgactaa 19140
ttgcacttct aagagtgagg accctagtta aaattaactc taaaaatact gaatttttaa 19200
cctaaacctt ttatttctaa tcaacagtat tatttatgag taggttatag attactttga 19260
aacggaatgt gtctcagaac tttgctatcg atatttttaa ggtctggtag ggaaaagata 19320
ataggaatga gatttatcag tgaatagggg actgctttcc cagtttctcg gtcgcactgg 19380
tgtattcacc atggaagcat cttatgaaat atgtacataa actactaata tcccacatta 19440
caggttgact attctttatc tgaaatgctt aggacctaga agtatttttg gattttggtt 19500
tttcagagta gggatactca gcctacattg gtaagtaaag aatgtgaggt gacaggctgg 19560
gcgcgatggt tgacgcctgt aatcccagca ctttgggagg ccgaggcgga tcacctgagg 19620
tcaggagttg aagaccagcc tggccaatct gtactaaaaa tacaaaaatt agctggacac 19680
agtggcacgt gccagtagtc ccagctactc aggaggctga ggtaggagaa tcgcttgaac 19740
ctgggaggcg gaggttgcag tgactcgaga tcgtgtcact gccctccagc ctaggcaaca 19800
gagcaagact ccatctcaaa aaaaaaaaaa aaaaaaaaaa aaaagaatgt gaggtggcag 19860
caataggtag gaagagtctt tggtcagctt tacatgctct gtagccatgc ctgggtaatg 19920
ggttgactct aagactctgt gctttgctcc cacctcctgc tttttcatta ctctttagaa 19980
tggtttttaa tttgtgatct ataggagttc tttcaagtat ttaataagag aataggctaa 20040
attaagtaaa tgtcaactga atgctcaaat ctctactaaa gagcctctta tttagaaaat 20100
aaatatccat cttttttttc tgactggtga gataattaat ttttattaca gatggtttgg 20160
aaaataccat atgctttaaa agataagcac aaaattatag tctaatatgt aggttttcat 20220
actttaaaaa attgaaaacc aaagaaaaac atttaacata gcatctagta caaagaaaag 20280
agataagcaa gagataaatg tcttttttgg gacagagttt tgctgttgtt gcccaggctg 20340
gagtgcaatg gcacaatctc agctcaccgt aacctccacc tcccgggttc aagtgattct 20400
cctgcctcag cctcccgagt agctgggatt acagtcatgc accaccaggc ccaggtaatt 20460
ttgtatgttt agtagagatg gggtttctcc gtgttggtca ggctgatctc aaactcccga 20520
cctcaggtga tctgcccacc ttggcctccc aaagtgctgg gattacagac atgagccatc 20580
gcacccggcc aagataaatg tcttttaaat tatctccatt aaagacataa cctttataac 20640
attttgatgt atatattacc agtttttaaa cacatagtag atttgtataa atacataaac 20700
acatattatt gtgatcatgc tgcacttaga catctttata ttctccttat actgtaaaca 20760
ttttgaaata ctttactaac aacatttgta atgaccattc tttctctctt tctccctctg 20820
atagaatggt ctacagagta attcataaac taaacatact ttagaggctg ggcgcagtgg 20880
ctcatgcctg taatcccagc actttgagag gctgaggcgt gcagatcacg aggtcaggag 20940
ttagagacca gcctgactaa catggtgaaa ccccatctct actaaaaaaa cagtacaaaa 21000
attagccggg cgtggtggcg tgcacctaga atcccagcta ctcaagaggc tgaggcagga 21060
gaatcactcg agcccaggag gcagaggttg tagtgagccg agattgcacc acagcactcc 21120
agcctgggcg acagagcgag actccatctc aaaaaaaaaa aaaaaagata cattaatact 21180
atagcctaca tgtggaacat taagaaaata attgctttta tgtttatgct ttatacctgt 21240
tgttagccct gcttcttatt tcatgatttc atggcttcac attgtaacat ccctttacca 21300
tattttttga ggactgtttt ggcagaatgt gtgaaatctt gagcagaagt attacccaaa 21360
agtcagaaga aaatcagatt tttatttcaa gattctgtta aagttaccca ctcccttctt 21420
ttacttaatc ttatagttgc agttctctct ctttttagaa aagaaaaaag aggcccctca 21480
ggatttgcag atgaaacaat attgctcttt agagatatcc atctggctgt tagattattt 21540
ttccacagtt ttcagaagtg gatgaggcca ttagaatctt gagtattgcc catttcctta 21600
tgtgtgcctt tgactataga taaaatagat gcatgacaat tatttataag ttgattgatt 21660
tttcttgtca tttaaatcat cttgaataat agagttggta gagctatccc atttttgaaa 21720
ttattttgtt ttgtcaataa ctttttgtta ccagcatgta cacttgcatt gttgactctc 21780
catataatac ctttaaaaaa tttttttttg tggtaaaata tgcataacat aaagtttacc 21840
atggtagttt tctttcattt gttttgtttt tgtttttttg agacggagcc ttgctctgtt 21900
gccaggctgg agtgcagtgg agcgatcttg gctcactgca acctccgcct cccgggttca 21960
agcaattccc ctgcctcagc ctcctgagta gctgggacta caggcgcccg ccaccacgcc 22020
cggctaatat tttgtatttt aatagagatg gggtttcacc atgttggcca ggatgttctt 22080
gatctcctga cctcatgatc cgcccacctc ggcctcccaa agtgttggga ttgcaagtgt 22140
gagccaccgc gcctagacca tggtagttaa ttttaagtgt tcaattcagt gaccttaagt 22200
gtgttcataa tgttgtgcaa ccatcaccat gttgtctaac cattagcact atctgttttg 22260
agaacttttt tttatcatcc caaattagaa ttctgtacct gtcaaatagt ccccagtaat 22320
cctccctccc ccagcccctg gtaatctgta gtctactttt cgtctttttg aatttgccta 22380
ttttaggttc ctcatataag tggaattatg tggtatttgt ccttttgtgt tggcttactt 22440
catttagcat aatgttttca aggttcatct gtgttgtagc atgtatatac aggttgaagc 22500
atccgttatc caaaatggtt gtgaccagaa gtggtttgga tttcagattt tttttttgga 22560
ttttggaata ttcatagata cttaactggt tcagcatccc tcgtccaaaa atccaaaatc 22620
agatggagct cagtggctca tgcttgtaat cccaacacgt tgggtggcca aggcaggagg 22680
atcgcttgag cccaggagtt caaccagcct gagcaacaca agaccctatc tctccaaaaa 22740
aaaaaaaaaa aaaaaaaaga tgaaagaaaa aaaaatccaa aatcaaatgc tccagtgagc 22800
atttcctttt agcatcatgt caggctctaa aagttacagg ttttggagca ttttggattt 22860
cagatttttg gattaacctg cattaatgct caacctatat gaaattttat tcctttttat 22920
ggctgaataa tgttccactg tatgtatata ctacattttg tttatccatt catctgttaa 22980
cagacactta agttatttcc acattttggg tattataaat agtgctgctg cgaacattgg 23040
tgtacatgta tctgtttgag tccctgtttt tagttatttt ggttatatac ctaggaatgg 23100
aattgctgat catatggtaa ttctgtgttt aactttttga ggaactacca ctgttttcca 23160
caatggcatc accattttac attcccacca gcaatgcaca aagatttcag tgtctgtatc 23220
cttgctaaca cttattttcc attttttgag tttttttgtt ttgttttttt aataatagcc 23280
aatcctaatg ggtatgtggt agcatctcat ggttttgatt ttattttcct gactattgat 23340
gatgttgagc atcttttcag gtgcttagtg gccatttgtc cgtcatcttt ggagcaggaa 23400
caatgtcttt tcaagtcctt tgcccatttt taaattgaat tttttgttgt tgagttgtat 23460
ataacacctt ttttgaagta aaaggtgcac tgtaataatc cagactgtgt ttctcccttc 23520
tcaggattcc tacaggaagc aagtagtaat tgatggagaa acctgtctct tggatattct 23580
cgacacagca ggtcaagagg agtacagtgc aatgagggac cagtacatga ggactgggga 23640
gggctttctt tgtgtatttg ccataaataa tactaaatca tttgaagata ttcaccatta 23700
taggtgggtt taaattgaat ataataagct gacattaagg agtaattata gtttttattt 23760
tttgagtctt tgctaatgcc atgcatataa tatttaataa aaatttttaa ataatgttta 23820
tgaggtaggt aatatccctg ttttataaat gaagttcttg ggggattaga gcagtggagt 23880
aacttgctcc agactgcatc ggtagtggtg gtgctgggat tgaaacctag gcctgtttga 23940
ctccacagcc ttctgtactc ttgactattc tacaaaagca agactttaaa ctttttagat 24000
acatcattaa aaaagaaaac cataaaaaag aatatgaaaa gatgatttga gatggtgtca 24060
ctttaacagt cttaaaagca atcgtgtgta tagcatagaa ttgcttggat tggataaaca 24120
gtggcattat atattttaaa aaataaaagt tttgaaagat tgaagaattt gggcattaca 24180
gttctcttaa atctgacaaa gctgcataaa actattaaaa taatcattat tatactattt 24240
tatattctat ttctttgagg gtttagtttt ccaaaaacta catattaagc aaatgaatca 24300
ctcagtggct atgtcatata ataacgagtt agcctagtta taagaagttt aacattttat 24360
ttaagaacat tgttacagca tgtttactgt atagtctagt aatagaggaa aagacatttg 24420
ggtgggtggt agtggtagta tttttataga ggagttacca aatttcagct ctattatcca 24480
agtttaccca gctaatggtg ttcggaaccg ggaatttgag ccaattctga ctctgttgtc 24540
tgctctgctc cttcttttgt gctgtgtctt tgaaagtcac ctaaaattgt gagggaatgt 24600
aatttcaccc caaatttaga gtttatgcac ttgttatatt gaaaatgatt aacatgtaga 24660
agggctttta atggaataag tggtgtagta acttcagtgt tgcctaccta gaaatcaaaa 24720
tctttctagt tgtccacttt gttttttgaa aaagtaatat gaaaattatg ttaatgcttt 24780
aattcaggtt tttgtaaaat attttttatc tttacacatt taacatacgt ttctaaaatt 24840
atagtctgtt atatagcact ttgggtctag aatttttcag tagtttctgt tttactatta 24900
tgatctacct gcatattaac ctattaggtt atagttttac tatacttcta ggtatttgat 24960
cttttgagag agatacaagg tttctgttta aaaaggtaaa gaaacaaaat aactagtaga 25020
agaaggaagg aaaatttggt gtagtggaaa ctaggaatta cattgttttc tttcagccaa 25080
attttatgac aaaagttgtg gacaggtttt gaaagatatt tgtgttacta atgactgtgc 25140
tataactttt ttttctttcc cagagaacaa attaaaagag ttaaggactc tgaagatgta 25200
cctatggtcc tagtaggaaa taaatgtgat ttgccttcta gaacagtaga cacaaaacag 25260
gctcaggact tagcaagaag ttatggaatt ccttttattg aaacatcagc aaagacaaga 25320
caggtaagta acactgaaat aaatacagat ctgttttctg caaaatcata actgttatgt 25380
catttaatat atcagttttt ctctcaatta tgctatacta ggaaataaaa caatatttag 25440
taaatgtttt tgtctcttga gagggcattg cttcttaatc cagtgtccat ggtactgctt 25500
ttggctttgg tttctttcta cattgaaaat ttctcttcaa ttctgagcac atgttaacat 25560
ttagaattca agaggtgggg attttttttt cccatggtta catatatata tatatatata 25620
tatatatata tatatatata tatatatata aagaacaggg caacaaattt ttgcgttttc 25680
tatttcggta gtacttttaa accattatgt catgtttcta ggttaaacgt tgttgtattt 25740
gaagaatttt actttggcag aatttttttg aggatgtgtt tatttctgga gaaaggtctc 25800
attaaagaaa gacaataccc agaaagccaa cagaaattct gttactcatt taatgcattt 25860
ttctgacaaa aattattgcc agagagaacc tgaattttgt ttcaaaaatc atctttgttt 25920
taaaaatgac tttttcttca ggtaaaataa aataatttca gttgctatta tttaacctgt 25980
ttgtatgaag agtttaacat ataggaaatg aatacataaa gataggaagg aattaattgt 26040
tatatgtagt catatgtctc ttaatgacag ggatactttc taagaaatac attgttaggt 26100
gattttgtca ttgtgcaaac atcatagaat atacttacac aaaccttggt agtataacct 26160
actatacacc tgggatatgt agtatagtct cttgccccag ggatacaaac ctgtacagta 26220
tgtaactgta ctaatgacta taaggcaatt gttaacacaa tggtaagttt tgtgtgtcta 26280
aacctacact tgggctaccc taagtttata tattttttta aatttctgtt caataataaa 26340
ttaaccttac tttactgtaa ctttttaaac tttttaattt ttcctaacat tttgactttt 26400
gtaatacagc ttaaaacaca cattatacag ctatacaaat ttttctttcc ttatatcttt 26460
attctgtaag cttttttcca tatttaaaat tttttgtttg tttttactta ttaaactttt 26520
ttgttaaaaa ctaagacatg catgcacatt aacctaggcc tacacagggt caggaccatc 26580
aatatcattg tcttccactt ccacatcttg tcccactgga agatcttcag gggcagtaac 26640
acacgtggag ctgtcatctc ctataataac attgccttct tttggaatac ctcctgaagg 26700
acctatccaa ggctgtttat agttaacttt tttttttttt tttttttttt tttagtaaat 26760
aggaggagta cactataaaa taacaatata ggtgctatac cattatacaa ctgacagtgc 26820
agtaggtttg tttacaccag catcaccaca aacacgtgag caatgtgtcg tactacagtg 26880
ttaggatggc tataacatca ctaagcaata ggaactttta aactccatta taatcttatg 26940
ggaccactat cacatatgca atctcctgtg gaccaaaatg tcattatgtg gtacatgact 27000
gtactaagaa attgatccat ctatattcca tcaatttgtt tagggctttt tctggttaca 27060
tttacctgtg agcccagaaa accagttttg tagaaattaa cttctgtaat gctaggagtt 27120
aaaaaaaatt gctgaacaac ttttacattg ttaaacattt aaaaacaagc gttctagaag 27180
tttatcaaat ttcataaagg tgcaaaaatg taaatgtaaa tcattatcca gctaatatat 27240
atgttgtatt tccctagtag gagagcatat gtacctcttc ctagttatac aaatttgata 27300
tatagtaaag aaacagtaaa ttctacttca agtcattttg ggaggattaa aaactgaatt 27360
tctctagttt gaccattgta cagatttatc tggcaatttt actaaaacct gatttatagg 27420
ttaaacttgg tgtatatcat atatcacttt actttagagg aattaagatt tcacataaat 27480
ccatttccag gttccaaaga ccaggaagag gcttggtttt tgtttttctt tttactgtct 27540
ttacagtctc cttgactttt cttaggagag aaggtactga gaaaacatga ttctaatatt 27600
tattattttt tcttccaaca ttttcttatg aaacattttc aaatacaaaa ttgagtttta 27660
tttaaaacat ttgcaaatat actacctaga ttctaccatt gttgttttat atttgcttta 27720
cttacaactt ttaaaagatg ctttttatac cactgaacat tttagcttac atttcacaaa 27780
gaaaagaaaa aatttaagag actttgcata atgttttaag gggttgcagt aaagaagtgc 27840
ttcttatatt ttcttatgca tacaaatcag ctgggcttat taaaatccag attctaattc 27900
agaaggttta ggtggggacc gagtctgcat ttctaacaaa ctcctaggtg gtatttttct 27960
tggtacttgg accatacttt gagtagaaaa gcagtagagg acataaaaag agtcttgtta 28020
gtcccacttt gttgctgtcc acttctcatt tgataatatc ctaaaatagc tgtgtctcct 28080
ttttggtggt tgtatgatta ctacctcaga agtactaatt gattcttgct atttgacctt 28140
aatactttaa tataacacag cattcatatt tgatcagaaa actatctggc ttccttttat 28200
aagagatttt taggttttat acagttttgt ggccttgggt ttttttgttt gatttgtttt 28260
tttgaaggta tataatatgt aagtagataa acaaatttga tttgtagaca tttttatgtg 28320
gatcatctaa ttaaaaatgg agggatacag tatgaaagaa tacttgtact tcttaacaga 28380
gcactcaacc tttcttttac atcctgtttc actgatgtta ttatgtaatt tatgttgcta 28440
aactataaat tagatattta atttctgttc tttgatttcc ttttattatt aaatggactt 28500
gttgatttgc ctagaaatta atttgccttt caaaagtctt attaatcttc ctccgttgaa 28560
attaatttga tatttgcatg cttctggaag actttaaaga gctattccga gtaactgtag 28620
agattataaa atgaaatatg ggaattttaa taaattttac atctccagtt actggtgaaa 28680
atgtcaagtc ctcctttctg cagagtattt tgttactcat ctgttattca gcttatttat 28740
ttatttattt atttatttat ttttctttct ttcttgtttt ttttttttga gacggagtct 28800
tgctttgtcg cccaggctgg agtacagtgg tgggatcttg gctcactgca ggctccgcct 28860
cccgggttca caccattctt ctgcctcagc ctcccaagta gctgggacta caggcacccg 28920
ccaccatgcc ttgctaaatt tttgtatttt tagtagagac gggtttcact gtgttagcca 28980
ggatggtctc gatctcttga cctcgtgatc cacctgcctc ggcctcccaa agtgctggga 29040
ttacaggcat gagccaccgc gcctggccct tatttgtttt ttaaacaaaa ttagtgtgca 29100
tatccttgtt gtattttatc ggcaagttgt tttatgccct aacttttggg gtcttgatca 29160
tgagcctaaa acacgtaaac acccaaaaag aattatattc cggttaaagg aacaaaacat 29220
tcatttagaa gttctcatcc atgtaaatca gaggctggca aatattttct gtaaagggcc 29280
aagatagtaa atgttttagg ctttgagggc cacaagtggt atctgttgca ttttttttta 29340
attatgaccc tttaaaatgc aaaaatcgtt gttagcttgt gcatagtata aaaataggct 29400
ggccgcatgc tgtggctcat gcctgtaatc ccagaaatga ggtgggaagc cgaggtgggc 29460
acaccacctg aggtcaggag ttcgaggcca gcctggccaa cgtggttgaa accccgtctc 29520
tactaaaaat acaaaactta gccaggcgtg gtggcgggtg cctgttatcc tggctactca 29580
aggggctgag gcagtagaat tgcttgaacc tgagaggcag aggctgtagt gagcccagat 29640
caagccagtg cacaccagcc tggacgaccg agcgagactc tgtctcaaaa aaaaaaaaaa 29700
aaggctgtgg ctgcatttgg tccattggct gtaatatgct gattcctaat tctctgggta 29760
actttagtgt ttgattagct actagaagtt aggttaaact tttgtatttt acaggctaac 29820
tttaataatc ttaaagtaaa acttaacata gttcatggaa aggaaataga aattttaccc 29880
tagtactctt tttttttttt tttttttttt ttgaggcaga gtctccctct gtcacccagg 29940
ctggagtgca gtggtgggat cttggctgat tgcaacctcc tcctcctggg ttcaagcaat 30000
tcttgtgcct cagcctcccg agcagctggg actacaggca cgcaccacca cacctgactg 30060
atttttgtat ttttagtaga gacagggttt cgccatgttg gccaggctgg tcttgaactc 30120
ctggcatcaa gtgatcctcc catctgagcc tcccagtgtg ctgggattac agacgtgagt 30180
cactgtgcct ggtctctagt attttttttt tttttgagac ggtctcactg ttgccaggct 30240
ggagtgcagt ggcgcgatcc tggctcactg caacctccgc ttcccggatt caagcgattt 30300
tcctgcctca gcctcctgag tagctgggac tatgggtgca caccaccacg cccagctaat 30360
ttttgtattt ttagtagaga cggggtttca ccatgttggc caatatggtc tcaatctctt 30420
gacctcgtga tctgcccgtc tcggcctccc aaagtgctgg gattacaggc gtgagccact 30480
gtgcccagct gtacttttta agataagaat tgcagggtat atatttttac caacttaata 30540
acttataatt ttaaaaagct aattacttgg ctagaatata atgcgttaca tattctttac 30600
actcagttca gtccatatct gaaaggcaaa tagaattatt ttctgctagt acattgtgta 30660
gtccctatgt tcctagtgta taaggactgt tacctagttc acatttatct gggttgttga 30720
cagattttcc tggtcccttt ggacagtgca tggccatgtt ggcaaaagct gtcaaaattg 30780
aaacattgac accatgagaa ttgtgtgttt tccagtctgc taaaatcaaa agtgggaggg 30840
ttcagtaagg tgaataacag aagcagagtt ttcggggtat ctgttactcc tcattcggct 30900
tttctgctct ctgggggtct caatttaaat ataatgtgaa aattagtttt acgaacctaa 30960
aaatgttgag tgattcattt cctggttttg ttgttaattt ctagatattt aaattaattg 31020
ttagaagaac cccgttaaag aatgctttgc aaaacaacct ccttatgtgc tatgtctctg 31080
tttaatagta gttgagtttg tgtacatgag atcaatattt tgaactatag ctttttatga 31140
gttaaaaatt gacggaacag ttactgtgca cttgctgtgc accatggtag tctcccaagt 31200
agtggttttt ctgcatttca atagtacatg agataggctg tgggtggcaa ggtttcttga 31260
gaaagtgagg gatgcacagt tgggttttag aatacatctt gttcctccat gcccttcccc 31320
accaaaaggc tggtagtctt gcatttgtat atagttaggg tatttgatgt gttgcttcct 31380
tgacagagtt ttgcaagaat ttgcagattt aacaggaaca aaaacttact taaaacaaaa 31440
tctcttagta aaagcatagt ctagcaagat ttagaatgat actttggcta acagtacttt 31500
ctctatatgg agtgctttgt ttccatagcc tcacaagtat gttttcagat aatagttgag 31560
ttgaaaatgt tgtcaatctc ttgattttaa aaaatttaca tatttaaagt tgtatacttt 31620
tgttcctacg tattttcagt tgttcttaaa gtttaataag tgacatttga aaatgagtat 31680
atgtgtataa aaacaaaagt aggctaggca cggtggctca tgcctataat cctagcactt 31740
tgggaggctg aggcaggcgg atcacaaggt caggagtttg agaccagcct gggcaatatg 31800
gtgaaacccc cctctactaa aaatacaaaa attagctggg tgtggtggtg catgcctgta 31860
gtcccagcta ctcaggaggc tgaggcagga gaatcgcttg aacccggagg tggcggttgc 31920
agtgagccga gattgcacca ctgcagtcca gcctgggcgg cagagcgaga ctccatctca 31980
aaaaaaaaaa acaaaaaaag aaaaagttaa aaaaaaacaa aaaaccccca caaaatgagt 32040
atatgtggca acaagtccta ttctcaaaaa aattattgtg tgctagttaa gagcttaatg 32100
agtagccagt cggtattaaa tatctgtttc agctatattt tatctttaaa aattatctac 32160
agattttgga atgtgaaaaa ctagtgtttt gtttcatagg tatatactgt aggcatttta 32220
aaaataagag ccagtgccag tggtttacag tgtacacaag gataatgttc tcatgttctc 32280
ttgatgtcag tatgacttta aagcatatta tcaagaaata actaagtctg aaaaactgtg 32340
gtaaataact ggtactctaa aacctaagtt tcttattact aaaaataaga aatggtaaaa 32400
gtcaccctgt gctgttaatt atatgagcca ctgaggtcct gacactgaat tcttggtggt 32460
ggataataat ctcttctttt taattattgg cttccaattc tctctgcatt gctggaaaca 32520
aaaatcatat atttcactat tggtggtggg gatgctgtca ctgaaaaagt agacacattc 32580
atattgattt tagaaataag ttaaaatcaa aatttgcttc tgctaaatta gtagaggacc 32640
aatactgttt ttctccttca tagtatgttt tggtacttct acattgacat tataactttt 32700
ttttttttaa acagaaatag aagtttacat tcttagaaaa tttatgaaaa tatgagcttt 32760
tacctggttt gtgtgtgtgc gtatatatat acacatattt ttaaatttct tacattgatt 32820
ttcaaattga aagagaacca tttgtgaaag tatcttaaca gagctcatgc tttacatttt 32880
acatgctaca aagttatttt agtgccttaa attatttatg ttgcttatta atgaaaattt 32940
tggatacata attttttcaa gacaaaggta aaaataataa accctttcct tctgaggatt 33000
aatgataaat ataaacttta aaacgattaa aaaaattttt ttagagacag ggtcttgctc 33060
tgttgcccag actgaagtgc agtggtgcag tcatagctca atgaagcctc aaactcctgg 33120
gcccaggcaa ccctcctgcc tcagcctttt gagtagctgg gacttcaggc tcatgccaac 33180
atgcctaatt tatcttattt ttagtagaga tgaggtctca aactcctggc atctcttgcc 33240
ctctcaaagt gctggtacta caggcattag tcaccacacc tgacacttaa aatcttttat 33300
atacaggtgt aagtgggtat ctaacttaaa gtgccaacga atgtagttga aagtttgtag 33360
ttggcttagc taactagtta actaaattga ttccattaaa aataagataa gactgctctt 33420
agaatataat gatttttgtt attcgttaaa tataaatata tcactggata gtatatgtta 33480
atgacttgag atacgcattt taacatataa tcacgttact taaatgcctg cctttgaact 33540
gaaacttaac attatgaatt taaattaaag tttgacttta gaggtaaatt tctgtacttt 33600
actaaagcag ttcttaatat aattctgaga tttctaaaaa ttagtgtgcc ctaaagaatt 33660
gaggtgtgtt tttcttaact actgtaggca gtagatgtac agatgacttc tgcatgcaaa 33720
aattaagccc tagccattgg tttacttcaa ctaatactta gttgccaatt ctctgtgtgt 33780
gattgaattt aaaactgcaa atggtactgg tgatacatta actttttagg tgctaggtcc 33840
actttgttac atttggttca gtagaaacat tgatgttacc aatctcagaa agctaaaata 33900
tgtatgccaa tccccaaatt aggtaattta ttcttaattt taagataaaa gaatagaatt 33960
cccttaaaat taaatgtgga gtaaaatata ccagctttaa aaaatattca cctttctgtt 34020
agaagaatga acataatatt acatctttta atttgcacta tatatagatt aatatttctg 34080
tgtatttctc tgtgccccta ctttgatggt atgcttttct gaacaaacta gcagcacagt 34140
taactaagca ctttgccccg tttgatgact gcctaatttt ctagattgga aaatattaaa 34200
aacttttatc tccatatggc caatatatga ttgtacctgt tgtcatagct ctcttatgtt 34260
taagcaagaa aaaccctatt aagagtattt aaattagaat ggaaggcaca cagccagtat 34320
gattgaacac tgttctaaaa attattttta agacttgtag taaggccagg tttggtggct 34380
catggctgta atcccagccc ttaggaggcc aaggtgggcg gatcacttgt gctcaggagt 34440
ttgagaccag cccgggcaac atggcaaaac cctgtctcta cgaaaaatac aaaaatcagt 34500
caggtgtggt ggtgcttgcc tgtagtccca gctatttgag aggctgaggc agggggatca 34560
cctagcctgg gaggtcgagg ctgcagtcat gatcgtgcca ttgcactcca tcctgggcaa 34620
cccagtgaga ccctgtctct aaaacaaaaa aataaaaaaa gaacttgtag taaggataca 34680
aaatgctcct attttgtgtg tgtcctttaa ttcatgatgt ttttatatta tggtaagcag 34740
ctctcattta agattttaat aatgtaatta aacatgtaca gaagacccag tctcagcttc 34800
acttgtatac cctggaaata gactgaaagg tgttaaaatt taagataaaa ctcaaggttc 34860
cagtttcttg actcaccttt gagattcttt tatgtttttg ttgtttttta acaaaggttt 34920
cacgtccata ttttaccatt tttcttctca ttctcccctg gaggagggtg tgggaatcga 34980
tagtatataa atcacttttt tcctaagtca aagaagtaat ttaaagctaa cttcagttta 35040
ggctttaatt ccaggactag caaactaaaa tggttgcatt aattgacaaa cagatgctaa 35100
tacctgtgtt taggcttgtc ataatctctc ctaattccta atttaaaaat tttaaaattt 35160
aattccatta gaaaacaaaa ctgactttta agaacaaacc aggattctag cccatatttt 35220
aaaactgcat cctcagtttt attcaaacag tctgatgtct gtttaaaaaa aaaaaaatct 35280
caagctcata atctcaaact tcttgcacat ggctttccca gtaaattact cttaccaatg 35340
caacagactt taaagaagtt gtgttttaca atgcagagag tggaggatgc tttttataca 35400
ttggtgagag agatccgaca atacagattg aaaaaaatca gcaaagaaga aaagactcct 35460
ggctgtgtga aaattaaaaa atgcattata atgtaatctg gtaagtttaa gttcagcaca 35520
ttaattttgg cagaaagcag atgtctttta aaggtaacaa ggtggcaacc actttagaac 35580
tacttaggtg tagtattcta acttgaagta ttaaaagata agaaacttgt ttccataatt 35640
agtacattta tttttaatct agtgggaatt aattataatt gagacaattt tgatggctgt 35700
agtagactaa tctatatttg gcataaagtc taatgattta atgagtctta agtaaactaa 35760
atatttggaa actgatattt acctttattt ttaagggaaa agttttgaga taatcagcag 35820
cttttttttt tttttttttt tttttagtag ggagaaaaag atatgagcta tagtagacag 35880
cagtaatatt gaatggccca gaaggtggga aaaagccact cttaaatgta ttttttcttt 35940
tggatatttt acaagcaaat aataacttct gcctaagttc gccatctcag tggcatcagc 36000
agcacagcac tttcttatcc cagtgagaaa cctgggaatt ttaggatgac tcctaccgcc 36060
ctcttttccc cctggtttgg aagtatccac aaattcctgt gacgttacat tctgtgtctt 36120
ttatgtcatc attagttcag gcccctatca tttcttgttg gactgttaga acctcctatt 36180
tggtttacca gttgctgcca tcattcattg tgaaaccgga gagatacact ttaaagaaat 36240
gtcatttttg gccgggcgcg gtggctcacg cctgtaatcc cagcactttg ggaggcctag 36300
gcgggtgatc acctgaggtc aggagttcaa gaccagcctg gctaacatgg tgaaacccta 36360
tttctactaa aaatacaaaa aattagccgg gcgtggtggc acgtgcctgt aatcccagct 36420
acttgggagg ctgaggcagg agaattgctt gaacctggga ggcagaggtt gcagtgagct 36480
gagaatgcac cattgcactc cagcttgagc aacaagagcg aaactctgtc tcaaaaaaaa 36540
aaaaaaaaag tcattttagc tatagaataa aatctcatgt tccacatgtg ttgcagatag 36600
tccttactac cttcccacca ctccagctct tttttggtct tatatctaaa aacgtcatct 36660
tgcctgaatt tcttttgttc ttctataaat aaataccatg ttatttccta ccttcccttg 36720
agtcttggct cttgtttgga atgccagtat ttttatccct agtcttacta attagctaac 36780
actctcatga ttccccagtc tcctactctc taaaaacctt tctttaaacc cttagactag 36840
gcatggagcc cttcctgtgt attcccagaa tactattctt aactattata tgcttcccat 36900
gttatgttga aataactaac ctcttctgtt tcattcctat attacttgac agcaaaatct 36960
tagccagaat tacatatttt taatctttgc acacccattg cctagtaagg ttcctgggac 37020
atagtaacta cccagtaaat atttattgcg tggaattctc attttcgttt ctaaacccgt 37080
attaaactct gtcttgctca gaaaatactt cactaggtat cataaagttc atggcagagc 37140
ttaagctttg gatgcatatt gtttgtaata tatcatgttc ttaagaatag gcaataaaat 37200
tacagttttc aaaaactact acatttatta tatttattac aagttggtgt tctttattac 37260
atgaatttta ggtatttccc aaaagtataa aatatacatt tgaatagtag actcaatccc 37320
aaaagatact acgtggtgta ctaatctact aaactcagaa acaaagcatg actggcatta 37380
atttttgttg aaatttatga actctgaatg tttttgaata tcattctgta aagcaatatt 37440
ttgcaattaa agcaattttg catgttaaat tttaccacaa cctctaaaat attgcaaatt 37500
taacaataca gtttgaaaag ttacacattt taaataacag taccatgacc agatttaggt 37560
ggtggtttta attttttatt ttctcctcct attgtctcac cattagatga ttttaaaaat 37620
agaattgttt agagtaaaat aagtgttatg ctctaattta tatttaaaat gaaggtttaa 37680
gcacgtacta ttctaaaatt tctaatttgt gcaaattatg ttttatacag tgactgtagg 37740
tgaatgtcac aattgtttga tgtgacgaat ccttgttttt cagtacacgt ggaagtaatt 37800
catataaaag agaagtatac ttggtaatta aaaatttaaa attaaataca atttaaaaaa 37860
aaatttattt gacaagctgg ctgtggtgtg tgtgcctgta gtatcagctg cttgggagcc 37920
tgaggcagga ggattgcctg accccaggag tttgaggttg aagggagcta tgatggtgcc 37980
atggcactgt agcctaggca acagaaagag actccatctc ttaaaaaaag taaaaataaa 38040
aaaattttgg cacagggaca gtggctcaca cttataatgc cagaacttta ggagtccaca 38100
gcgcgaggac tgcttgaggc caggagttta agaccagact gggcaacgta atgagacccc 38160
acctttagga aataaataca taaataaaaa tttgacaatg ataaacatat ataaattagc 38220
ttttcttagt cctgaaaaag ataatgttat gtgtatgtgt gagaatgatt agttctcata 38280
tgagaaaaaa agaattcatt gctctgtgta ggttgtgaca tttccttcac gattgaaatt 38340
aattaatttt tttttattac ttatttattt ttaaaataga gacaggttct tgctgtgttg 38400
cccaggctgg tctcaaactc ctggcctcaa gcagttctcc tgcctcagcc tcccaaattg 38460
ctgtgactgt aggtgtgagc cactgcactg ggccaaaatt acttaatttt aacaagatga 38520
tgtagagagg agagttcatt gcaacataag cctagaatct ttgtcagaat cttaggaagt 38580
aatgttttca aattctgtgt tttcaccata aaatgtgtct tctctgtgtc catcacatgg 38640
tttttcattg ttttctgctt taccatttta gtaccattgg catttttctt cattgtaaaa 38700
gtagtagaaa tggagtagat tacataagga tgtgatcaga gggaatttat tcattcaggg 38760
taagggagtt agatcctctt ttaagattct atcacattct aagggtttat gattctaaac 38820
tgtcaagtaa attgtcaagt gctggcaagc tacagaataa tttttattgt atcattggaa 38880
attttcccct ctatatgtgt taaagagttt agcctgaagg gatacataca catacatata 38940
tgtaatcaaa ccttgatggt attgtattgc tgataaatta tttcttacca cttttccttt 39000
ctcctgtggg agaaacaaaa gcatatgttt gtgtagtatc agtaatgata ttagagagtg 39060
ggaaacatca gtgagtgcag tttggggact ttattggaga ctttcactag tgctcaaata 39120
aataatgctg gtttttatcc tactgtttgc ttaatgtgga ctagcctctt attcccattc 39180
tatgtttacc tctcttaaaa tattggtcac gctttcttga attatagatc tattaggaaa 39240
attcatgaac tgtagctaat tttcattgtt catgctccag atttattttg aaatatcgtt 39300
aatcttagta gtacagtaaa ggagaaatac cacttaacat tttttgtttt tttttctttg 39360
agacagagtc atgctctgtc acccagtctg gagtgcagtg gtgctatctc ggctcactgc 39420
aatgcacttc gcctctccgg gttcagcaat tctcctgcct cagcctcctg agtagctggg 39480
attacaggca cctgctacca cacccagcta atttttgtat ttttagtaga gacagggttt 39540
caccatgttg gccaggctgg tctgaaactc ctcacctcaa gtgatccacc cgtcttggcc 39600
tcccaaagtg ctgggattac aggcttgagc caccgcaccc cgcccactta acattttaaa 39660
ttaatttcaa gataatatca cttgaatatt tttacacata taattttttt aatacattta 39720
tttacacagt ttataatatc ctacaaagtg attacaatga gtaaaaaccc agttttcatt 39780
gttcctaaag tggcttgatt tatacaactt aatgtgttgg gtatttgttt ctaagactcc 39840
ctctgctgtc taggtttgga agtattgtga ggttaacaga ttttcttttt atagttacta 39900
ctcagttgaa caggctttaa aatacagaga gaatcatatt ttttcttcat tttttgcttt 39960
tatttatatt tttcttttaa ttggagacat gacaagaatt gacttgtgta tggatcttgc 40020
ataatttaag tactgcaggt ttaaaatcta ctaccagttt gagagtgcca tttttcacac 40080
tgtagattat taggttgaaa agtattatgg cttaaaatcg cttttagcca ttaaatttaa 40140
ataaccttgc tttaatcata aatagatggt ggtcacaatg actaactgtt aaactctttg 40200
aagacaggat atttggcttt atatggcaag cttttgaata caacagaaat taaaacttta 40260
tgggatagaa agaatctcct ccaaattggt aaactataag acctttcaaa tgatttagct 40320
aatttctcca caaatctgag gtattagtgt tttttttaaa gtggtattct cctgtgttgg 40380
ggtcacttta aacctttttc ttaatgataa atatatgaat tgaaactaat cccttaatat 40440
atatcatttg aaaactgaaa taatatgttt agatactgtt tacttgttga taaattattg 40500
gaataggatg ttcgaatact gtttacttct tggtaaattt ttaaatccaa tggattttac 40560
gtaagtatag aactggagct caaatactgt tactgtgtgt gaagatatat gaacatagtt 40620
tacagttgca tggcttatat ctaaagtcca gaaacataag gacaattaag tgtacacaca 40680
cacacatgca tttggatttt gatgacttag gtttgccaat gtggaaaaaa tagtagcaaa 40740
ttaagttctc ctgtgaaaaa gtcgttacct tatttaaaat tctgtgccat tggttatcct 40800
tgtcttttgt gaaaattagt gttcctgttt ataatattga caaaacacct atgcggatga 40860
catttaagaa ttctaaaagt cctaatatat gtaatatata ttcagttgcc tgaagagaaa 40920
cataaagaat cctttcttaa tattttttcc attaatgaaa tttgttacct gtacacatga 40980
agccatcgta tatattcaca ttttaatact ttttatgtat ttcagggtgt tgatgatgcc 41040
ttctatacat tagttcgaga aattcgaaaa cataaagaaa agatgagcaa agatggtaaa 41100
aagaagaaaa agaagtcaaa gacaaagtgt gtaattatgt aaatacaatt tgtacttttt 41160
tcttaaggca tactagtaca agtggtaatt tttgtacatt acactaaatt attagcattt 41220
gttttagcat tacctaattt ttttcctgct ccatgcagac tgttagcttt taccttaaat 41280
gcttatttta aaatgacagt ggaagttttt ttttcctcta agtgccagta ttcccagagt 41340
tttggttttt gaactagcaa tgcctgtgaa aaagaaactg aatacctaag atttctgtct 41400
tggggctttt ggtgcatgca gttgattact tcttattttt cttaccaatt gtgaatgttg 41460
gtgtgaaaca aattaatgaa gcttttgaat catccctatt ctgtgtttta tctagtcaca 41520
taaatggatt aattactaat ttcagttgag accttctaat tggtttttac tgaaacattg 41580
agggaacaca aatttatggg cttcctgatg atgattcttc taggcatcat gtcctatagt 41640
ttgtcatccc tgatgaatgt aaagttacac tgttcacaaa ggttttgtct cctttccact 41700
gctattagtc atggtcactc tccccaaaat attatatttt ttctataaaa agaaaaaaat 41760
ggaaaaaaat tacaaggcaa tggaaactat tataaggcca tttccttttc acattagata 41820
aattactata aagactccta atagcttttc ctgttaaggc agacccagta tgaaatgggg 41880
attattatag caaccatttt ggggctatat ttacatgcta ctaaattttt ataataattg 41940
aaaagatttt aacaagtata aaaaattctc ataggaatta aatgtagtct ccctgtgtca 42000
gactgctctt tcatagtata actttaaatc ttttcttcaa cttgagtctt tgaagatagt 42060
tttaattctg cttgtgacat taaaagatta tttgggccag ttatagctta ttaggtgttg 42120
aagagaccaa ggttgcaagg ccaggccctg tgtgaacctt tgagctttca tagagagttt 42180
cacagcatgg actgtgtccc cacggtcatc cagtgttgtc atgcattggt tagtcaaaat 42240
ggggagggac tagggcagtt tggatagctc aacaagatac aatctcactc tgtggtggtc 42300
ctgctgacaa atcaagagca ttgcttttgt ttcttaagaa aacaaactct tttttaaaaa 42360
ttacttttaa atattaactc aaaagttgag attttggggt ggtggtgtgc caagacatta 42420
attttttttt taaacaatga agtgaaaaag ttttacaatc tctaggtttg gctagttctc 42480
ttaacactgg ttaaattaac attgcataaa cacttttcaa gtctgatcca tatttaataa 42540
tgctttaaaa taaaaataaa aacaatcctt ttgataaatt taaaatgtta cttattttaa 42600
aataaatgaa gtgagatggc atggtgaggt gaaagtatca ctggactagg aagaaggtga 42660
cttaggttct agataggtgt cttttaggac tctgattttg aggacatcac ttactatcca 42720
tttcttcatg ttaaaagaag tcatctcaaa ctcttagttt ttttttttta caactatgta 42780
atttatattc catttacata aggatacact tatttgtcaa gctcagcaca atctgtaaat 42840
ttttaaccta tgttacacca tcttcagtgc cagtcttggg caaaattgtg caagaggtga 42900
agtttatatt tgaatatcca ttctcgtttt aggactcttc ttccatatta gtgtcatctt 42960
gcctccctac cttccacatg ccccatgact tgatgcagtt ttaatacttg taattcccct 43020
aaccataaga tttactgctg ctgtggatat ctccatgaag ttttcccact gagtcacatc 43080
agaaatgccc tacatcttat ttcctcaggg ctcaagagaa tctgacagat accataaagg 43140
gatttgacct aatcactaat tttcaggtgg tggctgatgc tttgaacatc tctttgctgc 43200
ccaatccatt agcgacagta ggatttttca aacctggtat gaatagacag aaccctatcc 43260
agtggaagga gaatttaata aagatagtgc tgaaagaatt ccttaggtaa tctataacta 43320
ggactactcc tggtaacagt aatacattcc attgttttag taaccagaaa tcttcatgca 43380
atgaaaaata ctttaattca tgaagcttac tttttttttt tggtgtcaga gtctcgctct 43440
tgtcacccag gctggaatgc agtggcgcca tctcagctca ctgcaacctc catctcccag 43500
gttcaagcga ttctcgtgcc tcggcctcct gagtagctgg gattacaggc gtgtgccact 43560
acactcaact aatttttgta tttttaggag agacggggtt tcaccctgtt ggccaggctg 43620
gtctcgaact cctgacctca agtgattcac ccaccttggc ctcataaacc tgttttgcag 43680
aactcattta ttcagcaaat atttattgag tgcctaccag atgccagtca ccacacaagg 43740
cactgggtat atggtatccc caaacaagag acataatccc ggtccttagg tagtgctagt 43800
gtggtctgta atatcttact aaggcctttg gtatacgacc cagagataac acgatgcgta 43860
ttttagtttt gcaaagaagg ggtttggtct ctgtgccagc tctataattg ttttgctacg 43920
attccactga aactcttcga tcaagctact ttatgtaaat cacttcattg ttttaaagga 43980
ataaacttga ttatattgtt tttttatttg gcataactgt gattctttta ggacaattac 44040
tgtacacatt aaggtgtatg tcagatattc atattgaccc aaatgtgtaa tattccagtt 44100
ttctctgcat aagtaattaa aatatactta aaaattaata gttttatctg ggtacaaata 44160
aacaggtgcc tgaactagtt cacagacaag gaaacttcta tgtaaaaatc actatgattt 44220
ctgaattgct atgtgaaact acagatcttt ggaacactgt ttaggtaggg tgttaagact 44280
tacacagtac ctcgtttcta cacagagaaa gaaatggcca tacttcagga actgcagtgc 44340
ttatgagggg atatttaggc ctcttgaatt tttgatgtag atgggcattt ttttaaggta 44400
gtggttaatt acctttatgt gaactttgaa tggtttaaca aaagatttgt ttttgtagag 44460
attttaaagg gggagaattc tagaaataaa tgttacctaa ttattacagc cttaaagaca 44520
aaaatccttg ttgaagtttt tttaaaaaaa gctaaattac atagacttag gcattaacat 44580
gtttgtggaa gaatatagca gacgtatatt gtatcatttg agtgaatgtt cccaagtagg 44640
cattctaggc tctatttaac tgagtcacac tgcataggaa tttagaacct aacttttata 44700
ggttatcaaa actgttgtca ccattgcaca attttgtcct aatatataca tagaaacttt 44760
gtggggcatg ttaagttaca gtttgcacaa gttcatctca tttgtattcc attgattttt 44820
tttttcttct aaacattttt tcttcaaaca gtatataact ttttttaggg gatttttttt 44880
tagacagcaa aaactatctg aagatttcca tttgtcaaaa agtaatgatt tcttgataat 44940
tgtgtagtaa tgttttttag aacccagcag ttaccttaaa gctgaattta tatttagtaa 45000
cttctgtgtt aatactggat agcatgaatt ctgcattgag aaactgaata gctgtcataa 45060
aatgaaactt tctttctaaa gaaagatact cacatgagtt cttgaagaat agtcataact 45120
agattaagat ctgtgtttta gtttaatagt ttgaagtgcc tgtttgggat aatgataggt 45180
aatttagatg aatttagggg aaaaaaaagt tatctgcaga tatgttgagg gcccatctct 45240
ccccccacac ccccacagag ctaactgggt tacagtgttt tatccgaaag tttccaattc 45300
cactgtcttg tgttttcatg ttgaaaatac ttttgcattt ttcctttgag tgccaatttc 45360
ttactagtac tatttcttaa tgtaacatgt ttacctggaa tgtattttaa ctatttttgt 45420
atagtgtaaa ctgaaacatg cacattttgt acattgtgct ttcttttgtg ggacatatgc 45480
agtgtgatcc agttgttttc catcatttgg ttgcgctgac ctaggaatgt tggtcatatc 45540
aaacattaaa aatgaccact cttttaattg aaattaactt ttaaatgttt ataggagtat 45600
gtgctgtgaa gtgatctaaa atttgtaata tttttgtcat gaactgtact actcctaatt 45660
attgtaatgt aataaaaata gttacagtga ctatgagtgt gtatttattc atgaaatttg 45720
aactgtttgc cccgaaatgg atatggaata ctttataagc catagacact atagtatacc 45780
agtgaatctt ttatgcagct tgttagaagt atcctttatt tctaaaaggt gctgtggata 45840
ttatgtaaag gcgtgtttgc ttaaacttaa aaccatattt agaagtagat gcaaaacaaa 45900
tctgccttta tgacaaaaaa ataggataac attatttatt tatttccttt tatcaaagaa 45960
ggtaattgat acacaacagg tgacttggtt ttaggcccaa aggtagcagc agcaacatta 46020
ataatggaaa taattgaata gttagttatg tatgttaatg ccagtcacca gcaggctatt 46080
tcaaggtcag aagtaatgac tccatacata ttatttattt ctataactac atttaaatca 46140
ttaccagg 46148
<210> 88
<211> 188
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> KRAS (WT)蛋白同种型2B
<400> 88
Met Thr Glu Tyr Lys Leu Val Val Val Gly Ala Gly Gly Val Gly Lys
1 5 10 15
Ser Ala Leu Thr Ile Gln Leu Ile Gln Asn His Phe Val Asp Glu Tyr
20 25 30
Asp Pro Thr Ile Glu Asp Ser Tyr Arg Lys Gln Val Val Ile Asp Gly
35 40 45
Glu Thr Cys Leu Leu Asp Ile Leu Asp Thr Ala Gly Gln Glu Glu Tyr
50 55 60
Ser Ala Met Arg Asp Gln Tyr Met Arg Thr Gly Glu Gly Phe Leu Cys
65 70 75 80
Val Phe Ala Ile Asn Asn Thr Lys Ser Phe Glu Asp Ile His His Tyr
85 90 95
Arg Glu Gln Ile Lys Arg Val Lys Asp Ser Glu Asp Val Pro Met Val
100 105 110
Leu Val Gly Asn Lys Cys Asp Leu Pro Ser Arg Thr Val Asp Thr Lys
115 120 125
Gln Ala Gln Asp Leu Ala Arg Ser Tyr Gly Ile Pro Phe Ile Glu Thr
130 135 140
Ser Ala Lys Thr Arg Gln Gly Val Asp Asp Ala Phe Tyr Thr Leu Val
145 150 155 160
Arg Glu Ile Arg Lys His Lys Glu Lys Met Ser Lys Asp Gly Lys Lys
165 170 175
Lys Lys Lys Lys Ser Lys Thr Lys Cys Val Ile Met
180 185
<210> 89
<211> 5306
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> KRAS (WT) mRNA
<400> 89
ctaggcggcg gccgcggcgg cggaggcagc agcggcggcg gcagtggcgg cggcgaaggt 60
ggcggcggct cggccagtac tcccggcccc cgccatttcg gactgggagc gagcgcggcg 120
caggcactga aggcggcggc ggggccagag gctcagcggc tcccaggtgc gggagagagg 180
cctgctgaaa atgactgaat ataaacttgt ggtagttgga gctggtggcg taggcaagag 240
tgccttgacg atacagctaa ttcagaatca ttttgtggac gaatatgatc caacaataga 300
ggattcctac aggaagcaag tagtaattga tggagaaacc tgtctcttgg atattctcga 360
cacagcaggt caagaggagt acagtgcaat gagggaccag tacatgagga ctggggaggg 420
ctttctttgt gtatttgcca taaataatac taaatcattt gaagatattc accattatag 480
agaacaaatt aaaagagtta aggactctga agatgtacct atggtcctag taggaaataa 540
atgtgatttg ccttctagaa cagtagacac aaaacaggct caggacttag caagaagtta 600
tggaattcct tttattgaaa catcagcaaa gacaagacag ggtgttgatg atgccttcta 660
tacattagtt cgagaaattc gaaaacataa agaaaagatg agcaaagatg gtaaaaagaa 720
gaaaaagaag tcaaagacaa agtgtgtaat tatgtaaata caatttgtac ttttttctta 780
aggcatacta gtacaagtgg taatttttgt acattacact aaattattag catttgtttt 840
agcattacct aatttttttc ctgctccatg cagactgtta gcttttacct taaatgctta 900
ttttaaaatg acagtggaag tttttttttc ctctaagtgc cagtattccc agagttttgg 960
tttttgaact agcaatgcct gtgaaaaaga aactgaatac ctaagatttc tgtcttgggg 1020
cttttggtgc atgcagttga ttacttctta tttttcttac caattgtgaa tgttggtgtg 1080
aaacaaatta atgaagcttt tgaatcatcc ctattctgtg ttttatctag tcacataaat 1140
ggattaatta ctaatttcag ttgagacctt ctaattggtt tttactgaaa cattgaggga 1200
acacaaattt atgggcttcc tgatgatgat tcttctaggc atcatgtcct atagtttgtc 1260
atccctgatg aatgtaaagt tacactgttc acaaaggttt tgtctccttt ccactgctat 1320
tagtcatggt cactctcccc aaaatattat attttttcta taaaaagaaa aaaatggaaa 1380
aaaattacaa ggcaatggaa actattataa ggccatttcc ttttcacatt agataaatta 1440
ctataaagac tcctaatagc ttttcctgtt aaggcagacc cagtatgaaa tggggattat 1500
tatagcaacc attttggggc tatatttaca tgctactaaa tttttataat aattgaaaag 1560
attttaacaa gtataaaaaa ttctcatagg aattaaatgt agtctccctg tgtcagactg 1620
ctctttcata gtataacttt aaatcttttc ttcaacttga gtctttgaag atagttttaa 1680
ttctgcttgt gacattaaaa gattatttgg gccagttata gcttattagg tgttgaagag 1740
accaaggttg caaggccagg ccctgtgtga acctttgagc tttcatagag agtttcacag 1800
catggactgt gtccccacgg tcatccagtg ttgtcatgca ttggttagtc aaaatgggga 1860
gggactaggg cagtttggat agctcaacaa gatacaatct cactctgtgg tggtcctgct 1920
gacaaatcaa gagcattgct tttgtttctt aagaaaacaa actctttttt aaaaattact 1980
tttaaatatt aactcaaaag ttgagatttt ggggtggtgg tgtgccaaga cattaatttt 2040
ttttttaaac aatgaagtga aaaagtttta caatctctag gtttggctag ttctcttaac 2100
actggttaaa ttaacattgc ataaacactt ttcaagtctg atccatattt aataatgctt 2160
taaaataaaa ataaaaacaa tccttttgat aaatttaaaa tgttacttat tttaaaataa 2220
atgaagtgag atggcatggt gaggtgaaag tatcactgga ctaggaagaa ggtgacttag 2280
gttctagata ggtgtctttt aggactctga ttttgaggac atcacttact atccatttct 2340
tcatgttaaa agaagtcatc tcaaactctt agtttttttt ttttacaact atgtaattta 2400
tattccattt acataaggat acacttattt gtcaagctca gcacaatctg taaattttta 2460
acctatgtta caccatcttc agtgccagtc ttgggcaaaa ttgtgcaaga ggtgaagttt 2520
atatttgaat atccattctc gttttaggac tcttcttcca tattagtgtc atcttgcctc 2580
cctaccttcc acatgcccca tgacttgatg cagttttaat acttgtaatt cccctaacca 2640
taagatttac tgctgctgtg gatatctcca tgaagttttc ccactgagtc acatcagaaa 2700
tgccctacat cttatttcct cagggctcaa gagaatctga cagataccat aaagggattt 2760
gacctaatca ctaattttca ggtggtggct gatgctttga acatctcttt gctgcccaat 2820
ccattagcga cagtaggatt tttcaaacct ggtatgaata gacagaaccc tatccagtgg 2880
aaggagaatt taataaagat agtgctgaaa gaattcctta ggtaatctat aactaggact 2940
actcctggta acagtaatac attccattgt tttagtaacc agaaatcttc atgcaatgaa 3000
aaatacttta attcatgaag cttacttttt ttttttggtg tcagagtctc gctcttgtca 3060
cccaggctgg aatgcagtgg cgccatctca gctcactgca acctccatct cccaggttca 3120
agcgattctc gtgcctcggc ctcctgagta gctgggatta caggcgtgtg ccactacact 3180
caactaattt ttgtattttt aggagagacg gggtttcacc ctgttggcca ggctggtctc 3240
gaactcctga cctcaagtga ttcacccacc ttggcctcat aaacctgttt tgcagaactc 3300
atttattcag caaatattta ttgagtgcct accagatgcc agtcaccaca caaggcactg 3360
ggtatatggt atccccaaac aagagacata atcccggtcc ttaggtagtg ctagtgtggt 3420
ctgtaatatc ttactaaggc ctttggtata cgacccagag ataacacgat gcgtatttta 3480
gttttgcaaa gaaggggttt ggtctctgtg ccagctctat aattgttttg ctacgattcc 3540
actgaaactc ttcgatcaag ctactttatg taaatcactt cattgtttta aaggaataaa 3600
cttgattata ttgttttttt atttggcata actgtgattc ttttaggaca attactgtac 3660
acattaaggt gtatgtcaga tattcatatt gacccaaatg tgtaatattc cagttttctc 3720
tgcataagta attaaaatat acttaaaaat taatagtttt atctgggtac aaataaacag 3780
gtgcctgaac tagttcacag acaaggaaac ttctatgtaa aaatcactat gatttctgaa 3840
ttgctatgtg aaactacaga tctttggaac actgtttagg tagggtgtta agacttacac 3900
agtacctcgt ttctacacag agaaagaaat ggccatactt caggaactgc agtgcttatg 3960
aggggatatt taggcctctt gaatttttga tgtagatggg cattttttta aggtagtggt 4020
taattacctt tatgtgaact ttgaatggtt taacaaaaga tttgtttttg tagagatttt 4080
aaagggggag aattctagaa ataaatgtta cctaattatt acagccttaa agacaaaaat 4140
ccttgttgaa gtttttttaa aaaaagctaa attacataga cttaggcatt aacatgtttg 4200
tggaagaata tagcagacgt atattgtatc atttgagtga atgttcccaa gtaggcattc 4260
taggctctat ttaactgagt cacactgcat aggaatttag aacctaactt ttataggtta 4320
tcaaaactgt tgtcaccatt gcacaatttt gtcctaatat atacatagaa actttgtggg 4380
gcatgttaag ttacagtttg cacaagttca tctcatttgt attccattga tttttttttt 4440
cttctaaaca ttttttcttc aaacagtata taactttttt taggggattt ttttttagac 4500
agcaaaaact atctgaagat ttccatttgt caaaaagtaa tgatttcttg ataattgtgt 4560
agtaatgttt tttagaaccc agcagttacc ttaaagctga atttatattt agtaacttct 4620
gtgttaatac tggatagcat gaattctgca ttgagaaact gaatagctgt cataaaatga 4680
aactttcttt ctaaagaaag atactcacat gagttcttga agaatagtca taactagatt 4740
aagatctgtg ttttagttta atagtttgaa gtgcctgttt gggataatga taggtaattt 4800
agatgaattt aggggaaaaa aaagttatct gcagatatgt tgagggccca tctctccccc 4860
cacaccccca cagagctaac tgggttacag tgttttatcc gaaagtttcc aattccactg 4920
tcttgtgttt tcatgttgaa aatacttttg catttttcct ttgagtgcca atttcttact 4980
agtactattt cttaatgtaa catgtttacc tggaatgtat tttaactatt tttgtatagt 5040
gtaaactgaa acatgcacat tttgtacatt gtgctttctt ttgtgggaca tatgcagtgt 5100
gatccagttg ttttccatca tttggttgcg ctgacctagg aatgttggtc atatcaaaca 5160
ttaaaaatga ccactctttt aattgaaatt aacttttaaa tgtttatagg agtatgtgct 5220
gtgaagtgat ctaaaatttg taatattttt gtcatgaact gtactactcc taattattgt 5280
aatgtaataa aaatagttac agtgac 5306
<210> 90
<211> 189
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> KRAS (WT)蛋白同种型2A
<400> 90
Met Thr Glu Tyr Lys Leu Val Val Val Gly Ala Gly Gly Val Gly Lys
1 5 10 15
Ser Ala Leu Thr Ile Gln Leu Ile Gln Asn His Phe Val Asp Glu Tyr
20 25 30
Asp Pro Thr Ile Glu Asp Ser Tyr Arg Lys Gln Val Val Ile Asp Gly
35 40 45
Glu Thr Cys Leu Leu Asp Ile Leu Asp Thr Ala Gly Gln Glu Glu Tyr
50 55 60
Ser Ala Met Arg Asp Gln Tyr Met Arg Thr Gly Glu Gly Phe Leu Cys
65 70 75 80
Val Phe Ala Ile Asn Asn Thr Lys Ser Phe Glu Asp Ile His His Tyr
85 90 95
Arg Glu Gln Ile Lys Arg Val Lys Asp Ser Glu Asp Val Pro Met Val
100 105 110
Leu Val Gly Asn Lys Cys Asp Leu Pro Ser Arg Thr Val Asp Thr Lys
115 120 125
Gln Ala Gln Asp Leu Ala Arg Ser Tyr Gly Ile Pro Phe Ile Glu Thr
130 135 140
Ser Ala Lys Thr Arg Gln Arg Val Glu Asp Ala Phe Tyr Thr Leu Val
145 150 155 160
Arg Glu Ile Arg Gln Tyr Arg Leu Lys Lys Ile Ser Lys Glu Glu Lys
165 170 175
Thr Pro Gly Cys Val Lys Ile Lys Lys Cys Ile Ile Met
180 185
<210> 91
<211> 630
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 人间皮素
<400> 91
Met Ala Leu Pro Thr Ala Arg Pro Leu Leu Gly Ser Cys Gly Thr Pro
1 5 10 15
Ala Leu Gly Ser Leu Leu Phe Leu Leu Phe Ser Leu Gly Trp Val Gln
20 25 30
Pro Ser Arg Thr Leu Ala Gly Glu Thr Gly Gln Glu Ala Ala Pro Leu
35 40 45
Asp Gly Val Leu Ala Asn Pro Pro Asn Ile Ser Ser Leu Ser Pro Arg
50 55 60
Gln Leu Leu Gly Phe Pro Cys Ala Glu Val Ser Gly Leu Ser Thr Glu
65 70 75 80
Arg Val Arg Glu Leu Ala Val Ala Leu Ala Gln Lys Asn Val Lys Leu
85 90 95
Ser Thr Glu Gln Leu Arg Cys Leu Ala His Arg Leu Ser Glu Pro Pro
100 105 110
Glu Asp Leu Asp Ala Leu Pro Leu Asp Leu Leu Leu Phe Leu Asn Pro
115 120 125
Asp Ala Phe Ser Gly Pro Gln Ala Cys Thr Arg Phe Phe Ser Arg Ile
130 135 140
Thr Lys Ala Asn Val Asp Leu Leu Pro Arg Gly Ala Pro Glu Arg Gln
145 150 155 160
Arg Leu Leu Pro Ala Ala Leu Ala Cys Trp Gly Val Arg Gly Ser Leu
165 170 175
Leu Ser Glu Ala Asp Val Arg Ala Leu Gly Gly Leu Ala Cys Asp Leu
180 185 190
Pro Gly Arg Phe Val Ala Glu Ser Ala Glu Val Leu Leu Pro Arg Leu
195 200 205
Val Ser Cys Pro Gly Pro Leu Asp Gln Asp Gln Gln Glu Ala Ala Arg
210 215 220
Ala Ala Leu Gln Gly Gly Gly Pro Pro Tyr Gly Pro Pro Ser Thr Trp
225 230 235 240
Ser Val Ser Thr Met Asp Ala Leu Arg Gly Leu Leu Pro Val Leu Gly
245 250 255
Gln Pro Ile Ile Arg Ser Ile Pro Gln Gly Ile Val Ala Ala Trp Arg
260 265 270
Gln Arg Ser Ser Arg Asp Pro Ser Trp Arg Gln Pro Glu Arg Thr Ile
275 280 285
Leu Arg Pro Arg Phe Arg Arg Glu Val Glu Lys Thr Ala Cys Pro Ser
290 295 300
Gly Lys Lys Ala Arg Glu Ile Asp Glu Ser Leu Ile Phe Tyr Lys Lys
305 310 315 320
Trp Glu Leu Glu Ala Cys Val Asp Ala Ala Leu Leu Ala Thr Gln Met
325 330 335
Asp Arg Val Asn Ala Ile Pro Phe Thr Tyr Glu Gln Leu Asp Val Leu
340 345 350
Lys His Lys Leu Asp Glu Leu Tyr Pro Gln Gly Tyr Pro Glu Ser Val
355 360 365
Ile Gln His Leu Gly Tyr Leu Phe Leu Lys Met Ser Pro Glu Asp Ile
370 375 380
Arg Lys Trp Asn Val Thr Ser Leu Glu Thr Leu Lys Ala Leu Leu Glu
385 390 395 400
Val Asn Lys Gly His Glu Met Ser Pro Gln Ala Pro Arg Arg Pro Leu
405 410 415
Pro Gln Val Ala Thr Leu Ile Asp Arg Phe Val Lys Gly Arg Gly Gln
420 425 430
Leu Asp Lys Asp Thr Leu Asp Thr Leu Thr Ala Phe Tyr Pro Gly Tyr
435 440 445
Leu Cys Ser Leu Ser Pro Glu Glu Leu Ser Ser Val Pro Pro Ser Ser
450 455 460
Ile Trp Ala Val Arg Pro Gln Asp Leu Asp Thr Cys Asp Pro Arg Gln
465 470 475 480
Leu Asp Val Leu Tyr Pro Lys Ala Arg Leu Ala Phe Gln Asn Met Asn
485 490 495
Gly Ser Glu Tyr Phe Val Lys Ile Gln Ser Phe Leu Gly Gly Ala Pro
500 505 510
Thr Glu Asp Leu Lys Ala Leu Ser Gln Gln Asn Val Ser Met Asp Leu
515 520 525
Ala Thr Phe Met Lys Leu Arg Thr Asp Ala Val Leu Pro Leu Thr Val
530 535 540
Ala Glu Val Gln Lys Leu Leu Gly Pro His Val Glu Gly Leu Lys Ala
545 550 555 560
Glu Glu Arg His Arg Pro Val Arg Asp Trp Ile Leu Arg Gln Arg Gln
565 570 575
Asp Asp Leu Asp Thr Leu Gly Leu Gly Leu Gln Gly Gly Ile Pro Asn
580 585 590
Gly Tyr Leu Val Leu Asp Leu Ser Met Gln Glu Ala Leu Ser Gly Thr
595 600 605
Pro Cys Leu Leu Gly Pro Gly Pro Val Leu Thr Val Leu Ala Leu Leu
610 615 620
Leu Ala Ser Thr Leu Ala
625 630
<210> 92
<211> 622
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 人间皮素同种型2
<400> 92
Met Ala Leu Pro Thr Ala Arg Pro Leu Leu Gly Ser Cys Gly Thr Pro
1 5 10 15
Ala Leu Gly Ser Leu Leu Phe Leu Leu Phe Ser Leu Gly Trp Val Gln
20 25 30
Pro Ser Arg Thr Leu Ala Gly Glu Thr Gly Gln Glu Ala Ala Pro Leu
35 40 45
Asp Gly Val Leu Ala Asn Pro Pro Asn Ile Ser Ser Leu Ser Pro Arg
50 55 60
Gln Leu Leu Gly Phe Pro Cys Ala Glu Val Ser Gly Leu Ser Thr Glu
65 70 75 80
Arg Val Arg Glu Leu Ala Val Ala Leu Ala Gln Lys Asn Val Lys Leu
85 90 95
Ser Thr Glu Gln Leu Arg Cys Leu Ala His Arg Leu Ser Glu Pro Pro
100 105 110
Glu Asp Leu Asp Ala Leu Pro Leu Asp Leu Leu Leu Phe Leu Asn Pro
115 120 125
Asp Ala Phe Ser Gly Pro Gln Ala Cys Thr Arg Phe Phe Ser Arg Ile
130 135 140
Thr Lys Ala Asn Val Asp Leu Leu Pro Arg Gly Ala Pro Glu Arg Gln
145 150 155 160
Arg Leu Leu Pro Ala Ala Leu Ala Cys Trp Gly Val Arg Gly Ser Leu
165 170 175
Leu Ser Glu Ala Asp Val Arg Ala Leu Gly Gly Leu Ala Cys Asp Leu
180 185 190
Pro Gly Arg Phe Val Ala Glu Ser Ala Glu Val Leu Leu Pro Arg Leu
195 200 205
Val Ser Cys Pro Gly Pro Leu Asp Gln Asp Gln Gln Glu Ala Ala Arg
210 215 220
Ala Ala Leu Gln Gly Gly Gly Pro Pro Tyr Gly Pro Pro Ser Thr Trp
225 230 235 240
Ser Val Ser Thr Met Asp Ala Leu Arg Gly Leu Leu Pro Val Leu Gly
245 250 255
Gln Pro Ile Ile Arg Ser Ile Pro Gln Gly Ile Val Ala Ala Trp Arg
260 265 270
Gln Arg Ser Ser Arg Asp Pro Ser Trp Arg Gln Pro Glu Arg Thr Ile
275 280 285
Leu Arg Pro Arg Phe Arg Arg Glu Val Glu Lys Thr Ala Cys Pro Ser
290 295 300
Gly Lys Lys Ala Arg Glu Ile Asp Glu Ser Leu Ile Phe Tyr Lys Lys
305 310 315 320
Trp Glu Leu Glu Ala Cys Val Asp Ala Ala Leu Leu Ala Thr Gln Met
325 330 335
Asp Arg Val Asn Ala Ile Pro Phe Thr Tyr Glu Gln Leu Asp Val Leu
340 345 350
Lys His Lys Leu Asp Glu Leu Tyr Pro Gln Gly Tyr Pro Glu Ser Val
355 360 365
Ile Gln His Leu Gly Tyr Leu Phe Leu Lys Met Ser Pro Glu Asp Ile
370 375 380
Arg Lys Trp Asn Val Thr Ser Leu Glu Thr Leu Lys Ala Leu Leu Glu
385 390 395 400
Val Asn Lys Gly His Glu Met Ser Pro Gln Val Ala Thr Leu Ile Asp
405 410 415
Arg Phe Val Lys Gly Arg Gly Gln Leu Asp Lys Asp Thr Leu Asp Thr
420 425 430
Leu Thr Ala Phe Tyr Pro Gly Tyr Leu Cys Ser Leu Ser Pro Glu Glu
435 440 445
Leu Ser Ser Val Pro Pro Ser Ser Ile Trp Ala Val Arg Pro Gln Asp
450 455 460
Leu Asp Thr Cys Asp Pro Arg Gln Leu Asp Val Leu Tyr Pro Lys Ala
465 470 475 480
Arg Leu Ala Phe Gln Asn Met Asn Gly Ser Glu Tyr Phe Val Lys Ile
485 490 495
Gln Ser Phe Leu Gly Gly Ala Pro Thr Glu Asp Leu Lys Ala Leu Ser
500 505 510
Gln Gln Asn Val Ser Met Asp Leu Ala Thr Phe Met Lys Leu Arg Thr
515 520 525
Asp Ala Val Leu Pro Leu Thr Val Ala Glu Val Gln Lys Leu Leu Gly
530 535 540
Pro His Val Glu Gly Leu Lys Ala Glu Glu Arg His Arg Pro Val Arg
545 550 555 560
Asp Trp Ile Leu Arg Gln Arg Gln Asp Asp Leu Asp Thr Leu Gly Leu
565 570 575
Gly Leu Gln Gly Gly Ile Pro Asn Gly Tyr Leu Val Leu Asp Leu Ser
580 585 590
Met Gln Glu Ala Leu Ser Gly Thr Pro Cys Leu Leu Gly Pro Gly Pro
595 600 605
Val Leu Thr Val Leu Ala Leu Leu Leu Ala Ser Thr Leu Ala
610 615 620
<210> 93
<211> 656
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 人间皮素同种型3
<400> 93
Met Ala Leu Pro Thr Ala Arg Pro Leu Leu Gly Ser Cys Gly Thr Pro
1 5 10 15
Ala Leu Gly Ser Leu Leu Phe Leu Leu Phe Ser Leu Gly Trp Val Gln
20 25 30
Pro Ser Arg Thr Leu Ala Gly Glu Thr Gly Gln Glu Ala Ala Pro Leu
35 40 45
Asp Gly Val Leu Ala Asn Pro Pro Asn Ile Ser Ser Leu Ser Pro Arg
50 55 60
Gln Leu Leu Gly Phe Pro Cys Ala Glu Val Ser Gly Leu Ser Thr Glu
65 70 75 80
Arg Val Arg Glu Leu Ala Val Ala Leu Ala Gln Lys Asn Val Lys Leu
85 90 95
Ser Thr Glu Gln Leu Arg Cys Leu Ala His Arg Leu Ser Glu Pro Pro
100 105 110
Glu Asp Leu Asp Ala Leu Pro Leu Asp Leu Leu Leu Phe Leu Asn Pro
115 120 125
Asp Ala Phe Ser Gly Pro Gln Ala Cys Thr Arg Phe Phe Ser Arg Ile
130 135 140
Thr Lys Ala Asn Val Asp Leu Leu Pro Arg Gly Ala Pro Glu Arg Gln
145 150 155 160
Arg Leu Leu Pro Ala Ala Leu Ala Cys Trp Gly Val Arg Gly Ser Leu
165 170 175
Leu Ser Glu Ala Asp Val Arg Ala Leu Gly Gly Leu Ala Cys Asp Leu
180 185 190
Pro Gly Arg Phe Val Ala Glu Ser Ala Glu Val Leu Leu Pro Arg Leu
195 200 205
Val Ser Cys Pro Gly Pro Leu Asp Gln Asp Gln Gln Glu Ala Ala Arg
210 215 220
Ala Ala Leu Gln Gly Gly Gly Pro Pro Tyr Gly Pro Pro Ser Thr Trp
225 230 235 240
Ser Val Ser Thr Met Asp Ala Leu Arg Gly Leu Leu Pro Val Leu Gly
245 250 255
Gln Pro Ile Ile Arg Ser Ile Pro Gln Gly Ile Val Ala Ala Trp Arg
260 265 270
Gln Arg Ser Ser Arg Asp Pro Ser Trp Arg Gln Pro Glu Arg Thr Ile
275 280 285
Leu Arg Pro Arg Phe Arg Arg Glu Val Glu Lys Thr Ala Cys Pro Ser
290 295 300
Gly Lys Lys Ala Arg Glu Ile Asp Glu Ser Leu Ile Phe Tyr Lys Lys
305 310 315 320
Trp Glu Leu Glu Ala Cys Val Asp Ala Ala Leu Leu Ala Thr Gln Met
325 330 335
Asp Arg Val Asn Ala Ile Pro Phe Thr Tyr Glu Gln Leu Asp Val Leu
340 345 350
Lys His Lys Leu Asp Glu Leu Tyr Pro Gln Gly Tyr Pro Glu Ser Val
355 360 365
Ile Gln His Leu Gly Tyr Leu Phe Leu Lys Met Ser Pro Glu Asp Ile
370 375 380
Arg Lys Trp Asn Val Thr Ser Leu Glu Thr Leu Lys Ala Leu Leu Glu
385 390 395 400
Val Asn Lys Gly His Glu Met Ser Pro Gln Val Ala Thr Leu Ile Asp
405 410 415
Arg Phe Val Lys Gly Arg Gly Gln Leu Asp Lys Asp Thr Leu Asp Thr
420 425 430
Leu Thr Ala Phe Tyr Pro Gly Tyr Leu Cys Ser Leu Ser Pro Glu Glu
435 440 445
Leu Ser Ser Val Pro Pro Ser Ser Ile Trp Ala Val Arg Pro Gln Asp
450 455 460
Leu Asp Thr Cys Asp Pro Arg Gln Leu Asp Val Leu Tyr Pro Lys Ala
465 470 475 480
Arg Leu Ala Phe Gln Asn Met Asn Gly Ser Glu Tyr Phe Val Lys Ile
485 490 495
Gln Ser Phe Leu Gly Gly Ala Pro Thr Glu Asp Leu Lys Ala Leu Ser
500 505 510
Gln Gln Asn Val Ser Met Asp Leu Ala Thr Phe Met Lys Leu Arg Thr
515 520 525
Asp Ala Val Leu Pro Leu Thr Val Ala Glu Val Gln Lys Leu Leu Gly
530 535 540
Pro His Val Glu Gly Leu Lys Ala Glu Glu Arg His Arg Pro Val Arg
545 550 555 560
Asp Trp Ile Leu Arg Gln Arg Gln Asp Asp Leu Asp Thr Leu Gly Leu
565 570 575
Gly Leu Gln Gly Gly Ile Pro Asn Gly Tyr Leu Val Leu Asp Leu Ser
580 585 590
Val Gln Gly Gly Arg Gly Gly Gln Ala Arg Ala Gly Gly Arg Ala Gly
595 600 605
Gly Val Glu Val Gly Ala Leu Ser His Pro Ser Leu Cys Arg Gly Pro
610 615 620
Leu Gly Asp Ala Leu Pro Pro Arg Thr Trp Thr Cys Ser His Arg Pro
625 630 635 640
Gly Thr Ala Pro Ser Leu His Pro Gly Leu Arg Ala Pro Leu Pro Cys
645 650 655
<210> 94
<211> 621
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 人间皮素同种型4
<400> 94
Met Ala Leu Pro Thr Ala Arg Pro Leu Leu Gly Ser Cys Gly Thr Pro
1 5 10 15
Ala Leu Gly Ser Leu Leu Phe Leu Leu Phe Ser Leu Gly Trp Val Gln
20 25 30
Pro Ser Arg Thr Leu Ala Gly Glu Thr Gly Gln Ala Ala Pro Leu Asp
35 40 45
Gly Val Leu Ala Asn Pro Pro Asn Ile Ser Ser Leu Ser Pro Arg Gln
50 55 60
Leu Leu Gly Phe Pro Cys Ala Glu Val Ser Gly Leu Ser Thr Glu Arg
65 70 75 80
Val Arg Glu Leu Ala Val Ala Leu Ala Gln Lys Asn Val Lys Leu Ser
85 90 95
Thr Glu Gln Leu Arg Cys Leu Ala His Arg Leu Ser Glu Pro Pro Glu
100 105 110
Asp Leu Asp Ala Leu Pro Leu Asp Leu Leu Leu Phe Leu Asn Pro Asp
115 120 125
Ala Phe Ser Gly Pro Gln Ala Cys Thr Arg Phe Phe Ser Arg Ile Thr
130 135 140
Lys Ala Asn Val Asp Leu Leu Pro Arg Gly Ala Pro Glu Arg Gln Arg
145 150 155 160
Leu Leu Pro Ala Ala Leu Ala Cys Trp Gly Val Arg Gly Ser Leu Leu
165 170 175
Ser Glu Ala Asp Val Arg Ala Leu Gly Gly Leu Ala Cys Asp Leu Pro
180 185 190
Gly Arg Phe Val Ala Glu Ser Ala Glu Val Leu Leu Pro Arg Leu Val
195 200 205
Ser Cys Pro Gly Pro Leu Asp Gln Asp Gln Gln Glu Ala Ala Arg Ala
210 215 220
Ala Leu Gln Gly Gly Gly Pro Pro Tyr Gly Pro Pro Ser Thr Trp Ser
225 230 235 240
Val Ser Thr Met Asp Ala Leu Arg Gly Leu Leu Pro Val Leu Gly Gln
245 250 255
Pro Ile Ile Arg Ser Ile Pro Gln Gly Ile Val Ala Ala Trp Arg Gln
260 265 270
Arg Ser Ser Arg Asp Pro Ser Trp Arg Gln Pro Glu Arg Thr Ile Leu
275 280 285
Arg Pro Arg Phe Arg Arg Glu Val Glu Lys Thr Ala Cys Pro Ser Gly
290 295 300
Lys Lys Ala Arg Glu Ile Asp Glu Ser Leu Ile Phe Tyr Lys Lys Trp
305 310 315 320
Glu Leu Glu Ala Cys Val Asp Ala Ala Leu Leu Ala Thr Gln Met Asp
325 330 335
Arg Val Asn Ala Ile Pro Phe Thr Tyr Glu Gln Leu Asp Val Leu Lys
340 345 350
His Lys Leu Asp Glu Leu Tyr Pro Gln Gly Tyr Pro Glu Ser Val Ile
355 360 365
Gln His Leu Gly Tyr Leu Phe Leu Lys Met Ser Pro Glu Asp Ile Arg
370 375 380
Lys Trp Asn Val Thr Ser Leu Glu Thr Leu Lys Ala Leu Leu Glu Val
385 390 395 400
Asn Lys Gly His Glu Met Ser Pro Gln Val Ala Thr Leu Ile Asp Arg
405 410 415
Phe Val Lys Gly Arg Gly Gln Leu Asp Lys Asp Thr Leu Asp Thr Leu
420 425 430
Thr Ala Phe Tyr Pro Gly Tyr Leu Cys Ser Leu Ser Pro Glu Glu Leu
435 440 445
Ser Ser Val Pro Pro Ser Ser Ile Trp Ala Val Arg Pro Gln Asp Leu
450 455 460
Asp Thr Cys Asp Pro Arg Gln Leu Asp Val Leu Tyr Pro Lys Ala Arg
465 470 475 480
Leu Ala Phe Gln Asn Met Asn Gly Ser Glu Tyr Phe Val Lys Ile Gln
485 490 495
Ser Phe Leu Gly Gly Ala Pro Thr Glu Asp Leu Lys Ala Leu Ser Gln
500 505 510
Gln Asn Val Ser Met Asp Leu Ala Thr Phe Met Lys Leu Arg Thr Asp
515 520 525
Ala Val Leu Pro Leu Thr Val Ala Glu Val Gln Lys Leu Leu Gly Pro
530 535 540
His Val Glu Gly Leu Lys Ala Glu Glu Arg His Arg Pro Val Arg Asp
545 550 555 560
Trp Ile Leu Arg Gln Arg Gln Asp Asp Leu Asp Thr Leu Gly Leu Gly
565 570 575
Leu Gln Gly Gly Ile Pro Asn Gly Tyr Leu Val Leu Asp Leu Ser Met
580 585 590
Gln Glu Ala Leu Ser Gly Thr Pro Cys Leu Leu Gly Pro Gly Pro Val
595 600 605
Leu Thr Val Leu Ala Leu Leu Leu Ala Ser Thr Leu Ala
610 615 620
<210> 95
<211> 364
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 人CD33
<400> 95
Met Pro Leu Leu Leu Leu Leu Pro Leu Leu Trp Ala Gly Ala Leu Ala
1 5 10 15
Met Asp Pro Asn Phe Trp Leu Gln Val Gln Glu Ser Val Thr Val Gln
20 25 30
Glu Gly Leu Cys Val Leu Val Pro Cys Thr Phe Phe His Pro Ile Pro
35 40 45
Tyr Tyr Asp Lys Asn Ser Pro Val His Gly Tyr Trp Phe Arg Glu Gly
50 55 60
Ala Ile Ile Ser Arg Asp Ser Pro Val Ala Thr Asn Lys Leu Asp Gln
65 70 75 80
Glu Val Gln Glu Glu Thr Gln Gly Arg Phe Arg Leu Leu Gly Asp Pro
85 90 95
Ser Arg Asn Asn Cys Ser Leu Ser Ile Val Asp Ala Arg Arg Arg Asp
100 105 110
Asn Gly Ser Tyr Phe Phe Arg Met Glu Arg Gly Ser Thr Lys Tyr Ser
115 120 125
Tyr Lys Ser Pro Gln Leu Ser Val His Val Thr Asp Leu Thr His Arg
130 135 140
Pro Lys Ile Leu Ile Pro Gly Thr Leu Glu Pro Gly His Ser Lys Asn
145 150 155 160
Leu Thr Cys Ser Val Ser Trp Ala Cys Glu Gln Gly Thr Pro Pro Ile
165 170 175
Phe Ser Trp Leu Ser Ala Ala Pro Thr Ser Leu Gly Pro Arg Thr Thr
180 185 190
His Ser Ser Val Leu Ile Ile Thr Pro Arg Pro Gln Asp His Gly Thr
195 200 205
Asn Leu Thr Cys Gln Val Lys Phe Ala Gly Ala Gly Val Thr Thr Glu
210 215 220
Arg Thr Ile Gln Leu Asn Val Thr Tyr Val Pro Gln Asn Pro Thr Thr
225 230 235 240
Gly Ile Phe Pro Gly Asp Gly Ser Gly Lys Gln Glu Thr Arg Ala Gly
245 250 255
Val Val His Gly Ala Ile Gly Gly Ala Gly Val Thr Ala Leu Leu Ala
260 265 270
Leu Cys Leu Cys Leu Ile Phe Phe Ile Val Lys Thr His Arg Arg Lys
275 280 285
Ala Ala Arg Thr Ala Val Gly Arg Asn Asp Thr His Pro Thr Thr Gly
290 295 300
Ser Ala Ser Pro Lys His Gln Lys Lys Ser Lys Leu His Gly Pro Thr
305 310 315 320
Glu Thr Ser Ser Cys Ser Gly Ala Ala Pro Thr Val Glu Met Asp Glu
325 330 335
Glu Leu His Tyr Ala Ser Leu Asn Phe His Gly Met Asn Pro Ser Lys
340 345 350
Asp Thr Ser Thr Glu Tyr Ser Glu Val Arg Thr Gln
355 360
<210> 96
<211> 237
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 人CD33同种型2
<400> 96
Met Pro Leu Leu Leu Leu Leu Pro Leu Leu Trp Ala Asp Leu Thr His
1 5 10 15
Arg Pro Lys Ile Leu Ile Pro Gly Thr Leu Glu Pro Gly His Ser Lys
20 25 30
Asn Leu Thr Cys Ser Val Ser Trp Ala Cys Glu Gln Gly Thr Pro Pro
35 40 45
Ile Phe Ser Trp Leu Ser Ala Ala Pro Thr Ser Leu Gly Pro Arg Thr
50 55 60
Thr His Ser Ser Val Leu Ile Ile Thr Pro Arg Pro Gln Asp His Gly
65 70 75 80
Thr Asn Leu Thr Cys Gln Val Lys Phe Ala Gly Ala Gly Val Thr Thr
85 90 95
Glu Arg Thr Ile Gln Leu Asn Val Thr Tyr Val Pro Gln Asn Pro Thr
100 105 110
Thr Gly Ile Phe Pro Gly Asp Gly Ser Gly Lys Gln Glu Thr Arg Ala
115 120 125
Gly Val Val His Gly Ala Ile Gly Gly Ala Gly Val Thr Ala Leu Leu
130 135 140
Ala Leu Cys Leu Cys Leu Ile Phe Phe Ile Val Lys Thr His Arg Arg
145 150 155 160
Lys Ala Ala Arg Thr Ala Val Gly Arg Asn Asp Thr His Pro Thr Thr
165 170 175
Gly Ser Ala Ser Pro Lys His Gln Lys Lys Ser Lys Leu His Gly Pro
180 185 190
Thr Glu Thr Ser Ser Cys Ser Gly Ala Ala Pro Thr Val Glu Met Asp
195 200 205
Glu Glu Leu His Tyr Ala Ser Leu Asn Phe His Gly Met Asn Pro Ser
210 215 220
Lys Asp Thr Ser Thr Glu Tyr Ser Glu Val Arg Thr Gln
225 230 235
<210> 97
<211> 310
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 人CD33同种型3
<400> 97
Met Pro Leu Leu Leu Leu Leu Pro Leu Leu Trp Ala Gly Ala Leu Ala
1 5 10 15
Met Asp Pro Asn Phe Trp Leu Gln Val Gln Glu Ser Val Thr Val Gln
20 25 30
Glu Gly Leu Cys Val Leu Val Pro Cys Thr Phe Phe His Pro Ile Pro
35 40 45
Tyr Tyr Asp Lys Asn Ser Pro Val His Gly Tyr Trp Phe Arg Glu Gly
50 55 60
Ala Ile Ile Ser Arg Asp Ser Pro Val Ala Thr Asn Lys Leu Asp Gln
65 70 75 80
Glu Val Gln Glu Glu Thr Gln Gly Arg Phe Arg Leu Leu Gly Asp Pro
85 90 95
Ser Arg Asn Asn Cys Ser Leu Ser Ile Val Asp Ala Arg Arg Arg Asp
100 105 110
Asn Gly Ser Tyr Phe Phe Arg Met Glu Arg Gly Ser Thr Lys Tyr Ser
115 120 125
Tyr Lys Ser Pro Gln Leu Ser Val His Val Thr Asp Leu Thr His Arg
130 135 140
Pro Lys Ile Leu Ile Pro Gly Thr Leu Glu Pro Gly His Ser Lys Asn
145 150 155 160
Leu Thr Cys Ser Val Ser Trp Ala Cys Glu Gln Gly Thr Pro Pro Ile
165 170 175
Phe Ser Trp Leu Ser Ala Ala Pro Thr Ser Leu Gly Pro Arg Thr Thr
180 185 190
His Ser Ser Val Leu Ile Ile Thr Pro Arg Pro Gln Asp His Gly Thr
195 200 205
Asn Leu Thr Cys Gln Val Lys Phe Ala Gly Ala Gly Val Thr Thr Glu
210 215 220
Arg Thr Ile Gln Leu Asn Val Thr Tyr Val Pro Gln Asn Pro Thr Thr
225 230 235 240
Gly Ile Phe Pro Gly Asp Gly Ser Gly Lys Gln Glu Thr Arg Ala Gly
245 250 255
Val Val His Gly Ala Ile Gly Gly Ala Gly Val Thr Ala Leu Leu Ala
260 265 270
Leu Cys Leu Cys Leu Ile Phe Phe Ile Val Lys Thr His Arg Arg Lys
275 280 285
Ala Ala Arg Thr Ala Val Gly Arg Asn Asp Thr His Pro Thr Thr Gly
290 295 300
Ser Ala Ser Pro Val Arg
305 310
<210> 98
<211> 418
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 人CD33同种型X1
<400> 98
Met Asp Leu Gly Glu Ala Ala Thr Arg Ala Arg Pro Ala Val Ile Ser
1 5 10 15
Pro Gly Val Asn Ser Cys Ala Gln Lys Ser Thr Ser Glu Trp Lys Asp
20 25 30
Phe Arg His Gly Val Arg Met Ser Gln Met Ala Leu Lys Glu Ala Leu
35 40 45
Glu Ala Ala Ser Ser Asp Met Pro Leu Leu Leu Leu Leu Pro Leu Leu
50 55 60
Trp Ala Gly Ala Leu Ala Met Asp Pro Asn Phe Trp Leu Gln Val Gln
65 70 75 80
Glu Ser Val Thr Val Gln Glu Gly Leu Cys Val Leu Val Pro Cys Thr
85 90 95
Phe Phe His Pro Ile Pro Tyr Tyr Asp Lys Asn Ser Pro Val His Gly
100 105 110
Tyr Trp Phe Arg Glu Gly Ala Ile Ile Ser Arg Asp Ser Pro Val Ala
115 120 125
Thr Asn Lys Leu Asp Gln Glu Val Gln Glu Glu Thr Gln Gly Arg Phe
130 135 140
Arg Leu Leu Gly Asp Pro Ser Arg Asn Asn Cys Ser Leu Ser Ile Val
145 150 155 160
Asp Ala Arg Arg Arg Asp Asn Gly Ser Tyr Phe Phe Arg Met Glu Arg
165 170 175
Gly Ser Thr Lys Tyr Ser Tyr Lys Ser Pro Gln Leu Ser Val His Val
180 185 190
Thr Asp Leu Thr His Arg Pro Lys Ile Leu Ile Pro Gly Thr Leu Glu
195 200 205
Pro Gly His Ser Lys Asn Leu Thr Cys Ser Val Ser Trp Ala Cys Glu
210 215 220
Gln Gly Thr Pro Pro Ile Phe Ser Trp Leu Ser Ala Ala Pro Thr Ser
225 230 235 240
Leu Gly Pro Arg Thr Thr His Ser Ser Val Leu Ile Ile Thr Pro Arg
245 250 255
Pro Gln Asp His Gly Thr Asn Leu Thr Cys Gln Val Lys Phe Ala Gly
260 265 270
Ala Gly Val Thr Thr Glu Arg Thr Ile Gln Leu Asn Val Thr Tyr Val
275 280 285
Pro Gln Asn Pro Thr Thr Gly Ile Phe Pro Gly Asp Gly Ser Gly Lys
290 295 300
Gln Glu Thr Arg Ala Gly Val Val His Gly Ala Ile Gly Gly Ala Gly
305 310 315 320
Val Thr Ala Leu Leu Ala Leu Cys Leu Cys Leu Ile Phe Phe Ile Val
325 330 335
Lys Thr His Arg Arg Lys Ala Ala Arg Thr Ala Val Gly Arg Asn Asp
340 345 350
Thr His Pro Thr Thr Gly Ser Ala Ser Pro Lys His Gln Lys Lys Ser
355 360 365
Lys Leu His Gly Pro Thr Glu Thr Ser Ser Cys Ser Gly Ala Ala Pro
370 375 380
Thr Val Glu Met Asp Glu Glu Leu His Tyr Ala Ser Leu Asn Phe His
385 390 395 400
Gly Met Asn Pro Ser Lys Asp Thr Ser Thr Glu Tyr Ser Glu Val Arg
405 410 415
Thr Gln
<210> 99
<211> 402
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 人CD33同种型X2
<400> 99
Met Asp Leu Gly Glu Ala Ala Thr Arg Ala Arg Pro Ala Val Ile Ser
1 5 10 15
Pro Gly Val Asn Ser Cys Ala Gln Lys Ser Thr Ser Glu Trp Lys Asp
20 25 30
Phe Arg His Gly Val Arg Met Ser Gln Met Ala Leu Lys Glu Ala Leu
35 40 45
Glu Ala Ala Ser Ser Asp Met Pro Leu Leu Leu Leu Leu Pro Leu Leu
50 55 60
Trp Ala Gly Ala Leu Ala Met Asp Pro Asn Phe Trp Leu Gln Val Gln
65 70 75 80
Glu Ser Val Thr Val Gln Glu Gly Leu Cys Val Leu Val Pro Cys Thr
85 90 95
Phe Phe His Pro Ile Pro Tyr Tyr Asp Lys Asn Ser Pro Val His Gly
100 105 110
Tyr Trp Phe Arg Glu Gly Ala Ile Ile Ser Arg Asp Ser Pro Val Ala
115 120 125
Thr Asn Lys Leu Asp Gln Glu Val Gln Glu Glu Thr Gln Gly Arg Phe
130 135 140
Arg Leu Leu Gly Asp Pro Ser Arg Asn Asn Cys Ser Leu Ser Ile Val
145 150 155 160
Asp Ala Arg Arg Arg Asp Asn Gly Ser Tyr Phe Phe Arg Met Glu Arg
165 170 175
Gly Ser Thr Lys Tyr Ser Tyr Lys Ser Pro Gln Leu Ser Val His Val
180 185 190
Thr Asp Leu Thr His Arg Pro Lys Ile Leu Ile Pro Gly Thr Leu Glu
195 200 205
Pro Gly His Ser Lys Asn Leu Thr Cys Ser Val Ser Trp Ala Cys Glu
210 215 220
Gln Gly Thr Pro Pro Ile Phe Ser Trp Leu Ser Ala Ala Pro Thr Ser
225 230 235 240
Leu Gly Pro Arg Thr Thr His Ser Ser Val Leu Ile Ile Thr Pro Arg
245 250 255
Pro Gln Asp His Gly Thr Asn Leu Thr Cys Gln Val Lys Phe Ala Gly
260 265 270
Ala Gly Val Thr Thr Glu Arg Thr Ile Gln Leu Asn Val Thr Trp Lys
275 280 285
Gln Glu Thr Arg Ala Gly Val Val His Gly Ala Ile Gly Gly Ala Gly
290 295 300
Val Thr Ala Leu Leu Ala Leu Cys Leu Cys Leu Ile Phe Phe Ile Val
305 310 315 320
Lys Thr His Arg Arg Lys Ala Ala Arg Thr Ala Val Gly Arg Asn Asp
325 330 335
Thr His Pro Thr Thr Gly Ser Ala Ser Pro Lys His Gln Lys Lys Ser
340 345 350
Lys Leu His Gly Pro Thr Glu Thr Ser Ser Cys Ser Gly Ala Ala Pro
355 360 365
Thr Val Glu Met Asp Glu Glu Leu His Tyr Ala Ser Leu Asn Phe His
370 375 380
Gly Met Asn Pro Ser Lys Asp Thr Ser Thr Glu Tyr Ser Glu Val Arg
385 390 395 400
Thr Gln
<210> 100
<211> 291
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 人CD33同种型X4
<400> 100
Met Asp Leu Gly Glu Ala Ala Thr Arg Ala Arg Pro Ala Val Ile Ser
1 5 10 15
Pro Gly Val Asn Ser Cys Ala Gln Lys Ser Thr Ser Glu Trp Lys Asp
20 25 30
Phe Arg His Gly Val Arg Met Ser Gln Met Ala Leu Lys Glu Ala Leu
35 40 45
Glu Ala Ala Ser Ser Asp Met Pro Leu Leu Leu Leu Leu Pro Leu Leu
50 55 60
Trp Ala Asp Leu Thr His Arg Pro Lys Ile Leu Ile Pro Gly Thr Leu
65 70 75 80
Glu Pro Gly His Ser Lys Asn Leu Thr Cys Ser Val Ser Trp Ala Cys
85 90 95
Glu Gln Gly Thr Pro Pro Ile Phe Ser Trp Leu Ser Ala Ala Pro Thr
100 105 110
Ser Leu Gly Pro Arg Thr Thr His Ser Ser Val Leu Ile Ile Thr Pro
115 120 125
Arg Pro Gln Asp His Gly Thr Asn Leu Thr Cys Gln Val Lys Phe Ala
130 135 140
Gly Ala Gly Val Thr Thr Glu Arg Thr Ile Gln Leu Asn Val Thr Tyr
145 150 155 160
Val Pro Gln Asn Pro Thr Thr Gly Ile Phe Pro Gly Asp Gly Ser Gly
165 170 175
Lys Gln Glu Thr Arg Ala Gly Val Val His Gly Ala Ile Gly Gly Ala
180 185 190
Gly Val Thr Ala Leu Leu Ala Leu Cys Leu Cys Leu Ile Phe Phe Ile
195 200 205
Val Lys Thr His Arg Arg Lys Ala Ala Arg Thr Ala Val Gly Arg Asn
210 215 220
Asp Thr His Pro Thr Thr Gly Ser Ala Ser Pro Lys His Gln Lys Lys
225 230 235 240
Ser Lys Leu His Gly Pro Thr Glu Thr Ser Ser Cys Ser Gly Ala Ala
245 250 255
Pro Thr Val Glu Met Asp Glu Glu Leu His Tyr Ala Ser Leu Asn Phe
260 265 270
His Gly Met Asn Pro Ser Lys Asp Thr Ser Thr Glu Tyr Ser Glu Val
275 280 285
Arg Thr Gln
290
<210> 101
<400> 101
000
<210> 102
<400> 102
000
<210> 103
<400> 103
000
<210> 104
<400> 104
000
<210> 105
<400> 105
000
<210> 106
<400> 106
000
<210> 107
<400> 107
000
<210> 108
<400> 108
000
<210> 109
<400> 109
000
<210> 110
<400> 110
000
<210> 111
<400> 111
000
<210> 112
<400> 112
000
<210> 113
<400> 113
000
<210> 114
<400> 114
000
<210> 115
<400> 115
000
<210> 116
<400> 116
000
<210> 117
<400> 117
000
<210> 118
<400> 118
000
<210> 119
<400> 119
000
<210> 120
<400> 120
000
<210> 121
<400> 121
000
<210> 122
<400> 122
000
<210> 123
<400> 123
000
<210> 124
<400> 124
000
<210> 125
<400> 125
000
<210> 126
<400> 126
000
<210> 127
<400> 127
000
<210> 128
<400> 128
000
<210> 129
<400> 129
000
<210> 130
<400> 130
000
<210> 131
<400> 131
000
<210> 132
<400> 132
000
<210> 133
<400> 133
000
<210> 134
<400> 134
000
<210> 135
<400> 135
000
<210> 136
<400> 136
000
<210> 137
<400> 137
000
<210> 138
<400> 138
000
<210> 139
<400> 139
000
<210> 140
<400> 140
000
<210> 141
<400> 141
000
<210> 142
<400> 142
000
<210> 143
<400> 143
000
<210> 144
<400> 144
000
<210> 145
<400> 145
000
<210> 146
<400> 146
000
<210> 147
<400> 147
000
<210> 148
<400> 148
000
<210> 149
<400> 149
000
<210> 150
<400> 150
000
<210> 151
<400> 151
000
<210> 152
<400> 152
000
<210> 153
<400> 153
000
<210> 154
<400> 154
000
<210> 155
<400> 155
000
<210> 156
<400> 156
000
<210> 157
<400> 157
000
<210> 158
<400> 158
000
<210> 159
<400> 159
000
<210> 160
<400> 160
000
<210> 161
<400> 161
000
<210> 162
<400> 162
000
<210> 163
<400> 163
000
<210> 164
<400> 164
000
<210> 165
<400> 165
000
<210> 166
<400> 166
000
<210> 167
<400> 167
000
<210> 168
<400> 168
000
<210> 169
<400> 169
000
<210> 170
<400> 170
000
<210> 171
<400> 171
000
<210> 172
<400> 172
000
<210> 173
<400> 173
000
<210> 174
<400> 174
000
<210> 175
<400> 175
000
<210> 176
<400> 176
000
<210> 177
<400> 177
000
<210> 178
<400> 178
000
<210> 179
<400> 179
000
<210> 180
<400> 180
000
<210> 181
<400> 181
000
<210> 182
<400> 182
000
<210> 183
<400> 183
000
<210> 184
<400> 184
000
<210> 185
<400> 185
000
<210> 186
<400> 186
000
<210> 187
<400> 187
000
<210> 188
<400> 188
000
<210> 189
<400> 189
000
<210> 190
<400> 190
000
<210> 191
<400> 191
000
<210> 192
<400> 192
000
<210> 193
<400> 193
000
<210> 194
<400> 194
000
<210> 195
<400> 195
000
<210> 196
<400> 196
000
<210> 197
<400> 197
000
<210> 198
<400> 198
000
<210> 199
<400> 199
000
<210> 200
<400> 200
000
<210> 201
<400> 201
000
<210> 202
<400> 202
000
<210> 203
<400> 203
000
<210> 204
<400> 204
000
<210> 205
<400> 205
000
<210> 206
<400> 206
000
<210> 207
<400> 207
000
<210> 208
<400> 208
000
<210> 209
<400> 209
000
<210> 210
<400> 210
000
<210> 211
<400> 211
000
<210> 212
<400> 212
000
<210> 213
<400> 213
000
<210> 214
<400> 214
000
<210> 215
<400> 215
000
<210> 216
<400> 216
000
<210> 217
<400> 217
000
<210> 218
<400> 218
000
<210> 219
<400> 219
000
<210> 220
<400> 220
000
<210> 221
<400> 221
000
<210> 222
<400> 222
000
<210> 223
<400> 223
000
<210> 224
<400> 224
000
<210> 225
<400> 225
000
<210> 226
<400> 226
000
<210> 227
<400> 227
000
<210> 228
<400> 228
000
<210> 229
<400> 229
000
<210> 230
<400> 230
000
<210> 231
<400> 231
000
<210> 232
<400> 232
000
<210> 233
<400> 233
000
<210> 234
<400> 234
000
<210> 235
<400> 235
000
<210> 236
<400> 236
000
<210> 237
<400> 237
000
<210> 238
<400> 238
000
<210> 239
<400> 239
000
<210> 240
<400> 240
000
<210> 241
<400> 241
000
<210> 242
<400> 242
000
<210> 243
<400> 243
000
<210> 244
<400> 244
000
<210> 245
<400> 245
000
<210> 246
<400> 246
000
<210> 247
<400> 247
000
<210> 248
<400> 248
000
<210> 249
<400> 249
000
<210> 250
<400> 250
000
<210> 251
<400> 251
000
<210> 252
<400> 252
000
<210> 253
<400> 253
000
<210> 254
<400> 254
000
<210> 255
<400> 255
000
<210> 256
<400> 256
000
<210> 257
<400> 257
000
<210> 258
<400> 258
000
<210> 259
<400> 259
000
<210> 260
<400> 260
000
<210> 261
<400> 261
000
<210> 262
<400> 262
000
<210> 263
<400> 263
000
<210> 264
<400> 264
000
<210> 265
<400> 265
000
<210> 266
<400> 266
000
<210> 267
<400> 267
000
<210> 268
<400> 268
000
<210> 269
<400> 269
000
<210> 270
<400> 270
000
<210> 271
<400> 271
000
<210> 272
<400> 272
000
<210> 273
<400> 273
000
<210> 274
<400> 274
000
<210> 275
<400> 275
000
<210> 276
<400> 276
000
<210> 277
<400> 277
000
<210> 278
<400> 278
000
<210> 279
<400> 279
000
<210> 280
<400> 280
000
<210> 281
<400> 281
000
<210> 282
<400> 282
000
<210> 283
<400> 283
000
<210> 284
<400> 284
000
<210> 285
<400> 285
000
<210> 286
<400> 286
000
<210> 287
<400> 287
000
<210> 288
<400> 288
000
<210> 289
<400> 289
000
<210> 290
<400> 290
000
<210> 291
<400> 291
000
<210> 292
<400> 292
000
<210> 293
<400> 293
000
<210> 294
<400> 294
000
<210> 295
<400> 295
000
<210> 296
<400> 296
000
<210> 297
<400> 297
000
<210> 298
<400> 298
000
<210> 299
<400> 299
000
<210> 300
<400> 300
000
<210> 301
<211> 879
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> PrX - PTGFRN (1)
<400> 301
Met Gly Arg Leu Ala Ser Arg Pro Leu Leu Leu Ala Leu Leu Ser Leu
1 5 10 15
Ala Leu Cys Arg Gly Arg Val Val Arg Val Pro Thr Ala Thr Leu Val
20 25 30
Arg Val Val Gly Thr Glu Leu Val Ile Pro Cys Asn Val Ser Asp Tyr
35 40 45
Asp Gly Pro Ser Glu Gln Asn Phe Asp Trp Ser Phe Ser Ser Leu Gly
50 55 60
Ser Ser Phe Val Glu Leu Ala Ser Thr Trp Glu Val Gly Phe Pro Ala
65 70 75 80
Gln Leu Tyr Gln Glu Arg Leu Gln Arg Gly Glu Ile Leu Leu Arg Arg
85 90 95
Thr Ala Asn Asp Ala Val Glu Leu His Ile Lys Asn Val Gln Pro Ser
100 105 110
Asp Gln Gly His Tyr Lys Cys Ser Thr Pro Ser Thr Asp Ala Thr Val
115 120 125
Gln Gly Asn Tyr Glu Asp Thr Val Gln Val Lys Val Leu Ala Asp Ser
130 135 140
Leu His Val Gly Pro Ser Ala Arg Pro Pro Pro Ser Leu Ser Leu Arg
145 150 155 160
Glu Gly Glu Pro Phe Glu Leu Arg Cys Thr Ala Ala Ser Ala Ser Pro
165 170 175
Leu His Thr His Leu Ala Leu Leu Trp Glu Val His Arg Gly Pro Ala
180 185 190
Arg Arg Ser Val Leu Ala Leu Thr His Glu Gly Arg Phe His Pro Gly
195 200 205
Leu Gly Tyr Glu Gln Arg Tyr His Ser Gly Asp Val Arg Leu Asp Thr
210 215 220
Val Gly Ser Asp Ala Tyr Arg Leu Ser Val Ser Arg Ala Leu Ser Ala
225 230 235 240
Asp Gln Gly Ser Tyr Arg Cys Ile Val Ser Glu Trp Ile Ala Glu Gln
245 250 255
Gly Asn Trp Gln Glu Ile Gln Glu Lys Ala Val Glu Val Ala Thr Val
260 265 270
Val Ile Gln Pro Ser Val Leu Arg Ala Ala Val Pro Lys Asn Val Ser
275 280 285
Val Ala Glu Gly Lys Glu Leu Asp Leu Thr Cys Asn Ile Thr Thr Asp
290 295 300
Arg Ala Asp Asp Val Arg Pro Glu Val Thr Trp Ser Phe Ser Arg Met
305 310 315 320
Pro Asp Ser Thr Leu Pro Gly Ser Arg Val Leu Ala Arg Leu Asp Arg
325 330 335
Asp Ser Leu Val His Ser Ser Pro His Val Ala Leu Ser His Val Asp
340 345 350
Ala Arg Ser Tyr His Leu Leu Val Arg Asp Val Ser Lys Glu Asn Ser
355 360 365
Gly Tyr Tyr Tyr Cys His Val Ser Leu Trp Ala Pro Gly His Asn Arg
370 375 380
Ser Trp His Lys Val Ala Glu Ala Val Ser Ser Pro Ala Gly Val Gly
385 390 395 400
Val Thr Trp Leu Glu Pro Asp Tyr Gln Val Tyr Leu Asn Ala Ser Lys
405 410 415
Val Pro Gly Phe Ala Asp Asp Pro Thr Glu Leu Ala Cys Arg Val Val
420 425 430
Asp Thr Lys Ser Gly Glu Ala Asn Val Arg Phe Thr Val Ser Trp Tyr
435 440 445
Tyr Arg Met Asn Arg Arg Ser Asp Asn Val Val Thr Ser Glu Leu Leu
450 455 460
Ala Val Met Asp Gly Asp Trp Thr Leu Lys Tyr Gly Glu Arg Ser Lys
465 470 475 480
Gln Arg Ala Gln Asp Gly Asp Phe Ile Phe Ser Lys Glu His Thr Asp
485 490 495
Thr Phe Asn Phe Arg Ile Gln Arg Thr Thr Glu Glu Asp Arg Gly Asn
500 505 510
Tyr Tyr Cys Val Val Ser Ala Trp Thr Lys Gln Arg Asn Asn Ser Trp
515 520 525
Val Lys Ser Lys Asp Val Phe Ser Lys Pro Val Asn Ile Phe Trp Ala
530 535 540
Leu Glu Asp Ser Val Leu Val Val Lys Ala Arg Gln Pro Lys Pro Phe
545 550 555 560
Phe Ala Ala Gly Asn Thr Phe Glu Met Thr Cys Lys Val Ser Ser Lys
565 570 575
Asn Ile Lys Ser Pro Arg Tyr Ser Val Leu Ile Met Ala Glu Lys Pro
580 585 590
Val Gly Asp Leu Ser Ser Pro Asn Glu Thr Lys Tyr Ile Ile Ser Leu
595 600 605
Asp Gln Asp Ser Val Val Lys Leu Glu Asn Trp Thr Asp Ala Ser Arg
610 615 620
Val Asp Gly Val Val Leu Glu Lys Val Gln Glu Asp Glu Phe Arg Tyr
625 630 635 640
Arg Met Tyr Gln Thr Gln Val Ser Asp Ala Gly Leu Tyr Arg Cys Met
645 650 655
Val Thr Ala Trp Ser Pro Val Arg Gly Ser Leu Trp Arg Glu Ala Ala
660 665 670
Thr Ser Leu Ser Asn Pro Ile Glu Ile Asp Phe Gln Thr Ser Gly Pro
675 680 685
Ile Phe Asn Ala Ser Val His Ser Asp Thr Pro Ser Val Ile Arg Gly
690 695 700
Asp Leu Ile Lys Leu Phe Cys Ile Ile Thr Val Glu Gly Ala Ala Leu
705 710 715 720
Asp Pro Asp Asp Met Ala Phe Asp Val Ser Trp Phe Ala Val His Ser
725 730 735
Phe Gly Leu Asp Lys Ala Pro Val Leu Leu Ser Ser Leu Asp Arg Lys
740 745 750
Gly Ile Val Thr Thr Ser Arg Arg Asp Trp Lys Ser Asp Leu Ser Leu
755 760 765
Glu Arg Val Ser Val Leu Glu Phe Leu Leu Gln Val His Gly Ser Glu
770 775 780
Asp Gln Asp Phe Gly Asn Tyr Tyr Cys Ser Val Thr Pro Trp Val Lys
785 790 795 800
Ser Pro Thr Gly Ser Trp Gln Lys Glu Ala Glu Ile His Ser Lys Pro
805 810 815
Val Phe Ile Thr Val Lys Met Asp Val Leu Asn Ala Phe Lys Tyr Pro
820 825 830
Leu Leu Ile Gly Val Gly Leu Ser Thr Val Ile Gly Leu Leu Ser Cys
835 840 845
Leu Ile Gly Tyr Cys Ser Ser His Trp Cys Cys Lys Lys Glu Val Gln
850 855 860
Glu Thr Arg Arg Glu Arg Arg Arg Leu Met Ser Met Glu Met Asp
865 870 875
<210> 302
<211> 192
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> PrX - PTGFRN片段
<400> 302
Gly Pro Ile Phe Asn Ala Ser Val His Ser Asp Thr Pro Ser Val Ile
1 5 10 15
Arg Gly Asp Leu Ile Lys Leu Phe Cys Ile Ile Thr Val Glu Gly Ala
20 25 30
Ala Leu Asp Pro Asp Asp Met Ala Phe Asp Val Ser Trp Phe Ala Val
35 40 45
His Ser Phe Gly Leu Asp Lys Ala Pro Val Leu Leu Ser Ser Leu Asp
50 55 60
Arg Lys Gly Ile Val Thr Thr Ser Arg Arg Asp Trp Lys Ser Asp Leu
65 70 75 80
Ser Leu Glu Arg Val Ser Val Leu Glu Phe Leu Leu Gln Val His Gly
85 90 95
Ser Glu Asp Gln Asp Phe Gly Asn Tyr Tyr Cys Ser Val Thr Pro Trp
100 105 110
Val Lys Ser Pro Thr Gly Ser Trp Gln Lys Glu Ala Glu Ile His Ser
115 120 125
Lys Pro Val Phe Ile Thr Val Lys Met Asp Val Leu Asn Ala Phe Lys
130 135 140
Tyr Pro Leu Leu Ile Gly Val Gly Leu Ser Thr Val Ile Gly Leu Leu
145 150 155 160
Ser Cys Leu Ile Gly Tyr Cys Ser Ser His Trp Cys Cys Lys Lys Glu
165 170 175
Val Gln Glu Thr Arg Arg Glu Arg Arg Arg Leu Met Ser Met Glu Met
180 185 190
<210> 303
<211> 385
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> BSG蛋白
<400> 303
Met Ala Ala Ala Leu Phe Val Leu Leu Gly Phe Ala Leu Leu Gly Thr
1 5 10 15
His Gly Ala Ser Gly Ala Ala Gly Phe Val Gln Ala Pro Leu Ser Gln
20 25 30
Gln Arg Trp Val Gly Gly Ser Val Glu Leu His Cys Glu Ala Val Gly
35 40 45
Ser Pro Val Pro Glu Ile Gln Trp Trp Phe Glu Gly Gln Gly Pro Asn
50 55 60
Asp Thr Cys Ser Gln Leu Trp Asp Gly Ala Arg Leu Asp Arg Val His
65 70 75 80
Ile His Ala Thr Tyr His Gln His Ala Ala Ser Thr Ile Ser Ile Asp
85 90 95
Thr Leu Val Glu Glu Asp Thr Gly Thr Tyr Glu Cys Arg Ala Ser Asn
100 105 110
Asp Pro Asp Arg Asn His Leu Thr Arg Ala Pro Arg Val Lys Trp Val
115 120 125
Arg Ala Gln Ala Val Val Leu Val Leu Glu Pro Gly Thr Val Phe Thr
130 135 140
Thr Val Glu Asp Leu Gly Ser Lys Ile Leu Leu Thr Cys Ser Leu Asn
145 150 155 160
Asp Ser Ala Thr Glu Val Thr Gly His Arg Trp Leu Lys Gly Gly Val
165 170 175
Val Leu Lys Glu Asp Ala Leu Pro Gly Gln Lys Thr Glu Phe Lys Val
180 185 190
Asp Ser Asp Asp Gln Trp Gly Glu Tyr Ser Cys Val Phe Leu Pro Glu
195 200 205
Pro Met Gly Thr Ala Asn Ile Gln Leu His Gly Pro Pro Arg Val Lys
210 215 220
Ala Val Lys Ser Ser Glu His Ile Asn Glu Gly Glu Thr Ala Met Leu
225 230 235 240
Val Cys Lys Ser Glu Ser Val Pro Pro Val Thr Asp Trp Ala Trp Tyr
245 250 255
Lys Ile Thr Asp Ser Glu Asp Lys Ala Leu Met Asn Gly Ser Glu Ser
260 265 270
Arg Phe Phe Val Ser Ser Ser Gln Gly Arg Ser Glu Leu His Ile Glu
275 280 285
Asn Leu Asn Met Glu Ala Asp Pro Gly Gln Tyr Arg Cys Asn Gly Thr
290 295 300
Ser Ser Lys Gly Ser Asp Gln Ala Ile Ile Thr Leu Arg Val Arg Ser
305 310 315 320
His Leu Ala Ala Leu Trp Pro Phe Leu Gly Ile Val Ala Glu Val Leu
325 330 335
Val Leu Val Thr Ile Ile Phe Ile Tyr Glu Lys Arg Arg Lys Pro Glu
340 345 350
Asp Val Leu Asp Asp Asp Asp Ala Gly Ser Ala Pro Leu Lys Ser Ser
355 360 365
Gly Gln His Gln Asn Asp Lys Gly Lys Asn Val Arg Gln Arg Asn Ser
370 375 380
Ser
385
<210> 304
<211> 613
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> IGSF8蛋白
<400> 304
Met Gly Ala Leu Arg Pro Thr Leu Leu Pro Pro Ser Leu Pro Leu Leu
1 5 10 15
Leu Leu Leu Met Leu Gly Met Gly Cys Trp Ala Arg Glu Val Leu Val
20 25 30
Pro Glu Gly Pro Leu Tyr Arg Val Ala Gly Thr Ala Val Ser Ile Ser
35 40 45
Cys Asn Val Thr Gly Tyr Glu Gly Pro Ala Gln Gln Asn Phe Glu Trp
50 55 60
Phe Leu Tyr Arg Pro Glu Ala Pro Asp Thr Ala Leu Gly Ile Val Ser
65 70 75 80
Thr Lys Asp Thr Gln Phe Ser Tyr Ala Val Phe Lys Ser Arg Val Val
85 90 95
Ala Gly Glu Val Gln Val Gln Arg Leu Gln Gly Asp Ala Val Val Leu
100 105 110
Lys Ile Ala Arg Leu Gln Ala Gln Asp Ala Gly Ile Tyr Glu Cys His
115 120 125
Thr Pro Ser Thr Asp Thr Arg Tyr Leu Gly Ser Tyr Ser Gly Lys Val
130 135 140
Glu Leu Arg Val Leu Pro Asp Val Leu Gln Val Ser Ala Ala Pro Pro
145 150 155 160
Gly Pro Arg Gly Arg Gln Ala Pro Thr Ser Pro Pro Arg Met Thr Val
165 170 175
His Glu Gly Gln Glu Leu Ala Leu Gly Cys Leu Ala Arg Thr Ser Thr
180 185 190
Gln Lys His Thr His Leu Ala Val Ser Phe Gly Arg Ser Val Pro Glu
195 200 205
Ala Pro Val Gly Arg Ser Thr Leu Gln Glu Val Val Gly Ile Arg Ser
210 215 220
Asp Leu Ala Val Glu Ala Gly Ala Pro Tyr Ala Glu Arg Leu Ala Ala
225 230 235 240
Gly Glu Leu Arg Leu Gly Lys Glu Gly Thr Asp Arg Tyr Arg Met Val
245 250 255
Val Gly Gly Ala Gln Ala Gly Asp Ala Gly Thr Tyr His Cys Thr Ala
260 265 270
Ala Glu Trp Ile Gln Asp Pro Asp Gly Ser Trp Ala Gln Ile Ala Glu
275 280 285
Lys Arg Ala Val Leu Ala His Val Asp Val Gln Thr Leu Ser Ser Gln
290 295 300
Leu Ala Val Thr Val Gly Pro Gly Glu Arg Arg Ile Gly Pro Gly Glu
305 310 315 320
Pro Leu Glu Leu Leu Cys Asn Val Ser Gly Ala Leu Pro Pro Ala Gly
325 330 335
Arg His Ala Ala Tyr Ser Val Gly Trp Glu Met Ala Pro Ala Gly Ala
340 345 350
Pro Gly Pro Gly Arg Leu Val Ala Gln Leu Asp Thr Glu Gly Val Gly
355 360 365
Ser Leu Gly Pro Gly Tyr Glu Gly Arg His Ile Ala Met Glu Lys Val
370 375 380
Ala Ser Arg Thr Tyr Arg Leu Arg Leu Glu Ala Ala Arg Pro Gly Asp
385 390 395 400
Ala Gly Thr Tyr Arg Cys Leu Ala Lys Ala Tyr Val Arg Gly Ser Gly
405 410 415
Thr Arg Leu Arg Glu Ala Ala Ser Ala Arg Ser Arg Pro Leu Pro Val
420 425 430
His Val Arg Glu Glu Gly Val Val Leu Glu Ala Val Ala Trp Leu Ala
435 440 445
Gly Gly Thr Val Tyr Arg Gly Glu Thr Ala Ser Leu Leu Cys Asn Ile
450 455 460
Ser Val Arg Gly Gly Pro Pro Gly Leu Arg Leu Ala Ala Ser Trp Trp
465 470 475 480
Val Glu Arg Pro Glu Asp Gly Glu Leu Ser Ser Val Pro Ala Gln Leu
485 490 495
Val Gly Gly Val Gly Gln Asp Gly Val Ala Glu Leu Gly Val Arg Pro
500 505 510
Gly Gly Gly Pro Val Ser Val Glu Leu Val Gly Pro Arg Ser His Arg
515 520 525
Leu Arg Leu His Ser Leu Gly Pro Glu Asp Glu Gly Val Tyr His Cys
530 535 540
Ala Pro Ser Ala Trp Val Gln His Ala Asp Tyr Ser Trp Tyr Gln Ala
545 550 555 560
Gly Ser Ala Arg Ser Gly Pro Val Thr Val Tyr Pro Tyr Met His Ala
565 570 575
Leu Asp Thr Leu Phe Val Pro Leu Leu Val Gly Thr Gly Val Ala Leu
580 585 590
Val Thr Gly Ala Thr Val Leu Gly Thr Ile Thr Cys Cys Phe Met Lys
595 600 605
Arg Leu Arg Lys Arg
610
<210> 305
<211> 748
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> ITGB1蛋白
<400> 305
Met Asn Leu Gln Pro Ile Phe Trp Ile Gly Leu Ile Ser Ser Val Cys
1 5 10 15
Cys Val Phe Ala Gln Thr Asp Glu Asn Arg Cys Leu Lys Ala Asn Ala
20 25 30
Lys Ser Cys Gly Glu Cys Ile Gln Ala Gly Pro Asn Cys Gly Trp Cys
35 40 45
Thr Asn Ser Thr Phe Leu Gln Glu Gly Met Pro Thr Ser Ala Arg Cys
50 55 60
Asp Asp Leu Glu Ala Leu Lys Lys Lys Gly Cys Pro Pro Asp Asp Ile
65 70 75 80
Glu Asn Pro Arg Gly Ser Lys Asp Ile Lys Lys Asn Lys Asn Val Thr
85 90 95
Asn Arg Ser Lys Gly Thr Ala Glu Lys Leu Lys Pro Glu Asp Ile Thr
100 105 110
Gln Ile Gln Pro Gln Gln Leu Val Leu Arg Leu Arg Ser Gly Glu Pro
115 120 125
Gln Thr Phe Thr Leu Lys Phe Lys Arg Ala Glu Asp Tyr Pro Ile Asp
130 135 140
Leu Tyr Tyr Leu Met Asp Leu Ser Tyr Ser Met Lys Asp Asp Leu Glu
145 150 155 160
Asn Val Lys Ser Leu Gly Thr Asp Leu Met Asn Glu Met Arg Arg Ile
165 170 175
Thr Ser Asp Phe Arg Ile Gly Phe Gly Ser Phe Val Glu Lys Thr Val
180 185 190
Met Pro Tyr Ile Ser Thr Thr Pro Ala Lys Leu Arg Asn Pro Cys Thr
195 200 205
Ser Glu Gln Asn Cys Thr Ser Pro Phe Ser Tyr Lys Asn Val Leu Ser
210 215 220
Leu Thr Asn Lys Gly Glu Val Phe Asn Glu Leu Val Gly Lys Gln Arg
225 230 235 240
Ile Ser Gly Asn Leu Asp Ser Pro Glu Gly Gly Phe Asp Ala Ile Met
245 250 255
Gln Val Ala Val Cys Gly Ser Leu Ile Gly Trp Arg Asn Val Thr Arg
260 265 270
Leu Leu Val Phe Ser Thr Asp Ala Gly Phe His Phe Ala Gly Asp Gly
275 280 285
Lys Leu Gly Gly Ile Val Leu Pro Asn Asp Gly Gln Cys His Leu Glu
290 295 300
Asn Asn Met Tyr Thr Met Ser His Tyr Tyr Asp Tyr Pro Ser Ile Ala
305 310 315 320
His Leu Val Gln Lys Leu Ser Glu Asn Asn Ile Gln Thr Ile Phe Ala
325 330 335
Val Thr Glu Glu Phe Gln Pro Val Tyr Lys Glu Leu Lys Asn Leu Ile
340 345 350
Pro Lys Ser Ala Val Gly Thr Leu Ser Ala Asn Ser Ser Asn Val Ile
355 360 365
Gln Leu Ile Ile Asp Ala Tyr Asn Ser Leu Ser Ser Glu Val Ile Leu
370 375 380
Glu Asn Gly Lys Leu Ser Glu Gly Val Thr Ile Ser Tyr Lys Ser Tyr
385 390 395 400
Cys Lys Asn Gly Val Asn Gly Thr Gly Glu Asn Gly Arg Lys Cys Ser
405 410 415
Asn Ile Ser Ile Gly Asp Glu Val Gln Phe Glu Ile Ser Ile Thr Ser
420 425 430
Asn Lys Cys Pro Lys Lys Asp Ser Asp Ser Phe Lys Ile Arg Pro Leu
435 440 445
Gly Phe Thr Glu Glu Val Glu Val Ile Leu Gln Tyr Ile Cys Glu Cys
450 455 460
Glu Cys Gln Ser Glu Gly Ile Pro Glu Ser Pro Lys Cys His Glu Gly
465 470 475 480
Asn Gly Thr Phe Glu Cys Gly Ala Cys Arg Cys Asn Glu Gly Arg Val
485 490 495
Gly Arg His Cys Glu Cys Ser Thr Asp Glu Val Asn Ser Glu Asp Met
500 505 510
Asp Ala Tyr Cys Arg Lys Glu Asn Ser Ser Glu Ile Cys Ser Asn Asn
515 520 525
Gly Glu Cys Val Cys Gly Gln Cys Val Cys Arg Lys Arg Asp Asn Thr
530 535 540
Asn Glu Ile Tyr Ser Gly Ala Ser Asn Gly Gln Ile Cys Asn Gly Arg
545 550 555 560
Gly Ile Cys Glu Cys Gly Val Cys Lys Cys Thr Asp Pro Lys Phe Gln
565 570 575
Gly Gln Thr Cys Glu Met Cys Gln Thr Cys Leu Gly Val Cys Ala Glu
580 585 590
His Lys Glu Cys Val Gln Cys Arg Ala Phe Asn Lys Gly Glu Lys Lys
595 600 605
Asp Thr Cys Thr Gln Glu Cys Ser Tyr Phe Asn Ile Thr Lys Val Glu
610 615 620
Ser Arg Asp Lys Leu Pro Gln Pro Val Gln Pro Asp Pro Val Ser His
625 630 635 640
Cys Lys Glu Lys Asp Val Asp Asp Cys Trp Phe Tyr Phe Thr Tyr Ser
645 650 655
Val Asn Gly Asn Asn Glu Val Met Val His Val Val Glu Asn Pro Glu
660 665 670
Cys Pro Thr Gly Pro Asp Ile Ile Pro Ile Val Ala Gly Val Val Ala
675 680 685
Gly Ile Val Leu Ile Gly Leu Ala Leu Leu Leu Ile Trp Lys Leu Leu
690 695 700
Met Ile Ile His Asp Arg Arg Glu Phe Ala Lys Phe Glu Lys Glu Lys
705 710 715 720
Met Asn Ala Lys Trp Asp Thr Gly Glu Asn Pro Ile Tyr Lys Ser Ala
725 730 735
Val Thr Thr Val Val Asn Pro Lys Tyr Glu Gly Lys
740 745
<210> 306
<211> 1032
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> ITGA4蛋白
<400> 306
Met Ala Trp Glu Ala Arg Arg Glu Pro Gly Pro Arg Arg Ala Ala Val
1 5 10 15
Arg Glu Thr Val Met Leu Leu Leu Cys Leu Gly Val Pro Thr Gly Arg
20 25 30
Pro Tyr Asn Val Asp Thr Glu Ser Ala Leu Leu Tyr Gln Gly Pro His
35 40 45
Asn Thr Leu Phe Gly Tyr Ser Val Val Leu His Ser His Gly Ala Asn
50 55 60
Arg Trp Leu Leu Val Gly Ala Pro Thr Ala Asn Trp Leu Ala Asn Ala
65 70 75 80
Ser Val Ile Asn Pro Gly Ala Ile Tyr Arg Cys Arg Ile Gly Lys Asn
85 90 95
Pro Gly Gln Thr Cys Glu Gln Leu Gln Leu Gly Ser Pro Asn Gly Glu
100 105 110
Pro Cys Gly Lys Thr Cys Leu Glu Glu Arg Asp Asn Gln Trp Leu Gly
115 120 125
Val Thr Leu Ser Arg Gln Pro Gly Glu Asn Gly Ser Ile Val Thr Cys
130 135 140
Gly His Arg Trp Lys Asn Ile Phe Tyr Ile Lys Asn Glu Asn Lys Leu
145 150 155 160
Pro Thr Gly Gly Cys Tyr Gly Val Pro Pro Asp Leu Arg Thr Glu Leu
165 170 175
Ser Lys Arg Ile Ala Pro Cys Tyr Gln Asp Tyr Val Lys Lys Phe Gly
180 185 190
Glu Asn Phe Ala Ser Cys Gln Ala Gly Ile Ser Ser Phe Tyr Thr Lys
195 200 205
Asp Leu Ile Val Met Gly Ala Pro Gly Ser Ser Tyr Trp Thr Gly Ser
210 215 220
Leu Phe Val Tyr Asn Ile Thr Thr Asn Lys Tyr Lys Ala Phe Leu Asp
225 230 235 240
Lys Gln Asn Gln Val Lys Phe Gly Ser Tyr Leu Gly Tyr Ser Val Gly
245 250 255
Ala Gly His Phe Arg Ser Gln His Thr Thr Glu Val Val Gly Gly Ala
260 265 270
Pro Gln His Glu Gln Ile Gly Lys Ala Tyr Ile Phe Ser Ile Asp Glu
275 280 285
Lys Glu Leu Asn Ile Leu His Glu Met Lys Gly Lys Lys Leu Gly Ser
290 295 300
Tyr Phe Gly Ala Ser Val Cys Ala Val Asp Leu Asn Ala Asp Gly Phe
305 310 315 320
Ser Asp Leu Leu Val Gly Ala Pro Met Gln Ser Thr Ile Arg Glu Glu
325 330 335
Gly Arg Val Phe Val Tyr Ile Asn Ser Gly Ser Gly Ala Val Met Asn
340 345 350
Ala Met Glu Thr Asn Leu Val Gly Ser Asp Lys Tyr Ala Ala Arg Phe
355 360 365
Gly Glu Ser Ile Val Asn Leu Gly Asp Ile Asp Asn Asp Gly Phe Glu
370 375 380
Asp Val Ala Ile Gly Ala Pro Gln Glu Asp Asp Leu Gln Gly Ala Ile
385 390 395 400
Tyr Ile Tyr Asn Gly Arg Ala Asp Gly Ile Ser Ser Thr Phe Ser Gln
405 410 415
Arg Ile Glu Gly Leu Gln Ile Ser Lys Ser Leu Ser Met Phe Gly Gln
420 425 430
Ser Ile Ser Gly Gln Ile Asp Ala Asp Asn Asn Gly Tyr Val Asp Val
435 440 445
Ala Val Gly Ala Phe Arg Ser Asp Ser Ala Val Leu Leu Arg Thr Arg
450 455 460
Pro Val Val Ile Val Asp Ala Ser Leu Ser His Pro Glu Ser Val Asn
465 470 475 480
Arg Thr Lys Phe Asp Cys Val Glu Asn Gly Trp Pro Ser Val Cys Ile
485 490 495
Asp Leu Thr Leu Cys Phe Ser Tyr Lys Gly Lys Glu Val Pro Gly Tyr
500 505 510
Ile Val Leu Phe Tyr Asn Met Ser Leu Asp Val Asn Arg Lys Ala Glu
515 520 525
Ser Pro Pro Arg Phe Tyr Phe Ser Ser Asn Gly Thr Ser Asp Val Ile
530 535 540
Thr Gly Ser Ile Gln Val Ser Ser Arg Glu Ala Asn Cys Arg Thr His
545 550 555 560
Gln Ala Phe Met Arg Lys Asp Val Arg Asp Ile Leu Thr Pro Ile Gln
565 570 575
Ile Glu Ala Ala Tyr His Leu Gly Pro His Val Ile Ser Lys Arg Ser
580 585 590
Thr Glu Glu Phe Pro Pro Leu Gln Pro Ile Leu Gln Gln Lys Lys Glu
595 600 605
Lys Asp Ile Met Lys Lys Thr Ile Asn Phe Ala Arg Phe Cys Ala His
610 615 620
Glu Asn Cys Ser Ala Asp Leu Gln Val Ser Ala Lys Ile Gly Phe Leu
625 630 635 640
Lys Pro His Glu Asn Lys Thr Tyr Leu Ala Val Gly Ser Met Lys Thr
645 650 655
Leu Met Leu Asn Val Ser Leu Phe Asn Ala Gly Asp Asp Ala Tyr Glu
660 665 670
Thr Thr Leu His Val Lys Leu Pro Val Gly Leu Tyr Phe Ile Lys Ile
675 680 685
Leu Glu Leu Glu Glu Lys Gln Ile Asn Cys Glu Val Thr Asp Asn Ser
690 695 700
Gly Val Val Gln Leu Asp Cys Ser Ile Gly Tyr Ile Tyr Val Asp His
705 710 715 720
Leu Ser Arg Ile Asp Ile Ser Phe Leu Leu Asp Val Ser Ser Leu Ser
725 730 735
Arg Ala Glu Glu Asp Leu Ser Ile Thr Val His Ala Thr Cys Glu Asn
740 745 750
Glu Glu Glu Met Asp Asn Leu Lys His Ser Arg Val Thr Val Ala Ile
755 760 765
Pro Leu Lys Tyr Glu Val Lys Leu Thr Val His Gly Phe Val Asn Pro
770 775 780
Thr Ser Phe Val Tyr Gly Ser Asn Asp Glu Asn Glu Pro Glu Thr Cys
785 790 795 800
Met Val Glu Lys Met Asn Leu Thr Phe His Val Ile Asn Thr Gly Asn
805 810 815
Ser Met Ala Pro Asn Val Ser Val Glu Ile Met Val Pro Asn Ser Phe
820 825 830
Ser Pro Gln Thr Asp Lys Leu Phe Asn Ile Leu Asp Val Gln Thr Thr
835 840 845
Thr Gly Glu Cys His Phe Glu Asn Tyr Gln Arg Val Cys Ala Leu Glu
850 855 860
Gln Gln Lys Ser Ala Met Gln Thr Leu Lys Gly Ile Val Arg Phe Leu
865 870 875 880
Ser Lys Thr Asp Lys Arg Leu Leu Tyr Cys Ile Lys Ala Asp Pro His
885 890 895
Cys Leu Asn Phe Leu Cys Asn Phe Gly Lys Met Glu Ser Gly Lys Glu
900 905 910
Ala Ser Val His Ile Gln Leu Glu Gly Arg Pro Ser Ile Leu Glu Met
915 920 925
Asp Glu Thr Ser Ala Leu Lys Phe Glu Ile Arg Ala Thr Gly Phe Pro
930 935 940
Glu Pro Asn Pro Arg Val Ile Glu Leu Asn Lys Asp Glu Asn Val Ala
945 950 955 960
His Val Leu Leu Glu Gly Leu His His Gln Arg Pro Lys Arg Tyr Phe
965 970 975
Thr Ile Val Ile Ile Ser Ser Ser Leu Leu Leu Gly Leu Ile Val Leu
980 985 990
Leu Leu Ile Ser Tyr Val Met Trp Lys Ala Gly Phe Phe Lys Arg Gln
995 1000 1005
Tyr Lys Ser Ile Leu Gln Glu Glu Asn Arg Arg Asp Ser Trp Ser
1010 1015 1020
Tyr Ile Asn Ser Lys Ser Asn Asp Asp
1025 1030
<210> 307
<211> 630
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> SLC3A2蛋白
<400> 307
Met Glu Leu Gln Pro Pro Glu Ala Ser Ile Ala Val Val Ser Ile Pro
1 5 10 15
Arg Gln Leu Pro Gly Ser His Ser Glu Ala Gly Val Gln Gly Leu Ser
20 25 30
Ala Gly Asp Asp Ser Glu Leu Gly Ser His Cys Val Ala Gln Thr Gly
35 40 45
Leu Glu Leu Leu Ala Ser Gly Asp Pro Leu Pro Ser Ala Ser Gln Asn
50 55 60
Ala Glu Met Ile Glu Thr Gly Ser Asp Cys Val Thr Gln Ala Gly Leu
65 70 75 80
Gln Leu Leu Ala Ser Ser Asp Pro Pro Ala Leu Ala Ser Lys Asn Ala
85 90 95
Glu Val Thr Gly Thr Met Ser Gln Asp Thr Glu Val Asp Met Lys Glu
100 105 110
Val Glu Leu Asn Glu Leu Glu Pro Glu Lys Gln Pro Met Asn Ala Ala
115 120 125
Ser Gly Ala Ala Met Ser Leu Ala Gly Ala Glu Lys Asn Gly Leu Val
130 135 140
Lys Ile Lys Val Ala Glu Asp Glu Ala Glu Ala Ala Ala Ala Ala Lys
145 150 155 160
Phe Thr Gly Leu Ser Lys Glu Glu Leu Leu Lys Val Ala Gly Ser Pro
165 170 175
Gly Trp Val Arg Thr Arg Trp Ala Leu Leu Leu Leu Phe Trp Leu Gly
180 185 190
Trp Leu Gly Met Leu Ala Gly Ala Val Val Ile Ile Val Arg Ala Pro
195 200 205
Arg Cys Arg Glu Leu Pro Ala Gln Lys Trp Trp His Thr Gly Ala Leu
210 215 220
Tyr Arg Ile Gly Asp Leu Gln Ala Phe Gln Gly His Gly Ala Gly Asn
225 230 235 240
Leu Ala Gly Leu Lys Gly Arg Leu Asp Tyr Leu Ser Ser Leu Lys Val
245 250 255
Lys Gly Leu Val Leu Gly Pro Ile His Lys Asn Gln Lys Asp Asp Val
260 265 270
Ala Gln Thr Asp Leu Leu Gln Ile Asp Pro Asn Phe Gly Ser Lys Glu
275 280 285
Asp Phe Asp Ser Leu Leu Gln Ser Ala Lys Lys Lys Ser Ile Arg Val
290 295 300
Ile Leu Asp Leu Thr Pro Asn Tyr Arg Gly Glu Asn Ser Trp Phe Ser
305 310 315 320
Thr Gln Val Asp Thr Val Ala Thr Lys Val Lys Asp Ala Leu Glu Phe
325 330 335
Trp Leu Gln Ala Gly Val Asp Gly Phe Gln Val Arg Asp Ile Glu Asn
340 345 350
Leu Lys Asp Ala Ser Ser Phe Leu Ala Glu Trp Gln Asn Ile Thr Lys
355 360 365
Gly Phe Ser Glu Asp Arg Leu Leu Ile Ala Gly Thr Asn Ser Ser Asp
370 375 380
Leu Gln Gln Ile Leu Ser Leu Leu Glu Ser Asn Lys Asp Leu Leu Leu
385 390 395 400
Thr Ser Ser Tyr Leu Ser Asp Ser Gly Ser Thr Gly Glu His Thr Lys
405 410 415
Ser Leu Val Thr Gln Tyr Leu Asn Ala Thr Gly Asn Arg Trp Cys Ser
420 425 430
Trp Ser Leu Ser Gln Ala Arg Leu Leu Thr Ser Phe Leu Pro Ala Gln
435 440 445
Leu Leu Arg Leu Tyr Gln Leu Met Leu Phe Thr Leu Pro Gly Thr Pro
450 455 460
Val Phe Ser Tyr Gly Asp Glu Ile Gly Leu Asp Ala Ala Ala Leu Pro
465 470 475 480
Gly Gln Pro Met Glu Ala Pro Val Met Leu Trp Asp Glu Ser Ser Phe
485 490 495
Pro Asp Ile Pro Gly Ala Val Ser Ala Asn Met Thr Val Lys Gly Gln
500 505 510
Ser Glu Asp Pro Gly Ser Leu Leu Ser Leu Phe Arg Arg Leu Ser Asp
515 520 525
Gln Arg Ser Lys Glu Arg Ser Leu Leu His Gly Asp Phe His Ala Phe
530 535 540
Ser Ala Gly Pro Gly Leu Phe Ser Tyr Ile Arg His Trp Asp Gln Asn
545 550 555 560
Glu Arg Phe Leu Val Val Leu Asn Phe Gly Asp Val Gly Leu Ser Ala
565 570 575
Gly Leu Gln Ala Ser Asp Leu Pro Ala Ser Ala Ser Leu Pro Ala Lys
580 585 590
Ala Asp Leu Leu Leu Ser Thr Gln Pro Gly Arg Glu Glu Gly Ser Pro
595 600 605
Leu Glu Leu Glu Arg Leu Lys Leu Glu Pro His Glu Gly Leu Leu Leu
610 615 620
Arg Phe Pro Tyr Ala Ala
625 630
<210> 308
<211> 1021
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> IGSF2
<400> 308
Met Ala Gly Ile Ser Tyr Val Ala Ser Phe Phe Leu Leu Leu Thr Lys
1 5 10 15
Leu Ser Ile Gly Gln Arg Glu Val Thr Val Gln Lys Gly Pro Leu Phe
20 25 30
Arg Ala Glu Gly Tyr Pro Val Ser Ile Gly Cys Asn Val Thr Gly His
35 40 45
Gln Gly Pro Ser Glu Gln His Phe Gln Trp Ser Val Tyr Leu Pro Thr
50 55 60
Asn Pro Thr Gln Glu Val Gln Ile Ile Ser Thr Lys Asp Ala Ala Phe
65 70 75 80
Ser Tyr Ala Val Tyr Thr Gln Arg Val Arg Ser Gly Asp Val Tyr Val
85 90 95
Glu Arg Val Gln Gly Asn Ser Val Leu Leu His Ile Ser Lys Leu Gln
100 105 110
Met Lys Asp Ala Gly Glu Tyr Glu Cys His Thr Pro Asn Thr Asp Glu
115 120 125
Lys Tyr Tyr Gly Ser Tyr Ser Ala Lys Thr Asn Leu Ile Val Ile Pro
130 135 140
Asp Thr Leu Ser Ala Thr Met Ser Ser Gln Thr Leu Gly Lys Glu Glu
145 150 155 160
Gly Glu Pro Leu Ala Leu Thr Cys Glu Ala Ser Lys Ala Thr Ala Gln
165 170 175
His Thr His Leu Ser Val Thr Trp Tyr Leu Thr Gln Asp Gly Gly Gly
180 185 190
Ser Gln Ala Thr Glu Ile Ile Ser Leu Ser Lys Asp Phe Ile Leu Val
195 200 205
Pro Gly Pro Leu Tyr Thr Glu Arg Phe Ala Ala Ser Asp Val Gln Leu
210 215 220
Asn Lys Leu Gly Pro Thr Thr Phe Arg Leu Ser Ile Glu Arg Leu Gln
225 230 235 240
Ser Ser Asp Gln Gly Gln Leu Phe Cys Glu Ala Thr Glu Trp Ile Gln
245 250 255
Asp Pro Asp Glu Thr Trp Met Phe Ile Thr Lys Lys Gln Thr Asp Gln
260 265 270
Thr Thr Leu Arg Ile Gln Pro Ala Val Lys Asp Phe Gln Val Asn Ile
275 280 285
Thr Ala Asp Ser Leu Phe Ala Glu Gly Lys Pro Leu Glu Leu Val Cys
290 295 300
Leu Val Val Ser Ser Gly Arg Asp Pro Gln Leu Gln Gly Ile Trp Phe
305 310 315 320
Phe Asn Gly Thr Glu Ile Ala His Ile Asp Ala Gly Gly Val Leu Gly
325 330 335
Leu Lys Asn Asp Tyr Lys Glu Arg Ala Ser Gln Gly Glu Leu Gln Val
340 345 350
Ser Lys Leu Gly Pro Lys Ala Phe Ser Leu Lys Ile Phe Ser Leu Gly
355 360 365
Pro Glu Asp Glu Gly Ala Tyr Arg Cys Val Val Ala Glu Val Met Lys
370 375 380
Thr Arg Thr Gly Ser Trp Gln Val Leu Gln Arg Lys Gln Ser Pro Asp
385 390 395 400
Ser His Val His Leu Arg Lys Pro Ala Ala Arg Ser Val Val Met Ser
405 410 415
Thr Lys Asn Lys Gln Gln Val Val Trp Glu Gly Glu Thr Leu Ala Phe
420 425 430
Leu Cys Lys Ala Gly Gly Ala Glu Ser Pro Leu Ser Val Ser Trp Trp
435 440 445
His Ile Pro Arg Asp Gln Thr Gln Pro Glu Phe Val Ala Gly Met Gly
450 455 460
Gln Asp Gly Ile Val Gln Leu Gly Ala Ser Tyr Gly Val Pro Ser Tyr
465 470 475 480
His Gly Asn Thr Arg Leu Glu Lys Met Asp Trp Ala Thr Phe Gln Leu
485 490 495
Glu Ile Thr Phe Thr Ala Ile Thr Asp Ser Gly Thr Tyr Glu Cys Arg
500 505 510
Val Ser Glu Lys Ser Arg Asn Gln Ala Arg Asp Leu Ser Trp Thr Gln
515 520 525
Lys Ile Ser Val Thr Val Lys Ser Leu Glu Ser Ser Leu Gln Val Ser
530 535 540
Leu Met Ser Arg Gln Pro Gln Val Met Leu Thr Asn Thr Phe Asp Leu
545 550 555 560
Ser Cys Val Val Arg Ala Gly Tyr Ser Asp Leu Lys Val Pro Leu Thr
565 570 575
Val Thr Trp Gln Phe Gln Pro Ala Ser Ser His Ile Phe His Gln Leu
580 585 590
Ile Arg Ile Thr His Asn Gly Thr Ile Glu Trp Gly Asn Phe Leu Ser
595 600 605
Arg Phe Gln Lys Lys Thr Lys Val Ser Gln Ser Leu Phe Arg Ser Gln
610 615 620
Leu Leu Val His Asp Ala Thr Glu Glu Glu Thr Gly Val Tyr Gln Cys
625 630 635 640
Glu Val Glu Val Tyr Asp Arg Asn Ser Leu Tyr Asn Asn Arg Pro Pro
645 650 655
Arg Ala Ser Ala Ile Ser His Pro Leu Arg Ile Ala Val Thr Leu Pro
660 665 670
Glu Ser Lys Leu Lys Val Asn Ser Arg Ser Gln Val Gln Glu Leu Ser
675 680 685
Ile Asn Ser Asn Thr Asp Ile Glu Cys Ser Ile Leu Ser Arg Ser Asn
690 695 700
Gly Asn Leu Gln Leu Ala Ile Ile Trp Tyr Phe Ser Pro Val Ser Thr
705 710 715 720
Asn Ala Ser Trp Leu Lys Ile Leu Glu Met Asp Gln Thr Asn Val Ile
725 730 735
Lys Thr Gly Asp Glu Phe His Thr Pro Gln Arg Lys Gln Lys Phe His
740 745 750
Thr Glu Lys Val Ser Gln Asp Leu Phe Gln Leu His Ile Leu Asn Val
755 760 765
Glu Asp Ser Asp Arg Gly Lys Tyr His Cys Ala Val Glu Glu Trp Leu
770 775 780
Leu Ser Thr Asn Gly Thr Trp His Lys Leu Gly Glu Lys Lys Ser Gly
785 790 795 800
Leu Thr Glu Leu Lys Leu Lys Pro Thr Gly Ser Lys Val Arg Val Ser
805 810 815
Lys Val Tyr Trp Thr Glu Asn Val Thr Glu His Arg Glu Val Ala Ile
820 825 830
Arg Cys Ser Leu Glu Ser Val Gly Ser Ser Ala Thr Leu Tyr Ser Val
835 840 845
Met Trp Tyr Trp Asn Arg Glu Asn Ser Gly Ser Lys Leu Leu Val His
850 855 860
Leu Gln His Asp Gly Leu Leu Glu Tyr Gly Glu Glu Gly Leu Arg Arg
865 870 875 880
His Leu His Cys Tyr Arg Ser Ser Ser Thr Asp Phe Val Leu Lys Leu
885 890 895
His Gln Val Glu Met Glu Asp Ala Gly Met Tyr Trp Cys Arg Val Ala
900 905 910
Glu Trp Gln Leu His Gly His Pro Ser Lys Trp Ile Asn Gln Ala Ser
915 920 925
Asp Glu Ser Gln Arg Met Val Leu Thr Val Leu Pro Ser Glu Pro Thr
930 935 940
Leu Pro Ser Arg Ile Cys Ser Ser Ala Pro Leu Leu Tyr Phe Leu Phe
945 950 955 960
Ile Cys Pro Phe Val Leu Leu Leu Leu Leu Leu Ile Ser Leu Leu Cys
965 970 975
Leu Tyr Trp Lys Ala Arg Lys Leu Ser Thr Leu Arg Ser Asn Thr Arg
980 985 990
Lys Glu Lys Ala Leu Trp Val Asp Leu Lys Glu Ala Gly Gly Val Thr
995 1000 1005
Thr Asn Arg Arg Glu Asp Glu Glu Glu Asp Glu Gly Asn
1010 1015 1020
<210> 309
<211> 1195
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> IGSF3
<400> 309
Met Lys Cys Phe Phe Pro Val Leu Ser Cys Leu Ala Val Leu Gly Val
1 5 10 15
Val Ser Ala Gln Arg Gln Val Thr Val Gln Glu Gly Pro Leu Tyr Arg
20 25 30
Thr Glu Gly Ser His Ile Thr Ile Trp Cys Asn Val Ser Gly Tyr Gln
35 40 45
Gly Pro Ser Glu Gln Asn Phe Gln Trp Ser Ile Tyr Leu Pro Ser Ser
50 55 60
Pro Glu Arg Glu Val Gln Ile Val Ser Thr Met Asp Ser Ser Phe Pro
65 70 75 80
Tyr Ala Ile Tyr Thr Gln Arg Val Arg Gly Gly Lys Ile Phe Ile Glu
85 90 95
Arg Val Gln Gly Asn Ser Thr Leu Leu His Ile Thr Asp Leu Gln Ala
100 105 110
Arg Asp Ala Gly Glu Tyr Glu Cys His Thr Pro Ser Thr Asp Lys Gln
115 120 125
Tyr Phe Gly Ser Tyr Ser Ala Lys Met Asn Leu Val Val Ile Pro Asp
130 135 140
Ser Leu Gln Thr Thr Ala Met Pro Gln Thr Leu His Arg Val Glu Gln
145 150 155 160
Asp Pro Leu Glu Leu Thr Cys Glu Val Ala Ser Glu Thr Ile Gln His
165 170 175
Ser His Leu Ser Val Ala Trp Leu Arg Gln Lys Val Gly Glu Lys Pro
180 185 190
Val Glu Val Ile Ser Leu Ser Arg Asp Phe Met Leu His Ser Ser Ser
195 200 205
Glu Tyr Ala Gln Arg Gln Ser Leu Gly Glu Val Arg Leu Asp Lys Leu
210 215 220
Gly Arg Thr Thr Phe Arg Leu Thr Ile Phe His Leu Gln Pro Ser Asp
225 230 235 240
Gln Gly Glu Phe Tyr Cys Glu Ala Ala Glu Trp Ile Gln Asp Pro Asp
245 250 255
Gly Ser Trp Tyr Ala Met Thr Arg Lys Arg Ser Glu Gly Ala Val Val
260 265 270
Asn Val Gln Pro Thr Asp Lys Glu Phe Thr Val Arg Leu Glu Thr Glu
275 280 285
Lys Arg Leu His Thr Val Gly Glu Pro Val Glu Phe Arg Cys Ile Leu
290 295 300
Glu Ala Gln Asn Val Pro Asp Arg Tyr Phe Ala Val Ser Trp Ala Phe
305 310 315 320
Asn Ser Ser Leu Ile Ala Thr Met Gly Pro Asn Ala Val Pro Val Leu
325 330 335
Asn Ser Glu Phe Ala His Arg Glu Ala Arg Gly Gln Leu Lys Val Ala
340 345 350
Lys Glu Ser Asp Ser Val Phe Val Leu Lys Ile Tyr His Leu Arg Gln
355 360 365
Glu Asp Ser Gly Lys Tyr Asn Cys Arg Val Thr Glu Arg Glu Lys Thr
370 375 380
Val Thr Gly Glu Phe Ile Asp Lys Glu Ser Lys Arg Pro Lys Asn Ile
385 390 395 400
Pro Ile Ile Val Leu Pro Leu Lys Ser Ser Ile Ser Val Glu Val Ala
405 410 415
Ser Asn Ala Ser Val Ile Leu Glu Gly Glu Asp Leu Arg Phe Ser Cys
420 425 430
Ser Val Arg Thr Ala Gly Arg Pro Gln Gly Arg Phe Ser Val Ile Trp
435 440 445
Gln Leu Val Asp Arg Gln Asn Arg Arg Ser Asn Ile Met Trp Leu Asp
450 455 460
Arg Asp Gly Thr Val Gln Pro Gly Ser Ser Tyr Trp Glu Arg Ser Ser
465 470 475 480
Phe Gly Gly Val Gln Met Glu Gln Val Gln Pro Asn Ser Phe Ser Leu
485 490 495
Gly Ile Phe Asn Ser Arg Lys Glu Asp Glu Gly Gln Tyr Glu Cys His
500 505 510
Val Thr Glu Trp Val Arg Ala Val Asp Gly Glu Trp Gln Ile Val Gly
515 520 525
Glu Arg Arg Ala Ser Thr Pro Ile Ser Ile Thr Ala Leu Glu Met Gly
530 535 540
Phe Ala Val Thr Ala Ile Ser Arg Thr Pro Gly Val Thr Tyr Ser Asp
545 550 555 560
Ser Phe Asp Leu Gln Cys Ile Ile Lys Pro His Tyr Pro Ala Trp Val
565 570 575
Pro Val Ser Val Thr Trp Arg Phe Gln Pro Val Gly Thr Val Glu Phe
580 585 590
His Asp Leu Val Thr Phe Thr Arg Asp Gly Gly Val Gln Trp Gly Asp
595 600 605
Arg Ser Ser Ser Phe Arg Thr Arg Thr Ala Ile Glu Lys Ala Glu Ser
610 615 620
Ser Asn Asn Val Arg Leu Ser Ile Ser Arg Ala Ser Asp Thr Glu Ala
625 630 635 640
Gly Lys Tyr Gln Cys Val Ala Glu Leu Trp Arg Lys Asn Tyr Asn Asn
645 650 655
Thr Trp Thr Arg Leu Ala Glu Arg Thr Ser Asn Leu Leu Glu Ile Arg
660 665 670
Val Leu Gln Pro Val Thr Lys Leu Gln Val Ser Lys Ser Lys Arg Thr
675 680 685
Leu Thr Leu Val Glu Asn Lys Pro Ile Gln Leu Asn Cys Ser Val Lys
690 695 700
Ser Gln Thr Ser Gln Asn Ser His Phe Ala Val Leu Trp Tyr Val His
705 710 715 720
Lys Pro Ser Asp Ala Asp Gly Lys Leu Ile Leu Lys Thr Thr His Asn
725 730 735
Ser Ala Phe Glu Tyr Gly Thr Tyr Ala Glu Glu Glu Gly Leu Arg Ala
740 745 750
Arg Leu Gln Phe Glu Arg His Val Ser Gly Gly Leu Phe Ser Leu Thr
755 760 765
Val Gln Arg Ala Glu Val Ser Asp Ser Gly Ser Tyr Tyr Cys His Val
770 775 780
Glu Glu Trp Leu Leu Ser Pro Asn Tyr Ala Trp Tyr Lys Leu Ala Glu
785 790 795 800
Glu Val Ser Gly Arg Thr Glu Val Thr Val Lys Gln Pro Asp Ser Arg
805 810 815
Leu Arg Leu Ser Gln Ala Gln Gly Asn Leu Ser Val Leu Glu Thr Arg
820 825 830
Gln Val Gln Leu Glu Cys Val Val Leu Asn Arg Thr Ser Ile Thr Ser
835 840 845
Gln Leu Met Val Glu Trp Phe Val Trp Lys Pro Asn His Pro Glu Arg
850 855 860
Glu Thr Val Ala Arg Leu Ser Arg Asp Ala Thr Phe His Tyr Gly Glu
865 870 875 880
Gln Ala Ala Lys Asn Asn Leu Lys Gly Arg Leu His Leu Glu Ser Pro
885 890 895
Ser Pro Gly Val Tyr Arg Leu Phe Ile Gln Asn Val Ala Val Gln Asp
900 905 910
Ser Gly Thr Tyr Ser Cys His Val Glu Glu Trp Leu Pro Ser Pro Ser
915 920 925
Gly Met Trp Tyr Lys Arg Ala Glu Asp Thr Ala Gly Gln Thr Ala Leu
930 935 940
Thr Val Met Arg Pro Asp Ala Ser Leu Gln Val Asp Thr Val Val Pro
945 950 955 960
Asn Ala Thr Val Ser Glu Lys Ala Ala Phe Gln Leu Asp Cys Ser Ile
965 970 975
Val Ser Arg Ser Ser Gln Asp Ser Arg Phe Ala Val Ala Trp Tyr Ser
980 985 990
Leu Arg Thr Lys Ala Gly Gly Lys Arg Ser Ser Pro Gly Leu Glu Glu
995 1000 1005
Gln Glu Glu Glu Arg Glu Glu Glu Glu Glu Glu Glu Glu Asp Asp
1010 1015 1020
Asp Asp Asp Asp Pro Thr Glu Arg Thr Ala Leu Leu Ser Val Gly
1025 1030 1035
Pro Asp Ala Val Phe Gly Pro Glu Gly Ser Pro Trp Glu Gly Arg
1040 1045 1050
Leu Arg Phe Gln Arg Leu Ser Pro Val Leu Tyr Arg Leu Thr Val
1055 1060 1065
Leu Gln Ala Ser Pro Gln Asp Thr Gly Asn Tyr Ser Cys His Val
1070 1075 1080
Glu Glu Trp Leu Pro Ser Pro Gln Lys Glu Trp Tyr Arg Leu Thr
1085 1090 1095
Glu Glu Glu Ser Ala Pro Ile Gly Ile Arg Val Leu Asp Thr Ser
1100 1105 1110
Pro Thr Leu Gln Ser Ile Ile Cys Ser Asn Asp Ala Leu Phe Tyr
1115 1120 1125
Phe Val Phe Phe Tyr Pro Phe Pro Ile Phe Gly Ile Leu Ile Ile
1130 1135 1140
Thr Ile Leu Leu Val Arg Phe Lys Ser Arg Asn Ser Ser Lys Asn
1145 1150 1155
Ser Asp Gly Lys Asn Gly Val Pro Leu Leu Trp Ile Lys Glu Pro
1160 1165 1170
His Leu Asn Tyr Ser Pro Thr Cys Leu Glu Pro Pro Val Leu Ser
1175 1180 1185
Ile His Pro Gly Ala Ile Asp
1190 1195
<210> 310
<211> 1023
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> ATP1A1
<400> 310
Met Gly Lys Gly Val Gly Arg Asp Lys Tyr Glu Pro Ala Ala Val Ser
1 5 10 15
Glu Gln Gly Asp Lys Lys Gly Lys Lys Gly Lys Lys Asp Arg Asp Met
20 25 30
Asp Glu Leu Lys Lys Glu Val Ser Met Asp Asp His Lys Leu Ser Leu
35 40 45
Asp Glu Leu His Arg Lys Tyr Gly Thr Asp Leu Ser Arg Gly Leu Thr
50 55 60
Ser Ala Arg Ala Ala Glu Ile Leu Ala Arg Asp Gly Pro Asn Ala Leu
65 70 75 80
Thr Pro Pro Pro Thr Thr Pro Glu Trp Ile Lys Phe Cys Arg Gln Leu
85 90 95
Phe Gly Gly Phe Ser Met Leu Leu Trp Ile Gly Ala Ile Leu Cys Phe
100 105 110
Leu Ala Tyr Ser Ile Gln Ala Ala Thr Glu Glu Glu Pro Gln Asn Asp
115 120 125
Asn Leu Tyr Leu Gly Val Val Leu Ser Ala Val Val Ile Ile Thr Gly
130 135 140
Cys Phe Ser Tyr Tyr Gln Glu Ala Lys Ser Ser Lys Ile Met Glu Ser
145 150 155 160
Phe Lys Asn Met Val Pro Gln Gln Ala Leu Val Ile Arg Asn Gly Glu
165 170 175
Lys Met Ser Ile Asn Ala Glu Glu Val Val Val Gly Asp Leu Val Glu
180 185 190
Val Lys Gly Gly Asp Arg Ile Pro Ala Asp Leu Arg Ile Ile Ser Ala
195 200 205
Asn Gly Cys Lys Val Asp Asn Ser Ser Leu Thr Gly Glu Ser Glu Pro
210 215 220
Gln Thr Arg Ser Pro Asp Phe Thr Asn Glu Asn Pro Leu Glu Thr Arg
225 230 235 240
Asn Ile Ala Phe Phe Ser Thr Asn Cys Val Glu Gly Thr Ala Arg Gly
245 250 255
Ile Val Val Tyr Thr Gly Asp Arg Thr Val Met Gly Arg Ile Ala Thr
260 265 270
Leu Ala Ser Gly Leu Glu Gly Gly Gln Thr Pro Ile Ala Ala Glu Ile
275 280 285
Glu His Phe Ile His Ile Ile Thr Gly Val Ala Val Phe Leu Gly Val
290 295 300
Ser Phe Phe Ile Leu Ser Leu Ile Leu Glu Tyr Thr Trp Leu Glu Ala
305 310 315 320
Val Ile Phe Leu Ile Gly Ile Ile Val Ala Asn Val Pro Glu Gly Leu
325 330 335
Leu Ala Thr Val Thr Val Cys Leu Thr Leu Thr Ala Lys Arg Met Ala
340 345 350
Arg Lys Asn Cys Leu Val Lys Asn Leu Glu Ala Val Glu Thr Leu Gly
355 360 365
Ser Thr Ser Thr Ile Cys Ser Asp Lys Thr Gly Thr Leu Thr Gln Asn
370 375 380
Arg Met Thr Val Ala His Met Trp Phe Asp Asn Gln Ile His Glu Ala
385 390 395 400
Asp Thr Thr Glu Asn Gln Ser Gly Val Ser Phe Asp Lys Thr Ser Ala
405 410 415
Thr Trp Leu Ala Leu Ser Arg Ile Ala Gly Leu Cys Asn Arg Ala Val
420 425 430
Phe Gln Ala Asn Gln Glu Asn Leu Pro Ile Leu Lys Arg Ala Val Ala
435 440 445
Gly Asp Ala Ser Glu Ser Ala Leu Leu Lys Cys Ile Glu Leu Cys Cys
450 455 460
Gly Ser Val Lys Glu Met Arg Glu Arg Tyr Ala Lys Ile Val Glu Ile
465 470 475 480
Pro Phe Asn Ser Thr Asn Lys Tyr Gln Leu Ser Ile His Lys Asn Pro
485 490 495
Asn Thr Ser Glu Pro Gln His Leu Leu Val Met Lys Gly Ala Pro Glu
500 505 510
Arg Ile Leu Asp Arg Cys Ser Ser Ile Leu Leu His Gly Lys Glu Gln
515 520 525
Pro Leu Asp Glu Glu Leu Lys Asp Ala Phe Gln Asn Ala Tyr Leu Glu
530 535 540
Leu Gly Gly Leu Gly Glu Arg Val Leu Gly Phe Cys His Leu Phe Leu
545 550 555 560
Pro Asp Glu Gln Phe Pro Glu Gly Phe Gln Phe Asp Thr Asp Asp Val
565 570 575
Asn Phe Pro Ile Asp Asn Leu Cys Phe Val Gly Leu Ile Ser Met Ile
580 585 590
Asp Pro Pro Arg Ala Ala Val Pro Asp Ala Val Gly Lys Cys Arg Ser
595 600 605
Ala Gly Ile Lys Val Ile Met Val Thr Gly Asp His Pro Ile Thr Ala
610 615 620
Lys Ala Ile Ala Lys Gly Val Gly Ile Ile Ser Glu Gly Asn Glu Thr
625 630 635 640
Val Glu Asp Ile Ala Ala Arg Leu Asn Ile Pro Val Ser Gln Val Asn
645 650 655
Pro Arg Asp Ala Lys Ala Cys Val Val His Gly Ser Asp Leu Lys Asp
660 665 670
Met Thr Ser Glu Gln Leu Asp Asp Ile Leu Lys Tyr His Thr Glu Ile
675 680 685
Val Phe Ala Arg Thr Ser Pro Gln Gln Lys Leu Ile Ile Val Glu Gly
690 695 700
Cys Gln Arg Gln Gly Ala Ile Val Ala Val Thr Gly Asp Gly Val Asn
705 710 715 720
Asp Ser Pro Ala Leu Lys Lys Ala Asp Ile Gly Val Ala Met Gly Ile
725 730 735
Ala Gly Ser Asp Val Ser Lys Gln Ala Ala Asp Met Ile Leu Leu Asp
740 745 750
Asp Asn Phe Ala Ser Ile Val Thr Gly Val Glu Glu Gly Arg Leu Ile
755 760 765
Phe Asp Asn Leu Lys Lys Ser Ile Ala Tyr Thr Leu Thr Ser Asn Ile
770 775 780
Pro Glu Ile Thr Pro Phe Leu Ile Phe Ile Ile Ala Asn Ile Pro Leu
785 790 795 800
Pro Leu Gly Thr Val Thr Ile Leu Cys Ile Asp Leu Gly Thr Asp Met
805 810 815
Val Pro Ala Ile Ser Leu Ala Tyr Glu Gln Ala Glu Ser Asp Ile Met
820 825 830
Lys Arg Gln Pro Arg Asn Pro Lys Thr Asp Lys Leu Val Asn Glu Arg
835 840 845
Leu Ile Ser Met Ala Tyr Gly Gln Ile Gly Met Ile Gln Ala Leu Gly
850 855 860
Gly Phe Phe Thr Tyr Phe Val Ile Leu Ala Glu Asn Gly Phe Leu Pro
865 870 875 880
Ile His Leu Leu Gly Leu Arg Val Asp Trp Asp Asp Arg Trp Ile Asn
885 890 895
Asp Val Glu Asp Ser Tyr Gly Gln Gln Trp Thr Tyr Glu Gln Arg Lys
900 905 910
Ile Val Glu Phe Thr Cys His Thr Ala Phe Phe Val Ser Ile Val Val
915 920 925
Val Gln Trp Ala Asp Leu Val Ile Cys Lys Thr Arg Arg Asn Ser Val
930 935 940
Phe Gln Gln Gly Met Lys Asn Lys Ile Leu Ile Phe Gly Leu Phe Glu
945 950 955 960
Glu Thr Ala Leu Ala Ala Phe Leu Ser Tyr Cys Pro Gly Met Gly Val
965 970 975
Ala Leu Arg Met Tyr Pro Leu Lys Pro Thr Trp Trp Phe Cys Ala Phe
980 985 990
Pro Tyr Ser Leu Leu Ile Phe Val Tyr Asp Glu Val Arg Lys Leu Ile
995 1000 1005
Ile Arg Arg Arg Pro Gly Gly Trp Val Glu Lys Glu Thr Tyr Tyr
1010 1015 1020
<210> 311
<211> 240
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> ATP1A2
<400> 311
Met Gly Arg Gly Ala Gly Arg Glu Tyr Ser Pro Ala Ala Thr Thr Ala
1 5 10 15
Glu Asn Gly Gly Gly Lys Lys Lys Gln Lys Glu Lys Glu Leu Asp Glu
20 25 30
Leu Lys Lys Glu Val Ala Met Asp Asp His Lys Leu Ser Leu Asp Glu
35 40 45
Leu Gly Arg Lys Tyr Gln Val Asp Leu Ser Lys Gly Leu Thr Asn Gln
50 55 60
Arg Ala Gln Asp Val Leu Ala Arg Asp Gly Pro Asn Ala Leu Thr Pro
65 70 75 80
Pro Pro Thr Thr Pro Glu Trp Val Lys Phe Cys Arg Gln Leu Phe Gly
85 90 95
Gly Phe Ser Ile Leu Leu Trp Ile Gly Ala Ile Leu Cys Phe Leu Ala
100 105 110
Tyr Gly Ile Gln Ala Ala Met Glu Asp Glu Pro Ser Asn Asp Asn Leu
115 120 125
Tyr Leu Gly Val Val Leu Ala Ala Val Val Ile Val Thr Gly Cys Phe
130 135 140
Ser Tyr Tyr Gln Glu Ala Lys Ser Ser Lys Ile Met Asp Ser Phe Lys
145 150 155 160
Asn Met Val Pro Gln Gln Ala Leu Val Ile Arg Glu Gly Glu Lys Met
165 170 175
Gln Ile Asn Ala Glu Glu Val Val Val Gly Asp Leu Val Glu Val Lys
180 185 190
Gly Gly Asp Arg Val Pro Ala Asp Leu Arg Ile Ile Ser Ser His Gly
195 200 205
Cys Lys Val Asp Asn Ser Ser Leu Thr Gly Glu Ser Glu Pro Gln Thr
210 215 220
Arg Ser Pro Glu Phe Thr His Glu Asn Pro Leu Glu Thr Arg Asn Ile
225 230 235 240
<210> 312
<211> 780
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> ATP1A3
<400> 312
Cys Phe Phe Ser Thr Asn Cys Val Glu Gly Thr Ala Arg Gly Ile Val
1 5 10 15
Ile Ala Thr Gly Asp Arg Thr Val Met Gly Arg Ile Ala Thr Leu Ala
20 25 30
Ser Gly Leu Glu Val Gly Arg Thr Pro Ile Ala Met Glu Ile Glu His
35 40 45
Phe Ile Gln Leu Ile Thr Gly Val Ala Val Phe Leu Gly Val Ser Phe
50 55 60
Phe Val Leu Ser Leu Ile Leu Gly Tyr Ser Trp Leu Glu Ala Val Ile
65 70 75 80
Phe Leu Ile Gly Ile Ile Val Ala Asn Val Pro Glu Gly Leu Leu Ala
85 90 95
Thr Val Thr Val Cys Leu Thr Leu Thr Ala Lys Arg Met Ala Arg Lys
100 105 110
Asn Cys Leu Val Lys Asn Leu Glu Ala Val Glu Thr Leu Gly Ser Thr
115 120 125
Ser Thr Ile Cys Ser Asp Lys Thr Gly Thr Leu Thr Gln Asn Arg Met
130 135 140
Thr Val Ala His Met Trp Phe Asp Asn Gln Ile His Glu Ala Asp Thr
145 150 155 160
Thr Glu Asp Gln Ser Gly Ala Thr Phe Asp Lys Arg Ser Pro Thr Trp
165 170 175
Thr Ala Leu Ser Arg Ile Ala Gly Leu Cys Asn Arg Ala Val Phe Lys
180 185 190
Ala Gly Gln Glu Asn Ile Ser Val Ser Lys Arg Asp Thr Ala Gly Asp
195 200 205
Ala Ser Glu Ser Ala Leu Leu Lys Cys Ile Glu Leu Ser Cys Gly Ser
210 215 220
Val Arg Lys Met Arg Asp Arg Asn Pro Lys Val Ala Glu Ile Pro Phe
225 230 235 240
Asn Ser Thr Asn Lys Tyr Gln Leu Ser Ile His Glu Arg Glu Asp Ser
245 250 255
Pro Gln Ser His Val Leu Val Met Lys Gly Ala Pro Glu Arg Ile Leu
260 265 270
Asp Arg Cys Ser Thr Ile Leu Val Gln Gly Lys Glu Ile Pro Leu Asp
275 280 285
Lys Glu Met Gln Asp Ala Phe Gln Asn Ala Tyr Met Glu Leu Gly Gly
290 295 300
Leu Gly Glu Arg Val Leu Gly Phe Cys Gln Leu Asn Leu Pro Ser Gly
305 310 315 320
Lys Phe Pro Arg Gly Phe Lys Phe Asp Thr Asp Glu Leu Asn Phe Pro
325 330 335
Thr Glu Lys Leu Cys Phe Val Gly Leu Met Ser Met Ile Asp Pro Pro
340 345 350
Arg Ala Ala Val Pro Asp Ala Val Gly Lys Cys Arg Ser Ala Gly Ile
355 360 365
Lys Val Ile Met Val Thr Gly Asp His Pro Ile Thr Ala Lys Ala Ile
370 375 380
Ala Lys Gly Val Gly Ile Ile Ser Glu Gly Asn Glu Thr Val Glu Asp
385 390 395 400
Ile Ala Ala Arg Leu Asn Ile Pro Met Ser Gln Val Asn Pro Arg Glu
405 410 415
Ala Lys Ala Cys Val Val His Gly Ser Asp Leu Lys Asp Met Thr Ser
420 425 430
Glu Gln Leu Asp Glu Ile Leu Lys Asn His Thr Glu Ile Val Phe Ala
435 440 445
Arg Thr Ser Pro Gln Gln Lys Leu Ile Ile Val Glu Gly Cys Gln Arg
450 455 460
Gln Gly Ala Ile Val Ala Val Thr Gly Asp Gly Val Asn Asp Ser Pro
465 470 475 480
Ala Leu Lys Lys Ala Asp Ile Gly Ile Ala Met Gly Ile Ser Gly Ser
485 490 495
Asp Val Ser Lys Gln Ala Ala Asp Met Ile Leu Leu Asp Asp Asn Phe
500 505 510
Ala Ser Ile Val Thr Gly Val Glu Glu Gly Arg Leu Ile Phe Asp Asn
515 520 525
Leu Lys Lys Ser Ile Ala Tyr Thr Leu Thr Ser Asn Ile Pro Glu Ile
530 535 540
Thr Pro Phe Leu Leu Phe Ile Ile Ala Asn Ile Pro Leu Pro Leu Gly
545 550 555 560
Thr Val Thr Ile Leu Cys Ile Asp Leu Gly Thr Asp Met Val Pro Ala
565 570 575
Ile Ser Leu Ala Tyr Glu Ala Ala Glu Ser Asp Ile Met Lys Arg Gln
580 585 590
Pro Arg Asn Ser Gln Thr Asp Lys Leu Val Asn Glu Arg Leu Ile Ser
595 600 605
Met Ala Tyr Gly Gln Ile Gly Met Ile Gln Ala Leu Gly Gly Phe Phe
610 615 620
Thr Tyr Phe Val Ile Leu Ala Glu Asn Gly Phe Leu Pro Ser Arg Leu
625 630 635 640
Leu Gly Ile Arg Leu Asp Trp Asp Asp Arg Thr Met Asn Asp Leu Glu
645 650 655
Asp Ser Tyr Gly Gln Glu Trp Thr Tyr Glu Gln Arg Lys Val Val Glu
660 665 670
Phe Thr Cys His Thr Ala Phe Phe Ala Ser Ile Val Val Val Gln Trp
675 680 685
Ala Asp Leu Ile Ile Cys Lys Thr Arg Arg Asn Ser Val Phe Gln Gln
690 695 700
Gly Met Lys Asn Lys Ile Leu Ile Phe Gly Leu Leu Glu Glu Thr Ala
705 710 715 720
Leu Ala Ala Phe Leu Ser Tyr Cys Pro Gly Met Gly Val Ala Leu Arg
725 730 735
Met Tyr Pro Leu Lys Val Thr Trp Trp Phe Cys Ala Phe Pro Tyr Ser
740 745 750
Leu Leu Ile Phe Ile Tyr Asp Glu Val Arg Lys Leu Ile Leu Arg Arg
755 760 765
Tyr Pro Gly Gly Trp Val Glu Lys Glu Thr Tyr Tyr
770 775 780
<210> 313
<211> 1026
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> ATP1A4
<400> 313
Met Gly Ser Gly Gly Ser Asp Ser Tyr Arg Ile Ala Thr Ser Gln Asp
1 5 10 15
Lys Lys Asp Asp Lys Asp Ser Pro Lys Lys Asn Lys Gly Lys Glu Arg
20 25 30
Arg Asp Leu Asp Asp Leu Lys Lys Glu Val Ala Met Thr Glu His Lys
35 40 45
Met Ser Val Glu Glu Val Cys Arg Lys Tyr Asn Thr Asp Cys Val Gln
50 55 60
Gly Leu Thr His Ser Lys Ala Gln Glu Ile Leu Ala Arg Asp Gly Pro
65 70 75 80
Asn Ala Leu Thr Pro Pro Pro Thr Thr Pro Glu Trp Val Lys Phe Cys
85 90 95
Arg Gln Leu Phe Gly Gly Phe Ser Ile Leu Leu Trp Ile Gly Ala Ile
100 105 110
Leu Cys Phe Leu Ala Tyr Gly Ile Gln Ala Gly Thr Glu Asp Asp Pro
115 120 125
Ser Gly Asp Asn Leu Tyr Leu Gly Ile Val Leu Ala Ala Val Val Ile
130 135 140
Ile Thr Gly Cys Phe Ser Tyr Tyr Gln Glu Ala Lys Ser Ser Lys Ile
145 150 155 160
Met Glu Ser Phe Lys Asn Met Val Pro Gln Gln Ala Leu Val Ile Arg
165 170 175
Glu Gly Glu Lys Met Gln Val Asn Ala Glu Glu Val Val Val Gly Asp
180 185 190
Leu Val Glu Ile Lys Gly Gly Asp Arg Val Pro Ala Asp Leu Arg Ile
195 200 205
Ile Ser Ala His Gly Cys Lys Val Asp Asn Ser Ser Leu Thr Gly Glu
210 215 220
Ser Glu Pro Gln Thr Arg Ser Pro Asp Cys Thr His Asp Asn Pro Leu
225 230 235 240
Glu Thr Arg Asn Ile Thr Phe Phe Ser Thr Asn Cys Val Glu Gly Thr
245 250 255
Ala Arg Gly Val Val Val Ala Thr Gly Asp Arg Thr Val Met Gly Arg
260 265 270
Ile Ala Thr Leu Ala Ser Gly Leu Glu Val Gly Lys Thr Pro Ile Ala
275 280 285
Ile Glu Ile Glu His Phe Ile Gln Leu Ile Thr Gly Val Ala Val Phe
290 295 300
Leu Gly Val Ser Phe Phe Ile Leu Ser Leu Ile Leu Gly Tyr Thr Trp
305 310 315 320
Leu Glu Ala Val Ile Phe Leu Ile Gly Ile Ile Val Ala Asn Val Pro
325 330 335
Glu Gly Leu Leu Ala Thr Val Thr Val Cys Leu Thr Leu Thr Ala Lys
340 345 350
Arg Met Ala Arg Lys Asn Cys Leu Val Lys Asn Leu Glu Ala Val Glu
355 360 365
Thr Leu Gly Ser Thr Ser Thr Ile Cys Ser Asp Lys Thr Gly Thr Leu
370 375 380
Thr Gln Asn Arg Met Thr Val Ala His Met Trp Phe Asp Asn Gln Ile
385 390 395 400
His Glu Ala Asp Thr Thr Glu Asp Gln Ser Gly Thr Ser Phe Asp Lys
405 410 415
Ser Ser His Thr Trp Val Ala Leu Ser His Ile Ala Gly Leu Cys Asn
420 425 430
Arg Ala Val Phe Lys Gly Gly Gln Asp Asn Ile Pro Val Leu Lys Arg
435 440 445
Asp Val Ala Gly Asp Ala Ser Glu Ser Ala Leu Leu Lys Cys Ile Glu
450 455 460
Leu Ser Ser Gly Ser Val Lys Leu Met Arg Glu Arg Asn Lys Lys Val
465 470 475 480
Ala Glu Ile Pro Phe Asn Ser Thr Asn Lys Tyr Gln Leu Ser Ile His
485 490 495
Glu Thr Glu Asp Pro Asn Asp Asn Arg Tyr Leu Leu Val Met Lys Gly
500 505 510
Ala Pro Glu Arg Ile Leu Asp Arg Cys Ser Thr Ile Leu Leu Gln Gly
515 520 525
Lys Glu Gln Pro Leu Asp Glu Glu Met Lys Glu Ala Phe Gln Asn Ala
530 535 540
Tyr Leu Glu Leu Gly Gly Leu Gly Glu Arg Val Leu Gly Phe Cys His
545 550 555 560
Tyr Tyr Leu Pro Glu Glu Gln Phe Pro Lys Gly Phe Ala Phe Asp Cys
565 570 575
Asp Asp Val Asn Phe Thr Thr Asp Asn Leu Cys Phe Val Gly Leu Met
580 585 590
Ser Met Ile Asp Pro Pro Arg Ala Ala Val Pro Asp Ala Val Gly Lys
595 600 605
Cys Arg Ser Ala Gly Ile Lys Val Ile Met Val Thr Gly Asp His Pro
610 615 620
Ile Thr Ala Lys Ala Ile Ala Lys Gly Val Gly Ile Ile Ser Glu Gly
625 630 635 640
Asn Glu Thr Val Glu Asp Ile Ala Ala Arg Leu Asn Ile Pro Val Ser
645 650 655
Gln Val Asn Pro Arg Asp Ala Lys Ala Cys Val Ile His Gly Thr Asp
660 665 670
Leu Lys Asp Phe Thr Ser Glu Gln Ile Asp Glu Ile Leu Gln Asn His
675 680 685
Thr Glu Ile Val Phe Ala Arg Thr Ser Pro Gln Gln Lys Leu Ile Ile
690 695 700
Val Glu Gly Cys Gln Arg Gln Gly Ala Ile Val Ala Val Thr Gly Asp
705 710 715 720
Gly Val Asn Asp Ser Pro Ala Leu Lys Lys Ala Asp Ile Gly Val Ala
725 730 735
Met Gly Ile Ala Gly Ser Asp Val Ser Lys Gln Ala Ala Asp Met Ile
740 745 750
Leu Leu Asp Asp Asn Phe Ala Ser Ile Val Thr Gly Val Glu Glu Gly
755 760 765
Arg Leu Ile Phe Asp Asn Leu Lys Lys Ser Ile Ala Tyr Thr Leu Thr
770 775 780
Ser Asn Ile Pro Glu Ile Thr Pro Phe Leu Leu Phe Ile Met Ala Asn
785 790 795 800
Ile Pro Leu Pro Leu Gly Thr Ile Thr Ile Leu Cys Ile Asp Leu Gly
805 810 815
Thr Asp Met Val Pro Ala Ile Ser Leu Ala Tyr Glu Ala Ala Glu Ser
820 825 830
Asp Ile Met Lys Arg Gln Pro Arg Asn Pro Arg Thr Asp Lys Leu Val
835 840 845
Asn Glu Arg Leu Ile Ser Met Ala Tyr Gly Gln Ile Gly Met Ile Gln
850 855 860
Ala Leu Gly Gly Phe Phe Ser Tyr Phe Val Ile Leu Ala Glu Asn Gly
865 870 875 880
Phe Leu Pro Gly Asn Leu Val Gly Ile Arg Leu Asn Trp Asp Asp Arg
885 890 895
Thr Val Asn Asp Leu Glu Asp Ser Tyr Gly Gln Gln Trp Thr Tyr Glu
900 905 910
Gln Arg Lys Val Val Glu Phe Thr Cys His Thr Ala Phe Phe Val Ser
915 920 925
Ile Val Val Val Gln Trp Ala Asp Leu Ile Ile Cys Lys Thr Arg Arg
930 935 940
Asn Ser Val Phe Gln Gln Gly Met Lys Asn Lys Ile Leu Ile Phe Gly
945 950 955 960
Leu Phe Glu Glu Thr Ala Leu Ala Ala Phe Leu Ser Tyr Cys Pro Gly
965 970 975
Met Asp Val Ala Leu Arg Met Tyr Pro Leu Lys Pro Ser Trp Trp Phe
980 985 990
Cys Ala Phe Pro Tyr Ser Phe Leu Ile Phe Val Tyr Asp Glu Ile Arg
995 1000 1005
Lys Leu Ile Leu Arg Arg Asn Pro Gly Gly Trp Val Glu Lys Glu
1010 1015 1020
Thr Tyr Tyr
1025
<210> 314
<211> 1029
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> ATP1B3
<400> 314
Met Gly Leu Trp Gly Lys Lys Gly Thr Val Ala Pro His Asp Gln Ser
1 5 10 15
Pro Arg Arg Arg Pro Lys Lys Gly Leu Ile Lys Lys Lys Met Val Lys
20 25 30
Arg Glu Lys Gln Lys Arg Asn Met Glu Glu Leu Lys Lys Glu Val Val
35 40 45
Met Asp Asp His Lys Leu Thr Leu Glu Glu Leu Ser Thr Lys Tyr Ser
50 55 60
Val Asp Leu Thr Lys Gly His Ser His Gln Arg Ala Lys Glu Ile Leu
65 70 75 80
Thr Arg Gly Gly Pro Asn Thr Val Thr Pro Pro Pro Thr Thr Pro Glu
85 90 95
Trp Val Lys Phe Cys Lys Gln Leu Phe Gly Gly Phe Ser Leu Leu Leu
100 105 110
Trp Thr Gly Ala Ile Leu Cys Phe Val Ala Tyr Ser Ile Gln Ile Tyr
115 120 125
Phe Asn Glu Glu Pro Thr Lys Asp Asn Leu Tyr Leu Ser Ile Val Leu
130 135 140
Ser Val Val Val Ile Val Thr Gly Cys Phe Ser Tyr Tyr Gln Glu Ala
145 150 155 160
Lys Ser Ser Lys Ile Met Glu Ser Phe Lys Asn Met Val Pro Gln Gln
165 170 175
Ala Leu Val Ile Arg Gly Gly Glu Lys Met Gln Ile Asn Val Gln Glu
180 185 190
Val Val Leu Gly Asp Leu Val Glu Ile Lys Gly Gly Asp Arg Val Pro
195 200 205
Ala Asp Leu Arg Leu Ile Ser Ala Gln Gly Cys Lys Val Asp Asn Ser
210 215 220
Ser Leu Thr Gly Glu Ser Glu Pro Gln Ser Arg Ser Pro Asp Phe Thr
225 230 235 240
His Glu Asn Pro Leu Glu Thr Arg Asn Ile Cys Phe Phe Ser Thr Asn
245 250 255
Cys Val Glu Gly Thr Ala Arg Gly Ile Val Ile Ala Thr Gly Asp Ser
260 265 270
Thr Val Met Gly Arg Ile Ala Ser Leu Thr Ser Gly Leu Ala Val Gly
275 280 285
Gln Thr Pro Ile Ala Ala Glu Ile Glu His Phe Ile His Leu Ile Thr
290 295 300
Val Val Ala Val Phe Leu Gly Val Thr Phe Phe Ala Leu Ser Leu Leu
305 310 315 320
Leu Gly Tyr Gly Trp Leu Glu Ala Ile Ile Phe Leu Ile Gly Ile Ile
325 330 335
Val Ala Asn Val Pro Glu Gly Leu Leu Ala Thr Val Thr Val Cys Leu
340 345 350
Thr Leu Thr Ala Lys Arg Met Ala Arg Lys Asn Cys Leu Val Lys Asn
355 360 365
Leu Glu Ala Val Glu Thr Leu Gly Ser Thr Ser Thr Ile Cys Ser Asp
370 375 380
Lys Thr Gly Thr Leu Thr Gln Asn Arg Met Thr Val Ala His Met Trp
385 390 395 400
Phe Asp Met Thr Val Tyr Glu Ala Asp Thr Thr Glu Glu Gln Thr Gly
405 410 415
Lys Thr Phe Thr Lys Ser Ser Asp Thr Trp Phe Met Leu Ala Arg Ile
420 425 430
Ala Gly Leu Cys Asn Arg Ala Asp Phe Lys Ala Asn Gln Glu Ile Leu
435 440 445
Pro Ile Ala Lys Arg Ala Thr Thr Gly Asp Ala Ser Glu Ser Ala Leu
450 455 460
Leu Lys Phe Ile Glu Gln Ser Tyr Ser Ser Val Ala Glu Met Arg Glu
465 470 475 480
Lys Asn Pro Lys Val Ala Glu Ile Pro Phe Asn Ser Thr Asn Lys Tyr
485 490 495
Gln Met Ser Ile His Leu Arg Glu Asp Ser Ser Gln Thr His Val Leu
500 505 510
Met Met Lys Gly Ala Pro Glu Arg Ile Leu Glu Phe Cys Ser Thr Phe
515 520 525
Leu Leu Asn Gly Gln Glu Tyr Ser Met Asn Asp Glu Met Lys Glu Ala
530 535 540
Phe Gln Asn Ala Tyr Leu Glu Leu Gly Gly Leu Gly Glu Arg Val Leu
545 550 555 560
Gly Phe Cys Phe Leu Asn Leu Pro Ser Ser Phe Ser Lys Gly Phe Pro
565 570 575
Phe Asn Thr Asp Glu Ile Asn Phe Pro Met Asp Asn Leu Cys Phe Val
580 585 590
Gly Leu Ile Ser Met Ile Asp Pro Pro Arg Ala Ala Val Pro Asp Ala
595 600 605
Val Ser Lys Cys Arg Ser Ala Gly Ile Lys Val Ile Met Val Thr Gly
610 615 620
Asp His Pro Ile Thr Ala Lys Ala Ile Ala Lys Gly Val Gly Ile Ile
625 630 635 640
Ser Glu Gly Thr Glu Thr Ala Glu Glu Val Ala Ala Arg Leu Lys Ile
645 650 655
Pro Ile Ser Lys Val Asp Ala Ser Ala Ala Lys Ala Ile Val Val His
660 665 670
Gly Ala Glu Leu Lys Asp Ile Gln Ser Lys Gln Leu Asp Gln Ile Leu
675 680 685
Gln Asn His Pro Glu Ile Val Phe Ala Arg Thr Ser Pro Gln Gln Lys
690 695 700
Leu Ile Ile Val Glu Gly Cys Gln Arg Leu Gly Ala Val Val Ala Val
705 710 715 720
Thr Gly Asp Gly Val Asn Asp Ser Pro Ala Leu Lys Lys Ala Asp Ile
725 730 735
Gly Ile Ala Met Gly Ile Ser Gly Ser Asp Val Ser Lys Gln Ala Ala
740 745 750
Asp Met Ile Leu Leu Asp Asp Asn Phe Ala Ser Ile Val Thr Gly Val
755 760 765
Glu Glu Gly Arg Leu Ile Phe Asp Asn Leu Lys Lys Ser Ile Met Tyr
770 775 780
Thr Leu Thr Ser Asn Ile Pro Glu Ile Thr Pro Phe Leu Met Phe Ile
785 790 795 800
Ile Leu Gly Ile Pro Leu Pro Leu Gly Thr Ile Thr Ile Leu Cys Ile
805 810 815
Asp Leu Gly Thr Asp Met Val Pro Ala Ile Ser Leu Ala Tyr Glu Ser
820 825 830
Ala Glu Ser Asp Ile Met Lys Arg Leu Pro Arg Asn Pro Lys Thr Asp
835 840 845
Asn Leu Val Asn His Arg Leu Ile Gly Met Ala Tyr Gly Gln Ile Gly
850 855 860
Met Ile Gln Ala Leu Ala Gly Phe Phe Thr Tyr Phe Val Ile Leu Ala
865 870 875 880
Glu Asn Gly Phe Arg Pro Val Asp Leu Leu Gly Ile Arg Leu His Trp
885 890 895
Glu Asp Lys Tyr Leu Asn Asp Leu Glu Asp Ser Tyr Gly Gln Gln Trp
900 905 910
Thr Tyr Glu Gln Arg Lys Val Val Glu Phe Thr Cys Gln Thr Ala Phe
915 920 925
Phe Val Thr Ile Val Val Val Gln Trp Ala Asp Leu Ile Ile Ser Lys
930 935 940
Thr Arg Arg Asn Ser Leu Phe Gln Gln Gly Met Arg Asn Lys Val Leu
945 950 955 960
Ile Phe Gly Ile Leu Glu Glu Thr Leu Leu Ala Ala Phe Leu Ser Tyr
965 970 975
Thr Pro Gly Met Asp Val Ala Leu Arg Met Tyr Pro Leu Lys Ile Thr
980 985 990
Trp Trp Leu Cys Ala Ile Pro Tyr Ser Ile Leu Ile Phe Val Tyr Asp
995 1000 1005
Glu Ile Arg Lys Leu Leu Ile Arg Gln His Pro Asp Gly Trp Val
1010 1015 1020
Glu Arg Glu Thr Tyr Tyr
1025
<210> 315
<211> 279
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> ATP2B1
<400> 315
Met Thr Lys Asn Glu Lys Lys Ser Leu Asn Gln Ser Leu Ala Glu Trp
1 5 10 15
Lys Leu Phe Ile Tyr Asn Pro Thr Thr Gly Glu Phe Leu Gly Arg Thr
20 25 30
Ala Lys Ser Trp Gly Leu Ile Leu Leu Phe Tyr Leu Val Phe Tyr Gly
35 40 45
Phe Leu Ala Ala Leu Phe Ser Phe Thr Met Trp Val Met Leu Gln Thr
50 55 60
Leu Asn Asp Glu Val Pro Lys Tyr Arg Asp Gln Ile Pro Ser Pro Gly
65 70 75 80
Leu Met Val Phe Pro Lys Pro Val Thr Ala Leu Glu Tyr Thr Phe Ser
85 90 95
Arg Ser Asp Pro Thr Ser Tyr Ala Gly Tyr Ile Glu Asp Leu Lys Lys
100 105 110
Phe Leu Lys Pro Tyr Thr Leu Glu Glu Gln Lys Asn Leu Thr Val Cys
115 120 125
Pro Asp Gly Ala Leu Phe Glu Gln Lys Gly Pro Val Tyr Val Ala Cys
130 135 140
Gln Phe Pro Ile Ser Leu Leu Gln Ala Cys Ser Gly Met Asn Asp Pro
145 150 155 160
Asp Phe Gly Tyr Ser Gln Gly Asn Pro Cys Ile Leu Val Lys Met Asn
165 170 175
Arg Ile Ile Gly Leu Lys Pro Glu Gly Val Pro Arg Ile Asp Cys Val
180 185 190
Ser Lys Asn Glu Asp Ile Pro Asn Val Ala Val Tyr Pro His Asn Gly
195 200 205
Met Ile Asp Leu Lys Tyr Phe Pro Tyr Tyr Gly Lys Lys Leu His Val
210 215 220
Gly Tyr Leu Gln Pro Leu Val Ala Val Gln Val Ser Phe Ala Pro Asn
225 230 235 240
Asn Thr Gly Lys Glu Val Thr Val Glu Cys Lys Ile Asp Gly Ser Ala
245 250 255
Asn Leu Lys Ser Gln Asp Asp Arg Asp Lys Phe Leu Gly Arg Val Met
260 265 270
Phe Lys Ile Thr Ala Arg Ala
275
<210> 316
<211> 1258
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> ATP2B2
<400> 316
Met Gly Asp Met Ala Asn Asn Ser Val Ala Tyr Ser Gly Val Lys Asn
1 5 10 15
Ser Leu Lys Glu Ala Asn His Asp Gly Asp Phe Gly Ile Thr Leu Ala
20 25 30
Glu Leu Arg Ala Leu Met Glu Leu Arg Ser Thr Asp Ala Leu Arg Lys
35 40 45
Ile Gln Glu Ser Tyr Gly Asp Val Tyr Gly Ile Cys Thr Lys Leu Lys
50 55 60
Thr Ser Pro Asn Glu Gly Leu Ser Gly Asn Pro Ala Asp Leu Glu Arg
65 70 75 80
Arg Glu Ala Val Phe Gly Lys Asn Phe Ile Pro Pro Lys Lys Pro Lys
85 90 95
Thr Phe Leu Gln Leu Val Trp Glu Ala Leu Gln Asp Val Thr Leu Ile
100 105 110
Ile Leu Glu Ile Ala Ala Ile Val Ser Leu Gly Leu Ser Phe Tyr Gln
115 120 125
Pro Pro Glu Gly Asp Asn Ala Leu Cys Gly Glu Val Ser Val Gly Glu
130 135 140
Glu Glu Gly Glu Gly Glu Thr Gly Trp Ile Glu Gly Ala Ala Ile Leu
145 150 155 160
Leu Ser Val Val Cys Val Val Leu Val Thr Ala Phe Asn Asp Trp Ser
165 170 175
Lys Glu Lys Gln Phe Arg Gly Leu Gln Ser Arg Ile Glu Gln Glu Gln
180 185 190
Lys Phe Thr Val Ile Arg Gly Gly Gln Val Ile Gln Ile Pro Val Ala
195 200 205
Asp Ile Thr Val Gly Asp Ile Ala Gln Val Lys Tyr Gly Asp Leu Leu
210 215 220
Pro Ala Asp Gly Ile Leu Ile Gln Gly Asn Asp Leu Lys Ile Asp Glu
225 230 235 240
Ser Ser Leu Thr Gly Glu Ser Asp His Val Lys Lys Ser Leu Asp Lys
245 250 255
Asp Pro Leu Leu Leu Ser Gly Thr His Val Met Glu Gly Ser Gly Arg
260 265 270
Met Val Val Thr Ala Val Gly Val Asn Ser Gln Thr Gly Ile Ile Phe
275 280 285
Thr Leu Leu Gly Ala Gly Gly Glu Glu Glu Glu Lys Lys Asp Glu Lys
290 295 300
Lys Lys Glu Lys Lys Asn Lys Lys Gln Asp Gly Ala Ile Glu Asn Arg
305 310 315 320
Asn Lys Ala Lys Ala Gln Asp Gly Ala Ala Met Glu Met Gln Pro Leu
325 330 335
Lys Ser Glu Glu Gly Gly Asp Gly Asp Glu Lys Asp Lys Lys Lys Ala
340 345 350
Asn Leu Pro Lys Lys Glu Lys Ser Val Leu Gln Gly Lys Leu Thr Lys
355 360 365
Leu Ala Val Gln Ile Gly Lys Ala Gly Leu Leu Met Ser Ala Ile Thr
370 375 380
Val Ile Ile Leu Val Leu Tyr Phe Val Ile Asp Thr Phe Trp Val Gln
385 390 395 400
Lys Arg Pro Trp Leu Ala Glu Cys Thr Pro Ile Tyr Ile Gln Tyr Phe
405 410 415
Val Lys Phe Phe Ile Ile Gly Val Thr Val Leu Val Val Ala Val Pro
420 425 430
Glu Gly Leu Pro Leu Ala Val Thr Ile Ser Leu Ala Tyr Ser Val Lys
435 440 445
Lys Met Met Lys Asp Asn Asn Leu Val Arg His Leu Asp Ala Cys Glu
450 455 460
Thr Met Gly Asn Ala Thr Ala Ile Cys Ser Asp Lys Thr Gly Thr Leu
465 470 475 480
Thr Met Asn Arg Met Thr Val Val Gln Ala Tyr Ile Asn Glu Lys His
485 490 495
Tyr Lys Lys Val Pro Glu Pro Glu Ala Ile Pro Pro Asn Ile Leu Ser
500 505 510
Tyr Leu Val Thr Gly Ile Ser Val Asn Cys Ala Tyr Thr Ser Lys Ile
515 520 525
Leu Pro Pro Glu Lys Glu Gly Gly Leu Pro Arg His Val Gly Asn Lys
530 535 540
Thr Glu Cys Ala Leu Leu Gly Leu Leu Leu Asp Leu Lys Arg Asp Tyr
545 550 555 560
Gln Asp Val Arg Asn Glu Ile Pro Glu Glu Ala Leu Tyr Lys Val Tyr
565 570 575
Thr Phe Asn Ser Val Arg Lys Ser Met Ser Thr Val Leu Lys Asn Ser
580 585 590
Asp Gly Ser Tyr Arg Ile Phe Ser Lys Gly Ala Ser Glu Ile Ile Leu
595 600 605
Lys Lys Cys Phe Lys Ile Leu Ser Ala Asn Gly Glu Ala Lys Val Phe
610 615 620
Arg Pro Arg Asp Arg Asp Asp Ile Val Lys Thr Val Ile Glu Pro Met
625 630 635 640
Ala Ser Glu Gly Leu Arg Thr Ile Cys Leu Ala Phe Arg Asp Phe Pro
645 650 655
Ala Gly Glu Pro Glu Pro Glu Trp Asp Asn Glu Asn Asp Ile Val Thr
660 665 670
Gly Leu Thr Cys Ile Ala Val Val Gly Ile Glu Asp Pro Val Arg Pro
675 680 685
Glu Val Pro Asp Ala Ile Lys Lys Cys Gln Arg Ala Gly Ile Thr Val
690 695 700
Arg Met Val Thr Gly Asp Asn Ile Asn Thr Ala Arg Ala Ile Ala Thr
705 710 715 720
Lys Cys Gly Ile Leu His Pro Gly Glu Asp Phe Leu Cys Leu Glu Gly
725 730 735
Lys Asp Phe Asn Arg Arg Ile Arg Asn Glu Lys Gly Glu Ile Glu Gln
740 745 750
Glu Arg Ile Asp Lys Ile Trp Pro Lys Leu Arg Val Leu Ala Arg Ser
755 760 765
Ser Pro Thr Asp Lys His Thr Leu Val Lys Gly Ile Ile Asp Ser Thr
770 775 780
Val Ser Asp Gln Arg Gln Val Val Ala Val Thr Gly Asp Gly Thr Asn
785 790 795 800
Asp Gly Pro Ala Leu Lys Lys Ala Asp Val Gly Phe Ala Met Gly Ile
805 810 815
Ala Gly Thr Asp Val Ala Lys Glu Ala Ser Asp Ile Ile Leu Thr Asp
820 825 830
Asp Asn Phe Thr Ser Ile Val Lys Ala Val Met Trp Gly Arg Asn Val
835 840 845
Tyr Asp Ser Ile Ser Lys Phe Leu Gln Phe Gln Leu Thr Val Asn Val
850 855 860
Val Ala Val Ile Val Ala Phe Thr Gly Ala Cys Ile Thr Gln Asp Ser
865 870 875 880
Pro Leu Lys Ala Val Gln Met Leu Trp Val Asn Leu Ile Met Asp Thr
885 890 895
Leu Ala Ser Leu Ala Leu Ala Thr Glu Pro Pro Thr Glu Ser Leu Leu
900 905 910
Leu Arg Lys Pro Tyr Gly Arg Asn Lys Pro Leu Ile Ser Arg Thr Met
915 920 925
Met Lys Asn Ile Leu Gly His Ala Phe Tyr Gln Leu Val Val Val Phe
930 935 940
Thr Leu Leu Phe Ala Gly Glu Lys Phe Phe Asp Ile Asp Ser Gly Arg
945 950 955 960
Asn Ala Pro Leu His Ala Pro Pro Ser Glu His Tyr Thr Ile Val Phe
965 970 975
Asn Thr Phe Val Leu Met Gln Leu Phe Asn Glu Ile Asn Ala Arg Lys
980 985 990
Ile His Gly Glu Arg Asn Val Phe Glu Gly Ile Phe Asn Asn Ala Ile
995 1000 1005
Phe Cys Thr Ile Val Leu Gly Thr Phe Val Val Gln Ile Ile Ile
1010 1015 1020
Val Gln Phe Gly Gly Lys Pro Phe Ser Cys Ser Glu Leu Ser Ile
1025 1030 1035
Glu Gln Trp Leu Trp Ser Ile Phe Leu Gly Met Gly Thr Leu Leu
1040 1045 1050
Trp Gly Gln Leu Ile Ser Thr Ile Pro Thr Ser Arg Leu Lys Phe
1055 1060 1065
Leu Lys Glu Ala Gly His Gly Thr Gln Lys Glu Glu Ile Pro Glu
1070 1075 1080
Glu Glu Leu Ala Glu Asp Val Glu Glu Ile Asp His Ala Glu Arg
1085 1090 1095
Glu Leu Arg Arg Gly Gln Ile Leu Trp Phe Arg Gly Leu Asn Arg
1100 1105 1110
Ile Gln Thr Gln Met Asp Val Val Asn Ala Phe Gln Ser Gly Ser
1115 1120 1125
Ser Ile Gln Gly Ala Leu Arg Arg Gln Pro Ser Ile Ala Ser Gln
1130 1135 1140
His His Asp Val Thr Asn Ile Ser Thr Pro Thr His Ile Arg Val
1145 1150 1155
Val Asn Ala Phe Arg Ser Ser Leu Tyr Glu Gly Leu Glu Lys Pro
1160 1165 1170
Glu Ser Arg Ser Ser Ile His Asn Phe Met Thr His Pro Glu Phe
1175 1180 1185
Arg Ile Glu Asp Ser Glu Pro His Ile Pro Leu Ile Asp Asp Thr
1190 1195 1200
Asp Ala Glu Asp Asp Ala Pro Thr Lys Arg Asn Ser Ser Pro Pro
1205 1210 1215
Pro Ser Pro Asn Lys Asn Asn Asn Ala Val Asp Ser Gly Ile His
1220 1225 1230
Leu Thr Ile Glu Met Asn Lys Ser Ala Thr Ser Ser Ser Pro Gly
1235 1240 1245
Ser Pro Leu His Ser Leu Glu Thr Ser Leu
1250 1255
<210> 317
<211> 1272
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> ATP2B3
<400> 317
Met Gly Asp Met Thr Asn Ser Asp Phe Tyr Ser Lys Asn Gln Arg Asn
1 5 10 15
Glu Ser Ser His Gly Gly Glu Phe Gly Cys Thr Met Glu Glu Leu Arg
20 25 30
Ser Leu Met Glu Leu Arg Gly Thr Glu Ala Val Val Lys Ile Lys Glu
35 40 45
Thr Tyr Gly Asp Thr Glu Ala Ile Cys Arg Arg Leu Lys Thr Ser Pro
50 55 60
Val Glu Gly Leu Pro Gly Thr Ala Pro Asp Leu Glu Lys Arg Lys Gln
65 70 75 80
Ile Phe Gly Gln Asn Phe Ile Pro Pro Lys Lys Pro Lys Thr Phe Leu
85 90 95
Gln Leu Val Trp Glu Ala Leu Gln Asp Val Thr Leu Ile Ile Leu Glu
100 105 110
Ile Ala Ala Ile Ile Ser Leu Gly Leu Ser Phe Tyr His Pro Pro Gly
115 120 125
Glu Gly Asn Glu Gly Cys Ala Thr Ala Gln Gly Gly Ala Glu Asp Glu
130 135 140
Gly Glu Ala Glu Ala Gly Trp Ile Glu Gly Ala Ala Ile Leu Leu Ser
145 150 155 160
Val Ile Cys Val Val Leu Val Thr Ala Phe Asn Asp Trp Ser Lys Glu
165 170 175
Lys Gln Phe Arg Gly Leu Gln Ser Arg Ile Glu Gln Glu Gln Lys Phe
180 185 190
Thr Val Val Arg Ala Gly Gln Val Val Gln Ile Pro Val Ala Glu Ile
195 200 205
Val Val Gly Asp Ile Ala Gln Val Lys Tyr Gly Asp Leu Leu Pro Ala
210 215 220
Asp Gly Leu Phe Ile Gln Gly Asn Asp Leu Lys Ile Asp Glu Ser Ser
225 230 235 240
Leu Thr Gly Glu Ser Asp Gln Val Arg Lys Ser Val Asp Lys Asp Pro
245 250 255
Met Leu Leu Ser Gly Thr His Val Met Glu Gly Ser Gly Arg Met Leu
260 265 270
Val Thr Ala Val Gly Val Asn Ser Gln Thr Gly Ile Ile Phe Thr Leu
275 280 285
Leu Gly Ala Gly Gly Glu Glu Glu Glu Lys Lys Asp Lys Lys Gly Val
290 295 300
Lys Lys Gly Asp Gly Leu Gln Leu Pro Ala Ala Asp Gly Ala Ala Ala
305 310 315 320
Ser Asn Ala Ala Asp Ser Ala Asn Ala Ser Leu Val Asn Gly Lys Met
325 330 335
Gln Asp Gly Asn Val Asp Ala Ser Gln Ser Lys Ala Lys Gln Gln Asp
340 345 350
Gly Ala Ala Ala Met Glu Met Gln Pro Leu Lys Ser Ala Glu Gly Gly
355 360 365
Asp Ala Asp Asp Arg Lys Lys Ala Ser Met His Lys Lys Glu Lys Ser
370 375 380
Val Leu Gln Gly Lys Leu Thr Lys Leu Ala Val Gln Ile Gly Lys Ala
385 390 395 400
Gly Leu Val Met Ser Ala Ile Thr Val Ile Ile Leu Val Leu Tyr Phe
405 410 415
Thr Val Asp Thr Phe Val Val Asn Lys Lys Pro Trp Leu Pro Glu Cys
420 425 430
Thr Pro Val Tyr Val Gln Tyr Phe Val Lys Phe Phe Ile Ile Gly Val
435 440 445
Thr Val Leu Val Val Ala Val Pro Glu Gly Leu Pro Leu Ala Val Thr
450 455 460
Ile Ser Leu Ala Tyr Ser Val Lys Lys Met Met Lys Asp Asn Asn Leu
465 470 475 480
Val Arg His Leu Asp Ala Cys Glu Thr Met Gly Asn Ala Thr Ala Ile
485 490 495
Cys Ser Asp Lys Thr Gly Thr Leu Thr Thr Asn Arg Met Thr Val Val
500 505 510
Gln Ala Tyr Val Gly Asp Val His Tyr Lys Glu Ile Pro Asp Pro Ser
515 520 525
Ser Ile Asn Thr Lys Thr Met Glu Leu Leu Ile Asn Ala Ile Ala Ile
530 535 540
Asn Ser Ala Tyr Thr Thr Lys Ile Leu Pro Pro Glu Lys Glu Gly Ala
545 550 555 560
Leu Pro Arg Gln Val Gly Asn Lys Thr Glu Cys Gly Leu Leu Gly Phe
565 570 575
Val Leu Asp Leu Lys Gln Asp Tyr Glu Pro Val Arg Ser Gln Met Pro
580 585 590
Glu Glu Lys Leu Tyr Lys Val Tyr Thr Phe Asn Ser Val Arg Lys Ser
595 600 605
Met Ser Thr Val Ile Lys Leu Pro Asp Glu Ser Phe Arg Met Tyr Ser
610 615 620
Lys Gly Ala Ser Glu Ile Val Leu Lys Lys Cys Cys Lys Ile Leu Asn
625 630 635 640
Gly Ala Gly Glu Pro Arg Val Phe Arg Pro Arg Asp Arg Asp Glu Met
645 650 655
Val Lys Lys Val Ile Glu Pro Met Ala Cys Asp Gly Leu Arg Thr Ile
660 665 670
Cys Val Ala Tyr Arg Asp Phe Pro Ser Ser Pro Glu Pro Asp Trp Asp
675 680 685
Asn Glu Asn Asp Ile Leu Asn Glu Leu Thr Cys Ile Cys Val Val Gly
690 695 700
Ile Glu Asp Pro Val Arg Pro Glu Val Pro Glu Ala Ile Arg Lys Cys
705 710 715 720
Gln Arg Ala Gly Ile Thr Val Arg Met Val Thr Gly Asp Asn Ile Asn
725 730 735
Thr Ala Arg Ala Ile Ala Ile Lys Cys Gly Ile Ile His Pro Gly Glu
740 745 750
Asp Phe Leu Cys Leu Glu Gly Lys Glu Phe Asn Arg Arg Ile Arg Asn
755 760 765
Glu Lys Gly Glu Ile Glu Gln Glu Arg Ile Asp Lys Ile Trp Pro Lys
770 775 780
Leu Arg Val Leu Ala Arg Ser Ser Pro Thr Asp Lys His Thr Leu Val
785 790 795 800
Lys Gly Ile Ile Asp Ser Thr His Thr Glu Gln Arg Gln Val Val Ala
805 810 815
Val Thr Gly Asp Gly Thr Asn Asp Gly Pro Ala Leu Lys Lys Ala Asp
820 825 830
Val Gly Phe Ala Met Gly Ile Ala Gly Thr Asp Val Ala Lys Glu Ala
835 840 845
Ser Asp Ile Ile Leu Thr Asp Asp Asn Phe Ser Ser Ile Val Lys Ala
850 855 860
Val Met Trp Gly Arg Asn Val Tyr Asp Ser Ile Ser Lys Phe Leu Gln
865 870 875 880
Phe Gln Leu Thr Val Asn Val Val Ala Val Ile Val Ala Phe Thr Gly
885 890 895
Ala Cys Ile Thr Gln Asp Ser Pro Leu Lys Ala Val Gln Met Leu Trp
900 905 910
Val Asn Leu Ile Met Asp Thr Phe Ala Ser Leu Ala Leu Ala Thr Glu
915 920 925
Pro Pro Thr Glu Thr Leu Leu Leu Arg Lys Pro Tyr Gly Arg Asn Lys
930 935 940
Pro Leu Ile Ser Arg Thr Met Met Lys Asn Ile Leu Gly His Ala Val
945 950 955 960
Tyr Gln Leu Ala Leu Ile Phe Thr Leu Leu Phe Val Gly Glu Lys Met
965 970 975
Phe Gln Ile Asp Ser Gly Arg Asn Ala Pro Leu His Ser Pro Pro Ser
980 985 990
Glu His Tyr Thr Ile Ile Phe Asn Thr Phe Val Met Met Gln Leu Phe
995 1000 1005
Asn Glu Ile Asn Ala Arg Lys Ile His Gly Glu Arg Asn Val Phe
1010 1015 1020
Asp Gly Ile Phe Arg Asn Pro Ile Phe Cys Thr Ile Val Leu Gly
1025 1030 1035
Thr Phe Ala Ile Gln Ile Val Ile Val Gln Phe Gly Gly Lys Pro
1040 1045 1050
Phe Ser Cys Ser Pro Leu Gln Leu Asp Gln Trp Met Trp Cys Ile
1055 1060 1065
Phe Ile Gly Leu Gly Glu Leu Val Trp Gly Gln Val Ile Ala Thr
1070 1075 1080
Ile Pro Thr Ser Arg Leu Lys Phe Leu Lys Glu Ala Gly Arg Leu
1085 1090 1095
Thr Gln Lys Glu Glu Ile Pro Glu Glu Glu Leu Asn Glu Asp Val
1100 1105 1110
Glu Glu Ile Asp His Ala Glu Arg Glu Leu Arg Arg Gly Gln Ile
1115 1120 1125
Leu Trp Phe Arg Gly Leu Asn Arg Ile Gln Thr Gln Ile Glu Val
1130 1135 1140
Val Asn Thr Phe Lys Ser Gly Ala Ser Phe Gln Gly Ala Leu Arg
1145 1150 1155
Arg Gln Ser Ser Val Thr Ser Gln Ser Gln Asp Ile Arg Val Val
1160 1165 1170
Lys Ala Phe Arg Ser Ser Leu Tyr Glu Gly Leu Glu Lys Pro Glu
1175 1180 1185
Ser Arg Thr Ser Ile His Asn Phe Met Ala His Pro Glu Phe Arg
1190 1195 1200
Ile Glu Asp Ser Gln Pro His Ile Pro Leu Ile Asp Asp Thr Asp
1205 1210 1215
Leu Glu Glu Asp Ala Ala Leu Lys Gln Asn Ser Ser Pro Pro Ser
1220 1225 1230
Ser Leu Asn Lys Asn Asn Ser Ala Ile Asp Ser Gly Ile Asn Leu
1235 1240 1245
Thr Thr Asp Thr Ser Lys Ser Ala Thr Ser Ser Ser Pro Gly Ser
1250 1255 1260
Pro Ile His Ser Leu Glu Thr Ser Leu
1265 1270
<210> 318
<211> 874
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> ATP2B4
<400> 318
Met Gly Asp Met Ala Asn Ser Ser Ile Glu Phe His Pro Lys Pro Gln
1 5 10 15
Gln Gln Arg Asp Val Pro Gln Ala Gly Gly Phe Gly Cys Thr Leu Ala
20 25 30
Glu Leu Arg Thr Leu Met Glu Leu Arg Gly Ala Glu Ala Leu Gln Lys
35 40 45
Ile Glu Glu Ala Tyr Gly Asp Val Ser Gly Leu Cys Arg Arg Leu Lys
50 55 60
Thr Ser Pro Thr Glu Gly Leu Ala Asp Asn Thr Asn Asp Leu Glu Lys
65 70 75 80
Arg Arg Gln Ile Tyr Gly Gln Asn Phe Ile Pro Pro Lys Gln Pro Lys
85 90 95
Thr Phe Leu Gln Leu Val Trp Glu Ala Leu Gln Asp Val Thr Leu Ile
100 105 110
Ile Leu Glu Val Ala Ala Ile Val Ser Leu Gly Leu Ser Phe Tyr Ala
115 120 125
Pro Pro Gly Glu Glu Ser Glu Ala Cys Gly Asn Val Ser Gly Gly Ala
130 135 140
Glu Asp Glu Gly Glu Ala Glu Ala Gly Trp Ile Glu Gly Ala Ala Ile
145 150 155 160
Leu Leu Ser Val Ile Cys Val Val Leu Val Thr Ala Phe Asn Asp Trp
165 170 175
Ser Lys Glu Lys Gln Phe Arg Gly Leu Gln Ser Arg Ile Glu Gln Glu
180 185 190
Gln Lys Phe Thr Val Ile Arg Asn Gly Gln Leu Leu Gln Val Pro Val
195 200 205
Ala Ala Leu Val Val Gly Asp Ile Ala Gln Val Lys Tyr Gly Asp Leu
210 215 220
Leu Pro Ala Asp Gly Val Leu Ile Gln Ala Asn Asp Leu Lys Ile Asp
225 230 235 240
Glu Ser Ser Leu Thr Gly Glu Ser Asp His Val Arg Lys Ser Ala Asp
245 250 255
Lys Asp Pro Met Leu Leu Ser Gly Thr His Val Met Glu Gly Ser Gly
260 265 270
Arg Met Val Val Thr Ala Val Gly Val Asn Ser Gln Thr Gly Ile Ile
275 280 285
Phe Thr Leu Leu Gly Ala Gly Gly Glu Glu Glu Glu Lys Lys Asp Lys
290 295 300
Lys Gly Lys Gln Gln Asp Gly Ala Met Glu Ser Ser Gln Thr Lys Ala
305 310 315 320
Lys Lys Gln Asp Gly Ala Val Ala Met Glu Met Gln Pro Leu Lys Ser
325 330 335
Ala Glu Gly Gly Glu Met Glu Glu Arg Glu Lys Lys Lys Ala Asn Ala
340 345 350
Pro Lys Lys Glu Lys Ser Val Leu Gln Gly Lys Leu Thr Lys Leu Ala
355 360 365
Val Gln Ile Gly Lys Ala Gly Leu Val Met Ser Ala Ile Thr Val Ile
370 375 380
Ile Leu Val Leu Tyr Phe Val Ile Glu Thr Phe Val Val Glu Gly Arg
385 390 395 400
Thr Trp Leu Ala Glu Cys Thr Pro Val Tyr Val Gln Tyr Phe Val Lys
405 410 415
Phe Phe Ile Ile Gly Val Thr Val Leu Val Val Ala Val Pro Glu Gly
420 425 430
Leu Pro Leu Ala Val Thr Ile Ser Leu Ala Tyr Ser Val Lys Lys Met
435 440 445
Met Lys Asp Asn Asn Leu Val Arg His Leu Asp Ala Cys Glu Thr Met
450 455 460
Gly Asn Ala Thr Ala Ile Cys Ser Asp Lys Thr Gly Thr Leu Thr Thr
465 470 475 480
Asn Arg Met Thr Val Val Gln Ser Tyr Leu Gly Asp Thr His Tyr Lys
485 490 495
Glu Ile Pro Ala Pro Ser Ala Leu Thr Pro Lys Ile Leu Asp Leu Leu
500 505 510
Val His Ala Ile Ser Ile Asn Ser Ala Tyr Thr Thr Lys Ile Leu Pro
515 520 525
Pro Glu Lys Glu Gly Ala Leu Pro Arg Gln Val Gly Asn Lys Thr Glu
530 535 540
Cys Ala Leu Leu Gly Phe Val Leu Asp Leu Lys Arg Asp Phe Gln Pro
545 550 555 560
Val Arg Glu Gln Ile Pro Glu Asp Lys Leu Tyr Lys Val Tyr Thr Phe
565 570 575
Asn Ser Val Arg Lys Ser Met Ser Thr Val Ile Arg Met Pro Asp Gly
580 585 590
Gly Phe Arg Leu Phe Ser Lys Gly Ala Ser Glu Ile Leu Leu Lys Lys
595 600 605
Cys Thr Asn Ile Leu Asn Ser Asn Gly Glu Leu Arg Gly Phe Arg Pro
610 615 620
Arg Asp Arg Asp Asp Met Val Arg Lys Ile Ile Glu Pro Met Ala Cys
625 630 635 640
Asp Gly Leu Arg Thr Ile Cys Ile Ala Tyr Arg Asp Phe Ser Ala Gly
645 650 655
Gln Glu Pro Asp Trp Asp Asn Glu Asn Glu Val Val Gly Asp Leu Thr
660 665 670
Cys Ile Ala Val Val Gly Ile Glu Asp Pro Val Arg Pro Glu Val Pro
675 680 685
Glu Ala Ile Arg Lys Cys Gln Arg Ala Gly Ile Thr Val Arg Met Val
690 695 700
Thr Gly Asp Asn Ile Asn Thr Ala Arg Ala Ile Ala Ala Lys Cys Gly
705 710 715 720
Ile Ile Gln Pro Gly Glu Asp Phe Leu Cys Leu Glu Gly Lys Glu Phe
725 730 735
Asn Arg Arg Ile Arg Asn Glu Lys Gly Glu Ile Glu Gln Glu Arg Leu
740 745 750
Asp Lys Val Trp Pro Lys Leu Arg Val Leu Ala Arg Ser Ser Pro Thr
755 760 765
Asp Lys His Thr Leu Val Lys Gly Ile Ile Asp Ser Thr Thr Gly Glu
770 775 780
Gln Arg Gln Val Val Ala Val Thr Gly Asp Gly Thr Asn Asp Gly Pro
785 790 795 800
Ala Leu Lys Lys Ala Asp Val Gly Phe Ala Met Gly Ile Ala Gly Thr
805 810 815
Asp Val Ala Lys Glu Ala Ser Asp Ile Ile Leu Thr Asp Asp Asn Phe
820 825 830
Thr Ser Ile Val Lys Ala Val Met Trp Gly Arg Asn Val Tyr Asp Ser
835 840 845
Ile Ser Lys Phe Leu Gln Phe Gln Leu Thr Val Asn Val Val Ala Val
850 855 860
Ile Val Ala Phe Thr Gly Ala Cys Ile Thr
865 870
<210> 319
<211> 731
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> PTGFRN蛋白片段#1
<400> 319
Pro Ser Ala Arg Pro Pro Pro Ser Leu Ser Leu Arg Glu Gly Glu Pro
1 5 10 15
Phe Glu Leu Arg Cys Thr Ala Ala Ser Ala Ser Pro Leu His Thr His
20 25 30
Leu Ala Leu Leu Trp Glu Val His Arg Gly Pro Ala Arg Arg Ser Val
35 40 45
Leu Ala Leu Thr His Glu Gly Arg Phe His Pro Gly Leu Gly Tyr Glu
50 55 60
Gln Arg Tyr His Ser Gly Asp Val Arg Leu Asp Thr Val Gly Ser Asp
65 70 75 80
Ala Tyr Arg Leu Ser Val Ser Arg Ala Leu Ser Ala Asp Gln Gly Ser
85 90 95
Tyr Arg Cys Ile Val Ser Glu Trp Ile Ala Glu Gln Gly Asn Trp Gln
100 105 110
Glu Ile Gln Glu Lys Ala Val Glu Val Ala Thr Val Val Ile Gln Pro
115 120 125
Ser Val Leu Arg Ala Ala Val Pro Lys Asn Val Ser Val Ala Glu Gly
130 135 140
Lys Glu Leu Asp Leu Thr Cys Asn Ile Thr Thr Asp Arg Ala Asp Asp
145 150 155 160
Val Arg Pro Glu Val Thr Trp Ser Phe Ser Arg Met Pro Asp Ser Thr
165 170 175
Leu Pro Gly Ser Arg Val Leu Ala Arg Leu Asp Arg Asp Ser Leu Val
180 185 190
His Ser Ser Pro His Val Ala Leu Ser His Val Asp Ala Arg Ser Tyr
195 200 205
His Leu Leu Val Arg Asp Val Ser Lys Glu Asn Ser Gly Tyr Tyr Tyr
210 215 220
Cys His Val Ser Leu Trp Ala Pro Gly His Asn Arg Ser Trp His Lys
225 230 235 240
Val Ala Glu Ala Val Ser Ser Pro Ala Gly Val Gly Val Thr Trp Leu
245 250 255
Glu Pro Asp Tyr Gln Val Tyr Leu Asn Ala Ser Lys Val Pro Gly Phe
260 265 270
Ala Asp Asp Pro Thr Glu Leu Ala Cys Arg Val Val Asp Thr Lys Ser
275 280 285
Gly Glu Ala Asn Val Arg Phe Thr Val Ser Trp Tyr Tyr Arg Met Asn
290 295 300
Arg Arg Ser Asp Asn Val Val Thr Ser Glu Leu Leu Ala Val Met Asp
305 310 315 320
Gly Asp Trp Thr Leu Lys Tyr Gly Glu Arg Ser Lys Gln Arg Ala Gln
325 330 335
Asp Gly Asp Phe Ile Phe Ser Lys Glu His Thr Asp Thr Phe Asn Phe
340 345 350
Arg Ile Gln Arg Thr Thr Glu Glu Asp Arg Gly Asn Tyr Tyr Cys Val
355 360 365
Val Ser Ala Trp Thr Lys Gln Arg Asn Asn Ser Trp Val Lys Ser Lys
370 375 380
Asp Val Phe Ser Lys Pro Val Asn Ile Phe Trp Ala Leu Glu Asp Ser
385 390 395 400
Val Leu Val Val Lys Ala Arg Gln Pro Lys Pro Phe Phe Ala Ala Gly
405 410 415
Asn Thr Phe Glu Met Thr Cys Lys Val Ser Ser Lys Asn Ile Lys Ser
420 425 430
Pro Arg Tyr Ser Val Leu Ile Met Ala Glu Lys Pro Val Gly Asp Leu
435 440 445
Ser Ser Pro Asn Glu Thr Lys Tyr Ile Ile Ser Leu Asp Gln Asp Ser
450 455 460
Val Val Lys Leu Glu Asn Trp Thr Asp Ala Ser Arg Val Asp Gly Val
465 470 475 480
Val Leu Glu Lys Val Gln Glu Asp Glu Phe Arg Tyr Arg Met Tyr Gln
485 490 495
Thr Gln Val Ser Asp Ala Gly Leu Tyr Arg Cys Met Val Thr Ala Trp
500 505 510
Ser Pro Val Arg Gly Ser Leu Trp Arg Glu Ala Ala Thr Ser Leu Ser
515 520 525
Asn Pro Ile Glu Ile Asp Phe Gln Thr Ser Gly Pro Ile Phe Asn Ala
530 535 540
Ser Val His Ser Asp Thr Pro Ser Val Ile Arg Gly Asp Leu Ile Lys
545 550 555 560
Leu Phe Cys Ile Ile Thr Val Glu Gly Ala Ala Leu Asp Pro Asp Asp
565 570 575
Met Ala Phe Asp Val Ser Trp Phe Ala Val His Ser Phe Gly Leu Asp
580 585 590
Lys Ala Pro Val Leu Leu Ser Ser Leu Asp Arg Lys Gly Ile Val Thr
595 600 605
Thr Ser Arg Arg Asp Trp Lys Ser Asp Leu Ser Leu Glu Arg Val Ser
610 615 620
Val Leu Glu Phe Leu Leu Gln Val His Gly Ser Glu Asp Gln Asp Phe
625 630 635 640
Gly Asn Tyr Tyr Cys Ser Val Thr Pro Trp Val Lys Ser Pro Thr Gly
645 650 655
Ser Trp Gln Lys Glu Ala Glu Ile His Ser Lys Pro Val Phe Ile Thr
660 665 670
Val Lys Met Asp Val Leu Asn Ala Phe Lys Tyr Pro Leu Leu Ile Gly
675 680 685
Val Gly Leu Ser Thr Val Ile Gly Leu Leu Ser Cys Leu Ile Gly Tyr
690 695 700
Cys Ser Ser His Trp Cys Cys Lys Lys Glu Val Gln Glu Thr Arg Arg
705 710 715 720
Glu Arg Arg Arg Leu Met Ser Met Glu Met Asp
725 730
<210> 320
<211> 611
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> PTGFRN蛋白片段#2
<400> 320
Val Ala Thr Val Val Ile Gln Pro Ser Val Leu Arg Ala Ala Val Pro
1 5 10 15
Lys Asn Val Ser Val Ala Glu Gly Lys Glu Leu Asp Leu Thr Cys Asn
20 25 30
Ile Thr Thr Asp Arg Ala Asp Asp Val Arg Pro Glu Val Thr Trp Ser
35 40 45
Phe Ser Arg Met Pro Asp Ser Thr Leu Pro Gly Ser Arg Val Leu Ala
50 55 60
Arg Leu Asp Arg Asp Ser Leu Val His Ser Ser Pro His Val Ala Leu
65 70 75 80
Ser His Val Asp Ala Arg Ser Tyr His Leu Leu Val Arg Asp Val Ser
85 90 95
Lys Glu Asn Ser Gly Tyr Tyr Tyr Cys His Val Ser Leu Trp Ala Pro
100 105 110
Gly His Asn Arg Ser Trp His Lys Val Ala Glu Ala Val Ser Ser Pro
115 120 125
Ala Gly Val Gly Val Thr Trp Leu Glu Pro Asp Tyr Gln Val Tyr Leu
130 135 140
Asn Ala Ser Lys Val Pro Gly Phe Ala Asp Asp Pro Thr Glu Leu Ala
145 150 155 160
Cys Arg Val Val Asp Thr Lys Ser Gly Glu Ala Asn Val Arg Phe Thr
165 170 175
Val Ser Trp Tyr Tyr Arg Met Asn Arg Arg Ser Asp Asn Val Val Thr
180 185 190
Ser Glu Leu Leu Ala Val Met Asp Gly Asp Trp Thr Leu Lys Tyr Gly
195 200 205
Glu Arg Ser Lys Gln Arg Ala Gln Asp Gly Asp Phe Ile Phe Ser Lys
210 215 220
Glu His Thr Asp Thr Phe Asn Phe Arg Ile Gln Arg Thr Thr Glu Glu
225 230 235 240
Asp Arg Gly Asn Tyr Tyr Cys Val Val Ser Ala Trp Thr Lys Gln Arg
245 250 255
Asn Asn Ser Trp Val Lys Ser Lys Asp Val Phe Ser Lys Pro Val Asn
260 265 270
Ile Phe Trp Ala Leu Glu Asp Ser Val Leu Val Val Lys Ala Arg Gln
275 280 285
Pro Lys Pro Phe Phe Ala Ala Gly Asn Thr Phe Glu Met Thr Cys Lys
290 295 300
Val Ser Ser Lys Asn Ile Lys Ser Pro Arg Tyr Ser Val Leu Ile Met
305 310 315 320
Ala Glu Lys Pro Val Gly Asp Leu Ser Ser Pro Asn Glu Thr Lys Tyr
325 330 335
Ile Ile Ser Leu Asp Gln Asp Ser Val Val Lys Leu Glu Asn Trp Thr
340 345 350
Asp Ala Ser Arg Val Asp Gly Val Val Leu Glu Lys Val Gln Glu Asp
355 360 365
Glu Phe Arg Tyr Arg Met Tyr Gln Thr Gln Val Ser Asp Ala Gly Leu
370 375 380
Tyr Arg Cys Met Val Thr Ala Trp Ser Pro Val Arg Gly Ser Leu Trp
385 390 395 400
Arg Glu Ala Ala Thr Ser Leu Ser Asn Pro Ile Glu Ile Asp Phe Gln
405 410 415
Thr Ser Gly Pro Ile Phe Asn Ala Ser Val His Ser Asp Thr Pro Ser
420 425 430
Val Ile Arg Gly Asp Leu Ile Lys Leu Phe Cys Ile Ile Thr Val Glu
435 440 445
Gly Ala Ala Leu Asp Pro Asp Asp Met Ala Phe Asp Val Ser Trp Phe
450 455 460
Ala Val His Ser Phe Gly Leu Asp Lys Ala Pro Val Leu Leu Ser Ser
465 470 475 480
Leu Asp Arg Lys Gly Ile Val Thr Thr Ser Arg Arg Asp Trp Lys Ser
485 490 495
Asp Leu Ser Leu Glu Arg Val Ser Val Leu Glu Phe Leu Leu Gln Val
500 505 510
His Gly Ser Glu Asp Gln Asp Phe Gly Asn Tyr Tyr Cys Ser Val Thr
515 520 525
Pro Trp Val Lys Ser Pro Thr Gly Ser Trp Gln Lys Glu Ala Glu Ile
530 535 540
His Ser Lys Pro Val Phe Ile Thr Val Lys Met Asp Val Leu Asn Ala
545 550 555 560
Phe Lys Tyr Pro Leu Leu Ile Gly Val Gly Leu Ser Thr Val Ile Gly
565 570 575
Leu Leu Ser Cys Leu Ile Gly Tyr Cys Ser Ser His Trp Cys Cys Lys
580 585 590
Lys Glu Val Gln Glu Thr Arg Arg Glu Arg Arg Arg Leu Met Ser Met
595 600 605
Glu Met Asp
610
<210> 321
<211> 485
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> PTGFRN蛋白片段#3
<400> 321
Ser Pro Ala Gly Val Gly Val Thr Trp Leu Glu Pro Asp Tyr Gln Val
1 5 10 15
Tyr Leu Asn Ala Ser Lys Val Pro Gly Phe Ala Asp Asp Pro Thr Glu
20 25 30
Leu Ala Cys Arg Val Val Asp Thr Lys Ser Gly Glu Ala Asn Val Arg
35 40 45
Phe Thr Val Ser Trp Tyr Tyr Arg Met Asn Arg Arg Ser Asp Asn Val
50 55 60
Val Thr Ser Glu Leu Leu Ala Val Met Asp Gly Asp Trp Thr Leu Lys
65 70 75 80
Tyr Gly Glu Arg Ser Lys Gln Arg Ala Gln Asp Gly Asp Phe Ile Phe
85 90 95
Ser Lys Glu His Thr Asp Thr Phe Asn Phe Arg Ile Gln Arg Thr Thr
100 105 110
Glu Glu Asp Arg Gly Asn Tyr Tyr Cys Val Val Ser Ala Trp Thr Lys
115 120 125
Gln Arg Asn Asn Ser Trp Val Lys Ser Lys Asp Val Phe Ser Lys Pro
130 135 140
Val Asn Ile Phe Trp Ala Leu Glu Asp Ser Val Leu Val Val Lys Ala
145 150 155 160
Arg Gln Pro Lys Pro Phe Phe Ala Ala Gly Asn Thr Phe Glu Met Thr
165 170 175
Cys Lys Val Ser Ser Lys Asn Ile Lys Ser Pro Arg Tyr Ser Val Leu
180 185 190
Ile Met Ala Glu Lys Pro Val Gly Asp Leu Ser Ser Pro Asn Glu Thr
195 200 205
Lys Tyr Ile Ile Ser Leu Asp Gln Asp Ser Val Val Lys Leu Glu Asn
210 215 220
Trp Thr Asp Ala Ser Arg Val Asp Gly Val Val Leu Glu Lys Val Gln
225 230 235 240
Glu Asp Glu Phe Arg Tyr Arg Met Tyr Gln Thr Gln Val Ser Asp Ala
245 250 255
Gly Leu Tyr Arg Cys Met Val Thr Ala Trp Ser Pro Val Arg Gly Ser
260 265 270
Leu Trp Arg Glu Ala Ala Thr Ser Leu Ser Asn Pro Ile Glu Ile Asp
275 280 285
Phe Gln Thr Ser Gly Pro Ile Phe Asn Ala Ser Val His Ser Asp Thr
290 295 300
Pro Ser Val Ile Arg Gly Asp Leu Ile Lys Leu Phe Cys Ile Ile Thr
305 310 315 320
Val Glu Gly Ala Ala Leu Asp Pro Asp Asp Met Ala Phe Asp Val Ser
325 330 335
Trp Phe Ala Val His Ser Phe Gly Leu Asp Lys Ala Pro Val Leu Leu
340 345 350
Ser Ser Leu Asp Arg Lys Gly Ile Val Thr Thr Ser Arg Arg Asp Trp
355 360 365
Lys Ser Asp Leu Ser Leu Glu Arg Val Ser Val Leu Glu Phe Leu Leu
370 375 380
Gln Val His Gly Ser Glu Asp Gln Asp Phe Gly Asn Tyr Tyr Cys Ser
385 390 395 400
Val Thr Pro Trp Val Lys Ser Pro Thr Gly Ser Trp Gln Lys Glu Ala
405 410 415
Glu Ile His Ser Lys Pro Val Phe Ile Thr Val Lys Met Asp Val Leu
420 425 430
Asn Ala Phe Lys Tyr Pro Leu Leu Ile Gly Val Gly Leu Ser Thr Val
435 440 445
Ile Gly Leu Leu Ser Cys Leu Ile Gly Tyr Cys Ser Ser His Trp Cys
450 455 460
Cys Lys Lys Glu Val Gln Glu Thr Arg Arg Glu Arg Arg Arg Leu Met
465 470 475 480
Ser Met Glu Met Asp
485
<210> 322
<211> 343
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> PTGFRN蛋白片段#4
<400> 322
Lys Pro Val Asn Ile Phe Trp Ala Leu Glu Asp Ser Val Leu Val Val
1 5 10 15
Lys Ala Arg Gln Pro Lys Pro Phe Phe Ala Ala Gly Asn Thr Phe Glu
20 25 30
Met Thr Cys Lys Val Ser Ser Lys Asn Ile Lys Ser Pro Arg Tyr Ser
35 40 45
Val Leu Ile Met Ala Glu Lys Pro Val Gly Asp Leu Ser Ser Pro Asn
50 55 60
Glu Thr Lys Tyr Ile Ile Ser Leu Asp Gln Asp Ser Val Val Lys Leu
65 70 75 80
Glu Asn Trp Thr Asp Ala Ser Arg Val Asp Gly Val Val Leu Glu Lys
85 90 95
Val Gln Glu Asp Glu Phe Arg Tyr Arg Met Tyr Gln Thr Gln Val Ser
100 105 110
Asp Ala Gly Leu Tyr Arg Cys Met Val Thr Ala Trp Ser Pro Val Arg
115 120 125
Gly Ser Leu Trp Arg Glu Ala Ala Thr Ser Leu Ser Asn Pro Ile Glu
130 135 140
Ile Asp Phe Gln Thr Ser Gly Pro Ile Phe Asn Ala Ser Val His Ser
145 150 155 160
Asp Thr Pro Ser Val Ile Arg Gly Asp Leu Ile Lys Leu Phe Cys Ile
165 170 175
Ile Thr Val Glu Gly Ala Ala Leu Asp Pro Asp Asp Met Ala Phe Asp
180 185 190
Val Ser Trp Phe Ala Val His Ser Phe Gly Leu Asp Lys Ala Pro Val
195 200 205
Leu Leu Ser Ser Leu Asp Arg Lys Gly Ile Val Thr Thr Ser Arg Arg
210 215 220
Asp Trp Lys Ser Asp Leu Ser Leu Glu Arg Val Ser Val Leu Glu Phe
225 230 235 240
Leu Leu Gln Val His Gly Ser Glu Asp Gln Asp Phe Gly Asn Tyr Tyr
245 250 255
Cys Ser Val Thr Pro Trp Val Lys Ser Pro Thr Gly Ser Trp Gln Lys
260 265 270
Glu Ala Glu Ile His Ser Lys Pro Val Phe Ile Thr Val Lys Met Asp
275 280 285
Val Leu Asn Ala Phe Lys Tyr Pro Leu Leu Ile Gly Val Gly Leu Ser
290 295 300
Thr Val Ile Gly Leu Leu Ser Cys Leu Ile Gly Tyr Cys Ser Ser His
305 310 315 320
Trp Cys Cys Lys Lys Glu Val Gln Glu Thr Arg Arg Glu Arg Arg Arg
325 330 335
Leu Met Ser Met Glu Met Asp
340
<210> 323
<211> 217
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> PTGFRN蛋白片段#5
<400> 323
Val Arg Gly Ser Leu Trp Arg Glu Ala Ala Thr Ser Leu Ser Asn Pro
1 5 10 15
Ile Glu Ile Asp Phe Gln Thr Ser Gly Pro Ile Phe Asn Ala Ser Val
20 25 30
His Ser Asp Thr Pro Ser Val Ile Arg Gly Asp Leu Ile Lys Leu Phe
35 40 45
Cys Ile Ile Thr Val Glu Gly Ala Ala Leu Asp Pro Asp Asp Met Ala
50 55 60
Phe Asp Val Ser Trp Phe Ala Val His Ser Phe Gly Leu Asp Lys Ala
65 70 75 80
Pro Val Leu Leu Ser Ser Leu Asp Arg Lys Gly Ile Val Thr Thr Ser
85 90 95
Arg Arg Asp Trp Lys Ser Asp Leu Ser Leu Glu Arg Val Ser Val Leu
100 105 110
Glu Phe Leu Leu Gln Val His Gly Ser Glu Asp Gln Asp Phe Gly Asn
115 120 125
Tyr Tyr Cys Ser Val Thr Pro Trp Val Lys Ser Pro Thr Gly Ser Trp
130 135 140
Gln Lys Glu Ala Glu Ile His Ser Lys Pro Val Phe Ile Thr Val Lys
145 150 155 160
Met Asp Val Leu Asn Ala Phe Lys Tyr Pro Leu Leu Ile Gly Val Gly
165 170 175
Leu Ser Thr Val Ile Gly Leu Leu Ser Cys Leu Ile Gly Tyr Cys Ser
180 185 190
Ser His Trp Cys Cys Lys Lys Glu Val Gln Glu Thr Arg Arg Glu Arg
195 200 205
Arg Arg Leu Met Ser Met Glu Met Asp
210 215
<210> 324
<211> 66
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> PTGFRN蛋白片段#6
<400> 324
Ser Lys Pro Val Phe Ile Thr Val Lys Met Asp Val Leu Asn Ala Phe
1 5 10 15
Lys Tyr Pro Leu Leu Ile Gly Val Gly Leu Ser Thr Val Ile Gly Leu
20 25 30
Leu Ser Cys Leu Ile Gly Tyr Cys Ser Ser His Trp Cys Cys Lys Lys
35 40 45
Glu Val Gln Glu Thr Arg Arg Glu Arg Arg Arg Leu Met Ser Met Glu
50 55 60
Met Asp
65
<210> 325
<211> 21
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> PTGFRN蛋白-信号肽
<400> 325
Met Gly Arg Leu Ala Ser Arg Pro Leu Leu Leu Ala Leu Leu Ser Leu
1 5 10 15
Ala Leu Cys Arg Gly
20
<210> 326
<211> 247
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> BSG蛋白片段#1
<400> 326
Pro Gly Thr Val Phe Thr Thr Val Glu Asp Leu Gly Ser Lys Ile Leu
1 5 10 15
Leu Thr Cys Ser Leu Asn Asp Ser Ala Thr Glu Val Thr Gly His Arg
20 25 30
Trp Leu Lys Gly Gly Val Val Leu Lys Glu Asp Ala Leu Pro Gly Gln
35 40 45
Lys Thr Glu Phe Lys Val Asp Ser Asp Asp Gln Trp Gly Glu Tyr Ser
50 55 60
Cys Val Phe Leu Pro Glu Pro Met Gly Thr Ala Asn Ile Gln Leu His
65 70 75 80
Gly Pro Pro Arg Val Lys Ala Val Lys Ser Ser Glu His Ile Asn Glu
85 90 95
Gly Glu Thr Ala Met Leu Val Cys Lys Ser Glu Ser Val Pro Pro Val
100 105 110
Thr Asp Trp Ala Trp Tyr Lys Ile Thr Asp Ser Glu Asp Lys Ala Leu
115 120 125
Met Asn Gly Ser Glu Ser Arg Phe Phe Val Ser Ser Ser Gln Gly Arg
130 135 140
Ser Glu Leu His Ile Glu Asn Leu Asn Met Glu Ala Asp Pro Gly Gln
145 150 155 160
Tyr Arg Cys Asn Gly Thr Ser Ser Lys Gly Ser Asp Gln Ala Ile Ile
165 170 175
Thr Leu Arg Val Arg Ser His Leu Ala Ala Leu Trp Pro Phe Leu Gly
180 185 190
Ile Val Ala Glu Val Leu Val Leu Val Thr Ile Ile Phe Ile Tyr Glu
195 200 205
Lys Arg Arg Lys Pro Glu Asp Val Leu Asp Asp Asp Asp Ala Gly Ser
210 215 220
Ala Pro Leu Lys Ser Ser Gly Gln His Gln Asn Asp Lys Gly Lys Asn
225 230 235 240
Val Arg Gln Arg Asn Ser Ser
245
<210> 327
<211> 168
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> BSG蛋白片段#2
<400> 327
His Gly Pro Pro Arg Val Lys Ala Val Lys Ser Ser Glu His Ile Asn
1 5 10 15
Glu Gly Glu Thr Ala Met Leu Val Cys Lys Ser Glu Ser Val Pro Pro
20 25 30
Val Thr Asp Trp Ala Trp Tyr Lys Ile Thr Asp Ser Glu Asp Lys Ala
35 40 45
Leu Met Asn Gly Ser Glu Ser Arg Phe Phe Val Ser Ser Ser Gln Gly
50 55 60
Arg Ser Glu Leu His Ile Glu Asn Leu Asn Met Glu Ala Asp Pro Gly
65 70 75 80
Gln Tyr Arg Cys Asn Gly Thr Ser Ser Lys Gly Ser Asp Gln Ala Ile
85 90 95
Ile Thr Leu Arg Val Arg Ser His Leu Ala Ala Leu Trp Pro Phe Leu
100 105 110
Gly Ile Val Ala Glu Val Leu Val Leu Val Thr Ile Ile Phe Ile Tyr
115 120 125
Glu Lys Arg Arg Lys Pro Glu Asp Val Leu Asp Asp Asp Asp Ala Gly
130 135 140
Ser Ala Pro Leu Lys Ser Ser Gly Gln His Gln Asn Asp Lys Gly Lys
145 150 155 160
Asn Val Arg Gln Arg Asn Ser Ser
165
<210> 328
<211> 66
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> BSG蛋白片段#3
<400> 328
Ser His Leu Ala Ala Leu Trp Pro Phe Leu Gly Ile Val Ala Glu Val
1 5 10 15
Leu Val Leu Val Thr Ile Ile Phe Ile Tyr Glu Lys Arg Arg Lys Pro
20 25 30
Glu Asp Val Leu Asp Asp Asp Asp Ala Gly Ser Ala Pro Leu Lys Ser
35 40 45
Ser Gly Gln His Gln Asn Asp Lys Gly Lys Asn Val Arg Gln Arg Asn
50 55 60
Ser Ser
65
<210> 329
<211> 18
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> BSG蛋白-信号肽
<400> 329
Met Ala Ala Ala Leu Phe Val Leu Leu Gly Phe Ala Leu Leu Gly Thr
1 5 10 15
His Gly
<210> 330
<211> 456
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> IGSF8蛋白片段#1
<400> 330
Ala Pro Pro Gly Pro Arg Gly Arg Gln Ala Pro Thr Ser Pro Pro Arg
1 5 10 15
Met Thr Val His Glu Gly Gln Glu Leu Ala Leu Gly Cys Leu Ala Arg
20 25 30
Thr Ser Thr Gln Lys His Thr His Leu Ala Val Ser Phe Gly Arg Ser
35 40 45
Val Pro Glu Ala Pro Val Gly Arg Ser Thr Leu Gln Glu Val Val Gly
50 55 60
Ile Arg Ser Asp Leu Ala Val Glu Ala Gly Ala Pro Tyr Ala Glu Arg
65 70 75 80
Leu Ala Ala Gly Glu Leu Arg Leu Gly Lys Glu Gly Thr Asp Arg Tyr
85 90 95
Arg Met Val Val Gly Gly Ala Gln Ala Gly Asp Ala Gly Thr Tyr His
100 105 110
Cys Thr Ala Ala Glu Trp Ile Gln Asp Pro Asp Gly Ser Trp Ala Gln
115 120 125
Ile Ala Glu Lys Arg Ala Val Leu Ala His Val Asp Val Gln Thr Leu
130 135 140
Ser Ser Gln Leu Ala Val Thr Val Gly Pro Gly Glu Arg Arg Ile Gly
145 150 155 160
Pro Gly Glu Pro Leu Glu Leu Leu Cys Asn Val Ser Gly Ala Leu Pro
165 170 175
Pro Ala Gly Arg His Ala Ala Tyr Ser Val Gly Trp Glu Met Ala Pro
180 185 190
Ala Gly Ala Pro Gly Pro Gly Arg Leu Val Ala Gln Leu Asp Thr Glu
195 200 205
Gly Val Gly Ser Leu Gly Pro Gly Tyr Glu Gly Arg His Ile Ala Met
210 215 220
Glu Lys Val Ala Ser Arg Thr Tyr Arg Leu Arg Leu Glu Ala Ala Arg
225 230 235 240
Pro Gly Asp Ala Gly Thr Tyr Arg Cys Leu Ala Lys Ala Tyr Val Arg
245 250 255
Gly Ser Gly Thr Arg Leu Arg Glu Ala Ala Ser Ala Arg Ser Arg Pro
260 265 270
Leu Pro Val His Val Arg Glu Glu Gly Val Val Leu Glu Ala Val Ala
275 280 285
Trp Leu Ala Gly Gly Thr Val Tyr Arg Gly Glu Thr Ala Ser Leu Leu
290 295 300
Cys Asn Ile Ser Val Arg Gly Gly Pro Pro Gly Leu Arg Leu Ala Ala
305 310 315 320
Ser Trp Trp Val Glu Arg Pro Glu Asp Gly Glu Leu Ser Ser Val Pro
325 330 335
Ala Gln Leu Val Gly Gly Val Gly Gln Asp Gly Val Ala Glu Leu Gly
340 345 350
Val Arg Pro Gly Gly Gly Pro Val Ser Val Glu Leu Val Gly Pro Arg
355 360 365
Ser His Arg Leu Arg Leu His Ser Leu Gly Pro Glu Asp Glu Gly Val
370 375 380
Tyr His Cys Ala Pro Ser Ala Trp Val Gln His Ala Asp Tyr Ser Trp
385 390 395 400
Tyr Gln Ala Gly Ser Ala Arg Ser Gly Pro Val Thr Val Tyr Pro Tyr
405 410 415
Met His Ala Leu Asp Thr Leu Phe Val Pro Leu Leu Val Gly Thr Gly
420 425 430
Val Ala Leu Val Thr Gly Ala Thr Val Leu Gly Thr Ile Thr Cys Cys
435 440 445
Phe Met Lys Arg Leu Arg Lys Arg
450 455
<210> 331
<211> 320
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> IGSF8蛋白片段#2
<400> 331
Ala His Val Asp Val Gln Thr Leu Ser Ser Gln Leu Ala Val Thr Val
1 5 10 15
Gly Pro Gly Glu Arg Arg Ile Gly Pro Gly Glu Pro Leu Glu Leu Leu
20 25 30
Cys Asn Val Ser Gly Ala Leu Pro Pro Ala Gly Arg His Ala Ala Tyr
35 40 45
Ser Val Gly Trp Glu Met Ala Pro Ala Gly Ala Pro Gly Pro Gly Arg
50 55 60
Leu Val Ala Gln Leu Asp Thr Glu Gly Val Gly Ser Leu Gly Pro Gly
65 70 75 80
Tyr Glu Gly Arg His Ile Ala Met Glu Lys Val Ala Ser Arg Thr Tyr
85 90 95
Arg Leu Arg Leu Glu Ala Ala Arg Pro Gly Asp Ala Gly Thr Tyr Arg
100 105 110
Cys Leu Ala Lys Ala Tyr Val Arg Gly Ser Gly Thr Arg Leu Arg Glu
115 120 125
Ala Ala Ser Ala Arg Ser Arg Pro Leu Pro Val His Val Arg Glu Glu
130 135 140
Gly Val Val Leu Glu Ala Val Ala Trp Leu Ala Gly Gly Thr Val Tyr
145 150 155 160
Arg Gly Glu Thr Ala Ser Leu Leu Cys Asn Ile Ser Val Arg Gly Gly
165 170 175
Pro Pro Gly Leu Arg Leu Ala Ala Ser Trp Trp Val Glu Arg Pro Glu
180 185 190
Asp Gly Glu Leu Ser Ser Val Pro Ala Gln Leu Val Gly Gly Val Gly
195 200 205
Gln Asp Gly Val Ala Glu Leu Gly Val Arg Pro Gly Gly Gly Pro Val
210 215 220
Ser Val Glu Leu Val Gly Pro Arg Ser His Arg Leu Arg Leu His Ser
225 230 235 240
Leu Gly Pro Glu Asp Glu Gly Val Tyr His Cys Ala Pro Ser Ala Trp
245 250 255
Val Gln His Ala Asp Tyr Ser Trp Tyr Gln Ala Gly Ser Ala Arg Ser
260 265 270
Gly Pro Val Thr Val Tyr Pro Tyr Met His Ala Leu Asp Thr Leu Phe
275 280 285
Val Pro Leu Leu Val Gly Thr Gly Val Ala Leu Val Thr Gly Ala Thr
290 295 300
Val Leu Gly Thr Ile Thr Cys Cys Phe Met Lys Arg Leu Arg Lys Arg
305 310 315 320
<210> 332
<211> 179
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> IGSF8蛋白片段#3
<400> 332
Arg Glu Glu Gly Val Val Leu Glu Ala Val Ala Trp Leu Ala Gly Gly
1 5 10 15
Thr Val Tyr Arg Gly Glu Thr Ala Ser Leu Leu Cys Asn Ile Ser Val
20 25 30
Arg Gly Gly Pro Pro Gly Leu Arg Leu Ala Ala Ser Trp Trp Val Glu
35 40 45
Arg Pro Glu Asp Gly Glu Leu Ser Ser Val Pro Ala Gln Leu Val Gly
50 55 60
Gly Val Gly Gln Asp Gly Val Ala Glu Leu Gly Val Arg Pro Gly Gly
65 70 75 80
Gly Pro Val Ser Val Glu Leu Val Gly Pro Arg Ser His Arg Leu Arg
85 90 95
Leu His Ser Leu Gly Pro Glu Asp Glu Gly Val Tyr His Cys Ala Pro
100 105 110
Ser Ala Trp Val Gln His Ala Asp Tyr Ser Trp Tyr Gln Ala Gly Ser
115 120 125
Ala Arg Ser Gly Pro Val Thr Val Tyr Pro Tyr Met His Ala Leu Asp
130 135 140
Thr Leu Phe Val Pro Leu Leu Val Gly Thr Gly Val Ala Leu Val Thr
145 150 155 160
Gly Ala Thr Val Leu Gly Thr Ile Thr Cys Cys Phe Met Lys Arg Leu
165 170 175
Arg Lys Arg
<210> 333
<211> 24
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> IGSF8蛋白片段#4
<400> 333
Val Ala Leu Val Thr Gly Ala Thr Val Leu Gly Thr Ile Thr Cys Cys
1 5 10 15
Phe Met Lys Arg Leu Arg Lys Arg
20
<210> 334
<211> 27
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> IGSF8蛋白-信号肽
<400> 334
Met Gly Ala Leu Arg Pro Thr Leu Leu Pro Pro Ser Leu Pro Leu Leu
1 5 10 15
Leu Leu Leu Met Leu Gly Met Gly Cys Trp Ala
20 25
<210> 335
<400> 335
000
<210> 336
<400> 336
000
<210> 337
<400> 337
000
<210> 338
<400> 338
000
<210> 339
<400> 339
000
<210> 340
<400> 340
000
<210> 341
<400> 341
000
<210> 342
<400> 342
000
<210> 343
<400> 343
000
<210> 344
<400> 344
000
<210> 345
<400> 345
000
<210> 346
<400> 346
000
<210> 347
<400> 347
000
<210> 348
<400> 348
000
<210> 349
<400> 349
000
<210> 350
<400> 350
000
<210> 351
<400> 351
000
<210> 352
<400> 352
000
<210> 353
<400> 353
000
<210> 354
<400> 354
000
<210> 355
<400> 355
000
<210> 356
<400> 356
000
<210> 357
<400> 357
000
<210> 358
<400> 358
000
<210> 359
<400> 359
000
<210> 360
<400> 360
000
<210> 361
<400> 361
000
<210> 362
<400> 362
000
<210> 363
<400> 363
000
<210> 364
<400> 364
000
<210> 365
<400> 365
000
<210> 366
<400> 366
000
<210> 367
<400> 367
000
<210> 368
<400> 368
000
<210> 369
<400> 369
000
<210> 370
<400> 370
000
<210> 371
<400> 371
000
<210> 372
<400> 372
000
<210> 373
<400> 373
000
<210> 374
<400> 374
000
<210> 375
<400> 375
000
<210> 376
<400> 376
000
<210> 377
<400> 377
000
<210> 378
<400> 378
000
<210> 379
<400> 379
000
<210> 380
<400> 380
000
<210> 381
<400> 381
000
<210> 382
<400> 382
000
<210> 383
<400> 383
000
<210> 384
<400> 384
000
<210> 385
<400> 385
000
<210> 386
<400> 386
000
<210> 387
<400> 387
000
<210> 388
<400> 388
000
<210> 389
<400> 389
000
<210> 390
<400> 390
000
<210> 391
<400> 391
000
<210> 392
<400> 392
000
<210> 393
<400> 393
000
<210> 394
<400> 394
000
<210> 395
<400> 395
000
<210> 396
<400> 396
000
<210> 397
<400> 397
000
<210> 398
<400> 398
000
<210> 399
<400> 399
000
<210> 400
<400> 400
000
<210> 401
<211> 332
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> MARCKS蛋白
<400> 401
Met Gly Ala Gln Phe Ser Lys Thr Ala Ala Lys Gly Glu Ala Ala Ala
1 5 10 15
Glu Arg Pro Gly Glu Ala Ala Val Ala Ser Ser Pro Ser Lys Ala Asn
20 25 30
Gly Gln Glu Asn Gly His Val Lys Val Asn Gly Asp Ala Ser Pro Ala
35 40 45
Ala Ala Glu Ser Gly Ala Lys Glu Glu Leu Gln Ala Asn Gly Ser Ala
50 55 60
Pro Ala Ala Asp Lys Glu Glu Pro Ala Ala Ala Gly Ser Gly Ala Ala
65 70 75 80
Ser Pro Ser Ala Ala Glu Lys Gly Glu Pro Ala Ala Ala Ala Ala Pro
85 90 95
Glu Ala Gly Ala Ser Pro Val Glu Lys Glu Ala Pro Ala Glu Gly Glu
100 105 110
Ala Ala Glu Pro Gly Ser Pro Thr Ala Ala Glu Gly Glu Ala Ala Ser
115 120 125
Ala Ala Ser Ser Thr Ser Ser Pro Lys Ala Glu Asp Gly Ala Thr Pro
130 135 140
Ser Pro Ser Asn Glu Thr Pro Lys Lys Lys Lys Lys Arg Phe Ser Phe
145 150 155 160
Lys Lys Ser Phe Lys Leu Ser Gly Phe Ser Phe Lys Lys Asn Lys Lys
165 170 175
Glu Ala Gly Glu Gly Gly Glu Ala Glu Ala Pro Ala Ala Glu Gly Gly
180 185 190
Lys Asp Glu Ala Ala Gly Gly Ala Ala Ala Ala Ala Ala Glu Ala Gly
195 200 205
Ala Ala Ser Gly Glu Gln Ala Ala Ala Pro Gly Glu Glu Ala Ala Ala
210 215 220
Gly Glu Glu Gly Ala Ala Gly Gly Asp Pro Gln Glu Ala Lys Pro Gln
225 230 235 240
Glu Ala Ala Val Ala Pro Glu Lys Pro Pro Ala Ser Asp Glu Thr Lys
245 250 255
Ala Ala Glu Glu Pro Ser Lys Val Glu Glu Lys Lys Ala Glu Glu Ala
260 265 270
Gly Ala Ser Ala Ala Ala Cys Glu Ala Pro Ser Ala Ala Gly Pro Gly
275 280 285
Ala Pro Pro Glu Gln Glu Ala Ala Pro Ala Glu Glu Pro Ala Ala Ala
290 295 300
Ala Ala Ser Ser Ala Cys Ala Ala Pro Ser Gln Glu Ala Gln Pro Glu
305 310 315 320
Cys Ser Pro Glu Ala Pro Pro Ala Glu Ala Ala Glu
325 330
<210> 402
<211> 195
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> MARCKSL1蛋白
<400> 402
Met Gly Ser Gln Ser Ser Lys Ala Pro Arg Gly Asp Val Thr Ala Glu
1 5 10 15
Glu Ala Ala Gly Ala Ser Pro Ala Lys Ala Asn Gly Gln Glu Asn Gly
20 25 30
His Val Lys Ser Asn Gly Asp Leu Ser Pro Lys Gly Glu Gly Glu Ser
35 40 45
Pro Pro Val Asn Gly Thr Asp Glu Ala Ala Gly Ala Thr Gly Asp Ala
50 55 60
Ile Glu Pro Ala Pro Pro Ser Gln Gly Ala Glu Ala Lys Gly Glu Val
65 70 75 80
Pro Pro Lys Glu Thr Pro Lys Lys Lys Lys Lys Phe Ser Phe Lys Lys
85 90 95
Pro Phe Lys Leu Ser Gly Leu Ser Phe Lys Arg Asn Arg Lys Glu Gly
100 105 110
Gly Gly Asp Ser Ser Ala Ser Ser Pro Thr Glu Glu Glu Gln Glu Gln
115 120 125
Gly Glu Ile Gly Ala Cys Ser Asp Glu Gly Thr Ala Gln Glu Gly Lys
130 135 140
Ala Ala Ala Thr Pro Glu Ser Gln Glu Pro Gln Ala Lys Gly Ala Glu
145 150 155 160
Ala Ser Ala Ala Ser Glu Glu Glu Ala Gly Pro Gln Ala Thr Glu Pro
165 170 175
Ser Thr Pro Ser Gly Pro Glu Ser Gly Pro Thr Pro Ala Ser Ala Glu
180 185 190
Gln Asn Glu
195
<210> 403
<211> 227
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> BASP1蛋白
<400> 403
Met Gly Gly Lys Leu Ser Lys Lys Lys Lys Gly Tyr Asn Val Asn Asp
1 5 10 15
Glu Lys Ala Lys Glu Lys Asp Lys Lys Ala Glu Gly Ala Ala Thr Glu
20 25 30
Glu Glu Gly Thr Pro Lys Glu Ser Glu Pro Gln Ala Ala Ala Glu Pro
35 40 45
Ala Glu Ala Lys Glu Gly Lys Glu Lys Pro Asp Gln Asp Ala Glu Gly
50 55 60
Lys Ala Glu Glu Lys Glu Gly Glu Lys Asp Ala Ala Ala Ala Lys Glu
65 70 75 80
Glu Ala Pro Lys Ala Glu Pro Glu Lys Thr Glu Gly Ala Ala Glu Ala
85 90 95
Lys Ala Glu Pro Pro Lys Ala Pro Glu Gln Glu Gln Ala Ala Pro Gly
100 105 110
Pro Ala Ala Gly Gly Glu Ala Pro Lys Ala Ala Glu Ala Ala Ala Ala
115 120 125
Pro Ala Glu Ser Ala Ala Pro Ala Ala Gly Glu Glu Pro Ser Lys Glu
130 135 140
Glu Gly Glu Pro Lys Lys Thr Glu Ala Pro Ala Ala Pro Ala Ala Gln
145 150 155 160
Glu Thr Lys Ser Asp Gly Ala Pro Ala Ser Asp Ser Lys Pro Gly Ser
165 170 175
Ser Glu Ala Ala Pro Ser Ser Lys Glu Thr Pro Ala Ala Thr Glu Ala
180 185 190
Pro Ser Ser Thr Pro Lys Ala Gln Gly Pro Ala Ala Ser Ala Glu Glu
195 200 205
Pro Lys Pro Val Glu Ala Pro Ala Ala Asn Ser Asp Gln Thr Val Thr
210 215 220
Val Lys Glu
225
<210> 404
<211> 8
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成肽
<220>
<221> misc_feature
<222> (2)..(2)
<223> 其中Xaa是丙氨酸或任何其他氨基酸
<400> 404
Gly Xaa Lys Leu Ser Lys Lys Lys
1 5
<210> 405
<211> 4
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成肽
<400> 405
Lys Lys Lys Lys
1
<210> 406
<211> 5
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成肽
<400> 406
Lys Lys Lys Lys Lys
1 5
<210> 407
<211> 4
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成肽
<400> 407
Arg Arg Arg Arg
1
<210> 408
<211> 5
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成肽
<400> 408
Arg Arg Arg Arg Arg
1 5
<210> 409
<211> 4
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成肽
<220>
<221> misc_Feature
<222> (1)..(1)
<223> 其中Xaa可以是Lys或Arg
<220>
<221> misc_Feature
<222> (2)..(2)
<223> 其中Xaa可以是Lys或Arg
<220>
<221> misc_Feature
<222> (3)..(3)
<223> 其中Xaa可以是Lys或Arg
<220>
<221> misc_Feature
<222> (4)..(4)
<223> 其中Xaa可以是Lys或Arg
<400> 409
Xaa Xaa Xaa Xaa
1
<210> 410
<211> 5
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成肽
<220>
<221> misc_feature
<222> (1)..(1)
<223> 其中Xaa可以是Lys或Arg
<220>
<221> misc_feature
<222> (2)..(2)
<223> 其中Xaa可以是Lys或Arg
<220>
<221> misc_feature
<222> (3)..(3)
<223> 其中Xaa可以是Lys或Arg
<220>
<221> misc_feature
<222> (4)..(4)
<223> 其中Xaa可以是Lys或Arg
<220>
<221> misc_feature
<222> (5)..(5)
<223> 其中Xaa可以是Lys或Arg
<400> 410
Xaa Xaa Xaa Xaa Xaa
1 5
<210> 411
<211> 7
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成肽
<400> 411
Gly Gly Lys Leu Ser Lys Lys
1 5
<210> 412
<211> 7
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成肽
<400> 412
Gly Ala Lys Leu Ser Lys Lys
1 5
<210> 413
<211> 7
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成肽
<400> 413
Gly Gly Lys Gln Ser Lys Lys
1 5
<210> 414
<211> 7
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成肽
<400> 414
Gly Gly Lys Leu Ala Lys Lys
1 5
<210> 415
<211> 6
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成肽
<400> 415
Gly Gly Lys Leu Ser Lys
1 5
<210> 416
<211> 6
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成肽
<400> 416
Gly Ala Lys Leu Ser Lys
1 5
<210> 417
<211> 6
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成肽
<400> 417
Gly Gly Lys Gln Ser Lys
1 5
<210> 418
<211> 6
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成肽
<400> 418
Gly Gly Lys Leu Ala Lys
1 5
<210> 419
<211> 4
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成肽
<400> 419
Lys Lys Lys Gly
1
<210> 420
<211> 5
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成肽
<400> 420
Lys Lys Lys Gly Tyr
1 5
<210> 421
<211> 6
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成肽
<400> 421
Lys Lys Lys Gly Tyr Asn
1 5
<210> 422
<211> 7
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成肽
<400> 422
Lys Lys Lys Gly Tyr Asn Val
1 5
<210> 423
<211> 8
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成肽
<400> 423
Lys Lys Lys Gly Tyr Asn Val Asn
1 5
<210> 424
<211> 6
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成肽
<400> 424
Lys Lys Lys Gly Tyr Ser
1 5
<210> 425
<211> 6
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成肽
<400> 425
Lys Lys Lys Gly Tyr Gly
1 5
<210> 426
<211> 7
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成肽
<400> 426
Lys Lys Lys Gly Tyr Gly Gly
1 5
<210> 427
<211> 5
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成肽
<400> 427
Lys Lys Lys Gly Ser
1 5
<210> 428
<211> 6
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成肽
<400> 428
Lys Lys Lys Gly Ser Gly
1 5
<210> 429
<211> 7
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成肽
<400> 429
Lys Lys Lys Gly Ser Gly Ser
1 5
<210> 430
<211> 4
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成肽
<400> 430
Lys Lys Lys Ser
1
<210> 431
<211> 5
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成肽
<400> 431
Lys Lys Lys Ser Gly
1 5
<210> 432
<211> 6
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成肽
<400> 432
Lys Lys Lys Ser Gly Gly
1 5
<210> 433
<211> 7
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成肽
<400> 433
Lys Lys Lys Ser Gly Gly Ser
1 5
<210> 434
<211> 8
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成肽
<400> 434
Lys Lys Lys Ser Gly Gly Ser Gly
1 5
<210> 435
<211> 8
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成肽
<400> 435
Lys Lys Ser Gly Gly Ser Gly Gly
1 5
<210> 436
<211> 10
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成肽
<400> 436
Lys Lys Lys Ser Gly Gly Ser Gly Gly Ser
1 5 10
<210> 437
<211> 8
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成肽
<400> 437
Lys Arg Phe Ser Phe Lys Lys Ser
1 5
<210> 438
<211> 8
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成肽
<400> 438
Gly Gly Lys Leu Ser Lys Lys Lys
1 5
<210> 439
<211> 8
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成肽
<400> 439
Gly Gly Lys Leu Ser Lys Lys Ser
1 5
<210> 440
<211> 8
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成肽
<400> 440
Gly Ala Lys Leu Ser Lys Lys Lys
1 5
<210> 441
<211> 8
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成肽
<400> 441
Gly Ala Lys Leu Ser Lys Lys Ser
1 5
<210> 442
<211> 8
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成肽
<400> 442
Gly Gly Lys Gln Ser Lys Lys Lys
1 5
<210> 443
<211> 8
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成肽
<400> 443
Gly Gly Lys Gln Ser Lys Lys Ser
1 5
<210> 444
<211> 8
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成肽
<400> 444
Gly Gly Lys Leu Ala Lys Lys Lys
1 5
<210> 445
<211> 8
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成肽
<400> 445
Gly Gly Lys Leu Ala Lys Lys Ser
1 5
<210> 446
<211> 14
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成肽
<400> 446
Gly Gly Lys Leu Ser Lys Lys Lys Lys Gly Tyr Asn Val Asn
1 5 10
<210> 447
<211> 14
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成肽
<400> 447
Gly Ala Lys Leu Ser Lys Lys Lys Lys Gly Tyr Asn Val Asn
1 5 10
<210> 448
<211> 14
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成肽
<400> 448
Gly Gly Lys Gln Ser Lys Lys Lys Lys Gly Tyr Asn Val Asn
1 5 10
<210> 449
<211> 14
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成肽
<400> 449
Gly Gly Lys Leu Ala Lys Lys Lys Lys Gly Tyr Asn Val Asn
1 5 10
<210> 450
<211> 14
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成肽
<400> 450
Gly Gly Lys Leu Ser Lys Lys Lys Lys Gly Tyr Ser Gly Gly
1 5 10
<210> 451
<211> 14
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成肽
<400> 451
Gly Gly Lys Leu Ser Lys Lys Lys Lys Gly Ser Gly Gly Ser
1 5 10
<210> 452
<211> 14
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成肽
<400> 452
Gly Gly Lys Leu Ser Lys Lys Lys Lys Ser Gly Gly Ser Gly
1 5 10
<210> 453
<211> 14
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成肽
<400> 453
Gly Gly Lys Leu Ser Lys Lys Lys Ser Gly Gly Ser Gly Gly
1 5 10
<210> 454
<211> 14
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成肽
<400> 454
Gly Gly Lys Leu Ser Lys Lys Ser Gly Gly Ser Gly Gly Ser
1 5 10
<210> 455
<211> 14
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成肽
<400> 455
Gly Gly Lys Leu Ser Lys Ser Gly Gly Ser Gly Gly Ser Val
1 5 10
<210> 456
<211> 14
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成肽
<400> 456
Gly Ala Lys Lys Ser Lys Lys Arg Phe Ser Phe Lys Lys Ser
1 5 10
<210> 457
<211> 29
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成肽
<400> 457
Gly Gly Lys Leu Ser Lys Lys Lys Lys Gly Tyr Asn Val Asn Asp Glu
1 5 10 15
Lys Ala Lys Glu Lys Asp Lys Lys Ala Glu Gly Ala Ala
20 25
<210> 458
<211> 28
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成肽
<400> 458
Gly Gly Lys Leu Ser Lys Lys Lys Lys Gly Tyr Asn Val Asn Asp Glu
1 5 10 15
Lys Ala Lys Glu Lys Asp Lys Lys Ala Glu Gly Ala
20 25
<210> 459
<211> 27
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成肽
<400> 459
Gly Gly Lys Leu Ser Lys Lys Lys Lys Gly Tyr Asn Val Asn Asp Glu
1 5 10 15
Lys Ala Lys Glu Lys Asp Lys Lys Ala Glu Gly
20 25
<210> 460
<211> 26
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成肽
<400> 460
Gly Gly Lys Leu Ser Lys Lys Lys Lys Gly Tyr Asn Val Asn Asp Glu
1 5 10 15
Lys Ala Lys Glu Lys Asp Lys Lys Ala Glu
20 25
<210> 461
<211> 25
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成肽
<400> 461
Gly Gly Lys Leu Ser Lys Lys Lys Lys Gly Tyr Asn Val Asn Asp Glu
1 5 10 15
Lys Ala Lys Glu Lys Asp Lys Lys Ala
20 25
<210> 462
<211> 24
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成肽
<400> 462
Gly Gly Lys Leu Ser Lys Lys Lys Lys Gly Tyr Asn Val Asn Asp Glu
1 5 10 15
Lys Ala Lys Glu Lys Asp Lys Lys
20
<210> 463
<211> 23
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成肽
<400> 463
Gly Gly Lys Leu Ser Lys Lys Lys Lys Gly Tyr Asn Val Asn Asp Glu
1 5 10 15
Lys Ala Lys Glu Lys Asp Lys
20
<210> 464
<211> 22
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成肽
<400> 464
Gly Gly Lys Leu Ser Lys Lys Lys Lys Gly Tyr Asn Val Asn Asp Glu
1 5 10 15
Lys Ala Lys Glu Lys Asp
20
<210> 465
<211> 21
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成肽
<400> 465
Gly Gly Lys Leu Ser Lys Lys Lys Lys Gly Tyr Asn Val Asn Asp Glu
1 5 10 15
Lys Ala Lys Glu Lys
20
<210> 466
<211> 20
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成肽
<400> 466
Gly Gly Lys Leu Ser Lys Lys Lys Lys Gly Tyr Asn Val Asn Asp Glu
1 5 10 15
Lys Ala Lys Glu
20
<210> 467
<211> 19
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成肽
<400> 467
Gly Gly Lys Leu Ser Lys Lys Lys Lys Gly Tyr Asn Val Asn Asp Glu
1 5 10 15
Lys Ala Lys
<210> 468
<211> 18
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成肽
<400> 468
Gly Gly Lys Leu Ser Lys Lys Lys Lys Gly Tyr Asn Val Asn Asp Glu
1 5 10 15
Lys Ala
<210> 469
<211> 17
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成肽
<400> 469
Gly Gly Lys Leu Ser Lys Lys Lys Lys Gly Tyr Asn Val Asn Asp Glu
1 5 10 15
Lys
<210> 470
<211> 16
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成肽
<400> 470
Gly Gly Lys Leu Ser Lys Lys Lys Lys Gly Tyr Asn Val Asn Asp Glu
1 5 10 15
<210> 471
<211> 15
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成肽
<400> 471
Gly Gly Lys Leu Ser Lys Lys Lys Lys Gly Tyr Asn Val Asn Asp
1 5 10 15
<210> 472
<211> 13
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成肽
<400> 472
Gly Gly Lys Leu Ser Lys Lys Lys Lys Gly Tyr Asn Val
1 5 10
<210> 473
<211> 12
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成肽
<400> 473
Gly Gly Lys Leu Ser Lys Lys Lys Lys Gly Tyr Asn
1 5 10
<210> 474
<211> 11
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成肽
<400> 474
Gly Gly Lys Leu Ser Lys Lys Lys Lys Gly Tyr
1 5 10
<210> 475
<211> 10
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成肽
<400> 475
Gly Gly Lys Leu Ser Lys Lys Lys Lys Gly
1 5 10
<210> 476
<211> 9
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成肽
<400> 476
Gly Gly Lys Leu Ser Lys Lys Lys Lys
1 5
<210> 477
<211> 29
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成肽
<400> 477
Gly Ala Lys Lys Ser Lys Lys Arg Phe Ser Phe Lys Lys Ser Phe Lys
1 5 10 15
Leu Ser Gly Phe Ser Phe Lys Lys Asn Lys Lys Glu Ala
20 25
<210> 478
<211> 28
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成肽
<400> 478
Gly Ala Lys Lys Ser Lys Lys Arg Phe Ser Phe Lys Lys Ser Phe Lys
1 5 10 15
Leu Ser Gly Phe Ser Phe Lys Lys Asn Lys Lys Glu
20 25
<210> 479
<211> 27
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成肽
<400> 479
Gly Ala Lys Lys Ser Lys Lys Arg Phe Ser Phe Lys Lys Ser Phe Lys
1 5 10 15
Leu Ser Gly Phe Ser Phe Lys Lys Asn Lys Lys
20 25
<210> 480
<211> 26
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成肽
<400> 480
Gly Ala Lys Lys Ser Lys Lys Arg Phe Ser Phe Lys Lys Ser Phe Lys
1 5 10 15
Leu Ser Gly Phe Ser Phe Lys Lys Asn Lys
20 25
<210> 481
<211> 25
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成肽
<400> 481
Gly Ala Lys Lys Ser Lys Lys Arg Phe Ser Phe Lys Lys Ser Phe Lys
1 5 10 15
Leu Ser Gly Phe Ser Phe Lys Lys Asn
20 25
<210> 482
<211> 24
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成肽
<400> 482
Gly Ala Lys Lys Ser Lys Lys Arg Phe Ser Phe Lys Lys Ser Phe Lys
1 5 10 15
Leu Ser Gly Phe Ser Phe Lys Lys
20
<210> 483
<211> 23
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成肽
<400> 483
Gly Ala Lys Lys Ser Lys Lys Arg Phe Ser Phe Lys Lys Ser Phe Lys
1 5 10 15
Leu Ser Gly Phe Ser Phe Lys
20
<210> 484
<211> 22
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成肽
<400> 484
Gly Ala Lys Lys Ser Lys Lys Arg Phe Ser Phe Lys Lys Ser Phe Lys
1 5 10 15
Leu Ser Gly Phe Ser Phe
20
<210> 485
<211> 21
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成肽
<400> 485
Gly Ala Lys Lys Ser Lys Lys Arg Phe Ser Phe Lys Lys Ser Phe Lys
1 5 10 15
Leu Ser Gly Phe Ser
20
<210> 486
<211> 20
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成肽
<400> 486
Gly Ala Lys Lys Ser Lys Lys Arg Phe Ser Phe Lys Lys Ser Phe Lys
1 5 10 15
Leu Ser Gly Phe
20
<210> 487
<211> 19
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成肽
<400> 487
Gly Ala Lys Lys Ser Lys Lys Arg Phe Ser Phe Lys Lys Ser Phe Lys
1 5 10 15
Leu Ser Gly
<210> 488
<211> 18
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成肽
<400> 488
Gly Ala Lys Lys Ser Lys Lys Arg Phe Ser Phe Lys Lys Ser Phe Lys
1 5 10 15
Leu Ser
<210> 489
<211> 17
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成肽
<400> 489
Gly Ala Lys Lys Ser Lys Lys Arg Phe Ser Phe Lys Lys Ser Phe Lys
1 5 10 15
Leu
<210> 490
<211> 16
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成肽
<400> 490
Gly Ala Lys Lys Ser Lys Lys Arg Phe Ser Phe Lys Lys Ser Phe Lys
1 5 10 15
<210> 491
<211> 15
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成肽
<400> 491
Gly Ala Lys Lys Ser Lys Lys Arg Phe Ser Phe Lys Lys Ser Phe
1 5 10 15
<210> 492
<211> 13
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成肽
<400> 492
Gly Ala Lys Lys Ser Lys Lys Arg Phe Ser Phe Lys Lys
1 5 10
<210> 493
<211> 12
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成肽
<400> 493
Gly Ala Lys Lys Ser Lys Lys Arg Phe Ser Phe Lys
1 5 10
<210> 494
<211> 11
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成肽
<400> 494
Gly Ala Lys Lys Ser Lys Lys Arg Phe Ser Phe
1 5 10
<210> 495
<211> 10
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成肽
<400> 495
Gly Ala Lys Lys Ser Lys Lys Arg Phe Ser
1 5 10
<210> 496
<211> 9
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成肽
<400> 496
Gly Ala Lys Lys Ser Lys Lys Arg Phe
1 5
<210> 497
<211> 8
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成肽
<400> 497
Gly Ala Lys Lys Ser Lys Lys Arg
1 5
<210> 498
<211> 7
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成肽
<400> 498
Gly Ala Lys Lys Ser Lys Lys
1 5
<210> 499
<211> 29
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成肽
<400> 499
Gly Ala Lys Lys Ala Lys Lys Arg Phe Ser Phe Lys Lys Ser Phe Lys
1 5 10 15
Leu Ser Gly Phe Ser Phe Lys Lys Asn Lys Lys Glu Ala
20 25
<210> 500
<211> 28
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成肽
<400> 500
Gly Ala Lys Lys Ala Lys Lys Arg Phe Ser Phe Lys Lys Ser Phe Lys
1 5 10 15
Leu Ser Gly Phe Ser Phe Lys Lys Asn Lys Lys Glu
20 25
<210> 501
<211> 27
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成肽
<400> 501
Gly Ala Lys Lys Ala Lys Lys Arg Phe Ser Phe Lys Lys Ser Phe Lys
1 5 10 15
Leu Ser Gly Phe Ser Phe Lys Lys Asn Lys Lys
20 25
<210> 502
<211> 26
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成肽
<400> 502
Gly Ala Lys Lys Ala Lys Lys Arg Phe Ser Phe Lys Lys Ser Phe Lys
1 5 10 15
Leu Ser Gly Phe Ser Phe Lys Lys Asn Lys
20 25
<210> 503
<211> 25
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成肽
<400> 503
Gly Ala Lys Lys Ala Lys Lys Arg Phe Ser Phe Lys Lys Ser Phe Lys
1 5 10 15
Leu Ser Gly Phe Ser Phe Lys Lys Asn
20 25
<210> 504
<211> 24
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成肽
<400> 504
Gly Ala Lys Lys Ala Lys Lys Arg Phe Ser Phe Lys Lys Ser Phe Lys
1 5 10 15
Leu Ser Gly Phe Ser Phe Lys Lys
20
<210> 505
<211> 23
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成肽
<400> 505
Gly Ala Lys Lys Ala Lys Lys Arg Phe Ser Phe Lys Lys Ser Phe Lys
1 5 10 15
Leu Ser Gly Phe Ser Phe Lys
20
<210> 506
<211> 22
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成肽
<400> 506
Gly Ala Lys Lys Ala Lys Lys Arg Phe Ser Phe Lys Lys Ser Phe Lys
1 5 10 15
Leu Ser Gly Phe Ser Phe
20
<210> 507
<211> 21
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成肽
<400> 507
Gly Ala Lys Lys Ala Lys Lys Arg Phe Ser Phe Lys Lys Ser Phe Lys
1 5 10 15
Leu Ser Gly Phe Ser
20
<210> 508
<211> 20
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成肽
<400> 508
Gly Ala Lys Lys Ala Lys Lys Arg Phe Ser Phe Lys Lys Ser Phe Lys
1 5 10 15
Leu Ser Gly Phe
20
<210> 509
<211> 19
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成肽
<400> 509
Gly Ala Lys Lys Ala Lys Lys Arg Phe Ser Phe Lys Lys Ser Phe Lys
1 5 10 15
Leu Ser Gly
<210> 510
<211> 18
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成肽
<400> 510
Gly Ala Lys Lys Ala Lys Lys Arg Phe Ser Phe Lys Lys Ser Phe Lys
1 5 10 15
Leu Ser
<210> 511
<211> 17
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成肽
<400> 511
Gly Ala Lys Lys Ala Lys Lys Arg Phe Ser Phe Lys Lys Ser Phe Lys
1 5 10 15
Leu
<210> 512
<211> 16
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成肽
<400> 512
Gly Ala Lys Lys Ala Lys Lys Arg Phe Ser Phe Lys Lys Ser Phe Lys
1 5 10 15
<210> 513
<211> 15
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成肽
<400> 513
Gly Ala Lys Lys Ala Lys Lys Arg Phe Ser Phe Lys Lys Ser Phe
1 5 10 15
<210> 514
<211> 14
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成肽
<400> 514
Gly Ala Lys Lys Ala Lys Lys Arg Phe Ser Phe Lys Lys Ser
1 5 10
<210> 515
<211> 13
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成肽
<400> 515
Gly Ala Lys Lys Ala Lys Lys Arg Phe Ser Phe Lys Lys
1 5 10
<210> 516
<211> 12
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成肽
<400> 516
Gly Ala Lys Lys Ala Lys Lys Arg Phe Ser Phe Lys
1 5 10
<210> 517
<211> 11
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成肽
<400> 517
Gly Ala Lys Lys Ala Lys Lys Arg Phe Ser Phe
1 5 10
<210> 518
<211> 10
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成肽
<400> 518
Gly Ala Lys Lys Ala Lys Lys Arg Phe Ser
1 5 10
<210> 519
<211> 9
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成肽
<400> 519
Gly Ala Lys Lys Ala Lys Lys Arg Phe
1 5
<210> 520
<211> 8
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成肽
<400> 520
Gly Ala Lys Lys Ala Lys Lys Arg
1 5
<210> 521
<211> 7
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成肽
<400> 521
Gly Ala Lys Lys Ala Lys Lys
1 5
<210> 522
<211> 28
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成肽
<400> 522
Gly Ala Gln Glu Ser Lys Lys Lys Lys Lys Lys Arg Phe Ser Phe Lys
1 5 10 15
Lys Ser Phe Lys Leu Ser Gly Phe Ser Phe Lys Lys
20 25
<210> 523
<211> 27
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成肽
<400> 523
Gly Ala Gln Glu Ser Lys Lys Lys Lys Lys Lys Arg Phe Ser Phe Lys
1 5 10 15
Lys Ser Phe Lys Leu Ser Gly Phe Ser Phe Lys
20 25
<210> 524
<211> 26
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成肽
<400> 524
Gly Ala Gln Glu Ser Lys Lys Lys Lys Lys Lys Arg Phe Ser Phe Lys
1 5 10 15
Lys Ser Phe Lys Leu Ser Gly Phe Ser Phe
20 25
<210> 525
<211> 25
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成肽
<400> 525
Gly Ala Gln Glu Ser Lys Lys Lys Lys Lys Lys Arg Phe Ser Phe Lys
1 5 10 15
Lys Ser Phe Lys Leu Ser Gly Phe Ser
20 25
<210> 526
<211> 24
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成肽
<400> 526
Gly Ala Gln Glu Ser Lys Lys Lys Lys Lys Lys Arg Phe Ser Phe Lys
1 5 10 15
Lys Ser Phe Lys Leu Ser Gly Phe
20
<210> 527
<211> 23
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成肽
<400> 527
Gly Ala Gln Glu Ser Lys Lys Lys Lys Lys Lys Arg Phe Ser Phe Lys
1 5 10 15
Lys Ser Phe Lys Leu Ser Gly
20
<210> 528
<211> 22
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成肽
<400> 528
Gly Ala Gln Glu Ser Lys Lys Lys Lys Lys Lys Arg Phe Ser Phe Lys
1 5 10 15
Lys Ser Phe Lys Leu Ser
20
<210> 529
<211> 21
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成肽
<400> 529
Gly Ala Gln Glu Ser Lys Lys Lys Lys Lys Lys Arg Phe Ser Phe Lys
1 5 10 15
Lys Ser Phe Lys Leu
20
<210> 530
<211> 20
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成肽
<400> 530
Gly Ala Gln Glu Ser Lys Lys Lys Lys Lys Lys Arg Phe Ser Phe Lys
1 5 10 15
Lys Ser Phe Lys
20
<210> 531
<211> 19
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成肽
<400> 531
Gly Ala Gln Glu Ser Lys Lys Lys Lys Lys Lys Arg Phe Ser Phe Lys
1 5 10 15
Lys Ser Phe
<210> 532
<211> 18
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成肽
<400> 532
Gly Ala Gln Glu Ser Lys Lys Lys Lys Lys Lys Arg Phe Ser Phe Lys
1 5 10 15
Lys Ser
<210> 533
<211> 17
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成肽
<400> 533
Gly Ala Gln Glu Ser Lys Lys Lys Lys Lys Lys Arg Phe Ser Phe Lys
1 5 10 15
Lys
<210> 534
<211> 16
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成肽
<400> 534
Gly Ala Gln Glu Ser Lys Lys Lys Lys Lys Lys Arg Phe Ser Phe Lys
1 5 10 15
<210> 535
<211> 15
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成肽
<400> 535
Gly Ala Gln Glu Ser Lys Lys Lys Lys Lys Lys Arg Phe Ser Phe
1 5 10 15
<210> 536
<211> 14
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成肽
<400> 536
Gly Ala Gln Glu Ser Lys Lys Lys Lys Lys Lys Arg Phe Ser
1 5 10
<210> 537
<211> 13
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成肽
<400> 537
Gly Ala Gln Glu Ser Lys Lys Lys Lys Lys Lys Arg Phe
1 5 10
<210> 538
<211> 12
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成肽
<400> 538
Gly Ala Gln Glu Ser Lys Lys Lys Lys Lys Lys Arg
1 5 10
<210> 539
<211> 11
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成肽
<400> 539
Gly Ala Gln Glu Ser Lys Lys Lys Lys Lys Lys
1 5 10
<210> 540
<211> 10
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成肽
<400> 540
Gly Ala Gln Glu Ser Lys Lys Lys Lys Lys
1 5 10
<210> 541
<211> 9
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成肽
<400> 541
Gly Ala Gln Glu Ser Lys Lys Lys Lys
1 5
<210> 542
<211> 8
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成肽
<400> 542
Gly Ala Gln Glu Ser Lys Lys Lys
1 5
<210> 543
<211> 7
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成肽
<400> 543
Gly Ala Gln Glu Ser Lys Lys
1 5
<210> 544
<211> 30
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成肽
<400> 544
Gly Ser Gln Ser Ser Lys Lys Lys Lys Lys Lys Phe Ser Phe Lys Lys
1 5 10 15
Pro Phe Lys Leu Ser Gly Leu Ser Phe Lys Arg Asn Arg Lys
20 25 30
<210> 545
<211> 29
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成肽
<400> 545
Gly Ser Gln Ser Ser Lys Lys Lys Lys Lys Lys Phe Ser Phe Lys Lys
1 5 10 15
Pro Phe Lys Leu Ser Gly Leu Ser Phe Lys Arg Asn Arg
20 25
<210> 546
<211> 28
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成肽
<400> 546
Gly Ser Gln Ser Ser Lys Lys Lys Lys Lys Lys Phe Ser Phe Lys Lys
1 5 10 15
Pro Phe Lys Leu Ser Gly Leu Ser Phe Lys Arg Asn
20 25
<210> 547
<211> 27
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成肽
<400> 547
Gly Ser Gln Ser Ser Lys Lys Lys Lys Lys Lys Phe Ser Phe Lys Lys
1 5 10 15
Pro Phe Lys Leu Ser Gly Leu Ser Phe Lys Arg
20 25
<210> 548
<211> 26
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成肽
<400> 548
Gly Ser Gln Ser Ser Lys Lys Lys Lys Lys Lys Phe Ser Phe Lys Lys
1 5 10 15
Pro Phe Lys Leu Ser Gly Leu Ser Phe Lys
20 25
<210> 549
<211> 25
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成肽
<400> 549
Gly Ser Gln Ser Ser Lys Lys Lys Lys Lys Lys Phe Ser Phe Lys Lys
1 5 10 15
Pro Phe Lys Leu Ser Gly Leu Ser Phe
20 25
<210> 550
<211> 24
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成肽
<400> 550
Gly Ser Gln Ser Ser Lys Lys Lys Lys Lys Lys Phe Ser Phe Lys Lys
1 5 10 15
Pro Phe Lys Leu Ser Gly Leu Ser
20
<210> 551
<211> 23
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成肽
<400> 551
Gly Ser Gln Ser Ser Lys Lys Lys Lys Lys Lys Phe Ser Phe Lys Lys
1 5 10 15
Pro Phe Lys Leu Ser Gly Leu
20
<210> 552
<211> 22
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成肽
<400> 552
Gly Ser Gln Ser Ser Lys Lys Lys Lys Lys Lys Phe Ser Phe Lys Lys
1 5 10 15
Pro Phe Lys Leu Ser Gly
20
<210> 553
<211> 21
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成肽
<400> 553
Gly Ser Gln Ser Ser Lys Lys Lys Lys Lys Lys Phe Ser Phe Lys Lys
1 5 10 15
Pro Phe Lys Leu Ser
20
<210> 554
<211> 20
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成肽
<400> 554
Gly Ser Gln Ser Ser Lys Lys Lys Lys Lys Lys Phe Ser Phe Lys Lys
1 5 10 15
Pro Phe Lys Leu
20
<210> 555
<211> 19
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成肽
<400> 555
Gly Ser Gln Ser Ser Lys Lys Lys Lys Lys Lys Phe Ser Phe Lys Lys
1 5 10 15
Pro Phe Lys
<210> 556
<211> 18
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成肽
<400> 556
Gly Ser Gln Ser Ser Lys Lys Lys Lys Lys Lys Phe Ser Phe Lys Lys
1 5 10 15
Pro Phe
<210> 557
<211> 17
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成肽
<400> 557
Gly Ser Gln Ser Ser Lys Lys Lys Lys Lys Lys Phe Ser Phe Lys Lys
1 5 10 15
Pro
<210> 558
<211> 16
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成肽
<400> 558
Gly Ser Gln Ser Ser Lys Lys Lys Lys Lys Lys Phe Ser Phe Lys Lys
1 5 10 15
<210> 559
<211> 15
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成肽
<400> 559
Gly Ser Gln Ser Ser Lys Lys Lys Lys Lys Lys Phe Ser Phe Lys
1 5 10 15
<210> 560
<211> 14
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成肽
<400> 560
Gly Ser Gln Ser Ser Lys Lys Lys Lys Lys Lys Phe Ser Phe
1 5 10
<210> 561
<211> 13
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成肽
<400> 561
Gly Ser Gln Ser Ser Lys Lys Lys Lys Lys Lys Phe Ser
1 5 10
<210> 562
<211> 12
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成肽
<400> 562
Gly Ser Gln Ser Ser Lys Lys Lys Lys Lys Lys Phe
1 5 10
<210> 563
<211> 11
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成肽
<400> 563
Gly Ser Gln Ser Ser Lys Lys Lys Lys Lys Lys
1 5 10
<210> 564
<211> 10
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成肽
<400> 564
Gly Ser Gln Ser Ser Lys Lys Lys Lys Lys
1 5 10
<210> 565
<211> 9
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成肽
<400> 565
Gly Ser Gln Ser Ser Lys Lys Lys Lys
1 5
<210> 566
<211> 8
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成肽
<400> 566
Gly Ser Gln Ser Ser Lys Lys Lys
1 5
<210> 567
<211> 7
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成肽
<400> 567
Gly Ser Gln Ser Ser Lys Lys
1 5
<210> 568
<400> 568
000
<210> 569
<400> 569
000
<210> 570
<400> 570
000
<210> 571
<400> 571
000
<210> 572
<400> 572
000
<210> 573
<400> 573
000
<210> 574
<400> 574
000
<210> 575
<400> 575
000
<210> 576
<400> 576
000
<210> 577
<400> 577
000
<210> 578
<400> 578
000
<210> 579
<400> 579
000
<210> 580
<400> 580
000
<210> 581
<400> 581
000
<210> 582
<400> 582
000
<210> 583
<400> 583
000
<210> 584
<400> 584
000
<210> 585
<400> 585
000
<210> 586
<400> 586
000
<210> 587
<400> 587
000
<210> 588
<400> 588
000
<210> 589
<400> 589
000
<210> 590
<400> 590
000
<210> 591
<400> 591
000
<210> 592
<400> 592
000
<210> 593
<400> 593
000
<210> 594
<400> 594
000
<210> 595
<400> 595
000
<210> 596
<400> 596
000
<210> 597
<400> 597
000
<210> 598
<400> 598
000
<210> 599
<400> 599
000
<210> 600
<400> 600
000
<210> 601
<400> 601
000
<210> 602
<400> 602
000
<210> 603
<400> 603
000
<210> 604
<400> 604
000
<210> 605
<400> 605
000
<210> 606
<400> 606
000
<210> 607
<400> 607
000
<210> 608
<211> 19
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> Angiopep-2
<400> 608
Thr Phe Phe Tyr Gly Gly Ser Arg Gly Lys Arg Asn Asn Phe Lys Thr
1 5 10 15
Glu Glu Tyr
<210> 609
<211> 39
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> ApoB (3371-3409)
<400> 609
Ser Ser Val Ile Asp Ala Leu Gln Tyr Lys Leu Glu Gly Thr Thr Arg
1 5 10 15
Leu Thr Arg Lys Arg Gly Leu Lys Leu Ala Thr Ala Leu Ser Leu Ser
20 25 30
Asn Lys Phe Val Glu Gly Ser
35
<210> 610
<211> 18
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> ApoE (159-167)2
<400> 610
Leu Arg Lys Leu Arg Lys Arg Leu Leu Leu Arg Lys Leu Arg Lys Arg
1 5 10 15
Leu Leu
<210> 611
<211> 8
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 肽-22
<400> 611
Cys Met Pro Arg Leu Arg Gly Cys
1 5
<210> 612
<211> 12
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> THR
<400> 612
Thr His Arg Pro Pro Met Trp Ser Pro Val Trp Pro
1 5 10
<210> 613
<211> 12
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> THR逆-对映异构体
<400> 613
Pro Trp Val Pro Ser Trp Met Pro Pro Arg His Thr
1 5 10
<210> 614
<211> 9
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> CRT
<400> 614
Cys Arg Thr Ile Gly Pro Ser Val Cys
1 5
<210> 615
<211> 30
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> Leptin30
<400> 615
Tyr Gln Gln Ile Leu Thr Ser Met Pro Ser Arg Asn Val Ile Gln Ile
1 5 10 15
Ser Asn Asp Leu Glu Asn Leu Arg Asp Leu Leu His Val Leu
20 25 30
<210> 616
<211> 29
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> RVG29
<400> 616
Tyr Thr Ile Trp Met Pro Glu Asn Pro Arg Pro Gly Thr Pro Cys Asp
1 5 10 15
Ile Phe Thr Asn Ser Arg Gly Lys Arg Ala Ser Asn Gly
20 25
<210> 617
<211> 16
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> DCDX
<400> 617
Gly Arg Glu Ile Arg Thr Gly Arg Ala Glu Arg Trp Ser Glu Lys Phe
1 5 10 15
<210> 618
<211> 18
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> Apamin
<400> 618
Cys Asn Cys Lys Ala Pro Glu Thr Ala Leu Cys Ala Arg Arg Cys Gln
1 5 10 15
Gln His
<210> 619
<211> 8
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> MiniAp-4
<400> 619
Lys Ala Pro Glu Thr Ala Leu Asp
1 5
<210> 620
<211> 2
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> GSH
<400> 620
Cys Gly
1
<210> 621
<211> 13
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> G23
<400> 621
His Leu Asn Ile Leu Ser Thr Leu Trp Lys Tyr Arg Cys
1 5 10
<210> 622
<211> 7
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> g7
<400> 622
Gly Phe Thr Gly Phe Leu Ser
1 5
<210> 623
<211> 12
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> TGN
<400> 623
Thr Gly Asn Tyr Lys Ala Leu His Pro His Asn Gly
1 5 10
<210> 624
<211> 11
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> TAT (47-57)
<400> 624
Tyr Gly Arg Lys Lys Arg Arg Gln Arg Arg Arg
1 5 10
<210> 625
<211> 18
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> SynB1
<400> 625
Arg Gly Gly Arg Leu Ser Tyr Ser Arg Arg Arg Phe Ser Thr Ser Thr
1 5 10 15
Gly Arg
<210> 626
<211> 2
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 二酮哌嗪
<400> 626
Phe Phe
1
<210> 627
<211> 4
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> PhPro
<400> 627
Pro Pro Pro Pro
1
<210> 628
<211> 21
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> “自身”肽
<400> 628
Gly Asn Tyr Thr Cys Glu Val Thr Glu Leu Thr Arg Glu Gly Glu Thr
1 5 10 15
Ile Ile Glu Leu Lys
20
<210> 629
<211> 323
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 规范CD47
<400> 629
Met Trp Pro Leu Val Ala Ala Leu Leu Leu Gly Ser Ala Cys Cys Gly
1 5 10 15
Ser Ala Gln Leu Leu Phe Asn Lys Thr Lys Ser Val Glu Phe Thr Phe
20 25 30
Cys Asn Asp Thr Val Val Ile Pro Cys Phe Val Thr Asn Met Glu Ala
35 40 45
Gln Asn Thr Thr Glu Val Tyr Val Lys Trp Lys Phe Lys Gly Arg Asp
50 55 60
Ile Tyr Thr Phe Asp Gly Ala Leu Asn Lys Ser Thr Val Pro Thr Asp
65 70 75 80
Phe Ser Ser Ala Lys Ile Glu Val Ser Gln Leu Leu Lys Gly Asp Ala
85 90 95
Ser Leu Lys Met Asp Lys Ser Asp Ala Val Ser His Thr Gly Asn Tyr
100 105 110
Thr Cys Glu Val Thr Glu Leu Thr Arg Glu Gly Glu Thr Ile Ile Glu
115 120 125
Leu Lys Tyr Arg Val Val Ser Trp Phe Ser Pro Asn Glu Asn Ile Leu
130 135 140
Ile Val Ile Phe Pro Ile Phe Ala Ile Leu Leu Phe Trp Gly Gln Phe
145 150 155 160
Gly Ile Lys Thr Leu Lys Tyr Arg Ser Gly Gly Met Asp Glu Lys Thr
165 170 175
Ile Ala Leu Leu Val Ala Gly Leu Val Ile Thr Val Ile Val Ile Val
180 185 190
Gly Ala Ile Leu Phe Val Pro Gly Glu Tyr Ser Leu Lys Asn Ala Thr
195 200 205
Gly Leu Gly Leu Ile Val Thr Ser Thr Gly Ile Leu Ile Leu Leu His
210 215 220
Tyr Tyr Val Phe Ser Thr Ala Ile Gly Leu Thr Ser Phe Val Ile Ala
225 230 235 240
Ile Leu Val Ile Gln Val Ile Ala Tyr Ile Leu Ala Val Val Gly Leu
245 250 255
Ser Leu Cys Ile Ala Ala Cys Ile Pro Met His Gly Pro Leu Leu Ile
260 265 270
Ser Gly Leu Ser Ile Leu Ala Leu Ala Gln Leu Leu Gly Leu Val Tyr
275 280 285
Met Lys Phe Val Ala Ser Asn Gln Lys Thr Ile Gln Pro Pro Arg Lys
290 295 300
Ala Val Glu Glu Pro Leu Asn Ala Phe Lys Glu Ser Lys Gly Met Met
305 310 315 320
Asn Asp Glu
<210> 630
<211> 292
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> CD47人同种型OA3-293
<400> 630
Met Trp Pro Leu Val Ala Ala Leu Leu Leu Gly Ser Ala Cys Cys Gly
1 5 10 15
Ser Ala Gln Leu Leu Phe Asn Lys Thr Lys Ser Val Glu Phe Thr Phe
20 25 30
Cys Asn Asp Thr Val Val Ile Pro Cys Phe Val Thr Asn Met Glu Ala
35 40 45
Gln Asn Thr Thr Glu Val Tyr Val Lys Trp Lys Phe Lys Gly Arg Asp
50 55 60
Ile Tyr Thr Phe Asp Gly Ala Leu Asn Lys Ser Thr Val Pro Thr Asp
65 70 75 80
Phe Ser Ser Ala Lys Ile Glu Val Ser Gln Leu Leu Lys Gly Asp Ala
85 90 95
Ser Leu Lys Met Asp Lys Ser Asp Ala Val Ser His Thr Gly Asn Tyr
100 105 110
Thr Cys Glu Val Thr Glu Leu Thr Arg Glu Gly Glu Thr Ile Ile Glu
115 120 125
Leu Lys Tyr Arg Val Val Ser Trp Phe Ser Pro Asn Glu Asn Ile Leu
130 135 140
Ile Val Ile Phe Pro Ile Phe Ala Ile Leu Leu Phe Trp Gly Gln Phe
145 150 155 160
Gly Ile Lys Thr Leu Lys Tyr Arg Ser Gly Gly Met Asp Glu Lys Thr
165 170 175
Ile Ala Leu Leu Val Ala Gly Leu Val Ile Thr Val Ile Val Ile Val
180 185 190
Gly Ala Ile Leu Phe Val Pro Gly Glu Tyr Ser Leu Lys Asn Ala Thr
195 200 205
Gly Leu Gly Leu Ile Val Thr Ser Thr Gly Ile Leu Ile Leu Leu His
210 215 220
Tyr Tyr Val Phe Ser Thr Ala Ile Gly Leu Thr Ser Phe Val Ile Ala
225 230 235 240
Ile Leu Val Ile Gln Val Ile Ala Tyr Ile Leu Ala Val Val Gly Leu
245 250 255
Ser Leu Cys Ile Ala Ala Cys Ile Pro Met His Gly Pro Leu Leu Ile
260 265 270
Ser Gly Leu Ser Ile Leu Ala Leu Ala Gln Leu Leu Gly Leu Val Tyr
275 280 285
Met Lys Phe Val
290
<210> 631
<211> 305
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> CD47人同种型OA3-305
<400> 631
Met Trp Pro Leu Val Ala Ala Leu Leu Leu Gly Ser Ala Cys Cys Gly
1 5 10 15
Ser Ala Gln Leu Leu Phe Asn Lys Thr Lys Ser Val Glu Phe Thr Phe
20 25 30
Cys Asn Asp Thr Val Val Ile Pro Cys Phe Val Thr Asn Met Glu Ala
35 40 45
Gln Asn Thr Thr Glu Val Tyr Val Lys Trp Lys Phe Lys Gly Arg Asp
50 55 60
Ile Tyr Thr Phe Asp Gly Ala Leu Asn Lys Ser Thr Val Pro Thr Asp
65 70 75 80
Phe Ser Ser Ala Lys Ile Glu Val Ser Gln Leu Leu Lys Gly Asp Ala
85 90 95
Ser Leu Lys Met Asp Lys Ser Asp Ala Val Ser His Thr Gly Asn Tyr
100 105 110
Thr Cys Glu Val Thr Glu Leu Thr Arg Glu Gly Glu Thr Ile Ile Glu
115 120 125
Leu Lys Tyr Arg Val Val Ser Trp Phe Ser Pro Asn Glu Asn Ile Leu
130 135 140
Ile Val Ile Phe Pro Ile Phe Ala Ile Leu Leu Phe Trp Gly Gln Phe
145 150 155 160
Gly Ile Lys Thr Leu Lys Tyr Arg Ser Gly Gly Met Asp Glu Lys Thr
165 170 175
Ile Ala Leu Leu Val Ala Gly Leu Val Ile Thr Val Ile Val Ile Val
180 185 190
Gly Ala Ile Leu Phe Val Pro Gly Glu Tyr Ser Leu Lys Asn Ala Thr
195 200 205
Gly Leu Gly Leu Ile Val Thr Ser Thr Gly Ile Leu Ile Leu Leu His
210 215 220
Tyr Tyr Val Phe Ser Thr Ala Ile Gly Leu Thr Ser Phe Val Ile Ala
225 230 235 240
Ile Leu Val Ile Gln Val Ile Ala Tyr Ile Leu Ala Val Val Gly Leu
245 250 255
Ser Leu Cys Ile Ala Ala Cys Ile Pro Met His Gly Pro Leu Leu Ile
260 265 270
Ser Gly Leu Ser Ile Leu Ala Leu Ala Gln Leu Leu Gly Leu Val Tyr
275 280 285
Met Lys Phe Val Ala Ser Asn Gln Lys Thr Ile Gln Pro Pro Arg Asn
290 295 300
Asn
305
<210> 632
<211> 311
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> CD47人同种型OA3-312
<400> 632
Met Trp Pro Leu Val Ala Ala Leu Leu Leu Gly Ser Ala Cys Cys Gly
1 5 10 15
Ser Ala Gln Leu Leu Phe Asn Lys Thr Lys Ser Val Glu Phe Thr Phe
20 25 30
Cys Asn Asp Thr Val Val Ile Pro Cys Phe Val Thr Asn Met Glu Ala
35 40 45
Gln Asn Thr Thr Glu Val Tyr Val Lys Trp Lys Phe Lys Gly Arg Asp
50 55 60
Ile Tyr Thr Phe Asp Gly Ala Leu Asn Lys Ser Thr Val Pro Thr Asp
65 70 75 80
Phe Ser Ser Ala Lys Ile Glu Val Ser Gln Leu Leu Lys Gly Asp Ala
85 90 95
Ser Leu Lys Met Asp Lys Ser Asp Ala Val Ser His Thr Gly Asn Tyr
100 105 110
Thr Cys Glu Val Thr Glu Leu Thr Arg Glu Gly Glu Thr Ile Ile Glu
115 120 125
Leu Lys Tyr Arg Val Val Ser Trp Phe Ser Pro Asn Glu Asn Ile Leu
130 135 140
Ile Val Ile Phe Pro Ile Phe Ala Ile Leu Leu Phe Trp Gly Gln Phe
145 150 155 160
Gly Ile Lys Thr Leu Lys Tyr Arg Ser Gly Gly Met Asp Glu Lys Thr
165 170 175
Ile Ala Leu Leu Val Ala Gly Leu Val Ile Thr Val Ile Val Ile Val
180 185 190
Gly Ala Ile Leu Phe Val Pro Gly Glu Tyr Ser Leu Lys Asn Ala Thr
195 200 205
Gly Leu Gly Leu Ile Val Thr Ser Thr Gly Ile Leu Ile Leu Leu His
210 215 220
Tyr Tyr Val Phe Ser Thr Ala Ile Gly Leu Thr Ser Phe Val Ile Ala
225 230 235 240
Ile Leu Val Ile Gln Val Ile Ala Tyr Ile Leu Ala Val Val Gly Leu
245 250 255
Ser Leu Cys Ile Ala Ala Cys Ile Pro Met His Gly Pro Leu Leu Ile
260 265 270
Ser Gly Leu Ser Ile Leu Ala Leu Ala Gln Leu Leu Gly Leu Val Tyr
275 280 285
Met Lys Phe Val Ala Ser Asn Gln Lys Thr Ile Gln Pro Pro Arg Lys
290 295 300
Ala Val Glu Glu Pro Leu Asn
305 310
Claims (150)
1.一种包含反义寡核苷酸(ASO)的细胞外囊泡,所述反义寡核苷酸(ASO)包含与KRASG12D转录物(SEQ ID NO:1)的核苷酸5,568至5,606内的核酸序列互补的长度为10至30个核苷酸的连续核苷酸序列。
2.如权利要求1所述的细胞外囊泡,所述细胞外囊泡靶向巨噬细胞。
3.如权利要求1或2所述的细胞外囊泡,其中所述连续核苷酸序列与所述KRAS G12D转录物内的所述核酸序列至少约80%、至少约85%、至少约90%、至少约95%或约100%互补。
4.如权利要求1至3中任一项所述的细胞外囊泡,其中所述ASO能够降低人细胞(例如,免疫细胞或肿瘤细胞)中的KRAS G12D蛋白表达,其中所述人细胞表达所述KRAS G12D蛋白。
5.如权利要求4所述的细胞外囊泡,其中与未暴露于所述ASO的人细胞中的KRAS G12D蛋白表达相比,所述KRAS G12D蛋白表达降低至少约30%、至少约35%、至少约40%、至少约45%、至少约50%、至少约55%、至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%或约100%。
6.如权利要求1至5中任一项所述的细胞外囊泡,其中所述ASO能够降低人细胞(例如,免疫细胞或肿瘤细胞)中的KRAS G12D mRNA的水平,其中所述人细胞表达所述KRAS G12DmRNA。
7.如权利要求6所述的细胞外囊泡,其中与未暴露于所述ASO的人细胞中的所述KRASG12D mRNA的水平相比,KRAS G12DmRNA的所述水平降低至少约30%、至少约35%、至少约40%、至少约45%、至少约50%、至少约55%、至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%或约100%。
8.一种包含反义寡核苷酸(ASO)的细胞外囊泡,所述反义寡核苷酸(ASO)包含与KRAS突变转录物的核酸序列的区域互补的长度为10至30个核苷酸的连续核苷酸序列,其中所述ASO与之互补的所述核酸序列的所述区域与野生型KRAS转录物的对应区域相比包含突变。
9.如权利要求8所述的细胞外囊泡,其中所述ASO能够降低人细胞(例如,免疫细胞或肿瘤细胞)中由所述KRAS突变转录物编码的蛋白(“KRAS突变蛋白”)的表达,其中所述人细胞表达所述KRAS突变蛋白。
10.如权利要求9所述的细胞外囊泡,其中与未暴露于所述ASO的人细胞中的对应表达相比,所述KRAS突变蛋白的所述表达降低至少约30%、至少约35%、至少约40%、至少约45%、至少约50%、至少约55%、至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%或约100%。
11.如权利要求8至9中任一项所述的细胞外囊泡,其中所述ASO能够降低人细胞(例如,免疫细胞或肿瘤细胞)中的所述KRAS突变转录物的表达,其中所述人细胞表达所述KRAS突变转录物。
12.如权利要求11所述的细胞外囊泡,其中与未暴露于所述ASO的人细胞中的对应表达相比,所述KRAS突变转录物的所述表达降低至少约30%、至少约35%、至少约40%、至少约45%、至少约50%、至少约55%、至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%或约100%。
13.如权利要求1至7中任一项所述的细胞外囊泡,其中所述ASO能够降低人细胞(例如,免疫细胞或肿瘤细胞)中的野生型KRAS蛋白表达,其中所述人细胞表达所述野生型KRAS蛋白。
14.如权利要求8所述的细胞外囊泡,其中与未暴露于所述ASO的人细胞中的野生型KRAS蛋白表达相比,所述野生型KRAS蛋白表达降低至少约30%、至少约35%、至少约40%、至少约45%、至少约50%、至少约55%、至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%或约100%。
15.如权利要求1至9中任一项所述的细胞外囊泡,其中所述ASO能够降低人细胞(例如,免疫细胞或肿瘤细胞)中的野生型KRAS mRNA的水平,其中所述人细胞表达所述野生型KRASmRNA。
16.如权利要求10所述的细胞外囊泡,其中与未暴露于所述ASO的人细胞中的所述野生型KRAS mRNA的水平相比,野生型KRAS mRNA的所述水平降低至少约30%、至少约35%、至少约40%、至少约45%、至少约50%、至少约55%、至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%或约100%。
17.如权利要求1至7中任一项所述的细胞外囊泡,其中所述ASO不降低人细胞(例如,免疫细胞或肿瘤细胞)中的野生型KRAS mRNA的水平,其中所述人细胞表达所述野生型KRASmRNA。
18.如权利要求1至12中任一项所述的细胞外囊泡,其中所述ASO是间隔体、混合体或全聚体。
19.如权利要求1至13中任一项所述的细胞外囊泡,其中所述ASO包含一种或多种核苷类似物。
20.如权利要求14所述的细胞外囊泡,其中所述核苷类似物中的一者或多者包含2'-O-烷基-RNA;2'-O-甲基RNA(2'-OMe);2'-烷氧基-RNA;2'-O-甲氧基乙基-RNA(2'-MOE);2'-氨基-DNA;2'-氟-RNA;2'-氟-DNA;阿拉伯核酸(ANA);2'-氟-ANA双环核苷类似物;或它们的任何组合。
21.如权利要求14或15所述的细胞外囊泡,其中所述核苷类似物中的一者或多者是糖修饰的核苷。
22.如权利要求16所述的细胞外囊泡,其中所述糖修饰的核苷是增强亲和力的2'糖修饰的核苷。
23.如权利要求14至17中任一项所述的细胞外囊泡,其中所述核苷类似物中的一者或多者包含含有双环糖的核苷。
24.如权利要求14至18中任一项所述的细胞外囊泡,其中所述核苷类似物中的一者或多者包含LNA。
25.如权利要求14至19中任一项所述的细胞外囊泡,其中所述核苷类似物中的一者或多者选自由以下各项组成的组:约束乙基核苷(cEt)、2',4'-约束2'-O-甲氧基乙基(cMOE)、α-L-LNA、β-D-LNA、2'-O,4'-C-亚乙基-桥接核酸(ENA)、氨基-LNA、氧基-LNA、硫代-LNA以及它们的任何组合。
26.如权利要求1至20中任一项所述的细胞外囊泡,其中所述ASO包含一个或多个5'-甲基-胞嘧啶核碱基。
27.如权利要求1至21中任一项所述的细胞外囊泡,其中所述连续核苷酸序列包含与选自图1中的序列的序列互补的核苷酸序列。
28.如权利要求1至22中任一项所述的细胞外囊泡,其中所述连续核苷酸序列与所述KRAS G12D转录物内的核苷酸序列完全互补。
29.如权利要求1至23中任一项所述的细胞外囊泡,其中所述ASO包含选自SEQ ID NO:4-85的核苷酸序列,任选地具有一个或两个错配。
30.如权利要求1至24中任一项所述的细胞外囊泡,其中所述ASO具有选自LLLDnLLL、LLLLDnLLLL、LLLLLDnLLLLL、LLLMMDnMMLLL、LLLMDnMLLL、LLLLMMDnMMLLLL、LLLLMDnMLLLL、LLLLLLMMDnMMLLLLL、LLLLLLMDnMLLLLL或它们的组合的设计,其中L是核苷类似物(例如,LNA),D是DNA,M是2'-MOE,并且n可以是4与24之间(例如,3与15之间)的任何整数。
31.如权利要求1至25中任一项所述的细胞外囊泡,其中所述ASO的长度为14至20个核苷酸。
32.如权利要求1至26中任一项所述的细胞外囊泡,其中所述连续核苷酸序列包含一个或多个修饰的核苷间键联。
33.如权利要求27所述的细胞外囊泡,其中所述一个或多个修饰的核苷间键联是硫代磷酸酯键联。
34.如权利要求27或28所述的细胞外囊泡,其中至少约75%、至少约80%、至少约85%、至少约90%、至少约95%或约100%的核苷间键联是修饰的。
35.如权利要求29所述的细胞外囊泡,其中所述ASO中的所述核苷间键联中的每一者是硫代磷酸酯键联。
36.如权利要求1至30中任一项所述的细胞外囊泡,所述细胞外囊泡还包含锚定部分。
37.如权利要求31所述的细胞外囊泡,其中所述ASO连接至所述锚定部分。
38.如权利要求1至32中任一项所述的细胞外囊泡,所述细胞外囊泡还包含外源靶向部分。
39.如权利要求33所述的细胞外囊泡,其中所述外源靶向部分包括肽、抗体或其抗原结合片段、化学化合物、RNA适体或它们的任何组合。
40.如权利要求33或34所述的细胞外囊泡,其中所述外源靶向部分包括肽。
41.如权利要求33至35中任一项所述的细胞外囊泡,其中所述外源靶向部分包括微蛋白、设计的锚蛋白重复蛋白(darpin)、anticalin、adnectin、适体、肽模拟分子、受体的天然配体、骆驼纳米抗体或它们的任何组合。
42.如权利要求33至36中任一项所述的细胞外囊泡,其中所述外源靶向部分包括全长抗体、单结构域抗体、只有重链的抗体、单链抗体、只有重链的鲨鱼抗体、scFv、Fv、Fab、Fab'、F(ab')2或它们的任何组合。
43.如权利要求37所述的细胞外囊泡,其中所述抗体是单链抗体。
44.如权利要求37所述的细胞外囊泡,其中所述抗体是单结构域抗体。
45.如权利要求38所述的细胞外囊泡,其中所述单结构域抗体包括纳米抗体、vNAR或两者。
46.如权利要求33至40中任一项所述的细胞外囊泡,其中所述外源靶向部分使所述细胞外囊泡靶向肝、心、肺、脑、肾、中枢神经系统、外周神经系统、脑脊髓液(CSF)、肌肉、骨、骨髓、血液、脾脏、淋巴结、胃、食道、膈膜、膀胱、结肠、胰腺、甲状腺、唾液腺、肾上腺、垂体、乳腺、皮肤、卵巢、子宫、前列腺、睾丸、子宫颈或它们的任何组合。
47.如权利要求33至41中任一项所述的细胞外囊泡,其中所述外源靶向部分使所述细胞外囊泡靶向肿瘤细胞、树突细胞、T细胞、B细胞、巨噬细胞、NK细胞、血小板、神经元、肝细胞、造血干细胞、脂肪细胞或它们的任何组合。
48.如权利要求33至42中任一项所述的细胞外囊泡,其中所述外源靶向部分与肿瘤抗原结合。
49.如权利要求43所述的细胞外囊泡,其中所述肿瘤抗原包括间皮素、CD22、MAGEA、MAGEB、MAGEC、BAGE、GAGE、NY-ESO1、SSX、GRP78、CD33、CD123、WT1或它们的任何组合。
50.如权利要求44所述的细胞外囊泡,其中所述肿瘤抗原是间皮素。
51.如权利要求33至45中任一项所述的细胞外囊泡,所述细胞外囊泡包含将所述外源靶向部分连接至所述细胞外囊泡的支架部分。
52.如权利要求31至46中任一项所述的细胞外囊泡,其中所述锚定部分和/或所述支架部分是支架X。
53.如权利要求31至46中任一项所述的细胞外囊泡,其中所述锚定部分和/或所述支架部分是支架Y。
54.如权利要求48所述的细胞外囊泡,其中所述支架X是能够将所述ASO锚定在所述细胞外囊泡的腔表面上和/或所述细胞外囊泡的外表面上的支架蛋白。
55.如权利要求48或49所述的细胞外囊泡,其中所述支架X选自由以下各项组成的组:前列腺素F2受体负调节因子(PTGFRN蛋白);basigin(BSG蛋白);免疫球蛋白超家族成员2(IGSF2蛋白);免疫球蛋白超家族成员3(IGSF3蛋白);免疫球蛋白超家族成员8(IGSF8蛋白);整联蛋白β-1(ITGB1蛋白);整联蛋白α-4(ITGA4蛋白);4F2细胞表面抗原重链(SLC3A2蛋白);一类ATP转运蛋白(ATP1A1、ATP1A2、ATP1A3、ATP1A4、ATP1B3、ATP2B1、ATP2B2、ATP2B3、ATP2B4蛋白);它们的功能性片段;以及它们的任何组合。
56.如权利要求31至50中任一项所述的细胞外囊泡,其中所述锚定部分和/或所述支架部分是PTGFRN蛋白或其功能性片段。
57.如权利要求31至51中任一项所述的细胞外囊泡,其中所述锚定部分和/或所述支架部分包含如SEQ ID NO:302所示的氨基酸序列。
58.如权利要求31至51中任一项所述的细胞外囊泡,其中所述锚定部分和/或所述支架部分包含与SEQ ID NO:301至少50%、至少60%、至少70%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或约100%同一的氨基酸序列。
59.如权利要求48所述的细胞外囊泡,其中所述支架Y是能够将所述ASO锚定在所述细胞外囊泡的腔表面上和/或所述细胞外囊泡的外表面上的支架蛋白。
60.如权利要求48或54所述的细胞外囊泡,其中所述支架Y选自由以下各项组成的组:富含肉豆蔻酰化丙氨酸的蛋白激酶C底物(MARCKS)蛋白、富含肉豆蔻酰化丙氨酸的蛋白激酶C底物样1(MARCKSL1蛋白)、脑酸可溶性蛋白1(BASP1蛋白)、它们的功能性片段,以及它们的任何组合。
61.如权利要求48、54和55中任一项所述的细胞外囊泡,其中所述支架Y是BASP1蛋白或其功能性片段。
62.如权利要求48和54至56中任一项所述的细胞外囊泡,其中所述支架Y包含N末端结构域(ND)和效应结构域(ED),其中所述ND和/或所述ED与所述细胞外囊泡的所述腔表面缔合。
63.如权利要求57所述的细胞外囊泡,其中所述ND通过肉豆蔻酰化与所述细胞外囊泡的所述腔表面缔合。
64.如权利要求57或58所述的细胞外囊泡,其中所述ED通过离子相互作用与所述细胞外囊泡的所述腔表面缔合。
65.如权利要求57至59中任一项所述的细胞外囊泡,其中所述ED包含(i)碱性氨基酸或(ii)按顺序的两个或更多个碱性氨基酸,其中所述碱性氨基酸选自由以下各项组成的组:Lys、Arg、His以及它们的任何组合。
66.如权利要求60所述的细胞外囊泡,其中所述碱性氨基酸是(Lys)n,其中n是1与10之间的整数。
67.如权利要求57至61中任一项所述的细胞外囊泡,其中所述ED包含Lys(K)、KK、KKK、KKKK(SEQ ID NO:405)、KKKKK(SEQ ID NO:406)、Arg(R)、RR、RRR、RRRR(SEQ ID NO:407);RRRRR(SEQ ID NO:408)、KR、RK、KKR、KRK、RKK、KRR、RRK、(K/R)(K/R)(K/R)(K/R)(SEQ IDNO:409)、(K/R)(K/R)(K/R)(K/R)(K/R)(SEQ ID NO:410)或它们的任何组合。
68.如权利要求57至62中任一项所述的细胞外囊泡,其中所述ND包含如G:X2:X3:X4:X5:X6所示的氨基酸序列,其中G代表Gly;其中“:”代表肽键,其中所述X2至所述X6中的每一者独立地是氨基酸,并且其中所述X6包含碱性氨基酸。
69.如权利要求63所述的细胞外囊泡,其中:
(i)所述X2选自由Pro、Gly、Ala和Ser组成的组;
(ii)所述X4选自由Pro、Gly、Ala、Ser、Val、Ile、Leu、Phe、Trp、Tyr、Gln和Met组成的组;
(iii)所述X5选自由Pro、Gly、Ala和Ser组成的组;
(iv)所述X6选自由Lys、Arg和His组成的组;或
(v)(i)-(iv)的任何组合。
70.如权利要求57至64中任一项所述的细胞外囊泡,其中所述ND包含G:X2:X3:X4:X5:X6的氨基酸序列,其中
(i)G代表Gly;
(ii)“:”代表肽键;
(iii)所述X2是选自由Pro、Gly、Ala和Ser组成的组的氨基酸;
(iv)所述X3是氨基酸;
(v)所述X4是选自由Pro、Gly、Ala、Ser、Val、Ile、Leu、Phe、Trp、Tyr、Gln和Met组成的组的氨基酸;
(vi)所述X5是选自由Pro、Gly、Ala和Ser组成的组的氨基酸;并且
(vii)所述X6是选自由Lys、Arg和His组成的组的氨基酸。
71.如权利要求63至65中任一项所述的细胞外囊泡,其中所述X3选自由Asn、Gln、Ser、Thr、Asp、Glu、Lys、His和Arg组成的组。
72.如权利要求57至66中任一项所述的细胞外囊泡,其中所述ND和所述ED通过接头连接。
73.如权利要求67所述的细胞外囊泡,其中所述接头包含一个或多个氨基酸。
74.如权利要求57至68中任一项所述的方法,其中所述ND包含选自由以下各项组成的组的氨基酸序列:GGKLSKK(SEQ ID NO:411)、(ii)GAKLSKK(SEQ ID NO:412)、(iii)GGKQSKK(SEQ ID NO:413)、(iv)GGKLAKK(SEQ ID NO:414)、(v)GGKLSK(SEQ ID NO:415)以及(vi)它们的任何组合。
75.如权利要求69所述的细胞外囊泡,其中所述ND包含选自由以下各项组成的组的氨基酸序列:(i)GGKLSKKK(SEQ ID NO:438)、(ii)GGKLSKKS(SEQ ID NO:439)、(iii)GAKLSKKK(SEQ ID NO:440)、(iv)GAKLSKKS(SEQ ID NO:441)、(v)GGKQSKKK(SEQ ID NO:442)、(vi)GGKQSKKS(SEQ ID NO:443)、(vii)GGKLAKKK(SEQ ID NO:444)、(viii)GGKLAKKS(SEQ IDNO:445)以及(ix)它们的任何组合。
76.如权利要求57至70中任一项所述的细胞外囊泡,其中所述ND包含氨基酸序列GGKLSKK(SEQ ID NO:411)。
77.如权利要求48和54至71中任一项所述的细胞外囊泡,其中所述支架Y的长度为至少约8个、至少约9个、至少约10个、至少约11个、至少约12个、至少约13个、至少约14个、至少约15个、至少约16个、至少约17个、至少约18个、至少约19个、至少约20个、至少约21个、至少约22个、至少约23个、至少约24个、至少约25个、至少约30个、至少约35个、至少约40个、至少约45个、至少约50个、至少约55个、至少约60个、至少约65个、至少约70个、至少约75个、至少约80个、至少约85个、至少约90个、至少约95个、至少约100个、至少约105个、至少约110个、至少约120个、至少约130个、至少约140个、至少约150个、至少约160个、至少约170个、至少约180个、至少约190个或至少约200个氨基酸。
78.如权利要求48和54至72中任一项所述的细胞外囊泡,其中所述支架Y包含(i)GGKLSKKKKGYNVN(SEQ ID NO:446)、(ii)GAKLSKKKKGYNVN(SEQ ID NO:447)、(iii)GGKQSKKKKGYNVN(SEQ ID NO:448)、(iv)GGKLAKKKKGYNVN(SEQ ID NO:449)、(v)GGKLSKKKKGYSGG(SEQ ID NO:450)、(vi)GGKLSKKKKGSGGS(SEQ ID NO:451)、(vii)GGKLSKKKKSGGSG(SEQ ID NO:452)、(viii)GGKLSKKKSGGSGG(SEQ ID NO:453)、(ix)GGKLSKKSGGSGGS(SEQ ID NO:454)、(x)GGKLSKSGGSGGSV(SEQ ID NO:455)或(xi)GAKKSKKRFSFKKS(SEQ ID NO:456)。
79.如权利要求48和54至73中任一项所述的细胞外囊泡,其中所述支架Y由(i)GGKLSKKKKGYNVN(SEQ ID NO:446)、(ii)GAKLSKKKKGYNVN(SEQ ID NO:447)、(iii)GGKQSKKKKGYNVN(SEQ ID NO:448)、(iv)GGKLAKKKKGYNVN(SEQ ID NO:449)、(v)GGKLSKKKKGYSGG(SEQ ID NO:450)、(vi)GGKLSKKKKGSGGS(SEQ ID NO:451)、(vii)GGKLSKKKKSGGSG(SEQ ID NO:452)、(viii)GGKLSKKKSGGSGG(SEQ ID NO:453)、(ix)GGKLSKKSGGSGGS(SEQ ID NO:454)、(x)GGKLSKSGGSGGSV(SEQ ID NO:455)或(xi)GAKKSKKRFSFKKS(SEQ ID NO:456)组成。
80.如权利要求48和54至74中任一项所述的细胞外囊泡,其中所述支架Y在N末端不包含Met。
81.如权利要求48和54至75中任一项所述的细胞外囊泡,其中所述支架Y在所述支架蛋白的N末端包含肉豆蔻酰化氨基酸残基。
82.如权利要求76所述的细胞外囊泡,其中所述支架Y的N末端的所述氨基酸残基是Gly。
83.如权利要求31至77中任一项所述的细胞外囊泡,其中所述ASO连接至所述细胞外囊泡的所述外表面上的所述锚定部分和/或所述支架部分。
84.如权利要求31至7888中任一项所述的细胞外囊泡,其中所述ASO连接至所述细胞外囊泡的所述腔表面上的所述锚定部分和/或所述支架部分。
85.如权利要求31至79中任一项所述的细胞外囊泡,其中所述锚定部分包括甾醇、GM1、脂质、维生素、小分子、肽或它们的组合。
86.如权利要求31至80中任一项所述的细胞外囊泡,其中所述锚定部分包括胆固醇。
87.如权利要求31至81中任一项所述的细胞外囊泡,其中所述锚定部分包括磷脂、溶血磷脂、脂肪酸、维生素(例如,维生素D和/或维生素E)或它们的任何组合。
88.如权利要求31至82中任一项所述的细胞外囊泡,其中所述ASO通过接头连接至所述锚定部分和/或所述支架部分。
89.如权利要求1至83中任一项所述的细胞外囊泡,其中所述ASO通过接头连接至所述细胞外囊泡。
90.如权利要求83或84所述的细胞外囊泡,其中所述接头是多肽。
91.如权利要求83或84所述的细胞外囊泡,其中所述接头是非多肽部分。
92.如权利要求83或84所述的细胞外囊泡,其中所述接头包括乙二醇。
93.如权利要求87所述的细胞外囊泡,其中所述接头包括HEG、TEG、PEG或它们的任何组合。
94.如权利要求83或84所述的细胞外囊泡,其中所述接头包括丙烯酸亚磷酰胺(例如,ACRYDITETM)、腺苷酸化、叠氮化物(NHS酯)、地高辛(NHS酯)、胆固醇-TEG、I-LINKERTM、氨基修饰剂(例如,氨基修饰剂C6、氨基修饰剂C12、氨基修饰剂C6 dT或Uni-LinkTM氨基修饰剂)、炔烃、5'己炔基、5-辛二炔基dU、生物素化(例如,生物素、生物素(叠氮化物)、生物素dT、生物素-TEG、双生物素、PC生物素或脱硫生物素)、硫醇修饰(硫醇修饰剂C3 S-S、二硫醇或硫醇修饰剂C6 S-S)或它们的任何组合。
95.如权利要求83至89中任一项所述的细胞外囊泡,其中所述接头是可切割的接头。
96.如权利要求83至90中任一项所述的细胞外囊泡,其中所述接头包含(i)马来酰亚胺部分和(ii)缬氨酸-丙氨酸-对氨基苄基氨基甲酸酯或缬氨酸-瓜氨酸-对氨基苄基氨基甲酸酯。
97.如权利要求91所述的细胞外囊泡,其中所述接头包含缬氨酸-丙氨酸-对氨基苄基氨基甲酸酯或缬氨酸-瓜氨酸-对氨基苄基氨基甲酸酯。
98.如权利要求1至92中任一项所述的细胞外囊泡,其中所述细胞外囊泡是外泌体。
99.一种反义寡核苷酸(ASO),所述反义寡核苷酸(ASO)包含与KRAS G12D转录物(SEQID NO:1)的核苷酸5,568至5,606内的核酸序列互补的长度为10至30个核苷酸的连续核苷酸序列。
100.如权利要求94所述的ASO,其中所述连续核苷酸序列与所述KRAS G12D转录物内的所述核酸序列至少约80%、至少约85%、至少约90%、至少约95%或约100%互补。
101.如权利要求94或95所述的ASO,所述ASO能够降低人细胞(例如,免疫细胞或肿瘤细胞)中的KRAS G12D蛋白表达,其中所述人细胞表达所述KRAS G12D蛋白。
102.如权利要求96所述的ASO,其中与未暴露于所述ASO的人细胞中的KRAS G12D蛋白表达相比,所述KRAS G12D蛋白表达降低至少约30%、至少约35%、至少约40%、至少约45%、至少约50%、至少约55%、至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%或约100%。
103.如权利要求94至97中任一项所述的ASO,所述ASO能够降低人细胞(例如,免疫细胞或肿瘤细胞)中的KRAS G12D mRNA的水平,其中所述人细胞表达所述KRAS G12D mRNA。
104.如权利要求98所述的ASO,其中与未暴露于所述ASO的人细胞中的所述KRAS G12DmRNA的水平相比,KRAS G12D mRNA的所述水平降低至少约30%、至少约35%、至少约40%、至少约45%、至少约50%、至少约55%、至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%或约100%。
105.如权利要求94至99中任一项所述的ASO,所述ASO能够降低人细胞(例如,免疫细胞或肿瘤细胞)中的野生型KRAS蛋白表达,其中所述人细胞表达所述野生型KRAS蛋白。
106.如权利要求100所述的ASO,其中与未暴露于所述ASO的人细胞中的野生型KRAS蛋白表达相比,所述野生型KRAS蛋白表达降低至少约30%、至少约35%、至少约40%、至少约45%、至少约50%、至少约55%、至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%或约100%。
107.如权利要求94至101中任一项所述的ASO,所述ASO能够降低人细胞(例如,免疫细胞或肿瘤细胞)中的野生型KRAS mRNA的水平,其中所述人细胞表达所述野生型KRAS mRNA。
108.如权利要求102所述的ASO,其中与未暴露于所述ASO的人细胞中的所述野生型KRAS mRNA的水平相比,野生型KRAS mRNA的所述水平降低至少约30%、至少约35%、至少约40%、至少约45%、至少约50%、至少约55%、至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%或约100%。
109.如权利要求94至99中任一项所述的ASO,所述ASO不降低人细胞(例如,免疫细胞或肿瘤细胞)中的野生型KRAS mRNA的水平,其中所述人细胞表达所述野生型KRAS mRNA。
110.如权利要求94至104中任一项所述的ASO,所述ASO是间隔体、混合体或全聚体。
111.如权利要求94至105中任一项所述的ASO,所述ASO包含一种或多种核苷类似物。
112.如权利要求106所述的ASO,其中所述核苷类似物中的一者或多者包含2'-O-烷基-RNA;2'-O-甲基RNA(2'-OMe);2'-烷氧基-RNA;2'-O-甲氧基乙基-RNA(2'-MOE);2'-氨基-DNA;2'-氟-RNA;2'-氟-DNA;阿拉伯核酸(ANA);2'-氟-ANA双环核苷类似物(LNA);或它们的任何组合。
113.如权利要求106或107所述的ASO,其中所述核苷类似物中的一者或多者是糖修饰的核苷。
114.如权利要求108所述的ASO,其中所述糖修饰的核苷是增强亲和力的2'糖修饰的核苷。
115.如权利要求106至109中任一项所述的ASO,其中所述核苷类似物中的一者或多者包含含有双环糖的核苷。
116.如权利要求106至110中任一项所述的ASO,其中所述核苷类似物中的一者或多者包含LNA。
117.如权利要求106至110中任一项所述的ASO,其中所述核苷类似物中的一者或多者选自由以下各项组成的组:约束乙基核苷(cEt)、2',4'-约束2'-O-甲氧基乙基(cMOE)、α-L-LNA、β-D-LNA、2'-O,4'-C-亚乙基-桥接核酸(ENA)、氨基-LNA、氧基-LNA、硫代-LNA以及它们的任何组合。
118.如权利要求94至112中任一项所述的ASO,其中所述ASO包含一个或多个5'-甲基-胞嘧啶核碱基。
119.如权利要求94至113中任一项所述的ASO,其中所述ASO包含SEQ ID NO:4至SEQ IDNO:85中的任一者。
120.如权利要求94至114中任一项所述的ASO,其中所述ASO具有选自LLLDnLLL、LLLLDnLLLL、LLLLLDnLLLLL、LLLMMDnMMLLL、LLLMDnMLLL、LLLLMMDnMMLLLL、LLLLMDnMLLLL、LLLLLLMMDnMMLLLLL、LLLLLLMDnMLLLLL或它们的组合的设计,其中L是核苷类似物(例如,LNA),D是DNA,M是2'-MOE,并且n可以是4与24之间(例如,3与15之间)的任何整数。
121.如权利要求94至115中任一项所述的ASO,其中所述ASO的长度为14至20个核苷酸。
122.如权利要求94至116中任一项所述的ASO,其中所述连续核苷酸序列包含一个或多个修饰的核苷间键联。
123.如权利要求117所述的ASO,其中所述一个或多个修饰的核苷间键联是硫代磷酸酯键联。
124.如权利要求117或118所述的ASO,其中至少75%、至少80%、至少85%、至少90%、至少95%或100%的核苷间键联是修饰的。
125.如权利要求119所述的ASO,其中所述ASO中的所述核苷间键联中的每一者是硫代磷酸酯键联。
126.一种缀合物,所述缀合物包含权利要求94至120中任一项所述的ASO,其中所述ASO与至少一个非核苷酸或非多核苷酸部分共价连接。
127.如权利要求121所述的缀合物,其中所述非核苷酸或非多核苷酸部分包括蛋白质、脂肪酸链、糖残基、糖蛋白、聚合物或它们的任何组合。
128.一种细胞外囊泡,所述细胞外囊泡包含权利要求94至120中任一项所述的ASO或权利要求121或122所述的缀合物。
129.一种药物组合物,所述药物组合物包含权利要求1至83和108中任一项所述的细胞外囊泡、权利要求94至120中任一项所述的ASO或权利要求121或122所述的缀合物,以及药学上可接受的稀释剂、载体、盐或佐剂。
130.如权利要求124所述的药物组合物,其中所述药学上可接受的盐包括钠盐、钾盐、铵盐或它们的任何组合。
131.如权利要求124或125所述的药物组合物,所述药物组合物还包含至少一种另外的治疗剂。
132.如权利要求126所述的药物组合物,其中所述另外的治疗剂是KRAS G12D拮抗剂。
133.如权利要求127所述的药物组合物,其中所述KRAS G12D拮抗剂是化学化合物、siRNA、shRNA、反义寡核苷酸、蛋白质或它们的任何组合。
134.如权利要求127或128所述的药物组合物,其中所述KRAS G12D拮抗剂是抗KRASG12D抗体或其片段。
135.一种药盒,所述药盒包括权利要求1至93和123中任一项所述的细胞外囊泡、权利要求94至120中任一项所述的ASO、权利要求121或122所述的缀合物或权利要求124至129中任一项所述的药物组合物,以及使用说明书。
136.一种诊断试剂盒,所述诊断试剂盒包括权利要求1至93和123中任一项所述的细胞外囊泡、权利要求94至120中任一项所述的ASO、权利要求121或122所述的缀合物或权利要求124至129中任一项所述的药物组合物,以及使用说明书。
137.一种抑制或降低细胞中的KRAS G12D蛋白表达的方法,所述方法包括将权利要求1至93和123中任一项所述的细胞外囊泡、权利要求94至120中任一项所述的ASO、权利要求121或122所述的缀合物或权利要求124至129中任一项所述的药物组合物施用至表达KRASG12D蛋白的所述细胞,其中所述细胞中的所述KRAS G12D蛋白表达在所述施用后被抑制或降低。
138.如权利要求132所述的方法,其中在所述施用后所述ASO抑制或降低所述细胞中的KRAS G12D mRNA表达。
139.如权利要求133所述的方法,其中与未暴露于所述ASO的细胞中的KRAS G12D mRNA表达相比,在所述施用后所述KRAS G12D mRNA表达降低至少约20%、至少约30%、至少约40%、至少约50%、至少约60%、至少约70%、至少约80%、至少约90%或约100%。
140.如权利要求132至134中任一项所述的方法,其中与未暴露于所述ASO的细胞中的KRAS G12D蛋白表达相比,在所述施用后所述KRAS G12D蛋白表达降低至少约60%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或约100%。
141.一种治疗有需要的受试者的癌症的方法,所述方法包括将有效量的权利要求1至93和123中任一项所述的细胞外囊泡、权利要求94至120中任一项所述的ASO、权利要求121或122所述的缀合物或权利要求124至129中任一项所述的药物组合物施用至所述受试者。
142.权利要求1至93和123中任一项所述的细胞外囊泡、权利要求94至120中任一项所述的ASO、权利要求121或122所述的缀合物或权利要求124至129中任一项所述的药物组合物在制造用于治疗有需要的受试者的癌症的药物中的用途。
143.如权利要求1至93和123中任一项所述的细胞外囊泡、如权利要求94至120中任一项所述的ASO、如权利要求121或122所述的缀合物或如权利要求124至129中任一项所述的药物组合物,所述细胞外囊泡、所述ASO、所述缀合物或所述药物组合物用于治疗有需要的受试者的癌症。
144.如权利要求132至136中任一项所述的方法、如权利要求137所述的用途或如权利要求138使用的组合物,其中静脉内、瘤内、心内、口服、肠胃外、鞘内、脑室内、经肺、局部或心室内施用所述细胞外囊泡、所述ASO、所述缀合物或所述药物组合物。
145.如权利要求136或139所述的方法、如权利要求137或139所述的用途或如权利要求138或139使用的组合物,其中所述癌症包括结肠直肠癌、肺癌(例如,非小细胞肺癌(NSCLC))、胰腺癌(例如,胰腺导管腺癌)、白血病、子宫癌、卵巢癌、膀胱癌、胆管癌、胃癌、胃癌、睾丸癌、食道癌、胆管癌、宫颈癌、急性髓性白血病(AML)、弥漫性大B细胞淋巴瘤(DLBC)、肉瘤、黑素瘤、胶质瘤(例如,低级别胶质瘤,例如胶质母细胞瘤)、间皮瘤、肝癌、乳腺癌(例如,浸润性乳腺癌)、肾癌(例如,乳头状肾细胞癌(pRCC)和嫌色性肾细胞癌)、头颈癌、前列腺癌、腺样囊性癌(ACC)、胸腺癌、甲状腺癌、透明细胞肾细胞癌(CCRCC)、神经内分泌赘瘤(例如,嗜铬细胞瘤/副神经节瘤)、葡萄膜黑素瘤或它们的任何组合。
146.一种治疗有需要的受试者的纤维化的方法,所述方法包括将有效量的权利要求1至93和123中任一项所述的细胞外囊泡、权利要求94至120中任一项所述的ASO、权利要求121或122所述的缀合物或权利要求124至129中任一项所述的药物组合物施用至所述受试者。
147.权利要求1至93和123中任一项所述的细胞外囊泡、权利要求94至120中任一项所述的ASO、权利要求121或122所述的缀合物或权利要求124至129中任一项所述的药物组合物在制造用于治疗有需要的受试者的纤维化的药物中的用途。
148.如权利要求1至93和123中任一项所述的细胞外囊泡、如权利要求94至120中任一项所述的ASO、如权利要求121或122所述的缀合物或如权利要求124至129中任一项所述的药物组合物,所述细胞外囊泡、所述ASO、所述缀合物或所述药物组合物用于治疗有需要的受试者的纤维化。
149.如权利要求141所述的方法、如权利要求142所述的用途或如权利要求1438使用的组合物,其中静脉内、瘤内、心内、口服、肠胃外、鞘内、脑室内、经肺、局部或心室内施用所述细胞外囊泡、所述ASO、所述缀合物或所述药物组合物。
150.如权利要求141或144所述的方法、如权利要求142或144所述的用途或如权利要求143或144使用的组合物,其中所述纤维化包括肝纤维化(NASH)、肝硬化、肺纤维化、囊性纤维化、慢性溃疡性结肠炎/IBD、膀胱纤维化、肾纤维化、CAPS(穆-韦二氏综合征)、心房纤维化、心内膜心肌纤维化、陈旧性心肌梗死、胶质瘢痕、动脉僵硬、关节纤维化、克罗恩氏病、迪皮特伦氏挛缩、瘢痕疙瘩纤维化、纵隔纤维化、骨髓纤维化、佩罗尼氏病、肾原性系统性纤维化、进行性大块纤维化、腹膜后纤维化、硬皮病/系统性硬化、粘连性关节囊炎、1型神经纤维瘤病(NF1)或它们的任何组合。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201962886885P | 2019-08-14 | 2019-08-14 | |
US62/886,885 | 2019-08-14 | ||
PCT/US2020/046564 WO2021030781A1 (en) | 2019-08-14 | 2020-08-14 | Extracellular vesicles with antisense oligonucleotides targeting kras |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114641570A true CN114641570A (zh) | 2022-06-17 |
Family
ID=72243267
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202080070752.9A Pending CN114641570A (zh) | 2019-08-14 | 2020-08-14 | 具有靶向kras的反义寡核苷酸的细胞外囊泡 |
Country Status (6)
Country | Link |
---|---|
US (1) | US20230018254A1 (zh) |
EP (1) | EP4013872A1 (zh) |
JP (1) | JP2022544290A (zh) |
CN (1) | CN114641570A (zh) |
CA (1) | CA3147701A1 (zh) |
WO (1) | WO2021030781A1 (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114729366A (zh) * | 2019-08-14 | 2022-07-08 | 科迪亚克生物科学公司 | 靶向CEBP/β的细胞外囊泡-ASO构建体 |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2021237100A1 (en) | 2020-05-21 | 2021-11-25 | Codiak Biosciences, Inc. | Methods of targeting extracellular vesicles to lung |
US20240360181A1 (en) * | 2021-05-20 | 2024-10-31 | Achelois Biopharma, Inc. | Compositions and methods for multivalent surface display on enveloped particles |
JP2024519945A (ja) * | 2021-05-20 | 2024-05-21 | アチェロイス バイオファーマ,インク. | 免疫チェックポイント多価粒子の組成物、および使用方法 |
JPWO2023286836A1 (zh) * | 2021-07-16 | 2023-01-19 | ||
KR20240082391A (ko) | 2021-10-14 | 2024-06-10 | 론자 세일즈 아게 | 세포외 소포 생산을 위한 변형된 생산자 세포 |
WO2023172208A1 (en) * | 2022-03-11 | 2023-09-14 | National University Of Singapore | Vesicle-based compositions and uses thereof |
CN119855910A (zh) * | 2022-07-06 | 2025-04-18 | 美国微哲默理有限责任公司 | 用于治疗胰腺癌的组合物和方法 |
Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102796817A (zh) * | 2012-07-06 | 2012-11-28 | 陕西北美基因股份有限公司 | 一种快速检测kras基因突变的方法 |
WO2016201323A1 (en) * | 2015-06-10 | 2016-12-15 | Board Of Regents, The University Of Texas System | Use of exosomes for the treatment of disease |
WO2017053722A1 (en) * | 2015-09-24 | 2017-03-30 | Ionis Pharmaceuticals, Inc. | Modulators of kras expression |
WO2017161010A1 (en) * | 2016-03-15 | 2017-09-21 | Codiak Biosciences, Inc. | Therapeutic membrane vesicles |
WO2018102397A1 (en) * | 2016-11-29 | 2018-06-07 | PureTech Health LLC | Exosomes for delivery of therapeutic agents |
WO2018129622A1 (en) * | 2017-01-13 | 2018-07-19 | Wang Yuzhuo | Dual targeting antisense oligonucleotides for use as apoptotic inhibitors for the treatment of cancer |
US20190117792A1 (en) * | 2017-08-25 | 2019-04-25 | Codiak Biosciences, Inc. | Preparation of therapeutic exosomes using membrane proteins |
CN109689031A (zh) * | 2016-07-11 | 2019-04-26 | 医福斯治疗有限公司 | Ev的代谢药物装载 |
WO2019099942A1 (en) * | 2017-11-17 | 2019-05-23 | Codiak Biosciences, Inc. | Compositions of engineered exosomes and methods of loading luminal exosomes payloads |
US20190175506A1 (en) * | 2017-11-17 | 2019-06-13 | Codiak Biosciences, Inc. | Loading of Extracellular Vesicles through Imparting of Mechanical Shear |
WO2019122282A1 (en) * | 2017-12-22 | 2019-06-27 | Roche Innovation Center Copenhagen A/S | Gapmer oligonucleotides comprising a phosphorodithioate internucleoside linkage |
Family Cites Families (39)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO1981001145A1 (en) | 1979-10-18 | 1981-04-30 | Univ Illinois | Hydrolytic enzyme-activatible pro-drugs |
US4683195A (en) | 1986-01-30 | 1987-07-28 | Cetus Corporation | Process for amplifying, detecting, and/or-cloning nucleic acid sequences |
JP3756313B2 (ja) | 1997-03-07 | 2006-03-15 | 武 今西 | 新規ビシクロヌクレオシド及びオリゴヌクレオチド類縁体 |
CA2303299C (en) | 1997-09-12 | 2016-02-23 | Exiqon A/S | Oligonucleotide analogues |
CA2361318C (en) | 1999-02-12 | 2008-11-25 | Sankyo Company, Limited | Novel nucleosides and oligonucleotide analogues |
KR100782896B1 (ko) | 1999-05-04 | 2007-12-06 | 엑시콘 에이/에스 | L-리보-lna 유사체 |
US6617442B1 (en) | 1999-09-30 | 2003-09-09 | Isis Pharmaceuticals, Inc. | Human Rnase H1 and oligonucleotide compositions thereof |
US7091186B2 (en) | 2001-09-24 | 2006-08-15 | Seattle Genetics, Inc. | p-Amidobenzylethers in drug delivery agents |
DK2284269T3 (en) | 2002-11-18 | 2017-10-23 | Roche Innovation Ct Copenhagen As | Antisense design |
WO2005082023A2 (en) | 2004-02-23 | 2005-09-09 | Genentech, Inc. | Heterocyclic self-immolative linkers and conjugates |
US7691962B2 (en) | 2004-05-19 | 2010-04-06 | Medarex, Inc. | Chemical linkers and conjugates thereof |
TW200616604A (en) | 2004-08-26 | 2006-06-01 | Nicholas Piramal India Ltd | Nitric oxide releasing prodrugs containing bio-cleavable linker |
US20060269480A1 (en) | 2005-05-31 | 2006-11-30 | Ramot At Tel Aviv University Ltd. | Multi-triggered self-immolative dendritic compounds |
US8142781B2 (en) | 2005-10-07 | 2012-03-27 | Armagen Technologies, Inc. | Fusion proteins for blood-brain barrier delivery |
PL2314594T3 (pl) | 2006-01-27 | 2014-12-31 | Isis Pharmaceuticals Inc | Zmodyfikowane w pozycji 6 analogi bicykliczne kwasów nukleinowych |
EP2397551A1 (en) | 2006-05-05 | 2011-12-21 | Isis Pharmaceuticals, Inc. | Compounds and methods for modulating expression of PCSK9 |
US7666854B2 (en) | 2006-05-11 | 2010-02-23 | Isis Pharmaceuticals, Inc. | Bis-modified bicyclic nucleic acid analogs |
WO2007134181A2 (en) | 2006-05-11 | 2007-11-22 | Isis Pharmaceuticals, Inc. | 5'-modified bicyclic nucleic acid analogs |
US8748567B2 (en) | 2006-05-22 | 2014-06-10 | Children's Medical Center Corporation | Method for delivery across the blood brain barrier |
AU2007285782B2 (en) | 2006-08-18 | 2010-06-24 | Arrowhead Research Corporation | Polyconjugates for in vivo delivery of polynucleotides |
TWI412367B (zh) | 2006-12-28 | 2013-10-21 | Medarex Llc | 化學鏈接劑與可裂解基質以及其之綴合物 |
WO2008113832A2 (en) | 2007-03-22 | 2008-09-25 | Santaris Pharma A/S | SHORT RNA ANTAGONIST COMPOUNDS FOR THE MODULATION OF TARGET mRNA |
CA2688321A1 (en) | 2007-05-30 | 2008-12-11 | Isis Pharmaceuticals, Inc. | N-substituted-aminomethylene bridged bicyclic nucleic acid analogs |
ES2386492T3 (es) | 2007-06-08 | 2012-08-21 | Isis Pharmaceuticals, Inc. | Análogos de ácidos nucleicos bicíclicos carbocíclicos |
ATE538127T1 (de) | 2007-07-05 | 2012-01-15 | Isis Pharmaceuticals Inc | 6-disubstituierte bicyclische nukleinsäureanaloga |
US8546556B2 (en) | 2007-11-21 | 2013-10-01 | Isis Pharmaceuticals, Inc | Carbocyclic alpha-L-bicyclic nucleic acid analogs |
WO2010036698A1 (en) | 2008-09-24 | 2010-04-01 | Isis Pharmaceuticals, Inc. | Substituted alpha-l-bicyclic nucleosides |
WO2011017521A2 (en) | 2009-08-06 | 2011-02-10 | Isis Pharmaceuticals, Inc. | Bicyclic cyclohexose nucleic acid analogs |
WO2011048125A1 (en) | 2009-10-20 | 2011-04-28 | Santaris Pharma A/S | Oral delivery of therapeutically effective lna oligonucleotides |
WO2011156202A1 (en) | 2010-06-08 | 2011-12-15 | Isis Pharmaceuticals, Inc. | Substituted 2 '-amino and 2 '-thio-bicyclic nucleosides and oligomeric compounds prepared therefrom |
NZ724348A (en) | 2010-11-30 | 2019-12-20 | Genentech Inc | Low affinity blood brain barrier receptor antibodies and uses therefor |
HK1198766A1 (zh) | 2011-09-07 | 2015-06-05 | 玛瑞纳生物技术有限公司 | 具有構象限制的單體的核酸化合物的合成和用途 |
WO2013036889A1 (en) | 2011-09-09 | 2013-03-14 | University Of Washington | Retrograde transport peptide and use of same for delivery to central nervous system |
US9221864B2 (en) | 2012-04-09 | 2015-12-29 | Isis Pharmaceuticals, Inc. | Tricyclic nucleic acid analogs |
JP6283661B2 (ja) * | 2012-05-09 | 2018-02-21 | ストライク バイオ インク.Strike Bio,Inc. | 一塩基KRAS変異に特異的な二機能性低分子ヘアピン型RNA(BI−SHRNA,Bi−functionalShort−HairpinRNA) |
DK2895200T3 (da) | 2012-09-14 | 2020-02-10 | Translate Bio Ma Inc | Multimeriske oligonukleotidforbindelser |
EP3218411B1 (en) | 2014-11-14 | 2022-01-12 | Ossianix, Inc. | Variable new antigen receptors (vnars) directed against transferrin receptor (tfr) and their use |
WO2020101740A1 (en) * | 2018-11-16 | 2020-05-22 | Codiak Biosciences, Inc. | Engineered extracellular vesicles and uses thereof |
CN119614501A (zh) * | 2018-02-12 | 2025-03-14 | 隆萨销售股份公司 | 用于巨噬细胞极化的方法和组合物 |
-
2020
- 2020-08-14 US US17/635,298 patent/US20230018254A1/en active Pending
- 2020-08-14 WO PCT/US2020/046564 patent/WO2021030781A1/en unknown
- 2020-08-14 JP JP2022508819A patent/JP2022544290A/ja active Pending
- 2020-08-14 CN CN202080070752.9A patent/CN114641570A/zh active Pending
- 2020-08-14 EP EP20762007.1A patent/EP4013872A1/en active Pending
- 2020-08-14 CA CA3147701A patent/CA3147701A1/en active Pending
Patent Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102796817A (zh) * | 2012-07-06 | 2012-11-28 | 陕西北美基因股份有限公司 | 一种快速检测kras基因突变的方法 |
WO2016201323A1 (en) * | 2015-06-10 | 2016-12-15 | Board Of Regents, The University Of Texas System | Use of exosomes for the treatment of disease |
CN107980004A (zh) * | 2015-06-10 | 2018-05-01 | 得克萨斯州大学系统董事会 | 用于医治疾病的外泌体的用途 |
WO2017053722A1 (en) * | 2015-09-24 | 2017-03-30 | Ionis Pharmaceuticals, Inc. | Modulators of kras expression |
CN109071597A (zh) * | 2016-03-15 | 2018-12-21 | 科迪艾克生物科学公司 | 治疗性膜囊泡 |
WO2017161010A1 (en) * | 2016-03-15 | 2017-09-21 | Codiak Biosciences, Inc. | Therapeutic membrane vesicles |
CN109689031A (zh) * | 2016-07-11 | 2019-04-26 | 医福斯治疗有限公司 | Ev的代谢药物装载 |
WO2018102397A1 (en) * | 2016-11-29 | 2018-06-07 | PureTech Health LLC | Exosomes for delivery of therapeutic agents |
WO2018129622A1 (en) * | 2017-01-13 | 2018-07-19 | Wang Yuzhuo | Dual targeting antisense oligonucleotides for use as apoptotic inhibitors for the treatment of cancer |
US20190117792A1 (en) * | 2017-08-25 | 2019-04-25 | Codiak Biosciences, Inc. | Preparation of therapeutic exosomes using membrane proteins |
WO2019099942A1 (en) * | 2017-11-17 | 2019-05-23 | Codiak Biosciences, Inc. | Compositions of engineered exosomes and methods of loading luminal exosomes payloads |
US20190175506A1 (en) * | 2017-11-17 | 2019-06-13 | Codiak Biosciences, Inc. | Loading of Extracellular Vesicles through Imparting of Mechanical Shear |
WO2019122282A1 (en) * | 2017-12-22 | 2019-06-27 | Roche Innovation Center Copenhagen A/S | Gapmer oligonucleotides comprising a phosphorodithioate internucleoside linkage |
Non-Patent Citations (2)
Title |
---|
KYEONGSOO JEONG等: "Exosome-based antisense locked nucleic acid delivery for inhibition of type II collagen degradation in chondrocyte", JOURNAL OF INDUSTRIAL AND ENGINEERING CHEMISTRY, vol. 74, 1 March 2019 (2019-03-01), pages 126 - 135, XP085649982, DOI: 10.1016/j.jiec.2019.02.017 * |
张学军等主编: "《现代皮肤性病学进展》", 30 April 1997, 安徽科学技术出版社, pages: 183 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114729366A (zh) * | 2019-08-14 | 2022-07-08 | 科迪亚克生物科学公司 | 靶向CEBP/β的细胞外囊泡-ASO构建体 |
Also Published As
Publication number | Publication date |
---|---|
US20230018254A1 (en) | 2023-01-19 |
JP2022544290A (ja) | 2022-10-17 |
WO2021030781A1 (en) | 2021-02-18 |
EP4013872A1 (en) | 2022-06-22 |
CA3147701A1 (en) | 2021-02-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN114641570A (zh) | 具有靶向kras的反义寡核苷酸的细胞外囊泡 | |
CN114729356A (zh) | 靶向stat6的细胞外囊泡-aso构建体 | |
CN114728078A (zh) | 与分子连接的细胞外囊泡及其用途 | |
CN114729366A (zh) | 靶向CEBP/β的细胞外囊泡-ASO构建体 | |
CN114729327A (zh) | 具有stat3反义寡核苷酸的细胞外囊泡 | |
CN114829586A (zh) | 细胞外囊泡-nlrp3拮抗剂 | |
WO2022076596A1 (en) | Extracellular vesicle-aso constructs targeting stat6 | |
WO2021184021A1 (en) | Extracellular vesicle-aso constructs targeting pmp22 | |
KR20220035137A (ko) | Ppm1a 억제제 및 그의 사용 방법 | |
KR20230147125A (ko) | 세포외 소포-nlrp3 길항제 | |
TW202424190A (zh) | 靶向CEBP/β之細胞外囊泡-ASO構築體 | |
WO2024118592A2 (en) | Methods of using extracellular vesicle-aso targeting stat6 | |
EP4547259A2 (en) | Methods of using extracellular vesicle-aso targeting stat6 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20231228 Address after: Basel, SUI Applicant after: Lhasa Sales Co.,Ltd. Address before: Massachusetts, USA Applicant before: Codiak BioSciences, Inc. |
|
TA01 | Transfer of patent application right |