CN116406305A - Shank3基因治疗方法 - Google Patents
Shank3基因治疗方法 Download PDFInfo
- Publication number
- CN116406305A CN116406305A CN202180070681.7A CN202180070681A CN116406305A CN 116406305 A CN116406305 A CN 116406305A CN 202180070681 A CN202180070681 A CN 202180070681A CN 116406305 A CN116406305 A CN 116406305A
- Authority
- CN
- China
- Prior art keywords
- seq
- leu
- pro
- gly
- ser
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/46—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
- C07K14/47—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
- C07K14/4701—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals not used
- C07K14/4702—Regulators; Modulating activity
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01K—ANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
- A01K67/00—Rearing or breeding animals, not otherwise provided for; New or modified breeds of animals
- A01K67/027—New or modified breeds of vertebrates
- A01K67/0275—Genetically modified vertebrates, e.g. transgenic
- A01K67/0276—Knock-out vertebrates
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K48/00—Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
- A61K48/005—Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'active' part of the composition delivered, i.e. the nucleic acid delivered
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K48/00—Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
- A61K48/005—Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'active' part of the composition delivered, i.e. the nucleic acid delivered
- A61K48/0058—Nucleic acids adapted for tissue specific expression, e.g. having tissue specific promoters as part of a contruct
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K48/00—Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
- A61K48/005—Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'active' part of the composition delivered, i.e. the nucleic acid delivered
- A61K48/0066—Manipulation of the nucleic acid to modify its expression pattern, e.g. enhance its duration of expression, achieved by the presence of particular introns in the delivered nucleic acid
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K48/00—Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
- A61K48/0075—Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the delivery route, e.g. oral, subcutaneous
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P25/00—Drugs for disorders of the nervous system
- A61P25/18—Antipsychotics, i.e. neuroleptics; Drugs for mania or schizophrenia
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/85—Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
- C12N15/86—Viral vectors
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01K—ANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
- A01K2217/00—Genetically modified animals
- A01K2217/07—Animals genetically altered by homologous recombination
- A01K2217/075—Animals genetically altered by homologous recombination inducing loss of function, i.e. knock out
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01K—ANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
- A01K2227/00—Animals characterised by species
- A01K2227/10—Mammal
- A01K2227/105—Murine
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01K—ANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
- A01K2267/00—Animals characterised by purpose
- A01K2267/03—Animal model, e.g. for test or diseases
- A01K2267/0306—Animal model for genetic diseases
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01K—ANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
- A01K2267/00—Animals characterised by purpose
- A01K2267/03—Animal model, e.g. for test or diseases
- A01K2267/035—Animal model for multifactorial diseases
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2740/00—Reverse transcribing RNA viruses
- C12N2740/00011—Details
- C12N2740/10011—Retroviridae
- C12N2740/16011—Human Immunodeficiency Virus, HIV
- C12N2740/16041—Use of virus, viral particle or viral elements as a vector
- C12N2740/16043—Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2750/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
- C12N2750/00011—Details
- C12N2750/14011—Parvoviridae
- C12N2750/14111—Dependovirus, e.g. adenoassociated viruses
- C12N2750/14141—Use of virus, viral particle or viral elements as a vector
- C12N2750/14143—Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2830/00—Vector systems having a special element relevant for transcription
- C12N2830/008—Vector systems having a special element relevant for transcription cell type or tissue specific enhancer/promoter combination
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Engineering & Computer Science (AREA)
- Genetics & Genomics (AREA)
- General Health & Medical Sciences (AREA)
- Biotechnology (AREA)
- Molecular Biology (AREA)
- Organic Chemistry (AREA)
- Medicinal Chemistry (AREA)
- Veterinary Medicine (AREA)
- Animal Behavior & Ethology (AREA)
- Zoology (AREA)
- Biochemistry (AREA)
- Public Health (AREA)
- Pharmacology & Pharmacy (AREA)
- Biomedical Technology (AREA)
- Epidemiology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biophysics (AREA)
- General Engineering & Computer Science (AREA)
- Wood Science & Technology (AREA)
- Toxicology (AREA)
- Gastroenterology & Hepatology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Environmental Sciences (AREA)
- Microbiology (AREA)
- Virology (AREA)
- Physics & Mathematics (AREA)
- Plant Pathology (AREA)
- Animal Husbandry (AREA)
- Biodiversity & Conservation Biology (AREA)
- Psychiatry (AREA)
- Neurology (AREA)
- Neurosurgery (AREA)
- Chemical Kinetics & Catalysis (AREA)
- General Chemical & Material Sciences (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
- Medicines Containing Material From Animals Or Micro-Organisms (AREA)
Abstract
本公开的方面涉及编码Shank3蛋白的非天然存在的多核苷酸、包含该多核苷酸的AAV载体,和基因治疗方法。
Description
相关申请的交叉引用
本申请根据35U.S.C.§119(e)要求享有2020年8月17日提交的名称为“Shank3基因治疗方法”的美国临时申请号63/066,570的权益,其全部公开内容通过引用整体并入本文。
对通过EFS-WEB以文本文件形式提交的序列表的引用
本申请含有已经通过EFS-Web以ASCII格式递交并通过引用整体并入本文的序列表。所述ASCII副本于2021年8月16日创建,被命名为B119570108WO00-SEQ-SXT,并且大小为151,434字节。
技术领域
本公开涉及基因治疗方法,该基因治疗方法用于将编码Shank3蛋白的多核苷酸递送至患有、怀疑患有或有风险患有神经发育障碍的受试者。
背景技术
涉及Shank3的缺失和/或突变占所有自闭症谱系障碍(ASD)患者的约0.5-1%和有智力残疾(ID)的ASD患者的约2%。然而,缺乏对ASD和/或ID的有效治疗。开发能纠正与ASD和ID有关的多种病理学的药物治疗面临一些挑战。
发明概述
本公开的方面涉及开发用于具有Shank3突变的受试者的有效基因治疗方法。
本公开的方面涉及编码Shank3蛋白的非天然存在的多核苷酸,其中该Shank3蛋白包含SH3结构域、PDZ结构域、Homer结合结构域、Cortactin结合结构域和SAM结构域。在一些实施方案中,该SH3结构域包含与SEQ ID NO:6的474-525残基至少90%的同一性或与SEQID NO:5的473-524残基至少90%的同一性。在一些实施方案中,该PDZ结构域包含与SEQ IDNO:6的573-662残基至少90%的同一性或与SEQ ID NO:5的572-661残基至少90%的同一性。在一些实施方案中,该Homer结合结构域包含与SEQ ID NO:5或6的1294-1323残基至少90%的同一性。在一些实施方案中,该Cortactin结合结构域包含与SEQ ID NO:5或6的1400-1426残基至少90%的同一性。在一些实施方案中,该SAM结构域包含与SEQ ID NO:6的1664-1729残基至少90%的同一性或与SEQ ID NO:5的1663-1728残基至少90%的同一性。在一些实施方案中,该多核苷酸小于4.7kb。
在一些实施方案中,该多核苷酸进一步包含富脯氨酸区。在一些实施方案中,该SH3结构域包含SEQ ID NO:6的474-525残基或SEQ ID NO:5的473-524残基,该PDZ结构域包含SEQ ID NO:6的573-662残基或SEQ ID NO:5的572-661残基,该Homer结合结构域包含SEQID NO:5或6的1294-1323残基,该Cortactin结合结构域包含SEQ ID NO:5或6的1400-1426残基和/或该SAM结构域包含SEQ ID NO:6的1664-1729残基或SEQ ID NO:5的1663-1728残基。
在一些实施方案中,该多核苷酸包含与SEQ ID NO:1或2至少90%的同一性。在一些实施方案中,该多核苷酸包含SEQ ID NO:1或2。
在一些实施方案中,由所述多核苷酸编码的所述Shank3蛋白进一步包含锚蛋白重复结构域。在一些实施方案中,所述锚蛋白重复结构域包含与SEQ ID NO:6的148-345残基至少90%的同一性或与SEQ ID NO:5的147-313残基至少90%的同一性。在一些实施方案中,所述锚蛋白重复结构域包含SEQ ID NO:6的148-345残基或SEQ ID NO:5的147-313残基。
在一些实施方案中,该多核苷酸包含与SEQ ID NO:3或4至少90%的同一性。在一些实施方案中,该多核苷酸包含SEQ ID NO:3或4。
在一些实施方案中,该多核苷酸小于约4.6kb、4.5kb、4.4kb、4.3kb、4.2kb、4.1kb、4.0kb、3.9kb、3.8kb、3.7kb、3.6kb、3.5kb、3.4kb、3.3kb、3.2kb、3.1kb、3.0kb、2.9kb、2.8kb、2.7kb、2.6kb、2.5kb、2.4kb、2.3kb、2.2kb或2.1kb。
在一些实施方案中,该Shank3蛋白在SEQ ID NO:5或6的全长上与SEQ ID NO:5或6小于65%相同。
在一些实施方案中,所述Shank3蛋白包含与SEQ ID NO:17-20中任一项至少90%相同的氨基酸序列。在一些实施方案中,所述Shank3蛋白包含SEQ ID NO:17-20中任一项的氨基酸序列。
本公开的其他方面涉及由本文公开的多核苷酸编码的Shank3蛋白。
本公开的其他方面涉及包含本文描述的多核苷酸的载体。在一些实施方案中,该载体是病毒载体。在一些实施方案中,该载体是AAV载体。在一些实施方案中,载体包含可操作地连接至本文描述的多核苷酸的启动子。在一些实施方案中,该多核苷酸两侧是AAV反向末端重复序列(ITR)。在一些实施方案中,该AAV载体包含与SEQ ID NO:7或21至少90%相同的序列,并且该序列编码具有Shank3活性的蛋白。在一些实施方案中,该AAV载体包含SEQID NO:7或21的序列,并且该序列编码具有Shank3活性的蛋白。在一些实施方案中,该AAV载体包含与SEQ ID NO:2或4至少90%相同的序列,并且该序列编码具有Shank3活性的蛋白。在一些实施方案中,该AAV载体包含SEQ ID NO:2或4的序列,该序列编码具有Shank3活性的蛋白。在一些实施方案中,该AAV载体包含与SEQ ID NO:1或3至少90%相同的序列,并且该序列编码具有Shank3活性的蛋白。在一些实施方案中,该AAV载体包含SEQ ID NO:1或3的序列,该序列编码具有Shank3活性的蛋白。
本公开的其他方面涉及AAV颗粒,其包含AAV载体和衣壳蛋白,其中该衣壳蛋白具有选自AAV1、2、5、6、8、9、rh10和PHP.eB的血清型。在一些实施方案中,该血清型是AAV9。在一些实施方案中,该血清型是AAV10。在一些实施方案中,该血清型是PHP.eB。
在一些实施方案中,该AAV载体进一步包含启动子。在一些实施方案中,该启动子是人启动子。在一些实施方案中,该启动子是hSyn1。
本公开的其他方面涉及方法,该方法包括将本文描述的AAV载体或AAV颗粒施用至有需要的受试者。在一些实施方案中,该受试者是人受试者。在一些实施方案中,该人受试者是成人。在一些实施方案中,该人受试者不是成人。在一些实施方案中,该人受试者不大于25岁。在一些实施方案中,该人受试者为10岁或更年轻。在一些实施方案中,该受试者患有、疑似患有或有风险患有神经发育障碍。在一些实施方案中,该受试者患有、疑似患有或有风险患有自闭症谱系障碍(ASD)。在一些实施方案中,该受试者表现出ASD的一种或多种症状。在一些实施方案中,该受试者患有、疑似患有或有风险患有费伦-麦克德米德(Phelan-McDermid)综合症。在一些实施方案中,该受试者表现出发育迟缓、智力残疾(ID)、睡眠障碍、肌张力减退、言语缺乏或语言迟缓中的一种或多种。
本公开的其他方面涉及治疗患有神经发育障碍的受试者的方法。在一些实施方案中,本公开涉及治疗患有自闭症谱系障碍(ASD)的受试者的方法。在一些实施方案中,本公开涉及治疗患有费伦-麦克德米德综合症的受试者的方法。在一些实施方案中,该治疗方法包括向受试者施用有效量的包含AAV载体的组合物,该AAV载体包含编码Shank3蛋白的多核苷酸。在一些实施方案中,该组合物在药物可接受的载体中。
在一些实施方案中,递送该AAV载体至该受试者的脑。在一些实施方案中,递送该AAV载体至该受试者的皮层、纹状体和/或丘脑。
在一些实施方案中,该受试者具有、疑似具有或有风险具有相对于对照受试者的Shank3基因表达减少。在一些实施方案中,该对照受试者是不患有、不疑似患有、或没风险患有神经发育障碍、自闭症谱系障碍(ASD)和/或费伦-麦克德米德综合症的受试者。在一些实施方案中,所述Shank3基因表达减少由Shank3基因的至少一个拷贝的破坏导致。在一些实施方案中,Shank3基因的破坏包含所述Shank3基因的至少一个拷贝的缺失。在一些实施方案中,Shank3基因的破坏包含在Shank3基因的至少一个拷贝内的一个或多个突变。
本公开的其他方面涉及MiniShank3蛋白,其包含与SEQ ID NO:17-20中任一项至少80%、至少85%、至少90%、或至少95%相同的序列。在一些实施方案中,该MiniShank3蛋白包含SEQ ID NO:17-20中任一项的序列。
附图说明
图1A-1B示出了Shank3B-/-小鼠的皮肤损伤和梳理增加。
图2A-2C示出了Shank3B突变小鼠显示出社交互动缺陷。图2A中“陌生小鼠1”表示测试过与测试动物的社交接触行为的伙伴。图2A中“陌生小鼠2”表示被引入先前空的有线笼的新手社交伙伴。S1:陌生小鼠1;S2:陌生小鼠2;E:空笼。
图3A-图3C示出了在纹状体PSD中显示出改变的分子组成的Shank3B-/-小鼠。
图4A-4E示出了Shank3B突变小鼠中皮层-纹状体突触缺陷。PPR:双脉冲比率。
图5A-5C示出了miniShank3-v1的设计。图5A示出了全长Shank3的蛋白结构域图。图5B示出了本公开提供的miniShank3-v1的示意图。图5C示出了具有人突触蛋白-1启动子(hSyn-1)的带GFP标签的miniShank3-v1的示意图。ANK,锚蛋白重复;SH3,src同源3结构域;PDZ,PDZ结构域;Pro,富脯氨酸结构域;HBD,Homer结合结构域;CBD,Cortactin结合结构域;SAM,无菌α基序(sterile alpha motif)。
图6A-6C示出了miniShank3-v2的设计。图6A示出了全长Shank3的蛋白结构域图。图6B示出了本公开提供的miniShank3-v2的示意图。图6C示出了具有人突触蛋白-1启动子(hSyn-1)的带GFP标签的miniShank3-v2的示意图。ANK,锚蛋白重复;SH3,src同源3结构域;PDZ,PDZ结构域;Pro,富脯氨酸结构域;HBD,Homer结合结构域;CBD,Cortactin结合结构域;SAM,无菌α基序。
图7A-7H示出了GFP-miniShank3-v1定位于突触。转染HSyn1-GFP-miniShank3-v1至皮层-纹状体共培养物中的纹状体中型多刺神经元(MSN)。图7A示出了在MSN中表达的GFP-miniShank3-v1;图7B-7C示出了用PSD95染色以标记突触(图7B)和用MAP2染色以示出树突(图7C)的相同培养物。图7D示出了图7A-7C的合并图像。图7E-7H示出了来自图7A-7D的高倍放大图像以使用PSD95(图7F)示出在树突(图7G)和合并图像中的树突棘(图7H)上GFP-miniShank3-v1(图7E)的精确定位。
图8示出了在出生后0天面部静脉注射后存在GFP-miniShank3-v1的有效表达。用6.42E+11病毒基因组(vg)每只小鼠的量注射P0小鼠。在AAV注射2月后收集小鼠脑并对脑进行切片以观察GFP表达。
图9A-9F示出了在P0单次静脉注射AAV-miniShank3-v1挽救Shank3缺陷小鼠的PSD蛋白缺陷。图9A示出了AAV介导的miniShank3-v1基因治疗实验的时间线和实验组。图9B提供了示出纹状体突触质膜(SPM)部分中miniShank3表达的蛋白印迹(Western blot),该纹状体突触质膜(SPM)部分制备自注射AAV-GFP的野生型小鼠(WT)、注射AAV-GFP的InsG3680+/+小鼠(突变体)、注射AAV-GFP-miniShank3-v1的InsG3680+/+小鼠(miniShank3)、表达编码GFP-miniShank3-v1的cDNA质粒的HEK293细胞的裂解物(HEK293-a)和表达编码GFP-p2AminiShank3-v1的cDNA质粒的HEK293细胞的裂解物(HEK293-b),该蛋白印迹使用抗-Shank3抗体进行检测。图9C和9E示出了通过特定抗体在纹状体(图9C)和皮层(图9E)SPM部分中检测到的代表性蛋白印迹,该纹状体和皮层SPM部分来自注射AAV的小鼠:注射AAV-GFP的野生型小鼠(WT)、注射AAV-GFP的InsG3680+/+小鼠(突变体)、和注射AAV-GFP-miniShank3-v1的InsG3680+/+小鼠(miniShank3)。图9D和9F示出了相对于纹状体(图9D)和皮层(图9F)SPM中微管蛋白表达量进行归一化的蛋白质相对水平的量化。(n=每个基因型每个蛋白4个样本,每个n来自两只小鼠的混合组织)。注意突变体中PSD蛋白水平在MiniShank3组中恢复到野生型水平。*p<0.05,**p<0.01,***p<0.001,带Bonferroni post-hoc检验的单向ANOVA(图9D和9F)。
图10A-10B示出了在P0单次静脉注射AAV-miniShank3-v1挽救Shank3缺陷小鼠的纹状体突触缺陷。图10A示出了在注射了miniShank3-v1的动物中,突变小鼠的纹状体突然尖峰(pop spike)波幅降低得到挽救。图10B示出了来自经过指定治疗的小鼠的代表性皮层-纹状体突然尖峰痕迹。
图11A-11E示出了在P0系统性递送miniShank3-v1挽救Shank3缺陷小鼠的行为缺失。图11A示出了在社交互动测试中,相比于对照组,突变小鼠对陌生小鼠(S)没有表现出对新物体(O)的偏好。通过miniShank3治疗挽救该行为。图11B示出了miniShank3治疗拯救突变小鼠相对于野生型较低的运动活动(在旷场测试中减少的行进距离)。图11C示出了Shank3突变小鼠减少的探索行为(饲喂时间)在miniShank3治疗组中被挽救至野生型水平。图11D示出了Shank3突变小鼠的焦虑样行为(减少的高架环形迷宫(elevated zero maze)测试中的开放臂时间)也在miniShank3治疗组中被挽救。图11E示出了相比于Shank3突变组,可以在miniShank3治疗组中见到运动技巧(转棒测试)提升的趋势。*p<0.05,**p<0.01,***p<0.001,****p<0.0001,带Bonferroni post-hoc检验的单向ANOVA(图11A-11D),带Bonferroni post-hoc检验的双向ANOVA(图11E)。数据表示为平均值±SEM(a:n=16WT+GFP,n=12突变体+GFP和n=14突变体+miniShank3;b-e:n=26WT+GFP,n=29突变体+GFP和n=19突变体+miniShank3)。
图12A-12F示出了在出生后28天(P28)的miniShank3治疗选择性挽救Shank3突变小鼠的社交障碍和运动缺陷。图12A示出了在II期社交偏好测定中相比于陌生小鼠(S),小鼠与对象(O)进行密切社交互动花费的时间。图12B示出了在旷场测试中的总行进距离。图12C示出了通过转棒测试中延迟掉落的评价的运动学习的评估。图12D示出了通过转棒测试中延迟掉落的评价的运动协调的评估。图12E示出了在高架环形迷宫的开放臂中花费的时间的量化以评价焦虑样行为。图12F示出了在2小时录像中的梳理时间的评价。*p<0.05,**p<0.01,***p<0.001,****p<0.0001,带Bonferroni post-hoc检验的单向ANOVA(图12A、12B、12E和12F),带Bonferroni post-hoc检验的双向ANOVA(图12C和12D)。数据表示为平均值±SEM(图12A:n=21WT,n=23Mut,和n=18MiniShank3;图12B:n=14WT,n=20Mut,和n=13MiniShank3;图12C:n=17WT,n=14Mut和n=10MiniShank3;图12D:n=17WT,n=14Mut和n=10MiniShan3k;图12E:n=14WT,n=20Mut和n=14MiniShank3;图12F:n=15WT,n=18Mut和n=17MiniShank3)。WT表示野生型;mut表示Shanks3突变体;MiniShank3表示Shank3突变体+miniShank3治疗。
图13A-13I示出了在出生后天数(P7)的miniShank3治疗挽救了Shank3突变小鼠中所有行为缺陷和睡眠中断。图13A示出了在II期社交偏好测定中相比于陌生小鼠(S),小鼠与对象(O)进行密切社交互动花费的时间。图13B示出了在2小时录像中的梳理时间的评价。图13C示出了在高架环形迷宫测试中的开放臂上花费的时间的量化以评价Shank3突变小鼠的焦虑样行为。图13D和13E示出了在旷场测试中的总行进距离。图13F示出了通过转棒测试中延迟掉落的评价的运动学习的评估。图13G示出了评价Shan3突变小鼠睡眠行为NREM睡眠持续时间的量化。图13H示出了评价Shank3突变小鼠的睡眠行为的NREM睡眠段落长度的量化。图13I示出了评价Shank3突变小鼠的睡眠行为的delta强度的量化。*p<0.05,**p<0.01,***p<0.001,****p<0.0001,带Bonferroni post-hoc检验的单向ANOVA(图13A、13B、13C、13D、13G、13H和13I),带Bonferroni post-hoc检验的双向ANOVA(图13E和13F)。数据表示为平均值±SEM(图13A:n=16WT,n=9Mut,和n=14MiniShank3;图13B:n=18WT,n=12Mut,和n=14MiniShank3;图13C:n=10WT,n=10Mut和n=10MiniShank3;图13D:n=18WT,n=14Mut和n=18MiniShank3;图13E:n=18WT,n=14Mut和n=18MiniShank3;图13F:n=17WT,n=15Mut和n=17MiniShank3;图13G-13I:n=9WT,n=8Mut和n=8MiniShank3)。WT表示野生型;mut表示Shanks3突变体;MiniShank3表示Shank3突变体+miniShank3治疗。
图14A-14B示出了在出生后天数(P7)的miniShank3治疗不会造成Shank3突变小鼠的癫痫活动。图14A示出了野生型动物、注射对照病毒的突变体、注射miniShank3的突变体或Scn2a突变体的代表性EEG痕迹。图14B示出了在面板a示出的四个实验组中观察到的尖波放电(SWD)的量化(数据表示为平均值±SEM)。***p<0.001,带Bonferroni post-hoc检验的单向ANOVA。
图15说明了示出具有hSyn1启动子的人miniShank3基因的质粒构建体的示意图。
发明详述
本公开的方面涉及用于治疗神经发育障碍的基因治疗方法。实施例表明非天然存在的编码Shank3蛋白的多核苷酸能在基因递送载体中表达并施用于受试者。本文公开的基因治疗策略使用AAV系统将Shank3基因的功能性拷贝递送至脑细胞以恢复细胞功能。
SHANK3编码兴奋性谷氨酸能突触中的突触支架蛋白,配合信号传导分子的募集并协调大分子突触后蛋白复合物的组装,其对合适的突触发育和功能十分关键。SHANK3的缺失是费伦-麦克德米德综合症的核心神经发育和神经行为缺陷的主要原因。人类基因研究还确认了SHANK3突变占自闭症谱系障碍(ASD)的约1%。具有费伦-麦克德米德综合症的患者和其他具有SHANK3突变的个体经常表现出多种合并症特征,其包含发育迟缓、睡眠障碍、肌张力减退、言语缺乏或语言迟缓和ASD的特征。目前,对于ASD缺乏有效的治疗。
ASD与Shank3之间的关联提供了突触功能异常和ASD的病理生理学之间的直接联系。动物模型将ASD的人类遗传学与临床表现下的脑病理学联系起来,并最终帮助发现并评估有效的疗法。之前在蝇、鱼和啮齿动物的研究已揭示由于SHANK3缺失导致的突触功能障碍和行为异常。例如,小鼠模型中Shank3的破坏导致了突触缺陷、社交互动受损、运动困难、重复梳理和焦虑水平增加。由于Shank3缺失造成啮齿动物、猴和人类患者的严重睡眠障碍,睡眠效率为ASD提供了独特的生物标志物。此外,Shank3缺陷小鼠模型表现出可预测的有效性,因为当恢复Shank3时突触缺陷和行为异常是可逆的。因此,基因替换非常适合作为这种单基因疾病的治疗策略。
新型重组腺相关病毒(rAAV)由于其广泛的组织嗜性、低免疫原性、高效和持续的基因转导以及临床证明的安全记录表现为一个有前途的基因传递平台。然而,本领域已知Shank3是具有约5.7kb的编码序列的大蛋白,超过了AAV载体的包装能力。本申请的发明人发现Shank3蛋白的某些区域对于该蛋白的功能是不关键的,因此设计了异源Shank3表达构建体,由于该构建体编码去除了某些非必要区域的Shank3蛋白版本,该构建体具有显著更小的编码序列(约2.1kb至约3.1kb)。本文所述的所得小型化Shank3蛋白可通过载体(如AAV)递送。本申请的发明人出人意料地发现,小型化Shank3蛋白可恢复小鼠模型中由编码Shank3蛋白的基因的缺失或突变导致的有缺陷的功能,并因此可潜在地挽救由与Shank3突变或缺失相关的疾病导致的异常。这与本领域已知的方法相反,本领域已知的方法专注于修复或改善Shank3蛋白的部分片段,但无法恢复Shank蛋白的功能。因此,本公开涉及通过使用小型化Shank3蛋白(“MiniShank3”)恢复Shank3的活性来治疗神经发育障碍的方法和组合物。
Shank蛋白
Shank蛋白家族(例如,Shank1、Shank2和Shank3)是在兴奋性神经元突触处栓系和组织支架蛋白的主支架蛋白(master scaffolding protein)。该家族的成员共享至少五个主要结构域区域:N端锚蛋白重复、SH3结构域、PDZ结构域、富脯氨酸结构域和C端SAM结构域。通过这些功能结构域,Shank蛋白与许多突触后密度(PSD)蛋白相互作用。不被任何理论束缚,Shank蛋白可与SAPAP结合,SAPAP又可以与PSA95结合以形成PSD95/SAPAP/Shank突触后复合物。这些多结构域蛋白被假定一起形成了关键支架,在谷氨酸能突触处协调大分子突触后信号传导复合物的组装。已显示该复合物在靶向、锚定及动态调节神经递质受体和信号传导分子的突触定位中发挥重要作用。在另一个实例中,Shank蛋白家族通过其与Homer的结合与mGLuR通路联系起来。
由于Shank与肌动蛋白结合蛋白的联系,其也在棘发育中起主要作用。已发现转染Shank3足以在培养的多刺小脑颗粒细胞中诱导功能性树突棘突触,表明Shank3在棘诱导中的作用。Shank3有三种主要异形体,包括Shank3α(最长的Shank3异形体)、Shank3β和Shank3γ。已报道Shank3的siRNA敲低在DIV18培养的海马神经元中减少树突棘的数量并增加树突棘的长度,暗示Shank3在棘成熟中的作用。Shank1的过表达扩大了培养的海马神经元中已经存在的树突棘这一发现支持了这一假定的功能。此外,已报道Shank1突变小鼠具有较小的树突棘和较弱的突触传递。
在一些实施方案中,本公开涉及能在具有被破坏的Shank蛋白活性的受试者中恢复突触活性的Shank蛋白。在一些实施方案中,被破坏的Shank蛋白活性存在于具有神经发育障碍、自闭症谱系障碍(ASD)和/或费伦-麦克德米德综合症的受试者中。在一些实施方案中,与本公开有关的Shank蛋白是Shank1蛋白。在一些实施方案中,本公开涉及在有需要的受试者中表达编码Shank1或Shank1变体的多核苷酸。在一些实施方案中,与本公开有关的Shank蛋白是Shank2蛋白。在一些实施方案中,本公开涉及在有需要的受试者中表达编码Shank2或Shank2变体的多核苷酸。在一些实施方案中,与本公开有关的Shank蛋白是Shank3蛋白。在一些实施方案中,本公开涉及在有需要的受试者中表达编码Shank3或Shank3变体的多核苷酸。应当理解与本公开有关的Shank蛋白可包括在兴奋性神经元的突触中起支架蛋白作用的任何Shank蛋白,包含其变体或片段。
本文还公开了用于基因治疗的编码Shank蛋白(Shank1、Shank2和Shank3)的多核苷酸。
对应于GenBank识别号BAE16756.1的小鼠Shank3全长蛋白序列由SEQ ID NO:5提供:
MDGPGASAVVVRVGIPDLQQTKCLRLDPTAPVWAAKQRVLCALNHSLQDALNYGLFQPPSRGRAGKFLDEERLLQDYPPNLDTPLPYLEFRYKRRVYAQNLIDDKQFAKLHTKANLKKFMDYVQLHSTDKVARLLDKGLDPNFHDPDSGECPLSLAAQLDNATDLLKVLRNGGAHLDFRTRDGLTAVHCATRQRNAGALTTLLDLGASPDYKDSRGLTPLYHSALGGGDALCCELLLHDHAQLGTTDENGWQEIHQACRFGHVQHLEHLLFYGANMGAQNASGNTALHICALYNQESCARVLLFRGANKDVRNYNSQTAFQVAIIAGNFELAEVIKTHKDSDVVPFRETPSYAKRRRLAGPSGLASPRPLQRSASDINLKGDQPAASPGPTLRSLPHQLLLQRLQEEKDRDRDGELENDISGPSAGRGGHNKISPSGPGGSGPAPGPGPASPAPPAPPPRGPKRKLYSAVPGRKFIAVKAHSPQGEGEIPLHRGEAVKVLSIGEGGFWEGTVKGRTGWFPADCVEEVQMRQYDTRHETREDRTKRLFRHYTVGSYDSLTSHSDYVIDDKVAILQKRDHEGFGFVLRGAKAETPIEEFTPTPAFPALQYLESVDVEGVAWRAGLRTGDFLIEVNGVNVVKVGHKQVVGLIRQGGNRLVMKVVSVTRKPEEDGARRRAPPPPKRAPSTTLTLRSKSMTAELEELASIRRRKGEKLDEILAVAAEPTLRPDIADADSRAATVKQRPTSRRITPAEISSLFERQGLPGPEKLPGSLRKGIPRTKSVGEDEKLASLLEGRFPRSTSMQDTVREGRGIPPPPQTAPPPPPAPYYFDSGPPPTFSPPPPPGRAYDTVRSSFKPGLEARLGAGAAGLYDPSTPLGPLPYPERQKRARSMIILQDSAPEVGDVPRPAPAATPPERPKRRPRPSGPDSPYANLGAFSASLFAPSKPQRRKSPLVKQLQVEDAQERAALAVGSPGPVGGSFAREPSPTHRGPRPGSLDYSSGEGLGLTFGGPSPGPVKERRLEERRRSTVFLSVGAIEGSPPSADLPSLQPSRSIDERLLGTGATTGRDLLLPSPVSALKPLVGGPSLGPSGSTFIHPLTGKPLDPSSPLALALAARERALASQTPSRSPTPVHSPDADRPGPLFVDVQTRDSERGPLASPAFSPRSPAWIPVPARREAEKPPREERKSPEDKKSMILSVLDTSLQRPAGLIVVHATSNGQEPSRLGAEEERPGTPELAPAPMQAAAVAEPMPSPRAQPPGSIPADPGPGQGSSEEEPELVFAVNLPPAQLSSSDEETREELARIGLVPPPEEFANGILLTTPPPGPGPLPTTVPSPASGKPSSELPPAPESAADSGVEEADTRSSSDPHLETTSTISTVSSMSTLSSESGELTDTHTSFADGHTFLLEKPPVPPKPKLKSPLGKGPVTFRDPLLKQSSDSELMAQQHHAASTGLASAAGPARPRYLFQRRSKLWGDPVESRGLPGPEDDKPTVISELSSRLQQLNKDTRSLGEEPVGGLGSLLDPAKKSPIAAARLFSSLGELSTISAQRSPGGPGGGASYSVRPSGRYPVARRAPSPVKPASLERVEGLGAGVGGAGRPFGLTPPTILKSSSLSIPHEPKEVRFVVRSVSARSRSPSPSPLPSPSPGSGPSAGPRRPFQQKPLQLWSKFDVGDWLESIHLGEHRDRFEDHEIEGAHLPALTKEDFVELGVTRVGHRMNIERALRQLDGS
在一些实施方案中,对应于小鼠全长Shank3蛋白序列的SEQ ID NO:5由对应于GenBamk识别号NM_021423的核酸序列编码,其由SEQ ID NO:15提供:
atggacggccccggggccagcgccgtggtcgtgcgcgtcggcatcccggacctgcaacaaacgaagtgcctgcgtctggacccaaccgcgcccgtgtgggccgccaagcagcgtgtgctctgcgccctcaatcatagccttcaagacgcgctcaactacgggctattccagcctccctcccggggtcgcgccggcaagttcctggatgaagagcggctcttacaggactacccgcctaacctggacacgcccctgccctatctggagttccgatacaagcggagagtttatgcccagaacctcatagatgacaagcagtttgcaaagctacacacaaaggcaaacctgaagaagttcatggactatgtccagctacacagcacagataaggtggcccgcctgctggacaaggggctggaccccaatttccatgaccctgactcaggagagtgccctctgagccttgcggcacagttggacaacgccactgacctcctgaaggttctccgcaacggcggtgctcatctggacttccggacccgagatgggctgacagccgtccactgtgctacccgccagcggaacgcaggggcattgacgaccctgctggacctgggggcttcgcctgactacaaggacagccgcggcctgacgcccctgtaccatagtgccctagggggcggggatgccctctgttgcgagctgcttctccatgatcatgcacagctggggaccactgatgagaatggttggcaagagatccatcaggcctgtcgctttggacacgtgcagcacctggagcaccttttgttctatggggccaacatgggtgctcagaatgcctcgggaaacacagccctgcacatctgtgccctctacaaccaggagagttgcgcgcgcgtcctgcttttccgtggtgccaacaaggacgtccgcaattacaacagccagacagccttccaggtggccattattgcagggaactttgagcttgccgaggtaatcaagacccacaaagactccgatgtcgtaccattcagggaaacccccagctatgcaaagcgacggcgtctggctggcccgagtggcctggcatccccacggcccttacagcgctcagccagtgatatcaacctgaaaggtgatcagcccgcagcttctccagggcccactctccgaagcctccctcatcaactcttgctccagaggcttcaggaggagaaagaccgtgacagggatggtgaactggagaatgacatcagcggcccctcagcaggcaggggtggccacaacaagatcagccccagtgggcccggcggatccggccccgcgcccggccccggcccggcgtctcccgcgccccccgcgccgccgccccggggcccgaagcggaaactttacagtgccgtccccggccgcaagttcatcgctgtgaaggcgcacagcccgcagggcgagggcgagatcccgctgcaccgcggcgaggccgtgaaggtgctcagcattggggagggcggtttctgggagggaaccgtgaagggccgaacaggctggttcccagctgactgtgtggaagaagtgcagatgcgacagtatgacacccggcatgaaaccagagaggaccggacgaagcgtctcttccgccactacactgtgggttcctatgacagcctcacttcacacagcgattatgtcatcgatgataaggtggctatcctgcagaaaagggaccatgaggggtttggctttgttctccggggagccaaagcagagacccccattgaggagtttacacccacacctgccttccctgcactccaataccttgagtctgtagatgtggaaggtgtggcctggagggctggacttcgaactggggacttcctcattgaggtgaacggagtgaatgtcgtgaaggttggacacaagcaagtggtgggtctcatccgtcagggtggcaaccgcctggtcatgaaggttgtgtctgtgaccaggaaacccgaggaggatggtgctcggcgcagagccccaccacccccaaagagggctcccagcaccacgctgaccctgcggtccaagtccatgacggctgagctcgaggaacttgcttccattcggagaagaaaaggggagaagttggatgagatcctggcagttgccgcggagccgacactgaggccggacattgcagatgctgactcgagggcggccactgtcaagcagcggcccaccagccggaggatcacccctgctgagatcagctcattgtttgagcgccagggcctcccaggcccagagaagctgccgggctctctgcggaaggggattccacggaccaaatctgtaggggaggatgagaagctggcatccctactggaagggcgcttcccacgcagcacgtcaatgcaggacacagtgcgtgaaggtcgaggcattccacccccgccgcagaccgccccgccacccccacccgcgccctactacttcgactccgggccaccccccaccttctcaccgccgccaccaccgggccgggcctatgacactgtgcgctccagcttcaaaccaggcctggaggctcgtctgggtgcgggggccgccggcctgtatgatccgagcacgcctctgggcccgctgccctaccctgagcgtcagaagcgtgcgcgctccatgatcatactgcaggactctgcgccagaagtgggtgatgtcccccggcctgcgcctgccgccacaccgcctgagcgccccaagcgccggcctcggccgtcaggccctgatagtccctatgccaacctgggcgccttcagtgccagcctcttcgctccgtcgaaaccacagcgccgcaagagcccgctggtgaagcagcttcaggtggaggacgctcaggagcgcgcggccctggccgtgggtagcccgggaccagtgggcggaagctttgcacgagaaccctctccgacgcaccgcgggccccggccaggcagccttgactacagctctggagaaggcctaggccttaccttcggcggccctagccctggcccagtcaaggagcggcgcctggaggagcgacgccgttccactgtgttcctctctgtgggtgccatcgagggcagccctcccagcgcggatctgccatccctacaaccctcccgctccattgatgagcgcctcctggggacaggcgccaccactggccgcgatttgctactcccctcccctgtctctgctctgaagccattggtcggtggtcccagccttgggccctcaggctccaccttcatccaccctctcactggcaaacccttggatcctagctcacccttagctcttgctctggctgcccgggagcgggctctggcctcgcaaacaccttcccggtcccccacacctgtgcacagccccgatgctgaccgccctggacccctctttgtggatgtgcaaacccgagactctgagagaggaccgttggcttccccagccttctcccctcggagtccagcgtggattccagtgcctgctcggagagaggcagagaagccccctcgggaagagcggaagtcaccagaggacaagaagtccatgatcctcagcgtcttggacacgtccttgcaacggccagctggcctcattgttgtgcatgccaccagcaatgggcaggagcccagcaggctgggggctgaagaggagcgccccggtactccggagctggccccagcccccatgcaggcagcagctgtggcagagcccatgccaagcccccgggcccagccccctggcagcatcccagcagatcccgggccaggtcaaggcagctcagaggaggagccagagctggtattcgctgtgaacctgccacctgctcagctgtcctccagcgatgaggagaccagagaggagctggcccgcatagggctagtgccaccccctgaagagtttgccaatgggatcctgctgaccaccccgcccccagggccgggccccttgcccaccacggtacccagcccggcctcagggaagcccagcagcgagctgccccctgcccctgagtctgcagctgactctggagtagaggaggctgacactcgaagctccagtgacccccacctggagaccacaagcaccatttccacagtgtccagcatgtccaccctgagctcggagagtggggaactcacggacacccacacctcctttgccgatggacacacttttctactcgagaagccaccagtgcctcccaagcccaagctcaagtccccgctggggaaggggccggtgaccttcagggacccgctgctgaagcaatcctcggacagtgagctcatggcccagcagcaccatgctgcctctactgggttggcttctgctgctgggcccgcccgccctcgctacctcttccagagaaggtccaagctgtggggggaccccgtggagagtcgggggctccctgggcctgaagatgacaaaccaactgtgatcagtgagctcagctcccgtctgcagcagctgaataaagacacacgctccttgggggaggaaccagttggtggcctgggcagcctgctggaccctgctaagaagtcacccattgcagcagctcggctcttcagcagcctcggtgagctgagcaccatctcagcgcagcgcagcccggggggcccgggcggaggggcctcctactcggtgcggcccagcggccggtaccccgtggcgagacgagccccgagcccagtgaaacccgcatcgctggagcgggtggaggggctgggggcgggcgtgggaggcgcggggcggcccttcggcctcacgcctcccaccatcctcaagtcgtccagcctctccatcccgcacgaacccaaggaagtgcgcttcgtggtgcgaagtgtgagtgcgcgcagccgctccccctcaccatctccgctgccctcgccttctcccggctctggccccagtgccggcccgcgtcggccatttcaacagaagcccctgcagctctggagcaagttcgatgtgggcgactggctggagagcatccacttaggcgagcaccgagaccgcttcgaggaccatgagatcgaaggcgcacacctgcctgcgctcaccaaggaagacttcgtggagctgggcgtcacacgcgttggccaccgcatgaacatcgagcgtgcgctcaggcagctggatggcagctga
对应于GenBank识别号Q9BYB0.3的人全长Shank3蛋白序列由SEQ ID NO.6提供:
MDGPGASAVVVRVGIPDLQQTKCLRLDPAAPVWAAKQRVLCALNHSLQDALNYGLFQPPSRGRAGKFLDEERLLQEYPPNLDTPLPYLEFRYKRRVYAQNLIDDKQFAKLHTKANLKKFMDYVQLHSTDKVARLLDKGLDPNFHDPDSGECPLSLAAQLDNATDLLKVLKNGGAHLDFRTRDGLTAVHCATRQRNAAALTTLLDLGASPDYKDSRGLTPLYHSALGGGDALCCELLLHDHAQLGITDENGWQEIHQACRFGHVQHLEHLLFYGADMGAQNASGNTALHICALYNQESCARVLLFRGANRDVRNYNSQTAFQVAIIAGNFELAEVIKTHKDSDVVPFRETPSYAKRRRLAGPSGLASPRPLQRSASDINLKGEAQPAASPGPSLRSLPHQLLLQRLQEEKDRDRDADQESNISGPLAGRAGQSKISPSGPGGPGPAPGPGPAPPAPPAPPPRGPKRKLYSAVPGRKFIAVKAHSPQGEGEIPLHRGEAVKVLSIGEGGFWEGTVKGRTGWFPADCVEEVQMRQHDTRPETREDRTKRLFRHYTVGSYDSLTSHSDYVIDDKVAVLQKRDHEGFGFVLRGAKAETPIEEFTPTPAFPALQYLESVDVEGVAWRAGLRTGDFLIEVNGVNVVKVGHKQVVALIRQGGNRLVMKVVSVTRKPEEDGARRRAPPPPKRAPSTTLTLRSKSMTAELEELASIRRRKGEKLDEMLAAAAEPTLRPDIADADSRAATVKQRPTSRRITPAEISSLFERQGLPGPEKLPGSLRKGIPRTKSVGEDEKLASLLEGRFPRSTSMQDPVREGRGIPPPPQTAPPPPPAPYYFDSGPPPAFSPPPPPGRAYDTVRSSFKPGLEARLGAGAAGLYEPGAALGPLPYPERQKRARSMIILQDSAPESGDAPRPPPAATPPERPKRRPRPPGPDSPYANLGAFSASLFAPSKPQRRKSPLVKQLQVEDAQERAALAVGSPGPGGGSFAREPSPTHRGPRPGGLDYGAGDGPGLAFGGPGPAKDRRLEERRRSTVFLSVGAIEGSAPGADLPSLQPSRSIDERLLGTGPTAGRDLLLPSPVSALKPLVSGPSLGPSGSTFIHPLTGKPLDPSSPLALALAARERALASQAPSRSPTPVHSPDADRPGPLFVDVQARDPERGSLASPAFSPRSPAWIPVPARREAEKVPREERKSPEDKKSMILSVLDTSLQRPAGLIVVHATSNGQEPSRLGGAEEERPGTPELAPAPMQSAAVAEPLPSPRAQPPGGTPADAGPGQGSSEEEPELVFAVNLPPAQLSSSDEETREELARIGLVPPPEEFANGVLLATPLAGPGPSPTTVPSPASGKPSSEPPPAPESAADSGVEEADTRSSSDPHLETTSTISTVSSMSTLSSESGELTDTHTSFADGHTFLLEKPPVPPKPKLKSPLGKGPVTFRDPLLKQSSDSELMAQQHHAASAGLASAAGPARPRYLFQRRSKLWGDPVESRGLPGPEDDKPTVISELSSRLQQLNKDTRSLGEEPVGGLGSLLDPAKKSPIAAARLFSSLGELSSISAQRSPGGPGGGASYSVRPSGRYPVARRAPSPVKPASLERVEGLGAGAGGAGRPFGLTPPTILKSSSLSIPHEPKEVRFVVRSVSARSRSPSPSPLPSPASGPGPGAPGPRRPFQQKPLQLWSKFDVGDWLESIHLGEHRDRFEDHEIEGAHLPALTKDDFVELGVTRVGHRMNIERALRQLDGS
在一些实施方案中,对应于SEQ ID NO:6的人Shank3全长蛋白序列由对应于GenBank识别号NM_001372044的核酸序列编码,该核酸序列由SEQ ID NO:16提供:
atgcagctgagccgcgccgccgccgccgccgccgccgcccctgcggagcccccggagccgctgtcccccgcgccggccccggccccggccccccccggccccctcccgcgcagcgcggccgacggggctccggcgggggggaagggggggccggggcgccgcgcggagtccccgggcgctccgttccccggcgcgagcggccccggcccgggccccggcgcggggatggacggccccggggccagcgccgtggtcgtgcgcgtcggcatcccggacctgcagcagacgaagtgcctgcgcctggacccggccgcgcccgtgtgggccgccaagcagcgcgtgctctgcgccctcaaccacagcctccaggacgcgctcaactatgggcttttccagccgccctcccggggccgcgccggcaagttcctggatgaggagcggctcctgcaggagtacccgcccaacctggacacgcccctgccctacctggagtttcgatacaagcggcgagtttatgcccagaacctcatcgatgataagcagtttgcaaagcttcacacaaaggcgaacctgaagaagttcatggactacgtccagctgcatagcacggacaaggtggcacgcctgttggacaaggggctggaccccaacttccatgaccctgactcaggagagtgccccctgagcctcgcagcccagctggacaacgccacggacctgctaaaggtgctgaagaatggtggtgcccacctggacttccgcactcgcgatgggctcactgccgtgcactgtgccacacgccagcggaatgcggcagcactgacgaccctgctggacctgggggcttcacctgactacaaggacagccgcggcttgacacccctctaccacagcgccctggggggtggggatgccctctgctgtgagctgcttctccacgaccacgctcagctggggatcaccgacgagaatggctggcaggagatccaccaggcctgccgctttgggcacgtgcagcatctggagcacctgctgttctatggggcagacatgggggcccagaacgcctcggggaacacagccctgcacatctgtgccctctacaaccaggagagctgtgctcgtgtcctgctcttccgtggagctaacagggatgtccgcaactacaacagccagacagccttccaggtggccatcatcgcagggaactttgagcttgcagaggttatcaagacccacaaagactcggatgttgtaccattcagggaaacccccagctatgcgaagcggcggcgactggctggccccagtggcttggcatcccctcggcctctgcagcgctcagccagcgatatcaacctgaagggggaggcacagccagcagcttctcctggaccctcgctgagaagcctcccccaccagctgctgctccagcggctgcaagaggagaaagatcgtgaccgggatgccgaccaggagagcaacatcagtggccctttagcaggcagggccggccaaagcaagatcagcccgagcgggcccggcggccccggccccgcgcccggccccggccccgcgccccctgcgccccccgcaccgccgccccggggcccgaagcggaaactttacagcgccgtccccggccgcaagttcatcgccgtgaaggcgcacagcccgcagggtgaaggcgagatcccgctgcaccgcggcgaggccgtgaaggtgctcagcattggggagggcggtttctgggagggaaccgtgaaaggccgcacgggctggttcccggccgactgcgtggaggaagtgcagatgaggcagcatgacacacggcctgaaacgcgggaggaccggacgaagcggctctttcggcactacacagtgggctcctacgacagcctcacctcacacagcgattatgtcattgatgacaaagtggctgtcctgcagaaacgggaccacgagggctttggttttgtgctccggggagccaaagcagagacccccatcgaggagttcacgcccacgccagccttcccggcgctgcagtatctcgagtcggtggacgtggagggtgtggcctggagggccgggctgcgcacgggagacttcctcatcgaggtgaacggggtgaacgtggtgaaggtcggacacaagcaggtggtggctctgattcgccagggtggcaaccgcctcgtcatgaaggttgtgtctgtgacaaggaagccagaagaggacggggctcggcgcagagccccaccgccccccaagagggcccccagcaccacactgaccctgcgctccaagtccatgacagctgagctcgaggaacttgcctccattcggagaagaaaaggggagaagctggacgagatgctggcagccgccgcagagccaacgctgcggccagacatcgcagacgcagactccagagccgccaccgtcaaacagaggcccaccagtcggaggatcacacccgccgagattagctcattgtttgaacgccagggcctcccaggcccagagaagctgccgggctccttgcggaaggggattccacggaccaagtctgtaggggaggacgagaagctggcgtccctgctggaagggcgcttcccgcggagcacctcgatgcaagacccggtgcgcgagggtcgcggcatcccgcccccgccgcagaccgcgccgcctcccccgcccgcgccctactacttcgactcggggccgcccccggccttctcgccgccgcccccgccgggccgcgcctacgacacggtgcgctccagcttcaagcccggcctggaggcgcgcctgggcgcgggcgctgccggcctgtacgagccgggcgcggccctcggcccgctgccgtatcccgagcggcagaagcgcgcgcgctccatgatcatcctgcaggactcggcgcccgagtcgggcgacgcccctcgacccccgcccgcggccaccccgcccgagcgacccaagcgccggccgcggccgcccggccccgacagcccctacgccaacctgggcgccttcagcgccagcctcttcgctccgtccaagccgcagcgccgcaagagccccctggtgaagcagctgcaggtggaggacgcgcaggagcgcgcggccctggccgtgggcagccccggtcccggcggcggcagcttcgcccgcgagccctccccgacccaccgcggtccgcgcccgggtggcctcgactacggcgcgggcgatggcccggggctcgcgttcggcggcccgggcccggccaaggaccggcggctggaggagcggcgccgctccactgtgttcctgtccgtgggggccatcgagggcagcgcccccggcgcggatctgccatccctacagccctcccgctccatcgacgagcgcctcctggggaccggccccaccgccggccgcgacctgctgctgccctccccggtgtctgccctgaagccgttggtcagcggcccgagcctggggccctcgggttccaccttcatccacccactcaccggcaaacccctggaccccagctcacccctggcccttgccctggctgcccgagagcgagctctggcctcccaggcgccctcccggtcccccacacccgtgcacagtcccgacgccgaccgccccggacccctgtttgtggatgtacaggcccgggacccagagcgagggtccctggcttccccggctttctccccacggagcccagcctggattcctgtgcctgctcgcagggaggcagagaaggtcccccgggaggagcggaagtcacccgaggacaagaagtccatgatcctcagcgtcctggacacatccctgcagcggccagctggcctcatcgttgtgcacgccaccagcaacgggcaggagcccagcaggctggggggggccgaagaggagcgcccgggcaccccggagttggccccggcccccatgcagtcagcggctgtggcagagcccctgcccagcccccgggcccagccccctggtggcaccccggcagacgccgggccaggccagggcagctcagaggaagagccagagctggtgtttgctgtgaacctgccacctgcccagctgtcgtccagcgatgaggagaccagggaggagctggcccgaattgggttggtgccaccccctgaagagtttgccaacggggtcctgctggccaccccactcgctggcccgggcccctcgcccaccacggtgcccagcccggcctcagggaagcccagcagtgagccaccccctgcccctgagtctgcagccgactctggggtggaggaggctgacacacgcagctccagcgacccccacctggagaccacaagcaccatctccacggtgtccagcatgtccaccttgagctcggagagcggggaactcactgacacccacacctccttcgctgacggacacacttttctactcgagaagccaccagtgcctcccaagcccaagctcaagtccccgctggggaaggggccggtgaccttcagggacccgctgctgaagcagtcctcggacagcgagctcatggcccagcagcaccacgccgcctctgccgggctggcctctgccgccgggcctgcccgccctcgctacctcttccagagaaggtccaagctatggggggaccccgtggagagccgggggctccctgggcctgaagacgacaaaccaactgtgatcagtgagctcagctcccgcctgcagcagctgaacaaggacacgcgttccctgggggaggaaccagttggtggcctgggcagcctgctggaccctgccaagaagtcgcccatcgcagcagctcggctcttcagcagcctcggtgagctgagctccatttcagcgcagcgcagccccgggggcccgggcggcggggcctcgtactcggtgaggcccagtggccgctaccccgtggcgagacgcgccccgagcccggtgaagcccgcgtcgctggagcgggtggaggggctgggggcgggcgcggggggcgcagggcggcccttcggcctcacgccccccaccatcctcaagtcgtccagcctctccatcccgcacgagcccaaggaggtgcgcttcgtggtgcgcagcgtgagcgcgcgcagtcgctccccctcgccgtcgccgctgccctcgcccgcgtccggccccggccccggcgcccccggcccacgccgacccttccagcagaagccgctgcagctctggagcaagttcgacgtgggcgactggctggagagcatccacctaggcgagcaccgcgaccgcttcgaggaccatgagatagaaggcgcgcacctacccgcgcttaccaaggacgacttcgtggagctgggcgtcacgcgcgtgggccaccgcatgaacatcgagcgcgcgctcaggcagctggacggcagctga
全长Shank3蛋白包含多个结构域并由大小约5.2Kb的基因编码。由于其大小,难以将全长Shank3通过AAV载体递送至感兴趣的组织或细胞。本申请的发明人发现可以从全长Shank3蛋白中去除或截去特定结构域以产生MiniShank3,MiniShank3在恢复兴奋性神经元中的Shank3活性中是有效的(图5B和6B)。本文描述的多核苷酸编码的Shank蛋白(例如Shank3蛋白)可小型化以形成原始的全长Shank3蛋白的缩短变体。如本文公开的,小型化的Shank3蛋白或编码该小型化的Shank3蛋白的DNA构建体可互换地被称为“miniShank3”或“MiniShank3”。
在一些实施方案中,本文公开的Shank3蛋白由小型化Shank3的DNA构建体表达。在一些实施方案中,本文公开的Shank3变体DNA构建体和Shank3蛋白(MiniShank3)包含相比于全长Shank3基因和蛋白更少的结构域。在一些实施方案中,本文公开的Shank3蛋白由非天然存在的多核苷酸编码。
由本文公开的多核苷酸编码的Shank3蛋白可包含一个或多个蛋白结构域。例如,Shank3蛋白可包含以下的一个或多个:SH3结构域、PDZ结构域、Homer结合结构域、Cortactin结构域、SAM结构域和/或锚蛋白重复结构域。
在一些实施方案中,SH3结构域包含相对于SEQ ID NO:6的474-525残基或SEQ IDNO:5的473-524残基的至少70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%同一性或100%相同(包括其间的任何数值)。在一些实施方案中,SH3结构域包含相对于SEQ ID NO:6的474-525残基的至少90%同一性。在一些实施方案中,SH3结构域包含相对于SEQ ID NO:5的473-524残基的至少90%同一性。在一些实施方案中,SH3结构域包含SEQ ID NO:6的474-525残基。在一些实施方案中,SH3结构域包含SEQ IDNO:5的473-524残基。在一些实施方案中,SH3结构域可包含相对于适于构建miniShank3的SEQ ID NO:6的474-525残基的任何百分比同一性。在一些实施方案中,SH3结构域可包含相对于适于构建miniShank3的SEQ ID NO:5的473-524残基的任何百分比同一性。
在一些实施方案中,PDZ结构域包含相对于SEQ ID NO:6的573-662残基或SEQ IDNO:5的572-661残基的至少70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%同一性或100%相同(包括其间的任何数值)。在一些实施方案中,PDZ结构域包含相对于SEQ ID NO:6的573-662残基的至少90%同一性。在一些实施方案中,PDZ结构域包含相对于SEQ ID NO:5的572-661残基的至少90%同一性。在一些实施方案中,PDZ结构域包含SEQ ID NO:6的573-662残基。在一些实施方案中,PDZ结构域包含SEQ IDNO:5的572-661残基。在一些实施方案中,PDZ结构域可包含相对于适于构建miniShank3的SEQ ID NO:6的573-662残基的任何百分比同一性。在一些实施方案中,PDZ结构域可包含相对于适于构建miniShank3的SEQ ID NO:5的572-661残基任何百分比的同一性。
在一些实施方案中,Homer结构域包含相对于SEQ ID NO:5或6的1294-1323残基的至少70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%同一性或100%相同(包括其间的任何数值)。在一些实施方案中,Homer结构域包含相对于SEQ ID NO:5的1294-1323残基的至少90%同一性。在一些实施方案中,Homer结构域包含相对于SEQ ID NO:6的1294-1323残基的至少90%同一性。在一些实施方案中,Homer结构域包含SEQ ID NO:5或6的1294-1323残基。在一些实施方案中,Homer结构域可包含相对于适于构建miniShank3的SEQ ID NO:5或6的1294-1323残基的任何百分比同一性。
在一些实施方案中,Cortactin结合结构域包含相对于SEQ ID NO:5或6的1400-1426残基的至少70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%同一性或100%相同(包括其间的任何数值)。在一些实施方案中,Cortactin结合结构域包含相对于SEQ ID NO:5的1400-1426残基的至少90%同一性。在一些实施方案中,Cortactin结合结构域包含相对于SEQ ID NO:6的1400-1426残基的至少90%同一性。在一些实施方案中,Cortactin结合结构域包含SEQ ID NO:5或6的1400-1426残基。在一些实施方案中,Cortactin结合结构域可包含相对于适于构建miniShank3的SEQID NO:5或6的1400-1426残基的任何百分比同一性。
在一些实施方案中,SAM结构域包含相对于SEQ ID NO:6的1664-1729残基或SEQID NO:5的1663-1728残基的至少70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%同一性或100%相同(包括其间的任何数值)。在一些实施方案中,SAM结合结构域包含相对于SEQ ID NO:6的1664-1729残基的至少90%同一性。在一些实施方案中,SAM结合结构域包含相对于SEQ ID NO:5的1663-1728残基的至少90%同一性。在一些实施方案中,SAM结构域包含SEQ ID NO:6的1664-1729残基。在一些实施方案中,SAM结构域包含SEQ ID NO:5的1663-1728残基。在一些实施方案中,SAM结合结构域可包含相对于适于构建miniShank3的SEQ ID NO:6的1664-1729残基的任何百分比同一性。在一些实施方案中,SAM结合结构域可包含相对于适于构建miniShank3的SEQ ID NO:5的1663-1728残基任何百分比同一性。
在一些实施方案中,锚蛋白重复结构域包含相对于SEQ ID NO:6的148-345残基或SEQ ID NO:5的147-313残基的至少70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%同一性或100%相同(包括其间的任何数值)。在一些实施方案中,锚蛋白重复结构域包含相对于SEQ ID NO:6的148-345残基的至少90%同一性。在一些实施方案中,锚蛋白重复结构域包含相对于SEQ ID NO:5的147-313残基的至少90%同一性。在一些实施方案中,SAM结合结构域可包含相对于适于构建miniShank3的SEQ IDNO:6的148-345残基的任何百分比同一性。在一些实施方案中,SAM结合结构域可包含相对于适于构建miniShank3的SEQ ID NO:5的147-313残基的任何百分比同一性。
在一些实施方案中,MiniShank3蛋白相对于SEQ ID NO:5的全长与SEQ ID NO:5少于65%相同。在一些实施方案中,MiniShank3蛋白相对于SEQ ID NO:6的全长与SEQ ID NO:6少于65%相同。如本文所用,“少于65%”包含任何小于65%的适于构建MiniShank3的同一性百分比。在一些实施方案中,MiniShank3蛋白相对于SEQ ID NO:5的全长与SEQ ID NO:5少于64%、63%、62%、61%、60%、59%、58%、57%、56%、55%、54%、53%、52%、51%、50%、49%、48%、47%、46%、45%、44%、43%、42%、41%、40%、39%、38%、37%、36%、35%、34%、33%、32%、31%、30%、29%、28%、27%、26%、25%、24%、23%、22%、21%、20%、19%、18%、17%、16%、15%、14%、13%、12%、11%或10%相同。
在一些实施方案中,MiniShank3蛋白包含相对于表1中提供的SEQ ID NO:17-20中的任一项至少70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%相同或100%相同(包括其间的任何数值)的氨基酸序列。
在一些实施方案中,MiniShank3蛋白包含SEQ ID NO:17-20中的任一项。在一些实施方案中,SEQ ID NO:17由SEQ ID NO:1编码。在一些实施方案中,SEQ ID NO:18由SEQ IDNO:2编码。在一些实施方案中,SEQ ID NO:19由SEQ ID NO:3编码。在一些实施方案中,SEQID NO:20由SEQ ID NO:4编码。
在一些实施方案中,MiniShank3蛋白包含锚蛋白重复结构域。在MiniShank3蛋白包含锚蛋白重复结构域的一些实施方案中,MiniShank3蛋白包含SEQ ID NO:19和/或SEQID NO:20。
在一些实施方案中,MiniShank3蛋白不包含锚蛋白重复结构域。在MiniShank3蛋白不包含锚蛋白重复结构域的一些实施方案中,MiniShank3蛋白包含SEQ ID NO:17和/或SEQ ID NO:18。
在一些实施方案中,与本公开有关的编码MiniShank3蛋白的多核苷酸序列包含相对于SEQ ID NO:1-4中的任一项至少70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%同一性或100%相同(包括其间的任何数值),并编码一种或多种具有Shank3活性的蛋白。在一些实施方案中,与本公开有关的编码MiniShank3蛋白的多核苷酸序列包含相对于SEQ ID NO:1-4中的任一项的至少90%同一性,并编码一种或多种具有Shank3活性的蛋白。在一些实施方案中,与本公开有关的编码MiniShank3蛋白的多核苷酸序列包含相对于SEQ ID NO:1-4中的任一项。在一些实施方案中,SEQ ID NO:1-4中的任一项编码一种或多种具有部分Shank3活性的蛋白。在一些实施方案中,SEQ ID NO:1-4中的任一项编码一种或多种具有全部Shank3活性的蛋白。
在一些实施方案中,MiniShank3蛋白由表1提供的SEQ ID NO:1-4中的任一项编码。SEQ ID NO:1和SEQ ID NO:3对应于小鼠MiniShank3核酸序列,SEQ ID NO:2和SEQ IDNO:4对应于人MiniShank3核酸序列。SEQ ID NO:1和SEQ ID NO:2编码不包含锚蛋白重复结构域或N端结构域的MiniShank3蛋白。SEQ ID NO:3和SEQ ID NO:4编码包含锚蛋白重复结构域和N端结构域的MiniShank3蛋白。
本文描述的编码MiniShank3蛋白的多核苷酸编码具有至少部分Shank3活性的蛋白。
如本文所用,序列的“同一性”指通过本领域普通技术人员已知的数学模型、算法或计算机程序来测量或计算两个或多个具有缺口比对的序列之间的相同匹配百分比。两个序列(例如,核酸或氨基酸序列)的同一性百分比可以,例如,使用基本局部比对搜索工具如和程序(2.0版)来确定。比对技术如ClustalOmega可用于多序列比对。其他算法或比对方法可包括但不限于Smith-Waterman算法、Needleman-Wunsch算法或快速最优全局序列比对算法(FOGSAA)。
在一些实施方案中,编码本文公开的Shank蛋白(Shank1、Shank2和Shank3)的多核苷酸的大小少于约4.6kb、约4.5kb、约4.4kb、约4.3kb、约4.2kb、约4.1kb、约4.0kb、约3.9kb、约3.8kb、约3.7kb、约3.6kb、约3.5kb、约3.4kb、约3.3kb、约3.2kb、约3.1kb、约3.0kb、约2.9kb、约2.8kb、约2.7kb、约2.6kb、约2.5kb、约2.4kb、约2.3kb、约2.2kb或约2.1kb。在一些实施方案中,编码本文公开的Shank蛋白(Shank1、Shank2和Shank3)的多核苷酸可以是适于本公开公开的方法和载体的任何大小。
疾病和病症
本公开提供适于治疗神经发育障碍,如自闭症谱系障碍(ASD)或费伦-麦克德米德综合症的组合物和方法。
如本文使用的“神经发育障碍”指任何损害大脑和/或中枢神经系统生长和/或发育的病症。在一些实施方案中,神经发育障碍影响一种或多种脑功能,如情绪、学习能力、自控和记忆。应当理解本公开的方面可适用于治疗任何神经发育障碍。
在一些实施方案中,神经发育障碍是自闭症谱系障碍(ASD)。ASD的诊断主要基于沟通上的缺陷、受损的社交互动以及重复或受限的兴趣和行为等标准。ASD是高度遗传性病症,同卵双胞胎的一致性率高达90%。然而,ASD是临床异质性的,覆盖了广泛的不同症状严重程度的离散病症。ASD被认为是病因异质性的,可能包涵多基因、单基因和环境因素。
突触连接和功能的改变被认为是ASD潜在的关键机理。最近的基因研究确认了大量ASD的候选基因,其中许多编码突触蛋白(包括Shank3、神经配蛋白-3、神经配蛋白-4和神经连接蛋白-1)。这些发现表明突触功能障碍可能是ASD的子集的共同机理的基础。多种Shank3突变已被鉴定为有智力残疾(ID)的ASD的单基因原因。在ASD患者中,所有已经确认的Shank3缺失和/或突变都导致Shank3基因的两个正常拷贝中的一个的功能丢失(LoF)(即,单倍剂量不足)。最近的基因筛选已确认在Shank3基因中的大量突变,其包括在未诊断有费伦-麦克德米德综合症(PMS)的ASD患者中的微缺失、无义突变和反复出现的断点。这些研究暗示Shank3基因破坏和/或突变是自闭症谱系障碍(ASD)的单基因原因。目前估计,涉及Shank3的缺失和/或突变占所有具有ID的ASD患者的约2%。因此,理解Shank3的功能可深入了解ASD的病理学机理。
如本文所用,“智力残疾”指导致受试者在智力功能和/或适应功能方面存在缺陷的残疾。智力功能可以包括,例如,推理、解决问题、计划、抽象思维、判断、学术学习和/或经验学习。智力功能可通过本领域已知的任何方法测量,如IQ测试。适应功能可包括,例如,以独立和负责任的方式生活所需的技能(如沟通和社交技能)。在某些情况下,智力残疾在童年或青春期可能明显。
在一些实施方案中,神经发育障碍是费伦-麦克德米德综合症(PMS、22q13.3缺失综合症),其是表现出类似自闭症的行为、肌张力减退、严重智力残疾以及言语和语言发育受损的自闭症谱系障碍。Shank3是已报道的费伦-麦克德米德综合症中缺失的基因之一。因为携带具有完整Shank3基因的环状22号染色体的个体是表型正常的,所以认为Shank3的破坏是费伦-麦克德米德综合症中核心神经发育和神经行为缺陷的原因。
其他神经发育障碍可包含但不限于注意缺陷/多动障碍(ADHD)、学习残疾,如阅读障碍或计算障碍、智力残疾(智力低下)、行为或运动障碍、脑瘫、视力和听力障碍、发育性语言障碍、神经遗传障碍,如脆性X综合症(Fragile X syndrome)、唐氏综合症、雷特综合症(Rett syndrome)、低促性腺激素性腺功能减退综合症和创伤性脑损伤。
受试者
被本文描述的方法治疗的受试者可以是人受试者或非人受试者。非人受试者包括,例如:非人灵长类动物;农场动物,如牛、马、山羊、绵羊和猪;宠物,例如狗和猫;和啮齿动物。
被本文描述的方法治疗的受试者可以是患有、疑似患有或有风险发展为神经发育障碍的受试者。在一些实施方案中,受试者已确诊患有神经发育障碍,而在其他实施方案中,受试者未确诊患有神经发育障碍。在一些实施方案中,受试者是患有、疑似患有或有风险发展为自闭症谱系障碍(ASD)的人受试者。在一些实施方案中,受试者是患有、疑似患有或有风险发展为费伦-麦克德米德综合症的人受试者。在一些实施方案中,受试者是相对对照受试者具有减少的Shank3基因表达的受试者。在一些实施方案中,受试者中Shank3基因的表达相对于对照受试者减少了至少5%、10%、20%、30%、40%、50%、60%、70%、80%、90%、100%、或至少2倍、至少5倍、至少10倍、至少20倍、至少50倍、至少100倍、或至少1000倍。在一些实施方案中,对照受试者是没有、不怀疑患有或没风险患有神经发育障碍的受试者。在一些实施方案中,Shank3基因的至少一个拷贝的破坏导致受试者中Shank3基因的表达减少。在一些实施方案中,Shank3基因的破坏包含Shank3基因的至少一个拷贝的缺失。在一些实施方案中,Shank3基因的破坏包含Shank3基因的至少一个拷贝中的一个或多个突变。
在一些实施方案中,受试者是表现出ASD的一种或多种症状的人受试者。在一些实施方案中,受试者是表现出发育迟缓的人受试者。在一些实施方案中,受试者是表现出智力残疾(ID)的人受试者。在一些实施方案中,受试者是表现出睡眠障碍的人受试者。在一些实施方案中,受试者是表现出肌张力减退的人受试者。在一些实施方案中,受试者是表现出言语缺乏的人受试者。在一些实施方案中,受试者是表现出语言迟缓的人受试者。在一些实施方案中,受试者是表现出ASD的任何症状或体征的人受试者。
在一些实施方案中,受试者是人受试者,其是成年人。在一些实施方案中,成年人大于25岁。在一些实施方案中,成年人不大于25岁。在一些实施方案中,成年人不大于21岁。在一些实施方案中,成年人不大于18岁。在一些实施方案中,成年人为16岁。在一些实施方案中,受试者是老人(例如,65岁或更老)。在一些实施方案中,成年人可以是适合本文公开的治疗的成年年龄的任何年龄。
在一些实施方案中,受试者是人受试者,其不是成年人。在一些实施方案中,人受试者不大于16岁。在一些实施方案中,人受试者不大于10岁。在一些实施方案中,人受试者为10岁或更年轻。在一些实施方案中,人受试者为儿童或婴儿。在一些实施方案中,人受试者为学步的儿童。在一些实施方案中,人受试者处于发育的胎儿阶段。在一些实施方案中,人受试者处于发育的产前阶段。
病毒载体
如本文公开的,可将病毒载体中编码MiniShank3蛋白的多核苷酸递送至感兴趣的组织或细胞。可以用本文描述的载体将编码感兴趣的蛋白的核酸递送至受试者,包括,例如,递送至受试者的特定器官或中枢神经系统(CNS)。在一些实施方案中,感兴趣的蛋白是Shank蛋白。在一些实施方案中,感兴趣的蛋白是Shank3蛋白。在一些实施方案中,感兴趣的蛋白是MiniShank3蛋白。
在一些实施方案中,本公开提供包含编码本文公开的Shank蛋白的多核苷酸的载体。在一些实施方案中,本公开提供包含编码Shank3蛋白的多核苷酸的载体。在一些实施方案中,载体是病毒载体。在一些实施方案中,载体是AAV载体。
AAV指细小病毒科病毒属中的一种复制缺陷型依赖性细小病毒。AAV可源自天然存在的病毒或可以是重组的。AAV可以包装在衣壳中,该衣壳可以源自天然存在的衣壳蛋白或重组衣壳蛋白。AAV的单链DNA基因组包含反向末端重复(ITR)。ITR涉及AAV基因组的复制和包壳,以及它在宿主细胞中的整合和它的切除。不希望被任何理论束缚,AAV载体可包含一个或多个ITR,包括5’ITR和/或3’ITR、一个或多个启动子、一个或多个编码一个或感兴趣的蛋白的核酸序列、和/或额外的转录后调控元件。本文公开的AAV载体可用本领域普通技术人员已知的标准分子生物学技术制备,例如,在通过引用整体并入本文的Sambook et al.(Molecular Cloning:A Laboratory Manual.Cold Spring Harbor Laboratory Press、N.Y.(2012))中描述的分子生物学技术。
在一些实施方案中,AAV整合入宿主细胞基因组中。在一些实施方案中,AAV不整合入宿主基因组中。在一些实施方案中,本文公开的AAV载体可包含来自任何已知生物的序列。在一些实施方案中,本文公开的AAV载体可包含合成的序列。AAV载体序列可以本领域普通技术人员已知的任何方式修改,如通过并入插入、缺失或取代,和/或通过使用转录后调控元件,如启动子、增强子以及转录和翻译终止子,如聚腺苷酸化信号。在一些实施方案中,AAV载体可包含涉及复制和整合的序列。
在一些实施方案中,本文公开的MiniShank3通过AAV载体递送至感兴趣的组织或细胞。在一些实施方案中,递送本文公开的MiniShank3的AAV载体被递送至受试者的中枢神经系统(CNS)。如本文所用,递送AAV载体至CNS可包含递送AAV载体至CNS中任何感兴趣的组织或细胞。在一些实施方案中,递送AAV载体至CNS涉及递送AAV载体至神经组织或神经细胞。在一些实施方案中,递送AAV载体至CNS涉及递送AAV载体至脑。在一些实施方案中,递送AAV载体至CNS涉及递送AAV载体至脊髓。在一些实施方案中,递送AAV载体至CNS涉及递送AAV载体至白质和灰质。在一些实施方案中,递送本文公开的MiniShank3的AAV载体被递送至适于本文公开的治疗的受试者的任何感兴趣的组织或细胞。
如本公开中使用的,“递送”或“施用”AAV载体可包括用于递送或施用AAV载体或包含AAV载体的组合物至受试者的本领域已知的任何方法。施用可包括但不限于AAV载体或包含AAV载体的组合物的直接施用或通过被动扩散或对流增强递送(CED)以绕过本领域已知的血脑屏障的外周施用。本文描述的AAV载体可以以与本公开的方面相容的任何组合物的形式施用。
AAV载体可包含任何已知的AAV血清型,包含,例如、AAV1、AAV2、AAV3、AAV4、AAV5、AAV6、AAV7、AAV8、AAV9、AAV10和AAV11。在一些实施方案中,AAV血清型是AAV9。通过引用并入本文的Gao etal.(2004)J.Virol.78(12):6381-6388中描述了AAV病毒的进化枝。在一些实施方案中,可以选择任何适于递送至CNS的AAV血清型。
本公开的AAV载体可包含或源自任何天然或重组的AAV血清型。在一些实施方案中,AAV载体可使用或基于WO 2017/201258A1中描述的AAV血清型,其内容通过引用整体并入本文,如,但不限于AAV1、AAV2、AAV2G9、AAV3、AAV3a、AAV3b、AAV3-3、AAV4、AAV4-4、AAV5、AAV6、AAV6.1、AAV6.2、AAV6.1.2、AAV7、AAV7.2、AAV8、AAV9、AAV9.11、AAV9.13、AAV9.16、AAV9.24、AAV9.45、AAV9.47、AAV9.61、AAV9.68、AAV9.84、AAV9.9、AAV10、AAV11、AAV12、AAV16.3、AAV24.1、AAV27.3、AAV42.12、AAV42-1b、AAV42-2、AAV42-3a、AAV42-3b、AAV42-4、AAV42-5a、AAV42-5b、AAV42-6b、AAV42-8、AAV42-10、AAV42-11、AAV42-12、AAV42-13、AAV42-15、AAV42-aa、AAV43-1、AAV43-12、AAV43-20、AAV43-21、AAV43-23、AAV43-25、AAV43-5、AAV44.1、AAV44.2、AAV44.5、AAV223.1、AAV223.2、AAV223.4、AAV223.5、AAV223.6、AAV223.7、AAV1-7/rh.48、AAV1-8/rh.49、AAV2-15/rh.62、AAV2-3/rh.61、AAV2-4/rh.50、AAV2-5/rh.51、AAV3.1/hu.6、AAV3.1/hu.9、AAV3-9/rh.52、AAV3-11/rh.53、AAV4-8/r11.64、AAV4-9/rh.54、AAV4-19/rh.55、AAV5-3/rh.57、AAV5-22/rh.58、AAV7.3/hu.7、AAV16.8/hu.10、AAV16.12/hu.11、AAV29.3/bb.1、AAV29.5/bb.2、AAV106.1/hu.37、AAV114.3/hu.40、AAV127.2/hu.41、AAV127.5/hu.42、AAV128.3/hu.44、AAV130.4/hu.48、AAV145.1/hu.53、AAV145.5/hu.54、AAV145.6/hu.55、AAV161.10/hu.60、AAV161.6/hu.61、AAV33.12/hu.17、AAV33.4/hu.15、AAV33.8/hu.16、AAV52/hu.19、AAV52.1/hu.20、AAV58.2/hu.25、AAVA3.3、AAVA3.4、AAVA3.5、AAVA3.7、AAVC1、AAVC2、AAVC5、AAV-DJ、AAV-DJ8、AAVF3、AAVF5、AAVH2、AAVrh.72、AAVhu.8、AAVrh.68、AAVrh.70、AAVpi.1、AAVpi.3、AAVpi.2、AAVrh.60、AAVrh.44、AAVrh.65、AAVrh.55、AAVrh.47、AAVrh.69、AAVrh.45、AAVrh.59、AAVhu.12、AAVH6、AAVLK03、AAVH-1/hu.1、AAVH-5/hu.3、AAVLG-10/rh.40、AAVLG-4/rh.38、AAVLG-9/hu.39、AAVN721-8/rh.43、AAVCh.5、AAVCh.5R1、AAVcy.2、AAVcy.3、AAVcy.4、AAVcy.5、AAVCy.5R1、AAVCy.5R2、AAVCy.5R3、AAVCy.5R4、AAVcy.6、AAVhu.1、AAVhu.2、AAVhu.3、AAVhu.4、AAVhu.5、AAVhu.6、AAVhu.7、AAVhu.9、AAVhu.10、AAVhu.11、AAVhu.13、AAVhu.15、AAVhu.16、AAVhu.17、AAVhu.18、AAVhu.20、AAVhu.21、AAVhu.22、AAVhu.23.2、AAVhu.24、AAVhu.25、AAVhu.27、AAVhu.28、AAVhu.29、AAVhu.29R、AAVhu.31、AAVhu.32、AAVhu.34、AAVhu.35、AAVhu.37、AAVhu.39、AAVhu.40、AAVhu.41、AAVhu.42、AAVhu.43、AAVhu.44、AAVhu.44R1、AAVhu.44R2、AAVhu.44R3、AAVhu.45、AAVhu.46、AAVhu.47、AAVhu.48、AAVhu.48R1、AAVhu.48R2、AAVhu.48R3、AAVhu.49、AAVhu.51、AAVhu.52、AAVhu.54、AAVhu.55、AAVhu.56、AAVhu.57、AAVhu.58、AAVhu.60、AAVhu.61、AAVhu.63、AAVhu.64、AAVhu.66、AAVhu.67、AAVhu.14/9、AAVhu.t 19、AAVrh.2、AAVrh.2R、AAVrh.8、AAVrh.8R、AAVrh.10、AAVrh.12、AAVrh.13、AAVrh.13R、AAVrh.14、AAVrh.17、AAVrh.18、AAVrh.19、AAVrh.20、AAVrh.21、AAVrh.22、AAVrh.23、AAVrh.24、AAVrh.25、AAVrh.31、AAVrh.32、AAVrh.33、AAVrh.34、AAVrh.35、AAVrh.36、AAVrh.37、AAVrh.37R2、AAVrh.38、AAVrh.39、AAVrh.40、AAVrh.46、AAVrh.48、AAVrh.48.1、AAVrh.48.1.2、AAVrh.48.2、AAVrh.49、AAVrh.51、AAVrh.52、AAVrh.53、AAVrh.54、AAVrh.56、AAVrh.57、AAVrh.58、AAVrh.61、AAVrh.64、AAVrh.64R1、AAVrh.64R2、AAVrh.67、AAVrh.73、AAVrh.74、AAVrh8R、AAVrh8R A586R突变体、AAVrh8RR533A突变体、AAAV、BAAV、山羊AAV、牛AAV、AAVhE1.1、AAVhEr1.5、AAVhER1.14、AAVhEr1.8、AAVhEr1.16、AAVhEr1.18、AAVhEr1.35、AAVhEr1.7、AAVhEr1.36、AAVhEr2.29、AAVhEr2.4、AAVhEr2.16、AAVhEr2.30、AAVhEr2.31、AAVhEr2.36、AAVhER1.23、AAVhEr3.1、AAV2.5T、AAV-PAEC、AAV-LK01、AAV-LK02、AAV-LK03、AAV-LK04、AAV-LK05、AAV-LK06、AAV-LK07、AAV-LK08、AAV-LK09、AAV-LK10、AAV-LK11、AAV-LK12、AAV-LK13、AAV-LK14、AAV-LK15、AAV-LK16、AAV-LK17、AAV-LK18、AAV-LK19、AAV-PAEC2、AAV-PAEC4、AAV-PAEC6、AAV-PAEC7、AAV-PAEC8、AAV-PAEC11、AAV-PAEC12、AAV-2-pre-miRNA-101、AAV-8h、AAV-8b、AAV-h、AAV-b、AAV SM 10-2、AAV Shuffle 100-1、AAV Shuffle 100-3、AAV Shuffle 100-7、AAV Shuffle 10-2、AAV Shuffle10-6、AAV Shuffle 10-8、AAVShuffle 100-2、AAV SM 10-1、AAV SM 10-8、AAV SM 100-3、AAV SM 100-10、BNP61 AAV、BNP62 AAV、BNP63 AAV、AAVrh.50、AAVrh.43、AAVrh.62、AAVrh.48、AAVhu.19、AAVhu.11、AAVhu.53、AAV4-8/rh.64、AAVLG-9/hu.39、AAV54.5/hu.23、AAV54.2/hu.22、AAV54.7/hu.24、AAV54.1/hu.21、AAV54.4R/hu.27、AAV46.2/hu.28、AAV46.6/hu.29、AAV128.1/hu.43、真实型AAV(ttAAV)、UPENN AAV 10、日本AAV 10血清型、AAV CBr-7.1、AAV CBr-7.10、AAV CBr-7.2、AAV CBr-7.3、AAV CBr-7.4、AAV CBr-7.5、AAV CBr-7.7、AAV CBr-7.8、AAV CBr-B7.3、AAV CBr-B7.4、AAV CBr-E1、AAV CBr-E2、AAV CBr-E3、AAV CBr-E4、AAVCBr-E5、AAV CBr-e5、AAV CBr-E6、AAV CBr-E7、AAV CBr-E8、AAV CHt-1、AAV CHt-2、AAVCHt-3、AAV CHt-6.1、AAV CHt-6.10、AAV CHt-6.5、AAV CHt-6.6、AAV CHt-6.7、AAV CHt-6.8、AAV CHt-P1、AAV CHt-P2、AAV CHt-P5、AAV CHt-P6、AAV CHt-P8、AAV CHt-P9、AAVCKd-1、AAV CKd-10、AAV CKd-2、AAV CKd-3、AAV CKd-4、AAV CKd-6、AAV CKd-7、AAV CKd-8、AAV CKd-B1、AAV CKd-B2、AAV CKd-B3、AAV CKd-B4、AAV CKd-B5、AAV CKd-B6、AAV CKd-B7、AAV CKd-B8、AAV CKd-H1、AAV CKd-H2、AAV CKd-H3、AAV CKd-H4、AAV CKd-H5、AAV CKd-H6、AAV CKd-N3、AAV CKd-N4、AAV CKd-N9、AAV CLg-F1、AAV CLg-F2、AAV CLg-F3、AAV CLg-F4、AAV CLg-F5、AAV CLg-F6、AAV CLg-F7、AAV CLg-F8、AAV CLv-1、AAV CLv1-1、AAV Clv1-10、AAV CLv1-2、AAV CLv-12、AAV CLv1-3、AAV CLv-13、AAV CLv1-4、AAV Clv1-7、AAV Clv1-8、AAV Clv1-9、AAV CLv-2、AAV CLv-3、AAV CLv-4、AAV CLv-6、AAV CLv-8、AAV CLv-D1、AAVCLv-D2、AAV CLv-D3、AAV CLv-D4、AAV CLv-D5、AAV CLv-D6、AAV CLv-D7、AAV CLv-D8、AAVCLv-E1、AAV CLv-K1、AAV CLv-K3、AAV CLv-K6、AAV CLv-L4、AAV CLv-L5、AAV CLv-L6、AAVCLv-M1、AAV CLv-M11、AAV CLv-M2、AAV CLv-M5、AAV CLv-M6、AAV CLv-M7、AAV CLv-M8、AAVCLv-M9、AAV CLv-R1、AAV CLv-R2、AAV CLv-R3、AAV CLv-R4、AAV CLv-R5、AAV CLv-R6、AAVCLv-R7、AAV CLv-R8、AAV CLv-R9、AAV CSp-1、AAV CSp-10、AAV CSp-11、AAV CSp-2、AAVCSp-3、AAV CSp-4、AAV CSp-6、AAV CSp-7、AAV CSp-8、AAV CSp-8.10、AAV CSp-8.2、AAVCSp-8.4、AAV CSp-8.5、AAV CSp-8.6、AAV CSp-8.7、AAV CSp-8.8、AAV CSp-8.9、AAV CSp-9、AAV.hu.48R3、AAV.VR-355、AAV3B、AAV4、AAV5、AAVF1/HSC1、AAVF11/HSC11、AAVF12/HSC12、AAVF13/HSC13、AAVF14/HSC14、AAVF15/HSC15、AAVF16/HSC16、AAVF17/HSC17、AAVF2/HSC2、AAVF3/HSC3、AAVF4/HSC4、AAVF5/HSC5、AAVF6/HSC6、AAVF7/HSC7、AAVF8/HSC8、AAVF9/HSC9、AAV-PHP.B(PHP.B)、AAV-PHP.A(PHP.A)、G2B-26、G2B-13、TH1.1-32和/或TH1.1-35及其变体。在US9,585,971、US2017/0166926和WO2020160337中进一步描述了AAV载体,其通过引用并入本文。
在一些实施方案中,本文公开的MiniShank3通过AAV载体递送。在一些实施方案中,AAV载体包含转基因及其调控序列,以及任选的5’ITR和3’ITR。在一些实施方案中,转基因及其调控序列的两侧是5’ITR和3’ITR序列。转基因可包含如本文公开的一个或多个编码MiniShank3的区域。转基因也可包含编码另一蛋白的区域。转基因还可包含一个或多个表达控制序列(例如,poly-A尾)。在一些实施方案中,AAV载体至少包含AAV ITR和MiniShank3转基因。
在一些实施方案中,AAV可以包装进AAV颗粒中并施用至受试者和/或递送至选中的靶细胞。在一些实施方案中,AAV颗粒包含AAV衣壳蛋白。在一些实施方案中,AAV颗粒包含至少一种选自本文公开的AAV血清型的衣壳蛋白,这些AAV血清型包括AAV1、AAV2、AAV3、AAV4、AAV5、AAV6、AAV6.2、AAV7、AAV8、AAV9、PHB.eB、AAV.rh8、AAV.rh10、AAV.rh39、AAV.43、AAV2/2-66、AAV2/2-84和AAV2/2-125,或任何前述血清型的变体。
在一些实施方案中,AAV载体中miniShank3转基因编码序列可操作性地连接至用于组织特异性基因表达的调控序列。在一些情况下,组织特异性调控序列结合诱导以组织特异性方式转录的组织特异性转录因子。此类组织特异性调控序列(例如,启动子、增强子等)是本领域公知的。在一些实施方案中,组织特异性调控序列可以是Syn启动子(例如,hSyn1)。在一些实施方案中,组织特异性调控序列可以是神经元特异的并适于本文描述的治疗的任何启动子或增强子。
在一些实施方案中,在AAV载体中的包含SEQ ID NO:2或4的miniShank3转基因编码序列可操作地连接至启动子并且两侧是AAV ITR。在一些实施方案中,在AAV载体中的包含SEQ ID NO:1或3的miniShank3转基因编码序列可操作地连接至启动子并且两侧是AAVITR。
本公开的方面涉及表达miniShank3转基因的AAV载体。在一些实施方案中,miniShank3转基因两侧是AAV ITR。在一些实施方案中,AAV ITR包含AAV2 ITR。在一些实施方案中,AAV ITR包含AAV1 ITR。在一些实施方案中,AAV ITR包含AAV5 ITR。在一些实施方案中,AAV ITR包含AAV6ITR。在一些实施方案中,AAV ITR包含AAV8 ITR。在一些实施方案中,AAV ITR包含AAV9 ITR。在一些实施方案中,AAV ITR包含rh10 ITR。在一些实施方案中,AAV ITR可包含自体互补ITR。
应当理解本文描述的AAV载体可包含DNA构建体,该DNA构建体包含转基因如MiniShank3、5’和/或3’ITR、启动子、内含子和/或本领域已知的其他相关调控元件。
在一些实施方案中,AAV载体包含土拨鼠肝炎病毒转录后调控元件(WPRE),其可促进miniShank3转基因表达。在一些实施方案中,AAV载体包含非翻译部分如内含子或5’非翻译区或3’非翻译区。在一些实施方案中,内含子可位于启动子/增强子序列和miniShank3转基因之间。
在一些实施方案中,本文所用的AAV载体可以是自体互补的载体。
图15示出了包含人miniShank3转基因的AAV载体的实例(指的是图15中“AAV-hSyn1-人MiniShank3-V1”),该转基因在人突触蛋白1(hSyn1)启动子控制下表达。图15中示出的AAV载体包含表1中如SEQ ID NO:21提供的序列。
如图15所示,SEQ ID NO:21包含人Mini-Shank3基因、5’-ITR、3’-ITR、WPRE、hGHpolyA、F1复制起点、NeoR/KanR标记、hSyn1启动子和PUC复制起点。在一些实施方案中,每个反向末端重复(ITR)序列包含约145个核苷酸。这些元件可顺式用于有效复制和衣壳化。本领域技术人员将理解本领域已知的AAV载体的任何元件可以与本公开的方面相容。本领域技术人员将理解,编码功能性MiniShank3蛋白的本文描述的任何多核苷酸序列可以在类似于图15中示出的DNA构建体中表达以用于AAV递送。这些DNA构建体可包含图15中示出的一个或多个元件。例如,在一些实施方案中,相对于SEQ ID NO:1-4中任一项包含至少70%、至少75%、至少80%、至少85%、至少90%、至少95%的同一性的编码序列表达于DNA构建体(如图15中示出的构建体)中。在一些实施方案中,包含SEQ ID NO:1-4中的任一项的序列的编码序列表达于DNA构建体(如图15中示出的构建体)中。在一些实施方案中,DNA构建体包含图15中示出的一个或多个元件,如启动子、5’-ITR、3’-ITR、WPRE、hGH polyA、F1复制起点、NeoR/KanR标记和/或PUC复制起点。
在一些实施方案中,与本公开相关的AAV载体包含编码MiniShank3蛋白的核酸序列,该核酸序列相对于SEQ ID NO:21的序列包含至少70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%同一性或100%相同(包括其间的任何数值)。在一些实施方案中,AAV载体包含对应于SEQ ID NO:21的序列,其编码包含SEQ IDNO:18的序列的MiniShank3蛋白。
在一些实施方案中,AAV载体包含相对于SEQ ID NO:21的序列包含至少70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%同一性或100%相同(包其间的任何数值)的序列,并且该序列编码包含SEQ ID NO:18的序列的MiniShank3蛋白,该AAV载体可递送至有需要的人受试者并可适用于治疗具有神经发育障碍的人受试者。
作为本领域普通技术人员应当理解,本领域已知的用于临床用途的设计AAV载体的任何方法可以与本公开的方面相容。例如,涉及AAV载体和递送的公开内容的非限制性实例提供于并引用自标题为“腺相关病毒(AAV)进化枝、序列、含有其的载体、及其用途”的美国专利号7,906,111和标题为“用于无脉络膜症的基因疗法的AAV载体”的美国专利号9,834,788,其中任一项通过引用整体并入本文。
在一些实施方案中,与本公开相关的AAV载体包含编码MiniShank3蛋白用于AAV递送的序列,该序列相对于表1提供的SEQ ID NO:7或21的序列包含至少70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%同一性或100%相同(包括其间的任何数值)。SEQ ID NO:7编码SEQ ID NO:11的蛋白序列。SEQ ID NO:8编码SEQ ID NO:12的蛋白序列。SEQ ID NO:9编码SEQ ID NO:13的蛋白序列。SEQ ID NO:10编码SEQ ID NO:14的蛋白序列。SEQ ID NO:21编码SEQ ID NO:18的蛋白序列。
在一些实施方案中,编码MiniShank3蛋白用于AAV递送的AAV载体编码具有以下序列的蛋白,该序列相对于表1提供的SEQ ID NO:11或17-20中任一项包含至少70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%同一性或100%相同(包括其间的任何数值)。
在一些实施方案中,用于递送本文公开的miniShank3的载体可以是慢病毒载体。在一些实施方案中,用于递送本文公开的miniShank3的载体可以是腺病毒载体。
在一些实施方案中,本文公开的载体构建体可包含表1示出的SEQ ID NO:21。
在一些实施方案中,包含Shank3蛋白的多核苷酸(即miniShank3 DNA构建体)的载体可以在感兴趣的特定组织或细胞中表达。在一些实施方案中,本文公开的载体包含启动子。在一些实施方案中,载体包含细胞类型特异性启动子。在一些实施方案中,启动子是人启动子。在一些实施方案中,人启动子是人突触蛋白1(hSyn1)。在一些实施方案中,hSyn1启动子具有对应于SEQ ID NO:22的多核苷酸序列。在一些实施方案中,人启动子可以是本领域已知并适于构建miniShank3的任何启动子。在一些实施方案中,人启动子可以是对神经组织和细胞有高度特异性的任何启动子。在一些实施方案中,启动子是组成型启动子。例如,组成型启动子可以是CAG启动子。作为本领域普通技术人员应当理解,只要所选的启动子与本公开的方面相容,可以使用任何启动子。
组合物和施用
本公开提供了组合物,包括药物组合物,该组合物包含在本文公开的AAV载体中递送的多核苷酸和药学上可接受的载体。
本公开的组合物可包含单独的或与一种或多种其他病毒组合的AAV。在一些实施方案中,组合物包含1、2、3、4、5、6、7、8、9、10或更多种不同的AAV,每种AAV有一个或多个不同的Shank蛋白。
考虑到AAV所针对的适应症,本领域普通技术人员可以容易地选择合适的载体。例如,一个合适的载体包含盐水,其可以与多种缓冲溶液(例如,磷酸盐缓冲盐水)一起配制。其他示例性载体包含无菌生理盐水、乳糖、蔗糖、磷酸钙、明胶、葡聚糖、琼脂、果胶、花生油、香油和水。载体的选择不是对本公开的限制。在US9,585,971和US2017/0166926中进一步描述了包含AAV载体的药用组合物,其通过引用整体并入本文。
如本文所用,“载体”包含任何和所有溶剂、分散媒介、媒介物、涂料、稀释剂、抗菌剂和抗真菌剂、等渗剂和延迟吸收剂、缓冲液、载体溶液、悬浮液、胶体等。本领域公知此类媒介和试剂用于药物活性物质的用途。补充活性成分也可掺入该组合物。短语“药学上可接受的”指施用于宿主时不会产生过敏或类似不良反应的分子实体和组合物。
递送媒介物如脂质体、纳米胶囊、微粒、微球、脂质颗粒、囊泡等可用于将本公开的组合物引入合适的宿主细胞中。特别地,可配制AAV载体递送的转基因用于包裹在脂质颗粒、脂质体、囊泡、纳米球或纳米颗粒等中进行递送。
此类制剂可优选用于引入本文公开的核酸或AAV构建体的药学上可接受的制剂。本领域技术人员通常已知脂质体的形成和使用。最近,研发出的脂质体有改善的血浆稳定性和循环半衰期(美国专利号5,741,516)。此外,已经描述了脂质体和脂质体样制剂作为潜在药物载体的各种方法(美国专利号5,567,434;5,552,157;5,565,213;5,738,868和5,795,587)。
脂质体由分散在水性介质中并自发形成多层囊泡(也称为多层囊泡(MLV))的磷脂形成。MLV通常具有25nm至4μm的直径。MLV的超声处理导致形成直径范围为200至的小单层囊泡(SUV),其核心含有水溶液。
或者,可以使用AAV载体的纳米胶囊制剂。纳米胶囊通常可以稳定和可重复的方式包埋物质。为避免细胞内聚合物过载引起的副作用,此类超细颗粒(大小约为0.1μm)应使用能够在体内降解的聚合物进行设计。考虑使用满足这些要求的可生物降解的聚氰基丙烯酸烷基酯纳米颗粒。
在一些实施方案中,包含在AAV载体中递送的核酸的药物组合物包含其他药物成分,如防腐剂或化学稳定剂。合适的示例性防腐剂包括氯丁醇、山梨酸钾、山梨酸、二氧化硫、没食子酸丙酯、对羟基苯甲酸酯、乙基香草醛、甘油、苯酚、硫柳汞和对氯苯酚。合适的化学稳定剂包括明胶和白蛋白。在许多情况下,优选包括等渗剂,例如糖或氯化钠。通过在组合物中使用延迟吸收剂,例如单硬脂酸铝和明胶,可以延长药物组合物的吸收。
适于递送AAV载体的药学上可接受的形式包括无菌水溶液或分散液和无菌粉末,其用于临时制备无菌注射液或分散液。也可以在甘油、液体聚乙二醇及其混合物和油中制备分散体。在一般的储存和使用条件下,这些制剂含有防腐剂以防止微生物的生长。在许多情况下,该形式是无菌的并且应该是易于注射的流体。它在制造和储存条件下必须是稳定的,并且必须防止微生物如细菌和真菌的污染作用。
本文描述的方法包括施用足够量的AAV载体以转染期望组织(例如,脑)的细胞并提供足够水平的基因转移和表达而没有过度的不利影响。常规和药学上可接受的施用途径包括但不限于直接递送至所选器官、口服、吸入、眼内、静脉内包括面部静脉注射和眼眶后注射、脑室内(ICV)、肌内、鞘内、颅内、皮下、皮内、瘤内和其他肠胃外施用途径。如果需要,可以组合施用途径。在一些实施方案中,本文公开的载体经静脉内施用。
在一些实施方案中,本公开提供治疗具有神经发育障碍的受试者的方法。在一些实施方案中,本公开提供治疗具有自闭症谱系障碍(ASD)的受试者的方法。在一些实施方案中,本公开提供治疗具有费伦-麦克德米德综合症的受试者的方法。在一些实施方案中,本文提供的方法包括施用并递送有效量的组合物至受试者的靶环境或组织,该组合物包含含有编码Shank3蛋白(例如,miniShank3)的多核苷酸的载体。在一些实施方案中,靶组织是皮层。在一些实施方案中,靶组织是纹状体。在一些实施方案中,靶组织是小脑丘脑。在一些实施方案中,靶组织是海马体。在一些实施方案中,靶组织是任何脑结构。在一些实施方案中,用于施用并递送有效量的组合物至靶环境或组织的方法包括递送该组合物至神经元或其他脑细胞类型,该组合物包含含有编码Shank3蛋白(例如,miniShank3)的多核苷酸的载体。在一些实施方案中,载体是AAV载体。在一些实施方案中,引用递送核酸至有需要的受试者的靶环境或组织的方法包括向受试者的靶环境或组织提供包含至少含有待递送的核酸(例如miniShank3)的AAV载体的组合物并施用该组合物至受试者。在US9,585,971、US2017/0166926和WO2020/160337中进一步描述了AAV载体的使用方法,其通过引用并入本文。在一些实施方案中,组合物可包含衣壳蛋白。
在一些实施方案中,组合物包含载体,该载体包含编码Shank3蛋白的多核苷酸,该组合物通过静脉内施用、全身施用、脑室内施用、子宫内施用、鞘内注射、眼眶后注射或面部静脉注射递送至受试者。在一些实施方案中,子宫内施用用于处于产前发育阶段的受试者。在一些实施方案中,通过纳米颗粒递送该组合物至受试者。在一些实施方案中,通过病毒载体递送该组合物至受试者。在一些实施方案中,通过适于递送核酸物质的任何载体递送该组合物至受试者。
可根据本文公开的方法将包含含有编码对受试者有某种用途或益处的蛋白质的多核苷酸的载体的任何组合物递送至受试者的靶环境或组织。
除了上述递送方法,也考虑以下技术作为递送AAV组合物至宿主的替代方法。美国专利号5,656,016中已经使用和描述了超声穿透(即超声波)作为用于提高药物渗透进入和通过循环系统的速率和功效的装置。其他考虑的替代药物递送是骨内注射(美国专利号5,779,708)、微芯片装置(美国专利号5,797,898)、眼用制剂(Bourlais等人,1998)、透皮基质(美国专利号5,770,219和5,783,208)和反馈控制递送(美国专利号5,697,899)。
包含编码Shank3蛋白(例如miniShank3)的多核苷酸的AAV的剂量需要实现特定的“治疗效果”,例如绝对载体基因组(vg)或每毫升药物溶液的载体基因组(vg/mL)的剂量单位将根据多种因素而改变,包括但不限于:AAV施用途径、实现治疗效果所需的基因表达水平、正在治疗的特定疾病或病症以及基因产物的稳定性。在不影响神经发育的情况下产生最大感染百分比的剂量也是合适的。本领域技术人员可基于上述因素和其他因素简单确定AAV剂量范围以治疗有特定疾病或病症的患者。
AAV载体的有效量是足以感染动物受试者或人受试者或靶向期望组织的量。有效量将主要取决于以下因素,如受试者的物种、年龄、性别、体重、健康状况和目标组织。因此,有效量在受试者和组织间可以变化。在用于施用至受试者的组合物或剂量的上下文中的术语“有效量”指在受试者中产生一种或多种期望的反应的组合物或剂量的量。在一些实施方案中,本文公开的有效量可部分或全部挽救突变的Shank3基因的效果和/或部分或全部恢复Shank3蛋白的功能缺失。有效量可涉及减少未期望的应答水平,尽管在一些实施方案中,它涉及完全防止不期望的应答。有效量也可涉及推迟不期望的应答的发生。有效量也可以是产生所期望治疗终点或所期望治疗结果的量。在其他实施方案中,有效量可涉及增强期望的应答水平,如治疗终点或结果。可以通过常规方法和本申请中公开的方法监测任何前述的实现。当然,有效量将取决于所治疗的特定受试者;病况的严重程度;患者个体参数,其包括年龄、身体状况、体型和体重;治疗的持续时间;并发治疗的性质(如果有的话);具体的施用途径等因素。
例如,在一些实施方案中,施用于受试者的载体基因组的量是约6.0x1011vg至约9.0x1013 vg间的任何数值。在一些实施方案中,施用于受试者的载体基因组的量是约6.0x1013 vg/mL至约9.0x1013 vg间的任何数值。在一些实施方案中,施用于受试者的载体基因组的量是约1x1010 vg至约1x1012 vg间的任何数值。在某些实施方案中,AAV的有效量是1010、1011、1012、1013或1014基因组拷贝每千克。在某些实施方案中,AAV的有效量是1010、1011、1012、1013或1014或1015基因组拷贝每千克。在一些情况下,在约1011至1013AAV基因组拷贝之间的剂量是合适的。在一些实施方案中,施用至受试者的载体基因组的量可以是适于本文公开的治疗和方法的任何剂量。
在一些实施方案中,施用一剂量的AAV至受试者不超过每个日历天(例如,24小时)一次。在一些实施方案中,施用一剂量的AAV至受试者不超过每2、3、4、5、6或7个日历天一次。在一些实施方案中,施用一剂量的AAV至受试者不超过每个日历周(例如,7个日历天)一次。在一些实施方案中,施用一剂量的AAV至受试者不超过两周一次(例如,每两个日历周一次)。在一些实施方案中,施用一剂量的AAV至受试者不超过每个日历月(例如,30个日历天)一次。在一些实施方案中,施用一剂量的AAV至受试者不超过每6个日历月一次。在一些实施方案中,施用一剂量的AAV至受试者不超过每个日历年(例如,365天或闰年中的366天)一次。在一些实施方案中,施用一剂量的AAV至受试者不超过每两个日历年(例如,730天或闰年中的731天)一次。在一些实施方案中,施用一剂量的AAV至受试者不超过每三个日历年(例如,1095天或闰年中的1096天)一次。
本文公开的药学上可接受的赋形剂和载体溶液的制剂是本领域技术人员众所周知的,正如开发在多种治疗方案中使用本文所述的特定组合物的合适剂量和治疗方案一样。通常,这些制剂可包含至少约0.1%或更多的活性化合物,尽管活性成分的百分比当然可以变化,并且活性成分的百分比可以方便地是在总制剂重量或体积的约1%或2%和约70%或80%或更多之间。自然地,每种治疗有用的组合物中的活性化合物的量可以这样制备,即在化合物的任何给定单位剂量中获得合适的剂量。如溶解度、生物利用度、生物半衰期、施用途径、产品保质期以及其他药理学考虑的因素将被制备此类药物制剂的领域的技术人员所考虑。因此,可能需要各种剂量和治疗方案。
与Shank蛋白网络相关的蛋白的表达
在一些实施方案中,本文提供的方法和组合物有助于治疗神经发育障碍,如自闭症谱系障碍(ASD)或费伦-麦克德米德综合症。本公开的发明人发现在小鼠模型中通过病毒载体如AAV载体递送miniShank3在恢复突触后密度(PSD)蛋白的功能方面是有效的。在一些实施方案中,使用PSD蛋白的表达水平评估施用miniShank3的功效。在一些实施方案中,PSD蛋白是Homer。在一些实施方案中,PSD蛋白是突触后密度蛋白95(PSD95)。在一些实施方案中,PSD蛋白是SynGap1。在一些实施方案中,PSD蛋白是SAPAP3。在一些实施方案中,PSD蛋白是NR1。在一些实施方案中,PSD蛋白是NR2B。在一些实施方案中,PSD蛋白是GluR2。在一些实施方案中,PSD蛋白是在miniShank3治疗后能获得改善或恢复的任何蛋白。
在一些实施方案中,任何PSD蛋白相比于未治疗对照受试者的增加可表明miniShank3的功效。用于检测基因表达和蛋白水平的方法是本领域公知的。
在一些实施方案中,用miniShank3治疗后受试者中Homer的表达相对于对照增加了至少5%、10%、20%、30%、40%、50%、60%、70%、80%、90%、100%、或至少2倍、至少5倍、至少10倍、至少20倍、至少50倍、至少100倍、或至少1000倍。在一些实施方案中,用miniShank3治疗后受试者中突触后蛋白(PSD95)的表达相对于对照增加了至少5%、10%、20%、30%、40%、50%、60%、70%、80%、90%、100%、或至少2倍、至少5倍、至少10倍、至少20倍、至少50倍、至少100倍、或至少1000倍。在一些实施方案中,用miniShank3治疗后受试者中SynGap1的表达相对于对照增加了至少5%、10%、20%、30%、40%、50%、60%、70%、80%、90%、100%、或至少2倍、至少5倍、至少10倍、至少20倍、至少50倍、至少100倍、或至少1000倍。在一些实施方案中,用miniShank3治疗后受试者中SAPAP3的表达相对于对照增加了至少5%、10%、20%、30%、40%、50%、60%、70%、80%、90%、100%、或至少2倍、至少5倍、至少10倍、至少20倍、至少50倍、至少100倍、或至少1000倍。在一些实施方案中,用miniShank3治疗后受试者中NR1的表达相对于对照增加了至少5%、10%、20%、30%、40%、50%、60%、70%、80%、90%、100%、或至少2倍、至少5倍、至少10倍、至少20倍、至少50倍、至少100倍、或至少1000倍。在一些实施方案中,用miniShank3治疗后受试者中NR2B的表达相对于对照增加了至少5%、10%、20%、30%、40%、50%、60%、70%、80%、90%、100%、或至少2倍、至少5倍、至少10倍、至少20倍、至少50倍、至少100倍、或至少1000倍。在一些实施方案中,用miniShank3治疗后受试者中GluR2的表达相对于对照增加了至少5%、10%、20%、30%、40%、50%、60%、70%、80%、90%、100%、或至少2倍、至少5倍、至少10倍、至少20倍、至少50倍、至少100倍、或至少1000倍。
在一些实施方案中,施用MiniShank3或包含MiniShank3的组合物可导致睡眠效率改善。在一些实施方案中,受试者在施用有效量的包含表达构建体的组合物后睡眠效率改善,该表达构建体包含编码Shank蛋白如MiniShank3蛋白的多核苷酸。在一些实施方案中,受试者在施用有效量的组合物后睡眠效率相对于对照受试者增加了至少5%、10%、20%、30%、40%、50%、60%、70%、80%、90%、100%、或至少2倍、至少5倍、至少10倍、至少20倍、至少50倍、至少100倍、或至少1000倍。改善的睡眠效率包括更少的睡眠障碍,其包括但不限于难以入睡和难以保持熟睡。可以使用本领域已知的任何方法进行睡眠效率的测量。
在一些实施方案中,施用MiniShank3或包含MiniShank3的组合物可导致社交障碍改善。在一些实施方案中,受试者在施用有效量的包含表达构建体的组合物后社交障碍改善,该表达构建体包含编码Shank蛋白如MiniShank3蛋白的多核苷酸。在一些实施方案中,受试者施用有效量的组合物后社交障碍相对于对照受试者减少了至少5%、10%、20%、30%、40%、50%、60%、70%、80%、90%、100%、或至少2倍、至少5倍、至少10倍、至少20倍、至少50倍、至少100倍、或至少1000倍。可以使用本领域已知的任何方法进行社交障碍的测量。
如本文所用,“社交障碍”指阻止受试者表现出自愿社交互动的行为异常或缺陷。
在一些实施方案中,施用MiniShank3或包含MiniShank3的组合物可导致运动和/或运动协调缺陷改善。在一些实施方案中,受试者在施用有效量的包含表达构建体的组合物后运动和/或运动协调缺陷改善,该表达构建体包含编码Shank蛋白如MiniShank3蛋白的多核苷酸。在一些实施方案中,受试者施用有效量的组合物后运动和/或运动协调缺陷相对于对照受试者降低了至少5%、10%、20%、30%、40%、50%、60%、70%、80%、90%、100%、或至少2倍、至少5倍、至少10倍、至少20倍、至少50倍、至少100倍、或至少1000倍。可以使用本领域已知的任何方法进行运动和/或运动协调缺陷的测量。
如本文所用,“运动和/或运动协调缺陷”可包含例如缺乏协调、平衡缺失和/或步态蹒跚。
在一些实施方案中,施用MiniShank3或包含MiniShank3的组合物可导致皮层-纹状体突触功能障碍改善。在一些实施方案中,受试者在施用有效量的包含表达构建体的组合物后皮层-纹状体突触功能障碍改善,该表达构建体包含编码Shank蛋白如MiniShank3蛋白的多核苷酸。在一些实施方案中,受试者施用有效量的组合物后皮层-纹状体突触功能障碍相对于对照受试者降低了至少5%、10%、20%、30%、40%、50%、60%、70%、80%、90%、100%、或至少2倍、至少5倍、至少10倍、至少20倍、至少50倍、至少100倍、或至少1000倍。可以使用本领域已知的任何方法进行皮层-纹状体突触功能障碍的测量。
如本文所用,“皮层-纹状体突触功能障碍”指脑中有缺陷的皮层纹状体回路,其会造成如神经精神障碍和神经发育疾病,如自闭症、强迫症和图雷特综合征中的重复性和强迫性行为。
基于以下实施例部分中描述的非限制性说明性实施方案,可以进一步理解本文描述的技术的一些方面。对以下实施例部分中描述的实施方案的任何限制仅是对以下实施例部分中描述的实施方案的限制,而不是对本文描述的任何其他实施方案的限制。
实施例
为了可以更充分地理解本文描述的发明,给出以下实施例。本申请中描述的实施例例用于说明本文提供的系统和方法,不应以任何方式解释为限制其范围。
实施例1:具有Shank3突变的小鼠模型表现出突触缺陷和行为异常
先前开发了多个具有Shank3 LoF突变的小鼠和猴模型,以研究Shank3基因的突变如何影响脑发育、神经元结构、突触和回路功能以及行为。这些模型作为测试潜在疗法的基础。
产生了两个不同Shank3等位基因突变小鼠:Shank3A和Shank3B。在Shank3A突变小鼠中,靶向编码锚蛋白重复的基因的部分,导致Shank3α(最长的Shank3异形体)的完全消除。然而,其他两个异形体未受影响(本文中称为Shank3β和Shank3γ)。在Shank3B突变体中,靶向PDZ结构域,导致Shank3α和Shank3β异形体的完全消除以及假定的Shank3γ异形体的显著减少。进一步分析主要集中于Shank3B突变小鼠。
通过组织学分析,Shank3B-/-小鼠未表现出明显的脑异常。然而,到3-6个月大时,Shank3B-/-小鼠出现明显的皮肤损伤。该损失是自体产生的,因为它们存在于断奶年龄时被分开的动物中,而不是由于过度相互梳理(allogrooming),因为自出生时与Shank3B-/-小鼠一起饲养的野生型(WT)小鼠中没有发现损伤。24小时录像揭示,相比于WT对照,损伤前的Shank3B-/-小鼠显示出增加的梳理时间(图1A-1B),表明Shank3B-/-小鼠具有过度梳理和自伤行为。总之,Shank3B突变小鼠表现出重复和强迫性梳理,从而导致皮肤损伤。
为研究Shank3突变对社交行为的影响,使用三室社会舞台来探究动物自愿发起社交互动及其辨别社交新奇事物的能力。最初,测试动物被留下来探索并开始与被关在有线笼子内的伙伴(“陌生小鼠1”)或相同但空着的有线笼子(“空笼”)进行社交接触。Shank3B-/-小鼠表现出与空笼而不是社交伙伴互动的明显偏好(图2A-2B)。在随后的试验中,引入一个新的社交伙伴“(陌生小鼠2”)到之前空着的有线笼子里。WT小鼠表现出对新动物的偏好,而Shank3B-/-突变体在中心室中花费更多时间(图2A和2C)。总之,Shank3B突变小鼠表现出社交互动缺陷。
用Shank3突变小鼠研究Shank3突变对纹状体突触的影响。基底神经节是与ASD相关的大脑区域之一。Shank3B-/-小鼠的重复梳理行为表明皮层-纹状体功能的缺陷。此外,Shank3是纹状体中唯一高表达的Shank家族成员(图3A)。因此,分析集中在纹状体神经元和皮层-纹状体突触上。
为了确定Shank3的破坏可能如何影响PSD蛋白网络,针对支架蛋白和谷氨酸受体亚基探究从纹状体纯化的PSD(图3B-3C)。在Shank3B-/-小鼠中观察到SAPAP3、Homer-1b/c和PSD93以及谷氨酸受体亚基GluR2、NR2A和NR2B的水平减少。这表明纹状体中PSD的分子组成发生了改变并且谷氨酸能信号传导被破坏,支持了Shank蛋白是主支架的假设。
使用高尔基体追踪,发现神经元肥大,如Shank3B-/-MSN中树突轴的复杂性、总树突长度和表面积增加所示。另外,充满MSN的染料揭示Shank3B-/-小鼠中棘密度的减少。EM分析显示相对于WT,来自Shank3B-/-小鼠的PSD的平均厚度和长度减少。总之,这些结果强调了Shank3在纹状体中MSN和谷氨酸能突触发育中的关键作用。
为了阐明Shank3破坏对突触的功能性后果,在6-7周龄Shank3B-/-小鼠的急性脑切片中进行了皮层-纹状体突触回路的记录,并进行了相同年龄的行为测试。发现与对照相比,Shank3B-/-小鼠的场群峰显著降低(图4A)。突触前功能没有明显改变,如刺激强度与称为负峰1(NP1)和双脉冲比率(PPR)的应答的动作电位分量的波幅的关系所示。这些结果表明,总场应答的减少很可能是由于突触功能的突触后损伤和/或功能性突触数量的减少。
还进行了记录背外侧纹状体MSN中AMPAR-mEPSC的全细胞电压钳。在Shank3B-/-MSN中mEPSC的频率显著减少(图4B-4C),因为未观察到PPR缺陷,表明Shank3B-/-MSN中功能性突触数量减少(图4E)。Shank3B-/-MSN中的峰mEPSC波幅也减少(图4B和4D),表明可用突触的突触后反应减少。这些数据表明Shank3在皮层-纹状体回路中的突触后功能中的重要作用。类似的检查将在猴模型上进行测试,然后在临床试验中对具有Shank3突变的人类ASD患者进行测试。
实施例2:miniShank3基因的设计和构建
本文公开的针对Shank3突变的基因治疗策略是使用AAV将Shank3cDNA的功能拷贝递送至脑细胞中以恢复患者中的Shank3表达水平。然而,Shank3是具有约5.7kb的编码序列的大蛋白,超过了AAV载体的包装能力。为了解决该问题,以减小尺寸同时保持其完整功能的目标设计了小型化Shank3(miniShank3)。
在miniShank3的第一个版本(miniShank3-v1,图5B)中,删除了N端结构域和被认为不关键的其他区域如锚蛋白重复以及PDZ结构域与富脯氨酸结构域之间的连接序列,包括富脯氨酸结构域的主要部分。通过仅保留预测对Shank3蛋白功能关键的结构域,这有效地将Shank3编码序列减少到2.1kb。
不希望受任何理论的束缚,Shank3蛋白的N端结构域(NTD)可能在突触可塑性方面发挥特定作用。突触可塑性是指神经元响应各种刺激而调节其突触强度的能力,这被认为是人类学习和适应环境变化能力的基石。已发现Shank3与主要的突触可塑性调节剂CaMKIIα具有特定的相互作用。在具有严重ID的人ASD患者中发现的错义突变会损害这种相互作用。产生了携带相同突变的敲入小鼠,这些小鼠具有突触可塑性缺陷。基于这些发现,推测在miniShank3-v1中加入NTD可以进一步提高miniShank3的功能。
设计了包含NTD的第二个版本的miniShank3(miniShank3-v2,图6B)。miniShank3-v2(3.1kb)明显大于miniShank3-v1(2.1kb),但仍在AAV包装容量之内。基于miniShank3-v1数据,预计这两个版本都能有效恢复Shank3功能。miniShank3-v2在恢复突触可塑性功能方面可能具有某些优势,这种效应可能会将基因治疗的窗口扩展到多个发育阶段。
进行皮层-纹状体共培养。简而言之,如本领域先前所述制备原代皮层-纹状体共培养物。从P0Shank3InsG3680/InsG3680突变体中解剖纹状体组织。从P0野生型幼崽身上解剖皮层组织。组织用木瓜蛋白酶(Worthington Biochemical Corporation)消化,并用小玻璃巴斯德吸管解离。使用单独的1μg AAV-hSyn-GFP质粒或混合有2μg AAV-hSyn1-minishank3质粒的1μg AAV-hSyn1-GFP质粒,通过小鼠神经元NucleofectorTM试剂盒(Lonza)对大约500万个纹状体中型多刺神经元(MSN)进行电穿孔。然后将纹状体MSN和皮层神经元以3:1的比例混合,并以1x105个细胞/cm2的密度铺板到预先包被有聚D-赖氨酸/层粘连蛋白(Neuvitro,GG-12-1.5-层粘连蛋白)的12mm盖玻片上,该载玻片在含有Neurobasal A培养基(Invitrogen)的24孔板内,该培养基补充有0.5mM谷氨酰胺(Invitrogen)、1X B27(Invitrogen)、50μg/mL青霉素/链霉素(Invitrogen)、50ng/mL BDNF(R&D Systems)和30ng/mL GDNF(R&DSystems)。初次铺板后,每3-4天将一半培养基更换为不含BDNF和GDNF的新鲜培养基。
为了检查miniShank3是否保持了Shank3的关键功能,首先测试了其在来自Shank3突变小鼠的培养神经元中的表达和定位。由于Shank3是一种突触蛋白,因此miniShank3类似于内源性Shank3蛋白定位于突触是关键的。发现当GFP标记的miniShank3v1在皮层-纹状体共培养的神经元中表达时,GFP-miniShank3精确定位到突触,这由其与突触后标志物PSD95共定位所指示(图7A-7H)。因此,miniShank3保留了突触蛋白的关键特征。
实施例3:小鼠模型中miniShank3的功能性表达
为了检查miniShank3是否获得了内源性Shank3的全部功能,测试了miniShank3-v1在Shank3突变小鼠中恢复神经元功能的能力。先前已证明,Shank3突变小鼠在突触后密度(PSD)的分子组成方面表现出缺陷,包括突触和行为的电生理特性异常。测试了miniShank3-v1在Shank3 InsG3680突变小鼠中恢复这些缺陷中每一个的能力。该小鼠模拟了在人类ASD患者身上发现的InsG3680突变。先前的研究显示,这些小鼠表现出与ASD相关的分子、电生理和行为缺陷。因此,该模型被用于测试miniShank3-v1是否可以恢复在这些突变小鼠中观察到的缺陷。
将GFP-miniShank3-v1克隆至pHP.eB AAV载体。制备AAV-GFP-miniShank3-v1病毒并通过面部静脉注射施用至出生后0天或2天(P0-P2)的小鼠。结果发现,在每只小鼠6.42E+11个病毒基因组(vg)的剂量下,GFP-miniShank3-v1在脑中的绝大多数神经元中高表达(图8)。注射AAV-hSyn1-GFP作为对照。
使用标准生化方法,从注射AAV-hSyn1-GFP的野生型小鼠、注射AAV-hSyn1-GFP的Shank3突变小鼠和注射AAV-GFP-miniShank3-v1的Shank3突变小鼠的脑中分离PSD(图9A)。使用蛋白印迹测定来检测PSD中各种突触蛋白的水平(图9B)。如前所述,与野生型小鼠相比,Shank3突变小鼠的PSD中几种突触蛋白(包括Homer、PSD95、SynGap1、SAPAP3、NR1、NR2B和GluR2)的水平减少(图9C-9F)。miniShank3-v1的表达使这些突触蛋白的表达水平恢复至野生型水平,表明miniShank3-v1在恢复PSD的分子组成方面具有完整的功能(图9C-9F)。总之,miniShank3恢复Shank3突变小鼠中突触后密度(PSD)中的分子缺陷。
Shank3在纹状体中高表达。Shank3突变小鼠中皮层-纹状体突触沟通存在缺陷。为了测试miniShank3-v1是否可以恢复突触缺陷,对来自Shank3突变小鼠的急性脑切片中的皮层-纹状体突触回路进行了电生理记录。如之前报道的,与对照相比,Shank3-/-小鼠的场群峰显著减少(图10A)。通过表达miniShank3-v1挽救了Shank3突变小鼠中的缺陷(图10A)。突触前功能没有改变,如刺激强度与称为负峰1(NP1)的应答的动作电位分量的波幅的关系所示(图10B)。这些结果表明,总场应答的减少很可能是由于突触功能的突触后损伤和/或功能性突触数量的减少,并且这些缺陷可以通过P0时AAV介导的miniShank3-v1表达被有效纠正。总之,miniShank3可恢复Shank3突变小鼠的皮层-纹状体突触缺陷。
之前的研究显示,Shank3突变小鼠表现出与具有费伦-麦克德米德综合症或Shank3突变的患者中所见症状相关的几种行为表型。发现在P0时的miniShank3-v1治疗完全挽救了Shank3突变小鼠中的所有测试的行为缺陷,除了运动学习的单一测试上的表现,其仅表现出改善趋势。用miniShank3-v1治疗完全挽救了通过三室社交互动测定测量的社交互动缺陷(图11A)、通过旷场测试中的行进距离测量的运动活动缺陷(图11B)、通过旷场测试中的饲喂时间测量的探索行为缺陷(图11C)和高架环形迷宫中示出的焦虑样行为(图11D)。然而,突变Shank3小鼠中在转棒测试中的运动学习缺陷仅仅轻微改善(图11E)。这可能与在P0注射时小脑中miniShank3的表达水平非常低有关,因为小鼠的小脑发育在出生后开始,这限制了P0时的AAV感染。总之,miniShank3恢复了Shank3突变小鼠的行为缺陷。
实施例4:确定miniShank3基因治疗的治疗时机
以前的研究表明,挽救Shank3突变体中的某些行为存在关键的发育时间窗口。为了确定AAV介导的miniShank3递送的有效治疗窗口,在不同发育阶段进行了静脉内病毒注射,并测定了对成年期行为的影响。所有行为实验均在向小鼠注射AAV后至少8周进行。简而言之,将不同年龄(P0、P2、P7和P28)的野生型小鼠、Shank3突变小鼠和经Shank3治疗的Shank3突变小鼠分配到实验组。P0和P2的小鼠静脉内注射20μl注射混合物,该混合物由稀释于无菌盐水中的6.0x1011 AAV-PHP.eB-hSyn-GFP的总病毒基因组(vg)或AAV-PHP.eB-hSyn-GFP-MiniShank3的总病毒基因组(vg)组成。对于年龄为P0-P2的小鼠,使用面部静脉注射。P7和P28的小鼠静脉内注射7.0x1011 AAV-PHP.eB-hSyn-GFP的总病毒基因组(vg)或AAV-PHP.eB-hSyn-GFP-MiniShank3的总病毒基因组(vg)。对于年龄为P7和P28的小鼠,使用眼眶后注射或脑室内(ICV)注射。
在出生后天数(P28)进行MiniShank3治疗完全挽救了Shank3 InsG3680突变体的社交行为障碍,治疗后的小鼠表现出对陌生小鼠的强烈偏好,这与没有表现出偏好的未治疗突变体不同(图12A)。P28治疗的miniShank3小鼠相比于突变小鼠也示出显著增加的运动活动(图12B)。发现用miniShank3在P28治疗显著改善了运动学习(图12C)和运动协调(图12D)。与社交和运动行为相比,在P28的miniShank3治疗显示出对焦虑样行为和重复梳理的影响最小(图12D)。在高架环形迷宫中,miniShank3治疗的小鼠与突变小鼠在开放臂中的探索时间上没有显著差异(图12F),并且在梳理测定中miniShank3治疗的小鼠仅示出梳理行为轻微减少(图12F)。
之前描述成年小鼠中Shank3表达的基因拯救的研究表明,梳理表型在成人中是可逆的,并且皮层-纹状体-丘脑-皮层回路功能障碍与重复/强迫样行为密切相关。为了解决在P28时用miniShank3治疗的突变体中这些行为表型的挽救的缺失是否由于梳理相关脑区的miniShank3不良表达,通过评价P28治疗的动物中GFP表达来检查miniShank3的生物分布,并且发现GFP表达在丘脑中极低并且在纹状体中有限。因此,鉴于在P28的miniShank3治疗选择性地挽救了社交行为、运动和运动协调的缺陷,在该年龄基于AAV的靶向丘脑和纹状体的改善策略可以为焦虑和重复行为带来额外的治疗益处。
与同窝突变小鼠相比,在出生后第7天(P7)施用miniShank3的突变小鼠表现出对陌生小鼠的更强偏好,这与P0-P2注射时观察到的情况相似(图13A)。电生理学研究显示,在P7的miniShank3递送足以恢复在Shank3突变小鼠中观察到的皮层-纹状体突触缺陷。皮层-纹状体回路功能障碍和与自闭症和强迫症以及表现出过度梳理表型的Shank3突变体相关的重复和强迫行为密切相关。为了测试该理论,对WT小鼠个体、Shank3突变小鼠个体和用miniShank3在P7治疗的Shank3突变小鼠个体进行2小时监测,并量化治疗期间花在梳理上的时间的百分比。发现与WT小鼠相比,Shank3突变小鼠花在梳理上的时间的百分比显著增加。然而,miniShank3治疗的小鼠花在梳理上的时间显著减少并与WT动物类似(图13B)。
在P7的MiniShank3治疗完全挽救了在Shank3突变体中观察到的运动表型,其通过在旷场测试中的总行进距(图13C)、在高架环形迷宫中的焦虑样行为(图13D-13E)测量。与P0-P2(出生后0天-出生后2天)的miniShank3递送相比,在P7用miniShank3治疗的Shank3突变小鼠在运动学习和运动协调方面的表现显著优于突变同窝小鼠(图13F),表明如果在适当的发育阶段给予AAV介导的miniShank3基因治疗,在Shank3突变体中观察到的运动缺陷是可逆的。总之,这些行为结果说明在P7的miniShank3基因治疗能够有效挽救Shank3InsG3680突变动物中所有报道的行为表型。
实施例5:在P7时系统递送miniShank3导致Shank3 InsG3680突变体睡眠障碍的改善
已经显示出患有费伦-麦克德米德综合症的患者和其他具有SHANK3突变的个体经常表现出严重的睡眠障碍,包括难以入睡和难以保持熟睡。例如,SHANK3突变的猕猴表现出显著的睡眠破坏。为了评价Shank3 InsG3680突变小鼠的睡眠障碍,进行了脑电图(EEG)/肌电图(EMG)相关手术,并检查了所有三个实验组的信号,以确定睡眠是否受到Shank3突变的影响。InsG3680纯合子表现出NREM睡眠持续时间减少(图13G),其时间长度(bout length)比WT对照更短(图13H),并且在NREM睡眠期间额叶EEG中的delta节律(1-4Hz)的能量减弱(图13I)。这些结果显示出Shank3突变小鼠中的严重睡眠障碍。在P7注射的MiniShank3显著减轻在未处理的突变体中观察到的NREM睡眠减少(图13G)和睡眠时间长度缩短(图13H)。另外,在P7注射的miniShank3部分挽救了减弱的delta强度(图13I)。总之,这些结果表明,miniShank3可以减轻纯合子Shank3 InsG3680小鼠的睡眠障碍,并且与miniShank3挽救ASD相关行为表型的广泛能力一致。
实施例6:在P7的MiniShank3治疗不导致Shank3 InsG3680突变体的癫痫发作活动
为了测试miniShank3治疗对癫痫发作活动的潜在影响,本研究包含WT小鼠、注射了对照病毒的Shank3突变体、注射了miniShank3的Shank3突变体和Scn2a突变体。对于脑电图分析,进行了如睡眠监测、自发性癫痫发作和听源性癫痫发作的指标。在Shank3InsG3680突变小鼠中没有观察到自发性癫痫EEG异常,如24小时记录期间稳定的EEG基线所证明(代表性痕迹,图14A)。检查了Shank3突变体诱发听觉癫痫发作(124dB声学刺激)的易感性,发现突变小鼠中不存在听觉癫痫发作的行为迹象。为评价miniShank3的安全性,在P7时注射miniShank3的突变小鼠中研究了自发性癫痫EEG异常并且未观察到可检测到的EEG过度兴奋活动(图14A)。另外,Shank3InsG3680突变小鼠和注射了miniShank3的突变小鼠未示出尖波放电(SWD),其是失神癫痫发作的EEG信号。然而,对具有Scn2a杂合突变(其导致频繁失神癫痫发作)的动物的分析发现每小时约60次SWD,验证了分析管线的有效性(图14B)。总之,这些结果表明Shank3 InsG3680突变体没有表现出癫痫样活动,并且miniShank3表达没有导致可检测到的癫痫发作。
实施例7:用miniShank3治疗成年人受试者
患有、疑似患有或有风险患有神经发育障碍(如自闭症谱系障碍(ASD)或费伦-麦克德米德综合症)的成年人受试者可以使用本文所述的方法、载体和非天然存在的多核苷酸通过miniShank3进行治疗。成年人受试者可以包括任何年满16岁或以上的成年男性或成年女性。对于本文公开的miniShank3治疗,小于25岁的成年人可能是优选的。施用和递送方法可包括如本文所公开的面部静脉注射和脑室内注射。也可使用其他门领域技术人员已知的方法。用通过病毒载体(如AAV)递送的miniShank3治疗成年人受试者。例如,可用包含表达miniShank3转基因的SEQ ID NO:21序列的AAV载体治疗成年人受试者。不希望受任何理论的束缚,治疗剂量可以在1x1010至1x1012病毒基因组(vg)之间。本领域技术人员会理解,在确定特定成人的剂量时可能考虑各种因素,如性别、体重、年龄、疾病状态和疾病类型。剂量可以在1x1010至1x1012病毒基因组(vg)的范围之外。施用途径可以是例如静脉内、面部静脉内、颅内、脑室内、眼内或鞘内。
实施例8:使用miniShank3治疗非成年人受试者
患有、疑似患有或有风险患有神经发育障碍(如自闭症谱系障碍(ASD)或费伦-麦克德米德综合症)的非成年人受试者可以使用本文所述的方法、载体和非天然存在的多核苷酸通过miniShank3进行治疗。非成年人受试者可包含任何小于16岁或更年轻的男性或女性。不希望受任何理论的束缚,对于本文公开的miniShank3治疗,10岁或更年轻的人受试者(如婴儿或学步的儿童)可能是优选的。施用和递送方法可包括如本文所公开的面部静脉注射和脑室内注射。也可使用其他门领域技术人员已知的方法。通过病毒载体(如AAV)递送的miniShank3治疗非成年人受试者。例如,可用包含表达miniShank3转基因的SEQ ID NO:21序列的AAV载体治疗非成年人受试者。不希望受任何理论的束缚,治疗剂量可以在1x1010至1x1012病毒基因组(vg)之间。本领域技术人员会理解,在确定特定成人的剂量时可能考虑各种因素,如性别、体重、年龄、疾病状态和疾病类型。剂量可以在1x1010至1x1012病毒基因组(vg)的范围之外。施用途径可以是例如静脉内、面部静脉内、颅内、脑室内、眼内或鞘内。如果非成年人受试者处于胎儿或产前发育阶段,则施用途径可以是子宫内。
实施例9:用miniShank1或miniShank2治疗人受试者
患有、疑似患有或有风险患有神经发育障碍(如自闭症谱系障碍(ASD)或费伦-麦克德米德综合症)的人受试者可以使用本文所述的方法、载体和非天然存在的多核苷酸通过miniShank1或miniShank2进行治疗。成年人受试者可包含任何男性或女性人受试者。治疗方法将类似于本文描述的方法,除了将miniShank3构建体(SEQ ID NO:1-4和21)修改为包含Shank1(miniShank1)或Shank2(miniShank2)。通过病毒载体(如AAV)递送的miniShank1或miniShank2治疗成年或非成年人受试者。例如,可用包含表达miniShank3转基因的SEQ ID NO:21序列的AAV载体治疗成年人受试者或非成年人受试者。不希望受任何理论的束缚,治疗剂量可以在1x1010至1x1012病毒基因组(vg)之间。本领域技术人员会理解,在确定特定成人的剂量时可能考虑各种因素,如性别、体重、年龄、疾病状态和疾病类型。剂量可以在1x1010至1x1012病毒基因组(vg)的范围之外。施用途径可以是例如静脉内、面部静脉内、颅内、脑室内、眼内或鞘内。如果非成年人受试者处于胎儿或产前发育阶段,则施用途径可以是子宫内。
实施例10:使用慢病毒病毒载体递送miniShank3
患有、疑似患有或有风险患有神经发育障碍(如自闭症谱系障碍(ASD)或费伦-麦克德米德综合症)的人受试者可以使用本文所述的方法、载体和非天然存在的多核苷酸通过miniShank1或miniShank2进行治疗。通过病毒载体(如慢病毒)递送的miniShank3治疗成年人受试者或非成年人受试者。不希望受任何理论的束缚,治疗剂量可以在1x1010至1x1012病毒基因组(vg)之间。本领域技术人员会理解,在确定特定成人的剂量时可能考虑各种因素,如性别、体重、年龄、疾病状态和疾病类型。剂量可以在1x1010至1x1012病毒基因组(vg)的范围之外。施用途径可以是例如静脉内、面部静脉内、颅内、脑室内、眼内或鞘内。如果非成人人受试者处于胎儿或产前发育阶段,则施用途径可以是子宫内。
表1.小鼠和人miniShank3序列和载体序列
参考文献
1.Prasad C,Prasad AN,Chodirker BN,Lee C,Dawson AK,Jocelyn LJ,ChudleyAE.(2000)Genetic evaluation of pervasive developmental disorders:the terminal22q13 deletion syndrome may represent a recognizable phenotype.Clin Genet 57:103-109.
2.Precht KS,Lese CM,Spiro RP,Huttenlocher PR,Johnston KM,Baker JC,Christian SL,Kittikamron K,Ledbetter DH.(1998)Two 22q telomere deletionsserendipitously detected by FISH.J Med Genet 35:939-942.
3.Manning MA,Cassidy SB,Clericuzio C,Cherry AM,Schwartz S,Hudgins L,Enns GM,Hoyme HE.(2004)Terminal 22q deletion syndrome:a newly recognizedcause of speech and language disability in the autism spectrum.Pediatrics114,451-457.
4.Wilson HL,Wong AC,Shaw SR,Tse WY,Stapleton GA,Phelan MC,Hu S,Marshall J,McDermid HE.(2003)Molecular characterisation of the 22q13 deletionsyndrome supports the role of haploinsufficiency of SHANK3/PROSAP2 in themajor neurological symptoms.J Med Genet 40,575-584.
5.Jeffries AR,Curran S,Elmslie F,Sharma A,Wenger S,Hummel M,Powell J(2005)Molecular and phenotypic characterization of ring chromosome 22.Am JMed Genet A 137:139-147.
6.Durand CM,Betancur C,Boeckers TM,Bockmann J,Chaste P,Fauchereau F,Nygren G,Rastam M,Gillberg IC,H,Sponheim E,Goubran-Botros H,Delorme R,Chabane N,Mouren-Simeoni MC,de Mas P,Bieth E,RogéB,Héron D,BurglenL,Gillberg C,Leboyer M,Bourgeron T.(2007)Mutations in the gene encoding thesynaptic scaffolding protein SHANK3 are associated with autism spectrumdisorders.Nat Genet 39,25-27.
7.Moessner R,Marshall CR,Sutcliffe JS,Skaug J,Pinto D,Vincent J,Zwaigenbaum L,Fernandez B,Roberts W,Szatmari P,Scherer SW.(2007)Contributionof SHANK3 mutations to autism spectrum disorder.Am J Hum Genet 81,1289-1297.
8.Gauthier J,Spiegelman D,Piton A,Lafrenière RG,Laurent S,St-Onge J,Lapointe L,Hamdan FF,Cossette P,Mottron L,Fombonne E,Joober R,Marineau C,Drapeau P,Rouleau GA.(2009)Novel de novo SHANK3 mutation in autisticpatients.Am J Med Genet B Neuropsychiatr Genet 150B,421-424.
9.Boccuto et al.,Prevalence of SHANK3 variants in patients withdifferent subtypes of autism spectrum disorders.Eur J Hum Genet.2013 Mar;21(3):310-6.
10.Betancur C,Buxbaum JD.SHANK3 haploinsufficiency:a"common"butunderdiagnosed highly penetrant monogenic cause of autism spectrumdisorders.Mol Autism.2013 Jun 11;4(1):17.
11.Du,Y.,Weed,S.A.,Xiong,W.C.,Marshall,T.D.&Parsons,J.T.(1998)Identification of a novel cortactin SH3 domain-binding protein and itslocalization to growth cones of cultured neurons.Mol Cell Biol 18,5838-5851(1998).
12.Naisbitt S,Kim E,Tu JC,Xiao B,Sala C,Valtschanoff J,Weinberg RJ,Worley PF,Sheng M.(1999)Shank,a novel family of postsynaptic density proteinsthat binds to the NMDA receptor/PSD-95/GKAP complex and cortactin.Neuron 23:569-82.
13.Boeckers TM,Winter C,Smalla KH,Kreutz MR,Bockmann J,SeidenbecherC,Garner CC,Gundelfinger ED.(1999a)Proline-rich synapse-associated proteinsProSAP1 and ProSAP2 interact with synaptic proteins of the SAPAP/GKAPfamily.Biochem Biophys Res Commun.264:247-52.
14.Boeckers TM,Kreutz MR,Winter C,Zuschratter W,Smalla KH,Sanmarti-Vila L,Wex H,Langnaese K,Bockmann J,Garner CC,Gundelfinger ED.(1999b)Proline-rich synapse-associated protein-1/cortactin binding protein 1(ProSAP1/CortBP1)is a PDZ-domain protein highly enriched in the postsynaptic density.JNeurosci.19:6506-18.
15.Sheng,M.&Kim,E.(2000)The Shank family of scaffold proteins.J CellSci 113(Pt 11),1851-1856.
16.Montgomery JM,Zamorano PL,Garner CC.(2004)MAGUKs in synapseassembly and function:an emerging view.Cell Mol Life Sci.61:911-29
17.Kim,E.and M.Sheng(2004).PDZ domain proteins of synapses.Nat RevNeurosci 5:771-81.
18.McAllister AK.(2007)Dynamic aspects of CNS synapse formation.AnnuRev Neurosci.30:425-50.
19.Tu JC,Xiao B,Naisbitt S,Yuan JP,Petralia RS,Brakeman P,Doan A,Aakalu VK,Lanahan AA,Sheng M,Worley PF.(1999)Coupling of mGluR/Homer and PSD-95 complexes by the Shank family of postsynaptic density proteins.Neuron 23,583-592.
20.Valtschanoff,J.G.&Weinberg,R.J.(2011)Laminar organization of theNMDA receptor complex within the postsynaptic density.J Neurosci 21,1211-1217.
21.Baron MK,Boeckers TM,Vaida B,Faham S,Gingery M,Sawaya MR,Salyer D,Gundelfinger ED,Bowie JU.(2006)An architectural framework that may lie at thecore of the postsynaptic density.Science 311:531-5.
22.Kreienkamp,H.J.(2008)Scaffolding proteins at the postsynapticdensity:shank as the architectural framework.Handb Exp Pharmacol,365-380.
23.Hayashi MK,Tang C,Verpelli C,Narayanan R,Stearns MH,Xu RM,Li H,Sala C,Hayashi Y.(2009)The postsynaptic density proteins Homer and Shank forma polymeric network structure.Cell 137:159-71.
24.Roussignol G,Ango F,Romorini S,Tu JC,Sala C,Worley PF,Bockaert J,Fagni L.(2005)Shank expression is sufficient to induce functional dendriticspine synapses in aspiny neurons.J Neurosci 25,3560-3570.
25.Sala C,V,Wilson NR,Passafaro M,Liu G,Sheng M.Regulation ofdendritic spine morphology and synaptic function by Shank and Homer.(2001)Regulation of dendritic spine morphology and synaptic function by Shank andHomer.Neuron 31,115-130.
26.Hung AY,Futai K,Sala C,Valtschanoff JG,Ryu J,Woodworth MA,Kidd FL,Sung CC,Miyakawa T,Bear MF,Weinberg RJ,Sheng M.(2008)Smaller dendriticspines,weaker synaptic transmission,but enhanced spatial learning in micelacking Shank1.J Neurosci.28:1697-708.
27.American Psychiatric Association.&American PsychiatricAssociation.Task Force on DSM-IV.Diagnostic and statistical manual of mentaldisorders:DSM-IV-TR,(American Psychiatric Association,Washington,DC,2000.
28.Bertrand J,Mars A,Boyle C,Bove F,Yeargin-Allsopp M,Decoufle P.(2001)Prevalence of autism in a United States population:the Brick Township,New Jersey,investigation.Pediatrics 108:1155-1161.
29.Chakrabarti,S.&Fombonne,E.(2005)Pervasive developmental disordersin preschool children:confirmation of high prevalence.Am J Psychiatry 162:1133-1141.
30.Baird G,Simonoff E,Pickles A,Chandler S,Loucas T,Meldrum D,CharmanT.(2006)Prevalence of disorders of the autism spectrum in a population cohortof children in South Thames:the Special Needs and Autism Project(SNAP).Lancet368:210-215.
31.Rosenberg RE,Law JK,Yenokyan G,McGready J,Kaufmann WE,Law PA.(2009)Characteristics and concordance of autism spectrum disorders among 277twin pairs.Arch Pediatr Adolesc Med 163:907-914.
32.Newschaffer CJ,Croen LA,Daniels J,Giarelli E,Grether JK,Levy SE,Mandell DS,Miller LA,Pinto-Martin J,Reaven J,Reynolds AM,Rice CE,Schendel D,Windham GC.(2007)The epidemiology of autism spectrum disorders.Annu RevPublic Health 28:235-258.
33.Veenstra-VanderWeele,J.,Christian,S.L.&Cook,E.H.(2004)Autism as aparadigmatic complex genetic disorder.Annu Rev Genom Hum G.5,379-405.
34.Zoghbi,H.Y.[2003]Postnatal neurodevelopmental disorders:meeting atthe synapse?Science 302:826-830.
35.Cline H.(2005)Synaptogenesis:a balancing act between excitationand inhibition.Curr Biol.15:R203-5.
36.Südhof TC.(2008)Neuroligins and neurexins link synaptic functionto cognitive disease.Nature 455:903-11.
37.Betancur C,Sakurai T,Buxbaum JD.(2009)The emerging role ofsynaptic cell-adhesion pathways in the pathogenesis of autism spectrumdisorders.Trends Neurosci.32:402-12.
38.Bourgeron T.(2009)A synaptic trek to autism.Curr OpinNeurobiol.19:231-4.
39.Pfeiffer BE,Huber KM.(2009)The state of synapses in fragile Xsyndrome.Neuroscientist 15:549-67.
40.Abrahams,B.S.&Geschwind,D.H.(2008)Advances in autism genetics:onthe threshold of a new neurobiology.Nat Rev Genet 9:341-355.
41.State MW.(2010)The genetics of child psychiatric disorders:focuson autism and Tourette syndrome.Neuron 68:254-69.
42.van de Lagemaat,L.N.&Grant,S.G.(2010)Genome variation andcomplexity in the autism spectrum.Neuron 67:8-10.
43.Kumar RA,Christian SL.(2009)Genetics of autism spectrumdisorders.Curr Neurol Neurosci Rep.9:188-97.
44.Peca J,Feliciano C,Ting JT,Wang W,Wells MF,Venkatraman TY,LascolaCD,Fu Z and Feng G.(2011)Shank3 mutant mice display autistic-like behavioursand striatal dysfunction.Nature,472:437
45.Zhou Y,Kaiser T,Monteiro P,Zhang X,Van der Goes MS,Wang D,Barak B,Zeng M,Li C,Lu C,Wells M,Amaya A,Nguyen S,Lewis M,Sanjana N,Zhou Y,Zhang M,Zhang F,Fu Z,Feng G.(2016)Mice with Shank3 mutations associated with ASD andschizophrenia display both shared and distinct defects.Neuron 89:147-162.
46.Guo B,Chen J,Chen Q,Ren K,Feng D,Mao H,Yao H,Yang J,Liu H,Liu Y,Jia F,Qi C,Lynn-Jones T,Hu H,Fu Z,Feng G*,Wang W*,Wu S*.(2019)Anteriorcingulate cortex dysfunction underlies social deficits in Shank3 mutantmice.Nat Neurosci.22(8):1223-1234.*co-corresponding authors.
47.Zhou Y,Sharma J,Ke Q,Landman R,Yuan J,Chen H,Hayden DS,Fisher JW3rd,Jiang M,Menegas W,Aida T,Yan T,Zou Y,Xu D,Parmar S,Hyman JB,Fanucci-KissA,Meisner O,Wang D,Huang Y,Li Y,Bai Y,Ji W,Lai X,Li W,Huang L,Lu Z,Wang L,Anteraper SA,Sur M,Zhou H*,Xiang AP*,Desimone R,Feng G*,Yang S*.(2019)Atypical behaviour and connectivity in SHANK3-mutant macaques.Nature.570:326-331.*co-corresponding authors.
48.Chen Q,Deister CA,Gao X,Guo B,Lynn-Jones T,Chen N,Wells MF,Liu R,Goard MJ,Dimidschstein J,Feng S,Shi Y,Liao W,Lu Z,Fishell G,Moore CI#,FengG#.(2020)Dysfunction of cortical GABAergic neurons leads to sensory hyper-reactivity in a Shank3 mouse model of ASD.Nat Neurosci.23:520-532.#corresponding authors.
49.Wang W,Li C,Chen Q,van der Goes MS,Hawrot J,Yao AY,Gao X,Lu C,ZangY,Zhang Q,Lyman K,Wang D,Guo B,Wu S,Gerfen CR,Fu Z#,Feng G#(2017)Striatopallidal dysfunction underlies repetitive behavior in Shank3-deficientmodel of autism.J Clin Invest.pii:87997.#co-corresponding authors.
50.Mei Y,Monteiro P,Zhou Y,Kim J-A,Gao X,Fu Z and Feng G.(2016)AdultRestoration of Shank3 Expression Rescues Selective Autistic-LikePhenotypes.Nature,530:481-4.
51.Segal,M.,Greenberger,V.&Korkotian,E.Formation of dendritic spinesin cultured striatal neurons depends on excitatory afferentactivity.Eur.J.Neurosci.17,2573–2585(2003)
52.Tian,X.,Kai,L.,Hockberger,P.E.,Wokosin,D.L.&Surmeier,D.J.mediumspiny neurons.44,94–108(2011).
53.Zhang,Q.et al.Impaired dendritic development and memory in sorbs2knock-out mice.J.Neurosci.36,2247–2260(2016).
54.Luh,L.M.,Das,I.&Bertolotti,A.qMotor,a set of rules for sensitive,robust and quantitative measurement of motor performance inmice.Nat.Protoc.12,1451–1457(2017).
在权利要求中,如“一”、“一个”和“该”之类的冠词可以表示一个或多个,除非另有说明或从上下文中明显看出。如果一个、多个或所有组成员出现、用于给定产品或过程或以其他方式与给定产品或过程相关,则组的一个或多个成员之间包含“或”的声明或描述被视为满足,除非另有说明相反或从上下文中可以明显看出。本公开包括这样的实施方案,其中该组中恰好有一个成员存在于给定的产品或过程中、被用于或以其他方式与给定的产品或过程相关。本公开包括其中多于一个或所有组成员存在于、用于于给定产品或过程或以其他方式与给定产品或过程相关的实施方案。
此外,本公开包括所有变化、组合和排列,其中将来自一个或多个所列权利要求的一个或多个限制、要素、条款和描述性术语引入到另一权利要求中。例如,可以修改从属于另一权利要求的任何权利要求,以包括在从属于同一基础权利要求的任何其他权利要求中发现的一个或多个限制。在元素以列表形式呈现的情况下(例如,以马库什组格式),元素的每个子组也被公开,并且任何元素都可以从组中删除。应当理解,一般而言,本公开或本公开的方面中被称为包括特定元素和/或特征的情况下,本公开的某些实施方案或本公开的方面由基本上由以下此类元素和/或特征组成。为了简单起见,那些实施方案在本文中没有具体阐述。还应注意的是,术语“包括”和“包含”旨在是开放的并且允许包括额外的元素或步骤。在给出范围的情况下,端点包括在这样的范围内,除非另有说明。此外,除非另有说明或从上下文和本领域普通技术人员的理解中可以明显看出,表示为范围的值可以采用本公开的不同实施方案中所述范围内的任何特定值或子范围,以范围下限单位的十分之一,除非上下文另有明确规定。
本申请涉及各种已颁发的专利、公开的专利申请、期刊文章和其他出版物,所有这些都通过引用并入本文。如果任何并入的参考文献与本说明书之间存在冲突,则以本说明书为准。此外,落入现有技术范围内的本公开的任何特定实施方案可被明确排除在任何一项或多项权利要求之外。因为这样的实施方案被认为是本领域的普通技术人员已知的,所以即使排除没有在本文中明确阐述,它们也可以被排除。本公开的任何特定实施方案可以出于任何原因从任何权利要求中排除,无论是否与现有技术的存在相关。
本领域的技术人员将认识到或能够仅使用常规实验来确定本文所述的具体实施方案的许多等同物。本文描述的实施方案的范围并不旨在限于以上描述,而是如所附权利要求中所阐述的那样。本领域的普通技术人员将理解,在不脱离如所附权利要求所限定的本公开的精神或范围的情况下,可以对本描述进行各种改变和修改。
序列表
<110> 麻省理工学院
<120> Shank3基因治疗方法
<130> B1195.70108WO00
<140> 未分配
<141> 同上
<150> US 63/066,570
<151> 2020-08-17
<160> 22
<170> PatentIn版本3.5
<210> 1
<211> 2121
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 1
atgggcccga agcggaaact ttacagtgcc gtccccggcc gcaagttcat cgctgtgaag 60
gcgcacagcc cgcagggcga gggcgagatc ccgctgcacc gcggcgaggc cgtgaaggtg 120
ctcagcattg gggagggcgg tttctgggag ggaaccgtga agggccgaac aggctggttc 180
ccagctgact gtgtggaaga agtgcagatg cgacagtatg acacccggca tgaaaccaga 240
gaggaccgga cgaagcgtct cttccgccac tacactgtgg gttcctatga cagcctcact 300
tcacacagcg attatgtcat cgatgataag gtggctatcc tgcagaaaag ggaccatgag 360
gggtttggct ttgttctccg gggagccaaa gcagagaccc ccattgagga gtttacaccc 420
acacctgcct tccctgcact ccaatacctt gagtctgtag atgtggaagg tgtggcctgg 480
agggctggac ttcgaactgg ggacttcctc attgaggtga acggagtgaa tgtcgtgaag 540
gttggacaca agcaagtggt gggtctcatc cgtcagggtg gcaaccgcct ggtcatgaag 600
gttgtgtctg tgaccaggaa acccgaggag gatggtgctc ggcgcagagc cccaccaccc 660
ccaaagaggg ctcccagcac cacgctgacc ctgcggtcca agtccatgac ggctgagctc 720
gaggaacttg cttccattcg gagctcagag gaggagccag agctggtatt cgctgtgaac 780
ctgccacctg ctcagctgtc ctccagcgat gaggagacca gagaggagct ggcccgcata 840
gggctagtgc caccccctga agagtttgcc aatgggatcc tgctgaccac cccgccccca 900
gggccgggcc ccttgcccac cacggtaccc agcccggcct cagggaagcc cagcagcgag 960
ctgccccctg cccctgagtc tgcagctgac tctggagtag aggaggctga cactcgaagc 1020
tccagtgacc cccacctgga gaccacaagc accatttcca cagtgtccag catgtccacc 1080
ctgagctcgg agagtgggga actcacggac acccacacct cctttgccga tggacacact 1140
tttctactcg agaagccacc agtgcctccc aagcccaagc tcaagtcccc gctggggaag 1200
gggccggtga ccttcaggga cccgctgctg aagcaatcct cggacagtga gctcatggcc 1260
cagcagcacc atgctgcctc tactgggttg gcttctgctg ctgggcccgc ccgccctcgc 1320
tacctcttcc agagaaggtc caagctgtgg ggggaccccg tggagagtcg ggggctccct 1380
gggcctgaag atgacaaacc aactgtgatc agtgagctca gctcccgtct gcagcagctg 1440
aataaagaca cacgctcctt gggggaggaa ccagttggtg gcctgggcag cctgctggac 1500
cctgctaaga agtcacccat tgcagcagct cggctcttca gcagcctcgg tgagctgagc 1560
accatctcag cgcagcgcag cccggggggc ccgggcggag gggcctccta ctcggtgcgg 1620
cccagcggcc ggtaccccgt ggcgagacga gccccgagcc cagtgaaacc cgcatcgctg 1680
gagcgggtgg aggggctggg ggcgggcgtg ggaggcgcgg ggcggccctt cggcctcacg 1740
cctcccacca tcctcaagtc gtccagcctc tccatcccgc acgaacccaa ggaagtgcgc 1800
ttcgtggtgc gaagtgtgag tgcgcgcagc cgctccccct caccatctcc gctgccctcg 1860
ccttctcccg gctctggccc cagtgccggc ccgcgtcggc catttcaaca gaagcccctg 1920
cagctctgga gcaagttcga tgtgggcgac tggctggaga gcatccactt aggcgagcac 1980
cgagaccgct tcgaggacca tgagatcgaa ggcgcacacc tgcctgcgct caccaaggaa 2040
gacttcgtgg agctgggcgt cacacgcgtt ggccaccgca tgaacatcga gcgtgcgctc 2100
aggcagctgg atggcagctg a 2121
<210> 2
<211> 2124
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 2
atgggcccga agcggaaact ttacagcgcc gtccccggcc gcaagttcat cgccgtgaag 60
gcgcacagcc cgcagggtga aggcgagatc ccgctgcacc gcggcgaggc cgtgaaggtg 120
ctcagcattg gggagggcgg tttctgggag ggaaccgtga aaggccgcac gggctggttc 180
ccggccgact gcgtggagga agtgcagatg aggcagcatg acacacggcc tgaaacgcgg 240
gaggaccgga cgaagcggct ctttcggcac tacacagtgg gctcctacga cagcctcacc 300
tcacacagcg attatgtcat tgatgacaaa gtggctgtcc tgcagaaacg ggaccacgag 360
ggctttggtt ttgtgctccg gggagccaaa gcagagaccc ccatcgagga gttcacgccc 420
acgccagcct tcccggcgct gcagtatctc gagtcggtgg acgtggaggg tgtggcctgg 480
agggccgggc tgcgcacggg agacttcctc atcgaggtga acggggtgaa cgtggtgaag 540
gtcggacaca agcaggtggt ggctctgatt cgccagggtg gcaaccgcct cgtcatgaag 600
gttgtgtctg tgacaaggaa gccagaagag gacggggctc ggcgcagagc cccaccgccc 660
cccaagaggg cccccagcac cacactgacc ctgcgctcca agtccatgac agctgagctc 720
gaggaacttg cctccattcg gagctcagag gaagagccag agctggtgtt tgctgtgaac 780
ctgccacctg cccagctgtc gtccagcgat gaggagacca gggaggagct ggcccgaatt 840
gggttggtgc caccccctga agagtttgcc aacggggtcc tgctggccac cccactcgct 900
ggcccgggcc cctcgcccac cacggtgccc agcccggcct cagggaagcc cagcagtgag 960
ccaccccctg cccctgagtc tgcagccgac tctggggtgg aggaggctga cacacgcagc 1020
tccagcgacc cccacctgga gaccacaagc accatctcca cggtgtccag catgtccacc 1080
ttgagctcgg agagcgggga actcactgac acccacacct ccttcgctga cggacacact 1140
tttctactcg agaagccacc agtgcctccc aagcccaagc tcaagtcccc gctggggaag 1200
gggccggtga ccttcaggga cccgctgctg aagcagtcct cggacagcga gctcatggcc 1260
cagcagcacc acgccgcctc tgccgggctg gcctctgccg ccgggcctgc ccgccctcgc 1320
tacctcttcc agagaaggtc caagctatgg ggggaccccg tggagagccg ggggctccct 1380
gggcctgaag acgacaaacc aactgtgatc agtgagctca gctcccgcct gcagcagctg 1440
aacaaggaca cgcgttccct gggggaggaa ccagttggtg gcctgggcag cctgctggac 1500
cctgccaaga agtcgcccat cgcagcagct cggctcttca gcagcctcgg tgagctgagc 1560
tccatttcag cgcagcgcag ccccgggggc ccgggcggcg gggcctcgta ctcggtgagg 1620
cccagtggcc gctaccccgt ggcgagacgc gccccgagcc cggtgaagcc cgcgtcgctg 1680
gagcgggtgg aggggctggg ggcgggcgcg gggggcgcag ggcggccctt cggcctcacg 1740
ccccccacca tcctcaagtc gtccagcctc tccatcccgc acgagcccaa ggaggtgcgc 1800
ttcgtggtgc gcagcgtgag cgcgcgcagt cgctccccct cgccgtcgcc gctgccctcg 1860
cccgcgtccg gccccggccc cggcgccccc ggcccacgcc gacccttcca gcagaagccg 1920
ctgcagctct ggagcaagtt cgacgtgggc gactggctgg agagcatcca cctaggcgag 1980
caccgcgacc gcttcgagga ccatgagata gaaggcgcgc acctacccgc gcttaccaag 2040
gacgacttcg tggagctggg cgtcacgcgc gtgggccacc gcatgaacat cgagcgcgcg 2100
ctcaggcagc tggacggcag ctga 2124
<210> 3
<211> 3276
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 3
atggacggcc ccggggccag cgccgtggtc gtgcgcgtcg gcatcccgga cctgcaacaa 60
acgaagtgcc tgcgtctgga cccaaccgcg cccgtgtggg ccgccaagca gcgtgtgctc 120
tgcgccctca atcatagcct tcaagacgcg ctcaactacg ggctattcca gcctccctcc 180
cggggtcgcg ccggcaagtt cctggatgaa gagcggctct tacaggacta cccgcctaac 240
ctggacacgc ccctgcccta tctggagttc cgatacaagc ggagagttta tgcccagaac 300
ctcatagatg acaagcagtt tgcaaagcta cacacaaagg caaacctgaa gaagttcatg 360
gactatgtcc agctacacag cacagataag gtggcccgcc tgctggacaa ggggctggac 420
cccaatttcc atgaccctga ctcaggagag tgccctctga gccttgcggc acagttggac 480
aacgccactg acctcctgaa ggttctccgc aacggcggtg ctcatctgga cttccggacc 540
cgagatgggc tgacagccgt ccactgtgct acccgccagc ggaacgcagg ggcattgacg 600
accctgctgg acctgggggc ttcgcctgac tacaaggaca gccgcggcct gacgcccctg 660
taccatagtg ccctaggggg cggggatgcc ctctgttgcg agctgcttct ccatgatcat 720
gcacagctgg ggaccactga tgagaatggt tggcaagaga tccatcaggc ctgtcgcttt 780
ggacacgtgc agcacctgga gcaccttttg ttctatgggg ccaacatggg tgctcagaat 840
gcctcgggaa acacagccct gcacatctgt gccctctaca accaggagag ttgcgcgcgc 900
gtcctgcttt tccgtggtgc caacaaggac gtccgcaatt acaacagcca gacagccttc 960
caggtggcca ttattgcagg gaactttgag cttgccgagg taatcaagac ccacaaagac 1020
tccgatgtcg taccattcag ggaaaccccc agctatgcaa agcgacggcg tctggctggc 1080
ccgagtggcc tggcatcccc acggccctta cagcgctcag ccagtgatat caacctgaaa 1140
ggtgcgccgc cgccccgggg cccgaagcgg aaactttaca gtgccgtccc cggccgcaag 1200
ttcatcgctg tgaaggcgca cagcccgcag ggcgagggcg agatcccgct gcaccgcggc 1260
gaggccgtga aggtgctcag cattggggag ggcggtttct gggagggaac cgtgaagggc 1320
cgaacaggct ggttcccagc tgactgtgtg gaagaagtgc agatgcgaca gtatgacacc 1380
cggcatgaaa ccagagagga ccggacgaag cgtctcttcc gccactacac tgtgggttcc 1440
tatgacagcc tcacttcaca cagcgattat gtcatcgatg ataaggtggc tatcctgcag 1500
aaaagggacc atgaggggtt tggctttgtt ctccggggag ccaaagcaga gacccccatt 1560
gaggagttta cacccacacc tgccttccct gcactccaat accttgagtc tgtagatgtg 1620
gaaggtgtgg cctggagggc tggacttcga actggggact tcctcattga ggtgaacgga 1680
gtgaatgtcg tgaaggttgg acacaagcaa gtggtgggtc tcatccgtca gggtggcaac 1740
cgcctggtca tgaaggttgt gtctgtgacc aggaaacccg aggaggatgg tgctcggcgc 1800
agagccccac cacccccaaa gagggctccc agcaccacgc tgaccctgcg gtccaagtcc 1860
atgacggctg agctcgagga acttgcttcc attcggagct cagaggagga gccagagctg 1920
gtattcgctg tgaacctgcc acctgctcag ctgtcctcca gcgatgagga gaccagagag 1980
gagctggccc gcatagggct agtgccaccc cctgaagagt ttgccaatgg gatcctgctg 2040
accaccccgc ccccagggcc gggccccttg cccaccacgg tacccagccc ggcctcaggg 2100
aagcccagca gcgagctgcc ccctgcccct gagtctgcag ctgactctgg agtagaggag 2160
gctgacactc gaagctccag tgacccccac ctggagacca caagcaccat ttccacagtg 2220
tccagcatgt ccaccctgag ctcggagagt ggggaactca cggacaccca cacctccttt 2280
gccgatggac acacttttct actcgagaag ccaccagtgc ctcccaagcc caagctcaag 2340
tccccgctgg ggaaggggcc ggtgaccttc agggacccgc tgctgaagca atcctcggac 2400
agtgagctca tggcccagca gcaccatgct gcctctactg ggttggcttc tgctgctggg 2460
cccgcccgcc ctcgctacct cttccagaga aggtccaagc tgtgggggga ccccgtggag 2520
agtcgggggc tccctgggcc tgaagatgac aaaccaactg tgatcagtga gctcagctcc 2580
cgtctgcagc agctgaataa agacacacgc tccttggggg aggaaccagt tggtggcctg 2640
ggcagcctgc tggaccctgc taagaagtca cccattgcag cagctcggct cttcagcagc 2700
ctcggtgagc tgagcaccat ctcagcgcag cgcagcccgg ggggcccggg cggaggggcc 2760
tcctactcgg tgcggcccag cggccggtac cccgtggcga gacgagcccc gagcccagtg 2820
aaacccgcat cgctggagcg ggtggagggg ctgggggcgg gcgtgggagg cgcggggcgg 2880
cccttcggcc tcacgcctcc caccatcctc aagtcgtcca gcctctccat cccgcacgaa 2940
cccaaggaag tgcgcttcgt ggtgcgaagt gtgagtgcgc gcagccgctc cccctcacca 3000
tctccgctgc cctcgccttc tcccggctct ggccccagtg ccggcccgcg tcggccattt 3060
caacagaagc ccctgcagct ctggagcaag ttcgatgtgg gcgactggct ggagagcatc 3120
cacttaggcg agcaccgaga ccgcttcgag gaccatgaga tcgaaggcgc acacctgcct 3180
gcgctcacca aggaagactt cgtggagctg ggcgtcacac gcgttggcca ccgcatgaac 3240
atcgagcgtg cgctcaggca gctggatggc agctga 3276
<210> 4
<211> 3279
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 4
atggacggcc ccggggccag cgccgtggtc gtgcgcgtcg gcatcccgga cctgcagcag 60
acgaagtgcc tgcgcctgga cccggccgcg cccgtgtggg ccgccaagca gcgcgtgctc 120
tgcgccctca accacagcct ccaggacgcg ctcaactatg ggcttttcca gccgccctcc 180
cggggccgcg ccggcaagtt cctggatgag gagcggctcc tgcaggagta cccgcccaac 240
ctggacacgc ccctgcccta cctggagttt cgatacaagc ggcgagttta tgcccagaac 300
ctcatcgatg ataagcagtt tgcaaagctt cacacaaagg cgaacctgaa gaagttcatg 360
gactacgtcc agctgcatag cacggacaag gtggcacgcc tgttggacaa ggggctggac 420
cccaacttcc atgaccctga ctcaggagag tgccccctga gcctcgcagc ccagctggac 480
aacgccacgg acctgctaaa ggtgctgaag aatggtggtg cccacctgga cttccgcact 540
cgcgatgggc tcactgccgt gcactgtgcc acacgccagc ggaatgcggc agcactgacg 600
accctgctgg acctgggggc ttcacctgac tacaaggaca gccgcggctt gacacccctc 660
taccacagcg ccctgggggg tggggatgcc ctctgctgtg agctgcttct ccacgaccac 720
gctcagctgg ggatcaccga cgagaatggc tggcaggaga tccaccaggc ctgccgcttt 780
gggcacgtgc agcatctgga gcacctgctg ttctatgggg cagacatggg ggcccagaac 840
gcctcgggga acacagccct gcacatctgt gccctctaca accaggagag ctgtgctcgt 900
gtcctgctct tccgtggagc taacagggat gtccgcaact acaacagcca gacagccttc 960
caggtggcca tcatcgcagg gaactttgag cttgcagagg ttatcaagac ccacaaagac 1020
tcggatgttg taccattcag ggaaaccccc agctatgcga agcggcggcg actggctggc 1080
cccagtggct tggcatcccc tcggcctctg cagcgctcag ccagcgatat caacctgaag 1140
ggggcaccgc cgccccgggg cccgaagcgg aaactttaca gcgccgtccc cggccgcaag 1200
ttcatcgccg tgaaggcgca cagcccgcag ggtgaaggcg agatcccgct gcaccgcggc 1260
gaggccgtga aggtgctcag cattggggag ggcggtttct gggagggaac cgtgaaaggc 1320
cgcacgggct ggttcccggc cgactgcgtg gaggaagtgc agatgaggca gcatgacaca 1380
cggcctgaaa cgcgggagga ccggacgaag cggctctttc ggcactacac agtgggctcc 1440
tacgacagcc tcacctcaca cagcgattat gtcattgatg acaaagtggc tgtcctgcag 1500
aaacgggacc acgagggctt tggttttgtg ctccggggag ccaaagcaga gacccccatc 1560
gaggagttca cgcccacgcc agccttcccg gcgctgcagt atctcgagtc ggtggacgtg 1620
gagggtgtgg cctggagggc cgggctgcgc acgggagact tcctcatcga ggtgaacggg 1680
gtgaacgtgg tgaaggtcgg acacaagcag gtggtggctc tgattcgcca gggtggcaac 1740
cgcctcgtca tgaaggttgt gtctgtgaca aggaagccag aagaggacgg ggctcggcgc 1800
agagccccac cgccccccaa gagggccccc agcaccacac tgaccctgcg ctccaagtcc 1860
atgacagctg agctcgagga acttgcctcc attcggagct cagaggaaga gccagagctg 1920
gtgtttgctg tgaacctgcc acctgcccag ctgtcgtcca gcgatgagga gaccagggag 1980
gagctggccc gaattgggtt ggtgccaccc cctgaagagt ttgccaacgg ggtcctgctg 2040
gccaccccac tcgctggccc gggcccctcg cccaccacgg tgcccagccc ggcctcaggg 2100
aagcccagca gtgagccacc ccctgcccct gagtctgcag ccgactctgg ggtggaggag 2160
gctgacacac gcagctccag cgacccccac ctggagacca caagcaccat ctccacggtg 2220
tccagcatgt ccaccttgag ctcggagagc ggggaactca ctgacaccca cacctccttc 2280
gctgacggac acacttttct actcgagaag ccaccagtgc ctcccaagcc caagctcaag 2340
tccccgctgg ggaaggggcc ggtgaccttc agggacccgc tgctgaagca gtcctcggac 2400
agcgagctca tggcccagca gcaccacgcc gcctctgccg ggctggcctc tgccgccggg 2460
cctgcccgcc ctcgctacct cttccagaga aggtccaagc tatgggggga ccccgtggag 2520
agccgggggc tccctgggcc tgaagacgac aaaccaactg tgatcagtga gctcagctcc 2580
cgcctgcagc agctgaacaa ggacacgcgt tccctggggg aggaaccagt tggtggcctg 2640
ggcagcctgc tggaccctgc caagaagtcg cccatcgcag cagctcggct cttcagcagc 2700
ctcggtgagc tgagctccat ttcagcgcag cgcagccccg ggggcccggg cggcggggcc 2760
tcgtactcgg tgaggcccag tggccgctac cccgtggcga gacgcgcccc gagcccggtg 2820
aagcccgcgt cgctggagcg ggtggagggg ctgggggcgg gcgcgggggg cgcagggcgg 2880
cccttcggcc tcacgccccc caccatcctc aagtcgtcca gcctctccat cccgcacgag 2940
cccaaggagg tgcgcttcgt ggtgcgcagc gtgagcgcgc gcagtcgctc cccctcgccg 3000
tcgccgctgc cctcgcccgc gtccggcccc ggccccggcg cccccggccc acgccgaccc 3060
ttccagcaga agccgctgca gctctggagc aagttcgacg tgggcgactg gctggagagc 3120
atccacctag gcgagcaccg cgaccgcttc gaggaccatg agatagaagg cgcgcaccta 3180
cccgcgctta ccaaggacga cttcgtggag ctgggcgtca cgcgcgtggg ccaccgcatg 3240
aacatcgagc gcgcgctcag gcagctggac ggcagctga 3279
<210> 5
<211> 1730
<212> PRT
<213> 小鼠(Mus musculus)
<400> 5
Met Asp Gly Pro Gly Ala Ser Ala Val Val Val Arg Val Gly Ile Pro
1 5 10 15
Asp Leu Gln Gln Thr Lys Cys Leu Arg Leu Asp Pro Thr Ala Pro Val
20 25 30
Trp Ala Ala Lys Gln Arg Val Leu Cys Ala Leu Asn His Ser Leu Gln
35 40 45
Asp Ala Leu Asn Tyr Gly Leu Phe Gln Pro Pro Ser Arg Gly Arg Ala
50 55 60
Gly Lys Phe Leu Asp Glu Glu Arg Leu Leu Gln Asp Tyr Pro Pro Asn
65 70 75 80
Leu Asp Thr Pro Leu Pro Tyr Leu Glu Phe Arg Tyr Lys Arg Arg Val
85 90 95
Tyr Ala Gln Asn Leu Ile Asp Asp Lys Gln Phe Ala Lys Leu His Thr
100 105 110
Lys Ala Asn Leu Lys Lys Phe Met Asp Tyr Val Gln Leu His Ser Thr
115 120 125
Asp Lys Val Ala Arg Leu Leu Asp Lys Gly Leu Asp Pro Asn Phe His
130 135 140
Asp Pro Asp Ser Gly Glu Cys Pro Leu Ser Leu Ala Ala Gln Leu Asp
145 150 155 160
Asn Ala Thr Asp Leu Leu Lys Val Leu Arg Asn Gly Gly Ala His Leu
165 170 175
Asp Phe Arg Thr Arg Asp Gly Leu Thr Ala Val His Cys Ala Thr Arg
180 185 190
Gln Arg Asn Ala Gly Ala Leu Thr Thr Leu Leu Asp Leu Gly Ala Ser
195 200 205
Pro Asp Tyr Lys Asp Ser Arg Gly Leu Thr Pro Leu Tyr His Ser Ala
210 215 220
Leu Gly Gly Gly Asp Ala Leu Cys Cys Glu Leu Leu Leu His Asp His
225 230 235 240
Ala Gln Leu Gly Thr Thr Asp Glu Asn Gly Trp Gln Glu Ile His Gln
245 250 255
Ala Cys Arg Phe Gly His Val Gln His Leu Glu His Leu Leu Phe Tyr
260 265 270
Gly Ala Asn Met Gly Ala Gln Asn Ala Ser Gly Asn Thr Ala Leu His
275 280 285
Ile Cys Ala Leu Tyr Asn Gln Glu Ser Cys Ala Arg Val Leu Leu Phe
290 295 300
Arg Gly Ala Asn Lys Asp Val Arg Asn Tyr Asn Ser Gln Thr Ala Phe
305 310 315 320
Gln Val Ala Ile Ile Ala Gly Asn Phe Glu Leu Ala Glu Val Ile Lys
325 330 335
Thr His Lys Asp Ser Asp Val Val Pro Phe Arg Glu Thr Pro Ser Tyr
340 345 350
Ala Lys Arg Arg Arg Leu Ala Gly Pro Ser Gly Leu Ala Ser Pro Arg
355 360 365
Pro Leu Gln Arg Ser Ala Ser Asp Ile Asn Leu Lys Gly Asp Gln Pro
370 375 380
Ala Ala Ser Pro Gly Pro Thr Leu Arg Ser Leu Pro His Gln Leu Leu
385 390 395 400
Leu Gln Arg Leu Gln Glu Glu Lys Asp Arg Asp Arg Asp Gly Glu Leu
405 410 415
Glu Asn Asp Ile Ser Gly Pro Ser Ala Gly Arg Gly Gly His Asn Lys
420 425 430
Ile Ser Pro Ser Gly Pro Gly Gly Ser Gly Pro Ala Pro Gly Pro Gly
435 440 445
Pro Ala Ser Pro Ala Pro Pro Ala Pro Pro Pro Arg Gly Pro Lys Arg
450 455 460
Lys Leu Tyr Ser Ala Val Pro Gly Arg Lys Phe Ile Ala Val Lys Ala
465 470 475 480
His Ser Pro Gln Gly Glu Gly Glu Ile Pro Leu His Arg Gly Glu Ala
485 490 495
Val Lys Val Leu Ser Ile Gly Glu Gly Gly Phe Trp Glu Gly Thr Val
500 505 510
Lys Gly Arg Thr Gly Trp Phe Pro Ala Asp Cys Val Glu Glu Val Gln
515 520 525
Met Arg Gln Tyr Asp Thr Arg His Glu Thr Arg Glu Asp Arg Thr Lys
530 535 540
Arg Leu Phe Arg His Tyr Thr Val Gly Ser Tyr Asp Ser Leu Thr Ser
545 550 555 560
His Ser Asp Tyr Val Ile Asp Asp Lys Val Ala Ile Leu Gln Lys Arg
565 570 575
Asp His Glu Gly Phe Gly Phe Val Leu Arg Gly Ala Lys Ala Glu Thr
580 585 590
Pro Ile Glu Glu Phe Thr Pro Thr Pro Ala Phe Pro Ala Leu Gln Tyr
595 600 605
Leu Glu Ser Val Asp Val Glu Gly Val Ala Trp Arg Ala Gly Leu Arg
610 615 620
Thr Gly Asp Phe Leu Ile Glu Val Asn Gly Val Asn Val Val Lys Val
625 630 635 640
Gly His Lys Gln Val Val Gly Leu Ile Arg Gln Gly Gly Asn Arg Leu
645 650 655
Val Met Lys Val Val Ser Val Thr Arg Lys Pro Glu Glu Asp Gly Ala
660 665 670
Arg Arg Arg Ala Pro Pro Pro Pro Lys Arg Ala Pro Ser Thr Thr Leu
675 680 685
Thr Leu Arg Ser Lys Ser Met Thr Ala Glu Leu Glu Glu Leu Ala Ser
690 695 700
Ile Arg Arg Arg Lys Gly Glu Lys Leu Asp Glu Ile Leu Ala Val Ala
705 710 715 720
Ala Glu Pro Thr Leu Arg Pro Asp Ile Ala Asp Ala Asp Ser Arg Ala
725 730 735
Ala Thr Val Lys Gln Arg Pro Thr Ser Arg Arg Ile Thr Pro Ala Glu
740 745 750
Ile Ser Ser Leu Phe Glu Arg Gln Gly Leu Pro Gly Pro Glu Lys Leu
755 760 765
Pro Gly Ser Leu Arg Lys Gly Ile Pro Arg Thr Lys Ser Val Gly Glu
770 775 780
Asp Glu Lys Leu Ala Ser Leu Leu Glu Gly Arg Phe Pro Arg Ser Thr
785 790 795 800
Ser Met Gln Asp Thr Val Arg Glu Gly Arg Gly Ile Pro Pro Pro Pro
805 810 815
Gln Thr Ala Pro Pro Pro Pro Pro Ala Pro Tyr Tyr Phe Asp Ser Gly
820 825 830
Pro Pro Pro Thr Phe Ser Pro Pro Pro Pro Pro Gly Arg Ala Tyr Asp
835 840 845
Thr Val Arg Ser Ser Phe Lys Pro Gly Leu Glu Ala Arg Leu Gly Ala
850 855 860
Gly Ala Ala Gly Leu Tyr Asp Pro Ser Thr Pro Leu Gly Pro Leu Pro
865 870 875 880
Tyr Pro Glu Arg Gln Lys Arg Ala Arg Ser Met Ile Ile Leu Gln Asp
885 890 895
Ser Ala Pro Glu Val Gly Asp Val Pro Arg Pro Ala Pro Ala Ala Thr
900 905 910
Pro Pro Glu Arg Pro Lys Arg Arg Pro Arg Pro Ser Gly Pro Asp Ser
915 920 925
Pro Tyr Ala Asn Leu Gly Ala Phe Ser Ala Ser Leu Phe Ala Pro Ser
930 935 940
Lys Pro Gln Arg Arg Lys Ser Pro Leu Val Lys Gln Leu Gln Val Glu
945 950 955 960
Asp Ala Gln Glu Arg Ala Ala Leu Ala Val Gly Ser Pro Gly Pro Val
965 970 975
Gly Gly Ser Phe Ala Arg Glu Pro Ser Pro Thr His Arg Gly Pro Arg
980 985 990
Pro Gly Ser Leu Asp Tyr Ser Ser Gly Glu Gly Leu Gly Leu Thr Phe
995 1000 1005
Gly Gly Pro Ser Pro Gly Pro Val Lys Glu Arg Arg Leu Glu Glu
1010 1015 1020
Arg Arg Arg Ser Thr Val Phe Leu Ser Val Gly Ala Ile Glu Gly
1025 1030 1035
Ser Pro Pro Ser Ala Asp Leu Pro Ser Leu Gln Pro Ser Arg Ser
1040 1045 1050
Ile Asp Glu Arg Leu Leu Gly Thr Gly Ala Thr Thr Gly Arg Asp
1055 1060 1065
Leu Leu Leu Pro Ser Pro Val Ser Ala Leu Lys Pro Leu Val Gly
1070 1075 1080
Gly Pro Ser Leu Gly Pro Ser Gly Ser Thr Phe Ile His Pro Leu
1085 1090 1095
Thr Gly Lys Pro Leu Asp Pro Ser Ser Pro Leu Ala Leu Ala Leu
1100 1105 1110
Ala Ala Arg Glu Arg Ala Leu Ala Ser Gln Thr Pro Ser Arg Ser
1115 1120 1125
Pro Thr Pro Val His Ser Pro Asp Ala Asp Arg Pro Gly Pro Leu
1130 1135 1140
Phe Val Asp Val Gln Thr Arg Asp Ser Glu Arg Gly Pro Leu Ala
1145 1150 1155
Ser Pro Ala Phe Ser Pro Arg Ser Pro Ala Trp Ile Pro Val Pro
1160 1165 1170
Ala Arg Arg Glu Ala Glu Lys Pro Pro Arg Glu Glu Arg Lys Ser
1175 1180 1185
Pro Glu Asp Lys Lys Ser Met Ile Leu Ser Val Leu Asp Thr Ser
1190 1195 1200
Leu Gln Arg Pro Ala Gly Leu Ile Val Val His Ala Thr Ser Asn
1205 1210 1215
Gly Gln Glu Pro Ser Arg Leu Gly Ala Glu Glu Glu Arg Pro Gly
1220 1225 1230
Thr Pro Glu Leu Ala Pro Ala Pro Met Gln Ala Ala Ala Val Ala
1235 1240 1245
Glu Pro Met Pro Ser Pro Arg Ala Gln Pro Pro Gly Ser Ile Pro
1250 1255 1260
Ala Asp Pro Gly Pro Gly Gln Gly Ser Ser Glu Glu Glu Pro Glu
1265 1270 1275
Leu Val Phe Ala Val Asn Leu Pro Pro Ala Gln Leu Ser Ser Ser
1280 1285 1290
Asp Glu Glu Thr Arg Glu Glu Leu Ala Arg Ile Gly Leu Val Pro
1295 1300 1305
Pro Pro Glu Glu Phe Ala Asn Gly Ile Leu Leu Thr Thr Pro Pro
1310 1315 1320
Pro Gly Pro Gly Pro Leu Pro Thr Thr Val Pro Ser Pro Ala Ser
1325 1330 1335
Gly Lys Pro Ser Ser Glu Leu Pro Pro Ala Pro Glu Ser Ala Ala
1340 1345 1350
Asp Ser Gly Val Glu Glu Ala Asp Thr Arg Ser Ser Ser Asp Pro
1355 1360 1365
His Leu Glu Thr Thr Ser Thr Ile Ser Thr Val Ser Ser Met Ser
1370 1375 1380
Thr Leu Ser Ser Glu Ser Gly Glu Leu Thr Asp Thr His Thr Ser
1385 1390 1395
Phe Ala Asp Gly His Thr Phe Leu Leu Glu Lys Pro Pro Val Pro
1400 1405 1410
Pro Lys Pro Lys Leu Lys Ser Pro Leu Gly Lys Gly Pro Val Thr
1415 1420 1425
Phe Arg Asp Pro Leu Leu Lys Gln Ser Ser Asp Ser Glu Leu Met
1430 1435 1440
Ala Gln Gln His His Ala Ala Ser Thr Gly Leu Ala Ser Ala Ala
1445 1450 1455
Gly Pro Ala Arg Pro Arg Tyr Leu Phe Gln Arg Arg Ser Lys Leu
1460 1465 1470
Trp Gly Asp Pro Val Glu Ser Arg Gly Leu Pro Gly Pro Glu Asp
1475 1480 1485
Asp Lys Pro Thr Val Ile Ser Glu Leu Ser Ser Arg Leu Gln Gln
1490 1495 1500
Leu Asn Lys Asp Thr Arg Ser Leu Gly Glu Glu Pro Val Gly Gly
1505 1510 1515
Leu Gly Ser Leu Leu Asp Pro Ala Lys Lys Ser Pro Ile Ala Ala
1520 1525 1530
Ala Arg Leu Phe Ser Ser Leu Gly Glu Leu Ser Thr Ile Ser Ala
1535 1540 1545
Gln Arg Ser Pro Gly Gly Pro Gly Gly Gly Ala Ser Tyr Ser Val
1550 1555 1560
Arg Pro Ser Gly Arg Tyr Pro Val Ala Arg Arg Ala Pro Ser Pro
1565 1570 1575
Val Lys Pro Ala Ser Leu Glu Arg Val Glu Gly Leu Gly Ala Gly
1580 1585 1590
Val Gly Gly Ala Gly Arg Pro Phe Gly Leu Thr Pro Pro Thr Ile
1595 1600 1605
Leu Lys Ser Ser Ser Leu Ser Ile Pro His Glu Pro Lys Glu Val
1610 1615 1620
Arg Phe Val Val Arg Ser Val Ser Ala Arg Ser Arg Ser Pro Ser
1625 1630 1635
Pro Ser Pro Leu Pro Ser Pro Ser Pro Gly Ser Gly Pro Ser Ala
1640 1645 1650
Gly Pro Arg Arg Pro Phe Gln Gln Lys Pro Leu Gln Leu Trp Ser
1655 1660 1665
Lys Phe Asp Val Gly Asp Trp Leu Glu Ser Ile His Leu Gly Glu
1670 1675 1680
His Arg Asp Arg Phe Glu Asp His Glu Ile Glu Gly Ala His Leu
1685 1690 1695
Pro Ala Leu Thr Lys Glu Asp Phe Val Glu Leu Gly Val Thr Arg
1700 1705 1710
Val Gly His Arg Met Asn Ile Glu Arg Ala Leu Arg Gln Leu Asp
1715 1720 1725
Gly Ser
1730
<210> 6
<211> 1731
<212> PRT
<213> 智人(Homo sapiens)
<400> 6
Met Asp Gly Pro Gly Ala Ser Ala Val Val Val Arg Val Gly Ile Pro
1 5 10 15
Asp Leu Gln Gln Thr Lys Cys Leu Arg Leu Asp Pro Ala Ala Pro Val
20 25 30
Trp Ala Ala Lys Gln Arg Val Leu Cys Ala Leu Asn His Ser Leu Gln
35 40 45
Asp Ala Leu Asn Tyr Gly Leu Phe Gln Pro Pro Ser Arg Gly Arg Ala
50 55 60
Gly Lys Phe Leu Asp Glu Glu Arg Leu Leu Gln Glu Tyr Pro Pro Asn
65 70 75 80
Leu Asp Thr Pro Leu Pro Tyr Leu Glu Phe Arg Tyr Lys Arg Arg Val
85 90 95
Tyr Ala Gln Asn Leu Ile Asp Asp Lys Gln Phe Ala Lys Leu His Thr
100 105 110
Lys Ala Asn Leu Lys Lys Phe Met Asp Tyr Val Gln Leu His Ser Thr
115 120 125
Asp Lys Val Ala Arg Leu Leu Asp Lys Gly Leu Asp Pro Asn Phe His
130 135 140
Asp Pro Asp Ser Gly Glu Cys Pro Leu Ser Leu Ala Ala Gln Leu Asp
145 150 155 160
Asn Ala Thr Asp Leu Leu Lys Val Leu Lys Asn Gly Gly Ala His Leu
165 170 175
Asp Phe Arg Thr Arg Asp Gly Leu Thr Ala Val His Cys Ala Thr Arg
180 185 190
Gln Arg Asn Ala Ala Ala Leu Thr Thr Leu Leu Asp Leu Gly Ala Ser
195 200 205
Pro Asp Tyr Lys Asp Ser Arg Gly Leu Thr Pro Leu Tyr His Ser Ala
210 215 220
Leu Gly Gly Gly Asp Ala Leu Cys Cys Glu Leu Leu Leu His Asp His
225 230 235 240
Ala Gln Leu Gly Ile Thr Asp Glu Asn Gly Trp Gln Glu Ile His Gln
245 250 255
Ala Cys Arg Phe Gly His Val Gln His Leu Glu His Leu Leu Phe Tyr
260 265 270
Gly Ala Asp Met Gly Ala Gln Asn Ala Ser Gly Asn Thr Ala Leu His
275 280 285
Ile Cys Ala Leu Tyr Asn Gln Glu Ser Cys Ala Arg Val Leu Leu Phe
290 295 300
Arg Gly Ala Asn Arg Asp Val Arg Asn Tyr Asn Ser Gln Thr Ala Phe
305 310 315 320
Gln Val Ala Ile Ile Ala Gly Asn Phe Glu Leu Ala Glu Val Ile Lys
325 330 335
Thr His Lys Asp Ser Asp Val Val Pro Phe Arg Glu Thr Pro Ser Tyr
340 345 350
Ala Lys Arg Arg Arg Leu Ala Gly Pro Ser Gly Leu Ala Ser Pro Arg
355 360 365
Pro Leu Gln Arg Ser Ala Ser Asp Ile Asn Leu Lys Gly Glu Ala Gln
370 375 380
Pro Ala Ala Ser Pro Gly Pro Ser Leu Arg Ser Leu Pro His Gln Leu
385 390 395 400
Leu Leu Gln Arg Leu Gln Glu Glu Lys Asp Arg Asp Arg Asp Ala Asp
405 410 415
Gln Glu Ser Asn Ile Ser Gly Pro Leu Ala Gly Arg Ala Gly Gln Ser
420 425 430
Lys Ile Ser Pro Ser Gly Pro Gly Gly Pro Gly Pro Ala Pro Gly Pro
435 440 445
Gly Pro Ala Pro Pro Ala Pro Pro Ala Pro Pro Pro Arg Gly Pro Lys
450 455 460
Arg Lys Leu Tyr Ser Ala Val Pro Gly Arg Lys Phe Ile Ala Val Lys
465 470 475 480
Ala His Ser Pro Gln Gly Glu Gly Glu Ile Pro Leu His Arg Gly Glu
485 490 495
Ala Val Lys Val Leu Ser Ile Gly Glu Gly Gly Phe Trp Glu Gly Thr
500 505 510
Val Lys Gly Arg Thr Gly Trp Phe Pro Ala Asp Cys Val Glu Glu Val
515 520 525
Gln Met Arg Gln His Asp Thr Arg Pro Glu Thr Arg Glu Asp Arg Thr
530 535 540
Lys Arg Leu Phe Arg His Tyr Thr Val Gly Ser Tyr Asp Ser Leu Thr
545 550 555 560
Ser His Ser Asp Tyr Val Ile Asp Asp Lys Val Ala Val Leu Gln Lys
565 570 575
Arg Asp His Glu Gly Phe Gly Phe Val Leu Arg Gly Ala Lys Ala Glu
580 585 590
Thr Pro Ile Glu Glu Phe Thr Pro Thr Pro Ala Phe Pro Ala Leu Gln
595 600 605
Tyr Leu Glu Ser Val Asp Val Glu Gly Val Ala Trp Arg Ala Gly Leu
610 615 620
Arg Thr Gly Asp Phe Leu Ile Glu Val Asn Gly Val Asn Val Val Lys
625 630 635 640
Val Gly His Lys Gln Val Val Ala Leu Ile Arg Gln Gly Gly Asn Arg
645 650 655
Leu Val Met Lys Val Val Ser Val Thr Arg Lys Pro Glu Glu Asp Gly
660 665 670
Ala Arg Arg Arg Ala Pro Pro Pro Pro Lys Arg Ala Pro Ser Thr Thr
675 680 685
Leu Thr Leu Arg Ser Lys Ser Met Thr Ala Glu Leu Glu Glu Leu Ala
690 695 700
Ser Ile Arg Arg Arg Lys Gly Glu Lys Leu Asp Glu Met Leu Ala Ala
705 710 715 720
Ala Ala Glu Pro Thr Leu Arg Pro Asp Ile Ala Asp Ala Asp Ser Arg
725 730 735
Ala Ala Thr Val Lys Gln Arg Pro Thr Ser Arg Arg Ile Thr Pro Ala
740 745 750
Glu Ile Ser Ser Leu Phe Glu Arg Gln Gly Leu Pro Gly Pro Glu Lys
755 760 765
Leu Pro Gly Ser Leu Arg Lys Gly Ile Pro Arg Thr Lys Ser Val Gly
770 775 780
Glu Asp Glu Lys Leu Ala Ser Leu Leu Glu Gly Arg Phe Pro Arg Ser
785 790 795 800
Thr Ser Met Gln Asp Pro Val Arg Glu Gly Arg Gly Ile Pro Pro Pro
805 810 815
Pro Gln Thr Ala Pro Pro Pro Pro Pro Ala Pro Tyr Tyr Phe Asp Ser
820 825 830
Gly Pro Pro Pro Ala Phe Ser Pro Pro Pro Pro Pro Gly Arg Ala Tyr
835 840 845
Asp Thr Val Arg Ser Ser Phe Lys Pro Gly Leu Glu Ala Arg Leu Gly
850 855 860
Ala Gly Ala Ala Gly Leu Tyr Glu Pro Gly Ala Ala Leu Gly Pro Leu
865 870 875 880
Pro Tyr Pro Glu Arg Gln Lys Arg Ala Arg Ser Met Ile Ile Leu Gln
885 890 895
Asp Ser Ala Pro Glu Ser Gly Asp Ala Pro Arg Pro Pro Pro Ala Ala
900 905 910
Thr Pro Pro Glu Arg Pro Lys Arg Arg Pro Arg Pro Pro Gly Pro Asp
915 920 925
Ser Pro Tyr Ala Asn Leu Gly Ala Phe Ser Ala Ser Leu Phe Ala Pro
930 935 940
Ser Lys Pro Gln Arg Arg Lys Ser Pro Leu Val Lys Gln Leu Gln Val
945 950 955 960
Glu Asp Ala Gln Glu Arg Ala Ala Leu Ala Val Gly Ser Pro Gly Pro
965 970 975
Gly Gly Gly Ser Phe Ala Arg Glu Pro Ser Pro Thr His Arg Gly Pro
980 985 990
Arg Pro Gly Gly Leu Asp Tyr Gly Ala Gly Asp Gly Pro Gly Leu Ala
995 1000 1005
Phe Gly Gly Pro Gly Pro Ala Lys Asp Arg Arg Leu Glu Glu Arg
1010 1015 1020
Arg Arg Ser Thr Val Phe Leu Ser Val Gly Ala Ile Glu Gly Ser
1025 1030 1035
Ala Pro Gly Ala Asp Leu Pro Ser Leu Gln Pro Ser Arg Ser Ile
1040 1045 1050
Asp Glu Arg Leu Leu Gly Thr Gly Pro Thr Ala Gly Arg Asp Leu
1055 1060 1065
Leu Leu Pro Ser Pro Val Ser Ala Leu Lys Pro Leu Val Ser Gly
1070 1075 1080
Pro Ser Leu Gly Pro Ser Gly Ser Thr Phe Ile His Pro Leu Thr
1085 1090 1095
Gly Lys Pro Leu Asp Pro Ser Ser Pro Leu Ala Leu Ala Leu Ala
1100 1105 1110
Ala Arg Glu Arg Ala Leu Ala Ser Gln Ala Pro Ser Arg Ser Pro
1115 1120 1125
Thr Pro Val His Ser Pro Asp Ala Asp Arg Pro Gly Pro Leu Phe
1130 1135 1140
Val Asp Val Gln Ala Arg Asp Pro Glu Arg Gly Ser Leu Ala Ser
1145 1150 1155
Pro Ala Phe Ser Pro Arg Ser Pro Ala Trp Ile Pro Val Pro Ala
1160 1165 1170
Arg Arg Glu Ala Glu Lys Val Pro Arg Glu Glu Arg Lys Ser Pro
1175 1180 1185
Glu Asp Lys Lys Ser Met Ile Leu Ser Val Leu Asp Thr Ser Leu
1190 1195 1200
Gln Arg Pro Ala Gly Leu Ile Val Val His Ala Thr Ser Asn Gly
1205 1210 1215
Gln Glu Pro Ser Arg Leu Gly Gly Ala Glu Glu Glu Arg Pro Gly
1220 1225 1230
Thr Pro Glu Leu Ala Pro Ala Pro Met Gln Ser Ala Ala Val Ala
1235 1240 1245
Glu Pro Leu Pro Ser Pro Arg Ala Gln Pro Pro Gly Gly Thr Pro
1250 1255 1260
Ala Asp Ala Gly Pro Gly Gln Gly Ser Ser Glu Glu Glu Pro Glu
1265 1270 1275
Leu Val Phe Ala Val Asn Leu Pro Pro Ala Gln Leu Ser Ser Ser
1280 1285 1290
Asp Glu Glu Thr Arg Glu Glu Leu Ala Arg Ile Gly Leu Val Pro
1295 1300 1305
Pro Pro Glu Glu Phe Ala Asn Gly Val Leu Leu Ala Thr Pro Leu
1310 1315 1320
Ala Gly Pro Gly Pro Ser Pro Thr Thr Val Pro Ser Pro Ala Ser
1325 1330 1335
Gly Lys Pro Ser Ser Glu Pro Pro Pro Ala Pro Glu Ser Ala Ala
1340 1345 1350
Asp Ser Gly Val Glu Glu Ala Asp Thr Arg Ser Ser Ser Asp Pro
1355 1360 1365
His Leu Glu Thr Thr Ser Thr Ile Ser Thr Val Ser Ser Met Ser
1370 1375 1380
Thr Leu Ser Ser Glu Ser Gly Glu Leu Thr Asp Thr His Thr Ser
1385 1390 1395
Phe Ala Asp Gly His Thr Phe Leu Leu Glu Lys Pro Pro Val Pro
1400 1405 1410
Pro Lys Pro Lys Leu Lys Ser Pro Leu Gly Lys Gly Pro Val Thr
1415 1420 1425
Phe Arg Asp Pro Leu Leu Lys Gln Ser Ser Asp Ser Glu Leu Met
1430 1435 1440
Ala Gln Gln His His Ala Ala Ser Ala Gly Leu Ala Ser Ala Ala
1445 1450 1455
Gly Pro Ala Arg Pro Arg Tyr Leu Phe Gln Arg Arg Ser Lys Leu
1460 1465 1470
Trp Gly Asp Pro Val Glu Ser Arg Gly Leu Pro Gly Pro Glu Asp
1475 1480 1485
Asp Lys Pro Thr Val Ile Ser Glu Leu Ser Ser Arg Leu Gln Gln
1490 1495 1500
Leu Asn Lys Asp Thr Arg Ser Leu Gly Glu Glu Pro Val Gly Gly
1505 1510 1515
Leu Gly Ser Leu Leu Asp Pro Ala Lys Lys Ser Pro Ile Ala Ala
1520 1525 1530
Ala Arg Leu Phe Ser Ser Leu Gly Glu Leu Ser Ser Ile Ser Ala
1535 1540 1545
Gln Arg Ser Pro Gly Gly Pro Gly Gly Gly Ala Ser Tyr Ser Val
1550 1555 1560
Arg Pro Ser Gly Arg Tyr Pro Val Ala Arg Arg Ala Pro Ser Pro
1565 1570 1575
Val Lys Pro Ala Ser Leu Glu Arg Val Glu Gly Leu Gly Ala Gly
1580 1585 1590
Ala Gly Gly Ala Gly Arg Pro Phe Gly Leu Thr Pro Pro Thr Ile
1595 1600 1605
Leu Lys Ser Ser Ser Leu Ser Ile Pro His Glu Pro Lys Glu Val
1610 1615 1620
Arg Phe Val Val Arg Ser Val Ser Ala Arg Ser Arg Ser Pro Ser
1625 1630 1635
Pro Ser Pro Leu Pro Ser Pro Ala Ser Gly Pro Gly Pro Gly Ala
1640 1645 1650
Pro Gly Pro Arg Arg Pro Phe Gln Gln Lys Pro Leu Gln Leu Trp
1655 1660 1665
Ser Lys Phe Asp Val Gly Asp Trp Leu Glu Ser Ile His Leu Gly
1670 1675 1680
Glu His Arg Asp Arg Phe Glu Asp His Glu Ile Glu Gly Ala His
1685 1690 1695
Leu Pro Ala Leu Thr Lys Asp Asp Phe Val Glu Leu Gly Val Thr
1700 1705 1710
Arg Val Gly His Arg Met Asn Ile Glu Arg Ala Leu Arg Gln Leu
1715 1720 1725
Asp Gly Ser
1730
<210> 7
<211> 7459
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 7
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60
gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120
actccatcac taggggttcc tgcggccgca cgcgtttaat taagtgtcta gactgcagag 180
ggccctgcgt atgagtgcaa gtgggtttta ggaccaggat gaggcggggt gggggtgcct 240
acctgacgac cgaccccgac ccactggaca agcacccaac ccccattccc caaattgcgc 300
atcccctatc agagaggggg aggggaaaca ggatgcggcg aggcgcgtgc gcactgccag 360
cttcagcacc gcggacagtg ccttcgcccc cgcctggcgg cgcgcgccac cgccgcctca 420
gcactgaagg cgcgctgacg tcactcgccg gtcccccgca aactcccctt cccggccacc 480
ttggtcgcgt ccgcgccgcc gccggcccag ccggaccgca ccacgcgagg cgcgagatag 540
gggggcacgg gcgcgaccat ctgcgctgcg gcgccggcga ctcagcgctg cctcagtctg 600
cggtgggcag cggaggagtc gtgtcgtgcc tgagagcgca gtcgagaaac cggctagagg 660
atccttcgaa accggtgcta gcagcgctgt taacaccatg gtgagcaagg gcgaggagct 720
gttcaccggg gtggtgccca tcctggtcga gctggacggc gacgtaaacg gccacaagtt 780
cagcgtgtcc ggcgagggcg agggcgatgc cacctacggc aagctgaccc tgaagttcat 840
ctgcaccacc ggcaagctgc ccgtgccctg gcccaccctc gtgaccaccc tgacctacgg 900
cgtgcagtgc ttcagccgct accccgacca catgaagcag cacgacttct tcaagtccgc 960
catgcccgaa ggctacgtcc aggagcgcac catcttcttc aaggacgacg gcaactacaa 1020
gacccgcgcc gaggtgaagt tcgagggcga caccctggtg aaccgcatcg agctgaaggg 1080
catcgacttc aaggaggacg gcaacatcct ggggcacaag ctggagtaca actacaacag 1140
ccacaacgtc tatatcatgg ccgacaagca gaagaacggc atcaaggtga acttcaagat 1200
ccgccacaac atcgaggacg gcagcgtgca gctcgccgac cactaccagc agaacacccc 1260
catcggcgac ggccccgtgc tgctgcccga caaccactac ctgagcaccc agtccgccct 1320
gagcaaagac cccaacgaga agcgcgatca catggtcctg ctggagttcg tgaccgccgc 1380
cgggatcact ctcggcatgg acgagctgta caagggaagc ggaggaattc acggcccgaa 1440
gcggaaactt tacagtgccg tccccggccg caagttcatc gctgtgaagg cgcacagccc 1500
gcagggcgag ggcgagatcc cgctgcaccg cggcgaggcc gtgaaggtgc tcagcattgg 1560
ggagggcggt ttctgggagg gaaccgtgaa gggccgaaca ggctggttcc cagctgactg 1620
tgtggaagaa gtgcagatgc gacagtatga cacccggcat gaaaccagag aggaccggac 1680
gaagcgtctc ttccgccact acactgtggg ttcctatgac agcctcactt cacacagcga 1740
ttatgtcatc gatgataagg tggctatcct gcagaaaagg gaccatgagg ggtttggctt 1800
tgttctccgg ggagccaaag cagagacccc cattgaggag tttacaccca cacctgcctt 1860
ccctgcactc caataccttg agtctgtaga tgtggaaggt gtggcctgga gggctggact 1920
tcgaactggg gacttcctca ttgaggtgaa cggagtgaat gtcgtgaagg ttggacacaa 1980
gcaagtggtg ggtctcatcc gtcagggtgg caaccgcctg gtcatgaagg ttgtgtctgt 2040
gaccaggaaa cccgaggagg atggtgctcg gcgcagagcc ccaccacccc caaagagggc 2100
tcccagcacc acgctgaccc tgcggtccaa gtccatgacg gctgagctcg aggaacttgc 2160
ttccattcgg agctcagagg aggagccaga gctggtattc gctgtgaacc tgccacctgc 2220
tcagctgtcc tccagcgatg aggagaccag agaggagctg gcccgcatag ggctagtgcc 2280
accccctgaa gagtttgcca atgggatcct gctgaccacc ccgcccccag ggccgggccc 2340
cttgcccacc acggtaccca gcccggcctc agggaagccc agcagcgagc tgccccctgc 2400
ccctgagtct gcagctgact ctggagtaga ggaggctgac actcgaagct ccagtgaccc 2460
ccacctggag accacaagca ccatttccac agtgtccagc atgtccaccc tgagctcgga 2520
gagtggggaa ctcacggaca cccacacctc ctttgccgat ggacacactt ttctactcga 2580
gaagccacca gtgcctccca agcccaagct caagtccccg ctggggaagg ggccggtgac 2640
cttcagggac ccgctgctga agcaatcctc ggacagtgag ctcatggccc agcagcacca 2700
tgctgcctct actgggttgg cttctgctgc tgggcccgcc cgccctcgct acctcttcca 2760
gagaaggtcc aagctgtggg gggaccccgt ggagagtcgg gggctccctg ggcctgaaga 2820
tgacaaacca actgtgatca gtgagctcag ctcccgtctg cagcagctga ataaagacac 2880
acgctccttg ggggaggaac cagttggtgg cctgggcagc ctgctggacc ctgctaagaa 2940
gtcacccatt gcagcagctc ggctcttcag cagcctcggt gagctgagca ccatctcagc 3000
gcagcgcagc ccggggggcc cgggcggagg ggcctcctac tcggtgcggc ccagcggccg 3060
gtaccccgtg gcgagacgag ccccgagccc agtgaaaccc gcatcgctgg agcgggtgga 3120
ggggctgggg gcgggcgtgg gaggcgcggg gcggcccttc ggcctcacgc ctcccaccat 3180
cctcaagtcg tccagcctct ccatcccgca cgaacccaag gaagtgcgct tcgtggtgcg 3240
aagtgtgagt gcgcgcagcc gctccccctc accatctccg ctgccctcgc cttctcccgg 3300
ctctggcccc agtgccggcc cgcgtcggcc atttcaacag aagcccctgc agctctggag 3360
caagttcgat gtgggcgact ggctggagag catccactta ggcgagcacc gagaccgctt 3420
cgaggaccat gagatcgaag gcgcacacct gcctgcgctc accaaggaag acttcgtgga 3480
gctgggcgtc acacgcgttg gccaccgcat gaacatcgag cgtgcgctca ggcagctgga 3540
tggcagctga gcggccatcg tcgacggcgc gccaagctta tcgataatca acctctggat 3600
tacaaaattt gtgaaagatt gactggtatt cttaactatg ttgctccttt tacgctatgt 3660
ggatacgctg ctttaatgcc tttgtatcat gctattgctt cccgtatggc tttcattttc 3720
tcctccttgt ataaatcctg gttgctgtct ctttatgagg agttgtggcc cgttgtcagg 3780
caacgtggcg tggtgtgcac tgtgtttgct gacgcaaccc ccactggttg gggcattgcc 3840
accacctgtc agctcctttc cgggactttc gctttccccc tccctattgc cacggcggaa 3900
ctcatcgccg cctgccttgc ccgctgctgg acaggggctc ggctgttggg cactgacaat 3960
tccgtggtgt tgtcggggaa atcatcgtcc tttccttggc tgctcgccta tgttgccacc 4020
tggattctgc gcgggacgtc cttctgctac gtcccttcgg ccctcaatcc agcggacctt 4080
ccttcccgcg gcctgctgcc ggctctgcgg cctcttccgc gtcttcgcct tcgccctcag 4140
acgagtcgga tctccctttg ggccgcctcc ccgcatcgat accgagcgct gctcgagaga 4200
tctacgggtg gcatccctgt gacccctccc cagtgcctct cctggccctg gaagttgcca 4260
ctccagtgcc caccagcctt gtcctaataa aattaagttg catcattttg tctgactagg 4320
tgtccttcta taatattatg gggtggaggg gggtggtatg gagcaagggg caagttggga 4380
agacaacctg tagggcctgc ggggtctatt gggaaccaag ctggagtgca gtggcacaat 4440
cttggctcac tgcaatctcc gcctcctggg ttcaagcgat tctcctgcct cagcctcccg 4500
agttgttggg attccaggca tgcatgacca ggctcagcta atttttgttt ttttggtaga 4560
gacggggttt caccatattg gccaggctgg tctccaactc ctaatctcag gtgatctacc 4620
caccttggcc tcccaaattg ctgggattac aggcgtgaac cactgctccc ttccctgtcc 4680
ttctgatttt gtaggtaacc acgtgcggac cgagcggccg caggaacccc tagtgatgga 4740
gttggccact ccctctctgc gcgctcgctc gctcactgag gccgggcgac caaaggtcgc 4800
ccgacgcccg ggctttgccc gggcggcctc agtgagcgag cgagcgcgca gctgcctgca 4860
ggggcgcctg atgcggtatt ttctccttac gcatctgtgc ggtatttcac accgcatacg 4920
tcaaagcaac catagtacgc gccctgtagc ggcgcattaa gcgcggcggg tgtggtggtt 4980
acgcgcagcg tgaccgctac acttgccagc gccctagcgc ccgctccttt cgctttcttc 5040
ccttcctttc tcgccacgtt cgccggcttt ccccgtcaag ctctaaatcg ggggctccct 5100
ttagggttcc gatttagtgc tttacggcac ctcgacccca aaaaacttga tttgggtgat 5160
ggttcacgta gtgggccatc gccctgatag acggtttttc gccctttgac gttggagtcc 5220
acgttcttta atagtggact cttgttccaa actggaacaa cactcaaccc tatctcgggc 5280
tattcttttg atttataagg gattttgccg atttcggcct attggttaaa aaatgagctg 5340
atttaacaaa aatttaacgc gaattttaac aaaatattaa cgtttacaat tttatggtgc 5400
actctcagta caatctgctc tgatgccgca tagttaagcc agccccgaca cccgccaaca 5460
cccgctgacg cgccctgacg ggcttgtctg ctcccggcat ccgcttacag acaagctgtg 5520
accgtctccg ggagctgcat gtgtcagagg ttttcaccgt catcaccgaa acgcgcgaga 5580
cgaaagggcc tcgtgatacg cctattttta taggttaatg tcatgataat aatggtttct 5640
tagacgtcag gtggcacttt tcggggaaat gtgcgcggaa cccctatttg tttatttttc 5700
taaatacatt caaatatgta tccgctcatg agacaataac cctgataaat gcttcaataa 5760
tattgaaaaa ggaagagtat gagtattcaa catttccgtg tcgcccttat tccctttttt 5820
gcggcatttt gccttcctgt ttttgctcac ccagaaacgc tggtgaaagt aaaagatgct 5880
gaagatcagt tgggtgcacg agtgggttac atcgaactgg atctcaacag cggtaagatc 5940
cttgagagtt ttcgccccga agaacgtttt ccaatgatga gcacttttaa agttctgcta 6000
tgtggcgcgg tattatcccg tattgacgcc gggcaagagc aactcggtcg ccgcatacac 6060
tattctcaga atgacttggt tgagtactca ccagtcacag aaaagcatct tacggatggc 6120
atgacagtaa gagaattatg cagtgctgcc ataaccatga gtgataacac tgcggccaac 6180
ttacttctga caacgatcgg aggaccgaag gagctaaccg cttttttgca caacatgggg 6240
gatcatgtaa ctcgccttga tcgttgggaa ccggagctga atgaagccat accaaacgac 6300
gagcgtgaca ccacgatgcc tgtagcaatg gcaacaacgt tgcgcaaact attaactggc 6360
gaactactta ctctagcttc ccggcaacaa ttaatagact ggatggaggc ggataaagtt 6420
gcaggaccac ttctgcgctc ggcccttccg gctggctggt ttattgctga taaatctgga 6480
gccggtgagc gtgggtctcg cggtatcatt gcagcactgg ggccagatgg taagccctcc 6540
cgtatcgtag ttatctacac gacggggagt caggcaacta tggatgaacg aaatagacag 6600
atcgctgaga taggtgcctc actgattaag cattggtaac tgtcagacca agtttactca 6660
tatatacttt agattgattt aaaacttcat ttttaattta aaaggatcta ggtgaagatc 6720
ctttttgata atctcatgac caaaatccct taacgtgagt tttcgttcca ctgagcgtca 6780
gaccccgtag aaaagatcaa aggatcttct tgagatcctt tttttctgcg cgtaatctgc 6840
tgcttgcaaa caaaaaaacc accgctacca gcggtggttt gtttgccgga tcaagagcta 6900
ccaactcttt ttccgaaggt aactggcttc agcagagcgc agataccaaa tactgtcctt 6960
ctagtgtagc cgtagttagg ccaccacttc aagaactctg tagcaccgcc tacatacctc 7020
gctctgctaa tcctgttacc agtggctgct gccagtggcg ataagtcgtg tcttaccggg 7080
ttggactcaa gacgatagtt accggataag gcgcagcggt cgggctgaac ggggggttcg 7140
tgcacacagc ccagcttgga gcgaacgacc tacaccgaac tgagatacct acagcgtgag 7200
ctatgagaaa gcgccacgct tcccgaaggg agaaaggcgg acaggtatcc ggtaagcggc 7260
agggtcggaa caggagagcg cacgagggag cttccagggg gaaacgcctg gtatctttat 7320
agtcctgtcg ggtttcgcca cctctgactt gagcgtcgat ttttgtgatg ctcgtcaggg 7380
gggcggagcc tatggaaaaa cgccagcaac gcggcctttt tacggttcct ggccttttgc 7440
tggccttttg ctcacatgt 7459
<210> 8
<211> 5331
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 8
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60
gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120
actccatcac taggggttcc tgcggccgca cgcgtttaat taagtgtcta gactgcagag 180
ggccctgcgt atgagtgcaa gtgggtttta ggaccaggat gaggcggggt gggggtgcct 240
acctgacgac cgaccccgac ccactggaca agcacccaac ccccattccc caaattgcgc 300
atcccctatc agagaggggg aggggaaaca ggatgcggcg aggcgcgtgc gcactgccag 360
cttcagcacc gcggacagtg ccttcgcccc cgcctggcgg cgcgcgccac cgccgcctca 420
gcactgaagg cgcgctgacg tcactcgccg gtcccccgca aactcccctt cccggccacc 480
ttggtcgcgt ccgcgccgcc gccggcccag ccggaccgca ccacgcgagg cgcgagatag 540
gggggcacgg gcgcgaccat ctgcgctgcg gcgccggcga ctcagcgctg cctcagtctg 600
cggtgggcag cggaggagtc gtgtcgtgcc tgagagcgca gtcgagaaac cggctagagg 660
atccttcgaa accggtgcta gcagcgctgt taacaccatg gtgagcaagg gcgaggagct 720
gttcaccggg gtggtgccca tcctggtcga gctggacggc gacgtaaacg gccacaagtt 780
cagcgtgtcc ggcgagggcg agggcgatgc cacctacggc aagctgaccc tgaagttcat 840
ctgcaccacc ggcaagctgc ccgtgccctg gcccaccctc gtgaccaccc tgacctacgg 900
cgtgcagtgc ttcagccgct accccgacca catgaagcag cacgacttct tcaagtccgc 960
catgcccgaa ggctacgtcc aggagcgcac catcttcttc aaggacgacg gcaactacaa 1020
gacccgcgcc gaggtgaagt tcgagggcga caccctggtg aaccgcatcg agctgaaggg 1080
catcgacttc aaggaggacg gcaacatcct ggggcacaag ctggagtaca actacaacag 1140
ccacaacgtc tatatcatgg ccgacaagca gaagaacggc atcaaggtga acttcaagat 1200
ccgccacaac atcgaggacg gcagcgtgca gctcgccgac cactaccagc agaacacccc 1260
catcggcgac ggccccgtgc tgctgcccga caaccactac ctgagcaccc agtccgccct 1320
gagcaaagac cccaacgaga agcgcgatca catggtcctg ctggagttcg tgaccgccgc 1380
cgggatcact ctcggcatgg acgagctgta caagtaaggc gcgcccctgc agggaattcg 1440
atatcaagct tatcgataat caacctctgg attacaaaat ttgtgaaaga ttgactggta 1500
ttcttaacta tgttgctcct tttacgctat gtggatacgc tgctttaatg cctttgtatc 1560
atgctattgc ttcccgtatg gctttcattt tctcctcctt gtataaatcc tggttgctgt 1620
ctctttatga ggagttgtgg cccgttgtca ggcaacgtgg cgtggtgtgc actgtgtttg 1680
ctgacgcaac ccccactggt tggggcattg ccaccacctg tcagctcctt tccgggactt 1740
tcgctttccc cctccctatt gccacggcgg aactcatcgc cgcctgcctt gcccgctgct 1800
ggacaggggc tcggctgttg ggcactgaca attccgtggt gttgtcgggg aaatcatcgt 1860
cctttccttg gctgctcgcc tatgttgcca cctggattct gcgcgggacg tccttctgct 1920
acgtcccttc ggccctcaat ccagcggacc ttccttcccg cggcctgctg ccggctctgc 1980
ggcctcttcc gcgtcttcgc cttcgccctc agacgagtcg gatctccctt tgggccgcct 2040
ccccgcatcg ataccgagcg ctgctcgaga gatctacggg tggcatccct gtgacccctc 2100
cccagtgcct ctcctggccc tggaagttgc cactccagtg cccaccagcc ttgtcctaat 2160
aaaattaagt tgcatcattt tgtctgacta ggtgtccttc tataatatta tggggtggag 2220
gggggtggta tggagcaagg ggcaagttgg gaagacaacc tgtagggcct gcggggtcta 2280
ttgggaacca agctggagtg cagtggcaca atcttggctc actgcaatct ccgcctcctg 2340
ggttcaagcg attctcctgc ctcagcctcc cgagttgttg ggattccagg catgcatgac 2400
caggctcagc taatttttgt ttttttggta gagacggggt ttcaccatat tggccaggct 2460
ggtctccaac tcctaatctc aggtgatcta cccaccttgg cctcccaaat tgctgggatt 2520
acaggcgtga accactgctc ccttccctgt ccttctgatt ttgtaggtaa ccacgtgcgg 2580
accgagcggc cgcaggaacc cctagtgatg gagttggcca ctccctctct gcgcgctcgc 2640
tcgctcactg aggccgggcg accaaaggtc gcccgacgcc cgggctttgc ccgggcggcc 2700
tcagtgagcg agcgagcgcg cagctgcctg caggggcgcc tgatgcggta ttttctcctt 2760
acgcatctgt gcggtatttc acaccgcata cgtcaaagca accatagtac gcgccctgta 2820
gcggcgcatt aagcgcggcg ggtgtggtgg ttacgcgcag cgtgaccgct acacttgcca 2880
gcgccctagc gcccgctcct ttcgctttct tcccttcctt tctcgccacg ttcgccggct 2940
ttccccgtca agctctaaat cgggggctcc ctttagggtt ccgatttagt gctttacggc 3000
acctcgaccc caaaaaactt gatttgggtg atggttcacg tagtgggcca tcgccctgat 3060
agacggtttt tcgccctttg acgttggagt ccacgttctt taatagtgga ctcttgttcc 3120
aaactggaac aacactcaac cctatctcgg gctattcttt tgatttataa gggattttgc 3180
cgatttcggc ctattggtta aaaaatgagc tgatttaaca aaaatttaac gcgaatttta 3240
acaaaatatt aacgtttaca attttatggt gcactctcag tacaatctgc tctgatgccg 3300
catagttaag ccagccccga cacccgccaa cacccgctga cgcgccctga cgggcttgtc 3360
tgctcccggc atccgcttac agacaagctg tgaccgtctc cgggagctgc atgtgtcaga 3420
ggttttcacc gtcatcaccg aaacgcgcga gacgaaaggg cctcgtgata cgcctatttt 3480
tataggttaa tgtcatgata ataatggttt cttagacgtc aggtggcact tttcggggaa 3540
atgtgcgcgg aacccctatt tgtttatttt tctaaataca ttcaaatatg tatccgctca 3600
tgagacaata accctgataa atgcttcaat aatattgaaa aaggaagagt atgagtattc 3660
aacatttccg tgtcgccctt attccctttt ttgcggcatt ttgccttcct gtttttgctc 3720
acccagaaac gctggtgaaa gtaaaagatg ctgaagatca gttgggtgca cgagtgggtt 3780
acatcgaact ggatctcaac agcggtaaga tccttgagag ttttcgcccc gaagaacgtt 3840
ttccaatgat gagcactttt aaagttctgc tatgtggcgc ggtattatcc cgtattgacg 3900
ccgggcaaga gcaactcggt cgccgcatac actattctca gaatgacttg gttgagtact 3960
caccagtcac agaaaagcat cttacggatg gcatgacagt aagagaatta tgcagtgctg 4020
ccataaccat gagtgataac actgcggcca acttacttct gacaacgatc ggaggaccga 4080
aggagctaac cgcttttttg cacaacatgg gggatcatgt aactcgcctt gatcgttggg 4140
aaccggagct gaatgaagcc ataccaaacg acgagcgtga caccacgatg cctgtagcaa 4200
tggcaacaac gttgcgcaaa ctattaactg gcgaactact tactctagct tcccggcaac 4260
aattaataga ctggatggag gcggataaag ttgcaggacc acttctgcgc tcggcccttc 4320
cggctggctg gtttattgct gataaatctg gagccggtga gcgtgggtct cgcggtatca 4380
ttgcagcact ggggccagat ggtaagccct cccgtatcgt agttatctac acgacgggga 4440
gtcaggcaac tatggatgaa cgaaatagac agatcgctga gataggtgcc tcactgatta 4500
agcattggta actgtcagac caagtttact catatatact ttagattgat ttaaaacttc 4560
atttttaatt taaaaggatc taggtgaaga tcctttttga taatctcatg accaaaatcc 4620
cttaacgtga gttttcgttc cactgagcgt cagaccccgt agaaaagatc aaaggatctt 4680
cttgagatcc tttttttctg cgcgtaatct gctgcttgca aacaaaaaaa ccaccgctac 4740
cagcggtggt ttgtttgccg gatcaagagc taccaactct ttttccgaag gtaactggct 4800
tcagcagagc gcagatacca aatactgtcc ttctagtgta gccgtagtta ggccaccact 4860
tcaagaactc tgtagcaccg cctacatacc tcgctctgct aatcctgtta ccagtggctg 4920
ctgccagtgg cgataagtcg tgtcttaccg ggttggactc aagacgatag ttaccggata 4980
aggcgcagcg gtcgggctga acggggggtt cgtgcacaca gcccagcttg gagcgaacga 5040
cctacaccga actgagatac ctacagcgtg agctatgaga aagcgccacg cttcccgaag 5100
ggagaaaggc ggacaggtat ccggtaagcg gcagggtcgg aacaggagag cgcacgaggg 5160
agcttccagg gggaaacgcc tggtatcttt atagtcctgt cgggtttcgc cacctctgac 5220
ttgagcgtcg atttttgtga tgctcgtcag gggggcggag cctatggaaa aacgccagca 5280
acgcggcctt tttacggttc ctggcctttt gctggccttt tgctcacatg t 5331
<210> 9
<211> 6369
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 9
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60
gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120
actccatcac taggggttcc tgcggccgca cgcgtttaat taagtgtcta gactgcagag 180
ggccctgcgt atgagtgcaa gtgggtttta ggaccaggat gaggcggggt gggggtgcct 240
acctgacgac cgaccccgac ccactggaca agcacccaac ccccattccc caaattgcgc 300
atcccctatc agagaggggg aggggaaaca ggatgcggcg aggcgcgtgc gcactgccag 360
cttcagcacc gcggacagtg ccttcgcccc cgcctggcgg cgcgcgccac cgccgcctca 420
gcactgaagg cgcgctgacg tcactcgccg gtcccccgca aactcccctt cccggccacc 480
ttggtcgcgt ccgcgccgcc gccggcccag ccggaccgca ccacgcgagg cgcgagatag 540
gggggcacgg gcgcgaccat ctgcgctgcg gcgccggcga ctcagcgctg cctcagtctg 600
cggtgggcag cggaggagtc gtgtcgtgcc tgagagcgca gtcgagaaac cggctagagg 660
atccttcgaa accggtgcta gcaccatgcc taagaagaag agaaaggtat gcaggtcaca 720
ccaaaatttg cctgcattac cggtcgatgc aacgagtgat gaggttcgca agaacctgat 780
ggacatgttc agggatcgcc aggcgttttc tgagcatacc tggaaaatgc ttctgtccgt 840
ttgccggtcg tgggcggcat ggtgcaagtt gaataaccgg aaatggtttc ccgcagaacc 900
tgaagatgtt cgcgattatc ttctatatct tcaggcgcgc ggtctggcag taaaaactat 960
ccagcaacat ttgggccagc taaacatgct tcatcgtcgg tccgggctgc cacgaccaag 1020
tgacagcaat gctgtttcac tggttatgcg gcggatccga aaagaaaacg ttgatgccgg 1080
tgaacgtgca aaacaggctc tagcgttcga acgcactgat ttcgaccagg ttcgttcact 1140
catggaaaat agcgatcgct gccaggatat acgtaatctg gcatttctgg ggattgctta 1200
taacaccctg ttacgtatag ccgaaattgc caggatcagg gttaaagata tctcacgtac 1260
tgacggtggg agaatgttaa tccatattgg cagaacgaaa acgctggtta gcaccgcagg 1320
tgtagagaag gcacttagcc tgggggtaac taaactggtc gagcgatgga tttccgtctc 1380
tggtgtagct gatgatccga ataactacct gttttgccgg gtcagaaaaa atggtgttgc 1440
cgcgccatct gccaccagcc agctatcaac tcgcgccctg gaagggattt ttgaagcaac 1500
tcatcgattg atttacggcg ctaaggatga ctctggtcag agatacctgg cctggtctgg 1560
acacagtgcc cgtgtcggag ccgcgcgaga tatggcccgc gctggagttt caataccgga 1620
gatcatgcaa gctggtggct ggaccaatgt aaatattgtc atgaactata tccgtaacct 1680
ggatagtgaa acaggggcaa tggtgcgcct gctggaagat ggcgatgtta acgtgagcaa 1740
gggcgaggag ctgttcaccg gggtggtgcc catcctggtc gagctggacg gcgacgtaaa 1800
cggccacaag ttcagcgtgt ccggcgaggg cgagggcgat gccacctacg gcaagctgac 1860
cctgaagttc atctgcacca ccggcaagct gcccgtgccc tggcccaccc tcgtgaccac 1920
cctgacctac ggcgtgcagt gcttcagccg ctaccccgac cacatgaagc agcacgactt 1980
cttcaagtcc gccatgcccg aaggctacgt ccaggagcgc accatcttct tcaaggacga 2040
cggcaactac aagacccgcg ccgaggtgaa gttcgagggc gacaccctgg tgaaccgcat 2100
cgagctgaag ggcatcgact tcaaggagga cggcaacatc ctggggcaca agctggagta 2160
caactacaac agccacaacg tctatatcat ggccgacaag cagaagaacg gcatcaaggt 2220
gaacttcaag atccgccaca acatcgagga cggcagcgtg cagctcgccg accactacca 2280
gcagaacacc cccatcggcg acggccccgt gctgctgccc gacaaccact acctgagcac 2340
ccagtccgcc ctgagcaaag accccaacga gaagcgcgat cacatggtcc tgctggagtt 2400
cgtgaccgcc gccgggatca ctctcggcat ggacgagctg tacaagtaag tcgacggcgc 2460
gcccctgcag ggaattcgat atcaagctta tcgataatca acctctggat tacaaaattt 2520
gtgaaagatt gactggtatt cttaactatg ttgctccttt tacgctatgt ggatacgctg 2580
ctttaatgcc tttgtatcat gctattgctt cccgtatggc tttcattttc tcctccttgt 2640
ataaatcctg gttgctgtct ctttatgagg agttgtggcc cgttgtcagg caacgtggcg 2700
tggtgtgcac tgtgtttgct gacgcaaccc ccactggttg gggcattgcc accacctgtc 2760
agctcctttc cgggactttc gctttccccc tccctattgc cacggcggaa ctcatcgccg 2820
cctgccttgc ccgctgctgg acaggggctc ggctgttggg cactgacaat tccgtggtgt 2880
tgtcggggaa atcatcgtcc tttccttggc tgctcgccta tgttgccacc tggattctgc 2940
gcgggacgtc cttctgctac gtcccttcgg ccctcaatcc agcggacctt ccttcccgcg 3000
gcctgctgcc ggctctgcgg cctcttccgc gtcttcgcct tcgccctcag acgagtcgga 3060
tctccctttg ggccgcctcc ccgcatcgat accgagcgct gctcgagaga tctacgggtg 3120
gcatccctgt gacccctccc cagtgcctct cctggccctg gaagttgcca ctccagtgcc 3180
caccagcctt gtcctaataa aattaagttg catcattttg tctgactagg tgtccttcta 3240
taatattatg gggtggaggg gggtggtatg gagcaagggg caagttggga agacaacctg 3300
tagggcctgc ggggtctatt gggaaccaag ctggagtgca gtggcacaat cttggctcac 3360
tgcaatctcc gcctcctggg ttcaagcgat tctcctgcct cagcctcccg agttgttggg 3420
attccaggca tgcatgacca ggctcagcta atttttgttt ttttggtaga gacggggttt 3480
caccatattg gccaggctgg tctccaactc ctaatctcag gtgatctacc caccttggcc 3540
tcccaaattg ctgggattac aggcgtgaac cactgctccc ttccctgtcc ttctgatttt 3600
gtaggtaacc acgtgcggac cgagcggccg caggaacccc tagtgatgga gttggccact 3660
ccctctctgc gcgctcgctc gctcactgag gccgggcgac caaaggtcgc ccgacgcccg 3720
ggctttgccc gggcggcctc agtgagcgag cgagcgcgca gctgcctgca ggggcgcctg 3780
atgcggtatt ttctccttac gcatctgtgc ggtatttcac accgcatacg tcaaagcaac 3840
catagtacgc gccctgtagc ggcgcattaa gcgcggcggg tgtggtggtt acgcgcagcg 3900
tgaccgctac acttgccagc gccctagcgc ccgctccttt cgctttcttc ccttcctttc 3960
tcgccacgtt cgccggcttt ccccgtcaag ctctaaatcg ggggctccct ttagggttcc 4020
gatttagtgc tttacggcac ctcgacccca aaaaacttga tttgggtgat ggttcacgta 4080
gtgggccatc gccctgatag acggtttttc gccctttgac gttggagtcc acgttcttta 4140
atagtggact cttgttccaa actggaacaa cactcaaccc tatctcgggc tattcttttg 4200
atttataagg gattttgccg atttcggcct attggttaaa aaatgagctg atttaacaaa 4260
aatttaacgc gaattttaac aaaatattaa cgtttacaat tttatggtgc actctcagta 4320
caatctgctc tgatgccgca tagttaagcc agccccgaca cccgccaaca cccgctgacg 4380
cgccctgacg ggcttgtctg ctcccggcat ccgcttacag acaagctgtg accgtctccg 4440
ggagctgcat gtgtcagagg ttttcaccgt catcaccgaa acgcgcgaga cgaaagggcc 4500
tcgtgatacg cctattttta taggttaatg tcatgataat aatggtttct tagacgtcag 4560
gtggcacttt tcggggaaat gtgcgcggaa cccctatttg tttatttttc taaatacatt 4620
caaatatgta tccgctcatg agacaataac cctgataaat gcttcaataa tattgaaaaa 4680
ggaagagtat gagtattcaa catttccgtg tcgcccttat tccctttttt gcggcatttt 4740
gccttcctgt ttttgctcac ccagaaacgc tggtgaaagt aaaagatgct gaagatcagt 4800
tgggtgcacg agtgggttac atcgaactgg atctcaacag cggtaagatc cttgagagtt 4860
ttcgccccga agaacgtttt ccaatgatga gcacttttaa agttctgcta tgtggcgcgg 4920
tattatcccg tattgacgcc gggcaagagc aactcggtcg ccgcatacac tattctcaga 4980
atgacttggt tgagtactca ccagtcacag aaaagcatct tacggatggc atgacagtaa 5040
gagaattatg cagtgctgcc ataaccatga gtgataacac tgcggccaac ttacttctga 5100
caacgatcgg aggaccgaag gagctaaccg cttttttgca caacatgggg gatcatgtaa 5160
ctcgccttga tcgttgggaa ccggagctga atgaagccat accaaacgac gagcgtgaca 5220
ccacgatgcc tgtagcaatg gcaacaacgt tgcgcaaact attaactggc gaactactta 5280
ctctagcttc ccggcaacaa ttaatagact ggatggaggc ggataaagtt gcaggaccac 5340
ttctgcgctc ggcccttccg gctggctggt ttattgctga taaatctgga gccggtgagc 5400
gtgggtctcg cggtatcatt gcagcactgg ggccagatgg taagccctcc cgtatcgtag 5460
ttatctacac gacggggagt caggcaacta tggatgaacg aaatagacag atcgctgaga 5520
taggtgcctc actgattaag cattggtaac tgtcagacca agtttactca tatatacttt 5580
agattgattt aaaacttcat ttttaattta aaaggatcta ggtgaagatc ctttttgata 5640
atctcatgac caaaatccct taacgtgagt tttcgttcca ctgagcgtca gaccccgtag 5700
aaaagatcaa aggatcttct tgagatcctt tttttctgcg cgtaatctgc tgcttgcaaa 5760
caaaaaaacc accgctacca gcggtggttt gtttgccgga tcaagagcta ccaactcttt 5820
ttccgaaggt aactggcttc agcagagcgc agataccaaa tactgtcctt ctagtgtagc 5880
cgtagttagg ccaccacttc aagaactctg tagcaccgcc tacatacctc gctctgctaa 5940
tcctgttacc agtggctgct gccagtggcg ataagtcgtg tcttaccggg ttggactcaa 6000
gacgatagtt accggataag gcgcagcggt cgggctgaac ggggggttcg tgcacacagc 6060
ccagcttgga gcgaacgacc tacaccgaac tgagatacct acagcgtgag ctatgagaaa 6120
gcgccacgct tcccgaaggg agaaaggcgg acaggtatcc ggtaagcggc agggtcggaa 6180
caggagagcg cacgagggag cttccagggg gaaacgcctg gtatctttat agtcctgtcg 6240
ggtttcgcca cctctgactt gagcgtcgat ttttgtgatg ctcgtcaggg gggcggagcc 6300
tatggaaaaa cgccagcaac gcggcctttt tacggttcct ggccttttgc tggccttttg 6360
ctcacatgt 6369
<210> 10
<211> 5703
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 10
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60
gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120
actccatcac taggggttcc tgcggccgca cgcgtttaat taagtgtcta gactgcagag 180
ggccctgcgt atgagtgcaa gtgggtttta ggaccaggat gaggcggggt gggggtgcct 240
acctgacgac cgaccccgac ccactggaca agcacccaac ccccattccc caaattgcgc 300
atcccctatc agagaggggg aggggaaaca ggatgcggcg aggcgcgtgc gcactgccag 360
cttcagcacc gcggacagtg ccttcgcccc cgcctggcgg cgcgcgccac cgccgcctca 420
gcactgaagg cgcgctgacg tcactcgccg gtcccccgca aactcccctt cccggccacc 480
ttggtcgcgt ccgcgccgcc gccggcccag ccggaccgca ccacgcgagg cgcgagatag 540
gggggcacgg gcgcgaccat ctgcgctgcg gcgccggcga ctcagcgctg cctcagtctg 600
cggtgggcag cggaggagtc gtgtcgtgcc tgagagcgca gtcgagaaac cggctagagg 660
atccttcgaa accggtgcta gcaccatgcc taagaagaag agaaaggtat gcaggtcaca 720
ccaaaatttg cctgcattac cggtcgatgc aacgagtgat gaggttcgca agaacctgat 780
ggacatgttc agggatcgcc aggcgttttc tgagcatacc tggaaaatgc ttctgtccgt 840
ttgccggtcg tgggcggcat ggtgcaagtt gaataaccgg aaatggtttc ccgcagaacc 900
tgaagatgtt cgcgattatc ttctatatct tcaggcgcgc ggtctggcag taaaaactat 960
ccagcaacat ttgggccagc taaacatgct tcatcgtcgg tccgggctgc cacgaccaag 1020
tgacagcaat gctgtttcac tggttatgcg gcggatccga gttaacgtga gcaagggcga 1080
ggagctgttc accggggtgg tgcccatcct ggtcgagctg gacggcgacg taaacggcca 1140
caagttcagc gtgtccggcg agggcgaggg cgatgccacc tacggcaagc tgaccctgaa 1200
gttcatctgc accaccggca agctgcccgt gccctggccc accctcgtga ccaccctgac 1260
ctacggcgtg cagtgcttca gccgctaccc cgaccacatg aagcagcacg acttcttcaa 1320
gtccgccatg cccgaaggct acgtccagga gcgcaccatc ttcttcaagg acgacggcaa 1380
ctacaagacc cgcgccgagg tgaagttcga gggcgacacc ctggtgaacc gcatcgagct 1440
gaagggcatc gacttcaagg aggacggcaa catcctgggg cacaagctgg agtacaacta 1500
caacagccac aacgtctata tcatggccga caagcagaag aacggcatca aggtgaactt 1560
caagatccgc cacaacatcg aggacggcag cgtgcagctc gccgaccact accagcagaa 1620
cacccccatc ggcgacggcc ccgtgctgct gcccgacaac cactacctga gcacccagtc 1680
cgccctgagc aaagacccca acgagaagcg cgatcacatg gtcctgctgg agttcgtgac 1740
cgccgccggg atcactctcg gcatggacga gctgtacaag taagtcgacg gcgcgcccct 1800
gcagggaatt cgatatcaag cttatcgata atcaacctct ggattacaaa atttgtgaaa 1860
gattgactgg tattcttaac tatgttgctc cttttacgct atgtggatac gctgctttaa 1920
tgcctttgta tcatgctatt gcttcccgta tggctttcat tttctcctcc ttgtataaat 1980
cctggttgct gtctctttat gaggagttgt ggcccgttgt caggcaacgt ggcgtggtgt 2040
gcactgtgtt tgctgacgca acccccactg gttggggcat tgccaccacc tgtcagctcc 2100
tttccgggac tttcgctttc cccctcccta ttgccacggc ggaactcatc gccgcctgcc 2160
ttgcccgctg ctggacaggg gctcggctgt tgggcactga caattccgtg gtgttgtcgg 2220
ggaaatcatc gtcctttcct tggctgctcg cctatgttgc cacctggatt ctgcgcggga 2280
cgtccttctg ctacgtccct tcggccctca atccagcgga ccttccttcc cgcggcctgc 2340
tgccggctct gcggcctctt ccgcgtcttc gccttcgccc tcagacgagt cggatctccc 2400
tttgggccgc ctccccgcat cgataccgag cgctgctcga gagatctacg ggtggcatcc 2460
ctgtgacccc tccccagtgc ctctcctggc cctggaagtt gccactccag tgcccaccag 2520
ccttgtccta ataaaattaa gttgcatcat tttgtctgac taggtgtcct tctataatat 2580
tatggggtgg aggggggtgg tatggagcaa ggggcaagtt gggaagacaa cctgtagggc 2640
ctgcggggtc tattgggaac caagctggag tgcagtggca caatcttggc tcactgcaat 2700
ctccgcctcc tgggttcaag cgattctcct gcctcagcct cccgagttgt tgggattcca 2760
ggcatgcatg accaggctca gctaattttt gtttttttgg tagagacggg gtttcaccat 2820
attggccagg ctggtctcca actcctaatc tcaggtgatc tacccacctt ggcctcccaa 2880
attgctggga ttacaggcgt gaaccactgc tcccttccct gtccttctga ttttgtaggt 2940
aaccacgtgc ggaccgagcg gccgcaggaa cccctagtga tggagttggc cactccctct 3000
ctgcgcgctc gctcgctcac tgaggccggg cgaccaaagg tcgcccgacg cccgggcttt 3060
gcccgggcgg cctcagtgag cgagcgagcg cgcagctgcc tgcaggggcg cctgatgcgg 3120
tattttctcc ttacgcatct gtgcggtatt tcacaccgca tacgtcaaag caaccatagt 3180
acgcgccctg tagcggcgca ttaagcgcgg cgggtgtggt ggttacgcgc agcgtgaccg 3240
ctacacttgc cagcgcccta gcgcccgctc ctttcgcttt cttcccttcc tttctcgcca 3300
cgttcgccgg ctttccccgt caagctctaa atcgggggct ccctttaggg ttccgattta 3360
gtgctttacg gcacctcgac cccaaaaaac ttgatttggg tgatggttca cgtagtgggc 3420
catcgccctg atagacggtt tttcgccctt tgacgttgga gtccacgttc tttaatagtg 3480
gactcttgtt ccaaactgga acaacactca accctatctc gggctattct tttgatttat 3540
aagggatttt gccgatttcg gcctattggt taaaaaatga gctgatttaa caaaaattta 3600
acgcgaattt taacaaaata ttaacgttta caattttatg gtgcactctc agtacaatct 3660
gctctgatgc cgcatagtta agccagcccc gacacccgcc aacacccgct gacgcgccct 3720
gacgggcttg tctgctcccg gcatccgctt acagacaagc tgtgaccgtc tccgggagct 3780
gcatgtgtca gaggttttca ccgtcatcac cgaaacgcgc gagacgaaag ggcctcgtga 3840
tacgcctatt tttataggtt aatgtcatga taataatggt ttcttagacg tcaggtggca 3900
cttttcgggg aaatgtgcgc ggaaccccta tttgtttatt tttctaaata cattcaaata 3960
tgtatccgct catgagacaa taaccctgat aaatgcttca ataatattga aaaaggaaga 4020
gtatgagtat tcaacatttc cgtgtcgccc ttattccctt ttttgcggca ttttgccttc 4080
ctgtttttgc tcacccagaa acgctggtga aagtaaaaga tgctgaagat cagttgggtg 4140
cacgagtggg ttacatcgaa ctggatctca acagcggtaa gatccttgag agttttcgcc 4200
ccgaagaacg ttttccaatg atgagcactt ttaaagttct gctatgtggc gcggtattat 4260
cccgtattga cgccgggcaa gagcaactcg gtcgccgcat acactattct cagaatgact 4320
tggttgagta ctcaccagtc acagaaaagc atcttacgga tggcatgaca gtaagagaat 4380
tatgcagtgc tgccataacc atgagtgata acactgcggc caacttactt ctgacaacga 4440
tcggaggacc gaaggagcta accgcttttt tgcacaacat gggggatcat gtaactcgcc 4500
ttgatcgttg ggaaccggag ctgaatgaag ccataccaaa cgacgagcgt gacaccacga 4560
tgcctgtagc aatggcaaca acgttgcgca aactattaac tggcgaacta cttactctag 4620
cttcccggca acaattaata gactggatgg aggcggataa agttgcagga ccacttctgc 4680
gctcggccct tccggctggc tggtttattg ctgataaatc tggagccggt gagcgtgggt 4740
ctcgcggtat cattgcagca ctggggccag atggtaagcc ctcccgtatc gtagttatct 4800
acacgacggg gagtcaggca actatggatg aacgaaatag acagatcgct gagataggtg 4860
cctcactgat taagcattgg taactgtcag accaagttta ctcatatata ctttagattg 4920
atttaaaact tcatttttaa tttaaaagga tctaggtgaa gatccttttt gataatctca 4980
tgaccaaaat cccttaacgt gagttttcgt tccactgagc gtcagacccc gtagaaaaga 5040
tcaaaggatc ttcttgagat cctttttttc tgcgcgtaat ctgctgcttg caaacaaaaa 5100
aaccaccgct accagcggtg gtttgtttgc cggatcaaga gctaccaact ctttttccga 5160
aggtaactgg cttcagcaga gcgcagatac caaatactgt ccttctagtg tagccgtagt 5220
taggccacca cttcaagaac tctgtagcac cgcctacata cctcgctctg ctaatcctgt 5280
taccagtggc tgctgccagt ggcgataagt cgtgtcttac cgggttggac tcaagacgat 5340
agttaccgga taaggcgcag cggtcgggct gaacgggggg ttcgtgcaca cagcccagct 5400
tggagcgaac gacctacacc gaactgagat acctacagcg tgagctatga gaaagcgcca 5460
cgcttcccga agggagaaag gcggacaggt atccggtaag cggcagggtc ggaacaggag 5520
agcgcacgag ggagcttcca gggggaaacg cctggtatct ttatagtcct gtcgggtttc 5580
gccacctctg acttgagcgt cgatttttgt gatgctcgtc aggggggcgg agcctatgga 5640
aaaacgccag caacgcggcc tttttacggt tcctggcctt ttgctggcct tttgctcaca 5700
tgt 5703
<210> 11
<211> 950
<212> PRT
<213> 人工序列
<220>
<223> 合成的
<400> 11
Met Val Ser Lys Gly Glu Glu Leu Phe Thr Gly Val Val Pro Ile Leu
1 5 10 15
Val Glu Leu Asp Gly Asp Val Asn Gly His Lys Phe Ser Val Ser Gly
20 25 30
Glu Gly Glu Gly Asp Ala Thr Tyr Gly Lys Leu Thr Leu Lys Phe Ile
35 40 45
Cys Thr Thr Gly Lys Leu Pro Val Pro Trp Pro Thr Leu Val Thr Thr
50 55 60
Leu Thr Tyr Gly Val Gln Cys Phe Ser Arg Tyr Pro Asp His Met Lys
65 70 75 80
Gln His Asp Phe Phe Lys Ser Ala Met Pro Glu Gly Tyr Val Gln Glu
85 90 95
Arg Thr Ile Phe Phe Lys Asp Asp Gly Asn Tyr Lys Thr Arg Ala Glu
100 105 110
Val Lys Phe Glu Gly Asp Thr Leu Val Asn Arg Ile Glu Leu Lys Gly
115 120 125
Ile Asp Phe Lys Glu Asp Gly Asn Ile Leu Gly His Lys Leu Glu Tyr
130 135 140
Asn Tyr Asn Ser His Asn Val Tyr Ile Met Ala Asp Lys Gln Lys Asn
145 150 155 160
Gly Ile Lys Val Asn Phe Lys Ile Arg His Asn Ile Glu Asp Gly Ser
165 170 175
Val Gln Leu Ala Asp His Tyr Gln Gln Asn Thr Pro Ile Gly Asp Gly
180 185 190
Pro Val Leu Leu Pro Asp Asn His Tyr Leu Ser Thr Gln Ser Ala Leu
195 200 205
Ser Lys Asp Pro Asn Glu Lys Arg Asp His Met Val Leu Leu Glu Phe
210 215 220
Val Thr Ala Ala Gly Ile Thr Leu Gly Met Asp Glu Leu Tyr Lys Gly
225 230 235 240
Ser Gly Gly Ile His Gly Pro Lys Arg Lys Leu Tyr Ser Ala Val Pro
245 250 255
Gly Arg Lys Phe Ile Ala Val Lys Ala His Ser Pro Gln Gly Glu Gly
260 265 270
Glu Ile Pro Leu His Arg Gly Glu Ala Val Lys Val Leu Ser Ile Gly
275 280 285
Glu Gly Gly Phe Trp Glu Gly Thr Val Lys Gly Arg Thr Gly Trp Phe
290 295 300
Pro Ala Asp Cys Val Glu Glu Val Gln Met Arg Gln Tyr Asp Thr Arg
305 310 315 320
His Glu Thr Arg Glu Asp Arg Thr Lys Arg Leu Phe Arg His Tyr Thr
325 330 335
Val Gly Ser Tyr Asp Ser Leu Thr Ser His Ser Asp Tyr Val Ile Asp
340 345 350
Asp Lys Val Ala Ile Leu Gln Lys Arg Asp His Glu Gly Phe Gly Phe
355 360 365
Val Leu Arg Gly Ala Lys Ala Glu Thr Pro Ile Glu Glu Phe Thr Pro
370 375 380
Thr Pro Ala Phe Pro Ala Leu Gln Tyr Leu Glu Ser Val Asp Val Glu
385 390 395 400
Gly Val Ala Trp Arg Ala Gly Leu Arg Thr Gly Asp Phe Leu Ile Glu
405 410 415
Val Asn Gly Val Asn Val Val Lys Val Gly His Lys Gln Val Val Gly
420 425 430
Leu Ile Arg Gln Gly Gly Asn Arg Leu Val Met Lys Val Val Ser Val
435 440 445
Thr Arg Lys Pro Glu Glu Asp Gly Ala Arg Arg Arg Ala Pro Pro Pro
450 455 460
Pro Lys Arg Ala Pro Ser Thr Thr Leu Thr Leu Arg Ser Lys Ser Met
465 470 475 480
Thr Ala Glu Leu Glu Glu Leu Ala Ser Ile Arg Ser Ser Glu Glu Glu
485 490 495
Pro Glu Leu Val Phe Ala Val Asn Leu Pro Pro Ala Gln Leu Ser Ser
500 505 510
Ser Asp Glu Glu Thr Arg Glu Glu Leu Ala Arg Ile Gly Leu Val Pro
515 520 525
Pro Pro Glu Glu Phe Ala Asn Gly Ile Leu Leu Thr Thr Pro Pro Pro
530 535 540
Gly Pro Gly Pro Leu Pro Thr Thr Val Pro Ser Pro Ala Ser Gly Lys
545 550 555 560
Pro Ser Ser Glu Leu Pro Pro Ala Pro Glu Ser Ala Ala Asp Ser Gly
565 570 575
Val Glu Glu Ala Asp Thr Arg Ser Ser Ser Asp Pro His Leu Glu Thr
580 585 590
Thr Ser Thr Ile Ser Thr Val Ser Ser Met Ser Thr Leu Ser Ser Glu
595 600 605
Ser Gly Glu Leu Thr Asp Thr His Thr Ser Phe Ala Asp Gly His Thr
610 615 620
Phe Leu Leu Glu Lys Pro Pro Val Pro Pro Lys Pro Lys Leu Lys Ser
625 630 635 640
Pro Leu Gly Lys Gly Pro Val Thr Phe Arg Asp Pro Leu Leu Lys Gln
645 650 655
Ser Ser Asp Ser Glu Leu Met Ala Gln Gln His His Ala Ala Ser Thr
660 665 670
Gly Leu Ala Ser Ala Ala Gly Pro Ala Arg Pro Arg Tyr Leu Phe Gln
675 680 685
Arg Arg Ser Lys Leu Trp Gly Asp Pro Val Glu Ser Arg Gly Leu Pro
690 695 700
Gly Pro Glu Asp Asp Lys Pro Thr Val Ile Ser Glu Leu Ser Ser Arg
705 710 715 720
Leu Gln Gln Leu Asn Lys Asp Thr Arg Ser Leu Gly Glu Glu Pro Val
725 730 735
Gly Gly Leu Gly Ser Leu Leu Asp Pro Ala Lys Lys Ser Pro Ile Ala
740 745 750
Ala Ala Arg Leu Phe Ser Ser Leu Gly Glu Leu Ser Thr Ile Ser Ala
755 760 765
Gln Arg Ser Pro Gly Gly Pro Gly Gly Gly Ala Ser Tyr Ser Val Arg
770 775 780
Pro Ser Gly Arg Tyr Pro Val Ala Arg Arg Ala Pro Ser Pro Val Lys
785 790 795 800
Pro Ala Ser Leu Glu Arg Val Glu Gly Leu Gly Ala Gly Val Gly Gly
805 810 815
Ala Gly Arg Pro Phe Gly Leu Thr Pro Pro Thr Ile Leu Lys Ser Ser
820 825 830
Ser Leu Ser Ile Pro His Glu Pro Lys Glu Val Arg Phe Val Val Arg
835 840 845
Ser Val Ser Ala Arg Ser Arg Ser Pro Ser Pro Ser Pro Leu Pro Ser
850 855 860
Pro Ser Pro Gly Ser Gly Pro Ser Ala Gly Pro Arg Arg Pro Phe Gln
865 870 875 880
Gln Lys Pro Leu Gln Leu Trp Ser Lys Phe Asp Val Gly Asp Trp Leu
885 890 895
Glu Ser Ile His Leu Gly Glu His Arg Asp Arg Phe Glu Asp His Glu
900 905 910
Ile Glu Gly Ala His Leu Pro Ala Leu Thr Lys Glu Asp Phe Val Glu
915 920 925
Leu Gly Val Thr Arg Val Gly His Arg Met Asn Ile Glu Arg Ala Leu
930 935 940
Arg Gln Leu Asp Gly Ser
945 950
<210> 12
<211> 239
<212> PRT
<213> 人工序列
<220>
<223> 合成的
<400> 12
Met Val Ser Lys Gly Glu Glu Leu Phe Thr Gly Val Val Pro Ile Leu
1 5 10 15
Val Glu Leu Asp Gly Asp Val Asn Gly His Lys Phe Ser Val Ser Gly
20 25 30
Glu Gly Glu Gly Asp Ala Thr Tyr Gly Lys Leu Thr Leu Lys Phe Ile
35 40 45
Cys Thr Thr Gly Lys Leu Pro Val Pro Trp Pro Thr Leu Val Thr Thr
50 55 60
Leu Thr Tyr Gly Val Gln Cys Phe Ser Arg Tyr Pro Asp His Met Lys
65 70 75 80
Gln His Asp Phe Phe Lys Ser Ala Met Pro Glu Gly Tyr Val Gln Glu
85 90 95
Arg Thr Ile Phe Phe Lys Asp Asp Gly Asn Tyr Lys Thr Arg Ala Glu
100 105 110
Val Lys Phe Glu Gly Asp Thr Leu Val Asn Arg Ile Glu Leu Lys Gly
115 120 125
Ile Asp Phe Lys Glu Asp Gly Asn Ile Leu Gly His Lys Leu Glu Tyr
130 135 140
Asn Tyr Asn Ser His Asn Val Tyr Ile Met Ala Asp Lys Gln Lys Asn
145 150 155 160
Gly Ile Lys Val Asn Phe Lys Ile Arg His Asn Ile Glu Asp Gly Ser
165 170 175
Val Gln Leu Ala Asp His Tyr Gln Gln Asn Thr Pro Ile Gly Asp Gly
180 185 190
Pro Val Leu Leu Pro Asp Asn His Tyr Leu Ser Thr Gln Ser Ala Leu
195 200 205
Ser Lys Asp Pro Asn Glu Lys Arg Asp His Met Val Leu Leu Glu Phe
210 215 220
Val Thr Ala Ala Gly Ile Thr Leu Gly Met Asp Glu Leu Tyr Lys
225 230 235
<210> 13
<211> 587
<212> PRT
<213> 人工序列
<220>
<223> 合成的
<400> 13
Met Pro Lys Lys Lys Arg Lys Val Cys Arg Ser His Gln Asn Leu Pro
1 5 10 15
Ala Leu Pro Val Asp Ala Thr Ser Asp Glu Val Arg Lys Asn Leu Met
20 25 30
Asp Met Phe Arg Asp Arg Gln Ala Phe Ser Glu His Thr Trp Lys Met
35 40 45
Leu Leu Ser Val Cys Arg Ser Trp Ala Ala Trp Cys Lys Leu Asn Asn
50 55 60
Arg Lys Trp Phe Pro Ala Glu Pro Glu Asp Val Arg Asp Tyr Leu Leu
65 70 75 80
Tyr Leu Gln Ala Arg Gly Leu Ala Val Lys Thr Ile Gln Gln His Leu
85 90 95
Gly Gln Leu Asn Met Leu His Arg Arg Ser Gly Leu Pro Arg Pro Ser
100 105 110
Asp Ser Asn Ala Val Ser Leu Val Met Arg Arg Ile Arg Lys Glu Asn
115 120 125
Val Asp Ala Gly Glu Arg Ala Lys Gln Ala Leu Ala Phe Glu Arg Thr
130 135 140
Asp Phe Asp Gln Val Arg Ser Leu Met Glu Asn Ser Asp Arg Cys Gln
145 150 155 160
Asp Ile Arg Asn Leu Ala Phe Leu Gly Ile Ala Tyr Asn Thr Leu Leu
165 170 175
Arg Ile Ala Glu Ile Ala Arg Ile Arg Val Lys Asp Ile Ser Arg Thr
180 185 190
Asp Gly Gly Arg Met Leu Ile His Ile Gly Arg Thr Lys Thr Leu Val
195 200 205
Ser Thr Ala Gly Val Glu Lys Ala Leu Ser Leu Gly Val Thr Lys Leu
210 215 220
Val Glu Arg Trp Ile Ser Val Ser Gly Val Ala Asp Asp Pro Asn Asn
225 230 235 240
Tyr Leu Phe Cys Arg Val Arg Lys Asn Gly Val Ala Ala Pro Ser Ala
245 250 255
Thr Ser Gln Leu Ser Thr Arg Ala Leu Glu Gly Ile Phe Glu Ala Thr
260 265 270
His Arg Leu Ile Tyr Gly Ala Lys Asp Asp Ser Gly Gln Arg Tyr Leu
275 280 285
Ala Trp Ser Gly His Ser Ala Arg Val Gly Ala Ala Arg Asp Met Ala
290 295 300
Arg Ala Gly Val Ser Ile Pro Glu Ile Met Gln Ala Gly Gly Trp Thr
305 310 315 320
Asn Val Asn Ile Val Met Asn Tyr Ile Arg Asn Leu Asp Ser Glu Thr
325 330 335
Gly Ala Met Val Arg Leu Leu Glu Asp Gly Asp Val Asn Val Ser Lys
340 345 350
Gly Glu Glu Leu Phe Thr Gly Val Val Pro Ile Leu Val Glu Leu Asp
355 360 365
Gly Asp Val Asn Gly His Lys Phe Ser Val Ser Gly Glu Gly Glu Gly
370 375 380
Asp Ala Thr Tyr Gly Lys Leu Thr Leu Lys Phe Ile Cys Thr Thr Gly
385 390 395 400
Lys Leu Pro Val Pro Trp Pro Thr Leu Val Thr Thr Leu Thr Tyr Gly
405 410 415
Val Gln Cys Phe Ser Arg Tyr Pro Asp His Met Lys Gln His Asp Phe
420 425 430
Phe Lys Ser Ala Met Pro Glu Gly Tyr Val Gln Glu Arg Thr Ile Phe
435 440 445
Phe Lys Asp Asp Gly Asn Tyr Lys Thr Arg Ala Glu Val Lys Phe Glu
450 455 460
Gly Asp Thr Leu Val Asn Arg Ile Glu Leu Lys Gly Ile Asp Phe Lys
465 470 475 480
Glu Asp Gly Asn Ile Leu Gly His Lys Leu Glu Tyr Asn Tyr Asn Ser
485 490 495
His Asn Val Tyr Ile Met Ala Asp Lys Gln Lys Asn Gly Ile Lys Val
500 505 510
Asn Phe Lys Ile Arg His Asn Ile Glu Asp Gly Ser Val Gln Leu Ala
515 520 525
Asp His Tyr Gln Gln Asn Thr Pro Ile Gly Asp Gly Pro Val Leu Leu
530 535 540
Pro Asp Asn His Tyr Leu Ser Thr Gln Ser Ala Leu Ser Lys Asp Pro
545 550 555 560
Asn Glu Lys Arg Asp His Met Val Leu Leu Glu Phe Val Thr Ala Ala
565 570 575
Gly Ile Thr Leu Gly Met Asp Glu Leu Tyr Lys
580 585
<210> 14
<211> 365
<212> PRT
<213> 人工序列
<220>
<223> 合成的
<400> 14
Met Pro Lys Lys Lys Arg Lys Val Cys Arg Ser His Gln Asn Leu Pro
1 5 10 15
Ala Leu Pro Val Asp Ala Thr Ser Asp Glu Val Arg Lys Asn Leu Met
20 25 30
Asp Met Phe Arg Asp Arg Gln Ala Phe Ser Glu His Thr Trp Lys Met
35 40 45
Leu Leu Ser Val Cys Arg Ser Trp Ala Ala Trp Cys Lys Leu Asn Asn
50 55 60
Arg Lys Trp Phe Pro Ala Glu Pro Glu Asp Val Arg Asp Tyr Leu Leu
65 70 75 80
Tyr Leu Gln Ala Arg Gly Leu Ala Val Lys Thr Ile Gln Gln His Leu
85 90 95
Gly Gln Leu Asn Met Leu His Arg Arg Ser Gly Leu Pro Arg Pro Ser
100 105 110
Asp Ser Asn Ala Val Ser Leu Val Met Arg Arg Ile Arg Val Asn Val
115 120 125
Ser Lys Gly Glu Glu Leu Phe Thr Gly Val Val Pro Ile Leu Val Glu
130 135 140
Leu Asp Gly Asp Val Asn Gly His Lys Phe Ser Val Ser Gly Glu Gly
145 150 155 160
Glu Gly Asp Ala Thr Tyr Gly Lys Leu Thr Leu Lys Phe Ile Cys Thr
165 170 175
Thr Gly Lys Leu Pro Val Pro Trp Pro Thr Leu Val Thr Thr Leu Thr
180 185 190
Tyr Gly Val Gln Cys Phe Ser Arg Tyr Pro Asp His Met Lys Gln His
195 200 205
Asp Phe Phe Lys Ser Ala Met Pro Glu Gly Tyr Val Gln Glu Arg Thr
210 215 220
Ile Phe Phe Lys Asp Asp Gly Asn Tyr Lys Thr Arg Ala Glu Val Lys
225 230 235 240
Phe Glu Gly Asp Thr Leu Val Asn Arg Ile Glu Leu Lys Gly Ile Asp
245 250 255
Phe Lys Glu Asp Gly Asn Ile Leu Gly His Lys Leu Glu Tyr Asn Tyr
260 265 270
Asn Ser His Asn Val Tyr Ile Met Ala Asp Lys Gln Lys Asn Gly Ile
275 280 285
Lys Val Asn Phe Lys Ile Arg His Asn Ile Glu Asp Gly Ser Val Gln
290 295 300
Leu Ala Asp His Tyr Gln Gln Asn Thr Pro Ile Gly Asp Gly Pro Val
305 310 315 320
Leu Leu Pro Asp Asn His Tyr Leu Ser Thr Gln Ser Ala Leu Ser Lys
325 330 335
Asp Pro Asn Glu Lys Arg Asp His Met Val Leu Leu Glu Phe Val Thr
340 345 350
Ala Ala Gly Ile Thr Leu Gly Met Asp Glu Leu Tyr Lys
355 360 365
<210> 15
<211> 5193
<212> DNA
<213> 小鼠(Mus musculus)
<400> 15
atggacggcc ccggggccag cgccgtggtc gtgcgcgtcg gcatcccgga cctgcaacaa 60
acgaagtgcc tgcgtctgga cccaaccgcg cccgtgtggg ccgccaagca gcgtgtgctc 120
tgcgccctca atcatagcct tcaagacgcg ctcaactacg ggctattcca gcctccctcc 180
cggggtcgcg ccggcaagtt cctggatgaa gagcggctct tacaggacta cccgcctaac 240
ctggacacgc ccctgcccta tctggagttc cgatacaagc ggagagttta tgcccagaac 300
ctcatagatg acaagcagtt tgcaaagcta cacacaaagg caaacctgaa gaagttcatg 360
gactatgtcc agctacacag cacagataag gtggcccgcc tgctggacaa ggggctggac 420
cccaatttcc atgaccctga ctcaggagag tgccctctga gccttgcggc acagttggac 480
aacgccactg acctcctgaa ggttctccgc aacggcggtg ctcatctgga cttccggacc 540
cgagatgggc tgacagccgt ccactgtgct acccgccagc ggaacgcagg ggcattgacg 600
accctgctgg acctgggggc ttcgcctgac tacaaggaca gccgcggcct gacgcccctg 660
taccatagtg ccctaggggg cggggatgcc ctctgttgcg agctgcttct ccatgatcat 720
gcacagctgg ggaccactga tgagaatggt tggcaagaga tccatcaggc ctgtcgcttt 780
ggacacgtgc agcacctgga gcaccttttg ttctatgggg ccaacatggg tgctcagaat 840
gcctcgggaa acacagccct gcacatctgt gccctctaca accaggagag ttgcgcgcgc 900
gtcctgcttt tccgtggtgc caacaaggac gtccgcaatt acaacagcca gacagccttc 960
caggtggcca ttattgcagg gaactttgag cttgccgagg taatcaagac ccacaaagac 1020
tccgatgtcg taccattcag ggaaaccccc agctatgcaa agcgacggcg tctggctggc 1080
ccgagtggcc tggcatcccc acggccctta cagcgctcag ccagtgatat caacctgaaa 1140
ggtgatcagc ccgcagcttc tccagggccc actctccgaa gcctccctca tcaactcttg 1200
ctccagaggc ttcaggagga gaaagaccgt gacagggatg gtgaactgga gaatgacatc 1260
agcggcccct cagcaggcag gggtggccac aacaagatca gccccagtgg gcccggcgga 1320
tccggccccg cgcccggccc cggcccggcg tctcccgcgc cccccgcgcc gccgccccgg 1380
ggcccgaagc ggaaacttta cagtgccgtc cccggccgca agttcatcgc tgtgaaggcg 1440
cacagcccgc agggcgaggg cgagatcccg ctgcaccgcg gcgaggccgt gaaggtgctc 1500
agcattgggg agggcggttt ctgggaggga accgtgaagg gccgaacagg ctggttccca 1560
gctgactgtg tggaagaagt gcagatgcga cagtatgaca cccggcatga aaccagagag 1620
gaccggacga agcgtctctt ccgccactac actgtgggtt cctatgacag cctcacttca 1680
cacagcgatt atgtcatcga tgataaggtg gctatcctgc agaaaaggga ccatgagggg 1740
tttggctttg ttctccgggg agccaaagca gagaccccca ttgaggagtt tacacccaca 1800
cctgccttcc ctgcactcca ataccttgag tctgtagatg tggaaggtgt ggcctggagg 1860
gctggacttc gaactgggga cttcctcatt gaggtgaacg gagtgaatgt cgtgaaggtt 1920
ggacacaagc aagtggtggg tctcatccgt cagggtggca accgcctggt catgaaggtt 1980
gtgtctgtga ccaggaaacc cgaggaggat ggtgctcggc gcagagcccc accaccccca 2040
aagagggctc ccagcaccac gctgaccctg cggtccaagt ccatgacggc tgagctcgag 2100
gaacttgctt ccattcggag aagaaaaggg gagaagttgg atgagatcct ggcagttgcc 2160
gcggagccga cactgaggcc ggacattgca gatgctgact cgagggcggc cactgtcaag 2220
cagcggccca ccagccggag gatcacccct gctgagatca gctcattgtt tgagcgccag 2280
ggcctcccag gcccagagaa gctgccgggc tctctgcgga aggggattcc acggaccaaa 2340
tctgtagggg aggatgagaa gctggcatcc ctactggaag ggcgcttccc acgcagcacg 2400
tcaatgcagg acacagtgcg tgaaggtcga ggcattccac ccccgccgca gaccgccccg 2460
ccacccccac ccgcgcccta ctacttcgac tccgggccac cccccacctt ctcaccgccg 2520
ccaccaccgg gccgggccta tgacactgtg cgctccagct tcaaaccagg cctggaggct 2580
cgtctgggtg cgggggccgc cggcctgtat gatccgagca cgcctctggg cccgctgccc 2640
taccctgagc gtcagaagcg tgcgcgctcc atgatcatac tgcaggactc tgcgccagaa 2700
gtgggtgatg tcccccggcc tgcgcctgcc gccacaccgc ctgagcgccc caagcgccgg 2760
cctcggccgt caggccctga tagtccctat gccaacctgg gcgccttcag tgccagcctc 2820
ttcgctccgt cgaaaccaca gcgccgcaag agcccgctgg tgaagcagct tcaggtggag 2880
gacgctcagg agcgcgcggc cctggccgtg ggtagcccgg gaccagtggg cggaagcttt 2940
gcacgagaac cctctccgac gcaccgcggg ccccggccag gcagccttga ctacagctct 3000
ggagaaggcc taggccttac cttcggcggc cctagccctg gcccagtcaa ggagcggcgc 3060
ctggaggagc gacgccgttc cactgtgttc ctctctgtgg gtgccatcga gggcagccct 3120
cccagcgcgg atctgccatc cctacaaccc tcccgctcca ttgatgagcg cctcctgggg 3180
acaggcgcca ccactggccg cgatttgcta ctcccctccc ctgtctctgc tctgaagcca 3240
ttggtcggtg gtcccagcct tgggccctca ggctccacct tcatccaccc tctcactggc 3300
aaacccttgg atcctagctc acccttagct cttgctctgg ctgcccggga gcgggctctg 3360
gcctcgcaaa caccttcccg gtcccccaca cctgtgcaca gccccgatgc tgaccgccct 3420
ggacccctct ttgtggatgt gcaaacccga gactctgaga gaggaccgtt ggcttcccca 3480
gccttctccc ctcggagtcc agcgtggatt ccagtgcctg ctcggagaga ggcagagaag 3540
ccccctcggg aagagcggaa gtcaccagag gacaagaagt ccatgatcct cagcgtcttg 3600
gacacgtcct tgcaacggcc agctggcctc attgttgtgc atgccaccag caatgggcag 3660
gagcccagca ggctgggggc tgaagaggag cgccccggta ctccggagct ggccccagcc 3720
cccatgcagg cagcagctgt ggcagagccc atgccaagcc cccgggccca gccccctggc 3780
agcatcccag cagatcccgg gccaggtcaa ggcagctcag aggaggagcc agagctggta 3840
ttcgctgtga acctgccacc tgctcagctg tcctccagcg atgaggagac cagagaggag 3900
ctggcccgca tagggctagt gccaccccct gaagagtttg ccaatgggat cctgctgacc 3960
accccgcccc cagggccggg ccccttgccc accacggtac ccagcccggc ctcagggaag 4020
cccagcagcg agctgccccc tgcccctgag tctgcagctg actctggagt agaggaggct 4080
gacactcgaa gctccagtga cccccacctg gagaccacaa gcaccatttc cacagtgtcc 4140
agcatgtcca ccctgagctc ggagagtggg gaactcacgg acacccacac ctcctttgcc 4200
gatggacaca cttttctact cgagaagcca ccagtgcctc ccaagcccaa gctcaagtcc 4260
ccgctgggga aggggccggt gaccttcagg gacccgctgc tgaagcaatc ctcggacagt 4320
gagctcatgg cccagcagca ccatgctgcc tctactgggt tggcttctgc tgctgggccc 4380
gcccgccctc gctacctctt ccagagaagg tccaagctgt ggggggaccc cgtggagagt 4440
cgggggctcc ctgggcctga agatgacaaa ccaactgtga tcagtgagct cagctcccgt 4500
ctgcagcagc tgaataaaga cacacgctcc ttgggggagg aaccagttgg tggcctgggc 4560
agcctgctgg accctgctaa gaagtcaccc attgcagcag ctcggctctt cagcagcctc 4620
ggtgagctga gcaccatctc agcgcagcgc agcccggggg gcccgggcgg aggggcctcc 4680
tactcggtgc ggcccagcgg ccggtacccc gtggcgagac gagccccgag cccagtgaaa 4740
cccgcatcgc tggagcgggt ggaggggctg ggggcgggcg tgggaggcgc ggggcggccc 4800
ttcggcctca cgcctcccac catcctcaag tcgtccagcc tctccatccc gcacgaaccc 4860
aaggaagtgc gcttcgtggt gcgaagtgtg agtgcgcgca gccgctcccc ctcaccatct 4920
ccgctgccct cgccttctcc cggctctggc cccagtgccg gcccgcgtcg gccatttcaa 4980
cagaagcccc tgcagctctg gagcaagttc gatgtgggcg actggctgga gagcatccac 5040
ttaggcgagc accgagaccg cttcgaggac catgagatcg aaggcgcaca cctgcctgcg 5100
ctcaccaagg aagacttcgt ggagctgggc gtcacacgcg ttggccaccg catgaacatc 5160
gagcgtgcgc tcaggcagct ggatggcagc tga 5193
<210> 16
<211> 5421
<212> DNA
<213> 智人(Homo sapiens)
<400> 16
atgcagctga gccgcgccgc cgccgccgcc gccgccgccc ctgcggagcc cccggagccg 60
ctgtcccccg cgccggcccc ggccccggcc ccccccggcc ccctcccgcg cagcgcggcc 120
gacggggctc cggcgggggg gaaggggggg ccggggcgcc gcgcggagtc cccgggcgct 180
ccgttccccg gcgcgagcgg ccccggcccg ggccccggcg cggggatgga cggccccggg 240
gccagcgccg tggtcgtgcg cgtcggcatc ccggacctgc agcagacgaa gtgcctgcgc 300
ctggacccgg ccgcgcccgt gtgggccgcc aagcagcgcg tgctctgcgc cctcaaccac 360
agcctccagg acgcgctcaa ctatgggctt ttccagccgc cctcccgggg ccgcgccggc 420
aagttcctgg atgaggagcg gctcctgcag gagtacccgc ccaacctgga cacgcccctg 480
ccctacctgg agtttcgata caagcggcga gtttatgccc agaacctcat cgatgataag 540
cagtttgcaa agcttcacac aaaggcgaac ctgaagaagt tcatggacta cgtccagctg 600
catagcacgg acaaggtggc acgcctgttg gacaaggggc tggaccccaa cttccatgac 660
cctgactcag gagagtgccc cctgagcctc gcagcccagc tggacaacgc cacggacctg 720
ctaaaggtgc tgaagaatgg tggtgcccac ctggacttcc gcactcgcga tgggctcact 780
gccgtgcact gtgccacacg ccagcggaat gcggcagcac tgacgaccct gctggacctg 840
ggggcttcac ctgactacaa ggacagccgc ggcttgacac ccctctacca cagcgccctg 900
gggggtgggg atgccctctg ctgtgagctg cttctccacg accacgctca gctggggatc 960
accgacgaga atggctggca ggagatccac caggcctgcc gctttgggca cgtgcagcat 1020
ctggagcacc tgctgttcta tggggcagac atgggggccc agaacgcctc ggggaacaca 1080
gccctgcaca tctgtgccct ctacaaccag gagagctgtg ctcgtgtcct gctcttccgt 1140
ggagctaaca gggatgtccg caactacaac agccagacag ccttccaggt ggccatcatc 1200
gcagggaact ttgagcttgc agaggttatc aagacccaca aagactcgga tgttgtacca 1260
ttcagggaaa cccccagcta tgcgaagcgg cggcgactgg ctggccccag tggcttggca 1320
tcccctcggc ctctgcagcg ctcagccagc gatatcaacc tgaaggggga ggcacagcca 1380
gcagcttctc ctggaccctc gctgagaagc ctcccccacc agctgctgct ccagcggctg 1440
caagaggaga aagatcgtga ccgggatgcc gaccaggaga gcaacatcag tggcccttta 1500
gcaggcaggg ccggccaaag caagatcagc ccgagcgggc ccggcggccc cggccccgcg 1560
cccggccccg gccccgcgcc ccctgcgccc cccgcaccgc cgccccgggg cccgaagcgg 1620
aaactttaca gcgccgtccc cggccgcaag ttcatcgccg tgaaggcgca cagcccgcag 1680
ggtgaaggcg agatcccgct gcaccgcggc gaggccgtga aggtgctcag cattggggag 1740
ggcggtttct gggagggaac cgtgaaaggc cgcacgggct ggttcccggc cgactgcgtg 1800
gaggaagtgc agatgaggca gcatgacaca cggcctgaaa cgcgggagga ccggacgaag 1860
cggctctttc ggcactacac agtgggctcc tacgacagcc tcacctcaca cagcgattat 1920
gtcattgatg acaaagtggc tgtcctgcag aaacgggacc acgagggctt tggttttgtg 1980
ctccggggag ccaaagcaga gacccccatc gaggagttca cgcccacgcc agccttcccg 2040
gcgctgcagt atctcgagtc ggtggacgtg gagggtgtgg cctggagggc cgggctgcgc 2100
acgggagact tcctcatcga ggtgaacggg gtgaacgtgg tgaaggtcgg acacaagcag 2160
gtggtggctc tgattcgcca gggtggcaac cgcctcgtca tgaaggttgt gtctgtgaca 2220
aggaagccag aagaggacgg ggctcggcgc agagccccac cgccccccaa gagggccccc 2280
agcaccacac tgaccctgcg ctccaagtcc atgacagctg agctcgagga acttgcctcc 2340
attcggagaa gaaaagggga gaagctggac gagatgctgg cagccgccgc agagccaacg 2400
ctgcggccag acatcgcaga cgcagactcc agagccgcca ccgtcaaaca gaggcccacc 2460
agtcggagga tcacacccgc cgagattagc tcattgtttg aacgccaggg cctcccaggc 2520
ccagagaagc tgccgggctc cttgcggaag gggattccac ggaccaagtc tgtaggggag 2580
gacgagaagc tggcgtccct gctggaaggg cgcttcccgc ggagcacctc gatgcaagac 2640
ccggtgcgcg agggtcgcgg catcccgccc ccgccgcaga ccgcgccgcc tcccccgccc 2700
gcgccctact acttcgactc ggggccgccc ccggccttct cgccgccgcc cccgccgggc 2760
cgcgcctacg acacggtgcg ctccagcttc aagcccggcc tggaggcgcg cctgggcgcg 2820
ggcgctgccg gcctgtacga gccgggcgcg gccctcggcc cgctgccgta tcccgagcgg 2880
cagaagcgcg cgcgctccat gatcatcctg caggactcgg cgcccgagtc gggcgacgcc 2940
cctcgacccc cgcccgcggc caccccgccc gagcgaccca agcgccggcc gcggccgccc 3000
ggccccgaca gcccctacgc caacctgggc gccttcagcg ccagcctctt cgctccgtcc 3060
aagccgcagc gccgcaagag ccccctggtg aagcagctgc aggtggagga cgcgcaggag 3120
cgcgcggccc tggccgtggg cagccccggt cccggcggcg gcagcttcgc ccgcgagccc 3180
tccccgaccc accgcggtcc gcgcccgggt ggcctcgact acggcgcggg cgatggcccg 3240
gggctcgcgt tcggcggccc gggcccggcc aaggaccggc ggctggagga gcggcgccgc 3300
tccactgtgt tcctgtccgt gggggccatc gagggcagcg cccccggcgc ggatctgcca 3360
tccctacagc cctcccgctc catcgacgag cgcctcctgg ggaccggccc caccgccggc 3420
cgcgacctgc tgctgccctc cccggtgtct gccctgaagc cgttggtcag cggcccgagc 3480
ctggggccct cgggttccac cttcatccac ccactcaccg gcaaacccct ggaccccagc 3540
tcacccctgg cccttgccct ggctgcccga gagcgagctc tggcctccca ggcgccctcc 3600
cggtccccca cacccgtgca cagtcccgac gccgaccgcc ccggacccct gtttgtggat 3660
gtacaggccc gggacccaga gcgagggtcc ctggcttccc cggctttctc cccacggagc 3720
ccagcctgga ttcctgtgcc tgctcgcagg gaggcagaga aggtcccccg ggaggagcgg 3780
aagtcacccg aggacaagaa gtccatgatc ctcagcgtcc tggacacatc cctgcagcgg 3840
ccagctggcc tcatcgttgt gcacgccacc agcaacgggc aggagcccag caggctgggg 3900
ggggccgaag aggagcgccc gggcaccccg gagttggccc cggcccccat gcagtcagcg 3960
gctgtggcag agcccctgcc cagcccccgg gcccagcccc ctggtggcac cccggcagac 4020
gccgggccag gccagggcag ctcagaggaa gagccagagc tggtgtttgc tgtgaacctg 4080
ccacctgccc agctgtcgtc cagcgatgag gagaccaggg aggagctggc ccgaattggg 4140
ttggtgccac cccctgaaga gtttgccaac ggggtcctgc tggccacccc actcgctggc 4200
ccgggcccct cgcccaccac ggtgcccagc ccggcctcag ggaagcccag cagtgagcca 4260
ccccctgccc ctgagtctgc agccgactct ggggtggagg aggctgacac acgcagctcc 4320
agcgaccccc acctggagac cacaagcacc atctccacgg tgtccagcat gtccaccttg 4380
agctcggaga gcggggaact cactgacacc cacacctcct tcgctgacgg acacactttt 4440
ctactcgaga agccaccagt gcctcccaag cccaagctca agtccccgct ggggaagggg 4500
ccggtgacct tcagggaccc gctgctgaag cagtcctcgg acagcgagct catggcccag 4560
cagcaccacg ccgcctctgc cgggctggcc tctgccgccg ggcctgcccg ccctcgctac 4620
ctcttccaga gaaggtccaa gctatggggg gaccccgtgg agagccgggg gctccctggg 4680
cctgaagacg acaaaccaac tgtgatcagt gagctcagct cccgcctgca gcagctgaac 4740
aaggacacgc gttccctggg ggaggaacca gttggtggcc tgggcagcct gctggaccct 4800
gccaagaagt cgcccatcgc agcagctcgg ctcttcagca gcctcggtga gctgagctcc 4860
atttcagcgc agcgcagccc cgggggcccg ggcggcgggg cctcgtactc ggtgaggccc 4920
agtggccgct accccgtggc gagacgcgcc ccgagcccgg tgaagcccgc gtcgctggag 4980
cgggtggagg ggctgggggc gggcgcgggg ggcgcagggc ggcccttcgg cctcacgccc 5040
cccaccatcc tcaagtcgtc cagcctctcc atcccgcacg agcccaagga ggtgcgcttc 5100
gtggtgcgca gcgtgagcgc gcgcagtcgc tccccctcgc cgtcgccgct gccctcgccc 5160
gcgtccggcc ccggccccgg cgcccccggc ccacgccgac ccttccagca gaagccgctg 5220
cagctctgga gcaagttcga cgtgggcgac tggctggaga gcatccacct aggcgagcac 5280
cgcgaccgct tcgaggacca tgagatagaa ggcgcgcacc tacccgcgct taccaaggac 5340
gacttcgtgg agctgggcgt cacgcgcgtg ggccaccgca tgaacatcga gcgcgcgctc 5400
aggcagctgg acggcagctg a 5421
<210> 17
<211> 706
<212> PRT
<213> 人工序列
<220>
<223> 合成的
<400> 17
Met Gly Pro Lys Arg Lys Leu Tyr Ser Ala Val Pro Gly Arg Lys Phe
1 5 10 15
Ile Ala Val Lys Ala His Ser Pro Gln Gly Glu Gly Glu Ile Pro Leu
20 25 30
His Arg Gly Glu Ala Val Lys Val Leu Ser Ile Gly Glu Gly Gly Phe
35 40 45
Trp Glu Gly Thr Val Lys Gly Arg Thr Gly Trp Phe Pro Ala Asp Cys
50 55 60
Val Glu Glu Val Gln Met Arg Gln Tyr Asp Thr Arg His Glu Thr Arg
65 70 75 80
Glu Asp Arg Thr Lys Arg Leu Phe Arg His Tyr Thr Val Gly Ser Tyr
85 90 95
Asp Ser Leu Thr Ser His Ser Asp Tyr Val Ile Asp Asp Lys Val Ala
100 105 110
Ile Leu Gln Lys Arg Asp His Glu Gly Phe Gly Phe Val Leu Arg Gly
115 120 125
Ala Lys Ala Glu Thr Pro Ile Glu Glu Phe Thr Pro Thr Pro Ala Phe
130 135 140
Pro Ala Leu Gln Tyr Leu Glu Ser Val Asp Val Glu Gly Val Ala Trp
145 150 155 160
Arg Ala Gly Leu Arg Thr Gly Asp Phe Leu Ile Glu Val Asn Gly Val
165 170 175
Asn Val Val Lys Val Gly His Lys Gln Val Val Gly Leu Ile Arg Gln
180 185 190
Gly Gly Asn Arg Leu Val Met Lys Val Val Ser Val Thr Arg Lys Pro
195 200 205
Glu Glu Asp Gly Ala Arg Arg Arg Ala Pro Pro Pro Pro Lys Arg Ala
210 215 220
Pro Ser Thr Thr Leu Thr Leu Arg Ser Lys Ser Met Thr Ala Glu Leu
225 230 235 240
Glu Glu Leu Ala Ser Ile Arg Ser Ser Glu Glu Glu Pro Glu Leu Val
245 250 255
Phe Ala Val Asn Leu Pro Pro Ala Gln Leu Ser Ser Ser Asp Glu Glu
260 265 270
Thr Arg Glu Glu Leu Ala Arg Ile Gly Leu Val Pro Pro Pro Glu Glu
275 280 285
Phe Ala Asn Gly Ile Leu Leu Thr Thr Pro Pro Pro Gly Pro Gly Pro
290 295 300
Leu Pro Thr Thr Val Pro Ser Pro Ala Ser Gly Lys Pro Ser Ser Glu
305 310 315 320
Leu Pro Pro Ala Pro Glu Ser Ala Ala Asp Ser Gly Val Glu Glu Ala
325 330 335
Asp Thr Arg Ser Ser Ser Asp Pro His Leu Glu Thr Thr Ser Thr Ile
340 345 350
Ser Thr Val Ser Ser Met Ser Thr Leu Ser Ser Glu Ser Gly Glu Leu
355 360 365
Thr Asp Thr His Thr Ser Phe Ala Asp Gly His Thr Phe Leu Leu Glu
370 375 380
Lys Pro Pro Val Pro Pro Lys Pro Lys Leu Lys Ser Pro Leu Gly Lys
385 390 395 400
Gly Pro Val Thr Phe Arg Asp Pro Leu Leu Lys Gln Ser Ser Asp Ser
405 410 415
Glu Leu Met Ala Gln Gln His His Ala Ala Ser Thr Gly Leu Ala Ser
420 425 430
Ala Ala Gly Pro Ala Arg Pro Arg Tyr Leu Phe Gln Arg Arg Ser Lys
435 440 445
Leu Trp Gly Asp Pro Val Glu Ser Arg Gly Leu Pro Gly Pro Glu Asp
450 455 460
Asp Lys Pro Thr Val Ile Ser Glu Leu Ser Ser Arg Leu Gln Gln Leu
465 470 475 480
Asn Lys Asp Thr Arg Ser Leu Gly Glu Glu Pro Val Gly Gly Leu Gly
485 490 495
Ser Leu Leu Asp Pro Ala Lys Lys Ser Pro Ile Ala Ala Ala Arg Leu
500 505 510
Phe Ser Ser Leu Gly Glu Leu Ser Thr Ile Ser Ala Gln Arg Ser Pro
515 520 525
Gly Gly Pro Gly Gly Gly Ala Ser Tyr Ser Val Arg Pro Ser Gly Arg
530 535 540
Tyr Pro Val Ala Arg Arg Ala Pro Ser Pro Val Lys Pro Ala Ser Leu
545 550 555 560
Glu Arg Val Glu Gly Leu Gly Ala Gly Val Gly Gly Ala Gly Arg Pro
565 570 575
Phe Gly Leu Thr Pro Pro Thr Ile Leu Lys Ser Ser Ser Leu Ser Ile
580 585 590
Pro His Glu Pro Lys Glu Val Arg Phe Val Val Arg Ser Val Ser Ala
595 600 605
Arg Ser Arg Ser Pro Ser Pro Ser Pro Leu Pro Ser Pro Ser Pro Gly
610 615 620
Ser Gly Pro Ser Ala Gly Pro Arg Arg Pro Phe Gln Gln Lys Pro Leu
625 630 635 640
Gln Leu Trp Ser Lys Phe Asp Val Gly Asp Trp Leu Glu Ser Ile His
645 650 655
Leu Gly Glu His Arg Asp Arg Phe Glu Asp His Glu Ile Glu Gly Ala
660 665 670
His Leu Pro Ala Leu Thr Lys Glu Asp Phe Val Glu Leu Gly Val Thr
675 680 685
Arg Val Gly His Arg Met Asn Ile Glu Arg Ala Leu Arg Gln Leu Asp
690 695 700
Gly Ser
705
<210> 18
<211> 707
<212> PRT
<213> 人工序列
<220>
<223> 合成的
<400> 18
Met Gly Pro Lys Arg Lys Leu Tyr Ser Ala Val Pro Gly Arg Lys Phe
1 5 10 15
Ile Ala Val Lys Ala His Ser Pro Gln Gly Glu Gly Glu Ile Pro Leu
20 25 30
His Arg Gly Glu Ala Val Lys Val Leu Ser Ile Gly Glu Gly Gly Phe
35 40 45
Trp Glu Gly Thr Val Lys Gly Arg Thr Gly Trp Phe Pro Ala Asp Cys
50 55 60
Val Glu Glu Val Gln Met Arg Gln His Asp Thr Arg Pro Glu Thr Arg
65 70 75 80
Glu Asp Arg Thr Lys Arg Leu Phe Arg His Tyr Thr Val Gly Ser Tyr
85 90 95
Asp Ser Leu Thr Ser His Ser Asp Tyr Val Ile Asp Asp Lys Val Ala
100 105 110
Val Leu Gln Lys Arg Asp His Glu Gly Phe Gly Phe Val Leu Arg Gly
115 120 125
Ala Lys Ala Glu Thr Pro Ile Glu Glu Phe Thr Pro Thr Pro Ala Phe
130 135 140
Pro Ala Leu Gln Tyr Leu Glu Ser Val Asp Val Glu Gly Val Ala Trp
145 150 155 160
Arg Ala Gly Leu Arg Thr Gly Asp Phe Leu Ile Glu Val Asn Gly Val
165 170 175
Asn Val Val Lys Val Gly His Lys Gln Val Val Ala Leu Ile Arg Gln
180 185 190
Gly Gly Asn Arg Leu Val Met Lys Val Val Ser Val Thr Arg Lys Pro
195 200 205
Glu Glu Asp Gly Ala Arg Arg Arg Ala Pro Pro Pro Pro Lys Arg Ala
210 215 220
Pro Ser Thr Thr Leu Thr Leu Arg Ser Lys Ser Met Thr Ala Glu Leu
225 230 235 240
Glu Glu Leu Ala Ser Ile Arg Ser Ser Glu Glu Glu Pro Glu Leu Val
245 250 255
Phe Ala Val Asn Leu Pro Pro Ala Gln Leu Ser Ser Ser Asp Glu Glu
260 265 270
Thr Arg Glu Glu Leu Ala Arg Ile Gly Leu Val Pro Pro Pro Glu Glu
275 280 285
Phe Ala Asn Gly Val Leu Leu Ala Thr Pro Leu Ala Gly Pro Gly Pro
290 295 300
Ser Pro Thr Thr Val Pro Ser Pro Ala Ser Gly Lys Pro Ser Ser Glu
305 310 315 320
Pro Pro Pro Ala Pro Glu Ser Ala Ala Asp Ser Gly Val Glu Glu Ala
325 330 335
Asp Thr Arg Ser Ser Ser Asp Pro His Leu Glu Thr Thr Ser Thr Ile
340 345 350
Ser Thr Val Ser Ser Met Ser Thr Leu Ser Ser Glu Ser Gly Glu Leu
355 360 365
Thr Asp Thr His Thr Ser Phe Ala Asp Gly His Thr Phe Leu Leu Glu
370 375 380
Lys Pro Pro Val Pro Pro Lys Pro Lys Leu Lys Ser Pro Leu Gly Lys
385 390 395 400
Gly Pro Val Thr Phe Arg Asp Pro Leu Leu Lys Gln Ser Ser Asp Ser
405 410 415
Glu Leu Met Ala Gln Gln His His Ala Ala Ser Ala Gly Leu Ala Ser
420 425 430
Ala Ala Gly Pro Ala Arg Pro Arg Tyr Leu Phe Gln Arg Arg Ser Lys
435 440 445
Leu Trp Gly Asp Pro Val Glu Ser Arg Gly Leu Pro Gly Pro Glu Asp
450 455 460
Asp Lys Pro Thr Val Ile Ser Glu Leu Ser Ser Arg Leu Gln Gln Leu
465 470 475 480
Asn Lys Asp Thr Arg Ser Leu Gly Glu Glu Pro Val Gly Gly Leu Gly
485 490 495
Ser Leu Leu Asp Pro Ala Lys Lys Ser Pro Ile Ala Ala Ala Arg Leu
500 505 510
Phe Ser Ser Leu Gly Glu Leu Ser Ser Ile Ser Ala Gln Arg Ser Pro
515 520 525
Gly Gly Pro Gly Gly Gly Ala Ser Tyr Ser Val Arg Pro Ser Gly Arg
530 535 540
Tyr Pro Val Ala Arg Arg Ala Pro Ser Pro Val Lys Pro Ala Ser Leu
545 550 555 560
Glu Arg Val Glu Gly Leu Gly Ala Gly Ala Gly Gly Ala Gly Arg Pro
565 570 575
Phe Gly Leu Thr Pro Pro Thr Ile Leu Lys Ser Ser Ser Leu Ser Ile
580 585 590
Pro His Glu Pro Lys Glu Val Arg Phe Val Val Arg Ser Val Ser Ala
595 600 605
Arg Ser Arg Ser Pro Ser Pro Ser Pro Leu Pro Ser Pro Ala Ser Gly
610 615 620
Pro Gly Pro Gly Ala Pro Gly Pro Arg Arg Pro Phe Gln Gln Lys Pro
625 630 635 640
Leu Gln Leu Trp Ser Lys Phe Asp Val Gly Asp Trp Leu Glu Ser Ile
645 650 655
His Leu Gly Glu His Arg Asp Arg Phe Glu Asp His Glu Ile Glu Gly
660 665 670
Ala His Leu Pro Ala Leu Thr Lys Asp Asp Phe Val Glu Leu Gly Val
675 680 685
Thr Arg Val Gly His Arg Met Asn Ile Glu Arg Ala Leu Arg Gln Leu
690 695 700
Asp Gly Ser
705
<210> 19
<211> 1091
<212> PRT
<213> 人工序列
<220>
<223> 合成的
<400> 19
Met Asp Gly Pro Gly Ala Ser Ala Val Val Val Arg Val Gly Ile Pro
1 5 10 15
Asp Leu Gln Gln Thr Lys Cys Leu Arg Leu Asp Pro Thr Ala Pro Val
20 25 30
Trp Ala Ala Lys Gln Arg Val Leu Cys Ala Leu Asn His Ser Leu Gln
35 40 45
Asp Ala Leu Asn Tyr Gly Leu Phe Gln Pro Pro Ser Arg Gly Arg Ala
50 55 60
Gly Lys Phe Leu Asp Glu Glu Arg Leu Leu Gln Asp Tyr Pro Pro Asn
65 70 75 80
Leu Asp Thr Pro Leu Pro Tyr Leu Glu Phe Arg Tyr Lys Arg Arg Val
85 90 95
Tyr Ala Gln Asn Leu Ile Asp Asp Lys Gln Phe Ala Lys Leu His Thr
100 105 110
Lys Ala Asn Leu Lys Lys Phe Met Asp Tyr Val Gln Leu His Ser Thr
115 120 125
Asp Lys Val Ala Arg Leu Leu Asp Lys Gly Leu Asp Pro Asn Phe His
130 135 140
Asp Pro Asp Ser Gly Glu Cys Pro Leu Ser Leu Ala Ala Gln Leu Asp
145 150 155 160
Asn Ala Thr Asp Leu Leu Lys Val Leu Arg Asn Gly Gly Ala His Leu
165 170 175
Asp Phe Arg Thr Arg Asp Gly Leu Thr Ala Val His Cys Ala Thr Arg
180 185 190
Gln Arg Asn Ala Gly Ala Leu Thr Thr Leu Leu Asp Leu Gly Ala Ser
195 200 205
Pro Asp Tyr Lys Asp Ser Arg Gly Leu Thr Pro Leu Tyr His Ser Ala
210 215 220
Leu Gly Gly Gly Asp Ala Leu Cys Cys Glu Leu Leu Leu His Asp His
225 230 235 240
Ala Gln Leu Gly Thr Thr Asp Glu Asn Gly Trp Gln Glu Ile His Gln
245 250 255
Ala Cys Arg Phe Gly His Val Gln His Leu Glu His Leu Leu Phe Tyr
260 265 270
Gly Ala Asn Met Gly Ala Gln Asn Ala Ser Gly Asn Thr Ala Leu His
275 280 285
Ile Cys Ala Leu Tyr Asn Gln Glu Ser Cys Ala Arg Val Leu Leu Phe
290 295 300
Arg Gly Ala Asn Lys Asp Val Arg Asn Tyr Asn Ser Gln Thr Ala Phe
305 310 315 320
Gln Val Ala Ile Ile Ala Gly Asn Phe Glu Leu Ala Glu Val Ile Lys
325 330 335
Thr His Lys Asp Ser Asp Val Val Pro Phe Arg Glu Thr Pro Ser Tyr
340 345 350
Ala Lys Arg Arg Arg Leu Ala Gly Pro Ser Gly Leu Ala Ser Pro Arg
355 360 365
Pro Leu Gln Arg Ser Ala Ser Asp Ile Asn Leu Lys Gly Ala Pro Pro
370 375 380
Pro Arg Gly Pro Lys Arg Lys Leu Tyr Ser Ala Val Pro Gly Arg Lys
385 390 395 400
Phe Ile Ala Val Lys Ala His Ser Pro Gln Gly Glu Gly Glu Ile Pro
405 410 415
Leu His Arg Gly Glu Ala Val Lys Val Leu Ser Ile Gly Glu Gly Gly
420 425 430
Phe Trp Glu Gly Thr Val Lys Gly Arg Thr Gly Trp Phe Pro Ala Asp
435 440 445
Cys Val Glu Glu Val Gln Met Arg Gln Tyr Asp Thr Arg His Glu Thr
450 455 460
Arg Glu Asp Arg Thr Lys Arg Leu Phe Arg His Tyr Thr Val Gly Ser
465 470 475 480
Tyr Asp Ser Leu Thr Ser His Ser Asp Tyr Val Ile Asp Asp Lys Val
485 490 495
Ala Ile Leu Gln Lys Arg Asp His Glu Gly Phe Gly Phe Val Leu Arg
500 505 510
Gly Ala Lys Ala Glu Thr Pro Ile Glu Glu Phe Thr Pro Thr Pro Ala
515 520 525
Phe Pro Ala Leu Gln Tyr Leu Glu Ser Val Asp Val Glu Gly Val Ala
530 535 540
Trp Arg Ala Gly Leu Arg Thr Gly Asp Phe Leu Ile Glu Val Asn Gly
545 550 555 560
Val Asn Val Val Lys Val Gly His Lys Gln Val Val Gly Leu Ile Arg
565 570 575
Gln Gly Gly Asn Arg Leu Val Met Lys Val Val Ser Val Thr Arg Lys
580 585 590
Pro Glu Glu Asp Gly Ala Arg Arg Arg Ala Pro Pro Pro Pro Lys Arg
595 600 605
Ala Pro Ser Thr Thr Leu Thr Leu Arg Ser Lys Ser Met Thr Ala Glu
610 615 620
Leu Glu Glu Leu Ala Ser Ile Arg Ser Ser Glu Glu Glu Pro Glu Leu
625 630 635 640
Val Phe Ala Val Asn Leu Pro Pro Ala Gln Leu Ser Ser Ser Asp Glu
645 650 655
Glu Thr Arg Glu Glu Leu Ala Arg Ile Gly Leu Val Pro Pro Pro Glu
660 665 670
Glu Phe Ala Asn Gly Ile Leu Leu Thr Thr Pro Pro Pro Gly Pro Gly
675 680 685
Pro Leu Pro Thr Thr Val Pro Ser Pro Ala Ser Gly Lys Pro Ser Ser
690 695 700
Glu Leu Pro Pro Ala Pro Glu Ser Ala Ala Asp Ser Gly Val Glu Glu
705 710 715 720
Ala Asp Thr Arg Ser Ser Ser Asp Pro His Leu Glu Thr Thr Ser Thr
725 730 735
Ile Ser Thr Val Ser Ser Met Ser Thr Leu Ser Ser Glu Ser Gly Glu
740 745 750
Leu Thr Asp Thr His Thr Ser Phe Ala Asp Gly His Thr Phe Leu Leu
755 760 765
Glu Lys Pro Pro Val Pro Pro Lys Pro Lys Leu Lys Ser Pro Leu Gly
770 775 780
Lys Gly Pro Val Thr Phe Arg Asp Pro Leu Leu Lys Gln Ser Ser Asp
785 790 795 800
Ser Glu Leu Met Ala Gln Gln His His Ala Ala Ser Thr Gly Leu Ala
805 810 815
Ser Ala Ala Gly Pro Ala Arg Pro Arg Tyr Leu Phe Gln Arg Arg Ser
820 825 830
Lys Leu Trp Gly Asp Pro Val Glu Ser Arg Gly Leu Pro Gly Pro Glu
835 840 845
Asp Asp Lys Pro Thr Val Ile Ser Glu Leu Ser Ser Arg Leu Gln Gln
850 855 860
Leu Asn Lys Asp Thr Arg Ser Leu Gly Glu Glu Pro Val Gly Gly Leu
865 870 875 880
Gly Ser Leu Leu Asp Pro Ala Lys Lys Ser Pro Ile Ala Ala Ala Arg
885 890 895
Leu Phe Ser Ser Leu Gly Glu Leu Ser Thr Ile Ser Ala Gln Arg Ser
900 905 910
Pro Gly Gly Pro Gly Gly Gly Ala Ser Tyr Ser Val Arg Pro Ser Gly
915 920 925
Arg Tyr Pro Val Ala Arg Arg Ala Pro Ser Pro Val Lys Pro Ala Ser
930 935 940
Leu Glu Arg Val Glu Gly Leu Gly Ala Gly Val Gly Gly Ala Gly Arg
945 950 955 960
Pro Phe Gly Leu Thr Pro Pro Thr Ile Leu Lys Ser Ser Ser Leu Ser
965 970 975
Ile Pro His Glu Pro Lys Glu Val Arg Phe Val Val Arg Ser Val Ser
980 985 990
Ala Arg Ser Arg Ser Pro Ser Pro Ser Pro Leu Pro Ser Pro Ser Pro
995 1000 1005
Gly Ser Gly Pro Ser Ala Gly Pro Arg Arg Pro Phe Gln Gln Lys
1010 1015 1020
Pro Leu Gln Leu Trp Ser Lys Phe Asp Val Gly Asp Trp Leu Glu
1025 1030 1035
Ser Ile His Leu Gly Glu His Arg Asp Arg Phe Glu Asp His Glu
1040 1045 1050
Ile Glu Gly Ala His Leu Pro Ala Leu Thr Lys Glu Asp Phe Val
1055 1060 1065
Glu Leu Gly Val Thr Arg Val Gly His Arg Met Asn Ile Glu Arg
1070 1075 1080
Ala Leu Arg Gln Leu Asp Gly Ser
1085 1090
<210> 20
<211> 1092
<212> PRT
<213> 人工序列
<220>
<223> 合成的
<400> 20
Met Asp Gly Pro Gly Ala Ser Ala Val Val Val Arg Val Gly Ile Pro
1 5 10 15
Asp Leu Gln Gln Thr Lys Cys Leu Arg Leu Asp Pro Ala Ala Pro Val
20 25 30
Trp Ala Ala Lys Gln Arg Val Leu Cys Ala Leu Asn His Ser Leu Gln
35 40 45
Asp Ala Leu Asn Tyr Gly Leu Phe Gln Pro Pro Ser Arg Gly Arg Ala
50 55 60
Gly Lys Phe Leu Asp Glu Glu Arg Leu Leu Gln Glu Tyr Pro Pro Asn
65 70 75 80
Leu Asp Thr Pro Leu Pro Tyr Leu Glu Phe Arg Tyr Lys Arg Arg Val
85 90 95
Tyr Ala Gln Asn Leu Ile Asp Asp Lys Gln Phe Ala Lys Leu His Thr
100 105 110
Lys Ala Asn Leu Lys Lys Phe Met Asp Tyr Val Gln Leu His Ser Thr
115 120 125
Asp Lys Val Ala Arg Leu Leu Asp Lys Gly Leu Asp Pro Asn Phe His
130 135 140
Asp Pro Asp Ser Gly Glu Cys Pro Leu Ser Leu Ala Ala Gln Leu Asp
145 150 155 160
Asn Ala Thr Asp Leu Leu Lys Val Leu Lys Asn Gly Gly Ala His Leu
165 170 175
Asp Phe Arg Thr Arg Asp Gly Leu Thr Ala Val His Cys Ala Thr Arg
180 185 190
Gln Arg Asn Ala Ala Ala Leu Thr Thr Leu Leu Asp Leu Gly Ala Ser
195 200 205
Pro Asp Tyr Lys Asp Ser Arg Gly Leu Thr Pro Leu Tyr His Ser Ala
210 215 220
Leu Gly Gly Gly Asp Ala Leu Cys Cys Glu Leu Leu Leu His Asp His
225 230 235 240
Ala Gln Leu Gly Ile Thr Asp Glu Asn Gly Trp Gln Glu Ile His Gln
245 250 255
Ala Cys Arg Phe Gly His Val Gln His Leu Glu His Leu Leu Phe Tyr
260 265 270
Gly Ala Asp Met Gly Ala Gln Asn Ala Ser Gly Asn Thr Ala Leu His
275 280 285
Ile Cys Ala Leu Tyr Asn Gln Glu Ser Cys Ala Arg Val Leu Leu Phe
290 295 300
Arg Gly Ala Asn Arg Asp Val Arg Asn Tyr Asn Ser Gln Thr Ala Phe
305 310 315 320
Gln Val Ala Ile Ile Ala Gly Asn Phe Glu Leu Ala Glu Val Ile Lys
325 330 335
Thr His Lys Asp Ser Asp Val Val Pro Phe Arg Glu Thr Pro Ser Tyr
340 345 350
Ala Lys Arg Arg Arg Leu Ala Gly Pro Ser Gly Leu Ala Ser Pro Arg
355 360 365
Pro Leu Gln Arg Ser Ala Ser Asp Ile Asn Leu Lys Gly Ala Pro Pro
370 375 380
Pro Arg Gly Pro Lys Arg Lys Leu Tyr Ser Ala Val Pro Gly Arg Lys
385 390 395 400
Phe Ile Ala Val Lys Ala His Ser Pro Gln Gly Glu Gly Glu Ile Pro
405 410 415
Leu His Arg Gly Glu Ala Val Lys Val Leu Ser Ile Gly Glu Gly Gly
420 425 430
Phe Trp Glu Gly Thr Val Lys Gly Arg Thr Gly Trp Phe Pro Ala Asp
435 440 445
Cys Val Glu Glu Val Gln Met Arg Gln His Asp Thr Arg Pro Glu Thr
450 455 460
Arg Glu Asp Arg Thr Lys Arg Leu Phe Arg His Tyr Thr Val Gly Ser
465 470 475 480
Tyr Asp Ser Leu Thr Ser His Ser Asp Tyr Val Ile Asp Asp Lys Val
485 490 495
Ala Val Leu Gln Lys Arg Asp His Glu Gly Phe Gly Phe Val Leu Arg
500 505 510
Gly Ala Lys Ala Glu Thr Pro Ile Glu Glu Phe Thr Pro Thr Pro Ala
515 520 525
Phe Pro Ala Leu Gln Tyr Leu Glu Ser Val Asp Val Glu Gly Val Ala
530 535 540
Trp Arg Ala Gly Leu Arg Thr Gly Asp Phe Leu Ile Glu Val Asn Gly
545 550 555 560
Val Asn Val Val Lys Val Gly His Lys Gln Val Val Ala Leu Ile Arg
565 570 575
Gln Gly Gly Asn Arg Leu Val Met Lys Val Val Ser Val Thr Arg Lys
580 585 590
Pro Glu Glu Asp Gly Ala Arg Arg Arg Ala Pro Pro Pro Pro Lys Arg
595 600 605
Ala Pro Ser Thr Thr Leu Thr Leu Arg Ser Lys Ser Met Thr Ala Glu
610 615 620
Leu Glu Glu Leu Ala Ser Ile Arg Ser Ser Glu Glu Glu Pro Glu Leu
625 630 635 640
Val Phe Ala Val Asn Leu Pro Pro Ala Gln Leu Ser Ser Ser Asp Glu
645 650 655
Glu Thr Arg Glu Glu Leu Ala Arg Ile Gly Leu Val Pro Pro Pro Glu
660 665 670
Glu Phe Ala Asn Gly Val Leu Leu Ala Thr Pro Leu Ala Gly Pro Gly
675 680 685
Pro Ser Pro Thr Thr Val Pro Ser Pro Ala Ser Gly Lys Pro Ser Ser
690 695 700
Glu Pro Pro Pro Ala Pro Glu Ser Ala Ala Asp Ser Gly Val Glu Glu
705 710 715 720
Ala Asp Thr Arg Ser Ser Ser Asp Pro His Leu Glu Thr Thr Ser Thr
725 730 735
Ile Ser Thr Val Ser Ser Met Ser Thr Leu Ser Ser Glu Ser Gly Glu
740 745 750
Leu Thr Asp Thr His Thr Ser Phe Ala Asp Gly His Thr Phe Leu Leu
755 760 765
Glu Lys Pro Pro Val Pro Pro Lys Pro Lys Leu Lys Ser Pro Leu Gly
770 775 780
Lys Gly Pro Val Thr Phe Arg Asp Pro Leu Leu Lys Gln Ser Ser Asp
785 790 795 800
Ser Glu Leu Met Ala Gln Gln His His Ala Ala Ser Ala Gly Leu Ala
805 810 815
Ser Ala Ala Gly Pro Ala Arg Pro Arg Tyr Leu Phe Gln Arg Arg Ser
820 825 830
Lys Leu Trp Gly Asp Pro Val Glu Ser Arg Gly Leu Pro Gly Pro Glu
835 840 845
Asp Asp Lys Pro Thr Val Ile Ser Glu Leu Ser Ser Arg Leu Gln Gln
850 855 860
Leu Asn Lys Asp Thr Arg Ser Leu Gly Glu Glu Pro Val Gly Gly Leu
865 870 875 880
Gly Ser Leu Leu Asp Pro Ala Lys Lys Ser Pro Ile Ala Ala Ala Arg
885 890 895
Leu Phe Ser Ser Leu Gly Glu Leu Ser Ser Ile Ser Ala Gln Arg Ser
900 905 910
Pro Gly Gly Pro Gly Gly Gly Ala Ser Tyr Ser Val Arg Pro Ser Gly
915 920 925
Arg Tyr Pro Val Ala Arg Arg Ala Pro Ser Pro Val Lys Pro Ala Ser
930 935 940
Leu Glu Arg Val Glu Gly Leu Gly Ala Gly Ala Gly Gly Ala Gly Arg
945 950 955 960
Pro Phe Gly Leu Thr Pro Pro Thr Ile Leu Lys Ser Ser Ser Leu Ser
965 970 975
Ile Pro His Glu Pro Lys Glu Val Arg Phe Val Val Arg Ser Val Ser
980 985 990
Ala Arg Ser Arg Ser Pro Ser Pro Ser Pro Leu Pro Ser Pro Ala Ser
995 1000 1005
Gly Pro Gly Pro Gly Ala Pro Gly Pro Arg Arg Pro Phe Gln Gln
1010 1015 1020
Lys Pro Leu Gln Leu Trp Ser Lys Phe Asp Val Gly Asp Trp Leu
1025 1030 1035
Glu Ser Ile His Leu Gly Glu His Arg Asp Arg Phe Glu Asp His
1040 1045 1050
Glu Ile Glu Gly Ala His Leu Pro Ala Leu Thr Lys Asp Asp Phe
1055 1060 1065
Val Glu Leu Gly Val Thr Arg Val Gly His Arg Met Asn Ile Glu
1070 1075 1080
Arg Ala Leu Arg Gln Leu Asp Gly Ser
1085 1090
<210> 21
<211> 6701
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 21
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60
gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120
actccatcac taggggttcc tgcggccgca cgcgtttaat taagtgtcta gactgcagag 180
ggccctgcgt atgagtgcaa gtgggtttta ggaccaggat gaggcggggt gggggtgcct 240
acctgacgac cgaccccgac ccactggaca agcacccaac ccccattccc caaattgcgc 300
atcccctatc agagaggggg aggggaaaca ggatgcggcg aggcgcgtgc gcactgccag 360
cttcagcacc gcggacagtg ccttcgcccc cgcctggcgg cgcgcgccac cgccgcctca 420
gcactgaagg cgcgctgacg tcactcgccg gtcccccgca aactcccctt cccggccacc 480
ttggtcgcgt ccgcgccgcc gccggcccag ccggaccgca ccacgcgagg cgcgagatag 540
gggggcacgg gcgcgaccat ctgcgctgcg gcgccggcga ctcagcgctg cctcagtctg 600
cggtgggcag cggaggagtc gtgtcgtgcc tgagagcgca gtcgagaaac cggctagagg 660
atccttcgaa accggtgcta gcatgggccc gaagcggaaa ctttacagcg ccgtccccgg 720
ccgcaagttc atcgccgtga aggcgcacag cccgcagggt gaaggcgaga tcccgctgca 780
ccgcggcgag gccgtgaagg tgctcagcat tggggagggc ggtttctggg agggaaccgt 840
gaaaggccgc acgggctggt tcccggccga ctgcgtggag gaagtgcaga tgaggcagca 900
tgacacacgg cctgaaacgc gggaggaccg gacgaagcgg ctctttcggc actacacagt 960
gggctcctac gacagcctca cctcacacag cgattatgtc attgatgaca aagtggctgt 1020
cctgcagaaa cgggaccacg agggctttgg ttttgtgctc cggggagcca aagcagagac 1080
ccccatcgag gagttcacgc ccacgccagc cttcccggcg ctgcagtatc tcgagtcggt 1140
ggacgtggag ggtgtggcct ggagggccgg gctgcgcacg ggagacttcc tcatcgaggt 1200
gaacggggtg aacgtggtga aggtcggaca caagcaggtg gtggctctga ttcgccaggg 1260
tggcaaccgc ctcgtcatga aggttgtgtc tgtgacaagg aagccagaag aggacggggc 1320
tcggcgcaga gccccaccgc cccccaagag ggcccccagc accacactga ccctgcgctc 1380
caagtccatg acagctgagc tcgaggaact tgcctccatt cggagctcag aggaagagcc 1440
agagctggtg tttgctgtga acctgccacc tgcccagctg tcgtccagcg atgaggagac 1500
cagggaggag ctggcccgaa ttgggttggt gccaccccct gaagagtttg ccaacggggt 1560
cctgctggcc accccactcg ctggcccggg cccctcgccc accacggtgc ccagcccggc 1620
ctcagggaag cccagcagtg agccaccccc tgcccctgag tctgcagccg actctggggt 1680
ggaggaggct gacacacgca gctccagcga cccccacctg gagaccacaa gcaccatctc 1740
cacggtgtcc agcatgtcca ccttgagctc ggagagcggg gaactcactg acacccacac 1800
ctccttcgct gacggacaca cttttctact cgagaagcca ccagtgcctc ccaagcccaa 1860
gctcaagtcc ccgctgggga aggggccggt gaccttcagg gacccgctgc tgaagcagtc 1920
ctcggacagc gagctcatgg cccagcagca ccacgccgcc tctgccgggc tggcctctgc 1980
cgccgggcct gcccgccctc gctacctctt ccagagaagg tccaagctat ggggggaccc 2040
cgtggagagc cgggggctcc ctgggcctga agacgacaaa ccaactgtga tcagtgagct 2100
cagctcccgc ctgcagcagc tgaacaagga cacgcgttcc ctgggggagg aaccagttgg 2160
tggcctgggc agcctgctgg accctgccaa gaagtcgccc atcgcagcag ctcggctctt 2220
cagcagcctc ggtgagctga gctccatttc agcgcagcgc agccccgggg gcccgggcgg 2280
cggggcctcg tactcggtga ggcccagtgg ccgctacccc gtggcgagac gcgccccgag 2340
cccggtgaag cccgcgtcgc tggagcgggt ggaggggctg ggggcgggcg cggggggcgc 2400
agggcggccc ttcggcctca cgccccccac catcctcaag tcgtccagcc tctccatccc 2460
gcacgagccc aaggaggtgc gcttcgtggt gcgcagcgtg agcgcgcgca gtcgctcccc 2520
ctcgccgtcg ccgctgccct cgcccgcgtc cggccccggc cccggcgccc ccggcccacg 2580
ccgacccttc cagcagaagc cgctgcagct ctggagcaag ttcgacgtgg gcgactggct 2640
ggagagcatc cacctaggcg agcaccgcga ccgcttcgag gaccatgaga tagaaggcgc 2700
gcacctaccc gcgcttacca aggacgactt cgtggagctg ggcgtcacgc gcgtgggcca 2760
ccgcatgaac atcgagcgcg cgctcaggca gctggacggc agctgacggc gcgccaagct 2820
tatcgataat caacctctgg attacaaaat ttgtgaaaga ttgactggta ttcttaacta 2880
tgttgctcct tttacgctat gtggatacgc tgctttaatg cctttgtatc atgctattgc 2940
ttcccgtatg gctttcattt tctcctcctt gtataaatcc tggttgctgt ctctttatga 3000
ggagttgtgg cccgttgtca ggcaacgtgg cgtggtgtgc actgtgtttg ctgacgcaac 3060
ccccactggt tggggcattg ccaccacctg tcagctcctt tccgggactt tcgctttccc 3120
cctccctatt gccacggcgg aactcatcgc cgcctgcctt gcccgctgct ggacaggggc 3180
tcggctgttg ggcactgaca attccgtggt gttgtcgggg aaatcatcgt cctttccttg 3240
gctgctcgcc tatgttgcca cctggattct gcgcgggacg tccttctgct acgtcccttc 3300
ggccctcaat ccagcggacc ttccttcccg cggcctgctg ccggctctgc ggcctcttcc 3360
gcgtcttcgc cttcgccctc agacgagtcg gatctccctt tgggccgcct ccccgcatcg 3420
ataccgagcg ctgctcgaga gatctacggg tggcatccct gtgacccctc cccagtgcct 3480
ctcctggccc tggaagttgc cactccagtg cccaccagcc ttgtcctaat aaaattaagt 3540
tgcatcattt tgtctgacta ggtgtccttc tataatatta tggggtggag gggggtggta 3600
tggagcaagg ggcaagttgg gaagacaacc tgtagggcct gcggggtcta ttgggaacca 3660
agctggagtg cagtggcaca atcttggctc actgcaatct ccgcctcctg ggttcaagcg 3720
attctcctgc ctcagcctcc cgagttgttg ggattccagg catgcatgac caggctcagc 3780
taatttttgt ttttttggta gagacggggt ttcaccatat tggccaggct ggtctccaac 3840
tcctaatctc aggtgatcta cccaccttgg cctcccaaat tgctgggatt acaggcgtga 3900
accactgctc ccttccctgt ccttctgatt ttgtaggtaa ccacgtgcgg accgagcggc 3960
cgcaggaacc cctagtgatg gagttggcca ctccctctct gcgcgctcgc tcgctcactg 4020
aggccgggcg accaaaggtc gcccgacgcc cgggctttgc ccgggcggcc tcagtgagcg 4080
agcgagcgcg cagctgcctg caggggcgcc tgatgcggta ttttctcctt acgcatctgt 4140
gcggtatttc acaccgcata cgtcaaagca accatagtac gcgccctgta gcggcgcatt 4200
aagcgcggcg ggtgtggtgg ttacgcgcag cgtgaccgct acacttgcca gcgccctagc 4260
gcccgctcct ttcgctttct tcccttcctt tctcgccacg ttcgccggct ttccccgtca 4320
agctctaaat cgggggctcc ctttagggtt ccgatttagt gctttacggc acctcgaccc 4380
caaaaaactt gatttgggtg atggttcacg tagtgggcca tcgccctgat agacggtttt 4440
tcgccctttg acgttggagt ccacgttctt taatagtgga ctcttgttcc aaactggaac 4500
aacactcaac cctatctcgg gctattcttt tgatttataa gggattttgc cgatttcggc 4560
ctattggtta aaaaatgagc tgatttaaca aaaatttaac gcgaatttta acaaaatatt 4620
aacgtttaca attttatggt gcactctcag tacaatctgc tctgatgccg catagttaag 4680
ccagccccga cacccgccaa cacccgctga cgcgccctga cgggcttgtc tgctcccggc 4740
atccgcttac agacaagctg tgaccgtctc cgggagctgc atgtgtcaga ggttttcacc 4800
gtcatcaccg aaacgcgcga gacgaaaggg cctcgtgata cgcctatttt tataggttaa 4860
tgtcatgata ataatggttt cttagacgtc aggtggcact tttcggggaa atgtgcgcgg 4920
aacccctatt tgtttatttt tctaaataca ttcaaatatg tatccgctca tgagacaata 4980
accctgataa atgcttcaat aatattgaaa aaggaagagt atgagtattc aacatttccg 5040
tgtcgccctt attccctttt ttgcggcatt ttgccttcct gtttttgctc acccagaaac 5100
gctggtgaaa gtaaaagatg ctgaagatca gttgggtgca cgagtgggtt acatcgaact 5160
ggatctcaac agcggtaaga tccttgagag ttttcgcccc gaagaacgtt ttccaatgat 5220
gagcactttt aaagttctgc tatgtggcgc ggtattatcc cgtattgacg ccgggcaaga 5280
gcaactcggt cgccgcatac actattctca gaatgacttg gttgagtact caccagtcac 5340
agaaaagcat cttacggatg gcatgacagt aagagaatta tgcagtgctg ccataaccat 5400
gagtgataac actgcggcca acttacttct gacaacgatc ggaggaccga aggagctaac 5460
cgcttttttg cacaacatgg gggatcatgt aactcgcctt gatcgttggg aaccggagct 5520
gaatgaagcc ataccaaacg acgagcgtga caccacgatg cctgtagcaa tggcaacaac 5580
gttgcgcaaa ctattaactg gcgaactact tactctagct tcccggcaac aattaataga 5640
ctggatggag gcggataaag ttgcaggacc acttctgcgc tcggcccttc cggctggctg 5700
gtttattgct gataaatctg gagccggtga gcgtgggtct cgcggtatca ttgcagcact 5760
ggggccagat ggtaagccct cccgtatcgt agttatctac acgacgggga gtcaggcaac 5820
tatggatgaa cgaaatagac agatcgctga gataggtgcc tcactgatta agcattggta 5880
actgtcagac caagtttact catatatact ttagattgat ttaaaacttc atttttaatt 5940
taaaaggatc taggtgaaga tcctttttga taatctcatg accaaaatcc cttaacgtga 6000
gttttcgttc cactgagcgt cagaccccgt agaaaagatc aaaggatctt cttgagatcc 6060
tttttttctg cgcgtaatct gctgcttgca aacaaaaaaa ccaccgctac cagcggtggt 6120
ttgtttgccg gatcaagagc taccaactct ttttccgaag gtaactggct tcagcagagc 6180
gcagatacca aatactgtcc ttctagtgta gccgtagtta ggccaccact tcaagaactc 6240
tgtagcaccg cctacatacc tcgctctgct aatcctgtta ccagtggctg ctgccagtgg 6300
cgataagtcg tgtcttaccg ggttggactc aagacgatag ttaccggata aggcgcagcg 6360
gtcgggctga acggggggtt cgtgcacaca gcccagcttg gagcgaacga cctacaccga 6420
actgagatac ctacagcgtg agctatgaga aagcgccacg cttcccgaag ggagaaaggc 6480
ggacaggtat ccggtaagcg gcagggtcgg aacaggagag cgcacgaggg agcttccagg 6540
gggaaacgcc tggtatcttt atagtcctgt cgggtttcgc cacctctgac ttgagcgtcg 6600
atttttgtga tgctcgtcag gggggcggag cctatggaaa aacgccagca acgcggcctt 6660
tttacggttc ctggcctttt gctggccttt tgctcacatg t 6701
<210> 22
<211> 495
<212> DNA
<213> 智人(Homo sapiens)
<400> 22
gtgtctagac tgcagagggc cctgcgtatg agtgcaagtg ggttttagga ccaggatgag 60
gcggggtggg ggtgcctacc tgacgaccga ccccgaccca ctggacaagc acccaacccc 120
cattccccaa attgcgcatc ccctatcaga gagggggagg ggaaacagga tgcggcgagg 180
cgcgtgcgca ctgccagctt cagcaccgcg gacagtgcct tcgcccccgc ctggcggcgc 240
gcgccaccgc cgcctcagca ctgaaggcgc gctgacgtca ctcgccggtc ccccgcaaac 300
tccccttccc ggccaccttg gtcgcgtccg cgccgccgcc ggcccagccg gaccgcacca 360
cgcgaggcgc gagatagggg ggcacgggcg cgaccatctg cgctgcggcg ccggcgactc 420
agcgctgcct cagtctgcgg tgggcagcgg aggagtcgtg tcgtgcctga gagcgcagtc 480
gagaaaccgg ctaga 495
Claims (79)
1.编码Shank3蛋白的非天然存在的多核苷酸,
其中所述Shank3蛋白包含SH3结构域、PDZ结构域、Homer结合结构域、Cortactin结合结构域和SAM结构域;
其中所述SH3结构域包含与SEQ ID NO:6的474-525残基的至少90%同一性或与SEQ IDNO:5的473-524残基的至少90%同一性;
其中所述PDZ结构域包含与SEQ ID NO:6的573-662残基的至少90%同一性或与SEQ IDNO:5的572-661残基的至少90%同一性;
其中所述Homer结合结构域包含与SEQ ID NO:5或6的1294-1323残基的至少90%同一性;
其中所述Cortactin结合结构域包含与SEQ ID NO:5或6的1400-1426残基的至少90%同一性;和/或
其中所述SAM结构域包含与SEQ ID NO:6的1664-1729残基的至少90%同一性或与SEQID NO:5的1663-1728残基的至少90%同一性;且
其中所述多核苷酸小于4.7kb。
2.如权利要求1所述的多核苷酸,其中所述多核苷酸进一步包含富脯氨酸区。
3.如权利要求1或2所述的多核苷酸,其中所述SH3结构域包含SEQ ID NO:6的474-525残基或SEQ ID NO:5的473-524残基,所述PDZ结构域包含SEQ ID NO:6的573-662残基或SEQID NO:5的572-661残基,所述Homer结合结构域包含SEQ ID NO:5或6的1294-1323残基,所述Cortactin结合结构域包含SEQ ID NO:5或6的1400-1426残基和/或所述SAM结构域包含SEQ ID NO:6的1664-1729残基或SEQ ID NO:5的1663-1728残基。
4.如权利要求1-3中任一项所述的多核苷酸,其中所述多核苷酸包含与SEQ ID NO:1或2的至少90%同一性。
5.如权利要求4所述的多核苷酸,其中所述多核苷酸包含SEQ ID NO:1或2。
6.如权利要求1所述的多核苷酸,其中由所述多核苷酸编码的所述Shank3蛋白进一步包含锚蛋白重复结构域。
7.如权利要求6所述的多核苷酸,其中所述锚蛋白重复结构域包含与SEQ ID NO:6的148-345残基的至少90%同一性或与SEQ ID NO:5的147-313残基的至少90%同一性。
8.如权利要求7所述的多核苷酸,其中所述锚蛋白重复结构域包含SEQ ID NO:6的148-345残基或SEQ ID NO:5的147-313残基。
9.如权利要求6-8中任一项所述的多核苷酸,其中所述多核苷酸包含与SEQ ID NO:3或4的至少90%同一性。
10.如权利要求9所述的多核苷酸,其中所述多核苷酸包含SEQ ID NO:3或4。
11.如权利要求1-10中任一项所述的多核苷酸,其中所述多核苷酸小于约4.6kb、4.5kb、4.4kb、4.3kb、4.2kb、4.1kb、4.0kb、3.9kb、3.8kb、3.7kb、3.6kb、3.5kb、3.4kb、3.3kb、3.2kb、3.1kb、3.0kb、2.9kb、2.8kb、2.7kb、2.6kb、2.5kb、2.4kb、2.3kb、2.2kb或2.1kb。
12.如权利要求1-11中任一项所述的多核苷酸,其中所述Shank3蛋白在SEQ ID NO:5或6的全长上与SEQ ID NO:5或6小于65%相同。
13.如权利要求1-12中任一项所述的多核苷酸,其中所述Shank3蛋白包含与SEQ IDNO:17-20中任一项至少90%相同的氨基酸序列。
14.如权利要求13所述的多核苷酸,其中所述Shank3蛋白包含SEQ ID NO:17-20中任一项的氨基酸序列。
15.Shank3蛋白,其由权利要求1-14中任一项所述的多肽编码。
16.载体,其包含权利要求1-14中任一项所述的多核苷酸。
17.如权利要求16所述的载体,其中所述载体是病毒载体。
18.如权利要求17所述的载体,其中所述载体是AAV载体。
19.如权利要求18所述的AAV载体,其中所述载体包含可操作地连接至权利要求1-14中任一项所述的多核苷酸的启动子。
20.如权利要求19所述的AAV载体,其中所述多核苷酸两侧是AAV反向末端重复序列(ITR)。
21.如权利要求18-20中任一项所述的AAV载体,其中所述AAV载体包含与SEQ ID NO:7或21至少90%相同的序列。
22.如权利要求21所述的AAV载体,其中所述AAV载体包含SEQ ID NO:7或21的序列。
23.AAV颗粒,其包含如权利要求19-21中任一项所述的AAV载体和衣壳蛋白,其中所述衣壳蛋白具有选自AAV1、2、5、6、8、9、rh10和PHP.eB的血清型。
24.如权利要求23所述的AAV颗粒,其中所述血清型是AAV9。
25.如权利要求23所述的AAV颗粒,其中所述血清型是AAV10。
26.如权利要求23所述的AAV颗粒,其中所述血清型是AAV9-PHP.eB血清型。
27.如权利要求19所述的AAV载体,其中所述启动子是人启动子。
28.如权利要求27所述的AAV载体,其中所述启动子是hSyn1。
29.方法,其包括将权利要求18-21中任一项所述的AAV载体或权利要求23-26中任一项所述的AAV颗粒施用至有需要的受试者。
30.如权利要求29所述的方法,其中所述AAV载体或颗粒经静脉内施用。
31.如权利要求29所述的方法,其中所述AAV载体或颗粒递送至所述受试者的脑。
32.如权利要求29所述的方法,其中所述AAV载体或颗粒递送至所述受试者的皮层、纹状体和/或丘脑。
33.如权利要求29所述的方法,其中所述受试者是人受试者。
34.如权利要求33所述的方法,其中所述人受试者是成人。
35.如权利要求33所述的方法,其中所述人受试者不是成人。
36.如权利要求334所述的方法,其中所述人受试者不大于25岁。
37.如权利要求35所述的方法,其中所述人受试者为10岁或更年轻。
38.如权利要求28-36中任一项所述的方法,其中所述受试者患有、疑似患有或有风险患有神经发育障碍。
39.如权利要求29-37中任一项所述的方法,其中所述受试者患有、疑似患有或有风险患有自闭症谱系障碍(ASD)。
40.如权利要求29-37中任一项所述的方法,其中所述受试者表现出ASD的一种或多种症状。
41.如权利要求29-37中任一项所述的方法,其中所述受试者患有、疑似患有或有风险患有费伦-麦克德米德(Phelan-McDermid)综合症。
42.如权利要求29-41中任一项所述的方法,其中所述受试者表现出发育迟缓、智力残疾(ID)、睡眠障碍、肌张力减退、言语缺乏或语言迟缓中的一种或多种。
43.如权利要求29-42中任一项所述的方法,其中所述受试者具有、疑似具有或有风险具有相对于对照受试者的Shank3基因表达减少。
44.如权利要求43所述的方法,其中所述对照受试者是不患有、不疑似患有、或没风险患有神经发育障碍、自闭症谱系障碍(ASD)和/或费伦-麦克德米德综合症的受试者。
45.如权利要求43或44的方法,其中所述Shank3基因表达减少由所述Shank3基因的至少一个拷贝的破坏造成。
46.如权利要求45所述的方法,其中所述Shank3基因的破坏包含所述Shank3基因的至少一个拷贝的缺失。
47.如权利要求45所述的方法,其中所述Shank3基因的破坏包含在所述Shank3基因的至少一个拷贝内的一个或多个突变。
48.治疗患有神经发育障碍的受试者的方法,所述方法包括向所述受试者施用有效量的包含AAV载体的组合物,其中所述AAV载体包含编码Shank3蛋白的多核苷酸。
49.治疗患有自闭症谱系障碍(ASD)的受试者的方法,所述方法包括向所述受试者施用有效量的包含AAV载体的组合物,其中所述AAV载体包含编码Shank3蛋白的多核苷酸。
50.治疗患有费伦-麦克德米德综合症的受试者的方法,所述方法包括向所述受试者施用有效量的包含AAV载体的组合物,其中所述AAV载体包含编码Shank3蛋白的多核苷酸。
51.如权利要求48-50中任一项所述的方法,其中所述Shank3蛋白包含SH3结构域、PDZ结构域、Homer结合结构域、Cortactin结合结构域和SAM结构域。
52.如权利要求48-50中任一项所述的方法,其中所述Shank3蛋白进一步包含锚蛋白重复结构域。
53.如权利要求52所述的方法,其中所述锚蛋白重复结构域包含与SEQ ID NO:6的148-345残基的至少90%同一性或与SEQ ID NO:5的147-313残基的至少90%同一性。
54.如权利要求51-53中任一项所述的方法,其中所述SH3结构域包含与SEQ ID NO:6的474-525残基的至少90%同一性或与SEQ ID NO:5的473-524残基的至少90%同一性;
其中所述PDZ结构域包含与SEQ ID NO:6的573-662残基的至少90%同一性或与SEQ IDNO:5的572-661残基的至少90%同一性;
其中所述Homer结合结构域包含与SEQ ID NO:5或6的1294-1323残基的至少90%同一性;
其中所述Cortactin结合结构域包含与SEQ ID NO:5或6的1400-1426残基的至少90%同一性;和/或
其中所述SAM结构域包含与SEQ ID NO:6的1664-1729残基的至少90%同一性或与SEQID NO:5的1663-1728残基的至少90%同一性。
55.如权利要求48-50所述的方法,其中所述SH3结构域包含SEQ ID NO:6的474-525残基或SEQ ID NO:5的473-524残基;
其中所述PDZ结构域包含SEQ ID NO:6的573-662残基或SEQ ID NO:5的572-661残基;
其中所述Homer结合结构域包含SEQ ID NO:5或6的1294-1323残基;
其中所述Cortactin结合结构域包含SEQ ID NO:5或6的1400-1426残基;和/或
其中所述SAM结构域包含SEQ ID NO:6的1664-1729残基或SEQ ID NO:5的1663-1728残基。
56.如权利要求47-49中任一项所述的方法,其中所述多核苷酸小于4.7kb。
57.如权利要求48-50中任一项所述的方法,所述多核苷酸小于约4.6kb、4.5kb、4.4kb、4.3kb、4.2kb、4.1kb、4.0kb、3.9kb、3.8kb、3.7kb、3.6kb、3.5kb、3.4kb、3.3kb、3.2kb、3.1kb、3.0kb、2.9kb、2.8kb、2.7kb、2.6kb、2.5kb、2.4kb、2.3kb、2.2kb或2.1kb。
58.如权利要求48-50中任一项所述的方法,其中所述多核苷酸进一步包含富脯氨酸区。
59.如权利要求48-50中任一项所述的方法,其中所述多核苷酸包含与SEQ ID NO:1-4中任一项的至少90%同一性。
60.如权利要求48-50中任一项所述的方法,其中所述多核苷酸包含SEQ ID NO:1-4中的任一项。
61.如权利要求478-50中任一项所述的方法,其中所述受试者是人受试者。
62.如权利要求61所述的方法,其中所述人受试者是成人。
63.如权利要求61所述的方法,其中所述人受试者不是成人。
64.如权利要求62所述的方法,其中所述人受试者不大于25岁。
65.如权利要求63所述的方法,其中所述人受试者为10岁或更年轻。
66.如权利要求48-65中任一项所述的方法,其中所述组合物经静脉内施用。
67.如权利要求48-65中任一项所述的方法,其中所述组合物递送至所述受试者的脑。
68.如权利要求48-65中任一项所述的方法,其中所述组合物递送至所述受试者的纹状体和/或丘脑。
69.如权利要求48-68中任一项所述的方法,其中所述受试者表现发育迟缓、智力残疾(ID)、睡眠障碍、肌张力减退、言语缺乏或语言迟缓中的一种或多种。
70.如权利要求48所述的方法,其中所述自闭症谱系障碍(ASD)包含自闭症。
71.如权利要求48-70的方法,其中所述受试者具有、疑似具有或有风险具有相对于对照受试者的Shank3基因表达减少。
72.如权利要求71所述的方法,其中所述对照受试者是不患有、不疑似患有、或没风险患有神经发育障碍、自闭症谱系障碍(ASD)和/或费伦-麦克德米德综合症的受试者。
73.如权利要求71或72所述的方法,其中所述Shank3基因表达减少由所述Shank3基因的至少一个拷贝的破坏造成。
74.如权利要求73所述的方法,其中所述Shank3基因的破坏包含所述Shank3基因的至少一个拷贝的缺失。
75.如权利要求73所述的方法,其中所述Shank3基因的破坏包含在所述Shank3基因的至少一个拷贝内的一个或多个突变。
76.如权利要求48-50中任一项所述的方法,其中所述受试者在施用有效量的所述组合物后具有改善的睡眠效率。
77.如权利要求48-76中任一项所述的方法,其中所述组合物在药学上可接受的载体中。
78.MiniShank3蛋白,其包含与SEQ ID NO:17-20中任一项具有至少80%、至少85%、至少90%、或至少95%同一性的序列。
79.如权利要求78所述的MiniShank3蛋白,其中所述MiniShank3蛋白包含SEQ ID NO:17-20中任一项的序列。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US202063066570P | 2020-08-17 | 2020-08-17 | |
US63/066,570 | 2020-08-17 | ||
PCT/US2021/046382 WO2022040239A1 (en) | 2020-08-17 | 2021-08-17 | Shank3 gene therapy approaches |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116406305A true CN116406305A (zh) | 2023-07-07 |
Family
ID=77951796
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202180070681.7A Pending CN116406305A (zh) | 2020-08-17 | 2021-08-17 | Shank3基因治疗方法 |
Country Status (11)
Country | Link |
---|---|
US (1) | US20230340041A1 (zh) |
EP (1) | EP4196494A1 (zh) |
JP (1) | JP2023539574A (zh) |
KR (1) | KR20230051578A (zh) |
CN (1) | CN116406305A (zh) |
AU (1) | AU2021328570A1 (zh) |
BR (1) | BR112023003023A2 (zh) |
CA (1) | CA3192052A1 (zh) |
IL (1) | IL300526A (zh) |
MX (1) | MX2023001998A (zh) |
WO (1) | WO2022040239A1 (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2024178401A1 (en) * | 2023-02-24 | 2024-08-29 | Massachusetts Institute Of Technology | Shank3 gene therapy approaches |
WO2024233422A1 (en) | 2023-05-05 | 2024-11-14 | Massachusetts Institute Of Technology | Shank3 gene therapy approaches |
Family Cites Families (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5549910A (en) | 1989-03-31 | 1996-08-27 | The Regents Of The University Of California | Preparation of liposome and lipid complex compositions |
US5252334A (en) | 1989-09-08 | 1993-10-12 | Cygnus Therapeutic Systems | Solid matrix system for transdermal drug delivery |
JP3218637B2 (ja) | 1990-07-26 | 2001-10-15 | 大正製薬株式会社 | 安定なリポソーム水懸濁液 |
JP2958076B2 (ja) | 1990-08-27 | 1999-10-06 | 株式会社ビタミン研究所 | 遺伝子導入用多重膜リポソーム及び遺伝子捕捉多重膜リポソーム製剤並びにその製法 |
US5741516A (en) | 1994-06-20 | 1998-04-21 | Inex Pharmaceuticals Corporation | Sphingosomes for enhanced drug delivery |
US5795587A (en) | 1995-01-23 | 1998-08-18 | University Of Pittsburgh | Stable lipid-comprising drug delivery complexes and methods for their production |
US5697899A (en) | 1995-02-07 | 1997-12-16 | Gensia | Feedback controlled drug delivery system |
US5738868A (en) | 1995-07-18 | 1998-04-14 | Lipogenics Ltd. | Liposome compositions and kits therefor |
US5656016A (en) | 1996-03-18 | 1997-08-12 | Abbott Laboratories | Sonophoretic drug delivery system |
US5797898A (en) | 1996-07-02 | 1998-08-25 | Massachusetts Institute Of Technology | Microchip drug delivery devices |
US5783208A (en) | 1996-07-19 | 1998-07-21 | Theratech, Inc. | Transdermal drug delivery matrix for coadministering estradiol and another steroid |
US5779708A (en) | 1996-08-15 | 1998-07-14 | Cyberdent, Inc. | Intraosseous drug delivery device and method |
EP3211085B1 (en) | 2003-09-30 | 2021-03-31 | The Trustees of The University of Pennsylvania | Adeno-associated virus (aav) clades, sequences, vectors containing same, and uses therefor |
GB201103062D0 (en) | 2011-02-22 | 2011-04-06 | Isis Innovation | Method |
ES2739288T3 (es) | 2013-09-13 | 2020-01-30 | California Inst Of Techn | Recuperación selectiva |
CO2018007203A2 (es) | 2015-12-11 | 2018-09-20 | California Inst Of Techn | Focalización de péptidos para dirigir virus adenoasociados (aavs) |
US11951121B2 (en) | 2016-05-18 | 2024-04-09 | Voyager Therapeutics, Inc. | Compositions and methods for treating Huntington's disease |
WO2020160337A1 (en) | 2019-01-30 | 2020-08-06 | The Broad Institute, Inc. | Systems for evolved adeno-associated viruses (aavs) for targeted delivery |
IT201900008877A1 (it) * | 2019-06-13 | 2020-12-13 | Univ Bologna Alma Mater Studiorum | Nuovi costrutti per terapia genica |
-
2021
- 2021-08-17 KR KR1020237009262A patent/KR20230051578A/ko active Pending
- 2021-08-17 IL IL300526A patent/IL300526A/en unknown
- 2021-08-17 US US18/021,693 patent/US20230340041A1/en active Pending
- 2021-08-17 WO PCT/US2021/046382 patent/WO2022040239A1/en unknown
- 2021-08-17 CN CN202180070681.7A patent/CN116406305A/zh active Pending
- 2021-08-17 CA CA3192052A patent/CA3192052A1/en active Pending
- 2021-08-17 AU AU2021328570A patent/AU2021328570A1/en active Pending
- 2021-08-17 JP JP2023512119A patent/JP2023539574A/ja active Pending
- 2021-08-17 EP EP21778597.1A patent/EP4196494A1/en active Pending
- 2021-08-17 BR BR112023003023A patent/BR112023003023A2/pt unknown
- 2021-08-17 MX MX2023001998A patent/MX2023001998A/es unknown
Also Published As
Publication number | Publication date |
---|---|
AU2021328570A1 (en) | 2023-03-09 |
WO2022040239A8 (en) | 2022-06-23 |
KR20230051578A (ko) | 2023-04-18 |
BR112023003023A2 (pt) | 2023-04-11 |
WO2022040239A1 (en) | 2022-02-24 |
US20230340041A1 (en) | 2023-10-26 |
EP4196494A1 (en) | 2023-06-21 |
IL300526A (en) | 2023-04-01 |
MX2023001998A (es) | 2023-05-04 |
JP2023539574A (ja) | 2023-09-15 |
CA3192052A1 (en) | 2022-02-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108753824B (zh) | 用于治疗视网膜营养不良的病毒载体 | |
CN108289933B (zh) | 作为认知和行为障碍药物的哺乳动物Klotho的分泌型剪接变体 | |
KR102604096B1 (ko) | 윌슨병을 치료하기 위한 유전자 치료 | |
KR102178322B1 (ko) | 변형된 인자 ix, 및 세포, 기관 및 조직으로 유전자를 전달하기 위한 조성물, 방법 및 용도 | |
KR102684387B1 (ko) | 신규한 마이크로-디스트로핀 및 관련된 사용 방법 | |
KR102654180B1 (ko) | 프롤린 및 알라닌 잔기가 풍부한 반복적인 아미노산 서열을 암호화하고 낮은 반복적인 뉴클레오티드 서열을 갖는 핵산 | |
AU2024278250A1 (en) | Compositions and methods of treating Huntington's Disease | |
AU2024266824A1 (en) | Expression of FOXP3 in edited CD34+ cells | |
US20030177507A1 (en) | Nematodes as model organisms for the investigation of neurodegenerative diseases, in particular parkinsons disease, uses and methods for the discovery of substances and genes which can used in the treatment of the above disease states and identification of anematode gene | |
KR102745604B1 (ko) | Glp-1 및 대사성 질환 치료용 조성물에서 이의 용도 | |
AU2024266825A1 (en) | Expression of human FOXP3 in gene edited T cells | |
KR20230062873A (ko) | 염기 편집 효소 | |
CN110662839A (zh) | 用于细胞疗法的基于靶向性配体-有效负载的药物递送 | |
CN116406305A (zh) | Shank3基因治疗方法 | |
KR20230038508A (ko) | Mybpc3 폴리펩티드 및 그의 용도 | |
TW202227476A (zh) | 編碼GJB2之重組腺相關病毒(rAAV)及其用途 | |
CN111621522A (zh) | 一种培育肠道特异性表达红色荧光转基因斑马鱼的方法 | |
KR20210005178A (ko) | X-연관 고 igm 증후군에서의 치료적 게놈 편집 | |
CN112203697A (zh) | 编码氨基己糖苷酶alpha和beta亚基的双顺反子AAV载体及其用途 | |
KR20230170686A (ko) | 부정맥유발 우심실 심근병증에 대한 유전자 치료법 | |
CN112342234B (zh) | 一种调控n-乙酰神经氨酸产量提高的重组枯草芽孢杆菌 | |
CN107988259A (zh) | SmartBac杆状病毒表达系统及其应用 | |
US9493747B2 (en) | Engineered transglutaminase barrel proteins | |
TW201030146A (en) | High-expression promoter and method for producing gene product using the same | |
CN117677630A (zh) | 用于治疗神经退行性疾病的颗粒体蛋白/上皮素模块及其组合 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |