[go: up one dir, main page]

CN113874510A - 包括具有β滑移突变的人源化TTR基因座的非人动物和使用方法 - Google Patents

包括具有β滑移突变的人源化TTR基因座的非人动物和使用方法 Download PDF

Info

Publication number
CN113874510A
CN113874510A CN202080038549.3A CN202080038549A CN113874510A CN 113874510 A CN113874510 A CN 113874510A CN 202080038549 A CN202080038549 A CN 202080038549A CN 113874510 A CN113874510 A CN 113874510A
Authority
CN
China
Prior art keywords
ttr
human
sequence
human animal
locus
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202080038549.3A
Other languages
English (en)
Inventor
杰弗里·海恩斯
基思·克罗斯比
梅根·德拉蒙德·萨缪尔森
大卫·弗伦杜威
布莱恩·扎姆布罗维兹
安德鲁·J.·墨菲
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Regeneron Pharmaceuticals Inc
Original Assignee
Regeneron Pharmaceuticals Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Regeneron Pharmaceuticals Inc filed Critical Regeneron Pharmaceuticals Inc
Publication of CN113874510A publication Critical patent/CN113874510A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K67/00Rearing or breeding animals, not otherwise provided for; New or modified breeds of animals
    • A01K67/027New or modified breeds of vertebrates
    • A01K67/0275Genetically modified vertebrates, e.g. transgenic
    • A01K67/0278Knock-in vertebrates, e.g. humanised vertebrates
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/8509Vectors or expression systems specially adapted for eukaryotic hosts for animal cells for producing genetically modified animals, e.g. transgenic
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K67/00Rearing or breeding animals, not otherwise provided for; New or modified breeds of animals
    • A01K67/027New or modified breeds of vertebrates
    • A01K67/0275Genetically modified vertebrates, e.g. transgenic
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K49/00Preparations for testing in vivo
    • A61K49/0004Screening or testing of compounds for diagnosis of disorders, assessment of conditions, e.g. renal clearance, gastric emptying, testing for diabetes, allergy, rheuma, pancreas functions
    • A61K49/0008Screening agents using (non-human) animal models or transgenic animal models or chimeric hosts, e.g. Alzheimer disease animal model, transgenic model for heart failure
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/46Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
    • C07K14/47Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/46Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
    • C07K14/47Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
    • C07K14/4701Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals not used
    • C07K14/4702Regulators; Modulating activity
    • C07K14/4705Regulators; Modulating activity stimulating, promoting or activating activity
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2207/00Modified animals
    • A01K2207/15Humanized animals
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2217/00Genetically modified animals
    • A01K2217/07Animals genetically altered by homologous recombination
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2217/00Genetically modified animals
    • A01K2217/15Animals comprising multiple alterations of the genome, by transgenesis or homologous recombination, e.g. obtained by cross-breeding
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2227/00Animals characterised by species
    • A01K2227/10Mammal
    • A01K2227/105Murine
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2267/00Animals characterised by purpose
    • A01K2267/03Animal model, e.g. for test or diseases
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/10Plasmid DNA
    • C12N2800/106Plasmid DNA for vertebrates
    • C12N2800/107Plasmid DNA for vertebrates for mammalian

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Genetics & Genomics (AREA)
  • Chemical & Material Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Biotechnology (AREA)
  • Environmental Sciences (AREA)
  • Organic Chemistry (AREA)
  • Veterinary Medicine (AREA)
  • Biomedical Technology (AREA)
  • Animal Behavior & Ethology (AREA)
  • Wood Science & Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biodiversity & Conservation Biology (AREA)
  • Animal Husbandry (AREA)
  • Biochemistry (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Toxicology (AREA)
  • Physics & Mathematics (AREA)
  • Microbiology (AREA)
  • Plant Pathology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Medicinal Chemistry (AREA)
  • Pathology (AREA)
  • Endocrinology (AREA)
  • Diabetes (AREA)
  • Rheumatology (AREA)
  • Urology & Nephrology (AREA)
  • Epidemiology (AREA)
  • Public Health (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Peptides Or Proteins (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

提供了包括包含β滑移突变的人源化TTR基因座的非人动物细胞和非人动物以及使用此类非人动物细胞和非人动物的方法。包括包含β滑移突变的人源化TTR基因座的非人动物细胞或非人动物表达人转甲状腺素蛋白或嵌合转甲状腺素蛋白,所述嵌合转甲状腺素蛋白的片段来自人转甲状腺素蛋白。提供了用于使用包括人源化TTR基因座的此类非人动物来评估如核酸酶药剂等被设计成靶向人TTR的人TTR靶向试剂的体内功效的方法。

Description

包括具有β滑移突变的人源化TTR基因座的非人动物和使用 方法
相关申请的交叉引用
本申请要求于2019年6月4日提交的美国申请第62/856,999号的权益,所述美国申请出于所有目的通过引用整体并入本文。
序列表的引用通过EFS WEB作为文本文件提交
写入文件547028SEQLIST.txt中的序列表为124千字节,创建于2020年5月25日,并且特此通过引用并入。
背景技术
转甲状腺素蛋白(TTR)是一种在血清和脑脊液中发现的蛋白质,其携带甲状腺激素和视黄醇结合蛋白至视黄醇。肝脏将TTR分泌到血液中,而脉络丛将其分泌到脑脊液中。TTR也在视网膜色素上皮中产生并且分泌到玻璃体中。错误折叠和聚集的TTR在淀粉样蛋白疾病老年系统性淀粉样变性(SSA)、家族性淀粉样蛋白多发性神经病变(FAP)和家族性淀粉样蛋白心肌病(FAC)中的多个组织和器官中积聚。
仍然需要合适的非人动物,所述非人动物在内源性Ttr基因座处提供人TTR靶向试剂的真实人靶标或真实人靶标的近似靶标,由此能够测试此类药剂在活体动物中的功效和作用模式以及在人源化蛋白质和人源化基因是存在的TTR的唯一版本的背景下的药物代谢动力学和药效动力学研究。
发明内容
提供了包括包含β滑移突变的人源化TTR基因座的非人动物以及使用此类非人动物的方法。还提供了非人动物、非人动物细胞和非人动物基因组以及制备和使用此类非人动物、非人动物细胞和非人动物基因组的方法,所述非人动物、非人动物细胞和非人动物基因组包括包含β滑移突变的人源化TTR基因座。还提供了包括β滑移突变的人源化非人动物TTR基因、核酸酶药剂和/或用于使非人动物TTR基因人源化的靶向载体以及制备和使用此类人源化TTR基因的方法。
一方面,提供了包括包含β滑移突变的人源化TTR基因座的非人动物。还提供了非人动物、非人动物细胞以及在其基因组中包括包含β滑移突变的人源化TTR基因座的非人动物基因组。此类非人动物可以包括经基因修饰的内源性Ttr基因座,其中所述内源性Ttr基因座的包括Ttr编码序列和非编码序列两者的区域已经缺失并且被包括TTR编码序列和非编码序列两者的直系同源人TTR序列替代,并且其中所述经基因修饰的内源性Ttr基因座包括引起经编码的转甲状腺素蛋白的β链D中的移位的突变。一些此类非人动物、非人动物细胞和非人动物基因组可以包括经基因修饰的内源性Ttr基因座,其中所述内源性Ttr基因座的包括Ttr编码序列和非编码序列两者的区域已经缺失并且被包括TTR编码序列和非编码序列两者的对应人TTR序列替代,并且其中所述经基因修饰的内源性Ttr基因座包括引起经编码的转甲状腺素蛋白的β链D中的移位的突变。任选地,当所述经编码的转甲状腺素蛋白与人转甲状腺素蛋白进行最佳比对时,所述突变引起β链D的三残基移位,所述三残基移位将与所述人转甲状腺素蛋白中的残基L58相对应的残基置于通常被与所述人转甲状腺素蛋白中的残基L55相对应的残基占据的位置处。任选地,当所述经编码的转甲状腺素蛋白与所述人转甲状腺素蛋白进行最佳比对时,所述突变是与所述人转甲状腺素蛋白中的G53S/E54D/L55S相对应的三重突变。任选地,所述三重突变位于直系同源人TTR序列中。任选地,所述三重突变位于对应人TTR序列中。
在一些此类非人动物中,经基因修饰的内源性Ttr基因座包括内源性Ttr启动子。在一些此类非人动物、非人动物细胞和非人动物基因组中,所述经基因修饰的内源性Ttr基因座包括内源性Ttr启动子,其中所述人TTR序列与所述内源性Ttr启动子可操作地连接。任选地,所述内源性Ttr基因座的至少一个内含子和至少一个外显子已经缺失并且被所述直系同源人TTR序列替代。任选地,所述内源性Ttr基因座的至少一个内含子和至少一个外显子已经缺失并且被所述对应人TTR序列替代。
在一些此类非人动物中,所述内源性Ttr基因座的整个Ttr编码序列已经缺失并且被所述直系同源人TTR序列替代。任选地,所述内源性Ttr基因座的从Ttr起始密码子到Ttr终止密码子的区域已经缺失并且被所述直系同源人TTR序列替代。在一些此类非人动物、非人动物细胞和非人动物基因组中,内源性Ttr基因座的整个Ttr编码序列已经缺失并且被所述对应人TTR序列替代。任选地,所述内源性Ttr基因座的从Ttr起始密码子到Ttr终止密码子的区域已经缺失并且被所述对应人TTR序列替代。
在一些此类非人动物中,所述经基因修饰的内源性Ttr基因座包括人TTR 3'非翻译区。在一些此类非人动物中,所述内源性Ttr 5'非翻译区尚未缺失并且尚未被所述直系同源人TTR序列替代。在一些此类非人动物、非人动物细胞和非人动物基因组中,所述经基因修饰的内源性Ttr基因座包括人TTR 3'非翻译区。在一些此类非人动物、非人动物细胞和非人动物基因组中,所述内源性Ttr 5'非翻译区尚未缺失并且尚未被所述对应人TTR序列替代。
在一些此类非人动物中,所述内源性Ttr基因座的从Ttr起始密码子到Ttr终止密码子的区域已经缺失并且被包括所述直系同源人TTR序列和人TTR 3'非翻译区的人TTR序列替代,并且所述内源性Ttr 5'非翻译区尚未缺失并且尚未被所述直系同源人TTR序列替代,并且所述内源性Ttr启动子尚未缺失并且尚未被所述直系同源人TTR序列替代。在一些此类非人动物、非人动物细胞和非人动物基因组中,所述内源性Ttr基因座的从Ttr起始密码子到Ttr终止密码子的区域已经缺失并且被包括所述对应人TTR序列和人TTR 3'非翻译区的人TTR序列替代,并且所述内源性Ttr 5'非翻译区尚未缺失并且尚未被所述对应人TTR序列替代,并且所述内源性Ttr启动子尚未缺失并且尚未被所述对应人TTR序列替代。任选地,所述经基因修饰的内源性Ttr基因座处的所述人TTR序列包括与SEQ ID NO:14中所示的序列至少90%、95%、96%、97%、98%、99%或100%相同的序列、基本上由其组成或由其组成。任选地,所述经基因修饰的内源性Ttr基因座处的所述人TTR序列包括与SEQ ID NO:14中所示的序列至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或约100%相同的序列、基本上由其组成或由其组成。任选地,所述经基因修饰的内源性Ttr基因座编码包括与SEQ ID NO:9中所示的序列至少90%、95%、96%、97%、98%、99%或100%相同的序列、基本上由其组成或由其组成的蛋白质。任选地,所述经基因修饰的内源性Ttr基因座编码包括与SEQ ID NO:9中所示的序列至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或约100%相同的序列、基本上由其组成或由其组成的蛋白质。任选地,所述经基因修饰的内源性Ttr基因座包括编码序列,所述编码序列包括与SEQ ID NO:10中所示的序列至少90%、95%、96%、97%、98%、99%或100%相同的序列、基本上由其组成或由其组成。任选地,所述经基因修饰的内源性Ttr基因座包括编码序列,所述编码序列包括与SEQ ID NO:10中所示的序列至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或约100%相同的序列、基本上由其组成或由其组成。任选地,所述经基因修饰的内源性Ttr基因座包括与SEQ ID NO:12或13中所示的序列至少90%、95%、96%、97%、98%、99%或100%相同的序列、基本上由其组成或由其组成。任选地,所述经基因修饰的内源性Ttr基因座包括与SEQ ID NO:12或13中所示的序列至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或约100%相同的序列、基本上由其组成或由其组成。
在一些此类非人动物中,所述经基因修饰的内源性Ttr基因座编码包括信号肽的转甲状腺素蛋白前体蛋白,并且所述内源性Ttr基因座的编码所述信号肽的区域尚未缺失并且尚未被所述直系同源人TTR序列替代。任选地,所述内源性Ttr基因座的所述第一外显子尚未缺失并且尚未被所述直系同源人TTR序列替代。任选地,所述内源性Ttr基因座的所述第一外显子和第一内含子尚未缺失并且尚未被所述直系同源人TTR序列替代。任选地,所述内源性Ttr基因座的从第二Ttr外显子开始到Ttr终止密码子的区域已经缺失并且被所述直系同源人TTR序列替代。任选地,所述经基因修饰的内源性Ttr基因座包括人TTR 3'非翻译区。在一些此类非人动物、非人动物细胞和非人动物基因组中,所述经基因修饰的内源性Ttr基因座编码包括信号肽的转甲状腺素蛋白前体蛋白,并且所述内源性Ttr基因座的编码所述信号肽的区域尚未缺失并且尚未被所述对应人TTR序列替代。任选地,所述内源性Ttr基因座的所述第一外显子尚未缺失并且尚未被所述对应人TTR序列替代。任选地,所述内源性Ttr基因座的所述第一外显子和所述第一内含子尚未缺失并且尚未被所述对应人TTR序列替代。任选地,所述内源性Ttr基因座的从所述第二Ttr外显子开始到所述Ttr终止密码子的区域已经缺失并且被所述对应人TTR序列替代。任选地,所述经基因修饰的内源性Ttr基因座包括人TTR 3'非翻译区。
在一些此类非人动物中,所述内源性Ttr基因座的从第二Ttr外显子到Ttr终止密码子的区域已经缺失并且被包括所述直系同源人TTR序列和人TTR 3'非翻译区的人TTR序列替代,并且所述内源性Ttr 5'非翻译区尚未缺失并且尚未被所述直系同源人TTR序列替代,并且所述内源性Ttr启动子尚未缺失并且尚未被所述直系同源人TTR序列替代。在一些此类非人动物、非人动物细胞和非人动物基因组中,所述内源性Ttr基因座的从第二Ttr外显子到Ttr终止密码子的区域已经缺失并且被包括所述对应人TTR序列和人TTR 3'非翻译区的人TTR序列替代,并且所述内源性Ttr 5'非翻译区尚未缺失并且尚未被所述对应人TTR序列替代,并且所述内源性Ttr启动子尚未缺失并且尚未被所述对应人TTR序列替代。
在一些此类非人动物中,所述经基因修饰的内源性Ttr基因座不包括选择盒或报告基因。在一些此类非人动物中,所述经基因修饰的内源性Ttr基因座确实包括选择盒或报告基因。在一些此类非人动物中,所述非人动物对于所述经基因修饰的内源性Ttr基因座是纯合的。在一些此类非人动物中,所述非人动物对于所述经基因修饰的内源性Ttr基因座是杂合的。在一些此类非人动物、非人动物细胞和非人动物基因组中,所述经基因修饰的内源性Ttr基因座不包括选择盒或报告基因。在一些此类非人动物、非人动物细胞和非人动物基因组中,所述经基因修饰的内源性Ttr基因座确实包括选择盒或报告基因。在一些此类非人动物、非人动物细胞和非人动物基因组中,所述非人动物对于所述经基因修饰的内源性Ttr基因座是纯合的。在一些此类非人动物、非人动物细胞和非人动物基因组中,所述非人动物对于所述经基因修饰的内源性Ttr基因座是杂合的。在一些此类非人动物中,所述非人动物在其种系中包括所述经基因修饰的内源性Ttr基因座。
在一些此类非人动物中,所述非人动物是哺乳动物。在一些此类非人动物、非人动物细胞和非人动物基因组中,所述非人动物是哺乳动物。任选地,所述哺乳动物是啮齿动物。任选地,所述啮齿动物是大鼠或小鼠。任选地,所述非人动物是小鼠。
在一些此类非人动物中,所述非人动物相对于对照野生型非人动物或包括所述经基因修饰的内源性Ttr基因座而没有所述突变的非人动物是活动过度的。在一些此类非人动物、非人动物细胞和非人动物基因组中,所述非人动物相对于对照野生型非人动物或包括所述经基因修饰的内源性Ttr基因座而没有所述突变的非人动物是活动过度的。任选地,活动过度是通过旷场实验中的总距离、总活动或总直立次数中的一个或多个或全部来测量的。在一些此类非人动物中,所述非人动物表现出后肢肌张力障碍。在一些此类非人动物、非人动物细胞和非人动物基因组中,所述非人动物表现出后肢肌张力障碍。在一些此类非人动物中,其中所述非人动物包括淀粉样蛋白沉积物。在一些此类非人动物、非人动物细胞和非人动物基因组中,其中所述非人动物包括淀粉样蛋白沉积物。任选地,所述非人动物在坐骨神经中包括淀粉样蛋白沉积物。任选地,所述非人动物在约两个月龄时患上淀粉样变性。
另一方面,提供了用于产生经基因修饰的内源性Ttr基因座的靶向载体,其中所述内源性Ttr基因座的包括Ttr编码序列和非编码序列两者的区域已经缺失并且被包括TTR编码序列和非编码序列两者的对应人TTR序列替代,并且其中所述经基因修饰的内源性Ttr基因座包括引起经编码的转甲状腺素蛋白的β链D中的移位的突变,其中所述靶向载体包括插入核酸,所述插入核酸包括侧接有靶向所述内源性Ttr基因座处的5'靶序列的5'同源臂和靶向所述内源性Ttr基因座处的3'靶序列的3'同源臂的对应人TTR序列。
另一方面,提供了经基因修饰的非人动物Ttr基因,其中内源性Ttr基因的包括Ttr编码序列和非编码序列两者的区域已经缺失并且被包括TTR编码序列和非编码序列两者的对应人TTR序列替代,并且其中所述经基因修饰的非人动物Ttr基因包括引起经编码的转甲状腺素蛋白的β链D中的移位的突变。
另一方面,提供了使用包括人源化TTR基因座的非人动物评估人TTR靶向试剂的体内活性的方法。此类方法可以包括:(a)向上述非人动物中的任何非人动物施用所述人TTR靶向试剂;以及(b)评估所述人TTR靶向试剂在所述非人动物中的活性。
在一些此类方法中,引入包括腺相关病毒(AAV)介导的递送、脂质纳米颗粒(LNP)介导的递送或流体动力学递送(HDD)。任选地,所述引入包括LNP介导的递送。任选地,所述引入包括AAV8介导的递送。
在一些此类方法中,步骤(b)包括从所述非人动物中分离肝脏并且评估所述人TTR靶向试剂在所述肝脏中的活性。任选地,步骤(b)进一步包括评估所述人TTR靶向试剂在除了所述肝脏之外的器官或组织中的活性。
在一些此类方法中,所述评估包括评估所述经基因修饰的Ttr基因座的修饰。在一些此类方法中,所述评估包括评估由所述经基因修饰的Ttr基因座编码的Ttr信使RNA的表达。在一些此类方法中,所述评估包括评估由所述经基因修饰的Ttr基因座编码的TTR蛋白的表达。任选地,评估所述TTR蛋白的表达包括测量所述TTR蛋白在所述非人动物的血清水平。任选地,所述活性是在所述非人动物的所述肝脏中评估的。
在一些此类方法中,所述评估包括评估活动过度。在一些此类方法中,所述评估包括评估后肢肌张力障碍。在一些此类方法中,所述评估包括评估淀粉样蛋白沉积。任选地,所述评估包括评估坐骨神经中的淀粉样蛋白沉积。在一些此类方法中,所述评估是通过与未经处理的对照非人动物进行比较来进行的。
在一些此类方法中,所述人TTR靶向试剂包括被设计成靶向人TTR基因的区域的核酸酶药剂。任选地,所述核酸酶药剂包括Cas蛋白和被设计成靶向人TTR基因中的向导RNA靶序列的向导RNA。任选地,所述Cas蛋白是Cas9蛋白。在一些此类方法中,所述人TTR靶向试剂包括外源性供体核酸,其中所述外源性供体核酸被设计成与所述人TTR基因重组。任选地,所述外源性供体核酸是单链寡脱氧核苷酸(ssODN)。在一些此类方法中,所述人TTR靶向试剂包括抗原结合蛋白。在一些此类方法中,所述人TTR靶向试剂包括RNAi药剂或反义寡核苷酸。
在一些此类方法中,评估所述人TTR靶向试剂在所述非人动物中的活性包括评估转甲状腺素蛋白活性。在一些此类方法中,所述评估是通过与未经处理的对照非人动物进行比较来进行的。
另一方面,提供了优化人TTR靶向试剂的体内活性的方法。此类方法可以包括:(I)在第一非人动物中第一次在体内执行评估人TTR靶向试剂的活性的上述方法中的任何方法;(II)改变变量并且在第二非人动物中用所改变变量第二次执行步骤(I)的方法;以及(III)将步骤(I)中的所述人TTR靶向试剂的活性与步骤(II)中的所述人TTR靶向试剂的活性进行比较,并且选择导致较高功效、较高精度、较高一致性或较高特异性的方法。此类方法可以包括:(I)在第一非人动物中第一次在体内执行评估人TTR靶向试剂的活性的上述方法中的任何方法,所述第一非人动物在其基因组中包括所述经基因修饰的内源性Ttr基因座;(II)改变变量并且在第二非人动物中用所改变变量第二次执行步骤(I)的方法,所述第二非人动物在其基因组中包括所述经基因修饰的内源性Ttr基因座;以及(III)将步骤(I)中的所述人TTR靶向试剂的活性与步骤(II)中的所述人TTR靶向试剂的活性进行比较,并且选择导致较高功效、较高精度、较高一致性或较高特异性的方法。
任选地,步骤(II)中的所述所改变变量是将所述人TTR靶向试剂引入到所述非人动物中的递送方法。任选地,步骤(II)中的所述所改变变量是将所述人TTR靶向试剂引入到所述非人动物中的施用途径。任选地,步骤(II)中的所述所改变变量是引入到所述非人动物中的所述人TTR靶向试剂的浓度或量。任选地,步骤(II)中的所述所改变变量是引入到所述非人动物中的所述人TTR靶向试剂的形式。任选地,步骤(II)中的所述所改变变量是引入到所述非人动物中的所述人TTR靶向试剂。
另一方面,提供了制备包括人源化TTR基因座的非人动物的方法。此类方法可以包括:(a)对多能性非人动物细胞的基因组进行修饰以包括经基因修饰的内源性Ttr基因座;(b)鉴定或选择包括所述经基因修饰的内源性Ttr基因座的所述经基因修饰的多能性非人动物细胞;(c)将所述经基因修饰的多能性非人动物细胞引入到非人动物宿主胚胎中;以及(d)在代孕母体中孕育所述非人动物宿主胚胎;此类方法可以可替代地包括:(a)对非人动物单细胞期胚胎的基因组进行修饰以包括经基因修饰的内源性Ttr基因座;(b)选择包括所述经基因修饰的内源性Ttr基因座的经基因修饰的非人动物单细胞期胚胎;以及(c)在代孕母体中孕育所述经基因修饰的非人动物单细胞期胚胎。
附图说明
图1A示出了小鼠、人野生型和人β滑移转甲状腺素蛋白(TTR)前体蛋白(分别为SEQID NO:5、1和9)的比对。指示信号肽、T4结合结构域、0位外显子/内含子边界和1/2位外显子/内含子边界,连同β滑移突变。
图1B示出了小鼠、人野生型和人β滑移转甲状腺素蛋白(TTR)编码序列(分别为SEQID NO:8、4和10)的比对。指示信号肽、T4结合结构域、0位外显子/内含子边界和1/2位外显子/内含子边界,连同β滑移突变。
图2示出了野生型鼠Ttr基因座、野生型人源化小鼠Ttr基因座(野生型人TTR)和突变人源化小鼠Ttr基因座(β滑移人TTR)的示意图(未按比例绘制)。指示外显子、内含子、5'非翻译区(UTR)、3'UTR、起始密码子(ATG)、终止密码子(TGA)和来自选择盒的loxP瘢痕。白框表示鼠序列;黑框表示人序列。
图3示出了产生突变体(β滑移)人源化小鼠Ttr基因座的靶向示意图(未按比例绘制)。示出了野生型小鼠Ttr基因座、具有自缺失新霉素(SDC-Puro)选择盒(MAID 8530)的突变人源化小鼠Ttr基因座的F0等位基因和具有来自SDC-Puro选择盒(MAID 8531)去除的loxP瘢痕的突变人源化小鼠Ttr基因座的F1等位基因。白框表示鼠序列;黑框表示人序列。
图4示出了用于筛选靶向小鼠Ttr基因座的策略的示意图(未按比例绘制),包含等位基因丢失测定(7576mTU、4552mTU、9212mTU、7655mTU、9090mTM、7576mTD、9212mTD和7655mTD)、等位基因获得测定(7576hTU、7655hTU、7576hTD、Puro)、保留测定(9204mretU、9090retU、9090retU2、9090retU3、9090retD、9090retD2、9090retD3、9204mretD)以及被设计成覆盖被CRISPR向导序列破坏的区域的CRISPR测定(9090mTGU、mGU、9090mTGD和mGD)。白框表示鼠序列;黑框表示人序列。
图5A-5D示出了在两个月龄的人源化TTR野生型小鼠、人源化TTRβ滑移小鼠和F1H4对照小鼠中的血浆hTTR水平(图5A)、血清总T4水平(图5B)、无血清T4水平(图5C)和体温(图5D)。用带圆圈的红色三角形标记肌张力障碍小鼠。通过ELISA测量TTR和T4水平。
图6A示出了在来自两个月龄的人源化TTRβ滑移小鼠的血浆样品的变性PAGE之后的蛋白质印迹。F1H4样品用作阴性对照,并且重组WT人TTR用作阳性对照。转铁蛋白用作上样对照。
图6B示出了来自两个月龄的人源化TTRβ滑移小鼠的血浆样品和来自两个月龄的人源化TTR野生型小鼠的样品的天然PAGE之后的蛋白质印迹。F1H4样品用作阴性对照,并且重组WT人TTR用作阳性对照。
图7A-7B示出了人源化TTRβ滑移小鼠的张力障碍表型。图7A示出了两个月龄的人源化TTRβ滑移小鼠、人源化TTR野生型小鼠和对照F1H4小鼠在刮洗之后的图片,以评估小鼠后肢相对于其体轴的角度。图7B示出了正常小鼠的数量和具有张力障碍表型的小鼠的数量的定量。用带圆圈的红点标记肌张力障碍小鼠。
图8A-8C示出了在旷场行为测试中来自两个月龄的人源化TTRβ滑移小鼠、人源化TTR野生型小鼠和对照F1H4小鼠的各种读数,包含总距离(图8A)、总活动(图8B)和直立次数(图8C)。
图9A-9B示出了两个月龄的人源化TTRβ滑移小鼠、人源化TTR野生型小鼠和对照F1H4小鼠的体重(图9A)和握力(图9B)。用带圆圈的红色三角形和点标记肌张力障碍小鼠。
图10A-10B示出了从两个月龄的人源化TTRβ滑移小鼠、人源化TTR野生型小鼠和对照F1H4小鼠分离的坐骨神经样品(图10A)和肝脏样品(图10B)中的刚果红染色。每个的顶部示出了在白光下成像的染色组织。每个的底部示出了使用线性偏振光照射的染色组织。
定义
本文可互换使用的术语“蛋白质”、“多肽”、和“肽”包含任何长度的聚合形式的氨基酸,包含编码氨基酸和非编码氨基酸以及以化学方式或生物化学方式修饰的氨基酸或以化学方式或生物化学方式衍生的氨基酸。这些术语还包含已经修饰的聚合物,如具有经修饰的肽骨架的多肽。术语“结构域”是指具有特定功能或结构的蛋白质或多肽的任何部分。
蛋白质被视为具有“N端”和“C端”。术语“N端”涉及蛋白质或多肽的开始,其终止于具有游离胺基(-NH2)的氨基酸。术语“C端”是指氨基酸链(蛋白质或多肽)的末端,其终止于游离羧基(-COOH)。
本文可互换使用的术语“核酸”和“多核苷酸”包含任何长度的聚合形式的核苷酸,包含核糖核苷酸、脱氧核糖核苷酸、或其类似物或经过修饰的版本。所述核苷酸包含单链、双链和多链DNA或RNA、基因组DNA、cDNA、DNA-RNA杂交体、和包括嘌呤碱基、嘧啶碱基或其它天然的、以化学方式修饰的、以生物化学方式修饰的、非天然的或衍生的核苷酸碱基的聚合物。
核酸被视为具有“5'末端”和“3'末端”,因为以使得一个单核苷酸戊糖环的5'磷酸通过磷酸二酯键在一个方向上与其相邻的单核苷酸戊糖环的3'氧附着的方式使单核苷酸反应以形成寡核苷酸。如果寡核苷酸的5'磷酸不与单核苷酸戊糖环的3'氧相连,那么将寡核苷酸的端称为“5'末端”。如果寡核苷酸的3'氧不与另一个单核苷酸戊糖环的5'磷酸相连,那么将寡核苷酸的端称为“3'末端”。即使核酸序列处于更大的寡核苷酸的内部,所述核酸序列也可以被视为具有5'末端和3'末端。在线性或环状DNA分子中,离散元件被称为“下游”或3'元件的“上游”或5'。
术语“基因组整合的”是指已被引入到细胞中使得核苷酸序列整合到细胞的基因组中的核酸。可以使用任何方案用于将核酸稳定地掺入到细胞的基因组中。
术语“表达载体”或“表达构建体”或“表达盒”是指含有期望编码序列的重组核酸,所述期望编码序列与在特定宿主细胞或生物体中表达可操作地连接的编码序列所必需的适当核酸序列可操作地连接。在原核生物中表达所必需的核酸序列通常包含启动子、操纵子(任选的)和核糖体结合位点以及其它序列。众所周知,真核细胞利用启动子、增强子以及终止信号和多聚腺苷酸化信号,但是在不牺牲必要表达的情况下可以删除一些元素并添加其它元素。
术语“靶向载体”是指可以通过同源重组、非同源末端连接介导的连结或任何其它重组方式引入到细胞基因组中的靶位置的重组核酸。
术语“病毒载体”是指包含至少一种病毒来源元素并包含足以或允许包装成病毒载体颗粒的元素的重组核酸。载体和/或颗粒可以用于在体外、离体或在体内将DNA、RNA或其它核酸转移到细胞中的目的。许多形式的病毒载体是已知的。
关于蛋白质、核酸和细胞的术语“分离的”包含相对于通常可以原位存在的其它细胞或生物体组分相对纯化的蛋白质、核酸和细胞,直至并且包含蛋白质、核酸或细胞的基本上纯的制剂。术语“分离的”还包含不具有天然存在的对应物的细胞、蛋白质和核酸,或者已经化学合成并且因此基本上未被其它蛋白质或核酸污染的蛋白质或核酸。术语“分离的”还包含已经从与蛋白质、核酸或细胞天然伴随的大多数其它细胞组分或生物体组分(例如,其它细胞蛋白、核酸或细胞或胞外组分)中分离或纯化的蛋白质、核酸或细胞。
术语“野生型”包含具有在正常(与突变、患病、改变等相比)状态或情况下发现的结构和/或活性的实体。野生型基因和多肽通常以多种不同形式(例如,等位基因)存在。
术语“内源性序列”是指天然存在于细胞或非人动物内的核酸序列。例如,非人动物的内源性Ttr序列是指天然存在于非人动物的Ttr基因座处的天然Ttr序列。
“外源性”分子或序列包含通常不以所述形式存在于细胞中的分子或序列。正常存在包含关于细胞的特定发育阶段和环境条件的存在。例如,外源性分子或序列可以包含细胞内对应的内源性序列的突变版本(如内源性序列的人源化版本),或者可以包含与细胞内的内源性序列相对应但形式不同(即,不在染色体内)的序列。相比之下,内源性分子或序列包含在特定环境条件下在特定发育阶段在特定细胞中通常以所述形式存在的分子或序列。
当在核酸或蛋白质的上下文中使用时,术语“异源的”指示核酸或蛋白质包括在同一分子中并非天然地一起出现的至少两个区段。例如,当关于核酸的段或蛋白质的区段使用时,术语“异源的”指示核酸或蛋白质包括在自然界中未发现彼此处于相同关系(例如,连接在一起)的两个或更多个子序列。举例来说,核酸载体的“异源”区域是在自然界中未发现与其它分子缔合的另一个核酸分子内或与其附着的核酸区段。例如,核酸载体的异源区域可以包含由在自然界中未发现与编码序列缔合的序列侧接的编码序列。同样地,蛋白质的“异源”区域是在自然界中未发现与其它肽分子缔合的另一个肽分子(例如,融合蛋白或具有标签的蛋白质)内或与其附着的氨基酸的区段。相似地,核酸或蛋白质可以包括异源标记或异源分泌或定位序列。
“密码子优化”利用密码子的简并性,如指定氨基酸的三碱基对密码子组合的多样性所展示的,并且通常包含通过用宿主细胞的基因中更频繁或最频繁使用的密码子置换天然序列的至少一个密码子同时维持天然氨基酸序列来修饰核酸序列以在特定宿主细胞中增强表达的过程。例如,与天然存在的核酸序列相比,可以修饰对Cas9蛋白进行编码的核酸以置换在给定的原核或真核细胞中具有更高使用频率的密码子,包含细菌细胞、酵母细胞、人细胞、非人细胞、哺乳动物细胞、啮齿动物细胞、小鼠细胞、大鼠细胞、仓鼠细胞或任何其它宿主细胞。密码子使用表例如在“密码子使用数据库”处很容易获得。这些表可以通过多种方式进行修改。参见Nakamura等人(2000),《核酸研究(Nucleic Acids Research)》28:292,所述文献出于所有目的通过引用整体并入本文。也可获得用于在特定宿主中表达的特定序列的密码子优化的计算机算法(参见例如,《基因伪造(Gene Forge)》)。
术语“基因座”是指基因(或显著序列)、DNA序列、多肽编码序列或生物体的基因组的染色体上的位置的特异性定位。例如,“Ttr基因座”可以指在已经被鉴定为此类序列位于何处的生物体的基因组的染色体上的Ttr基因、Ttr DNA序列、转甲状腺素蛋白编码序列或Ttr位置的特异性定位。“Ttr基因座”可以包括Ttr基因的调控元件,包含例如增强子、启动子、5'和/或3'非翻译区(UTR)或其组合。
术语“基因”是指染色体中的对产物(例如,RNA产物和/或多肽产物)进行编码并且包含被非编码内含子中断的编码区域和定位于5'末端和3'末端两者上的编码区附近而使得基因与全长mRNA(包含5'和3'非翻译序列)相对应的序列的DNA序列。术语“基因”还包含其它非编码序列,所述其它非编码序列包含调控序列(例如,启动子、增强子和转录因子结合位点)、聚腺苷酸化信号、内部核糖体进入位点、沉默子、绝缘序列和基质附着区可以存在于基因中。这些序列可以靠近基因的编码区域(例如,在10kb内)或处于远处的位点,并且所述序列影响基因的转录和翻译的水平或速率。
术语“等位基因”是指基因的变体形式。一些基因具有多种不同的形式,所述基因定位于染色体上的相同位置或基因位点处。二倍体生物体在每个基因座处具有两个等位基因。每对等位基因表示特异性基因座的基因型。如果在特定基因座处有两个相同的等位基因,则基因型被描述为纯合的,如果两个等位基因不同,则基因型被描述为杂合的。
基因的“编码区”或“编码序列”由编码蛋白质的外显子构成的基因的DNA或RNA的部分组成。所述区域在5'末端的起始密码子处开始并且在3'末端的终止密码子处结束。
“启动子”是DNA的调控区,其通常包括能够指导RNA聚合酶II在特定多核苷酸序列的适当转录起始位点处起始RNA合成的TATA盒。启动子可以另外包括影响转录起始速率的其它区域。本文所公开的启动子序列调节可操作连接的多核苷酸的转录。启动子可以在本文所公开的细胞类型(例如,真核细胞、非人哺乳动物细胞、人细胞、啮齿动物细胞、多能性细胞、单细胞期胚胎、分化细胞或其组合)中的一种或多种细胞类型中具有活性。启动子可以是例如组成型活性启动子、条件型启动子、诱导型启动子、时间受限启动子(例如,受发育调控的启动子)或空间受限启动子(例如,细胞特异性或组织特异性启动子)。启动子的实例可以例如在WO 2013/176772中找到,所述文献出于所有目的通过引用整体并入本文。
“可操作的连接”或“可操作地连接”包含将两种或多种组分(例如启动子和另一种序列元件)并置使得两种组分正常发挥功能,并使得至少一种组分能够介导施加在至少一种其它组分上的功能。例如,如果启动子响应于存在或不存在一种或多种转录调控因子而控制编码序列的转录水平,则所述启动子可以与编码序列可操作地连接。可操作的连接可以包含这些彼此相邻或以反式作用的序列(例如,调控序列可以在一定距离处起作用以控制编码序列的转录)。
核酸的“互补性”意味着由于其核碱基团的取向,一条核酸链中的核苷酸序列与另一条相对核酸链上的序列形成氢键。DNA中的互补碱基通常是A与T和C与G。在RNA中,其通常是C与G和U与A。互补可以是完美的或者实质性的/足够的。两个核酸之间的完美互补意味着所述两个核酸可以形成双链体,其中双链体中的每个碱基都通过沃森-克里克配对(Watson-Crick pairing)与互补碱基键合。“基本上”或“足够”互补意味着一条链中的序列与相对链中的序列不完全和/或完全互补,但两条链上的碱基之间发生足够的键合以在一组杂交条件下形成稳定的杂合复合物(例如,盐浓度和温度)。此类条件可以通过使用序列和标准数学计算来预测杂交链的Tm(熔融温度),或通过使用常规方法的Tm经验测定来预测。Tm包含在两条核酸链之间形成的杂交复合物群变性50%(即,双链核酸分子群半解离成单链)时的温度。在低于Tm的温度下,有利于杂交复合物的形成,而在高于Tm的温度下,有利于杂交复合物中的链的熔融或分离。可以通过使用例如Tm=81.5+0.41(%G+C)来估计在1MNaCl水溶液中具有已知G+C含量的核酸的Tm,但是其它已知的Tm计算考虑了核酸结构特性。
“杂交条件”包含其中一条核酸链通过互补链相互作用和氢键与第二核酸链键合,以产生杂交复合物的累积环境。此类条件包含含有核酸的水性或有机溶液的化学组分和其浓度(例如,盐、螯合剂、甲酰胺)以及混合物的温度。如温育时间的长度或反应室尺寸等其它因素可能对环境产生影响。参见例如,Sambrook等人,《分子克隆:实验室手册(MolecularCloning,A Laboratory Manual)》,第2版,第1.90-1.91,9.47-9.51,1 1.47-11.57页(纽约冷泉港的冷泉港实验室出版社(Cold Spring Harbor Laboratory Press,Cold SpringHarbor,N.Y.),1989),所述文献出于所有目的通过引用整体并入本文。
尽管碱基之间的错配是可能的,但是杂交要求所述两个核酸含有互补序列。适用于两种核酸之间的杂交的条件取决于核酸的长度和互补程度,这是众所周知的变量。两个核苷酸序列之间的互补程度越大,具有这些序列的核酸杂交体的解链温度(Tm)值就越大。对于具有较短互补段(例如,在35个或更少、30个或更少、25个或更少、22个或更少、20个或更少或18个或更少的核苷酸上互补)的核酸之间的杂交,错配位置变得尤为重要(参见Sambrook等人,同上,11.7-11.8)。通常,可杂交核酸的长度为至少约10个核苷酸。可杂交核酸的说明性最小长度包含至少约15个核苷酸、至少约20个核苷酸、至少约22个核苷酸、至少约25个核苷酸和至少约30个核苷酸。此外,可以根据如互补区的长度和互补程度等因素,根据需要调整温度和洗涤溶液盐浓度。
多核苷酸序列不必与其可特异性杂交的靶核酸具有100%互补性。此外,多核苷酸可以在一个或多个段上杂交,使得插入或相邻段不参与杂交事件(例如,环结构或发夹结构)。多核苷酸(例如,gRNA)可以包括与其靶向的靶核酸序列内的靶区域的至少70%、至少80%、至少90%、至少95%、至少99%或100%的序列互补性。例如,其中20个核苷酸中的18个与靶区域互补并因此特异性杂交的gRNA将表示90%的互补性。在此实施例中,剩余的非互补核苷酸可以与互补核苷酸成簇或散布并且不需要彼此相邻或与互补核苷酸相邻。
可以使用默认设置,使用BLAST程序(基本局部比对搜索工具)和PowerBLAST程序(Altschul等人,(1990)《分子生物学杂志(J.Mol.Biol.)》215:403-410;Zhang和Madden(1997),《基因组研究(Genome Res.)》7:649-656),所述文献中的每个文献出于所有目的通过引用整体并入本文)或使用Gap程序(威斯康星州麦迪逊大学研究园的基因学计算机组的Unix版本8的威斯康星序列分析包(Wisconsin Sequence Analysis Package,Version8for Unix,Genetics Computer Group,University Research Park,Madison Wis.))来常规确定核酸内特定核酸序列段之间的互补性百分比,其使用史密斯和沃特曼(Smith andWaterman)算法(1981)《应用数学进展(Adv.Appl.Math.)》2:482-489,所述文献出于所有目的通过引用整体并入本文。
本文所提供的方法和组合物采用多种不同的组分。贯穿说明书的一些组分可以具有活性变体和片段。此类组分包含例如Cas蛋白、CRISPR RNA、tracrRNA和向导RNA。这些组分中的每个组分的生物活性在本文其它地方描述。术语“功能性”是指蛋白质或核酸(或其片段或变体)表现出生物活性或功能的先天能力。此类生物活性或功能可以包含例如Cas蛋白结合向导RNA和靶DNA序列的能力。与原始分子相比,功能性片段或变体的生物学功能可以相同或实际上可以改变(例如,关于其特异性或选择性或功效)但保留分子的基本生物学功能。
术语“变体”是指与群体中最普遍的序列不同的核苷酸序列(例如,相差一个核苷酸)或与群体中最普遍的序列不同的蛋白质序列(例如,相差一个氨基酸)。
当提及蛋白质时,术语“片段”意指比全长蛋白质更短或具有更少氨基酸的蛋白质。当提及核酸时,术语“片段”意指比全长核酸更短或具有更少核苷酸的核酸。当提及蛋白质片段时,片段可以是例如N端片段(即,去除蛋白质的C末端的一部分)、C端片段(即,去除蛋白质的N末端的一部分)或内部片段(即,去除蛋白质的N末端和C末端中的每个末端的一部分)。当提及核酸片段时,片段可以是例如5'片段(即,去除核酸的3'末端的一部分)、3'片段(即,去除核酸的5'末端的一部分)或内部片段(即,去除核酸的5'末端和3'末端中的每个末端的一部分)。
“序列同一性”或“同一性”在两个多核苷酸或多肽序列的上下文中是指当在指定的比较窗口上出于最大对应进行比对时两个序列中相同的残基。当提及蛋白质的序列同一性的百分比时,不相同的残基位置通常因保守性氨基酸取代而不同,其中氨基酸残基被具有相似化学性质(例如,电荷或疏水性)的其它氨基酸残基取代,因此不改变分子的功能性质。当序列的保守性取代不同时,可以将百分比序列同一性向上调整以校正取代的保守性质。因此类保守性取代而不同的序列被视为具有“序列相似性”或“相似性。”用于进行这种调整的方法众所周知。通常,这涉及将保守性取代计为部分错配而不是完全错配,从而增加百分比序列同一性。因此,例如,当相同氨基酸的所得得分为1,非保守性取代的所得得分为零时,保守性取代的所得得分介于零与1之间。例如,通过在项目PC/GENE(加利福尼亚州山景城的Intelligenetics公司(Intelligenetics,Mountain View,California))中的实施方式计算保守性取代的得分。
“序列同一性百分比”包含通过在比较窗口上比较两个最佳比对序列测定的值(完全匹配残基的最大数量),其中在比较窗口中的多核苷酸序列部分与参考序列(不包括添加物或缺失部分)相比可以包括添加物或缺失部分(即缺口),以实现两个序列的最佳比对。通过测定在两个序列中出现相同核酸碱基或氨基酸残基的位置数计算百分比来得到匹配位置数,用匹配位置数除以比较窗口中的位置总数,并将结果乘以100以得到序列同一性的百分比。除非另有说明(例如,较短的序列包含连接的异源序列),否则所述比较窗口为两个所比较序列中较短序列的全长。
除非另有说明,否则序列同一性/相似性值包含使用以下参数使用第10版GAP获得的值:使用GAP权重50、长度权重3以及nwsgapdna.cmp得分矩阵的核苷酸序列的同一性百分比和相似性百分比;使用GAP权重8和长度权重2以及BLOSUM62得分矩阵的氨基酸序列的同一性百分比和相似性百分比;或其任何等效程序。“等效程序”包含当与第10版GAP生成的对应比对进行比较时针对所讨论的任何两个序列产生具有相同核苷酸或氨基酸残基匹配和相同百分比序列同一性的比对的任何序列比较程序。
术语“保守性氨基酸取代”是指用具有相似大小、电荷或极性的不同氨基酸取代序列中正常存在的氨基酸。保守性取代的实例包含用非极性(疏水性)残基(如异亮氨酸、缬氨酸或亮氨酸)取代另一种非极性残基。同样地,保守性取代的实例包含用一种极性(亲水性)残基取代另一种极性残基,如精氨酸与赖氨酸之间的极性残基、谷氨酰胺与天冬酰胺之间的极性残基或甘氨酸与丝氨酸之间的极性残基。另外,用碱性残基(如赖氨酸、精氨酸或组氨酸)取代另一种碱性残基或者用一种酸性残基(如天冬氨酸或谷氨酸)取代另一种酸性残基是保守性取代另外的实例。非保守性取代的实例包含用非极性(疏水性)氨基酸残基(如异亮氨酸、缬氨酸、亮氨酸、丙氨酸或甲硫氨酸)取代极性(亲水性)残基(如半胱氨酸、谷氨酰胺、谷氨酸或赖氨酸)和/或用极性残基取代非极性残基。典型的氨基酸分类总结如下表1。
表1:氨基酸分类。
Figure BDA0003371335300000161
“同源”序列(例如,核酸序列)包含与已知参考序列相同或基本上相似的序列,使得其例如与已知参考序列具有至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%同一性。同源序列可以包含例如直系同源序列和旁系同源序列。例如,同源基因通常通过物种形成事件(直系同源基因)或基因复制事件(旁系同源基因)从共同的祖先DNA序列下降。“直系同源”基因包含不同物种中通过物种形成从共同祖先基因进化而来的基因。直系同源物通常在进化过程中保留相同的功能。“旁系同源”基因包含通过基因组内的复制相关的基因。旁系同源物可以在进化过程中进化出新的功能。
术语“体外(in vitro)”包含人工环境以及在人工环境(例如,试管或分离的细胞或细胞系)内发生的过程或反应。术语“体内(in vivo)”包含自然环境(例如,细胞、生物体或身体)以及在自然环境内发生的过程或反应。术语“离体”包含已从个体体内取出的细胞以及在此类细胞内发生的过程或反应。
术语“报告基因”是指具有对基因产物(通常是酶)进行编码的序列的核酸,当包括与内源或异源启动子和/或增强子元件可操作地连接的报告基因序列的构建体被引入到含有(或者可以使其含有)激活启动子和/或增强子元件所必需的因子的细胞中时,所述核酸易于且可定量地进行测定。报告基因的实例包含但不限于对β-半乳糖苷酶(lacZ)进行编码的基因、细菌氯霉素乙酰转移酶(cat)基因、萤火虫荧光素酶基因、对β-葡萄糖醛酸酶(GUS)进行编码的基因和对荧光蛋白进行编码的基因。“报告蛋白”是指由报告基因编码的蛋白质。
如本文所使用的,术语“荧光报告蛋白”意指基于荧光可检测的报告蛋白,其中荧光可以直接来自报告蛋白、报告蛋白在荧光底物上的活性,或对与荧光标记的化合物结合具有亲和力的蛋白质。荧光蛋白的实例包含绿色荧光蛋白(例如,GFP、GFP-2、tagGFP、turboGFP、eGFP、祖母绿(Emerald)、Azami绿、单体Azami绿、CopGFP、AceGFP和ZsGreenl)、黄色荧光蛋白(例如,YFP、eYFP、柠檬黄、Venus、YPet、PhiYFP和ZsYellowl)、蓝色荧光蛋白(例如,BFP、eBFP、eBFP2、石青、mKalamal、GFPuv、天蓝色和T-天蓝色(T-sapphire))、青色荧光蛋白(例如CFP、eCFP、蔚蓝色(Cerulean)、CyPet、AmCyanl和Midoriishi-青色)、红色荧光蛋白(例如,RFP、mKate、mKate2、mPlum、DsRed单体、mCherry、mRFP1、DsRed-表达、DsRed2、DsRed-单体、HcRed-Tandem、HcRedl、AsRed2、eqFP611、mRaspberry、mStrawberry和Jred)、橙色荧光蛋白(例如,mOrange、mKO、Kusabira-橙色、单体Kusabira-橙色、mTangerine和tdTomato),以及可以通过流式细胞术方法检测到细胞中存在的任何其它合适的荧光蛋白。
响应于双链断裂(DSB)的修复主要通过两个保守的DNA修复途径发生:同源重组(HR)和非同源末端连接(NHEJ)。参见Kasparek和Humphrey(2011)《细胞与发育生物学研讨会(Seminars in Cell&Dev.Biol.)》22:886-897,所述文献出于所有目的通过引用整体并入本文。同样地,由外源性供体核酸介导的靶核酸的修复可以包含两种多核苷酸之间的任何基因信息交换过程。
术语“重组”包含两个多核苷酸之间的任何基因信息交换过程,并且可以通过任何机制发生。重组可以通过同源定向修复(HDR)或同源重组(HR)发生。HDR或HR包含可能需要核苷酸序列同源性的核酸修复形式,使用“供体”分子作为模板来修复“靶”分子(即经历双链断裂的分子),并且导致将基因信息从供体转移到靶标。不希望受任何特定理论的束缚,这种转移可以涉及在断裂的靶与供体之间形成的异源双链DNA的错配校正和/或合成依赖性链退火(synthesis-dependent strand annealing),其中供体用于重新合成将成为靶的一部分的基因信息和/或相关过程。在一些情况下,供体多核苷酸、供体多核苷酸的一部分、供体多核苷酸的副本或者供体多核苷酸的副本的一部分被整合到靶DNA中。参见Wang等人(2013)《细胞(Cell)》153:910-918;Mandalos等人(2012)《公共科学图书馆·综合(PLOSONE)》7:e45768:1-9;以及Wang等人(2013)《自然生物技术(Nat Biotechnol.)》31:530-532,所述文献中的每个文献出于所有目的通过引用整体并入本文。
非同源末端连接(NHEJ)包含在不需要同源模板的情况下通过将断裂端直接彼此连接或与外源性序列连接来修复核酸中的双链断裂。通过NHEJ连接非连续序列通常会导致双链断裂位点附近的缺失、插入或易位。例如,NHEJ还可以通过断裂末端与外源性供体核酸的末端的直接连接(即,基于NHEJ的捕获)导致外源性供体核酸的靶向整合。当同源定向修复(HDR)途径不易使用时(例如,在非分裂细胞、原代细胞和执行基于同源性的DNA修复不佳的细胞中),此类NHEJ介导的靶向整合可以优选用于插入外源性供体核酸。另外,与同源定向修复相反,不需要关于侧接切割位点的序列同一性的大区域的知识,这在尝试靶向插入到具有基因组序列知识有限的基因组的生物体中时可能是有益的。整合可以通过连接外源性供体核酸与切割的基因组序列之间的平末端来进行,或者通过使用外源性供体核酸连接粘性末端(即,具有5'或3'突出端)来进行,所述外源性供体核酸侧接有与由切割的基因组序列中的核酸酶药剂产生的突出端相容的突出端。参见例如,US 2011/020722、WO 2014/033644、WO 2014/089290以及Maresca等人(2013),《基因组研究》23(3):539-546,所述文献中的每个文献出于所有目的通过引用整体并入本文。如果连接平末端,则可能需要切除靶标和/或供体以产生片段连接所需的微同源性区域,这可能会在靶序列中产生不想要的改变。
术语“抗原结合蛋白”包含与抗原结合的任何蛋白质。抗原结合蛋白的实例包含抗体、抗体的抗原结合片段、多特异性抗体(例如,双特异性抗体)、scFV、双-scFV、双抗体、三抗体、四抗体、V-NAR、VHH、VL、F(ab)、F(ab)2、DVD(双可变结构域抗原结合蛋白)、SVD(单可变结构域抗原结合蛋白)、双特异性T细胞衔接蛋白(BiTE)或戴维斯体(Davisbody)(美国专利第8,586,713号,所述文献出于所有目的通过引用整体并入本文)。
术语“抗原”是指一种物质,无论是整个分子还是分子内的结构域,其能够引发与所述物质具有结合特异性的抗体的产生。术语抗原还包含在野生型宿主生物体中不会通过自我识别引发抗体产生但可以通过适当的基因工程在宿主动物中引发这种反应以破坏免疫耐受的物质。
术语“表位”是指抗原上与抗原结合蛋白(例如,抗体)结合的位点。表位可以由连续氨基酸或通过一种或多种蛋白质的三级折叠而并置的非连续氨基酸形成。由连续氨基酸形成的表位(也被称为线性表位)通常在暴露于变性溶剂时保留,而由三级折叠形成的表位(也被称为构象表位)通常在用变性溶剂处理时丢失。在独特的空间构象中,表位典型地包含至少3个(并且更常见地,至少5个或8-10个)氨基酸。确定表位的空间构象的方法包含例如X射线晶体学和2维核磁共振。参见例如,Glenn E.Morris编辑的《分子生物学方法(Methods in Molecular Biology)》第66卷中的《表位作图指南(Epitope MappingProtocols)》(1996),所述文献出于所有目的通过引用整体并入本文。
如本文所述的抗体互补位通常至少包括特异性识别异源表位的互补决定区(CDR)(例如,重链和/或轻链可变结构域的CDR3区)。
术语“抗体”包含包括通过二硫键相互连接的四个多肽链、两个重(H)链和两个轻(L)链的免疫球蛋白分子。每个重链包括重链可变结构域和重链恒定区(CH)。重链恒定区包括三个结构域:CH1、CH2和CH3。每个轻链包括轻链可变结构域和轻链恒定区(CL)。重链和轻链可变结构域可以进一步细分为穿插有被称为构架区(FR)的更保守区域的被称为互补性决定区(CDR)的高变区。每个重链和轻链可变结构域包括三个CDR和四个FR,其从氨基端到羧基端按以下顺序布置:FR1、CDR1、FR2、CDR2、FR3、CDR3、FR4(重链CDR可以缩写为HCDR1、HCDR2和HCDR3;轻链CDR可以缩写为LCDR1、LCDR2和LCDR3)。术语“高亲和力”抗体是指相对于其靶表位KD约为10-9M或更低(例如,约1×10-9M、1×10-10M、1×10-11M或约1×10-12M)的抗体。在一个实施例中,KD是通过表面等离子体共振,例如,BIACORETM来测量的;在另一个实施例中,KD是通过ELISA来测量的。
抗原结合蛋白与其靶抗原的特异性结合包含以至少106、107、108、109或1010M-1的亲和力的结合。特异性结合在量级上可检测地更高,并且可区别于针对至少一种不相关靶标发生的非特异性结合。特异性结合可以是特定官能团之间键的形成或特定空间配合(例如,锁和钥匙类型)的结果,而非特异性结合通常是范德华力(van der Waals force)的结果。然而,特异性结合不一定暗示抗原结合蛋白结合一个且仅一个靶标。
术语“反义RNA”是指与在细胞中转录的信使RNA链互补的单链RNA。
术语“小干扰RNA(siRNA)”是指诱导RNA干扰(RNAi)途径的典型双链RNA分子。这些分子的长度可以变化(通常介于18-30个碱基对之间)并且含有与其反义链中的靶mRNA的不同程度的互补性。一些但不是全部siRNA在有义链和/或反义链的5'末端或3'末端上具有未配对的突出碱基。术语“siRNA”包含两条单独的链的双链体,以及可以形成包括双链体区的发夹结构的单链。双链结构的长度可以例如小于20个、25个、30个、35个、40个、45个或50个核苷酸。例如,双链结构的长度可以为约21-23个核苷酸、约19-25个核苷酸或约19-23个核苷酸。
术语“短发夹RNA(shRNA)”是指在发夹结构中自杂交并且可以在加工时诱导RNA干扰(RNAi)途径的单链RNA碱基。这些分子的长度可以变化(通常长度为约50-90个核苷酸,或在一些情况下长度至多大于250个核苷酸,例如对于微RNA适应的shRNA)。shRNA分子在细胞内被加工以形成siRNA,其进而可以敲低基因表达。shRNA可以整合到载体中。术语“shRNA”还指可以从中转录短的发夹RNA分子的DNA分子。
“包括(comprising)”或“包含(including)”一个或多个所列举的元件的组合物或方法可以包含其它未具体列举的元件。例如,“包括”或“包含”蛋白质的组合物可以单独含有蛋白质或与其它成分组合的蛋白质。过渡短语“基本上由……组成”意指权利要求的范围应被解释为涵盖权利要求中所列举的指定要素以及对要求保护的发明的基本和新颖特性没有实质性影响的那些要素。因此,当在本发明的权利要求中使用时,术语“基本上由……组成”不应被解释为等效于“包括”。
“任选的(optional)”或“任选地(optionally)”是指随后描述的事件或情况可能发生或可能不发生并且此描述包含其中所述事件或情况发生的实例以及其中所述事件或情况不发生的实例。
数值范围的指定包含所述范围内或定义所述范围的所有整数以及由所述范围内的整数定义的所有子范围。
除非从上下文中明显看出,否则术语“约”涵盖规定值的标准测量误差范围(例如,SEM)内的值。
术语“和/或”是指并且涵盖关联的所列项中的一个或多个所列项的任何和所有可能组合以及在以替代性方案(“或”)解释时组合的缺少。
术语“或”是指特定列表中的任何一个成员,并且还包含所述列表成员的任何组合。
除非上下文另外明确指明,否则本文中的单数形式“一个(a)”、“一种(an)”和“所述(the)”包含复数个提及物。例如,术语“蛋白质”或“至少一种蛋白质”可以包含多种蛋白质,包含其混合物。
统计学上显著意指p≤0.05。
具体实施方式
I.概述
本文中公开了包括包含β滑移突变的人源化TTR基因座的非人动物细胞和非人动物以及使用此类非人动物细胞和非人动物的方法。本文中还公开了制备此类非人动物细胞和非人动物的方法。本文中还公开了包括包含β滑移突变的人源化TTR基因座的非人动物基因组以及使用此类非人动物基因组的方法。本文中还公开了包括β滑移突变的人源化非人动物TTR基因和核酸酶药剂以及用于使非人动物TTR基因人源化的靶向载体。包括包含β滑移突变的人源化TTR基因座的非人动物细胞或非人动物表达人转甲状腺素蛋白或包括人转甲状腺素蛋白的一个或多个片段的嵌合转甲状腺素蛋白。包括包含β滑移突变的人源化TTR基因座的非人动物非常早地患上淀粉样变性。例如,包括包含β滑移突变的人源化TTR基因座的小鼠早在约两个月龄时就患上淀粉样变性。这是第一个报道的体内TTR淀粉样变性模型如此迅速地患上淀粉样变性。此类非人动物细胞和非人动物可以用于离体或体内评估人TTR靶向药剂(例如,CRISPR/Cas9基因组编辑药剂)的递送或功效,并且可以用于离体或体内优化此类药剂的功效递送的方法中。
在本文所公开的一些非人动物细胞和非人动物中,大多数或全部非人动物基因组DNA被直系同源人基因组DNA逐一替代。与具有cDNA插入的非人动物相比,当保持内含子-外显子结构和剪接机制时,表达水平应该更高,因为保守的调控元件更有可能保持完整,并且经过RNA加工的剪接转录物比cDNA更稳定。相比之下,将人TTR cDNA(例如,连同在5'UTR中插入人工β球蛋白内含子)插入非人动物Ttr基因座将消除保守调控元件,如包含在非人动物Ttr的第一外显子和内含子内的调控元件。用直系同源人基因组序列替代非人动物基因组序列更有可能导致来自内源性Ttr基因座的转基因的忠实表达。相似地,在随机基因组基因座而非内源性非人动物Ttr基因座处具有人TTR编码序列的转基因插入的转基因非人动物将不会准确地反映Ttr表达的内源性调控。通过用直系同源人基因组DNA逐一替代大多数或全部非人动物基因组DNA而产生的人源化TTR等位基因将提供人TTR靶向试剂(例如,被设计成靶向人TTR的CRISPR/Cas9试剂)的真实人靶标或真实人靶标的近似靶标,由此能够测试此类药剂在活体动物中的功效和作用模式以及在人源化蛋白质和人源化基因是存在的TTR的唯一版本的背景下的药物代谢动力学和药效动力学研究。
II.包括包含β滑移突变的人源化TTR基因座的非人动物
本文所公开的细胞和非人动物包括包含β滑移突变的人源化TTR基因座。包括包含β滑移突变的人源化TTR基因座的细胞或非人动物表达人转甲状腺素蛋白或部分人源化的嵌合转甲状腺素蛋白,其中天然转甲状腺素蛋白的一个或多个片段已经被来自人转甲状腺素蛋白的对应片段替代。
A.转甲状腺素蛋白(TTR)
本文所述的细胞和非人动物包括包含β滑移突变的人源化转甲状腺素蛋白(Ttr)基因座。转甲状腺素蛋白(TTR)是一种127-氨基酸、55kDa血清和脑脊液转运蛋白,主要由肝脏合成,但也由脉络丛产生。其还被称为前白蛋白、甲状腺素结合前白蛋白、ATTR、TBPA、CTS、CTS1、HEL111、HsT2651和PALB。在其天然状态下,TTR以四聚体的形式存在。在纯合子中,同源四聚体包括相同的富含127-氨基酸β片层亚基。在杂合子中,TTR四聚体可以由变体和/或野生型亚基组成,通常以统计学方式组合。TTR负责在血清和脑脊液中携带甲状腺素(T4)和视黄醇结合的RBP(视黄醇结合蛋白)。
除非从上下文另外显而易见,否则提及人转甲状腺素蛋白(TTR)或其片段或结构域包含天然的野生型人氨基酸序列,包含其同种型和等位基因变体。转甲状腺素蛋白前体蛋白包含信号序列(通常为20个氨基酸),而成熟的转甲状腺素蛋白不包含信号序列。示例性TTR多肽序列由登录号NP_000362.1(NCBI)和P02766.1(UniProt)(相同的,各自列示SEQID NO:1)指定。残基可以根据UniProt登录号P02766.1进行编号,其中成熟蛋白的第一个氨基酸(即,不包含20个氨基酸信号序列)指定为残基1。在任何其它TTR蛋白中,残基根据UniProt登录号P02766.1中在最大比对时的对应残基进行编号。
人TTR基因位于18号染色体上并且包含四个外显子和三个内含子。示例性人TTR基因来自由GenBank登录号NG_009490.1(SEQ ID NO:3)指定的序列中的残基5001-12258。SEQID NO:3中的四个外显子分别包含残基1-205、1130-1260、3354-3489和6802-7258。SEQ IDNO:3中的TTR编码序列包含残基137-205、1130-1260、3354-3489和6802-6909。示例性人TTRmRNA由NCBI登录号NM_000371.3(SEQ ID NO:2)指定。SEQ ID NO:10中示出了对包括G53S/E54D/L55Sβ滑移突变的TTR蛋白进行编码的示例性人TTR编码序列。在SEQ ID NO:9中示出了包括G53S/E54D/L55Sβ滑移突变的转甲状腺素蛋白前体蛋白。
小鼠Ttr基因位于18号染色体上并且还包含四个外显子和三个内含子。示例性小鼠Ttr基因来自由GenBank登录号NC_000084.6(SEQ ID NO:7)指定的序列的残基20665250到20674326。SEQ ID NO:7中的四个外显子分别包含残基1-258、1207-1337、4730-4865和8382-9077。SEQ ID NO:7中的Ttr编码序列包含残基190-258、1207-1337、4730-4865和8382-8489。示例性小鼠TTR蛋白由UniProt登录号P07309.1或NCBI登录号NP_038725.1(相同的,各自列示SEQ ID NO:5)指定。示例性小鼠Ttr mRNA由NCBI登录号NM_013697.5(SEQID NO:6)指定。
示例性大鼠TTR蛋白由UniProt登录号P02767指定。示例性猪TTR蛋白由UniProt登录号P50390指定。示例性鸡TTR蛋白由UniProt登录号P27731指定。示例性奶牛TTR蛋白由UniProt登录号O46375指定。示例性绵羊TTR蛋白由UniProt登录号P12303指定。示例性黑猩猩TTR蛋白由UniProt登录号Q5U7I5指定。示例性猩猩TTR蛋白由UniProt登录号Q5NVS2指定。示例性兔TTR蛋白由UniProt登录号P07489指定。示例性食蟹猴(猕猴)TTR蛋白由UniProt登录号Q8HXW1指定。
转甲状腺素蛋白(TTR)淀粉样变性是一种系统性病症,其特征在于致病性、错误折叠的TTR和由TTR构成的淀粉样蛋白原纤维的胞外沉积。TTR淀粉样变性通常是由天然TTR四聚体形式的去稳定(由于环境或基因条件)引起的,从而导致TTR的解离、错误折叠和聚集成淀粉样蛋白原纤维,所述淀粉样蛋白原纤维积聚在各种器官和组织中,引起进行性功能障碍。这些解离的单体具有形成错误折叠的蛋白质聚集体和淀粉样蛋白原纤维的倾向。
在人中,野生型TTR四聚体和由突变型和野生型亚基组成的混合四聚体两者均可以解离、错误折叠和聚集,其中淀粉样变性的过程导致有丝分裂后组织的退化。因此,TTR淀粉样变性涵盖由致病性错误折叠的TTR引起的疾病,所述致病性错误折叠的TTR是由TTR中的突变引起的或由非突变的错误折叠的TTR引起的。
老年系统性淀粉样变性(SSA)和老年心脏淀粉样变性(SCA)是由心脏心肌细胞外部和内部的野生型TTR淀粉样蛋白沉积引起的年龄相关类型的淀粉样变性。TTR淀粉样变性也是遗传性(家族性)淀粉样变性的最常见形式,其是由使TTR蛋白不稳定的突变引起的。与TTR基因中的点突变相关的TTR淀粉样变性包含家族性淀粉样蛋白多发性神经病(FAP)、家族性淀粉样蛋白心肌病(FAC)和中枢神经系统选择性淀粉样变性(CNSA)。
B.包括β滑移突变的人源化TTR基因座
本文所述的人源化TTR基因座包括β滑移突变。β滑移突变的实例是描述由人转甲状腺素蛋白三重突变体G53S/E54D/L55S引起的构象变化的突变。此处和下文的残基的编号是指没有信号肽的成熟人转甲状腺素蛋白中的编号(例如,在转甲状腺素蛋白前体蛋白的残基21处开始,因此转甲状腺素蛋白前体蛋白中的这些残基将分别是残基73、74和75)。β链D中的三残基移位将L58置于通常由L55占据的位置处。这导致对包括残基S50-G63的CD环、β链D和DE环区域中的相邻残基的结构后果,但是使β链C的位置保持完整。参见Eneqvist等人(2000),《分子细胞(Mol.Cell)》6:1207-1218,所述文献出于所有目的通过引用整体并入本文。G53S/E54D/L55S变体在生理条件下自发聚合并产生高分子量聚集体,其显示淀粉样蛋白的所有特性,除了其仍然是可溶的之外。G53S/E54D/L55S变体结合硫黄素T和刚果红,对胰蛋白酶具有升高的敏感性,并且形成纤丝结构,其产生与交叉β结构一致的纤维衍射图谱。参见Eneqvist等人(2000),《分子细胞》6:1207-1218,所述文献出于所有目的通过引用整体并入本文。
通常,如在本文中提及的β滑移突变包括引起TTR蛋白的β链D中的移位的突变。β链D是指当与人TTR蛋白进行最佳比对时,人TTR蛋白或非人TTR蛋白的对应区域中的β链D。例如,当突变的TTR蛋白与人TTR蛋白进行最佳比对时,突变可以引起β链D中的三残基移位,所述三残基移位将与人TTR中的残基L58相对应的残基置于通常被与人TTR中的残基L55相对应的残基占据的位置处。更具体地,当突变的TTR蛋白与人TTR蛋白进行最佳比对时,β滑移突变可以是与人TTR蛋白中的G53S/E54D/L55S相对应的三重突变。内源性Ttr基因(或TTR蛋白)中的残基(例如,核苷酸或氨基酸)可以通过在指定的比较窗口(例如,TTR编码序列)上针对最大对应性最佳地比对这两个序列而确定为与人TTR基因(或TTR蛋白)中的残基相对应,其中多核苷酸(或氨基酸)序列在比较窗口中的部分与参考序列(不包括添加或缺失)相比可以包含添加或缺失(即,空位)以进行两个序列的最佳比对(参见例如,本文其它地方关于序列同一性和互补性的讨论)。如果两个残基在进行最佳比对时位于同一位置,则这两个残基对应。
本文所公开的人源化β滑移TTR基因座可以是其中整个Ttr基因被包括β滑移突变的对应直系同源人TTR序列替代的Ttr基因座,或者其可以是其中仅Ttr基因的一部分被对应直系同源人TTR序列替代的Ttr基因座(即,人源化)。可替代地,其可以是其中Ttr基因的一部分缺失并且对应直系同源人TTR序列的一部分插入的Ttr基因座。如果Ttr基因座的仅一部分是人源化的,则β滑移突变可以位于剩余的内源性Ttr序列中或位于插入的直系同源人TTR序列中。在一些实例中,插入的直系同源人TTR基因座的部分包括比从内源性Ttr基因座缺失的更多的人TTR基因座。与内源性Ttr序列的特定区段相对应的人TTR序列是指当对人TTR和内源性Ttr进行最佳比对时(最大数量的完全匹配的残基)与内源性Ttr序列的特定区段比对的人TTR区域。对应的直系同源人序列可以包括例如互补DNA(cDNA)或基因组DNA。任选地,基于非人动物中的密码子使用将对应直系同源人TTR序列修饰为密码子优化的。替代或插入(即,人源化)区域可以包含如外显子等编码区、如内含子等非编码区、非翻译区或调控区(例如,启动子、增强子或转录阻遏物结合元件)或其任何组合。人源化TTR基因座还可以包括插入到内源性Ttr基因座中而不替代对应的直系同源内源性序列的人TTR序列。举例来说,与人TTR基因的1个、2个、3个或全部4个外显子(或1个、2个、3个或全部4个外显子的全部或部分)的外显子可以是人源化的。在具体实例中,与外显子2和3以及外显子1和4的编码区(即,不包含5'UTR和3'UTR)相对应的外显子可以从内源性TTR基因座中缺失,并且可以插入人TTR基因的包含人TTR基因的外显子2-4和外显子1的编码区(即,不包含5'UTR)的区域。在具体实例中,与外显子2和3以及外显子1和4的编码区(即,不包含5'UTR和3'UTR)相对应的外显子可以从内源性TTR基因座中缺失,并且可以插入人TTR基因的包含外显子2和3以及外显子1和4的编码区以及人TTR基因的3'UTR(即,不包含5'UTR)的全部或部分的区域。可替代地,对由抗人TTR抗原结合蛋白识别的表位进行编码的TTR的区域或由人TTR靶向试剂(例如,小分子)靶向的区域可以是人源化的。同样地,与人TTR基因的1个、2个或全部3个内含子相对应的内含子可以是人源化的或可以保持内源性。在一个实例中,与人TTR基因的全部3个内含子相对应的内含子可以是人源化的(例如,从内源性基因座中缺失并且被对应的人内含子替代)。
人源化TTR基因座可以是其中内源性Ttr基因座的区域已经缺失并且被直系同源人TTR序列(例如,直系同源野生型人TTR序列)替代的基因座。举例来说,内源性Ttr基因座的替代区可以包括编码序列(即,外显子的全部或部分)和非编码序列(即,内含子的全部或部分)两者,如至少一个外显子和至少一个内含子。例如,替代区可以包括至少一个外显子和至少一个内含子。包括编码序列和非编码序列二者的替代区可以是内源性Ttr基因座的连续区域,这意味着在经替代的编码序列与经替代的非编码序列之间不存在间插序列。例如,替代区可以包括至少一个外显子和至少一个相邻的内含子。替代区可以包括内源性Ttr基因座的一个外显子、两个外显子、三个外显子、四个外显子或全部外显子。插入的人TTR序列可以包括人TTR基因的一个外显子、两个外显子、三个外显子、四个外显子或全部外显子。同样地,替代区可以包括内源性Ttr基因座的一个内含子、两个内含子、三个内含子或全部内含子。插入的人TTR序列可以包括人TTR基因的一个内含子、两个内含子、三个内含子或全部内含子。任选地,内源性Ttr基因座的一个或多个内含子和/或一个或多个外显子保持未经修饰(即,未缺失和替代)。例如,内源性Ttr基因座的第一外显子可以保持未经修饰。相似地,内源性Ttr基因座的第一外显子和第一内含子可以保持未经修饰。
由人源化TTR基因座编码的转甲状腺素蛋白前体蛋白可以保留天然转甲状腺素蛋白前体蛋白和/或人转甲状腺素蛋白前体蛋白的活性。例如,由人源化TTR基因座编码的转甲状腺素蛋白前体蛋白可以保留包括β滑移突变的天然转甲状腺素蛋白前体蛋白和/或包括β滑移突变的人转甲状腺素蛋白前体蛋白的活性。
在一个具体实例中,转甲状腺素蛋白前体蛋白的整个编码序列可以缺失并且被直系同源人TTR序列替代。例如,内源性Ttr基因座的在起始密码子处开始并且在终止密码子处结束的区域可以缺失并且被直系同源人TTR序列替代。
包含调控序列的侧接非翻译区也可以是人源化的。可替代地,包含调控序列的侧接非翻译区可以保持内源性。Ttr基因座的第一外显子通常包含起始密码子上游的5'非翻译区。同样地,Ttr基因座的最后外显子通常包含终止密码子下游的3'非翻译区。Ttr起始密码子上游和Ttr终止密码子下游的区域可以是未经修饰的或可以缺失并且被直系同源人TTR序列替代。例如,5'非翻译区(UTR)、3'UTR或5'UTR和3'UTR两者可以是人源化的,或者5'UTR、3'UTR或5'UTR和3'UTR两者可以保持内源性。可以插入人5'和3'UTR之一或两者,和/或可以缺失内源性5'和3'UTR之一或两者。在一个具体实例中,5'UTR保持内源性。在另一个具体实例中,3'UTR是人源化的,但5'UTR仍然是内源性的。在另一个具体实例中,5'UTR保持内源性,并且将人TTR 3'UTR插入到内源性Ttr基因座。例如,人TTR 3'UTR可以替代内源性3'UTR,或者可以插入而不替代内源性3'UTR(例如,其可以插入到内源性3'UTR的上游)。例如,内源性5'UTR(或其一部分)和内源性3'UTR(或其一部分)可以保留在人源化TTR基因座处,并且人3'UTR(或其一部分)可以插入到内源性3'UTR的上游。
内源性Ttr基因座的对转甲状腺素蛋白前体蛋白的一个或多个结构域进行编码的一个或多个区域可以是人源化的。同样地,内源性Ttr基因座的对转甲状腺素蛋白前体蛋白的一个或多个结构域进行编码的一个或多个区域可以保持未经修饰(即,未缺失和替代)。例如,转甲状腺素蛋白前体蛋白通常在N端具有信号肽。信号肽的长度可以为例如约20个氨基酸。内源性Ttr基因座的编码信号肽的区域可以保持未经修饰(即,未缺失和替代),或者可以缺失并且被直系同源人TTR序列替代。相似地,内源性Ttr基因座的对由抗人TTR抗原结合蛋白识别的表位进行编码的区域可以是人源化的。
根据直系同源序列替代的程度,如启动子等调控序列可以是内源性的或由替代的人直系同源序列提供。例如,人源化TTR基因座可以包含内源性非人动物Ttr启动子。在经基因修饰的内源性Ttr基因座处的转甲状腺素蛋白前体蛋白的编码序列可以与内源性Ttr启动子可操作地连接。
作为具体实例,包括β滑移突变的人源化TTR基因座可以是其中内源性Ttr基因座的缺失并且被直系同源人TTR序列替代的区域包括从Ttr起始密码子到终止密码子的区域、基本上由其组成或由其组成的基因座。被插入的人TTR序列可以进一步包括人TTR 3'UTR。例如,在包括β滑移突变的人源化TTR基因座处的人TTR序列可以包括从TTR起始密码子到3'UTR末端的区域、基本上由其组成或由其组成。任选地,经修饰的内源性Ttr基因座中的Ttr编码序列与内源性Ttr启动子可操作地连接。在包括β滑移突变的人源化TTR基因座处的人TTR序列可以包括与SEQ ID NO:14至少85%、90%、95%、96%、97%、98%、99%或100%相同的序列、基本上由其组成或由其组成。在包括β滑移突变的人源化TTR基因座处的人TTR序列可以包括与SEQ ID NO:14至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或约100%相同的序列、基本上由其组成或由其组成。包括β滑移突变的人源化TTR基因座可以包括与SEQ ID NO:12或13至少85%、90%、95%、96%、97%、98%、99%或100%相同的序列、基本上由其组成或由其组成。包括β滑移突变的人源化TTR基因座可以包括与SEQ ID NO:12或13至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或约100%相同的序列、基本上由其组成或由其组成。在包括β滑移突变的人源化TTR基因座处的编码序列(CDS)可以包括与SEQ ID NO:10(或其编码同一蛋白质的简并物)至少85%、90%、95%、96%、97%、98%、99%或100%相同的序列、基本上由其组成或由其组成。在包括β滑移突变的人源化TTR基因座处的编码序列(CDS)可以包括与SEQ ID NO:10(或其编码同一蛋白质的简并物)至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或约100%相同的序列、基本上由其组成或由其组成。由包括β滑移突变的人源化TTR基因座编码的所得人转甲状腺素蛋白前体蛋白可以包括与SEQ ID NO:9至少85%、90%、95%、96%、97%、98%、99%或100%相同的序列、基本上由其组成或由其组成。由包括β滑移突变的人源化TTR基因座编码的所得人转甲状腺素蛋白前体蛋白可以包括与SEQ ID NO:9至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或约100%相同的序列、基本上由其组成或由其组成。
还可以产生包括人源化TTR野生型基因座的对照非人动物。人源化TTR基因座处的野生型人TTR序列可以包括与SEQ ID NO:17至少85%、90%、95%、96%、97%、98%、99%或100%相同的序列、基本上由其组成或由其组成。人源化TTR基因座处的野生型人TTR序列可以包括与SEQ ID NO:17至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或约100%相同的序列、基本上由其组成或由其组成。人源化TTR野生型基因座可以包括与SEQ ID NO:15或16至少85%、90%、95%、96%、97%、98%、99%或100%相同的序列、基本上由其组成或由其组成。人源化TTR野生型基因座可以包括与SEQID NO:15或16至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或约100%相同的序列、基本上由其组成或由其组成。人源化TTR野生型基因座处的编码序列(CDS)可以包括与SEQ ID NO:4(或其编码同一蛋白质的简并物)至少85%、90%、95%、96%、97%、98%、99%或100%相同的序列、基本上由其组成或由其组成。人源化TTR野生型基因座处的编码序列(CDS)可以包括与SEQ ID NO:4(或其编码同一蛋白质的简并物)至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或约100%相同的序列、基本上由其组成或由其组成。由人源化TTR野生型基因座编码的所得人转甲状腺素蛋白前体蛋白可以包括与SEQ ID NO:1至少85%、90%、95%、96%、97%、98%、99%或100%相同的序列、基本上由其组成或由其组成。由人源化TTR野生型基因座编码的所得人转甲状腺素蛋白前体蛋白可以包括与SEQ ID NO:1至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或约100%相同的序列、基本上由其组成或由其组成。
作为另一个具体实例,人源化TTR基因座可以是其中内源性Ttr基因座的缺失并且被直系同源人TTR序列替代的区域包括从第二Ttr外显子开始到终止密码子的区域、基本上由其组成或由其组成的基因座。被插入的人TTR序列可以进一步包括人TTR 3'UTR。例如,人源化TTR基因座处的人TTR序列可以包括从第二人TTR外显子开始到3'UTR的末端的区域、基本上由其组成或由其组成。任选地,经修饰的内源性Ttr基因座中的Ttr编码序列与内源性Ttr启动子可操作地连接。
从人源化TTR基因座表达的TTR蛋白可以是完全人TTR蛋白或嵌合内源性/人TTR蛋白(例如,如果非人动物是小鼠,则为嵌合小鼠/人TTR蛋白)。例如,转甲状腺素蛋白前体蛋白的信号肽可以是内源性的,并且所述蛋白质的其余部分可以是人的。可替代地,转甲状腺素蛋白前体蛋白的N端可以是内源性的,并且所述蛋白质的其余部分可以是人的。例如,N端的5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个或25个氨基酸可以是内源性的,并且其余部分可以是人的。在具体实例中,N端处的23个氨基酸是内源性的,并且蛋白质的其余部分是人的。
任选地,人源化TTR基因座可以包括其它元件。此类元件的实例可以包含选择盒、报告基因、重组酶识别位点或其它元件。举例来说,人源化TTR基因座可以包括侧接有重组酶识别序列(例如,loxP位点)的可去除选择盒(例如,自缺失选择盒)。可替代地,人源化TTR基因座可以缺少其它元件(例如,可以缺少选择盒和/或可以缺少报告基因)。合适的报告基因和报告蛋白的实例在本文其它地方公开。合适的选择标志物的实例包含新霉素磷酸转移酶(neor)、潮霉素B磷酸转移酶(hygr)、嘌呤霉素-N-乙酰转移酶(puror)、杀稻瘟素S脱氨酶(bsrr)、黄嘌呤/鸟嘌呤磷酸核糖转移酶(gpt)和单纯疱疹病毒胸苷激酶(HSV-k)。重组酶的实例包含Cre、Flp和Dre重组酶。Cre重组酶基因的一个实例是Crei,其中两个对Cre重组酶进行编码的外显子被内含子隔开,以防止其在原核细胞中表达。此类重组酶可以进一步包括用于促进定位到核(例如,NLS-Crei)的核定位信号。重组酶识别位点包含由位点特异性重组酶识别并且可以用作重组事件的底物的核苷酸序列。重组酶识别位点的实例包含FRT、FRT11、FRT71、attp、att、rox和lox位点,如loxP、lox511、lox2272、lox66、lox71、loxM2和lox5171。
如报告基因或选择盒等其它元件可以是侧接有重组酶识别位点的自缺失盒。参见例如US8,697,851和US 2013/0312129,所述文献中的每个文献出于所有目的通过引用整体并入本文。举例来说,自删除盒可以包括与小鼠Prm1启动子可操作地连接的Crei基因(包括对Cre重组酶进行编码的由内含子分开的两个外显子)和与人泛素启动子可操作地连接的新霉素抗性基因。通过采用Prm1启动子,可以在F0动物的雄性生殖细胞中特异性地缺失自缺失盒。对选择标志物进行编码的多核苷酸可以与在被靶向的细胞中具有活性的启动子可操作地连接。启动子的实例在本文其它地方描述。作为另一个具体实例,自缺失选择盒可以包括与一个或多个启动子(例如,人泛素和EM7启动子两者)可操作地连接的潮霉素抗性基因编码序列,接着是聚腺苷酸化信号,接着是与一个或多个启动子(例如,mPrm1启动子)可操作地连接的Crei编码序列,接着是另一个聚腺苷酸化信号,其中整个盒侧接有loxP位点。
人源化TTR基因座还可以是条件等位基因。例如,条件等位基因可以是多功能等位基因,如US 2011/0104799中所述,所述文献出于所有目的通过引用整体并入本文。例如,条件等位基因可以包括:(a)相对于基因转录在有义取向上的启动序列;(b)在有义或反义取向上的药物选择盒(DSC);(c)在反义取向上的所关注核苷酸序列(NSI);以及(d)在相反取向上的条件反转模块(COIN,其利用外显子分裂内含子和可逆基因捕获样模块)。参见例如US2011/0104799。条件等位基因可以进一步包括可重组单元,所述可重组单元在暴露于第一重组酶后重组以形成条件等位基因,所述条件等位基因(i)缺少启动序列和DSC;以及(ii)含有有义取向上的NSI和反义取向上的COIN。参见例如US 2011/0104799。
C.包括包含β滑移突变的人源化TTR基因座的非人细胞和非人动物
提供了包括包含如本文其它地方描述的β滑移突变的人源化TTR基因座的非人动物细胞和非人动物。还提供了包括包含如本文其它地方描述的β滑移突变的人源化TTR基因座的非人动物基因组。基因组、细胞或非人动物可以是雄性或雌性。细胞或非人动物对于包括β滑移突变的人源化TTR基因座可以是杂合的或纯合的。同样地,这些基因组对于包括β滑移突变的人源化TTR基因座可以是杂合的或纯合的。二倍体生物体在每个基因座处具有两个等位基因。每对等位基因表示特异性基因座的基因型。如果在特定基因座处有两个相同的等位基因,则基因型被描述为纯合的,如果两个等位基因不同,则基因型被描述为杂合的。包括包含β滑移突变的人源化TTR基因座的非人动物可以在其种系中包括人源化TTR基因座。
本文所提供的非人动物细胞可以是例如包括Ttr基因座或与人TTR基因座同源或直系同源的基因组基因座的任何非人细胞。同样地,本文所提供的非人动物基因组可以是例如包括Ttr基因座或与人TTR基因座同源或直系同源的基因组基因座的任何非人动物基因组。细胞可以是真核细胞,所述真核细胞包含例如动物细胞、哺乳动物细胞、非人哺乳动物细胞和人细胞。术语“动物”包含哺乳动物、鱼类和鸟类。同样地,基因组可以来自真核细胞。哺乳动物细胞可以是例如非人哺乳动物细胞、啮齿动物细胞、大鼠细胞、小鼠细胞或仓鼠细胞。其它非人哺乳动物包含例如非人灵长类动物、猴子、猿、猩猩、猫、狗、兔、马、家畜(例如,牛物种,如奶牛、食用公牛等;羊物种,如绵羊、山羊等;以及猪物种,如猪和野猪)。还包含家养动物和农业动物。术语“非人”不包含人。
细胞也可以呈任何类型的未分化或分化状态。例如,细胞可以是全能细胞、多能性细胞(例如,人多能性细胞或非人多能性细胞,如小鼠胚胎干(ES)细胞或大鼠ES细胞)或非多能性细胞。全能细胞包含可以产生任何细胞类型的未分化细胞,并且多能性细胞包含具有发育成超过一种分化细胞类型的能力的未分化细胞。此类多能和/或全能细胞可以是例如ES细胞或ES样细胞,如诱导多能干(iPS)细胞。ES细胞包含在引入到胚胎中时能够对发育胚胎的任何组织做出贡献的胚胎源性全能或多能性细胞。ES细胞可以源自囊胚的内细胞团,并且能够分化成三种脊椎动物胚层(内胚层、外胚层和中胚层)中的任何层的细胞。
本文所提供的细胞还可以是生殖细胞(例如,精子或卵母细胞)。细胞可以是有丝分裂感受态细胞或有丝分裂非活性细胞、减数分裂感受态细胞或减数分裂非活性细胞。相似地,细胞还可以是初生体细胞或不是初生体细胞的细胞。体细胞包含任何不是配子、生殖细胞、配子母细胞或未分化干细胞的细胞。例如,细胞可以是肝细胞(liver cell),如成肝细胞或肝细胞(hepatocyte)。
本文所提供的合适的细胞还包含原代细胞。原代细胞包含直接从生物体、器官或组织中分离的细胞或细胞培养物。原代细胞包含既不转化也不永生的细胞。所述原代细胞包含从生物体、器官或组织中获得的任何细胞,所述细胞先前未在组织培养物中进行传代,或者先前已经在组织培养物中进行传代但不能无限期地在组织培养中进行传代。此类细胞可以通过常规技术分离并且包含例如肝细胞。
本文所提供的其它合适的细胞包含永生化细胞。永生化细胞包含来自多细胞生物体的细胞,其通常不会无限增殖但由于突变或改变而逃避正常细胞衰老并且替代地可以继续进行分裂。此类突变或改变可以天然存在或有意诱导。永生化细胞系的具体实例是HepG2人肝癌细胞系。多种类型的永生化细胞是众所周知的。永生化或原代细胞包含通常用于培养或表达重组基因或蛋白质的细胞。
本文所提供的细胞还包含单细胞期胚胎(即,受精的卵母细胞或受精卵)。此类单细胞期胚胎可以来自任何基因背景(例如,对于小鼠,BALB/c、C57BL/6、129或其组合)、可以是新鲜的或冷冻的并且可以衍生自自然繁殖或体外受精。
本文所提供的细胞可以是正常的、健康的细胞,或者可以是患病或携带突变体的细胞。
在具体实例中,非人动物细胞是胚胎干(ES)细胞或肝细胞,如小鼠或大鼠ES细胞或肝细胞。
可以通过本文其它地方描述的方法制备包括包含如本文所述的β滑移突变的人源化TTR基因座的非人动物。术语“动物”包含哺乳动物、鱼类和鸟类。非人哺乳动物包含例如非人灵长类动物、猴子、猿、猩猩、猫、狗、马、兔、啮齿动物(例如,小鼠、大鼠、仓鼠和豚鼠)和家畜(例如,牛物种,如奶牛和食用公牛;羊物种,如绵羊和山羊;以及猪物种,如猪和野猪)。还包含家养动物和农业动物。术语“非人动物”不包含人。优选的非人动物包含例如啮齿动物,如小鼠和大鼠。
非人动物可以来自任何基因背景。例如,合适的小鼠可以来自129品系、C57BL/6品系、129和C57BL/6的混合、BALB/c品系或Swiss Webster品系。129品系的实例包含129P1、129P2、129P3、129X1、129S1(例如,129S1/SV,129S1/Svlm)、129S2、129S4、129S5、129S9/SvEvH、129S6(129/SvEvTac)、129S7、129S8、129T1和129T2。参见例如,Festing等人(1999),《哺乳动物基因组(Mammalian Genome)》10:836,所述文献出于所有目的通过引用整体并入本文。C57BL品系的实例包含C57BL/A、C57BL/An、C57BL/GrFa、C57BL/Kal_wN、C57BL/6、C57BL/6J、C57BL/6ByJ、C57BL/6NJ、C57BL/10、C57BL/10ScSn、C57BL/10Cr和C57BL/Ola。合适的小鼠还可以来自上述129品系和上述C57BL/6品系的混合(例如,50%129和50%C57BL/6)。同样地,合适的小鼠可以来自上述129品系的混合或上述BL/6品系的混合(例如,129S6(129/SvEvTac)品系)。
相似地,大鼠可以来自任何大鼠品系,包含例如ACI大鼠品系、黑刺鼠(DA)大鼠品系、威斯塔(Wistar)大鼠品系、LEA大鼠品系、斯泼累格多雷(Sprague Dawley,SD)大鼠品系或费舍尔(Fischer)大鼠品系,如费舍尔F344或费舍尔F6。大鼠还可以从源自上述两种或更多种品系的混合品系中获得。例如,合适的大鼠可以来自DA品系或ACI品系。ACI大鼠品系的特征在于具有腹部和足部呈白色的黑刺鼠以及RT1av1单倍型。此类品系可从多种来源获得,包含哈兰实验室(Harlan Laboratories)。黑刺鼠(DA)大鼠品系的特征在于具有刺鼠皮毛和RT1av1单倍型。此类大鼠可从多种来源获得,包含查尔斯河和哈兰实验室(Charles Riverand Harlan Laboratories)。一些合适的大鼠可以来自近交大鼠品系。参见例如US 2014/0235933,所述文献出于所有目的通过引用整体并入本文。
包括包含β滑移突变的人源化TTR基因座的非人动物可以具有若干表型。举例来说,此类非人动物相对于对照野生型非人动物或包括不具有β滑移突变的人源化TTR基因座的对照动物可以是活动过度的。如在工作实例中更详细描述的,活动过度可以通过在旷场实验中测量总距离、总活动和总直立次数中的一个或多个或全部来评估。
非人动物还可以显示肌张力障碍或异位肌肉表型。例如,非人动物可以表现出后肢肌张力障碍或后肢肌张力障碍表型(例如,肌张力障碍后肢回缩),如在工作实例中更详细描述的。
非人动物还可以包括聚集形式的TTR和/或淀粉样蛋白沉积物(例如,具体地TTR淀粉样蛋白沉积物)。例如,淀粉样蛋白沉积物可以在坐骨神经中,如在工作实例中更详细地示出的。然而,淀粉样蛋白沉积物也可以在其它器官和组织中。
在一些非人动物中,早在约1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个或12个月龄时,任何这些表型(例如,淀粉样蛋白沉积物)都是明显的。例如,表型(例如,淀粉样蛋白沉积物)在约2个月龄时可以是明显的。
包括包含β滑移突变的人源化TTR基因座的非人动物可以以任何水平表达人源化TTR蛋白。例如,包括包含β滑移突变的人源化TTR基因座的非人动物可以在血清中以至少约0.1μg/mL、至少约0.2μg/mL或至少约0.3μg/mL的水平表达人源化TTR蛋白。可替代地,包括包含β滑移突变的人源化TTR基因座的非人动物可以在血清中以至少约0.5、至少约1、至少约2、至少约3、至少约4、至少约5、至少约6、至少约7、至少约8、至少约9、至少约10、至少约12、至少约14、至少约15、至少约16、至少约18、至少约20、至少约22、至少约24、至少约25、至少约26、至少约28或至少约30μg/mL的水平表达人源化TTR蛋白。
III.使用包括包含β滑移突变的人源化TTR基因座的非人动物用于在体内或离体评估人TTR靶向试剂的功效的方法
提供了用于使用包括包含如本文其它地方描述的β滑移突变的人源化TTR基因座的非人动物在体内或离体评估或优化人TTR靶向试剂(例如,治疗性分子或复合物)的递送或功效的各种方法。非人动物产生包含β滑移突变的人源化TTR蛋白,所述β滑移突变导致淀粉样蛋白沉积和反映人的TTR淀粉样变性的表型的表型。这些表型和淀粉样蛋白沉积发生在非常早的年龄。因为这是第一个报道的体内TTR淀粉样变性模型如此迅速地患上淀粉样变性,所以非人动物是研究TTR淀粉样变性的有用工具。另外,因为非人动物包括人源化TTR基因座,所以非人动物将更准确地反映人TTR靶向试剂的功效。此类非人动物对于测试被设计成靶向人TTR基因的基因组编辑试剂是特别有用的,因为本文公开的非人动物包括人源化内源性Ttr基因座而不是在随机基因组基因座处转基因插入人TTR序列,并且人源化内源性Ttr基因座包括来自编码区和非编码区两者的直系同源人基因组TTR序列而不是人工cDNA序列。
A.在体内或离体测试人TTR靶向试剂的功效的方法
提供了用于使用包括包含如本文其它地方描述的β滑移突变的人源化TTR基因座的非人动物评估人TTR靶向试剂的体内递送或功效的各种方法。此类方法可以包括:(a)将人TTR靶向试剂引入到非人动物中;以及(b)评估人TTR靶向试剂的活性。
人TTR靶向试剂可以是靶向人TTR基因座(人TTR基因)、人TTR mRNA或人转甲状腺素蛋白的任何生物或化学药剂。本文其它地方公开了人TTR靶向试剂的实例。例如,人TTR靶向试剂可以是TTR靶向核酸(例如,CRISPR/Cas向导RNA、短发夹RNA(shRNA)或小干扰RNA(siRNA))或对TTR靶向蛋白(例如,Cas蛋白,如Cas9、ZFN或TALEN)进行编码的核酸。可替代地,人TTR靶向试剂可以是TTR靶向抗体或抗原结合蛋白或靶向人TTR的任何其它大分子或小分子。
此类人TTR靶向试剂可以通过如本文其它地方更详细地公开的任何递送方法(例如,AAV、LNP或HDD)以及通过任何施用途径来施用。在本文其它地方更详细地公开了递送治疗复合物和分子的方式以及施用途径。在特定方法中,试剂通过AAV介导的递送进行递送。例如,AAV8可以用于靶向肝脏。在其它特定方法中,试剂通过LNP介导的递送进行递送。在其它特定方法中,试剂通过流体动力学递送(HDD)进行递送。剂量可以是任何合适的剂量。例如,在试剂(例如,Cas9 mRNA和gRNA)通过LNP介导的递送进行递送的一些方法中,剂量可以介于约0.01mg/kg与约10mg/kg之间、约0.01mg/kg和约5mg/kg、介于约0.01mg/kg与约4mg/kg之间、介于约0.01mg/kg与约3mg/kg之间、介于约0.01mg/kg与约2mg/kg之间、介于约0.01mg/kg与约1mg/kg之间、介于约0.1mg/kg与约10mg/kg之间、介于约0.1mg/kg与约6mg/kg之间、介于约0.1mg/kg与约5mg/kg之间、介于约0.1mg/kg与约4mg/kg之间、介于约0.1mg/kg与约3mg/kg之间、介于约0.1mg/kg与约2mg/kg之间、介于约0.1mg/kg与约1mg/kg之间、介于约0.3mg/kg与约10mg/kg之间、介于约0.3mg/kg与约6mg/kg之间、介于约0.3mg/kg与约5mg/kg之间、介于约0.3mg/kg与约4mg/kg之间、介于约0.3mg/kg与约3mg/kg之间、介于约0.3mg/kg与约2mg/kg之间、介于约0.3mg/kg与约1mg/kg之间、为约0.1mg/kg、约0.3mg/kg、约1mg/kg、约2mg/kg或约3mg/kg。在具体实例中,剂量介于约0.1mg/kg与约6mg/kg之间、介于约0.1mg/kg与约3mg/kg之间或介于约0.1mg/kg与约2mg/kg之间。在具体实例中,人TTR靶向试剂是基因组编辑试剂,LNP剂量为约1mg/kg,并且人源化TTR基因座处的基因组编辑百分比介于约70%与约80%之间。在另一个具体实例中,人TTR靶向试剂是基因组编辑试剂,LNP剂量为约0.3mg/kg,并且编辑百分比介于约50%与约80%之间。在另一个具体实例中,人TTR靶向试剂是基因组编辑试剂,LNP剂量为约0.1mg/kg,并且编辑百分比介于约20%与约80%之间。在另一个具体实例中,LNP剂量为约1mg/kg,并且血清TTR水平降低到对照水平的约0%与约10%之间或约0%与约35%之间。在另一个具体实例中,LNP剂量为约0.3mg/kg,并且血清TTR水平降低到对照水平的约0%与约20%之间或约0%与约95%之间。在另一个具体实例中,LNP剂量为约0.1mg/kg,并且血清TTR水平降低到对照水平的约0%与约60%之间或约0%与约99%之间。
用于评估人TTR靶向试剂的活性的方法是众所周知的并且在本文其它地方提供。对活性的评估可以是在如本文其它地方公开的任何细胞类型、任何组织类型或任何器官类型中进行。在一些方法中,对活性的评估是在肝细胞中进行。举例来说,评估可以包括测量人源化TTR基因座处的非同源末端连接(NHEJ)活性。这可以包括例如测量人源化TTR基因座内的插入或缺失的频率。如果TTR靶向试剂是基因组编辑试剂(例如,核酸酶药剂),则此类方法可以包括评估包括β滑移突变的人源化TTR基因座的修饰。例如,评估可以包括对从非人动物中分离出的一个或多个细胞中的人源化TTR基因座进行测序(例如,下一代测序)。评估可以包括从非人动物中分离靶器官(例如,肝脏)或组织以及评估靶器官或组织中人源化TTR基因座的修饰。评估还可以包括评估靶器官或组织内两种或更多种不同细胞类型中人源化TTR基因座的修饰。相似地,评估可以包括从非人动物中分离非靶器官或组织(例如,两个或更多个非靶器官或组织)以及评估非靶器官或组织中人源化TTR基因座的修饰。
此类方法还可以包括测量由包括β滑移突变的人源化TTR基因座产生的mRNA的表达水平,或通过测量由包括β滑移突变的人源化TTR基因座编码的蛋白质的表达水平。例如,可以测量特定细胞、组织或器官类型(例如,肝脏)中的蛋白质水平,或者可以测量血清中的分泌水平。用于评估从人源化TTR基因座表达的Ttr mRNA或蛋白质的表达的方法在本文其它地方提供并且是众所周知的。
作为一个具体实例,如果人TTR靶向试剂是基因组编辑试剂(例如,核酸酶药剂),则可以(例如,在肝细胞中)评估人源化TTR基因座处的百分比编辑(例如,在PCR反应中从裂解细胞池中读取的序列的总数中观察到的插入或缺失总数)。
举例来说,如果人TTR靶向试剂是基因组编辑试剂(例如,核酸酶药剂),则可以(例如,在肝细胞中)评估人源化TTR基因座处的编辑百分比。例如,编辑百分比(例如,在PCR反应中从裂解细胞池中读取的序列的总数中观察到的插入或缺失的总数)可以为至少约10%、至少约20%、至少约30%、至少约40%、至少约50%、至少约60%、至少约70%、至少约80%、至少约90%、至少约95%、至少约99%,或者例如,介于约1%与约99%之间、介于约10%与约99%之间、介于约20%与约99%之间、介于约30%与约99%之间、介于约40%与约99%之间、介于约50%与约99%之间、介于约60%与约99%之间、介于约1%与约90%之间、介于约10%与约90%之间、介于约20%与约90%之间、介于约30%与约90%之间、介于约40%与约90%之间、介于约50%与约90%之间、介于约60%与约90%之间、介于约1%与约80%之间、介于约10%与约80%之间、介于约20%与约80%之间、介于约30%与约80%之间、介于约40%与约80%之间、介于约50%与约80%之间或介于约60%与约80%之间。
作为另一个实例,可以评估血清TTR水平。例如,血清TTR水平可以降低至少约10%、至少约20%、至少约30%、至少约40%、至少约50%、至少约60%、至少约65%、至少约70%、至少约80%、至少约90%、至少约95%、至少约99%,或者例如,介于约1%与约99%之间、介于约10%与约99%之间、介于约20%与约99%之间、介于约30%与约99%之间、介于约40%与约99%之间、介于约50%与约99%之间、介于约60%与约99%之间、介于约70%与约99%之间、介于约80%与约99%之间、介于约1%与约90%之间、介于约10%与约90%之间、介于约20%与约90%之间、介于约30%与约90%之间、介于约40%与约90%之间、介于约50%与约90%之间、介于约60%与约90%之间、介于约70%与约90%或介于约80%与约90%之间。
此类方法还可以包括例如在如本文其它地方更详细地描述的旷场实验中评估非人动物的活性/活动过度。此类方法还可以包括评估聚集形式的TTR的存在(例如,通过天然PAGE和蛋白质印迹)或评估淀粉样蛋白沉积物的存在,如本文其它地方更详细地描述的。此类方法还可以包括评估非人动物是否表现出肌张力障碍或肌张力障碍表型,如本文其它地方更详细地描述的。
以上提供的用于评估体内活性的各种方法还可以用于评估如本文其它地方描述的人TTR靶向试剂的离体活性。
在一些方法中,人TTR靶向试剂是靶向人TTR基因的核酸酶药剂,如CRISPR/Cas核酸酶药剂。此类方法可以包括,例如:(a)向非人动物中引入被设计成切割人TTR基因的核酸酶药剂(例如,如Cas9等Cas蛋白和被设计成靶向人TTR基因中的向导RNA靶序列的向导RNA);以及(b)评估包括β滑移突变的人源化TTR基因座的修饰。
例如,在CRISPR/Cas核酸酶的情况下,当向导RNA与Cas蛋白形成复合物并且将Cas蛋白引导到人源化TTR基因座,并且Cas/向导RNA复合物切割向导RNA靶序列,从而触发细胞的修复(例如,如果不存在供体序列,则通过非同源末端连接(NHEJ)触发)时,包括β滑移突变的人源化TTR基因座的修饰将被诱导。
任选地,可以引入两个或更多个向导RNA,各自被设计成靶向人TTR基因内的不同向导RNA靶序列。例如,两个向导RNA可以设计成切除两个向导RNA靶序列之间的基因组序列。当第一向导RNA与Cas蛋白形成复合物并且将Cas蛋白引导到人源化TTR基因座,第二向导RNA与Cas蛋白形成复合物并且将Cas蛋白引导到人源化TTR基因座,第一Cas/向导RNA复合物切割第一向导RNA靶序列,并且第二Cas/向导RNA复合物切割第二向导RNA靶序列,从而导致间插序列的切除时,人源化TTR基因座的修饰将被诱导。
任选地,还将能够与人TTR基因重组并且修饰人TTR基因的外源性供体核酸引入到非人动物中。任选地,核酸酶药剂或Cas蛋白可以栓系到如本文其它地方所述的外源性供体核酸。例如,当向导RNA与Cas蛋白形成复合物并且将Cas蛋白引导到人源化TTR基因座,Cas/向导RNA复合物切割向导RNA靶序列,并且人源化TTR基因座与外源性供体核酸重组以修饰人源化TTR基因座时,人源化TTR基因座的修饰将被诱导。然后可以用外源性供体核酸修复人源化TTR基因座,例如通过同源定向修复(HDR)或通过NHEJ介导的插入。可以使用任何类型的外源性供体核酸,其实例在本文其它地方提供。
B.在体内或离体优化人TTR靶向试剂的递送或功效的方法
提供了用于优化人TTR靶向试剂向细胞或非人动物的递送或优化人TTR靶向试剂的体内活性或功效的各种方法。此类方法可以包括,例如:(a)在第一非人动物或第一细胞中第一次执行如上所述的测试人TTR靶向试剂的功效的方法;(b)改变变量并用所改变变量在第二非人动物(即,相同物种的)或第二细胞中第二次进行所述方法;以及(c)将步骤(a)中的人TTR靶向试剂的活性与步骤(b)中的人TTR靶向试剂的活性进行比较,并且选择产生较高活性的方法。
本文其它地方公开了测量人TTR靶向试剂的递送、功效或活性的方法。例如,此类方法可以包括测量包括β滑移突变的人源化TTR基因座的修饰。根据非人动物或细胞内的期望效果,人源化TTR基因座的更有效的修饰可以意指不同的事情。例如,人源化TTR基因座的更有效的修饰可以意指更高水平的修饰、更高的精确度、更高的一致性或更高的特异性中的一个或多个或全部。人源化TTR基因座的更高水平的修饰(即,更高的功效)是指在特定靶细胞类型内、在特定靶组织内或在特定靶器官(例如,肝脏)内靶向更高百分比的细胞。更高的精确度是指人源化TTR基因座的更精确的修饰(例如,更高百分比的靶向细胞具有相同的修饰或具有期望的修饰而没有额外的非预期插入和缺失(例如,NHEJ插入缺失))。更高的一致性是指在多于一种类型的细胞、组织或器官被靶向的情况下,不同类型的靶向细胞、组织或器官之间的人源化TTR基因座的更一致的修饰(例如,肝脏内更多数量的细胞类型的修饰)。如果靶向特定器官,则更高的一致性也可以指在器官(例如,肝脏)内的所有位置中更一致的修饰。更高的特异性可以指对于所靶向的基因组基因座或基因座的更高的特异性、对于所靶向的细胞类型的更高的特异性、对于所靶向的组织类型的更高的特异性或者对于所靶向的器官的更高的特异性。例如,增加的基因组基因座特异性是指脱靶基因组基因座的修饰较少(例如,代替或除了靶基因组基因座的修饰之外,在非预期的脱靶基因组基因座处具有修饰的靶向细胞的百分比较低)。同样地,增加的细胞类型、组织或器官类型特异性是指在靶向特定的细胞类型、组织类型或器官类型的情况下(例如,当靶向特定器官(例如,肝脏)时,器官或组织中不是预期靶标的细胞的修饰较少),脱靶细胞类型、组织类型或器官类型的修饰较少。
可替代地,此类方法可以包括测量TTR mRNA或TTR蛋白的表达。在一个实例中,更有效的人TTR靶向剂导致TTR mRNA或TTR蛋白表达的更大减少。可替代地,此类方法可以包括测量TTR活性。在一个实例中,更有效的人TTR靶向剂导致TTR活性的更大降低。
被改变的变量可以是任何参数。举例来说,所改变变量可以是包装或递送方法,通过所述包装或递送方法将一种或多种人TTR靶向试剂引入到细胞或非人动物中。如LNP、HDD和AAV等递送方法的实例在本文其它地方进行了公开。例如,所改变变量可以是AAV血清型。相似地,施用可以包括LNP介导的递送,并且所改变变量可以是LNP调配物。作为另一个实例,所改变变量可以是用于将一种或多种人TTR靶向试剂引入到细胞或非人动物中的施用途径。如静脉内、玻璃体内、实质内和鼻内滴注等施用途径的实例在本文其它地方公开。
作为另一个实例,所改变变量可以是所引入的一种或多种人TTR靶向试剂的浓度或量。作为另一个实例,所改变变量可以是相对于所引入的另一种人TTR靶向试剂(例如,向导RNA、Cas蛋白、外源性供体核酸、RNAi药剂或ASO)的浓度或量的所引入的一种人TTR靶向试剂(例如,向导RNA、Cas蛋白、外源性供体核酸、RNAi药剂或ASO)的浓度或量。
作为另一个实例,所改变变量可以是相对于评估试剂的活性或功效的定时的引入一种或多种人TTR靶向试剂的定时。作为另一个实例,所改变变量可以是引入一种或多种人TTR靶向试剂的次数或频率。作为另一个实例,所改变变量可以是相对于所引入的另一种人TTR靶向试剂(例如,向导RNA、Cas蛋白、外源性供体核酸、RNAi药剂或ASO)的引入定时的所引入的一种人TTR靶向试剂(例如,向导RNA、Cas蛋白、外源性供体核酸、RNAi药剂或ASO)的引入定时。
作为另一个实例,所改变变量可以是引入人TTR靶向试剂的形式。例如,向导RNA可以以DNA的形式或以RNA的形式引入。Cas蛋白(例如,Cas9)可以以DNA的形式、以RNA的形式或以蛋白质的形式(例如,与向导RNA复合)引入。外源性供体核酸可以是DNA、RNA、单链的、双链的、线状的、环状的等。相似地,为了稳定性,组分中的每个组分可以包括各种修饰组合,以减少脱靶效应、促进递送等。同样地,例如,为了稳定性,RNAi药剂和ASO可以包括各种修饰组合,以减少脱靶效应、促进递送等。作为另一个实例,所改变变量可以是引入的一种或多种人TTR靶向试剂(例如,引入具有不同序列的不同向导RNA,引入不同Cas蛋白(例如,引入具有不同序列的不同Cas蛋白或具有不同序列但编码同一Cas蛋白氨基酸序列的核酸)或引入具有不同序列的不同外源性供体核酸)。
在具体实例中,人TTR靶向试剂包括Cas蛋白和被设计成靶向人TTR基因中的向导RNA靶序列的向导RNA。在此类方法中,所改变变量可以是向导RNA序列和/或向导RNA靶序列。相似地,如果人TTR靶向试剂包括RNAi药剂或ASO,则所改变变量可以是引入具有不同序列的不同RNAi药剂或ASO。在一些此类方法中,Cas蛋白和向导RNA可以各自以RNA的形式施用,并且所改变变量可以是Cas mRNA与向导RNA的比率(例如,在LNP调配物中)。在一些此类方法中,所改变变量可以是向导RNA修饰(例如,将具有修饰的向导RNA与没有修饰的向导RNA进行比较)。
C.人TTR靶向试剂
人TTR靶向试剂可以是靶向人TTR基因、人TTR mRNA或人TTR蛋白的任何试剂。人TTR靶向试剂可以靶向人TTR基因、人TTR mRNA或人TTR蛋白的任何区域(即,不仅包括β滑移突变的区域,而且也包括任何其它区域)。例如,其可以是基因组编辑试剂,如切割人TTR基因内的靶序列的核酸酶药剂,其可以是靶向人TTR mRNA的反义寡核苷酸,其可以是靶向人TTR蛋白的表位的抗原结合蛋白,或者其可以是靶向人TTR的小分子。本文公开的方法中的人TTR靶向试剂可以是已知的人TTR靶向试剂,可以是推定的TTR靶向试剂(例如,被设计用于靶向人TTR的候选试剂),或可以是针对人TTR靶向活性进行筛选的试剂。
(1)靶向人TTR基因的核酸酶药剂
人TTR靶向试剂可以是基因组编辑试剂,如切割人TTR基因内的靶序列的核酸酶药剂。核酸酶靶序列包含由核酸酶药剂诱导切口或双链断裂的DNA序列。核酸酶药剂的靶序列可以是细胞内源的(或自然的),或者靶序列可以是细胞外源的。细胞外源性靶序列并非天然存在于细胞的基因组中。靶序列还可以对于期望定位在靶基因座处的所关注的多核苷酸是外源的。在一些情况下,靶序列在宿主细胞的基因组中仅存在一次。
靶序列的长度可以变化,并且包含例如对于锌指核酸酶(ZFN)对约30-36bp(即,对于每个ZFN约15-18bp)、对于转录激活子样效应物核酸酶(TALEN)约36bp或对于CRISPR/Cas9向导RNA约20bp的靶序列。
可以在本文所公开的方法和组合物中使用在期望靶序列处诱导切口或双链断裂的任何核酸酶药剂。可以采用天然存在的或天然的核酸酶药剂,只要所述核酸酶药剂在期望的靶序列中诱导切口或双链断裂即可。可替代地,可以采用经修饰的或工程化核酸酶药剂。“工程化核酸酶药剂”包含从其天然形式工程化(进行修饰或源自所述天然形式)以特异性地识别和诱导期望的靶序列中的切口或双链断裂的核酸酶。因此,工程化核酸酶药剂可以源自天然的、天然存在的核酸酶药剂,或者可以人工产生或合成。工程化核酸酶可以在例如靶序列中诱导切口或双链断裂,其中靶序列不是由天然(非工程化或未经修饰的)核酸酶药剂识别的序列。核酸酶药剂的修饰可以少至蛋白质切割剂中的一个氨基酸或核酸切割剂中的一个核苷酸。在靶序列或其它DNA中产生切口或双链断裂在本文中可以被称为“切割(cutting)”或“切割(cleaving)”靶序列或其它DNA。
还提供了例示性靶序列的活性变体和片段。此类活性变体可以包括与给定的靶序列具有至少65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的序列同一性,其中活性变体保留生物活性并且因此能够以序列特异性方式被核酸酶药剂识别和切割。由核酸酶药剂测量靶序列双链断裂的测定是众所周知的。参见例如Frendewey等人(2010),《酶学方法(Methods in Enzymology)》476:295-307,所述文献出于所有目的通过引用整体并入本文。
核酸酶药剂的靶序列可以定位在Ttr基因座中或附近的任何位置。靶序列可以定位在Ttr基因的编码区内,或者在影响基因表达的调控区内。核酸酶药剂的靶序列可以定位在内含子、外显子、启动子、增强子、调控区或任何非蛋白质编码区中。
一种类型的核酸酶药剂是转录激活子样效应物核酸酶(TALEN)。TAL效应物核酸酶是一类序列特异性核酸酶,其可以用于在原核或真核生物基因组中的具体靶序列处使双链断裂。通过将自然或工程化转录激活子样(TAL)效应物或其功能部分与例如FokI等核酸内切酶的催化结构域融合来产生TAL效应物核酸酶。独特的模块化TAL效应子DNA结合结构域允许设计具有潜在任何给定DNA识别特异性的蛋白质。因此,TAL效应子核酸酶的DNA结合结构域可以被工程化以识别特定的DNA靶位点,并且因此用于在期望的靶序列处进行双链断裂。参见WO 2010/079430;Morbitzer等人(2010),《美国国家科学院院刊(PNAS)》10.1073/pnas.1013133107;Scholze和Boch(2010),《毒力(Virulence)》1:428-432;Christian等人,《基因学(Genetics)》(2010)186:757-761;Li等人(2010),《核酸研究》(2010)doi:10.1093/nar/gkq704;以及Miller等人(2011),《自然生物技术》29:143-148,所述文献中的每个文献通过引用整体并入本文。
合适的TAL核酸酶的实例和用于制备合适的TAL核酸酶的方法公开于例如US2011/0239315 A1、US 2011/0269234 A1、US 2011/0145940 A1、US 2003/0232410 A1、US2005/0208489 A1、US 2005/0026157 A1、US 2005/0064474 A1、US 2006/0188987 A1和US2006/0063231 A1中,所述文献中的每个文献通过引用整体并入本文。在各个实施例中,TAL效应物核酸酶被工程化为在例如所关注的基因座或所关注的基因组基因座中的靶核酸序列中或附近切断,其中靶核酸序列位于将由靶向载体修饰的序列处或附近。适合与本文所提供的各种方法和组合物一起使用的TAL核酸酶包含那些专门设计成在将由如本文所述的靶向载体修饰的靶核酸序列处或附近结合的核酸酶。
在一些TALEN中,TALEN的每个单体包括通过两个高变残基识别单个碱基对的33-35个TAL重复序列。在一些TALEN中,核酸酶药剂是包括与如FokI核酸内切酶等独立核酸酶可操作地连接的基于TAL重复序列的DNA结合结构域的嵌合蛋白。例如,核酸酶药剂可以包括第一基于TAL重复序列的DNA结合结构域和第二基于TAL重复序列的DNA结合结构域,其中第一和第二基于TAL重复序列的DNA结合结构域中的每一个与FokI核酸酶可操作地连接,其中第一和第二基于TAL重复序列的DNA结合结构域识别由不同长度(12-20bp)的间隔子序列分开的靶DNA序列的每条链中的两个连续靶DNA序列,并且其中FokI核酸酶亚基二聚化以产生使靶序列上的双链断裂的活性核酸酶。
在本文所公开的各种方法和组合物中采用的核酸酶药剂可以进一步包括锌指核酸酶(ZFN)。在一些ZFN中,ZFN的每个单体包括3个或更多个基于锌指的DNA结合结构域,其中每个基于锌指的DNA结合结构域与3bp亚位点结合。在其它ZFN中,ZFN是包括基于锌指的DNA结合结构域的嵌合蛋白,所述结合结构域与如FokI核酸内切酶等独立的核酸酶可操作地连接。例如,核酸酶药剂可以包括第一ZFN和第二ZFN,其中第一ZFN和第二ZFN各自与FokI核酸酶亚基可操作地连接,其中第一ZFN和第二ZFN识别由约5-7bp间隔子分开的靶DNA序列中的每条链中的两个连续靶DNA序列,并且其中FokI核酸酶亚基二聚化以产生使双链断裂的活性核酸酶。参见例如,US20060246567;US20080182332;US20020081614;US20030021776;WO/2002/057308A2;US20130123484;US20100291048;WO/2011/017293A2;以及Gaj等人(2013),《生物技术趋势(Trends in Biotechnology)》31(7):397-405,所述文献中的每个文献通过引用并入本文。
另一种类型的核酸酶药剂是大范围核酸酶。大范围核酸酶基于保守序列基序分类为四个家族,这些家族是LAGLIDADG、GIY-YIG、H-N-H和His-Cys盒家族。这些基序参与金属离子的配位和磷酸二酯键的水解。大范围核酸酶因其长的靶序列以及在其DNA底物中耐受一些序列多态性而著称。大范围核酸酶结构域、结构和功能是已知的,参见例如Guhan和Muniyappa(2003),《生物化学与分子生物学评论(Crit Rev Biochem Mol Biol)》38:199-248;Lucas等人,(2001)《核酸研究》29:960-9;Jurica和Stoddard,(1999),《细胞分子生命科学(Cell Mol Life Sci)》55:1304-26;Stoddard,(2006),《生物物理学季评(Q RevBiophys)》38:49-95;以及Moure等人,(2002),《自然结构生物学(Nat Struct Biol)》9:764。在一些实例中,使用天然存在的变体和/或工程化衍生的大范围核酸酶。用于修饰动力学、辅因子相互作用、表达、最佳条件和/或靶序列特异性和筛选活性的方法是已知的。参见例如,Epinat等人,(2003)《核酸研究》31:2952-62Chevalier等人,(2002),《分子细胞》10:895-905;Gimble等人,(2003)《分子生物学(Mol Biol)》334:993-1008;Seligman等人,(2002)《核酸研究》30:3870-9;Sussman等人,(2004)《分子生物学杂志》342:31-41;Rosen等人,(2006)《核酸研究》34:4791-800;Chames等人,(2005)《核酸研究》33:e178;Smith等人,(2006)《核酸研究》34:e149;Gruen等人,(2002)《核酸研究》30:e29;Chen和Zhao,(2005)《核酸研究》33:e154;WO2005105989;WO2003078619;WO2006097854;WO2006097853;WO2006097784;和WO2004031346,所述文献中的每个文献通过引用整体并入本文。
可以使用任何大范围核酸酶,包含例如I-SceI、I-SceII、I-SceIII、I-SceIV、I-SceV、I-SceVI、I-SceVII、I-CeuI、I-CeuAIIP、I-CreI、I-CrepsbIP、I-CrepsbIIP、I-CrepsbIIIP、I-CrepsbIVP、I-TliI、I-PpoI、PI-PspI、F-SceI、F-SceII、F-SuvI、F-TevI、F-TevII、I-AmaI、I-AniI、I-ChuI、I-CmoeI、I-CpaI、I-CpaII、I-CsmI、I-CvuI、I-CvuAIP、I-DdiI、I-DdiII、I-DirI、I-DmoI、I-HmuI、I-HmuII、I-HsNIP、I-LlaI、I-MsoI、I-NaaI、I-NanI、I-NcIIP、I-NgrIP、I-NitI、I-NjaI、I-Nsp236IP、I-PakI、I-PboIP、I-PcuIP、I-PcuAI、I-PcuVI、I-PgrIP、I-PobIP、I-PorI、I-PorIIP、I-PbpIP、I-SpBetaIP、I-ScaI、I-SexIP、I-SneIP、I-SpomI、I-SpomCP、I-SpomIP、I-SpomIIP、I-SquIP、I-Ssp6803I、I-SthPhiJP、I-SthPhiST3P、I-SthPhiSTe3bP、I-TdeIP、I-TevI、I-TevII、I-TevIII、I-UarAP、I-UarHGPAIP、I-UarHGPA13P、I-VinIP、I-ZbiIP、PI-MtuI、PI-MtuHIP PI-MtuHIIP、PI-PfuI、PI-PfuII、PI-PkoI、PI-PkoII、PI-Rma43812IP、PI-SpBetaIP、PI-SceI、PI-TfuI、PI-TfuII、PI-ThyI、PI-TliI、PI-TliII或其任何活性变体或片段。
大范围核酸酶可以识别例如12个到40个碱基对的双链DNA序列。在一些情况下,大范围核酸酶识别基因组中一个完美匹配的靶序列。
一些大范围核酸酶是归巢核酸酶。归巢核酸酶的一种类型是归巢核酸酶的LAGLIDADG家族,包含例如I-SceI、I-CreI和I-Dmol。
核酸酶药剂可以进一步包括如以下更详细地描述的CRISPR/Cas系统。
还提供了核酸酶药剂(即,工程化核酸酶药剂)的活性变体和片段。此类活性变体可以与自然核酸酶药剂具有至少65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的序列同一性,其中活性变体保留在期望靶序列处切断的能力,并且因此保留切口或双链断裂诱导活性。例如,本文所述的核酸酶药剂中的任何核酸酶药剂可以由自然核酸内切酶序列修饰,并设计成在自然核酸酶药剂未识别的靶序列处识别和诱导切口或双链断裂。因此,一些工程化核酸酶具有在不同于对应天然核酸酶药剂靶序列的靶序列处诱导切口或双链断裂的特异性。对切口或双链断裂诱导活性的测定是已知的,并且通常测量内切核酸酶对含有靶序列的DNA底物的总体活性和特异性。
核酸酶药剂可以通过任何已知方式引入到细胞或非人动物中。对核酸酶药剂进行编码的多肽可以被直接引入到细胞或非人动物中。可替代地,对核酸酶药剂进行编码的多核苷酸可以被引入到细胞或非人动物中。当引入对核酸酶药剂进行编码的多核苷酸时,核酸酶药剂可以在细胞内瞬时地、有条件地或组成性地表达。对核酸酶药剂进行编码的多核苷酸可以包含在表达盒中并且与条件启动子、诱导型启动子、组成型启动子或组织特异性启动子可操作地连接。启动子的实例在本文其它地方进一步详细讨论。可替代地,核酸酶药剂可以作为对核酸酶药剂进行编码的mRNA被引入到细胞中。
对核酸酶药剂进行编码的多核苷酸可以稳定地整合在细胞的基因组中,并且与在细胞中有活性的启动子可操作地连接。可替代地,对核酸酶药剂进行编码的多核苷酸可以在靶向载体中。
当通过引入对核酸酶药剂进行编码的多核苷酸向细胞提供核酸酶药剂时,可以修饰这种对核酸酶药剂进行编码的多核苷酸以取代与对核酸酶药剂进行编码的天然存在的多核苷酸序列相比在所关注的细胞中具有更高使用频率的密码子。例如,与天然存在的多核苷酸序列相比,可以修饰对核酸酶药剂进行编码的多核苷酸以取代在给定的所关注真核细胞中具有更高使用频率的密码子,包含人细胞、非人细胞、哺乳动物细胞、啮齿动物细胞、小鼠细胞、大鼠细胞或任何其它所关注的宿主细胞。
(2)靶向人TTR基因的CRISPR/Cas系统
特定类型的人TTR靶向试剂可以是靶向人TTR基因的CRISPR/Cas系统。CRISPR/Cas系统包含转录本和涉及Cas基因表达或指导其活性的其它元件。CRISPR/Cas系统可以是例如I型、II型、III型或V型系统(例如,V-A亚型或V-B亚型)。在本文公开的组合物和方法中使用的CRISPR/Cas系统可以是非天然存在的。“非天然存在的”系统包含表明涉及人工的任何事物,如系统的一种或多种组分从其自然存在的状态改变或突变,至少基本上不含所述组分在自然界中与其天然相关的至少一种其它组分或与所述组分不与其天然相关的至少一种其它组分相关。例如,一些CRISPR/Cas系统采用包括非天然一起存在的gRNA和Cas蛋白的非天然存在的CRISPR复合物,采用非天然存在的Cas蛋白,或者采用非天然存在的gRNA。
Cas蛋白以及对Cas蛋白进行编码的多核苷酸。Cas蛋白通常包含可以与向导RNA(gRNA,以下更详细地描述)相互作用的至少一个RNA识别或结合结构域。Cas蛋白还可以包括核酸酶结构域(例如,DNase结构域或RNase结构域)、DNA结合结构域、解旋酶结构域、蛋白质-蛋白质相互作用结构域、二聚化结构域和其它结构域。一些此类结构域(例如,DNase结构域)可以来自天然Cas蛋白。可以添加其它此类结构域以制备经修饰的Cas蛋白。核酸酶结构域对核酸切割具有催化活性,所述核酸切割包含核酸分子的共价键的断裂。切割可以产生平末端或交错末端,并且其可以是单链或双链的。例如,野生型Cas9蛋白通常将产生钝性切割产物。可替代地,野生型Cpf1蛋白(例如,FnCpf1)可以产生具有5核苷酸5'突出端的切割产物,其中切割发生在非靶向链上的PAM序列的第18个碱基对之后和靶向链上的第23个碱基之后。Cas蛋白可以具有完整的切割活性以在靶基因组基因座处产生双链断裂(例如,具有平末端的双链断裂),或者其可以是在靶基因组基因座处产生单链断裂的切口酶。
Cas蛋白的实例包含Cas1、Cas1B、Cas2、Cas3、Cas4、Cas5、Cas5e(CasD)、Cas6、Cas6e、Cas6f、Cas7、Cas8a1、Cas8a2、Cas8b、Cas8c、Cas9(Csn1或Csx12)、Cas10、Cas10d、CasF、CasG、CasH、Csy1、Csy2、Csy3、Cse1(CasA)、Cse2(CasB)、Cse3(CasE)、Cse4(CasC)、Csc1、Csc2、Csa5、Csn2、Csm2、Csm3、Csm4、Csm5、Csm6、Cmr1、Cmr3、Cmr4、Cmr5、Cmr6、Csb1、Csb2、Csb3、Csx17、Csx14、Csx10、Csx16、CsaX、Csx3、Csx1、Csx15、Csf1、Csf2、Csf3、Csf4和Cu1966以及其同源物或经修饰的版本。
示例性Cas蛋白是Cas9蛋白或源自Cas9蛋白的蛋白。Cas9蛋白来自II型CRISPR/Cas系统,并且通常共享具有保守结构的四个关键基序。基序1、2和4是类似RuvC的基序,并且基序3是HNH基序。示例性Cas9蛋白来自酿脓链球菌(Streptococcus pyogenes)、嗜热链球菌(Streptococcus thermophilus)、链球菌(Streptococcus sp.)、金黄色葡萄球菌(Staphylococcus aureus)、达松维尔拟诺卡氏菌(Nocardiopsis dassonvillei)、始旋链霉菌(Streptomyces pristinaespiralis)、绿产色链霉菌(Streptomycesviridochromogenes)、绿产色链霉菌(Streptomyces viridochromogenes)、链孢囊菌(Streptosporangium roseum)、链孢囊菌(Streptosporangium roseum)、酸热脂环酸杆菌(Alicyclobacillus acidocaldarius)、假蕈状芽孢杆菌(Bacillus pseudomycoides)、硒化芽孢杆菌(Bacillus selenitireducens)、西伯利亚微小杆菌(Exiguobacteriumsibiricum)、德氏乳酸杆菌(Lactobacillus delbrueckii)、唾液乳杆菌(Lactobacillussalivarius)、海洋微颤菌(Microscilla marina)、伯克氏菌目细菌(Burkholderialesbacterium)、食萘极地单胞菌(Polaromonas naphthalenivorans)、极地单胞菌(Polaromonas sp.)、瓦氏鳄球藻(Crocosphaera watsonii)、蓝丝菌(Cyanothece sp.)、铜绿微囊藻(Microcystis aeruginosa)、聚球藻(Synechococcus sp.)、阿拉伯糖醋酸杆菌(Acetohalobium arabaticum)、德根斯产氨菌(Ammonifex degensii)、热解纤维素菌(Caldicelulosiruptor becscii)、候选金矿菌(Candidatus Desulforudis)、肉毒杆菌(Clostridium botulinum)、艰难梭菌(Clostridium difficile)、大芬戈尔德菌(Finegoldia magna)、嗜热盐碱厌氧菌(Natranaerobius thermophilus)、丙酸降解菌(Pelotomaculum thermopropionicum)、喜温嗜酸硫杆菌(Acidithiobacillus caldus)、嗜酸氧化亚铁硫杆菌(Acidithiobacillus ferrooxidans)、异色变色菌(Allochromatiumvinosum)、海杆菌(Marinobacter sp.)、嗜盐亚硝化球菌(Nitrosococcus halophilus)、沃森亚硝化球菌(Nitrosococcus watsoni)、嗜盐假交替单胞菌(Pseudoalteromonashaloplanktis)、雷氏纤线杆菌(Ktedonobacter racemifer)、伊芙氏甲烷盐菌(Methanohalobium evestigatum)、鱼腥藻(Anabaena variabilis)、泡沫节球藻(Nodularia spumigena)、念珠藻(Nostoc sp.)、节旋藻(Arthrospira maxima)、盘状节旋藻(Arthrospira platensis)、节旋藻(Arthrospira sp.)、鞘丝藻(Lyngbya sp.)、原型微鞘藻(Microcoleus chthonoplastes)、颤蓝细菌(Oscillatoria sp.)、运动石袍菌(Petrotoga mobilis)、非洲栖热腔菌(Thermosipho africanus)、深海阿卡罗虎尾草(Acaryochloris marina)、脑膜炎奈瑟氏菌(Neisseria meningitidis)或空肠弯曲杆菌(Campylobacter jejuni)。Cas9家族成员的另外实例在WO 2014/131833中进行描述,所述文献出于所有目的通过引用整体并入本文。来自酿脓链球菌的Cas9(SpCas9)(指定SwissProt登录号Q99ZW2)是示例性Cas9蛋白。来自金黄色葡萄球菌的Cas9(SaCas9)(指定UniProt登录号J7RUA5)是另一示例性Cas9蛋白。来自空肠弯曲杆菌的Cas9(CjCas9)(指定UniProt登录号Q0P897)是另一种示例性Cas9蛋白。参见例如,Kim等人(2017),《自然通讯(Nat.Comm.)》8:14500,所述文献出于所有目的通过引用整体并入本文。SaCas9小于SpCas9,并且CjCas9小于SaCas9和SpCas9两者。
Cas蛋白的另一个实例是Cpf1(来自普雷沃氏菌(Prevotella)和弗朗西斯氏菌(Francisella)1的CRISPR)蛋白。Cpf1是含有与Cas9的对应结构域同源的RuvC样核酸酶结构域以及与特征性富含精氨酸的Cas9簇的对应物的大蛋白质(约1300个氨基酸)。然而,Cpf1缺乏Cas9蛋白中存在的HNH核酸酶结构域,并且RuvC样结构域在Cpf1序列中是连续的,而Cas9则相反,其含有包含HNH结构域的长插入物。参见例如,Zetsche等人(2015),《细胞》163(3):759-771,所述文献出于所有目的通过引用整体并入本文。示例性Cpf1蛋白来自土拉弗朗西斯菌(Francisella tularensis)1、土拉弗朗西丝菌新凶手亚种(Francisellatularensis subsp.novicida)、易北河普雷沃氏菌(Prevotella albensis)、毛螺菌科细菌(Lachnospiraceae bacterium)MC2017 1、解蛋白丁酸弧菌(Butyrivibrioproteoclasticus)、异域菌门细菌(Peregrinibacteria bacterium)GW2011_GWA2_33_10、俭菌超门细菌(Parcubacteria bacterium)GW2011_GWC2_44_17、史密斯氏菌属(Smithellasp.)SCADC、氨基酸球菌属(Acidaminococcus sp.)BV3L6、毛螺菌科细菌(Lachnospiraceaebacterium)MA2020、候选白蚁甲烷支原体(Candidatus Methanoplasma termitum)、挑剔真杆菌(Eubacterium eligens)、牛眼莫拉氏菌(Moraxella bovoculi)237、稻田氏钩端螺旋体(Leptospira inadai)、毛螺菌科细菌(Lachnospiraceae bacterium)ND2006、狗口腔卟啉单胞菌(Porphyromonas crevioricanis)3、解糖胨普雷沃氏菌(Prevotella disiens)和猕猴卟啉单胞菌(Porphyromonas macacae)。来自新凶手弗朗西丝氏菌(Francisellanovicida)U112的Cpf1(FnCpf1;指定UniProt登录号A0Q7Q2)是示例性Cpf1蛋白。
Cas蛋白可以是野生型蛋白(即,自然界中存在的那些蛋白)、经修饰的Cas蛋白(即,Cas蛋白变体)或野生型或经修饰的Cas蛋白的片段。就野生型或经修饰的Cas蛋白的催化活性而言,Cas蛋白也可以是活性变体或片段。就催化活性而言,活性变体或片段可以包括与野生型或经修饰的Cas蛋白或其部分具有至少80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的序列同一性,其中活性变体保留在期望的切割位点处切割的能力,并因此保留切口诱导或双链断裂诱导活性。对切口诱导或双链断裂诱导活性的测定是已知的,并且通常测量Cas蛋白对含有切割位点的DNA底物的总体活性和特异性。
可以修饰Cas蛋白以增加或减少核酸结合亲和力、核酸结合特异性和酶活性中的一种或多种。也可以修饰Cas蛋白以改变蛋白质的任何其它活性或性质,如稳定性。例如,可以修饰、缺失或灭活Cas蛋白的一个或多个核酸酶结构域,或者可以截短Cas蛋白以去除对蛋白质功能不是必需的结构域或优化(例如,增强或减少)Cas蛋白的活性或性质。
经修饰的Cas蛋白的一个实例是经修饰的SpCas9-HF1蛋白,其是具有设计成减少非特异性DNA接触的改变(N497A/R661A/Q695A/Q926A)的酿脓链球菌Cas9的高保真变体。参见例如,Kleinstiver等人(2016),《自然(Nature)》529(7587):490-495,所述文献出于所有目的通过引用整体并入本文。经修饰Cas蛋白的另一个实例是被设计成减少脱靶效应的经修饰的eSpCas9变体(K848A/K1003A/R1060A)。参见例如,Slaymaker等人(2016),《科学(Science)》351(6268):84-88,所述文献出于所有目的通过引用整体并入本文。其它SpCas9变体包含K855A和K810A/K1003A/R1060A。
Cas蛋白可以包括至少一个核酸酶结构域,如DNase结构域。例如,野生型Cpf1蛋白通常包括切割靶DNA的两条链的RuvC样结构域,其可能呈二聚体构型。Cas蛋白还可以包括至少两个核酸酶结构域,如DNase结构域。例如,野生型Cas9蛋白通常包括RuvC样核酸酶结构域和HNH样核酸酶结构域。RuvC结构域和HNH结构域可以各自切割双链DNA的不同的链以在DNA中产生双链断裂。参见例如,Jinek等人(2012),《科学》337:816-821,所述文献出于所有目的通过引用整体并入本文。
核酸酶结构域中的一个或多个或所有核酸酶结构域可以缺失或突变,使得其不再具有功能或具有降低的核酸酶活性。例如,如果Cas9蛋白中的核酸酶结构域之一进行缺失或突变,则所得Cas9蛋白可以被称为切口酶,并且可以在双链靶DNA内产生单链断裂,但不会产生双链断裂(即,其可以切割互补链或非互补链,但不能同时切割两者)。如果核酸酶结构域中的两者进行缺失或突变,则所得Cas蛋白(例如,Cas9)切割双链DNA的两条链的能力将降低(例如,核酸酶无效或核酸酶失活Cas蛋白,或催化死亡的Cas蛋白(dCas))。将Cas9转化为切口酶的突变的实例是来自酿脓链球菌的Cas9的RuvC结构域中的D10A(在Cas9的位置10处天冬氨酸转化为丙氨酸)突变。同样地,来自酿脓链球菌的Cas9的HNH结构域中的H939A(在氨基酸位置839处组氨酸到丙氨酸)、H840A(在氨基酸位置840处组氨酸到丙氨酸)或N863A(在氨基酸位置N863处天冬酰胺到丙氨酸)可以将Cas9转化为切口酶。将Cas9转化为切口酶的突变的其它实例包含来自嗜热链球菌的Cas9的对应突变。参见例如,Sapranauskas等人(2011),《核酸研究》39:9275-9282和WO 2013/141680,所述文献中的每个文献出于所有目的通过引用整体并入本文。可以使用如定点诱变、PCR介导的诱变或总基因合成等方法产生此类突变。产生切口酶的其它突变实例可以在例如WO 2013/176772和WO2013/142578中找到,所述文献中的每个文献出于所有目的通过引用整体并入本文。如果Cas蛋白中的全部核酸酶结构域都进行缺失或突变(例如,Cas9蛋白中的两个核酸酶结构域都进行缺失或突变),则所得Cas蛋白(例如,Cas9)切割双链DNA的两条链的能力将降低(例如,核酸酶无效或核酸酶失活Cas蛋白)。一个具体实例是D10A/H840A酿脓链球菌Cas9双突变体或者当与酿脓链球菌Cas9最佳比对时来自另一物种的Cas9中的对应双突变体。另一个具体实例是D10A/N863A酿脓链球菌Cas9双突变体或者当与酿脓链球菌Cas9最佳比对时来自另一物种的Cas9中的对应双突变体。
金黄色葡萄球菌Cas9蛋白的催化结构域中的失活突变的实例也是已知的。例如,金黄色葡萄球菌Cas9酶(SaCas9)可以包括用于产生核酸酶失活Cas蛋白的位置N580处的取代(例如,N580A取代)和位置D10处的取代(例如,D10A取代)。参见例如,WO 2016/106236,所述文献出于所有目的通过引用整体并入本文。
Cpf1蛋白的催化结构域中的失活突变的实例也是已知的。参考来自新凶手弗朗西丝氏菌U112(FnCpf1)、氨基酸球菌BV3L6(AsCpf1)、毛螺科菌ND2006(LbCpf1)和牛眼莫拉氏菌237(MbCpf1 Cpf1)的Cpf1蛋白,此类突变可以包含AsCpf1的位置908、993或1263处或Cpf1直系同源物中的对应位置处,或LbCpf1的位置832、925、947或1180或Cpf1直系同源物中的对应位置处的突变。此类突变可以包含例如AsCpf1的突变D908A、E993A和D1263A或Cpf1直系同源物中的对应突变或LbCpf1的D832A、E925A、D947A和D1180A或Cpf1直系同源物中的对应突变中的一种或多种突变。参见例如US 2016/0208243,所述文献出于所有目的通过引用整体并入本文。
Cas蛋白也可以作为融合蛋白与异源多肽可操作地连接。例如,Cas蛋白可以与切割结构域或表观遗传修饰结构域融合。参见WO 2014/089290,所述文献出于所有目的通过引用整体并入本文。Cas蛋白也可以与异源多肽融合,从而提高或降低稳定性。融合结构域或异源多肽可以定位于N端、C端或Cas蛋白内部。
举例来说,Cas蛋白可以与提供亚细胞定位的一种或多种异源多肽融合。此类异源多肽可以包含例如一种或多种核定位信号(NLS),如用于靶向细胞核的单分SV40 NLS和/或双分α-输入蛋白NLS、用于靶向线粒体的线粒体定位信号、ER保留信号等。参见例如,Lange等人(2007),《生物化学杂志(J.Biol.Chem.)》282:5101-5105,所述文献出于所有目的通过引用整体并入本文。此类亚细胞定位信号可以定位于N端、C端或Cas蛋白内的任何位置。NLS可以包括碱性氨基酸段,并且可以是单分序列或二分序列。任选地,Cas蛋白可以包括两个或更多个NLS,包含N端处的NLS(例如,α-输入蛋白NLS或单分NLS)和C端处的NLS(例如,SV40NLS或双分NLS)。Cas蛋白还可以包括N端处的两个或更多个NLS和/或C端处的两个或更多个NLS。
Cas蛋白也可以与细胞穿透性结构域或蛋白质转导结构域可操作地连接。例如,细胞穿透性结构域可以源自HIV-1TAT蛋白、来自人乙型肝炎病毒的TLM细胞穿透基序、MPG、Pep-1、VP22、来自单纯疱疹病毒的细胞穿透性肽或聚精氨酸肽序列。参见例如WO2014/089290和WO 2013/176772,所述文献中的每个文献出于所有目的通过引用整体并入本文。细胞穿透性结构域可以定位于N端、C端或Cas蛋白内的任何位置。
Cas蛋白也可以与异源多肽可操作地连接以便于进行追踪或纯化,如荧光蛋白、纯化标签或表位标签。荧光蛋白的实例包含绿色荧光蛋白(例如,GFP、GFP-2、tagGFP、turboGFP、eGFP、祖母绿、Azami绿、单体Azami绿、CopGFP、AceGFP、ZsGreenl)、黄色荧光蛋白(例如,YFP、eYFP、柠檬黄、Venus、YPet、PhiYFP、ZsYellowl)、蓝色荧光蛋白(例如,eBFP、eBFP2、石青、mKalamal、GFPuv、天蓝色、T-天蓝色(T-sapphire))、青色荧光蛋白(例如,eCFP、蔚蓝色(Cerulean)、CyPet、AmCyanl、Midoriishi-青色)、红色荧光蛋白(例如,mKate、mKate2、mPlum、DsRed单体、mCherry、mRFP1、DsRed-表达、DsRed2、DsRed-单体、HcRed-Tandem、HcRedl、AsRed2、eqFP611、mRaspberry、mStrawberry、Jred)、橙色荧光蛋白(例如,mOrange、mKO、Kusabira-橙色、单体Kusabira-橙色、mTangerine、tdTomato)和任何其它合适的荧光蛋白。标签的实例包含谷胱甘肽-S-转移酶(GST)、几丁质结合蛋白(CBP)、麦芽糖结合蛋白、硫氧还蛋白(TRX)、聚(NANP)、串联亲和纯化(TAP)标签、myc、AcV5、AU1、AU5、E、ECS、E2、FLAG、血凝素(HA)、nus、Softag 1、Softag 3、Strep、SBP、Glu-Glu、HSV、KT3、S、S1、T7、V5、VSV-G、组氨酸(His)、生物素羧基载体蛋白(BCCP)和钙调蛋白。
Cas蛋白还可以栓系到外源性供体核酸或经标记的核酸。这种栓系(即,物理连接)可以通过共价相互作用或非共价相互作用来实现,并且栓系可以是直接的(例如,通过直接融合或化学缀合,这可以通过蛋白质上的半胱氨酸或赖氨酸残基的修饰或内含子修饰来实现),或者可以通过如链霉亲和素或适配子等一个或多个中间连接子或衔接子分子来实现。参见例如,Pierce等人(2005),《药物化学短评(Mini Rev.Med.Chem.)》5(1):41-55;Duckworth等人(2007),《德国应用化学会刊(Angew.Chem.Int.Ed.Engl.)》46(46):8819-8822;Schaeffer和Dixon(2009),《澳大利亚化学杂志(Australian J.Chem.)》62(10):1328-1332;Goodman等人(2009),《生物化学(Chembiochem.)》10(9):1551-1557;以及Khatwani等人(2012)《生物有机化学与医药化学(Bioorg.Med.Chem.)》20(14):4532-4539,所述文献中的每个文献出于所有目的通过引用整体并入本文。用于合成蛋白质-核酸缀合物的非共价策略包含生物素-链霉亲和素和镍-组氨酸方法。可以通过使用多种化学反应连接适当功能化的核酸和蛋白质来合成共价蛋白质-核酸缀合物。这些化学反应中的一些化学反应涉及将寡核苷酸直接附着到蛋白质表面上的氨基酸残基(例如,赖氨酸胺或半胱氨酸硫醇),而其它更复杂的方案需要蛋白质的翻译后修饰或者催化或反应蛋白结构域的参与。用于蛋白质与核酸共价附着的方法可以包含例如寡核苷酸与蛋白质赖氨酸或半胱氨酸残基的化学交联、表达的蛋白质连接、化学酶法和光适体的使用。外源性供体核酸或标记的核酸可以栓系到Cas蛋白内的C端、N端或内部区域。在一个实例中,外源性供体核酸或标记的核酸拴系到Cas蛋白的C端或N端。同样地,Cas蛋白可以栓系到外源性供体核酸或标记的核酸的5'末端、3'末端或内部区域。也就是说,外源性供体核酸或标记的核酸可以以任何取向和极性拴系。例如,Cas蛋白可以栓系到外源性供体核酸或标记的核酸的5'末端或3'末端。
Cas蛋白可以以任何形式提供。例如,Cas蛋白可以以蛋白质的形式提供,如与gRNA复合的Cas蛋白。可替代地,可以以对Cas蛋白进行编码的核酸形式提供Cas蛋白,如RNA(例如,信使RNA(mRNA))或DNA。任选地,可以对编码Cas蛋白的核酸进行密码子优化以在特定细胞或生物体中有效翻译成蛋白质。例如,与天然存在的多核苷酸序列相比,可以修饰对Cas蛋白进行编码的核酸以取代在细菌细胞、酵母细胞、人细胞、非人细胞、哺乳动物细胞、啮齿动物细胞、小鼠细胞、大鼠细胞或任何其它所关注宿主细胞中具有更高使用频率的密码子。当对Cas蛋白进行编码的核酸被引入到细胞中时,Cas蛋白可以在细胞中进行瞬时、条件性或组成性表达。
作为mRNA提供的Cas蛋白可以被修饰用于改进的稳定性和/或免疫原性性质。可以对mRNA内的一种或多种核苷进行修饰。对mRNA核碱基进行化学修饰的实例包含假尿苷、1-甲基-假尿苷和5-甲基-胞苷。例如,可以使用含有N1-甲基假尿苷的加帽和聚腺苷酸化CasmRNA。同样地,Cas mRNA可以通过使用同义密码子对尿苷进行缺失来修饰。
对Cas蛋白进行编码的核酸可以稳定地整合在细胞的基因组中,并且与在细胞中有活性的启动子可操作地连接。可替代地,对Cas蛋白进行编码的核酸可以与表达构建体中的启动子可操作地连接。表达构建体包含能够指导基因或其它所关注核酸序列(例如,Cas基因)的表达并且可以将此类所关注核酸序列转移到靶细胞的任何核酸构建体。例如,对Cas蛋白进行编码的核酸可以在包括对gRNA进行编码的DNA的载体中。可替代地,其可以在与包括对gRNA进行编码的DNA的载体分离的载体或质粒中。可以用于表达构建体的启动子包含在例如真核细胞、人细胞、非人细胞、哺乳动物细胞、非人哺乳动物细胞、啮齿动物细胞、小鼠细胞、大鼠细胞、多能性细胞、胚胎干(ES)细胞、成体干细胞、发育受限的祖细胞、诱导多能干(iPS)细胞或单细胞期胚胎中的一种或多种细胞中具有活性的启动子。此类启动子可以是例如条件启动子、诱导型启动子、组成型启动子或组织特异性启动子。任选地,启动子可以是在一个方向上驱动Cas蛋白的表达并且在另一个方向上驱动向导RNA的表达的双向启动子。此类双向启动子可以由以下组成:(1)含有3个外部控制元件:远侧序列元件(DSE)、近侧端序列元件(PSE)和TATA框的完整的、常规的、单向的Pol III启动子;(2)包含在相反取向上与DSE的5'端融合PSE和TATA盒的第二基本Pol III启动子。例如,在H1启动子中,DSE邻近PSE和TATA框,并且可以通过产生杂合启动子使启动子双向化,其中通过源自U6启动子的附加PSE和TATA盒来控制反向转录。参见例如US 2016/0074535,所述文献出于所有目的通过引用整体并入本文。使用双向启动子同时表达对Cas蛋白和向导RNA进行编码的基因允许生成紧凑表达盒以促进递送。
向导RNA:“向导RNA”或“gRNA”是与Cas蛋白(例如,Cas9蛋白)结合并将Cas蛋白靶向靶DNA内的特定位置的RNA分子。向导RNA可以包括两个区段:“DNA靶向区段”和“蛋白质结合区段”。“区段”包含分子的一部分或区域,如RNA中的连续核苷酸段。一些gRNA,如Cas9的那些,可以包括两个单独的RNA分子:“激活因子RNA”(例如,tracrRNA)和“靶向因子RNA”(例如,CRISPR RNA或crRNA)。其它gRNA是单个RNA分子(单个RNA多核苷酸),所述单个RNA分子也可以被称为“单分子gRNA”、“单向导RNA”或“sgRNA”。参见例如WO 2013/176772、WO 2014/065596、WO 2014/089290、WO2014/093622、WO 2014/099750、WO 2013/142578和WO 2014/131833,所述文献中的每个文献出于所有目的通过引用整体并入本文。例如,对于Cas9,单向导RNA可以包括(例如,通过连接子)与tracrRNA融合的crRNA。例如,对于Cpf1,只需要crRNA就可以实现与靶序列的结合。术语“向导RNA”和“gRNA”包含双分子(即,模块化)gRNA和单分子gRNA两者。
示例性双分子gRNA包括crRNA样(“CRISPR RNA”或“靶向因子RNA”或“crRNA”或“crRNA重复序列”)分子和对应的tracrRNA样(“反式作用CRISPR RNA”或“激活因子RNA”或“tracrRNA”)分子。crRNA包括gRNA的DNA靶向区段(单链)和核苷酸段,所述核苷酸段形成gRNA的蛋白质结合区段的dsRNA双链体的一半。定位在DNA靶向区段下游(3')的crRNA尾部的实例包括GUUUUAGAGCUAUGCU(SEQ ID NO:84)、基本上由其组成或由其组成。本文所公开的DNA靶向区段中的任何区段都可以与SEQ ID NO:84的5'末端连接以形成crRNA。
对应的tracrRNA(激活因子RNA)包括形成gRNA的蛋白质结合区段的dsRNA双链体的另一半的核苷酸段。crRNA的核苷酸段与tracrRNA的核苷酸段互补并且与其杂交,以形成gRNA的蛋白质结合结构域的dsRNA双链体。因此,每个crRNA可以被视为具有对应的tracrRNA。tracrRNA序列的实例包括AGCAUAGCAAGUUAAAAUAAGGCUAGUCCG UUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUU(SEQ ID NO:85)、基本上由其组成或由其组成。
在需要crRNA和tracrRNA两者的系统中,crRNA和对应的tracrRNA杂交以形成gRNA。在仅需要crRNA的系统中,crRNA可以是gRNA。crRNA另外提供与靶DNA的互补链杂交的单链DNA靶向区段。如果用于细胞内的修饰,则给定的crRNA或tracrRNA分子的确切序列可以被设计成对将使用RNA分子的物种具有特异性。参见例如,Mali等人(2013),《科学》339:823-826;Jinek等人(2012),《科学》337:816-821;Hwang等人(2013),《自然生物技术》31:227-229;Jiang等人(2013),《自然生物技术》31:233-239;以及Cong等人(2013),《科学》339:819-823,所述文献中的每个文献出于所有目的通过引用整体并入本文。
给定gRNA的DNA靶向区段(crRNA)包括与靶DNA的互补链上的序列互补的核苷酸序列,如下文更详细地描述的。gRNA的DNA靶向区段通过杂交(即,碱基配对)以序列特异性方式与靶DNA相互作用。因此,DNA靶向区段的核苷酸序列可以不同,并且测定gRNA和靶DNA将与其相互作用的靶DNA内的定位。可以修饰主题gRNA的DNA靶向区段以与靶DNA内的任何期望序列杂交。天然存在的crRNA因CRISPR/Cas系统和生物体而不同,但通常含有长度为21到72个核苷酸的由长度为21到46个核苷酸的两个直接重复序列(DR)侧接的靶向区段(参见例如,WO 2014/131833,所述文献出于所有目的通过引用整体并入本文)。在酿脓链球菌的情况下,DR的长度为36个核苷酸,并且靶向区段的长度为30个核苷酸。定位于3'的DR与对应的tracrRNA互补并杂交,后者进而与Cas蛋白结合。
DNA靶向区段的长度可以为例如至少约12、15、17、18、19、20、25、30、35或40个核苷酸。此类DNA靶向区段的长度可以为例如约12到约100、约12到约80、约12到约50、约12到约40、约12到约30、约12到约25或约12到约20个核苷酸。例如,DNA靶向区段可以为约15到约25个核苷酸(例如,约17到约20个核苷酸或约17、18、19或20个核苷酸)。参见例如US 2016/0024523,所述文献出于所有目的通过引用整体并入本文。对于来自酿脓链球菌的Cas9,典型的DNA靶向区段的长度介于16与20个核苷酸之间或长度介于17与20个核苷酸之间。对于来自金黄色葡萄球菌的Cas9,典型的DNA靶向区段的长度介于21与23个核苷酸之间。对于Cpf1,典型的DNA靶向区段的长度为至少16个核苷酸或至少18个核苷酸。
TracrRNA可以呈任何形式(例如,全长tracrRNA或活性部分tracrRNA)并具有不同长度。TracrRNA可以包含初级转录本或经处理的形式。例如,tracrRNA(作为单向导RNA的一部分或作为作为双分子gRNA的一部分的单独分子)可以包括野生型tracrRNA序列(例如,野生型tracrRNA序列的约或超过约20、26、32、45、48、54、63、67、85或更多个核苷酸)、基本上由其组成或由其组成。来自酿脓链球菌的野生型tracrRNA序列的实例包含171核苷酸、89核苷酸、75核苷酸和65核苷酸版本。参见例如,Deltcheva等人(2011),《自然》471:602-607;WO2014/093661,所述文献中的每个文献出于所有目的通过引用整体并入本文。单向导RNA(sgRNA)内的tracrRNA的实例包含在+48、+54、+67和+85版本的sgRNA中发现的tracrRNA区段,其中“+n”表示在sgRNA中包含野生型tracrRNA的至多+n个核苷酸。参见US 8,697,359,所述文献出于所有目的通过引用整体并入本文。
向导RNA的DNA靶向区段与靶DNA的互补链之间的互补性百分比可以为至少60%(例如,至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少97%、至少98%、至少99%或100%)。DNA靶向区段与靶DNA的互补链之间的互补性百分比在约20个连续核苷酸上可以为至少60%。举例来说,DNA靶向区段与靶DNA的互补链之间的互补性百分比在靶DNA的互补链的5'末端处的14个连续的核苷酸上可以为100%并且在其余部分上低至0%。在此类情况下,DNA靶向区段可以被视为长度为14个核苷酸。作为另一个实例,DNA靶向区段与靶DNA的互补链之间的互补性百分比在靶DNA的互补链的5'末端处的七个连续的核苷酸上可以为100%并且在其余部分上低至0%。在此类情况下,DNA靶向区段可以被视为长度为7个核苷酸。在一些向导RNA中,DNA靶向区段内的至少17个核苷酸与靶DNA的互补链互补。例如,DNA靶向区段的长度可以为20个核苷酸并且可以包括与靶DNA的互补链的1个、2个或3个错配。在一个实例中,错配不与对应于原型间隔子相邻基序(PAM)序列的互补链的区域(即,PAM序列的反向补体)相邻(例如,错配处于向导RNA的DNA靶向区段的5'末端中,或者错配距离对应于PAM序列的互补链的区域至少2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18或19个碱基对)。
gRNA的蛋白质结合区段可以包括彼此互补的两个核苷酸段。蛋白质结合区段的互补核苷酸杂交形成双链RNA双链体(dsRNA)。主题gRNA的蛋白质结合区段与Cas蛋白相互作用,并且gRNA通过DNA靶向区段将结合的Cas蛋白引导到靶DNA内的特异性核苷酸序列。
单向导RNA可以包括DNA靶向区段和支架序列(即,向导RNA的蛋白质结合或Cas结合序列)。例如,此类向导RNA可以具有连接到3'支架序列的5'DNA靶向区段。示例性支架序列包括以下、基本上由以下组成或由以下组成:GUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCU(版本1;SEQ ID NO:86);GUUGGAACCAUUCAAAACAGCAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC(版本2;SEQ ID NO:87);GUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC(版本3;SEQ ID NO:88);和GUUUAAGAGCUAUGCUGGAAACAGCAUAGCAAGUUUAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC(版本4;SEQ ID NO:89)。靶向本文所公开的向导RNA靶序列中的任何序列的向导RNA可以包含例如与向导RNA的3'末端上的示例性向导RNA支架序列中的任何序列融合的向导RNA的5'末端上的DNA靶向区段。即,本文所公开的DNA靶向区段中的任何DNA靶向区段可以与上述支架序列中的任何支架序列的5'末端连接以形成单向导RNA(嵌合向导RNA)。
向导RNA可以包含提供另外的期望特征的修饰或序列(例如,经修饰或经调控的稳定性;亚细胞靶向;用荧光标记追踪;蛋白质或蛋白质复合物的结合位点等)。此类修饰的实例包含例如5'帽(例如,7-甲基鸟苷酸帽(m7G));3'聚腺苷酸化尾部(即,3'poly(A)尾部);核糖开关序列(例如,以允许调控稳定性和/或调控蛋白质和/或蛋白质复合物的可及性);稳定性控制序列;形成dsRNA双链体(即,发夹)的序列;将RNA靶向亚细胞位置(例如,细胞核、线粒体、叶绿体等)的修饰或序列;提供用于追踪的修饰或序列(例如,与荧光分子直接缀合、与促进荧光检测的部分缀合、允许荧光检测的序列等);为蛋白质(例如,作用于DNA的蛋白质,包含DNA甲基转移酶、DNA去甲基化酶、组蛋白乙酰转移酶、组蛋白去乙酰化酶等)提供结合位点的修饰或序列;和其组合。修饰的其它实例包含工程化茎环双链体结构、工程化凸起区、茎环双链体结构的工程化发夹3'或其任何组合。参见例如US2015/0376586,所述文献出于所有目的通过引用整体并入本文。凸起可以是由crRNA样区域和最小tracrRNA样区域构成的双链体内的核苷酸的未配对区域。凸起在双链体的一侧可以包括未配对的5'-XXXY-3',其中X是任何嘌呤,并且Y可以包括可以与相对链上的核苷酸形成摇摆对的核苷酸;并且在双链体的另一侧包括未配对核苷酸区。
未经修饰的核酸可能易于降解。外源性核酸也可以诱导先天免疫应答。修饰可以有助于引入稳定性并降低免疫原性。向导RNA可以包括经修饰的核苷和经修饰的核苷酸,包含例如以下中的一种或多种:(1)磷酸二酯骨架键中的非连接磷酸氧中的一个或两个和/或连接磷酸氧中的一个或多个的改变或替代;(2)核糖成分的改变或替代,如核糖上的2'羟基的改变或替代;(3)用脱磷连接子替代磷酸部分;(4)天然存在的核碱基的修饰或替代;(5)核糖磷酸骨架的替代或修饰;(6)寡核苷酸3'末端或5'末端的修饰(例如,末端磷酸基团的去除、修饰或替代或部分的缀合);以及(7)糖的修饰。其它可能的向导RNA修饰包含尿嘧啶或聚尿嘧啶束的修饰或替代。参见例如WO 2015/048577和US 2016/0237455,所述文献中的每个文献出于所有目的通过引用整体并入本文。可以对Cas编码核酸如Cas mRNA进行相似的修饰。
举例来说,向导RNA的5'或3'末端处的核苷酸可以包含硫代磷酸酯键(例如,碱基可以具有经修饰的磷酸酯基,所述经修饰的磷酸酯基是硫代磷酸酯基)。例如,向导RNA可以包含向导RNA的5'或3'末端处的2、3或4个末端核苷酸之间的硫代磷酸酯键。作为另一个实例,向导RNA的5'和/或3'末端的核苷酸可以具有2'-O-甲基修饰。例如,向导RNA可以包含向导RNA的5'和/或3'末端(例如,5'末端)的2、3或4个端核苷酸处的2'-O-甲基修饰。参见例如WO 2017/173054 A1和Finn等人(2018),《细胞报告(Cell Reports)》22:1-9,所述文献中的每个文献出于所有目的通过引用整体并入本文。在一个具体实例中,向导RNA在前三个5'和3'端RNA残基处包括2'-O-甲基类似物和3'硫代磷酸酯核苷酸间键。在另一个具体实例中,向导RNA被修饰使得所有不与Cas9蛋白相互作用的2'OH基团被2'-O-甲基类似物置换,并且与Cas9的相互作用最小的向导RNA的尾部区用5'和3'硫代磷酸酯核苷酸间键修饰。参见例如,Yin等人(2017),《自然生物技术》35(12):1179-1187,所述文献出于所有目的通过引用整体并入本文。经修饰的向导RNA的其它实例在例如WO 2018/107028 A1中提供,所述文献出于所有目的整体并入本文。
可以以任何形式提供向导RNA。例如,gRNA可以以RNA的形式提供,作为两个分子(单独的crRNA和tracrRNA)或作为一个分子(sgRNA),并且任选地以与Cas蛋白的复合物的形式提供。gRNA也可以以对gRNA进行编码的DNA的形式提供。对gRNA进行编码的DNA可以编码单个RNA分子(sgRNA)或单独的RNA分子(例如,单独的crRNA和tracrRNA)。在后一种情况下,对gRNA进行编码的DNA可以作为一个DNA分子或作为分别对crRNA和tracrRNA进行编码的单独DNA分子提供。
当gRNA以DNA的形式提供时,gRNA可以在细胞中瞬时、有条件或组成型表达。对gRNA进行编码的DNA可以稳定地整合到细胞的基因组中,并且与在细胞中具有活性的启动子可操作地连接。可替代地,对gRNA进行编码的DNA可以与表达构建体中的启动子可操作地连接。例如,对gRNA进行编码的DNA可以处于包括异源核酸如对Cas蛋白进行编码的核酸的载体中。可替代地,对gRNA进行编码的DNA可以处于与包括对Cas蛋白进行编码的核酸的载体分开的载体或质粒中。可以用于此类表达构建体的启动子包含例如在真核细胞、人细胞、非人细胞、哺乳动物细胞、非人哺乳动物细胞、啮齿动物细胞、小鼠细胞、大鼠细胞、仓鼠细胞、兔细胞、多能性细胞、胚胎干(ES)细胞、成体干细胞、发育受限的祖细胞、诱导的多能干(iPS)细胞或单细胞期胚胎中的一种或多种中有活性的启动子。此类启动子可以是例如条件启动子、诱导型启动子、组成型启动子或组织特异性启动子。此类启动子也可以是例如双向启动子。合适启动子的具体实例包含RNA聚合酶III启动子,如人U6启动子、大鼠U6聚合酶III启动子或小鼠U6聚合酶III启动子。
可替代地,可以通过各种其它方法制备gRNA。例如,可以使用例如T7 RNA聚合酶通过体外转录制备gRNA(参见例如,WO 2014/089290和WO 2014/065596,所述文献中的每个文献出于所有目的通过引用整体并入本文)。向导RNA也可以是通过化学合成制备的合成产生的分子。
向导RNA靶序列:用于向导RNA的靶DNA包含存在于DNA中的核酸序列,gRNA的DNA靶向区段将与其结合,前提是存在足够的结合条件。合适的DNA/RNA结合条件包含细胞中通常存在的生理条件。其它合适的DNA/RNA结合条件(例如,无细胞系统中的条件)是本领域已知的(参见例如,《分子克隆:实验室手册》,第3版(Sambrook等人,海港实验室出版社(HarborLaboratory Press)2001),所述文献出于所有目的通过引用整体并入本文)。与gRNA互补并杂交的靶DNA的链可以被称为“互补链”,并且与“互补链”互补(并且因此不与Cas蛋白或gRNA互补)的靶DNA的链可以称为“非互补链”或“模板链”。
靶DNA包含向导RNA所杂交的互补链上的序列和非互补链上的对应序列(例如,邻近原型间隔子邻近基序(PAM))。如本文所使用的,术语“向导RNA靶序列”具体指非互补链上的与向导RNA在互补链上与其杂交的序列相对应(即,其反向补体)的序列。即,向导RNA靶序列是指非互补链上的与PAM相邻(例如,在Cas9的情况下,PAM的上游或5')的序列。向导RNA靶序列等同于向导RNA的DNA靶向区段,但具有胸腺嘧啶而不是尿嘧啶。举例来说,SpCas9酶的向导RNA靶序列可以指非互补链上的5'-NGG-3'PAM上游的序列。向导RNA被设计成与靶DNA的互补链具有互补性,其中向导RNA的DNA靶向区段与靶DNA的互补链之间的杂交促进CRISPR复合物的形成。不一定需要完全互补,条件是存在足够的互补性来引起杂交并促进CRISPR复合物的形成。如果向导RNA在本文中被称为靶向向导RNA靶序列,则意味着向导RNA与靶DNA的互补链序列杂交,所述互补链序列是非互补链上的向导RNA靶序列的反向补体。
靶DNA或向导RNA靶序列可以包括任何多核苷酸并且可以定位在例如细胞的细胞核或细胞质中或者细胞的细胞器,如线粒体或叶绿体内。靶DNA或向导RNA靶序列可以是细胞内源性或外源性的任何核酸序列。向导RNA靶序列可以是编码基因产物(例如,蛋白质)的序列或非编码序列(例如,调控序列)或者可以包含两者。
Cas蛋白对靶DNA的位点特异性结合和切割可以发生在由(i)向导RNA与靶DNA的互补链之间的碱基配对互补性和(ii)靶DNA的非互补链中的短基序(被称为原型间隔子相邻基序(PAM))两者测定的定位处。PAM可以侧接向导RNA靶序列。任选地,向导RNA靶序列可以在3'末端上侧接有PAM(例如,对于Cas9)。可替代地,向导RNA靶序列可以在5'末端上侧接有PAM(例如,对于Cpf1)。例如,Cas蛋白的切割位点可以是PAM序列上游或下游(例如,向导RNA靶序列内)的约1到约10或约2到约5个碱基对(例如,3个碱基对)。在SpCas9的情况下,PAM序列(即,非互补链上)可以是5'-N1GG-3',其中N1是任何DNA核苷酸,并且PAM紧接着靶DNA的非互补链上的向导RNA靶序列的3'。因此,对应于互补链上的PAM的序列(即,反向补体)将是5'-CCN2-3',其中N2是任何DNA核苷酸并且紧接着向导RNA的DNA靶向区段在靶DNA的互补链上与其杂交的序列的5'。在一些此类情况下,N1和N2可以是互补的,并且N1-N2碱基对可以是任何碱基对(例如,N1=C并且N2=G;N1=G并且N2=C;N1=A并且N2=T;或N1=T并且N2=A)。在来自金黄色葡萄球菌的Cas9的情况下,PAM可以是NNGRRT或NNGRR,其中N可以A、G、C或T,并且R可以是G或A。在来自空肠弯曲杆菌的Cas9的情况下,PAM可以是例如NNNNACAC或NNNNRYAC,其中N可以是A、G、C或T,并且R可以是G或A。在一些情况下(例如,对于FnCpf1),PAM序列可以位于5'末端上游并且具有序列5'-TTN-3'。
向导RNA靶序列的实例是紧接在SpCas9蛋白识别的NGG基序之前的20核苷酸DNA序列。例如,向导RNA靶序列加PAM的两个实例是GN19NGG(SEQ ID NO:90)或N20NGG(SEQ ID NO:91)。参见例如,WO 2014/165825,所述文献出于所有目的通过引用整体并入本文。5'末端处的鸟嘌呤可以促进细胞中RNA聚合酶的转录。向导RNA靶序列加PAM的其它实例可以包含5'末端处的两个鸟嘌呤核苷酸(例如,GGN20NGG;SEQ ID NO:92)以促进体外T7聚合酶的高效转录。参见例如,WO 2014/065596,所述文献出于所有目的通过引用整体并入本文。其它向导RNA靶序列加PAM可以具有长度介于4-22个核苷酸之间的SEQ ID NO:90-92,包含5'G或GG和3'GG或NGG。又其它向导RNA靶序列加PAM可以具有长度介于14与20个核苷酸之间的SEQ IDNO:90-92。
与靶DNA杂交的CRISPR复合物的形成可以导致靶DNA的一条链或两条链在与向导RNA靶序列相对应的区域内或其附近的切割(即,靶DNA的非互补链上的向导RNA靶序列和向导RNA与其杂交的互补链上的反向补体)。例如,切割位点可以位于向导RNA靶序列内(例如,在相对于PAM序列的限定位置处)。“切割位点”包含Cas蛋白产生单链断裂或双链断裂的靶DNA的位置。切割位点可以位于仅一条链上(例如,当使用切口酶时)或位于双链DNA的两条链上。切割位点可以在两条链上的相同位置处(产生平端;例如,Cas9))或可以在每条链上的不同位点处(产生交错末端(即,突出端);例如,Cpf1)。例如,可以通过使用两种Cas蛋白产生交错末端,其中每一种在不同链的不同切割位点处产生单链断裂,从而产生双链断裂。例如,第一切口酶可以在双链DNA(dsDNA)的第一条链上产生单链断裂,并且第二切口酶可以在dsDNA的第二条链上产生单链断裂,使得产生突出序列。在一些情况下,第一条链上的切口酶的向导RNA靶序列或切割位点与第二条链上的切口酶的向导RNA靶序列或切割位点相隔至少2个、3个、4个、5个、6个、7个、8个、9个、10个、15个、20个、25个、30个、40个、50个、75个、100个、250个、500个或1,000个碱基对。
(3)靶向人TTR基因的外源性供体核酸
本文所公开的方法和组合物可以利用外源性供体核酸来在用核酸酶药剂切割人源化TTR基因座后修饰包括β滑移突变的人源化TTR基因座。在此类方法中,核酸酶药剂蛋白质切割人源化TTR基因座以产生单链断裂(切口)或双链断裂,并且外源性供体核酸通过非同源末端连接(NHEJ)介导的连接或通过同源定向修复事件重组人源化TTR基因座。任选地,用外源性供体核酸进行修复去除或破坏了核酸酶靶序列,使得已经靶向的等位基因不能被核酸酶药剂重新靶向。
外源性供体核酸可以包括脱氧核糖核酸(DNA)或核糖核酸(RNA),其可以是单链或双链的,并且其可以呈线性或环状形式。例如,外源性供体核酸可以是单链寡脱氧核苷酸(ssODN)。参见例如Yoshimi等人(2016)《自然通讯》7:10431,所述文献出于所有目的通过引用整体并入本文。示例性外源性供体核酸的长度在约50个核苷酸到约5kb之间、约50个核苷酸到约3kb之间或约50个到约1,000个核苷酸之间。其它示例性外源性供体核酸的长度在约40个到约200个核苷酸之间。例如,外源性供体核酸的长度可以在约50-60、60-70、70-80、80-90、90-100、100-110、110-120、120-130、130-140、140-150、150-160、160-170、170-180、180-190或190-200个核苷酸之间。可替代地,外源性供体核酸的长度可以在约50-100、100-200、200-300、300-400、400-500、500-600、600-700、700-800、800-900或900-1000个核苷酸之间。可替代地,外源性供体核酸的长度可以在约1-1.5、1.5-2、2-2.5、2.5-3、3-3.5、3.5-4、4-4.5或4.5-5kb之间。可替代地,外源性供体核酸的长度可以例如不超过5kb、4.5kb、4kb、3.5kb、3kb、2.5kb、2kb、1.5kb、1kb、900个核苷酸、800个核苷酸、700个核苷酸、600个核苷酸、500个核苷酸、400个核苷酸、300个核苷酸、200个核苷酸、100个核苷酸或50个核苷酸。外源性供体核酸(例如,靶向载体)也可以更长。
在一个实例中,外源性供体核酸是长度在约80个核苷酸与约200个核苷酸之间的ssODN。在另一个实例中,外源性供体核酸是长度在约80个核苷酸与约3kb之间的ssODN。此类ssODN可以具有例如各自长度在约40个核苷酸与约60个核苷酸之间的同源臂。此类ssODN还可以具有例如各自长度在约30个核苷酸与100个核苷酸之间的同源臂。同源臂可以是对称的(例如,长度为各自40个核苷酸或各自60个核苷酸),或者其可以是不对称的(例如,一个同源臂的长度为36个核苷酸,并且一个同源臂的长度为91个核苷酸)。
外源性供体核酸可以包含提供另外的期望特征的修饰或序列(例如,经修饰的或经调控的稳定性;用荧光标记跟踪或检测;蛋白质或蛋白质复合物的结合位点等)。外源性供体核酸可以包括一种或多种荧光标记、纯化标签、表位标签或其组合。例如,外源性供体核酸可以包括一个或多个荧光标记(例如,荧光蛋白或其它荧光团或染料),如至少1个、至少2个、至少3个、至少4个或至少5个荧光标记。示例性荧光标记包含荧光团,如荧光素(例如,6-羧基荧光素(6-FAM))、德克萨斯红(Texas Red)、HEX、Cy3、Cy5、Cy5.5、太平洋蓝、5-(和-6)-羧基四甲基罗丹明(TAMRA)和Cy7。多种荧光染料可商购获得,用于标记寡核苷酸(例如,来自整合DNA技术公司(Integrated DNA Technologies))。此类荧光标记(例如,内部荧光标记)可以用于例如检测已经直接整合到经切割的靶核酸中的外源性供体核酸,所述经切割的靶核酸具有与外源性供体核酸的端相容的突出端。标签或标记可以位于外源性供体核酸的5'末端、3'末端或内部。例如,外源性供体核酸可以在5'末端与来自整合DNA技术公司(5'
Figure BDA0003371335300000591
700)的IR700荧光团缀合。
外源性供体核酸还可以包括核酸插入物,所述核酸插入物包含待整合在包括β滑移突变的人源化TTR基因座处的DNA的区段。核酸插入物在人源化TTR基因座处的整合可能会导致所关注核酸序列到人源化TTR基因座的添加,所关注核酸序列在人源化TTR基因座处的缺失或所关注核酸序列在人源化TTR基因座处的替代(即,缺失和插入)。一些外源性供体核酸被设计成在人源化TTR基因座处插入核酸插入物而在人源化TTR基因座处没有任何对应的缺失。其它外源性供体核酸被设计成在人源化TTR基因座处缺失所关注核酸序列而无需核酸插入物的任何对应的插入。又其它外源性供体核酸被设计成在人源化TTR基因座处缺失所关注核酸序列并用核酸插入物将其替代。
在人源化TTR基因座处被缺失和/或替代的核酸插入物或对应的核酸可以具有各种长度。在人源化TTR基因座处被缺失和/或替代的示例性核酸插入物或对应的核酸的长度在约1个核苷酸到约5kb之间或在约1个核苷酸到约1,000个核苷酸之间。例如,在人源化TTR基因座处被缺失和/或替代的核酸插入物或对应的核酸的长度在约1-10、10-20、20-30、30-40、40-50、50-60、60-70、70-80、80-90、90-100、100-110、110-120、120-130、130-140、140-150、150-160、160-170、170-180、180-190或190-120个核苷酸之间。同样地,在人源化TTR基因座处被缺失和/或替代的核酸插入物或对应的核酸的长度在1-100、100-200、200-300、300-400、400-500、500-600、600-700、700-800、800-900或900-1000个核苷酸之间。同样地,在人源化TTR基因座处被缺失和/或替代的核酸插入物或对应的核酸的长度在约1-1.5、1.5-2、2-2.5、2.5-3、3-3.5、3.5-4、4-4.5或4.5-5kb之间或更长。
核酸插入物可以包括与旨在用于替代的序列中的所有或部分序列同源或直系同源的序列。例如,核酸插入物可以包括与在人源化TTR基因座处旨在用于替代的序列相比包括一个或多个点突变(例如,1个、2个、3个、4个、5个或更多个)的序列。任选地,此类点突变可能导致经编码的多肽中的保守氨基酸取代(例如,用谷氨酸[Glu,E]取代天冬氨酸[Asp,D])。
用于非同源末端连接介导的插入的供体核酸:一些外源性供体核酸可以在5'末端和/或3'末端处具有与由核酸酶介导的切割在包括β滑移突变的人源化TTR基因座处产生的一个或多个突出端互补的短的单链区域。这些突出端也可以被称为5'和3'同源臂。例如,一些外源性供体核酸在5'末端和/或3'末端处具有与由核酸酶介导的切割在人源化TTR基因座的5'和/或3'靶序列处产生的一个或多个突出端互补的短单链区域。一些此类外源性供体核酸仅在5'末端或仅在3'末端处具有互补区。例如,一些此类外源性供体核酸仅在与人源化TTR基因座的5'靶序列处产生的突出端互补的5'末端处或者仅在与人源化TTR基因座的3'靶序列处产生的突出端互补3'末端处具有互补区。其它此类外源性供体核酸在5'和3'末端两者处都有互补区域。例如,其它此类外源性供体核酸在5'和3'末端两者处都有由核酸酶介导的切割在人源化TTR基因座处产生的例如分别与第一突出端和第二突出端互补的互补区。例如,如果外源性供体核酸是双链的,则单链互补区可以从供体核酸的顶部链的5'末端和供体核酸的底部链的5'末端延伸,从而在每端产生5'突出端。可替代地,单链互补区可以从供体核酸的顶部链的3'末端和模板的底部链的3'末端延伸,从而产生3'突出端。
互补区可以具有足以促进外源性供体核酸与靶核酸之间的连接的任何长度。示例性互补区的长度在约1个到约5个核苷酸之间、在约1个到约25个核苷酸之间或在约5个到约150个核苷酸之间。例如,互补区的长度可以为至少约1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个或25个核苷酸。可替代地,互补区的长度可以为约5-10、10-20、20-30、30-40、40-50、50-60、60-70、70-80、80-90、90-100、100-110、110-120、120-130、130-140或140-150个核苷酸或更长。
此类互补区可以与由两对切口酶产生的突出端互补。通过使用切割相反的DNA链以产生第一双链断裂的第一切口酶和第二切口酶以及切割相反的DNA链以产生第二双链断裂的第三切口酶和第四切口酶,可以产生具有交错端的两个双链断裂。例如,Cas蛋白可以用于切割与第一、第二、第三和第四向导RNA对应的第一、第二、第三和第四向导RNA靶序列。第一和第二向导RNA靶序列可以被定位成产生第一切割位点,使得第一和第二切口酶在第一和第二DNA链上产生的切口产生双链断裂(即,第一切割位点包括第一和第二向导RNA靶序列内的切口)。同样地,第三和第四向导RNA靶序列可以被定位成产生第二切割位点,使得第三和第四切口酶在第一和第二DNA链上产生的切口产生双链断裂(即,第二切割位点包括第三和第四向导RNA靶序列内的切口)。优选地,第一和第二向导RNA靶序列和/或第三和第四向导RNA靶序列内的切口可以是产生突出端的偏移切口。偏移窗口可以为例如至少约5bp、10bp、20bp、30bp、40bp、50bp、60bp、70bp、80bp、90bp、100bp或更多。参见Ran等人(2013),《细胞》154:1380-1389;Mali等人(2013),《自然生物技术》31:833-838;以及Shen等人(2014),《自然方法(Nat.Methods)》11:399-404,所述文献中的每个文献出于所有目的通过引用整体并入本文。在这种情况下,双链外源性供体核酸可以被设计成具有单链互补区,所述单链互补区与由第一和第二向导RNA靶序列内的切口以及第三和第四向导RNA靶序列内的切口产生的突出端互补。然后此类外源性供体核酸可以通过非同源末端连接介导的连接插入。
用于通过同源定向修复插入的供体核酸:一些外源性供体核酸包括同源臂。如果外源性供体核酸还包括核酸插入物,则同源臂可以侧接核酸插入物。为了便于参考,同源臂在本文中被称为5'和3'(即,上游和下游)同源臂。此术语涉及同源臂与外源性供体核酸内的核酸插入物的相对位置。5'和3'同源臂对应于人源化TTR基因座内的区域,所述区域在本文中分别被称为“5'靶序列”和“3'靶序列”。
当同源臂和靶序列彼此共享足够水平的序列同一性时,则这两个区域彼此“对应(correspond或corresponding)”以充当同源重组反应的底物。术语“同源性”包含与对应序列相同或共享序列同一性的DNA序列。给定靶序列与外源性供体核酸中存在的对应同源臂之间的序列同一性可以是允许发生同源重组的任何程度的序列同一性。例如,外源性供体核酸(或其片段)的同源臂与靶序列(或其片段)所共享的序列同一性的量可以是至少50%、55%、60%、65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%序列同一性,使得序列经历同源重组。此外,同源臂与对应的靶序列之间对应的同源区域可以具有足以促进同源重组的任何长度。示例性同源臂的长度在约25个核苷酸到约2.5kb之间、约25个核苷酸到约1.5kb之间或约25个到约500个核苷酸之间。例如,给定同源臂(或同源臂中的每个同源臂)和/或对应的靶序列可以包括长度在约25-30、30-40、40-50、50-60、60-70、70-80、80-90、90-100、100-150、150-200、200-250、250-300、300-350、350-400、400-450或450-500个核苷酸之间的对应同源区域,使得同源臂具有足以与靶核酸内对应的靶序列经历同源重组的同源性。可替代地,给定的同源臂(或同源臂中的每个同源臂)和/或对应的靶序列包括的对应的同源区的长度可以介于约0.5kb到约1kb之间、约1kb到约1.5kb之间、约1.5kb到约2kb之间或约2kb到约2.5kb之间。例如,同源臂各自的长度可以为约750个核苷酸。同源臂可以是对称的(每个长度的大小大约相同),或者可以是不对称的(一个比另一个长)。
当核酸酶药剂与外源性供体核酸组合使用时,5'和3'靶序列优选地定位在足够接近核酸酶切割位点的位置(例如,在足够接近核酸酶靶序列的位置内),以在核酸酶切割位点处的单链断裂(切口)或双链断裂后促进靶序列与同源臂之间同源重组事件的发生。术语“核酸酶切割位点”包含由核酸酶药剂(例如,与向导RNA复合的Cas9蛋白)在其中产生切口或双链断裂的DNA序列。靶基因座内对应于外源性供体核酸的5'和3'同源臂的靶序列“定位在足够接近”核酸酶切割位点的位置,如果这样的距离是为了在核酸酶切割位点处的单链断裂或双链断裂后促进5'和3'靶序列与同源臂之间同源重组事件的发生。因此,对应于外源性供体核酸的5'和/或3'同源臂的靶序列可以例如在给定核酸酶切割位点的至少1个核苷酸内,或在给定核酸酶切割位点的至少10个核苷酸到约1,000个核苷酸内。举例来说,核酸酶切割位点可以紧邻靶序列的至少一个或两个靶序列。
对应于外源性供体核酸的同源臂和核酸酶切割位点的靶序列的空间关系可以变化。例如,靶序列可以定位到核酸酶切割位点的5',靶序列可以定位到核酸酶切割位点的3',或者靶序列可以侧接核酸酶切割位点。
(4)其它人TTR靶向试剂
还可以使用本文所公开的非人动物对任何其它已知或假定的人TTR靶向试剂的活性进行评估。相似地,可以使用本文所公开的非人动物针对人TTR靶向活性筛选任何其它分子。
其它人TTR靶向试剂可以包含RNAi药剂。“RNAi药剂”是包括能够以序列特异性方式促进如信使RNA(mRNA)等靶RNA的翻译的降级或抑制的小双链RNA或RNA样(例如,化学修饰的RNA)寡核苷酸分子的组合物。RNAi药剂中的寡核苷酸是经连接的核苷的聚合物,所述经连接的核苷中的每个核苷可以是独立地修饰的或未经修饰的。RNAi药剂通过RNA干扰机制起作用(即,通过与哺乳动物细胞的RNA干扰途径机制(RNA诱导的沉默复合物或RISC)相互作用来诱导RNA干扰)。虽然如本文所使用的术语RNAi药剂被认为主要通过RNA干扰机制起作用,但所公开的RNAi药剂不受任何特定途径或作用机制的约束或限制。本文所公开的RNAi药剂包括有义链和反义链,并且包含但不限于短干扰RNA(siRNA)、双链RNA(dsRNA)、微RNA(miRNA)、短发夹RNA(shRNA)和dicer底物。本文所述的RNAi药剂的反义链至少部分地与靶RNA中的序列(即,连续或有序的核碱基或核苷酸,使用标准命名法用连续字母描述)互补。
其它人TTR靶向试剂可以包含反义寡核苷酸(ASO)。单链ASO和RNA干扰(RNAi)共享寡核苷酸通过沃森-克里克碱基配对与靶RNA结合的基本原理。不希望受理论束缚,在RNAi期间,小RNA双链体(RNAi药剂)与RNA诱导的沉默复合物(RISC)相关联,一条链(随从链)丢失,并且剩下的链(引导链)与RISC协同结合互补RNA。然后,RISC的催化组分Argonaute 2(Ago2)切割靶RNA。引导链总是与互补的有义链或蛋白质(RISC)相关联。相比之下,ASO必须存活下来并作为单链发挥作用。ASO与靶RNA结合并阻断核糖体或如剪接因子等其它因子与RNA结合或者募集如核酸酶等蛋白质。根据期望的作用机制为ASO选择不同的修饰和靶区域。Gapmer是在侧接DNA的中央8-10个碱基空位的每个端上含有2-5个化学修饰的核苷酸(例如,LNA或2'-MOE)的ASO寡核苷酸。在与靶RNA结合之后,DNA-RNA杂交体充当RNase H的底物。
其它人TTR靶向试剂包含被设计成特异性地结合人TTR表位的抗体或抗原结合蛋白。术语“抗原结合蛋白”包含与抗原结合的任何蛋白质。抗原结合蛋白的实例包含抗体、抗体的抗原结合片段、多特异性抗体(例如,双特异性抗体)、scFV、双-scFV、双抗体、三抗体、四抗体、V-NAR、VHH、VL、F(ab)、F(ab)2、DVD(双可变结构域抗原结合蛋白)、SVD(单可变结构域抗原结合蛋白)、双特异性T细胞衔接蛋白(BiTE)或戴维斯体(Davisbody)(美国专利第8,586,713号,所述文献出于所有目的通过引用整体并入本文)。
其它人TTR靶向试剂包含小分子试剂。这种小分子试剂的一个实例是氯苯唑酸,其通过正确折叠的四聚体形式的转甲状腺素蛋白(TTR)的动力学稳定起作用。参见例如,Hammarstrom等人(2003),《科学》299:713-716,所述文献出于所有目的通过引用整体并入本文。
D.向非人动物或细胞施用人TTR靶向试剂
本文所公开的方法可以包括向非人动物或细胞中引入各种分子(例如,人TTR靶向试剂,如治疗分子或复合物),包含核酸、蛋白质、核酸-蛋白质复合物、蛋白质复合物或小分子。“引入”包含以进入细胞内部或非人动物内的细胞内部的方式向细胞或非人动物呈递分子(例如,核酸或蛋白质)。引入可以通过任何方式完成,并且可以以任何组合同时或顺序地将组分中的两种或更多种组分(例如,组分中的两种组分或组分中的全部组分)引入到细胞或非人动物中。例如,可以在引入向导RNA之前将Cas蛋白引入到细胞或非人动物中,或者可以在引入向导RNA之后将其引入。作为另一个实例,可以在引入Cas蛋白和向导RNA前引入外源性供体核酸,或者可以在引入Cas蛋白和向导RNA后引入外源性供体核酸(例如,外源性供体核酸可以在引入Cas蛋白和向导RNA之前或之后约1小时、2小时、3小时、4小时、8小时、12小时、24小时、36小时、48小时或72小时施用)。参见例如US 2015/0240263和US 2015/0110762,所述文献中的每个文献出于所有目的通过引用整体并入本文。另外,可以通过相同的递送方法或不同的递送方法将组分中的两种或更多种组分引入到细胞或非人动物中。相似地,可以通过相同的施用途径或不同的施用途径将组分中的两种或更多种组分引入到非人动物中。
在一些方法中,CRISPR/Cas系统的组分被引入到非人动物或细胞中。可以将向导RNA以RNA的形式(例如,体外转录的RNA)或对向导RNA进行编码的DNA的形式引入到非人动物或细胞中。当以DNA的形式引入时,对向导RNA进行编码的DNA可以与在非人动物的细胞中具有活性的启动子可操作地连接。例如,向导RNA可以通过AAV递送,并在U6启动子下在体内表达。此类DNA可以在一种或多种表达构建体中。例如,此类表达构建体可以是单个核酸分子的组分。可替代地,其可以在两个或多个核酸分子之间以任何组合分离(即,对一种或多种CRISPR RNA进行编码的DNA和对一种或多种tracrRNA进行编码的DNA可以是单独的核酸分子的组分)。
同样地,Cas蛋白可以以任何形式提供。例如,Cas蛋白可以以蛋白质的形式提供,如与gRNA复合的Cas蛋白。可替代地,可以以对Cas蛋白进行编码的核酸形式提供Cas蛋白,如RNA(例如,信使RNA(mRNA))或DNA。任选地,可以对编码Cas蛋白的核酸进行密码子优化以在特定细胞或生物体中有效翻译成蛋白质。例如,可以修饰对Cas蛋白进行编码的核酸以取代与天然存在的多核苷酸序列相比在哺乳动物细胞、啮齿动物细胞、小鼠细胞、大鼠细胞或任何其它所关注宿主细胞中具有更高使用频率的密码子。当对Cas蛋白进行编码的核酸被引入到非人动物中时,Cas蛋白可以在非人动物的细胞中瞬时地、有条件地或组成性地表达。
对Cas蛋白或向导RNA进行编码的核酸可以与表达构建体中的启动子可操作地连接。表达构建体包含能够指导基因或其它所关注核酸序列(例如,Cas基因)的表达并且可以将此类所关注核酸序列转移到靶细胞的任何核酸构建体。例如,对Cas蛋白进行编码的核酸可以在包括编码一种或多种gRNA的DNA的载体中。可替代地,其可以在与包括对一种或多种gRNA进行编码的DNA的载体分离的载体或质粒中。可以用于表达构建体的合适的启动子包含例如在真核细胞、人细胞、非人细胞、哺乳动物细胞、非人哺乳动物细胞、啮齿动物细胞、小鼠细胞、大鼠细胞、仓鼠细胞、兔细胞、多能性细胞、胚胎干(ES)细胞、成体干细胞、发育受限的祖细胞、诱导多能干(iPS)细胞或单细胞期胚胎中的一个或多个中具有活性的启动子。此类启动子可以是例如条件启动子、诱导型启动子、组成型启动子或组织特异性启动子。任选地,启动子可以是在一个方向上驱动Cas蛋白的表达并且在另一个方向上驱动向导RNA的表达的双向启动子。此类双向启动子可以由以下组成:(1)含有3个外部控制元件:远侧序列元件(DSE)、近侧端序列元件(PSE)和TATA框的完整的、常规的、单向的Pol III启动子;(2)包含在相反取向上与DSE的5'端融合PSE和TATA盒的第二基本Pol III启动子。例如,在H1启动子中,DSE邻近PSE和TATA框,并且可以通过产生杂合启动子使启动子双向化,其中通过源自U6启动子的附加PSE和TATA盒来控制反向转录。参见例如US2016/0074535,所述文献出于所有目的通过引用整体并入本文。使用双向启动子同时表达对Cas蛋白和向导RNA进行编码的基因允许生成紧凑表达盒以促进递送。
引入到非人动物或细胞中的分子(例如,Cas蛋白或向导RNA或RNAi药剂或ASO)可以在包括增加所引入分子的稳定性(例如,延长在给定储存条件(例如,-20℃、4℃或环境温度)下降解产物保持在阈值以下的时间,如按起始核酸或蛋白质重量计低于0.5%;或增加体内稳定性)。此类载体的非限制性实例包含聚乳酸(PLA)微球体、聚(D,L-乳酸-乙醇酸共聚物)(PLGA)微球体、脂质体、胶束、反胶束、脂质螺旋体和脂质微管。
本文提供了允许将分子(例如,核酸或蛋白质)引入到细胞或非人动物中的各种方法和组合物。用于将分子引入到各种细胞类型中的方法是已知的,并且包含例如稳定转染方法、瞬时转染方法和病毒介导的方法。
转染方案以及用于将核酸序列引入到细胞中的方案可以不同。非限制性转染方法包含使用以下的基于化学的转染方法:脂质体;纳米颗粒;磷酸钙(Graham等人(1973),《病毒学(Virology)》52(2):456–67;Bacchetti等人(1977),《美国国家科学院院刊》74(4):1590-4;以及Kriegler,M(1991),《转移和表达:实验室手册(Transfer and Expression:ALaboratory Manual.)》纽约:W.H.弗里曼出版社(W.H.Freeman and Company),第96-97页);树枝状聚合物;或阳离子聚合物,如DEAE葡聚糖或聚乙烯亚胺。非化学方法包含电穿孔、声穿孔和光转染。基于颗粒的转染包含使用基因枪或磁体辅助的转染(Bertram(2006)《当今药物生物技术(Current Pharmaceutical Biotechnology)》7,277-28)。病毒方法也可以用于转染。
也可以通过电穿孔、胞质内注射、病毒感染、腺病毒、腺相关病毒、慢病毒、逆转录病毒、转染、脂质介导的转染或核转染来介导将分子(例如,核酸或蛋白质)引入到细胞中。核转染是使核酸底物不仅能够被递送到细胞质,而且能够通过核膜进入到细胞核中的改善的电穿孔技术。另外,在本文公开的方法中使用核转染通常需要比常规电穿孔少得多的细胞(例如,与常规电穿孔的700万相比,仅约200万)。在一个实例中,使用
Figure BDA0003371335300000661
NUCLEOFECTORTM系统进行核转染。
将分子(例如,核酸或蛋白质)引入到细胞(例如,受精卵)中还可以通过显微注射来完成。在受精卵(即,单细胞期胚胎)中,显微注射可以注入到母本和/或父本原核或细胞质中。如果显微注射仅注入到一个原核,则优选父本原核,因为其尺寸较大。优选将mRNA显微注射到细胞质中(例如,将mRNA直接递送到翻译机器),而优选将Cas蛋白或对Cas蛋白或RNA进行编码的多核苷酸显微注射到细胞核/原核中。可替代地,可以通过注射到细胞核/前核和细胞质两者中来进行显微注射:可以首先将针引入到细胞核/前核中并且注射第一量,并且在将针从单细胞期胚胎中去除时,可以将第二量注射到细胞质中。如果Cas蛋白被注射到细胞质中,则Cas蛋白优选地包括用于确保递送到细胞核/原核的核定位信号。用于进行显微注射的方法是众所周知的。参见例如,Nagy等人(Nagy A、Gertsenstein M、VinterstenK、Behringer R.,2003,《操纵小鼠胚胎(Manipulating the Mouse Embryo)》.纽约冷泉港:冷泉港实验室出版社);还参见Meyer等人(2010),《美国国家科学院院刊》107:15022-15026和Meyer等人(2012),《美国国家科学院院刊》109:9354-9359。
用于将分子(核酸或蛋白质)引入到细胞或非人动物中的其它方法可以包含例如载体递送、颗粒介导的递送、外泌体介导的递送、脂质纳米颗粒介导的递送、细胞穿透性肽介导的递送或可植入装置介导的递送。作为具体实例,可以将核酸或蛋白质以如聚(乳酸)(PLA)微球体、聚(D,L-乳酸-乙醇酸共聚物)(PLGA)微球体、脂质体、胶束、反胶束、脂质螺旋体或脂质微管等载体引入到细胞或非人动物中。向非人动物递送的一些具体实例包含流体动力学递送、病毒介导的递送(例如,腺相关病毒(AAV)介导的递送)和脂质纳米颗粒介导的递送。
将核酸和蛋白质引入到细胞或非人动物中可以通过流体动力递送(HDD)来完成。对于到实质细胞的基因递送,只需要通过选定的血管注射必需的DNA序列,从而消除与当前病毒和合成载体相关的安全问题。当注入到血流中时,DNA能够到达血液可及的不同组织中的细胞。流体动力递送采用将大量溶液快速注射到循环中不可压缩的血液中所产生的力来解决阻止大的和不可透过膜的化合物进入实质细胞的内皮和细胞膜的物理屏障问题。除了递送DNA外,此方法还可用于RNA、蛋白质和其它小化合物在体内的高效细胞内递送。参见例如,Bonamassa等人(2011),《药学研究(Pharm.Res.)》28(4):694-701,所述文献出于所有目的通过引用整体并入本文。
核酸的引入也可以通过病毒介导的递送来完成,如AAV介导的递送或慢病毒介导的递送。其它示例性病毒/病毒性载体包含逆转录病毒、腺病毒、牛痘病毒、痘病毒和单纯疱疹病毒。病毒可以感染分裂细胞、非分裂细胞或分裂细胞和非分裂细胞两者。病毒可以整合到宿主基因组中,或者可替代地不整合到宿主基因组中。此类病毒还可以被工程化为具有降低的免疫力。病毒可能具有复制能力,也可能具有复制缺陷(例如,在另外轮次的病毒粒子复制和/或包装所必需的一个或多个基因中存在缺陷)。病毒可以引起瞬时表达、长期表达(例如,至少1周、2周、1个月、2个月或3个月)或永久表达(例如,Cas9和/或gRNA)。示例性病毒滴度(例如,AAV滴度)包含1012、1013、1014、1015和1016个载体基因组/毫升。
ssDNA AAV基因组由两个开放阅读框Rep和Cap组成,其侧接有允许合成互补DNA链的两个反向末端重复序列。当构建AAV转移质粒时,转基因放置在两个ITR之间,并且Rep和Cap可以反式提供。除了Rep和Cap之外,AAV还可能需要含有腺病毒基因的辅助质粒。这些基因(E4、E2a和VA)介导AAV复制。例如,转移质粒、Rep/Cap和辅助质粒可以转染到含有腺病毒基因E1+的HEK293细胞中,以产生感染性AAV颗粒。可替代地,将Rep、Cap和腺病毒辅助基因可以组合成单个质粒。相似的包装细胞和方法可以用于其它病毒,如逆转录病毒。
已经鉴定了AAV的多种血清型。这些血清型在其感染的细胞类型(即,其趋向性)方面不同,允许优先转导特定细胞类型。CNS组织的血清型包含AAV1、AAV2、AAV4、AAV5、AAV8和AAV9。心脏组织的血清型包含AAV1、AAV8和AAV9。肾组织的血清型包含AAV2。肺组织的血清型包含AAV4、AAV5、AAV6和AAV9。胰腺组织的血清型包含AAV8。感光细胞的血清型包含AAV2、AAV5和AAV8。视网膜色素上皮组织的血清型包含AAV1、AAV2、AAV4、AAV5和AAV8。骨骼肌组织的血清型包含AAV1、AAV6、AAV7、AAV8和AAV9。肝组织的血清型包含AAV7、AAV8和AAV9,并且特别是AAV8。
趋向性可以通过假型进一步细化,所述假型即混合来自不同病毒血清型的衣壳和基因组。例如,AAV2/5指示包装在来自血清型5的衣壳中的含有血清型2基因组的病毒。使用假型病毒可以提高转导效率以及改变趋向性。源自不同血清型的杂交衣壳也可以用于改变病毒趋向性。例如,AAV-DJ含有来自八种血清型的杂交衣壳,并在广泛的体内细胞类型中表现出高感染性。AAV-DJ8是显示AAV-DJ性质的另一个实例,但具有增强的脑摄取。AAV血清型还可以通过突变进行修饰。AAV2突变修饰的实例包含Y444F、Y500F、Y730F和S662V。AAV3突变修饰的实例包含Y705F、Y731F和T492V。AAV6突变修饰的实例包含S663V和T492V。其它假型的/经修饰的AAV变体包含AAV2/1、AAV2/6、AAV2/7、AAV2/8、AAV2/9、AAV2.5、AAV8.2和AAV/SASTG。
为了加速转基因表达,可以使用自身互补型AAV(scAAV)变体。由于AAV依赖于细胞的DNA复制机制来合成AAV单链DNA基因组的互补链,因此转基因表达可能会延迟。为了解决这种延迟问题,可以使用含有能够在感染后自发退火的互补序列的scAAV,从而消除对宿主细胞DNA合成的需要。然而,还可以使用单链AAV(ssAAV)载体。
为了提高包装能力,可以将较长的转基因在两个AAV转移质粒之间拆分,第一个具有3'剪接供体并且第二个具有5'剪接受体。在细胞共感染后,这些病毒形成多联体,拼接在一起,并且全长转基因可以被表达。虽然这允许更长的转基因表达,但表达效率较低。用于增加容量的相似方法利用同源重组。例如,转基因可以在两个转移质粒之间分开但是具大量的序列重叠,使得共表达诱导全长转基因的同源重组和表达。
核酸和蛋白质的引入也可以通过脂质纳米颗粒(LNP)介导的递送来完成。例如,LNP介导的递送可以用于递送Cas mRNA和向导RNA的组合或Cas蛋白和向导RNA的组合。通过此类方法递送导致瞬时Cas表达,并且可生物降解脂质提高清除率、提高耐受性并降低免疫原性。脂质调配物可以保护生物分子免于降解,同时改善其细胞摄取。脂质纳米颗粒是包括通过分子间力彼此物理相关的多个脂质分子的颗粒。这些颗粒包含微球体(包含单层和多层囊泡,例如,脂质体)、乳液中的分散相、胶束或悬浮液中的内相。此类脂质纳米颗粒可以用于封装一个或多个核酸或蛋白质以供递送。含有阳离子脂质的调配物可用于递送如核酸等聚阴离子。其它可以包含在内的脂质是中性脂质(即,不带电荷或两性离子脂质)、阴离子脂质、增强转染的辅助脂质和增加纳米颗粒可以在体内存在的时间长度的隐形脂质。合适的阳离子脂质、中性脂质、阴离子脂质、辅助脂质和隐形脂质的实例可以在WO 2016/010840A1和WO2017/173054A1中找到,所述文献出于所有目的通过引用整体并入本文。示例性脂质纳米颗粒可以包括阳离子脂质和一种或多种其它组分。在一个实例中,其它组分可以包括如胆固醇等辅助脂质。在另一个实例中,其它组分可以包括如胆固醇等辅助脂质和如DSPC等中性脂质。在另一个实例中,其它组分可以包括如胆固醇等辅助脂质、如DSPC等任选的中性脂质以及如S010、S024、S027、S031或S033等隐形脂质。
LNP可以含有以下中的一种或多种或全部:(i)用于封装和用于内体逃逸的脂质;(ii)用于稳定的中性脂质;(iii)用于稳定的辅助脂质;(iv)隐形脂质。参见例如,Finn等人(2018),《细胞报告》22:1-9和WO 2017/173054 A1,所述文献中的每个文献出于所有目的通过引用整体并入本文。在某些LNP中,负荷物可以包含向导RNA或对向导RNA进行编码的核酸。在某些LNP中,负荷物可以包含对如Cas9等Cas核酸酶进行编码的mRNA以及向导RNA或对向导RNA进行编码的核酸。
用于包封和内体逃逸的脂质可以是阳离子脂质。脂质还可以是可生物降解脂质,如可生物降解可电离脂质。合适的脂质的一个实例是脂质A或LP01,即(9Z,12Z)-3-((4,4-双(辛氧基)丁酰基)氧基)-2-((((3-(二乙氨基)丙氧基)羰基)氧基)甲基)丙基十八-9,12-二烯酸酯,也被称为3-((4,4-双(辛氧基)丁酰基)氧基)-2-((((3-(二乙氨基)丙氧基)羰基)氧基)甲基)丙基(9Z,12Z)-十八-9,12-二烯酸酯。参见例如,Finn等人(2018),《细胞报告》22:1-9和WO 2017/173054 A1,所述文献中的每个文献出于所有目的通过引用整体并入本文。合适的脂质的另一个实例是脂质B,即((5-((二甲氨基)甲基)-1,3-亚苯基)双(氧))双(辛烷-8,1-二基)双(癸酸酯),也被称为((5-((二甲氨基)甲基)-1,3-亚苯基)双(氧基))双(辛烷-8,1-二基)双(癸酸酯)。合适的脂质的另一个实例是脂质C,即2-((4-(((3-(二甲氨基)丙氧基)羰基)氧基)十六酰基)氧基)丙烷-1,3-二基(9Z,9'Z,12Z,12'Z)-双(十八-9,12-二烯酸酯)。合适的脂质的另一个实例是脂质D,即3-(((3-(二甲氨基)丙氧基)羰基)氧基)-13-(辛酰氧基)十三烷基3-辛基十一烷酸酯。其它合适的脂质包含三十七碳-6,9,28,31-四烯-19-基4-(二甲基氨基)丁酸酯(也被称为Dlin-MC3-DMA(MC3))。
适用于本文所述的LNP的一些此类脂质在体内是可生物降解的。例如,包括此类脂质的LNP包含在8小时、10小时、12小时、24小时或48小时或3天、4天、5天、6天、7天或10天内从血浆中清除脂质的至少75%的那些。作为另一个实例,LNP的至少50%在8小时、10小时、12小时、24小时或48小时或3天、4天、5天、6天、7天或10天内从血浆中清除。
根据其所在的介质的pH,此类脂质可以是可电离的。例如,在微酸性介质中,脂质可以被质子化并且因此带正电荷。相反,在弱碱性介质中,例如在pH大约为7.35的血液中,脂质可能不会被质子化并且因此不带电荷。在一些实施例中,脂质可以在至少约9、9.5或10的pH下质子化。这种脂质带电荷的能力与其固有pKa有关。例如,脂质的pKa可以独立地处于约5.8到约6.2的范围内。
中性脂质起到稳定和改善LNP的加工的作用。合适的中性脂质的实例包含各种中性、不带电荷或两性离子脂质。适用于本公开的中性磷脂的实例包含但不限于5-十七烷基苯-1,3-二醇(间苯二酚)、二棕榈酰磷脂酰胆碱(DPPC)、二硬脂酰磷脂酰胆碱(DSPC)、磷酸胆碱(DOPC)、二肉豆蔻酰磷脂酰胆碱(DMPC)、磷脂酰胆碱(PLPC)、1,2-二硬脂酰-sn-甘油-3-磷酸胆碱(DAPC)、磷脂酰乙醇胺(PE)、卵磷脂酰胆碱(EPC)、二月桂酰磷脂酰胆碱(DLPC)、二肉豆蔻酰磷脂酰胆碱(DMPC)、1-肉豆蔻酰-2-棕榈酰磷脂酰胆碱(MPPC)、1-棕榈酰-2-肉豆蔻酰磷脂酰胆碱(PMPC)、1-棕榈酰-2-硬脂酰磷脂酰胆碱(PSPC)、1,2-二花生酰-sn-甘油-3-磷酸胆碱(DBPC)、1-硬脂酰-2-棕榈酰磷脂酰胆碱(SPPC)、1,2-二二十碳烯酰-sn-甘油-3-磷酸胆碱(DEPC)、棕榈酰油酰磷脂酰胆碱(POPC)、溶血磷脂酰胆碱、二油酰磷脂酰乙醇胺(DOPE)、二亚油酰磷脂酰胆碱二硬脂酰磷脂酰乙醇胺(DSPE)、二肉豆蔻酰磷脂酰乙醇胺(DMPE)、二棕榈酰磷脂酰乙醇胺(DPPE)、棕榈酰油酰磷脂酰乙醇胺(POPE)、溶血磷脂酰乙醇胺和其组合。例如,中性磷脂可以选自由二硬脂酰磷脂酰胆碱(DSPC)和二肉豆蔻酰磷脂酰乙醇胺(DMPE)组成的组。
辅助脂质包含增强转染的脂质。辅助脂质增强转染的机制可以包含增强颗粒稳定性。在某些情况下,辅助脂质可以增强膜融合性。辅助脂质包含类固醇、甾醇和烷基间苯二酚。合适的辅助脂质的实例包含胆固醇、5-十七烷基间苯二酚和胆固醇半琥珀酸酯。在一个实例中,辅助脂质可以是胆固醇或胆固醇半琥珀酸酯。
隐形脂质包含改变纳米颗粒在体内可以存在的时间长度的脂质。隐形脂质可以通过例如减少颗粒聚集和控制粒度来帮助调配过程。隐形脂质可以调节LNP的药代动力学性质。合适的隐形脂质包含具有连接到脂质部分的亲水性头部基团的脂质。
隐形脂质的亲水性头部基团可以包括例如选自基于PEG(有时称为聚(环氧乙烷))、聚(噁唑啉)、聚(乙烯醇)、聚(甘油)、聚(N-乙烯吡咯烷酮)、聚氨基酸和聚N-(2-羟丙基)甲基丙烯酰胺的聚合物的聚合物部分。术语PEG意指任何聚乙二醇或其它聚亚烷基醚聚合物。在某些LNP调配物中,PEG是PEG-2K,也被称为PEG 2000,其平均分子量为约2,000道尔顿。参见例如WO 2017/173054 A1,所述文献出于所有目的通过引用整体并入本文。
隐形脂质的脂质部分可以衍生自例如二酰基甘油或二烷基甘酰胺,其包含包括二烷基甘油或二烷基甘酰胺基团的那些,所述二烷基甘油或二烷基甘酰胺基团具有独立地包括约C4到约C40个饱和或不饱和碳原子的烷基链长度,其中链可以包括一个或多个官能团,例如酰胺或酯。二酰基甘油或二烷基甘酰胺基团可以进一步包括一个或多个经取代的烷基。
举例来说,隐形脂质可以选自PEG-二月桂酸甘油酯、PEG-二肉豆蔻酰甘油(PEG-DMG)、PEG-二棕榈酰甘油、PEG-二硬脂酰甘油(PEG-DSPE)、PEG-二月桂甘酰胺、PEG-二肉豆蔻甘酰胺、PEG-二棕榈酰甘酰胺和PEG-二硬脂酰甘酰胺、PEG-胆固醇(l-[8'-(胆甾-5-en-3[β]-氧基)甲酰胺基-3',6'-二氧杂辛基]氨甲酰基-[ω]-甲基-聚(乙二醇)、PEG-DMB(3,4-二十四烷基苄基-[ω]-甲基-聚(乙二醇)醚)、1,2-二肉豆蔻酰-sn-甘油-3-磷酸乙醇胺-N-[甲氧基(聚乙二醇)-2000](PEG2k-DMG)、1,2-二硬脂酰-sn-甘油-3-磷酸乙醇胺-N-[甲氧基(聚乙二醇)-2000](PEG2k-DSPE)、1,2-二硬脂酰-sn-甘油、甲氧基聚乙烯乙二醇(PEG2k-DSG)、聚(乙二醇)-2000-二甲基丙烯酸酯(PEG2k-DMA)和1,2-二硬脂氧基丙基-3-胺-N-[甲氧基(聚乙二醇)-2000](PEG2k-DSA)。在一个特定实例中,隐形脂质可以是PEG2k-DMG。
LNP可以包括调配物中组分脂质的不同的相应摩尔比。CCD脂质的mol-%可以为例如约30mol-%到约60mol-%、约35mol-%到约55mol-%、约40mol-%到约50mol-%、约42mol-%到约47mol-%或约45%。辅助脂质的mol-%可以为例如约30mol-%到约60mol-%、约35mol-%到约55mol-%、约40mol-%到约50mol-%、约41mol-%到约46mol-%或约44mol-%。中性脂质的mol-%可以为例如约1mol-%到约20mol-%、约5mol-%到约15mol-%、约7mol-%到约12mol-%或约9mol-%。隐形脂质的mol-%可以为例如约1mol-%到约10mol-%、约1mol-%到约5mol-%、约1mol-%到约3mol-%、约2mol-%或约1mol-%。
LNP在可生物降解脂质(N)的带正电荷的胺基团与待封装的核酸的带负电荷的磷酸基团(P)之间可以具有不同的比率。这可以由等式N/P在数学上表示。例如,N/P比率可以为约0.5到约100、约1到约50、约1到约25、约1到约10、约1到约7、约3到约5、约4到约5、约4、约4.5或约5。N/P比率也可以为约4到约7或约4.5到约6。在具体实例中,N/P比率可以为4.5或者可以为6。
在一些LNP中,货物可以包括Cas mRNA和gRNA。Cas mRNA和gRNA的比率可以不同。例如,LNP调配物的Cas mRNA与gRNA核酸的比率的范围可以为约25:1到约1:25、约10:1到约1:10、约5:1到约1:5或为约1:1。可替代地,LNP调配物的Cas mRNA与gRNA核酸的比率可以为约1:1到约1:5或约10:1。可替代地,LNP调配物的Cas mRNA与gRNA核酸的比率可以为约1:10、25:1、10:1、5:1、3:1、1:1、1:3、1:5、1:10或1:25。可替代地,LNP调配物的Cas mRNA与gRNA核酸的比率可以为约1:1到约1:2。在具体实例中,Cas mRNA与gRNA的比率可以为约1:1或约1:2。
在一些LNP中,货物可以包括外源性供体核酸和gRNA。外源性供体核酸和gRNA的比率可以不同。例如,LNP调配物的外源性供体核酸与gRNA核酸的比率的范围可以为约25:1到约1:25、约10:1到约1:10、约5:1到约1:5或为约1:1。可替代地,LNP调配物的外源性供体核酸与gRNA核酸的比率可以为约1:1到约1:5、约5:1到约1:1、约10:1或为约1:10。可替代地,LNP调配物的外源性供体核酸与gRNA核酸的比率可以为约1:10、25:1、10:1、5:1、3:1、1:1、1:3、1:5、1:10或1:25。
合适的LNP的具体实例的氮磷(N/P)比率为4.5,并且含有摩尔比为45:44:9:2的可生物降解阳离子脂质、胆固醇、DSPC和PEG2k-DMG。生物可降解阳离子脂质可以是(9Z,12Z)-3-((4,4-双(辛氧基)丁酰基)氧基)-2-((((3-(二乙氨基)丙氧基)羰基)氧基)甲基)丙基十八-9,12-二烯酸酯,也被称为3-((4,4-双(辛氧基)丁酰基)氧基)-2-((((3-(二乙氨基)丙氧基)羰基)氧基)甲基)丙基(9Z,12Z)-十八-9,12-二烯酸酯。参见例如,Finn等人(2018),《细胞报告》22:1-9,所述文献出于所有目的通过引用整体并入本文。Cas9 mRNA与向导RNA的重量比可以为1:1。合适的LNP的另一个具体实例含有摩尔比为50:38.5:10:1.5的Dlin-MC3-DMA(MC3)、胆固醇、DSPC和PEG-DMG。
合适的LNP的另一个具体实例的氮磷(N/P)比率为6,并且含有摩尔比为50:38:9:3的可生物降解阳离子脂质、胆固醇、DSPC和PEG2k-DMG。生物可降解阳离子脂质可以是(9Z,12Z)-3-((4,4-双(辛氧基)丁酰基)氧基)-2-((((3-(二乙氨基)丙氧基)羰基)氧基)甲基)丙基十八-9,12-二烯酸酯,也被称为3-((4,4-双(辛氧基)丁酰基)氧基)-2-((((3-(二乙氨基)丙氧基)羰基)氧基)甲基)丙基(9Z,12Z)-十八-9,12-二烯酸酯。Cas9 mRNA与向导RNA的重量比可以为1:2。
可以选择降低免疫原性的递送方式。例如,Cas蛋白和gRNA可以通过不同的模式(例如,双模式递送)进行递送。这些不同的模式可以赋予受试者递送的分子(例如,Cas或核酸编码、gRNA或核酸编码或外源性供体核酸/修复模板)不同的药效学或药代动力学性质。例如,不同的模式会导致不同的组织分布、不同的半衰期或不同的时间分布。一些递送模式(例如,通过自主复制或基因组整合来递送在细胞中持续存在的核酸载体)导致分子的表达和存在更持久,而其它递送模式是瞬时的且不太持久(例如,RNA或蛋白质的递送)。以更瞬时的方式递送Cas蛋白例如作为mRNA或蛋白质可以确保Cas/gRNA复合物仅在短时间段内存在和具有活性,并且可以降低由MHC分子在细胞表面上展示的来自细菌来源的Cas酶的肽引起的免疫原性。此类瞬时递送还可以减少脱靶修饰的可能性。
体内施用可以通过任何合适的途径,包含例如肠胃外、静脉内、口服、皮下、动脉内、颅内、鞘内、腹膜内、局部、鼻内或肌肉内施用。全身施用方式包含例如口服和肠胃外途径。肠胃外途径的实例包含静脉内、动脉内、骨内、肌肉内、皮内、皮下、鼻内和腹膜内途径。具体的实例是静脉输液。鼻滴注和玻璃体内注射是其它具体实例。局部施用方式包含例如鞘内、脑室内、脑实质内(例如,局部脑实质内递送到纹状体(例如,进入尾状核或进入壳核种)、大脑皮层、中央前回、海马体(例如,进入齿状回或CA3区域)、颞叶皮层、杏仁核、额叶皮层、丘脑、小脑、髓质、下丘脑、顶盖、被盖或黑质)、眼内、眶内、结膜下、玻璃体内、视网膜下和经巩膜途径。与全身施用(例如,静脉内)相比,当局部施用(例如,脑实质内或玻璃体内)时,显著更少量的组分(与全身方法相比)可以发挥作用。局部施用方式还可以降低或消除当全身施用治疗有效量的组分时可能发生的潜在毒副作用的发生率。
体内施用可以通过任何合适的途径,包含例如肠胃外、静脉内、口服、皮下、动脉内、颅内、鞘内、腹膜内、局部、鼻内或肌肉内施用。具体的实例是静脉输液。可以使用一种或多种生理学和药学上可接受的载体、稀释剂、赋形剂或助剂来调配包括向导RNA和/或Cas蛋白(或编码向导RNA和/或Cas蛋白的核酸)的组合物。调配物可以取决于所选择的施用途径。术语“药学上可接受的”意指载体、稀释剂、赋形剂或助剂与调配物的其它成分相容并且对其接受者基本上无害。
施用频率和剂量数可以取决于外源性供体核酸、向导RNA或Cas蛋白(或编码向导RNA或Cas蛋白的核酸)的半衰期和施用途径等因素。将核酸或蛋白质引入到细胞或非人动物中可以在一段时间内执行一次或多次。例如,引入可以按以下频率执行:一段时间内至少两次、一段时间内至少三次、一段时间内至少四次、一段时间内至少五次、一段时间内至少六次、一段时间内至少七次、一段时间内至少八次、一段时间内至少九次、一段时间内至少十次、至少十一次、一段时间内至少十二次、一段时间内至少十三次、一段时间内至少十四次、一段时间内至少十五次、一段时间内至少十六次、一段时间内至少十七次、一段时间内至少十八次、一段时间内至少十九次或一段时间内至少二十次。
E.在体内或离体测量人TTR靶向试剂的递送、活性或功效
本文所公开的方法可以进一步包括检测或测量人TTR靶向试剂的活性。例如,如果人TTR靶向试剂是基因组编辑试剂(例如,被设计成靶向人TTR基因座的CRISPR/Cas),则测量可以包括评估包括β滑移突变的人源化TTR基因座进行修饰。
可以使用各种方法来鉴定具有靶向基因修饰的细胞。筛选可以包括用于评估亲本染色体的等位基因修饰(MOA)的定量测定。参见例如US 2004/0018626;US 2014/0178879;US2016/0145646;WO 2016/081923;以及Frendewey等人(2010),《酶学方法》476:295-307,所述文献中的每个文献出于所有目的通过引用整体并入本文。例如,定量测定可以通过定量PCR,如实时PCR(qPCR)进行。实时PCR可以利用识别靶基因座的第一引物组和识别非靶向参考基因座的第二引物组。引物组可以包括识别扩增序列的荧光探针。合适的定量测定的其它实例包含荧光介导的原位杂交(FISH)、比较基因组杂交、等温DNA扩增、与固定化探针的定量杂交、
Figure BDA0003371335300000741
探针、
Figure BDA0003371335300000742
分子信标探针或ECLIPSETM探针技术(参见例如US2005/0144655,所述文献出于所有目的通过引用整体并入本文)。
下一代测序(NGS)也可以用于筛选。下一代测序也可以被称为“NGS”或“大规模平行测序”或“高通量测序”。除了MOA测定外,NGS还可以用作筛选工具,用于定义靶向基因修饰的确切性质以及其是否在细胞类型或组织类型或器官类型上保持一致。
评估对非人动物中的包括β滑移突变的人源化TTR基因座的修饰可以在来自任何组织或器官的任何细胞类型中进行。例如,评估可以在来自同一组织或器官的多种细胞类型中进行,或者在来自组织或器官内的多个位置的细胞中进行。这可以提供关于靶向靶组织或器官内的哪些细胞类型或者人TTR靶向试剂到达组织或器官的哪些区段的信息。作为另一个实例,评估可以在多种类型的组织或多个器官中进行。在靶向特定组织、器官或细胞类型的方法中,这可以提供关于靶向所述组织或器官的有效性以及其它组织或器官中是否存在脱靶效应的信息。
可以使用的测定的一个实例是RNASCOPETM和BASESCOPETM RNA原位杂交(ISH)测定,这是一种可以在完整的固定组织的情况下定量细胞特异性编辑的转录物,包含单核苷酸变化的方法。BASESCOPETM RNAISH测定可以在基因编辑的表征中补充NGS和qPCR。虽然NGS/qPCR可以提供野生型和编辑序列的定量平均值,但其不提供有关组织内经编辑的细胞的异质性或百分比的信息。BASESCOPETM ISH测定可以提供整个组织的景观图并以单细胞分辨率对野生型与经编辑的转录物进行定量,其中可以定量靶组织中含有经编辑的mRNA转录物的细胞的实际数量。BASESCOPETM测定使用配对寡核苷酸(“ZZ”)探针在无非特异性背景的情况下放大信号,从而实现单分子RNA检测。然而,BASESCOPETM探针设计和信号放大系统利用ZZ探针实现单分子RNA检测,并且可以差异地检测完整固定组织中的单核苷酸编辑和突变。
如果试剂被设计成使包括β滑移突变的人源化TTR基因座灭火、影响人源化TTR基因座的表达、防止人源化TTR mRNA的翻译或清除人源化TTR蛋白,则测量可以包括评估人源化TTR mRNA或蛋白质表达。这种测量可以在肝脏内或肝脏内的特定细胞类型或区域内进行,或者这种测量可以涉及测量所分泌的人源化TTR蛋白的血清水平。
可以通过任何已知方式评估包括β滑移突变的人源化TTR蛋白的产生和分泌。例如,表达可以使用已知测定通过测量非人动物肝脏中经编码的mRNA的水平或非人动物肝脏中经编码的蛋白质的水平来评估。人源化TTR蛋白的分泌可以通过使用已知测定测量非人动物中经编码的人源化TTR蛋白的血浆水平或血清水平来评估。例如,测量可以用于确定人TTR靶向试剂是否降低非人动物的TTR水平。
测量还可以包括评估人源化TTR蛋白的聚集。例如,天然PAGE和蛋白质印迹可以用于评估聚集的人源化TTR蛋白(例如,较高分子量形式的人源化TTR蛋白)的存在以及人TTR靶向试剂是否防止聚集、减少聚集、破坏聚集或增加聚集形式的人源化TTR蛋白的清除。
测量还可以包括评估淀粉样蛋白沉积或淀粉样蛋白沉积物的存在(淀粉样变性)。例如,测量可以用于确定人TTR靶向试剂是否防止、减少、破坏或清除淀粉样蛋白沉积物。举例来说,刚果红是广泛用于检测淀粉样变性的染色剂。可以在白光下使组织成像,这揭示了整体组织结构和特征性红色染色。当使用线性偏振光照射刚果红染色的组织时,仅与淀粉样蛋白结合的染料将折射偏振光(例如,淀粉样蛋白结合的刚果红染料将变为双折射的),这被视为浅绿色/白色。这些灰白色沉积物的存在指示淀粉样蛋白沉积。此类测定可以用于评估人TTR靶向试剂是否防止或减少或破坏或清除淀粉样蛋白沉积物。评估可以是在发生TTR淀粉样蛋白沉积的任何组织或器官中进行。作为一个非限制性实例,评估可以在坐骨神经中进行。
测量还可以包括评估非人动物中的活性或活动过度水平。例如,测量可以用于确定人TTR靶向试剂是否防止或减少非人动物的活动过度。活动过度可以通过在旷场实验中测量总距离、总活动和总直立次数中的一个或多个或全部来评估。旷场实验给出了小鼠运动和活动过度的整体量度。来自旷场实验的三个读数是总行进距离、总活动以及直立次数总数。旷场是用于测量小鼠在60分钟时间段期间的一般运动健康和活动的行为测试。在60分钟时间段期间,跟踪小鼠在封闭的方形设备内部行进的总距离。总活动是通过设备中的小鼠在X和Y平面中中断红外光束的路径的次数来测量的。直立次数是小鼠将站立在其后肢上以探索设备壁的次数的量度。较大的直立次数值指示较少的焦虑和活动过度的小鼠。直立次数是通过Z平面中的红外光束中断数(置于四足小鼠的高度之上的高度的光束)来测量的。
评估还可以包括评估肌张力障碍或肌张力障碍表型的存在。例如,评估可以包括评估非人动物是否表现出后肢肌张力障碍或后肢肌张力障碍表型(例如,肌张力障碍后肢回缩),如在工作实例中描述的。例如,测量可以用于确定人TTR靶向试剂是否改善或防止这种表型。
任何这些表型的评估可以在非人动物的任何年龄进行,如至少约1、2、3、4、5、6、7、8、9、10、11或12个月龄。在具体实例中,非人动物可以是至少约2个月龄。
与对照非人动物相比,可以完成对任何这些表型的评估。对照非人动物的一个实例是对应的野生型动物(例如,同一物种的)。例如,对照非人动物可以是野生型同窝仔。对照非人动物的另一个实例是包括不具有β滑移突变的人源化TTR基因座的对应的非人动物(例如,人源化TTR基因座除了不存在β滑移突变之外均是相同的)。对照非人动物可以是例如与测试非人动物相同的年龄和/或与测试非人动物相同的性别。与除了未用人TTR靶向试剂处理之外与测试非人动物相同的对照非人动物相比,还可以完成对任何这些表型的评估。
对任何这些表型的评估可以在单个非人动物中进行,并且评估非人动物的变化。可替代地,评估可以在非人动物群体中进行并且比较例如具有特定表型的非人动物的百分比。举例来说,评估可以包括评估与对照群体(未用人TTR靶向试剂处理)相比,在测试群体(用人TTR靶向试剂处理)中具有淀粉样蛋白沉积物或具有肌张力障碍表型的非人动物的百分比。
IV.制备包括包含β滑移突变的人源化TTR基因座的非人动物的方法
提供了用于制备包括包含如本文其它地方公开的β滑移突变的人源化TTR基因座的非人动物的各种方法。用于产生经基因修饰的生物体的任何方便的方法或方案都适用于产生这种经基因修饰的非人动物。参见例如,Cho等人(2009),《当代细胞生物学实验指南(Current Protocols in Cell Biology)》42:19.11:19.11.1–19.11.22和Gama Sosa等人(2010)《大脑结构与功能(Brain Struct.Funct.)》214(2-3):91-109,所述文献中的每个文献出于所有目的通过引用整体并入本文。此类经基因修饰的非人动物可以例如通过在靶标Ttr基因座处的基因敲入来产生。
例如,产生包括包含β滑移突变的人源化TTR基因座的非人动物的方法可以包括:(1)对多能性细胞的基因组进行修饰以包括包含β滑移突变的人源化TTR基因座;(2)鉴定或选择包括包含β滑移突变的人源化TTR基因座的经基因修饰的多能性细胞;(3)将经基因修饰的多能性细胞引入到非人动物宿主胚胎中;以及(4)将宿主胚胎植入代孕母体中并在其中孕育。可替代地,产生包括包含β滑移突变的人源化TTR基因座的非人动物的方法可以包括:(1)对多能性细胞的基因组进行修饰以包括包含β滑移突变的人源化TTR基因座;(2)鉴定或选择包括包含β滑移突变的人源化TTR基因座的经基因修饰的多能性细胞;(3)将经基因修饰的多能性细胞引入到非人动物宿主胚胎中;以及(4)在代孕母体中孕育宿主胚胎。任选地,包括经修饰的多能性细胞(例如,非人ES细胞)的宿主胚胎可以在植入到代孕母体中并在其中孕育以产生F0非人动物之前进行温育,直到胚泡期为止。然后,代孕母体可以产生包括包含β滑移突变的人源化TTR基因座的F0代非人动物。
所述方法可以进一步包括鉴定具有经修饰的靶基因组基因座(即,包括β滑移突变的人源化TTR基因座)的细胞或动物。可以使用各种方法来鉴定具有靶向基因修饰的细胞和动物。
筛选步骤可以包括例如用于评估亲本染色体的等位基因(MOA)的修饰的定量测定。例如,定量测定可以通过定量PCR进行,如实时PCR(qPCR)。实时PCR可以利用识别靶基因座的第一引物组和识别非靶向参考基因座的第二引物组。引物组可以包括识别扩增序列的荧光探针。
合适的定量测定的其它实例包含荧光介导的原位杂交(FISH)、比较基因组杂交、等温DNA扩增、与固定化探针的定量杂交、
Figure BDA0003371335300000771
探针、
Figure BDA0003371335300000772
分子信标探针或ECLIPSETM探针技术(参见例如US 2005/0144655,所述文献出于所有目的通过引用整体并入本文)。
合适的多能性细胞的实例是胚胎干(ES)细胞(例如,小鼠ES细胞或大鼠ES细胞)。经修饰的多能性细胞可以例如通过以下方式重组产生:(a)将一种或多种靶向载体引入到细胞中,所述靶向载体包括侧接有与5'和3'靶位点相对应的5'和3'同源臂的插入核酸,其中所述插入核酸包括包含β滑移突变的人源化TTR基因座;以及(b)鉴定在其基因组中包括在内源性Ttr基因座处整合的插入核酸的至少一个细胞。可替代地,经修饰的多能性细胞可以通过以下方式产生:(a)引入到细胞中:(i)核酸酶药剂,其中核酸酶药剂在内源性Ttr基因座内的靶序列处诱导切口或双链断裂;以及(ii)一种或多种靶向载体,所述一种或多种靶向载体包括侧接有与定位在足够接近核酸酶靶序列的5'和3'靶位点相对应的5'和3'同源臂的插入核酸,其中所述插入核酸包括包含β滑移突变的人源化TTR基因座;以及(c)鉴定在内源性Ttr基因座处包括修饰(例如,插入核酸的整合)的至少一个细胞。可以使用将切口或双链断裂诱导到期望靶序列中的任何核酸酶药剂。合适的核酸酶的实例包含转录激活子样效应物核酸酶(TALEN)、锌指核酸酶(ZFN)、大范围核酸酶和成簇规律间隔短回文重复序列(CRISPR)/CRISPR相关(Cas)系统或此类系统(例如,CRISPR/Cas9)的组分。参见例如US2013/0309670和US 2015/0159175,所述文献中的每个文献出于所有目的通过引用整体并入本文。
供体细胞可以在任何阶段引入到宿主胚胎中,如胚泡阶段或桑椹胚前阶段(即,4细胞期或8细胞期)。产生能够通过种系传递基因修饰的后代。参见例如美国专利第7,294,754号,所述文献出于所有目的通过引用整体并入本文。
可替代地,产生本文其它地方描述的非人动物的方法可以包括:(1)使用上述用于修饰多能性细胞的方法对单细胞期胚胎的基因组进行修饰以包括包含β滑移突变的人源化TTR基因座;(2)选择经基因修饰的胚胎;以及(3)将经基因修饰的胚胎植入到代孕母体中并在其中孕育。可替代地,产生本文其它地方描述的非人动物的方法可以包括:(1)使用上述用于修饰多能性细胞的方法对单细胞期胚胎的基因组进行修饰以包括包含β滑移突变的人源化TTR基因座;(2)选择经基因修饰的胚胎;以及(3)在代孕母体中孕育经基因修饰的胚胎。产生能够通过种系传递基因修饰的后代。
核转移技术还可以用于产生非人哺乳动物。简而言之,用于核转移的方法可以包括以下步骤:(1)去除卵母细胞的核或提供去核卵母细胞;(2)分离或提供要与去核卵母细胞结合的供体细胞或细胞核;(3)将细胞或细胞核插入到去核卵母细胞中以形成重组细胞;(4)将重组细胞植入到动物的子宫中以形成胚胎;以及(5)允许胚胎发育。在此类方法中,卵母细胞通常从死亡动物身上取得,但卵母细胞也可以从活体动物的输卵管和/或卵巢中分离出来。在去核前,卵母细胞可以在各种众所周知的培养基中成熟。可以以多种众所周知的方式执行卵母细胞的去核。可以通过在融合前在透明带下显微注射供体细胞来将供体细胞或细胞核插入到去核卵母细胞中以形成重组细胞。可以通过在接触/融合平面上施加DC电脉冲(电融合)、通过将细胞暴露于如聚乙二醇等促进融合的化学物质或通过如仙台病毒等灭活病毒的方式来诱导融合。在核供体和受体卵母细胞融合之前、期间和/或之后,可以通过电气方式和/或非电气方式来活化重组细胞。活化方法包含电脉冲、化学诱发的休克、精子渗透、增加卵母细胞中二价阳离子的水平以及减少卵母细胞中细胞蛋白质的磷酸化(如通过激酶抑制剂的方式)。活化的重组细胞或胚胎可以在众所周知的培养基中培养,并且然后转移到动物的子宫中。参见例如US 2008/0092249、WO 1999/005266、US 2004/0177390、WO 2008/017234和美国专利第7,612,250号,所述文献中的每个文献出于所有目的通过引用整体并入本文。
本文所提供的各种方法允许产生经基因修饰的非人F0动物,其中经基因修饰的F0动物的细胞包括包含β滑移突变的人源化TTR基因座。根据用于产生F0动物的方法,F0动物内具有包括β滑移突变的人源化TTR基因座的细胞数量将有所不同。通过例如
Figure BDA0003371335300000791
方法将供体ES细胞引入到来自对应生物体(例如,8细胞期小鼠胚胎)的桑椹胚前阶段胚胎中允许更大百分比的F0动物的细胞群包括具有包括靶向基因修饰的所关注核苷酸序列的细胞。例如,非人F0动物的细胞贡献的至少50%、60%、65%、70%、75%、85%、86%、87%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%可以包括具有靶向修饰的细胞群。
经基因修饰的F0动物的细胞对于包括β滑移突变的人源化TTR基因座可以是杂合的,或者对于包括β滑移突变的人源化TTR基因座可以是纯合的。
出于所有目的,上文或下文引用的所有专利申请、网站、其它出版物、登录号等都通过引用整体并入,其程度如同每个单独的项目被单独并且具体地指出通过引用的方式并入。如果序列的不同版本与不同时间的登录号相关联,则意指在本申请的有效提交日期与登录号相关联的版本。有效提交日期是指实际提交日期或提及登记号的优先权申请的提交日期(在适用情况下)中较早的日期。同样地,如果出版物、网站等的不同版本在不同时间发布,除非另有说明,否则指在申请的有效提交日期最近发布的版本。除非另外具体说明,否则本发明的任何特征、步骤、元件、实施例或方面都可以与任何其它特征、步骤、元件、实施例或方面结合使用。尽管为了清楚和理解起见,已通过图解和实例方式详细地对本发明进行了描述,但显而易见的是,可以在所附权利要求的范围内进行某些改变和修改。
序列简要说明
使用核苷酸碱基的标准字母缩写和氨基酸的三字母代码示出随附序列表中列出的核苷酸和氨基酸序列。核苷酸序列遵循从序列的5'末端开始并且向前(即,在每行中从左到右)到达3'末端的标准惯例。每个核苷酸序列仅示出一条链,但任何提及的显示链均应理解为包含互补链。当提供对氨基酸序列进行编码的核苷酸序列时,应当理解的是还提供了其对相同氨基酸序列进行编码的密码子简并变体。氨基酸序列遵循从序列的氨基端开始并且向前(即,在每行中从左到右)到达羧基端的标准惯例。
表2:序列描述。
Figure BDA0003371335300000801
Figure BDA0003371335300000811
Figure BDA0003371335300000821
实例
实例1:包括人源化TTRβ滑移基因座的小鼠的产生
所制备的人源化Ttr等位基因是小鼠转甲状腺素蛋白编码序列的完全缺失及其被人TTR基因的直系同源部分替代。人TTR基因的直系同源部分编码三个点突变(G53S、E54D和L55S,统称为TTRβ滑移),所述三个点突变使涉及TTR复合物的分子间相互作用的β片层的位置移位并且使TTR特别易于聚集。由β滑移突变形成的TTR复合物的相互作用的改变导致原纤维和淀粉样蛋白的形成(参见例如,Eneqvist等人(2000),《分子细胞》6(5):1207-1218,所述文献出于所有目的通过引用整体并入本文),已经报道其对IMR-32细胞系是有毒的(参见例如,Andersson等人(2013),《公共科学图书馆·综合》8(2):e55766,所述文献出于所有目的通过引用整体并入本文)。然而,这些突变从未在体内建模。
产生包括包含33.7kb的在小鼠Ttr起始密码子上游的序列和34.5kb的在小鼠Ttr终止密码子下游的序列的5'同源臂的大靶向载体,以用从人TTR起始密码子到最后人TTR外显子(外显子4,包含人3'UTR)末端的大约7.1kb的直系同源人TTR序列和侧接有loxP位点的自缺失嘌呤霉素选择盒(SDC Puro)替代从小鼠Ttr起始密码子到小鼠Ttr终止密码子的大约8.3kb区域。参见图3.SDC Puro盒包含从5'到3'的以下组分:loxP位点、小鼠鱼精蛋白(Prm1)启动子、Crei(被优化成包含内含子的Cre编码序列)、polyA、人泛素启动子、嘌呤霉素-N-乙酰转移酶(puror)编码序列、polyA、loxP。为了产生人源化等位基因,将CRISPR/Cas9组分与大靶向载体一起引入到F1H4小鼠胚胎干细胞中。使用图4和表3中所示的引物和探针进行等位基因丢失测定、等位基因获得测定、保留测定和CRISPR测定,以证实小鼠Ttr等位基因的人源化。等位基因丢失、等位基因获得测定和保留测定描述于例如US 2014/0178879;US 2016/0145646;WO 2016/081923;以及Frendewey等人(2010),《酶学方法》476:295-307,所述文献中的每个文献出于所有目的通过引用整体并入本文。CRISPR测定是被设计成覆盖被CRISPR gRNA破坏的区域的
Figure BDA0003371335300000831
测定。当CRISPR gRNA切割并且产生indel(插入或缺失)时,
Figure BDA0003371335300000832
测定将无法扩增并且因此报告CRISPR切割。图3示出了具有SDC Puro盒和切除SDC Puro盒之后的版本。然后使用
Figure BDA0003371335300000833
方法产生F0小鼠。参见例如,US 7,576,259;US 7,659,442;US 7,294,754;US 2008/007800;以及Poueymirou等人(2007),《自然生物技术》25(1):91-99,所述文献中的每个文献出于所有目的通过引用整体并入本文。
从多个人源化ES细胞克隆产生F0代小鼠(50%C57BL/6NTac和50%129S6/SvEvTac)。F0代小鼠中预期的人源化TTRβ滑移基因座的序列示出于SEQ ID NO:12中并且包含SDC Puro盒(被称为MAID8530)。然后通过繁殖产生F1和F2代小鼠(75%C57BL/6NTac和25%129S6/SvEvTac)。F1和F2代小鼠中预期的人源化TTRβ滑移基因座的序列示出于SEQ IDNO:13中并且不包含SDC Puro盒(被称为MAID8531)。在以下实验中进行表征的所有人源化TTRβ滑移小鼠均是TTR8531/8531(在两个人源化TTRβ滑移等位基因中去除的盒)。
除了用SDC Neo盒之外,以相同的方式制备对应的人源化TTR野生型小鼠。F0代小鼠中预期的人源化小鼠Ttr野生型基因座的序列示出于SEQ ID NO:15中并且包含SDC Neo盒(被称为7576)。然后通过繁殖产生F1和F2代小鼠(75%C57BL/6NTac和25%129S6/SvEvTac)。F1和F2代小鼠中预期的人源化小鼠Ttr野生型基因座的序列示出于SEQ ID NO:16中并且不包含SDC Neo盒(被称为MAID7577)。在以下实验中进行表征的所有人源化TTR野生型小鼠均是TTR7577/7577(在两个人源化TTR野生型等位基因中去除的盒)。
图1A示出了小鼠转甲状腺素蛋白前体蛋白、人野生型转甲状腺素蛋白前体蛋白和人β滑移转甲状腺素蛋白前体蛋白序列的比较。图1B示出了小鼠转甲状腺素蛋白、人野生型转甲状腺素蛋白和人β滑移转甲状腺素蛋白编码序列的比较。图2示出了显示野生型小鼠Ttr基因座、最终野生型人源化小鼠Ttr基因座(SDC Neo盒缺失)和最终β滑移人源化小鼠Ttr基因座(SDC Puro盒缺失)的示意图。从起始密码子到终止密码子的内源性小鼠Ttr基因座序列提供于SEQ ID NO:11中。内源性小鼠Ttr基因座的编码序列提供于SEQ ID NO:8中。由内源性小鼠Ttr基因座编码的转甲状腺素蛋白前体蛋白提供于SEQ ID NO:5中。具有SDCNeo盒和不具有SDC Neo盒的预期野生型人源化小鼠Ttr基因座的序列分别示出于SEQ IDNO:15和16中。野生型人源化小鼠Ttr基因座的预期编码序列(CDS)示出于SEQ ID NO:4中。由野生型人源化小鼠Ttr基因座编码的预期转甲状腺素蛋白前体蛋白示出于SEQ ID NO:1中。具有SDC Puro盒和不具有SDC Puro盒的预期β滑移人源化小鼠Ttr基因座的序列分别示出于SEQ ID NO:12和13中。β滑移人源化小鼠Ttr基因座的预期编码序列(CDS)示出于SEQID NO:10中。由β滑移人源化小鼠Ttr基因座编码的预期转甲状腺素蛋白前体蛋白示出于SEQ ID NO:9中。这些等位基因提供了人TTR治疗剂的真实人靶标,由此使得能够在活体动物中测试治疗剂的功效和作用模式以及在其中突变的人蛋白质是存在的TTR的唯一版本的背景下的药物代谢动力学和药效动力学研究。
表3:用于等位基因丢失测定、等位基因获得测定和保留测定的引物和探针。
Figure BDA0003371335300000851
实例2:包括人源化TTRβ滑移基因座的小鼠的表征。
建立了人源化TTRβ滑移小鼠集落,并且在两个月龄时对F2组群进行表征。在血清中测量人TTR并且在0.3μg/mL下对其进行检测,其显著低于对照野生型小鼠(大约1000μg/mL的小鼠TTR)或在人中循环的小鼠(大约200μg/mL)的血清中通常检测的水平。其也低于人源化TTR野生型小鼠中所见的水平。参见图5A和表4。
表4:人源化TTRβ滑移小鼠、人源化TTR野生型小鼠和对照F1H4小鼠的血浆TTR水平、血清T4水平和体温。
Figure BDA0003371335300000861
当在天然PAGE上分析人源化TTRβ滑移小鼠的血液,随后用抗人特异性抗体进行蛋白质印迹时,如预期观察到TTR。参见图6A。人成熟WT TTR(pI:5.31;MW:13.76kDa)和人成熟β滑移TTR(pI:5.30/MW:13.75kDa)具有几乎相同的分子量。当在天然PAGE上分析人源化TTRβ滑移小鼠的血液,随后用抗人特异性抗体进行蛋白质印迹时,在人源化TTRβ滑移小鼠的血清中观察到高分子量TTR物种,但在对应的人源化TTR野生型小鼠中未观察到。参见图6B。
尽管循环TTR水平较低,但当在行为测定中测试时,人源化TTRβ滑移小鼠具有表型差异。参见图8A-8C。一种测定是旷场实验,其给出了小鼠运动和活动过度的整体量度。当与人源化TTR WT小鼠或同窝仔(F1H4)对照相比时,来自旷场实验的三个读数是在人源化TTRβ滑移小鼠中各自显著增加的总行进距离、总活动和直立次数总数。分别参见图8A、8B和8C。还分别参见表5、6和7。旷场是用于测量小鼠在60分钟时间段期间的一般运动健康和活动的行为测试。在60分钟时间段期间,使用计算机软件(加利福尼亚州波威市的金德科学公司的金德科学汽车监控软件(Kinder Scientific MotorMonitor software,KinderScientific,Poway,CA))跟踪小鼠在封闭的方形设备内部行进的总距离。总活动是通过设备中的小鼠在X和Y平面中中断红外光束的路径的次数(即,“光束中断数”)来测量的。直立次数是小鼠站立在其后肢(即,“后部”)上以探索设备壁的次数的量度。较大的直立次数值指示较少的焦虑和较具活性的小鼠。直立次数是通过Z平面中的红外光束中断数(置于四足小鼠的高度之上的高度的光束)来测量的。
表5:人源化TTRβ滑移小鼠、人源化TTR野生型小鼠和对照F1H4小鼠的旷场实验中的总距离。
Figure BDA0003371335300000871
**=p<0.01对F1H4和对WT hTTR7577/7577(ANOVA,图基(Tukey))
表6:人源化TTRβ滑移小鼠、人源化TTR野生型小鼠和对照F1H4小鼠的总活动。
Figure BDA0003371335300000872
表7:人源化TTRβ滑移小鼠、人源化TTR野生型小鼠和对照F1H4小鼠的总直立次数。
Figure BDA0003371335300000873
***=p<0.001对F1H4和对WT hTTR7577/7577(ANOVA,图基)
据报道,TTR无效小鼠的活动过度增加(参见例如,Sousa等人(2004),《神经化学杂志(J.Neurochem.)》88(5):1052-1058,所述文献出于所有目的通过引用整体并入本文),这表明TTR β滑移可以充当功能丢失突变体,尽管在血清中是可检测的。非功能性的表达的TTRβ滑移蛋白的另外的相关性是血清总T4和游离T4的降低,这与体温降低相关,这表明TTRβ滑移小鼠可能由于TTR功能丢失而甲状腺机能减退。分别参见图5B、5C和5D。
至少有两种可能的解释可以解释人源化TTRβ滑移小鼠中循环人TTR的水平低的原因。一种可能的解释是来自肝细胞的β滑移TTR的不良或低效分泌。第二种可能的解释是循环人β滑移TTR可以迅速地沉积到外周器官/组织上。
人β滑移TTR的组织沉积的可能性由以下观察结果支持:一些小鼠的其后肢肌肉张力较弱,这些肌肉受坐骨神经高度神经支配。参见图7A-7B。在后肢肌肉张力改变(即,“肌张力障碍”)的人源化TTRβ滑移小鼠的这一观察结果是先前在文献中未报道的用于TTR无效小鼠或表达人形式的TTR的转基因小鼠的观察结果。这种表型是通过刮洗小鼠并且评估其后肢相对于体轴的角度来评估的。通常,小鼠的体轴与后肢角度之间的角度很大(参见图7A中的F1H4和TTR WT人源化图片)。相比之下,β滑移小鼠没有使其后肢从其身体延伸(参见图7A中的TTRβ滑移人源化图片)。这一点的重要性在于其可以是坐骨神经功能障碍的替代量度,因为坐骨神经控制后肢功能。坐骨神经是人TTR疾病(例如,FAP)中的淀粉样蛋白沉积的主要位点之一。因此,肌张力障碍表型可以是异常坐骨神经功能的指标。
然后测量握力。通过允许小鼠抓住连接到握力计的棒,然后以恒定速率将小鼠从棒上手动拉开来测量握力。设备测量小鼠在失去抓握和释放棒之前拉动棒的最大力。分别测试前肢和后肢,并且以每只小鼠三次尝试的平均力单位作图。握力与肌张力障碍表型不相关并且在人源化TTRβ滑移小鼠、人源化TTR野生型小鼠和对照(F1H4)小鼠中是相似的。参见图9B和表8。同样地,人源化TTRβ滑移小鼠、人源化TTR野生型小鼠和对照(F1H4)小鼠的体重是相似的。参见图9A和表9。
表8:人源化TTRβ滑移小鼠、人源化TTR野生型小鼠和对照F1H4小鼠的握力。
前肢,N(SD) 后肢,N(SD)
F1H4 1.109(0.137) 0.3115(0.092)
WT hTTR<sup>7577/7577</sup> 0.961(0.155) 0.3029(0.096)
β滑移hTTR<sup>8531/8531</sup> 1.141(0.185) 0.3107(0.083)
表9:人源化TTRβ滑移小鼠、人源化TTR野生型小鼠和对照F1H4小鼠的体重。
雄性,g(SD) 雌性,g(SD)
F1H4 27.12(2.31) 20.51(2.12)
WT hTTR<sup>7577/7577</sup> 24.77(3.16) 20.22(1.67)
β滑移hTTR<sup>8531/8531</sup> 25.38(1.26) 20.69(0.99)
使用淀粉样蛋白特异性染料(刚果红)的死后组织病理学分析显示在人源化TTRβ滑移小鼠的坐骨神经上而不在F1H4(同窝仔动物对照)或人源化TTR野生型小鼠的坐骨神经上的双折射阳性淀粉样蛋白沉积物。分别参见图10A和10B。使用CO2对两个月龄的β滑移小鼠实施安乐死并且用磷酸盐缓冲液(20mL)经心脏灌注,随后用20mL的4%多聚甲醛(PFA)进行灌注。去除肝和坐骨神经,并且在4%PFA中在4℃下后固定2天,随后通过将组织浸泡在磷酸盐缓冲液中的30%(w/v)蔗糖中过夜来进行冷冻保存步骤。第二天,将组织浸入OCT中并冷冻(“最佳切割温度”)。将切片在低温恒温器上以10微米切割并且安装到磨砂显微镜载玻片上。根据制造商的方案(西格玛公司(Sigma),目录号:HT60-1KT),用刚果红溶液对载玻片进行染色。刚果红是广泛用于检测淀粉样变性的染色剂。在白光下使载玻片成像,其揭示整体组织结构和特征性红色染色。参见图10A和10B中的顶部图。当使用线性偏振光照射刚果红染色的组织时,仅与淀粉样蛋白结合的染料折射偏振光(例如,淀粉样蛋白结合的刚果红染料将变为双折射的),这被视为浅绿色/白色。参见图10A和10B中的底部图。这些灰白色沉积物的存在指示淀粉样蛋白沉积。在坐骨神经中观察到双折射(即,淀粉样蛋白沉积物的存在),这可以解释小鼠的肌张力障碍表型。参见图10A中的右下图(TTRβ滑移人源化)。如所预期的,在肝脏中没有观察到淀粉样蛋白。参见图10B中的右下图(TTRβ滑移人源化)。
这是第一次报道的如此迅速患上淀粉样变性的体内模型,其中在两个月龄的β滑移小鼠中观察到淀粉样蛋白沉积物。然后进行实验以与抗TTR抗体共染色以共标记双折射沉积物并且证实其是由TTR沉积引起的。进行另外的实验以分析在其它器官和组织中是否存在沉积物。
序列表
<110> 瑞泽恩制药公司(Regeneron Pharmaceuticals, Inc.)
<120> 包括具有β滑移突变的人源化TTR基因座的非人动物和使用方法
<130> 057766/547028
<150> US 62/856,999
<151> 2019-06-04
<160> 92
<170> PatentIn版本3.5
<210> 1
<211> 147
<212> PRT
<213> 智人(Homo sapiens)
<400> 1
Met Ala Ser His Arg Leu Leu Leu Leu Cys Leu Ala Gly Leu Val Phe
1 5 10 15
Val Ser Glu Ala Gly Pro Thr Gly Thr Gly Glu Ser Lys Cys Pro Leu
20 25 30
Met Val Lys Val Leu Asp Ala Val Arg Gly Ser Pro Ala Ile Asn Val
35 40 45
Ala Val His Val Phe Arg Lys Ala Ala Asp Asp Thr Trp Glu Pro Phe
50 55 60
Ala Ser Gly Lys Thr Ser Glu Ser Gly Glu Leu His Gly Leu Thr Thr
65 70 75 80
Glu Glu Glu Phe Val Glu Gly Ile Tyr Lys Val Glu Ile Asp Thr Lys
85 90 95
Ser Tyr Trp Lys Ala Leu Gly Ile Ser Pro Phe His Glu His Ala Glu
100 105 110
Val Val Phe Thr Ala Asn Asp Ser Gly Pro Arg Arg Tyr Thr Ile Ala
115 120 125
Ala Leu Leu Ser Pro Tyr Ser Tyr Ser Thr Thr Ala Val Val Thr Asn
130 135 140
Pro Lys Glu
145
<210> 2
<211> 938
<212> DNA
<213> 智人(Homo sapiens)
<400> 2
gttgactaag tcaataatca gaatcagcag gtttgcagtc agattggcag ggataagcag 60
cctagctcag gagaagtgag tataaaagcc ccaggctggg agcagccatc acagaagtcc 120
actcattctt ggcaggatgg cttctcatcg tctgctcctc ctctgccttg ctggactggt 180
atttgtgtct gaggctggcc ctacgggcac cggtgaatcc aagtgtcctc tgatggtcaa 240
agttctagat gctgtccgag gcagtcctgc catcaatgtg gccgtgcatg tgttcagaaa 300
ggctgctgat gacacctggg agccatttgc ctctgggaaa accagtgagt ctggagagct 360
gcatgggctc acaactgagg aggaatttgt agaagggata tacaaagtgg aaatagacac 420
caaatcttac tggaaggcac ttggcatctc cccattccat gagcatgcag aggtggtatt 480
cacagccaac gactccggcc cccgccgcta caccattgcc gccctgctga gcccctactc 540
ctattccacc acggctgtcg tcaccaatcc caaggaatga gggacttctc ctccagtgga 600
cctgaaggac gagggatggg atttcatgta accaagagta ttccattttt actaaagcag 660
tgttttcacc tcatatgcta tgttagaagt ccaggcagag acaataaaac attcctgtga 720
aaggcacttt tcattccact ttaacttgat tttttaaatt cccttattgt cccttccaaa 780
aaaaagagaa tcaaaatttt acaaagaatc aaaggaattc tagaaagtat ctgggcagaa 840
cgctaggaga gatccaaatt tccattgtct tgcaagcaaa gcacgtatta aatatgatct 900
gcagccatta aaaagacaca ttctgtaaaa aaaaaaaa 938
<210> 3
<211> 7258
<212> DNA
<213> 智人(Homo sapiens)
<400> 3
gttgactaag tcaataatca gaatcagcag gtttgcagtc agattggcag ggataagcag 60
cctagctcag gagaagtgag tataaaagcc ccaggctggg agcagccatc acagaagtcc 120
actcattctt ggcaggatgg cttctcatcg tctgctcctc ctctgccttg ctggactggt 180
atttgtgtct gaggctggcc ctacggtgag tgtttctgtg acatcccatt cctacattta 240
agattcacgc taaatgaagt agaagtgact ccttccagct ttgccaacca gcttttatta 300
ctagggcaag ggtacccagc atctattttt aatataatta attcaaactt caaaaagaat 360
gaagttccac tgagcttact gagctgggac ttgaactctg agcattctac ctcattgctt 420
tggtgcatta ggtttgtaat atctggtacc tctgtttcct cagatagatg atagaaataa 480
agatatgata ttaaggaagc tgttaatact gaattttcag aaaagtatcc ctccataaaa 540
tgtatttggg ggacaaactg caggagatta tattctggcc ctatagttat tcaaaacgta 600
tttattgatt aatctttaaa aggcttagtg aacaatattc tagtcagata tctaattctt 660
aaatcctcta gaagaattaa ctaatactat aaaatgggtc tggatgtagt tctgacatta 720
ttttataaca actggtaaga gggagtgact atagcaacaa ctaaaatgat ctcaggaaaa 780
cctgtttggc cctatgtatg gtacattaca tcttttcagt aattccactc aaatggagac 840
ttttaacaaa gcaactgttc tcaggggacc tattttctcc cttaaaattc attatacaca 900
tccctggttg atagcagtgt gtctggaggc agaaaccatt cttgctttgg aaacaattac 960
gtctgtgtta tactgagtag ggaagctcat taattgtcga cacttacgtt cctgataatg 1020
ggatcagtgt gtaattcttg tttcgctcca gatttctaat accacaaaga ataaatcctt 1080
tcactctgat caattttgtt aacttctcac gtgtcttctc tacacccagg gcaccggtga 1140
atccaagtgt cctctgatgg tcaaagttct agatgctgtc cgaggcagtc ctgccatcaa 1200
tgtggccgtg catgtgttca gaaaggctgc tgatgacacc tgggagccat ttgcctctgg 1260
gtaagttgcc aaagaaccct cccacaggac ttggttttat cttcccgttt gcccctcact 1320
tggtagagag aggctcacat catctgctaa agaatttaca agtagattga aaaacgtagg 1380
cagaggtcaa gtatgccctc tgaaggatgc cctctttttg ttttgcttag ctaggaagtg 1440
accaggaacc tgagcatcat ttaggggcag acagtagaga aaagaaggaa tcagaactcc 1500
tctcctctag ctgtggtttg caaccctttt gggtcacaga acactttatg taggtgatga 1560
aaagtaaaca ttctatgccc agaaaaaatg cacagataca cacacataca aaatcatata 1620
tgtgatttta ggagtttcac agattccctg gtgtccctgg gtaacaccaa agctaagtgt 1680
ccttgtctta gaattttagg aaaaggtata atgtgtatta acccattaac aaaaggaaag 1740
gaattcagaa atattattaa ccaggcatct gtctgtagtt aatatggatc acccaaaacc 1800
caaggctttt gcctaatgaa cactttgggg cacctactgt gtgcaaggct gggggctgtc 1860
aagctcagtt aaaaaaaaaa agatagaaga gatggatcca tgaggcaaag tacagcccca 1920
ggctaatccc acgatcaccc gacttcatgt ccaagagtgg cttctcacct tcattagcca 1980
gttcacaatt ttcatggagt ttttctacct gcactagcaa aaacttcaag gaaaatacat 2040
attaataaat ctaagcaaag tgaccagaag acagagcaat caggagaccc tttgcatcca 2100
gcagaagagg aactgctaag tatttacatc tccacagaga agaatttctg ttgggtttta 2160
attgaacccc aagaaccaca tgattcttca accattattg ggaagatcat tttcttaggt 2220
ctggttttaa ctggcttttt atttgggaat tcatttatgt ttatataaaa tgccaagcat 2280
aacatgaaaa gtggttacag gactattcta agggagagac agaatggaca ccaaaaatat 2340
tccaatgttc ttgtgaatct tttccttgca ccaggacaaa aaaaaaaaga agtgaaaaga 2400
agaaaggagg aggggcataa tcagagtcag taaagacaac tgctattttt atctatcgta 2460
gctgttgcag tcaaatggga agcaatttcc aacattcaac tatggagctg gtacttacat 2520
ggaaatagaa gttgcctagt gtttgttgct ggcaaagagt tatcagagag gttaaatata 2580
taaaagggaa aagagtcaga tacaggttct tcttcctact ttaggttttc cactgtgtgt 2640
gcaaatgata ctccctggtg gtgtgcagat gcctcaaagc tatcctcaca ccacaaggga 2700
gaggagcgag atcctgctgt cctggagaag tgcagagtta gaacagctgt ggccacttgc 2760
atccaatcat caatcttgaa tcacagggac tctttcttaa gtaaacatta tacctggccg 2820
ggcacggtgg ctcacgcctg taatcccagc actttgggat gccaaagtgg gcatatcatc 2880
tgaggtcagg agttcaagac cagcctggcc aacatggcaa aactccgtct ttatgaaaaa 2940
tacaaaaatt agccaggcat ggtggcaggc gcctgtaatc ccagctaatt gggaggctga 3000
ggctggagaa tcccttgaat ctaggaggca gaggttgcag tgagctgaga tcgtgccatt 3060
gcactccagc ctgggtgaca agagtaaaac tctgtctcaa aaaaaaaaaa ttatacctac 3120
attctcttct tatcagagaa aaaaatctac agtgagcttt tcaaaaagtt tttacaaact 3180
ttttgccatt taatttcagt taggagtttt ccctacttct gacttagttg aggggaaatg 3240
ttcataacat gtttataaca tgtttatgtg tgttagttgg tgggggtgta ttactttgcc 3300
atgccatttg tttcctccat gcgtaactta atccagactt tcacacctta taggaaaacc 3360
agtgagtctg gagagctgca tgggctcaca actgaggagg aatttgtaga agggatatac 3420
aaagtggaaa tagacaccaa atcttactgg aaggcacttg gcatctcccc attccatgag 3480
catgcagagg tgagtataca gaccttcgag ggttgttttg gttttggttt ttgcttttgg 3540
cattccagga aatgcacagt tttactcagt gtaccacaga aatgtcctaa ggaaggtgat 3600
gaatgaccaa aggttccctt tcctattata caagaaaaaa ttcacaacac tctgagaagc 3660
aaatttcttt ttgactttga tgaaaatcca cttagtaaca tgacttgaac ttacatgaaa 3720
ctactcatag tctattcatt ccactttata tgaatattga tgtatctgct gttgaaataa 3780
tagtttatga ggcagccctc cagaccccac gtagagtgta tgtaacaaga gatgcaccat 3840
tttatttctc gaaaacccgt aacattcttc attccaaaac acatctggct tctcggaggt 3900
ctggacaagt gattcttggc aacacatacc tatagagaca ataaaatcaa agtaataatg 3960
gcaacacaat agataacatt taccaagcat acaccatgtg gcagacacaa ttataagtgt 4020
tttccatatt taacctactt aatcctcagg aataagccac tgaggtcagt cctattatta 4080
tccccatctt atagatgaag aaaatgaggc accaggaagt caaataactt gtcaaaggtc 4140
acaagactag gaaatacaca agtagaaatg tttacaatta aggcccaggc tgggtttgcc 4200
ctcagttctg ctatgcctcg cattatgccc caggaaactt tttcccttgt gaaagccaag 4260
cttaaaaaaa gaaaagccac atttgtaacg tgctctgttc ccctgcctat ggtgaggatc 4320
ttcaaacagt tatacatgga cccagtcccc ctgccttctc cttaatttct taagtcattt 4380
gaaacagatg gctgtcatgg aaatagaatc cagacatgtt ggtcagagtt aaagatcaac 4440
taattccatc aaaaatagct cggcatgaaa gggaactatt ctctggctta gtcatggatg 4500
agactttcaa ttgctataaa gtggttcctt tattagacaa tgttaccagg gaaacaacag 4560
gggtttgttt gacttctggg gcccacaagt caacaagaga gccccatcta ccaaggagca 4620
tgtccctgac tacccctcag ccagcagcaa gacatggacc ccagtcaggg caggagcagg 4680
gtttcggcgg cgcccagcac aagacattgc ccctagagtc tcagccccta ccctcgagta 4740
atagatctgc ctacctgaga ctgttgtttg cccaagagct gggtctcagc ctgatgggaa 4800
ccatataaaa aggttcactg acatactgcc cacatgttgt tctctttcat tagatcttag 4860
cttccttgtc tgctcttcat tcttgcagta ttcattcaac aaacattaaa aaaaaaaaaa 4920
agcattctat gtgtggaaca ctctgctaga tgctgtggat ttagaaatga aaatacatcc 4980
cgacccttgg aatggaaggg aaaggactga agtaagacag attaagcagg accgtcagcc 5040
cagcttgaag cccagataaa tacggagaac aagagagagc gagtagtgag agatgagtcc 5100
caatgcctca ctttggtgac gggtgcgtgg tgggcttcat gcagcttctt ctgataaatg 5160
cctccttcag aactggtcaa ctctaccttg gccagtgacc caggtggtca tagtagattt 5220
accaagggaa aatggaaact tttattagga gctcttaggc ctcttcactt catggatttt 5280
tttttccttt ttttttgaga tggagttttg ccctgtcacc caggctggaa tgcagtggtg 5340
caatctcagc tcactgcaac ctccgcctcc caggttcaag caattctcct gcctcagcct 5400
cccgagtagc tgggactaca ggtgtgcgcc accacaccag gctaattttt gtattttttg 5460
taaagacagg ttttcaccac gttggccagg ctggtctgaa ctccagacct caggtgattc 5520
acctgtctca gcctcccaaa gtgctgggat tacaggtgtg agccaccgtg cccggctact 5580
tcatggattt ttgattacag attatgcctc ttacaatttt taagaagaat caagtgggct 5640
gaaggtcaat gtcaccataa gacaaaagac atttttatta gttgattcta gggaattggc 5700
cttaagggga gccctttctt cctaagagat tcttaggtga ttctcacttc ctcttgcccc 5760
agtattattt ttgtttttgg tatggctcac tcagatcctt ttttcctcct atccctaagt 5820
aatccgggtt tctttttccc atatttagaa caaaatgtat ttatgcagag tgtgtccaaa 5880
cctcaaccca aggcctgtat acaaaataaa tcaaattaaa cacatcttta ctgtcttcta 5940
cctctttcct gacctcaata tatcccaact tgcctcactc tgagaaccaa ggctgtccca 6000
gcacctgagt cgcagatatt ctactgattt gacagaactg tgtgactatc tggaacagca 6060
ttttgatcca caatttgccc agttacaaag cttaaatgag ctctagtgca tgcatatata 6120
tttcaaaatt ccaccatgat cttccacact ctgtattgta aatagagccc tgtaatgctt 6180
ttacttcgta tttcattgct tgttatacat aaaaatatac ttttcttctt catgttagaa 6240
aatgcaaaga ataggagggt gggggaatct ctgggcttgg agacaggaga cttgccttcc 6300
tactatggtt ccatcagaat gtagactggg acaatacaat aattcaagtc tggtttgctc 6360
atctgtaaat tgggaagaat gtttccagct ccagaatgct aaatctctaa gtctgtggtt 6420
ggcagccact attgcagcag ctcttcaatg actcaatgca gttttgcatt ctccctacct 6480
tttttttcta aaaccaataa aatagataca gcctttaggc tttctgggat ttcccttagt 6540
caagctaggg tcatcctgac tttcggcgtg aatttgcaaa acaagacctg actctgtact 6600
cctgctctaa ggactgtgca tggttccaaa ggcttagctt gccagcatat ttgagctttt 6660
tccttctgtt caaactgttc caaaatataa aagaataaaa ttaattaagt tggcactgga 6720
cttccggtgg tcagtcatgt gtgtcatctg tcacgttttt cgggctctgg tggaaatgga 6780
tctgtctgtc ttctctcata ggtggtattc acagccaacg actccggccc ccgccgctac 6840
accattgccg ccctgctgag cccctactcc tattccacca cggctgtcgt caccaatccc 6900
aaggaatgag ggacttctcc tccagtggac ctgaaggacg agggatggga tttcatgtaa 6960
ccaagagtat tccattttta ctaaagcagt gttttcacct catatgctat gttagaagtc 7020
caggcagaga caataaaaca ttcctgtgaa aggcactttt cattccactt taacttgatt 7080
ttttaaattc ccttattgtc ccttccaaaa aaaagagaat caaaatttta caaagaatca 7140
aaggaattct agaaagtatc tgggcagaac gctaggagag atccaaattt ccattgtctt 7200
gcaagcaaag cacgtattaa atatgatctg cagccattaa aaagacacat tctgtaaa 7258
<210> 4
<211> 444
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 4
atggcttctc atcgtctgct cctcctctgc cttgctggac tggtatttgt gtctgaggct 60
ggccctacgg gcaccggtga atccaagtgt cctctgatgg tcaaagttct agatgctgtc 120
cgaggcagtc ctgccatcaa tgtggccgtg catgtgttca gaaaggctgc tgatgacacc 180
tgggagccat ttgcctctgg gaaaaccagt gagtctggag agctgcatgg gctcacaact 240
gaggaggaat ttgtagaagg gatatacaaa gtggaaatag acaccaaatc ttactggaag 300
gcacttggca tctccccatt ccatgagcat gcagaggtgg tattcacagc caacgactcc 360
ggcccccgcc gctacaccat tgccgccctg ctgagcccct actcctattc caccacggct 420
gtcgtcacca atcccaagga atga 444
<210> 5
<211> 147
<212> PRT
<213> 小家鼠(Mus musculus)
<400> 5
Met Ala Ser Leu Arg Leu Phe Leu Leu Cys Leu Ala Gly Leu Val Phe
1 5 10 15
Val Ser Glu Ala Gly Pro Ala Gly Ala Gly Glu Ser Lys Cys Pro Leu
20 25 30
Met Val Lys Val Leu Asp Ala Val Arg Gly Ser Pro Ala Val Asp Val
35 40 45
Ala Val Lys Val Phe Lys Lys Thr Ser Glu Gly Ser Trp Glu Pro Phe
50 55 60
Ala Ser Gly Lys Thr Ala Glu Ser Gly Glu Leu His Gly Leu Thr Thr
65 70 75 80
Asp Glu Lys Phe Val Glu Gly Val Tyr Arg Val Glu Leu Asp Thr Lys
85 90 95
Ser Tyr Trp Lys Thr Leu Gly Ile Ser Pro Phe His Glu Phe Ala Asp
100 105 110
Val Val Phe Thr Ala Asn Asp Ser Gly His Arg His Tyr Thr Ile Ala
115 120 125
Ala Leu Leu Ser Pro Tyr Ser Tyr Ser Thr Thr Ala Val Val Ser Asn
130 135 140
Pro Gln Asn
145
<210> 6
<211> 1237
<212> DNA
<213> 小家鼠(Mus musculus)
<400> 6
ctaatctccc taggcaaggt tcatatttgt gtaggttact tattctcctt ttgttgacta 60
agtcaataat cagaatcagc aggtttggag tcagcttggc agggatcagc agcctgggtt 120
ggaaggaggg ggtataaaag ccccttcacc aggagaagcc gtcacacaga tccacaagct 180
cctgacagga tggcttccct tcgactcttc ctcctttgcc tcgctggact ggtatttgtg 240
tctgaagctg gccccgcggg tgctggagaa tccaaatgtc ctctgatggt caaagtcctg 300
gatgctgtcc gaggcagccc tgctgtagac gtggctgtaa aagtgttcaa aaagacctct 360
gagggatcct gggagccctt tgcctctggg aagaccgcgg agtctggaga gctgcacggg 420
ctcaccacag atgagaagtt tgtagaagga gtgtacagag tagaactgga caccaaatcg 480
tactggaaga cacttggcat ttccccgttc catgaattcg cggatgtggt tttcacagcc 540
aacgactctg gccatcgcca ctacaccatc gcagccctgc tcagcccata ctcctacagc 600
accacggctg tcgtcagcaa cccccagaat tgagagactc agcccaggag gaccaggatc 660
ttgccaaagc agtagcatcc catttgtacc aaaacagtgt tcttgctcta taaaccgtgt 720
tagcagctca ggaagatgcc gtgaagcatt cttattaaac cacctgctat ttcattcaaa 780
ctgtgtttct tttttatttc ctcatttttc tcccctgctc ctaaaaccca aaatcttcta 840
aagaattcta gaaggtatgc gatcaaactt tttaaagaaa gaaaatactt tttgactcat 900
ggtttaaagg catcctttcc atcttgggga ggtcatgggt gctcctggca acttgcttga 960
ggaagatagg tcagaaagca gagtggacca accgttcaat gttttacaag caaaacatac 1020
actaagcatg gtctgtagct attaaaagca cacaatctga agggctgtag atgcacagta 1080
gtgttttccc agagcatgtt caaaagccct gggttcaatc acaatactga aaagtaggcc 1140
aaaaaacatt ctgaaaatga aatatttggg ttttttttta taacctttag tgactaaata 1200
aagacaaatc taagagacta aaaaaaaaaa aaaaaaa 1237
<210> 7
<211> 9077
<212> DNA
<213> 小家鼠(Mus musculus)
<400> 7
ctaatctccc taggcaaggt tcatatttgt gtaggttact tattctcctt ttgttgacta 60
agtcaataat cagaatcagc aggtttggag tcagcttggc agggatcagc agcctgggtt 120
ggaaggaggg ggtataaaag ccccttcacc aggagaagcc gtcacacaga tccacaagct 180
cctgacagga tggcttccct tcgactcttc ctcctttgcc tcgctggact ggtatttgtg 240
tctgaagctg gccccgcggt gagtgatcct gtgagcgatc cagacatggc agttagacct 300
tagataaaga agaagtgcct tcttccagat gtgagaacta gagtactcag actctatatt 360
taccattaga ctccaaagag aagagctgga gtgcctctgg ctcttccttc tattgcttta 420
gcgcattggg tctgtagtgc tcagtctctg gtgtccttag ataataaaga tatgagatta 480
acatagaaat aaagatataa aagggctgga tgtatagttt agtggtccag tgtatgccta 540
gtatgtgaaa agccttctgt tcaacctcta gcaatagaaa aacaagatat attctcggtg 600
gggctgttaa tattgaattc tcataaaatc tttaatatat ttagtatgcc tattatgttg 660
ttatatttta gttctttagc taatcaaaat gcattattga tctttctttg tctttttttg 720
gccaacactc tattccagtc tttgaaaaag tcctttaaaa gagttaatca gtataattaa 780
atgagtcagg aagtatgtga gggttatttt acaaccagag ggaattacta tagcaacagc 840
tgattagaat gatctcaaga aaaagcccat tctgtctttt tgcaccatgc acctttcagt 900
ggctccattc agatggagag gcaaacagag caatggctct cagagggcct attttccctt 960
tgaacattca ttatccatat ccctggtgca cagcagtgca tctgggggca gaaactgttc 1020
ttgctttgga aacaatgctg tctatgtcat actggataaa gaagctcatt aattgtcaac 1080
acttatgtta tcataatggg atcagcatgt acttttggtt ttgttccaga gtctatcacc 1140
ggaaagaaca agccggttta ctctgaccca tttcactgac atttctcttg tctcctctgt 1200
gcccagggtg ctggagaatc caaatgtcct ctgatggtca aagtcctgga tgctgtccga 1260
ggcagccctg ctgtagacgt ggctgtaaaa gtgttcaaaa agacctctga gggatcctgg 1320
gagccctttg cctctgggta agcttgtaga aagcccacca tgggaccggt tccaggttcc 1380
catttgctct tattcgtgtt agattcagac acacacaact taccagctag agggctcaga 1440
gagagggctc aggggcgaag ggcacgtatt gctcttgtaa gagacacagg tttaattcct 1500
agcaccagaa tggcagctca taaccatctg aaactcacag tcttaggaga tctgggtatc 1560
tgacattctc ttctacccac catgtgtgtg gtgcacaaat tcacatgcag gcatcaaatc 1620
ttataaacaa caacaaaaaa ccaacaaacc tggtagcaaa agaagattag aaggttaaac 1680
atatgagccg agagcttttg ttttgttttg ttttgttttg ttttgtttac atttcaaatg 1740
ttatcccctt tctcggtccc cctccccaaa ccctctaccc cattctctcc tccccttctt 1800
ctatgagggt gttccccacc aacccactcc caccttcctg ctctcgaatt cccctatact 1860
gggacatcaa gccttcacag aatcaagggc ctctcctccc attgatgccc gacaatgtca 1920
tcctctgcta cctatgtggc tggagccatg ggtcccttca tgtatcctcc ttggttggtg 1980
gtttagtctc tgggaggtct gggggatctg gttgattgat attattgttc ttcctatgag 2040
attgcaaacc ccttcagctc cttcggtcct ttaactcctc cactggggac cccgagctca 2100
gtccaatggt tggctgtgag catccaccag cagaggcctt tttttttttt tttaacaaag 2160
ctgctttatt atgttgctta gagcatgacc aggaaccaga gcacagtcca agactgaagg 2220
gaggaaaagg gggggagtca ataaccccac tgtttcatag tggtttgcaa cccttttata 2280
tcacagccca ctttaggcaa ataatgaaaa ttatagtctc cagggacaga gaagatggtg 2340
caggaagtga agtgcctgct cagaaaatgg gggcttgaat gtgagttccc agactctgtg 2400
taagatgccc agcatcgaag tgcatgctta taacaccagc ctggaggtag aagcttagaa 2460
acaggggtac cctgaagttg cttgttcacc agtgtccctg aatgggtagg tgcatgtttg 2520
gtgagagacc ctgtctcaaa aatcaaggtg taggataatt gaaaatacct agctttgagc 2580
ttagatcatg caaatgtgta cacacactca cacacaccac acacacaaaa aaatgcagag 2640
acagagagat acagagagac agagagatac agagacagag acagagagaa aaggagaaag 2700
taaaaaacaa ataatttaaa gacccatggc cacaaagagg ctcaaagaca agcacgtata 2760
aaaccataca catgtaattt taggagtttt cagattccct ggtacccgtg ggtgatgcac 2820
aagctttgaa tcccagtctt aaaatcttac gaagaacgtg ttcgtgtgtg ctaatttatt 2880
gatgagagga aaggaattga caaagtgccc ttccggagct tcctgcatta cccagactca 2940
gggttttttt aaatgtacac tcagaacaga gtagctctgt gcaagggtag caaccacgaa 3000
gcttaataag aaacatatcg tgagagatct gcaaggcaaa tctaggggct gaccaatctc 3060
acagtcaccc actagcatgt caacacaact tcccacctgt gctagccact tagcaatttt 3120
gtgttgttct gttttgtttt tgtttttaac aaagcaattt caaagagatt tctaattcat 3180
ctaaacaaac aaaccaaaag gaaaacagca aagacgccct gagcacttag cagagcagct 3240
atgcagttat gactcctggg tggagacttt atatcaggct tcaactgaat acctagaacc 3300
tactagtgct cttcatcaat ccttgggaag gtcattttct tttggtgctg ttttgagttt 3360
ctatttgtta atgtcttcat aattatacac gtgttgagca cagcatgcaa agtgattagg 3420
ggaatctagt tggagtggaa tggataccca aatattcaga ctttcttgtg actcttcttt 3480
cttgtaccca catcaaaaaa aaaaaaaatg gagatgagac atggtcagag tcactaaaac 3540
cagctgctac ttttaattac gtggggagca gtttctaaca ttgccattat tgaactgatg 3600
ctgcctgggt ggaaatggaa atcacttagt atttcttgtt ggcaaagaat tactgaatgg 3660
attaaatttc caaagggaga agtcagttac aagtcttttc tttgtttatt aggctttctg 3720
ctatgataaa ttacactact tccagaagtt acccttaggc catgggacac tggactatca 3780
ctctgctgtc acaagagatt acagagttag tcaaggcagc ttgtgacacc ttcagggact 3840
gtcataaact tccagcaagt cattaatcct gaatgcaata ctgtgtgtgt gtgtctatgt 3900
gtgtttgtat gtctgtgtgt gtcttatgtc tgtgtctctg tgtgtgtgtg tgtttgtgtg 3960
tgtgtgtgta tgtatgcctg tgtgtgtctt atgtctgtgt ttgtgtgtct gtgtgtgtct 4020
tatgtctgtg tttgtatgtc tgtgtgtgtc tgtgtgtgtc ttatgtctgt gtctctgtgt 4080
gtgtgtgtgt gtatgtatgt atgtatgtat gtatgtgtat gtgtttgcat ctctctgtgt 4140
gtctgcgctt atatatttgt gtatgtgttt atgtgttcgc ctttgtgcgt tgttggggat 4200
tgaatccagg ggaatacaaa tgttaagaaa gaacgttacc actaagcttc acctgtaggc 4260
cttaaagctt ttctttcttt taaaaattgt aattaattca ttttcagtca ggatctccac 4320
acctcgtccc tgctgctcta gaactcacta tttaaacaca atcgccctca aacctgcagc 4380
aaccctcccg cctctaccct gcgagcacta gaataataac aggtgacccc acacgcctag 4440
attaagacct ttaaggtaaa cattttacta tattttagtc tcataagaca agatgctaca 4500
ataaagctgt acataaagtt ccctcgaatt tcttgctatt ttaactcaaa cataaggatt 4560
tcctcctttt tgattcaggt aacagaaaaa atacacaggt acatacatgt acacacatga 4620
acacacacgc atcacaacca catatgcgca cgcttgtgtg atctatcatt taccatgcca 4680
ctgaactctt ctttccccat aaattcctct ggacttgtgt gccctccagg aagaccgcgg 4740
agtctggaga gctgcacggg ctcaccacag atgagaagtt tgtagaagga gtgtacagag 4800
tagaactgga caccaaatcg tactggaaga cacttggcat ttccccgttc catgaattcg 4860
cggatgtaag tggacacacc aagttgtttg gattttgttt ttagtctcag gaaattccct 4920
tcgctcttgc tgtacgatgg gcatgagtgg aaagtagatt ccacagccag aatccacagt 4980
gctgggaaag caagccttct gaatttttct aaaactcatt tagcaacatg gcctgaacct 5040
gttcacactg cttatggtca gctaactata tttatgtaaa tattcatttc tctgttgagg 5100
aaatgttagt atttgctttt gaggcaacct ccagatacca tggagggcat gtcatagtca 5160
aagagagggc tccctatggt atttctctaa attctggcat ttcctttatt ccaaagcaca 5220
tctagtgtcc ccagaagttt gggtagacaa ttcttggcaa cacagagaat tacaacatgt 5280
tcaaaaccca acagcttaat atctaaatca tcaagcaaac atcacatggc aaagggattt 5340
ctgaatcaaa actgtttcat ccttatgatc aacctatgga ggtctagcct cgacttacac 5400
ccattttacc aataagctaa gagaagctaa gttcctcatc aaggacacaa ggctagcatg 5460
tgtgagcaag tgacagagtt gccctctatg ttggttagtg tgccttagcc agtgtctcag 5520
taagaaatgg agctaaatca aaacccaagg ccaacagcca aaggcacatg agtaaccttt 5580
gcttggcact gggctcagtt tccctggctc ctctcagtcc tcagttcaca gaggcagctg 5640
tcatgcaaat agaatccaag cttgttggtc agacctggag ataacaaatt ccatcaaaaa 5700
tagctcctca tgtgacctag tttgctgtct gttgctatga tacacaccat gaccgaaaag 5760
caaccctggg gagagaaggg tttatttcat cttacagctt acagttcacc atggaggaaa 5820
gccaggtggg aacctggaag tggaaattga agcagagacc agaaaggaat gctgtttact 5880
ggctggctta gctccttttc ttatacagct taggtctatg tgcccagggg atggtactgc 5940
cgagcatagg ctgagcccgc ctacatcaac cattagtcaa aaaaaggtcc atagacttgc 6000
ctacaggcca atctcatgga ggcaataccc cagtggaggg tccctcttcg caggttactc 6060
tagtttgtgt caagttgaca aaacctaacc acaaagcaca aacagggtct gcccttgtgg 6120
cttagccatg gatgacactc tcagatgatg gtgttaccag acaaaccaga ggggctcacc 6180
aagagtctgc cacctaccaa ggtagtactc tactcctcac tgggcaccaa cacccatatt 6240
agctgggcca gtacaggacc cttgctgttt cctgcatgaa ttgtccatag accctgggtc 6300
tcagcctgcc gggagtacct gtaagtagtc gcctcaaaca cattattcct gttggaagac 6360
ttgtctgatt ctcttttaga actcaatcaa caaacgtttt tattttgttt tggctttttg 6420
gagacaagat ctctcatagg ccagcctgac ttgaatgtag ctgaggatga cctgtgctgc 6480
taatcttctc gcctcttcct cccaagtggt aggataatag gcataagaca ccacagcagt 6540
tttactccat accagggctc tgaacccaga ctttaaacac tctatcaact gattcacatt 6600
cccaccccat cattcaacaa acatttgaaa aataaaaccc ttctgccttg agcactctgc 6660
taaatacagc ctttgagtgc ggagtatttc ctcacaacca gggtccaaga tgaccccatc 6720
atacatacca cggaaaatta ggagatgttt ttaggtctct ttgcttgggg taatttttat 6780
gtgtgtgtgt acacagccct gtgcgtgtgt gtgtgtgtgt gtgtgtgtgt gtacaggcac 6840
acacgtgtat gcatgtagag gctacataaa aaccttaggt gtcattctca ggcactctgt 6900
tcaccccttc acacagcccg aacacacaaa atttgaggca ttagcctgga gctcaccagt 6960
taggctagac tgacttgcca gcagacccca ggctgtctcc atctccccag ctctgggatt 7020
acaaactcta tcataccaga catttttata catattctga gcataaaatt catgtcttca 7080
ggctaacaag tcaagagctt aaatgactga gctctcttac gtggtggatt ttttttaaaa 7140
ctacataata tctttttttt ttttttcact tctggggaag aaacaaatga gcctgagtga 7200
caatgcgaca gaaaagaaat tttgaggagt gtgtgtgtct gtgtgtgtgg tggcacatgc 7260
ctctcatcta atgctagagg ctacagtaga atgctcctga attagtggcc agccaaggcc 7320
aagggctagg gttgtaactc agtggcagag ggcttgccta gcattcgcag gatttgatcc 7380
atagcgctat aaataataat aaataaatac aacagtctaa gatgattctc cctttcattt 7440
atctggatgt tatttttgtg ttagttttac tctgtcatcc aatcattgtt tgccctatat 7500
ttggacattt aaaaaaaatc tttattccaa gtgtgttcaa agctgtatcc aaaacctgtc 7560
caccaaatga gtccaatgac atacatcttc tatattacca tctgttccag atttggctga 7620
ctcccggcac ctgggctgtt gctgcaccca tgtctcagat agtctagtga tttgagaagt 7680
gactagtaat tgcaaaatcc agactttgtc cagaaacttc tatgagctcc aaaactttca 7740
tttacatttc tgccagccac aaaccgcttg tgttgtggag agaaccctgt gatgtcttcc 7800
cacagcatct cagccttgtt tcttccctta aaatattcat cttttcacat tagaacatgc 7860
aaagggacag tgggagcgaa acccctggac tgggacgcac gaagccttcc tttctggtca 7920
ggctctcact gtagaaactt aggccggttt cagcatgcag tctgctggag aatggctcct 7980
gccaacattc caggtctgga agtttgtagt ggagttgttg ataaccactg ttcgccacag 8040
gtcttttgtt tgtgggtgtc agtgtttcta ctctcctgac ttttatctga acccaagaaa 8100
gggaacaata gccttcaagc tctctgtgac tctgatctga ccagggccac ccacactgca 8160
gaaggaaact tgcaaagaga gacctgcaat tctctaagag ctccacacag ctccaaagac 8220
ttaggcagca tattttaatc taattattcg tcccccaacc ccaccccaga ggacagttag 8280
acaataaaag gaagattacc agcttagcat cctgtgaaca ctttgtctgc agctcctacc 8340
tctgggctct gttagaacta gctgtctctc ctctctccta ggtggttttc acagccaacg 8400
actctggcca tcgccactac accatcgcag ccctgctcag cccatactcc tacagcacca 8460
cggctgtcgt cagcaacccc cagaattgag agactcagcc caggaggacc aggatcttgc 8520
caaagcagta gcatcccatt tgtaccaaaa cagtgttctt gctctataaa ccgtgttagc 8580
agctcaggaa gatgccgtga agcattctta ttaaaccacc tgctatttca ttcaaactgt 8640
gtttcttttt tatttcctca tttttctccc ctgctcctaa aacccaaaat cttctaaaga 8700
attctagaag gtatgcgatc aaacttttta aagaaagaaa atactttttg actcatggtt 8760
taaaggcatc ctttccatct tggggaggtc atgggtgctc ctggcaactt gcttgaggaa 8820
gataggtcag aaagcagagt ggaccaaccg ttcaatgttt tacaagcaaa acatacacta 8880
agcatggtct gtagctatta aaagcacaca atctgaaggg ctgtagatgc acagtagtgt 8940
tttcccagag catgttcaaa agccctgggt tcaatcacaa tactgaaaag taggccaaaa 9000
aacattctga aaatgaaata tttgggtttt tttttataac ctttagtgac taaataaaga 9060
caaatctaag agactaa 9077
<210> 8
<211> 444
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 8
atggcttccc ttcgactctt cctcctttgc ctcgctggac tggtatttgt gtctgaagct 60
ggccccgcgg gtgctggaga atccaaatgt cctctgatgg tcaaagtcct ggatgctgtc 120
cgaggcagcc ctgctgtaga cgtggctgta aaagtgttca aaaagacctc tgagggatcc 180
tgggagccct ttgcctctgg gaagaccgcg gagtctggag agctgcacgg gctcaccaca 240
gatgagaagt ttgtagaagg agtgtacaga gtagaactgg acaccaaatc gtactggaag 300
acacttggca tttccccgtt ccatgaattc gcggatgtgg ttttcacagc caacgactct 360
ggccatcgcc actacaccat cgcagccctg ctcagcccat actcctacag caccacggct 420
gtcgtcagca acccccagaa ttga 444
<210> 9
<211> 147
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 9
Met Ala Ser His Arg Leu Leu Leu Leu Cys Leu Ala Gly Leu Val Phe
1 5 10 15
Val Ser Glu Ala Gly Pro Thr Gly Thr Gly Glu Ser Lys Cys Pro Leu
20 25 30
Met Val Lys Val Leu Asp Ala Val Arg Gly Ser Pro Ala Ile Asn Val
35 40 45
Ala Val His Val Phe Arg Lys Ala Ala Asp Asp Thr Trp Glu Pro Phe
50 55 60
Ala Ser Gly Lys Thr Ser Glu Ser Ser Asp Ser His Gly Leu Thr Thr
65 70 75 80
Glu Glu Glu Phe Val Glu Gly Ile Tyr Lys Val Glu Ile Asp Thr Lys
85 90 95
Ser Tyr Trp Lys Ala Leu Gly Ile Ser Pro Phe His Glu His Ala Glu
100 105 110
Val Val Phe Thr Ala Asn Asp Ser Gly Pro Arg Arg Tyr Thr Ile Ala
115 120 125
Ala Leu Leu Ser Pro Tyr Ser Tyr Ser Thr Thr Ala Val Val Thr Asn
130 135 140
Pro Lys Glu
145
<210> 10
<211> 444
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 10
atggcttctc atcgtctgct cctcctctgc cttgctggac tggtatttgt gtctgaggct 60
ggccctacgg gcaccggtga atccaagtgt cctctgatgg tcaaagttct agatgctgtc 120
cgaggcagtc ctgccatcaa tgtggccgtg catgtgttca gaaaggctgc tgatgacacc 180
tgggagccat ttgcctctgg gaaaaccagt gagtctagcg attcgcatgg gctcacaact 240
gaggaggaat ttgtagaagg gatatacaaa gtggaaatag acaccaaatc ttactggaag 300
gcacttggca tctccccatt ccatgagcat gcagaggtgg tattcacagc caacgactcc 360
ggcccccgcc gctacaccat tgccgccctg ctgagcccct actcctattc caccacggct 420
gtcgtcacca atcccaagga atga 444
<210> 11
<211> 8300
<212> DNA
<213> 小家鼠(Mus musculus)
<400> 11
atggcttccc ttcgactctt cctcctttgc ctcgctggac tggtatttgt gtctgaagct 60
ggccccgcgg tgagtgatcc tgtgagcgat ccagacatgg cagttagacc ttagataaag 120
aagaagtgcc ttcttccaga tgtgagaact agagtactca gactctatat ttaccattag 180
actccaaaga gaagagctgg agtgcctctg gctcttcctt ctattgcttt agcgcattgg 240
gtctgtagtg ctcagtctct ggtgtcctta gataataaag atatgagatt aacatagaaa 300
taaagatata aaagggctgg atgtatagtt tagtggtcca gtgtatgcct agtatgtgaa 360
aagccttctg ttcaacctct agcaatagaa aaacaagata tattctcggt ggggctgtta 420
atattgaatt ctcataaaat ctttaatata tttagtatgc ctattatgtt gttatatttt 480
agttctttag ctaatcaaaa tgcattattg atctttcttt gtcttttttt ggccaacact 540
ctattccagt ctttgaaaaa gtcctttaaa agagttaatc agtataatta aatgagtcag 600
gaagtatgtg agggttattt tacaaccaga gggaattact atagcaacag ctgattagaa 660
tgatctcaag aaaaagccca ttctgtcttt ttgcaccatg cacctttcag tggctccatt 720
cagatggaga ggcaaacaga gcaatggctc tcagagggcc tattttccct ttgaacattc 780
attatccata tccctggtgc acagcagtgc atctgggggc agaaactgtt cttgctttgg 840
aaacaatgct gtctatgtca tactggataa agaagctcat taattgtcaa cacttatgtt 900
atcataatgg gatcagcatg tacttttggt tttgttccag agtctatcac cggaaagaac 960
aagccggttt actctgaccc atttcactga catttctctt gtctcctctg tgcccagggt 1020
gctggagaat ccaaatgtcc tctgatggtc aaagtcctgg atgctgtccg aggcagccct 1080
gctgtagacg tggctgtaaa agtgttcaaa aagacctctg agggatcctg ggagcccttt 1140
gcctctgggt aagcttgtag aaagcccacc atgggaccgg ttccaggttc ccatttgctc 1200
ttattcgtgt tagattcaga cacacacaac ttaccagcta gagggctcag agagagggct 1260
caggggcgaa gggcacgtat tgctcttgta agagacacag gtttaattcc tagcaccaga 1320
atggcagctc ataaccatct gaaactcaca gtcttaggag atctgggtat ctgacattct 1380
cttctaccca ccatgtgtgt ggtgcacaaa ttcacatgca ggcatcaaat cttataaaca 1440
acaacaaaaa accaacaaac ctggtagcaa aagaagatta gaaggttaaa catatgagcc 1500
gagagctttt gttttgtttt gttttgtttt gttttgttta catttcaaat gttatcccct 1560
ttctcggtcc ccctccccaa accctctacc ccattctctc ctccccttct tctatgaggg 1620
tgttccccac caacccactc ccaccttcct gctctcgaat tcccctatac tgggacatca 1680
agccttcaca gaatcaaggg cctctcctcc cattgatgcc cgacaatgtc atcctctgct 1740
acctatgtgg ctggagccat gggtcccttc atgtatcctc cttggttggt ggtttagtct 1800
ctgggaggtc tgggggatct ggttgattga tattattgtt cttcctatga gattgcaaac 1860
cccttcagct ccttcggtcc tttaactcct ccactgggga ccccgagctc agtccaatgg 1920
ttggctgtga gcatccacca gcagaggcct tttttttttt ttttaacaaa gctgctttat 1980
tatgttgctt agagcatgac caggaaccag agcacagtcc aagactgaag ggaggaaaag 2040
ggggggagtc aataacccca ctgtttcata gtggtttgca acccttttat atcacagccc 2100
actttaggca aataatgaaa attatagtct ccagggacag agaagatggt gcaggaagtg 2160
aagtgcctgc tcagaaaatg ggggcttgaa tgtgagttcc cagactctgt gtaagatgcc 2220
cagcatcgaa gtgcatgctt ataacaccag cctggaggta gaagcttaga aacaggggta 2280
ccctgaagtt gcttgttcac cagtgtccct gaatgggtag gtgcatgttt ggtgagagac 2340
cctgtctcaa aaatcaaggt gtaggataat tgaaaatacc tagctttgag cttagatcat 2400
gcaaatgtgt acacacactc acacacacca cacacacaaa aaaatgcaga gacagagaga 2460
tacagagaga cagagagata cagagacaga gacagagaga aaaggagaaa gtaaaaaaca 2520
aataatttaa agacccatgg ccacaaagag gctcaaagac aagcacgtat aaaaccatac 2580
acatgtaatt ttaggagttt tcagattccc tggtacccgt gggtgatgca caagctttga 2640
atcccagtct taaaatctta cgaagaacgt gttcgtgtgt gctaatttat tgatgagagg 2700
aaaggaattg acaaagtgcc cttccggagc ttcctgcatt acccagactc agggtttttt 2760
taaatgtaca ctcagaacag agtagctctg tgcaagggta gcaaccacga agcttaataa 2820
gaaacatatc gtgagagatc tgcaaggcaa atctaggggc tgaccaatct cacagtcacc 2880
cactagcatg tcaacacaac ttcccacctg tgctagccac ttagcaattt tgtgttgttc 2940
tgttttgttt ttgtttttaa caaagcaatt tcaaagagat ttctaattca tctaaacaaa 3000
caaaccaaaa ggaaaacagc aaagacgccc tgagcactta gcagagcagc tatgcagtta 3060
tgactcctgg gtggagactt tatatcaggc ttcaactgaa tacctagaac ctactagtgc 3120
tcttcatcaa tccttgggaa ggtcattttc ttttggtgct gttttgagtt tctatttgtt 3180
aatgtcttca taattataca cgtgttgagc acagcatgca aagtgattag gggaatctag 3240
ttggagtgga atggataccc aaatattcag actttcttgt gactcttctt tcttgtaccc 3300
acatcaaaaa aaaaaaaaat ggagatgaga catggtcaga gtcactaaaa ccagctgcta 3360
cttttaatta cgtggggagc agtttctaac attgccatta ttgaactgat gctgcctggg 3420
tggaaatgga aatcacttag tatttcttgt tggcaaagaa ttactgaatg gattaaattt 3480
ccaaagggag aagtcagtta caagtctttt ctttgtttat taggctttct gctatgataa 3540
attacactac ttccagaagt tacccttagg ccatgggaca ctggactatc actctgctgt 3600
cacaagagat tacagagtta gtcaaggcag cttgtgacac cttcagggac tgtcataaac 3660
ttccagcaag tcattaatcc tgaatgcaat actgtgtgtg tgtgtctatg tgtgtttgta 3720
tgtctgtgtg tgtcttatgt ctgtgtctct gtgtgtgtgt gtgtttgtgt gtgtgtgtgt 3780
atgtatgcct gtgtgtgtct tatgtctgtg tttgtgtgtc tgtgtgtgtc ttatgtctgt 3840
gtttgtatgt ctgtgtgtgt ctgtgtgtgt cttatgtctg tgtctctgtg tgtgtgtgtg 3900
tgtatgtatg tatgtatgta tgtatgtgta tgtgtttgca tctctctgtg tgtctgcgct 3960
tatatatttg tgtatgtgtt tatgtgttcg cctttgtgcg ttgttgggga ttgaatccag 4020
gggaatacaa atgttaagaa agaacgttac cactaagctt cacctgtagg ccttaaagct 4080
tttctttctt ttaaaaattg taattaattc attttcagtc aggatctcca cacctcgtcc 4140
ctgctgctct agaactcact atttaaacac aatcgccctc aaacctgcag caaccctccc 4200
gcctctaccc tgcgagcact agaataataa caggtgaccc cacacgccta gattaagacc 4260
tttaaggtaa acattttact atattttagt ctcataagac aagatgctac aataaagctg 4320
tacataaagt tccctcgaat ttcttgctat tttaactcaa acataaggat ttcctccttt 4380
ttgattcagg taacagaaaa aatacacagg tacatacatg tacacacatg aacacacacg 4440
catcacaacc acatatgcgc acgcttgtgt gatctatcat ttaccatgcc actgaactct 4500
tctttcccca taaattcctc tggacttgtg tgccctccag gaagaccgcg gagtctggag 4560
agctgcacgg gctcaccaca gatgagaagt ttgtagaagg agtgtacaga gtagaactgg 4620
acaccaaatc gtactggaag acacttggca tttccccgtt ccatgaattc gcggatgtaa 4680
gtggacacac caagttgttt ggattttgtt tttagtctca ggaaattccc ttcgctcttg 4740
ctgtacgatg ggcatgagtg gaaagtagat tccacagcca gaatccacag tgctgggaaa 4800
gcaagccttc tgaatttttc taaaactcat ttagcaacat ggcctgaacc tgttcacact 4860
gcttatggtc agctaactat atttatgtaa atattcattt ctctgttgag gaaatgttag 4920
tatttgcttt tgaggcaacc tccagatacc atggagggca tgtcatagtc aaagagaggg 4980
ctccctatgg tatttctcta aattctggca tttcctttat tccaaagcac atctagtgtc 5040
cccagaagtt tgggtagaca attcttggca acacagagaa ttacaacatg ttcaaaaccc 5100
aacagcttaa tatctaaatc atcaagcaaa catcacatgg caaagggatt tctgaatcaa 5160
aactgtttca tccttatgat caacctatgg aggtctagcc tcgacttaca cccattttac 5220
caataagcta agagaagcta agttcctcat caaggacaca aggctagcat gtgtgagcaa 5280
gtgacagagt tgccctctat gttggttagt gtgccttagc cagtgtctca gtaagaaatg 5340
gagctaaatc aaaacccaag gccaacagcc aaaggcacat gagtaacctt tgcttggcac 5400
tgggctcagt ttccctggct cctctcagtc ctcagttcac agaggcagct gtcatgcaaa 5460
tagaatccaa gcttgttggt cagacctgga gataacaaat tccatcaaaa atagctcctc 5520
atgtgaccta gtttgctgtc tgttgctatg atacacacca tgaccgaaaa gcaaccctgg 5580
ggagagaagg gtttatttca tcttacagct tacagttcac catggaggaa agccaggtgg 5640
gaacctggaa gtggaaattg aagcagagac cagaaaggaa tgctgtttac tggctggctt 5700
agctcctttt cttatacagc ttaggtctat gtgcccaggg gatggtactg ccgagcatag 5760
gctgagcccg cctacatcaa ccattagtca aaaaaaggtc catagacttg cctacaggcc 5820
aatctcatgg aggcaatacc ccagtggagg gtccctcttc gcaggttact ctagtttgtg 5880
tcaagttgac aaaacctaac cacaaagcac aaacagggtc tgcccttgtg gcttagccat 5940
ggatgacact ctcagatgat ggtgttacca gacaaaccag aggggctcac caagagtctg 6000
ccacctacca aggtagtact ctactcctca ctgggcacca acacccatat tagctgggcc 6060
agtacaggac ccttgctgtt tcctgcatga attgtccata gaccctgggt ctcagcctgc 6120
cgggagtacc tgtaagtagt cgcctcaaac acattattcc tgttggaaga cttgtctgat 6180
tctcttttag aactcaatca acaaacgttt ttattttgtt ttggcttttt ggagacaaga 6240
tctctcatag gccagcctga cttgaatgta gctgaggatg acctgtgctg ctaatcttct 6300
cgcctcttcc tcccaagtgg taggataata ggcataagac accacagcag ttttactcca 6360
taccagggct ctgaacccag actttaaaca ctctatcaac tgattcacat tcccacccca 6420
tcattcaaca aacatttgaa aaataaaacc cttctgcctt gagcactctg ctaaatacag 6480
cctttgagtg cggagtattt cctcacaacc agggtccaag atgaccccat catacatacc 6540
acggaaaatt aggagatgtt tttaggtctc tttgcttggg gtaattttta tgtgtgtgtg 6600
tacacagccc tgtgcgtgtg tgtgtgtgtg tgtgtgtgtg tgtacaggca cacacgtgta 6660
tgcatgtaga ggctacataa aaaccttagg tgtcattctc aggcactctg ttcacccctt 6720
cacacagccc gaacacacaa aatttgaggc attagcctgg agctcaccag ttaggctaga 6780
ctgacttgcc agcagacccc aggctgtctc catctcccca gctctgggat tacaaactct 6840
atcataccag acatttttat acatattctg agcataaaat tcatgtcttc aggctaacaa 6900
gtcaagagct taaatgactg agctctctta cgtggtggat tttttttaaa actacataat 6960
atcttttttt tttttttcac ttctggggaa gaaacaaatg agcctgagtg acaatgcgac 7020
agaaaagaaa ttttgaggag tgtgtgtgtc tgtgtgtgtg gtggcacatg cctctcatct 7080
aatgctagag gctacagtag aatgctcctg aattagtggc cagccaaggc caagggctag 7140
ggttgtaact cagtggcaga gggcttgcct agcattcgca ggatttgatc catagcgcta 7200
taaataataa taaataaata caacagtcta agatgattct ccctttcatt tatctggatg 7260
ttatttttgt gttagtttta ctctgtcatc caatcattgt ttgccctata tttggacatt 7320
taaaaaaaat ctttattcca agtgtgttca aagctgtatc caaaacctgt ccaccaaatg 7380
agtccaatga catacatctt ctatattacc atctgttcca gatttggctg actcccggca 7440
cctgggctgt tgctgcaccc atgtctcaga tagtctagtg atttgagaag tgactagtaa 7500
ttgcaaaatc cagactttgt ccagaaactt ctatgagctc caaaactttc atttacattt 7560
ctgccagcca caaaccgctt gtgttgtgga gagaaccctg tgatgtcttc ccacagcatc 7620
tcagccttgt ttcttccctt aaaatattca tcttttcaca ttagaacatg caaagggaca 7680
gtgggagcga aacccctgga ctgggacgca cgaagccttc ctttctggtc aggctctcac 7740
tgtagaaact taggccggtt tcagcatgca gtctgctgga gaatggctcc tgccaacatt 7800
ccaggtctgg aagtttgtag tggagttgtt gataaccact gttcgccaca ggtcttttgt 7860
ttgtgggtgt cagtgtttct actctcctga cttttatctg aacccaagaa agggaacaat 7920
agccttcaag ctctctgtga ctctgatctg accagggcca cccacactgc agaaggaaac 7980
ttgcaaagag agacctgcaa ttctctaaga gctccacaca gctccaaaga cttaggcagc 8040
atattttaat ctaattattc gtcccccaac cccaccccag aggacagtta gacaataaaa 8100
ggaagattac cagcttagca tcctgtgaac actttgtctg cagctcctac ctctgggctc 8160
tgttagaact agctgtctct cctctctcct aggtggtttt cacagccaac gactctggcc 8220
atcgccacta caccatcgca gccctgctca gcccatactc ctacagcacc acggctgtcg 8280
tcagcaaccc ccagaattga 8300
<210> 12
<211> 11817
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<220>
<221> misc_feature
<222> (1)..(97)
<223> 小鼠序列
<220>
<221> misc_feature
<222> (98)..(7298)
<223> 人序列
<220>
<221> misc_feature
<222> (7299)..(11717)
<223> 盒序列
<220>
<221> misc_feature
<222> (11718)..(11817)
<223> 小鼠序列
<400> 12
agcttggcag ggatcagcag cctgggttgg aaggaggggg tataaaagcc ccttcaccag 60
gagaagccgt cacacagatc cacaagctcc tgacaggatg gcttctcatc gtctgctcct 120
cctctgcctt gctggactgg tatttgtgtc tgaggctggc cctacggtga gtgtttctgt 180
gacatcccat tcctacattt aagattcacg ctaaatgaag tagaagtgac tccttccagc 240
tttgccaacc agcttttatt actagggcaa gggtacccag catctatttt taatataatt 300
aattcaaact tcaaaaagaa tgaagttcca ctgagcttac tgagctggga cttgaactct 360
gagcattcta cctcattgct ttggtgcatt aggtttgtaa tatctggtac ctctgtttcc 420
tcagatagat gatagaaata aagatatgat attaaggaag ctgttaatac tgaattttca 480
gaaaagtatc cctccataaa atgtatttgg gggacaaact gcaggagatt atattctggc 540
cctatagtta ttcaaaacgt atttattgat taatctttaa aaggcttagt gaacaatatt 600
ctagtcagat atctaattct taaatcctct agaagaatta actaatacta taaaatgggt 660
ctggatgtag ttctgacatt attttataac aactggtaag agggagtgac tatagcaaca 720
actaaaatga tctcaggaaa acctgtttgg ccctatgtat ggtacattac atcttttcag 780
taattccact caaatggaga cttttaacaa agcaactgtt ctcaggggac ctattttctc 840
ccttaaaatt cattatacac atccctggtt gatagcagtg tgtctggagg cagaaaccat 900
tcttgctttg gaaacaatta cgtctgtgtt atactgagta gggaagctca ttaattgtcg 960
acacttacgt tcctgataat gggatcagtg tgtaattctt gtttcgctcc agatttctaa 1020
taccacaaag aataaatcct ttcactctga tcaattttgt taacttctca cgtgtcttct 1080
ctacacccag ggcaccggtg aatccaagtg tcctctgatg gtcaaagttc tagatgctgt 1140
ccgaggcagt cctgccatca atgtggccgt gcatgtgttc agaaaggctg ctgatgacac 1200
ctgggagcca tttgcctctg ggtaagttgc caaagaaccc tcccacagga cttggtttta 1260
tcttcccgtt tgcccctcac ttggtagaga gaggctcaca tcatctgcta aagaatttac 1320
aagtagattg aaaaacgtag gcagaggtca agtatgccct ctgaaggatg ccctcttttt 1380
gttttgctta gctaggaagt gaccaggaac ctgagcatca tttaggggca gacagtagag 1440
aaaagaagga atcagaactc ctctcctcta gctgtggttt gcaacccttt tgggtcacag 1500
aacactttat gtaggtgatg aaaagtaaac attctatgcc cagaaaaaat gcacagatac 1560
acacacatac aaaatcatat atgtgatttt aggagtttca cagattccct ggtgtccctg 1620
ggtaacacca aagctaagtg tccttgtctt agaattttag gaaaaggtat aatgtgtatt 1680
aacccattaa caaaaggaaa ggaattcaga aatattatta accaggcatc tgtctgtagt 1740
taatatggat cacccaaaac ccaaggcttt tgcctaatga acactttggg gcacctactg 1800
tgtgcaaggc tgggggctgt caagctcagt taaaaaaaaa aagatagaag agatggatcc 1860
atgaggcaaa gtacagcccc aggctaatcc cacgatcacc cgacttcatg tccaagagtg 1920
gcttctcacc ttcattagcc agttcacaat tttcatggag tttttctacc tgcactagca 1980
aaaacttcaa ggaaaataca tattaataaa tctaagcaaa gtgaccagaa gacagagcaa 2040
tcaggagacc ctttgcatcc agcagaagag gaactgctaa gtatttacat ctccacagag 2100
aagaatttct gttgggtttt aattgaaccc caagaaccac atgattcttc aaccattatt 2160
gggaagatca ttttcttagg tctggtttta actggctttt tatttgggaa ttcatttatg 2220
tttatataaa atgccaagca taacatgaaa agtggttaca ggactattct aagggagaga 2280
cagaatggac accaaaaata ttccaatgtt cttgtgaatc ttttccttgc accaggacaa 2340
aaaaaaaaag aagtgaaaag aagaaaggag gaggggcata atcagagtca gtaaagacaa 2400
ctgctatttt tatctatcgt agctgttgca gtcaaatggg aagcaatttc caacattcaa 2460
ctatggagct ggtacttaca tggaaataga agttgcctag tgtttgttgc tggcaaagag 2520
ttatcagaga ggttaaatat ataaaaggga aaagagtcag atacaggttc ttcttcctac 2580
tttaggtttt ccactgtgtg tgcaaatgat actccctggt ggtgtgcaga tgcctcaaag 2640
ctatcctcac accacaaggg agaggagcga gatcctgctg tcctggagaa gtgcagagtt 2700
agaacagctg tggccacttg catccaatca tcaatcttga atcacaggga ctctttctta 2760
agtaaacatt atacctggcc gggcacggtg gctcacgcct gtaatcccag cactttggga 2820
tgccaaagtg ggcatatcat ctgaggtcag gagttcaaga ccagcctggc caacatggca 2880
aaactccgtc tttatgaaaa atacaaaaat tagccaggca tggtggcagg cgcctgtaat 2940
cccagctaat tgggaggctg aggctggaga atcccttgaa tctaggaggc agaggttgca 3000
gtgagctgag atcgtgccat tgcactccag cctgggtgac aagagtaaaa ctctgtctca 3060
aaaaaaaaaa attataccta cattctcttc ttatcagaga aaaaaatcta cagtgagctt 3120
ttcaaaaagt ttttacaaac tttttgccat ttaatttcag ttaggagttt tccctacttc 3180
tgacttagtt gaggggaaat gttcataaca tgtttataac atgtttatgt gtgttagttg 3240
gtgggggtgt attactttgc catgccattt gtttcctcca tgcgtaactt aatccagact 3300
ttcacacctt ataggaaaac cagtgagtct agcgattcgc atgggctcac aactgaggag 3360
gaatttgtag aagggatata caaagtggaa atagacacca aatcttactg gaaggcactt 3420
ggcatctccc cattccatga gcatgcagag gtgagtatac agaccttcga gggttgtttt 3480
ggttttggtt tttgcttttg gcattccagg aaatgcacag ttttactcag tgtaccacag 3540
aaatgtccta aggaaggtga tgaatgacca aaggttccct ttcctattat acaagaaaaa 3600
attcacaaca ctctgagaag caaatttctt tttgactttg atgaaaatcc acttagtaac 3660
atgacttgaa cttacatgaa actactcata gtctattcat tccactttat atgaatattg 3720
atgtatctgc tgttgaaata atagtttatg aggcagccct ccagacccca cgtagagtgt 3780
atgtaacaag agatgcacca ttttatttct cgaaaacccg taacattctt cattccaaaa 3840
cacatctggc ttctcggagg tctggacaag tgattcttgg caacacatac ctatagagac 3900
aataaaatca aagtaataat ggcaacacaa tagataacat ttaccaagca tacaccatgt 3960
ggcagacaca attataagtg ttttccatat ttaacctact taatcctcag gaataagcca 4020
ctgaggtcag tcctattatt atccccatct tatagatgaa gaaaatgagg caccaggaag 4080
tcaaataact tgtcaaaggt cacaagacta ggaaatacac aagtagaaat gtttacaatt 4140
aaggcccagg ctgggtttgc cctcagttct gctatgcctc gcattatgcc ccaggaaact 4200
ttttcccttg tgaaagccaa gcttaaaaaa agaaaagcca catttgtaac gtgctctgtt 4260
cccctgccta tggtgaggat cttcaaacag ttatacatgg acccagtccc cctgccttct 4320
ccttaatttc ttaagtcatt tgaaacagat ggctgtcatg gaaatagaat ccagacatgt 4380
tggtcagagt taaagatcaa ctaattccat caaaaatagc tcggcatgaa agggaactat 4440
tctctggctt agtcatggat gagactttca attgctataa agtggttcct ttattagaca 4500
atgttaccag ggaaacaaca ggggtttgtt tgacttctgg ggcccacaag tcaacaagag 4560
agccccatct accaaggagc atgtccctga ctacccctca gccagcagca agacatggac 4620
cccagtcagg gcaggagcag ggtttcggcg gcgcccagca caagacattg cccctagagt 4680
ctcagcccct accctcgagt aatagatctg cctacctgag actgttgttt gcccaagagc 4740
tgggtctcag cctgatggga accatataaa aaggttcact gacatactgc ccacatgttg 4800
ttctctttca ttagatctta gcttccttgt ctgctcttca ttcttgcagt attcattcaa 4860
caaacattaa aaaaaaaaaa aagcattcta tgtgtggaac actctgctag atgctgtgga 4920
tttagaaatg aaaatacatc ccgacccttg gaatggaagg gaaaggactg aagtaagaca 4980
gattaagcag gaccgtcagc ccagcttgaa gcccagataa atacggagaa caagagagag 5040
cgagtagtga gagatgagtc ccaatgcctc actttggtga cgggtgcgtg gtgggcttca 5100
tgcagcttct tctgataaat gcctccttca gaactggtca actctacctt ggccagtgac 5160
ccaggtggtc atagtagatt taccaaggga aaatggaaac ttttattagg agctcttagg 5220
cctcttcact tcatggattt ttttttcctt tttttttgag atggagtttt gccctgtcac 5280
ccaggctgga atgcagtggt gcaatctcag ctcactgcaa cctccgcctc ccaggttcaa 5340
gcaattctcc tgcctcagcc tcccgagtag ctgggactac aggtgtgcgc caccacacca 5400
ggctaatttt tgtatttttt gtaaagacag gttttcacca cgttggccag gctggtctga 5460
actccagacc tcaggtgatt cacctgtctc agcctcccaa agtgctggga ttacaggtgt 5520
gagccaccgt gcccggctac ttcatggatt tttgattaca gattatgcct cttacaattt 5580
ttaagaagaa tcaagtgggc tgaaggtcaa tgtcaccata agacaaaaga catttttatt 5640
agttgattct agggaattgg ccttaagggg agccctttct tcctaagaga ttcttaggtg 5700
attctcactt cctcttgccc cagtattatt tttgtttttg gtatggctca ctcagatcct 5760
tttttcctcc tatccctaag taatccgggt ttctttttcc catatttaga acaaaatgta 5820
tttatgcaga gtgtgtccaa acctcaaccc aaggcctgta tacaaaataa atcaaattaa 5880
acacatcttt actgtcttct acctctttcc tgacctcaat atatcccaac ttgcctcact 5940
ctgagaacca aggctgtccc agcacctgag tcgcagatat tctactgatt tgacagaact 6000
gtgtgactat ctggaacagc attttgatcc acaatttgcc cagttacaaa gcttaaatga 6060
gctctagtgc atgcatatat atttcaaaat tccaccatga tcttccacac tctgtattgt 6120
aaatagagcc ctgtaatgct tttacttcgt atttcattgc ttgttataca taaaaatata 6180
cttttcttct tcatgttaga aaatgcaaag aataggaggg tgggggaatc tctgggcttg 6240
gagacaggag acttgccttc ctactatggt tccatcagaa tgtagactgg gacaatacaa 6300
taattcaagt ctggtttgct catctgtaaa ttgggaagaa tgtttccagc tccagaatgc 6360
taaatctcta agtctgtggt tggcagccac tattgcagca gctcttcaat gactcaatgc 6420
agttttgcat tctccctacc ttttttttct aaaaccaata aaatagatac agcctttagg 6480
ctttctggga tttcccttag tcaagctagg gtcatcctga ctttcggcgt gaatttgcaa 6540
aacaagacct gactctgtac tcctgctcta aggactgtgc atggttccaa aggcttagct 6600
tgccagcata tttgagcttt ttccttctgt tcaaactgtt ccaaaatata aaagaataaa 6660
attaattaag ttggcactgg acttccggtg gtcagtcatg tgtgtcatct gtcacgtttt 6720
tcgggctctg gtggaaatgg atctgtctgt cttctctcat aggtggtatt cacagccaac 6780
gactccggcc cccgccgcta caccattgcc gccctgctga gcccctactc ctattccacc 6840
acggctgtcg tcaccaatcc caaggaatga gggacttctc ctccagtgga cctgaaggac 6900
gagggatggg atttcatgta accaagagta ttccattttt actaaagcag tgttttcacc 6960
tcatatgcta tgttagaagt ccaggcagag acaataaaac attcctgtga aaggcacttt 7020
tcattccact ttaacttgat tttttaaatt cccttattgt cccttccaaa aaaaagagaa 7080
tcaaaatttt acaaagaatc aaaggaattc tagaaagtat ctgggcagaa cgctaggaga 7140
gatccaaatt tccattgtct tgcaagcaaa gcacgtatta aatatgatct gcagccatta 7200
aaaagacaca ttctgtaaat gagagagcct tattttcctg taaccttcag caaatagcaa 7260
aagacacatt ccaagggccc acttctttac tgtgggcaat gtatgctata cgaagttata 7320
tgcatgccag tagcagcacc cacgtccacc ttctgtctag taatgtccaa cacctccctc 7380
agtccaaaca ctgctctgca tccatgtggc tcccatttat acctgaagca cttgatgggg 7440
cctcaatgtt ttactagagc ccacccccct gcaactctga gaccctctgg atttgtctgt 7500
cagtgcctca ctggggcgtt ggataatttc ttaaaaggtc aagttccctc agcagcattc 7560
tctgagcagt ctgaagatgt gtgcttttca cagttcaaat ccatgtggct gtttcaccca 7620
cctgcctggc cttgggttat ctatcaggac ctagcctaga agcaggtgtg tggcacttaa 7680
cacctaagct gagtgactaa ctgaacactc aagtggatgc catctttgtc acttcttgac 7740
tgtgacacaa gcaactcctg atgccaaagc cctgcccacc cctctcatgc ccatatttgg 7800
acatggtaca ggtcctcact ggccatggtc tgtgaggtcc tggtcctctt tgacttcata 7860
attcctaggg gccactagta tctataagag gaagagggtg ctggctccca ggccacagcc 7920
cacaaaattc cacctgctca caggttggct ggctcgaccc aggtggtgtc ccctgctctg 7980
agccagctcc cggccaagcc agcaccatgg gaacccccaa gaagaagagg aaggtgcgta 8040
ccgatttaaa ttccaattta ctgaccgtac accaaaattt gcctgcatta ccggtcgatg 8100
caacgagtga tgaggttcgc aagaacctga tggacatgtt cagggatcgc caggcgtttt 8160
ctgagcatac ctggaaaatg cttctgtccg tttgccggtc gtgggcggca tggtgcaagt 8220
tgaataaccg gaaatggttt cccgcagaac ctgaagatgt tcgcgattat cttctatatc 8280
ttcaggcgcg cggtctggca gtaaaaacta tccagcaaca tttgggccag ctaaacatgc 8340
ttcatcgtcg gtccgggctg ccacgaccaa gtgacagcaa tgctgtttca ctggttatgc 8400
ggcggatccg aaaagaaaac gttgatgccg gtgaacgtgc aaaacaggta aatataaaat 8460
ttttaagtgt ataatgatgt taaactactg attctaattg tttgtgtatt ttaggctcta 8520
gcgttcgaac gcactgattt cgaccaggtt cgttcactca tggaaaatag cgatcgctgc 8580
caggatatac gtaatctggc atttctgggg attgcttata acaccctgtt acgtatagcc 8640
gaaattgcca ggatcagggt taaagatatc tcacgtactg acggtgggag aatgttaatc 8700
catattggca gaacgaaaac gctggttagc accgcaggtg tagagaaggc acttagcctg 8760
ggggtaacta aactggtcga gcgatggatt tccgtctctg gtgtagctga tgatccgaat 8820
aactacctgt tttgccgggt cagaaaaaat ggtgttgccg cgccatctgc caccagccag 8880
ctatcaactc gcgccctgga agggattttt gaagcaactc atcgattgat ttacggcgct 8940
aaggatgact ctggtcagag atacctggcc tggtctggac acagtgcccg tgtcggagcc 9000
gcgcgagata tggcccgcgc tggagtttca ataccggaga tcatgcaagc tggtggctgg 9060
accaatgtaa atattgtcat gaactatatc cgtaacctgg atagtgaaac aggggcaatg 9120
gtgcgcctgc tggaagatgg cgattaggcg gccggccgct aatcagccat accacatttg 9180
tagaggtttt acttgcttta aaaaacctcc cacacctccc cctgaacctg aaacataaaa 9240
tgaatgcaat tgttgttgtt aacttgttta ttgcagctta taatggttac aaataaagca 9300
atagcatcac aaatttcaca aataaagcat ttttttcact gcattctagt tgtggtttgt 9360
ccaaactcat caatgtatct tatcatgtct ggatcccccg gctagagttt aaacactaga 9420
actagtggat cccccgggat catggcctcc gcgccgggtt ttggcgcctc ccgcgggcgc 9480
ccccctcctc acggcgagcg ctgccacgtc agacgaaggg cgcagcgagc gtcctgatcc 9540
ttccgcccgg acgctcagga cagcggcccg ctgctcataa gactcggcct tagaacccca 9600
gtatcagcag aaggacattt taggacggga cttgggtgac tctagggcac tggttttctt 9660
tccagagagc ggaacaggcg aggaaaagta gtcccttctc ggcgattctg cggagggatc 9720
tccgtggggc ggtgaacgcc gatgattata taaggacgcg ccgggtgtgg cacagctagt 9780
tccgtcgcag ccgggatttg ggtcgcggtt cttgtttgtg gatcgctgtg atcgtcactt 9840
ggtgagtagc gggctgctgg gctggccggg gctttcgtgg ccgccgggcc gctcggtggg 9900
acggaagcgt gtggagagac cgccaagggc tgtagtctgg gtccgcgagc aaggttgccc 9960
tgaactgggg gttgggggga gcgcagcaaa atggcggctg ttcccgagtc ttgaatggaa 10020
gacgcttgtg aggcgggctg tgaggtcgtt gaaacaaggt ggggggcatg gtgggcggca 10080
agaacccaag gtcttgaggc cttcgctaat gcgggaaagc tcttattcgg gtgagatggg 10140
ctggggcacc atctggggac cctgacgtga agtttgtcac tgactggaga actcggtttg 10200
tcgtctgttg cgggggcggc agttatggcg gtgccgttgg gcagtgcacc cgtacctttg 10260
ggagcgcgcg ccctcgtcgt gtcgtgacgt cacccgttct gttggcttat aatgcagggt 10320
ggggccacct gccggtaggt gtgcggtagg cttttctccg tcgcaggacg cagggttcgg 10380
gcctagggta ggctctcctg aatcgacagg cgccggacct ctggtgaggg gagggataag 10440
tgaggcgtca gtttctttgg tcggttttat gtacctatct tcttaagtag ctgaagctcc 10500
ggttttgaac tatgcgctcg gggttggcga gtgtgttttg tgaagttttt taggcacctt 10560
ttgaaatgta atcatttggg tcaatatgta attttcagtg ttagactagt aaattgtccg 10620
ctaaattctg gccgtttttg gcttttttgt tagacgtgtt gacaattaat catcggcata 10680
gtatatcggc atagtataat acgacaaggt gaggaactaa accatgaccg agtacaagcc 10740
cacggtgcgc ctcgccaccc gcgacgacgt ccccagggcc gtacgcaccc tcgccgccgc 10800
gttcgccgac taccccgcca cgcgccacac cgtcgatccg gaccgccaca tcgagcgggt 10860
caccgagctg caagaactct tcctcacgcg cgtcgggctc gacatcggca aggtgtgggt 10920
cgcggacgac ggcgccgcgg tggcggtctg gaccacgccg gagagcgtcg aagcgggggc 10980
ggtgttcgcc gagatcggcc cgcgcatggc cgagttgagc ggttcccggc tggccgcgca 11040
gcaacagatg gaaggcctcc tggcgccgca ccggcccaag gagcccgcgt ggttcctggc 11100
caccgtcggc gtctcgcccg accaccaggg caagggtctg ggcagcgccg tcgtgctccc 11160
cggagtggag gcggccgagc gcgccggggt gcccgccttc ctggagacct ccgcgccccg 11220
caacctcccc ttctacgagc ggctcggctt caccgtcacc gccgacgtcg aggtgcccga 11280
aggaccgcgc acctggtgca tgacccgcaa gcccggtgcc tgacgcccgc cccacgaccc 11340
gcagcgcccg accgaaagga gcgcacgacc ccatgcatcg atgatctaga gctcgctgat 11400
cagcctcgac tgtgccttct agttgccagc catctgttgt ttgcccctcc cccgtgcctt 11460
ccttgaccct ggaaggtgcc actcccactg tcctttccta ataaaatgag gaaattgcat 11520
cgcattgtct gagtaggtgt cattctattc tggggggtgg ggtggggcag gacagcaagg 11580
gggaggattg ggaagacaat agcaggcatg ctggggatgc ggtgggctct atggcttctg 11640
aggcggccta gataacttcg tataatgtat gctatacgaa gttatgctag gtaactataa 11700
cggtcctaag gtagcgagag actcagccca ggaggaccag gatcttgcca aagcagtagc 11760
atcccatttg taccaaaaca gtgttcttgc tctataaacc gtgttagcag ctcagga 11817
<210> 13
<211> 7476
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<220>
<221> misc_feature
<222> (1)..(97)
<223> 小鼠序列
<220>
<221> misc_feature
<222> (98)..(7298)
<223> 人序列
<220>
<221> misc_feature
<222> (7299)..(7376)
<223> 盒LoxP瘢痕
<220>
<221> misc_feature
<222> (7377)..(7476)
<223> 小鼠序列
<400> 13
agcttggcag ggatcagcag cctgggttgg aaggaggggg tataaaagcc ccttcaccag 60
gagaagccgt cacacagatc cacaagctcc tgacaggatg gcttctcatc gtctgctcct 120
cctctgcctt gctggactgg tatttgtgtc tgaggctggc cctacggtga gtgtttctgt 180
gacatcccat tcctacattt aagattcacg ctaaatgaag tagaagtgac tccttccagc 240
tttgccaacc agcttttatt actagggcaa gggtacccag catctatttt taatataatt 300
aattcaaact tcaaaaagaa tgaagttcca ctgagcttac tgagctggga cttgaactct 360
gagcattcta cctcattgct ttggtgcatt aggtttgtaa tatctggtac ctctgtttcc 420
tcagatagat gatagaaata aagatatgat attaaggaag ctgttaatac tgaattttca 480
gaaaagtatc cctccataaa atgtatttgg gggacaaact gcaggagatt atattctggc 540
cctatagtta ttcaaaacgt atttattgat taatctttaa aaggcttagt gaacaatatt 600
ctagtcagat atctaattct taaatcctct agaagaatta actaatacta taaaatgggt 660
ctggatgtag ttctgacatt attttataac aactggtaag agggagtgac tatagcaaca 720
actaaaatga tctcaggaaa acctgtttgg ccctatgtat ggtacattac atcttttcag 780
taattccact caaatggaga cttttaacaa agcaactgtt ctcaggggac ctattttctc 840
ccttaaaatt cattatacac atccctggtt gatagcagtg tgtctggagg cagaaaccat 900
tcttgctttg gaaacaatta cgtctgtgtt atactgagta gggaagctca ttaattgtcg 960
acacttacgt tcctgataat gggatcagtg tgtaattctt gtttcgctcc agatttctaa 1020
taccacaaag aataaatcct ttcactctga tcaattttgt taacttctca cgtgtcttct 1080
ctacacccag ggcaccggtg aatccaagtg tcctctgatg gtcaaagttc tagatgctgt 1140
ccgaggcagt cctgccatca atgtggccgt gcatgtgttc agaaaggctg ctgatgacac 1200
ctgggagcca tttgcctctg ggtaagttgc caaagaaccc tcccacagga cttggtttta 1260
tcttcccgtt tgcccctcac ttggtagaga gaggctcaca tcatctgcta aagaatttac 1320
aagtagattg aaaaacgtag gcagaggtca agtatgccct ctgaaggatg ccctcttttt 1380
gttttgctta gctaggaagt gaccaggaac ctgagcatca tttaggggca gacagtagag 1440
aaaagaagga atcagaactc ctctcctcta gctgtggttt gcaacccttt tgggtcacag 1500
aacactttat gtaggtgatg aaaagtaaac attctatgcc cagaaaaaat gcacagatac 1560
acacacatac aaaatcatat atgtgatttt aggagtttca cagattccct ggtgtccctg 1620
ggtaacacca aagctaagtg tccttgtctt agaattttag gaaaaggtat aatgtgtatt 1680
aacccattaa caaaaggaaa ggaattcaga aatattatta accaggcatc tgtctgtagt 1740
taatatggat cacccaaaac ccaaggcttt tgcctaatga acactttggg gcacctactg 1800
tgtgcaaggc tgggggctgt caagctcagt taaaaaaaaa aagatagaag agatggatcc 1860
atgaggcaaa gtacagcccc aggctaatcc cacgatcacc cgacttcatg tccaagagtg 1920
gcttctcacc ttcattagcc agttcacaat tttcatggag tttttctacc tgcactagca 1980
aaaacttcaa ggaaaataca tattaataaa tctaagcaaa gtgaccagaa gacagagcaa 2040
tcaggagacc ctttgcatcc agcagaagag gaactgctaa gtatttacat ctccacagag 2100
aagaatttct gttgggtttt aattgaaccc caagaaccac atgattcttc aaccattatt 2160
gggaagatca ttttcttagg tctggtttta actggctttt tatttgggaa ttcatttatg 2220
tttatataaa atgccaagca taacatgaaa agtggttaca ggactattct aagggagaga 2280
cagaatggac accaaaaata ttccaatgtt cttgtgaatc ttttccttgc accaggacaa 2340
aaaaaaaaag aagtgaaaag aagaaaggag gaggggcata atcagagtca gtaaagacaa 2400
ctgctatttt tatctatcgt agctgttgca gtcaaatggg aagcaatttc caacattcaa 2460
ctatggagct ggtacttaca tggaaataga agttgcctag tgtttgttgc tggcaaagag 2520
ttatcagaga ggttaaatat ataaaaggga aaagagtcag atacaggttc ttcttcctac 2580
tttaggtttt ccactgtgtg tgcaaatgat actccctggt ggtgtgcaga tgcctcaaag 2640
ctatcctcac accacaaggg agaggagcga gatcctgctg tcctggagaa gtgcagagtt 2700
agaacagctg tggccacttg catccaatca tcaatcttga atcacaggga ctctttctta 2760
agtaaacatt atacctggcc gggcacggtg gctcacgcct gtaatcccag cactttggga 2820
tgccaaagtg ggcatatcat ctgaggtcag gagttcaaga ccagcctggc caacatggca 2880
aaactccgtc tttatgaaaa atacaaaaat tagccaggca tggtggcagg cgcctgtaat 2940
cccagctaat tgggaggctg aggctggaga atcccttgaa tctaggaggc agaggttgca 3000
gtgagctgag atcgtgccat tgcactccag cctgggtgac aagagtaaaa ctctgtctca 3060
aaaaaaaaaa attataccta cattctcttc ttatcagaga aaaaaatcta cagtgagctt 3120
ttcaaaaagt ttttacaaac tttttgccat ttaatttcag ttaggagttt tccctacttc 3180
tgacttagtt gaggggaaat gttcataaca tgtttataac atgtttatgt gtgttagttg 3240
gtgggggtgt attactttgc catgccattt gtttcctcca tgcgtaactt aatccagact 3300
ttcacacctt ataggaaaac cagtgagtct agcgattcgc atgggctcac aactgaggag 3360
gaatttgtag aagggatata caaagtggaa atagacacca aatcttactg gaaggcactt 3420
ggcatctccc cattccatga gcatgcagag gtgagtatac agaccttcga gggttgtttt 3480
ggttttggtt tttgcttttg gcattccagg aaatgcacag ttttactcag tgtaccacag 3540
aaatgtccta aggaaggtga tgaatgacca aaggttccct ttcctattat acaagaaaaa 3600
attcacaaca ctctgagaag caaatttctt tttgactttg atgaaaatcc acttagtaac 3660
atgacttgaa cttacatgaa actactcata gtctattcat tccactttat atgaatattg 3720
atgtatctgc tgttgaaata atagtttatg aggcagccct ccagacccca cgtagagtgt 3780
atgtaacaag agatgcacca ttttatttct cgaaaacccg taacattctt cattccaaaa 3840
cacatctggc ttctcggagg tctggacaag tgattcttgg caacacatac ctatagagac 3900
aataaaatca aagtaataat ggcaacacaa tagataacat ttaccaagca tacaccatgt 3960
ggcagacaca attataagtg ttttccatat ttaacctact taatcctcag gaataagcca 4020
ctgaggtcag tcctattatt atccccatct tatagatgaa gaaaatgagg caccaggaag 4080
tcaaataact tgtcaaaggt cacaagacta ggaaatacac aagtagaaat gtttacaatt 4140
aaggcccagg ctgggtttgc cctcagttct gctatgcctc gcattatgcc ccaggaaact 4200
ttttcccttg tgaaagccaa gcttaaaaaa agaaaagcca catttgtaac gtgctctgtt 4260
cccctgccta tggtgaggat cttcaaacag ttatacatgg acccagtccc cctgccttct 4320
ccttaatttc ttaagtcatt tgaaacagat ggctgtcatg gaaatagaat ccagacatgt 4380
tggtcagagt taaagatcaa ctaattccat caaaaatagc tcggcatgaa agggaactat 4440
tctctggctt agtcatggat gagactttca attgctataa agtggttcct ttattagaca 4500
atgttaccag ggaaacaaca ggggtttgtt tgacttctgg ggcccacaag tcaacaagag 4560
agccccatct accaaggagc atgtccctga ctacccctca gccagcagca agacatggac 4620
cccagtcagg gcaggagcag ggtttcggcg gcgcccagca caagacattg cccctagagt 4680
ctcagcccct accctcgagt aatagatctg cctacctgag actgttgttt gcccaagagc 4740
tgggtctcag cctgatggga accatataaa aaggttcact gacatactgc ccacatgttg 4800
ttctctttca ttagatctta gcttccttgt ctgctcttca ttcttgcagt attcattcaa 4860
caaacattaa aaaaaaaaaa aagcattcta tgtgtggaac actctgctag atgctgtgga 4920
tttagaaatg aaaatacatc ccgacccttg gaatggaagg gaaaggactg aagtaagaca 4980
gattaagcag gaccgtcagc ccagcttgaa gcccagataa atacggagaa caagagagag 5040
cgagtagtga gagatgagtc ccaatgcctc actttggtga cgggtgcgtg gtgggcttca 5100
tgcagcttct tctgataaat gcctccttca gaactggtca actctacctt ggccagtgac 5160
ccaggtggtc atagtagatt taccaaggga aaatggaaac ttttattagg agctcttagg 5220
cctcttcact tcatggattt ttttttcctt tttttttgag atggagtttt gccctgtcac 5280
ccaggctgga atgcagtggt gcaatctcag ctcactgcaa cctccgcctc ccaggttcaa 5340
gcaattctcc tgcctcagcc tcccgagtag ctgggactac aggtgtgcgc caccacacca 5400
ggctaatttt tgtatttttt gtaaagacag gttttcacca cgttggccag gctggtctga 5460
actccagacc tcaggtgatt cacctgtctc agcctcccaa agtgctggga ttacaggtgt 5520
gagccaccgt gcccggctac ttcatggatt tttgattaca gattatgcct cttacaattt 5580
ttaagaagaa tcaagtgggc tgaaggtcaa tgtcaccata agacaaaaga catttttatt 5640
agttgattct agggaattgg ccttaagggg agccctttct tcctaagaga ttcttaggtg 5700
attctcactt cctcttgccc cagtattatt tttgtttttg gtatggctca ctcagatcct 5760
tttttcctcc tatccctaag taatccgggt ttctttttcc catatttaga acaaaatgta 5820
tttatgcaga gtgtgtccaa acctcaaccc aaggcctgta tacaaaataa atcaaattaa 5880
acacatcttt actgtcttct acctctttcc tgacctcaat atatcccaac ttgcctcact 5940
ctgagaacca aggctgtccc agcacctgag tcgcagatat tctactgatt tgacagaact 6000
gtgtgactat ctggaacagc attttgatcc acaatttgcc cagttacaaa gcttaaatga 6060
gctctagtgc atgcatatat atttcaaaat tccaccatga tcttccacac tctgtattgt 6120
aaatagagcc ctgtaatgct tttacttcgt atttcattgc ttgttataca taaaaatata 6180
cttttcttct tcatgttaga aaatgcaaag aataggaggg tgggggaatc tctgggcttg 6240
gagacaggag acttgccttc ctactatggt tccatcagaa tgtagactgg gacaatacaa 6300
taattcaagt ctggtttgct catctgtaaa ttgggaagaa tgtttccagc tccagaatgc 6360
taaatctcta agtctgtggt tggcagccac tattgcagca gctcttcaat gactcaatgc 6420
agttttgcat tctccctacc ttttttttct aaaaccaata aaatagatac agcctttagg 6480
ctttctggga tttcccttag tcaagctagg gtcatcctga ctttcggcgt gaatttgcaa 6540
aacaagacct gactctgtac tcctgctcta aggactgtgc atggttccaa aggcttagct 6600
tgccagcata tttgagcttt ttccttctgt tcaaactgtt ccaaaatata aaagaataaa 6660
attaattaag ttggcactgg acttccggtg gtcagtcatg tgtgtcatct gtcacgtttt 6720
tcgggctctg gtggaaatgg atctgtctgt cttctctcat aggtggtatt cacagccaac 6780
gactccggcc cccgccgcta caccattgcc gccctgctga gcccctactc ctattccacc 6840
acggctgtcg tcaccaatcc caaggaatga gggacttctc ctccagtgga cctgaaggac 6900
gagggatggg atttcatgta accaagagta ttccattttt actaaagcag tgttttcacc 6960
tcatatgcta tgttagaagt ccaggcagag acaataaaac attcctgtga aaggcacttt 7020
tcattccact ttaacttgat tttttaaatt cccttattgt cccttccaaa aaaaagagaa 7080
tcaaaatttt acaaagaatc aaaggaattc tagaaagtat ctgggcagaa cgctaggaga 7140
gatccaaatt tccattgtct tgcaagcaaa gcacgtatta aatatgatct gcagccatta 7200
aaaagacaca ttctgtaaat gagagagcct tattttcctg taaccttcag caaatagcaa 7260
aagacacatt ccaagggccc acttctttac tgtgggcact cgagataact tcgtataatg 7320
tatgctatac gaagttatgc taggtaacta taacggtcct aaggtagcga gctagcgaga 7380
ctcagcccag gaggaccagg atcttgccaa agcagtagca tcccatttgt accaaaacag 7440
tgttcttgct ctataaaccg tgttagcagc tcagga 7476
<210> 14
<211> 7201
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 14
atggcttctc atcgtctgct cctcctctgc cttgctggac tggtatttgt gtctgaggct 60
ggccctacgg tgagtgtttc tgtgacatcc cattcctaca tttaagattc acgctaaatg 120
aagtagaagt gactccttcc agctttgcca accagctttt attactaggg caagggtacc 180
cagcatctat ttttaatata attaattcaa acttcaaaaa gaatgaagtt ccactgagct 240
tactgagctg ggacttgaac tctgagcatt ctacctcatt gctttggtgc attaggtttg 300
taatatctgg tacctctgtt tcctcagata gatgatagaa ataaagatat gatattaagg 360
aagctgttaa tactgaattt tcagaaaagt atccctccat aaaatgtatt tgggggacaa 420
actgcaggag attatattct ggccctatag ttattcaaaa cgtatttatt gattaatctt 480
taaaaggctt agtgaacaat attctagtca gatatctaat tcttaaatcc tctagaagaa 540
ttaactaata ctataaaatg ggtctggatg tagttctgac attattttat aacaactggt 600
aagagggagt gactatagca acaactaaaa tgatctcagg aaaacctgtt tggccctatg 660
tatggtacat tacatctttt cagtaattcc actcaaatgg agacttttaa caaagcaact 720
gttctcaggg gacctatttt ctcccttaaa attcattata cacatccctg gttgatagca 780
gtgtgtctgg aggcagaaac cattcttgct ttggaaacaa ttacgtctgt gttatactga 840
gtagggaagc tcattaattg tcgacactta cgttcctgat aatgggatca gtgtgtaatt 900
cttgtttcgc tccagatttc taataccaca aagaataaat cctttcactc tgatcaattt 960
tgttaacttc tcacgtgtct tctctacacc cagggcaccg gtgaatccaa gtgtcctctg 1020
atggtcaaag ttctagatgc tgtccgaggc agtcctgcca tcaatgtggc cgtgcatgtg 1080
ttcagaaagg ctgctgatga cacctgggag ccatttgcct ctgggtaagt tgccaaagaa 1140
ccctcccaca ggacttggtt ttatcttccc gtttgcccct cacttggtag agagaggctc 1200
acatcatctg ctaaagaatt tacaagtaga ttgaaaaacg taggcagagg tcaagtatgc 1260
cctctgaagg atgccctctt tttgttttgc ttagctagga agtgaccagg aacctgagca 1320
tcatttaggg gcagacagta gagaaaagaa ggaatcagaa ctcctctcct ctagctgtgg 1380
tttgcaaccc ttttgggtca cagaacactt tatgtaggtg atgaaaagta aacattctat 1440
gcccagaaaa aatgcacaga tacacacaca tacaaaatca tatatgtgat tttaggagtt 1500
tcacagattc cctggtgtcc ctgggtaaca ccaaagctaa gtgtccttgt cttagaattt 1560
taggaaaagg tataatgtgt attaacccat taacaaaagg aaaggaattc agaaatatta 1620
ttaaccaggc atctgtctgt agttaatatg gatcacccaa aacccaaggc ttttgcctaa 1680
tgaacacttt ggggcaccta ctgtgtgcaa ggctgggggc tgtcaagctc agttaaaaaa 1740
aaaaagatag aagagatgga tccatgaggc aaagtacagc cccaggctaa tcccacgatc 1800
acccgacttc atgtccaaga gtggcttctc accttcatta gccagttcac aattttcatg 1860
gagtttttct acctgcacta gcaaaaactt caaggaaaat acatattaat aaatctaagc 1920
aaagtgacca gaagacagag caatcaggag accctttgca tccagcagaa gaggaactgc 1980
taagtattta catctccaca gagaagaatt tctgttgggt tttaattgaa ccccaagaac 2040
cacatgattc ttcaaccatt attgggaaga tcattttctt aggtctggtt ttaactggct 2100
ttttatttgg gaattcattt atgtttatat aaaatgccaa gcataacatg aaaagtggtt 2160
acaggactat tctaagggag agacagaatg gacaccaaaa atattccaat gttcttgtga 2220
atcttttcct tgcaccagga caaaaaaaaa aagaagtgaa aagaagaaag gaggaggggc 2280
ataatcagag tcagtaaaga caactgctat ttttatctat cgtagctgtt gcagtcaaat 2340
gggaagcaat ttccaacatt caactatgga gctggtactt acatggaaat agaagttgcc 2400
tagtgtttgt tgctggcaaa gagttatcag agaggttaaa tatataaaag ggaaaagagt 2460
cagatacagg ttcttcttcc tactttaggt tttccactgt gtgtgcaaat gatactccct 2520
ggtggtgtgc agatgcctca aagctatcct cacaccacaa gggagaggag cgagatcctg 2580
ctgtcctgga gaagtgcaga gttagaacag ctgtggccac ttgcatccaa tcatcaatct 2640
tgaatcacag ggactctttc ttaagtaaac attatacctg gccgggcacg gtggctcacg 2700
cctgtaatcc cagcactttg ggatgccaaa gtgggcatat catctgaggt caggagttca 2760
agaccagcct ggccaacatg gcaaaactcc gtctttatga aaaatacaaa aattagccag 2820
gcatggtggc aggcgcctgt aatcccagct aattgggagg ctgaggctgg agaatccctt 2880
gaatctagga ggcagaggtt gcagtgagct gagatcgtgc cattgcactc cagcctgggt 2940
gacaagagta aaactctgtc tcaaaaaaaa aaaattatac ctacattctc ttcttatcag 3000
agaaaaaaat ctacagtgag cttttcaaaa agtttttaca aactttttgc catttaattt 3060
cagttaggag ttttccctac ttctgactta gttgagggga aatgttcata acatgtttat 3120
aacatgttta tgtgtgttag ttggtggggg tgtattactt tgccatgcca tttgtttcct 3180
ccatgcgtaa cttaatccag actttcacac cttataggaa aaccagtgag tctagcgatt 3240
cgcatgggct cacaactgag gaggaatttg tagaagggat atacaaagtg gaaatagaca 3300
ccaaatctta ctggaaggca cttggcatct ccccattcca tgagcatgca gaggtgagta 3360
tacagacctt cgagggttgt tttggttttg gtttttgctt ttggcattcc aggaaatgca 3420
cagttttact cagtgtacca cagaaatgtc ctaaggaagg tgatgaatga ccaaaggttc 3480
cctttcctat tatacaagaa aaaattcaca acactctgag aagcaaattt ctttttgact 3540
ttgatgaaaa tccacttagt aacatgactt gaacttacat gaaactactc atagtctatt 3600
cattccactt tatatgaata ttgatgtatc tgctgttgaa ataatagttt atgaggcagc 3660
cctccagacc ccacgtagag tgtatgtaac aagagatgca ccattttatt tctcgaaaac 3720
ccgtaacatt cttcattcca aaacacatct ggcttctcgg aggtctggac aagtgattct 3780
tggcaacaca tacctataga gacaataaaa tcaaagtaat aatggcaaca caatagataa 3840
catttaccaa gcatacacca tgtggcagac acaattataa gtgttttcca tatttaacct 3900
acttaatcct caggaataag ccactgaggt cagtcctatt attatcccca tcttatagat 3960
gaagaaaatg aggcaccagg aagtcaaata acttgtcaaa ggtcacaaga ctaggaaata 4020
cacaagtaga aatgtttaca attaaggccc aggctgggtt tgccctcagt tctgctatgc 4080
ctcgcattat gccccaggaa actttttccc ttgtgaaagc caagcttaaa aaaagaaaag 4140
ccacatttgt aacgtgctct gttcccctgc ctatggtgag gatcttcaaa cagttataca 4200
tggacccagt ccccctgcct tctccttaat ttcttaagtc atttgaaaca gatggctgtc 4260
atggaaatag aatccagaca tgttggtcag agttaaagat caactaattc catcaaaaat 4320
agctcggcat gaaagggaac tattctctgg cttagtcatg gatgagactt tcaattgcta 4380
taaagtggtt cctttattag acaatgttac cagggaaaca acaggggttt gtttgacttc 4440
tggggcccac aagtcaacaa gagagcccca tctaccaagg agcatgtccc tgactacccc 4500
tcagccagca gcaagacatg gaccccagtc agggcaggag cagggtttcg gcggcgccca 4560
gcacaagaca ttgcccctag agtctcagcc cctaccctcg agtaatagat ctgcctacct 4620
gagactgttg tttgcccaag agctgggtct cagcctgatg ggaaccatat aaaaaggttc 4680
actgacatac tgcccacatg ttgttctctt tcattagatc ttagcttcct tgtctgctct 4740
tcattcttgc agtattcatt caacaaacat taaaaaaaaa aaaaagcatt ctatgtgtgg 4800
aacactctgc tagatgctgt ggatttagaa atgaaaatac atcccgaccc ttggaatgga 4860
agggaaagga ctgaagtaag acagattaag caggaccgtc agcccagctt gaagcccaga 4920
taaatacgga gaacaagaga gagcgagtag tgagagatga gtcccaatgc ctcactttgg 4980
tgacgggtgc gtggtgggct tcatgcagct tcttctgata aatgcctcct tcagaactgg 5040
tcaactctac cttggccagt gacccaggtg gtcatagtag atttaccaag ggaaaatgga 5100
aacttttatt aggagctctt aggcctcttc acttcatgga tttttttttc cttttttttt 5160
gagatggagt tttgccctgt cacccaggct ggaatgcagt ggtgcaatct cagctcactg 5220
caacctccgc ctcccaggtt caagcaattc tcctgcctca gcctcccgag tagctgggac 5280
tacaggtgtg cgccaccaca ccaggctaat ttttgtattt tttgtaaaga caggttttca 5340
ccacgttggc caggctggtc tgaactccag acctcaggtg attcacctgt ctcagcctcc 5400
caaagtgctg ggattacagg tgtgagccac cgtgcccggc tacttcatgg atttttgatt 5460
acagattatg cctcttacaa tttttaagaa gaatcaagtg ggctgaaggt caatgtcacc 5520
ataagacaaa agacattttt attagttgat tctagggaat tggccttaag gggagccctt 5580
tcttcctaag agattcttag gtgattctca cttcctcttg ccccagtatt atttttgttt 5640
ttggtatggc tcactcagat ccttttttcc tcctatccct aagtaatccg ggtttctttt 5700
tcccatattt agaacaaaat gtatttatgc agagtgtgtc caaacctcaa cccaaggcct 5760
gtatacaaaa taaatcaaat taaacacatc tttactgtct tctacctctt tcctgacctc 5820
aatatatccc aacttgcctc actctgagaa ccaaggctgt cccagcacct gagtcgcaga 5880
tattctactg atttgacaga actgtgtgac tatctggaac agcattttga tccacaattt 5940
gcccagttac aaagcttaaa tgagctctag tgcatgcata tatatttcaa aattccacca 6000
tgatcttcca cactctgtat tgtaaataga gccctgtaat gcttttactt cgtatttcat 6060
tgcttgttat acataaaaat atacttttct tcttcatgtt agaaaatgca aagaatagga 6120
gggtggggga atctctgggc ttggagacag gagacttgcc ttcctactat ggttccatca 6180
gaatgtagac tgggacaata caataattca agtctggttt gctcatctgt aaattgggaa 6240
gaatgtttcc agctccagaa tgctaaatct ctaagtctgt ggttggcagc cactattgca 6300
gcagctcttc aatgactcaa tgcagttttg cattctccct accttttttt tctaaaacca 6360
ataaaataga tacagccttt aggctttctg ggatttccct tagtcaagct agggtcatcc 6420
tgactttcgg cgtgaatttg caaaacaaga cctgactctg tactcctgct ctaaggactg 6480
tgcatggttc caaaggctta gcttgccagc atatttgagc tttttccttc tgttcaaact 6540
gttccaaaat ataaaagaat aaaattaatt aagttggcac tggacttccg gtggtcagtc 6600
atgtgtgtca tctgtcacgt ttttcgggct ctggtggaaa tggatctgtc tgtcttctct 6660
cataggtggt attcacagcc aacgactccg gcccccgccg ctacaccatt gccgccctgc 6720
tgagccccta ctcctattcc accacggctg tcgtcaccaa tcccaaggaa tgagggactt 6780
ctcctccagt ggacctgaag gacgagggat gggatttcat gtaaccaaga gtattccatt 6840
tttactaaag cagtgttttc acctcatatg ctatgttaga agtccaggca gagacaataa 6900
aacattcctg tgaaaggcac ttttcattcc actttaactt gattttttaa attcccttat 6960
tgtcccttcc aaaaaaaaga gaatcaaaat tttacaaaga atcaaaggaa ttctagaaag 7020
tatctgggca gaacgctagg agagatccaa atttccattg tcttgcaagc aaagcacgta 7080
ttaaatatga tctgcagcca ttaaaaagac acattctgta aatgagagag ccttattttc 7140
ctgtaacctt cagcaaatag caaaagacac attccaaggg cccacttctt tactgtgggc 7200
a 7201
<210> 15
<211> 12208
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<220>
<221> misc_feature
<222> (1)..(97)
<223> 小鼠序列
<220>
<221> misc_feature
<222> (98)..(7298)
<223> 人序列
<220>
<221> misc_feature
<222> (7299)..(12108)
<223> 盒序列
<220>
<221> misc_feature
<222> (12109)..(12208)
<223> 小鼠序列
<400> 15
agcttggcag ggatcagcag cctgggttgg aaggaggggg tataaaagcc ccttcaccag 60
gagaagccgt cacacagatc cacaagctcc tgacaggatg gcttctcatc gtctgctcct 120
cctctgcctt gctggactgg tatttgtgtc tgaggctggc cctacggtga gtgtttctgt 180
gacatcccat tcctacattt aagattcacg ctaaatgaag tagaagtgac tccttccagc 240
tttgccaacc agcttttatt actagggcaa gggtacccag catctatttt taatataatt 300
aattcaaact tcaaaaagaa tgaagttcca ctgagcttac tgagctggga cttgaactct 360
gagcattcta cctcattgct ttggtgcatt aggtttgtaa tatctggtac ctctgtttcc 420
tcagatagat gatagaaata aagatatgat attaaggaag ctgttaatac tgaattttca 480
gaaaagtatc cctccataaa atgtatttgg gggacaaact gcaggagatt atattctggc 540
cctatagtta ttcaaaacgt atttattgat taatctttaa aaggcttagt gaacaatatt 600
ctagtcagat atctaattct taaatcctct agaagaatta actaatacta taaaatgggt 660
ctggatgtag ttctgacatt attttataac aactggtaag agggagtgac tatagcaaca 720
actaaaatga tctcaggaaa acctgtttgg ccctatgtat ggtacattac atcttttcag 780
taattccact caaatggaga cttttaacaa agcaactgtt ctcaggggac ctattttctc 840
ccttaaaatt cattatacac atccctggtt gatagcagtg tgtctggagg cagaaaccat 900
tcttgctttg gaaacaatta cgtctgtgtt atactgagta gggaagctca ttaattgtcg 960
acacttacgt tcctgataat gggatcagtg tgtaattctt gtttcgctcc agatttctaa 1020
taccacaaag aataaatcct ttcactctga tcaattttgt taacttctca cgtgtcttct 1080
ctacacccag ggcaccggtg aatccaagtg tcctctgatg gtcaaagttc tagatgctgt 1140
ccgaggcagt cctgccatca atgtggccgt gcatgtgttc agaaaggctg ctgatgacac 1200
ctgggagcca tttgcctctg ggtaagttgc caaagaaccc tcccacagga cttggtttta 1260
tcttcccgtt tgcccctcac ttggtagaga gaggctcaca tcatctgcta aagaatttac 1320
aagtagattg aaaaacgtag gcagaggtca agtatgccct ctgaaggatg ccctcttttt 1380
gttttgctta gctaggaagt gaccaggaac ctgagcatca tttaggggca gacagtagag 1440
aaaagaagga atcagaactc ctctcctcta gctgtggttt gcaacccttt tgggtcacag 1500
aacactttat gtaggtgatg aaaagtaaac attctatgcc cagaaaaaat gcacagatac 1560
acacacatac aaaatcatat atgtgatttt aggagtttca cagattccct ggtgtccctg 1620
ggtaacacca aagctaagtg tccttgtctt agaattttag gaaaaggtat aatgtgtatt 1680
aacccattaa caaaaggaaa ggaattcaga aatattatta accaggcatc tgtctgtagt 1740
taatatggat cacccaaaac ccaaggcttt tgcctaatga acactttggg gcacctactg 1800
tgtgcaaggc tgggggctgt caagctcagt taaaaaaaaa aagatagaag agatggatcc 1860
atgaggcaaa gtacagcccc aggctaatcc cacgatcacc cgacttcatg tccaagagtg 1920
gcttctcacc ttcattagcc agttcacaat tttcatggag tttttctacc tgcactagca 1980
aaaacttcaa ggaaaataca tattaataaa tctaagcaaa gtgaccagaa gacagagcaa 2040
tcaggagacc ctttgcatcc agcagaagag gaactgctaa gtatttacat ctccacagag 2100
aagaatttct gttgggtttt aattgaaccc caagaaccac atgattcttc aaccattatt 2160
gggaagatca ttttcttagg tctggtttta actggctttt tatttgggaa ttcatttatg 2220
tttatataaa atgccaagca taacatgaaa agtggttaca ggactattct aagggagaga 2280
cagaatggac accaaaaata ttccaatgtt cttgtgaatc ttttccttgc accaggacaa 2340
aaaaaaaaag aagtgaaaag aagaaaggag gaggggcata atcagagtca gtaaagacaa 2400
ctgctatttt tatctatcgt agctgttgca gtcaaatggg aagcaatttc caacattcaa 2460
ctatggagct ggtacttaca tggaaataga agttgcctag tgtttgttgc tggcaaagag 2520
ttatcagaga ggttaaatat ataaaaggga aaagagtcag atacaggttc ttcttcctac 2580
tttaggtttt ccactgtgtg tgcaaatgat actccctggt ggtgtgcaga tgcctcaaag 2640
ctatcctcac accacaaggg agaggagcga gatcctgctg tcctggagaa gtgcagagtt 2700
agaacagctg tggccacttg catccaatca tcaatcttga atcacaggga ctctttctta 2760
agtaaacatt atacctggcc gggcacggtg gctcacgcct gtaatcccag cactttggga 2820
tgccaaagtg ggcatatcat ctgaggtcag gagttcaaga ccagcctggc caacatggca 2880
aaactccgtc tttatgaaaa atacaaaaat tagccaggca tggtggcagg cgcctgtaat 2940
cccagctaat tgggaggctg aggctggaga atcccttgaa tctaggaggc agaggttgca 3000
gtgagctgag atcgtgccat tgcactccag cctgggtgac aagagtaaaa ctctgtctca 3060
aaaaaaaaaa attataccta cattctcttc ttatcagaga aaaaaatcta cagtgagctt 3120
ttcaaaaagt ttttacaaac tttttgccat ttaatttcag ttaggagttt tccctacttc 3180
tgacttagtt gaggggaaat gttcataaca tgtttataac atgtttatgt gtgttagttg 3240
gtgggggtgt attactttgc catgccattt gtttcctcca tgcgtaactt aatccagact 3300
ttcacacctt ataggaaaac cagtgagtct ggagagctgc atgggctcac aactgaggag 3360
gaatttgtag aagggatata caaagtggaa atagacacca aatcttactg gaaggcactt 3420
ggcatctccc cattccatga gcatgcagag gtgagtatac agaccttcga gggttgtttt 3480
ggttttggtt tttgcttttg gcattccagg aaatgcacag ttttactcag tgtaccacag 3540
aaatgtccta aggaaggtga tgaatgacca aaggttccct ttcctattat acaagaaaaa 3600
attcacaaca ctctgagaag caaatttctt tttgactttg atgaaaatcc acttagtaac 3660
atgacttgaa cttacatgaa actactcata gtctattcat tccactttat atgaatattg 3720
atgtatctgc tgttgaaata atagtttatg aggcagccct ccagacccca cgtagagtgt 3780
atgtaacaag agatgcacca ttttatttct cgaaaacccg taacattctt cattccaaaa 3840
cacatctggc ttctcggagg tctggacaag tgattcttgg caacacatac ctatagagac 3900
aataaaatca aagtaataat ggcaacacaa tagataacat ttaccaagca tacaccatgt 3960
ggcagacaca attataagtg ttttccatat ttaacctact taatcctcag gaataagcca 4020
ctgaggtcag tcctattatt atccccatct tatagatgaa gaaaatgagg caccaggaag 4080
tcaaataact tgtcaaaggt cacaagacta ggaaatacac aagtagaaat gtttacaatt 4140
aaggcccagg ctgggtttgc cctcagttct gctatgcctc gcattatgcc ccaggaaact 4200
ttttcccttg tgaaagccaa gcttaaaaaa agaaaagcca catttgtaac gtgctctgtt 4260
cccctgccta tggtgaggat cttcaaacag ttatacatgg acccagtccc cctgccttct 4320
ccttaatttc ttaagtcatt tgaaacagat ggctgtcatg gaaatagaat ccagacatgt 4380
tggtcagagt taaagatcaa ctaattccat caaaaatagc tcggcatgaa agggaactat 4440
tctctggctt agtcatggat gagactttca attgctataa agtggttcct ttattagaca 4500
atgttaccag ggaaacaaca ggggtttgtt tgacttctgg ggcccacaag tcaacaagag 4560
agccccatct accaaggagc atgtccctga ctacccctca gccagcagca agacatggac 4620
cccagtcagg gcaggagcag ggtttcggcg gcgcccagca caagacattg cccctagagt 4680
ctcagcccct accctcgagt aatagatctg cctacctgag actgttgttt gcccaagagc 4740
tgggtctcag cctgatggga accatataaa aaggttcact gacatactgc ccacatgttg 4800
ttctctttca ttagatctta gcttccttgt ctgctcttca ttcttgcagt attcattcaa 4860
caaacattaa aaaaaaaaaa aagcattcta tgtgtggaac actctgctag atgctgtgga 4920
tttagaaatg aaaatacatc ccgacccttg gaatggaagg gaaaggactg aagtaagaca 4980
gattaagcag gaccgtcagc ccagcttgaa gcccagataa atacggagaa caagagagag 5040
cgagtagtga gagatgagtc ccaatgcctc actttggtga cgggtgcgtg gtgggcttca 5100
tgcagcttct tctgataaat gcctccttca gaactggtca actctacctt ggccagtgac 5160
ccaggtggtc atagtagatt taccaaggga aaatggaaac ttttattagg agctcttagg 5220
cctcttcact tcatggattt ttttttcctt tttttttgag atggagtttt gccctgtcac 5280
ccaggctgga atgcagtggt gcaatctcag ctcactgcaa cctccgcctc ccaggttcaa 5340
gcaattctcc tgcctcagcc tcccgagtag ctgggactac aggtgtgcgc caccacacca 5400
ggctaatttt tgtatttttt gtaaagacag gttttcacca cgttggccag gctggtctga 5460
actccagacc tcaggtgatt cacctgtctc agcctcccaa agtgctggga ttacaggtgt 5520
gagccaccgt gcccggctac ttcatggatt tttgattaca gattatgcct cttacaattt 5580
ttaagaagaa tcaagtgggc tgaaggtcaa tgtcaccata agacaaaaga catttttatt 5640
agttgattct agggaattgg ccttaagggg agccctttct tcctaagaga ttcttaggtg 5700
attctcactt cctcttgccc cagtattatt tttgtttttg gtatggctca ctcagatcct 5760
tttttcctcc tatccctaag taatccgggt ttctttttcc catatttaga acaaaatgta 5820
tttatgcaga gtgtgtccaa acctcaaccc aaggcctgta tacaaaataa atcaaattaa 5880
acacatcttt actgtcttct acctctttcc tgacctcaat atatcccaac ttgcctcact 5940
ctgagaacca aggctgtccc agcacctgag tcgcagatat tctactgatt tgacagaact 6000
gtgtgactat ctggaacagc attttgatcc acaatttgcc cagttacaaa gcttaaatga 6060
gctctagtgc atgcatatat atttcaaaat tccaccatga tcttccacac tctgtattgt 6120
aaatagagcc ctgtaatgct tttacttcgt atttcattgc ttgttataca taaaaatata 6180
cttttcttct tcatgttaga aaatgcaaag aataggaggg tgggggaatc tctgggcttg 6240
gagacaggag acttgccttc ctactatggt tccatcagaa tgtagactgg gacaatacaa 6300
taattcaagt ctggtttgct catctgtaaa ttgggaagaa tgtttccagc tccagaatgc 6360
taaatctcta agtctgtggt tggcagccac tattgcagca gctcttcaat gactcaatgc 6420
agttttgcat tctccctacc ttttttttct aaaaccaata aaatagatac agcctttagg 6480
ctttctggga tttcccttag tcaagctagg gtcatcctga ctttcggcgt gaatttgcaa 6540
aacaagacct gactctgtac tcctgctcta aggactgtgc atggttccaa aggcttagct 6600
tgccagcata tttgagcttt ttccttctgt tcaaactgtt ccaaaatata aaagaataaa 6660
attaattaag ttggcactgg acttccggtg gtcagtcatg tgtgtcatct gtcacgtttt 6720
tcgggctctg gtggaaatgg atctgtctgt cttctctcat aggtggtatt cacagccaac 6780
gactccggcc cccgccgcta caccattgcc gccctgctga gcccctactc ctattccacc 6840
acggctgtcg tcaccaatcc caaggaatga gggacttctc ctccagtgga cctgaaggac 6900
gagggatggg atttcatgta accaagagta ttccattttt actaaagcag tgttttcacc 6960
tcatatgcta tgttagaagt ccaggcagag acaataaaac attcctgtga aaggcacttt 7020
tcattccact ttaacttgat tttttaaatt cccttattgt cccttccaaa aaaaagagaa 7080
tcaaaatttt acaaagaatc aaaggaattc tagaaagtat ctgggcagaa cgctaggaga 7140
gatccaaatt tccattgtct tgcaagcaaa gcacgtatta aatatgatct gcagccatta 7200
aaaagacaca ttctgtaaat gagagagcct tattttcctg taaccttcag caaatagcaa 7260
aagacacatt ccaagggccc acttctttac tgtgggcact cgagataact tcgtataatg 7320
tatgctatac gaagttatat gcatgccagt agcagcaccc acgtccacct tctgtctagt 7380
aatgtccaac acctccctca gtccaaacac tgctctgcat ccatgtggct cccatttata 7440
cctgaagcac ttgatggggc ctcaatgttt tactagagcc cacccccctg caactctgag 7500
accctctgga tttgtctgtc agtgcctcac tggggcgttg gataatttct taaaaggtca 7560
agttccctca gcagcattct ctgagcagtc tgaagatgtg tgcttttcac agttcaaatc 7620
catgtggctg tttcacccac ctgcctggcc ttgggttatc tatcaggacc tagcctagaa 7680
gcaggtgtgt ggcacttaac acctaagctg agtgactaac tgaacactca agtggatgcc 7740
atctttgtca cttcttgact gtgacacaag caactcctga tgccaaagcc ctgcccaccc 7800
ctctcatgcc catatttgga catggtacag gtcctcactg gccatggtct gtgaggtcct 7860
ggtcctcttt gacttcataa ttcctagggg ccactagtat ctataagagg aagagggtgc 7920
tggctcccag gccacagccc acaaaattcc acctgctcac aggttggctg gctcgaccca 7980
ggtggtgtcc cctgctctga gccagctccc ggccaagcca gcaccatggg aacccccaag 8040
aagaagagga aggtgcgtac cgatttaaat tccaatttac tgaccgtaca ccaaaatttg 8100
cctgcattac cggtcgatgc aacgagtgat gaggttcgca agaacctgat ggacatgttc 8160
agggatcgcc aggcgttttc tgagcatacc tggaaaatgc ttctgtccgt ttgccggtcg 8220
tgggcggcat ggtgcaagtt gaataaccgg aaatggtttc ccgcagaacc tgaagatgtt 8280
cgcgattatc ttctatatct tcaggcgcgc ggtctggcag taaaaactat ccagcaacat 8340
ttgggccagc taaacatgct tcatcgtcgg tccgggctgc cacgaccaag tgacagcaat 8400
gctgtttcac tggttatgcg gcggatccga aaagaaaacg ttgatgccgg tgaacgtgca 8460
aaacaggtaa atataaaatt tttaagtgta taatgatgtt aaactactga ttctaattgt 8520
ttgtgtattt taggctctag cgttcgaacg cactgatttc gaccaggttc gttcactcat 8580
ggaaaatagc gatcgctgcc aggatatacg taatctggca tttctgggga ttgcttataa 8640
caccctgtta cgtatagccg aaattgccag gatcagggtt aaagatatct cacgtactga 8700
cggtgggaga atgttaatcc atattggcag aacgaaaacg ctggttagca ccgcaggtgt 8760
agagaaggca cttagcctgg gggtaactaa actggtcgag cgatggattt ccgtctctgg 8820
tgtagctgat gatccgaata actacctgtt ttgccgggtc agaaaaaatg gtgttgccgc 8880
gccatctgcc accagccagc tatcaactcg cgccctggaa gggatttttg aagcaactca 8940
tcgattgatt tacggcgcta aggatgactc tggtcagaga tacctggcct ggtctggaca 9000
cagtgcccgt gtcggagccg cgcgagatat ggcccgcgct ggagtttcaa taccggagat 9060
catgcaagct ggtggctgga ccaatgtaaa tattgtcatg aactatatcc gtaacctgga 9120
tagtgaaaca ggggcaatgg tgcgcctgct ggaagatggc gattaggcgg ccggccgcta 9180
atcagccata ccacatttgt agaggtttta cttgctttaa aaaacctccc acacctcccc 9240
ctgaacctga aacataaaat gaatgcaatt gttgttgtta acttgtttat tgcagcttat 9300
aatggttaca aataaagcaa tagcatcaca aatttcacaa ataaagcatt tttttcactg 9360
cattctagtt gtggtttgtc caaactcatc aatgtatctt atcatgtctg gatcccccgg 9420
ctagagttta aacactagaa ctagtggatc ccccgggatc atggcctccg cgccgggttt 9480
tggcgcctcc cgcgggcgcc cccctcctca cggcgagcgc tgccacgtca gacgaagggc 9540
gcagcgagcg tcctgatcct tccgcccgga cgctcaggac agcggcccgc tgctcataag 9600
actcggcctt agaaccccag tatcagcaga aggacatttt aggacgggac ttgggtgact 9660
ctagggcact ggttttcttt ccagagagcg gaacaggcga ggaaaagtag tcccttctcg 9720
gcgattctgc ggagggatct ccgtggggcg gtgaacgccg atgattatat aaggacgcgc 9780
cgggtgtggc acagctagtt ccgtcgcagc cgggatttgg gtcgcggttc ttgtttgtgg 9840
atcgctgtga tcgtcacttg gtgagtagcg ggctgctggg ctggccgggg ctttcgtggc 9900
cgccgggccg ctcggtggga cggaagcgtg tggagagacc gccaagggct gtagtctggg 9960
tccgcgagca aggttgccct gaactggggg ttggggggag cgcagcaaaa tggcggctgt 10020
tcccgagtct tgaatggaag acgcttgtga ggcgggctgt gaggtcgttg aaacaaggtg 10080
gggggcatgg tgggcggcaa gaacccaagg tcttgaggcc ttcgctaatg cgggaaagct 10140
cttattcggg tgagatgggc tggggcacca tctggggacc ctgacgtgaa gtttgtcact 10200
gactggagaa ctcggtttgt cgtctgttgc gggggcggca gttatggcgg tgccgttggg 10260
cagtgcaccc gtacctttgg gagcgcgcgc cctcgtcgtg tcgtgacgtc acccgttctg 10320
ttggcttata atgcagggtg gggccacctg ccggtaggtg tgcggtaggc ttttctccgt 10380
cgcaggacgc agggttcggg cctagggtag gctctcctga atcgacaggc gccggacctc 10440
tggtgagggg agggataagt gaggcgtcag tttctttggt cggttttatg tacctatctt 10500
cttaagtagc tgaagctccg gttttgaact atgcgctcgg ggttggcgag tgtgttttgt 10560
gaagtttttt aggcaccttt tgaaatgtaa tcatttgggt caatatgtaa ttttcagtgt 10620
tagactagta aattgtccgc taaattctgg ccgtttttgg cttttttgtt agacgtgttg 10680
acaattaatc atcggcatag tatatcggca tagtataata cgacaaggtg aggaactaaa 10740
ccatgggatc ggccattgaa caagatggat tgcacgcagg ttctccggcc gcttgggtgg 10800
agaggctatt cggctatgac tgggcacaac agacaatcgg ctgctctgat gccgccgtgt 10860
tccggctgtc agcgcagggg cgcccggttc tttttgtcaa gaccgacctg tccggtgccc 10920
tgaatgaact gcaggacgag gcagcgcggc tatcgtggct ggccacgacg ggcgttcctt 10980
gcgcagctgt gctcgacgtt gtcactgaag cgggaaggga ctggctgcta ttgggcgaag 11040
tgccggggca ggatctcctg tcatctcacc ttgctcctgc cgagaaagta tccatcatgg 11100
ctgatgcaat gcggcggctg catacgcttg atccggctac ctgcccattc gaccaccaag 11160
cgaaacatcg catcgagcga gcacgtactc ggatggaagc cggtcttgtc gatcaggatg 11220
atctggacga agagcatcag gggctcgcgc cagccgaact gttcgccagg ctcaaggcgc 11280
gcatgcccga cggcgatgat ctcgtcgtga cccatggcga tgcctgcttg ccgaatatca 11340
tggtggaaaa tggccgcttt tctggattca tcgactgtgg ccggctgggt gtggcggacc 11400
gctatcagga catagcgttg gctacccgtg atattgctga agagcttggc ggcgaatggg 11460
ctgaccgctt cctcgtgctt tacggtatcg ccgctcccga ttcgcagcgc atcgccttct 11520
atcgccttct tgacgagttc ttctgagggg atccgctgta agtctgcaga aattgatgat 11580
ctattaaaca ataaagatgt ccactaaaat ggaagttttt cctgtcatac tttgttaaga 11640
agggtgagaa cagagtacct acattttgaa tggaaggatt ggagctacgg gggtgggggt 11700
ggggtgggat tagataaatg cctgctcttt actgaaggct ctttactatt gctttatgat 11760
aatgtttcat agttggatat cataatttaa acaagcaaaa ccaaattaag ggccagctca 11820
ttcctcccac tcatgatcta tagatctata gatctctcgt gggatcattg tttttctctt 11880
gattcccact ttgtggttct aagtactgtg gtttccaaat gtgtcagttt catagcctga 11940
agaacgagat cagcagcctc tgttccacat acacttcatt ctcagtattg ttttgccaag 12000
ttctaattcc atcagacctc gacctgcagc ccctagataa cttcgtataa tgtatgctat 12060
acgaagttat gctaggtaac tataacggtc ctaaggtagc gagctagcga gactcagccc 12120
aggaggacca ggatcttgcc aaagcagtag catcccattt gtaccaaaac agtgttcttg 12180
ctctataaac cgtgttagca gctcagga 12208
<210> 16
<211> 7476
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<220>
<221> misc_feature
<222> (1)..(97)
<223> 小鼠序列
<220>
<221> misc_feature
<222> (98)..(7298)
<223> 人序列
<220>
<221> misc_feature
<222> (7299)..(7376)
<223> 盒LoxP瘢痕
<220>
<221> misc_feature
<222> (7377)..(7476)
<223> 小鼠序列
<400> 16
agcttggcag ggatcagcag cctgggttgg aaggaggggg tataaaagcc ccttcaccag 60
gagaagccgt cacacagatc cacaagctcc tgacaggatg gcttctcatc gtctgctcct 120
cctctgcctt gctggactgg tatttgtgtc tgaggctggc cctacggtga gtgtttctgt 180
gacatcccat tcctacattt aagattcacg ctaaatgaag tagaagtgac tccttccagc 240
tttgccaacc agcttttatt actagggcaa gggtacccag catctatttt taatataatt 300
aattcaaact tcaaaaagaa tgaagttcca ctgagcttac tgagctggga cttgaactct 360
gagcattcta cctcattgct ttggtgcatt aggtttgtaa tatctggtac ctctgtttcc 420
tcagatagat gatagaaata aagatatgat attaaggaag ctgttaatac tgaattttca 480
gaaaagtatc cctccataaa atgtatttgg gggacaaact gcaggagatt atattctggc 540
cctatagtta ttcaaaacgt atttattgat taatctttaa aaggcttagt gaacaatatt 600
ctagtcagat atctaattct taaatcctct agaagaatta actaatacta taaaatgggt 660
ctggatgtag ttctgacatt attttataac aactggtaag agggagtgac tatagcaaca 720
actaaaatga tctcaggaaa acctgtttgg ccctatgtat ggtacattac atcttttcag 780
taattccact caaatggaga cttttaacaa agcaactgtt ctcaggggac ctattttctc 840
ccttaaaatt cattatacac atccctggtt gatagcagtg tgtctggagg cagaaaccat 900
tcttgctttg gaaacaatta cgtctgtgtt atactgagta gggaagctca ttaattgtcg 960
acacttacgt tcctgataat gggatcagtg tgtaattctt gtttcgctcc agatttctaa 1020
taccacaaag aataaatcct ttcactctga tcaattttgt taacttctca cgtgtcttct 1080
ctacacccag ggcaccggtg aatccaagtg tcctctgatg gtcaaagttc tagatgctgt 1140
ccgaggcagt cctgccatca atgtggccgt gcatgtgttc agaaaggctg ctgatgacac 1200
ctgggagcca tttgcctctg ggtaagttgc caaagaaccc tcccacagga cttggtttta 1260
tcttcccgtt tgcccctcac ttggtagaga gaggctcaca tcatctgcta aagaatttac 1320
aagtagattg aaaaacgtag gcagaggtca agtatgccct ctgaaggatg ccctcttttt 1380
gttttgctta gctaggaagt gaccaggaac ctgagcatca tttaggggca gacagtagag 1440
aaaagaagga atcagaactc ctctcctcta gctgtggttt gcaacccttt tgggtcacag 1500
aacactttat gtaggtgatg aaaagtaaac attctatgcc cagaaaaaat gcacagatac 1560
acacacatac aaaatcatat atgtgatttt aggagtttca cagattccct ggtgtccctg 1620
ggtaacacca aagctaagtg tccttgtctt agaattttag gaaaaggtat aatgtgtatt 1680
aacccattaa caaaaggaaa ggaattcaga aatattatta accaggcatc tgtctgtagt 1740
taatatggat cacccaaaac ccaaggcttt tgcctaatga acactttggg gcacctactg 1800
tgtgcaaggc tgggggctgt caagctcagt taaaaaaaaa aagatagaag agatggatcc 1860
atgaggcaaa gtacagcccc aggctaatcc cacgatcacc cgacttcatg tccaagagtg 1920
gcttctcacc ttcattagcc agttcacaat tttcatggag tttttctacc tgcactagca 1980
aaaacttcaa ggaaaataca tattaataaa tctaagcaaa gtgaccagaa gacagagcaa 2040
tcaggagacc ctttgcatcc agcagaagag gaactgctaa gtatttacat ctccacagag 2100
aagaatttct gttgggtttt aattgaaccc caagaaccac atgattcttc aaccattatt 2160
gggaagatca ttttcttagg tctggtttta actggctttt tatttgggaa ttcatttatg 2220
tttatataaa atgccaagca taacatgaaa agtggttaca ggactattct aagggagaga 2280
cagaatggac accaaaaata ttccaatgtt cttgtgaatc ttttccttgc accaggacaa 2340
aaaaaaaaag aagtgaaaag aagaaaggag gaggggcata atcagagtca gtaaagacaa 2400
ctgctatttt tatctatcgt agctgttgca gtcaaatggg aagcaatttc caacattcaa 2460
ctatggagct ggtacttaca tggaaataga agttgcctag tgtttgttgc tggcaaagag 2520
ttatcagaga ggttaaatat ataaaaggga aaagagtcag atacaggttc ttcttcctac 2580
tttaggtttt ccactgtgtg tgcaaatgat actccctggt ggtgtgcaga tgcctcaaag 2640
ctatcctcac accacaaggg agaggagcga gatcctgctg tcctggagaa gtgcagagtt 2700
agaacagctg tggccacttg catccaatca tcaatcttga atcacaggga ctctttctta 2760
agtaaacatt atacctggcc gggcacggtg gctcacgcct gtaatcccag cactttggga 2820
tgccaaagtg ggcatatcat ctgaggtcag gagttcaaga ccagcctggc caacatggca 2880
aaactccgtc tttatgaaaa atacaaaaat tagccaggca tggtggcagg cgcctgtaat 2940
cccagctaat tgggaggctg aggctggaga atcccttgaa tctaggaggc agaggttgca 3000
gtgagctgag atcgtgccat tgcactccag cctgggtgac aagagtaaaa ctctgtctca 3060
aaaaaaaaaa attataccta cattctcttc ttatcagaga aaaaaatcta cagtgagctt 3120
ttcaaaaagt ttttacaaac tttttgccat ttaatttcag ttaggagttt tccctacttc 3180
tgacttagtt gaggggaaat gttcataaca tgtttataac atgtttatgt gtgttagttg 3240
gtgggggtgt attactttgc catgccattt gtttcctcca tgcgtaactt aatccagact 3300
ttcacacctt ataggaaaac cagtgagtct ggagagctgc atgggctcac aactgaggag 3360
gaatttgtag aagggatata caaagtggaa atagacacca aatcttactg gaaggcactt 3420
ggcatctccc cattccatga gcatgcagag gtgagtatac agaccttcga gggttgtttt 3480
ggttttggtt tttgcttttg gcattccagg aaatgcacag ttttactcag tgtaccacag 3540
aaatgtccta aggaaggtga tgaatgacca aaggttccct ttcctattat acaagaaaaa 3600
attcacaaca ctctgagaag caaatttctt tttgactttg atgaaaatcc acttagtaac 3660
atgacttgaa cttacatgaa actactcata gtctattcat tccactttat atgaatattg 3720
atgtatctgc tgttgaaata atagtttatg aggcagccct ccagacccca cgtagagtgt 3780
atgtaacaag agatgcacca ttttatttct cgaaaacccg taacattctt cattccaaaa 3840
cacatctggc ttctcggagg tctggacaag tgattcttgg caacacatac ctatagagac 3900
aataaaatca aagtaataat ggcaacacaa tagataacat ttaccaagca tacaccatgt 3960
ggcagacaca attataagtg ttttccatat ttaacctact taatcctcag gaataagcca 4020
ctgaggtcag tcctattatt atccccatct tatagatgaa gaaaatgagg caccaggaag 4080
tcaaataact tgtcaaaggt cacaagacta ggaaatacac aagtagaaat gtttacaatt 4140
aaggcccagg ctgggtttgc cctcagttct gctatgcctc gcattatgcc ccaggaaact 4200
ttttcccttg tgaaagccaa gcttaaaaaa agaaaagcca catttgtaac gtgctctgtt 4260
cccctgccta tggtgaggat cttcaaacag ttatacatgg acccagtccc cctgccttct 4320
ccttaatttc ttaagtcatt tgaaacagat ggctgtcatg gaaatagaat ccagacatgt 4380
tggtcagagt taaagatcaa ctaattccat caaaaatagc tcggcatgaa agggaactat 4440
tctctggctt agtcatggat gagactttca attgctataa agtggttcct ttattagaca 4500
atgttaccag ggaaacaaca ggggtttgtt tgacttctgg ggcccacaag tcaacaagag 4560
agccccatct accaaggagc atgtccctga ctacccctca gccagcagca agacatggac 4620
cccagtcagg gcaggagcag ggtttcggcg gcgcccagca caagacattg cccctagagt 4680
ctcagcccct accctcgagt aatagatctg cctacctgag actgttgttt gcccaagagc 4740
tgggtctcag cctgatggga accatataaa aaggttcact gacatactgc ccacatgttg 4800
ttctctttca ttagatctta gcttccttgt ctgctcttca ttcttgcagt attcattcaa 4860
caaacattaa aaaaaaaaaa aagcattcta tgtgtggaac actctgctag atgctgtgga 4920
tttagaaatg aaaatacatc ccgacccttg gaatggaagg gaaaggactg aagtaagaca 4980
gattaagcag gaccgtcagc ccagcttgaa gcccagataa atacggagaa caagagagag 5040
cgagtagtga gagatgagtc ccaatgcctc actttggtga cgggtgcgtg gtgggcttca 5100
tgcagcttct tctgataaat gcctccttca gaactggtca actctacctt ggccagtgac 5160
ccaggtggtc atagtagatt taccaaggga aaatggaaac ttttattagg agctcttagg 5220
cctcttcact tcatggattt ttttttcctt tttttttgag atggagtttt gccctgtcac 5280
ccaggctgga atgcagtggt gcaatctcag ctcactgcaa cctccgcctc ccaggttcaa 5340
gcaattctcc tgcctcagcc tcccgagtag ctgggactac aggtgtgcgc caccacacca 5400
ggctaatttt tgtatttttt gtaaagacag gttttcacca cgttggccag gctggtctga 5460
actccagacc tcaggtgatt cacctgtctc agcctcccaa agtgctggga ttacaggtgt 5520
gagccaccgt gcccggctac ttcatggatt tttgattaca gattatgcct cttacaattt 5580
ttaagaagaa tcaagtgggc tgaaggtcaa tgtcaccata agacaaaaga catttttatt 5640
agttgattct agggaattgg ccttaagggg agccctttct tcctaagaga ttcttaggtg 5700
attctcactt cctcttgccc cagtattatt tttgtttttg gtatggctca ctcagatcct 5760
tttttcctcc tatccctaag taatccgggt ttctttttcc catatttaga acaaaatgta 5820
tttatgcaga gtgtgtccaa acctcaaccc aaggcctgta tacaaaataa atcaaattaa 5880
acacatcttt actgtcttct acctctttcc tgacctcaat atatcccaac ttgcctcact 5940
ctgagaacca aggctgtccc agcacctgag tcgcagatat tctactgatt tgacagaact 6000
gtgtgactat ctggaacagc attttgatcc acaatttgcc cagttacaaa gcttaaatga 6060
gctctagtgc atgcatatat atttcaaaat tccaccatga tcttccacac tctgtattgt 6120
aaatagagcc ctgtaatgct tttacttcgt atttcattgc ttgttataca taaaaatata 6180
cttttcttct tcatgttaga aaatgcaaag aataggaggg tgggggaatc tctgggcttg 6240
gagacaggag acttgccttc ctactatggt tccatcagaa tgtagactgg gacaatacaa 6300
taattcaagt ctggtttgct catctgtaaa ttgggaagaa tgtttccagc tccagaatgc 6360
taaatctcta agtctgtggt tggcagccac tattgcagca gctcttcaat gactcaatgc 6420
agttttgcat tctccctacc ttttttttct aaaaccaata aaatagatac agcctttagg 6480
ctttctggga tttcccttag tcaagctagg gtcatcctga ctttcggcgt gaatttgcaa 6540
aacaagacct gactctgtac tcctgctcta aggactgtgc atggttccaa aggcttagct 6600
tgccagcata tttgagcttt ttccttctgt tcaaactgtt ccaaaatata aaagaataaa 6660
attaattaag ttggcactgg acttccggtg gtcagtcatg tgtgtcatct gtcacgtttt 6720
tcgggctctg gtggaaatgg atctgtctgt cttctctcat aggtggtatt cacagccaac 6780
gactccggcc cccgccgcta caccattgcc gccctgctga gcccctactc ctattccacc 6840
acggctgtcg tcaccaatcc caaggaatga gggacttctc ctccagtgga cctgaaggac 6900
gagggatggg atttcatgta accaagagta ttccattttt actaaagcag tgttttcacc 6960
tcatatgcta tgttagaagt ccaggcagag acaataaaac attcctgtga aaggcacttt 7020
tcattccact ttaacttgat tttttaaatt cccttattgt cccttccaaa aaaaagagaa 7080
tcaaaatttt acaaagaatc aaaggaattc tagaaagtat ctgggcagaa cgctaggaga 7140
gatccaaatt tccattgtct tgcaagcaaa gcacgtatta aatatgatct gcagccatta 7200
aaaagacaca ttctgtaaat gagagagcct tattttcctg taaccttcag caaatagcaa 7260
aagacacatt ccaagggccc acttctttac tgtgggcact cgagataact tcgtataatg 7320
tatgctatac gaagttatgc taggtaacta taacggtcct aaggtagcga gctagcgaga 7380
ctcagcccag gaggaccagg atcttgccaa agcagtagca tcccatttgt accaaaacag 7440
tgttcttgct ctataaaccg tgttagcagc tcagga 7476
<210> 17
<211> 7201
<212> DNA
<213> 智人(Homo sapiens)
<400> 17
atggcttctc atcgtctgct cctcctctgc cttgctggac tggtatttgt gtctgaggct 60
ggccctacgg tgagtgtttc tgtgacatcc cattcctaca tttaagattc acgctaaatg 120
aagtagaagt gactccttcc agctttgcca accagctttt attactaggg caagggtacc 180
cagcatctat ttttaatata attaattcaa acttcaaaaa gaatgaagtt ccactgagct 240
tactgagctg ggacttgaac tctgagcatt ctacctcatt gctttggtgc attaggtttg 300
taatatctgg tacctctgtt tcctcagata gatgatagaa ataaagatat gatattaagg 360
aagctgttaa tactgaattt tcagaaaagt atccctccat aaaatgtatt tgggggacaa 420
actgcaggag attatattct ggccctatag ttattcaaaa cgtatttatt gattaatctt 480
taaaaggctt agtgaacaat attctagtca gatatctaat tcttaaatcc tctagaagaa 540
ttaactaata ctataaaatg ggtctggatg tagttctgac attattttat aacaactggt 600
aagagggagt gactatagca acaactaaaa tgatctcagg aaaacctgtt tggccctatg 660
tatggtacat tacatctttt cagtaattcc actcaaatgg agacttttaa caaagcaact 720
gttctcaggg gacctatttt ctcccttaaa attcattata cacatccctg gttgatagca 780
gtgtgtctgg aggcagaaac cattcttgct ttggaaacaa ttacgtctgt gttatactga 840
gtagggaagc tcattaattg tcgacactta cgttcctgat aatgggatca gtgtgtaatt 900
cttgtttcgc tccagatttc taataccaca aagaataaat cctttcactc tgatcaattt 960
tgttaacttc tcacgtgtct tctctacacc cagggcaccg gtgaatccaa gtgtcctctg 1020
atggtcaaag ttctagatgc tgtccgaggc agtcctgcca tcaatgtggc cgtgcatgtg 1080
ttcagaaagg ctgctgatga cacctgggag ccatttgcct ctgggtaagt tgccaaagaa 1140
ccctcccaca ggacttggtt ttatcttccc gtttgcccct cacttggtag agagaggctc 1200
acatcatctg ctaaagaatt tacaagtaga ttgaaaaacg taggcagagg tcaagtatgc 1260
cctctgaagg atgccctctt tttgttttgc ttagctagga agtgaccagg aacctgagca 1320
tcatttaggg gcagacagta gagaaaagaa ggaatcagaa ctcctctcct ctagctgtgg 1380
tttgcaaccc ttttgggtca cagaacactt tatgtaggtg atgaaaagta aacattctat 1440
gcccagaaaa aatgcacaga tacacacaca tacaaaatca tatatgtgat tttaggagtt 1500
tcacagattc cctggtgtcc ctgggtaaca ccaaagctaa gtgtccttgt cttagaattt 1560
taggaaaagg tataatgtgt attaacccat taacaaaagg aaaggaattc agaaatatta 1620
ttaaccaggc atctgtctgt agttaatatg gatcacccaa aacccaaggc ttttgcctaa 1680
tgaacacttt ggggcaccta ctgtgtgcaa ggctgggggc tgtcaagctc agttaaaaaa 1740
aaaaagatag aagagatgga tccatgaggc aaagtacagc cccaggctaa tcccacgatc 1800
acccgacttc atgtccaaga gtggcttctc accttcatta gccagttcac aattttcatg 1860
gagtttttct acctgcacta gcaaaaactt caaggaaaat acatattaat aaatctaagc 1920
aaagtgacca gaagacagag caatcaggag accctttgca tccagcagaa gaggaactgc 1980
taagtattta catctccaca gagaagaatt tctgttgggt tttaattgaa ccccaagaac 2040
cacatgattc ttcaaccatt attgggaaga tcattttctt aggtctggtt ttaactggct 2100
ttttatttgg gaattcattt atgtttatat aaaatgccaa gcataacatg aaaagtggtt 2160
acaggactat tctaagggag agacagaatg gacaccaaaa atattccaat gttcttgtga 2220
atcttttcct tgcaccagga caaaaaaaaa aagaagtgaa aagaagaaag gaggaggggc 2280
ataatcagag tcagtaaaga caactgctat ttttatctat cgtagctgtt gcagtcaaat 2340
gggaagcaat ttccaacatt caactatgga gctggtactt acatggaaat agaagttgcc 2400
tagtgtttgt tgctggcaaa gagttatcag agaggttaaa tatataaaag ggaaaagagt 2460
cagatacagg ttcttcttcc tactttaggt tttccactgt gtgtgcaaat gatactccct 2520
ggtggtgtgc agatgcctca aagctatcct cacaccacaa gggagaggag cgagatcctg 2580
ctgtcctgga gaagtgcaga gttagaacag ctgtggccac ttgcatccaa tcatcaatct 2640
tgaatcacag ggactctttc ttaagtaaac attatacctg gccgggcacg gtggctcacg 2700
cctgtaatcc cagcactttg ggatgccaaa gtgggcatat catctgaggt caggagttca 2760
agaccagcct ggccaacatg gcaaaactcc gtctttatga aaaatacaaa aattagccag 2820
gcatggtggc aggcgcctgt aatcccagct aattgggagg ctgaggctgg agaatccctt 2880
gaatctagga ggcagaggtt gcagtgagct gagatcgtgc cattgcactc cagcctgggt 2940
gacaagagta aaactctgtc tcaaaaaaaa aaaattatac ctacattctc ttcttatcag 3000
agaaaaaaat ctacagtgag cttttcaaaa agtttttaca aactttttgc catttaattt 3060
cagttaggag ttttccctac ttctgactta gttgagggga aatgttcata acatgtttat 3120
aacatgttta tgtgtgttag ttggtggggg tgtattactt tgccatgcca tttgtttcct 3180
ccatgcgtaa cttaatccag actttcacac cttataggaa aaccagtgag tctggagagc 3240
tgcatgggct cacaactgag gaggaatttg tagaagggat atacaaagtg gaaatagaca 3300
ccaaatctta ctggaaggca cttggcatct ccccattcca tgagcatgca gaggtgagta 3360
tacagacctt cgagggttgt tttggttttg gtttttgctt ttggcattcc aggaaatgca 3420
cagttttact cagtgtacca cagaaatgtc ctaaggaagg tgatgaatga ccaaaggttc 3480
cctttcctat tatacaagaa aaaattcaca acactctgag aagcaaattt ctttttgact 3540
ttgatgaaaa tccacttagt aacatgactt gaacttacat gaaactactc atagtctatt 3600
cattccactt tatatgaata ttgatgtatc tgctgttgaa ataatagttt atgaggcagc 3660
cctccagacc ccacgtagag tgtatgtaac aagagatgca ccattttatt tctcgaaaac 3720
ccgtaacatt cttcattcca aaacacatct ggcttctcgg aggtctggac aagtgattct 3780
tggcaacaca tacctataga gacaataaaa tcaaagtaat aatggcaaca caatagataa 3840
catttaccaa gcatacacca tgtggcagac acaattataa gtgttttcca tatttaacct 3900
acttaatcct caggaataag ccactgaggt cagtcctatt attatcccca tcttatagat 3960
gaagaaaatg aggcaccagg aagtcaaata acttgtcaaa ggtcacaaga ctaggaaata 4020
cacaagtaga aatgtttaca attaaggccc aggctgggtt tgccctcagt tctgctatgc 4080
ctcgcattat gccccaggaa actttttccc ttgtgaaagc caagcttaaa aaaagaaaag 4140
ccacatttgt aacgtgctct gttcccctgc ctatggtgag gatcttcaaa cagttataca 4200
tggacccagt ccccctgcct tctccttaat ttcttaagtc atttgaaaca gatggctgtc 4260
atggaaatag aatccagaca tgttggtcag agttaaagat caactaattc catcaaaaat 4320
agctcggcat gaaagggaac tattctctgg cttagtcatg gatgagactt tcaattgcta 4380
taaagtggtt cctttattag acaatgttac cagggaaaca acaggggttt gtttgacttc 4440
tggggcccac aagtcaacaa gagagcccca tctaccaagg agcatgtccc tgactacccc 4500
tcagccagca gcaagacatg gaccccagtc agggcaggag cagggtttcg gcggcgccca 4560
gcacaagaca ttgcccctag agtctcagcc cctaccctcg agtaatagat ctgcctacct 4620
gagactgttg tttgcccaag agctgggtct cagcctgatg ggaaccatat aaaaaggttc 4680
actgacatac tgcccacatg ttgttctctt tcattagatc ttagcttcct tgtctgctct 4740
tcattcttgc agtattcatt caacaaacat taaaaaaaaa aaaaagcatt ctatgtgtgg 4800
aacactctgc tagatgctgt ggatttagaa atgaaaatac atcccgaccc ttggaatgga 4860
agggaaagga ctgaagtaag acagattaag caggaccgtc agcccagctt gaagcccaga 4920
taaatacgga gaacaagaga gagcgagtag tgagagatga gtcccaatgc ctcactttgg 4980
tgacgggtgc gtggtgggct tcatgcagct tcttctgata aatgcctcct tcagaactgg 5040
tcaactctac cttggccagt gacccaggtg gtcatagtag atttaccaag ggaaaatgga 5100
aacttttatt aggagctctt aggcctcttc acttcatgga tttttttttc cttttttttt 5160
gagatggagt tttgccctgt cacccaggct ggaatgcagt ggtgcaatct cagctcactg 5220
caacctccgc ctcccaggtt caagcaattc tcctgcctca gcctcccgag tagctgggac 5280
tacaggtgtg cgccaccaca ccaggctaat ttttgtattt tttgtaaaga caggttttca 5340
ccacgttggc caggctggtc tgaactccag acctcaggtg attcacctgt ctcagcctcc 5400
caaagtgctg ggattacagg tgtgagccac cgtgcccggc tacttcatgg atttttgatt 5460
acagattatg cctcttacaa tttttaagaa gaatcaagtg ggctgaaggt caatgtcacc 5520
ataagacaaa agacattttt attagttgat tctagggaat tggccttaag gggagccctt 5580
tcttcctaag agattcttag gtgattctca cttcctcttg ccccagtatt atttttgttt 5640
ttggtatggc tcactcagat ccttttttcc tcctatccct aagtaatccg ggtttctttt 5700
tcccatattt agaacaaaat gtatttatgc agagtgtgtc caaacctcaa cccaaggcct 5760
gtatacaaaa taaatcaaat taaacacatc tttactgtct tctacctctt tcctgacctc 5820
aatatatccc aacttgcctc actctgagaa ccaaggctgt cccagcacct gagtcgcaga 5880
tattctactg atttgacaga actgtgtgac tatctggaac agcattttga tccacaattt 5940
gcccagttac aaagcttaaa tgagctctag tgcatgcata tatatttcaa aattccacca 6000
tgatcttcca cactctgtat tgtaaataga gccctgtaat gcttttactt cgtatttcat 6060
tgcttgttat acataaaaat atacttttct tcttcatgtt agaaaatgca aagaatagga 6120
gggtggggga atctctgggc ttggagacag gagacttgcc ttcctactat ggttccatca 6180
gaatgtagac tgggacaata caataattca agtctggttt gctcatctgt aaattgggaa 6240
gaatgtttcc agctccagaa tgctaaatct ctaagtctgt ggttggcagc cactattgca 6300
gcagctcttc aatgactcaa tgcagttttg cattctccct accttttttt tctaaaacca 6360
ataaaataga tacagccttt aggctttctg ggatttccct tagtcaagct agggtcatcc 6420
tgactttcgg cgtgaatttg caaaacaaga cctgactctg tactcctgct ctaaggactg 6480
tgcatggttc caaaggctta gcttgccagc atatttgagc tttttccttc tgttcaaact 6540
gttccaaaat ataaaagaat aaaattaatt aagttggcac tggacttccg gtggtcagtc 6600
atgtgtgtca tctgtcacgt ttttcgggct ctggtggaaa tggatctgtc tgtcttctct 6660
cataggtggt attcacagcc aacgactccg gcccccgccg ctacaccatt gccgccctgc 6720
tgagccccta ctcctattcc accacggctg tcgtcaccaa tcccaaggaa tgagggactt 6780
ctcctccagt ggacctgaag gacgagggat gggatttcat gtaaccaaga gtattccatt 6840
tttactaaag cagtgttttc acctcatatg ctatgttaga agtccaggca gagacaataa 6900
aacattcctg tgaaaggcac ttttcattcc actttaactt gattttttaa attcccttat 6960
tgtcccttcc aaaaaaaaga gaatcaaaat tttacaaaga atcaaaggaa ttctagaaag 7020
tatctgggca gaacgctagg agagatccaa atttccattg tcttgcaagc aaagcacgta 7080
ttaaatatga tctgcagcca ttaaaaagac acattctgta aatgagagag ccttattttc 7140
ctgtaacctt cagcaaatag caaaagacac attccaaggg cccacttctt tactgtgggc 7200
a 7201
<210> 18
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 18
cacagacaat cagacgtacc agta 24
<210> 19
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 19
ccagctttgc cagtttacga 20
<210> 20
<211> 18
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 20
ttggacggtt gccctctt 18
<210> 21
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 21
gatggcttcc cttcgactct tc 22
<210> 22
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 22
cactgacatt tctcttgtct cctct 25
<210> 23
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 23
gggctcacca cagatgagaa g 21
<210> 24
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 24
cactgttcgc cacaggtctt 20
<210> 25
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 25
gctcagccca tactcctaca 20
<210> 26
<211> 18
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 26
gcccaggagg accaggat 18
<210> 27
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 27
ggcaacttgc ttgaggaaga 20
<210> 28
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 28
gcagcaaccc agcttcactt 20
<210> 29
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 29
actgagctgg gacttgaac 19
<210> 30
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 30
tgcctcactc tgagaacca 19
<210> 31
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 31
cgcaacctcc ccttctacg 19
<210> 32
<211> 18
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 32
ggccgtgcat gtgttcag 18
<210> 33
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 33
ggttcccatt tgctcttatt cgt 23
<210> 34
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 34
cccacactgc agaaggaaac ttg 23
<210> 35
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 35
ggttcccatt tgctcttatt cgt 23
<210> 36
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 36
ccagcttagc atcctgtgaa ca 22
<210> 37
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 37
ggcaacttgc ttgaggaaga 20
<210> 38
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 38
tgtggagttc agtagtgtgg ag 22
<210> 39
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 39
cactgacatt tctcttgtct cctct 25
<210> 40
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 40
gggacatctc ggtttcctga ctt 23
<210> 41
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 41
tccacactac tgaactccac aa 22
<210> 42
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 42
cggaacactc gctctacgaa a 21
<210> 43
<211> 18
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 43
gggccagctt cagacaca 18
<210> 44
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 44
cccagggtgc tggagaatcc aa 22
<210> 45
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 45
gccaagtgtc ttccagtacg at 22
<210> 46
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 46
gttccctttc ttgggttcag a 21
<210> 47
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 47
gatgctactg ctttggcaag atc 23
<210> 48
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 48
cctgagctgc taacacggtt 20
<210> 49
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 49
agctacagac catgcttagt gta 23
<210> 50
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 50
tgccagttta ggaggaatat gttc 24
<210> 51
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 51
ctgaggaaac agaggtacca gatat 25
<210> 52
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 52
agtcacacag ttctgtcaaa tcag 24
<210> 53
<211> 17
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 53
gtccttcggg cacctcg 17
<210> 54
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 54
tcctgtggga gggttctttg 20
<210> 55
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 55
ccctctctct gagccctcta 20
<210> 56
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 56
gctgcctaag tctttggagc t 21
<210> 57
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 57
ccctctctct gagccctcta 20
<210> 58
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 58
gagaggagag acagctagtt ctaac 25
<210> 59
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 59
agctacagac catgcttagt gta 23
<210> 60
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 60
gccctcttca tacaggaatc ac 22
<210> 61
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 61
cggacagcat ccaggactt 19
<210> 62
<211> 26
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 62
tcatgtaatc tggcttcaga gtggga 26
<210> 63
<211> 27
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 63
tgggaggcaa ttcttagttt caatgga 27
<210> 64
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 64
tcccaaaggt gtctgtctgc aca 23
<210> 65
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 65
ctcctttgcc tcgctggact gg 22
<210> 66
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 66
cggacagcat ccaggactt 19
<210> 67
<211> 29
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 67
agaaggagtg tacagagtag aactggaca 29
<210> 68
<211> 27
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 68
tgtttgtggg tgtcagtgtt tctactc 27
<210> 69
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 69
caccacggct gtcgtcagca a 21
<210> 70
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 70
cttgccaaag cagtagcatc cca 23
<210> 71
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 71
aggtcagaaa gcagagtgga cca 23
<210> 72
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 72
cccaggcaat tcctaccttc cca 23
<210> 73
<211> 28
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 73
tctgagcatt ctacctcatt gctttggt 28
<210> 74
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 74
aggctgtccc agcacctgag tcg 23
<210> 75
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 75
cggctcggct tcaccgtcac c 21
<210> 76
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 76
aaggctgctg atgacacctg gga 23
<210> 77
<211> 27
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 77
agattcagac acacacaact taccagc 27
<210> 78
<211> 28
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 78
agacctgcaa ttctctaaga gctccaca 28
<210> 79
<211> 27
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 79
agattcagac acacacaact taccagc 27
<210> 80
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 80
ttgtctgcag ctcctacctc tggg 24
<210> 81
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 81
aggtcagaaa gcagagtgga cca 23
<210> 82
<211> 29
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 82
ttgacatgtg tgggtgagag attttactg 29
<210> 83
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 83
cccagggtgc tggagaatcc aa 22
<210> 84
<211> 16
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 84
guuuuagagc uaugcu 16
<210> 85
<211> 67
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 85
agcauagcaa guuaaaauaa ggcuaguccg uuaucaacuu gaaaaagugg caccgagucg 60
gugcuuu 67
<210> 86
<211> 77
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 86
guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc cguuaucaac uugaaaaagu 60
ggcaccgagu cggugcu 77
<210> 87
<211> 82
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 87
guuggaacca uucaaaacag cauagcaagu uaaaauaagg cuaguccguu aucaacuuga 60
aaaaguggca ccgagucggu gc 82
<210> 88
<211> 76
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 88
guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc cguuaucaac uugaaaaagu 60
ggcaccgagu cggugc 76
<210> 89
<211> 86
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 89
guuuaagagc uaugcuggaa acagcauagc aaguuuaaau aaggcuaguc cguuaucaac 60
uugaaaaagu ggcaccgagu cggugc 86
<210> 90
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<220>
<221> misc_feature
<222> (2)..(21)
<223> n = A、T、C或G
<400> 90
gnnnnnnnnn nnnnnnnnnn ngg 23
<210> 91
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<220>
<221> misc_feature
<222> (1)..(21)
<223> n = A、T、C或G
<400> 91
nnnnnnnnnn nnnnnnnnnn ngg 23
<210> 92
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<220>
<221> misc_feature
<222> (3)..(23)
<223> n = A、T、C或G
<400> 92
ggnnnnnnnn nnnnnnnnnn nnngg 25

Claims (64)

1.一种非人动物,其在其基因组中包括经基因修饰的内源性Ttr基因座,其中所述内源性Ttr基因座的包括Ttr编码序列和非编码序列两者的区域已经缺失并且被包括TTR编码序列和非编码序列两者的对应人TTR序列替代,并且其中所述经基因修饰的内源性Ttr基因座包括引起经编码的转甲状腺素蛋白的β链D中的移位的突变。
2.根据权利要求1所述的非人动物,其中当所述经编码的转甲状腺素蛋白与人转甲状腺素蛋白进行最佳比对时,所述突变引起β链D中的三残基移位,所述三残基移位将与所述人转甲状腺素蛋白中的残基L58相对应的残基置于通常被与所述人转甲状腺素蛋白中的残基L55相对应的残基占据的位置处。
3.根据权利要求2所述的非人动物,其中当所述经编码的转甲状腺素蛋白与所述人转甲状腺素蛋白进行最佳比对时,所述突变是与所述人转甲状腺素蛋白中的G53S/E54D/L55S相对应的三重突变。
4.根据权利要求3所述的非人动物,其中所述三重突变位于所述对应人TTR序列中。
5.根据前述权利要求中任一项所述的非人动物,其中所述经基因修饰的内源性Ttr基因座包括内源性Ttr启动子,其中所述人TTR序列与所述内源性Ttr启动子可操作地连接。
6.根据前述权利要求中任一项所述的非人动物,其中所述内源性Ttr基因座的至少一个内含子和至少一个外显子已经缺失并且被所述对应人TTR序列替代。
7.根据前述权利要求中任一项所述的非人动物,其中所述内源性Ttr基因座的整个Ttr编码序列已经缺失并且被所述对应人TTR序列替代。
8.根据权利要求7所述的非人动物,其中所述内源性Ttr基因座的从Ttr起始密码子到Ttr终止密码子的区域已经缺失并且被所述对应人TTR序列替代。
9.根据前述权利要求中任一项所述的非人动物,其中所述经基因修饰的内源性Ttr基因座包括人TTR 3'非翻译区。
10.根据前述权利要求中任一项所述的非人动物,其中内源性Ttr 5'非翻译区尚未缺失并且尚未被所述对应人TTR序列替代。
11.根据前述权利要求中任一项所述的非人动物,其中所述内源性Ttr基因座的从所述Ttr起始密码子到所述Ttr终止密码子的所述区域已经缺失并且被包括所述对应人TTR序列和人TTR 3'非翻译区的人TTR序列替代,并且
其中所述内源性Ttr 5'非翻译区尚未缺失并且尚未被所述对应人TTR序列替代,并且
其中所述内源性Ttr启动子尚未缺失并且尚未被所述对应人TTR序列替代。
12.根据权利要求11所述的非人动物,其中:
(i)所述经基因修饰的内源性Ttr基因座处的所述人TTR序列包括与SEQ ID NO:14中所示的序列至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%相同的序列;或
(ii)所述经基因修饰的内源性Ttr基因座编码包括与SEQ ID NO:9中所示的序列至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%相同的序列的蛋白质;
(iii)所述经基因修饰的内源性Ttr基因座包括编码序列,所述编码序列包括与SEQ IDNO:10中所示的序列至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%相同的序列;或
(iv)所述经基因修饰的内源性Ttr基因座包括与SEQ ID NO:12或13中所示的序列至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%相同的序列。
13.根据权利要求1到6中任一项所述的非人动物,其中所述经基因修饰的内源性Ttr基因座编码包括信号肽的转甲状腺素蛋白前体蛋白,并且所述内源性Ttr基因座的编码所述信号肽的区域尚未缺失并且尚未被所述对应人TTR序列替代。
14.根据权利要求13所述的非人动物,其中所述内源性Ttr基因座的第一外显子尚未缺失并且尚未被所述对应人TTR序列替代。
15.根据权利要求14所述的非人动物,其中所述内源性Ttr基因座的所述第一外显子和第一内含子尚未缺失并且尚未被所述对应人TTR序列替代。
16.根据权利要求13到15中任一项所述的非人动物,其中所述内源性Ttr基因座的从第二Ttr外显子开始到所述Ttr终止密码子的区域已经缺失并且被所述对应人TTR序列替代。
17.根据权利要求13到16中任一项所述的非人动物,其中所述经基因修饰的内源性Ttr基因座包括人TTR 3'非翻译区。
18.根据权利要求13到17中任一项所述的非人动物,其中所述内源性Ttr基因座的从所述第二Ttr外显子到所述Ttr终止密码子的所述区域已经缺失并且被包括所述对应人TTR序列和人TTR 3'非翻译区的人TTR序列替代,并且
其中所述内源性Ttr 5'非翻译区尚未缺失并且尚未被所述对应人TTR序列替代,并且
其中所述内源性Ttr启动子尚未缺失并且尚未被所述对应人TTR序列替代。
19.根据前述权利要求中任一项所述的非人动物,其中所述经基因修饰的内源性Ttr基因座不包括选择盒或报告基因。
20.根据前述权利要求中任一项所述的非人动物,其中所述非人动物对于所述经基因修饰的内源性Ttr基因座是纯合的。
21.根据前述权利要求中任一项所述的非人动物,其中所述非人动物是哺乳动物。
22.根据权利要求21所述的非人动物,其中所述非人动物是大鼠或小鼠。
23.根据权利要求22所述的非人动物,其中所述非人动物是小鼠。
24.根据前述权利要求中任一项所述的非人动物,其中所述非人动物在其种系中包括所述经基因修饰的内源性Ttr基因座。
25.根据前述权利要求中任一项所述的非人动物,其中所述非人动物相对于对照野生型非人动物或包括所述经基因修饰的内源性Ttr基因座而没有所述突变的非人动物是活动过度的。
26.根据权利要求25所述的非人动物,其中活动过度是通过旷场实验中的总距离、总活动或总直立次数中的一个或多个或全部来测量的。
27.根据前述权利要求中任一项所述的非人动物,其中所述非人动物表现出后肢肌张力障碍。
28.根据前述权利要求中任一项所述的非人动物,其中所述非人动物包括淀粉样蛋白沉积物。
29.根据权利要求28所述的非人动物,其中所述非人动物在坐骨神经中包括淀粉样蛋白沉积物。
30.根据权利要求28或29所述的非人动物,其中所述非人动物在约两个月龄时患上淀粉样变性。
31.一种非人动物细胞,其在其基因组中包括经基因修饰的内源性Ttr基因座,其中所述内源性Ttr基因座的包括Ttr编码序列和非编码序列两者的区域已经缺失并且被包括TTR编码序列和非编码序列两者的对应人TTR序列替代,并且其中所述经基因修饰的内源性Ttr基因座包括引起经编码的转甲状腺素蛋白的β链D中的移位的突变。
32.一种非人动物基因组,其包括经基因修饰的内源性Ttr基因座,其中所述内源性Ttr基因座的包括Ttr编码序列和非编码序列两者的区域已经缺失并且被包括TTR编码序列和非编码序列两者的对应人TTR序列替代,并且其中所述经基因修饰的内源性Ttr基因座包括引起经编码的转甲状腺素蛋白的β链D中的移位的突变。
33.一种用于产生经基因修饰的内源性Ttr基因座的靶向载体,其中所述内源性Ttr基因座的包括Ttr编码序列和非编码序列两者的区域已经缺失并且被包括TTR编码序列和非编码序列两者的对应人TTR序列替代,并且其中所述经基因修饰的内源性Ttr基因座包括引起经编码的转甲状腺素蛋白的β链D中的移位的突变,其中所述靶向载体包括插入核酸,所述插入核酸包括侧接有靶向所述内源性Ttr基因座处的5'靶序列的5'同源臂和靶向所述内源性Ttr基因座处的3'靶序列的3'同源臂的对应人TTR序列。
34.一种经基因修饰的非人动物Ttr基因,其中内源性Ttr基因的包括Ttr编码序列和非编码序列两者的区域已经缺失并且被包括TTR编码序列和非编码序列两者的对应人TTR序列替代,并且其中所述经基因修饰的非人动物Ttr基因包括引起经编码的转甲状腺素蛋白的β链D中的移位的突变。
35.一种评估人TTR靶向试剂的体内活性的方法,所述方法包括:
(a)向根据权利要求1到30中任一项所述的非人动物施用所述人TTR靶向试剂;以及
(b)评估所述人TTR靶向试剂在所述非人动物中的活性。
36.根据权利要求35所述的方法,其中引入包括腺相关病毒(AAV)介导的递送、脂质纳米颗粒(LNP)介导的递送或流体动力学递送(HDD)。
37.根据权利要求36所述的方法,其中所述引入包括LNP介导的递送。
38.根据权利要求36所述的方法,其中所述引入包括AAV8介导的递送。
39.根据权利要求35到38中任一项所述的方法,其中步骤(b)包括从所述非人动物中分离肝脏并且评估所述人TTR靶向试剂在所述肝脏中的活性。
40.根据权利要求39所述的方法,其中步骤(b)进一步包括评估所述人TTR靶向试剂在除了所述肝脏之外的器官或组织中的活性。
41.根据权利要求35到40中任一项所述的方法,其中所述评估包括评估所述经基因修饰的Ttr基因座的修饰。
42.根据权利要求35到41中任一项所述的方法,其中所述评估包括评估由所述经基因修饰的Ttr基因座编码的Ttr信使RNA的表达。
43.根据权利要求35到42中任一项所述的方法,其中所述评估包括评估由所述经基因修饰的Ttr基因座编码的TTR蛋白的表达。
44.根据权利要求43所述的方法,其中评估所述TTR蛋白的表达包括测量所述TTR蛋白在所述非人动物中的血清水平。
45.根据权利要求41到43中任一项所述的方法,其中所述活性是在所述非人动物的所述肝脏中评估的。
46.根据权利要求35到45中任一项所述的方法,其中所述评估包括评估活动过度。
47.根据权利要求35到46中任一项所述的方法,其中所述评估包括评估后肢肌张力障碍。
48.根据权利要求35到47中任一项所述的方法,其中所述评估包括评估淀粉样蛋白沉积。
49.根据权利要求48所述的方法,其中所述评估包括评估坐骨神经中的淀粉样蛋白沉积。
50.根据权利要求35到49中任一项所述的方法,其中所述评估是通过与未经处理的对照非人动物进行比较来进行的。
51.根据权利要求35到50中任一项所述的方法,其中所述人TTR靶向试剂包括被设计成靶向人TTR基因的区域的核酸酶药剂。
52.根据权利要求51所述的方法,其中所述核酸酶药剂包括Cas蛋白和被设计成靶向所述人TTR基因中的向导RNA靶序列的向导RNA。
53.根据权利要求52所述的方法,其中所述Cas蛋白是Cas9蛋白。
54.根据权利要求35到53中任一项所述的方法,其中所述人TTR靶向试剂包括外源性供体核酸,其中所述外源性供体核酸被设计成与所述人TTR基因重组。
55.根据权利要求54所述的方法,其中所述外源性供体核酸是单链寡脱氧核苷酸(ssODN)。
56.根据权利要求35到55中任一项所述的方法,其中所述人TTR靶向试剂包括抗原结合蛋白。
57.根据权利要求35到56中任一项所述的方法,其中所述人TTR靶向试剂包括RNAi药剂或反义寡核苷酸。
58.一种优化人TTR靶向试剂的体内活性的方法,所述方法包括:
(I)在第一非人动物中第一次执行根据权利要求35到57中任一项所述的方法,所述非人动物在其基因组中包括经基因修饰的内源性Ttr基因座;
(II)改变变量并且在第二非人动物中用所改变变量第二次执行步骤(I)的方法,所述第二非人动物在其基因组中包括所述经基因修饰的内源性Ttr基因座;以及
(III)将步骤(I)中的所述人TTR靶向试剂的活性与步骤(II)中的所述人TTR靶向试剂的活性进行比较,并且选择产生较高功效、较高精度、较高一致性或较高特异性的方法。
59.根据权利要求58所述的方法,其中步骤(II)中的所述所改变变量是将所述人TTR靶向试剂引入到所述非人动物中的递送方法。
60.根据权利要求58所述的方法,其中步骤(II)中的所述所改变变量是将所述人TTR靶向试剂引入到所述非人动物中的施用途径。
61.根据权利要求58所述的方法,其中步骤(II)中的所述所改变变量是引入到所述非人动物中的所述人TTR靶向试剂的浓度或量。
62.根据权利要求58所述的方法,其中步骤(II)中的所述所改变变量是引入到所述非人动物中的所述人TTR靶向试剂的形式。
63.根据权利要求58所述的方法,其中步骤(II)中的所述所改变变量是引入到所述非人动物中的所述人TTR靶向试剂。
64.一种制备根据权利要求1到30中任一项所述的非人动物的方法,所述方法包括:
(I)(a)对多能性非人动物细胞的基因组进行修饰以包括经基因修饰的内源性Ttr基因座;
(b)鉴定或选择包括所述经基因修饰的内源性Ttr基因座的经基因修饰的多能性非人动物细胞;
(c)将所述经基因修饰的多能性非人动物细胞引入到非人动物宿主胚胎中;以及
(d)在代孕母体中孕育所述非人动物宿主胚胎;或
(II)(a)对非人动物单细胞期胚胎的基因组进行修饰以包括经基因修饰的内源性Ttr基因座;
(b)选择包括所述经基因修饰的内源性Ttr基因座的经基因修饰的非人动物单细胞期胚胎;以及
(c)在代孕母体中孕育所述经基因修饰的非人动物单细胞期胚胎。
CN202080038549.3A 2019-06-04 2020-06-03 包括具有β滑移突变的人源化TTR基因座的非人动物和使用方法 Pending CN113874510A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201962856999P 2019-06-04 2019-06-04
US62/856,999 2019-06-04
PCT/US2020/035859 WO2020247452A1 (en) 2019-06-04 2020-06-03 Non-human animals comprising a humanized ttr locus with a beta-slip mutation and methods of use

Publications (1)

Publication Number Publication Date
CN113874510A true CN113874510A (zh) 2021-12-31

Family

ID=71842799

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202080038549.3A Pending CN113874510A (zh) 2019-06-04 2020-06-03 包括具有β滑移突变的人源化TTR基因座的非人动物和使用方法

Country Status (8)

Country Link
US (1) US11891618B2 (zh)
EP (1) EP3801011A1 (zh)
JP (1) JP7610339B2 (zh)
KR (1) KR20220016869A (zh)
CN (1) CN113874510A (zh)
AU (1) AU2020286382A1 (zh)
CA (1) CA3137761A1 (zh)
WO (1) WO2020247452A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116083485A (zh) * 2022-12-01 2023-05-09 四川大学华西医院 一种靶向载体、ATTRm疾病模型的构建方法及其应用

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111163633B (zh) 2017-09-29 2022-09-09 瑞泽恩制药公司 包含人源化ttr基因座的非人类动物及其使用方法
AU2020253532B2 (en) 2019-04-04 2024-06-20 Regeneron Pharmaceuticals, Inc. Non-human animals comprising a humanized coagulation factor 12 locus
CN113874510A (zh) 2019-06-04 2021-12-31 瑞泽恩制药公司 包括具有β滑移突变的人源化TTR基因座的非人动物和使用方法
BR112021022722A2 (pt) 2019-06-07 2022-01-04 Regeneron Pharma Animal não humano, célula de animal não humana, genoma de animal não humano, gene de albumina animal não humana humanizada, vetor de alvejamento, método de avaliação da atividade de um reagente, e, método de otimização da atividade de um reagente

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019067875A1 (en) * 2017-09-29 2019-04-04 Regeneron Pharmaceuticals, Inc. NON-HUMAN ANIMALS COMPRISING A HUMANIZED TTR LOCUS AND METHODS OF USE

Family Cites Families (124)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5958883A (en) 1992-09-23 1999-09-28 Board Of Regents Of The University Of Washington Office Of Technology Animal models of human amyloidoses
US5523226A (en) 1993-05-14 1996-06-04 Biotechnology Research And Development Corp. Transgenic swine compositions and methods
AU3640297A (en) 1996-06-06 1998-01-05 University Of Washington Perlecan transgenic animals and methods of identifying compounds for the treatment of amyloidoses
AU8587598A (en) 1997-07-26 1999-02-16 Wisconsin Alumni Research Foundation Trans-species nuclear transfer
US6599692B1 (en) 1999-09-14 2003-07-29 Sangamo Bioscience, Inc. Functional genomics using zinc finger proteins
US20030104526A1 (en) 1999-03-24 2003-06-05 Qiang Liu Position dependent recognition of GNN nucleotide triplets by zinc fingers
US6596541B2 (en) 2000-10-31 2003-07-22 Regeneron Pharmaceuticals, Inc. Methods of modifying eukaryotic cells
US6586251B2 (en) 2000-10-31 2003-07-01 Regeneron Pharmaceuticals, Inc. Methods of modifying eukaryotic cells
US20050144655A1 (en) 2000-10-31 2005-06-30 Economides Aris N. Methods of modifying eukaryotic cells
AU2884102A (en) 2000-12-07 2002-06-18 Sangamo Biosciences Inc Regulation of angiogenesis with zinc finger proteins
WO2002057294A2 (en) 2001-01-22 2002-07-25 Sangamo Biosciences, Inc. Zinc finger proteins for dna binding and gene regulation in plants
AU2002225187A1 (en) 2001-01-22 2002-07-30 Sangamo Biosciences, Inc. Zinc finger polypeptides and their use
US20020160394A1 (en) 2001-01-24 2002-10-31 Bayer Corporation Regulation of transthyretin to treat obesity
AUPR451401A0 (en) 2001-04-20 2001-05-24 Monash University A method of nuclear transfer
CA2474486C (en) 2002-01-23 2013-05-14 The University Of Utah Research Foundation Targeted chromosomal mutagenesis using zinc finger nucleases
DE60316124T3 (de) 2002-03-15 2018-03-22 Cellectis Hybride and einzelkettige meganukleasen und deren anwendungen
EP2368982A3 (en) 2002-03-21 2011-10-12 Sangamo BioSciences, Inc. Methods and compositions for using zinc finger endonucleases to enhance homologous recombination
US7612250B2 (en) 2002-07-29 2009-11-03 Trustees Of Tufts College Nuclear transfer embryo formation method
JP2006502748A (ja) 2002-09-05 2006-01-26 カリフォルニア インスティテュート オブ テクノロジー 遺伝子ターゲッティングを誘発するキメラヌクレアーゼの使用方法
WO2004031346A2 (en) 2002-09-06 2004-04-15 Fred Hutchinson Cancer Research Center Methods and compositions concerning designed highly-specific nucleic acid binding proteins
US8409861B2 (en) 2003-08-08 2013-04-02 Sangamo Biosciences, Inc. Targeted deletion of cellular DNA sequences
US7888121B2 (en) 2003-08-08 2011-02-15 Sangamo Biosciences, Inc. Methods and compositions for targeted cleavage and recombination
EP1591521A1 (en) 2004-04-30 2005-11-02 Cellectis I-Dmo I derivatives with enhanced activity at 37 degrees C and use thereof
US20080038227A1 (en) 2004-08-04 2008-02-14 Ignacio Torres Aleman Animal model of neurodegenerative diseases, the procedure for producing the model and applications thereof
KR20070060115A (ko) 2004-09-16 2007-06-12 상가모 바이오사이언스 인코포레이티드 단백질 생산을 위한 조성물 및 방법
PT2767161T (pt) 2004-10-19 2018-04-20 Regeneron Pharma Método para gerar um animal homozigótico para uma modificação genética
EP1863909B2 (en) 2005-03-15 2014-09-10 Cellectis I-crei meganuclease variants with modified specificity, method of preparation and uses thereof
WO2006097784A1 (en) 2005-03-15 2006-09-21 Cellectis I-crei meganuclease variants with modified specificity, method of preparation and uses thereof
WO2006105602A1 (en) 2005-04-06 2006-10-12 The Walter And Eliza Hall Institute Of Medical Research Animal models and cells with a modified gene encoding transthyretin-related protein and applications thereof
JP4692417B2 (ja) 2006-06-30 2011-06-01 富士ゼロックス株式会社 画像形成装置
CN101117633B (zh) 2006-08-03 2011-07-20 上海交通大学附属儿童医院 一种细胞核移植方法
EP2415872B1 (en) 2006-12-14 2016-05-11 Dow AgroSciences LLC Optimized non-canonical zinc finger proteins
CN102037594A (zh) 2008-04-11 2011-04-27 Utc电力公司 燃料电池和具有歧管贮槽的双极板
WO2010017509A1 (en) 2008-08-07 2010-02-11 Isis Pharmaceuticals, Inc. Modulation of transthyretin expression for the treatment of cns related disorders
WO2010030203A1 (en) 2008-09-09 2010-03-18 Biocodex - Incubação De Empresas De Ciências Da Vida, S.A. Monoclonal antibody to human amyloidogenic and modified forms of transthyretin and its use in the detection and treatment of fap and pathologies presenting modified ttr
MX2011004268A (es) 2008-10-20 2011-06-01 Alnylam Pharmaceuticals Inc Composiciones y metodos para inhibir la expresion de transtiretina.
EP2206723A1 (en) 2009-01-12 2010-07-14 Bonas, Ulla Modular DNA-binding domains
US20110239315A1 (en) 2009-01-12 2011-09-29 Ulla Bonas Modular dna-binding domains and methods of use
US8871905B2 (en) 2009-03-20 2014-10-28 Sangamo Biosciences, Inc. Modification of CXCR4 using engineered zinc finger proteins
US8772008B2 (en) 2009-05-18 2014-07-08 Sangamo Biosciences, Inc. Methods and compositions for increasing nuclease activity
WO2010151792A1 (en) 2009-06-26 2010-12-29 Regeneron Pharmaceuticals, Inc. Readily isolated bispecific antibodies with native immunoglobulin format
WO2011017293A2 (en) 2009-08-03 2011-02-10 The General Hospital Corporation Engineering of zinc finger arrays by context-dependent assembly
US8354389B2 (en) 2009-08-14 2013-01-15 Regeneron Pharmaceuticals, Inc. miRNA-regulated differentiation-dependent self-deleting cassette
PT3056082T (pt) 2009-10-06 2018-12-12 Univ Yale Ratinhos modificados geneticamente e enxerto
ES2613662T3 (es) 2009-10-29 2017-05-25 Regeneron Pharmaceuticals, Inc. Alelos multifuncionales
EP2496238A4 (en) 2009-11-03 2013-10-02 Alnylam Pharmaceuticals Inc FORMULATED LIPID COMPOSITIONS AND METHODS FOR INHIBITING TRANSTHYRETIN EXPRESSION (TTR)
WO2011072246A2 (en) 2009-12-10 2011-06-16 Regents Of The University Of Minnesota Tal effector-mediated dna modification
MX338971B (es) 2011-02-15 2016-05-06 Inst Res Biomedicine Irb Ratones de m-csf humanizada.
HUE033400T2 (en) 2011-10-28 2017-12-28 Regeneron Pharma Humanized IL-6 and IL-6 receptor
LT3262932T (lt) 2011-10-28 2019-08-26 Regeneron Pharmaceuticals, Inc. Pelės su genetiškai modifikuotu pagrindiniu histosuderinamumo kompleksu
US9637739B2 (en) 2012-03-20 2017-05-02 Vilnius University RNA-directed DNA cleavage by the Cas9-crRNA complex
WO2013141680A1 (en) 2012-03-20 2013-09-26 Vilnius University RNA-DIRECTED DNA CLEAVAGE BY THE Cas9-crRNA COMPLEX
DK2847335T3 (en) 2012-04-25 2018-08-13 Regeneron Pharma NUCLEASED MEDIUM TARGETING WITH LARGE TARGET VECTORS
LT2800811T (lt) 2012-05-25 2017-09-11 The Regents Of The University Of California Būdai ir kompozicijos, skirti tikslinės dnr modifikavimui, panaudojant adresuotą rnr, ir transkripcijos moduliavimui, panaudojant adresuotą rnr
US8962913B2 (en) 2012-06-18 2015-02-24 Regeneron Pharmaceuticals, Inc. Humanized IL-7 rodents
WO2014033644A2 (en) 2012-08-28 2014-03-06 Novartis Ag Methods of nuclease-based genetic engineering
CN110669758A (zh) 2012-10-23 2020-01-10 基因工具股份有限公司 用于切割靶dna 的组合物及其用途
ES2884598T3 (es) 2012-11-05 2021-12-10 Regeneron Pharma Animales no humanos modificados genéticamente y métodos de uso de los mismos
PT3138912T (pt) 2012-12-06 2018-12-28 Sigma Aldrich Co Llc Modificação e regulação de genoma baseado em crispr
US8697359B1 (en) 2012-12-12 2014-04-15 The Broad Institute, Inc. CRISPR-Cas systems and methods for altering expression of gene products
SG11201504523UA (en) 2012-12-12 2015-07-30 Broad Inst Inc Delivery, engineering and optimization of systems, methods and compositions for sequence manipulation and therapeutic applications
CN105121641A (zh) 2012-12-17 2015-12-02 哈佛大学校长及研究员协会 Rna-引导的人类基因组工程化
JP6475172B2 (ja) 2013-02-20 2019-02-27 リジェネロン・ファーマシューティカルズ・インコーポレイテッドRegeneron Pharmaceuticals, Inc. ラットの遺伝子組換え
EP3699190B9 (en) 2013-02-22 2023-10-04 Regeneron Pharmaceuticals, Inc. Murine cell expressing humanized major histocompatibility complex
US20150342163A1 (en) 2013-02-22 2015-12-03 Regeneron Pharmaceuticals, Inc. Genetically modified major histocompatibility complex mice
EP2922393B2 (en) 2013-02-27 2022-12-28 Helmholtz Zentrum München - Deutsches Forschungszentrum für Gesundheit und Umwelt (GmbH) Gene editing in the oocyte by cas9 nucleases
WO2014152432A2 (en) 2013-03-15 2014-09-25 The General Hospital Corporation Rna-guided targeting of genetic and epigenomic regulatory proteins to specific genomic loci
CN115261411A (zh) 2013-04-04 2022-11-01 哈佛学院校长同事会 利用CRISPR/Cas系统的基因组编辑的治疗性用途
LT2986729T (lt) 2013-04-16 2018-10-25 Regeneron Pharmaceuticals, Inc. Žiurkės genomo tikslinė modifikacija
BR112015027369B1 (pt) 2013-05-01 2021-06-08 Ionis Pharmaceuticals, Inc compostos compreendendo um oligonucleotídeo modificado e um grupo de conjugado, composição compreendendo os referidos compostos e usos dos mesmos
CA2915795C (en) 2013-06-17 2021-07-13 The Broad Institute, Inc. Delivery, use and therapeutic applications of the crispr-cas systems and compositions for targeting disorders and diseases using viral components
JP6738729B2 (ja) 2013-06-17 2020-08-12 ザ・ブロード・インスティテュート・インコーポレイテッド 分裂終了細胞の疾患および障害をターゲティングおよびモデリングするための系、方法および組成物の送達、エンジニアリングおよび最適化
KR20240172759A (ko) 2013-06-17 2024-12-10 더 브로드 인스티튜트, 인코퍼레이티드 간의 표적화 및 치료를 위한 CRISPR­Cas 시스템, 벡터 및 조성물의 전달 및 용도
WO2015006498A2 (en) 2013-07-09 2015-01-15 President And Fellows Of Harvard College Therapeutic uses of genome editing with crispr/cas systems
EP3022225B1 (en) 2013-07-19 2021-09-29 Board Of Regents Of the University Of Texas System Transthyretin amyloid-selective and polyreactive catabodies
TR201901782T4 (tr) 2013-09-23 2019-03-21 Regeneron Pharma İnsanlaştirilmiş bi̇r si̇nyal düzenleyi̇ci̇ protei̇n geni̇ne sahi̇p olan i̇nsan dişi hayvanlar.
US20160237455A1 (en) 2013-09-27 2016-08-18 Editas Medicine, Inc. Crispr-related methods and compositions
US10035847B2 (en) 2013-10-02 2018-07-31 The Rockefeller University Amyloid protofibril antibodies and methods of use thereof
CN109090037B (zh) 2013-10-15 2021-05-28 瑞泽恩制药公司 人源化的il-15动物
JP6646573B2 (ja) 2013-10-17 2020-02-14 サンガモ セラピューティクス, インコーポレイテッド ヌクレアーゼ媒介ゲノム遺伝子操作のための送達方法および組成物
CN105980568B (zh) 2013-12-11 2019-12-03 瑞泽恩制药公司 用于靶向修饰基因组的方法和组合物
PL3083681T3 (pl) 2013-12-20 2020-12-28 Neurimmune Holding Ag Terapia amyloidozy transtyretynowej oparta na przeciwciałach (ttr) i przeznaczone dla niej pochodzące od człowieka przeciwciała
US10604562B2 (en) 2014-01-29 2020-03-31 Km Biologics Co., Ltd. Anti-transthyretin humanized antibody
JP6606088B2 (ja) 2014-02-24 2019-11-13 サンガモ セラピューティクス, インコーポレイテッド ヌクレアーゼ媒介性標的化組み込みのための方法および組成物
JP6771387B2 (ja) 2014-03-25 2020-10-21 アークトゥラス・セラピューティクス・インコーポレイテッドArcturus Therapeutics,Inc. 遺伝子サイレンシング用トランスサイレチン対立遺伝子選択的unaオリゴマー
CN106659146B (zh) 2014-05-05 2020-06-23 再生元制药公司 人源化c5和c3动物
NO2785538T3 (zh) 2014-05-07 2018-08-04
JP6672171B2 (ja) 2014-05-19 2020-03-25 リジェネロン・ファーマシューティカルズ・インコーポレイテッド ヒトepoを発現する遺伝子改変された非ヒト動物
WO2015191693A2 (en) 2014-06-10 2015-12-17 Massachusetts Institute Of Technology Method for gene editing
ES2788426T3 (es) 2014-06-16 2020-10-21 Univ Johns Hopkins Composiciones y métodos para la expresión de ARNs de guía de CRISPR utilizando el promotor de H1
WO2015200334A1 (en) 2014-06-23 2015-12-30 Regeneron Pharmaceuticals, Inc. Nuclease-mediated dna assembly
US20150376586A1 (en) 2014-06-25 2015-12-31 Caribou Biosciences, Inc. RNA Modification to Engineer Cas9 Activity
CA3172866A1 (en) 2014-06-26 2015-12-30 Regeneron Pharamaceuticals, Inc. Methods and compositions for targeted genetic modifications and methods of use
WO2016010840A1 (en) 2014-07-16 2016-01-21 Novartis Ag Method of encapsulating a nucleic acid in a lipid nanoparticle host
CA2959428A1 (en) 2014-09-19 2016-03-24 Regeneron Pharmaceuticals, Inc. Chimeric antigen receptors
ES2731437T3 (es) 2014-11-21 2019-11-15 Regeneron Pharma Métodos y composiciones para la modificación genética dirigida mediante el uso de pares de ARN guías
WO2016106236A1 (en) 2014-12-23 2016-06-30 The Broad Institute Inc. Rna-targeting system
TWI718121B (zh) 2015-01-28 2021-02-11 愛爾蘭商普羅佘納生物科技有限公司 抗甲狀腺素運送蛋白抗體
KR102699643B1 (ko) 2015-04-06 2024-08-28 리제너론 파아마슈티컬스, 인크. 비인간 동물에서의 인간화 t 세포 매개 면역반응
WO2016176191A1 (en) 2015-04-27 2016-11-03 The Trustees Of The University Of Pennsylvania Dual aav vector system for crispr/cas9 mediated correction of human disease
US9790490B2 (en) 2015-06-18 2017-10-17 The Broad Institute Inc. CRISPR enzymes and systems
ES2959815T3 (es) 2015-09-21 2024-02-28 Arcturus Therapeutics Inc Edición génica selectiva de alelo y usos de la misma
EP3159407A1 (en) 2015-10-23 2017-04-26 Silence Therapeutics (London) Ltd Guide rnas, methods and uses
RS61866B1 (sr) 2015-11-20 2021-06-30 Regeneron Pharma Ne-humane životinje koje imaju humanizovani gen za aktivaciju limfocita 3
SG11201806176PA (en) 2016-02-04 2018-08-30 Regeneron Pharma Non-human animals having an engineered angptl8 gene
EP3436077A1 (en) 2016-03-30 2019-02-06 Intellia Therapeutics, Inc. Lipid nanoparticle formulations for crispr/cas components
WO2018007871A1 (en) 2016-07-08 2018-01-11 Crispr Therapeutics Ag Materials and methods for treatment of transthyretin amyloidosis
EP3509645A4 (en) 2016-09-07 2020-06-17 Sangamo Therapeutics, Inc. MODULATION OF LIVER GENES
KR102595683B1 (ko) 2016-12-08 2023-10-31 인텔리아 테라퓨틱스, 인크. 변형된 가이드 rna
CN110494168B (zh) 2017-02-27 2023-02-03 再生元制药公司 肾病症和肝病症的人源化模型
NZ762942A (en) 2017-09-29 2024-10-25 Intellia Therapeutics Inc Compositions and methods for ttr gene editing and treating attr amyloidosis
RU2020112751A (ru) 2017-09-29 2021-10-29 Регенерон Фармасьютикалз, Инк. Отличные от человека животные, у которых экспрессируется гуманизированный комплекс c1q
EP3592140A1 (en) 2018-03-19 2020-01-15 Regeneron Pharmaceuticals, Inc. Transcription modulation in animals using crispr/cas systems
CN112105260B (zh) 2018-03-26 2023-04-28 瑞泽恩制药公司 用于测试治疗剂的人源化啮齿动物
US11690921B2 (en) 2018-05-18 2023-07-04 Sangamo Therapeutics, Inc. Delivery of target specific nucleases
EP3802828A4 (en) 2018-06-08 2022-10-26 Intellia Therapeutics, Inc. RNA MODIFIED GUIDES FOR GENE EDITING
WO2019246203A1 (en) 2018-06-19 2019-12-26 The Board Of Regents Of The University Of Texas System Lipid nanoparticle compositions for delivery of mrna and long nucleic acids
AU2019308205A1 (en) 2018-07-16 2020-11-19 Regeneron Pharmaceuticals, Inc. Non-human animal models of DITRA disease and uses thereof
AU2020253532B2 (en) 2019-04-04 2024-06-20 Regeneron Pharmaceuticals, Inc. Non-human animals comprising a humanized coagulation factor 12 locus
WO2020240876A1 (ja) 2019-05-27 2020-12-03 株式会社トランスジェニック エクソンヒト化マウス
CN113874510A (zh) 2019-06-04 2021-12-31 瑞泽恩制药公司 包括具有β滑移突变的人源化TTR基因座的非人动物和使用方法
BR112021022722A2 (pt) 2019-06-07 2022-01-04 Regeneron Pharma Animal não humano, célula de animal não humana, genoma de animal não humano, gene de albumina animal não humana humanizada, vetor de alvejamento, método de avaliação da atividade de um reagente, e, método de otimização da atividade de um reagente
WO2021108363A1 (en) 2019-11-25 2021-06-03 Regeneron Pharmaceuticals, Inc. Crispr/cas-mediated upregulation of humanized ttr allele
WO2021195079A1 (en) 2020-03-23 2021-09-30 Regeneron Pharmaceuticals, Inc. Non-human animals comprising a humanized ttr locus comprising a v30m mutation and methods of use

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019067875A1 (en) * 2017-09-29 2019-04-04 Regeneron Pharmaceuticals, Inc. NON-HUMAN ANIMALS COMPRISING A HUMANIZED TTR LOCUS AND METHODS OF USE

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
KWANG HUN LIM等: "Pathogenic Mutations Induce Partial Structural Changes in the Native β‑Sheet Structure of Transthyretin and Accelerate Aggregation", 《BIOCHEMISTRY》, vol. 56, 18 August 2017 (2017-08-18), pages 4808 - 4818 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116083485A (zh) * 2022-12-01 2023-05-09 四川大学华西医院 一种靶向载体、ATTRm疾病模型的构建方法及其应用
CN116083485B (zh) * 2022-12-01 2024-09-13 四川大学华西医院 一种靶向载体、ATTRm疾病模型的构建方法及其应用

Also Published As

Publication number Publication date
JP2022534867A (ja) 2022-08-04
EP3801011A1 (en) 2021-04-14
WO2020247452A1 (en) 2020-12-10
CA3137761A1 (en) 2020-12-10
US20200385760A1 (en) 2020-12-10
JP7610339B2 (ja) 2025-01-08
AU2020286382A1 (en) 2021-11-04
KR20220016869A (ko) 2022-02-10
US11891618B2 (en) 2024-02-06

Similar Documents

Publication Publication Date Title
CN111163633B (zh) 包含人源化ttr基因座的非人类动物及其使用方法
CN111885915B (zh) 使用crispr/cas系统对动物进行转录调制
CN110891420B (zh) Cas转基因小鼠胚胎干细胞和小鼠及其应用
US20210261985A1 (en) Methods and compositions for assessing crispr/cas-mediated disruption or excision and crispr/cas-induced recombination with an exogenous donor nucleic acid in vivo
CN113874510A (zh) 包括具有β滑移突变的人源化TTR基因座的非人动物和使用方法
AU2020289581B2 (en) Non-human animals comprising a humanized albumin locus
US20190032156A1 (en) Methods and compositions for assessing crispr/cas-induced recombination with an exogenous donor nucleic acid in vivo
KR20220097414A (ko) X-연관 연소 망막층간분리 치료법을 위한 crispr 및 aav 전략
JP2023511626A (ja) ヒト化pnpla3遺伝子座を含む非ヒト動物および使用方法
CN114616002A (zh) 使用由脂质纳米颗粒递送的crispr/cas系统在动物中进行的转录调控
RU2784927C1 (ru) Отличные от человека животные, включающие в себя гуманизированный ttr локус, и способы применения
RU2833486C1 (ru) Стратегии crispr и aav для терапии х-сцепленного ювенильного ретиношизиса
US20230081547A1 (en) Non-human animals comprising a humanized klkb1 locus and methods of use

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination