CN116783293B

CN116783293B - 对肌营养不良蛋白基因中的识别序列具有特异性的工程化大范围核酸酶

Info

Publication number: CN116783293B
Application number: CN202180088740.3A
Authority: CN
Inventors: G·奥文斯; J·莱普; J·J·史密斯; J·莫里斯; C·图纳; W·刘易斯; D·扬茨
Original assignee: Precision Biosciences Inc
Current assignee: Precision Biosciences Inc
Priority date: 2020-11-12
Filing date: 2021-11-12
Publication date: 2025-03-18
Anticipated expiration: 2041-11-12
Also published as: WO2022104062A1; JP2023549357A; US20240018495A1; US20240002823A1; CN116783293A; IL302733A; IL302733B1; US11993793B2; CA3172481A1; JP7642809B2; US20230053176A1; IL317538A; US12006522B2; KR20230118841A; MX2023005496A; US20250034536A1; EP4244342A1; US11753630B2

Abstract

本公开涵盖结合并切割肌营养不良蛋白(dystrophin)基因内的识别序列的工程化大范围核酸酶。本公开还涵盖使用此类工程化大范围核酸酶制备遗传修饰的细胞的方法。此外，本公开涵盖包含工程化大范围核酸酶蛋白或编码本公开的工程化大范围核酸酶的多核苷酸的药物组合物，以及此类组合物用于在受试者中修饰肌营养不良蛋白基因或用于治疗杜氏(Duchenne)肌营养不良症的用途。

Description

对肌营养不良蛋白基因中的识别序列具有特异性的工程化大范围核酸酶

技术领域

本申请涉及工程化大范围核酸酶、分子生物学和重组核酸技术领域。在特定方面中，本发明涉及可用于从肌营养不良蛋白基因中去除外显子和可用于治疗患有杜氏肌营养不良症的受试者的工程化大核酸酶。

通过EFS-WEB作为文本文件提交的序列表的引用

本申请包含序列表，其已经通过EFS-Web以ASCII格式提交，并且将其全部内容通过引用并入本文中。该ASCII拷贝，于2021年11月12日创建，名为P109070054WO00-SEQ-EPG，并且大小为279,819字节。

背景技术

杜氏肌营养不良症(DMD)是一种罕见的X连锁肌退行性病症，全球约每3500名男孩中就有1个患有这种病症。这种疾病是由肌营养不良蛋白基因突变引起，所述肌营养不良蛋白基因是已知的最大基因。肌营养不良蛋白基因跨X染色体的2.2Mb，主要编码来自79个外显子的14kb转录物。在骨骼肌、平滑肌和心肌细胞中表达的全长肌营养不良蛋白为3685个氨基酸，分子量为427kD。严重的杜氏表型通常与骨骼肌和心肌中全长肌营养不良蛋白的缺失有关，这会导致衰弱性肌肉退化，并且最终导致心力衰竭。已经描述了大量不同的肌营养不良蛋白基因突变，其中很多突变导致严重的DMD或较轻的贝克型肌营养不良症。

目前有几种治疗DMD的治疗性策略。首先，“基因替代”策略是一个活跃的研究领域(Oshima等，(2009)J.Am.Soc.Gene Ther.17:73-80；Liu等，(2005)Mol.Ther.11:245-56；Lai等，(2006)Hum Gene Ther.17:1036-42；Odom等，(2008)Mol.Ther.16:1539-45)。该方法涉及使用病毒递送载体，通常是腺相关病毒(AAV)，将肌营养不良蛋白基因的功能性拷贝递送至患者。然而，肌营养不良蛋白基因的大尺寸使其与普通病毒载体的有限携带能力不相容。这就需要使用“微型-肌营养不良蛋白”基因，其中该基因的大部分重复中心部分被去除，只留下最低功能蛋白。但是，目前尚不清楚“微型-肌营养不良蛋白”的表达是否足以获得临床获益。此外，这种方法还存在随机基因整合到患者基因组中的可能性，这可能导致插入突变，以及针对递送载体的免疫反应的可能性。

治疗DMD的第二种方法是将健康的肌前体细胞移植到患者的肌纤维中(Peault等，(2007)Mol.Ther.15:867-77；Skuk等，(2007)Neuromuscul.Disord.17:38-46)。这种方法存在移植成肌细胞迁移效率低以及患者可能产生免疫排斥的问题。

第三种方法涉及使用PTC124抑制无意义突变(Welch等，(2007)Nature 447:87-91)。然而，这需要终身给药，而且该方法尚未显示出任何显著的临床获益。

用于治疗DMD的第四种方法称为“外显子跳跃”(Williams等，(2008)BMCBiotechnol.8:35；Jearawiriyapaisarn等，(2008)Mol Ther.16:1624-29；Yokota等，(2007)Acta Myol.26:179-84；van Deutekom等，(2001)Hum.Mol.Gen.10:1547-54；Benedetti等，(2013)FEBS J.280:4263-80；Rodino-Klapac(2013)Curr Neurol NeurosciRep.13:332；Verhaart&Aartsma-Rus(2012)Curr Opin Neurol.25:588-96)。一般来说，肌营养不良蛋白基因的氨基(N)和羧基(C)末端部分对于其作为维持肌纤维膜完整性的“支架”蛋白的作用至关重要，而包含24个血影蛋白(spectrin)样重复序列的中心“杆状结构域”至少部分是可有可无的。事实上，严重的杜氏表型通常与肌营养不良蛋白基因的突变相关，这些突变引入了移码和/或过早终止密码子，导致肌营养不良蛋白的缩短形式缺乏必需的C末端结构域。在中心杆状结构域中的突变，包括整个外显子的大量缺失，如果其保持阅读框，使得蛋白的C末端结构域保持完整，则通常会导致更温和的贝克型表型。

DMD最常见的原因是一个或多个完整外显子的缺失，导致阅读框移位。例如，外显子45在杜氏患者中通常缺失。因为外显子45的长度为176bp，其不能被三整除，所有缺失外显子会使外显子46-79进入错误的阅读框。外显子44也是如此，其长度为148bp。然而，如果外显子44和451缺失，则缺失的总尺寸是324bp，可以被三整除。这样，两个外显子的缺失不会导致阅读框移位。由于这些外显子编码肌营养不良蛋白非必需的杆状结构域的一部分，因此从蛋白中缺失其有望导致温和的贝克型样表型。因此，由于一个或多个外显子缺失而具有杜氏表型的患者可以通过消除一个或多个相邻的外显子来恢复阅读框来进行治疗。这就是“外显子跳跃”背后的原理，在该原理中，修饰的寡核苷酸用于阻断肌营养不良蛋白前体mRNA中的剪接受体位点，从而在加工的转录物中不存在一个或多个特异性外显子。该方法已被用于通过跳跃外显子23来恢复mdx小鼠模型中肌营养不良蛋白基因的表达，外显子23携带诱导疾病的无意义突变(Mann等，(2001)Proc.Nat.Acad.Sci.USA 98:42-47)。诱导外显子51跳跃的寡核苷酸类似物在早期人临床试验中也显示出了希望(Benedetti等，(2013)FEBS J.280:4263-80)。这种方法的主要局限性是：(1)外显子跳跃过程效率低下，导致功能性肌营养不良蛋白表达水平相对较低；和(2)外显子跳跃寡核苷酸的半衰期相对较短，因此影响是短暂的，需要重复和终身给药。因此，尽管外显子跳跃方法在临床试验中显示出了一些前景，但疾病进展的改善是最小的，而且是可变的。

本公开通过在基因组DNA水平而不是前mRNA水平校正基因表达来改进当前的外显子跳跃的方法。本发明是DMD的永久性治疗，其涉及使用一对工程化、位点特异性的归巢核酸内切酶(通常称为大范围核酸酶)从肌营养不良蛋白编码序列中切除特定的外显子。通过将一对这样的核酸内切酶靶向肌营养不良蛋白基因外显子侧翼的内含子区域中的位点，可以从基因组中永久去除中间的片段。所得细胞及其子代将表达修饰的肌营养不良蛋白，其中部分非必需的血影蛋白重复序列结构域被去除，但必需的N-和C-末端结构域是完整的。

归巢核酸内切酶或大范围核酸酶是一组天然存在的核酸酶，其识别植物和真菌基因组中常见的15-40个碱基对切割位点。其经常与寄生虫DNA元件结合，如第1组自我剪接内含子和内含肽(intein)。其通过在染色体上产生双链断裂，自然地促进同源重组或基因插入宿主基因组的特定位置，从而招募细胞DNA修复机制(Stoddard(2006)Q.Rev.Biophys.38:49-95)。归巢核酸内切酶通常分为四个家族：LAGLIDADG家族、GIY-YIG家族、His-Cys盒家族和HNH家族。这些家族以结构基序为特征，影响催化活性和识别序列。例如，LAGLIDADG家族成员的特征是具有一个或两个保守的LAGLIDADD基序拷贝(参见，Chevalier等，(2001)Nucleic Acids Res.29:3757-74)。具有一个LAGLIDADG基序拷贝的LAGLIDADD归巢核酸内切酶形成同源二聚体，而发现具有两个LAGLIDADG基序的成员是单体。

I-CreI(SEQ ID NO:1)是归巢核酸内切酶LAGLIDADG家族的成员，其识别并切割藻类莱茵衣藻(Chlamydomonas reinhardtii)叶绿体染色体中的22个碱基对识别序列。遗传选择技术已被用于修饰野生型I-CreI切割位点的偏好(Sussman等，(2004)J.Mol.Biol.342:31-41；Chames等，(2005)Nucleic Acids Res.33:e178；Seligman等，(2002)Nucleic Acids Res.30:3870-79，Arnould等，(2006)J.Mol.Biol.355:443-58)。已描述了合理设计单LAGLIDADG归巢核酸内切酶的方法，该方法能够全面重新设计I-CreI和其他归巢核内切酶，以靶向广泛不同的DNA位点，包括在哺乳动物、酵母、植物、细菌和病毒基因组中的位点(WO 2007/047859)。

如WO 2009/059195中首次描述的，I-CreI及其工程化衍生物通常是二聚体，但可以使用连接第一亚基的C末端和第二亚基的N末端的短肽接头融合成单个多肽(Li等，(2009)Nucleic Acids Res.37:1650-62；Grizot等，(2009)Nucleic Acids Res.37:5405-19)。因此，可以从单个转录物表达功能性“单链”大范围核酸酶。通过将编码两种不同单链大范围核酸酶的基因递送到同一细胞中，可以同时切割两个不同的位点。这与用工程化大范围核酸酶观察到的极低的脱靶切割频率相结合，使其成为本公开的优选核酸内切酶。

发明内容

本公开提供了结合并切割肌营养不良蛋白基因(例如，人肌营养不良蛋白基因)中的识别序列的工程化大范围核酸酶，以及包含此类工程化大范围核酸酶的组合物及其使用方法。在一些实施方式中，通过在第一外显子上游的内含子中产生第一切割位点和在第二外显子下游的内含子中产生第二切割位点，使用工程化大范围核酸酶对从肌营养不良蛋白基因中去除多个外显子。在本文所述的特定实例中，第一切割位点是在肌营养不良蛋白基因外显子45上游的内含子5’中产生的，而第二切割位点是在外显子55下游的内含子3’中产生的。该过程允许在两个切割位点的退火和基因组的修复之后从肌营养不良蛋白基因中切除和去除外显子45-55。将所公开的工程化大范围核酸酶靶向的识别序列选择为具有相同的四个碱基对的中心序列，以使得第一和第二切割位点将具有互补的四个可以彼此完美连接的碱基对3’突出端(即，一个突出端的每个碱基对与另一突出端上的互补配对)。通过从缺乏一个或多个这些外显子的突变肌营养不良蛋白基因中去除外显子45-55，这种方法导致肌营养不良蛋白基因的正常(即，野生型)阅读框的恢复。如此处理的细胞将表达肌营养不良蛋白的缩短的修饰形式，其中一部分中心血影蛋白重复序列结构域不存在，但是N-和C-末端结构域完整。在很多情况下，这将降低疾病的严重程度。在一些情况下，其将导致更温和的贝克型表型。

因此，在一个方面中，本发明提供了结合并切割肌营养不良蛋白基因中的识别序列的工程化大范围核酸酶，其中所述工程化大范围核酸酶包含第一亚基和第二亚基，其中第一亚基与识别序列的第一识别半位点结合并包含第一高变(HVR1)区，和其中第二亚基与识别序列的第二识别半位点结合并包含第二高变(HVR2)区。

在一些实施方式中，识别序列包含SEQ ID NO:6。

在一些此类实施方式中，HVR1区包含与对应于SEQ ID NO:36-44中任一项的残基24-79的氨基酸序列具有至少80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高序列同一性的氨基酸序列。在一些实施方式中，HVR1区包含对应于SEQ IDNO:36-44中任一项的残基24、26、28、30、32、33、38、40、42、44、46、68、70、75和77的一个或多个残基。在一些实施方式中，HVR1区包含对应于SEQ ID NO:36-44中任一项的残基24、26、28、30、32、33、38、40、42、44、46、68、70、75和77的残基。在一些实施方式中，HVR1区在对应于SEQ ID NO:36-44中任一项的残基66的残基处包含Y、R、K或D。在一些实施方式中，HVR1区包含具有至多1、2、3、4、5、6、7、8、9、10或11个氨基酸置换的SEQ ID NO:36-44中任一项的残基24-79。在一些实施方式中，HVR1区包含SEQ ID NO:36-44中任一项的残基24-79。

在一些此类实施方式中，第一亚基包含与SEQ ID NO:36-44中任一项的残基7-153具有至少80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高序列同一性的氨基酸序列。在一些实施方式中，第一亚基在对应于SEQ ID NO:36-44中任一项的残基19的残基处包含G、S或A。在一些实施方式中，第一亚基包含对应于SEQ ID NO:36-44中任一项的残基19的残基。在一些实施方式中，第一亚基在对应于SEQ ID NO:36-44中任一项的残基80的残基处包含E、Q或K。在一些实施方式中，第一亚基包含对应于SEQ ID NO:38、39或149中任一项的残基80的残基。在一些实施方式中，第一亚基包含具有至多1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29或30个氨基酸置换的SEQ ID NO:36-44中任一项的残基7-153。在一些实施方式中，第一亚基包含SEQ IDNO:36-44中任一项的残基7-153。

在一些此类实施方式中，HVR2区包含与对应于SEQ ID NO:36-44中任一项的残基215-270的氨基酸序列具有至少80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高序列同一性的氨基酸序列。在一些实施方式中，HVR2区包含对应于SEQ IDNO:36-44中任一项的残基215、217、219、221、223、224、229、231、233、235、237、259、261、266和268的一个或多个残基。在一些实施方式中，HVR2区包含对应于SEQ ID NO:36-44中任一项的残基215、217、219、221、223、224、229、231、233、235、237、259、261、266和268的残基。在一些实施方式中，HVR2区在对应于SEQ ID NO:36-44中任一项的残基257的残基处包含Y、R、K或D。在一些实施方式中，HVR2区包含对应于SEQ ID NO:39的残基236的残基。在一些实施方式中，HVR2区包含对应于SEQ ID NO:37的残基239的残基。在一些实施方式中，HVR2区包含对应于SEQ ID NO:36-37中任一项的残基241的残基。在一些实施方式中，HVR2区包含对应于SEQ ID NO:36的残基263的残基。在一些实施方式中，HVR2区包含对应于SEQ ID NO:36-44中任一项的残基264的残基。在一些实施方式中，HVR2区包含具有至多1、2、3、4、5、6、7、8、9、10或11个氨基酸置换的SEQ ID NO:36-44中任一项的残基215-270。在一些实施方式中，HVR2区包含SEQ ID NO:36-44中任一项的残基215-270。

在一些此类实施方式中，第二亚基包含与对应于SEQ ID NO:36-44中任一项的残基198-344具有至少80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高序列同一性的氨基酸序列。在一些实施方式中，第二亚基在对应于SEQ ID NO:36-44中任一项的残基210的残基处包含G、S或A。在一些实施方式中，第二亚基在对应于SEQ IDNO:36-44中任一项的残基271的残基处包含E、Q或K。在一些实施方式中，第二亚基包含对应于SEQ ID NO:36、39、40、43或44中任一项的残基271的残基。在一些实施方式中，第二亚基包含对应于SEQ ID NO:36-38或40-44中任一项的残基330的残基。在一些实施方式中，第二亚基包含具有至多1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29或30个氨基酸置换的SEQ ID NO:36-44中任一项的残基198-344。在一些实施方式中，第二亚基包含SEQ ID NO:36-44中任一项的残基198-344。

在一些此类实施方式中，工程化大范围核酸酶是包含接头的单链大范围核酸酶，其中接头共价接合所述第一亚基和所述第二亚基。在一些实施方式中，工程化大范围核酸酶包含与SEQ ID NO:36-44中任一项具有至少80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高序列同一性的氨基酸序列。在一些实施方式中，工程化大范围核酸酶包含SEQ ID NO:36-44中任一项的氨基酸序列。在一些实施方式中，工程化大范围核酸酶是由与SEQ ID NO:60-68中任一项所示的核酸序列具有至少80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高序列同一性的核酸序列编码的。在一些实施方式中，工程化大范围核酸酶是由SEQ ID NO:60-68中任一项所示的核酸序列编码的。

在一些实施方式中，识别序列包含SEQ ID NO:10。

在一些此类实施方式中，HVR1区包含与对应于SEQ ID NO:45-52中任一项的残基24-79具有至少80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高序列同一性的氨基酸序列。在一些实施方式中，HVR1区包含对应于SEQ ID NO:45-52中任一项的残基26、28、30、32、33、38、40、42、44、46、68、70、75和77的一个或多个残基。在一些实施方式中，HVR1区包含对应于SEQ ID NO:45-52中任一项的残基24、26、28、30、32、33、38、40、42、44、46、68、70、75和77的残基。在一些实施方式中，HVR1区在对应于SEQ ID NO:45-52中任一项的残基66的残基处包含Y、R、K或D。在一些实施方式中，HVR1区包含具有至多1、2、3、4、5、6、7、8、9、10或11个氨基酸置换的SEQ ID NO:45-52任一项的残基24-79。在一些实施方式中，HVR1区包含SEQ ID NO:45-52中任一项的残基24-79。

在一些此类实施方式中，第一亚基包含与SEQ ID NO:45-52中任一项的残基7-153具有至少80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高序列同一性的氨基酸序列。在一些实施方式中，第一亚基在对应于SEQ ID NO:45-52中任一项的残基19的残基处包含G、S或A。在一些实施方式中，第一亚基包含对应于SEQ ID NO:45-52中任一项的残基19的残基。在一些实施方式中，第一亚基在对应于SEQ ID NO:45-52中任一项的残基80的残基处包含E、Q或K。在一些实施方式中，第一亚基包含对应于SEQ ID NO:45-51中任一项的残基80的残基。在一些实施方式中，第一亚基包含具有至多1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29或30个氨基酸置换的SEQ ID NO:45-52中任一项的残基7-153。在一些实施方式中，第一亚基包含SEQ ID NO:45-52中任一项的残基7-153。

在一些此类实施方式中，HVR2区包含与对应于SEQ ID NO:45-52中任一项的残基215-270的氨基酸序列具有至少80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高序列同一性的氨基酸序列。在一些实施方式中，HVR2区包含对应于SEQ IDNO:45-52中任一项的残基215、217、219、221、223、224、229、231、233、235、237、259、261、266和268的一个或多个残基。在一些实施方式中，HVR2区包含对应于SEQ ID NO:45-52中任一项的残基215、217、219、221、223、224、229、231、233、235、237、259、261、266和268的残基。在一些实施方式中，HVR2区在对应于SEQ ID NO:45-52中任一项的残基257的残基处包含Y、R、K或D。在一些实施方式中，HVR2区包含对应于SEQ ID NO:45-52中任一项的残基239、241和264的残基。在一些实施方式中，HVR2区包含对应于SEQ ID NO:45的残基250的残基。在一些实施方式中，HVR2区包含对应于SEQ ID NO:45或46中任一项的残基263的残基。在一些实施方式中，HVR2区包含具有至多1、2、3、4、5、6、7、8、9、10或11个氨基酸置换的SEQ ID NO:45-52中任一项的残基215-270。在一些实施方式中，HVR2区包含SEQ ID NO:45-52中任一项的残基215-270。

在一些此类实施方式中，第二亚基包含与SEQ ID NO:45-52中任一项的残基198-344具有至少80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高序列同一性的氨基酸序列。在一些实施方式中，第二亚基在对应于SEQ ID NO:45-52中任一项的残基210的残基处包含G、S或A。在一些实施方式中，第二亚基在对应于SEQ ID NO:45-52中任一项的残基271的残基处包含E、Q或K。在一些实施方式中，第二亚基包含对应于SEQID NO:52的残基271的残基。在一些实施方式中，第二亚基包含对应于SEQ ID NO:45-52中任一项的残基330的残基。在一些实施方式中，第二亚基包含具有至多1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29或30个氨基酸置换的SEQ ID NO:45-52中任一项的残基198-344。在一些实施方式中，第二亚基包含SEQ ID NO:45-52中任一项的残基198-344。

在一些此类实施方式中，工程化大范围核酸酶是包含接头的单链大范围核酸酶，其中接头共价接合所述第一亚基和所述第二亚基。在一些实施方式中，工程化大范围核酸酶包含与SEQ ID NO:45-52中任一项具有至少80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高序列同一性的氨基酸序列。在一些实施方式中，工程化大范围核酸酶包含SEQ ID NO:45-52中任一项的氨基酸序列。在一些实施方式中，工程化大范围核酸酶由核酸序列编码，所述核酸序列与SEQ ID NO:69-76中任一项所示的核酸序列具有至少80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高序列同一性。在一些实施方式中，工程化大范围核酸酶由SEQ ID NO:69-76中任一项所示的核酸序列编码。

在一些实施方式中，识别序列包含SEQ ID NO:12。

在一些此类实施方式中，HVR1区包含与对应于SEQ ID NO:53-59中任一项的残基24-79的氨基酸序列具有至少80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高序列同一性的氨基酸序列。在一些实施方式中，HVR1区包含对应于SEQ IDNO:53-59中任一项的残基24、26、28、30、32、33、38、40、42、44、46、68、70、75和77的一个或多个残基。在一些实施方式中，HVR1区包含对应于SEQ ID NO:53-59中任一项的残基24、26、28、30、32、33、38、40、42、44、46、68、70、75和77的残基。在一些实施方式中，HVR1区在对应于SEQ ID NO:53-59中任一项的残基66的残基处包含Y、R、K或D。在一些实施方式中，HVR1区包含对应于SEQ ID NO:54的残基64的残基。在一些实施方式中，HVR1区包含具有至多1、2、3、4、5、6、7、8、9、10或11个氨基酸置换的SEQ ID NO:53-59中任一项的残基24-79。在一些实施方式中，HVR1区包含SEQ ID NO:53-59中任一项的残基24-79。

在一些此类实施方式中，第一亚基包含与SEQ ID NO:53-59中任一项的残基7-153具有至少80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高序列同一性的氨基酸序列。在一些实施方式中，第一亚基在对应于SEQ ID NO:53-59中任一项的残基19的残基处包含G、S或A。在一些实施方式中，第一亚基包含对应于SEQ ID NO:53-59中任一项的残基19的残基。在一些实施方式中，第一亚基在对应于SEQ ID NO:53-59中任一项的残基80的残基处包含E、Q或K。在一些实施方式中，第一亚基包含对应于SEQ ID NO:53-55、57或58中任一项的残基80的残基。在一些实施方式中，第一亚基包含具有至多1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29或30个氨基酸置换的SEQ ID NO:53-59中任一项的残基7-153。在一些实施方式中，第一亚基包含SEQID NO:53-59中任一项的残基7-153。

在一些此类实施方式中，HVR2区包含与对应于SEQ ID NO:53-59中任一项的残基215-270的氨基酸序列具有至少80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高序列同一性的氨基酸序列。在一些实施方式中，HVR2区包含对应于SEQ IDNO:53-59中任一项的残基215、217、219、221、223、224、229、231、233、235、237、259、261、266和268的一个或多个残基。在一些实施方式中，HVR2区包含对应于SEQ ID NO:53-59中任一项的残基215、217、219、221、223、224、229、231、233、235、237、259、261、266和268的残基。在一些实施方式中，HVR2区在对应于SEQ ID NO:53-59中任一项的残基257的残基处包含Y、R、K或D。在一些实施方式中，HVR2区包含对应于SEQ ID NO:53或SEQ ID NO:55的残基239的残基。在一些实施方式中，HVR2区包含对应于SEQ ID NO:53-55中任一项的残基241的残基。在一些实施方式中，HVR2区包含对应于SEQ ID NO:55的残基255的残基。在一些实施方式中，HVR2区包含对应于SEQ ID NO:56-59中任一项的残基263的残基。在一些实施方式中，HVR2区包含对应于SEQ ID NO:53-59中任一项的残基264的残基。在一些实施方式中，HVR2区包含具有至多1、2、3、4、5、6、7、8、9、10或11个氨基酸置换的SEQ ID NO:53-59中任一项的残基215-270。在一些实施方式中，HVR2区包含SEQ ID NO:53-59中任一项的残基215-270。

在一些此类实施方式中，第二亚基包含与SEQ ID NO:53-59中任一项的残基198-344具有至少80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高序列同一性的氨基酸序列。在一些实施方式中，第二亚基在对应于SEQ ID NO:53-59中任一项的残基210的残基处包含G、S或A。在一些实施方式中，第二亚基在对应于SEQ ID NO:53-59中任一项的残基271的残基处包含E、Q或K。在一些实施方式中，第二亚基包含对应于SEQID NO:53或55-59中任一项的残基271的残基。在一些实施方式中，第二亚基包含对应于SEQID NO:54-59中任一项的残基330的残基。在一些实施方式中，第二亚基包含具有至多1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29或30个氨基酸置换的SEQ ID NO:53-59中任一项的残基198-344。在一些实施方式中，第二亚基包含SEQ ID NO:53-59中任一项的残基198-344。

在一些此类实施方式中，工程化大范围核酸酶是包含接头的单链大范围核酸酶，其中接头共价接合所述第一亚基和所述第二亚基。在一些实施方式中，工程化大范围核酸酶包含与SEQ ID NO:53-59中任一项具有至少80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高序列同一性的氨基酸序列。在一些实施方式中，工程化大范围核酸酶包含SEQ ID NO:53-59中任一项的氨基酸序列。在一些实施方式中，工程化大范围核酸酶由核酸序列编码，所述核酸序列与SEQ ID NO:77-83中任一项所示的核酸序列具有至少80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高序列同一性。在一些实施方式中，工程化大范围核酸酶由SEQ ID NO:77-83中任一项所示的核酸序列编码。

在上述各个实施方式中，工程化大范围核酸酶可以包含核定位信号。在一些实施方式中，核定位信号在工程化大范围核酸酶的N末端。在一些实施方式中，核定位信号包含与SEQ ID NO:3具有至少80％或至少90％序列同一性的氨基酸序列。在一些实施方式中，核定位信号包含SEQ ID NO:3。

在另一个方面中，本发明提供了一种多核苷酸，其包含编码本文所述的工程化大范围核酸酶的核酸序列。在一些实施方式中，多核苷酸是mRNA。

在另一个方面中，本发明提供了一种重组DNA构建体，其包含含有编码本文所述的工程化大范围核酸酶的核酸序列的多核苷酸。

在一些实施方式中，重组DNA构建体编码包含多核苷酸的重组病毒。在一些实施方式中，重组病毒是重组腺病毒、重组慢病毒、重组逆转录病毒或重组AAV。在一些实施方式中，重组病毒是重组AAV。在一些实施方式中，重组AAV具有rh.74衣壳。在一些实施方式中，重组AAV具有AAV9衣壳。在一些实施方式中，rh.74衣壳包含与SEQ ID NO:182具有至少80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高同一性的氨基酸序列。在一些实施方式中，rh.74衣壳包含SEQ ID NO:182的氨基酸序列。在一些实施方式中，AAV9衣壳包含与SEQ ID NO:183具有至少80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高同一性的氨基酸序列。在一些实施方式中，AAV9衣壳包含SEQ ID NO:183的氨基酸序列。在一些实施方式中，重组AAV具有AAV8衣壳。

在一些实施方式中，核酸序列包含启动子，所述启动子与编码本文所述的工程化大范围核酸酶的核酸序列可操作地连接。在一些实施方式中，启动子是肌肉特异性启动子。在一些实施方式中，肌肉特异性启动子包括MCK启动子、C5-12启动子、spc 5-12启动子、MHCK7启动子、CK8启动子、SK-CRM4启动子、SP-301启动子、SP-817启动子或SP-905启动子。在一些实施方式中，启动子能够在肌前体细胞(例如，卫星细胞或干细胞)中表达本文所述的工程化大范围核酸酶。

在另一个方面中，本发明提供了一种重组病毒，其包含含有编码本文所述的工程化大范围核酸酶的核酸序列的多核苷酸。

在一些实施方式中，重组病毒是重组腺病毒、重组慢病毒、重组逆转录病毒或重组AAV。在一些实施方式中，重组病毒是重组AAV。在一些实施方式中，重组AAV具有rh.74衣壳。在一些实施方式中，rh.74衣壳包含与SEQ ID NO:182具有至少80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高同一性的氨基酸序列。在一些实施方式中，rh.74衣壳包含SEQ ID NO:182的氨基酸序列。在一些实施方式中，重组AAV具有AAV9衣壳。在一些实施方式中，AAV9衣壳包含与SEQ ID NO:183具有至少80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高同一性的氨基酸序列。在一些实施方式中，AAV9衣壳包含SEQ ID NO:183的氨基酸序列。在一些实施方式中，重组AAV具有AAV8衣壳。

在一些实施方式中，多核苷酸包含启动子，所述启动子与编码本文所述的工程化大范围核酸酶的核酸序列可操作地连接。在一些实施方式中，启动子是肌肉特异性启动子。在一些实施方式中，肌肉特异性启动子包括MCK启动子、C5-12启动子、spc 5-12启动子、MHCK7启动子、CK8启动子、SK-CRM4启动子、SP-301启动子、SP-817启动子或SP-905启动子。在一些实施方式中，启动子能够在肌前体细胞(例如，卫星细胞或干细胞)中表达本文所述的工程化大范围核酸酶。

在另一个方面中，本发明提供了一种脂质纳米颗粒组合物，其包含含有多核苷酸的脂质纳米颗粒，其中所述多核苷酸包含编码本文所述的工程化大范围核酸酶的核酸序列。在一些实施方式中，多核苷酸是mRNA。

在另一个方面中，本发明提供了一种药物组合物，其包含药学上可接受的载体和本文所述的工程化大范围核酸酶。

在另一个方面中，本发明提供了一种药物组合物，其包含药学上可接受的载体和本文所述的多核苷酸。

在另一个方面中，本发明提供了一种药物组合物，其包含药学上可接受的载体和本文所述的重组DNA构建体。

在另一个方面中，本发明提供了一种药物组合物，其包含药学上可接受的载体和本文所述的重组病毒。

在另一个方面中，本发明提供了一种药物组合物，其包含药学上可接受的载体和本文所述的脂质纳米颗粒组合物。

在另一个方面中，本发明提供了一种多核苷酸，其包含编码第一工程化大范围核酸酶的第一核酸序列和编码第二工程化大范围核酸酶的第二核酸序列，其中第一工程化大范围核酸酶是结合并切割包含SEQ ID NO:6的识别序列的本文所述的工程化大范围核酸酶，和其中第二工程化大范围核酸酶是结合并切割包含SEQ ID NO:10的识别序列的本文所述的工程化大范围核酸酶，或其中第二工程化大范围核酸酶是结合并切割包含SEQ ID NO:12的识别序列的本文所述的工程化大范围核酸酶。

在一些实施方式中，第一工程化大范围核酸酶是结合并切割包含SEQ ID NO:6的识别序列的本文所述的工程化大范围核酸酶，和第二工程化大范围核酸酶是结合并切割包含SEQ ID NO:10的识别序列的本文所述的工程化大范围核酸酶。在一些实施方式中，第一工程化大范围核酸酶和第二工程化大范围核酸酶选自表1中提供的大范围核酸酶(以及本文所述的其变体)的组合。

表1：

在一些实施方式中，第一工程化大范围核酸酶是DMD 19-20x.13(SEQ ID NO:36)，或本文所述的其变体，和第二工程化大范围核酸酶是DMD 35-36x.63(SEQ ID NO:45)，或本文所述的其变体。在一些实施方式中，第一工程化大范围核酸酶是DMD 19-20x.87(SEQ IDNO:37)，或本文所述的其变体，和第二工程化大范围核酸酶是DMD 35-36x.81(SEQ ID NO:46)，或本文所述的其变体。在一些实施方式中，第一工程化大范围核酸酶是DMD 19-20x.13(SEQ ID NO:36)，或本文所述的其变体，和第二工程化大范围核酸酶是DMD 35-36x.81(SEQID NO:46)，或本文所述的其变体。在一些实施方式中，第一工程化大范围核酸酶是DMD 19-20x.87(SEQ ID NO:37)，或本文所述的其变体，和第二工程化大范围核酸酶是DMD 35-36x.63(SEQ ID NO:45)，或本文所述的其变体。在一些实施方式中，第一工程化大范围核酸酶是DMD 19-20L.249(SEQ ID NO:38)，或本文所述的其变体，和第二工程化大范围核酸酶是DMD 35-36L.195(SEQ ID NO:47)，或本文所述的其变体。在一些实施方式中，第一工程化大范围核酸酶是DMD 19-20L.302(SEQ ID NO:39)，或本文所述的其变体，和第二工程化大范围核酸酶是DMD 35-36L.282(SEQ ID NO:48)，或本文所述的其变体。在一些实施方式中，第一工程化大范围核酸酶是DMD 19-20L.329(SEQ ID NO:40)，或本文所述的其变体，和第二工程化大范围核酸酶是DMD 35-36L.282(SEQ ID NO:48)，或本文所述的其变体。在一些实施方式中，第一工程化大范围核酸酶是DMD 19-20L.302(SEQ ID NO:39)，或本文所述的其变体，和第二工程化大范围核酸酶是DMD 35-36L.349(SEQ ID NO:49)，或本文所述的其变体。在一些实施方式中，第一工程化大范围核酸酶是DMD 19-20L.329(SEQ ID NO:40)，或本文所述的其变体，和第二工程化大范围核酸酶是DMD 35-36L.349(SEQ ID NO:49)，或本文所述的其变体。

在某些实施方式中，第一工程化大范围核酸酶是结合并切割包含SEQ ID NO:6的识别序列的本文所述的工程化大范围核酸酶，和第二工程化大范围核酸酶是结合并切割包含SEQ ID NO:12的识别序列的本文所述的工程化大范围核酸酶。在一些实施方式中，第一工程化大范围核酸酶和第二工程化大范围核酸酶选自表2中提供的大范围核酸酶(以及本文所述的其变体)的组合。

表2：

在一些实施方式中，第一工程化大范围核酸酶是DMD 19-20x.13(SEQ ID NO:36)，或本文所述的其变体，和第二工程化大范围核酸酶是DMD37-38x.15(SEQ ID NO:53)，或本文所述的其变体。在一些实施方式中，第一工程化大范围核酸酶是DMD 19-20x.87(SEQ IDNO:37)，或本文所述的其变体，和第二工程化大范围核酸酶是DMD37-38x.15(SEQ ID NO:53)，或本文所述的其变体。在一些实施方式中，第一工程化大范围核酸酶是DMD 19-20x.13(SEQ ID NO:36)，或本文所述的其变体，和第二工程化大范围核酸酶是DMD37-38x.66(SEQID NO:54)，或本文所述的其变体。在一些实施方式中，第一工程化大范围核酸酶是DMD 19-20x.87(SEQ ID NO:37)，或本文所述的其变体，和第二工程化大范围核酸酶是DMD37-38x.66(SEQ ID NO:54)，或本文所述的其变体。在一些实施方式中，第一工程化大范围核酸酶是DMD 19-20x.13(SEQ ID NO:36)，或本文所述的其变体，和第二工程化大范围核酸酶是DMD37-38x.79(SEQ ID NO:55)，或本文所述的其变体。在一些实施方式中，第一工程化大范围核酸酶是DMD 19-20x.87(SEQ ID NO:37)，或本文所述的其变体，和第二工程化大范围核酸酶是DMD37-38x.79(SEQ ID NO:55)，或本文所述的其变体。在一些实施方式中，第一工程化大范围核酸酶是DMD 19-20L.249(SEQ ID NO:38)，或本文所述的其变体，和第二工程化大范围核酸酶是DMD37-38L.166(SEQ ID NO:56)，或本文所述的其变体。

在一些实施方式中，多核苷酸是mRNA。在一些实施方式中，第一核酸序列和第二核酸序列被IRES或2A序列所分隔。在某些实施方式中，2A序列是T2A、P2A、E2A或F2A序列。

在另一个方面中，本发明提供了一种重组DNA构建体，其包含本文所述的多核苷酸(即，其包含编码第一工程化大范围核酸酶的第一核酸序列和编码第二工程化大范围核酸酶的第二核酸序列)。

在一些实施方式中，第一核酸序列和第二核酸序列被IRES或2A序列所分隔。在某些实施方式中，2A序列是T2A、P2A、E2A或F2A序列。

在一些实施方式中，多核苷酸包含启动子，所述启动子与第一核酸序列和第二核酸序列可操作地连接。在一些实施方式中，启动子是肌肉特异性启动子。在一些实施方式中，肌肉特异性启动子包括MCK启动子、C5-12启动子、spc 5-12启动子、MHCK7启动子、CK8启动子、SK-CRM4启动子、SP-301启动子、SP-817启动子或SP-905启动子。在一些实施方式中，启动子能够在肌前体细胞(例如，卫星细胞或干细胞)中表达本文所述的第一和第二工程化大范围核酸酶。

在一些实施方式中，多核苷酸包含与第一核酸序列可操作地连接的第一启动子和与第二核酸序列可操作地连接的第二启动子。在一些实施方式中，第一启动子和第二启动子是肌肉特异性启动子。在一些实施方式中，肌特异性启动子包括MCK启动子、C5-12启动子、spc5-12启动子、MHCK7启动子、CK8启动子、SK-CRM4启动子、SP-301启动子、SP-817启动子、SP-905启动子或其组合。在一些实施方式中，启动子能够在肌前体细胞(例如，卫星细胞或干细胞)中表达本文所述的第一和第二工程化大范围核酸酶。

在另一个方面中，本发明提供了一种重组病毒，其包含本文所述的多核苷酸(即，其包含编码第一工程化大范围核酸酶的第一核酸序列和编码第二工程化大范围核酸酶的第二核酸序列)。

在一些实施方式中，多核苷酸包含启动子，所述启动子与第一核酸序列和第二核酸序列可操作地连接。在一些实施方式中，第一核酸序列和第二核酸序列被IRES或2A序列所分隔。在某些实施方式中，2A序列是T2A、P2A、E2A或F2A序列。

在一些实施方式中，启动子是肌肉特异性启动子。在一些实施方式中，肌肉特异性启动子包括MCK启动子、C5-12启动子、spc 5-12启动子、MHCK7启动子、CK8启动子、SK-CRM4启动子、SP-301启动子、SP-817启动子或SP-905启动子。在一些实施方式中，启动子能够在肌前体细胞(例如，卫星细胞或干细胞)中表达本文所述的工程化大范围核酸酶。

在一些实施方式中，多核苷酸包含与第一核酸序列可操作地连接的第一启动子和与第二核酸序列可操作地连接的第二启动子。在一些实施方式中，第一启动子和第二启动子是肌肉特异性启动子。在一些实施方式中，肌特异性启动子包括MCK启动子、C5-12启动子、spc5-12启动子、MHCK7启动子、CK8启动子、SK-CRM4启动子、SP-301启动子、SP-817启动子、SP-905启动子或其组合。在一些实施方式中，启动子能够在肌前体细胞(例如，卫星细胞或干细胞)中表达本文所述的工程化大范围核酸酶。在一些实施方式中，重组病毒是重组腺病毒、重组慢病毒、重组逆转录病毒或重组AAV。在一些实施方式中，重组病毒是重组AAV。在一些实施方式中，重组AAV具有rh.74衣壳。在一些实施方式中，重组AAV具有AAV9衣壳。在一些实施方式中，rh.74衣壳包含与SEQ ID NO:182具有至少80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高同一性的氨基酸序列。在一些实施方式中，rh.74衣壳包含SEQ ID NO:182的氨基酸序列。在一些实施方式中，AAV9衣壳包含与SEQ IDNO:183具有至少80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高同一性的氨基酸序列。在一些实施方式中，AAV9衣壳包含SEQ ID NO:183的氨基酸序列。在一些实施方式中，重组AAV具有AAV8衣壳。

在另一个方面中，本发明提供了一种脂质纳米颗粒组合物，其包含含有本文所述的多核苷酸的脂质纳米颗粒(即，其包含编码第一工程化大范围核酸酶的第一核酸序列和编码第二工程化大范围核酸酶的第二核酸序列)。

在一些实施方式中，多核苷酸是本文所述的mRNA。在一些实施方式中，多核苷酸是本文所述的重组DNA构建体。

在另一个方面中，本发明提供了一种药物组合物，其包含药学上可接受的载体和本文所述的多核苷酸(即，其包含编码第一工程化大范围核酸酶的第一核酸序列和编码第二工程化大范围核酸酶的第二核酸序列)。

在一些实施方式中，多核苷酸包含本文所述的mRNA。在一些实施方式中，多核苷酸包含本文所述的重组DNA构建体。在一些实施方式中，药物组合物包含本文所述的重组病毒。一些实施方式中，药物组合物包含本文所述的脂质纳米颗粒组合物。

在另一个方面中，本发明提供了一种用于制备在遗传修饰的真核细胞的肌营养不良蛋白基因中具有修饰的靶序列的遗传修饰的真核细胞的方法，所述方法包括：将多核苷酸引入真核细胞中，所述多核苷酸包含编码本文所述的工程化大范围核酸酶的核酸序列，其中在真核细胞中表达工程化大范围核酸酶，和其中工程化大范围核酸酶在包含SEQ IDNO:6的识别序列处在肌营养不良蛋白基因中产生切割位点。在一些实施方式中，真核细胞是哺乳动物细胞。在一些实施方式中，哺乳动物细胞是肌细胞。在一些实施方式中，肌细胞是肌前体细胞(例如，卫星细胞或干细胞)、骨骼肌细胞或心肌细胞。在一些实施方式中，哺乳动物细胞是人细胞。在一些实施方式中，通过脂质纳米颗粒、mRNA或重组病毒(例如，重组AAV)将多核苷酸引入真核细胞中。

在另一个方面中，本发明提供了一种用于制备在遗传修饰的真核细胞的肌营养不良蛋白基因中具有修饰的靶序列的遗传修饰的真核细胞的方法，所述方法包括：将本文所述的工程化大范围核酸酶引入真核细胞中，其中工程化大范围核酸酶在包含SEQ ID NO:6的识别序列处在肌营养不良蛋白基因中产生切割位点。在一些实施方式中，真核细胞是哺乳动物细胞。在一些实施方式中，哺乳动物细胞是肌细胞。在一些实施方式中，肌细胞是肌前体细胞(例如，卫星细胞或干细胞)、骨骼肌细胞或心肌细胞。在一些实施方式中，哺乳动物细胞是人细胞。

在另一个方面中，本发明提供了一种用于产生遗传修饰的真核细胞的方法，其包括将目标外源序列插入遗传修饰的真核细胞的肌营养不良蛋白基因中，所述方法包括将一种或多种多核苷酸引入真核细胞中，其包含：编码本文所述的工程化大范围核酸酶的第一核酸序列，其中在真核细胞中表达工程化大范围核酸酶；和包含目标序列的第二核酸序列，其中工程化大范围核酸酶在包含SEQ ID NO:6的识别序列处在肌营养不良蛋白基因中产生切割位点，和其中在切割位点处将目标序列插入肌营养不良蛋白基因中。在一些实施方式中，第二核酸序列包含与切割位点侧翼的核酸序列同源的核酸序列，并且目标序列通过同源重组插入切割位点。在一些实施方式中，真核细胞是哺乳动物细胞。在一些实施方式中，哺乳动物细胞是肌细胞。在一些实施方式中，肌细胞是肌前体细胞(例如，卫星细胞或干细胞)、骨骼肌细胞或心肌细胞。在一些实施方式中，哺乳动物细胞是人细胞。在一些实施方式中，通过脂质纳米颗粒、mRNA或重组病毒(例如，重组AAV)将一种或多种多核苷酸引入真核细胞中。

在另一个方面中，本发明提供了一种用于产生遗传修饰的真核细胞的方法，其包括将目标外源序列插入遗传修饰的真核细胞的肌营养不良蛋白基因中，所述方法包括将本文所述的工程化大范围核酸酶和包含目标序列的多核苷酸引入真核细胞中，其中工程化大范围核酸酶在包含SEQ ID NO:6的识别序列处在肌营养不良蛋白基因中产生切割位点，和其中在切割位点处将目标序列插入肌营养不良蛋白基因中。在一些实施方式中，多核苷酸包含与切割位点侧翼的核酸序列同源的核酸序列，并且目标序列通过同源重组插入切割位点。在一些实施方式中，真核细胞是哺乳动物细胞。在一些实施方式中，哺乳动物细胞是肌细胞。在一些实施方式中，肌细胞是肌前体细胞(例如，卫星细胞或干细胞)、骨骼肌细胞或心肌细胞。在一些实施方式中，哺乳动物细胞是人细胞。在一些实施方式中，通过脂质纳米颗粒、mRNA或重组病毒(例如，重组AAV)将多核苷酸引入真核细胞中。

在另一个方面中，本发明提供了用于制备在遗传修饰的真核细胞的肌营养不良蛋白基因中具有修饰的靶序列的遗传修饰的真核细胞的方法，所述方法包括：将多核苷酸引入真核细胞中，所述多核苷酸包含编码本文所述的工程化大范围核酸酶的核酸序列，其中在真核细胞中表达工程化大范围核酸酶，和其中工程化大范围核酸酶在包含SEQ ID NO:10的识别序列处在肌营养不良蛋白基因中产生切割位点。在一些实施方式中，真核细胞是哺乳动物细胞。在一些实施方式中，哺乳动物细胞是肌细胞。在一些实施方式中，肌细胞是肌前体细胞(例如，卫星细胞或干细胞)、骨骼肌细胞或心肌细胞。在一些实施方式中，哺乳动物细胞是人细胞。在一些实施方式中，通过脂质纳米颗粒、mRNA或重组病毒(例如，重组AAV)将多核苷酸引入真核细胞中。

在另一个方面中，本发明提供了用于制备在遗传修饰的真核细胞的肌营养不良蛋白基因中具有修饰的靶序列的遗传修饰的真核细胞的方法，所述方法包括：将本文所述的工程化大范围核酸酶引入真核细胞中，其中工程化大范围核酸酶在包含SEQ ID NO:10的识别序列处在肌营养不良蛋白基因中产生切割位点。在一些实施方式中，真核细胞是哺乳动物细胞。在一些实施方式中，哺乳动物细胞是肌细胞。在一些实施方式中，肌细胞是肌前体细胞(例如，卫星细胞或干细胞)、骨骼肌细胞或心肌细胞。在一些实施方式中，哺乳动物细胞是人细胞。

在另一个方面中，本发明提供了一种用于产生遗传修饰的真核细胞的方法，其包括将目标外源序列插入遗传修饰的真核细胞的肌营养不良蛋白基因中，所述方法包括将一种或多种多核苷酸引入真核细胞中，其包含：编码本文所述的工程化大范围核酸酶的第一核酸序列，其中在真核细胞中表达工程化大范围核酸酶；和包含目标序列的第二核酸序列，其中工程化大范围核酸酶在包含SEQ ID NO:10的识别序列处在肌营养不良蛋白基因中产生切割位点，和其中在切割位点处将目标序列插入肌营养不良蛋白基因中。在一些实施方式中，第二核酸序列包含与切割位点侧翼的核酸序列同源的核酸序列，并且目标序列通过同源重组插入切割位点处。在一些实施方式中，真核细胞是哺乳动物细胞。在一些实施方式中，哺乳动物细胞是肌细胞。在一些实施方式中，肌细胞是肌前体细胞(例如，卫星细胞或干细胞)、骨骼肌细胞或心肌细胞。在一些实施方式中，哺乳动物细胞是人细胞。在一些实施方式中，通过脂质纳米颗粒、mRNA或重组病毒(例如，重组AAV)将一种或多种多核苷酸引入真核细胞中。

在另一个方面中，本发明提供了一种用于产生遗传修饰的真核细胞的方法，其包括将目标外源序列插入遗传修饰的真核细胞的肌营养不良蛋白基因中，所述方法包括将本文所述的工程化大范围核酸酶和包含目标序列的多核苷酸引入真核细胞中，其中工程化大范围核酸酶在包含SEQ ID NO:10的识别序列处在肌营养不良蛋白基因中产生切割位点，和其中在切割位点处将目标序列插入肌营养不良蛋白基因中。在一些实施方式中，多核苷酸包含与切割位点侧翼的核酸序列同源的核酸序列，并且目标序列通过同源重组插入切割位点处。在一些实施方式中，真核细胞是哺乳动物细胞。在一些实施方式中，哺乳动物细胞是肌细胞。在一些实施方式中，肌细胞是肌前体细胞(例如，卫星细胞或干细胞)、骨骼肌细胞或心肌细胞。在一些实施方式中，哺乳动物细胞是人细胞。在一些实施方式中，通过脂质纳米颗粒、mRNA或重组病毒(例如，重组AAV)将多核苷酸引入真核细胞中。

在另一个方面中，本发明提供了用于制备在遗传修饰的真核细胞的肌营养不良蛋白基因中具有修饰的靶序列的遗传修饰的真核细胞的方法，所述方法包括：将多核苷酸引入真核细胞中，所述多核苷酸包含编码本文所述的工程化大范围核酸酶的核酸序列，其中在真核细胞中表达工程化大范围核酸酶，和其中工程化大范围核酸酶在包含SEQ ID NO:12的识别序列处在肌营养不良蛋白基因中产生切割位点。在一些实施方式中，真核细胞是哺乳动物细胞。在一些实施方式中，哺乳动物细胞是肌细胞。在一些实施方式中，肌细胞是肌前体细胞(例如，卫星细胞或干细胞)、骨骼肌细胞或心肌细胞。在一些实施方式中，哺乳动物细胞是人细胞。在一些实施方式中，通过脂质纳米颗粒、mRNA或重组病毒(例如，重组AAV)将多核苷酸引入真核细胞中。

在另一个方面中，本发明提供了用于制备在遗传修饰的真核细胞的肌营养不良蛋白基因中具有修饰的靶序列的遗传修饰的真核细胞的方法，所述方法包括：将本文所述的工程化大范围核酸酶引入真核细胞中，其中工程化大范围核酸酶在包含SEQ ID NO:12的识别序列处在肌营养不良蛋白基因中产生切割位点。在一些实施方式中，真核细胞是哺乳动物细胞。在一些实施方式中，哺乳动物细胞是肌细胞。在一些实施方式中，肌细胞是肌前体细胞(例如，卫星细胞或干细胞)、骨骼肌细胞或心肌细胞。在一些实施方式中，哺乳动物细胞是人细胞。

在另一个方面中，本发明提供了一种用于产生遗传修饰的真核细胞的方法，其包括将目标外源序列插入遗传修饰的真核细胞的肌营养不良蛋白基因中，所述方法包括将一种或多种多核苷酸引入真核细胞中，所述多核苷酸包含：编码本文所述的工程化大范围核酸酶的第一核酸序列，其中在真核细胞中表达工程化大范围核酸酶；和包含目标序列的第二核酸序列，其中工程化大范围核酸酶在包含SEQ ID NO:12的识别序列处在肌营养不良蛋白基因中产生切割位点，和其中在切割位点处将目标序列插入肌营养不良蛋白基因中。在一些实施方式中，第二核酸序列包含与切割位点侧翼的核酸序列同源的核酸序列，并且目标序列通过同源重组插入切割位点处。在一些实施方式中，真核细胞是哺乳动物细胞。在一些实施方式中，哺乳动物细胞是肌细胞。在一些实施方式中，肌细胞是肌前体细胞(例如，卫星细胞或干细胞)、骨骼肌细胞或心肌细胞。在一些实施方式中，哺乳动物细胞是人细胞。在一些实施方式中，通过脂质纳米颗粒、mRNA或重组病毒(例如，重组AAV)将一种或多种多核苷酸引入真核细胞中。

在另一个方面中，本发明提供了一种用于产生遗传修饰的真核细胞的方法，其包括将目标外源序列插入遗传修饰的真核细胞的肌营养不良蛋白基因中，所述方法包括将本文所述的工程化大范围核酸酶和包含目标序列的多核苷酸引入真核细胞中，其中工程化大范围核酸酶在包含SEQ ID NO:12的识别序列处在肌营养不良蛋白基因中产生切割位点，和其中在切割位点处将目标序列插入肌营养不良蛋白基因中。在一些实施方式中，多核苷酸包含与切割位点侧翼的核酸序列同源的核酸序列，并且目标序列通过同源重组插入切割位点处。在一些实施方式中，真核细胞是哺乳动物细胞。在一些实施方式中，哺乳动物细胞是肌细胞。在一些实施方式中，肌细胞是肌前体细胞(例如，卫星细胞或干细胞)、骨骼肌细胞或心肌细胞。在一些实施方式中，哺乳动物细胞是人细胞。在一些实施方式中，通过脂质纳米颗粒、mRNA或重组病毒(例如，重组AAV)将多核苷酸引入真核细胞中。

在另一个方面中，本发明提供了一种用于产生遗传修饰的真核细胞的方法，所述真核细胞包含修饰的肌营养不良蛋白基因，所述方法包括：将一种或多种多核苷酸引入真核细胞中，所述多核苷酸包含编码第一工程化核酸酶的第一核酸序列和编码第二工程化核酸酶的第二核酸序列，其中第一工程化核酸酶结合并切割在外显子45上游内含子5’中的识别序列，和其中第二工程化核酸酶结合并切割在外显子55下游内含子3’中的识别序列，其中在真核细胞中表达第一工程化核酸酶和第二工程化核酸酶，其中第一工程化核酸酶在其识别序列处在肌营养不良蛋白基因中产生第一切割位点，其中第二工程化核酸酶在其识别序列处在肌营养不良蛋白基因中产生第二切割位点，其中第一切割位点和第二切割位点具有互补的突出端，其中第一切割位点和第二切割位点之间的中间基因组DNA从肌营养不良蛋白基因中切除，和其中肌营养不良蛋白基因退火以产生修饰的肌营养不良蛋白基因。

在一些实施方式中，第一工程化核酸酶是结合并切割包含SEQ ID NO:6的识别序列的本文所述的工程化大范围核酸酶，和第二工程化核酸酶是结合并切割包含SEQ ID NO:10的识别序列的本文所述的工程化大范围核酸酶。在一些实施方式中，第一工程化大范围核酸酶和第二工程化大范围核酸酶选自表1中提供的大范围核酸酶(以及本文所述的其变体)的组合。在此类实施方式中，第一切割位点和第二切割位点具有互补性3’突出端。在一些实施方式中，第一工程化大范围核酸酶是DMD 19-20x.13(SEQ ID NO:36)，或本文所述的其变体，和第二工程化大范围核酸酶是DMD35-36x.63(SEQ ID NO:45)，或本文所述的其变体。在一些实施方式中，第一工程化大范围核酸酶是DMD 19-20x.87(SEQ ID NO:37)，或本文所述的其变体，和第二工程化大范围核酸酶是DMD35-36x.81(SEQ ID NO:46)，或本文所述的其变体。在一些实施方式中，第一工程化大范围核酸酶是DMD 19-20x.13(SEQ ID NO:36)，或本文所述的其变体，和第二工程化大范围核酸酶是DMD35-36x.81(SEQ ID NO:46)，或本文所述的其变体。在一些实施方式中，第一工程化大范围核酸酶是DMD 19-20x.87(SEQID NO:37)，或本文所述的其变体，和第二工程化大范围核酸酶是DMD35-36x.63(SEQ IDNO:45)，或本文所述的其变体。在一些实施方式中，第一工程化大范围核酸酶是DMD 19-20L.249(SEQ ID NO:38)，或本文所述的其变体，和第二工程化大范围核酸酶是DMD35-36L.195(SEQ ID NO:47)，或本文所述的其变体。在一些实施方式中，第一工程化大范围核酸酶是DMD 19-20L.302(SEQ ID NO:39)，或本文所述的其变体，和第二工程化大范围核酸酶是DMD35-36L.282(SEQ ID NO:48)，或本文所述的其变体。在一些实施方式中，第一工程化大范围核酸酶是DMD 19-20L.329(SEQ ID NO:40)，或本文所述的其变体，和第二工程化大范围核酸酶是DMD35-36L.282(SEQ ID NO:48)，或本文所述的其变体。在一些实施方式中，第一工程化大范围核酸酶是DMD 19-20L.302(SEQ ID NO:39)，或本文所述的其变体，和第二工程化大范围核酸酶是DMD35-36L.349(SEQ ID NO:49)，或本文所述的其变体。在一些实施方式中，第一工程化大范围核酸酶是DMD 19-20L.329(SEQ ID NO:40)，或本文所述的其变体，和第二工程化大范围核酸酶是DMD35-36L.349(SEQ ID NO:49)，或本文所述的其变体。

在一些实施方式中，第一工程化核酸酶是结合并切割包含SEQ ID NO:6的识别序列的本文所述的工程化大范围核酸酶，和第二工程化核酸酶是结合并切割包含SEQ ID NO:12的识别序列的本文所述的工程化大范围核酸酶。在此类实施方式中，第一切割位点和第二切割位点具有互补性3’突出端。在一些实施方式中，第一工程化大范围核酸酶和第二工程化大范围核酸酶选自表2中提供的大范围核酸酶(以及本文所述的其变体)的组合。在一些实施方式中，第一工程化大范围核酸酶是DMD 19-20x.13(SEQ ID NO:36)，或本文所述的其变体，和第二工程化大范围核酸酶是DMD37-38x.15(SEQ ID NO:53)，或本文所述的其变体。在一些实施方式中，第一工程化大范围核酸酶是DMD 19-20x.87(SEQ ID NO:37)，或本文所述的其变体，和第二工程化大范围核酸酶是DMD37-38x.15(SEQ ID NO:53)，或本文所述的其变体。在一些实施方式中，第一工程化大范围核酸酶是DMD 19-20x.13(SEQ ID NO:36)，或本文所述的其变体，和第二工程化大范围核酸酶是DMD37-38x.66(SEQ ID NO:54)，或本文所述的其变体。在一些实施方式中，第一工程化大范围核酸酶是DMD 19-20x.87(SEQID NO:37)，或本文所述的其变体，和第二工程化大范围核酸酶是DMD37-38x.66(SEQ IDNO:54)，或本文所述的其变体。在一些实施方式中，第一工程化大范围核酸酶是DMD 19-20x.13(SEQ ID NO:36)，或本文所述的其变体，和第二工程化大范围核酸酶是DMD37-38x.79(SEQ ID NO:55)，或本文所述的其变体。在一些实施方式中，第一工程化大范围核酸酶是DMD 19-20x.87(SEQ ID NO:37)，或本文所述的其变体，和第二工程化大范围核酸酶是DMD37-38x.79(SEQ ID NO:55)，或本文所述的其变体。在一些实施方式中，第一工程化大范围核酸酶是DMD 19-20L.249(SEQ ID NO:38)，或本文所述的其变体，和第二工程化大范围核酸酶是DMD37-38L.166(SEQ ID NO:56)，或本文所述的其变体。

在一些实施方式中，第一切割位点和第二切割位点的互补性突出端(例如，3’突出端)彼此完全连接。

在一些实施方式中，肌营养不良蛋白基因包含SEQ ID NO:32或34中所示的核酸序列。在一些实施方式中，肌营养不良蛋白基因包含SEQ ID NO:32中所示的核酸序列。在一些实施方式中，肌营养不良蛋白基因包含SEQ ID NO:34中所示的核酸序列。

在一些实施方式中，与全长野生型肌营养不良蛋白基因相比，修饰的肌营养不良基因中的正常阅读框被恢复。

在一些实施方式中，修饰的肌营养不良蛋白基因编码修饰的肌营养不良蛋白多肽，其缺乏由野生型肌营养不良蛋白基因的外显子45-55编码的氨基酸。在一些实施方式中，修饰的肌营养不良蛋白多肽包含SEQ ID NO:5中所示的氨基酸序列。

在一些实施方式中，所述方法包括将第一多核苷酸和第二多核苷酸引入真核细胞中，所述第一多核苷酸包含编码第一工程化大范围核酸酶的第一核酸序列和所述第二多核苷酸包含编码第二工程化大范围核酸酶的第二核酸序列。在一些实施方式中，第一多核苷酸是第一mRNA。在一些实施方式中，第二多核苷酸是第二mRNA。在一些实施方式中，第一mRNA和/或第二mRNA是本文所述的mRNA(即，编码本文所述的工程化大范围核酸酶)。在一些实施方式中，第一多核苷酸是第一重组DNA构建体。在一些实施方式中，第二多核苷酸是第二重组DNA构建体。在一些实施方式中，第一重组DNA构建体和/或第二重组DNA构建体是本文所述的重组DNA构建体(即，包含编码本文所述的工程化大范围核酸酶的核酸序列)。在一些实施方式中，通过一种或多种脂质纳米颗粒将第一多核苷酸和第二多核苷酸引入真核细胞中。在一些实施方式中，通过第一脂质纳米颗粒将第一多核苷酸引入真核细胞中。在一些实施方式中，通过第二脂质纳米颗粒将第二多核苷酸引入真核细胞中。在一些实施方式中，通过第一重组病毒将第一多核苷酸引入真核细胞中。在一些实施方式中，通过第二重组病毒将第二多核苷酸引入真核细胞中。在一些实施方式中，第一重组病毒和/或第二重组病毒是本文所述的重组病毒(即，包含含有核酸序列的多核苷酸，所述核酸序列编码本文所述的工程化大范围核酸酶)。

在一些实施方式中，所述方法包括将包含编码第一工程化大范围核酸酶的第一核酸序列和编码第二工程化大范围核酸酶的第二核酸序列的多核苷酸引入真核细胞中。在一些实施方式中，多核苷酸是mRNA。在一些实施方式中，mRNA是本文所述的mRNA(即，包含分别编码本文所述的大范围核酸酶的第一和第二核酸序列)。在一些实施方式中，多核苷酸是重组DNA构建体。在一些实施方式中，重组DNA构建体是本文所述的重组DNA构建体(即，包含分别编码本文所述的大范围核酸酶的第一和第二核酸序列)。在一些实施方式中，通过脂质纳米颗粒将多核苷酸引入真核细胞中。在一些实施方式中，通过重组病毒将多核苷酸引入真核细胞中。在一些实施方式中，重组病毒是本文所述的重组病毒(即，包含含有分别编码本文所述的大范围核酸酶的第一核酸序列和第二核酸序列的多核苷酸)。

在一些实施方式中，真核细胞是哺乳动物细胞。在一些实施方式中，哺乳动物细胞是肌细胞。在一些实施方式中，肌细胞是肌前体细胞(例如，卫星细胞或干细胞)、骨骼肌细胞或心肌细胞。在一些实施方式中，哺乳动物细胞是人细胞。

在另一个方面中，本发明提供了一种用于在受试者的靶细胞中修饰肌营养不良基因的方法，其中肌营养不良蛋白基因的特征是从野生型改变肌营养不良蛋白基因的阅读框的突变，所述方法包括：向靶细胞递送一种或多种多核苷酸，所述多核苷酸包含编码第一工程化核酸酶的第一核酸序列和编码第二工程化核酸酶的第二核酸序列，其中第一工程化核酸酶结合并切割外显子45上游5’内含子中的识别序列，和其中第二工程化核酸酶结合并切割外显子55下游3’内含子中的识别序列，其中在靶细胞中表达第一工程化核酸酶和第二工程化核酸酶，其中第一工程化核酸酶在其识别序列处在肌营养不良蛋白基因中产生第一切割位点，其中第二工程化核酸酶在其识别序列处在肌营养不良蛋白基因中产生第二切割位点，其中第一切割位点和第二切割位点具有互补性突出端，其中第一切割位点和第二切割位点之间的中间基因组DNA从肌营养不良蛋白基因中切除，其中肌营养不良蛋白基因退火，和其中与全长野生型肌营养不良蛋白基因相比，肌营养不良蛋白基因的正常阅读框被恢复。

在一些实施方式中，第一工程化核酸酶是结合并切割包含SEQ ID NO:6的识别序列的本文所述的工程化大范围核酸酶，和第二工程化核酸酶是结合并切割包含SEQ ID NO:12的识别序列的本文所述的工程化大范围核酸酶。在一些实施方式中，第一工程化大范围核酸酶和第二工程化大范围核酸酶选自表2中提供的大范围核酸酶(以及本文所述的其变体)的组合。在此类实施方式中，第一切割位点和第二切割位点具有互补性3’突出端。在一些实施方式中，第一工程化大范围核酸酶是DMD 19-20x.13(SEQ ID NO:36)，或本文所述的其变体，和第二工程化大范围核酸酶是DMD37-38x.15(SEQ ID NO:53)，或本文所述的其变体。在一些实施方式中，第一工程化大范围核酸酶是DMD 19-20x.87(SEQ ID NO:37)，或本文所述的其变体，和第二工程化大范围核酸酶是DMD37-38x.15(SEQ ID NO:53)，或本文所述的其变体。在一些实施方式中，第一工程化大范围核酸酶是DMD 19-20x.13(SEQ ID NO:36)，或本文所述的其变体，和第二工程化大范围核酸酶是DMD37-38x.66(SEQ ID NO:54)，或本文所述的其变体。在一些实施方式中，第一工程化大范围核酸酶是DMD 19-20x.87(SEQID NO:37)，或本文所述的其变体，和第二工程化大范围核酸酶是DMD37-38x.66(SEQ IDNO:54)，或本文所述的其变体。在一些实施方式中，第一工程化大范围核酸酶是DMD 19-20x.13(SEQ ID NO:36)，或本文所述的其变体，和第二工程化大范围核酸酶是DMD37-38x.79(SEQ ID NO:55)，或本文所述的其变体。在一些实施方式中，第一工程化大范围核酸酶是DMD 19-20x.87(SEQ ID NO:37)，或本文所述的其变体，和第二工程化大范围核酸酶是DMD37-38x.79(SEQ ID NO:55)，或本文所述的其变体。在一些实施方式中，第一工程化大范围核酸酶是DMD 19-20L.249(SEQ ID NO:38)，或本文所述的其变体，和第二工程化大范围核酸酶是DMD37-38L.166(SEQ ID NO:56)，或本文所述的其变体。

在一些实施方式中，肌营养不良蛋白基因编码修饰的肌营养不良蛋白多肽，其缺乏由野生型肌营养不良蛋白基因的外显子45-55编码的氨基酸。在一些实施方式中，修饰的肌营养不良蛋白多肽包含SEQ ID NO:5中所示的氨基酸序列。在一些实施方式中，受试者转化为贝克型肌营养不良症表型。

在一些实施方式中，所述方法包括将第一多核苷酸和第二多核苷酸递送至靶细胞，所述第一多核苷酸包含编码第一工程化大范围核酸酶的第一核酸和所述第二多核苷酸包含编码第二工程化大范围核酸酶的第二核酸序列。在一些实施方式中，第一多核苷酸是第一mRNA。在一些实施方式中，第二多核苷酸是第二mRNA。在一些实施方式中，第一mRNA和/或第二mRNA是本文所述的(即，编码本文所述的工程化大范围核酸酶)。在一些实施方式中，第一多核苷酸是第一重组DNA构建体。在一些实施方式中，第二多核苷酸是第二重组DNA构建体。在一些实施方式中，第一重组DNA构建体和/或第二重组DNA构建体是本文所述的重组DNA构建体(即，包含编码本文所述的工程化大范围核酸酶的核酸序列)。在一些实施方式中，通过一种或多种脂质纳米颗粒将第一多核苷酸和第二多核苷酸递送至靶细胞。在一些实施方式中，通过第一脂质纳米颗粒将第一多核苷酸递送至靶细胞。在一些实施方式中，通过第二脂质纳米颗粒将第二多核苷酸递送至靶细胞。在一些实施方式中，通过重组病毒将第一多核苷酸递送至靶细胞。在一些实施方式中，通过第二重组病毒将第二多核苷酸递送至靶细胞。在一些实施方式中，第一重组病毒和/或第二重组病毒是本文所述的重组病毒(即，包含含有编码本文所述的工程化大范围核酸酶的核酸序列的多核苷酸)。

在一些实施方式中，所述方法包括将第一多核苷酸和第二多核苷酸递送至靶细胞，所述第一多核苷酸包含编码第一工程化大范围核酸酶的第一核酸和所述第二多核苷酸包含编码第二工程化大范围核酸酶的第二核酸序列。在一些实施方式中，多核苷酸是mRNA。在一些实施方式中，mRNA是本文所述的mRNA(即，包含分别编码本文所述的大范围核酸酶的第一和第二核酸序列)。在一些实施方式中，多核苷酸是重组DNA构建体。在一些实施方式中，重组DNA构建体是本文所述的重组DNA构建体(即，包含分别编码本文所述的大范围核酸酶的第一和第二核酸序列)。在一些实施方式中，通过脂质纳米颗粒将多核苷酸递送至靶细胞。在一些实施方式中，通过重组病毒将多核苷酸递送至靶细胞。在一些实施方式中，重组病毒是本文所述的重组病毒(即，包含含有分别编码本文所述的大范围核酸酶的第一核酸序列和第二核酸序列的多核苷酸)。

在一些实施方式中，受试者是哺乳动物。在一些实施方式中，靶细胞是肌细胞。在一些实施方式中，肌细胞是肌前体细胞(例如，卫星细胞或干细胞)、骨骼肌细胞或心肌细胞。在一些实施方式中，受试者是人。

在另一个方面中，本发明提供了一种用于在有此需要的受试者中治疗DMD的方法，其中DMD的特征是肌营养不良蛋白基因的突变，所述突变相对于全长的野生型肌营养不良蛋白基因改变肌营养不良蛋白基因的阅读框，所述方法包括：向受试者施用有效量的一种或多种多核苷酸，其包含编码第一工程化核酸酶的第一核酸序列和编码第二工程化核酸酶的第二核酸序列，其中第一工程化核酸酶结合并切割在外显子45上游5’内含子中的识别序列，和其中第二工程化核酸酶结合并切割在外显子55下游3’内含子中的识别序列，其中将一种或多种多核苷酸递送至受试者的靶细胞中，其中在靶细胞中表达第一工程化核酸酶和第二工程化核酸酶，其中第一工程化核酸酶在其识别序列处在肌营养不良蛋白基因中产生第一切割位点，其中第二工程化核酸酶在其识别序列处在肌营养不良蛋白基因中产生第二切割位点，其中第一切割位点和第二切割位点具有互补性突出端，其中第一切割位点和第二切割位点之间的中间基因组DNA从肌营养蛋白基因中切除，其中肌营养不良蛋白基因退火，和其中与全长野生型肌营养不良蛋白基因相比，肌营养不良基因的正常阅读框被恢复。

在一些实施方式中，所述方法包括向受试者施用第一多核苷酸和第二多核苷酸，所述第一多核苷酸包含编码第一工程化大范围核酸酶的第一核酸和所述第二多核苷酸包含编码第二工程化大范围核酸酶的第二核酸序列。在一些实施方式中，第一多核苷酸是第一mRNA。在一些实施方式中，第二多核苷酸是第二mRNA。在一些实施方式中，第一mRNA和/或第二mRNA是本文所述的mRNA(即，编码本文所述的工程化大范围核酸酶)。在一些实施方式中，第一多核苷酸是第一重组DNA构建体。在一些实施方式中，第二多核苷酸是第二重组DNA构建体。在一些实施方式中，第一重组DNA构建体和/或第二重组DNA构建体是本文所述的重组DNA构建体(即，包含编码本文所述的工程化大范围核酸酶的核酸序列)。在一些实施方式中，通过脂质纳米颗粒向受试者施用第一多核苷酸和第二多核苷酸。在一些实施方式中，通过第一脂质纳米颗粒向受试者施用第一多核苷酸。在一些实施方式中，通过第二脂质纳米颗粒向受试者施用第二多核苷酸。在一些实施方式中，通过第一重组病毒向受试者施用第一多核苷酸。在一些实施方式中，通过第二重组病毒向受试者施用第二多核苷酸。在一些实施方式中，第一重组病毒和/或第二重组病毒是本文所述的重组病毒(即，包含含有编码本文所述的工程化大范围核酸酶的核酸序列的多核苷酸)。

在一些实施方式中，所述方法包括向受试者施用多核苷酸，其包含编码第一工程化大范围核酸酶的第一核酸和编码第二工程化大范围核酸酶的第二核酸序列。在一些实施方式中，多核苷酸是mRNA。在一些实施方式中，mRNA是本文所述的mRNA(即，包含分别编码本文所述的大范围核酸酶的第一和第二核酸序列)。在一些实施方式中，多核苷酸是重组DNA构建体。在一些实施方式中，重组DNA构建体是本文所述的重组DNA构建体(即，包含分别编码本文所述的大范围核酸酶的第一和第二核酸序列)。在一些实施方式中，通过脂质纳米颗粒向受试者施用多核苷酸。在一些实施方式中，通过重组病毒向受试者施用多核苷酸。在一些实施方式中，重组病毒是本文所述的重组病毒(即，包含含有分别编码本文所述的大范围核酸酶的第一核酸序列和第二核酸序列的多核苷酸)。

在一些实施方式中，受试者是哺乳动物。在一些实施方式中，靶细胞是肌细胞。在一些实施方式中，肌细胞是肌前体细胞(例如，卫星细胞或干细胞)、骨骼肌细胞或心肌细胞。在一些实施方式中，the受试者是人。

在另一个方面中，本发明提供了一种多核苷酸，其包含如SEQ ID NO:32或SEQ IDNO:34中所示的核酸序列。

在一些实施方式中，多核苷酸包含如SEQ ID NO:32中所示的核酸序列。在一些实施方式中，多核苷酸是在细胞(例如，人肌细胞)基因组中的肌营养不良蛋白基因，其包含如SEQ ID NO:32中所示的核酸序列。在一些实施方式中，多核苷酸是在细胞(例如，人肌细胞)中的前体mRNA，其包含如SEQ ID NO:32中所示的核酸序列。

在一些实施方式中，多核苷酸包含如SEQ ID NO:34中所示的核酸序列。。在一些实施方式中，多核苷酸是在细胞(例如，人肌细胞)基因组中的肌营养不良蛋白基因，其包含如SEQ ID NO:34中所示的核酸序列。在一些实施方式中，多核苷酸是在细胞(例如，人肌细胞)中的前体mRNA，其包含如SEQ ID NO:34中所示的核酸序列。

在另一个方面中，本发明提供了一种遗传修饰的真核细胞，在其基因组中包含修饰的肌营养不良蛋白基因，其中修饰的肌营养不良蛋白基因缺乏外显子45-55，和其中修饰的肌营养不良蛋白基因包含位于外显子44和外显子56之间的内含子内的如SEQ ID NO:32中所示的核酸序列或如SEQ ID NO:34中所示的核酸序列。

在一些实施方式中，核酸序列包含SEQ ID NO:32。在一些实施方式中，核酸序列包含SEQ ID NO:34。

在一些实施方式中，遗传修饰的真核细胞是哺乳动物细胞。在一些实施方式中，遗传修饰的真核细胞是人细胞。在一些实施方式中，遗传修饰的真核细胞是肌细胞。在一些实施方式中，肌细胞是肌前体细胞(例如，卫星细胞或干细胞)、骨骼肌细胞或心肌细胞。

在另一个方面中，本发明提供了一种多肽，其包含与SEQ ID NO:5具有至少80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高序列同一性的氨基酸序列，其中所述多肽是修饰的肌营养不良蛋白，其缺乏由肌营养不良蛋白基因的外显子45-55编码的氨基酸，和其中所述多肽包含肌营养不良蛋白的C末端结构域。在一些实施方式中，多肽包含如SEQ ID NO:5中所示的氨基酸序列。

在另一个方面中，本发明提供了本文所述的工程化大范围核酸酶，或编码工程化大范围核酸酶的本文所述的多核苷酸，或表达工程化大范围核酸酶的本文所述的细胞，其用作药物。

在一些实施方式中，药物可用于在受试者中制备修饰的肌营养不良蛋白基因。在一些实施方式中，药物可用于治疗DMD。

在另一个方面中，本发明提供了本文所述的工程化大范围核酸酶，或编码工程化大范围核酸酶的本文公开的多核苷酸，或表达工程化大范围核酸酶的本文所述的细胞在制备治疗DMD的药物中的用途，所述药物用于增加修饰的肌营养不良蛋白(即，缺乏由肌营养不良蛋白基因的外显子45-55编码的氨基酸)的水平，或减少与DMD相关的症状。

附图说明

图1是提供DMD大范围核酸酶识别序列的大致位置的示意图，并说明了从肌营养不良蛋白基因中切除多个外显子的双大范围核酸酶的方法。如图所示，结合并切割DMD 19-20识别序列和DMD 35-36识别序列，或DMD 19-20识别序列和DM 37-38识别序列的工程化大范围核酸酶对导致从肌营养不良蛋白基因中去除外显子45-55。这些识别序列对位于内含子内，具有相同的四碱基对中心序列，并产生具有互补突出端的切割位点。因此，在去除外显子之后，基因在切割位点连接，切割位点将位于外显子44和外显子56之间的内含子内。在转录后剪接之后，这种遗传修饰导致产生具有与外显子56同框的外显子44的肌营养不良蛋白mRNA，其恢复肌营养不良蛋白基因阅读框并导致贝克型型肌营养不良蛋白表达。还显示了一对工程化大范围核酸酶结合并切割DMD 19-20识别序列和DMD 29-30识别序列的大致位置，其导致从肌营养不良蛋白基因中去除外显子45。

图2是显示本文公开的示例性识别序列的示意图，其包括针对人肌营养不良蛋白基因中的DMD 19-20(SEQ ID NO:6和7)、DMD 29-30(SEQ ID NO:8和9)、DMD 35-36(SEQ IDNO:10和11)和DMD 37-38(SEQ ID NO:12和13)识别序列的有义序列和反义序列。本文所述的工程化大范围核酸酶靶向的每个DMD识别序列包括两个识别半位点。每个识别半位点包括9个碱基对，由4个碱基对的中心序列分隔。例如，DMD 19-20识别序列具有5’DMD19半位点和3’DMD20半位点，其具有四碱基对中心序列GTAT。

图3。本文所述的工程化大范围核酸酶包含两个亚基，其中第一亚基包含与第一识别半位点结合的HVR1区(例如，DMD19)和第二亚基包含与第二识别半位点结合的HVR2区(例如，DMD20)。在其中工程化大范围核酸酶是单链大范围核酸酶的实施方式中，包含HVR1区的第一亚肌可以位于N末端或C末端亚基。同样，包含HVR2区的第二亚基可以位于N末端或C末端亚基。

图4A-4C。图4A提供了DMD 19-20大范围核酸酶序列的比对。图4B提供了DMD 35-36工程化大范围核酸酶序列的比对。图4C提供了DMD 37-38工程化大范围核酸酶序列的比对。星号表示所有对齐的核酸酶之间的保守残基，空格表示在大范围核酸酶之间至少有一个氨基酸不同。

图5是用于评价靶向肌营养不良蛋白基因中发现的识别序列的工程化大范围核酸酶的CHO细胞中报告基因测定的示意图。对于本文中所述的工程化大范围核酸酶，产生CHO细胞系，其中报告基因盒稳定地整合到细胞的基因组中。报告基因盒按照5’至3’的顺序包含：SV40早期启动子；GFP基因的5’2/3；本文所述的工程化大范围核酸酶的识别序列(例如，DMD 19-20、DMD 29-30、DMD 35-36或DMD 37-38识别序列)；CHO-23/24大范围核酸酶的识别序列(WO 2012/167192)；和GFP基因的3’2/3。在不存在DNA断裂诱导剂的情况下，用该盒稳定转染的细胞不表达GFP。通过转导编码每种大范围核酸酶的mRNA引入大范围核酸酶。当在任一大范围核酸酶识别序列处诱导DNA断裂时，GFP基因的重复区域相互重组，产生功能性GFP基因。表达GFP的细胞的百分比然后可以通过流式细胞术测定，作为大范围核酸酶切割基因组频率的间接指标。

图6A-6F。图6A、6B和6G提供了工程化DMD 19-20大范围核酸酶结合并切割CHO细胞报告基因测定中表达的DMD 19-20识别序列的效率。图6C提供了工程化DMD 29-30大范围核酸酶结合并切割CHO细胞报告基因测定中表达的DMD 29-30识别序列的效率。图6D提供了工程化DMD 35-36大范围核酸酶结合并切割CHO细胞报告基因测定中表达的DMD 35-36识别序列的效率。图6E、图6F和图6I提供了工程化DMD 37-38大范围核酸酶结合并切割CHO细胞报告基因测定中表达的DMD 37-38识别序列的效率。相对活性指数表示表达测试大范围核酸酶的每个细胞系的GFP阳性细胞％，将其归一化为表达CHO-23/24大范围核酸酶细胞系，用于说明大范围核酸酶毒性。

图7A-7D显示条形图，显示在MRC5细胞中以两个剂量靶向所示识别序列的测试的大范围核酸酶的插入和缺失(indel)的百分比频率。在大范围核酸酶转染后的三个时间点(第2、5和8天)测试每个大范围核酸酶。图7A提供了使用DMD 19-20大范围核酸酶的编辑百分比。图7B提供了使用DMD 35-36大范围核酸酶的编辑百分比。图7C提供了使用DMD 37-38大范围核酸酶的编辑百分比。图7D提供了使用DMD 29-30大范围核酸酶的编辑百分比。

图8A和图8B提供了在用一对设计用于结合并切割DMD 19-20和DMD 35-36识别序列的工程化大范围核酸酶切割后肌营养不良蛋白基因的完美连接的PCR产物和测序数据。图8A是使用特异性扩增互补的DMD 19-20和DMD 35-36识别序列连接的引物的PCR产物的凝胶图像。第5道表示DMD 19-20x.13和DMD 35-36x.63大范围核酸酶的组合。第6道表示DMD19-20x.87和DMD 35-36x.81大范围核酸酶的组合。第7道表示DMD 19-20x.13和DMD 35-36x.81大范围核酸酶的组合。第8道表示DMD 19-20x.87和DMD 35-36x.63大范围核酸酶的组合。第M道表示模拟对照。图8B提供了期间的基因组序列切割和切除后DMD 19-20和DMD35-36大范围核酸酶识别序列完美连接的代表性测序数据。

图9A和图9B提供了在用一对设计用于结合和切割DMD 19-20和DMD 37-38识别序列的工程化大范围核酸酶切割后肌营养不良蛋白基因的完美连接的PCR产物和测序数据。图8A是使用特异性扩增互补的DMD 19-20和DMD 37-38识别序列连接的引物的PCR产物的凝胶图像。第9道表示DMD 19-20x.13和DMD 37-38x.15大范围核酸酶的组合。第10道表示DMD19-20x.87和DMD 37-38x.15大范围核酸酶的组合。第11道表示DMD 19-20x.13和DMD 37-38x.66大范围核酸酶的组合。第12道表示DMD 19-20x.87和DMD 37-38x.66大范围核酸酶的组合。第13道表示DMD 19-20x.13和DMD 37-38x.79大范围核酸酶的组合。第14道表示DMD19-20x.87和DMD 37-38x.79大范围核酸酶的组合。第M道表示模拟对照。图9B提供了期间的基因组序列切割和切除后DMD 19-20和DMD 37-38大范围核酸酶识别序列完美连接的代表性测序数据。

图10提供了用一对设计用于结合和切割DMD 19-20和DMD 29-30识别序列的工程化大范围核酸酶切割后肌营养不良蛋白基因的完美连接的PCR产物。所示为使用特异性扩增互补DMD 19-20和DMD 29-30识别序列的连接的引物的PCR产物的凝胶图像。第1道表示DMD 19-20x.13和DMD 29-30x.18大范围核酸酶的组合。第2道表示DMD 19-20x.87和DMD29-30x.40大范围核酸酶的组合。第3道表示DMD 19-20x.13和DMD 29-30x.40大范围核酸酶的组合。第4道表示DMD 19-20x.87和DMD 29-30x.18大范围核酸酶的组合。第M道表示模拟对照。

图11提供了一个示意图，显示了数字液滴PCR(ddPCR)测定中用于检测切割后连接事件的参考和完美连接引物集合的正向和反向引物以及探针的大致位置。该示意图举例说明了DMD 19-20和DMD 37-38连接的识别序列。

图12A-12C提供了条形图，显示了通过ddPCR评估的外显子45-55或单独外显子45的缺失百分比。图12A提供了DMD 19-20x.13和DMD 35-36x.63大范围核酸酶、DMD 19-20x.87和DMD 35-36x.81大范围核酸酶、DMD 19-20x.13和DMD 35-36x.81大范围核酸酶、19-20x.87和DMD 35-36x.63大范围核酸酶的组合和模拟对照的外显子缺失数据。图12B提供了DMD 19-20x.13和DMD 37-38x.15大范围核酸、DMD 19-20x.87和DMD 37-38x.15大范围核酸酶、DMD 19-20x.13和DMD 37-38x.66大范围核酸酶、DMD 19-20x.87和DMD 37-38x.66大范围核酸酶、DMD 19-20x.13和DMD 37-38x.79大范围核酸酶、DMD 19-20x.87和DMD 37-38x.79大范围核酸酶的组合以及模拟对照的外显子缺失数据。图12C提供了单独的外显子45以及DMD 19-20x.13和DMD 29-30x.18大范围核酸酶、DMD 19-20x.87和DMD 29-30x.40大范围核酸酶、DMD 19-20x.13和DMD 29-30x.40大范围核酸酶、DMD 19-20x.87和DMD 29-30x.18大范围核酸酶的组合以及模拟对照的外显子缺失数据。

图13提供了通过ddPCR使用其他不同组合的工程化大范围核酸酶评估的完美连接事件的线形图。

图14提供了显示外显子45-55缺失百分比的条形图，使用DMD19-20L.249和DMD37-38L.166工程化大范围核酸酶对在人骨骼肌成肌细胞(HSMM)中通过ddPCR进行评估。用20ng、40ng、80ng或160ng编码每种工程化大范围核酸酶的mRNA转染HSMM细胞。

图15提供了一个条形图，显示了在来自患有DMD的患者(AB1098细胞)的永生化成肌细胞系中，使用DMD 19-20L.249和DMD 37-38L.166工程化大范围核酸酶对通过ddPCR评估完美连接的百分比。用10ng、20ng、40ng、80ng或160ng编码每种大范围核酸酶的mRNA转染AB1098细胞。

图16A-16C提供了在AB1098细胞中用10ng、20ng、40ng、80ng或160ng编码DMD 19-20L.249和DMD 37-38L.166工程化大范围核酸酶的mRNA或模拟对照处理后的蛋白表达数据。图16A是显示用工程化大范围核酸酶组合或模拟对照处理后肌营养不良蛋白表达的图。图16B提供了正确尺寸的缩短的肌营养不良蛋白条带(即，缺乏外显子45-55编码的氨基酸)的凝胶图像。图16C提供了相对于参考纽带蛋白基因的肌营养不良蛋白的量。

图17提供了一个条形图，显示用10ng、20ng、40ng、80ng或160ng编码DMD 19-20L.249和DMD 37-38L.166工程化大范围核酸酶的mRNA或模拟对照转染后，AB1098细胞mRNA中外显子44至外显子56的RNA剪接。

图18提供了一个条形图，显示了在HSMM细胞中使用所示工程化大范围核酸酶对通过ddPCR评估的完美连接的百分比。用40ng编码每种工程化大范围核酸酶的mRNA转染HSMM细胞。

图19提供了用于确定工程化核酸酶(例如，本文所述的工程化大范围核酸酶)脱靶效应的oligo捕获测定的示意图。如图所示，整合盒或寡聚体与基因组中的双链断裂退火，这可能是由于工程化核酸酶切割。然后，通过超声剪切DNA，连接衔接子并进行PCR扩增，随后进行序列分析以确定双链断裂的位置。

图20提供了描述oligo(寡核苷酸)捕获测定的结果的图，该测定用于鉴定在HEK293细胞中转染的DMD 19-20x.13、DMD19-20L.249、DMD 19/20L.329、DMD 19:20L.374、DMD19-20L.375、DMD 19-20L.431和DMD 19-20-L.458大范围核酸酶诱导的脱靶切割。带圆圈的点表示靶上位点，不带圆圈的点将表示脱靶位点，X轴表示每个检测到的脱靶位点的测序读取的数量。点的阴影表示靶上位点和每个检测到的脱靶位点之间的碱基对错配的数量。点越靠近行的顶部，错配的数量就越少。

图21提供了描述oligo捕获测定的结果的图，以鉴定在HEK 293细胞中转染的DMD35-36x.63、DMD 35-36L.195、DMD 35-36L.364、DMD 35.36L.372、DMD 35-36L.457和DMD35.36L.469大范围核酸酶诱导的脱靶切割。带圆圈的点表示靶上位点，不带圆圈的点表示脱靶位点，X轴表示每个脱靶位点的测序读取数量。点的行顶部的阴影和接近度表示靶上位点和每个检测到的脱靶位点之间的碱基对错配的数量。

图22提供了一个条形图，显示了在DMD 19-20和DMD 35-36识别序列被每对所示的工程化DMD 19-20-和DMD 35-36大范围核酸酶切割后，与外显子45-55相邻的基因组DNA的总连接百分比(％)。

图23A提供了用DMD 19-20和DMD 35-36大范围核酸酶组合处理的AB1098细胞中缺乏肌营养不良蛋白基因外显子45-55的缩短的修饰肌营养不良蛋白水平的WES蛋白强度读取。第1道是标记物对照；第2道是心脏肌营养不良蛋白阳性对照；第3道是空白对照；第4道是DMD 19-20L.374和DMD 35-36L.376大范围核酸酶的组合；第5道是DMD 19-20L.374和DMD35-36L.457大范围核酸酶的组合；第6道是DMD 19-20L.374和DMD 35-36L.469大范围核酸酶的组合；第7道是DMD 19-20L.375和DMD 35-36L.376大范围核酸酶的组合；第8道是DMD19-20L.375和DMD 35-36L.457大范围核酸酶的组合；第9道是DMD 19-20L.375和DMD 35-36L.469大范围核酸酶的组合；第10道是DMD 19-20L.431和DMD 35-36L.376大范围核酸酶的组合；第11道是DMD 19-20L.431和DMD 35-36L.457大范围核酸酶的组合；第12道是DMD19-20L.431和DMD 35-36L.469大范围核酸酶的组合；第13道是DMD 19-20L.458和DMD 35-36L.376大范围核酸酶的组合；第14道是DMD 19-20L.458和DMD 35-36L.457大范围核酸酶的组合；第15道是DMD 19-20L.458和DMD 35-36L.469大范围核酸酶的组合；和第16道是模拟AB1098细胞系对照，其缺乏肌营养不良蛋白的表达。图23B提供了一个条形图，显示了通过WES分析缩短的修饰肌营养不良蛋白水平，将该分析归一化为每对所示工程化DMD 19-20和DMD 35-36大范围核酸酶的纽带蛋白上样对照。

图24A-24B。图24A提供了一个条形图，显示了在DMD 19-20和DMD 37-38识别序列被每对所示的工程化DMD 19-20-和DMD 37-38大范围核酸酶切割后，与外显子45-55相邻的基因组DNA的总连接百分比(％)。图24B提供了一个条形图，显示了与基于该组织产生的标准曲线的等效鼠股四头肌组织裂解物上样相比，每对所示的工程化DMD 19-20和DMD 37-38大范围核酸酶的肌营养不良蛋白恢复百分比(％)。

图25A-25E提供了条形图，显示了利用不同肌特异性启动子组合的DMD 19-20x.13和DMD 37-38x.15工程化大范围核酸酶对切割DMD 19-20和DMD 37-38识别序列后，在肌组织中与外显子45-55相邻的基因组DNA完美连接的百分比(％)。图25A显示了在股四头肌组织中的完美连接百分比。图25B显示了在心脏组织中的完美连接百分比。图25C显示了在横膈肌组织中的完美连接百分比。图25D显示了在比目鱼肌组织中的完美连接百分比。图25E显示了在肝脏组织中的完美连接百分比。

图26A-26E提供了条形图，显示了在DMD 19-20L.329和DMD 37-38L.219工程化大范围核酸酶对切割DMD 19-20和DMD 35-36识别序列后，在肌组织中与外显子45-55相邻的基因组DNA的总连接百分比(％)。图26A显示了在股四头肌组织中的总连接百分比。图26B显示了在心脏组织中的总连接百分比。图26C显示了在横膈膜组织中的总连接百分比。图25D显示了在比目鱼肌组织中的总连接百分比。图26E显示了在肝脏组织中的总连接百分比。

图27A-27E提供了条形图，显示了在以总AAV量显示的两个不同剂量水平下(2x10¹²或4x10¹²)，由DMD 19-20x.13和DMD 37-38x.15工程化大范围核酸酶对DMD 19-20和DMD 35-36识别序列切割后，在肌组织中邻近外显子45-55的基因组DNA的总连接百分比(％)。图27A显示了在股四头肌组织中的总连接百分比。图27B显示了在心脏组织中的总连接百分比。图27C显示了在横膈膜组织中的总连接百分比。图27D显示了在胫骨前肌(TA)组织中的总连接百分比。图27E显示了在肝脏组织中的总连接百分比。

图28A-28C提供了用DMD 19-20x.13和DMD 37-38x.15大范围核酸酶处理后，缺失肌营养不良蛋白基因外显子45-55的缩短的修饰肌营养不良蛋白水平的WES蛋白强度读取。图28A-28C的第1-6道表示来自表达人肌营养不良蛋白的小鼠的全长人肌营养不良蛋白的蛋白条带强度的标准曲线；第7-8道表示来自使用1x10¹⁴ VG/kg的DMD 19-20x.13和DMD 37-38x.15大范围核酸酶的组合处理的小鼠的缩短的修饰肌营养不良蛋白的蛋白条带强度；第9-10道表示来自使用2x10¹⁴ VG/kg的DMD 19-20x.13和DMD 37-38x.15大范围核酸酶的组合处理的小鼠的缩短的修饰肌营养不良蛋白的蛋白条带强度；第11-12道表示使用PBS和不使用大范围核酸酶处理的小鼠。图28A表示在所示剂量下在心脏组织中检测的缩短的修饰肌营养不良蛋白的水平；图28B表示在所示剂量下在横膈膜组织中检测的缩短的修饰肌营养不良蛋白的水平；图28C表示在所示剂量下在股四头肌组织中检测的缩短的修饰肌营养不良蛋白的水平。

图29提供了显示了在DMD 19-20L.329和DMD 35-36L.349工程化大范围核酸酶对切割DMD 19-20和DMD 35-36识别序列后，在股四头肌、心脏和横膈膜肌组织中与外显子45-55相邻的基因组DNA的总连接百分比(％)的图。

图30A-30C提供了在用利用不同肌特异性启动子的DMD 19-20L.329和DMD 35-36L.349大范围核酸酶处理后，缺失肌营养不良蛋白基因外显子45-55的缩短的修饰肌营养不良蛋白水平的WES蛋白强度读取。图30A-30C的第1道表示ladder(分子量标准)；第2-6道表示来自表达人肌营养不良蛋白的小鼠的全长人肌营养不良蛋白的条带强度；第7道表示在CK8肌特异性启动子控制下以1x10¹⁴VG/kg的DMD 19-20L.329和DMD 35-36L.349大范围核酸酶的组合处理的小鼠中缩短的修饰肌营养不良蛋白的条带强度；第8道表示在MHCK7肌特异性启动子控制下以1x10¹⁴ VG/kg的DMD 19-20L.329和DMD 35-36L.349大范围核酸酶的组合处理的小鼠中缩短的修饰肌营养不良蛋白的条带强度；第9道表示以1x10¹⁴ VG/kg的DMD19-20L.329和DMD 35-36L.349大范围核酸酶的组合处理的小鼠中缩短的修饰肌营养不良蛋白的条带强度，其中DMD 19-20L.329大范围核酸酶是在CK8肌特异性启动子的控制下和DMD 35-36L.349大范围核酸酶是在SPc5-12肌特异性启动子的控制下；第10-11道表示用PBS处理的小鼠。图30A表示在所示剂量下在心脏组织中检测的缩短的修饰肌营养不良蛋白的水平；图30B表示在所示剂量下在横膈膜组织中检测的缩短的修饰肌营养不良蛋白的水平；和图30C表示在所示剂量下在股四头肌组织中检测的缩短的修饰肌营养不良蛋白的水平。

图31提供了一个条形图，显示了在股四头肌(quad)、心脏和横膈肌组织中用DMD19-20L.329和DMD 35-36L.349大范围核酸酶或PBS处理的小鼠通过WES分析归一化为纽带蛋白上样对照的缩短的修饰肌营养不良蛋白水平。

图32提供了来自使用DMD 19-20L.329和DMD 35-36L.349大范围核酸酶的组合或PBS处理的小鼠的股四头肌(quad)、心脏和横膈膜肌组织的免疫组织化学图像。深色染色代表人肌营养不良蛋白的检测，这只在用大范围核酸酶组合处理的小鼠中可见。

图33A和图33B提供了在使用AAV9衣壳递送给hDMDdel52/mdx(hDMD)小鼠的PBS或DMD 19-20L.329和DMD 35-36L.349大范围核酸酶对处理后小鼠股四头肌组织的荧光免疫组织化学图像。图33A提供了在来自PBS处理小鼠的股四头肌组织中Pax7表达的图像。左图是对照图像，其显示了使用检测大范围核酸酶表达的一抗和二抗的任何背景染色。中图显示了由白色箭头指示的表达Pax7的细胞；和右图显示了Pax7(白色箭头)和来自检测大范围核酸酶表达的抗体的任何背景染色。图33B提供了在来自大范围核酸酶处理小鼠的股四头肌组织中的大范围核酸酶和Pax7表达的图像。左图提供了由白色箭头指示的仅表达大范围核酸酶的细胞，全箭头指示表达大范围核酸酶蛋白和Pax7的细胞；中图显示了仅表达由白色箭头指示的Pax7或由全箭头指示的Pax7和大范围核酸酶蛋白的细胞。右图显示了表达由箭头指示的大范围核酸酶蛋白或Pax7的细胞，或者表达由全箭头指示的大范围核酸酶蛋白和Pax7两者的细胞。

图34提供了用于检测修饰的肌营养不良蛋白转录物的mRNA表达的BaseScope测定的示意图，其中在两种核酸酶表达后，人肌营养不良蛋白基因的外显子45-55已被缺失。第一核酸酶结合并切割位于外显子45的5’紧邻的内含子中的识别序列，而第二核酸酶则结合并切割位于外显子55的3’紧邻的内含物中的识别序列。如图所示，结合并切割位于这些内含子中的识别序列的核酸酶导致双链断裂，然后通过基因组的直接再连接来修复。在转录和剪接之后，产生具有剪接在一起的外显子44和外显子56的mRNA。然后使用设计用于识别该外显子44至外显子56连接(表示为E44-E56连接)的探针在肌组织切片中检测这种修饰的人肌营养不良蛋白转录物。

图35A和图35B提供了用PBS或DMD 19-20L.329和DMD 35-36L.349大范围核酸酶对处理的hDMDdel52/mdx(hDMD)小鼠的小鼠股四头肌组织的BaseScope染色。图35A显示了来自PBS处理的小鼠的肌组织的Pax7转录物表达的BaseScope染色，以及用于检测修饰的人肌营养不良蛋白转录物表达探针的任何背景染色。图35B显示了针对Pax7转录物表达和修饰的人肌营养不良蛋白转录物表达的来自用DMD 19-20L.329和DMD 35-36L.349大范围核酸酶处理的小鼠的肌组织的BaseScope染色。

图36提供了以20ng、80ng和160ng编码大范围核酸酶的mRNA，使用增加剂量的DMD19-20L.329和DMD 35-36L.349大范围核酸酶电穿孔通常缺乏肌营养不良蛋白表达的KM1328患者细胞系后，针对缺乏肌营养不良蛋白基因的外显子45-55的缩短的修饰肌营养不良蛋白水平的WES蛋白强度读取。第1道表示ladder(分子量标准)；第2道表示模拟对照；第3-5道表示在使用20ng、80ng和160ng大范围核酸酶mRNA处理的细胞中，缩短的修饰肌营养不良蛋白的条带强度；第6道表示全长人肌营养不良蛋白的条带强度。

图37提供了以80ng编码大范围核酸酶的mRNA使用DMD 19-20L.329和DMD 35-36L.349大范围核酸酶电穿孔通常缺乏肌营养不良蛋白的AB1098患者细胞系后针对缺乏肌营养不良蛋白基因的外显子45-55的缩短的修饰肌营养不良蛋白水平的WES蛋白强度读取。第1道表示全长人肌营养不良蛋白的条带强度；第2道表示模拟对照；第3道表示在使用80ng大范围核酸酶mRNA处理的细胞中缩短的修饰肌营养不良蛋白的条带强度。

图38A-38D提供了使用AAVrH74衣壳递送给hDMDdel52/mdx(hDMD)小鼠的PBS或DMD19-20L.329和DMD 35-36L.349大范围核酸酶对处理后小鼠股四头肌组织的荧光免疫组织化学图像。图38A提供了在来自PBS处理小鼠的股四头肌组织中Pax7表达的图像。左图为对照图像，其提供了用检测大范围核酸酶表达的一抗和二抗进行的任何背景染色；星号表示非特异性背景检测。中图显示了由白色箭头指示的表达Pax7的细胞；右图显示了Pax7(白色箭头)和来自检测由星号指示的大范围核酸酶表达的抗体的任何背景染色。图38B提供了来自以1x10¹⁴ VG/kg剂量的大范围核酸酶处理的小鼠的股四头肌组织中大范围核酸酶和Pax7表达的图像；图38C提供了来自以3x10¹³ VG/kg剂量的大范围核酸酶处理小鼠的图像；和图38D提供了来自以1x10¹³ VG/kg剂量的大范围核酸酶处理小鼠的图像。在图38B-38D中的左图提供了仅表达大范围核酸酶的细胞；中图显示了表达Pax7的细胞；和在图38B-38D中的右图显示了表达大范围核酸酶蛋白或Pax7的细胞，或者表达大范围核酸蛋白酶蛋白和Pax7两者的细胞，如全箭头所指示的。星号表示非特异性背景染色。

序列的简要说明

SEQ ID NO:1显示了来自莱茵衣藻(Chlamydomonas reinhardtii)的野生型I-CreI大范围核酸酶的氨基酸序列。

SEQ ID NO:2显示了LAGLIDADG基序的氨基酸序列。

SEQ ID NO:3显示了核定位信号的氨基酸序列。

SEQ ID NO:4显示了野生型肌营养不良蛋白CCDS48091.1(Gene ID 1756)的氨基酸序列。

SEQ ID NO:5显示了缺乏由外显子45-55编码的氨基酸的野生型肌营养不良蛋白CCDS48091.1(Gene ID 1756)的氨基酸序列。

SEQ ID NO:6显示了DMD 19-20识别序列的有义链的核酸序列。

SEQ ID NO:7显示了DMD 19-20识别序列的有反义链的核酸序列。

SEQ ID NO:8显示了DMD 29-30识别序列的有义链的核酸序列。

SEQ ID NO:9显示了DMD 29-30识别序列的反义链的核酸序列。

SEQ ID NO:10显示了DMD 35-36识别序列的有义链的核酸序列。

SEQ ID NO:11显示了DMD 35-36识别序列的反义链的核酸序列。

SEQ ID NO:12显示了DMD 37-38识别序列的有义链的核酸序列。

SEQ ID NO:13显示了DMD 37-38识别序列的反义链的核酸序列。

SEQ ID NO:14显示了DMD 19-20识别序列的第一半位点有义链的核酸序列。

SEQ ID NO:15显示了DMD 19-20识别序列的第一半位点反义链的核酸序列。

SEQ ID NO:16显示了DMD 29-30识别序列的第一半位点有义链的核酸序列。

SEQ ID NO:17显示了DMD 29-30识别序列的第一半位点反义链的核酸序列。

SEQ ID NO:18显示了DMD 35-36识别序列的第一半位点有义链的核酸序列。

SEQ ID NO:19显示了DMD 35-36识别序列的第一半位点反义链的核酸序列。

SEQ ID NO:20显示了DMD 37-38识别序列的第一半位点有义链的核酸序列。

SEQ ID NO:21显示了DMD 37-38识别序列的第一半位点反义链的核酸序列。

SEQ ID NO:22显示了DMD 19-20识别序列的第二半位点有义链的核酸序列。

SEQ ID NO:23显示了DMD 19-20识别序列的第二半位点反义链的核酸序列。

SEQ ID NO:24显示了DMD 29-30识别序列的第二半位点有义链的核酸序列。

SEQ ID NO:25显示了DMD 29-30识别序列的第二半位点反意义链的核酸序列。

SEQ ID NO:2显示了DMD 35-36识别序列的第二半位点有义链的核酸序列。

SEQ ID NO:27显示了DMD 35-36识别序列的第二半位点反义链的核酸序列。

SEQ ID NO:28显示了DMD 37-38识别序列的第二半位点有义链的核酸序列。

SEQ ID NO:29显示了DMD 37-38识别序列的第二半位点反义链的核酸序列。

SEQ ID NO:30显示了连接的杂交DMD 19-20/29-30有义链的核酸序列。

SEQ ID NO:31显示了连接的杂交DMD 19-20/29-30有义链的核酸序列。

SEQ ID NO:32显示了连接的杂交DMD 19-20/35-36有义链的核酸序列。

SEQ ID NO:33显示了连接的杂交DMD 19-20/35-36有义链的核酸序列。.

SEQ ID NO:34显示了连接的杂交DMD 19-20/37-38有义链的核酸序列。

SEQ ID NO:35显示了连接的杂交DMD 19-20/37-38有义链的核酸序列。

SEQ ID NO:36显示了DMD 19-20x.13工程化大范围核酸酶的氨基酸序列。

SEQ ID NO:37显示了DMD 19-20x.87工程化大范围核酸酶的氨基酸序列。

SEQ ID NO:38显示了DMD 19-20L.249工程化大范围核酸酶的氨基酸序列。

SEQ ID NO:39显示了DMD 19-20L.302工程化大范围核酸酶的氨基酸序列。

SEQ ID NO:40显示了DMD 19-20L.329工程化大范围核酸酶的氨基酸序列。

SEQ ID NO:41显示了DMD 19-20L.374工程化大范围核酸酶的氨基酸序列。

SEQ ID NO:42显示了DMD 19-20L.375工程化大范围核酸酶的氨基酸序列。

SEQ ID NO:43显示了DMD 19-20L.431工程化大范围核酸酶的氨基酸序列。

SEQ ID NO:44显示了DMD 19-20L.458工程化大范围核酸酶的氨基酸序列。

SEQ ID NO:45显示了DMD 35-36x.63工程化大范围核酸酶的氨基酸序列。

SEQ ID NO:46显示了DMD 35-36x.81工程化大范围核酸酶的氨基酸序列。

SEQ ID NO:47显示了DMD 35-36L.195工程化大范围核酸酶的氨基酸序列。

SEQ ID NO:48显示了DMD35-36L.282工程化大范围核酸酶的氨基酸序列。

SEQ ID NO:49显示了DMD35-36L.349工程化大范围核酸酶的氨基酸序列。

SEQ ID NO:50显示了DMD 35-36L.376工程化大范围核酸酶的氨基酸序列。

SEQ ID NO:51显示了DMD 35-36L.457工程化大范围核酸酶的氨基酸序列。

SEQ ID NO:52显示了DMD 35-36L.469工程化大范围核酸酶的氨基酸序列。.

SEQ ID NO:53显示了DMD 37-38x.15工程化大范围核酸酶的氨基酸序列。

SEQ ID NO:54显示了DMD 37-38x.66工程化大范围核酸酶的氨基酸序列。

SEQ ID NO:55显示了DMD 37-38x.79工程化大范围核酸酶的氨基酸序列。

SEQ ID NO:56显示了DMD 37-38x.166工程化大范围核酸酶的氨基酸序列。

SEQ ID NO:57显示了DMD 37-38L.478工程化大范围核酸酶的氨基酸序列。

SEQ ID NO:58显示了DMD 37-38L.512工程化大范围核酸酶的氨基酸序列。

SEQ ID NO:59显示了DMD 37-38L.528工程化大范围核酸酶的氨基酸序列。

SEQ ID NO:60显示了编码DMD 19-20x.13工程化大范围核酸酶的核酸序列。

SEQ ID NO:61显示了编码DMD 19-20x.87工程化大范围核酸酶的核酸序列。

SEQ ID NO:62显示了编码DMD 19-20L.249工程化大范围核酸酶的核酸序列。

SEQ ID NO:64显示了编码DMD 19-20L.302工程化大范围核酸酶的核酸序列。

SEQ ID NO:64显示了编码DMD 19-20L.309工程化大范围核酸酶的核酸序列。

SEQ ID NO:65显示了编码DMD 19-20L.374工程化大范围核酸酶的核酸序列。

SEQ ID NO:66显示了编码DMD 19-20L.375工程化大范围核酸酶的核酸序列。

SEQ ID NO:67显示了编码DMD 19-20L.431工程化大范围核酸酶的核酸序列。

SEQ ID NO:68显示了编码DMD 19-20L.458工程化大范围核酸酶的核酸序列。

SEQ ID NO:69显示了编码DMD 35-36x.63工程化大范围核酸酶的核酸序列。

SEQ ID NO:70显示了编码DMD 35-36x.81工程化大范围核酸酶的核酸序列。

SEQ ID NO:71显示了编码DMD 35-36L.195工程化大范围核酸酶的核酸序列。

SEQ ID NO:72显示了编码DMD 35-36L.282工程化大范围核酸酶的核酸序列。

SEQ ID NO:73显示了编码DMD 35-36L.349工程化大范围核酸酶的核酸序列。

SEQ ID NO:74显示了编码DMD 35-36L.376工程化大范围核酸酶的核酸序列。

SEQ ID NO:75显示了编码DMD 35-36L.457工程化大范围核酸酶的核酸序列。

SEQ ID NO:76显示了编码DMD 35-36L.469工程化大范围核酸酶的核酸序列。

SEQ ID NO:77显示了编码DMD 37-38x.15工程化大范围核酸酶的核酸序列。

SEQ ID NO:78显示了编码DMD 37-38x.66工程化大范围核酸酶的核酸序列。

SEQ ID NO:79显示了编码DMD 37-38x.79工程化大范围核酸酶的核酸序列。

SEQ ID NO:80显示了编码DMD 37-38L.166工程化大范围核酸酶的核酸序列。

SEQ ID NO:81显示了编码DMD 37-38L.478工程化大范围核酸酶的核酸序列。

SEQ ID NO:82显示了编码DMD 37-38L.512工程化大范围核酸酶的核酸序列。

SEQ ID NO:83显示了编码DMD 37-38L.528工程化大范围核酸酶的核酸序列。

SEQ ID NO:84显示了DMD 19-20x.13工程化大范围核酸酶DMD19结合亚基的氨基酸序列。

SEQ ID NO:85显示了DMD 19-20x.87工程化大范围核酸酶DMD19结合亚基的氨基酸序列。

SEQ ID NO:86显示了DMD 19-20L.249工程化大范围核酸酶DMD19结合亚基的氨基酸序列。

SEQ ID NO:87显示了DMD 19-20L.302工程化大范围核酸酶DMD19结合亚基的氨基酸序列。

SEQ ID NO:88显示了DMD 19-20L.329工程化大范围核酸酶DMD19结合亚基的氨基酸序列。

SEQ ID NO:89显示了DMD 19-20L.374工程化大范围核酸酶DMD19结合亚基的氨基酸序列。

SEQ ID NO:90显示了DMD 19-20L.375工程化大范围核酸酶DMD19结合亚基的氨基酸序列。

SEQ ID NO:91显示了DMD 19-20L.431工程化大范围核酸酶DMD19结合亚基的氨基酸序列。

SEQ ID NO:92显示了DMD 19-20L.458工程化大范围核酸酶DMD19结合亚基的氨基酸序列。

SEQ ID NO:93显示了DMD 35-36x.63工程化大范围核酸酶DMD35结合亚基的氨基酸序列。

SEQ ID NO:94显示了DMD 35-36x.81工程化大范围核酸酶DMD35结合亚基的氨基酸序列。

SEQ ID NO:95显示了DMD 35-36L.195工程化大范围核酸酶DMD35结合亚基的氨基酸序列。

SEQ ID NO:96显示了DMD 35-36L.282工程化大范围核酸酶DMD35结合亚基的氨基酸序列。

SEQ ID NO:97显示了DMD 35-36L.349工程化大范围核酸酶DMD35结合亚基的氨基酸序列。

SEQ ID NO:98显示了DMD 35-36L.376工程化大范围核酸酶DMD35结合亚基的氨基酸序列。

SEQ ID NO:99显示了DMD 35-36L.457工程化大范围核酸酶DMD35结合亚基的氨基酸序列。

SEQ ID NO:100显示了DMD 35-36L.469工程化大范围核酸酶DMD35结合亚基的氨基酸序列。

SEQ ID NO:101显示了DMD 37-38x.15工程化大范围核酸酶DMD37结合亚基的氨基酸序列。

SEQ ID NO:102显示了DMD 37-38x.66工程化大范围核酸酶DMD37结合亚基的氨基酸序列。

SEQ ID NO:103显示了DMD 37-38x.79工程化大范围核酸酶DMD37结合亚基的氨基酸序列。

SEQ ID NO:104显示了DMD 37-38L.166工程化大范围核酸酶DMD37结合亚基的氨基酸序列。

SEQ ID NO:105显示了DMD 37-38L.478工程化大范围核酸酶DMD37结合亚基的氨基酸序列。

SEQ ID NO:106显示了DMD 37-38L.512工程化大范围核酸酶DMD37结合亚基的氨基酸序列。

SEQ ID NO:107显示了DMD 37-38L.528工程化大范围核酸酶DMD37结合亚基的氨基酸序列。

SEQ ID NO:108显示了DMD 19-20x.13工程化大范围核酸酶DMD20结合亚基的氨基酸序列。

SEQ ID NO:109显示了DMD 19-20x.87工程化大范围核酸酶DMD20结合亚基的氨基酸序列。

SEQ ID NO:110显示了DMD 19-20L.249工程化大范围核酸酶DMD20结合亚基的氨基酸序列。

SEQ ID NO:111显示了DMD 19-20L.302工程化大范围核酸酶DMD20结合亚基的氨基酸序列。

SEQ ID NO:112显示了DMD 19-20L.329工程化大范围核酸酶DMD20结合亚基的氨基酸序列。

SEQ ID NO:113显示了DMD 19-20L.374工程化大范围核酸酶DMD20结合亚基的氨基酸序列。

SEQ ID NO:114显示了DMD 19-20L.375工程化大范围核酸酶DMD20结合亚基的氨基酸序列。

SEQ ID NO:115显示了DMD 19-20L.431工程化大范围核酸酶DMD20结合亚基的氨基酸序列。

SEQ ID NO:116显示了DMD 19-20L.458工程化大范围核酸酶DMD20结合亚基的氨基酸序列。

SEQ ID NO:117显示了DMD 35-36x.63工程化大范围核酸酶DMD36结合亚基的氨基酸序列。

SEQ ID NO:118显示了DMD 35-36x.81工程化大范围核酸酶DMD36结合亚基的氨基酸序列。

SEQ ID NO:119显示了DMD 35-36L.195工程化大范围核酸酶DMD36结合亚基的氨基酸序列。

SEQ ID NO:120显示了DMD 35-36L.282工程化大范围核酸酶DMD36结合亚基的氨基酸序列。

SEQ ID NO:121显示了DMD 35-36L.349工程化大范围核酸酶DMD36结合亚基的氨基酸序列。

SEQ ID NO:122显示了DMD 35-36L.376工程化大范围核酸酶DMD36结合亚基的氨基酸序列。

SEQ ID NO:123显示了DMD 35-36L.457工程化大范围核酸酶DMD36结合亚基的氨基酸序列。

SEQ ID NO:124显示了DMD 35-36L.469工程化大范围核酸酶DMD36结合亚基的氨基酸序列。

SEQ ID NO:125显示了DMD 37-38x.15工程化大范围核酸酶DMD38结合亚基的氨基酸序列。

SEQ ID NO:126显示了DMD 37-38x.66工程化大范围核酸酶DMD38结合亚基的氨基酸序列。

SEQ ID NO:127显示了DMD 37-38x.79工程化大范围核酸酶DMD38结合亚基的氨基酸序列。

SEQ ID NO:128显示了DMD 37-38L.166工程化大范围核酸酶DMD38结合亚基的氨基酸序列。

SEQ ID NO:129显示了DMD 37-38L.468工程化大范围核酸酶DMD38结合亚基的氨基酸序列。

SEQ ID NO:130显示了DMD 37-38L.512工程化大范围核酸酶DMD38结合亚基的氨基酸序列。

SEQ ID NO:131显示了DMD 37-38L.528工程化大范围核酸酶DMD38结合亚基的氨基酸序列。

SEQ ID NO:132显示了接头序列的氨基酸序列。

SEQ ID NO:133显示了在用于检测DMD 19-20识别序列处的INDEL的ddPCR测定中使用的探针的核酸序列。

SEQ ID NO:134显示了在用于检测DMD 19-20识别序列处的INDEL的ddPCR测定中使用的正向PCR引物的核酸序列。

SEQ ID NO:135显示了在用于检测DMD 19-20识别序列处的INDEL的ddPCR测定中使用的正向PCR引物的核酸序列。

SEQ ID NO:136显示了在用于检测INDEL的ddPCR测定中用作参考的探针的核酸序列。

SEQ ID NO:137显示了在用于检测INDEL的ddPCR测定中用作参考的正向PCR引物的核酸序列。

SEQ ID NO:138显示了在用于检测INDEL的ddPCR测定中用作参考的正向PCR引物的核酸序列。

SEQ ID NO:139显示了在用于检测DMD 37-38识别序列处的INDEL的ddPCR测定中使用的探针的核酸序列。

SEQ ID NO:140显示了在用于检测DMD 37-38识别序列处的INDEL的ddPCR测定中使用的正向PCR引物的核酸序列。

SEQ ID NO:141显示了在用于检测DMD 37-38识别序列处的INDEL的ddPCR测定中使用的正向PCR引物的核酸序列。

SEQ ID NO:142显示了在用于检测DMD 35-36识别序列处的INDEL的ddPCR测定中使用的探针的核酸序列。

SEQ ID NO:143显示了在用于检测DMD 35-36识别序列处的INDEL的ddPCR测定中使用的正向PCR引物的核酸序列。

SEQ ID NO:144显示了在用于检测DMD 35-36识别序列处的INDEL的ddPCR测定中使用的正向PCR引物的核酸序列。

SEQ ID NO:145显示了在用于检测DMD 29-30识别序列处的INDEL的ddPCR测定中使用的探针的核酸序列。

SEQ ID NO:146显示了在用于检测DMD 29-30识别序列处的INDEL的ddPCR测定中使用的正向PCR引物的核酸序列。

SEQ ID NO:147显示了在用于检测DMD 29-30识别序列处的INDEL的ddPCR测定中使用的正向PCR引物的核酸序列。

SEQ ID NO:148显示了在用于DMD 19-20向DMD 35-36连接的识别序列的PCR扩增测定中使用的正向PCR引物的核酸序列。

SEQ ID NO:149显示了在用于DMD 19-20向DMD 35-36连接的识别序列的PCR扩增测定中使用的反向PCR引物的核酸序列。

SEQ ID NO:150显示了在用于DMD 19-20向DMD 35-36连接的识别序列的PCR扩增测定中使用的正向PCR引物的核酸序列。

SEQ ID NO:151显示了在用于DMD 19-20向DMD 35-36连接的识别序列的PCR扩增测定中使用的反向PCR引物的核酸序列。

SEQ ID NO:152显示了在用于DMD 19-20向DMD 29-30连接的识别序列的PCR扩增测定中使用的正向PCR引物的核酸序列。

SEQ ID NO:153显示了在用于DMD 19-20向DMD 29-30连接的识别序列的PCR扩增测定中使用的反向PCR引物的核酸序列。

SEQ ID NO:154显示了在用于DMD 19-20向DMD 29-30连接的识别序列的PCR扩增测定中使用的正向PCR引物的核酸序列。

SEQ ID NO:155显示了在用于DMD 19-20向DMD 29-30连接的识别序列的PCR扩增测定中使用的反向PCR引物的核酸序列。

SEQ ID NO:156显示了在用于DMD 19-20向DMD 37-38连接的识别序列的PCR扩增测定中使用的正向PCR引物的核酸序列。

SEQ ID NO:157显示了在用于DMD 19-20向DMD 37-38连接的识别序列的PCR扩增测定中使用的反向PCR引物的核酸序列。

SEQ ID NO:158显示了在用于DMD 19-20向DMD 37-38连接的识别序列的PCR扩增测定中使用的正向PCR引物的核酸序列。

SEQ ID NO:159显示了在用于DMD 19-20向DMD 37-38连接的识别序列的PCR扩增测定中使用的反向PCR引物的核酸序列。

SEQ ID NO:160显示了在用于DMD 19-20向DMD 37-38连接的识别序列的ddPCR测定中使用的探针的核酸序列。

SEQ ID NO:161显示了在用于DMD 19-20向DMD 37-38连接的识别序列的ddPCR测定中使用的正向PCR引物的核酸序列。

SEQ ID NO:162显示了在用于DMD 19-20向DMD 37-38连接的识别序列的ddPCR测定中使用的反向PCR引物的核酸序列。

SEQ ID NO:163显示了在用于DMD 19-20向DMD 35-36连接的识别序列的ddPCR测定中使用的探针的核酸序列。

SEQ ID NO:164显示了在用于DMD 19-20向DMD 35-36连接的识别序列的ddPCR测定中使用的正向PCR引物的核酸序列。

SEQ ID NO:165显示了在用于DMD 19-20向DMD 35-36连接的识别序列的ddPCR测定中使用的反向PCR引物的核酸序列。.

SEQ ID NO:166显示了在用于DMD 19-20向DMD 29-30连接的识别序列的ddPCR测定中使用的探针的核酸序列。

SEQ ID NO:167显示了在用于DMD 19-20向DMD 29-30连接的识别序列的ddPCR测定中使用的正向PCR引物的核酸序列。

SEQ ID NO:168显示了在用于DMD 19-20向DMD 29-30连接的识别序列的ddPCR测定中使用的反向PCR引物的核酸序列。

SEQ ID NO:169显示了C5-12启动子序列的核酸序列。

SEQ ID NO:170显示了小鼠MCK启动子和增强子序列的核酸序列。

SEQ ID NO:171显示了人MCK启动子序列的核酸序列。

SEQ ID NO:172显示了野生型MCK增强子序列的核酸序列。

SEQ ID NO:173显示了修饰的MCK增强子序列的核酸序列。

SEQ ID NO:174显示了spc 5-12启动子序列的核酸序列。

SEQ ID NO:175显示了MHCK7启动子序列的核酸序列。

SEQ ID NO:176显示了CK8启动子序列的核酸序列。

SEQ ID NO:177显示了SK-CRM4启动子序列的核酸序列。

SEQ ID NO:178显示了SP-301启动子序列的核酸序列。

SEQ ID NO:179显示了SP-817启动子序列的核酸序列。

SEQ ID NO:180显示了SP-905启动子序列的核酸序列。

SEQ ID NO:181显示了肌杂交启动子序列的核酸序列。

SEQ ID NO:182显示了rh.74AAV衣壳的氨基酸序列。

SEQ ID NO:183显示了AAV9衣壳的氨基酸序列。

SEQ ID NO:184显示了正向引物的核酸序列。

SEQ ID NO:185显示了反向引物的核酸序列。

SEQ ID NO:186显示了探针的核酸序列。

SEQ ID NO:187显示了正向引物的核酸序列。

SEQ ID NO:188显示了反向引物的核酸序列。

SEQ ID NO:189显示了探针的核酸序列。

SEQ ID NO:190显示了正向引物的核酸序列。

SEQ ID NO:191显示了反向引物的核酸序列。

SEQ ID NO:192显示了探针的核酸序列。

SEQ ID NO:193显示了反向引物的核酸序列。

具体实施方式

1.1参考文献和定义

本文提及的专利和科学文献建立了本领域技术人员可用的知识。本文引用的授权美国专利、授权申请、公开的外国申请和包括GenBank数据库序列的参考文献通过引用并入本文，其程度如同每一个被具体和单独地指出以通过引用并入。

本发明可以以不同的形式实施，并且不应该被解释为限于本文列出的实施方式。相反，提供这些实施方式以使本公开详细和完整，并将本发明的范围充分传达给本领域技术人员。例如，关于一个实施方式示出的特征可以被并入其他实施方式中，并且关于特定实施方式示出的特征可以从该实施方式中删除。此外，根据本公开，对本文提出的实施方式的许多变化和添加对于本领域技术人员将是明显的，其不脱离本发明。

除非另外定义，否则本文使用的所有技术和科学术语具有与本发明所属领域的普通技术人员通常理解的相同的含义。在本发明的说明书中使用的术语仅用于描述特定实施方式的目的，而不旨在限制本发明。

本文提及的所有出版物、专利申请、专利和其他参考文献通过引用整体并入本文。

如本文所用，“一个/一种(a/an)”或“所述/该(the)”可以指一个或多于一个。例如，“一个”细胞可以指单个细胞或多个细胞。

如本文所用，除非另外特别指出，否则词语“或”以“和/或”的包含性含义使用，而不是“任一/或”的排他性含义。

如本文所用，术语“核酸酶”和“核酸内切酶”可互换使用，指切割多核苷酸链内的磷酸二酯键的天然存在的或工程化的酶。工程化核酸酶可以包括但不限于工程化大范围核酸酶、锌指核酸酶、TALEN、紧凑型TALEN，CRISPR系统核酸酶和大范围TAL。此外，任何能够在其切割位点产生突出端的工程化核酸酶都是可以设想的。

如本文所用，术语“切割”或“裂解”指靶序列内识别序列骨架内磷酸二酯键的水解，导致靶序列内的双链断裂，本文中称为“切割位点”。

如本文所用，术语“大范围核酸酶”是指在大于12个碱基对的识别序列处结合双链DNA的核酸内切酶。在一些实施方式中，用于本公开的大范围核酸酶的识别序列是22个碱基对。大范围核酸酶可以是来源自I-CreI(SEQ ID NO:1)的核酸内切酶，并且可以指相对于天然I-CreI在例如DNA结合特异性、DNA切割活性、DNA结合亲和力或二聚化性质方面已被修饰的I-CreI的工程化变体。用于产生此类修饰的I-CreI变体的方法是本领域已知的(例如，WO2007/047859，通过引用整体并入)。如本文所用，大范围核酸酶作为异源二聚体结合双链DNA。大范围核酸酶也可以是“单链大范围核酸酶”，其中使用肽接头将一对DNA结合结构域连接成单个多肽。术语“归巢核酸内切酶”与术语“大范围核酸酶”同义。当在本文所述的靶细胞中表达时，本公开的大范围核酸酶是基本上无毒的，使得细胞可以被转染并维持在37℃，而不会观察到对细胞活力的有害影响或大范围核酸酶切割活性的显著降低(当使用本文所述方法测量时)。

如本文所用，术语“单链大范围核酸酶”是指包含通过接头连接的一对核酸酶亚基的多肽。单链大范围核酸酶具有以下组织结构：N末端亚基-接头-C末端亚基。两个大范围核酸酶亚基在氨基酸序列上通常是不相同的，并且将结合不相同的DNA序列。因此，单链大范围核酸酶通常切割伪回文或非回文识别序列。单链大范围核酸酶可以被称为“单链异二聚体”或“单链异二聚体大范围核酸酶”，尽管事实上它不是二聚的。为清楚起见，除非另有说明，术语“大范围核酸酶”可指二聚体或单链大范围核酸酶。

如本文所用，术语“接头”是指用于将两个核酸酶亚基连接成单个多肽的外源肽序列。接头可以具有在天然蛋白质中发现的序列，或者可以是在任何天然蛋白质中未发现的人工序列。接头可以是柔性的并且缺乏二级结构，或者可以具有在生理条件下形成特定三维结构的倾向。接头可以包括但不限于美国专利号8,445,251、9,340,777、9,434,931和10,041,053所涵盖的那些，其每一个以引用方式整体并入。在一些实施方式中，接头可以与SEQID NO:132具有至少80％、至少85％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或100％序列同一性，所述SEQ ID NO:132示出了SEQ ID NO:36-59中任一个的残基154-195。

如本文所用，关于蛋白质，术语“重组的”或“工程化的”是指由于将基因工程技术应用于编码蛋白质的核酸和表达蛋白质的细胞或生物体而具有改变的氨基酸序列。关于核酸，术语“重组的”或“工程化的”是指由于应用基因工程技术而具有改变的核酸序列。基因工程技术包括但不限于PCR和DNA克隆技术；转染、转化和其他基因转移技术；同源重组；定点诱变；和基因融合。根据该定义，具有与天然存在的蛋白质相同的氨基酸序列但通过在异源宿主中克隆和表达产生的蛋白质不被认为是重组的或工程化的。

如本文所用，术语“野生型”是指相同类型基因的等位基因群体中最常见的天然存在的等位基因(即多核苷酸序列)，其中由野生型等位基因编码的多肽具有其原始功能。术语“野生型”也指由野生型等位基因编码的多肽。野生型等位基因(即多核苷酸)和多肽与突变体或变体等位基因和多肽是可区分的，所述突变体或变体等位基因和多肽相对于野生型序列包含一个或多个突变和/或置换。鉴于野生型等位基因或多肽可赋予生物体正常表型，因此在一些情况下，突变体或变体等位基因或多肽可赋予改变的表型。野生型核酸酶与重组或非天然存在的核酸酶是可区分的。术语“野生型”还可以指具有特定基因的野生型等位基因的细胞、生物体和/或受试者，或用于比较目的的细胞、生物体和/或受试者。

如本文所用，术语“遗传修饰的”指细胞或生物体，其中或其祖先中的基因组DNA序列已通过重组技术被有意修饰。如本文所用，术语“遗传修饰的”包含术语“转基因”。

如本文所用，关于重组蛋白，术语“修饰”是指重组序列中的氨基酸残基相对于参照序列(例如，野生型或天然序列)的任何插入、缺失或置换。

如本文所用，术语“识别序列”或“识别位点”是指被核酸酶结合并切割的DNA序列。在大范围核酸酶的情况下，识别序列包含一对反向的9个碱基对的“半位点”，它们被4个碱基对分隔开。在单链大范围核酸酶的情况下，蛋白质的N-末端结构域接触第一半位点，蛋白质的C-末端结构域接触第二半位点。由大范围核酸酶切割产生四碱基对的3’“突出端”。“突出端”或“粘性末端”是短的单链DNA片段，其可以通过对双链DNA序列进行核酸内切酶切割而产生。在来源于I-CreI的大范围核酸酶和单链大范围核酸酶的情况下，突出端包含22个碱基对识别序列的碱基10-13。

如本文所用，术语“靶位点”或“靶序列”是指包含核酸酶识别序列的细胞染色体DNA的区域。

如本文所用，术语“DNA结合亲和力”或“结合亲和力”是指大范围核酸酶与参照DNA分子(例如，识别序列或任意序列)非共价缔合的倾向。通过解离常数Kd测量结合亲和力。如本文所用，如果核酸酶对参照识别序列的Kd相对于参照核酸酶增加或减少统计学上显著的百分比变化，则核酸酶具有“改变的”结合亲和力。

如本文所用，术语“特异性”是指核酸酶仅在称为识别序列的特定碱基对序列处或仅在一组特定识别序列处识别并切割双链DNA分子的能力。该组识别序列将共有某些保守的位置或序列基序，但在一个或多个位置可能是简并的。高度特异性核酸酶能够仅切割一个或极少数识别序列。特异性可以通过本领域已知的任何方法测定。

如本文所用，术语“肌营养不良蛋白基因”指与国家生物技术信息中心(NCBI)基因ID 1756相关的基因及其天然存在的变体。术语“肌营养不良蛋白”指由肌营养不良蛋白基因编码的多肽。在肌细胞和肌前体细胞中表达的肌营养不良蛋白亚型称为Dp427m肌营养不良蛋白变体。全长野生型Dp427m肌营养不良蛋白多肽的氨基酸序列如SEQ ID NO:4中所示。NCBI参考编号NM_004006.3和NP_003997.2分别显示了肌营养不良蛋白Dp427m mRNA和多肽。在本文所述的一些实施方式中，用一对工程化大范围核酸酶编辑肌营养不良蛋白基因，导致肌营养不良蛋白基因外显子45-55的切除和随后的完美连接。从野生型肌营养不良蛋白基因中去除外显子45-55可产生包含如SEQ ID NO:5中所示的氨基酸序列的肌营养不良蛋白多肽。

如本文所用，术语“完美连接”指被本发明的工程化大范围核酸酶切割后，肌营养不良蛋白基因中第一个切割位点的3’突出端的全部四个碱基与第二切割位点互补性3’突出端的全部四个碱基连接(即，退火)。所公开的工程化大范围核酸酶靶向的识别序列具有相同的四个碱基对中心序列(例如，GTAT)，以使得第一和第二切割位点将具有互补的四个碱基对3’突出端。因此，第一3’突出端的每个碱基对与其在第二3’突出端上的互补碱基对配对，并且连接通过DNA连接酶发生。由这种完美连接产生的序列的实例显示在SEQ ID NO:32(即，DMD 19-20和DMD 35-36识别序列的完美连接)和SEQ ID NO:34(即，DMD 19-20和DMD37-38识别序列的完美连接)中。

如本文所用，术语“贝克型肌营养不良症表型”指与DMD相比，不太严重的肌营养不良症形式。患有贝克型肌营养不良症的个体仍包含在肌营养不良蛋白基因中的突变，但与患有DMD的个体相比，在肌细胞(例如，肌前体细胞、骨骼肌细胞和心肌细胞)中表达更多功能性肌营养不良蛋白，通常导致更好的临床预后。

如本文所用，术语“同源重组”或“HR”是指其中使用同源DNA序列作为修复模板修复双链DNA断裂的天然细胞过程(参见，例如Cahill等，(2006)Front.Biosci.11:1958-76)。同源DNA序列可以是内源染色体序列或递送至细胞的外源核酸。

如本文所用，术语“非同源末端连接”或“NHEJ”是指其中通过直接连接两个非同源DNA片段来修复双链DNA断裂的天然细胞过程(参见，例如，Cahill等，(2006))。通过非同源末端连接的DNA修复是易错的，并且经常导致修复位点处DNA序列的非模板添加或缺失。在一些情况下，在靶识别序列处的切割导致在靶识别位点处的NHEJ。基因编码序列中核酸酶诱导的靶位点的切割随后通过NHEJ的DNA修复可以向编码序列中引入破坏基因功能的突变，例如移码突变。因此，工程化大范围核酸酶可用于有效地敲除细胞群体中的基因。

如本文所用，术语“同源臂”或“与大范围核酸酶切割位点侧翼序列同源的序列”是指核酸分子的5’和3’端侧翼的序列，其促进将核酸分子插入至由大范围核酸酶产生的切割位点中。一般而言，同源臂的长度可以是至少50个碱基对，优选至少100个碱基对，且至多2000个碱基对或更多，并且可以与其在基因组中对应的序列具有至少90％、优选至少95％或更高的序列同源性。在一些实施方式中，同源臂为约500个碱基对。

如本文关于氨基酸序列和核酸序列两者所使用的，术语“百分比同一性”、“序列同一性”、“百分比相似性”、“序列相似性”等是指基于使比对的氨基酸残基或核苷酸之间的相似性最大化的序列比对的两个序列的相似性程度的度量，并且其随相同或相似残基或核苷酸的数目、总残基或核苷酸的数目、以及序列比对中缺口的存在和长度变化。多种算法和计算机程序可用于使用标准参数确定序列相似性。如本文所用，序列相似性是使用用于氨基酸序列的BLASTp程序和用于核酸序列的BLASTn程序测量的，两者均可通过国家生物技术信息中心(www.ncbi.nlm.nih.gov/)获得，并且在例如在以下中描述：例如Altschul等，(1990)J.Mol.Biol.215:403-10；Gish&States(1993)Nature Genet.3:266-72；Madden等，(1996)Meth.Enzymol.266:131-41；Altschul等，(1997)Nucleic Acids Res.25:3389-3402；和Zhang等，(2000)J.Comput.Biol.7:203-14。如本文所用，两个氨基酸序列的百分比相似性是基于BLASTp算法的以下参数的得分：字长＝3；缺口空位罚分＝-11；缺口延伸罚分＝-1；和评分矩阵＝BLOSUM62。如本文所用，两个核酸序列的百分比相似性是基于BLASTn算法的以下参数的得分：字长＝11；缺口空位罚分＝-5；缺口延伸罚分＝-2；匹配奖励＝1；和错配罚分＝-3。

如本文关于两个蛋白质或氨基酸序列的修饰所使用的，术语“对应于”用于表示第一蛋白质中的指定修饰是与第二蛋白质的修饰中相同的氨基酸残基的置换，并且当两个蛋白质进行标准序列比对(例如，使用BLASTp程序)时，第一蛋白质中的修饰氨基酸位置与第二蛋白质中的修饰氨基酸位置对应或对齐。因此，如果在序列比对中残基X和Y彼此对应，尽管X和Y可能是不同的编号，但第一蛋白质中残基“X”修饰成氨基酸“A”将对应于在第二蛋白质中残基“Y”修饰成氨基酸“A”。

如本文所用，术语“识别半位点”、“识别序列半位点”或简称为“半位点”是指被同型二聚体或异二聚体大范围核酸酶的单体或单链大范围核酸酶的一个亚基或单链大范围核酸酶的一个亚单元识别并结合的双链DNA分子中的核酸序列。

如本文所用，术语“高变区”是指大范围核酸酶单体或亚基内的局部序列，其包含具有相对高可变性的氨基酸。高变区可包含约50-60个连续的残基、约53-57个连续的残基或优选地约56个残基。在一些实施方式中，高变区的残基可对应于SEQ ID NO:36-59中任一项的位置24-79或位置215-270。高变区可以包含一个或多个与识别序列中的DNA碱基接触的残基，并且可以被修饰以改变单体或亚单位的碱基偏好。当大范围核酸酶与双链DNA识别序列结合时，高变区还可以包含一个或多个与DNA骨架结合的残基。可以修饰这些残基以改变大范围核酸酶对DNA骨架和靶识别序列的结合亲和力。在本发明的不同实施方式中，高变区可以包含表现出可变性并且可以被修饰以影响碱基偏好和/或DNA结合亲和力的1-20个残基。在特定的实施方式中，高变区包含表现出可变性并且可以被修饰以影响碱基偏好和/或DNA结合亲和力的约15-20个残基。在一些实施方式中，高变区内的可变残基对应于SEQID NO:36-59中任一项的位置24、26、28、30、32、33、38、40、42、44、46、68、70、75和77的一个或多个。在某些实施方式中，高变区内的可变残基还可以对应于SEQ ID NO:36-59中任一项的残基48、50和71-73。在其他实施方式中，高变区内的可变残基对应于SEQ ID NO:36-59的一个或多个的位置215、217、219、221、223、224、229、231、233、235、237、239、241、259、261、262、263、264、266和268的一个或多个。在某些实施方式中，高变区内的可变残基还可以对应于SEQ ID NO:36-59中任一项的残基239、241和263-265。

在肌营养不良蛋白或mRNA水平的上下文中，术语“增加”指当与参考水平或对照相比时，肌营养不良蛋白或mRNA的表达水平相对于参考水平的任何增加，包括肌营养不良蛋白或mRNA的表达增加至少1％、2％、3％、4％、5％、10％、15％、20％、25％、30％、40％、50％、60％、70％、80％、90％、95％、100％或更多。在一些实施方式中，肌营养不良蛋白或mRNA水平的增加是指与野生型肌营养不良蛋白多肽或基因相比，缩短的肌营养不良蛋白多肽或mRNA转录物的增加，例如，缺失由至少一个外显子编码的多肽的一部分(例如，由外显子45-55编码的一部分)或缺失对应于外显子45-55的mRNA的一部分。

如本文所用，在肌营养不良蛋白或mRNA水平的上下文中，术语“参考水平”指在例如对照细胞、对照细胞群或对照受试者中在对照细胞中的先前时间点测量的肌营养不良蛋白或mRNA的水平，对照细胞群或正在接受治疗的受试者(例如，从对照细胞、对照细胞群或受试者获得的给药前基线水平)，或肌营养不良蛋白或mRNA的预定义阈值水平(例如，通过先前实验鉴定的阈值水平)。

如本文所用，“对照”或“对照细胞”是指提供用于测定遗传修饰的细胞的基因型或表型变化的参考点的细胞。对照细胞可以包括例如：(a)野生型细胞，即与用于产生遗传修饰的细胞的遗传改变的起始材料基因型相同的细胞；(b)与遗传修饰的细胞基因型相同但已用无效构建体(即，用对目标性状没有已知影响的构建体)转化的细胞；或(c)与遗传修饰的细胞遗传上相同但不暴露于将诱导改变的基因型或表型的表达的条件或刺激或进一步遗传修饰的细胞。对照受试者可以包括例如：野生型受试者，即与导致遗传修饰的受试者的基因改变的初始受试者具有相同基因型(例如，在肌营养不良蛋白基因中具有相同突变的受试人)，其未暴露于会诱导受试者中改变的基因型或表型的表达的条件或刺激或进一步的遗传修饰。

如本文所用，术语“重组DNA构建体”、“重组构建体”、“表达盒”、“盒”、“表达构建体”、“嵌合构建体”、“构建体”和“重组DNA片段”在本文中可互换使用，并且它们是单链或双链多核苷酸。重组构建体包含核酸片段的人工组合，包括但不限于自然界中未发现在一起的调控序列和编码序列。例如，重组DNA构建体可包含源于不同来源的调控序列和编码序列，或源于相同来源并以不同于天然发现的方式排列的调控序列和编码序列。这种构建体可以单独使用或与载体结合使用。

如本文所用，“载体”或“重组DNA载体”可以是包括复制系统和能够在给定宿主细胞中转录和翻译多肽编码序列的序列的构建体。如果使用载体，则载体的选择取决于本领域技术人员熟知的用于转化宿主细胞的方法。载体可包括但不限于质粒载体和重组AAV载体，或本领域已知的适用于将基因递送至靶细胞的任何其他载体。本领域技术人员熟知必须存在于载体上的遗传元件，以成功转化、选择和扩增包含本发明的任何分离的核苷酸或核酸序列的宿主细胞。在一些实施方式中，“载体”也指病毒载体。病毒载体可包括但不限于逆转录病毒载体、慢病毒载体、腺病毒载体和AAV。

如本文所用，术语“可操作地连接”旨在表示两个或更多个元件之间的功能性连接。例如，编码本文所述核酸酶的核酸序列与调控序列(例如，启动子)之间的可操作连接是允许编码核酸酶的核酸序列表达的功能性连接。可操作地连接的元件可以是连续的或非连续的。当用于指两个蛋白编码区的连接时，可操作地连接是指编码区在同一阅读框中。

如本文所用，术语“治疗”或“治疗受试者”是指向患有DMD的受试者施用本文所述的工程化大范围核酸酶，或编码本文所述工程化大范围核苷酸酶的多核苷酸，或一对这样的工程化大范围核酸酶或多核苷酸，以提高受试者中肌营养不良蛋白的水平。在一些实施方式中，肌营养不良蛋白的缩短形式(例如，缺失由多个外显子编码的氨基酸)的表达增加。在一些实施方式中，缺乏由外显子45-55编码的氨基酸的肌营养不良蛋白的形式的表达增加。在一些实施方式中，这种治疗将DMD表型转变为贝克型肌营养不良症表型。

如本文所用，术语“gc/kg”或“基因拷贝/千克”是指每千克被施用编码工程化大范围核酸酶的核酸的受试者的体重的编码本文所述工程化大范围核酸酶的核酸的拷贝数。

如本文所用，术语术语“有效量”或“治疗有效量”是指足以实现有益或期望的生物学和/或临床结果的量。治疗有效量将根据所使用的制剂或组合物、疾病及其严重程度以及待治疗受试者的年龄、体重、身体状况和反应性而变化。在特定实施方式中，有效量的本文所述的工程化大范围核酸酶或一对工程化大范围核苷酸酶，或编码其的多核苷酸或一对多核苷酸，或本文所公开的药物组合物，增加肌营养不良蛋白(例如，缺乏外显子45-55编码的氨基酸的缩短的肌营养不良蛋白)的表达水平并改善与DMD相关的至少一种症状。

如本文所用，术语“脂质纳米颗粒”是指通常具有平均直径为10-1000纳米的典型球形结构的脂质组合物。在一些制剂中，脂质纳米颗粒可包含至少一种阳离子脂质、至少一种非阳离子脂质和至少一种缀合脂质。本领域内已知的适合于包封核酸(如mRNA)的脂质纳米颗粒预期用于本发明。

如本文所用，变量的数值范围的叙述旨在传达可以用等于该范围内的任何值的变量来实践本公开。因此，对于固有离散的变量，变量可以等于该数值范围内的任何整数值，包括范围的端点。类似地，对于固有连续的变量，变量可以等于数值范围内的任何实数值，包括范围的端点。作为示例而非限制，如果变量是固有离散的，则被描述为具有在0和2之间的值的变量可以取值0、1或2，并且如果变量是固有连续的，则可以取值0.0、0.1、0.01、0.001或≥0且≤2的任何其他实数值。

2.1发明的原理

本公开部分基于这样的假设，即肌营养不良蛋白基因中引起DMD表型的某些缺失可以通过利用核酸内切酶对战略性缺失肌营养不良蛋白基因的外显子来补偿，以恢复基因内的正常阅读框。DMD-Leiden数据库显示，导致DMD的大多数突变是一个或多个完整外显子的缺失，导致阅读框的移位。在很多情况下，可以通过在突变之前或之后立即消除外显子来恢复阅读框。如在表3中所示，29种不同的引起杜氏的突变约占65％的患者，可以通过缺失突变附近的单个外显子来补偿。

表3：

例如，由于外显子45的缺失而患有疾病的患者(发生在约7％的患者中)可以用缺失外显子46的治疗剂进行治疗。能够缺失外显子51或外显子45的治疗剂可以分别用于治疗15％和13％的患者。

值得注意的是，肌营养不良蛋白基因内超过50％的DMD相关突变包含在外显子45至55中。因此，在本发明的特定实施方式中，将去除肌营养不良蛋白基因的外显子45至55，以恢复该基因的正常阅读框。如本文所公开的，外显子去除是通过在肌细胞或肌前体细胞(例如，心肌细胞或骨骼肌细胞)中表达一对工程化大范围核酸酶来实现的，所述大范围核酸酶在外显子45上游和外显子55下游的内含子中产生一对切割位点，从而允许切除期间的基因组区域。按照这种方法，遗传修饰的细胞(例如，治疗受试者中的肌细胞)将能够从贝克型表型中产生一定量的缩短的肌营养不良蛋白，这类似于微肌营养不良方法，而不必表达微肌营养不良蛋白转基因。这种缩短的肌营养不良蛋白可能足以永久挽救疾病，而不像需要多个连续治疗方案的其他疗法。

因此，可以设想，一次治疗将从受试者一定比例的细胞中永久缺失外显子。在一些实施方式中，这些细胞将是成肌细胞(即，肌细胞)或其他能够复制并产生表达功能性(或半功能性)肌营养不良蛋白的全肌纤维的肌前体细胞。然而，如果外显子缺失的频率较低，则可能需要对每个患者进行多次治疗。

2.2结合并切割肌营养不良蛋白基因内的识别序列的大范围核酸酶识别序列

本领域公知，可以使用位点特异性核酸酶在活细胞的基因组中进行DNA断裂，并且这种DNA断裂可以通过诱变性NHEJ修复或通过与转基因DNA序列的同源重组导致基因组的永久修饰。NHEJ可以在切割位点产生突变，导致等位基因失活。NHEJ相关突变可能通过产生早期终止密码子、产生异常非功能蛋白的移码突变使等我基因失活，或者可能触发无意义介导的mRNA衰变等机制。使用核酸酶通过NHEJ诱导突变可用于靶向野生型等位基因中存在的特定突变或序列。此外，已知使用核酸酶在靶基因座中诱导双链断裂会刺激同源重组，特别是两侧为与基因组靶同源序列的转基因DNA序列的同源重组。以这种方式，可以将外源多核苷酸插入到靶基因座中。此类外源性多核苷酸可以编码任何所关注的序列或多肽。

在特定实施方式中，可以将本发明的工程化大范围核酸酶设计为结合和切割DMD19-20识别序列(SEQ ID NO:6)、DMD 35-36识别序列(SEQ ID NO:10)或DMD 37-38识别序列(SEQ ID NO:12)。在SEQ ID NO:36-44中提供了结合和切割DMD 19-20识别序列的示例性大范围核酸酶。在SEQ ID NO:45-52中提供了结合和切割DMD 35-36识别序列的示例性大范围核酸酶。在SEQ ID NO:53-59中提供了结合和切割DMD 37-38识别序列的示例性大范围核酸酶。下表4中提供了每个识别序列的序列，以及当被本文所述的工程化大范围核酸酶切割时产生的四个碱基对3’突出端。

表4：工程化大范围核酸酶识别序列

识别序列	SEQ ID NO:	4bp 3’突出端
			AAGGATTATGTATTACCTCCCG	6	GTAT
TAAGATTGGGTATGAGGGATAG	8	GTAT
			CTACATGGTGTATCTGACTAAG	10	GTAT
CTGGCCGAAGTATAGGAATATG	12	GTAT

为了修饰根据本公开的肌营养不良蛋白基因，在同一细胞中一起使用本文所述的一对工程化大范围核酸。将这种工程化大范围核酸酶对设计为在外显子45上游的内含子中产生第一切割位点和在外显子55下游的内含子中产生第二切割位点，以使得去除期间的基因组序列。令人吃惊的是，观察到可以高效完成从尺寸大于500,000bp的肌营养不良蛋白基因中切除该基因组区域。此外，选择在切割后具有互补的四个碱基对3’突出端的大范围核酸酶识别序列，并且观察到肌营养不良蛋白基因可以通过两个切割位点的3’突出端的完美连接而被高频修复。下表5中提供了本文涉及的这种完美连接识别序列。

表5：连接的识别序列

将这些识别序列进一步选择为在转录后修饰细胞过程中正常剪接出来的内含子序列中。这降低了突变引入肌营养不良蛋白基因和编码的多肽的可能性。

示例性工程化大范围核酸酶

本发明的工程化大范围核酸酶包含含有HVR1区的第一亚基和含有HVR2区的第二亚基。此外，第一亚基与识别序列中的第一识别半位点(例如，DMD19半位点)结合，和第二亚基与识别序列中的第二识别半位点(例如，DMD20半位点)结合。

在特定实施方式中，用于实施本发明的大范围核酸酶是单链大范围核酸酶。单链大范围核酸酶包含通过接头肽连接的N末端亚基和C末端亚基(即，上文讨论的第一和第二亚基)。两个亚基中的每一个都识别并结合识别序列的半位点，并且DNA切割位点位于识别序列的中间，靠近两个亚基的界面。如所讨论的，DNA链断裂被四个碱基对抵消，以使得DNA被大范围核酸酶切割以产生四个碱基3’单链突出端对。

在其中工程化大范围核酸酶是单链大范围核酸酶的实施方式中，可以对第一和第二亚基进行定向，以使得包含HVR1区并结合第一半位点的第一亚基被定位为N末端亚基，和包含HVR2区并结合第二半位点的第二亚基被定位为C末端亚基。在替代实施方式中，可以对第一和第二亚基进行定向，以使得包含HVR1区并结合第一半位点的第一亚基被定位为C末端亚基，和包含HVR2区并结合第二半位点的第二亚基被定位为N末端亚基。

在SEQ ID NO:36-59中提供了本发明的示例性DMD大范围核酸酶，并且总结在表6-8中。

表6：结合并切割DMD 19-20识别序列(SEQ ID NO:6)的示例性工程化大范围核酸酶

“DMD19亚基％”和“DMD 20亚基％”分别表示每种大范围核酸酶的DMD19结合和DMD20结合亚基区域与DMD19-20x.13大范围核酸酶DMD19结合和DMD22结合亚基区之间的氨基酸序列同一性。

表7：结合并切割DMD 35-36识别序列(SEQ ID NO:10)的示例性工程化大范围核酸酶

“DMD35亚基％”和“DMD36亚基％”分别表示每种大范围核酸酶的DMD35结合和DMD36结合亚基区域与DMD 35-36x.63大范围核酸酶DMD35结合和DMD36结合亚基区之间的氨基酸序列同一性。

表8：结合并切割DMD 37-38识别序列(SEQ ID NO:12)的示例性工程化大范围核酸酶

“DMD37亚基％”和“DMD38亚基％”分别表示每种大范围核酸酶的DMD37结合和DMD38结合亚基区域与DMD 37-38x.15大范围核酸酶DMD37结合和DMD38结合亚基区之间的氨基酸序列同一性。

在本发明的某些实施方式中，工程化大范围核酸酶结合并切割肌营养不良蛋白基因内的包含SEQ ID NO:6的识别序列(即，DMD 19-20识别序列)，其中工程化大范围核酸酶包含第一亚基和第二亚基，其中第一亚基与识别序列的第一识别半位点结合并包含HVR1区，和其中第二亚基与识别序列的第二识别半位点结合并包含HVR2区。示例性DMD 19-20大范围核酸酶如下所示。

DMD 19-20x.13(SEQ ID NO:36)

在一些实施方式中，HVR1区包含与对应于SEQ ID NO:36的残基24-79的氨基酸序列具有至少80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高序列同一性的氨基酸序列。在一些实施方式中，HVR1区包含对应于SEQ ID NO:36的残基24、26、28、30、32、33、38、40、42、44、46、68、70、75和77的一个或多个残基。在一些实施方式中，HVR1区包含对应于SEQ ID NO:36的残基24、26、28、30、32、33、38、40、42、44、46、68、70、75和77的残基。在一些实施方式中，HVR1区在对应于SEQ ID NO:36的残基66的残基处包含Y、R、K或D。在一些实施方式中，HVR1区包含具有至多1、2、3、4、5、6、7、8、9、10或11个氨基酸置换的SEQ ID NO:36的残基24-79。在一些实施方式中，HVR1区包含SEQ ID NO:36的残基24-79。

在一些实施方式中，第一亚基包含与SEQ ID NO:36的残基7-153具有至少80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高序列同一性的氨基酸序列。在一些实施方式中，第一亚基在对应于SEQ ID NO:36的残基19的残基处包含G、S或A。在一些实施方式中，第一亚基包含对应于SEQ ID NO:36的残基19的残基。在一些实施方式中，第一亚基在SEQ ID NO:36的残基80的残基处包含E、Q或K。在一些实施方式中，第一亚基包含具有至多1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29或30个氨基酸置换的SEQ ID NO:36的残基7-153。在一些实施方式中，第一亚基包含SEQ ID NO:36的残基7-153。

在一些实施方式中，HVR2区包含与对应于SEQ ID NO:36的残基215-270的氨基酸序列具有至少80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高序列同一性的氨基酸序列。在一些实施方式中，HVR2区包含对应于SEQ ID NO:36的残基215、217、219、221、223、224、229、231、233、235、237、259、261、266和268的一个或多个残基。在一些实施方式中，HVR2区包含对应于SEQ ID NO:36的残基215、217、219、221、223、224、229、231、233、235、237、259、261、266和268的残基。在一些实施方式中，HVR2区在对应于SEQID NO:36的残基257的残基处包含Y、R、K或D。在一些实施方式中，HVR2区包含对应于SEQ IDNO:36的残基241的残基。在一些实施方式中，HVR2区包含对应于SEQ ID NO:36的残基263的残基。在一些实施方式中，HVR2区包含对应于SEQ ID NO:36的残基264的残基。在一些实施方式中，HVR2区包含具有至多1、2、3、4、5、6、7、8、9、10或11个氨基酸置换的SEQ ID NO:36的残基215-270。在一些实施方式中，HVR2区包含SEQ ID NO:36的残基215-270。

在一些实施方式中，第二亚基包含与SEQ ID NO:36的残基198-344具有至少80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高序列同一性的氨基酸序列。在一些实施方式中，第二亚基在对应于SEQ ID NO:36的残基210的残基处包含G、S或A。在一些实施方式中，第二亚基在对应于SEQ ID NO:36的残基271的残基包含E、Q或K。在一些实施方式中，第二亚基包含对应于SEQ ID NO:36的残基271的残基。在一些实施方式中，第二亚基包含对应于SEQ ID NO:36的残基220的残基。在一些实施方式中，第二亚基包含具有至多1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29或30个氨基酸置换的SEQ ID NO:36的残基198-344。在一些实施方式中，第二亚基包含SEQ ID NO:36的残基198-344。

在一些实施方式中，工程化大范围核酸酶是包含接头的单链大范围核酸酶，其中接头共价接合所述第一亚基和所述第二亚基。在一些实施方式中，工程化大范围核酸酶包含与SEQ ID NO:36具有至少80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高序列同一性的氨基酸序列。在一些实施方式中，工程化大范围核酸酶包含SEQ ID NO:36的氨基酸序列。在一些实施方式中，工程化大范围核酸酶由核酸序列编码，其与SEQ ID NO:50中所示的核酸序列具有至少80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高序列同一性。在一些实施方式中，工程化大范围核酸酶由SEQ ID NO:50中所示的核酸序列编码。

DMD 19-20x.87(SEQ ID NO:37)

在一些实施方式中，HVR1区包含与对应于SEQ ID NO:37的残基24-79的氨基酸序列具有至少80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高序列同一性的氨基酸序列。在一些实施方式中，HVR1区包含对应于SEQ ID NO:37的残基24、26、28、30、32、33、38、40、42、44、46、68、70、75和77的一个或多个残基。在一些实施方式中，HVR1区包含对应于SEQ ID NO:37的残基24、26、28、30、32、33、38、40、42、44、46、68、70、75和77的残基。在一些实施方式中，HVR1区在对应于SEQ ID NO:37的残基66的残基处包含Y、R、K或D。在一些实施方式中，HVR1区包含具有至多1、2、3、4、5、6、7、8、9、10或11个氨基酸置换的SEQ ID NO:37的残基24-79。在一些实施方式中，HVR1区包含SEQ ID NO:37的残基24-79。

在一些实施方式中，第一亚基包含与SEQ ID NO:37的残基7-153具有至少80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高序列同一性的氨基酸序列。在一些实施方式中，第一亚基在对应于SEQ ID NO:37的残基19的残基处包含G、S或A。在一些实施方式中，第一亚基包含对应于SEQ ID NO:37的残基19的残基。在一些实施方式中，第一亚基在对应于SEQ ID NO:37的残基80的残基处包含E、Q或K。在一些实施方式中，第一亚基包含具有至多1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29或30个氨基酸置换的SEQ ID NO:37的残基7-153。在一些实施方式中，第一亚基包含SEQ ID NO:37的残基7-153。

在一些实施方式中，HVR2区包含与对应于SEQ ID NO:37的残基215-270的氨基酸序列具有至少80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高序列同一性的氨基酸序列。在一些实施方式中，HVR2区包含对应于SEQ ID NO:37的残基215、217、219、221、223、224、229、231、233、235、237、259、261、266和268的一个或多个残基。在一些实施方式中，HVR2区包含对应于SEQ ID NO:37的残基215、217、219、221、223、224、229、231、233、235、237、259、261、266和268的残基。在一些实施方式中，HVR2区在对应于SEQID NO:37的残基257的残基处包含Y、R、K或D。在一些实施方式中，HVR2区包含对应于SEQ IDNO:37的残基239的残基。在一些实施方式中，HVR2区包含对应于SEQ IDNO:37的残基241的残基。在一些实施方式中，HVR2区包含对应于SEQ ID NO:37的残基264的残基。在一些实施方式中，HVR2区包含具有至多1、2、3、4、5、6、7、8、9、10或11个氨基酸置换的SEQ ID NO:37的残基215-270。在一些实施方式中，HVR2区包含SEQ ID NO:37的残基215-270。

在一些实施方式中，第二亚基包含与SEQ ID NO:37的残基198-344具有至少80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高序列同一性的氨基酸序列。在一些实施方式中，第二亚基在对应于SEQ ID NO:37的残基210的残基处包含G、S或A。在一些实施方式中，第二亚基在对应于SEQ ID NO:37的残基271的残基处包含E、Q或K。在一些实施方式中，第二亚基包含对应于SEQ ID NO:37的残基330的残基。在一些实施方式中，第二亚基包含具有至多1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29或30个氨基酸置换的SEQ ID NO:37的残基198-344。在一些实施方式中，第二亚基包含SEQ ID NO:37的残基198-344。

在一些实施方式中，工程化大范围核酸酶是包含接头的单链大范围核酸酶，其中接头共价接合所述第一亚基和所述第二亚基。在一些实施方式中，工程化大范围核酸酶包含与SEQ ID NO:37具有至少80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高序列同一性的氨基酸序列。在一些实施方式中，工程化大范围核酸酶包含SEQ ID NO:37的氨基酸序列。在一些实施方式中，工程化大范围核酸酶是由与SEQ ID NO:51中所示的核酸序列具有至少80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高序列同一性的核酸序列编码的。在一些实施方式中，工程化大范围核酸酶由SEQ ID NO:51中所示的核酸序列编码。

DMD 19-20L.249(SEQ ID NO:38)

在一些实施方式中，HVR1区包含与对应于SEQ ID NO:38的残基24-79的氨基酸序列具有至少80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高序列同一性的氨基酸序列。在一些实施方式中，HVR1区包含对应于SEQ ID NO:38的残基24、26、28、30、32、33、38、40、42、44、46、68、70、75和77的一个或多个残基。在一些实施方式中，HVR1区包含对应于SEQ ID NO:38的残基24、26、28、30、32、33、38、40、42、44、46、68、70、75和77的残基。在一些实施方式中，HVR1区在对应于SEQ ID NO:38的残基66的残基处包含Y、R、K或D。在一些实施方式中，HVR1区包含具有至多1、2、3、4、5、6、7、8、9、10或11个氨基酸置换的SEQ ID NO:38的残基24-79。在一些实施方式中，HVR1区包含SEQ ID NO:38的残基24-79。

在一些实施方式中，第一亚基包含与SEQ ID NO:38的残基7-153具有至少80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高序列同一性的氨基酸序列。在一些实施方式中，第一亚基在SEQ ID NO:38的残基19的残基处包含G、S或A。在一些实施方式中，第一亚基包含对应于SEQ ID NO:38的残基19的残基。在一些实施方式中，第一亚基在对应于SEQ ID NO:38的残基80的残基处包含E、Q或K。在一些实施方式中，第一亚基包含对应于SEQ ID NO:38的残基80的残基。在一些实施方式中，第一亚基包含具有至多1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29或30个氨基酸置换的SEQ ID NO:38的残基7-153。在一些实施方式中，第一亚基包含SEQ IDNO:38的残基7-153。

在一些实施方式中，HVR2区包含与对应于SEQ ID NO:38的残基215-270的氨基酸序列具有至少80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高序列同一性的氨基酸序列。在一些实施方式中，HVR2区包含对应于SEQ ID NO:38的残基215、217、219、221、223、224、229、231、233、235、237、259、261、266和268的一个或多个残基。。在一些实施方式中，HVR2区包含对应于SEQ ID NO:38的残基215、217、219、221、223、224、229、231、233、235、237、259、261、266和268的残基。在一些实施方式中，HVR2区在对应于SEQ ID NO:38的残基257的残基处包含Y、R、K或D。在一些实施方式中，HVR2区包含对应于SEQ ID NO:38的残基264的残基。在一些实施方式中，HVR2区包含具有至多1、2、3、4、5、6、7、8、9、10或11个氨基酸置换的SEQ ID NO:38的残基215-270。在一些实施方式中，HVR2区包含SEQ ID NO:38的残基215-270。

在一些实施方式中，第二亚基包含与SEQ ID NO:38的残基198-344具有至少80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高序列同一性的氨基酸序列。在一些实施方式中，第二亚基在对应于SEQ ID NO:38的残基210的残基处包含G、S或A。在一些实施方式中，第二亚基在对应于SEQ ID NO:38的残基271的残基处包含E、Q或K。在一些实施方式中，第二亚基包含对应于SEQ ID NO:38的残基330的残基。在一些实施方式中，第二亚基包含具有至多1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29或30个氨基酸置换的SEQ ID NO:38的残基198-344。在一些实施方式中，第二亚基包含SEQ ID NO:38的残基198-344。

在一些实施方式中，工程化大范围核酸酶是包含接头的单链大范围核酸酶，其中接头共价接合所述第一亚基和所述第二亚基。在一些实施方式中，工程化大范围核酸酶包含与SEQ ID NO:38具有至少80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高序列同一性的氨基酸序列。在一些实施方式中，工程化大范围核酸酶包含SEQ ID NO:38的氨基酸序列。在一些实施方式中，工程化大范围核酸酶由核酸序列编码，其与SEQ ID NO:52中所示的核酸序列具有至少80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高序列同一性。在一些实施方式中，工程化大范围核酸酶由SEQ ID NO:52中所示的核酸序列编码。

DMD 19-20L.302(SEQ ID NO:39)

在一些实施方式中，HVR1区包含与对应于SEQ ID NO:39的残基24-79的氨基酸序列具有至少80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高序列同一性的氨基酸序列。在一些实施方式中，HVR1区包含对应于SEQ ID NO:39的残基24、26、28、30、32、33、38、40、42、44、46、68、70、75和77的一个或多个残基。在一些实施方式中，HVR1区包含对应于SEQ ID NO:39的残基24、26、28、30、32、33、38、40、42、44、46、68、70、75和77的残基。在一些实施方式中，HVR1区在对应于SEQ ID NO:39的残基66的残基处包含Y、R、K或D。在一些实施方式中，HVR1区包含具有至多1、2、3、4、5、6、7、8、9、10或11个氨基酸置换的SEQ ID NO:39的残基24-79。在一些实施方式中，HVR1区包含SEQ ID NO:39的残基24-79。

在一些实施方式中，第一亚基包含与SEQ ID NO:39的残基7-153具有至少80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高序列同一性的氨基酸序列。在一些实施方式中，第一亚基在对应于SEQ ID NO:39的残基19的残基处包含G、S或A。在一些实施方式中，第一亚基包含对应于SEQ ID NO:39的残基19的残基。在一些实施方式中，第一亚基在对应于SEQ ID NO:39的残基39的残基处包含E、Q或K。在一些实施方式中，第一亚基包含对应于SEQ ID NO:39的残基80的残基。在一些实施方式中，第一亚基包含具有至多1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29或30个氨基酸置换的SEQ ID NO:39的残基7-153。在一些实施方式中，第一亚基包含SEQ ID NO:39的残基7-153。

在一些实施方式中，HVR2区包含与对应于SEQ ID NO:39的残基215-270的氨基酸序列具有至少80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高序列同一性的氨基酸序列。在一些实施方式中，HVR2区包含对应于SEQ ID NO:39的残基215、217、219、221、223、224、229、231、233、235、237、259、261、266和268的一个或多个残基。在一些实施方式中，HVR2区包含对应于SEQ ID NO:39的残基215、217、219、221、223、224、229、231、233、235、237、259、261、266和268的残基。在一些实施方式中，HVR2区在对应于SEQID NO:39的残基257的残基处包含Y、R、K或D。在一些实施方式中，HVR2区包含对应于SEQ IDNO:39的残基236的残基。在一些实施方式中，HVR2区包含对应于SEQ ID NO:39的残基264的残基。在一些实施方式中，HVR2区包含具有至多1、2、3、4、5、6、7、8、9、10或11个氨基酸置换的SEQ ID NO:39的残基215-270。在一些实施方式中，HVR2区包含SEQ ID NO:39的残基215-270。

在一些实施方式中，第二亚基包含与SEQ ID NO:39的残基198-344具有至少80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高序列同一性的氨基酸序列。在一些实施方式中，第二亚基在对应于SEQ ID NO:39的残基210处的残基包含G、S或A。在一些实施方式中，第二亚基在对应于SEQ ID NO:39的残基271的残基处包含E、Q或K。在一些实施方式中，第二亚基包含对应于SEQ ID NO:39的残基271的残基。在一些实施方式中，第二亚基包含具有至多1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29或30个氨基酸置换的SEQ ID NO:39的残基198-344。在一些实施方式中，第二亚基包含SEQ ID NO:39的残基198-344。

在一些实施方式中，工程化大范围核酸酶是包含接头的单链大范围核酸酶，其中接头共价接合所述第一亚基和所述第二亚基。在一些实施方式中，工程化大范围核酸酶包含与SEQ ID NO:39具有至少80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高序列同一性的氨基酸序列。在一些实施方式中，工程化大范围核酸酶包含SEQ ID NO:39的氨基酸序列。在一些实施方式中，工程化大范围核酸酶由核酸序列编码，其与SEQ ID NO:53中所示的核酸序列具有至少80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高序列同一性。在一些实施方式中，工程化大范围核酸酶由SEQ ID NO:53中所示的核酸序列编码。

DMD 19-20L.329(SEQ ID NO:40)

在一些实施方式中，HVR1区包含与对应于SEQ ID NO:40的残基24-79的氨基酸序列具有至少80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高序列同一性的氨基酸序列。在一些实施方式中，HVR1区包含对应于SEQ ID NO:40的残基24、26、28、30、32、33、38、40、42、44、46、68、70、75和77的一个或多个残基。在一些实施方式中，HVR1区包含对应于SEQ ID NO:40的残基24、26、28、30、32、33、38、40、42、44、46、68、70、75和77的残基。在一些实施方式中，HVR1区在对应于SEQ ID NO:40的残基66的残基处包含Y、R、K或D。在一些实施方式中，HVR1区包含具有至多1、2、3、4、5、6、7、8、9、10或11个氨基酸置换的SEQ ID NO:40的残基24-79。在一些实施方式中，HVR1区包含SEQ ID NO:40的残基24-79。

在一些实施方式中，第一亚基包含与SEQ ID NO:40的残基7-153具有至少80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高序列同一性的氨基酸序列。在一些实施方式中，第一亚基在对应于SEQ ID NO:40的残基19的残基处包含G、S或A。在一些实施方式中，第一亚基包含对应于SEQ ID NO:40的残基19的残基。在一些实施方式中，第一亚基在对应于SEQ ID NO:40的残基80的残基处包含E、Q或K。在一些实施方式中，第一亚基包含具有至多1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29或30个氨基酸置换的SEQ ID NO:40的残基7-153。在一些实施方式中，第一亚基包含SEQ ID NO:40的残基7-153。

在一些实施方式中，HVR2区包含与对应于SEQ ID NO:40的残基215-270的氨基酸残基具有至少80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高序列同一性的氨基酸序列。在一些实施方式中，HVR2区包含对应于SEQ ID NO:40的残基215、217、219、221、223、224、229、231、233、235、237、259、261、266和268的一个或多个残基。在一些实施方式中，HVR2区包含对应于SEQ ID NO:40的残基215、217、219、221、223、224、229、231、233、235、237、259、261、266和268的残基。在一些实施方式中，HVR2区在对应于SEQID NO:40的残基257的残基处包含Y、R、K或D。在一些实施方式中，HVR2区包含对应于SEQ IDNO:40的残基264的残基。在一些实施方式中，HVR2区包含具有至多1、2、3、4、5、6、7、8、9、10或11个氨基酸置换的SEQ ID NO:40的残基215-270。在一些实施方式中，HVR2区包含SEQ IDNO:40的残基215-270。

在一些实施方式中，第二亚基包含与SEQ ID NO:40的残基198-344具有至少80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高序列同一性的氨基酸序列。在一些实施方式中，第二亚基在对应于SEQ ID NO:40的残基210的残基处包含G、S或A。在一些实施方式中，第二亚基在对应于SEQ ID NO:40的残基271的残基处包含E、Q或K。在一些实施方式中，第二亚基包含对应于SEQ ID NO:40的残基271的残基。在一些实施方式中，第二亚基包含对应于SEQ ID NO:40的残基330的残基。在一些实施方式中，第二亚基包含具有至多1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29或30个氨基酸置换的SEQ ID NO:40的残基198-344。在一些实施方式中，第二亚基包含SEQ ID NO:40的残基198-344。

在一些实施方式中，工程化大范围核酸酶是包含接头的单链大范围核酸酶，其中接头共价接合所述第一亚基和所述第二亚基。在一些实施方式中，工程化大范围核酸酶包含与SEQ ID NO:40具有至少80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高序列同一性的氨基酸序列。在一些实施方式中，工程化大范围核酸酶包含SEQ ID NO:40的氨基酸序列。在一些实施方式中，工程化大范围核酸酶由核酸序列编码，其与SEQ ID NO:54中所示的核酸序列具有至少80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高序列同一性。在一些实施方式中，工程化大范围核酸酶由SEQ ID NO:54中所示的核酸序列编码。

DMD 19-20L.374(SEQ ID NO:41)

在一些实施方式中，HVR1区包含与对应于SEQ ID NO:41的残基24-79的氨基酸序列具有至少80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高序列同一性的氨基酸序列。在一些实施方式中，HVR1区包含对应于SEQ ID NO:41的残基24、26、28、30、32、33、38、40、42、44、46、68、70、75和77的一个或多个残基。在一些实施方式中，HVR1区包含对应于SEQ ID NO:41的残基24、26、28、30、32、33、38、40、42、44、46、68、70、75和77的残基。在一些实施方式中，HVR1区在对应于SEQ ID NO:40的残基66的残基处包含Y、R、K或D。在一些实施方式中，HVR1区包含具有至多1、2、3、4、5、6、7、8、9、10或11个氨基酸置换的SEQ ID NO:41的残基24-79。在一些实施方式中，HVR1区包含SEQ ID NO:41的残基24-79。

在一些实施方式中，第一亚基包含与SEQ ID NO:41的残基7-153具有至少80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高序列同一性的氨基酸序列。在一些实施方式中，第一亚基在对应于SEQ ID NO:41的残基19的残基处包含G、S或A。在一些实施方式中，第一亚基包含对应于SEQ ID NO:41的残基19的残基。在一些实施方式中，第一亚基在对应于SEQ ID NO:41的残基80的残基处包含E、Q或K。在一些实施方式中，第一亚基包含具有至多1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29或30个氨基酸置换的SEQ ID NO:41的残基7-153。在一些实施方式中，第一亚基包含SEQ ID NO:41的残基7-153。

在一些实施方式中，HVR2区包含与对应于SEQ ID NO:41的残基215-270的氨基酸序列具有至少80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高序列同一性的氨基酸序列。在一些实施方式中，HVR2区包含对应于SEQ ID NO:41的残基215、217、219、221、223、224、229、231、233、235、237、259、261、266和268的一个或多个残基。在一些实施方式中，HVR2区包含对应于SEQ ID NO:41的残基215、217、219、221、223、224、229、231、233、235、237、259、261、266和268的残基。在一些实施方式中，HVR2区在对应于SEQID NO:41的残基257的残基处包含Y、R、K或D。在一些实施方式中，HVR2区包含对应于SEQ IDNO:41的残基264的残基。在一些实施方式中，HVR2区包含具有至多1、2、3、4、5、6、7、8、9、10或11个氨基酸置换的SEQ ID NO:41的残基215-270。在一些实施方式中，HVR2区包含SEQ IDNO:41的残基215-270。

在一些实施方式中，第二亚基包含与SEQ ID NO:41的残基198-344具有至少80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高序列同一性的氨基酸序列。在一些实施方式中，第二亚基在对应于SEQ ID NO:41的残基210的残基处包含G、S或A。在一些实施方式中，第二亚基在对应于SEQ ID NO:41的残基271的残基处包含E、Q或K。在一些实施方式中，第二亚基包含对应于SEQ ID NO:41的残基330的残基。在一些实施方式中，第二亚基包含具有至多1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29或30个氨基酸置换的SEQ ID NO:41的残基198-344。在一些实施方式中，第二亚基包含SEQ ID NO:41的残基198-344。

在一些实施方式中，工程化大范围核酸酶是包含接头的单链大范围核酸酶，其中接头共价接合所述第一亚基和所述第二亚基。在一些实施方式中，工程化大范围核酸酶包含与SEQ ID NO:41具有至少80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高序列同一性的氨基酸序列。在一些实施方式中，工程化大范围核酸酶包含SEQ ID NO:41的氨基酸序列。在一些实施方式中，工程化大范围核酸酶由核酸序列编码，其与SEQ ID NO:65中所示的核酸序列具有至少80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高序列同一性。在一些实施方式中，工程化大范围核酸酶由SEQ ID NO:65中所示的核酸序列编码。

DMD 19-20L.375(SEQ ID NO:42)

在一些实施方式中，HVR1区包含与SEQ ID NO:42的残基24-79对应的氨基酸序列具有至少80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高序列同一性的氨基酸序列。在一些实施方式中，HVR1区包含对应于SEQ ID NO:42的残基24、26、28、30、32、33、38、40、42、44、46、68、70、75和77的一个或多个残基。在一些实施方式中，HVR1区包含对应于SEQ ID NO:42的残基24、26、28、30、32、33、38、40、42、44、46、68、70、75和77的残基。在一些实施方式中，HVR1区在对应于SEQ ID NO:42的残基66的残基处包含Y、R、K或D。在一些实施方式中，HVR1区包含具有至多1、2、3、4、5、6、7、8、9、10或11个氨基酸置换的SEQID NO:42的残基24-79。在一些实施方式中，HVR1区包含SEQ ID NO:42的残基24-79。

在一些实施方式中，第一亚基包含与SEQ ID NO:42的残基7-153具有至少80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高序列同一性的氨基酸序列。在一些实施方式中，第一亚基在对应于SEQ ID NO:42的残基19的残基处包含G、S或A。在一些实施方式中，第一亚基包含对应于SEQ ID NO:42的残基19的残基。在一些实施方式中，第一亚基在对应于SEQ ID NO:42的残基80的残基处包含E、Q或K。在一些实施方式中，第一亚基包含具有至多1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29或30个氨基酸置换的SEQ ID NO:42的残基7-153。在一些实施方式中，第一亚基包含SEQ ID NO:42的残基7-153。

在一些实施方式中，HVR2区包含与对应于SEQ ID NO:42的残基215-270的氨基酸序列具有至少80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高序列同一性的氨基酸序列。在一些实施方式中，HVR2区包含对应于SEQ ID NO:42的残基215、217、219、221、223、224、229、231、233、235、237、259、261、266和268的一个或多个残基。在一些实施方式中，HVR2区包含对应于SEQ ID NO:42的残基215、217、219、221、223、224、229、231、233、235、237、259、261、266和268的残基。在一些实施方式中，HVR2区在对应于SEQID NO:42的残基257的残基处包含Y、R、K或D。在一些实施方式中，HVR2区包含对应于SEQ IDNO:42的残基264的残基。在一些实施方式中，HVR2区包含具有至多1、2、3、4、5、6、7、8、9、10或11个氨基酸置换的SEQ ID NO:42的残基215-270。在一些实施方式中，HVR2区包含SEQ IDNO:42的残基215-270。

在一些实施方式中，第二亚基包含与SEQ ID NO:42的残基198-344具有至少80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高序列同一性的氨基酸序列。在一些实施方式中，第二亚基在对应于SEQ ID NO:42的残基210的残基处包含G、S或A。在一些实施方式中，第二亚基在对应于SEQ ID NO:42的残基271的残基处包含E、Q或K。在一些实施方式中，第二亚基包含对应于SEQ ID NO:42的残基330的残基。在一些实施方式中，第二亚基包含具有至多1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29或30个氨基酸置换的SEQ ID NO:42的残基198-344。在一些实施方式中，第二亚基包含SEQ ID NO:42的残基198-344。

在一些实施方式中，工程化大范围核酸酶是包含接头的单链大范围核酸酶，其中接头共价接合所述第一亚基和所述第二亚基。在一些实施方式中，工程化大范围核酸酶包含与SEQ ID NO:42具有至少80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高序列同一性的氨基酸序列。在一些实施方式中，工程化大范围核酸酶包含SEQ ID NO:42的氨基酸序列。在一些实施方式中，工程化大范围核酸酶由核酸序列编码，其与SEQ ID NO:66中所示的核酸序列具有至少80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高序列同一性。在一些实施方式中，工程化大范围核酸酶由SEQ ID NO:66中所示的核酸序列编码。

DMD 19-20L.431(SEQ ID NO:43)

在一些实施方式中，HVR1区包含与对应于SEQ ID NO:43的残基24-79的氨基酸序列具有至少80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高序列同一性的氨基酸序列。在一些实施方式中，HVR1区包含对应于SEQ ID NO:43的残基24、26、28、30、32、33、38、40、42、44、46、68、70、75和77的一个或多个残基。在一些实施方式中，HVR1区包含对应于SEQ ID NO:43的残基24、26、28、30、32、33、38、40、42、44、46、68、70、75和77的残基。在一些实施方式中，HVR1区在对应于SEQ ID NO:43的残基66的残基处包含Y、R、K或D。在一些实施方式中，HVR1区包含具有至多1、2、3、4、5、6、7、8、9、10或11个氨基酸置换的SEQ ID NO:43的残基24-79。在一些实施方式中，HVR1区包含SEQ ID NO:43的残基24-79。

在一些实施方式中，第一亚基包含与SEQ ID NO:43的残基7-153具有至少80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高序列同一性的氨基酸序列。在一些实施方式中，第一亚基在对应于SEQ ID NO:43的残基19的残基处包含G、S或A。在一些实施方式中，第一亚基包含对应于SEQ ID NO:43的残基19的残基。在一些实施方式中，第一亚基在对应于SEQ ID NO:43的残基80的残基处包含E、Q或K。在一些实施方式中，第一亚基包含对应于SEQ ID NO:43的残基80的残基。在一些实施方式中，第一亚基包含具有至多1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29或30个氨基酸置换的SEQ ID NO:43的残基7-153。在一些实施方式中，第一亚基包含SEQ ID NO:43的残基7-153。

在一些实施方式中，HVR2区包含与对应于SEQ ID NO:43的残基215-270的氨基酸序列具有至少80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高序列同一性的氨基酸序列。在一些实施方式中，HVR2区包含对应于SEQ ID NO:43的残基215、217、219、221、223、224、229、231、233、235、237、259、261、266和268的一个或多个残基。在一些实施方式中，HVR2区包含对应于SEQ ID NO:43的残基215、217、219、221、223、224、229、231、233、235、237、259、261、266和268的残基。在一些实施方式中，HVR2区在对应于SEQID NO:43的残基257的残基处包含Y、R、K或D。在一些实施方式中，HVR2区包含对应于SEQ IDNO:43的残基264的残基。在一些实施方式中，HVR2区包含具有至多1、2、3、4、5、6、7、8、9、10或11个氨基酸置换的SEQ ID NO:43的残基215-270。在一些实施方式中，HVR2区包含SEQ IDNO:43的残基215-270。

在一些实施方式中，第二亚基包含与SEQ ID NO:43的残基198-344具有至少80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高序列同一性的氨基酸序列。在一些实施方式中，第二亚基在对应于SEQ ID NO:43的残基210的残基处包含G、S或A。在一些实施方式中，第二亚基在对应于SEQ ID NO:43的残基271的残基处包含E、Q或K。在一些实施方式中，第二亚基包含对应于SEQ ID NO:43的残基271的残基。在一些实施方式中，第二亚基包含对应于SEQ ID NO:43的残基330的残基。在一些实施方式中，第二亚基包含具有至多1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29或30个氨基酸置换的SEQ ID NO:43的残基198-344。在一些实施方式中，第二亚基包含SEQ ID NO:43的残基198-344。

在一些实施方式中，工程化大范围核酸酶是包含接头的单链大范围核酸酶，其中接头共价接合所述第一亚基和所述第二亚基。在一些实施方式中，工程化大范围核酸酶包含与SEQ ID NO:43具有至少80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高序列同一性的氨基酸序列。在一些实施方式中，工程化大范围核酸酶包含SEQ ID NO:43的氨基酸序列。在一些实施方式中，工程化大范围核酸酶由核酸序列编码，其与SEQ ID NO:67中所示的核酸序列具有至少80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高序列同一性。在一些实施方式中，工程化大范围核酸酶由SEQ ID NO:67中所示的核酸序列编码。

DMD 19-20L.458(SEQ ID NO:44)

在一些实施方式中，HVR1区包含与对应于SEQ ID NO:44的残基24-79的氨基酸序列具有至少80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高序列同一性的氨基酸序列。在一些实施方式中，HVR1区包含对应于SEQ ID NO:44的残基24、26、28、30、32、33、38、40、42、44、46、68、70、75和77的一个或多个残基。在一些实施方式中，HVR1区包含对应于SEQ ID NO:44的残基24、26、28、30、32、33、38、40、42、44、46、68、70、75和77的残基。在一些实施方式中，HVR1区在对应于SEQ ID NO:44的残基66的残基处包含Y、R、K或D。在一些实施方式中，HVR1区包含具有至多1、2、3、4、5、6、7、8、9、10或11个氨基酸置换的SEQ ID NO:44的残基24-79。在一些实施方式中，HVR1区包含SEQ ID NO:44的残基24-79。

在一些实施方式中，第一亚基包含与SEQ ID NO:44的残基7-153具有至少80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高序列同一性的氨基酸序列。在一些实施方式中，第一亚基在对应于SEQ ID NO:44的残基19的残基处包含G、S或A。在一些实施方式中，第一亚基包含对应于SEQ ID NO:44的残基19的残基。在一些实施方式中，第一亚基在对应于SEQ ID NO:44的残基80的残基处包含E、Q或K。在一些实施方式中，第一亚基包含具有至多1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29或30个氨基酸置换的SEQ ID NO:44的残基7-153。在一些实施方式中，第一亚基包含SEQ ID NO:44的残基7-153。

在一些实施方式中，HVR2区包含与对应于SEQ ID NO:44的残基215-270的氨基酸序列具有至少80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高序列同一性的氨基酸序列。在一些实施方式中，HVR2区包含对应于SEQ ID NO:44的残基215、217、219、221、223、224、229、231、233、235、237、259、261、266和268的一个或多个残基。在一些实施方式中，HVR2区包含对应于SEQ ID NO:44的残基215、217、219、221、223、224、229、231、233、235、237、259、261、266和268的残基。在一些实施方式中，HVR2区在对应于SEQID NO:44的残基257的残基处包含Y、R、K或D。在一些实施方式中，HVR2区包含对应于SEQ IDNO:44的残基264的残基。在一些实施方式中，HVR2区包含具有至多1、2、3、4、5、6、7、8、9、10或11个氨基酸置换的SEQ ID NO:44的残基215-270。在一些实施方式中，HVR2区包含SEQ IDNO:44的残基215-270。

在一些实施方式中，第二亚基包含与SEQ ID NO:44的残基198-344具有至少80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高序列同一性的氨基酸序列。在一些实施方式中，第二亚基在对应于SEQ ID NO:44的残基210的残基处包含G、S或A。在一些实施方式中，第二亚基在对应于SEQ ID NO:44的残基271的残基处包含E、Q或K。在一些实施方式中，第二亚基包含对应于SEQ ID NO:44的残基271的残基。在一些实施方式中，第二亚基包含对应于SEQ ID NO:44的残基220的残基。在一些实施方式中，第二亚基包含具有至多1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29或30个氨基酸置换的SEQ ID NO:44的残基198-344。在一些实施方式中，第二亚基包含SEQ ID NO:44的残基198-344。

在一些实施方式中，工程化大范围核酸酶是包含接头的单链大范围核酸酶，其中接头共价接合所述第一亚基和所述第二亚基。在一些实施方式中，工程化大范围核酸酶包含与SEQ ID NO:44具有至少80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高序列同一性的氨基酸序列。在一些实施方式中，工程化大范围核酸酶包含SEQ ID NO:44的氨基酸序列。在一些实施方式中，工程化大范围核酸酶由核酸序列编码，其与SEQ ID NO:68所示的核酸序列具有至少80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高序列同一性。在一些实施方式中，工程化大范围核酸酶由SEQID NO:68中所示的核酸序列编码。

在本发明的某些实施方式中，工程化大范围核酸酶结合并切割肌营养不良蛋白基因内的包含SEQ ID NO:10的识别序列(即，DMD 35-36识别序列)，其中工程化大范围核酸酶包含第一亚基和第二亚基，其中第一亚基与识别序列的第一识别半位点结合并包含第一高变(HVR1)区，和其中第二亚基集合至识别序列的第二识别半位点并包含第二高变(HVR2)区。示例性DMD 35-36大范围核酸酶如下所示。

DMD 35-36x.63(SEQ ID NO:45)

在一些实施方式中，HVR1区包含与对应于SEQ ID NO:45的残基24-79的氨基酸序列具有至少80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高序列同一性的氨基酸序列。在一些实施方式中，HVR1区包含对应于SEQ ID NO:45的残基24、26、28、30、32、33、38、40、42、44、46、68、70、75和77的一个或多个残基。在一些实施方式中，HVR1区包含对应于SEQ ID NO:45的残基24、26、28、30、32、33、38、40、42、44、46、68、70、75和77的残基。在一些实施方式中，HVR1区在对应于SEQ ID NO:45的残基66的残基处包含Y、R、K或D。在一些实施方式中，HVR1区包含具有至多1、2、3、4、5、6、7、8、9、10或11个氨基酸置换的SEQ ID NO:45的残基24-79。在一些实施方式中，HVR1区包含SEQ ID NO:45的残基24-79。

在一些实施方式中，第一亚基包含与SEQ ID NO:45的残基7-153具有至少80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高序列同一性的氨基酸序列。在一些实施方式中，第一亚基在对应于SEQ ID NO:45的残基19的残基处包含G、S或A。在一些实施方式中，第一亚基包含对应于SEQ ID NO:45的残基19的残基。在一些实施方式中，第一亚基在对应于SEQ ID NO:45的残基80的残基处包含E、Q或K。在一些实施方式中，第一亚基包含对应于SEQ ID NO:45的残基80的残基。在一些实施方式中，第一亚基包含具有至多1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29或30个氨基酸置换的SEQ ID NO:45的残基7-153。在一些实施方式中，第一亚基包含SEQ ID NO:45的残基7-153。

在一些实施方式中，HVR2区包含与对应于SEQ ID NO:45的残基215-270的氨基酸序列具有至少80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高序列同一性的氨基酸序列。在一些实施方式中，HVR2区包含对应于SEQ ID NO:45的残基215、217、219、221、223、224、229、231、233、235、237、259、261、266和268的一个或多个残基。在一些实施方式中，HVR2区包含对应于SEQ ID NO:45的残基215、217、219、221、223、224、229、231、233、235、237、259、261、266和268的残基。在一些实施方式中，HVR2区在对应于SEQID NO:45的残基257的残基处包含Y、R、K或D。在一些实施方式中，HVR2区包含对应于SEQ IDNO:45的残基239的残基。在一些实施方式中，HVR2区包含对应于SEQ ID NO:45的残基241的残基。在一些实施方式中，HVR2区包含对应于SEQ ID NO:45的残基250的残基。在一些实施方式中，HVR2区包含对应于SEQ ID NO:45的残基263的残基。在一些实施方式中，HVR2区包含对应于SEQ ID NO:45的残基264的残基。在一些实施方式中，HVR2区包含具有至多1、2、3、4、5、6、7、8、9、10或11个氨基酸置换的SEQ ID NO:45的残基215-270。在一些实施方式中，HVR2区包含SEQ ID NO:45的残基215-270。在一些实施方式中，第二亚基包含与SEQ ID NO:45的残基198-344具有至少80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高序列同一性的氨基酸序列。在一些实施方式中，第二亚基在对应于SEQ IDNO:45的残基210的残基处包含G、S或A。在一些实施方式中，第二亚基在对应于SEQ ID NO:45的残基271的残基处包含E、Q或K。在一些实施方式中，第二亚基包含对应于SEQ ID NO:45的残基330的残基。在一些实施方式中，第二亚基包含具有至多1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29或30个氨基酸置换的SEQ IDNO:45的残基98-344。在一些实施方式中，第二亚基包含SEQ ID NO:45的残基198-344。

在一些实施方式中，工程化大范围核酸酶是包含接头的单链大范围核酸酶，其中接头共价接合所述第一亚基和所述第二亚基。在一些实施方式中，工程化大范围核酸酶包含与SEQ ID NO:45具有至少80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高序列同一性的氨基酸序列。在一些实施方式中，工程化大范围核酸酶包含SEQ ID NO:45的氨基酸序列。在一些实施方式中，工程化大范围核酸酶由核酸序列编码，其与SEQ ID NO:69中所示的核酸序列具有至少80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高序列同一性。在一些实施方式中，工程化大范围核酸酶由SEQ ID NO:69中所示的核酸序列编码。

DMD 35-36x.81(SEQ ID NO:46)

在一些实施方式中，HVR1区包含与SEQ ID NO:46的残基24-79的氨基酸序列具有至少80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高序列同一性的氨基酸序列。在一些实施方式中，HVR1区包含对应于SEQ ID NO:46的残基24、26、28、30、32、33、38、40、42、44、46、68、70、75和77的一个或多个残基。在一些实施方式中，HVR1区包含对应于SEQ ID NO:46的残基24、26、28、30、32、33、38、40、42、44、46、68、70、75和77的残基。在一些实施方式中，HVR1区在对应于SEQ ID NO:46的残基66的残基处包含Y、R、K或D。在一些实施方式中，HVR1区包含具有至多1、2、3、4、5、6、7、8、9、10或11个氨基酸置换的SEQ IDNO:46的残基24-79。在一些实施方式中，HVR1区包含SEQ ID NO:46的残基24-79。

在一些实施方式中，第一亚基包含与SEQ ID NO:46的残基7-153a具有至少80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高序列同一性的氨基酸序列。在一些实施方式中，第一亚基在对应于SEQ ID NO:46的残基19的残基处包含G、S或A。在一些实施方式中，第一亚基包含对应于SEQ ID NO:46的残基19的残基。在一些实施方式中，第一亚基在对应于SEQ ID NO:46的残基80的残基处包含E、Q或K。在一些实施方式中，第一亚基包含对应于SEQ ID NO:46的残基80的残基。在一些实施方式中，第一亚基包含具有至多1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29或30个氨基酸置换的SEQ ID NO:46的残基7-153。在一些实施方式中，第一亚基包含SEQ ID NO:46的残基7-153。

在一些实施方式中，HVR2区包含与对应于SEQ ID NO:46的残基215-270的氨基酸序列具有至少80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高序列同一性的氨基酸序列。在一些实施方式中，HVR2区包含对应于SEQ ID NO:46的残基215、217、219、221、223、224、229、231、233、235、237、259、261、266和268的一个或多个残基。在一些实施方式中，HVR2区包含对应于SEQ ID NO:46的残基215、217、219、221、223、224、229、231、233、235、237、259、261、266和268的残基。在一些实施方式中，HVR2区在对应于SEQID NO:46的残基257的残基处包含Y、R、K或D。在一些实施方式中，HVR2区包含对应于SEQ IDNO:46的残基239的残基。在一些实施方式中，HVR2区包含对应于SEQ ID NO:46的残基241的残基。在一些实施方式中，HVR2区包含对应SEQ ID NO:46的残基263的残基。在一些实施方式中，HVR2区包含对应于SEQ ID NO:46的残基264的残基。在一些实施方式中，HVR2区包含具有至多1、2、3、4、5、6、7、8、9、10或11个氨基酸置换的SEQ ID NO:46的残基215-270。在一些实施方式中，HVR2区包含SEQ ID NO:46的残基215-270。

在一些实施方式中，第二亚基包含与SEQ ID NO:46的残基198-344具有至少80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高序列同一性的氨基酸序列。在一些实施方式中，第二亚基在对应于SEQ ID NO:46的残基210的残基处包含G、S或A。在一些实施方式中，第二亚基在对应于SEQ ID NO:46的残基271的残基处包含E、Q或K。在一些实施方式中，第二亚基包含对应于SEQ ID NO:46的残基330的残基。在一些实施方式中，第二亚基包含具有至多1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29或30个氨基酸置换的SEQ ID NO:46的残基198-344。在一些实施方式中，第二亚基包含SEQ ID NO:46的残基198-344。

在一些实施方式中，工程化大范围核酸酶是包含接头的单链大范围核酸酶，其中接头共价接合所述第一亚基和所述第二亚基。在一些实施方式中，工程化大范围核酸酶包含与SEQ ID NO:46具有至少80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高序列同一性的氨基酸序列。在一些实施方式中，工程化大范围核酸酶包含SEQ ID NO:46的氨基酸序列。在一些实施方式中，工程化大范围核酸酶由核酸序列编码，其与SEQ ID NO:70中所示的核酸序列具有至少80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高序列同一性。在一些实施方式中，工程化大范围核酸酶由SEQ ID NO:70中所示的核酸序列编码。

DMD 35-36L.195(SEQ ID NO:47)

在一些实施方式中，HVR1区包含与对应于SEQ ID NO:47的残基24-79的氨基酸序列具有至少80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高序列同一性的氨基酸序列。在一些实施方式中，HVR1区包含对应于SEQ ID NO:47的残基24、26、28、30、32、33、38、40、42、44、46、68、70、75和77的一个或多个残基。在一些实施方式中，HVR1区包含对应于SEQ ID NO:47的残基24、26、28、30、32、33、38、40、42、44、46、68、70、75和77的残基。在一些实施方式中，HVR1区在对应于SEQ ID NO:47的残基66的残基处包含Y、R、K或D。在一些实施方式中，HVR1区包含具有至多1、2、3、4、5、6、7、8、9、10或11个氨基酸置换的SEQ ID NO:47的残基24-79。在一些实施方式中，HVR1区包含SEQ ID NO:47的残基24-79。

在一些实施方式中，第一亚基包含与SEQ ID NO:47的残基7-153具有至少80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高序列同一性的氨基酸序列。在一些实施方式中，第一亚基在对应于SEQ ID NO:47的残基19的残基处包含G、S或A。在一些实施方式中，第一亚基包含对应于SEQ ID NO:47的残基19的残基。在一些实施方式中，第一亚基在对应于SEQ ID NO:47的残基80的残基处包含E、Q或K。在一些实施方式中，第一亚基包含对应于SEQ ID NO:47的残基80的残基。在一些实施方式中，第一亚基包含具有至多1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29或30个氨基酸置换的SEQ ID NO:47的残基7-153。在一些实施方式中，第一亚基包含SEQ ID NO:47的残基7-153。

在一些实施方式中，HVR2区包含与对应于SEQ ID NO:47的残基215-270的氨基酸序列具有至少80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高序列同一性的氨基酸序列。在一些实施方式中，HVR2区包含对应于SEQ ID NO:47的残基215、217、219、221、223、224、229、231、233、235、237、259、261、266和268的一个或多个残基。在一些实施方式中，HVR2区包含对应于SEQ ID NO:47的残基215、217、219、221、223、224、229、231、233、235、237、259、261、266和268的残基。在一些实施方式中，HVR2区在对应于SEQID NO:47的残基257的残基处包含Y、R、K或D。在一些实施方式中，HVR2区包含对应于SEQ IDNO:47的残基239的残基。在一些实施方式中，HVR2区包含对应于SEQ ID NO:47的残基241的残基。在一些实施方式中，HVR2区包含对应于SEQ ID NO:47的残基264的残基。在一些实施方式中，HVR2区包含具有至多1、2、3、4、5、6、7、8、9、10或11个氨基酸置换的SEQ ID NO:47的残基215-270。在一些实施方式中，HVR2区包含SEQ ID NO:47的残基215-270。

在一些实施方式中，第二亚基包含与SEQ ID NO:47的残基198-344具有至少80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高序列同一性的氨基酸序列。在一些实施方式中，第二亚基在对应于SEQ ID NO:47的残基210的残基处包含G、S或A。在一些实施方式中，第二亚基在对应于SEQ ID NO:47的残基271的残基处包含E、Q或K。在一些实施方式中，第二亚基包含对应于SEQ ID NO:47的残基330的残基。在一些实施方式中，第二亚基包含具有至多1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29或30个氨基酸置换的SEQ ID NO:47的残基198-344。在一些实施方式中，第二亚基包含SEQ ID NO:47的残基198-344。

在一些实施方式中，工程化大范围核酸酶是包含接头的单链大范围核酸酶，其中接头共价接合所述第一亚基和所述第二亚基。在一些实施方式中，工程化大范围核酸酶包含与SEQ ID NO:47具有至少80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高序列同一性的氨基酸序列。在一些实施方式中，工程化大范围核酸酶包含SEQ ID NO:47的氨基酸序列。在一些实施方式中，工程化大范围核酸酶由核酸序列编码，其与SEQ ID NO:71中所示的核酸序列具有至少80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高序列同一性。在一些实施方式中，工程化大范围核酸酶由SEQ ID NO:71中所示的核酸序列编码。

DMD 35-36L.282(SEQ ID NO:48)

在一些实施方式中，HVR1区包含与对应于SEQ ID NO:48的残基24-79的氨基酸序列具有至少80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高序列同一性的氨基酸序列。在一些实施方式中，HVR1区包含对应于SEQ ID NO:48的残基24、26、28、30、32、33、38、40、42、44、46、68、70、75和77的一个或多个残基。在一些实施方式中，HVR1区包含对应于SEQ ID NO:48的残基24、26、28、30、32、33、38、40、42、44、46、68、70、75和77的残基。在一些实施方式中，HVR1区在对应于SEQ ID NO:48的残基66的残基处包含Y、R、K或D。在一些实施方式中，HVR1区包含具有至多1、2、3、4、5、6、7、8、9、10或11个氨基酸置换的SEQ ID NO:48的残基24-79。在一些实施方式中，HVR1区包含SEQ ID NO:48的残基24-79。

在一些实施方式中，第一亚基包含与SEQ ID NO:48的残基7-153具有至少80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高序列同一性的氨基酸序列。在一些实施方式中，第一亚基在对应于SEQ ID NO:48的残基19的残基处包含G、S或A。在一些实施方式中，第一亚基包含对应于SEQ ID NO:48的残基19的残基。在一些实施方式中，第一亚基在对应于SEQ ID NO:48的残基80的残基处包含E、Q或K。在一些实施方式中，第一亚基包含对应于SEQ ID NO:48的残基80的残基。在一些实施方式中，第一亚基包含具有至多1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29或30个氨基酸置换的SEQ ID NO:48的残基7-153。在一些实施方式中，第一亚基包含SEQ ID NO:48的残基7-153。

在一些实施方式中，HVR2区包含与对应于SEQ ID NO:48的残基215-270的氨基酸序列具有至少80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高序列同一性的氨基酸序列。在一些实施方式中，HVR2区包含对应于SEQ ID NO:48的残基215、217、219、221、223、224、229、231、233、235、237、259、261、266和268的一个或多个残基。在一些实施方式中，HVR2区包含对应于SEQ ID NO:48的残基215、217、219、221、223、224、229、231、233、235、237、259、261、266和268的残基。在一些实施方式中，HVR2区在对应于SEQID NO:48的残基257的残基处包含Y、R、K或D。在一些实施方式中，HVR2区包含对应于SEQ IDNO:48的残基239的残基。在一些实施方式中，HVR2区包含对应于SEQ ID NO:48的残基241的残基。在一些实施方式中，HVR2区包含对应于SEQ ID NO:48的残基264的残基。在一些实施方式中，HVR2区包含具有至多1、2、3、4、5、6、7、8、9、10或11个氨基酸置换的SEQ ID NO:48的残基215-270。在一些实施方式中，HVR2区包含SEQ ID NO:48的残基215-270。

在一些实施方式中，第二亚基包含与SEQ ID NO:48的残基198-344具有至少80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高序列同一性的氨基酸序列。在一些实施方式中，第二亚基在对应于SEQ ID NO:48的残基210的残基处包含G、S或A。在一些实施方式中，第二亚基在对应于SEQ ID NO:48的残基271的残基处包含E、Q或K。在一些实施方式中，第二亚基包含对应于SEQ ID NO:48的残基330的残基。在一些实施方式中，第二亚基包含具有至多1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29或30个氨基酸置换的SEQ ID NO:48的残基198-344。在一些实施方式中，第二亚基包含SEQ ID NO:48的残基198-344。

在一些实施方式中，工程化大范围核酸酶是包含接头的单链大范围核酸酶，其中接头共价接合所述第一亚基和所述第二亚基。在一些实施方式中，工程化大范围核酸酶包含与SEQ ID NO:48具有至少80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高序列同一性的氨基酸序列。在一些实施方式中，工程化大范围核酸酶包含SEQ ID NO:48的氨基酸序列。在一些实施方式中，工程化大范围核酸酶由核酸序列编码，其与SEQ ID NO:72所示的核酸序列具有至少80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高序列同一性。在一些实施方式中，工程化大范围核酸酶由SEQID NO:72中所示的核酸序列编码。

DMD 35-36L.349(SEQ ID NO:49)

在一些实施方式中，HVR1区包含与对应于SEQ ID NO:49的残基24-79的氨基酸序列具有至少80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高序列同一性的氨基酸序列。在一些实施方式中，HVR1区包含对应于SEQ ID NO:49的残基24、26、28、30、32、33、38、40、42、44、46、68、70、75和77的一个或多个残基。在一些实施方式中，HVR1区包含对应于SEQ ID NO:49的残基24、26、28、30、32、33、38、40、42、44、46、68、70、75和77的残基。在一些实施方式中，HVR1区在对应于SEQ ID NO:49的残基66的残基处包含Y、R、K或D。在一些实施方式中，HVR1区包含具有至多1、2、3、4、5、6、7、8、9、10或11个氨基酸置换的SEQ ID NO:49的残基24-79。在一些实施方式中，HVR1区包含SEQ ID NO:49的残基24-79。

在一些实施方式中，第一亚基包含与SEQ ID NO:49的残基7-153具有至少80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高序列同一性的氨基酸序列。在一些实施方式中，第一亚基在对应于SEQ ID NO:49的残基19的残基处包含G、S或A。在一些实施方式中，第一亚基包含对应于SEQ ID NO:49的残基19的残基。在一些实施方式中，第一亚基在对应于SEQ ID NO:49的残基80的残基处包含E、Q或K。在一些实施方式中，第一亚基包含对应于SEQ ID NO:49的残基80的残基。在一些实施方式中，第一亚基包含具有至多1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29或30个氨基酸置换的SEQ ID NO:49的残基7-153。在一些实施方式中，第一亚基包含SEQ ID NO:49的残基7-153。

在一些实施方式中，HVR2区包含与对应于SEQ ID NO:49的残基215-270的氨基酸序列具有至少80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高序列同一性的氨基酸序列。在一些实施方式中，HVR2区包含对应于SEQ ID NO:49的残基215、217、219、221、223、224、229、231、233、235、237、259、261、266和268的一个或多个残基。在一些实施方式中，HVR2区包含对应于SEQ ID NO:49的残基215、217、219、221、223、224、229、231、233、235、237、259、261、266和268的残基。在一些实施方式中，HVR2区在对应于SEQID NO:49的残基257的残基处包含Y、R、K或D。在一些实施方式中，HVR2区包含对应于SEQ IDNO:49的残基239的残基。在一些实施方式中，HVR2区包含对应于SEQ ID NO:49的残基241的残基。在一些实施方式中，HVR2区包含对应于SEQ ID NO:49的残基264的残基。在一些实施方式中，HVR2区包含具有至多1、2、3、4、5、6、7、8、9、10或11个氨基酸置换的SEQ ID NO:49的残基215-270。在一些实施方式中，HVR2区包含SEQ ID NO:49的残基215-270。

在一些实施方式中，第二亚基包含与SEQ ID NO:49的残基198-344具有至少80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高序列同一性的氨基酸序列。在一些实施方式中，第二亚基在对应于SEQ ID NO:49的残基210的残基处包含G、S或A。在一些实施方式中，第二亚基在对应于SEQ ID NO:49的残基271的残基处包含E、Q或K。在一些实施方式中，第二亚基包含对应于SEQ ID NO:49的残基330的残基。在一些实施方式中，第二亚基包含具有至多1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29或30个氨基酸置换的SEQ ID NO:49的残基198-344。在一些实施方式中，第二亚基包含SEQ ID NO:49的残基198-344。

在一些实施方式中，工程化大范围核酸酶是包含接头的单链大范围核酸酶，其中接头共价接合所述第一亚基和所述第二亚基。在一些实施方式中，工程化大范围核酸酶包含与SEQ ID NO:49具有至少80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高序列同一性的氨基酸序列。在一些实施方式中，工程化大范围核酸酶包含SEQ ID NO:49的氨基酸序列。在一些实施方式中，工程化大范围核酸酶由核酸序列编码，其与SEQ ID NO:73中所示的核酸序列具有至少80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高序列同一性。在一些实施方式中，工程化大范围核酸酶由SEQ ID NO:73中所示的核酸序列编码。

DMD 35-36L.376(SEQ ID NO:50)

在一些实施方式中，HVR1区包含与对应于SEQ ID NO:50的残基24-79的氨基酸序列具有至少80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高序列同一性的氨基酸序列。在一些实施方式中，HVR1区包含对应于SEQ ID NO:50的残基24、26、28、30、32、33、38、40、42、44、46、68、70、75和77的一个或多个残基。在一些实施方式中，HVR1区包含对应于SEQ ID NO:50的残基24、26、28、30、32、33、38、40、42、44、46、68、70、75和77的残基。在一些实施方式中，HVR1区在对应于SEQ ID NO:50的残基66的残基处包含Y、R、K或D。在一些实施方式中，HVR1区包含具有至多1、2、3、4、5、6、7、8、9、10或11个氨基酸置换的SEQ ID NO:50的残基24-79。在一些实施方式中，HVR1区包含SEQ ID NO:50的残基24-79。

在一些实施方式中，第一亚基包含与SEQ ID NO:50的残基7-153具有至少80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高序列同一性的氨基酸序列。在一些实施方式中，第一亚基在对应于SEQ ID NO:50的残基19的残基处包含G、S或A。在一些实施方式中，第一亚基包含对应于SEQ ID NO:50的残基19的残基。在一些实施方式中，第一亚基在对应于SEQ ID NO:50的残基80的残基处包含E、Q或K。在一些实施方式中，第一亚基包含对应于SEQ ID NO:50的残基80的残基。在一些实施方式中，第一亚基包含具有至多1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29或30个氨基酸置换的SEQ ID NO:50的残基7-153。在一些实施方式中，第一亚基包含SEQ ID NO:50的残基7-153。

在一些实施方式中，HVR2区包含与对应于SEQ ID NO:50的残基215-270的氨基酸序列具有至少80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高序列同一性的氨基酸序列。在一些实施方式中，HVR2区包含对应于SEQ ID NO:50的残基215、217、219、221、223、224、229、231、233、235、237、259、261、266和268的一个或多个残基。在一些实施方式中，HVR2区包含对应于SEQ ID NO:50的残基215、217、219、221、223、224、229、231、233、235、237、259、261、266和268的残基。在一些实施方式中，HVR2区在对应于SEQID NO:50的残基257的残基处包含Y、R、K或D。在一些实施方式中，HVR2区包含对应于SEQ IDNO:50的残基239的残基。在一些实施方式中，HVR2区包含对应于SEQ ID NO:50的残基241的残基。在一些实施方式中，HVR2区包含对应于SEQ ID NO:50的残基264的残基。在一些实施方式中，HVR2区包含具有至多1、2、3、4、5、6、7、8、9、10或11个氨基酸置换的SEQ ID NO:50的残基215-270。在一些实施方式中，HVR2区包含SEQ ID NO:50的残基215-270。

在一些实施方式中，第二亚基包含与SEQ ID NO:50的残基198-344具有至少80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高序列同一性的氨基酸序列。在一些实施方式中，第二亚基在对应于SEQ ID NO:50的残基210的残基处包含G、S或A。在一些实施方式中，第二亚基在对应于SEQ ID NO:50的残基271的残基处包含E、Q或K。在一些实施方式中，第二亚基包含对应于SEQ ID NO:50的残基330的残基。在一些实施方式中，第二亚基包含具有至多1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29或30个氨基酸置换的SEQ ID NO:50的残基198-344。在一些实施方式中，第二亚基包含SEQ ID NO:50的残基198-344。

在一些实施方式中，工程化大范围核酸酶是包含接头的单链大范围核酸酶，其中接头共价接合所述第一亚基和所述第二亚基。在一些实施方式中，工程化大范围核酸酶包含与SEQ ID NO:50具有至少80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高序列同一性的氨基酸序列。在一些实施方式中，工程化大范围核酸酶包含SEQ ID NO:50的氨基酸序列。在一些实施方式中，工程化大范围核酸酶由核酸序列编码，其与SEQ ID NO:74中所示的核酸序列具有至少80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高序列同一性。在一些实施方式中，工程化大范围核酸酶由SEQ ID NO:74中所示的核酸序列编码。

DMD 35-36L.457(SEQ ID NO:51)

在一些实施方式中，HVR1区包含与对应于SEQ ID NO:51的残基24-79的氨基酸序列具有至少80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高序列同一性的氨基酸序列。在一些实施方式中，HVR1区包含对应于SEQ ID NO:51的残基24、26、28、30、32、33、38、40、42、44、46、68、70、75和77的一个或多个残基。在一些实施方式中，HVR1区包含对应于SEQ ID NO:51的残基24、26、28、30、32、33、38、40、42、44、46、68、70、75和77的残基。在一些实施方式中，HVR1区在对应于SEQ ID NO:51的残基66的残基处包含Y、R、K或D。在一些实施方式中，HVR1区包含具有至多1、2、3、4、5、6、7、8、9、10或11个氨基酸置换的SEQ ID NO:51的残基24-79。在一些实施方式中，HVR1区包含SEQ ID NO:51的残基24-79。

在一些实施方式中，第一亚基包含与SEQ ID NO:51的残基7-153具有至少80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高序列同一性的氨基酸序列。在一些实施方式中，第一亚基在对应于SEQ ID NO:51的残基19的残基处包含G、S或A。在一些实施方式中，第一亚基包含对应于SEQ ID NO:51的残基19的残基。在一些实施方式中，第一亚基在对应于SEQ ID NO:51的残基80的残基处包含E、Q或K。在一些实施方式中，第一亚基包含对应于SEQ ID NO:51的残基80的残基。在一些实施方式中，第一亚基包含具有至多1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29或30个氨基酸置换的SEQ ID NO:51的残基7-153。在一些实施方式中，第一亚基包含SEQ ID NO:51的残基7-153。

在一些实施方式中，HVR2区包含与对应于SEQ ID NO:51的残基215-270的氨基酸序列具有至少80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高序列同一性的氨基酸序列。在一些实施方式中，HVR2区包含对应于SEQ ID NO:51的残基215、217、219、221、223、224、229、231、233、235、237、259、261、266和268的一个或多个残基。在一些实施方式中，HVR2区包含对应于SEQ ID NO:51的残基215、217、219、221、223、224、229、231、233、235、237、259、261、266和268的残基。在一些实施方式中，HVR2区在对应于SEQID NO:51的残基257的残基处包含Y、R、K或D。在一些实施方式中，HVR2区包含对应于SEQ IDNO:51的残基239的残基。在一些实施方式中，HVR2区包含对应于SEQ ID NO:51的残基241的残基。在一些实施方式中，HVR2区包含对应于SEQ ID NO:51的残基264的残基。在一些实施方式中，HVR2区包含具有至多1、2、3、4、5、6、7、8、9、10或11个氨基酸置换的SEQ ID NO:51的残基215-270。在一些实施方式中，HVR2区包含SEQ ID NO:51的残基215-270。

在一些实施方式中，第二亚基包含与SEQ ID NO:51的残基198-344具有至少80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高序列同一性的氨基酸序列。在一些实施方式中，第二亚基在对应于SEQ ID NO:51的残基210的残基处包含G、S或A。在一些实施方式中，第二亚基在对应于SEQ ID NO:51的残基271的残基处包含E、Q或K。在一些实施方式中，第二亚基包含对应于SEQ ID NO:51的残基330的残基。在一些实施方式中，第二亚基包含具有至多1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29或30个氨基酸置换的SEQ ID NO:51的残基198-344。在一些实施方式中，第二亚基包含SEQ ID NO:51的残基198-344。

在一些实施方式中，工程化大范围核酸酶是包含接头的单链大范围核酸酶，其中接头共价接合所述第一亚基和所述第二亚基。在一些实施方式中，工程化大范围核酸酶包含与SEQ ID NO:51具有至少80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高序列同一性的氨基酸序列。在一些实施方式中，工程化大范围核酸酶包含SEQ ID NO:51的氨基酸序列。在一些实施方式中，工程化大范围核酸酶由核酸序列编码，其与SEQ ID NO:75中所示的核酸序列具有至少80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高序列同一性。在一些实施方式中，工程化大范围核酸酶由SEQ ID NO:75中所示的核酸序列编码。

DMD 35-36L.469(SEQ ID NO:52)

在一些实施方式中，HVR1区包含与对应于SEQ ID NO:52的残基24-79的氨基酸序列具有至少80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高序列同一性的氨基酸序列。在一些实施方式中，HVR1区包含对应于SEQ ID NO:52的残基24、26、28、30、32、33、38、40、42、44、46、68、70、75和77的一个或多个残基。在一些实施方式中，HVR1区包含对应于SEQ ID NO:52的残基24、26、28、30、32、33、38、40、42、44、46、68、70、75和77的残基。在一些实施方式中，HVR1区在对应于SEQ ID NO:52的残基66的残基处包含Y、R、K或D。在一些实施方式中，HVR1区包含具有至多1、2、3、4、5、6、7、8、9、10或11个氨基酸置换的SEQ ID NO:52的残基24-79。在一些实施方式中，HVR1区包含SEQ ID NO:52的24-79。

在一些实施方式中，第一亚基包含与SEQ ID NO:52的残基7-153具有至少80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高序列同一性的氨基酸序列。在一些实施方式中，第一亚基在对应于SEQ ID NO:52的残基19的残基处包含G、S或A。在一些实施方式中，第一亚基包含对应于SEQ ID NO:52的残基19的残基。在一些实施方式中，第一亚基在对应于SEQ ID NO:52的残基80的残基处包含E、Q或K。在一些实施方式中，第一亚基包含具有至多1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29或30个氨基酸置换的SEQ ID NO:52的残基7-153。在一些实施方式中，第一亚基包含SEQ ID NO:52的残基7-153。

在一些实施方式中，HVR2区包含与对应于SEQ ID NO:52的残基215-270的氨基酸序列具有至少80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高序列同一性的氨基酸序列。在一些实施方式中，HVR2区包含对应于SEQ ID NO:52的残基215、217、219、221、223、224、229、231、233、235、237、259、261、266和268的一个或多个残基。在一些实施方式中，HVR2区包含对应于SEQ ID NO:52的残基215、217、219、221、223、224、229、231、233、235、237、259、261、266和268的残基。在一些实施方式中，HVR2区在对应于SEQID NO:52的残基257的残基处包含Y、R、K或D。在一些实施方式中，HVR2区包含对应于SEQ IDNO:52的残基239的残基。在一些实施方式中，HVR2区包含对应于SEQ ID NO:52的残基241的残基。在一些实施方式中，HVR2区包含对应于SEQ ID NO:52的残基264的残基。在一些实施方式中，HVR2区包含具有至多1、2、3、4、5、6、7、8、9、10或11个氨基酸置换的SEQ ID NO:52的残基215-270。在一些实施方式中，HVR2区包含SEQ ID NO:52的残基215-270。

在一些实施方式中，第二亚基包含与SEQ ID NO:52的残基198-344具有至少80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高序列同一性的氨基酸序列。在一些实施方式中，第二亚基在对应于SEQ ID NO:52的残基210的残基处包含G、S或A。在一些实施方式中，第二亚基在对应于SEQ ID NO:52的残基271的残基处包含E、Q或K。在一些实施方式中，第二亚基包含对应于SEQ ID NO:52的残基271的残基。在一些实施方式中，第二亚基包含对应于SEQ ID NO:52的残基330的残基。在一些实施方式中，第二亚基包含具有至多1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29或30个氨基酸置换的SEQ ID NO:52的残基198-344。在一些实施方式中，第二亚基包含SEQ ID NO:52的残基198-344。

在一些实施方式中，工程化大范围核酸酶是包含接头的单链大范围核酸酶，其中接头共价接合所述第一亚基和所述第二亚基。在一些实施方式中，工程化大范围核酸酶包含与SEQ ID NO:52具有至少80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高序列同一性的氨基酸序列。在一些实施方式中，工程化大范围核酸酶包含SEQ ID NO:52的氨基酸序列。在一些实施方式中，工程化大范围核酸酶由核酸序列编码，其与SEQ ID NO:76中所示的核酸序列具有至少80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高序列同一性。在一些实施方式中，工程化大范围核酸酶由SEQ ID NO:76中所示的核酸序列编码。

在本发明的某些实施方式中，工程化大范围核酸酶结合并切割肌营养不良蛋白基因内的包含SEQ ID NO:12的识别序列(即，DMD 37-38识别序列)，其中工程化大范围核酸酶包含第一亚基和第二亚基，其中第一亚基与识别序列的第一识别半位点结合并包含第一高变(HVR1)区，和其中第二亚基与识别序列的第二识别半位点结合并包含第二高变(HVR2)区。示例性DMD 37-38大范围核酸酶如下所示。

DMD 37-38x.15(SEQ ID NO:53)

在一些实施方式中，HVR1区包含与对应于SEQ ID NO:53的残基24-79的氨基酸序列具有至少80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高序列同一性的氨基酸序列。在一些实施方式中，HVR1区包含对应于SEQ ID NO:53的残基24、26、28、30、32、33、38、40、42、44、46、68、70、75和77的一个或多个残基。在一些实施方式中，HVR1区包含对应于SEQ ID NO:53的残基24、26、28、30、32、33、38、40、42、44、46、68、70、75和77的残基。在一些实施方式中，HVR1区在对应于SEQ ID NO:53的残基66的残基处包含Y、R、K或D。在一些实施方式中，HVR1区包含具有至多1、2、3、4、5、6、7、8、9、10或11个氨基酸置换的SEQ ID NO:53的残基24-79。在一些实施方式中，HVR1区包含SEQ ID NO:53的残基24-79。

在一些实施方式中，第一亚基包含与SEQ ID NO:53的残基7-153具有至少80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高序列同一性的氨基酸序列。在一些实施方式中，第一亚基在对应于SEQ ID NO:53的残基19的残基处包含G、S或A。在一些实施方式中，第一亚基包含对应于SEQ ID NO:53的残基19的残基。在一些实施方式中，第一亚基在对应于SEQ ID NO:53的残基80的残基处包含E、Q或K。在一些实施方式中，第一亚基包含对应于SEQ ID NO:53的残基80的残基。在一些实施方式中，第一亚基包含具有至多1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29或30个氨基酸置换的SEQ ID NO:53的残基7-153。在一些实施方式中，第一亚基包含SEQ ID NO:53的残基7-153。

在一些实施方式中，HVR2区包含与对应于SEQ ID NO:53的残基215-270的氨基酸序列具有至少80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高序列同一性的氨基酸序列。在一些实施方式中，HVR2区包含对应于SEQ ID NO:53的残基215、217、219、221、223、224、229、231、233、235、237、259、261、266和268的一个或多个残基。在一些实施方式中，HVR2区包含对应于SEQ ID NO:53的残基215、217、219、221、223、224、229、231、233、235、237、259、261、266和268的残基。在一些实施方式中，HVR2区在对应于SEQID NO:53的残基257的残基处包含Y、R、K或D。在一些实施方式中，HVR2区包含对应于SEQ IDNO:53的残基239的残基。在一些实施方式中，HVR2区包含对应于SEQ ID NO:53的残基241的残基。在一些实施方式中，HVR2区包含对应于SEQ ID NO:53的残基264的残基。在一些实施方式中，HVR2区包含具有至多1、2、3、4、5、6、7、8、9、10或11个氨基酸置换的SEQ ID NO:53的残基215-270。在一些实施方式中，HVR2区包含SEQ ID NO:53的残基215-270。

在一些实施方式中，第二亚基包含与SEQ ID NO:53的残基198-344具有至少80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高序列同一性的氨基酸序列。在一些实施方式中，第二亚基在对应于SEQ ID NO:53的残基210的残基处包含G、S或A。在一些实施方式中，第二亚基在对应于SEQ ID NO:53的残基271的残基处包含E、Q或K。在一些实施方式中，第二亚基包含对应于SEQ ID NO:53的残基271的残基。在一些实施方式中，第二亚基包含具有至多1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29或30个氨基酸置换的SEQ ID NO:53的残基198-344。在一些实施方式中，第二亚基包含SEQ ID NO:53的残基198-344。

在一些实施方式中，工程化大范围核酸酶是包含接头的单链大范围核酸酶，其中接头共价接合所述第一亚基和所述第二亚基。在一些实施方式中，工程化大范围核酸酶包含与SEQ ID NO:53具有至少80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高序列同一性的氨基酸序列。在一些实施方式中，工程化大范围核酸酶包含SEQ ID NO:53的氨基酸序列。在一些实施方式中，工程化大范围核酸酶由核酸序列编码，其与SEQ ID NO:77中所示的核酸序列具有至少80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高序列同一性。在一些实施方式中，工程化大范围核酸酶由SEQ ID NO:77中所示的核酸序列编码。

DMD 37-38x.66(SEQ ID NO:54)

在一些实施方式中，HVR1区包含与对应于SEQ ID NO:54的残基24-79的氨基酸序列具有至少80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高序列同一性的氨基酸序列。在一些实施方式中，HVR1区包含对应于SEQ ID NO:54的残基24、26、28、30、32、33、38、40、42、44、46、68、70、75和77的一个或多个残基。在一些实施方式中，HVR1区包含对应于SEQ ID NO:54的残基24、26、28、30、32、33、38、40、42、44、46、68、70、75和77的残基。在一些实施方式中，HVR1区在对应于SEQ ID NO:54的残基66的残基处包含Y、R、K或D。在一些实施方式中，HVR1区包含对应于SEQ ID NO:54的残基66的残基。在一些实施方式中，HVR1区包含具有至多1、2、3、4、5、6、7、8、9、10或11个氨基酸置换的SEQ ID NO:54的残基24-79。在一些实施方式中，HVR1区包含SEQ ID NO:54的24-79。

在一些实施方式中，第一亚基包含与SEQ ID NO:54的残基7-153具有至少80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高序列同一性的氨基酸序列。在一些实施方式中，第一亚基在对应于SEQ ID NO:54的残基19的残基处包含G、S或A。在一些实施方式中，第一亚基包含对应于SEQ ID NO:54的残基19的残基。在一些实施方式中，第一亚基在对应于SEQ ID NO:54的残基80的残基处包含E、Q或K。在一些实施方式中，第一亚基包含对应于SEQ ID NO:54的残基80的残基。在一些实施方式中，第一亚基包含具有至多1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29或30个氨基酸置换的SEQ ID NO:54的残基7-153。在一些实施方式中，第一亚基包含SEQ ID NO:54的残基7-153。

在一些实施方式中，HVR2区包含与对应于SEQ ID NO:54的残基215-270的氨基酸序列具有至少80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高序列同一性的氨基酸序列。在一些实施方式中，HVR2区包含对应于SEQ ID NO:54的残基215、217、219、221、223、224、229、231、233、235、237、259、261、266和268的一个或多个残基。在一些实施方式中，HVR2区包含对应于SEQ ID NO:54的残基215、217、219、221、223、224、229、231、233、235、237、259、261、266和268的残基。在一些实施方式中，HVR2区在对应于SEQID NO:54的残基257的残基处包含Y、R、K或D。在一些实施方式中，HVR2区包含对应于SEQ IDNO:54的残基241的残基。在一些实施方式中，HVR2区包含对应于SEQ ID NO:54的残基264的残基。在一些实施方式中，HVR2区包含具有至多1、2、3、4、5、6、7、8、9、10或11个氨基酸置换的SEQ ID NO:54的残基215-270。在一些实施方式中，HVR2区包含SEQ ID NO:54的残基215-270。

在一些实施方式中，第二亚基包含与SEQ ID NO:54的残基198-344具有至少80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高序列同一性的氨基酸序列。在一些实施方式中，第二亚基在对应于SEQ ID NO:54的残基210的残基处包含G、S或A。在一些实施方式中，第二亚基在对应于SEQ ID NO:54的残基271的残基处包含E、Q或K。在一些实施方式中，第二亚基包含对应于SEQ ID NO:54的残基330的残基。在一些实施方式中，第二亚基包含具有至多1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29或30个氨基酸置换的SEQ ID NO:54的残基198-344。在一些实施方式中，第二亚基包含SEQ ID NO:54的残基198-344。

在一些实施方式中，工程化大范围核酸酶是包含接头的单链大范围核酸酶，其中接头共价接合所述第一亚基和所述第二亚基。在一些实施方式中，工程化大范围核酸酶包含与SEQ ID NO:54具有至少80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高序列同一性的氨基酸序列。在一些实施方式中，工程化大范围核酸酶包含SEQ ID NO:54的氨基酸序列。在一些实施方式中，工程化大范围核酸酶由核酸序列编码，其与SEQ ID NO:78中所示的核酸序列具有至少80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高序列同一性。在一些实施方式中，工程化大范围核酸酶由SEQ ID NO:78中所示的核酸序列编码。

DMD 37-38x.79(SEQ ID NO:55)

在一些实施方式中，HVR1区包含与对应于SEQ ID NO:55的残基24-79的氨基酸序列具有至少80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高序列同一性的氨基酸序列。在一些实施方式中，HVR1区包含对应于SEQ ID NO:55的残基24、26、28、30、32、33、38、40、42、44、46、68、70、75和77的一个或多个残基。在一些实施方式中，HVR1区包含对应于SEQ ID NO:55的残基24、26、28、30、32、33、38、40、42、44、46、68、70、75和77的残基。在一些实施方式中，HVR1区在对应于SEQ ID NO:55的残基66的残基处包含Y、R、K或D。在一些实施方式中，HVR1区包含具有至多1、2、3、4、5、6、7、8、9、10或11个氨基酸置换的SEQ ID NO:55的残基24-79。在一些实施方式中，HVR1区包含SEQ ID NO:55的残基24-79。

在一些实施方式中，第一亚基包含与SEQ ID NO:55的残基7-153具有至少80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高序列同一性的氨基酸序列。在一些实施方式中，第一亚基在对应于SEQ ID NO:55的残基19的残基处包含G、S或A。在一些实施方式中，第一亚基包含对应于SEQ ID NO:55的残基19的残基。在一些实施方式中，第一亚基在对应于SEQ ID NO:55的残基80的残基处包含E、Q或K。在一些实施方式中，第一亚基包含对应于SEQ ID NO:55的残基80的残基。在一些实施方式中，第一亚基包含具有至多1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29或30个氨基酸置换的SEQ ID NO:55的残基7-153。在一些实施方式中，第一亚基包含SEQ ID NO:55的残基7-153。

在一些实施方式中，HVR2区包含与对应于SEQ ID NO:55的残基215-270的氨基酸序列具有至少80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高序列同一性的氨基酸序列。在一些实施方式中，HVR2区包含对应于SEQ ID NO:55的残基215、217、219、221、223、224、229、231、233、235、237、259、261、266和268的一个或多个残基。在一些实施方式中，HVR2区包含对应于SEQ ID NO:55的残基215、217、219、221、223、224、229、231、233、235、237、259、261、266和268的残基。在一些实施方式中，HVR2区在对应于SEQID NO:55的残基257的残基处包含Y、R、K或D。在一些实施方式中，HVR2区包含对应于SEQ IDNO:55的残基239的残基。在一些实施方式中，HVR2区包含对应于SEQ ID NO:55的残基241的残基。在一些实施方式中，HVR2区包含对应于SEQ ID NO:55的残基255的残基。在一些实施方式中，HVR2区包含对应于SEQ ID NO:55的残基264的残基。在一些实施方式中，HVR2区包含具有至多1、2、3、4、5、6、7、8、9、10或11个氨基酸置换的SEQ ID NO:55的残基215-270。在一些实施方式中，HVR2区包含SEQ ID NO:55的残基215-270。

在一些实施方式中，第二亚基包含与SEQ ID NO:55的残基198-344具有至少80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高序列同一性的氨基酸序列。在一些实施方式中，第二亚基在对应于SEQ ID NO:55的残基210的残基处包含G、S或A。在一些实施方式中，第二亚基在对应于SEQ ID NO:55的残基271的残基处包含E、Q或K。在一些实施方式中，第二亚基包含对应于SEQ ID NO:55的残基271的残基。在一些实施方式中，第二亚基包含对应于SEQ ID NO:55的残基330的残基。在一些实施方式中，第二亚基包含具有至多1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29或30个氨基酸置换的SEQ ID NO:55的残基198-344。在一些实施方式中，第二亚基包含SEQ ID NO:55的残基198-344。

在一些实施方式中，工程化大范围核酸酶是包含接头的单链大范围核酸酶，其中接头共价接合所述第一亚基和所述第二亚基。在一些实施方式中，工程化大范围核酸酶包含与SEQ ID NO:55具有至少80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高序列同一性的氨基酸序列。在一些实施方式中，工程化大范围核酸酶包含SEQ ID NO:55的氨基酸序列。在一些实施方式中，工程化大范围核酸酶由核酸序列编码，其与SEQ ID NO:79中所示的核酸序列具有至少80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高序列同一性。在一些实施方式中，工程化大范围核酸酶由SEQ ID NO:79中所示的核酸序列编码。

DMD 37-38L.166(SEQ ID NO:56)

在一些实施方式中，HVR1区包含与对应于SEQ ID NO:56的残基24-79的氨基酸序列具有至少80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高序列同一性的氨基酸序列。在一些实施方式中，HVR1区包含对应于SEQ ID NO:56的残基24、26、28、30、32、33、38、40、42、44、46、68、70、75和77的一个或多个残基。在一些实施方式中，HVR1区包含对应于SEQ ID NO:56的残基24、26、28、30、32、33、38、40、42、44、46、68、70、75和77的残基。在一些实施方式中，HVR1区在对应于SEQ ID NO:56的残基66的残基处包含Y、R、K或D。在一些实施方式中，HVR1区包含具有至多1、2、3、4、5、6、7、8、9、10或11个氨基酸置换的SEQ ID NO:56的残基24-79。在一些实施方式中，HVR1区包含SEQ ID NO:56的残基24-79。

在一些实施方式中，第一亚基包含与SEQ ID NO:56的残基7-153具有至少80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高序列同一性的氨基酸序列。在一些实施方式中，第一亚基在对应于SEQ ID NO:56的残基19的残基处包含G、S或A。在一些实施方式中，第一亚基包含对应于SEQ ID NO:56的残基19的残基。在一些实施方式中，第一亚基在对应于SEQ ID NO:56的残基80的残基处包含E、Q或K。在一些实施方式中，第一亚基包含具有至多1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29或30个氨基酸置换的SEQ ID NO:56的残基7-153。在一些实施方式中，第一亚基包含SEQ ID NO:56的残基7-153。

在一些实施方式中，HVR2区包含与对应于SEQ ID NO:56的残基215-270的氨基酸序列具有至少80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高序列同一性的氨基酸序列。在一些实施方式中，HVR2区包含对应于SEQ ID NO:56的残基215、217、219、221、223、224、229、231、233、235、237、259、261、266和268的一个或多个残基。在一些实施方式中，HVR2区包含对应于SEQ ID NO:56的残基215、217、219、221、223、224、229、231、233、235、237、259、261、266和268的残基。在一些实施方式中，HVR2区在对应于SEQID NO:56的残基257的残基处包含Y、R、K或D。在一些实施方式中，HVR2区包含对应于SEQ IDNO:56的残基263的残基。在一些实施方式中，HVR2区包含对应于SEQ ID NO:56的残基264的残基。在一些实施方式中，HVR2区包含具有至多1、2、3、4、5、6、7、8、9、10或11个氨基酸置换的SEQ ID NO:56的残基215-270。在一些实施方式中，HVR2区包含SEQ ID NO:56的残基215-270。

在一些实施方式中，第二亚基包含与SEQ ID NO:56的残基198-344具有至少80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高序列同一性的氨基酸序列。在一些实施方式中，第二亚基在对应于SEQ ID NO:56的残基210的残基处包含G、S或A。在一些实施方式中，第二亚基在对应于SEQ ID NO:56的残基271的残基处包含E、Q或K。在一些实施方式中，第二亚基包含对应于SEQ ID NO:56的残基271的残基。在一些实施方式中，第二亚基包含对应于SEQ ID NO:56的残基330的残基。在一些实施方式中，第二亚基包含具有至多1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29或30个氨基酸置换的SEQ ID NO:56的残基198-344。在一些实施方式中，第二亚基包含SEQ ID NO:56的残基198-344。

在一些实施方式中，工程化大范围核酸酶是包含接头的单链大范围核酸酶，其中接头共价接合所述第一亚基和所述第二亚基。在一些实施方式中，工程化大范围核酸酶包含与SEQ ID NO:56具有至少80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高序列同一性的氨基酸序列。在一些实施方式中，工程化大范围核酸酶包含SEQ ID NO:56的氨基酸序列。在一些实施方式中，工程化大范围核酸酶由核酸序列编码，其与SEQ ID NO:80中所示的核酸序列具有至少80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高序列同一性。在一些实施方式中，工程化大范围核酸酶由SEQ ID NO:80中所示的核酸序列编码。

DMD 37-38L.478(SEQ ID NO:57)

在一些实施方式中，HVR1区包含与SEQ ID NO:57的残基24-79具有至少80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高序列同一性的氨基酸序列。在一些实施方式中，HVR1区包含对应于SEQ ID NO:57的残基24、26、28、30、32、33、38、40、42、44、46、68、70、75和77的一个或多个残基。在一些实施方式中，HVR1区包含对应于SEQ ID NO:57的残基24、26、28、30、32、33、38、40、42、44、46、68、70、75和77的残基。在一些实施方式中，HVR1区在对应于SEQ ID NO:57的残基66的残基处包含Y、R、K或D。在一些实施方式中，HVR1区包含具有至多1、2、3、4、5、6、7、8、9、10或11个氨基酸置换的SEQ ID NO:57的残基24-79。在一些实施方式中，HVR1区包含SEQ ID NO:57的残基24-79。

在一些实施方式中，第一亚基包含与SEQ ID NO:57的残基7-153具有至少80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高序列同一性的氨基酸序列。在一些实施方式中，第一亚基在对应于SEQ ID NO:57的残基19的残基处包含G、S或A。在一些实施方式中，第一亚基包含对应于SEQ ID NO:57的残基19的残基。在一些实施方式中，第一亚基在对应于SEQ ID NO:57的残基80的残基处包含E、Q或K。在一些实施方式中，第一亚基包含对应于SEQ ID NO:57的残基80的残基。在一些实施方式中，第一亚基包含具有至多1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29或30个氨基酸置换的SEQ ID NO:57的残基7-153。在一些实施方式中，第一亚基包含SEQ ID NO:57的残基7-153。

在一些实施方式中，HVR2区包含与对应于SEQ ID NO:57的残基215-270的氨基酸序列具有至少80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高序列同一性的氨基酸序列。在一些实施方式中，HVR2区包含对应于SEQ ID NO:57的残基215、217、219、221、223、224、229、231、233、235、237、259、261、266和268的一个或多个残基。在一些实施方式中，HVR2区包含对应于SEQ ID NO:57的残基215、217、219、221、223、224、229、231、233、235、237、259、261、266和268的一个或多个残基。在一些实施方式中，HVR2区在对应于SEQ ID NO:57的残基257的残基处包含Y、R、K或D。在一些实施方式中，HVR2区包含对应于SEQ ID NO:57的残基263的残基。在一些实施方式中，HVR2区包含对应于SEQ ID NO:57的残基264的残基。在一些实施方式中，HVR2区包含具有至多1、2、3、4、5、6、7、8、9、10或11个氨基酸置换的SEQ ID NO:57的残基215-270。在一些实施方式中，HVR2区包含SEQ ID NO:57的残基215-270。

在一些实施方式中，第二亚基包含与SEQ ID NO:57的残基198-344具有至少80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高序列同一性的氨基酸序列。在一些实施方式中，第二亚基在对应于SEQ ID NO:57的残基210的残基处包含G、S或A。在一些实施方式中，第二亚基在对应于SEQ ID NO:57的残基271的残基处包含E、Q或K。在一些实施方式中，第二亚基包含对应于SEQ ID NO:57的残基271的残基。在一些实施方式中，第二亚基包含对应于SEQ ID NO:57的残基330的残基。在一些实施方式中，第二亚基包含具有至多1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29或30个氨基酸置换的SEQ ID NO:57的残基198-344。在一些实施方式中，第二亚基包含SEQ ID NO:57的残基198-344。

在一些实施方式中，工程化大范围核酸酶是包含接头的单链大范围核酸酶，其中接头共价接合所述第一亚基和所述第二亚基。在一些实施方式中，工程化大范围核酸酶包含与SEQ ID NO:57具有至少80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高序列同一性的氨基酸序列。在一些实施方式中，工程化大范围核酸酶包含SEQ ID NO:57的氨基酸序列。在一些实施方式中，工程化大范围核酸酶由核酸序列编码，其与SEQ ID NO:81中所示的核酸序列具有至少80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高序列同一性。在一些实施方式中，工程化大范围核酸酶由SEQ ID NO:81中所示的核酸序列编码。

DMD 37-38L.512(SEQ ID NO:58)

在一些实施方式中，HVR1区包含与对应于SEQ ID NO:58的残基24-79的氨基酸序列具有至少80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高序列同一性的氨基酸序列。在一些实施方式中，HVR1区包含对应于SEQ ID NO:58的残基24、26、28、30、32、33、38、40、42、44、46、68、70、75和77的一个或多个残基。在一些实施方式中，HVR1区包含对应于SEQ ID NO:58的残基24、26、28、30、32、33、38、40、42、44、46、68、70、75和77的残基。在一些实施方式中，HVR1区在对应于SEQ ID NO:58的残基66的残基处包含Y、R、K或D。在一些实施方式中，HVR1区包含具有至多1、2、3、4、5、6、7、8、9、10或11个氨基酸置换的SEQ ID NO:58的残基24-79。在一些实施方式中，HVR1区包含SEQ ID NO:58的残基24-79。

在一些实施方式中，第一亚基包含与SEQ ID NO:58的残基7-153具有至少80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高序列同一性的氨基酸序列。在一些实施方式中，第一亚基在对应于SEQ ID NO:58的残基19的残基处包含G、S或A。在一些实施方式中，第一亚基包含对应于SEQ ID NO:58的残基19的残基。在一些实施方式中，第一亚基在对应于SEQ ID NO:58的残基80的残基处包含E、Q或K。在一些实施方式中，第一亚基包含对应于SEQ ID NO:58的残基80的残基。在一些实施方式中，第一亚基包含具有至多1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29或30个氨基酸置换的SEQ ID NO:58的残基7-153。在一些实施方式中，第一亚基包含SEQ ID NO:58的残基7-153。

在一些实施方式中，HVR2区包含与对应于SEQ ID NO:58的残基215-270的氨基酸序列具有至少80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高序列同一性的氨基酸序列。在一些实施方式中，HVR2区包含对应于SEQ ID NO:58的残基215、217、219、221、223、224、229、231、233、235、237、259、261、266和268的一个或多个残基。在一些实施方式中，HVR2区包含对应于SEQ ID NO:58的残基215、217、219、221、223、224、229、231、233、235、237、259、261、266和268的残基。在一些实施方式中，HVR2区在对应于SEQID NO:58的残基257的残基处包含Y、R、K或D。在一些实施方式中，HVR2区包含对应于SEQ IDNO:58的残基263的残基。在一些实施方式中，HVR2区包含对应于SEQ ID NO:58的残基264的残基。在一些实施方式中，HVR2区包含具有至多1、2、3、4、5、6、7、8、9、10或11个氨基酸置换的SEQ ID NO:58的残基215-270。在一些实施方式中，HVR2区包含SEQ ID NO:58的残基215-270。

在一些实施方式中，第二亚基包含与SEQ ID NO:58的残基198-344具有至少80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高序列同一性的氨基酸序列。在一些实施方式中，第二亚基在对应于SEQ ID NO:58的残基210的残基处包含G、S或A。在一些实施方式中，第二亚基在对应于SEQ ID NO:58的残基271的残基处包含E、Q或K。在一些实施方式中，第二亚基包含对应于SEQ ID NO:58的残基271的残基。在一些实施方式中，第二亚基包含对应于SEQ ID NO:58的残基330的残基。在一些实施方式中，第二亚基包含具有至多1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29或30个氨基酸置换的SEQ ID NO:58的残基198-344。在一些实施方式中，第二亚基包含SEQ ID NO:58的残基198-344。

在一些实施方式中，工程化大范围核酸酶是包含接头的单链大范围核酸酶，其中接头共价接合所述第一亚基和所述第二亚基。在一些实施方式中，工程化大范围核酸酶包含与SEQ ID NO:58具有至少80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高序列同一性的氨基酸序列。在一些实施方式中，工程化大范围核酸酶包含SEQ ID NO:58的氨基酸序列。在一些实施方式中，工程化大范围核酸酶由核酸序列编码，其与SEQ ID NO:82中所示的核酸序列具有至少80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高序列同一性。在一些实施方式中，工程化大范围核酸酶由SEQ ID NO:82中所示的核酸序列编码。

DMD 37-38L.528(SEQ ID NO:59)

在一些实施方式中，HVR1区包含与对应于SEQ ID NO:59的残基24-79的氨基酸序列具有至少80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高序列同一性的氨基酸序列。在一些实施方式中，HVR1区包含对应于SEQ ID NO:59的残基24、26、28、30、32、33、38、40、42、44、46、68、70、75和77的一个或多个残基。在一些实施方式中，HVR1区包含对应于SEQ ID NO:59的残基24、26、28、30、32、33、38、40、42、44、46、68、70、75和77的残基。在一些实施方式中，HVR1区在对应于SEQ ID NO:59的残基66的残基处包含Y、R、K或D。在一些实施方式中，HVR1区包含具有至多1、2、3、4、5、6、7、8、9、10或11个氨基酸置换的SEQ ID NO:59的残基24-79。在一些实施方式中，HVR1区包含SEQ ID NO:59的残基24-79。

在一些实施方式中，第一亚基包含与SEQ ID NO:59的残基7-153具有至少80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高序列同一性的氨基酸序列。在一些实施方式中，第一亚基在对应于SEQ ID NO:59的残基19的残基处包含G、S或A。在一些实施方式中，第一亚基包含对应于SEQ ID NO:59的残基19的残基。在一些实施方式中，第一亚基在对应于SEQ ID NO:59的残基80的残基处包含E、Q或K。在一些实施方式中，第一亚基包含具有至多1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29或30个氨基酸置换的SEQ ID NO:59的残基7-153。在一些实施方式中，第一亚基包含SEQ ID NO:59的残基7-153。

在一些实施方式中，HVR2区包含与对应于SEQ ID NO:59的残基215-270的氨基酸序列具有至少80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高序列同一性的氨基酸序列。在一些实施方式中，HVR2区包含对应于SEQ ID NO:59的残基215、217、219、221、223、224、229、231、233、235、237、259、261、266和268的一个或多个残基。在一些实施方式中，HVR2区包含对应于SEQ ID NO:59的残基215、217、219、221、223、224、229、231、233、235、237、259、261、266和268的残基。在一些实施方式中，HVR2区在对应于SEQID NO:59的残基257的残基处包含Y、R、K或D。在一些实施方式中，HVR2区包含对应于SEQ IDNO:59的残基263的残基。在一些实施方式中，HVR2区包含对应于SEQ ID NO:59的残基264的残基。在一些实施方式中，HVR2区包含具有至多1、2、3、4、5、6、7、8、9、10或11个氨基酸置换的SEQ ID NO:59的残基215-270。在一些实施方式中，HVR2区包含SEQ ID NO:59的残基215-270。

在一些实施方式中，第二亚基包含与SEQ ID NO:59的残基198-344具有至少80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高序列同一性的氨基酸序列。在一些实施方式中，第二亚基在对应于SEQ ID NO:59的残基210的残基处包含G、S或A9。在一些实施方式中，第二亚基在对应于SEQ ID NO:59的残基271的残基处包含E、Q或K。在一些实施方式中，第二亚基包含对应于SEQ ID NO:59的残基271的残基。在一些实施方式中，第二亚基包含对应于SEQ ID NO:59的残基330的残基。在一些实施方式中，第二亚基包含具有至多1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29或30个氨基酸置换的SEQ ID NO:59的残基198-344。在一些实施方式中，第二亚基包含SEQ ID NO:59的残基198-344。

在一些实施方式中，工程化大范围核酸酶是包含接头的单链大范围核酸酶，其中接头共价接合所述第一亚基和所述第二亚基。在一些实施方式中，工程化大范围核酸酶包含与SEQ ID NO:59具有至少80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高序列同一性的氨基酸序列。在一些实施方式中，工程化大范围核酸酶包含SEQ ID NO:59的氨基酸序列。在一些实施方式中，工程化大范围核酸酶由核酸序列编码，其与SEQ ID NO:83中所示的核酸序列具有至少80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高序列同一性。在一些实施方式中，工程化大范围核酸酶由SEQ ID NO:83中所示的核酸序列编码。

2.3用于递送和表达工程化大范围核酸酶的方法

在不同方面中，本发明提供了本文所述的工程化大范围核酸酶，其用于结合和切割细胞的肌营养不良蛋白基因(例如，人肌营养不良蛋白基因)内的识别序列。本发明提供了用于使用本文所述的工程化大范围核酸酶在细胞中修饰肌营养不良蛋白基因的方法，用于产生包含修饰的肌营养不良蛋白基因的遗传修饰的细胞的方法，以及在受试者的靶细胞中修饰肌营养不良蛋白基因的方法。在其他方面中，本发明提供了用于在受试者中治疗DMD的方法，通过向受试者施用本文所述的工程化大范围核酸酶，或者编码其的多核苷酸，在一些情况下作为药物组合物的一部分。

在每种情况下，假设将工程化的大范围核酸酶或编码其的多核苷酸引入细胞中，如能够表达肌营养不良蛋白的肌细胞或肌前体细胞。本文所述的工程化大范围核酸酶可以以蛋白的形式或优选地以编码工程化大范围核酸酶的多核苷酸的形式递送到细胞中。此类多核苷酸可以是例如DNA(例如，环状或线形质粒DNA、PCR产物或病毒基因组)或RNA(例如，mRNA)。

检测和表达

可以使用本领域的标准方法检测遗传修饰的细胞或受试者中的修饰的肌营养不良蛋白(即，缺乏外显子45-55的基因，或缺乏由外显子45-55编码的氨基酸的蛋白)的表达。例如，可以基于与肌营养不良蛋白基因表达相关的任何变量的水平来评估这种修饰的肌营养不蛋白的水平，例如，肌营养不良蛋白mRNA水平或肌营养不良蛋白水平。这种修饰的肌营养不良蛋白的水平或表达的增加可以通过与参考水平相比这些变量中的一个或多个的绝对或相对水平的增加来评估。这种修饰的肌营养不良蛋白水平可以在从受试者分离的生物样品中测量，如组织活检或体液，包括血液、血清、血浆、脑脊液或尿液。任选地，将这种修饰的肌营养不良蛋白的水平归一化至样品中的标准蛋白或物质。此外，这种修饰的肌营养不良蛋白水平可以根据本文的方法在治疗之前、期间或之后的任何时间进行评估。

在各种方面中，本文所述的方法可以将遗传修饰的细胞、靶细胞或受试者中经修饰的肌营养不良蛋白(即，缺乏由外显子45-55编码的氨基酸)的蛋白水平(例如，如在从受试者的细胞、组织、器官或生物样品中测量的)增加至参考水平(即，在野生型细胞或受试者中肌营养不良蛋白的蛋白水平)的至少1％、2％、3％、4％、5％、10％、15％、20％、25％、30％、40％、50％、60％、70％、80％、90％、95％、100％或更多。在一些实施方式中，本文的方法将此类修饰的肌营养不良蛋白的水平有效增加至肌营养不良蛋白参考水平(即，在野生型细胞或受试者中肌营养不良蛋白的蛋白水平)的约10％至约100％(例如，10％-20％、20％-30％、30％-40％、40％-50％、50％-60％、60％-70％、70％-80％、80％-90％、90％-100％或更多)。

将工程化大范围核酸酶引入细胞中

本文所述工程化大范围核酸酶蛋白或编码其的多核苷酸可通过本领域已知的多种不同机制被递送至细胞中以切割基因组DNA，其中包括下文进一步详述的那些。

本文所述工程化大范围核酸酶可以蛋白形式或优选地作为包含编码工程化大范围核酸酶的核酸序列的多核苷酸被递送至细胞中。此类多核苷酸可以是例如DNA(例如，环状或线性化质粒DNA、PCR产物或病毒基因组)或RNA(例如，mRNA)。

对于其中工程化大范围核酸酶编码序列以DNA形式递送的实施方式，其应与启动子可操作地连接以促进大范围核酸酶基因的转录。适用于本发明的哺乳动物启动子包括组成型启动子，例如巨细胞病毒早期(CMV)启动子(Thomsen等，(1984)Proc Natl Acad SciUSA.81:659-63)或SV40早期启动子(Benoist&Chambon(1981)Nature290:304-10)以及诱导型启动子，如四环素诱导型启动子(Dingermann等，(1992)Mol Cell Biol.12:4038-45)。本发明的工程化大范围核酸酶也可以与合成启动子可操作地连接。合成启动子可包括但不限于JeT启动子(WO 2002/012514)。

在特定实施方式中，编码本发明的工程化核酸酶的核酸序列与组织特异性启动子，如肌特异性启动子，可操作地连接。在一些特定实施方式中，启动子是能够在肌前体细胞(例如，卫星细胞或干细胞)中表达本文所述的工程化大范围核酸酶的启动子。示例性和非限制性肌启动子包括C5-12(Liu等，(2004)Hum Gene Ther.15:783-92)、肌特异性肌酸激酶(MCK)启动子(Yuasa等，(2002)Gene Ther.9:1576-88)或平滑肌22(SM22)启动子(Haase等，(2013)BMC Biotechnol.13:49-54)。在一些实施方式中，肌特异性启动子包含根据SEQID NO:169-181中任一项的序列。在一些实施方式中，肌特异性启动子包含与包含SEQ IDNO:169的C5-12启动子具有90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％同一性的序列。在一些实施方式中，肌特异性启动子包含与包含SEQ ID NO:170的小鼠MCK启动子具有90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％同一性的序列。在一些实施方式中，肌特异性启动子包含与包含SEQ ID NO:171的人MCK启动子具有90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％同一性的序列。在一些实施方式中，肌特异性启动子包含与包含SEQ ID NO:172的MCK增强子具有90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％同一性的序列。在一些实施方式中，肌特异性启动子包含与包含SEQ ID NO:173的修饰的MCK增强子具有90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％同一性的序列。在一些实施方式中，肌特异性启动子包含与包含SEQ ID NO:174的spc 5-12启动子具有90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％同一性的序列。在一些实施方式中，肌特异性启动子包含与包含SEQ ID NO:175的MHCK7启动子具有90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％同一性的序列。在一些实施方式中，肌特异性启动子包含与包含SEQ ID NO:176的CK8启动子具有90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％同一性的序列。在一些实施方式中，肌特异性启动子包含与包含SEQ ID NO:177的SK-CRM4启动子具有90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％同一性的序列。在一些实施方式中，肌特异性启动子包含与包含SEQ ID NO:178的SP-301启动子具有90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％同一性的序列。在一些实施方式中，肌特异性启动子包含与包含SEQ ID NO:179的SP-817启动子具有90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％同一性的序列。在一些实施方式中，肌特异性启动子包含与包含SEQ ID NO:180的SP-905启动子具有90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％同一性的序列。在一些实施方式中，肌特异性启动子包含与包含SEQ ID NO:181的肌杂交启动子具有90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％同一性的序列。

在一些实施方式中，其中单个多核苷酸包含两个单独的核酸序列，其分别编码本文所述的工程化大范围核酸酶，所述大范围核酸酶基因与两个单独的启动子可操作地连接。在替代实施方式中，两个大范围核酸酶基因与单个启动子可操作地连接，并且在一些实例中可以通过内部核糖体进入位点(IRES)或2A肽序列(Szymczak&Vignali(2005)ExpertOpin Biol Ther.5:627-38)分隔。这种2A肽序列可以包括例如T2A、P2A、E2A或F2A序列。

在特定实施方式中，将包含编码至少一种本文所述工程化大范围核酸酶的核酸序列的多核苷酸在重组DNA构建体或表达盒上递送。例如，重组DNA构建体可包含表达盒(即“盒”)，所述表达盒包含启动子和编码本文所述工程化大范围核酸酶的核酸序列。

在另一个特定实施方式中，使用单链DNA模板将包含编码本文所述工程化大范围核酸酶的核酸序列的多核苷酸引入细胞中。单链DNA还可以包含编码工程化核酸酶的序列上游和/或下游的5’和/或3’AAV反向末端重复序列(ITR)。单链DNA还可以包含编码工程化大范围核酸酶的序列上游和/或下游的5’和/或3’同源臂。

在另一个特定实施方式中，使用线性化DNA模板将包含编码本文所述工程化大范围核酸酶的核酸序列的多核苷酸引入细胞中。这样的线性化DNA模板可以通过本领域已知的方法产生。例如，编码核酸酶的质粒DNA可被一种或多种限制性酶消化，使得环状质粒DNA在被引入细胞之前被线性化。

在一些实施方式中，编码工程化大范围核酸酶的mRNA被递送至细胞，因为这样降低了编码工程化大范围核酸酶的基因整合至细胞基因组中的可能性。这样的mRNA可以使用本领域已知的方法例如体外转录产生。在一些实施方式中，mRNA是用7-甲基-鸟苷、抗反向帽类似物(ARCA)(US7,074,596)、类似物例如Cap 1类似物(Trilink,SanDiego,CA)5’加帽，或用牛痘病毒加帽酶或类似物酶促加帽。在一些实施方式中，mRNA可以是多腺苷酸化的。mRNA可以包含各种5’和3’非翻译序列元件以增强编码的工程化大范围核酸酶的表达和/或mRNA自身的稳定性。这些元件可以包括，例如，翻译后调控元件，例如土拨鼠肝炎病毒翻译后调控元件。mRNA可以包含核苷类似物或天然存在的核苷，例如假尿苷、5-甲基胞苷、N6-甲基腺苷、5-甲基尿苷或2-硫尿苷。其他核苷类似物包括例如US8,278,036中描述的那些。

在一些实施方式中，大范围核酸酶蛋白或编码大范围核酸酶的DNA/mRNA偶联至细胞穿透肽或靶向配体以促进细胞摄取。本领域内已知的细胞穿透肽的示例包括聚精氨酸(Jearawiriyapaisarn等，(2008)Mol Ther.16:1624-29)、来自HIV病毒的TAT肽(Hudecz等，(2005)Med.Res.Rev.25:679-736)、MPG(Simeoni等，(2003)Nucleic Acids Res.31:2717–24)、Pep-1(Deshayes等，(2004)Biochemistry43:7698–7706)和HSV-1VP-22(Deshayes等，(2005)Cell Mol Life Sci.62:1839-49)。在一个替代实施方式中，大范围核酸酶蛋白或编码大范围核酸酶的DNA/mRNA共价或非共价偶联至识别靶细胞上表达的特异性细胞表面受体的抗体，使得大范围核酸酶蛋白/DNA/mRNA与靶细胞结合并被靶细胞内化。或者，大范围核酸酶蛋白/DNA/mRNA可以共价或非共价偶联至这种细胞表面受体的天然配体(或天然配体的一部分)。(McCall等，(2014)Tissue Barriers.2(4):e944449；Dinda等，(2013)Curr.Pharm.Biotechnol.14:1264-74；Kang等，(2014)Curr.Pharm.Biotechnol.15:220-30；和Qian等，(2014)Expert Opin.Drug Metab Toxicol.10:1491-508)。

在一些实施方式中，大范围核酸酶蛋白或编码大范围核酸酶的DNA/mRNA被包封在生物可降解水凝胶内，用于注射或植入肝脏的期望区域内(例如，接近肝窦内皮细胞或造血内皮细胞，或分化为前述细胞的祖细胞)。水凝胶可以在不需要频繁注射的情况下向靶组织的期望区域提供治疗有效负载的持续且可调的释放，并且刺激响应材料(例如，温度和pH响应水凝胶)可以被设计为响应环境或外部施加的提示而释放有效负载(Derwent等，(2008)Trans Am.Ophthalmol.Soc.106:206-14)。

在一些实施方式中，使用本领域已知的方法将大范围核酸酶蛋白或编码大范围核酸酶的DNA/mRNA共价地或优选非共价地偶联至纳米颗粒或包封在这种纳米颗粒内(Sharma等，(2014)Biomed.Res.Int.2014:156010)。纳米颗粒是纳米级递送系统，其长度尺度<1μm，优选<100nm。可以使用由金属、脂质、聚合物或生物大分子组成的核来设计这种纳米颗粒，并且大范围核酸酶蛋白、mRNA或DNA的多个拷贝可以附着于纳米颗粒核或用纳米颗粒核包封。这增加了递送至每个细胞的蛋白质/mRNA/DNA的拷贝数，并因此增加了每个大范围核酸酶的细胞内表达，以最大化靶识别序列将被切割的可能性。这种纳米颗粒的表面可以进一步用聚合物或脂质(例如，壳聚糖、阳离子聚合物或阳离子脂质)修饰，以形成其表面赋予另外的功能的核-壳纳米颗粒，从而增强细胞递送和有效负载的摄取(Jian等，(2012)Biomaterials.33:7621-30)。纳米颗粒可另外有利地偶联至靶向分子以将纳米颗粒引导至合适的细胞类型和/或增加细胞摄取的可能性。这种靶向分子的示例包括对于细胞表面受体和细胞表面受体的天然配体(或天然配体的部分)特异性的抗体。

在一些实施方式中，大范围核酸酶蛋白或编码大范围核酸酶的DNA/mRNA被包封在脂质体内或使用阳离子脂质复合(参见，例如，LIPOFECTAMINE^TM,Life TechnologiesCorp.,Carlsbad,CA；Zuris等，(2015)Nat.Biotechnol.33:73-80；Mishra等，(2011)J.DrugDeliv.2011:863734)。脂质体和阳离子脂质制剂可以保护有效载荷以防其降解，增强靶位点处的累积和保留，并通过与靶细胞的细胞膜融合和/或破坏靶细胞的细胞膜促进细胞摄取和递送效率。

在一些实施方式中，大范围核酸酶蛋白或编码大范围核酸酶的DNA/mRNA被包封在聚合物支架(例如，PLGA)内或使用阳离子聚合物(例如，PEI、PLL)复合(Tamboli等，(2011)Ther Deliv.2:523-36)。可以设计聚合物载体以通过控制聚合物侵蚀和药物扩散提供可调的药物释放速率，并且高的药物包封效率可以提供对治疗有效负载的保护，直到细胞内递送至期望的靶细胞群体。

在一些实施方式中，大范围核酸酶蛋白或编码工程化大范围核酸酶的DNA/mRNA与自组装成胶束的两亲性分子组合(Tong等，(2007)J.Gene Med.9:956-66)。聚合物胶束可以包括由亲水性聚合物(例如，聚乙二醇)形成的胶束壳，其可以防止聚集、掩蔽电荷相互作用和减少非特异性相互作用。

在一些实施方式中，大范围核酸酶蛋白或编码大范围核酸酶的DNA/mRNA被配制成乳液或纳米乳液(即，具有<1nm的平均粒径)以用于施用和/或递送至靶细胞。术语“乳液”是指(但不限于)任何水包油、油包水、水包油包水或油包水包油分散液或液滴，其中包括当水不混溶相与水相混合时，可作为疏水力的结果形成的脂质结构，所述疏水力驱动非极性残基(例如，长烃链)远离水和极性头基团朝向水。这些其他脂质结构包括但不限于单层的、薄层的(paucilamellar)和多层的脂质囊泡、胶束和层状相。乳液由水相和亲脂相(通常包含油和有机溶剂)组成。乳液还经常包含一种或多种表面活性剂。纳米乳液制剂是众所周知的，例如，如美国专利号6,015,832、6,506,803、6,635,676、6,559,189和7,767,216中所描述的，其每一个通过引用整体并入本文。

在一些实施方式中，大范围核酸酶蛋白或编码大范围核酸酶的DNA/mRNA与多官能聚合物缀合物、DNA树状物和聚合树状物共价附接或非共价缔合(Mastorakos等，(2015)Nanoscale.7:3845-56；Cheng等，(2008)J.Pharm Sci.97:123-43)。树状物的产生可以控制有效负载容量和大小，并且可以提供高的药物有效负载能力。此外，可以利用多个表面基团的展示来改善稳定性、减少非特异性相互作用以及增强细胞特异性靶向和药物释放。

在一些实施方式中，使用重组病毒(即，重组病毒载体)将包含编码本文所述工程化大范围核酸酶的核酸序列的多核苷酸引入细胞中。这种重组病毒是本领域已知的，且包括重组逆转录病毒、重组慢病毒、重组腺病毒和重组AAV(综述于Vannucci等，(2013)NewMicrobiol.36:1-22)。可用于本发明的重组AAV可具有允许将病毒转导入靶细胞类型并在靶细胞中表达大范围核酸酶基因的任何血清型。例如，在一些实施方式中，重组AAV具有AAV1、AAV2、AAV5、AAV6、AAV7、AAV8、AAV9、AAV12或AAVrh.74的血清型(即，衣壳)。本领域内已知不同AAV倾向定位于不同的组织(Wang等，(2014)Expert Opin Drug Deliv 11:345-34.)。与AAV8密切相关的AAVrh.74血清型被进一步描述为靶向包括骨骼肌和心肌组织在内的肌组织(Mendell等，(2020)JAMA Neurol.77:1122-31)。因此，在一些实施方式中，AAV血清型是AAV1。在一些实施方式中，AAV血清型是AAV2。在一些实施方式中，AAV血清型是AAV5。在一些实施方式中，AAV血清型是AAV6。在一些实施方式中，AAV血清型是AAV7。在一些实施方式中，AAV血清型是AAV8。在一些实施方式中，AAV血清型是AAV9。在一些实施方式中，AAV血清型是AAV12。在一些实施方式中，AAV血清型是AAVrh.74。AAV也可以是自身互补的，使得其不需要宿主细胞中的第二链DNA合成(McCarty等，(2001)Gene Ther.8:1248-54)。通过重组AAV递送的多核苷酸可以包括左(5’)和右(3’)反向末端重复序列作为病毒基因组的一部分。在一些实施方式中，将重组病毒直接注射至靶组织。在替代实施方式中，重组病毒通过循环系统被全身性递送。

在一个实施方式中，用于大范围核酸酶基因递送的重组病毒是自限性重组病毒。由于病毒基因组内存在工程化大范围核酸酶的识别序列，自限性病毒在细胞或生物体中可具有有限的持续时间。因此，自限性重组病毒可被工程化以提供启动子、本文所述工程化大范围核酸酶和ITR内大范围核酸酶识别位点的编码序列。自限性重组病毒将大范围核酸酶基因递送至细胞、组织或生物体，使得大范围核酸酶被表达并且能够在基因组内的内源识别序列处切割细胞的基因组。递送的大范围核酸酶还将在自限性重组病毒基因组中发现其靶位点，并在该靶位点处切割重组病毒基因组。一旦切割，病毒基因组的5’和3’端将暴露并被核酸外切酶降解，从而杀死病毒并停止大范围核酸酶的产生。

如果包含编码本文所述工程化大范围核酸酶的核酸序列的多核苷酸通过重组病毒(例如，AAV)被递送至细胞，则编码工程化大范围核酸酶的核酸序列可与启动子可操作地连接。在一些实施方式中，这可以是病毒启动子，例如来自重组病毒的内源启动子(例如，慢病毒的LTR)或众所周知的巨细胞病毒或SV40病毒早期启动子。在特定实施方式中，编码工程化巨核酸酶的核酸序列可操作地连接到优先驱动靶细胞(例如，肌细胞或肌前体细胞)中的基因表达的启动子。肌特异性组织启动子的实例包括但不限于此前描述的那些肌特异性启动子，包括C5-12、肌特异性肌酸激酶(MCK)启动子或平滑肌2222(SM22)启动子。在一些实施方式中，肌特异性启动子包含根据SEQ ID NO:169-181中任一项的序列。在一些实施方式中，肌特异性启动子包含与包含SEQ ID NO:169的C5-12启动子具有90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％同一性的序列。在一些实施方式中，肌特异性启动子包含与包含SEQ ID NO:170的小鼠MCK启动子具有90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％同一性的序列。在一些实施方式中，肌特异性启动子包含与包含SEQ ID NO:171的人MCK启动子具有90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％同一性的序列。在一些实施方式中，肌特异性启动子包含与包含SEQ IDNO:172的MCK增强子具有90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％同一性的序列。在一些实施方式中，肌特异性启动子包含与包含SEQ ID NO:173的修饰的MCK增强子具有90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％同一性的序列。在一些实施方式中，肌特异性启动子包含与包含SEQ ID NO:174的spc 5-12启动子具有90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％同一性的序列。在一些实施方式中，肌特异性启动子包含与包含SEQ ID NO:175的MHCK7启动子具有90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％同一性的序列。在一些实施方式中，肌特异性启动子包含与包含SEQ ID NO:176的CK8启动子具有90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％同一性的序列。在一些实施方式中，肌特异性启动子包含与包含SEQ ID NO:177的SK-CRM4启动子具有90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％同一性的序列。在一些实施方式中，肌特异性启动子包含与包含SEQ ID NO:178的SP-301启动子具有90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％同一性的序列。在一些实施方式中，肌特异性启动子包含与包含SEQ ID NO:179的SP-817启动子具有90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％同一性的序列。在一些实施方式中，肌特异性启动子包含与包含SEQ ID NO:180的SP-905启动子具有90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％同一性的序列。在一些实施方式中，肌特异性启动子包含与包含SEQ ID NO:181的肌杂交启动子具有90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％同一性的序列。在一些实施方式中，其中单个多核苷酸包含两个单独的核酸序列，其分别编码本文所述的工程化大范围核酸酶，所述大范围核酸酶基因与两个单独的启动子可操作地连接。在替代实施方式中，两个大范围核酸酶基因与单个启动子可操作地连接，并且在一些实例中可以通过内部核糖体进入位点(IRES)或2A肽序列(Szymczak&Vignali(2005)Expert Opin Biol Ther.5:627-38)分隔。这种2A肽序列可以包括例如T2A、P2A、E2A或F2A序列。

在一些实施方式中，所述方法包括将本文所述的工程化大范围核酸酶或编码其的多核苷酸于第二多核苷酸一起递送至细胞，所述第二多核苷酸包含编码目标序列的外源性核酸序列，其中工程化大范围核酸酶在细胞中表达，识别和切割细胞的肌营养不良基因内的本文所述的识别序列(例如，SEQ ID NO:6、SEQ ID NO:10或SEQ ID NO:12)，并且产生切割位点，其中外源性核酸和目标序列在切割位点插入基因组(例如，通过同源重组)。在一些此类实例中，多核苷酸可以包含与位于大范围核酸酶切割位点侧翼的核酸序列同源的序列，以促进外源性核酸和目标序列同源重组到基因组中。

可以将包含外源性核酸的这种多核苷酸引通过此前讨论的任何方法引入受试者的细胞中和/或递送至靶细胞中。在特定实施方式中，通过重组病毒(即，病毒载体)的方式引入包含外源性核酸分子的这种多核苷酸，如重组慢病毒、重组逆转录病毒、重组腺病毒、或重组AAV。可用于引入包含外源性核酸分子的多核苷酸的重组AAV可以具有允许将病毒转导到细胞中并将外源性核酸分子序列插入细胞基因组的任何血清型(即，衣壳)。在一些实施方式中，重组AAV具有血清型AAV1、AAV2、AAV5、AAV6、AAV7、AAV8、AAV9、AAV12或AAVrh.74。在一些实施方式中，AAV血清型是AAV1。在一些实施方式中，AAV血清型是AAV2。在一些实施方式中，AAV血清型是AAV5。在一些实施方式中，AAV血清型是AAV6。在一些实施方式中，AAV血清型是AAV7。在一些实施方式中，AAV血清型是AAV8。在一些实施方式中，AAV血清型是AAV9。在一些实施方式中，AAV血清型是AAV12。在一些实施方式中，AAV血清型是AAVrh.74。AAV也可以是自身互补的，使得其不需要宿主细胞中的第二链DNA合成。使用重组AAV引入的外源性核酸分子可以在病毒基因组中侧翼为5’(左)和3’(右)倒置的末端重复序列。

在另一个特定实施方式中，可以使用单链DNA模板将外源性核酸分子引入细胞中。单链DNA可以包含外源性核酸分子和，在特定实施方式中，可以包含5’和3’同源臂，以通过同源重组促进核酸序列插入核酸酶切割位点。单链DNA还可以包含5’同源臂5’上游的5’AAVITR序列，和3’同源臂3’下游的3’AAV ITR序列。

在另一个特定实施方式中，编码本发明核酸酶和/或本发明外源性核酸分子的基因可以通过用线性化DNA模板转染而引入细胞中。编码工程化核酸酶和/或外源性核酸分子的质粒DNA可以，例如，被一种或多种限制性内切酶消化，使得环状质粒DNA在转染到细胞中之前被线性化。

当递送到细胞中时，本发明的外源性核酸可以可操作地连接到适合于在细胞中表达编码多肽的任何启动子，包括此前讨论的那些哺乳动物启动子和诱导型启动子。还可以将本发明的外源性核酸与合成的启动子可操作地连接。合成的启动子可以包括但不限于JeT启动子(WO 2002/012514)。在特定实施方式中，可以将编码如本文所公开的工程化大范围核酸酶的核酸序列与本文讨论的肌特异性启动子可操作地连接。

施用

靶组织或靶细胞包括但不限于肌细胞，如骨骼肌细胞、心肌细胞或膈肌细胞。在一些实施方式中，靶细胞是肌祖细胞如骨骼肌祖细胞或心肌祖细胞。这种肌祖细胞已经在本领域中进行了描述，并且可以存在于受试者中，或者衍生自另一干细胞群，例如诱导多能干细胞或胚胎干细胞(Tey等，(2019)Front.Cell Dev.Biol.7:284和Amini等，(2017)J.Cardiovasc.Thorac.Res.9:127-32)。

在一些实施方式中，将本文所述的工程化大范围核酸酶或编码其的多核苷酸在体外递送至细胞。在一些实施方式中，将本文所述的工程化大范围核酸酶或编码其的多核苷酸在体内递送至受试者的细胞中。如本文所讨论的，本发明的大范围核酸酶可以作为纯蛋白或作为多核苷酸(例如，RNA或DNA)递送，所述多核苷酸包含编码大范围核酸酶的核酸序列。在一些实施方式中，大范围核酸酶蛋白或编码大范围核酸酶的多核苷酸通过直接注射至靶组织向靶细胞(例如，肌细胞或肌祖细胞)供应。或者，大范围核酸酶蛋白或编码大范围核酸酶的多核苷酸可以通过循环系统全身递送。

在所述方法的各种实施方式中，本文所述的组合物，如本文所述的工程化大范围核酸酶，编码其的多核苷酸，包含此类多核苷酸的重组病毒或包含此类多核苷酸的脂质颗粒可以通过本领域公知的任何施用途径施用。此类施用途径可以包括例如静脉内、肌内、腹膜内、皮下、肝内、经粘膜、经皮、动脉内和舌下。在一些实施方式中，工程化大范围核酸酶蛋白、编码其的多核苷酸、包含此类多核苷酸的重组病毒或包含此类多核苷酸的脂质纳米颗粒通过直接注射至靶组织(例如，肌组织)向靶细胞(例如，肌细胞或肌前体细胞)供应。根据需要，治疗医师可以容易地确定其他合适的施用途径。

在一些实施方式中，治疗有效量的本文所述工程化大范围核酸酶或编码其的多核苷酸被施用于有此需要的受试者以用于治疗疾病。在适当的情况下，基于施用医师的判断，可以在治疗过程中调整工程化大范围核酸酶或编码其的多核苷酸的剂量或给药频率。除其他因素外，适当的剂量将取决于所选择的任何AAV的详细情况(例如，血清型等)、所选择的任何脂质纳米颗粒、施用途径、所治疗的受试者(即受试者的年龄、体重、性别和一般情况)和施用模式。因此，适当的剂量可以随患者而变化。适当的有效量可由本领域技术人员或治疗医师可容易地确定。剂量治疗可以是单剂量方案，或者如果需要多个剂量，可以是多剂量方案。此外，受试者可以被适当地施用多次给药。本领域技术人员可以容易地确定合适的给药次数。剂量可能需要调整以考虑替代施用途径或平衡治疗益处与任何副作用。

在一些实施方式中，所述方法还包括施用多核苷酸，其包含编码分泌受损肝毒素或编码tPA的核酸序列，所述tPA刺激肝细胞再生而不起到肝毒素的作用。

在一些实施方式中，向受试者施用药物组合物，其包含含有编码本文所述的工程化大范围核酸酶的核酸序列的多核苷酸，其中以约1x10¹⁰ gc/kg至约1x10¹⁴ gc/kg(例如，约1x10¹⁰ gc/kg、约1x10¹¹ gc/kg、约1x10¹² gc/kg、约1x10¹³ gc/kg或约1x10¹⁴ gc/kg)的剂量施用编码核酸序列。在一些实施方式中，向受试者施用药物组合物，其包含含有编码本文所述的工程化大范围核酸酶的核酸序列的多核苷酸，其中以约1x10¹⁰ gc/kg、约1x10¹¹ gc/kg、约1x10¹² gc/kg、约1x10¹³ gc/kg或约1x10¹⁴ gc/kg的剂量施用编码核酸序列。在一些实施方式中，向受试者施用药物组合物，其包含含有编码本文所述的工程化大范围核酸酶的核酸序列的多核苷酸，其中以约1x10¹⁰ gc/kg至约1x10¹¹ gc/kg、约1x10¹¹ gc/kg至约1x10¹²gc/kg、约1x10¹² gc/kg至约1x10¹³ gc/kg或约1x10¹³ gc/kg至约1x1014 gc/kg的剂量施用编码核酸序列。应当理解的是，这些剂量可能涉及单一多核苷酸的施用，所述单一多核苷酸包含编码本文所述的单一工程化大范围核酸酶的单一核酸序列，或者替代地，可能涉及单一多核苷酸的施用，所述单一多核苷酸包含编码本文所述的第一工程化大范围核酸酶的第一核酸序列和编码本文所述的第二工程化大范围核酸酶的第二核酸序列，其中两个编码核酸序列各自以所示剂量施用。

在一些实施方式中，受试者被施用包含mRNA的脂质纳米颗粒制剂，所述mRNA包含编码本文所述工程化大范围核酸酶的核酸序列，其中所述mRNA的剂量为约0.1mg/kg至约3mg/kg。在一些实施方式中，受试者被施用包含mRNA的脂质纳米颗粒制剂，所述mRNA包含编码本文所述工程化大范围核酸酶的核酸序列，其中mRNA的剂量是约0.1mg/kg、约0.25mg/kg、约0.5mg/kg、约0.75mg/kg、约1.0mg/kg、约1.5mg/kg、约2.0mg/kg、约2.5mg/kg或约3.0mg/kg。在一些实施方式中，受试者被施用包含mRNA的脂质纳米颗粒制剂，所述mRNA包含编码本文所述工程化大范围核酸酶的核酸序列，其中mRNA的剂量是约0.1mg/kg至约0.25mg/kg、约0.25mg/kg至约0.5mg/kg、约0.5mg/kg至约0.75mg/kg、约0.75mg/kg至约1.0mg/kg、约1.0mg/kg至约1.5mg/kg、约1.5mg/kg至约2.0mg/kg、约2.0mg/kg至约2.5mg/kg或约2.5mg/kg至约3.0mg/kg。

2.4药物组合物

在一些实施方式中，本发明提供了一种药物组合物，其包含药学上可接受的载体和本文所述工程化的大范围核酸酶，或药学上可接受的载体和本文所述多核苷酸，所述多核苷酸包含编码本文所述工程化大范围核酸酶的核酸序列。这样的多核苷酸可以是例如本文所述mRNA或DNA。在一些这样的实例中，药物组合物中的多核苷酸可以被脂质纳米颗粒包含或可以被重组病毒(例如，重组AAV)包含。在其他实施方式中，本公开提供了一种药物组合物，其包含药学上可接受的载体和本发明的遗传修饰的细胞，可以将其递送至靶组织，在靶组织中所述细胞表达如本文所公开的工程化大范围核酸酶。将此类药物组合物配制为例如用于全身施用或向靶组织施用。

在本发明的各种实施方式中，药物组合物可以用于治疗DMD，将DMD疾病表型转化为贝克型肌营养不良症表型和/或在受试者中减轻于DMD相关的症状。

此类药物组合物可根据已知技术制备。参见，例如Remington,the science andpractice of Pharmacy(第21版，Philadelphia,Lippincott,Williams&Wilkins,2005)。在根据本发明的药物制剂的制备中，本文所述工程化大范围核酸酶、编码其的多核苷酸或表达其的细胞通常与药学上可接受的载体混合，并将所得的组合物施用于受试者。载体在与制剂中的任何其他成分相容的意义上必须是可接受的，并且必须对受试者无害。载体可以是固体或液体或两者，并且可以与化合物一起配制为单位剂量制剂。

在一些实施方式中，本发明的药物组合物可以进一步包含一种或多种用于治疗受试者的疾病的另外的药剂或生物分子。同样，另外的药剂和/或生物分子可以作为单独的组合物共同施用。

本文所述的药物组合物可以包含治疗有效量的本文所公开的任何工程化大范围核酸酶，或编码本文所述的任何工程化大范围核酸酶的本文所述的任何多核苷酸。例如，在一些实施方式中，药物组合物可以以本文所述的任何剂量(例如，gc/kg的编码核酸序列或mg/kg的mRNA)包含本文所述的多核苷酸。

在本发明的特定实施方式中，药物组合物可以包含本文所述的一种或多种重组病毒(例如，重组AAV)，其包含一种或多种本文所述的多核苷酸(即，在病毒基因组内包装)。在特定实施方式中，药物组合物包含本文所述的两种或更多种重组病毒(例如，重组AAV)，其分别包含含有编码本文所述的不同工程化大范围核酸酶的核酸序列的多核苷酸。例如，第一重组病毒(例如，重组AAV)可以包含第一多核苷酸，其包含编码对DMD 19-20识别序列具有特异性的本文所述的第一工程化大范围核酸酶的第一核酸序列，和第二重组病毒(例如，重组AAV)，其包含第二多核苷酸，所述第二多核苷酸包含编码对DMD 35-36识别序列或DMD37-38识别序列具有特异性的本文所述的第二工程化大范围核酸酶的第二核酸序列。在同一细胞(例如，肌细胞)中表达这样一对工程化大范围核酸酶将使得能够从根据本发明的肌营养不良蛋白基因中切除外显子45-55。

在其他特定实施方式中，药物组合物可以包含本文所述的重组病毒(例如，重组AAV)，其包含多核苷酸(例如，在病毒基因组内包装)，所述多核苷酸包含编码本文所述的两个单独的工程化大范围核酸酶的两个核酸序列。例如，重组病毒(例如，重组AAV)可以包含多核苷酸，所述多核苷酸包含编码对DMD 19-20识别序列具有特异性的本文所述的第一工程化大范围核酸酶的第一核酸序列，和编码对DMD 35-36识别序列或DMD 37-38识别序列具有特异性的本文所述的第二工程化大范围核酸酶的第二核酸序列。表达这样一对工程化大范围核酸酶将使得能够从根据本发明的肌营养不良蛋白基因中切除外显子45-55。

在本发明的特定实施方式中，药物组合物可以包含包封在脂质纳米颗粒中的本文所述的一种或多种多核苷酸(例如，mRNA)。在特定实施方式中，脂质纳米颗粒可以包含本文所述的两种或多种多核苷酸(例如，mRNA)，其分别包含编码本文所述的不同工程化大范围核酸酶的核酸序列。例如，在脂质纳米颗粒中的第一多核苷酸(例如，mRNA)可以编码对DMD19-20识别序列具有特异性的本文所述的第一工程化大范围核酸酶，和在脂质纳米颗粒中的第二多核苷酸(例如，mRNA)可以编码对DMD 35-36识别序列或DMD 37-38识别序列具有特异性的本文所述的第二工程化大范围核酸酶。在同一细胞(例如，肌细胞)中表达这样一对工程化大范围核酸酶将使得能够从根据本发明的肌营养不良蛋白基因中切除外显子45-55。或者，药物组合物可以包含两个单独的脂质纳米颗粒群，其分别包含本文所述的不同多核苷酸(例如，mRNA)，其中脂质纳米颗粒的第一群包含编码对DMD 35-36识别序列或DMD37-38识别序列具有特异性的第一工程化大范围核酸酶的本文所述的第一多核苷酸(例如，mRNA)，和脂质纳米颗粒的第二群包含编码对DMD 35-36识别序列或DMD 37-38识别序列具有特异性的第二工程化大范围核酸酶的本文所述的第二多核苷酸(例如，mRNA)。

在其他特定实施方式中，脂质纳米颗粒可以包含本文所述的一种多核苷酸(例如，mRNA)，其包含编码本文所述的两个独立工程化大范围核酸酶的两个核酸序列。例如，脂质纳米颗粒可以包含多核苷酸(例如，mRNA)，其包含编码对DMD 19-20识别序列具有特异性的本文所述的第一工程化大范围核酸酶的第一核酸序列，和编码对DMD 35-36识别序列或DMD37-38识别序列具有特异性本文所述的第二工程化大范围核酸酶的第二核酸序列。在同一细胞(例如，肌细胞)中表达这样一对工程化大范围核酸酶将使得能够从根据本发明的肌营养不良蛋白基因中切除外显子45-55。

预期用于本发明的一些脂质纳米颗粒包含至少一种阳离子脂质、至少一种非阳离子脂质和至少一种缀合脂质。在更具体的示例中，脂质纳米颗粒可包含约50mol％至约85mol％的阳离子脂质、约13mol％至约49.5mol％的非阳离子脂质和约0.5mol％至约10mol％的脂质缀合物，并且以具有非层状(即，非双层)形态的方式产生。在其他具体示例中，脂质纳米颗粒可包含约40mol％至约85mol％的阳离子脂质、约13mol％至约49.5mol％的非阳离子脂质和约0.5mol％至约10mol％的脂质缀合物，并且以具有非层状(即，非双层)形态的方式产生。

阳离子脂质可以包括，例如，以下中的一种或多种：棕榈酰基-油酰基-去甲精氨酸(PONA)、MPDACA、GUADACA、((6Z,9Z,28Z,31Z)-三十七烷-6,9,28,31-四烯-19-基4-(二甲基氨基)丁酸酯)(MC3)、LenMC3、CP-LenMC3、γ-LenMC3、CP-γ-LenMC3、MC3MC、MC2MC、MC3醚、MC4醚、MC3酰胺、Pan-MC3、Pan-MC4和Pan MC5、1,2-二亚油酰氧基-N,N-二甲基氨基丙烷(DLinDMA)、1,2-二亚油烯基氧基-N,N-二甲基氨基丙烷(DLenDMA)、2,2-二亚油基-4-(2-二甲基氨基乙基)-[1,3]-二氧戊环(DLin-K-C2-DMA；“XTC2”)、2,2-二亚油基-4-(3-二甲基氨基丙基)-[1,3]-二氧戊环(DLin-K-C3-DMA)、2,2-二亚油基-4-(4-二甲基氨基丁基)-[1,3]-二氧戊环(DLin-K-C4-DMA)、2,2-二亚油基-5-二甲基氨基甲基-[1,3]-二噁烷(DLin-K6-DMA)、2,2-二亚油基-4-N-甲基哌嗪并-[1,3]-二氧戊环(DLin-K-MPZ)、2,2-二亚油基-4-二甲基氨基甲基-[1,3]-二氧戊环(DLin-K-DMA)、1,2-二亚油基氨基甲酰氧基-3-二甲基氨基丙烷(DLin-C-DAP)、1,2-二亚油酰氧基-3-(二甲基氨基)乙酰氧基丙烷(DLin-DAC)、1,2-二亚油酰氧基-3-吗啉代丙烷(DLin-MA)、1,2-二亚油酰基-3-二甲基氨基丙烷(DLinDAP)、1,2-二亚油烯基硫代-3-二甲基氨基丙烷(DLin-S-DMA)、1-亚油酰基-2-亚油酰氧基-3-二甲基氨基丙烷(DLin-2-DMAP)、1,2-二亚油酰氧基-3-三甲基氨基丙烷盐酸盐(DLin-TMA.Cl)、1,2-二亚油酰基-3-三甲基氨基丙烷盐酸盐(DLin-TAP.Cl)、1,2-二亚油酰氧基-3-(N-甲基哌嗪基)丙烷(DLin-MPZ)、3-(N,N-二亚油基氨基)-1,2-丙二醇(DLinAP)、3-(N,N-二油烯基氨基)-1,2-丙二醇(DOAP)、1,2-二亚油基氧代-3-(2-N,N-二甲基氨基)乙氧基丙烷(DLin-EG-DMA)、N,N-二油基-N,N-二甲基氯化铵(DODAC)、1,2-二油烯基氧基-N,N-二甲基氨基丙烷(DODMA)、1,2-二硬脂基氧基-N,N-二甲基氨基丙烷(DSDMA)、N-(1-(2,3-二油烯基氧基)丙基)-N,N,N-三甲基氯化铵(DOTMA)、N,N-二硬脂基-N,N-二甲基溴化铵(DDAB)、N-(1-(2,3-二油酰氧基)丙基)-N,N,N-三甲基氯化铵(DOTAP)、3-(N-(N’,N’-二甲基氨基乙烷)-氨基甲酰基)胆固醇(DC-Chol)、N-(1,2-二肉豆蔻酰氧基丙-3-基)-N,N-二甲基-N-羟乙基溴化铵(DMRIE)、2,3-二油烯基氧基-N-[2(精胺-甲酰胺基)乙基]-N,N-二甲基-1-丙胺三氟乙酸盐(DOSPA)、二-十八烷基酰胺基甘氨酰基精胺(DOGS)、3-二甲氨基-2-(胆甾-5-烯-3-β-氧基丁-4-氧基)-1-(顺,顺-9,12-十八碳二烯氧基)丙烷(CLinDMA)、2-[5’-(胆甾-5-烯-3-β-氧基)-3’-氧杂戊氧基]-3-二甲基-1-(顺,顺-9’,1-2’-十八碳二烯氧基)丙烷(CpLinDMA)、N,N-二甲基-3,4-二油酰氧基苄胺(DMOBA)、1,2-N,N’-二油烯基氨基甲酰基-3-二甲基氨基丙烷(DOcarbDAP)、1,2-N,N’-二亚油基氨基甲酰基-3-二甲基氨基丙烷(DLincarbDAP)或其混合物。阳离子脂质也可以是DLinDMA、DLin-K-C2-DMA(“XTC2”)、MC3、LenMC3、CP-LenMC3、γ-LenMC3，CP-γ-LenMC3、MC3MC、MC2MC、MC3醚、MC4醚、MC3酰胺、Pan-MC3、Pan-MC4、PanMC5或其混合物。

在各种实施方式中，阳离子脂质可占颗粒中存在的总脂质的约50mol％至约90mol％、约50mol％至约85mol％、约50mol％至约80mol％、约50mol％至约75mol％、约50mol％至约70mol％、约50mol％至约65mol％、或约50mol％至约60mol％。

在其他实施方式中，阳离子脂质可占颗粒中存在的总脂质的约40mol％至约90mol％、约40mol％至约85mol％、约40mol％至约80mol％、约40mol％至约75mol％、约40mol％至约70mol％、约40mol％至约65mol％、或约40mol％至约60mol％。

非阳离子脂质可以包含例如一种或多种阴离子脂质和/或中性脂质。在特定实施方式中，非阳离子脂质包含以下中性脂质组分之一：(1)胆固醇或其衍生物；(2)磷脂；或(3)磷脂和胆固醇或其衍生物的混合物。胆固醇衍生物的示例包括，但不限于，胆甾烷醇、胆甾烷酮、胆甾烯酮、粪甾醇、胆固醇基-2’-羟乙基醚、胆固醇基-4’-羟基丁基醚及其混合物。磷脂可以是中性脂质，包括但不限于，二棕榈酰磷脂酰胆碱(DPPC)、二硬脂酰磷脂酰胆碱(DSPC)、二油酰磷脂酰乙醇胺(DOPE)、棕榈酰油酰基-磷脂酰胆碱(POPC)、棕榈酰油酰基-磷脂酰乙醇胺(POPE)、棕榈酰油酰基-磷脂酰甘油(POPG)、二棕榈酰基-磷脂酰乙醇胺(DPPE)、二肉豆蔻酰基-磷脂酰乙醇胺(DMPE)、二硬脂酰基-磷脂酰乙醇胺(DSPE)、单甲基-磷脂酰乙醇胺、二甲基-磷脂酰乙醇胺、二反油酰基-磷脂酰乙醇胺(DEPE)、硬脂酰油酰基-磷脂酰乙醇胺(SOPE)、卵磷脂酰胆碱(EPC)及其混合物。在某些实施方式中，磷脂是DPPC、DSPC或其混合物。

在一些实施方式中，非阳离子脂质(例如，一种或多种磷脂和/或胆固醇)可占颗粒中存在的总脂质的约10mol％至约60mol％、约15mol％至约60mol％、约20mol％至约60mol％、约25mol％至约60mol％、约30mol％至约60mol％、约10mol％至约55mol％、约15mol％至约55mol％、约20mol％至约55mol％、约25mol％至约55mol％、约30mol％至约55mol％、约13mol％至约50mol％、约15mol％至约50mol％或约20mol％至约50mol％。当非阳离子脂质是磷脂和胆固醇或胆固醇衍生物的混合物时，混合物可占颗粒中存在的总脂质的至多约40、50或60mol％。

抑制颗粒聚集的缀合脂质可以包含例如以下的一种或多种：聚乙二醇(PEG)-脂质缀合物、聚酰胺(ATTA)-脂质缀合物、阳离子聚合物-脂质缀合物(CPL)或其混合物。在一个具体的实施方式中，核酸-脂质颗粒包含PEG-脂质缀合物或ATTA-脂质缀合物。在某些实施方式中，PEG-脂质缀合物或ATTA-脂质缀合物与CPL一起使用。抑制颗粒聚集的缀合脂质可包含PEG-脂质，其中包括例如，PEG-二酰基甘油(DAG)、PEG二烷氧基丙基(DAA)、PEG-磷脂、PEG-神经酰胺(Cer)或其混合物。PEG-DAA缀合物可以是PEG-二月桂酰氧基丙基(C12)、PEG-二肉豆蔻酰氧基丙基(C14)、PEG-二棕榈酰氧基丙基(C16)、PEG-二硬脂酰氧基丙基(C18)或其混合物。

适用于本发明的其他PEG-脂质缀合物包括但不限于mPEG2000-1,2-二-O-烷基-sn3-氨甲酰甘油酯(PEG-C-DOMG)。PEG-C-DOMG的合成描述于WO 2009/086558中。适用于本发明的另外的PEG-脂质缀合物包括但不限于1-[8’-(1,2-二肉豆蔻酰基-3-丙氧基)-甲酰氨基-3’,6’-二氧杂辛烷基]氨基甲酰基-ω-甲基-聚(乙二醇)(2KPEG-DMG)。2KPEG-DMG的合成描述于美国专利号7,404,969中。

在一些情况下，抑制颗粒聚集的缀合脂质(例如，PEG-脂质缀合物)可占颗粒中存在的总脂质的约0.1mol％至约2mol％、约0.5mol％至约2mol％、约1mol％至约2mol％、约0.6mol％至约1.9mol％、约0.7mol％至约1.8mol％、约0.8mol％至约1.7mol％、约1mol％至约1.8mol％、约1.2mol％至约1.8mol％、约1.2mol％至约1.7mol％、约1.3mol％至约1.6mol％、约1.4mol％至约1.5mol％或约1、1.1、1.2、1.3、1.4、1.5、1.6、1.7、1.8、1.9或2mol％(或其任何分数或其中的范围)。通常，在这样的情况中，PEG部分具有约2,000道尔顿的平均分子量。在其他情况中，抑制颗粒聚集的缀合脂质(例如，PEG-脂质缀合物)可以占颗粒中存在的总脂质的约5.0mol％至约10mol％、约5mol％至约9mol％、约5mol％至约8mol％、约6mol％至约9mol％、约6mol％至约8mol％、或约5mol％、6mol％、7mol％、8mol％、9mol％或10mol％(或其任何分数或其中的范围)。通常，在这样的情况中，PEG部分具有约750道尔顿的平均分子量。

在其他实施方式中，组合物可包含两性脂质体，其包含至少一种正电荷载体和至少一种负电荷载体，所述负电荷载体不同于正电荷载体，脂质体的等电点为4-8。这一目的是由于制备的脂质体具有pH依赖性的、变化的电荷而实现的。

例如，当成膜或基于膜的阳离子电荷载体的量在低pH下超过阴离子电荷载体的量并且该比率在较高pH下反转时，形成具有所需性质的脂质体结构。当可电离组分的pKa值在4和9之间时总是如此。当介质的pH下降时，所有阳离子电荷载体带电更多并且所有阴离子电荷载体失去它们的电荷。

可用于两性脂质体的阳离子化合物包括上文先前所述的那些阳离子化合物。非限制性地，强阳离子化合物可以包括例如：DC-Chol3-β-[N-(N’,N’-二甲基甲烷)氨甲酰基]胆固醇、TC-Chol3-β-[N-(N’,N’,N’-三甲基氨基乙基)氨甲酰基胆固醇、BGSC二胍-亚精胺-胆固醇、BGTC二胍-tren-胆固醇、DOTAP(1,2-二油酰氧基丙基)-N,N,N-三甲基氯化铵、DOSPER(1,3-二油酰氧基-2-(6-羧基-精胺基)-丙酰胺、DOTMA(1,2-二油酰氧基丙基)-N,N,N-三甲基氯化铵)DORIE溴化(1,2-二油酰氧基丙基)-3-二甲羟乙铵、DOSC(1,2-二油酰基-3-琥珀酰基-sn-甘油胆碱酯)、DOGSDSO(1,2-二油酰基-sn-甘油-3-琥珀酰基-2-羟乙基二硫化鸟氨酸)、DDAB溴化二甲基二-十八铵、DOGS((C18)2GlySper3+)N,N-二-十八烷基酰氨基-乙二醇-精胺(C18)2Gly+N,N-二-十八烷基酰氨基-甘氨酸、CTAB溴化鲸蜡基三甲铵、CpyC氯化鲸蜡基吡啶、DOEPC 1,2-二油酰基-sn-甘油-3-乙基磷酸胆碱或其他O-烷基-磷脂酰胆碱或乙醇胺、来自赖氨酸、精氨酸或鸟氨酸的酰胺和磷脂酰乙醇胺。

弱阳离子化合物的实例包括但不限于：His-Chol(组胺酰-胆固醇半琥珀酸酯)、Mo-Chol(吗啉-N-乙氨基-胆固醇半琥珀酸酯)或组胺酰-PE。

中性化合物的实例包括但不限于：胆固醇、神经酰胺、磷脂酰胆碱、磷脂酰乙醇胺、四醚脂质或二酰基甘油。

可用于两性脂质体的阴离子化合物包括本文前面所述的那些非阳离子化合物。非限制性地，弱阴离子化合物的示例可以包括：CHEMS(胆固醇半琥珀酸酯)，具有8至25个碳原子的烷基羧酸，或二酰基甘油半琥珀酸酯。其他弱阴离子化合物可包括天冬氨酸或谷氨酸的酰胺和PE以及PS及其与甘氨酸、丙氨酸、谷氨酰胺、天冬酰胺、丝氨酸、半胱氨酸、苏氨酸、酪氨酸、谷氨酸、天冬氨酸或其他氨基酸或氨基二羧酸的酰胺。根据相同的原理，羟基羧酸或羟基二羧酸和PS的酯也是弱阴离子化合物。

在一些实施方式中，两性脂质体包含缀合脂质，例如上文所述的那些。有用的缀合脂质的具体示例包括但不限于PEG修饰的磷脂乙醇胺和磷脂酸、PEG-神经酰胺缀合物(例如，PEG-CerC14或PEG-CerC20)、PEG修饰的二烷基胺和PEG修饰的1,2-二酰氧基丙烷-3-胺。特别是PEG改性的二酰基甘油和二烷基甘油。

在一些实施方式中，中性脂质可以占颗粒中存在的总脂质的约10mol％至约60mol％、约15mol％至约60mol％、约20mol％至约60mol％、约25mol％至约60mol％、约30mol％至约60mol％、约10mol％至约55mol％、约15mol％至约55mol％、约20mol％至约55mol％、约25mol％至约55mol％、约30mol％至约55mol％、约13mol％至约50mol％、约15mol％至约50mol％或约20mol％至约50mol％。

在一些情况下，抑制颗粒聚集的缀合脂质(例如，PEG-脂质缀合物)可以占颗粒中存在的总脂质的约0.1mol％至约2mol％、约0.5mol％至约2mol％、约1mol％至约2mol％、约0.6mol％至约1.9mol％、约0.7mol％至约1.8mol％、约0.8mol％至约1.7mol％、约1mol％至约1.8mol％、约1.2mol％至约1.8mol％、约1.2mol％至约1.7mol％、约1.3mol％至约1.6mol％、约1.4mol％至约1.5mol％或约1、1.1、1.2、1.3、1.4、1.5、1.6、1.7、1.8、1.9或2mol％(或其任何分数或其中的范围)。通常，在这种情况下，PEG部分具有约2,000道尔顿的平均分子量。在其他情况下，抑制颗粒聚集的缀合脂质(例如，PEG-脂质缀合物)可占颗粒中存在的总脂质的约5.0mol％至约10mol％、约5mol％至约9mol％、约5mol％至约8mol％、约6mol％至约9mol％、约6mol％至约8mol％或约5mol％、6mol％、7mol％、8mol％、9mol％或10mol％(或其任何级分或其中的范围)。通常，在这种情况下，PEG部分具有约750道尔顿的平均分子量。

考虑到中性和缀合脂质的总量，两性脂质体的余量可以包含以各种比率配制的阳离子化合物和阴离子化合物的混合物。可选择阳离子与阴离子脂质的比率以实现所需的核酸包封性质、zeta电位、pKa或至少部分取决于带电脂质组分的存在的其他物理化学性质。

在一些实施方式中，脂质纳米颗粒具有特异性地增强肝脏内，特别是肝细胞内的递送和摄取的组成。

在一些实施方式中，本发明的药物组合物可以进一步包含一种或多种用于治疗受试者中的DMD的另外的药剂。

本公开还提供了本文所述的工程化大范围核酸酶，或编码其本文所述的多核苷酸，或表达本文所述的工程化大范围核酸酶的本文所述的细胞，其用作药物。本公开还提供了本文所述的工程化大范围核酸酶，或编码其本文所述的多核苷酸，或表达本文所述的工程化大范围核酸酶的本文所述的细胞在制备用于治疗DMD，用于增加修饰的肌营养不良蛋白(即，缺乏由肌营养不良蛋白基因的外显子45-55编码的氨基酸)的水平或减少于DMD相关症状的药物。

2.5用于生产重组病毒的方法

在一些实施方式中，本发明提供了用于本发明方法的重组病毒，例如，重组AAV。重组AAV通常在哺乳动物细胞系如HEK-293中产生。因为从重组体病毒中除去病毒cap和rep基因以防止其自身复制从而为待递送的治疗性基因(例如，大范围核酸酶基因)腾出空间，所以它们必须在包装细胞系中以反式提供。此外，必须提供支持复制所必需的“辅助”(例如，腺病毒)组分(Cots等，(2013)Curr.Gene Ther.13:370-81)。通常，使用三重转染产生重组AAV，其中用编码“辅助”组分的第一质粒、包含cap和rep基因的第二质粒和包含病毒ITR的第三质粒转染细胞系，所述病毒ITR包含待包装至病毒中的插入DNA序列。然后通过冻-融循环、超声处理、去污剂或本领域已知的其他方法从细胞中分离包含包裹在衣壳中的基因组(ITR和插入目标基因)的病毒颗粒。然后使用氯化铯密度梯度离心或亲和色谱法纯化颗粒，并随后将目标基因递送至细胞、组织或生物体(例如人类患者)。

因为重组AAV颗粒通常在细胞中产生(制备)，所以在实施本发明时必须注意确保工程化大范围核酸酶不在包装细胞中表达。因为本发明的重组病毒基因组可以包含大范围核酸酶的识别序列，所以在包装细胞系中表达的任何大范围核酸酶都可能能够在其被包装至病毒颗粒中之前切割病毒基因组。这将导致包装效率降低和/或包装片段化基因组。可以使用几种方法来防止大范围核酸酶在包装细胞中表达。

将核酸酶置于在包装细胞中无活性的组织特异性启动子的控制下。可以使用本文所述的针对工程化大范围核酸酶表达或针对目标核酸序列的任何组织特异性启动子。例如，如果开发用于将编码工程化大范围核酸酶的基因递送至肌组织的重组病毒，则可以使用肌特异性启动子。肌特异性启动子的实例包括但不限于本文其他部分所述的那些肌特异性启动子。

或者，重组病毒可以包装在不可能表达大范围核酸酶的来自不同物种的细胞中。例如，可以使用哺乳动物启动子(例如，众所周知的巨细胞病毒或SV40病毒早期启动子，其在非哺乳动物包装细胞中没有活性)在微生物、昆虫或植物细胞中产生病毒颗粒。在特定的实施方式中，使用Gao等描述的杆状病毒系统在昆虫细胞中产生病毒颗粒。(Gao等，(2007)J.Biotechnol.131:138-43)。在哺乳动物启动子控制下的大范围核酸酶不太可能在这些细胞中表达(Airenne等，(2013)Mol.Ther.21:739-49)。此外，昆虫细胞利用不同于哺乳动物细胞的mRNA剪接基序。因此，有可能将哺乳动物内含子(如人生长激素(HGH)内含子或SV40大T抗原内含子)并入大范围核酸酶的编码序列中。因为这些内含子在昆虫细胞中不能有效地从前mRNA转录物剪接，所以昆虫细胞将不表达功能性大范围核酸酶并包装全长基因组。相反，对其递送所得重组AAV颗粒的哺乳动物细胞将正确剪接前mRNA并表达功能性大范围核酸酶蛋白。Chen报道了HGH和SV40大T抗原内含子在昆虫包装细胞中减弱毒性蛋白芽孢杆菌RNA酶(barnase)和白喉毒素片段A的表达的用途，从而使得能够产生携带这些毒素基因的重组AAV载体(Chen(2012)Mol.Ther.Nucleic Acids.1:e57)。

工程化大范围核酸酶基因可以与诱导型启动子可操作地连接，使得大范围核酸酶表达需要小分子诱导物。诱导型启动子的示例包括Tet-On系统(Clontech；Chen等，(2015)BMC Biotechnol.15:4)和RheoSwitch系统(Intrexon；Sowa i(2011)Spine 36:E623-8)。这两种系统以及本领域已知的类似系统都依赖于配体诱导的转录因子(分别为Tet阻遏物和蜕皮激素受体的变体)，其响应于小分子活化剂(分别为强力霉素或蜕皮激素)而激活转录。使用此类配体诱导的转录激活因子实施本发明包括：1)将工程化大范围核酸酶基因置于响应相应转录因子的启动子的控制下，所述大范围核酸酶基因具有转录因子的结合位点；和2)在包装的病毒基因组中包括编码转录因子的基因。后一步骤是必要的，因为如果转录激活因子也未提供给相同的细胞，则在重组AAV递送后工程化大范围核酸酶将不在靶细胞或组织中表达。然后转录激活因子仅在用同源小分子激活剂处理的细胞或组织中诱导大范围核酸酶基因表达。这种方法是有利的，因为它能够使大范围核酸酶基因表达通过选择何时和向何种组织递送小分子诱导剂而以时间-空间方式进行调节。然而，在病毒基因组中包含诱导物的要求(这明显限制承载能力)产生了该方法的缺点。

在另一个具体的实施方式中，在表达防止大范围核酸酶表达的转录阻遏物的哺乳动物细胞系中产生重组AAV颗粒。转录阻遏物是本领域已知的且包括Tet阻遏物、Lac阻遏物、Cro阻遏物和Lambda阻遏物。许多核激素受体(例如蜕皮激素受体)在缺乏其同源激素配体的情况下也充当转录阻遏物。为了实施本发明，用编码转录阻遏物的载体转染/转导包装细胞，并将病毒基因组(包装载体)中的大范围核酸酶基因可操作地连接到被修饰以包含阻遏物的结合位点的启动子，使得阻遏物沉默启动子。编码转录阻遏物的基因可以位于各种位置。它可以在单独的载体上编码；它可以被掺入ITR序列外的包装载体中；它可以被掺入cap/rep载体或腺病毒辅助载体中；或者它可以稳定地整合到包装细胞的基因组中使其组成型地表达。修饰常见哺乳动物启动子以掺入转录阻遏物位点的方法是本领域已知的。例如，Chang和Roninson修饰强的组成型CMV和RSV启动子以包含Lac阻遏物的操纵子，并显示来自经修饰的启动子的基因表达在表达阻遏物的细胞中被大大减弱(Chang和Roninson(1996)Gene 183:137-42)。非人转录阻遏物的使用确保大范围核酸酶基因的转录将仅在表达阻遏物的包装细胞中被抑制，而在用所得重组AAV转导的靶细胞或组织中不被抑制。

2.6工程化大范围核酸酶变体

本发明的实施方式包括本文所述工程化大范围核酸酶及其变体。本发明的其他实施方式包括包含编码本文所述大范围核酸酶的核酸序列的多核苷酸，以及此类多核苷酸的变体。

本文所用的“变体”旨在指基本上相似的序列。“变体”多肽旨在指通过在天然蛋白的一个或多个内部位点缺失或添加一个或多个氨基酸和/或在天然多肽的一个或多个位点置换一个或多个氨基酸而衍生自“天然”多肽的多肽。如本文所用，“天然”多核苷酸或多肽包含变体自其衍生的亲本序列。实施方式所包括的变体多肽具有生物活性。即，它们继续具有天然蛋白质的所需生物活性；即，结合并切割本文所述的肌营养不良蛋白基因识别序列(例如，DMD 19-20、DMD 35-36或DMD 37-38识别序列)的能力。这样的变体可以由例如人为操纵产生。实施方式的天然多肽(例如，SEQ ID NO:36-59)的生物活性变体，或本文所述识别半位点结合亚基的生物活性变体将与天然多肽、天然亚基、天然HVR1区和/或天然HVR2区的氨基酸序列具有至少约40％、约45％、约50％、约55％、约60％、约65％、约70％、约75％、约80％、约85％、约90％、约91％、约92％、约93％、约94％、约95％、约96％、约97％、约98％或约99％的序列同一性，如通过本文别处描述的序列比对程序和参数所确定的。实施方式的多肽或亚基的生物活性变体可以与该多肽或亚基相差少至约1-40个氨基酸残基、少至约1-20个、少至约1-10个、少至约5个、少至4个、3个、2个或甚至1个氨基酸残基。

实施方式的多肽可以以各种方式改变，包括氨基酸置换、缺失、缩短和插入。这种操作的方法通常是本领域已知的。例如，可通过DNA中的突变制备氨基酸序列变体。诱变和多核苷酸改变的方法是本领域众所周知的。参见，例如，Kunkel(1985)Proc.Natl.Acad.Sci.USA 82:488-92；Kunkel等，(1987)Methods Enzymol.154:367-82；美国专利号4,873,192；Walker&Gaastra编著，(1983)Techniques in Molecular Biology(MacMillan Publishing Company,New York)以及其中引用的参考文献。在Dayhoff等，(1978)Atlas of Protein Sequence and Structure(Natl.Biomed.Res.Found.,Washington,D.C.)的模型中可以找到关于不影响目标蛋白质的生物活性的适当氨基酸置换的指导，其通过引用并入本文。保守置换(如将一个氨基酸与另一个具有相似性质的氨基酸交换)可能是最佳的。

在一些实施方式中，本发明的工程化大范围核酸酶可以包含本文所述HVR1和HVR2区的变体。亲本HVR区可包含，例如示例性工程化大范围核酸酶的残基24-79或残基215-270。因此，变体HVR区可包含与对应于本文所示的工程化大范围核酸酶的残基24-79或残基215-270的氨基酸序列具有至少80％、至少85％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或更高序列同一性的氨基酸序列，使得变体HVR区维持工程化大范围核酸酶的生物活性(即，结合并切割识别序列)。此外，在本发明的一些实施方式中，变体HVR1区或变体HVR2区可包含对应于在亲本HVR中的特定位置发现的氨基酸残基的残基。在这种情况中，“对应于”是指变体HVR中的氨基酸残基是在亲本HVR序列中存在于相同相对位置(即，相对于亲本序列中的其余氨基酸)的相同氨基酸残基(即，单独的相同残基)。例如，如果亲本HVR序列在位置26包含丝氨酸残基，则“包含对应于”残基26的残基的变体HVR也将在相对于(即，对应于)亲本位置26的位置处包含丝氨酸。

在特定实施方式中，本发明的工程化大范围核酸酶包含HVR1区，所述HVR1区与对应于SEQ ID NO:36-59中任一项的残基24-79的氨基酸序列具有至少80％、至少81％、至少82％、至少83％、至少84％、至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或更高的序列同一性。

在某些实施方式中，本发明的工程化大范围核酸酶包含HVR2区，所述HVR2区与对应于SEQ ID NO:36-59中任一项的残基215-270的氨基酸序列具有至少80％、至少81％、至少82％、至少83％、至少84％、至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或更高的序列同一性。

先前已经鉴定了野生型I-CreI大范围核酸酶的DNA识别结构域的大量氨基酸修饰(例如，U.S.8,021,867)，其单独或组合地导致工程化大范围核酸酶在DNA识别序列半位点内的单个碱基处具有改变的特异性，使得所得合理设计的大范围核酸酶具有不同于野生型酶的半位点特异性。表9提供了基于识别半位点的每一个半位点位置(-1至-9)处存在的碱基可以在工程化大范围核酸酶单体或亚基中进行的潜在置换以增强特异性。

表9

粗体项目是野生型接触残基并且不构成本文所用的“修饰”。星号表示该残基与反义链上的碱基接触。

可以在工程化大范围核酸酶单体或亚基中进行某些修饰以调节DNA结合亲和力和/或活性。例如，本文所述工程化大范围核酸酶单体或亚基位可以在对应于I-CreI或SEQID NO:36-59中任一项的位置19的残基处包含G、S或A(WO 2009/001159)，在对应于I-CreI或SEQ ID NO:36-59中任一项的位置66的残基处包含Y、R、K或D，和/或在对应于I-CreI的位置80或SEQ ID NO:36-59中任一项的位置80的残基处包含E、Q或K(美国专利号8,021,867)。

对于多核苷酸，“变体”包括在天然多核苷酸内的一个或多个位点缺失和/或添加一个或多个核苷酸。本领域技术人员将认识到，实施方式的核酸的变体构建为使得维持开放阅读框。对于多核苷酸，保守变体包括由于遗传密码的简并性而编码实施方式的多肽之一的氨基酸序列的那些序列。变体多核苷酸包括合成衍生的多核苷酸，例如，通过使用定点诱变产生但仍编码实施方式的重组核酸酶的那些。一般而言，实施方式的特定多核苷酸的变体与该特定多核苷酸具有至少约40％、约45％、约50％、约55％、约60％、约65％、约70％、约75％、约80％、约85％、约90％、约91％、约92％、约93％、约94％、约95％、约96％、约97％、约98％、约99％或更高的序列同一性，如通过本文别处所述的序列比对程序和参数所确定的。也可通过比较变体多核苷酸编码的多肽与参照多核苷酸编码的多肽之间的序列同一性百分比来评估实施方式的特定多核苷酸(即，参照多核苷酸)的变体。

预期本文所包括的蛋白质序列的缺失、插入和置换不会产生多肽特征的根本改变。然而，当在进行置换、缺失或插入之前难以预测置换、缺失或插入的确切效果时，本领域技术人员将理解，该效果将通过筛选多肽的预期活性来评价。例如，将针对其优先结合和切割肌营养不良蛋白基因内发现的识别序列的能力筛选出工程化大范围核酸酶。

实施例

通过以下实施例进一步说明本发明，这些实施例不应解释为限制性的。仅使用常规实验，本领域技术人员将认识到或能够确定本文所述具体物质和程序的许多等同物。这些等同物旨在被包括在以下实施例之后的权利要求的范围内。

实施例1

结合并切割肌营养不良蛋白基因中的识别序列的大范围核酸酶的表征

1.结合并切割DMD 19-20、DMD 29-30、DMD 35-36和DMD 37-38识别序列的大范围核酸酶

这些实验旨在利用工程化大范围核酸酶对以去除肌营养不良蛋白基因区段。这种使用两种工程化大范围核酸酶在两个位置同时编辑的策略允许切除多个外显子，特别是外显子45至55。在一些情况下，在单个AAV载体上递送的两种工程化大范围核酸酶可以在外显子45上游和外显子55下游的内含子序列中产生双链断裂；即该基因的外显子45-55侧翼的内含子。

如本文所述，将选择使用的工程化大范围核酸酶对设计为切割具有相同的4碱基对中心序列的识别序列。结果，工程化大范围核酸酶的切割将留下互补的粘性末端(即，4碱基对，3’突出端)，这样在切除外显子45-55的“热点”后，基因组序列将被完美连接，在外显子45-55中发现了超过50％的引起DMD的突变。去除这些外显子会导致基因中超过500,000个碱基对的基因组序列的切除，使得基因阅读框相对于野生型恢复正常，并产生更短的“贝克型”肌营养不良蛋白，该蛋白在临床前模型中已显示出治疗相关性。图1提供了识别序列的大致位置以及在外显子44和外显子56之间所产生的内含子连接。在转录过程中随后的剪接提供了mRNA转录物，其中外显子44与外显子56处于同一框架中，导致缩短但具有功能的肌营养不良蛋白。

对数百个潜在的工程化大范围核酸酶对的活性和有效性进行了评价。其中，针对其在肌营养不良蛋白基因内切割并产生遗传物质的完美连接的能力对一部分进行进一步表征。

设计为结合并切割肌营养不良蛋白基因的内含子内的DMD 19-20(SEQ ID NO:6)、DMD 29-30(SEQ ID NO:8)、DMD 35-36(SEQ ID NO:10)和DMD 37-38(SEQ ID NO:12)识别序列的工程化大范围核酸酶在本文中分别称为DMD 19-20大范围核酸酶、DMD 29-30大范围核酸酶、DMD 35-36大范围核酸酶和DMD 37-3大范围核酸酶。DMD 19-20识别序列位于外显子45的5’上游内含子中。DMD 29-30识别序列位于外显子46的5’上游内含子中。DMD 35-36和DMD 37-38识别序列两者位于外显子55的3’下游内含子中。

每个DMD工程化大范围核酸酶包含来源于SV40的N末端核定位信号、第一大范围核酸酶亚基、接头序列和第二大范围核酸酶亚基。在每个DMD大范围核酸酶中的第一亚基与第一DMD识别半位点结合，而第二亚基与第二DMD识别半位点结合。例如，在DMD 19-20大范围核酸酶中的第一亚基与第一DMD识别半位点结合，而第二亚基与第二DMD 19-20识别半位点结合(图1)。

将分别包含56个碱基对的高变区的DMD大范围核酸酶亚基分别称为HVR1和HVR2。每个DMD大范围核酸酶结合亚基的HVR1区由SEQ ID NO:36-59的残基24-79组成。每个DMD大范围核酸酶的HVR2区由SEQ ID NO:36-59的残基215-270组成。

2.在CHO细胞报告测定中切割DMD19-20、DMD29-30、DMD35-36和DMD37-38识别序列

为确定DMD 19-20、DMD 29-30、DMD 35-36和DMD 37-38大范围核酸酶是否能够结合并切割其各自的人识别序列，使用此前描述的CHO细胞报告测定(参见，WO 2012/167192和图5)对每个工程化大范围核酸酶进行评价。为了进行测定，产生CHO细胞报告细胞细，其携带整合到细胞基因组中的非功能性绿色荧光蛋白(GFP)基因表达盒。通过识别序列对中断每个细胞系中的GFP基因，以使得任一识别序列被大范围核酸酶的细胞内切割将刺激同源重组事件，从而产生功能性GFP基因。

在为本研究开发的CHO报告细胞系中，插入GFP基因的一个识别序列是人DMD 19-20、DMD 29-30、DMD 35-36和DMD 37-38识别序列。插入GFP基因的第二识别序列是CHO-23/24识别序列，其被称为“CHO-23/24”的对照大范围核酸酶识别和切割。

使用编码DMD 19-20x.13、DMD 19-20x.87、DMD 19-20L.249、DMD 19-20L.374、DMD19-20L.375、DMD 19-20L.431、DMD 19-20L.458、DMD 29-30x.18、DMD 29-30x.40、DMD 35-36x.63、DMD 35-36x.81、DMD 35-36L.376、DMD 35-36L.457、DMD 35-36L.469、DMD 37-38x.15、DMD 37-38x.66、DMD 37-38x.79、DMD 37-38L.166、DMD 37-38L.478、DMD 37-38L.512和DMD 37-38L.528大范围核酸酶的mRNA转染CHO报告细胞。还使用编码CHO-23/24大范围核酸酶的mRNA转染CHO报告细胞。在每次测定中，根据生产厂商的说明书，使用MessengerMax(ThermoFisher)在96孔板中使用90ng mRNA转染5e4个CHO报告细胞。在转染后2天、5天和7天通过流式细胞术评价转染的CHO细胞，以确定与未转染的阴性对照相比GFP阳性细胞的百分比。将每个时间点获得的数据归一化为使用CHO-23/24大范围核酸酶观察到的GFP阳性细胞％，以确定“活性评分”，并从最早时间点的归一化数据中减去最晚时间点的数据，以确定“毒性评分”。然后将活性和毒性评分相加，以确定“活性指数”，然后将其归一化为CHO-23/24大范围核酸酶的活性指数，以比较细胞系之间的数据(“归一化活性指数”)。

3.结果

如图6A-6I中所示，每个相应的大范围核酸酶能够结合并切割其各自的识别序列。每个大范围核酸酶提供的GFP表达水平与阳性对照CHO 23-24大范围核酸酶一样高或更高。

4.结论

这些研究表明，本发明的工程化大范围核酸酶能够在细胞中有效结合并切割其各自的人识别序列(例如，SEQ ID NO:6、8、10和12的识别序列)。

实施例2

由DMD大范围核酸酶诱导的插入和缺失的表征

1.方法

针对其在MRC5细胞中在其各自的识别序列处产生插入或缺失(“indels”)的能力，分别对DMD 19-20、DMD 29-30、DMD 35-36和DMD 37-38大范围核酸酶进行评价。

在这些实验中，使用Lonza Amaxa 4D系统，使用2ng或100ng编码DMD大范围核酸酶(DMD 19-20x.13、DMD 19-20x.87、DMD 29-30x.18、DMD 29-30x.40、DMD 35-36x.63、DMD35-36x.81、DMD 37-38x.15、DMD 37-38x.66或DMD 37-38x.79)或GFP的mRNA对1e6 MRC5个细胞电穿孔。在电穿孔后两天收集细胞用于gDNA制备，并使用Beckman Coulter CytoFlexS细胞仪评价转染效率。转染效率超过90％。在电穿孔后5天和8天收集其他时间点用于gDNA提取。使用Macherey Nagel NucleoSpin Blood QuickPure试剂盒制备gDNA。

使用数字液滴PCR确定靶点插入和缺失的频率(indel％)，在DMD 19-20结合位点使用引物P1、F1和R1；在DMD 37-38结合位点使用引物P3、F3和R3；在35-36靶位点使用引物P4、F4和R4，以产生在结合位点周围的扩增子，在DMD29-30结合位点使用引物P5、F5和R5，以及使用引物P2、F2、R2以产生参考扩增子。在20uL反应液中进行多路复用扩增，反应液中含有1x ddPCR Supermix for Probes(无dUTP,BioRad)、250nM每种探针、900nM每种引物、5UHindIII-HF和约50ng细胞gDNA。使用QX100液滴发生器(BioRad)产生液滴。循环条件如下所示：95℃(2℃/s爬坡)持续10分钟1个循环，94℃(1℃/s爬坡)持续30秒、X℃(1℃/s爬坡)持续45秒(各“X”靶位点退火温度如下所示)、72℃(0.2℃/s爬坡)持续2分钟，进行44个循环，98℃持续10分钟1个循环，保持在4℃。使用QX200液滴读取器(BioRad)分析液滴，并使用QuantaSoft分析软件(BioRad)采集和分析数据。通过将结合位点探针的阳性拷贝数除以参考探针的阳性拷贝数并比较核酸酶处理的细胞与模拟转染的细胞中FAM+拷贝的损失来计算Indel频率。

循环退火温度：DMD 19-20：57℃；DMD 35-36 59℃；DMD 37-3857℃；和DMD 29-3062℃。

表10：引物和探针集合

位点	引物Seq Id No.	引物序列
			探针19-20	SEQ ID NO:133	CGGGAGGTAATACATAATCC
19-20F1	SEQ ID NO:134	GGGTGGGTTGCTTTACCTCTC
			19-20R1	SEQ ID NO:135	TGGGCTACTGCAACTCTGTT
P2参考	SEQ ID NO:136	AGGACAAAAGAGGACGGTCTGCCCTGG
			参考F2	SEQ ID NO:137	TAAGACCCAGCTTCACGGAG
参考R2	SEQ ID NO:138	TATGATCGCCTGTTCCTCCA
			P3 37-38	SEQ ID NO:139	CTGGCCGAAGTATAGGAA
37-38F3	SEQ ID NO:140	CGCAACATGTGACATAAAGAG
			37-38R3	SEQ ID NO:141	TCTGGATATCCTCTTCTGGG
P4 35-36	SEQ ID NO:142	CCTACATGGTGTATCTGAC
			35-36F4	SEQ ID NO:143	GAACACCACCAGAAAAACAAG
35-36R4	SEQ ID NO:144	CACTTCCTGTAAGACAACCAG
			P5 29-30	SEQ ID NO:145	ATCCCTCATACCCAATC
29-30F5	SEQ ID NO:146	AAAAACCACGGTGCTGTTGA
			29-30R5	SEQ ID NO:147	ATGGGGTCCGAGACTTTTCC

2.结果

针对其在MRC5细胞中产生indels的能力筛选靶向DMD 19-20、DMD 29-30、DMD 35-36和DMD 37-38识别序列的大范围核酸酶。DMD 19-20x.13和DMD 19-20-0.87大范围核酸酶在低信使核糖核酸剂量下各自返回可测量量的indel活性，DMD 19-20x.87大范围核酸酶在该单一核酸酶测定中显示出更高的效力(图7A)。在低信使核糖核酸剂量下，DMD 35-36x.63和DMD 35-36x.81大范围核酸酶在MRC5细胞中各自返回大于30％的基因组编辑(图7B)。在低信使核糖核酸剂量下，DMD 37-38x.15、DMD 37-38x.66和DMD 37-38-79大范围核酸酶返回>30％的基因组编辑，并且随着时间的推移没有编辑减少(图7C)。DMD 29-30x.18大范围核酸酶最初具有高INDEL％，但在第8天这些INDEL显著减少，而DMD 29-30x.40大范围核酸酶具有较低INDEL，直到第8天都是稳定的(图7D)。

3.结论

这些实验表明，本发明的工程化DMD大范围核酸酶能够在培养的细胞中在其识别序列产生indel，其中很多随着时间的推移能够产生稳定的高频indel，即使当用低浓度的mRNA转染细胞时也是如此。

实施例3

用于去除肌营养不良蛋白基因的外显子45-55的大范围核酸酶对的表征

1.方法

针对其从MRC5细胞的基因组切除肌营养不良蛋白基因的外显子45-55的能力，这些实验对靶向DMD 19-20、DMD 35-36和DMD 37-38识别序列的工程化大范围核酸酶对进行评价。为实现这一点，使用编码DMD 19-20和DMD 35-36大范围核酸酶的单独mRNA，或编码DMD 19-20和DMD 37-38大范围核酸酶的单独mRNA转染MRC5细胞。测试的DMD 19-20和DMD35-36大范围核酸酶对包括以下：DMD 19-20x.13和DMD 35-36x.63；DMD 19-20x.87和DMD35-36x.81；DMD 19-20x.13和DMD 35-36x.81；DMD 19-20x.87和DMD 35-36x.63。测试的DMD19-20和DMD 37-38大范围核酸酶对包括以下：DMD 19-20x.13和DMD 37-38x.15；DMD 19-20x.87和DMD 37-38x.15；DMD 19-20x.13和DMD 37-38x.66；DMD 19-20x.87和DMD 37-38x.66；DMD 19-20x.13和DMD 37-38x.79；和DMD 19-20x.87和DMD 37-38x.79。此外，针对其仅切除来自MRC5细胞基因组的肌营养不良蛋白基因的外显子45的能力，这些实验还对DMD 19-20和DMD 29-30大范围核酸酶进行了评价。测试的DMD 19-20和DMD 29-30大范围核酸酶对包括以下：DMD 19-20x.13和DMD 29-30x.18；DMD 19-20x.87和DMD 29-30x.40；DMD19-20x.13和DMD 29-30x.40；和DMD 19-20x.87和DMD 29-30x.18。

使用Lonza Amaxa 4D系统，使用分别编码DMD大范围核酸酶或GFP的40ng mRNA电穿孔1e6个MRC5细胞。在电穿孔后两天收集细胞用于gDNA制备，并使用Beckman CoulterCytoFlex S细胞仪评价转染效率。转染效率超过90％。使用Macherey Nagel NucleoSpinBlood QuickPure试剂盒制备gDNA。

gDNA用跨越缺失位点的引物集合进行PCR扩增，以扩增任何缺失事件。使用了下表中所示的下述PCR引物集合：

表11：引物集合

将Q5 Taq聚合酶(New England Biolabs)与上述引物和dNTP(New EnglandBiolabs)一起使用，以扩增gDNA。循环条件如下所示：98℃持续4分钟1个循环，98℃持续10分钟、X℃(退火参见上述TM)持续20秒、72℃持续1.5分钟，共进行35个循环72℃持续2分钟1个循环，保持在4℃。将PCR产物在2％琼脂糖凝胶上运行，并通过UV相机进行目测检查。使用扩增步骤中使用的相同引物将剩余的PCR产物用于sanger测序。使用SnapGene软件分析DNA序列，并将其与预期的模板文件进行比较。

利用跨越19-20靶位点和29-30、35-36或37-38的相应DMD核酸酶的连接的引物对和探针，利用数字液滴PCR来确定大缺失的频率(indel％)。该测定测量19-20的左半位点与29-30、35-36或37-38核酸酶位点的相应右半位点的完美连接事件。对于每个双核酸酶测定，包括与使用引物P2、F2、R2相同的来自实施例2的参考扩增子测定，这允许我们量化大缺失与不受核酸酶活性影响的区域的比率。概括示意图如图11所示，其说明了针对19-20至37-38双核酸酶递送的该测定。针对DMD 19-20和DMD 37-38的完美连接利用引物P6、F6和R6。针对DMD 19-20和DMD 35-36的完美连接利用引物P7、F7和R7。针对DMD 19-20至9-30的完美连接利用引物和探针P8、F8和R8。在20uL反应液中进行多路复用扩增，反应液中含有1xddPCR Supermix for Probes(无dUTP,BioRad)、250nM每种探针、900nM每种引物、5UHindIII-HF和约50ng细胞gDNA。使用QX100液滴发生器(BioRad)产生液滴。循环条件如下所示：95℃(2℃/s爬坡)持续10分钟1个循环，94℃(1℃/s爬坡)持续30秒、X℃(1℃/s爬坡)持续45秒(各靶位点退火温度如下所示)、72℃(0.2℃/s爬坡)持续2分钟，共进行44个循环，98℃持续10分钟1个循环，保持在4℃。使用QX200液滴读取器(BioRad)分析液滴，并使用QuantaSoft分析软件(BioRad)采集和分析数据。通过将结合位点探针的阳性拷贝数除以参考探针的阳性拷贝数并比较核酸酶处理的细胞与模拟转染的细胞中FAM+拷贝的损失来计算Indel频率。

循环退火温度：DMD 19-20–DMD 37-38，53℃，DMD19-20–DMD 37-38，59℃，以及DMD19-20–DMD 29-30，55℃。

表12：引物和探针集合

位点	引物Seq ID NO.	引物序列
			P6 19/38	SEQ ID NO:160	ATCAGAAGGATTATGTATAGGAATA
19-20F6	SEQ ID NO:161	GGGTGGGTTGCTTTACCTCT
			37-38R6	SEQ ID NO:162	TCTGGATATCCTCTTCTGGG
P7 19/36	SEQ ID NO:163	GTGAAGTAGCAAAGCACCTG
			19-20F7	SEQ ID NO:164	GTGAAGTAGCAAAGCACCTG
35-36R7	SEQ ID NO:165	AGTCACTTCCTAAGCTAAGACAACC
			P8 19/30	SEQ ID NO:166	CAGAAGGATTATGTATGAGGGATA
19-20F8	SEQ ID NO:167	GTGAAGTAGCAAAGCACCTG
			29-30R8	SEQ ID NO:168	ATGGGGTCCGAGACTTTTCC

2.结果

对19-20至35-36的扩增的正确大小的PCR产物进行目测检查(图8A)，相应的序列数据显示了19-20/35-36核酸酶结合位点之间的完美连接(图8B)。还对19-20至37-38的扩增的正确大小的PCR产物进行目测检查(图9A)，相应的序列数据显示了19-20/37-38核酸酶结合位点之间的完美连接(图9B)。此外，针对19-20to 29-30的扩增的正确大小的PCR产物进行目测检查(图10)。

全部三个缺失事件的数字液滴PCR(ddPCR)测定都成功测量了19-20识别序列与来自29-30、35-36或37-38的相应序列之间的完美连接，后者具有干净的模拟反应。DMD 19-20至DMD 35-36的完美连接量化的缺失和连接事件范围为6％至12％(图12A)。DMD 19-20至DMD 37-38的完美连接量化的缺失和连接事件范围为9％至17.9％(图12B)和DMD 19-20至DMD 29-30的完美连接量化的缺失和连接事件范围为1％至3％(图12C)。

3.结论

这些结果为去除与多个DMD疾病相关突变相关的热点外显子的双重编辑提供了体外概念验证。测得这些编辑事件高达17.9％。然而，这些编辑的频率，以及单独去除外显子45或外显子45-55的频率被低估了，因为这种测定只检测到完美连接事件，而不是在靶位点导致轻微indel连接。此外，研究表明，这可以通过多种不同工程化大范围核酸酶和不同成功程度的靶点来实现(图13)。出乎意料的是，这些数据显示，与用DMD 19-20和DMD 29-30大范围核酸酶对去除单个外显子45相比，用DMD 19-20和DMD 35-36/DMD 37-38大范围核酸酶对去除外显子45-55和超过500000bp的遗传序列，完美连接的百分比显著更高(图12C和图13)。

实施例4

在原代人骨骼肌成肌细胞中去除外显子45-55后在肌营养不良蛋白基因中的完美连接时间分析

1.方法

在这些实验中，在人骨骼肌成肌细胞(一种人原代肌细胞)中评估了靶向DMD 19-20和DMD 37-38识别序列的大范围核酸酶的编辑能力。人骨骼肌成肌细胞购自Lonza(HSMMCC-2580)。将细胞解冻并以3500个细胞/cm²接种在骨骼肌细胞生长培养基-2(SkGM-2)中，并保持不超过70％的汇合度直到电穿孔。使用1e6个细胞进行转染。使用Lonza Amaxa 4D系统，使用编码配对的每种DMD大范围核酸酶(DMD 19-20L.249和DMD 37-38L.166对)或GFP的20、40、80或160ng mRNA对细胞进行电穿孔。电穿孔后，将细胞接种到6孔板的单个孔中的生长培养基中。电穿孔后一天，将待分化的细胞更换为含2％马血清的DMEMF12(Thermo)，而将待维持未分化的细胞维持在生长培养基中。电穿孔后2天和8天收获细胞，用于DNA和蛋白提取gDNA分离，并使用数字液滴PCR测定DMD 19-20–DMD 37-38完美连接的大缺失频率(indel％)，如上文实施例3中所述的。

2.结果

在HSMM细胞细中，随着DMD 19-20L.249和DMD 37-38L.166工程化大范围核酸酶mRNA量的增加，可以看到大缺失/完美连接的剂量依赖性增加(图4)。切除外显子45-55后，低剂量至高剂量mRNA的完美连接范围为14％至27％。

3.结论

此前的双递送大缺失结果是在人MRC5细胞系中进行的。而相比之下，该实验测量了本发明工程化大范围核酸酶在识别位点编辑基因组的能力，该识别位点是切除相关肌细胞系中包含“热点”区域的外显子所需要的。通过数字液滴PCR定量，靶向DMD 19-20和DMD37-38识别序列的越来越多的工程化大范围核酸酶mRNA能够切除大于500,000bp的片段，并以高达27％的频率将基因完美地连接在一起。这些数据支持用工程化大范围核酸酶对进行大规模编辑/缺失的概念的体外验证。

实施例5

在从DMD患者分离的永生化细胞系中随着DMD大范围核酸酶对的量的增加的体外肌营养不良蛋白大缺失和恢复的分析1.方法

在DMD患者细胞系AB1098中对DMD 19-20和DMD 37-38核酸酶对进行进一步评价。DMD患者成肌细胞系获自Myology研究中心(Sorbonne University)。该细胞系是从具有外显子48-50缺失的患者的脊髓肌肉中永生化的，并且由于外显子缺失而导致肌营养不良蛋白缺乏。

将细胞以3000个细胞/cm²接种，并且在Promocell肌生长培养基(Promocell)中生长。在P5电穿孔溶液(Lonza)中用1e6个细胞进行转染，并使用Lonza 4D Nucleofector X单元用EY100程序转染。对于DMD 19-20L.249和DMD 37-38L.166大范围核酸酶中的每一种，核酸酶mRNA剂量为10ng、20ng、40ng、80ng或160ng。电穿孔后，将细胞接种到6孔板的单个孔中的生长培养基中。电穿孔后一天，将待分化的细胞改为DMEM(Thermo)10ug/ml胰岛素和50ug/ml庆大霉素，而将待维持为未分化的细胞维持在生长培养基中。在电穿孔后2天和8天收获细胞用于DNA和蛋白提取。gDNA分离和数字液滴PCR用于测定DMD 19-20-DMD 37-38完美连接的大缺失频率(indel％)，如上文实施例3中所述的。对于蛋白提取，使用TrypLE从平板中收获细胞，离心，然后用PBS洗涤并用含蛋白酶抑制剂的1xRIPA缓冲液(Millipore)裂解。通过BCAA测定(Thermo)确定蛋白浓度。为了通过WES(Protein simple)进行分析，将裂解物归一化至250ng/ul，并使用标准程序在66-440kDa模块上运行。用于检测肌营养不良蛋白的一抗为ab154168，比例为1:1000。使用针对纽带蛋白(Abcam)的一抗(1:200)作为上样对照。

2.结果

在该DMD患者细胞系中，随着编码DMD 19-20L.249和DMD 37-38L.166工程化大范围核酸酶的mRNA量的增加，可见大缺失/完美连接的剂量依赖性增加。完美连接的范围从4％至29％(低剂量至高剂量mRNA)(图15)。

通过WES自动蛋白印迹分析来测量缺少外显子45-55编码的氨基酸的缩短的修饰的肌营养不良蛋白的表达。在WES色度读取中，修饰的肌营养不良蛋白的量呈剂量依赖性增加，最高剂量为160ng(F道)、80ng(E道)、40ng(D道)、20ng(C道)、10ng(B道)和模拟(A道)(图16A)。WES系统将生成的彩色数据转换为更传统的蛋白印迹图，并复制读取的数据。在模拟未经处理的AB1098细胞中未检测到肌营养不良蛋白，在整个剂量范围内肌营养不良蛋白条带的强度增加(图16B)。将肌营养不良蛋白恢复归一化为负上样对照纽带蛋白蛋白，并计算相对于上样的蛋白恢复的量(图16C)。在模拟中没有测量到肌营养不良蛋白，而在整个剂量曲线上观察到肌营养不良蛋白增加了7倍。

3.结论

这些实验报告了在从患者中分离的细胞系中外显子45至55的大缺失，所述患者在肌营养不良蛋白基因中缺失外显子48至50。该细胞系不表达可检测水平的肌营养不良蛋白，并且是DMD疾病的良好体外模型。图16中的WES蛋白数据显示，缩短的修饰的肌营养不良蛋白的表达恢复，在未经处理的模拟细胞中，在所有工程化大范围核酸酶剂量范围内，没有蛋白表达达到可检测水平。这进一步证实并体外证明了使用双工程化大范围核酸酶通过切除外显子45-55并将肌营养不良蛋白基因转化为贝克型肌营养不良蛋白表型来治疗DMD患者的概念。

实施例6

RNA剪接信息的分析

1.方法

这项研究对患者细胞系AB1098中的DMD 19-20和DMD 37-38大范围核酸酶对进行了表征，观察了大范围核酸酶递送后的RNA剪接信息。

如实施例5中所述对细胞进行培养和电穿孔。针对每种大范围核酸酶(DMD 19-20L.249和DMD 37-36L.166)，核酸酶mRNA的剂量为10ng、20ng、40ng、80ng或160ng。在第8天收获细胞，使用苯酚-氯仿和Purelink RNA迷你试剂盒(Thermo)提取RNA。RNA分离后，用iSCRIPT cDNA合成试剂盒(Bio-Rad)进行cDNA合成，并用ddPCR测定外显子44与外显子56的剪接频率。将处理过的细胞的肌营养不良蛋白剪接信息归一化为从Thermo Fisher(测定#Hs01047624_g1)购买的含有锚蛋白重复结构域的蛋白27(ANKRD27)基因的参考信息测定。

CDNA合成条件：在25℃下预处理5分钟，在46℃下RT处理20分钟和在95℃下失活1分钟。ddPCR循环95℃ 10分钟，随后进行45个循环，95℃ 45秒、57℃ 45秒、72℃ 1分钟，以及98℃最终失活10分钟。

表13：引物和探针集合

Sit位点	引物Seq Id No.	引物序列
			95DMD剪接RNA For2	SEQ ID NO:184	GCTGAACAGTTTCTCAGAAAGACA
98DMD RNA剪接Rev 2	SEQ ID NO:185	GGCTGTTTTCATCCAGGTTGTG
			96DMD 4456RNA SPLICE PB	SEQ ID NO:186	TCTTAAGGACCTCCAAGG

2.结果

随着患者细胞系中DMD19-20L.249和DMD 37-38L.166工程化大范围核酸酶mRNA量的增加，外显子44至外显子56剪接信息呈剂量依赖性增加。剪接信息与参考基因信息的比率从模拟的0.01％到高剂量mRNA的9.51％(图17)。

3.结论

这些实验证明，在从DMD患者分离的细胞系中肌营养不良蛋白RNA信息的外显子45至55的大缺失。该细胞系不表达可检测水平的肌营养不良蛋白，其是DMD疾病的良好体外模型。在图17中的剪接信息数据显示了外显子45至55的靶向缺失。这进一步证实了使用双工程化大范围核酸酶策略通过切除外显子45-55和恢复“贝克”氏肌营养不良蛋白表型来治疗DMD患者的概念，并在体外证明了这一点。

实施例7

在原代人骨骼肌成肌细胞中去除外显子45-55后在肌营养不良蛋白基因中的完美连接事件分析

1.方法

这些实验评价了靶向DMD 19-20和DMD 35-36识别序列的大范围核酸酶在人骨骼肌成肌细胞(一种人原代肌细胞)中切除肌营养不良蛋白基因的外显子45至55的能力，如在实施例4中所述。将细胞解冻并以3500个细胞/cm²接种在骨骼肌细胞生长培养基-2(SkGM-2)中，并保持不超过70％的汇合度直到电穿孔。使用1e6个细胞进行转染。使用Lonza Amaxa4D系统，使用40ng编码每种DMD大范围核酸酶对(DMD 19-20x.13和DMD 35-36x.63；DMD 19-20L.249和DMD 35-36L.195；DMD 19-20L.302和DMD 35-36L.282；DMD 19-20L.329和DMD35-36L.282；DMD 19-20L.302和DMD 35-36L.349；或DMD 19-20L.329和DMD 35-36L.349)或GFP的mRNA对细胞进行电穿孔。电穿孔后，将细胞接种到6孔板的单个孔中的生长培养基中。在DNA电穿孔后2天收获细胞。将gDNA分离和数字液滴PCR用于测定DMD 19-20-DMD 35-36完美连接的大缺失频率(indel％)，如以上实施例3中所述。

2.结果

如图18中所示，在该原代成肌细胞系中，每对工程化大范围核酸酶都显示了外显子45-55的缺失和肌营养不良蛋白基因的完美连接。

3.结论

这些结果进一步证明，靶向肌营养不良蛋白基因内DMD 19-20和DMD 35-36识别序列的本发明工程化大范围核酸酶对可以从肌营养不良基因中切除外显子45-55，并且随后诱导肌营养不良蛋白基因的完美连接。这些数据与实施例4中提供的数据一致，并且进一步支持用工程化大范围核酸酶进行大规模编辑和缺失的概念的体外证明。

实施例8

其他DMD 19-20大范围核酸酶的产生

1.方法

经过三轮开发，产生了其他DMD19-20大范围核酸酶，以提高大范围核酸酶的效力和特异性。使用OligoCapture测定测量大范围核酸酶的特异性。这是一种基于细胞的体外测定，依赖于合成寡核苷酸(oligo)盒在基因组内DSB处的整合。使用oligo作为锚，可以扩增、测序和绘制整合位点两侧的基因组DNA(图19)。这使得对核酸酶的潜在脱靶编辑位点进行最小偏倚的评估。该技术改进自GuideSeq(Tsai等，(2015)Nat.Biotech.33:187-97)，其具有特异性修饰以增加灵敏度并适应由大范围核酸酶诱导的3’互补突出端。OligoCapture分析软件与序列无关。也就是说，没有对核酸酶能够切割哪些DNA序列做出先验假设。在OligoCapture测定中，使用核酸酶mRMA和双链DNA寡核苷酸转染细胞。2天后，分离细胞基因组DNA并剪切成更小的尺寸。将寡核苷酸衔接子连接到剪切的DNA上，并使用聚合酶链式反应扩增一端含有衔接子而另一端含有捕获的寡核苷酸的任何DNA片段。对扩增的DNA进行纯化，制备测序文库并进行测序。对数据进行过滤和分析，寻找捕获寡核苷酸的有效位点，以识别潜在的脱靶位点。将序列读数取与参考基因组进行比对，并在千碱基对窗口内对序列进行分组，以扫描潜在的大范围核酸酶切割位点。在每轮优化(1-3轮)中，用用于多种DMD19-20核酸酶的mRNA转染HEK293细胞。如以上在测定描述中所述，分离并处理gDNA。

2.结果

如图20中所示，HEK293细胞中每个DMD 19-20大范围核酸酶产生的每个脱靶位点是基于在该位点捕获的探针寡聚物的独特序列读取的数量绘制的，左边的点簇表示低读取计数，右边的点表示高读取计数。DMD 19-20大范围核酸酶的特异性可以通过在图的中间区域发现多少中间位点以及它们的读取计数有多低来判断。较少的点与总体上检测到的潜在脱靶位点较少相关，而更靠近左边的点与较低的读取计数和对它们是合法脱靶的把握较低相关。预期的DMD靶位点应该具有最高的读取计数，这是选择包含在圆圈内的DMD 19-20大范围核酸酶点中的两种核酸酶的情况；也对应于与由较深的蓝色斑点所示的靶位点序列相比更少的序列错配。

3.结论

针对19-20靶位点的大范围核酸酶特异性在三轮开发中增加。这些大范围核酸酶具有有必要对脱靶靶点进行表征的特异性性质。

实施例9

其他DMD 35-36大范围核酸酶的产生

1.方法

经过三轮开发，产生了其他DMD 35-36大范围核酸酶，以提高大范围核酸酶的效力和特异性。使用OligoCapture测定测量核酸酶特异性，如在实施例8中所述。

2.结果

如图21中所示，HEK293细胞中每个DMD 35-36大范围核酸酶产生的每个脱靶位点是基于在该位点捕获的探针寡聚物的独特序列读取的数量绘制的，左边的点簇表示低读取计数，右边的点表示高读取计数。DMD 35-36大范围核酸酶的特异性可以通过在图的中间区域发现多少中间位点以及它们的读取计数有多低来判断。较少的点与总体上检测到的潜在脱靶位点较少相关，而更靠近左边的点与较低的读取计数和对它们是合法脱靶的把握较低相关。预期的DMD靶位点应该具有最高的读取计数，这是选择包含在圆圈内的DMD 35-36大范围核酸酶点中的两种核酸酶的情况；也对应于与由较深的蓝色斑点所示的靶位点序列相比更少的序列错配。

3.结论

针对35-36靶位点的大范围核酸酶特异性在三轮开发中增加。这些大范围核酸酶具有有必要对脱靶靶点进行表征的特异性性质。

实施例10

使用DMD大范围核酸酶对在DMD患者细胞系中编辑肌营养不良蛋白基因

1.方法

在DMD患者细胞系中进一步评价了改进的DMD 19-20、DMD 35-36和DMD 37-38大范围核酸酶对。DMD患者成肌细胞系获自Myology研究中心(Sorbonne University)。该细胞系是从具有外显子48-50缺失的患者的脊髓肌肉中永生化的，并且由于外显子缺失而导致肌营养不良蛋白缺乏。使用靶向DMD 19-20和DMD 35-36或DMD 19-20和DMD 37-38识别序列的工程化大范围核酸酶对转导细胞，如在下表14中所示。

表14：工程化大范围核酸酶对

EP	19-20/35-36对
		1	19-20L.374/35-36L.376
2	19-20L.374/35-36L.457
		3	19-20L.374/35-36L.469
4	19-20L.375/35-36L.376
		5	19-20L.375/35-36L.457
6	19-20L.375/35-36L.469
		7	19-20L.431/35-36L.376
8	19-20L.431/35-36L.457
		9	19-20L.431/35-36L.469
10	19-20L.458/35-36L.376
		11	19-20L.458/35-36L.457
12	19-20L.458/35-36L.469
		13	模拟
14	19-20L.374/37-38L.478
		15	19-20L.374/37-38L.512
16	19-20L.374/37-38L.528
		17	19-20L.375/37-38L.528
18	19-20L.375/37-38L.528
		19	19-20L.375/37-38L.528
20	19-20L.431/37-38L.528
		21	19-20L.431/37-38L.528
22	19-20L.431/37-38L.528

将细胞以3000个细胞/cm²接种，并且在Promocell肌生长培养基(Promocell)中生长。在P5电穿孔溶液(Lonza)中用1e6个细胞进行转染，并使用Lonza 4D Nucleofector X单元用EY100程序转染。针对DMD 19-20、DMD 35-36和DMD 37-38大范围核酸酶的每一种，大范围核酸酶mRNA的剂量为40ng。电穿孔后，将细胞接种到6孔板的单个孔中的生长培养基中。电穿孔后一天，将待分化的细胞改为DMEM(Thermo)10ug/ml胰岛素和50ug/ml庆大霉素，而将待维持为未分化的细胞维持在生长培养基中。在电穿孔后2天和8天收获细胞用于DNA和蛋白提取。分离gDNA，并利用数字液滴PCR测定DMD 19-20–DMD 35-36和DMD 19-20-DMD 37-38大范围核酸酶的大缺失频率(indel％)。试剂、循环条件和参考测定如实施例2中所述，但改变PCR引物和探针以测量总连接。该ddPCR测定使用19-20结合位点的5’正向引物和35-36位点或37-38位点的3’反向引物，以及特异于连接的19-20/35-36位点和19-20/37-38位点的5’序列51碱基对的探针(见下表15)。对于每个双大范围核酸酶测定，包括来自实施例2的相同参考扩增子测定，从而允许定量大缺失与不受该大范围核酸酶对影响的区域的比率(参见下表15)。

对于蛋白提取，用TrypLE从平板中收获细胞，离心，然后用PBS冲洗，并用含有蛋白酶抑制剂的1xRIPA缓冲液(Millipore)裂解。通过BCA测定(Thermo)确定蛋白浓度。为了通过WES(Protein simple)进行分析，将裂解物归一化为250ng/ul，并使用标准程序在66-440kDa模块上运行。用于检测肌营养不良蛋白的一抗是1:50mandyS10。使用针对纽带蛋白的一抗(Abcam)(1:100)作为上样对照。

表15：在用于总连接确定的ddPCR测定中使用的引物

引物名称	引物序列	SEQ ID NO.
			143DMDligfor4	GGGTGGGTTGCTTTACCTCTCTAG	SEQ ID NO:187
145DMD1936REV	TCACATCATGAGATTTAGTCACTTCC	SEQ ID NO:188
			141DMD 38反向2	GCTATCTGGATATCCTCTTCTGGG	SEQ ID NO:193
134DMDimpLIG探针	TTGCTACTTCACAGTAACCACATGG	SEQ ID NO:189
			P2参考	AGGACAAAAGAGGACGGTCTGCCCTGG	SEQ ID NO:136
参考F2	TAAGACCCAGCTTCACGGAG	SEQ ID NO:137
			参考R2	TATGATCGCCTGTTCCTCCA	SEQ ID NO:138

2.结果

在该DMD患者细胞系中，用不同DMD19-20和DMD35-36或DMD19-20和DMD37-38工程化大范围核酸酶对，可以观察到不同水平的大缺失/总连接(图22和图24A)。使用DMD 19-20和DMD 35-36对的总连接范围从8％至22.7％(图22)，使用DMD 19-20和DMD 37-38对的总连接范围从略高于1％至12％(图24A)。

通过WES测量缩短的修饰肌营养不良蛋白的表达，该蛋白缺乏由外显子45-55编码的氨基酸。WES系统将生成的彩色数据转换为更传统的蛋白印迹图，并复制读取的数据。在模拟未处理AB1098细胞中未检测到肌营养不良蛋白。在DMD 19-20和DMD 35-36工程化大范围核酸酶对的每一个中均检测到了缩短的修饰肌营养不良蛋白(图23A)。将缩短的修饰肌营养不良蛋白恢复归一化为上样对照纽带蛋白蛋白，并计算相对于上样的蛋白恢复量(图23B)。类似地，根据该组织产生的标准曲线，与来自hDMD小鼠股四头肌的等量(500ng)裂解物的相对表达水平相比，用DMD 19-20和DMD 37-38工程化大范围核酸酶对处理的细胞检测到缩短的修饰肌营养不良蛋白(图24B)。在模拟中未测量到肌营养不良蛋白，而在每个大范围核酸酶对中检测到缩短的修饰肌营养不良蛋白。

3.结论

这些实验报道了在从患者中分离的细胞系中外显子45至55的大缺失，所述患者在肌营养不良蛋白基因中缺失外显子48至50。该细胞系未表达可检测水平的肌营养不良蛋白，并且是DMD疾病的良好体外模型。WES蛋白数据(图23A)以及图23B和24B中的定量显示，在所有工程化大范围核酸酶剂量范围内，在未经处理的模拟细胞中无蛋白表达的缩短的修饰肌营养不良蛋白的表达恢复到可检测水平。该蛋白定量进一步证实了使用双工程化大范围核酸酶通过切除外显子45-55并将肌营养不良蛋白基因转化为贝克型肌营养不良蛋白表型来治疗DMD患者的概念，并且在体外证明了这一点。

实施例11

hDMD小鼠研究(TD066)中体内肌营养不良蛋白基因的编辑

1.方法

在hDMD小鼠中进行了一项体内研究，以研究通过递送DMD 19-20x.13和DMD 37-38x.15大范围核酸酶对诱导的体内编辑和人肌营养不良蛋白恢复。小鼠通过眶后系统注射用AAV9包封的三种不同构建体(1x10¹⁴VG/kg)进行注射。第一AAV包含病毒基因组，其从5’至3’包含A17-120增强子、肌特异性启动子MHCK7、SV40内含子序列、DMD 19-20x.13核酸酶的编码序列、furin GSG P2A切割序列、DMD37-38x.15核酸酶的编码序列、WPRE元件和SV40多聚腺苷酸信号。此外，使用两盒方法研究了两种AAV9构建体，其中每种核酸酶都被单独的肌特异性启动子驱动。每个病毒基因组包含ITR后5’端的CK8或MHCK7肌肉特异性启动子，然后是HBA2 5’UTR，DMD 19-20x13核酸酶的编码序列，WPRE元件，SV40多聚腺苷酸信号，然后是肌特异性启动子SPc5-12，XBG 5’UTR序列，DMD 37-38x.15核酸酶的编码序列，XBG 3’UTR序列和BgH多聚腺苷酸化信号。注射后14天，处死小鼠，收集骨骼肌(股四头肌)、心脏、横膈膜、比目鱼肌和肝脏的组织切片进行分子和组织学分析。实施例10的ddPCR测定使用19-20结合位点的5’正向引物、35-36位点的3’反向引物和特异于连接的19-20/35-36位点的5’序列51碱基对的探针。本实施例中的完美连接测定使用特异于19-20和35-36结合位点与可比较的正向和反向引物对的完美连接的探针序列(19-20结合位点的5’正向引物，35-36位点的3’反向引物；表16)。

表16：在用于完美连接确定的ddPCR测定中使用的引物

引物名称	引物序列	SEQ ID NO.
			49DMD 19-20F1	GGGTGGGTTGCTTTACCTCT	SEQ ID NO:190
40-DMD 37-38R	TCTGGATATCCTCTTCTGGG	SEQ ID NO:191
			89DMD 1938探针	ATCAGAAGGATTATGTATAGGAATA	SEQ ID NO:192
P2参考	AGGACAAAAGAGGACGGTCTGCCCTGG	SEQ ID NO:136
			参考F2	TAAGACCCAGCTTCACGGAG	SEQ ID NO:137
参考R2	TATGATCGCCTGTTCCTCCA	SEQ ID NO:138

2.结果

单个启动子MHCK7 P2A AAV在所有组织中都具有成功的完美连接事件；股四头肌平均2.8％，心脏平均5.3％，横膈膜平均0.85％，比目鱼肌平均3.9％，肝脏平均2.4％。CK8/SPc5-12双启动子AAV在除肝脏外的所有组织中均成功完美连接，股四头肌平均5.5％，心脏平均5.9％，横膈膜平均2％，比目鱼肌平均1.45％，肝脏平均0.3％。MHCK7/SPC512双启动子AAV在股四头肌、心脏、横膈膜、比目鱼肌和肝脏中具有最小的完美连接事件，股四头肌平均0.2％，心脏平均1.7％，横膈膜平均0.04％，比目鱼肌平均1.45％和肝脏平均0.08％(图25A-25E)。

3.结论

在此，我们报道了人源化DMD小鼠模型中热点区域(外显子45-55)的体内切除。双启动子CK8+SPc5-12组合似乎在肝脏中具有较低的器官外编辑，而在股四头肌、横隔膜和心脏中具有较高的编辑。

实施例12

在hDMD小鼠研究(TD069)中体内肌营养不良蛋白基因的编辑

1.方法

在hDMD小鼠中进行了一项体内研究，以研究通过递送DMD 19-20L.329和DMD 37-38L.219大范围核酸酶对诱导的体内编辑和人肌营养不良蛋白恢复。小鼠通过眶后系统注射用AAV9包封的四种不同构建体(1x10¹⁴VG/kg)进行注射。第一组AAV改变3’下游核酸酶，但保持两者之间所有元件相等。其包含病毒基因组，其从5’至3’包含A17-120增强子、肌特异性启动子CK8、SV40内含子序列、DMD 19-20L.329核酸酶的编码序列、furin GSG P2A切割序列、DMD35-36L.349或DMD37-38L.219核酸酶的编码序列、WPRE元件和SV40多聚腺苷酸化信号。下一组AAV改变3’下游核酸酶，但保持两者之间所有元件相等。其包含病毒基因组，其从5’至3’包含A17-120增强子、肌特异性启动子CK8、DMD 19-20L.329核酸酶的编码序列、furin GSG P2A切割序列、DMD35-36L.349或DMD37-38L.219核酸酶的编码序列、WPRE元件和SV40多聚腺苷酸化信号。注射后14天，处死小鼠，收集骨骼肌(股四头肌)、心脏、横膈膜、比目鱼肌和肝脏的组织切片进行分子和组织学分析。如实施例10中所述进行ddPCR。

2.结果

含有A17-120 CK8 SV40内含子DMD19-20/L.329P2ADMD35-36/L.349的AAV在所有组织中具有成功的总连接事件；股四头肌平均3.3％，心脏平均5.7％，横膈膜平均2.6％，比目鱼肌平均0.6％，肝脏平均4.1％。含有A17-120 CK8 SV40内含子DMD19-20L.329P2ADMD37-38/L.219的AAV在所有组织中具有最小的总连接事件；股四头肌平均0.7％，心脏平均1.6％，横膈膜平均1.4％，比目鱼肌平均0.3％，肝脏平均1.3％。含有A17-120 CK8DMD19-20/L.329P2A DMD35-36/L.349的AAV在所有组织中具有成功的总连接事件；股四头肌平均5.6％，心脏平均3.6％，横膈膜平均3.6％，比目鱼肌平均4.3％，肝脏平均2.2％。含有A17-120 CK8DMD19-20L.329P2A DMD37-38/L.219的AAV在所有组织中具有最小的总连接事件；股四头肌平均2.1％，心脏平均3.4％，横膈膜平均1.2％，比目鱼肌平均0.35％，肝脏平均0.93％(图26A-26E)

3.结论

在此，我们报道了用实施例11中使用的DMD 19-20和DMD 35-36大范围核酸酶以及用DMD 37-38靶位点处的不同下游核酸酶配对DMD 19-20-核酸酶来切除外显子45-55。在该实验中，配对的DMD 19-20大范围核酸酶和DMD 35-36大范围核酸酶比DMD19-20和DMD 37-38配对的大范围核酸酶具有更高的编辑水平。启动子下游SV40内含子的添加最低限度地增加了靶组织中的编辑，并增加了肝脏中的编辑。

实施例13

在hDMDdel52/C57小鼠研究(TD075)中体内肌营养不良蛋白基因的编辑

1.方法

在hDMDdel52/mdx(hDMD小鼠)小鼠中进行了一项体内研究，以研究通过递送DMD19-20x.13和DMD 37-38x.15大范围核酸酶对诱导的体内编辑和缩短的修饰人肌营养不良蛋白恢复。小鼠通过眶后系统注射用AAV9包封的一种构建体，以两个剂量1x10¹⁴ VG/kg或2x10¹⁴VG/kg。AAV包含病毒基因组，其从5’至3’包含肌特异性启动子CK8、SV40内含子序列、DMD 19-20x.13大范围核酸酶的编码序列、furin GSG P2A切割序列、DMD 37-38x.15大范围核酸酶的编码序列、WPRE元件和SV40多聚腺苷酸化信号。注射后14天，处死小鼠，收集骨骼肌(股四头肌)、心脏、横膈膜、TA和肝脏的组织切片，进行分子、蛋白和组织学分析。如实施例10中所述进行ddPCR。在核酸酶处理的动物的股四头肌、心脏和横膈膜中使用Wes^TM系统(ProteinSimple)评估肌营养不良蛋白的表达，如在实施例10中所描述的。将肌营养不良蛋白的表达归一化为管家蛋白纽带蛋白，并针对从表达全长肌营养不良蛋白的hDMD小鼠中分离的肌营养不良蛋白的标准曲线进行测量。还对来自核酸酶处理的小鼠的组织切片进行IHC分析，以观察肌营养不良蛋白和大范围核酸酶蛋白的表达。

2.结果

含有CK8、SV40内含子和DMD19-20x.13P2A DMD37-38x15的剂量为1x10¹⁴VG/kg(总AAV为1x10¹²)的AAV在所有组织中都具有成功的总连接事件；股四头肌平均4.3％，心脏平均3.6％，横膈膜平均1.9％，TA平均2.5％，肝脏平均0.6％。含CK8、SV40内含子和DMD19-20x.13P2A DMD37-38x.15的剂量为2x¹⁴VG/kg(总AAV为4x10¹²)的AAV在所有组织中都有成功的总连接事件；股四头肌平均3.4％，心脏平均2.7％，横膈膜平均3.9％，TA平均2.8％，肝脏平均1.9％(图27A-27E)。通过用来自WES蛋白质分析的标准曲线比较来自蛋白质标准品的hDMD小鼠中相应组织的肌营养不良蛋白来定量肌营养不良蛋白恢复。如图28A-28C所示，1-6道代表标准曲线；7-8道代表用1x10¹⁴VG/kg的DMD19-20x.13和DMD37-38x.15大范围核酸酶处理的hDMD小鼠的肌肉组织；9-10道代表用2x¹⁴VG/kg的DMD19-20x.13和DMD37-38x.15大范围核酸酶处理的肌肉，11-12道代表用PBS处理的小鼠。根据标准曲线，发现经治疗的小鼠心脏中平均有6.5％的肌营养不良蛋白，横膈膜中平均有1.5％(低剂量)或3％(高剂量)的肌营养不良蛋白，股四头肌中平均有4.5％的肌营养不良蛋白(图28A-28C)。

3.结论

在这里，我们报道了在人源化DMD小鼠模型中对人肌营养不良蛋白基因缺失的热点区域(外显子45-55)的体内切除。这种基因型是在疾病模型或患者中发现的一个实例。两个剂量水平在编辑方面没有发现显著差异。如图28A-28C的11和12道所示，该小鼠模型不会产生人肌营养不良蛋白。在这里，我们报道了在体内模型中缩短的修饰人肌营养不良蛋白恢复的概念证明，该模型不会因突变而产生人肌营养不良蛋白。

实施例14

在hDMDdel52/MDX小鼠研究(TD073)中体内肌营养不良蛋白基因的编辑

1.方法

在hDMDdel52/mdx(hDMD)小鼠中进行了一项体内研究，以研究通过递送DMD 19-20L.329和DMD 35-36L.349对大范围核酸酶诱导的体内编辑和缩短的修饰人肌营养不良蛋白恢复。小鼠通过眶后系统注射用AAV9包封的三种不同构建体(1x10¹⁴ VG/kg)进行注射。第一AAV包含病毒基因组，其从5’至3’包含A17-120增强子、肌特异性启动子CK8、DMD 19-20L.329大范围核酸酶编码序列、furin GSG P2A切割序列、DMD35-36L.349大范围核酸酶编码序列、WPRE元件和SV40多聚腺苷酸化信号。第二AAV包含病毒基因组，其从5’至3’包含A17-120增强子、肌特异性启动子MHCK7、DMD 19-20L.329核酸酶的编码序列、furin GSGP2A切割序列、DMD35-36L.349核酸酶的编码序列、WPRE元件和SV40多聚腺苷酸化信号。第三AAV包含病毒基因组，其从5’至3’包含肌特异性启动子CK8、DMD 19-20L.329核酸酶的编码序列、WPRE元件、SV40多聚腺苷酸化信号、肌特异性启动子SPc5-12、DMD35-36L.349核酸酶的编码序列、WPRE元件和BgH多聚腺苷酸化信号。注射后14天，处死小鼠，收集骨骼肌(股四头肌)、心脏、横膈膜和肝脏的组织切片，进行分子、蛋白和组织学分析。如实施例10中所述进行ddPCR测定。在核酸酶处理的动物的股四头肌、心脏和横膈膜中使用Wes^TM系统(ProteinSimple)评估肌营养不良蛋白的表达，如在实施例10中所描述的。将肌营养不良蛋白的表达归一化为管家蛋白纽带蛋白，并针对从表达全长肌营养不良蛋白的hDMD小鼠中分离的肌营养不良蛋白的标准曲线进行测量。

还对来自核酸酶处理的小鼠的四头肌组织切片进行IHC分析，以观察肌营养不良蛋白和大范围核酸酶蛋白的表达。简言之，将股四头肌组织脱蜡，并用HIER(热诱导表位修复)和ER1在BOND RX上处理40分钟。将载玻片在室温下用MoM(小鼠对小鼠封闭试剂，VECTOR)封闭试剂在10％NGS PBST(含0.1％Tween20的PBS)中封闭1h，然后与稀释度为1:1500的家兔单克隆抗大范围核酸酶抗体(PBI，Rab54)和在含2％NGS的PBST中的小鼠单克隆抗Pax7抗体(DSHB，上清液，1:5)在4℃的湿盒中孵育过夜。将次日的样品与二抗(山羊-抗小鼠IgG1 Alexa647(Invitrogen)，山羊-抗家兔Alexa555(Invitrogen)，1:500)在室温下孵育1hr，然后用DAPI核复染5分钟。去除多余的BOND RX洗涤缓冲液，使用VectaShieldVibrance Antifade封片介质封装盖玻片。在Zeiss Apotome 2.0上进行成像。

在股四头肌组织切片上对Pax7 RNA和外显子44和56的肌营养不良蛋白剪接信息的共表达进行BaseScope分析。该技术利用了一种可检测的RNA探针，该探针跨越外显子44和外显子56连接处约50个碱基对(Advanced Cell Diagnostics(ACD),Newark,CA获得)，该探针是在通过直接再连接进行基因组修复后产生的(图34)。将载玻片脱蜡，并在室温下与RNAscope过氧化氢溶液孵育10分钟，然后在95℃的蒸锅中用RNAscope 1x靶点修复试剂进行靶点修复15分钟，并在常温下进行蛋白酶IV处理30分钟。添加肌营养不良蛋白外显子44-56连接和Pax7的探针，并在HybEZ烘箱中在40℃下孵育2小时，然后在5xSSC中储存过夜。根据生产厂商的方案，使用BaseScope Duplex测定(ACD)增强信号，然后在Leica GT450数字扫描仪上对载玻片进行苏木精染色和成像。

2.结果

相对于参考位点，股四头肌平均总连接15％，心脏和横膈膜约4％(图29)。通过使用标准曲线比较hDMD小鼠中相应组织的肌营养不良蛋白，对缩短的修饰肌营养不良蛋白恢复进行量化(图30A-30C)。经处理的小鼠股四头肌平均占8.2％，心脏平均占4.2％，横膈膜平均占2.8％(图31)。在用PBS处理的hDMD小鼠中，在股四头肌组织中未检测到人肌营养不良蛋白或大范围核酸酶的表达。值得注意的是，在暴露于DMD19-20/L.329和DMD35-36/L.349的hDMD小鼠中，缩短的修饰人肌营养不良蛋白的表达恢复，并且在相邻组织切片中存在大范围核酸酶蛋白染色(图32)。股四头肌组织切片的免疫荧光染色显示PBS处理的动物中核酸酶的最小背景染色和卫星细胞的清晰Pax7染色(白色箭头)(图33A)。在核酸酶处理的动物中，Pax7阳性细胞群的共染色表明核酸酶在卫星细胞中表达(图33B)。BaseScope分析显示，与PBS动物中单独的Pax7(图35A)相比，经处理的动物中Pax7和剪接RNA产物(外显子44-56)共表达(图35B)。

3.结论

这项研究证明了在DMD疾病模型中切除外显子45至55和肌营养不良蛋白恢复的概念的体内验证。

实施例15

在DMD人细胞系中肌营养不良蛋白表达的恢复

1.方法

此前，我们报道了在DMD患者细胞系AB1098中肌营养不良蛋白的恢复，该细胞系缺失外显子48-50以及表达肌营养不良蛋白。在这里，我们报道了在其他KM1328 DMD患者细胞系中修饰的DMD 19-20L.329和DMD 35-36L.349大范围核酸酶的类似结果。DMD患者的成肌细胞系获自Myology研究中心(Sorbonne University)。该细胞系从具有外显子52缺失的患者的脊髓肌肉中永生化，这导致其由于外显子缺失而导致肌营养不良蛋白缺乏。如此前实施例10中所述，对细胞进行电穿孔、培养和收获。DMD 19-20L.329和DMD 35-36L.349的大范围核酸酶mRNA剂量分别为20ng、80ng和160ng。为了进行比较，用80ng DMD 19-20L.329和DMD 35-36L.349大范围核酸酶转染AB1098患者细胞。使用此前实施例10中所述的WES系统提取、定量和分析蛋白。用于检测肌营养不良蛋白的一抗为1:50的mandyS106。将抗纽带蛋白的一抗(Abcam)(1:100)作为上样对照。

2.结果

通过WES自动蛋白质印迹分析来测量缺少外显子45-55编码的氨基酸的缩短的修饰肌营养不良蛋白的表达。观察到修饰的肌营养不良蛋白的量呈剂量依赖性增加。缩短的修饰肌营养不良蛋白条带可以在图36的3-5道和图37的3道中看到。用于比较的全长肌营养不良蛋白的蛋白条带可以在图36的6道和图37的1道中看到。在模拟未经处理的KM1328细胞中未检测到肌营养不良蛋白，在整个剂量范围内，肌营养不良蛋白的条带强度增加(图36)。

在KM1328细胞中，随着编码DMD 19-20L.329和DMD 35-36L.349工程化大范围核酸酶的mRNA量的增加，可以看到大缺失/完美连接的剂量依赖性增加。这种连接导致在增加剂量的大范围核酸酶对下对缩短的修饰肌营养不良蛋白的检测增加(图36)。类似地，在AB1098细胞中用80ng剂量的大范围核酸酶对观察到缩短的修饰肌营养不良蛋白的表达(图37)。

3.结论

这些实验报道了在从具有肌营养不良蛋白缺失的多个DMD细胞系中分离的细胞系中外显子45至55的大缺失。这些细胞系不表达可检测水平的肌营养不良蛋白，其是DMD疾病的良好体外模型。图36和图37中的WES蛋白数据显示，在未经处理的模拟细胞中，缩短的修饰肌营养不良蛋白的表达恢复到所有工程化大范围核酸酶剂量范围内的可检测水平，而无蛋白表达。这进一步证实并体外证明了使用双工程化大范围核酸酶通过切除外显子45-55并将肌营养不良蛋白基因转化为贝克型肌营养不良蛋白表型来治疗DMD患者的概念。

实施例16

在使用AAVrh74的hDMDdel52/MDX小鼠研究中在表达PAX7的肌细胞中的体内肌营养不良蛋白基因的编辑

1.方法

该体内研究对包含病毒基因组的AAV进行了评价，所述病毒基因组从5’到3’包含A17-120增强子、肌特异性启动子MHCK7、DMD 19-20L.329核酸酶的编码序列、furin GSGP2A切割序列、DMD35-36L.349核酸酶的编码序列、WPRE元件和SV40多聚腺苷酸化信号。在hDMDdel52/mdx(hDMD)小鼠中，将通过眶后系统注射1x10¹⁴、3x10¹³、1x10¹³或5x10¹² VG/kg递送的含有DMD 19-20L.329和DMD L.349大范围核酸酶的AAVrh74与PBS进行比较。注射后28天，处死小鼠，收集骨骼肌(股四头肌)、心脏、横膈膜和肝脏的组织切片，进行分子、蛋白和组织学分析。如实施例10中所述进行数字液滴PCR。在核酸酶处理的hDMDel52/mdx动物的股四头肌、心脏和横膈膜中，使用Wes^TM系统(ProteinSimple)评估肌营养不良蛋白的表达，如实施例10中所描述的。将肌营养不良蛋白的表达归一化为管家蛋白纽带蛋白，并针对从表达全长肌营养不良蛋白的hDMD小鼠中分离的肌营养不良蛋白的标准曲线进行测量。还对来自核酸酶处理的小鼠的组织切片进行荧光免疫组织化学分析，以观察肌营养不良蛋白和大范围核酸酶蛋白的表达，如实施例14中所述。

2.结果

股四头肌组织切片的免疫荧光染色显示PBS处理的动物中核酸酶的最小背景染色和卫星细胞的清晰Pax7染色(白色箭头)(图38A)。在核酸酶处理的动物中，Pax7阳性细胞群的共染色表明核酸酶在卫星细胞中表达(图38B)。本研究揭示了在所有测试剂量下Pax7阳性细胞中核酸酶的表达：1x10¹⁴VG/kg(图38B)、3x10¹³VG/kg(图38C)和1x10¹³VG/kg(图38D)。

3.结论

这项研究为使用包封双大范围核酸酶的AAVrh74编辑股四头肌中的卫星细胞群提供了进一步的概念证明。该研究显示了Pax7的共表达，其是一种已知的卫星标记物，与工程化大范围核酸酶的表达一起表明大范围核酸酶在该靶群体中表达，因此可以使用AAV9衣壳用相同的构建体如先前在实施例14中所示潜在地编辑这些细胞。

序列表

SEQ ID NO:1

MNTKYNKEFLLYLAGFVDGDGSIIAQIKPNQSYKFKHQLSLAFQVTQKTQRRWFLDKLVDEIGVGYVRDRGSVSDYILSEIKPLHNFLTQLQPFLKLKQKQANLVLKIIWRLPSAKESPDKFLEVCTWVDQIAALNDSKTRKTTSETVRAVLDSLSEKKKSSP

SEQ ID NO:2

LAGLIDADG

SEQ ID NO:3

MAPKKKRKVH

SEQ ID NO:4

MLWWEEVEDCYEREDVQKKTFTKWVNAQFSKFGKQHIENLFSDLQDGRRLLDLLEGLTGQKLPKEKGSTRVHALNNVNKALRVLQNNNVDLVNIGSTDIVDGNHKLTLGLIWNIILHWQVKNVMKNIMAGLQQTNSEKILLSWVRQSTRNYPQVNVINFTTSWSDGLALNALIHSHRPDLFDWNSVVCQQSATQRLEHAFNIARYQLGIEKLLDPEDVDTTYPDKKSILMYITSLFQVLPQQVSIEAIQEVEMLPRPPKVTKEEHFQLHHQMHYSQQITVSLAQGYERTSSPKPRFKSYAYTQAAYVTTSDPTRSPFPSQHLEAPEDKSFGSSLMESEVNLDRYQTALEEVLSWLLSAEDTLQAQGEISNDVEVVKDQFHTHEGYMMDLTAHQGRVGNILQLGSKLIGTGKLSEDEETEVQEQMNLLNSRWECLRVASMEKQSNLHRVLMDLQNQKLKELNDWLTKTEERTRKMEEEPLGPDLEDLKRQVQQHKVLQEDLEQEQVRVNSLTHMVVVVDESSGDHATAALEEQLKVLGDRWANICRWTEDRWVLLQDILLKWQRLTEEQCLFSAWLSEKEDAVNKIHTTGFKDQNEMLSSLQKLAVLKADLEKKKQSMGKLYSLKQDLLSTLKNKSVTQKTEAWLDNFARCWDNLVQKLEKSTAQISQAVTTTQPSLTQTTVMETVTTVTTREQILVKHAQEELPPPPPQKKRQITVDSEIRKRLDVDITELHSWITRSEAVLQSPEFAIFRKEGNFSDLKEKVNAIEREKAEKFRKLQDASRSAQALVEQMVNEGVNADSIKQASEQLNSRWIEFCQLLSERLNWLEYQNNIIAFYNQLQQLEQMTTTAENWLKIQPTTPSEPTAIKSQLKICKDEVNRLSDLQPQIERLKIQSIALKEKGQGPMFLDADFVAFTNHFKQVFSDVQAREKELQTIFDTLPPMRYQETMSAIRTWVQQSETKLSIPQLSVTDYEIMEQRLGELQALQSSLQEQQSGLYYLSTTVKEMSKKAPSEISRKYQSEFEEIEGRWKKLSSQLVEHCQKLEEQMNKLRKIQNHIQTLKKWMAEVDVFLKEEWPALGDSEILKKQLKQCRLLVSDIQTIQPSLNSVNEGGQKIKNEAEPEFASRLETELKELNTQWDHMCQQVYARKEALKGGLEKTVSLQKDLSEMHEWMTQAEEEYLERDFEYKTPDELQKAVEEMKRAKEEAQQKEAKVKLLTESVNSVIAQAPPVAQEALKKELETLTTNYQWLCTRLNGKCKTLEEVWACWHELLSYLEKANKWLNEVEFKLKTTENIPGGAEEISEVLDSLENLMRHSEDNPNQIRILAQTLTDGGVMDELINEELETFNSRWRELHEEAVRRQKLLEQSIQSAQETEKSLHLIQESLTFIDKQLAAYIADKVDAAQMPQEAQKIQSDLTSHEISLEEMKKHNQGKEAAQRVLSQIDVAQKKLQDVSMKF

RLFQKPANFEQRLQESKMILDEVKMHLPALETKSVEQEVVQSQLNHCVNLYKSLSEVK

SEVEMVIKTGRQIVQKKQTENPKELDERVTALKLHYNELGAKVTERKQQLEKCLKLSR

KMRKEMNVLTEWLAATDMELTKRSAVEGMPSNLDSEVAWGKATQKEIEKQKVHLKSI

TEVGEALKTVLGKKETLVEDKLSLLNSNWIAVTSRAEEWLNLLLEYQKHMETFDQNVD

HITKWIIQADTLLDESEKKKPQQKEDVLKRLKAELNDIRPKVDSTRDQAANLMANRGD

HCRKLVEPQISELNHRFAAISHRIKTGKASIPLKELEQFNSDIQKLLEPLEAEIQQGVNLK

EEDFNKDMNEDNEGTVKELLQRGDNLQQRITDERKREEIKIKQQLLQTKHNALKDLRS

QRRKKALEISHQWYQYKRQADDLLKCLDDIEKKLASLPEPRDERKIKEIDRELQKKKEE

LNAVRRQAEGLSEDGAAMAVEPTQIQLSKRWREIESKFAQFRRLNFAQIHTVREETMM

VMTEDMPLEISYVPSTYLTEITHVSQALLEVEQLLNAPDLCAKDFEDLFKQEESLKNIKD

SLQQSSGRIDIIHSKKTAALQSATPVERVKLQEALSQLDFQWEKVNKMYKDRQGRFDRS

VEKWRRFHYDIKIFNQWLTEAEQFLRKTQIPENWEHAKYKWYLKELQDGIGQRQTVVR

TLNATGEEIIQQSSKTDASILQEKLGSLNLRWQEVCKQLSDRKKRLEEQKNILSEFQRDL

NEFVLWLEEADNIASIPLEPGKEQQLKEKLEQVKLLVEELPLRQGILKQLNETGGPVLVS

APISPEEQDKLENKLKQTNLQWIKVSRALPEKQGEIEAQIKDLGQLEKKLEDLEEQLNHL

LLWLSPIRNQLEIYNQPNQEGPFDVKETEIAVQAKQPDVEEILSKGQHLYKEKPATQPVK

RKLEDLSSEWKAVNRLLQELRAKQPDLAPGLTTIGASPTQTVTLVTQPVVTKETAISKLE

MPSSLMLEVPALADFNRAWTELTDWLSLLDQVIKSQRVMVGDLEDINEMIIKQKATMQ

DLEQRRPQLEELITAAQNLKNKTSNQEARTIITDRIERIQNQWDEVQEHLQNRRQQLNE

MLKDSTQWLEAKEEAEQVLGQARAKLESWKEGPYTVDAIQKKITETKQLAKDLRQWQ

TNVDVANDLALKLLRDYSADDTRKVHMITENINASWRSIHKRVSEREAALEETHRLLQ

QFPLDLEKFLAWLTEAETTANVLQDATRKERLLEDSKGVKELMKQWQDLQGEIEAHT

DVYHNLDENSQKILRSLEGSDDAVLLQRRLDNMNFKWSELRKKSLNIRSHLEASSDQW

KRLHLSLQELLVWLQLKDDELSRQAPIGGDFPAVQKQNDVHRAFKRELKTKEPVIMST

LETVRIFLTEQPLEGLEKLYQEPRELPPEERAQNVTRLLRKQAEEVNTEWEKLNLHSAD

WQRKIDETLERLRELQEATDELDLKLRQAEVIKGSWQPVGDLLIDSLQDHLEKVKALR

GEIAPLKENVSHVNDLARQLTTLGIQLSPYNLSTLEDLNTRWKLLQVAVEDRVRQLHEA

HRDFGPASQHFLSTSVQGPWERAISPNKVPYYINHETQTTCWDHPKMTELYQSLADLN

NVRFSAYRTAMKLRRLQKALCLDLLSLSAACDALDQHNLKQNDQPMDILQIINCLTTIY

DRLEQEHNNLVNVPLCVDMCLNWLLNVYDTGRTGRIRVLSFKTGIISLCKAHLEDKYR

YLFKQVASSTGFCDQRRLGLLLHDSIQIPRQLGEVASFGGSNIEPSVRSCFQFANNKPEIE

AALFLDWMRLEPQSMVWLPVLHRVAAAETAKHQAKCNICKECPIIGFRYRSLKHFNYD

ICQSCFFSGRVAKGHKMHYPMVEYCTPTTSGEDVRDFAKVLKNKFRTKRYFAKHPRM

GYLPVQTVLEGDNMETPVTLINFWPVDSAPASSPQLSHDDTHSRIEHYASRLAEMENSN

GSYLNDSISPNESIDDEHLLIQHYCQSLNQDSPLSQPRSPAQILISLESEERGELERILADLE

EENRNLQAEYDRLKQQHEHKGLSPLPSPPEMMPTSPQSPRDAELIAEAKLLRQHKGRLE

ARMQILEDHNKQLESQLHRLRQLLEQPQAEAKVNGTTVSSPSTSLQRSDSSQPMLLRVV

GSQTSDSMGEEDLLSPPQDTSTGLEEVMEQLNNSFPSSRGRNTPGKPMREDTM

SEQ ID NO:5

MLWWEEVEDCYEREDVQKKTFTKWVNAQFSKFGKQHIENLFSDLQDGRRLLDLLEGL

TGQKLPKEKGSTRVHALNNVNKALRVLQNNNVDLVNIGSTDIVDGNHKLTLGLIWNIIL

HWQVKNVMKNIMAGLQQTNSEKILLSWVRQSTRNYPQVNVINFTTSWSDGLALNALIH

SHRPDLFDWNSVVCQQSATQRLEHAFNIARYQLGIEKLLDPEDVDTTYPDKKSILMYIT

SLFQVLPQQVSIEAIQEVEMLPRPPKVTKEEHFQLHHQMHYSQQITVSLAQGYERTSSPK

PRFKSYAYTQAAYVTTSDPTRSPFPSQHLEAPEDKSFGSSLMESEVNLDRYQTALEEVLS

WLLSAEDTLQAQGEISNDVEVVKDQFHTHEGYMMDLTAHQGRVGNILQLGSKLIGTG

KLSEDEETEVQEQMNLLNSRWECLRVASMEKQSNLHRVLMDLQNQKLKELNDWLTK

TEERTRKMEEEPLGPDLEDLKRQVQQHKVLQEDLEQEQVRVNSLTHMVVVVDESSGD

HATAALEEQLKVLGDRWANICRWTEDRWVLLQDILLKWQRLTEEQCLFSAWLSEKED

AVNKIHTTGFKDQNEMLSSLQKLAVLKADLEKKKQSMGKLYSLKQDLLSTLKNKSVT

QKTEAWLDNFARCWDNLVQKLEKSTAQISQAVTTTQPSLTQTTVMETVTTVTTREQIL

VKHAQEELPPPPPQKKRQITVDSEIRKRLDVDITELHSWITRSEAVLQSPEFAIFRKEGNF

SDLKEKVNAIEREKAEKFRKLQDASRSAQALVEQMVNEGVNADSIKQASEQLNSRWIE

FCQLLSERLNWLEYQNNIIAFYNQLQQLEQMTTTAENWLKIQPTTPSEPTAIKSQLKICK

DEVNRLSDLQPQIERLKIQSIALKEKGQGPMFLDADFVAFTNHFKQVFSDVQAREKELQ

TIFDTLPPMRYQETMSAIRTWVQQSETKLSIPQLSVTDYEIMEQRLGELQALQSSLQEQQ

SGLYYLSTTVKEMSKKAPSEISRKYQSEFEEIEGRWKKLSSQLVEHCQKLEEQMNKLRK

IQNHIQTLKKWMAEVDVFLKEEWPALGDSEILKKQLKQCRLLVSDIQTIQPSLNSVNEG

GQKIKNEAEPEFASRLETELKELNTQWDHMCQQVYARKEALKGGLEKTVSLQKDLSE

MHEWMTQAEEEYLERDFEYKTPDELQKAVEEMKRAKEEAQQKEAKVKLLTESVNSVI

AQAPPVAQEALKKELETLTTNYQWLCTRLNGKCKTLEEVWACWHELLSYLEKANKW

LNEVEFKLKTTENIPGGAEEISEVLDSLENLMRHSEDNPNQIRILAQTLTDGGVMDELIN

EELETFNSRWRELHEEAVRRQKLLEQSIQSAQETEKSLHLIQESLTFIDKQLAAYIADKV

DAAQMPQEAQKIQSDLTSHEISLEEMKKHNQGKEAAQRVLSQIDVAQKKLQDVSMKF

RLFQKPANFEQRLQESKMILDEVKMHLPALETKSVEQEVVQSQLNHCVNLYKSLSEVK

SEVEMVIKTGRQIVQKKQTENPKELDERVTALKLHYNELGAKVTERKQQLEKCLKLSR

KMRKEMNVLTEWLAATDMELTKRSAVEGMPSNLDSEVAWGKATQKEIEKQKVHLKSI

TEVGEALKTVLGKKETLVEDKLSLLNSNWIAVTSRAEEWLNLLLEYQKHMETFDQNVD

HITKWIIQADTLLDESEKKKPQQKEDVLKRLKAELNDIRPKVDSTRDQAANLMANRGD

HCRKLVEPQISELNHRFAAISHRIKTGKASIPLKELEQFNSDIQKLLEPLEAEIQQGVNLK

EEDFNKDMNEDNEGTVKELLQRGDNLQQRITDERKREEIKIKQQLLQTKHNALKDLRS

QRRKKALEISHQWYQYKRQADDLLKCLDDIEKKLASLPEPRDERKIKEIDRELQKKKEE

LNAVRRQAEGLSEDGAAMAVEPTQIQLSKRWREIESKFAQFRRLNFAQIHTVREETMM

VMTEDMPLEISYVPSTYLTEITHVSQALLEVEQLLNAPDLCAKDFEDLFKQEESLKNIKD

SLQQSSGRIDIIHSKKTAALQSATPVERVKLQEALSQLDFQWEKVNKMYKDRQGRFDRS

VEKWRRFHYDIKIFNQWLTEAEQFLRKTQIPENWEHAKYKWYLKDLQGEIEAHTDVYH

NLDENSQKILRSLEGSDDAVLLQRRLDNMNFKWSELRKKSLNIRSHLEASSDQWKRLH

LSLQELLVWLQLKDDELSRQAPIGGDFPAVQKQNDVHRAFKRELKTKEPVIMSTLETVR

IFLTEQPLEGLEKLYQEPRELPPEERAQNVTRLLRKQAEEVNTEWEKLNLHSADWQRKI

DETLERLRELQEATDELDLKLRQAEVIKGSWQPVGDLLIDSLQDHLEKVKALRGEIAPL

KENVSHVNDLARQLTTLGIQLSPYNLSTLEDLNTRWKLLQVAVEDRVRQLHEAHRDFG

PASQHFLSTSVQGPWERAISPNKVPYYINHETQTTCWDHPKMTELYQSLADLNNVRFSA

YRTAMKLRRLQKALCLDLLSLSAACDALDQHNLKQNDQPMDILQIINCLTTIYDRLEQE

HNNLVNVPLCVDMCLNWLLNVYDTGRTGRIRVLSFKTGIISLCKAHLEDKYRYLFKQV

ASSTGFCDQRRLGLLLHDSIQIPRQLGEVASFGGSNIEPSVRSCFQFANNKPEIEAALFLD

WMRLEPQSMVWLPVLHRVAAAETAKHQAKCNICKECPIIGFRYRSLKHFNYDICQSCFF

SGRVAKGHKMHYPMVEYCTPTTSGEDVRDFAKVLKNKFRTKRYFAKHPRMGYLPVQ

TVLEGDNMETPVTLINFWPVDSAPASSPQLSHDDTHSRIEHYASRLAEMENSNGSYLND

SISPNESIDDEHLLIQHYCQSLNQDSPLSQPRSPAQILISLESEERGELERILADLEEENRNL

QAEYDRLKQQHEHKGLSPLPSPPEMMPTSPQSPRDAELIAEAKLLRQHKGRLEARMQIL

EDHNKQLESQLHRLRQLLEQPQAEAKVNGTTVSSPSTSLQRSDSSQPMLLRVVGSQTSD

SMGEEDLLSPPQDTSTGLEEVMEQLNNSFPSSRGRNTPGKPMREDTM

SEQ ID NO:6

AAGGATTATGTATTACCTCCCG

SEQ ID NO:7

TTCCTAATACATAATGGAGGGC

SEQ ID NO:8

TAAGATTGGGTATGAGGGATAG

SEQ ID NO:9

ATTCTAACCCATACTCCCTATC

SEQ ID NO:10

CTACATGGTGTATCTGACTAAG

SEQ ID NO:11

GATGTACCACATAGACTGATTC

SEQ ID NO:12

CTGGCCGAAGTATAGGAATATG

SEQ ID NO:13

GACCGGCTTCATATCCTTATAC

SEQ ID NO:14

AAGGATTAT

SEQ ID NO:15

TTCCTAATA

SEQ ID NO:16

TAAGATTGG

SEQ ID NO:17

ATTCTAACC

SEQ ID NO:18

CTACATGGT

SEQ ID NO:19

GATGTACCA

SEQ ID NO:20

CTGGCCGAA

SEQ ID NO:21

GACCGGCTT

SEQ ID NO:22

TACCTCCCG

SEQ ID NO:23

ATGGAGGGC

SEQ ID NO:24

GAGGGATAG

SEQ ID NO:25

CTCCCTATC

SEQ ID NO:26

CTGACTAAG

SEQ ID NO:27

GACTGATTC

SEQ ID NO:28

AGGAATATG

SEQ ID NO:29

TCCTTATAC

SEQ ID NO:30

AAGGATTATGTATGAGGGATAG

SEQ ID NO:31

TTCCTAATACATACTCCCTATC

SEQ ID NO:32

AAGGATTATGTATCTGACTAAG

SEQ ID NO:33

TTCCTAATACATAGACTGATTC

SEQ ID NO:34

AAGGATTATGTATAGGAATATG

SEQ ID NO:35

TTCCTAATACATATCCTTATAC

SEQ ID NO:36

MNTKYNKEFLLYLAGFVDSDGSIYATIRPVQSTKFKHTLRLWFAVTQKTQRRWFLDKLVDEIGVGYVYDNGSVSWYYLSEIKPLHNFLTQLQPFLKLKQKQANLVLKIIEQLPSAKESPDKFLEVCTWVDQIAALNDSKTRKTTSETVRAVLDSLPGSVGGLSPSQASSAASSASSSPGSGISEALRAGAGSGTGYNKEFLLYLAGFVDGDGSICACIVPRQDRKFKHQLRLFFEVGQKTKRRWFLDKLVDEIGVGYVEDTGRASRYRLSQIKPLHNFLTQLQPFLKLKQKQANLVLKIIEQLPSAKESPDKFLEVCTWVDQIAALNDSRTRKTTSETVRAVLDSLSEKKKSSP

SEQ ID NO:37

MNTKYNKEFLLYLAGFVDSDGSIFAVIEPVQSAKFKHRLKLSFVVTQKTQRRWFLDKLVDEIGVGYVYDQGSVSFYRLSEIKPLHNFLTQLQPFLKLKQKQANLVLKIIEQLPSAKESPDKFLEVCTWVDQIAALNDSKTRKTTSETVRAVLDSLPGSVGGLSPSQASSAASSASSSPGSGISEALRAGAGSGTGYNKEFLLYLAGFVDGDGSICACIVPRQDRKFKHQLRLFFEVGQTTRRRWFLDKLVDEIGVGYVFDKGSASMYRLSEIKPLHNFLTQLQPFLKLKQKQANLVLKIIEQLPSAKESPDKFLEVCTWVDQIAALNDSRTRKTTSETVRAVLDSLSEKKKSSP

SEQ ID NO:38

MNTKYNKEFLLYLAGFVDSDGSIYASIMPIQTAKFKHRLKLQFAVAQKTQRRWFLDKLVDEIGVGYVYDFGSVSYYRLSQIKPLHNFLTQLQPFLKLKQKQANLVLKIIEQLPSAKESPDKFLEVCTWVDQIAALNDSKTRKTTSETVRAVLDSLPGSVGGLSPSQASSAASSASSSPGSGISEALRAGAGSGTGYNKEFLLYLAGFVDGDGSICACIVPRQDRKFKHQLRLFFEVGQKTQRRWFLDKLVDEIGVGYVRDLGSASTYRLSEIKPLHNFLTQLQPFLKLKQKQANLVLKIIEQLPSAKESPDKFLEVCTWVDQIAALNDSRTRKTTSETVRAVLDSLSEKKKSSP

SEQ ID NO:39

MNTKYNKEFLLYLAGFVDSDGSIIAFIMPSQTAKFKHRLKLQFAVAQKTQRRWFLDKLVDEIGVGYVYDFGSVSYYRLSQIKPLHNFLTQLQPFLKLKQKQANLVLKIIEQLPSAKESPDKFLEVCTWVDQIAALNDSKTRKTTSETVRAVLDSLPGSVGGLSPSQASSAASSASSSPGSGISEALRAGAGSGTGYNKEFLLYLAGFVDGDGSICACIVPRQDRKFKHQLRLFFEIGQKTQRRWFLDKLVDEIGVGYVRDLGSASTYRLSQIKPLHNFLTQLQPFLKLKQKQANLVLKIIEQLPSAKESPDKFLEVCTWVDQIAALNDSKTRKTTSETVRAVLDSLSEKKKSSP

SEQ ID NO:40

MNTKYNKEFLLYLAGFVDSDGSIMAFIMPTQTAKFKHRLKLQFAVAQKTQRRWFLDKLVDEIGVGYVYDFGSVSYYRLSEIKPLHNFLTQLQPFLKLKQKQANLVLKIIEQLPSAKESPDKFLEVCTWVDQIAALNDSKTRKTTSETVRAVLDSLPGSVGGLSPSQASSAASSASSSPGSGISEALRAGAGSGTGYNKEFLLYLAGFVDGDGSICACIVPRQDRKFKHQLRLFFEVGQKTQRRWFLDKLVDEIGVGYVRDLGSASTYRLSQIKPLHNFLTQLQPFLKLKQKQANLVLKIIEQLPSAKESPDKFLEVCTWVDQIAALNDSRTRKTTSETVRAVLDSLSEKKKSSP

SEQ ID NO:41

MNTKYNKEFLLYLAGFVDSDGSIMAFILPEQHMKFKHRLRLQFAVAQKTQRRWFLDKLVDEIGVGYVYDFGSVSYYRLSEIKPLHNFLTQLQPFLKLKQKQANLVLKIIEQLPSAKESPDKFLEVCTWVDQIAALNDSKTRKTTSETVRAVLDSLPGSVGGLSPSQASSAASSASSSPGSGISEALRAGAGSGTGYNKEFLLYLAGFVDGDGSICACIVPRQDRKFKHQLRLFFEVGQKTQRRWFLDKLVDEIGVGYVRDLGSASTYRLSEIKPLHNFLTQLQPFLKLKQKQANLVLKIIEQLPSAKESPDKFLEVCTWVDQIAALNDSRTRKTTSETVRAVLDSLSEKKKSSP

SEQ ID NO:42

MNTKYNKEFLLYLAGFVDSDGSIMAFILPEQHLKFKHRLRLQFAVAQKTQRRWFLDKLVDEIGVGYVYDFGSVSYYRLSEIKPLHNFLTQLQPFLKLKQKQANLVLKIIEQLPSAKESPDKFLEVCTWVDQIAALNDSKTRKTTSETVRAVLDSLPGSVGGLSPSQASSAASSASSSPGSGISEALRAGAGSGTGYNKEFLLYLAGFVDGDGSICACIVPRQDRKFKHQLRLFFEVGQKTQRRWFLDKLVDEIGVGYVRDLGSASTYRLSEIKPLHNFLTQLQPFLKLKQKQANLVLKIIEQLPSAKESPDKFLEVCTWVDQIAALNDSRTRKTTSETVRAVLDSLSEKKKSSP

SEQ ID NO:43

MNTKYNKEFLLYLAGFVDSDGSIMAFILPEQGLKFKHRLRLQFAVAQKTQRRWFLDKLVDEIGVGYVYDFGSVSYYRLSQIKPLHNFLTQLQPFLKLKQKQANLVLKIIEQLPSAKESPDKFLEVCTWVDQIAALNDSKTRKTTSETVRAVLDSLPGSVGGLSPSQASSAASSASSSPGSGISEALRAGAGSGTGYNKEFLLYLAGFVDGDGSICACIVPRQDRKFKHQLRLFFEVGQKTQRRWFLDKLVDEIGVGYVRDLGSASTYRLSQIKPLHNFLTQLQPFLKLKQKQANLVLKIIEQLPSAKESPDKFLEVCTWVDQIAALNDSRTRKTTSETVRAVLDSLSEKKKSSP

SEQ ID NO:44

MNTKYNKEFLLYLAGFVDSDGSIMAFIMPDQAPKFKHRLRLQFAVAQKTQRRWFLDKLVDEIGVGYVYDFGSVSYYRLSEIKPLHNFLTQLQPFLKLKQKQANLVLKIIEQLPSAKESPDKFLEVCTWVDQIAALNDSKTRKTTSETVRAVLDSLPGSVGGLSPSQASSAASSASSSPGSGISEALRAGAGSGTGYNKEFLLYLAGFVDGDGSICACIVPRQDRKFKHQLRLFFEVGQKTQRRWFLDKLVDEIGVGYVRDLGSASTYRLSQIKPLHNFLTQLQPFLKLKQKQANLVLKIIEQLPSAKESPDKFLEVCTWVDQIAALNDSRTRKTTSETVRAVLDSLSEKKKSSP

SEQ ID NO:45

MNTKYNKEFLLYLAGFVDADGSIYACIKPHQQLKFKHQLLLYFEVYQKTQRRWFLDKLVDEIGVGYVADRGSVSEYRLSQIKPLHNFLTQLQPFLKLKQKQANLVLKIIEQLPSAKESPDKFLEVCTWVDQIAALNDSKTRKTTSETVRAVLDSLPGSVGGLSPSQASSAASSASSSPGSGISEALRAGAGSGTGYNKEFLLYLAGFVDGDGSIFASIMPTQWTKFKHSLLLRFRVTQSTRRRWFLDKLMDEIGVGYVSDQGRASYYTLSEIKPLHNFLTQLQPFLKLKQKQANLVLKIIEQLPSAKESPDKFLEVCTWVDQIAALNDSRTRKTTSETVRAVLDSLSEKKKSSP

SEQ ID NO:46

MNTKYNKEFLLYLAGFVDADGSIYACIKPHQQLKFKHQLLLYFEVYQKTQRRWFLDKLVDEIGVGYVIDSGSVSTYRLSQIKPLHNFLTQLQPFLKLKQKQANLVLKIIEQLPSAKESPDKFLEVCTWVDQIAALNDSKTRKTTSETVRAVLDSLPGSVGGLSPSQASSAASSASSSPGSGISEALRAGAGSGTGYNKEFLLYLAGFVDGDGSIFASIIPSQLVKFKHTLLLRFRVTQATRRRWFLDKLVDEIGVGYVTDNGRASYYTLSEIKPLHNFLTQLQPFLKLKQKQANLVLKIIEQLPSAKESPDKFLEVCTWVDQIAALNDSRTRKTTSETVRAVLDSLSEKKKSSP

SEQ ID NO:47

MNTKYNKEFLLYLAGFVDADGSIYACIKPHQQLKFKHQLLLYFEVYQKTQRRWFLDKL

VDEIGVGYVADRGSVSEYRLSQIKPLHNFLTQLQPFLKLKQKQANLVLKIIEQLPSAKES

PDKFLEVCTWVDQIAALNDSKTRKTTSETVRAVLDSLPGSVGGLSPSQASSAASSASSSP

GSGISEALRAGAGSGTGYNKEFLLYLAGFVDGDGSIFASIIPSQLVKFKHTLLLRFRVCQ

ATKRRWFLDKLVDEIGVGYVSDQGSASYYTLSEIKPLHNFLTQLQPFLKLKQKQANLVL

KIIEQLPSAKESPDKFLEVCTWVDQIAALNDSRTRKTTSETVRAVLDSLSEKKKSSP

SEQ ID NO:48

MNTKYNKEFLLYLAGFVDSDGSIYACIKPHQQLKFKHQLLLYFEVYQKTQRRWFLDKL

VDEIGVGYVADRGSVSEYRLSQIKPLHNFLTQLQPFLKLKQKQANLVLKIIEQLPSAKES

PDKFLEVCTWVDQIAALNDSKTRKTTSETVRAVLDSLPGSVGGLSPSQASSAASSASSSP

GSGISEALRAGAGSGTGYNKEFLLYLAGFVDGDGSIFASIIPSQEVKFKHTLLLRFRVCQ

ATKRRWFLDKLVDEIGVGYVSDQGSASYYTLSEIKPLHNFLTQLQPFLKLKQKQANLVL

KIIEQLPSAKESPDKFLEVCTWVDQIAALNDSRTRKTTSETVRAVLDSLSEKKKSSP

SEQ ID NO:49

MNTKYNKEFLLYLAGFVDADGSIYACIKPHQQLKFKHQLLLYFEVYQKTQRRWFLDKL

VDEIGVGYVADRGSVSEYRLSQIKPLHNFLTQLQPFLKLKQKQANLVLKIIEQLPSAKES

PDKFLEVCTWVDQIAALNDSKTRKTTSETVRAVLDSLPGSVGGLSPSQASSAASSASSSP

GSGISEALRAGAGSGTGYNKEFLLYLAGFVDGDGSIFASIIPSQEVKFKHTLLLRFRVCQ

ATKRRWFLDKLVDEIGVGYVSDQGSASYYTLSEIKPLHNFLTQLQPFLKLKQKQANLVL

KIIEQLPSAKESPDKFLEVCTWVDQIAALNDSRTRKTTSETVRAVLDSLSEKKKSSP

SEQ ID NO:50

MNTKYNKEFLLYLAGFVDADGSIYACIKPHQQLKFKHQLLLYFEVYQKTQRRWFLDKL

VDEIGVGYVADRGSVSEYRLSQIKPLHNFLTQLQPFLKLKQKQANLVLKIIEQLPSAKES

PDKFLEVCTWVDQIAALNDSKTRKTTSETVRAVLDSLPGSVGGLSPSQASSAASSASSSP

GSGISEALRAGAGSGTGYNKEFLLYLAGFVDGDGSIFASIIPSQEVKFKHTLLLRFRVTQ

ATKRRWFLDKLVDEIGVGYVSDVGSASYYTLSEIKPLHNFLTQLQPFLKLKQKQANLVL

KIIEQLPSAKESPDKFLEVCTWVDQIAALNDSRTRKTTSETVRAVLDSLSEKKKSSP

SEQ ID NO:51

MNTKYNKEFLLYLAGFVDSDGSIYACIKPHQQLKFKHQLLLYFEVYQKTQRRWFLDKL

VDEIGVGYVADRGSVSEYRLSQIKPLHNFLTQLQPFLKLKQKQANLVLKIIEQLPSAKES

PDKFLEVCTWVDQIAALNDSKTRKTTSETVRAVLDSLPGSVGGLSPSQASSAASSASSSP

GSGISEALRAGAGSGTGYNKEFLLYLAGFVDGDGSIFASIIPSQEVKFKHTLLLRFRVCQ

ATKRRWFLDKLVDEIGVGYVSDRGSASYYTLSEIKPLHNFLTQLQPFLKLKQKQANLVL

KIIEQLPSAKESPDKFLEVCTWVDQIAALNDSRTRKTTSETVRAVLDSLSEKKKSSP

SEQ ID NO:52

MNTKYNKEFLLYLAGFVDADGSIYACIKPHQELKFKHQLLLYFEVYQKTQRRWFLDKLVDEIGVGYVADRGSVSEYRLSEIKPLHNFLTQLQPFLKLKQKQANLVLKIIEQLPSAKESPDKFLEVCTWVDQIAALNDSKTRKTTSETVRAVLDSLPGSVGGLSPSQASSAASSASSSPGSGISEALRAGAGSGTGYNKEFLLYLAGFVDGDGSIFASIIPSQEVKFKHTLLLRFRVCQATKRRWFLDKLVDEIGVGYVSDQGSASYYTLSQIKPLHNFLTQLQPFLKLKQKQANLVLKIIEQLPSAKESPDKFLEVCTWVDQIAALNDSRTRKTTSETVRAVLDSLSEKKKSSP

SEQ ID NO:53

MNTKYNKEFLLYLAGFVDSDGSIVATIRPGQELKFKHGLRLRFYVCQKTQRRWFLDKLVDEIGVGYVTDSGSVSRYELSQIKPLHNFLTQLQPFLKLKQKQANLVLKIIEQLPSAKESPDKFLEVCTWVDQIAALNDSKTRKTTSETVRAVLDSLPGSVGGLSPSQASSAASSASSSPGSGISEALRAGAGSGTGYNKEFLLYLAGFVDGDGSIFACIRPSQRAKFKHVLQLCFRVHQLTKRRWFLDKLVDEIGVGYVYDCGSASFYHLSQIKPLHNFLTQLQPFLKLKQKQANLVLKIIEQLPSAKESPDKFLEVCTWVDQIAALNDSKTRKTTSETVRAVLDSLSEKKKSSP

SEQ ID NO:54

MNTKYNKEFLLYLAGFVDADGSIVATIRPGQELKFKHGLRLRFYVCQKTQRRWFLDKLVDEIGAGYVTDSGSVSRYELSQIKPLHNFLTQLQPFLKLKQKQANLVLKIIEQLPSAKESPDKFLEVCTWVDQIAALNDSKTRKTTSETVRAVLDSLPGSVGGLSPSQASSAASSASSSPGSGISEALRAGAGSGTGYNKEFLLYLAGFVDGDGSIFACIRPSQRAKFKHVLQLCFRVHQKTKRRWFLDKLVDEIGVGYVYDHGSASCYHLSEIKPLHNFLTQLQPFLKLKQKQANLVLKIIEQLPSAKESPDKFLEVCTWVDQIAALNDSHTRKTTSETVRAVLDSLSEKKKSSP

SEQ ID NO:55

MNTKYNKEFLLYLAGFVDADGSIVATIRPGQELKFKHGLRLRFYVCQKTQRRWFLDKLVDEIGVGYVTDSGSVSRYELSQIKPLHNFLTQLQPFLKLKQKQANLVLKIIEQLPSAKESPDKFLEVCTWVDQIAALNDSKTRKTTSETVRAVLDSLPGSVGGLSPSQASSAASSASSSPGSGISEALRAGAGSGTGYNKEFLLYLAGFVDGDGSIFACIRPSQRAKFKHVLQLCFRVHQSTRRRWFLDKLVDEIGAGYVYDHGSASLYSLSQIKPLHNFLTQLQPFLKLKQKQANLVLKIIEQLPSAKESPDKFLEVCTWVDQIAALNDSHTRKTTSETVRAVLDSLSEKKKSSP

SEQ ID NO:56

MNTKYNKEFLLYLAGFVDSDGSIVASIAPAQDCKFKHRLRLRFFVSQKTQRRWFLDKLVDEIGVGYVSDSGSVSSYVLSEIKPLHNFLTQLQPFLKLKQKQANLVLKIIEQLPSAKESPDKFLEVCTWVDQIAALNDSKTRKTTSETVRAVLDSLPGSVGGLSPSQASSAASSASSSPGSGISEALRAGAGSGTGYNKEFLLYLAGFVDGDGSIFACIRPSQRAKFKHVLQLCFRVFQKTQRRWFLDKLVDEIGVGYVYDHGRASIYQLSQIKPLHNFLTQLQPFLKLKQKQANLVLKIIEQLPSAKESPDKFLEVCTWVDQIAALNDSHTRKTTSETVRAVLDSLSEKKKSSP

SEQ ID NO:57

MNTKYNKEFLLYLAGFVDSDGSIVARIEPAQDCKFKHRLRLQFFVSQKTQRRWFLDKLVDEIGVGYVRDSGSVSSYDLSQIKPLHNFLTQLQPFLKLKQKQANLVLKIIEQLPSAKESPDKFLEVCTWVDQIAALNDSKTRKTTSETVRAVLDSLPGSVGGLSPSQASSAASSASSSPGSGISEALRAGAGSGTGYNKEFLLYLAGFVDGDGSIFACIRPSQRAKFKHVLQLHFRVFQKTQRRWFLDKLVDEIGVGYVYDHGRASIYQLSQIKPLHNFLTQLQPFLKLKQKQANLVLKIIEQLPSAKESPDKFLEVCTWVDQIAALNDSHTRKTTSETVRAVLDSLSEKKKSSP

SEQ ID NO:58

MNTKYNKEFLLYLAGFVDSDGSIVARIEPAQDCKFKHRLRLQFFVSQKTQRRWFLDKLVDEIGVGYVRDSGSVSSYLLSQIKPLHNFLTQLQPFLKLKQKQANLVLKIIEQLPSAKESPDKFLEVCTWVDQIAALNDSKTRKTTSETVRAVLDSLPGSVGGLSPSQASSAASSASSSPGSGISEALRAGAGSGTGYNKEFLLYLAGFVDGDGSIFACIRPSQRAKFKHVLQLCFRVFQKTQRRWFLDKLVDEIGVGYVYDHGRASIYQLSQIKPLHNFLTQLQPFLKLKQKQANLVLKIIEQLPSAKESPDKFLEVCTWVDQIAALNDSHTRKTTSETVRAVLDSLSEKKKSSP

SEQ ID NO:59

MNTKYNKEFLLYLAGFVDADGSIVARIEPAQDCKFKHRLRLQFFVSQKTQRRWFLDKLVDEIGVGYVRDSGSVSSYNLSEIKPLHNFLTQLQPFLKLKQKQANLVLKIIEQLPSAKESPDKFLEVCTWVDQIAALNDSKTRKTTSETVRAVLDSLPGSVGGLSPSQASSAASSASSSPGSGISEALRAGAGSGTGYNKEFLLYLAGFVDGDGSIFACIRPSQRAKFKHVLQLCFRVFQKTQRRWFLDKLVDEIGVGYVYDHGRASIYQLSQIKPLHNFLTQLQPFLKLKQKQANLVLKIIEQLPSAKESPDKFLEVCTWVDQIAALNDSHTRKTTSETVRAVLDSLSEKKKSSP

SEQ ID NO:60

ATGAATACAAAATATAATAAAGAGTTCTTACTCTACTTAGCAGGGTTTGTAGACTCTGACGGTTCCATCTATGCCACGATCCGGCCTGTTCAAAGTACTAAGTTCAAGCACACTCTGCGGCTCTGGTTCGCGGTCACGCAGAAGACACAGCGCCGTTGGTTCCTCGACAAGCTGGTGGACGAGATCGGTGTGGGTTACGTGTATGACAATGGCAGCGTCTCCTGGTACTATCTGTCCGAGATCAAGCCTTTGCATAATTTTTTAACACAACTACAACCTTTTCTAAAACTAAAACAAAAACAAGCAAATTTAGTTTTAAAAATTATTGAACAACTTCCGTCAGCAAAAGAATCCCCGGACAAATTCTTAGAAGTTTGTACATGGGTGGATCAAATTGCAGCTCTGAATGATTCGAAGACGCGTAAAACAACTTCTGAAACCGTTCGTGCTGTGCTAGACAGTTTACCAGGATCCGTGGGAGGTCTATCGCCATCTCAGGCATCCAGCGCCGCATCCTCGGCTTCCTCAAGCCCGGGTTCAGGGATCTCCGAAGCACTCAGAGCTGGAGCAGGTTCCGGCACTGGATACAACAAGGAATTCCTGCTCTACCTGGCGGGCTTCGTCGACGGGGACGGCTCCATCTGTGCCTGTATCGTGCCTCGTCAAGATCGGAAGTTCAAGCACCAGCTGCGGCTCTTTTTCGAGGTCGGTCAGAAGACAAAGCGCCGTTGGTT

CCTCGACAAGCTGGTGGACGAGATCGGTGTGGGTTACGTGGAGGACACGGGCAGGG

CGAGCAGGTACCGGCTGTCCCAGATCAAGCCTCTGCACAACTTCCTGACCCAGCTCC

AGCCCTTCCTGAAGCTCAAGCAGAAGCAGGCCAACCTCGTGCTGAAGATCATCGAG

CAGCTGCCCTCCGCCAAGGAATCCCCGGACAAGTTCCTGGAGGTGTGCACCTGGGT

GGACCAGATCGCCGCTCTGAACGACTCCAGGACCCGCAAGACCACTTCCGAAACCG

TCCGCGCCGTTCTAGACAGTCTCTCCGAGAAGAAGAAGTCGTCCCCCTAA

SEQ ID NO:61

ATGAATACAAAATATAATAAAGAGTTCTTACTCTACTTAGCAGGGTTTGTAGACTCT

GACGGTTCCATCTTTGCCGTTATCGAGCCTGTTCAAAGTGCTAAGTTCAAGCACCGG

CTGAAGCTCTCGTTCGTTGTCACTCAGAAGACACAGCGCCGTTGGTTCCTCGACAAG

CTGGTGGACGAGATCGGTGTGGGTTACGTGTATGACCAGGGCAGCGTCTCCTTTTAC

AGGCTGTCCGAGATCAAGCCTTTGCATAATTTTTTAACACAACTACAACCTTTTCTA

AAACTAAAACAAAAACAAGCAAATTTAGTTTTAAAAATTATTGAACAACTTCCGTC

AGCAAAAGAATCCCCGGACAAATTCTTAGAAGTTTGTACATGGGTGGATCAAATTG

CAGCTCTGAATGATTCGAAGACGCGTAAAACAACTTCTGAAACCGTTCGTGCTGTGC

TAGACAGTTTACCAGGATCCGTGGGAGGTCTATCGCCATCTCAGGCATCCAGCGCC

GCATCCTCGGCTTCCTCAAGCCCGGGTTCAGGGATCTCCGAAGCACTCAGAGCTGG

AGCAGGTTCCGGCACTGGATACAACAAGGAATTCCTGCTCTACCTGGCGGGCTTCGT

CGACGGGGACGGCTCCATCTGTGCCTGTATCGTGCCTCGTCAAGATCGGAAGTTCAA

GCACCAGCTGCGGCTCTTTTTCGAGGTCGGGCAGACGACAAGGCGCCGTTGGTTCCT

CGACAAGCTGGTGGACGAGATCGGTGTGGGTTACGTGTTTGACAAGGGCAGCGCGA

GCATGTACCGGCTGTCCGAGATCAAGCCTCTGCACAACTTCCTGACCCAGCTCCAGC

CCTTCCTGAAGCTCAAGCAGAAGCAGGCCAACCTCGTGCTGAAGATCATCGAGCAG

CTGCCCTCCGCCAAGGAATCCCCGGACAAGTTCCTGGAGGTGTGCACCTGGGTGGA

CCAGATCGCCGCTCTGAACGACTCCAGGACCCGCAAGACCACTTCCGAAACCGTCC

GCGCCGTTCTAGACAGTCTCTCCGAGAAGAAGAAGTCGTCCCCCTAA

SEQ ID NO:62

ATGAATACAAAATATAATAAAGAGTTCTTACTCTACTTAGCAGGGTTTGTAGACTCT

GACGGTTCCATCTATGCCAGTATCATGCCTATTCAAACGGCTAAGTTCAAGCACCGT

CTGAAGCTCCAGTTCGCGGTCGCTCAGAAGACACAGCGCCGTTGGTTCCTCGACAA

GCTGGTGGACGAGATCGGTGTGGGTTACGTGTATGACTTTGGCAGCGTCTCCTATTA

CAGGCTGTCCCAGATCAAGCCTTTGCATAATTTTTTAACACAACTACAACCTTTTCT

AAAACTAAAACAAAAACAAGCAAATTTAGTTTTAAAAATTATTGAACAACTTCCGT

CAGCAAAAGAATCCCCGGACAAATTCTTAGAAGTTTGTACATGGGTGGATCAAATT

GCAGCTCTGAATGATTCGAAGACGCGTAAAACAACTTCTGAAACCGTTCGTGCTGT

GCTAGACAGTTTACCAGGATCCGTGGGAGGTCTATCGCCATCTCAGGCATCCAGCG

CCGCATCCTCGGCTTCCTCAAGCCCGGGTTCAGGGATCTCCGAAGCACTCAGAGCTG

GAGCAGGTTCCGGCACTGGATACAACAAGGAATTCCTGCTCTACCTGGCGGGCTTC

GTCGACGGGGACGGCTCCATCTGTGCCTGTATCGTGCCTCGTCAAGATCGGAAGTTC

AAGCACCAGCTGCGGCTCTTTTTCGAGGTCGGTCAGAAGACACAGCGCCGTTGGTTC

CTCGACAAGCTGGTGGACGAGATCGGTGTGGGTTACGTGAGGGACCTTGGCAGCGC

GAGCACTTACCGTCTGTCCGAGATCAAGCCTCTGCACAACTTCCTGACCCAGCTCCA

GCCCTTCCTGAAGCTCAAGCAGAAGCAGGCCAACCTCGTGCTGAAGATCATCGAGC

AGCTGCCCTCCGCCAAGGAATCCCCGGACAAGTTCCTGGAGGTGTGCACCTGGGTG

GACCAGATCGCCGCTCTGAACGACTCCAGGACCCGCAAGACCACTTCCGAAACCGT

CCGCGCCGTTCTAGACAGTCTCTCCGAGAAGAAGAAGTCGTCCCCCTAA

SEQ ID NO:63

ATGAATACAAAATATAATAAAGAGTTCTTACTCTACTTAGCAGGGTTTGTAGACTCT

GACGGTTCCATCATTGCCTTTATCATGCCTAGTCAGACGGCTAAGTTCAAGCACCGT

CTGAAGCTCCAGTTCGCGGTCGCTCAGAAGACACAGCGCCGTTGGTTCCTCGACAA

GCTGGTGGACGAGATCGGTGTGGGTTACGTGTATGACTTTGGCAGCGTCTCCTATTA

CAGGCTGTCCCAGATCAAGCCTTTGCATAATTTTTTAACACAACTACAACCTTTTCT

AAAACTAAAACAAAAACAAGCAAATTTAGTTTTAAAAATTATTGAACAACTTCCGT

CAGCAAAAGAATCCCCGGACAAATTCTTAGAAGTTTGTACATGGGTGGATCAAATT

GCAGCTCTGAATGATTCGAAGACGCGTAAAACAACTTCTGAAACCGTTCGTGCTGT

GCTAGACAGTTTACCAGGATCCGTGGGAGGTCTATCGCCATCTCAGGCATCCAGCG

CCGCATCCTCGGCTTCCTCAAGCCCGGGTTCAGGGATCTCCGAAGCACTCAGAGCTG

GAGCAGGTTCCGGCACTGGATACAACAAGGAATTCCTGCTCTACCTGGCGGGCTTC

GTCGACGGGGACGGCTCCATCTGTGCCTGTATCGTGCCTCGTCAAGATCGGAAGTTC

AAGCACCAGCTGCGGCTCTTTTTCGAGATCGGTCAGAAGACACAGCGCCGTTGGTTC

CTCGACAAGCTGGTGGACGAGATCGGTGTGGGTTACGTGAGGGACCTTGGCAGCGC

GAGCACTTACCGTCTGTCCCAGATCAAGCCTCTGCACAACTTCCTGACCCAGCTCCA

GCCCTTCCTGAAGCTCAAGCAGAAGCAGGCCAACCTCGTGCTGAAGATCATCGAGC

AGCTGCCCTCCGCCAAGGAATCCCCGGACAAGTTCCTGGAGGTGTGCACCTGGGTG

GACCAGATCGCCGCTCTGAACGACTCCAAGACCCGCAAGACCACTTCCGAAACCGT

CCGCGCCGTTCTAGACAGTCTCTCCGAGAAGAAGAAGTCGTCCCCCTAA

SEQ ID NO:64

ATGAATACAAAATATAATAAAGAGTTCTTACTCTACTTAGCAGGGTTTGTAGACTCT

GACGGTTCCATCATGGCCTTTATCATGCCTACTCAGACGGCTAAGTTCAAGCACCGT

CTGAAGCTCCAGTTCGCGGTCGCTCAGAAGACACAGCGCCGTTGGTTCCTCGACAA

GCTGGTGGACGAGATCGGTGTGGGTTACGTGTATGACTTTGGCAGCGTCTCCTATTA

CAGGCTGTCCGAGATCAAGCCTTTGCATAATTTTTTAACACAACTACAACCTTTTCT

AAAACTAAAACAAAAACAAGCAAATTTAGTTTTAAAAATTATTGAACAACTTCCGT

CAGCAAAAGAATCCCCGGACAAATTCTTAGAAGTTTGTACATGGGTGGATCAAATT

GCAGCTCTGAATGATTCGAAGACGCGTAAAACAACTTCTGAAACCGTTCGTGCTGT

GCTAGACAGTTTACCAGGATCCGTGGGAGGTCTATCGCCATCTCAGGCATCCAGCG

CCGCATCCTCGGCTTCCTCAAGCCCGGGTTCAGGGATCTCCGAAGCACTCAGAGCTG

GAGCAGGTTCCGGCACTGGATACAACAAGGAATTCCTGCTCTACCTGGCGGGCTTC

GTCGACGGGGACGGCTCCATCTGTGCCTGTATCGTGCCTCGTCAAGATCGGAAGTTC

AAGCACCAGCTGCGGCTCTTTTTCGAGGTCGGTCAGAAGACACAGCGCCGTTGGTTC

CTCGACAAGCTGGTGGACGAGATCGGTGTGGGTTACGTGAGGGACCTTGGCAGCGC

GAGCACTTACCGTCTGTCCCAGATCAAGCCTCTGCACAACTTCCTGACCCAGCTCCA

GCCCTTCCTGAAGCTCAAGCAGAAGCAGGCCAACCTCGTGCTGAAGATCATCGAGC

AGCTGCCCTCCGCCAAGGAATCCCCGGACAAGTTCCTGGAGGTGTGCACCTGGGTG

GACCAGATCGCCGCTCTGAACGACTCCAGGACCCGCAAGACCACTTCCGAAACCGT

CCGCGCCGTTCTAGACAGTCTCTCCGAGAAGAAGAAGTCGTCCCCCTAA

SEQ ID NO:65

ATGAATACAAAATATAATAAAGAGTTCTTACTCTACTTAGCAGGGTTTGTAGACTCT

GACGGTTCCATCATGGCCTTTATCTTGCCTGAGCAGCATATGAAGTTCAAGCACCGT

CTGAGGCTCCAGTTCGCGGTCGCTCAGAAGACACAGCGCCGTTGGTTCCTCGACAA

GCTGGTGGACGAGATCGGTGTGGGTTACGTGTATGACTTTGGCAGCGTCTCCTATTA

CAGGCTGTCCGAGATCAAGCCTTTGCATAATTTTTTAACACAACTACAACCTTTTCT

AAAACTAAAACAAAAACAAGCAAATTTAGTTTTAAAAATTATTGAACAACTTCCGT

CAGCAAAAGAATCCCCGGACAAATTCTTAGAAGTTTGTACATGGGTGGATCAAATT

GCAGCTCTGAATGATTCGAAGACGCGTAAAACAACTTCTGAAACCGTTCGTGCTGT

GCTAGACAGTTTACCAGGATCCGTGGGAGGTCTATCGCCATCTCAGGCATCCAGCG

CCGCATCCTCGGCTTCCTCAAGCCCGGGTTCAGGGATCTCCGAAGCACTCAGAGCTG

GAGCAGGTTCCGGCACTGGATACAACAAGGAATTCCTGCTCTACCTGGCGGGCTTC

GTCGACGGGGACGGCTCCATCTGTGCCTGTATCGTGCCTCGTCAAGATCGGAAGTTC

AAGCACCAGCTGCGGCTCTTTTTCGAGGTCGGTCAGAAGACACAGCGCCGTTGGTTC

CTCGACAAGCTGGTGGACGAGATCGGTGTGGGTTACGTGAGGGACCTTGGCAGCGC

GAGCACTTACCGTCTGTCCGAGATCAAGCCTCTGCACAACTTCCTGACCCAGCTCCA

GCCCTTCCTGAAGCTCAAGCAGAAGCAGGCCAACCTCGTGCTGAAGATCATCGAGC

AGCTGCCCTCCGCCAAGGAATCCCCGGACAAGTTCCTGGAGGTGTGCACCTGGGTG

GACCAGATCGCCGCTCTGAACGACTCCAGGACCCGCAAGACCACTTCCGAAACCGT

CCGCGCCGTTCTAGACAGTCTCTCCGAGAAGAAGAAGTCGTCCCCCTAA

SEQ ID NO:66

ATGAATACAAAATATAATAAAGAGTTCTTACTCTACTTAGCAGGGTTTGTAGACTCT

GACGGTTCCATCATGGCCTTTATCTTGCCTGAGCAGCATCTTAAGTTCAAGCACCGT

CTGAGGCTCCAGTTCGCGGTCGCTCAGAAGACACAGCGCCGTTGGTTCCTCGACAA

GCTGGTGGACGAGATCGGTGTGGGTTACGTGTATGACTTTGGCAGCGTCTCCTATTA

CAGGCTGTCCGAGATCAAGCCTTTGCATAATTTTTTAACACAACTACAACCTTTTCT

AAAACTAAAACAAAAACAAGCAAATTTAGTTTTAAAAATTATTGAACAACTTCCGT

CAGCAAAAGAATCCCCGGACAAATTCTTAGAAGTTTGTACATGGGTGGATCAAATT

GCAGCTCTGAATGATTCGAAGACGCGTAAAACAACTTCTGAAACCGTTCGTGCTGT

GCTAGACAGTTTACCAGGATCCGTGGGAGGTCTATCGCCATCTCAGGCATCCAGCG

CCGCATCCTCGGCTTCCTCAAGCCCGGGTTCAGGGATCTCCGAAGCACTCAGAGCTG

GAGCAGGTTCCGGCACTGGATACAACAAGGAATTCCTGCTCTACCTGGCGGGCTTC

GTCGACGGGGACGGCTCCATCTGTGCCTGTATCGTGCCTCGTCAAGATCGGAAGTTC

AAGCACCAGCTGCGGCTCTTTTTCGAGGTCGGTCAGAAGACACAGCGCCGATGGTT

CCTCGACAAGCTGGTGGACGAGATCGGTGTGGGTTACGTGAGGGACCTTGGCAGCG

CGAGCACTTACCGTCTGTCCGAGATCAAGCCTCTGCACAACTTCCTGACCCAGCTCC

AGCCCTTCCTGAAGCTCAAGCAGAAGCAGGCCAACCTCGTGCTGAAGATCATCGAG

CAGCTGCCCTCCGCCAAGGAATCCCCGGACAAGTTCCTGGAGGTGTGCACCTGGGT

GGACCAGATCGCCGCTCTGAACGACTCCAGGACCCGCAAGACCACTTCCGAAACCG

TCCGCGCCGTTCTAGACAGTCTCTCCGAGAAGAAGAAGTCGTCCCCCTAA

SEQ ID NO:67

ATGAATACAAAATATAATAAAGAGTTCTTACTCTACTTAGCAGGGTTTGTAGACTCT

GACGGTTCCATCATGGCCTTTATCTTGCCTGAGCAGGGTCTGAAGTTCAAGCACCGT

CTGAGGCTCCAGTTCGCGGTCGCTCAGAAGACACAGCGCCGTTGGTTCCTCGACAA

GCTGGTGGACGAGATCGGTGTGGGTTACGTGTATGACTTTGGCAGCGTCTCCTATTA

CAGGCTGTCCCAGATCAAGCCTTTGCATAATTTTTTAACACAACTACAACCTTTTCT

AAAACTAAAACAAAAACAAGCAAATTTAGTTTTAAAAATTATTGAACAACTTCCGT

CAGCAAAAGAATCCCCGGACAAATTCTTAGAAGTTTGTACATGGGTGGATCAAATT

GCAGCTCTGAATGATTCGAAGACGCGTAAAACAACTTCTGAAACCGTTCGTGCTGT

GCTAGACAGTTTACCAGGATCCGTGGGAGGTCTATCGCCATCTCAGGCATCCAGCG

CCGCATCCTCGGCTTCCTCAAGCCCGGGTTCAGGGATCTCCGAAGCACTCAGAGCTG

GAGCAGGTTCCGGCACCGGATACAACAAGGAATTCCTGCTCTACCTGGCGGGCTTC

GTCGACGGGGACGGCTCCATCTGTGCCTGTATCGTGCCTCGTCAAGATCGGAAGTTC

AAGCACCAGCTGCGGCTCTTTTTCGAGGTCGGTCAGAAGACACAGCGCCGTTGGTTC

CTCGACAAGCTGGTGGACGAGATCGGTGTGGGTTACGTGAGGGACCTTGGCAGCGC

GAGCACTTACCGTCTGTCCCAGATCAAGCCTCTGCACAACTTCCTGACCCAGCTCCA

GCCCTTCCTGAAGCTCAAGCAGAAGCAGGCCAACCTCGTGCTGAAGATCATCGAGC

AGCTGCCCTCCGCCAAGGAATCCCCGGACAAGTTCCTGGAGGTGTGCACCTGGGTG

GACCAGATCGCCGCTCTGAACGACTCCAGGACCCGCAAGACCACTTCCGAAACCGT

CCGCGCCGTTCTAGACAGTCTCTCCGAGAAGAAGAAGTCGTCCCCCTAA

SEQ ID NO:68

ATGAATACAAAATATAATAAAGAGTTCTTACTCTACTTAGCAGGGTTTGTAGACTCT

GACGGTTCCATCATGGCCTTTATCATGCCTGATCAGGCGCCTAAGTTCAAGCACCGT

CTGAGGCTCCAGTTCGCGGTCGCTCAGAAGACACAGCGCCGTTGGTTCCTCGACAA

GCTGGTGGACGAGATCGGTGTGGGTTACGTGTATGACTTTGGCAGCGTCTCCTATTA

CAGGCTGTCCGAGATCAAGCCTTTGCATAATTTTTTAACACAACTACAACCTTTTCT

AAAACTAAAACAAAAACAAGCAAATTTAGTTTTAAAAATTATTGAACAACTTCCGT

CAGCAAAAGAATCCCCGGACAAATTCTTAGAAGTTTGTACATGGGTGGATCAAATT

GCAGCTCTGAATGATTCGAAGACGCGTAAAACAACTTCTGAAACCGTTCGTGCTGT

GCTAGACAGTTTACCAGGATCCGTGGGAGGTCTATCGCCATCTCAGGCATCCAGCG

CCGCATCCTCGGCTTCCTCAAGCCCGGGTTCAGGGATCTCCGAAGCACTCAGAGCTG

GAGCAGGTTCCGGCACTGGATACAACAAGGAATTCCTGCTCTACCTGGCGGGCTTC

GTCGACGGGGACGGCTCCATCTGTGCCTGTATCGTGCCTCGTCAAGATCGGAAGTTC

AAGCACCAGCTGCGGCTCTTTTTCGAGGTCGGTCAGAAGACACAGCGCCGTTGGTTC

CTCGACAAGCTGGTGGACGAGATCGGTGTGGGTTACGTGAGGGACCTTGGCAGCGC

GAGCACTTACCGTCTGTCCCAGATCAAGCCTCTGCACAACTTCCTGACCCAGCTCCA

GCCCTTCCTGAAGCTCAAGCAGAAGCAGGCCAACCTCGTGCTGAAGATCATCGAGC

AGCTGCCCTCCGCCAAGGAATCCCCGGACAAGTTCCTGGAGGTGTGCACCTGGGTG

GACCAGATCGCCGCTCTGAACGACTCCAGGACCCGCAAGACCACTTCCGAAACCGT

CCGCGCCGTTCTAGACAGTCTCTCCGAGAAGAAGAAGTCGTCCCCCTAA

SEQ ID NO:69

ATGAATACAAAATATAATAAAGAGTTCTTACTCTACTTAGCAGGGTTTGTAGACGCT

GACGGTTCCATCTATGCCTGTATCAAGCCTCATCAACAGCTTAAGTTCAAGCACCAG

CTGTTGCTCTATTTCGAGGTCTATCAGAAGACACAGCGCCGTTGGTTCCTCGACAAG

CTGGTGGACGAGATCGGTGTGGGTTACGTGGCTGACCGTGGCAGCGTCTCCGAGTA

CCGTCTGTCCCAGATCAAGCCTTTGCATAATTTTTTAACACAACTACAACCTTTTCTA

AAACTAAAACAAAAACAAGCAAATTTAGTTTTAAAAATTATTGAACAACTTCCGTC

AGCAAAAGAATCCCCGGACAAATTCTTAGAAGTTTGTACATGGGTGGATCAAATTG

CAGCTCTGAATGATTCGAAGACGCGTAAAACAACTTCTGAAACCGTTCGTGCTGTGC

TAGACAGTTTACCAGGATCCGTGGGAGGTCTATCGCCATCTCAGGCATCCAGCGCC

GCATCCTCGGCTTCCTCAAGCCCGGGTTCAGGGATCTCCGAAGCACTCAGAGCTGG

AGCAGGTTCCGGCACTGGATACAACAAGGAATTCCTGCTCTACCTGGCGGGCTTCGT

CGACGGGGACGGCTCCATCTTTGCCTCTATCATGCCGACGCAGTGGACGAAGTTCA

AGCACTCGCTGTTGCTCCGGTTCCGGGTCACCCAGTCGACAAGGCGCCGTTGGTTCC

TCGACAAGCTGATGGACGAGATTGGTGTGGGTTACGTGTCTGACCAGGGCAGGGCG

AGCTACTACACCCTGTCCGAGATCAAGCCTCTGCACAACTTCCTGACCCAGCTCCAG

CCCTTCCTGAAGCTCAAGCAGAAGCAGGCCAACCTCGTGCTGAAGATCATCGAGCA

GCTGCCCTCCGCCAAGGAATCCCCGGACAAGTTCCTGGAGGTGTGCACCTGGGTGG

ACCAGATCGCCGCTCTGAACGACTCCAGGACCCGCAAGACCACTTCCGAAACCGTC

CGCGCCGTTCTAGACAGTCTCTCCGAGAAGAAGAAGTCGTCCCCCTAA

SEQ ID NO:70

ATGAATACAAAATATAATAAAGAGTTCTTACTCTACTTAGCAGGGTTTGTAGACGCT

GACGGTTCCATCTATGCCTGTATCAAGCCTCATCAACAGCTTAAGTTCAAGCACCAG

CTGTTGCTCTATTTCGAGGTCTATCAGAAGACACAGCGCCGTTGGTTCCTCGACAAG

CTGGTGGACGAGATCGGTGTGGGTTACGTGATTGACTCGGGCAGCGTCTCCACGTA

CCGGCTGTCCCAGATCAAGCCTTTGCATAATTTTTTAACACAACTACAACCTTTTCTA

AAACTAAAACAAAAACAAGCAAATTTAGTTTTAAAAATTATTGAACAACTTCCGTC

AGCAAAAGAATCCCCGGACAAATTCTTAGAAGTTTGTACATGGGTGGATCAAATTG

CAGCTCTGAATGATTCGAAGACGCGTAAAACAACTTCTGAAACCGTTCGTGCTGTGC

TAGACAGTTTACCAGGATCCGTGGGAGGTCTATCGCCATCTCAGGCATCTAGCGCCG

CATCCTCGGCTTCCTCAAGCCCGGGTTCAGGGATCTCCGAAGCACTCAGAGCTGGA

GCAGGTTCCGGCACTGGATACAACAAGGAATTCCTGCTCTACCTGGCGGGCTTCGTC

GACGGGGACGGCTCCATCTTTGCCTCTATCATTCCGTCGCAGCTGGTTAAGTTCAAG

CACACTCTGCTGCTCCGTTTCCGGGTCACCCAGGCGACAAGGCGCCGTTGGTTCCTC

GACAAGCTGGTGGACGAGATCGGTGTGGGTTACGTGACGGACAACGGCAGGGCGA

GCTACTACACCCTGTCCGAGATCAAGCCTCTGCACAACTTCCTGACCCAGCTCCAGC

CCTTCCTGAAGCTCAAGCAGAAGCAGGCCAACCTCGTGCTGAAGATCATCGAGCAG

CTGCCCTCCGCCAAGGAATCCCCGGACAAGTTCCTGGAGGTGTGCACCTGGGTGGA

CCAGATCGCCGCTCTGAACGACTCCAGGACCCGCAAGACCACTTCCGAAACCGTCC

GCGCCGTTCTAGACAGTCTCTCCGAGAAGAAGAAGTCGTCCCCCTAA

SEQ ID NO:71

ATGAATACAAAATATAATAAAGAGTTCTTACTCTACTTAGCAGGGTTTGTAGACGCT

GACGGTTCCATCTATGCCTGTATCAAGCCTCATCAACAGCTTAAGTTCAAGCACCAG

CTGTTGCTCTATTTCGAGGTCTATCAGAAGACACAGCGCCGTTGGTTCCTCGACAAG

CTGGTGGACGAGATCGGTGTGGGTTACGTGGCTGACCGTGGCAGCGTCTCCGAGTA

CCGTCTGTCCCAGATCAAGCCTTTGCATAATTTTTTAACACAACTACAACCTTTTCTA

AAACTAAAACAAAAACAAGCAAATTTAGTTTTAAAAATTATTGAACAACTTCCGTC

AGCAAAAGAATCCCCGGACAAATTCTTAGAAGTTTGTACATGGGTGGATCAAATTG

CAGCTCTGAATGATTCGAAGACGCGTAAAACAACTTCTGAAACCGTTCGTGCTGTGC

TAGACAGTTTACCAGGATCCGTGGGAGGTCTATCGCCATCTCAGGCATCCAGCGCC

GCATCCTCGGCTTCCTCAAGCCCGGGTTCAGGGATCTCCGAAGCACTCAGAGCTGG

AGCAGGTTCCGGCACTGGATACAACAAGGAATTCCTGCTCTACCTGGCGGGCTTCGT

CGACGGGGACGGCTCCATCTTTGCCTCTATCATTCCGTCGCAGCTGGTTAAGTTCAA

GCACACTCTGCTGCTCCGTTTCCGGGTCTGCCAGGCGACAAAGCGCCGTTGGTTCCT

CGACAAGCTGGTGGACGAGATTGGTGTGGGTTACGTGTCTGACCAGGGCAGCGCGA

GCTACTACACCCTGTCCGAGATCAAGCCTCTGCACAACTTCCTGACCCAGCTCCAGC

CCTTCCTGAAGCTCAAGCAGAAGCAGGCCAACCTCGTGCTGAAGATCATCGAGCAG

CTGCCCTCCGCCAAGGAATCCCCGGACAAGTTCCTGGAGGTGTGCACCTGGGTGGA

CCAGATCGCCGCTCTGAACGACTCCAGGACCCGCAAGACCACTTCCGAAACCGTCC

GCGCCGTTCTAGACAGTCTCTCCGAGAAGAAGAAGTCGTCCCCCTAA

SEQ ID NO:72

ATGAATACAAAATATAATAAAGAGTTCTTACTCTACTTAGCAGGGTTTGTAGACTCT

GACGGTTCCATCTATGCCTGTATCAAGCCTCATCAACAGCTTAAGTTCAAGCACCAG

CTGTTGCTCTATTTCGAGGTCTATCAGAAGACACAGCGCCGTTGGTTCCTCGACAAG

CTGGTGGACGAGATCGGTGTGGGTTACGTGGCTGACCGTGGCAGCGTCTCCGAGTA

CCGTCTGTCCCAGATCAAGCCTTTGCATAATTTTTTAACACAACTACAACCTTTTCTA

AAACTAAAACAAAAACAAGCAAATTTAGTTTTAAAAATTATTGAACAACTTCCGTC

AGCAAAAGAATCCCCGGACAAATTCTTAGAAGTTTGTACATGGGTGGATCAAATTG

CAGCTCTGAATGATTCGAAGACGCGTAAAACAACTTCTGAAACCGTTCGTGCTGTGC

TAGACAGTTTACCAGGATCCGTGGGAGGTCTATCGCCATCTCAGGCATCCAGCGCC

GCATCCTCGGCTTCCTCAAGCCCGGGTTCAGGGATCTCCGAAGCACTCAGAGCTGG

AGCAGGTTCCGGCACTGGATACAACAAGGAATTCCTGCTCTACCTGGCGGGCTTCGT

CGACGGGGACGGCTCCATCTTTGCCTCTATCATTCCGTCGCAGGAGGTTAAGTTCAA

GCACACTCTGCTGCTCCGTTTCCGGGTCTGCCAGGCGACAAAGCGCCGTTGGTTCCT

CGACAAGCTGGTGGACGAGATTGGTGTGGGTTACGTGTCTGACCAGGGCAGCGCGA

GCTACTACACCCTGTCCGAGATCAAGCCTCTGCACAACTTCCTGACCCAGCTCCAGC

CCTTCCTGAAGCTCAAGCAGAAGCAGGCCAACCTCGTGCTGAAGATCATCGAGCAG

CTGCCCTCCGCCAAGGAATCCCCGGACAAGTTCCTGGAGGTGTGCACCTGGGTGGA

CCAGATCGCCGCTCTGAACGACTCCAGGACCCGCAAGACCACTTCCGAAACCGTCC

GCGCCGTTCTAGACAGTCTCTCCGAGAAGAAGAAGTCGTCCCCCTAA

SEQ ID NO:73

ATGAATACAAAATATAATAAAGAGTTCTTACTCTACTTAGCAGGGTTTGTAGACGCT

GACGGTTCCATCTATGCCTGTATCAAGCCTCATCAACAGCTTAAGTTCAAGCACCAG

CTGTTGCTCTATTTCGAGGTCTATCAGAAGACACAGCGCCGTTGGTTCCTCGACAAG

CTGGTGGACGAGATCGGTGTGGGTTACGTGGCTGACCGTGGCAGCGTCTCCGAGTA

CCGTCTGTCCCAGATCAAGCCTTTGCATAATTTTTTAACACAACTACAACCTTTTCTA

AAACTAAAACAAAAACAAGCAAATTTAGTTTTAAAAATTATTGAACAACTTCCGTC

AGCAAAAGAATCCCCGGACAAATTCTTAGAAGTTTGTACATGGGTGGATCAAATTG

CAGCTCTGAATGATTCGAAGACGCGTAAAACAACTTCTGAAACCGTTCGTGCTGTGC

TAGACAGTTTACCAGGATCCGTGGGAGGTCTATCGCCATCTCAGGCATCCAGCGCC

GCATCCTCGGCTTCCTCAAGCCCGGGTTCAGGGATCTCCGAAGCACTCAGAGCTGG

AGCAGGTTCCGGCACTGGATACAACAAGGAATTCCTGCTCTACCTGGCGGGCTTCGT

CGACGGGGACGGCTCCATCTTTGCCTCTATCATTCCGTCGCAGGAGGTTAAGTTCAA

GCACACTCTGCTGCTCCGTTTCCGGGTCTGCCAGGCGACAAAGCGCCGTTGGTTCCT

CGACAAGCTGGTGGACGAGATTGGTGTGGGTTACGTGTCTGACCAGGGCAGCGCGA

GCTACTACACCCTGTCCGAGATCAAGCCTCTGCACAACTTCCTGACCCAGCTCCAGC

CCTTCCTGAAGCTCAAGCAGAAGCAGGCCAACCTCGTGCTGAAGATCATCGAGCAG

CTGCCCTCCGCCAAGGAATCCCCGGACAAGTTCCTGGAGGTGTGCACCTGGGTGGA

CCAGATCGCCGCTCTGAACGACTCCAGGACCCGCAAGACCACTTCCGAAACCGTCC

GCGCCGTTCTAGACAGTCTCTCCGAGAAGAAGAAGTCGTCCCCCTAA

SEQ ID NO:74

ATGAATACAAAATATAATAAAGAGTTCTTACTCTACTTAGCAGGGTTTGTAGACGCT

GACGGTTCCATCTATGCCTGTATCAAGCCTCATCAACAGCTTAAGTTCAAGCACCAG

CTGTTGCTCTATTTCGAGGTCTATCAGAAGACACAGCGCCGTTGGTTCCTCGACAAG

CTGGTGGACGAGATCGGTGTGGGTTACGTGGCTGACCGTGGCAGCGTCTCCGAGTA

CCGTCTGTCCCAGATCAAGCCTTTGCATAATTTTTTAACACAACTACAACCTTTTCTA

AAACTAAAACAAAAACAAGCAAATTTAGTTTTAAAAATTATTGAACAACTTCCGTC

AGCAAAAGAATCCCCGGACAAATTCTTAGAAGTTTGTACATGGGTGGATCAAATTG

CAGCTCTGAATGATTCGAAGACGCGTAAAACAACTTCTGAAACCGTTCGTGCTGTGC

TAGACAGTTTACCAGGATCCGTGGGAGGTCTATCGCCATCTCAGGCATCCAGCGCC

GCATCCTCGGCTTCCTCAAGCCCGGGTTCAGGGATCTCCGAAGCACTCAGAGCTGG

AGCAGGTTCCGGCACTGGATACAACAAGGAATTCCTGCTCTACCTGGCGGGCTTCGT

CGACGGGGACGGCTCCATCTTTGCCTCTATCATTCCGTCGCAGGAGGTTAAGTTCAA

GCACACTCTGCTGCTCCGTTTCAGGGTCACTCAGGCGACAAAGCGCCGTTGGTTCCT

CGACAAGCTGGTGGACGAGATTGGTGTGGGTTACGTGTCTGACGTTGGCAGCGCGA

GCTATTACACCCTGTCCGAGATCAAGCCTCTGCACAACTTCCTGACCCAGCTCCAGC

CCTTCCTGAAGCTCAAGCAGAAGCAGGCCAACCTCGTGCTGAAGATCATCGAGCAG

CTGCCCTCCGCCAAGGAATCCCCGGACAAGTTCCTGGAGGTGTGCACCTGGGTGGA

CCAGATCGCCGCTCTGAACGACTCCAGGACCCGCAAGACCACTTCCGAAACCGTCC

GCGCCGTTCTAGACAGTCTCTCCGAGAAGAAGAAGTCGTCCCCCTAA

SEQ ID NO:75

ATGAATACAAAATATAATAAAGAGTTCTTACTCTACTTAGCAGGGTTTGTAGACTCT

GACGGTTCCATCTATGCCTGTATCAAGCCTCATCAACAGCTTAAGTTCAAGCACCAG

CTGTTGCTCTATTTCGAGGTCTATCAGAAGACACAGCGCCGTTGGTTCCTCGACAAG

CTGGTGGACGAGATCGGTGTGGGTTACGTGGCTGACCGTGGCAGCGTCTCCGAGTA

CCGTCTGTCCCAGATCAAGCCTTTGCATAATTTTTTAACACAACTACAACCTTTTCTA

AAACTAAAACAAAAACAAGCAAATTTAGTTTTAAAAATTATTGAACAACTTCCGTC

AGCAAAAGAATCCCCGGACAAATTCTTAGAAGTTTGTACATGGGTGGATCAAATTG

CAGCTCTGAATGATTCGAAGACGCGTAAAACAACTTCTGAAACCGTTCGTGCTGTGC

TAGACAGTTTACCAGGATCCGTGGGAGGTCTATCGCCATCTCAGGCATCCAGCGCC

GCATCCTCGGCTTCCTCAAGCCCGGGTTCAGGGATCTCCGAAGCACTCAGAGCTGG

AGCAGGTTCCGGCACTGGATACAACAAGGAATTCCTGCTCTACCTGGCGGGCTTCGT

CGACGGGGACGGCTCCATCTTTGCCTCTATCATTCCGTCGCAGGAGGTTAAGTTCAA

GCACACTCTGCTGCTCCGTTTCCGGGTCTGCCAGGCGACAAAGCGCCGTTGGTTCCT

CGACAAGCTGGTGGACGAGATTGGTGTGGGTTACGTGTCTGACCGTGGCAGCGCGA

GCTATTACACCCTGTCCGAGATCAAGCCTCTGCACAACTTCCTGACCCAGCTCCAGC

CCTTCCTGAAGCTCAAGCAGAAGCAGGCCAACCTCGTGCTGAAGATCATCGAGCAG

CTGCCCTCCGCCAAGGAATCCCCGGACAAGTTCCTGGAGGTGTGCACCTGGGTGGA

CCAGATCGCCGCTCTGAACGACTCCAGGACCCGCAAGACCACTTCCGAAACCGTCC

GCGCCGTTCTAGACAGTCTCTCCGAGAAGAAGAAGTCGTCCCCCTAA

SEQ ID NO:76

ATGAATACAAAATATAATAAAGAGTTCTTACTCTACTTAGCAGGGTTTGTAGACGCT

GACGGTTCCATCTATGCCTGTATCAAGCCTCATCAAGAGCTTAAGTTCAAGCACCAG

CTGTTGCTCTATTTCGAGGTCTATCAGAAGACACAGCGCCGTTGGTTCCTCGACAAG

CTGGTGGACGAGATCGGTGTGGGTTACGTGGCTGACCGTGGCAGCGTCTCCGAGTA

CCGTCTGTCCGAGATCAAGCCTTTGCATAATTTTTTAACACAACTACAACCTTTTCTA

AAACTAAAACAAAAACAAGCAAATTTAGTTTTAAAAATTATTGAACAACTTCCGTC

AGCAAAAGAATCCCCGGACAAATTCTTAGAAGTTTGTACATGGGTGGATCAAATTG

CAGCTCTGAATGATTCGAAGACGCGTAAAACAACTTCTGAAACCGTTCGTGCTGTGC

TAGACAGTTTACCAGGATCCGTGGGAGGTCTATCGCCATCTCAGGCATCCAGCGCC

GCATCCTCGGCTTCCTCAAGCCCGGGTTCAGGGATCTCCGAAGCACTCAGAGCTGG

AGCAGGTTCCGGCACTGGATACAACAAGGAATTCCTGCTCTACCTGGCGGGCTTCGT

CGACGGGGACGGCTCCATCTTTGCCTCTATCATTCCGTCGCAGGAGGTTAAGTTCAA

GCACACTCTGCTGCTCCGTTTCCGGGTCTGCCAGGCGACAAAGCGCCGTTGGTTCCT

CGACAAGCTGGTGGACGAGATTGGTGTGGGTTACGTGTCTGACCAGGGCAGCGCGA

GCTACTACACCCTGTCCCAGATCAAGCCTCTGCACAACTTCCTGACCCAGCTCCAGC

CCTTCCTGAAGCTCAAGCAGAAGCAGGCCAACCTCGTGCTGAAGATCATCGAGCAG

CTGCCCTCCGCCAAGGAATCCCCGGACAAGTTCCTGGAGGTGTGCACCTGGGTGGA

CCAGATCGCCGCTCTGAACGACTCCAGGACCCGCAAGACCACTTCCGAAACCGTCC

GCGCCGTTCTAGACAGTCTCTCCGAGAAGAAGAAGTCGTCCCCCTAA

SEQ ID NO:77

ATGAATACAAAATATAATAAAGAGTTCTTACTCTACTTAGCAGGGTTTGTAGACTCT

GACGGTTCCATCGTGGCCACTATCCGGCCGGGGCAGGAGCTGAAGTTCAAGCACGG

TCTGCGGCTCAGGTTCTATGTCTGTCAGAAGACACAGCGCCGTTGGTTCCTCGACAA

GCTGGTGGACGAGATCGGTGTGGGTTACGTGACGGACAGTGGCAGCGTCTCCCGTT

ACGAGCTGTCCCAGATCAAGCCTTTGCATAATTTTTTAACACAACTACAACCTTTTC

TAAAACTAAAACAAAAACAAGCAAATTTAGTTTTAAAAATTATTGAACAACTTCCG

TCAGCAAAAGAATCCCCGGACAAATTCTTAGAAGTTTGTACATGGGTGGATCAAAT

TGCAGCTCTGAATGATTCGAAGACGCGTAAGACAACTTCTGAAACCGTTCGTGCTGT

GCTAGACAGTTTACCAGGATCCGTGGGAGGTCTATCGCCATCTCAGGCATCCAGCG

CCGCATCCTCGGCTTCCTCAAGCCCGGGTTCAGGGATCTCCGAAGCACTCAGAGCTG

GAGCAGGTTCCGGCACTGGATACAACAAGGAATTCCTGCTCTACCTGGCGGGCTTC

GTCGACGGGGACGGCTCCATCTTTGCCTGTATCCGTCCGTCGCAGAGGGCTAAGTTC

AAGCACGTGCTGCAGCTCTGTTTCAGGGTCCACCAGTTGACAAAGCGCCGTTGGTTC

CTCGACAAGCTGGTGGACGAGATCGGTGTAGGTTACGTGTATGACTGCGGCAGCGC

GAGCTTCTACCACCTGTCCCAGATCAAGCCTCTGCACAACTTCCTGACCCAGCTCCA

GCCCTTCCTGAAGCTCAAGCAGAAGCAGGCCAACCTCGTGCTGAAGATCATCGAGC

AGCTGCCCTCCGCCAAGGAATCCCCGGACAAGTTCCTGGAGGTGTGCACCTGGGTG

GACCAGATCGCCGCTCTGAACGACTCCAAGACCCGCAAGACCACTTCCGAAACCGT

CCGCGCCGTTCTAGACAGTCTCTCCGAGAAGAAGAAGTCGTCCCCCTAA

SEQ ID NO:78

ATGAATACAAAATATAATAAAGAGTTCTTACTCTACTTAGCAGGGTTTGTAGACGCT

GACGGTTCCATCGTGGCCACTATCCGGCCGGGGCAGGAGCTGAAGTTCAAGCACGG

TCTGCGGCTCAGGTTCTATGTCTGTCAGAAGACACAGCGCCGTTGGTTCCTCGACAA

GCTGGTGGACGAGATCGGTGCGGGTTACGTGACGGACAGTGGCAGCGTCTCCCGTT

ACGAGCTGTCCCAGATCAAGCCTTTGCATAATTTTTTAACACAACTACAACCTTTTC

TAAAACTAAAACAAAAACAAGCAAATTTAGTTTTAAAAATTATCGAACAACTTCCG

TCAGCAAAAGAATCCCCGGACAAATTCTTAGAAGTTTGTACATGGGTGGATCAAAT

TGCAGCTCTGAATGATTCGAAGACGCGTAAAACAACTTCTGAAACCGTTCGTGCTGT

GCTAGACAGTTTACCAGGATCCGTGGGAGGTCTATCGCCATCTCAGGCATCCAGCG

CCGCATCCTCGGCTTCCTCAAGCCCGGGTTCAGGGATCTCCGAAGCACTCAGAGCTG

GAGCAGGTTCCGGCACTGGATACAACAAGGAATTCCTGCTCTACCTGGCGGGCTTC

GTCGACGGGGACGGCTCCATCTTTGCCTGTATCCGTCCGTCGCAGAGGGCTAAGTTC

AAGCACGTGCTGCAGCTCTGTTTCAGGGTCCACCAGAAGACAAAGCGCCGTTGGTT

CCTCGACAAGCTGGTGGACGAGATCGGTGTGGGTTACGTGTATGACCACGGCAGCG

CGAGCTGCTACCACCTGTCCGAGATCAAGCCTCTGCACAACTTCCTGACCCAGCTCC

AGCCCTTCCTGAAGCTCAAGCAGAAGCAGGCCAACCTCGTGCTGAAGATCATCGAG

CAGCTGCCCTCCGCCAAGGAATCCCCGGACAAGTTCCTGGAGGTGTGCACCTGGGT

GGACCAGATCGCCGCTCTGAACGACTCCCACACCCGCAAGACCACTTCCGAAACCG

TCCGCGCCGTTCTAGACAGTCTCTCCGAGAAGAAGAAGTCGTCCCCCTAA

SEQ ID NO:79

ATGAATACAAAATATAATAAAGAGTTCTTACTCTACTTAGCAGGGTTTGTAGACGCT

GACGGTTCCATCGTGGCCACTATCCGGCCGGGGCAGGAGCTGAAGTTCAAGCACGG

TCTGCGGCTCAGGTTCTATGTCTGTCAGAAGACACAGCGCCGTTGGTTCCTCGACAA

GCTGGTGGACGAGATCGGTGTGGGTTACGTGACGGACAGTGGCAGCGTCTCCCGTT

ACGAGCTGTCCCAGATCAAGCCTTTGCATAATTTTTTAACACAACTACAACCTTTTC

TAAAACTAAAACAAAAACAAGCAAATTTAGTTTTAAAAATTATTGAACAACTTCCG

TCAGCAAAAGAATCCCCGGACAAATTCTTAGAAGTTTGTACATGGGTGGATCAAAT

TGCAGCTCTGAATGATTCGAAGACGCGTAAAACAACTTCTGAAACCGTTCGTGCTGT

GCTAGACAGTTTACCAGGATCCGTGGGAGGTCTATCGCCATCTCAGGCATCCAGCG

CCGCATCCTCGGCTTCCTCAAGCCCGGGTTCAGGGATCTCCGAAGCACTCAGAGCTG

GAGCAGGTTCCGGCACTGGATACAACAAGGAATTCCTGCTCTACCTGGCGGGCTTC

GTCGACGGGGACGGCTCCATCTTTGCCTGTATCCGTCCGTCGCAGAGGGCTAAGTTC

AAGCACGTGCTGCAGCTCTGTTTCAGGGTCCACCAGTCGACAAGGCGCCGTTGGTTC

CTAGACAAGCTGGTGGACGAGATCGGTGCGGGTTACGTGTATGACCACGGCAGCGC

GAGCCTGTACAGCCTGTCCCAGATCAAGCCTCTGCACAACTTCCTGACCCAGCTCCA

GCCCTTCCTGAAGCTCAAGCAGAAGCAGGCCAACCTCGTGCTGAAGATCATCGAGC

AGCTGCCCTCCGCCAAGGAATCCCCGGACAAGTTCCTGGAGGTGTGCACCTGGGTG

GACCAGATCGCCGCTCTGAACGACTCCCACACCCGCAAGACCACTTCCGAAACCGT

CCGCGCCGTTCTAGACAGTCTCTCCGAGAAGAAGAAGTCGTCCCCCTAA

SEQ ID NO:80

ATGAATACAAAATATAATAAAGAGTTCTTACTCTACTTAGCAGGGTTTGTAGACTCT

GACGGTTCCATCGTTGCCAGTATCGCTCCGGCTCAGGATTGTAAGTTCAAGCACAGG

CTGAGGCTCCGTTTCTTTGTCTCTCAGAAGACACAGCGCCGTTGGTTCCTCGACAAG

CTGGTGGACGAGATCGGTGTGGGTTACGTGTCTGACTCTGGCAGCGTCTCCAGTTAC

GTTCTGTCCGAGATCAAGCCTTTGCATAATTTTTTAACACAACTACAACCTTTTCTAA

AACTAAAACAAAAACAAGCAAATTTAGTTTTAAAAATTATTGAACAACTTCCGTCA

GCAAAAGAATCCCCGGACAAATTCTTAGAAGTTTGTACATGGGTGGATCAAATTGC

AGCTCTGAATGATTCGAAGACGCGTAAAACAACTTCTGAAACCGTTCGTGCTGTGCT

AGACAGTTTACCAGGATCCGTGGGAGGTCTATCGCCATCTCAGGCATCCAGCGCCG

CATCCTCGGCTTCCTCAAGCCCGGGTTCAGGGATCTCCGAAGCACTCAGAGCTGGA

GCAGGTTCCGGCACTGGATACAACAAGGAATTCCTGCTCTACCTGGCGGGCTTCGTC

GACGGGGACGGCTCCATCTTTGCCTGTATCCGTCCGTCGCAGAGGGCTAAGTTCAAG

CACGTGCTGCAGCTCTGTTTCCGGGTCTTTCAGAAGACACAGCGCCGTTGGTTCCTC

GACAAGCTGGTGGACGAGATCGGTGTAGGTTACGTGTATGACCACGGCAGGGCGAG

CATCTACCAGCTGTCCCAGATCAAGCCTCTGCACAACTTCCTGACCCAGCTCCAGCC

CTTCCTGAAGCTCAAGCAGAAGCAGGCCAACCTCGTGCTGAAGATCATCGAGCAGC

TGCCCTCCGCCAAGGAATCCCCGGACAAGTTCCTGGAGGTGTGCACCTGGGTGGAC

CAGATCGCCGCTCTGAACGACTCCCACACCCGCAAGACCACTTCCGAAACCGTCCG

CGCCGTTCTAGACAGTCTCTCCGAGAAGAAGAAGTCGTCCCCCTAA

SEQ ID NO:81

ATGAATACAAAATATAATAAAGAGTTCTTACTCTACTTAGCAGGGTTTGTAGACTCT

GACGGTTCCATCGTTGCCAGGATCGAGCCGGCTCAGGATTGTAAGTTCAAGCACAG

GCTGAGGCTCCAGTTCTTTGTCTCTCAGAAGACACAGCGCCGTTGGTTCCTCGACAA

GCTGGTGGACGAGATCGGTGTGGGTTACGTGCGGGACTCTGGCAGCGTCTCCAGTT

ACGATCTGTCCCAGATCAAGCCTTTGCATAATTTTTTAACACAACTACAACCTTTTCT

AAAACTAAAACAAAAACAAGCAAATTTAGTTTTAAAAATTATTGAACAACTTCCGT

CAGCAAAAGAATCCCCGGACAAATTCTTAGAAGTTTGTACATGGGTGGATCAAATT

GCAGCTCTGAATGATTCGAAGACGCGTAAAACAACTTCTGAAACCGTTCGTGCTGT

GCTAGACAGTTTACCAGGATCCGTGGGAGGTCTATCGCCATCTCAGGCATCCAGCG

CCGCATCCTCGGCTTCCTCAAGCCCGGGTTCAGGGATCTCCGAAGCACTCAGAGCTG

GAGCAGGTTCCGGCACTGGATACAACAAGGAATTCCTGCTCTACCTGGCGGGCTTC

GTCGACGGGGACGGCTCCATCTTTGCCTGTATCCGTCCGTCGCAGAGGGCTAAGTTC

AAGCACGTGCTGCAGCTCCATTTCCGGGTCTTTCAGAAGACACAGCGCCGTTGGTTC

CTCGACAAGCTGGTGGACGAGATCGGTGTAGGTTACGTGTATGACCACGGCAGGGC

GAGCATCTACCAGCTGTCCCAGATCAAGCCTCTGCACAACTTCCTGACCCAGCTCCA

GCCCTTCCTGAAGCTCAAGCAGAAGCAGGCCAACCTCGTGCTGAAGATCATCGAGC

AGCTGCCCTCCGCCAAGGAATCCCCGGACAAGTTCCTGGAGGTGTGCACCTGGGTG

GACCAGATCGCCGCTCTGAACGACTCCCACACCCGCAAGACCACTTCCGAAACCGT

CCGCGCCGTTCTAGACAGTCTCTCCGAGAAGAAGAAGTCGTCCCCCTAA

SEQ ID NO:82

ATGAATACAAAATATAATAAAGAGTTCTTACTCTACTTAGCAGGGTTTGTAGACTCT

GACGGTTCCATCGTTGCCAGGATCGAGCCGGCTCAGGATTGTAAGTTCAAGCACAG

GCTGAGGCTCCAGTTCTTTGTCTCTCAGAAGACACAGCGCCGTTGGTTCCTCGACAA

GCTGGTGGACGAGATCGGTGTGGGTTACGTGCGGGACTCTGGCAGCGTCTCCAGTT

ACTTGCTGTCCCAGATCAAGCCTTTGCATAATTTTTTAACACAACTACAACCTTTTCT

AAAACTAAAACAAAAACAAGCAAATTTAGTTTTAAAAATTATTGAACAACTTCCGT

CAGCAAAAGAATCCCCGGACAAATTCTTAGAAGTTTGTACATGGGTGGATCAAATT

GCAGCTCTGAATGATTCGAAGACGCGTAAAACAACTTCTGAAACCGTTCGTGCTGT

GCTAGACAGTTTACCAGGATCCGTGGGAGGTCTATCGCCATCTCAGGCATCCAGCG

CCGCATCCTCGGCTTCCTCAAGCCCGGGTTCAGGGATCTCCGAAGCACTCAGAGCTG

GAGCAGGTTCCGGCACTGGATACAACAAGGAATTCCTGCTCTACCTGGCGGGCTTC

GTCGACGGGGACGGCTCCATCTTTGCCTGTATCCGTCCGTCGCAGAGGGCTAAGTTC

AAGCACGTGCTGCAGCTCTGTTTCCGGGTCTTTCAGAAGACACAGCGCCGTTGGTTC

CTCGACAAGCTGGTGGACGAGATCGGTGTAGGTTACGTGTATGACCACGGCAGGGC

GAGCATCTACCAGCTGTCCCAGATCAAGCCTCTGCACAACTTCCTGACCCAGCTCCA

GCCCTTCCTGAAGCTCAAGCAGAAGCAGGCCAACCTCGTGCTGAAGATCATCGAGC

AGCTGCCCTCCGCCAAGGAATCCCCGGACAAGTTCCTGGAGGTGTGCACCTGGGTG

GACCAGATCGCCGCTCTGAACGACTCCCACACCCGCAAGACCACTTCCGAAACCGT

CCGCGCCGTTCTAGACAGTCTCTCCGAGAAGAAGAAGTCGTCCCCCTAA

SEQ ID NO:83

ATGAATACAAAATATAATAAAGAGTTCTTACTCTACTTAGCAGGGTTTGTAGACGCT

GACGGTTCCATCGTTGCCAGGATCGAGCCGGCTCAGGATTGTAAGTTCAAGCACAG

GCTGAGGCTCCAGTTCTTTGTCTCTCAGAAGACACAGCGCCGTTGGTTCCTCGACAA

GCTGGTGGACGAGATCGGTGTGGGTTACGTGCGGGACTCTGGCAGCGTCTCCAGTT

ACAATCTGTCCGAGATCAAGCCTTTGCATAATTTTTTAACACAACTACAACCTTTTCT

AAAACTAAAACAAAAACAAGCAAATTTAGTTTTAAAAATTATTGAACAACTTCCGT

CAGCAAAAGAATCCCCGGACAAATTCTTAGAAGTTTGTACATGGGTGGATCAAATT

GCAGCTCTGAATGATTCGAAGACGCGTAAAACAACTTCTGAAACCGTTCGTGCTGT

GCTAGACAGTTTACCAGGATCCGTGGGAGGTCTATCGCCATCTCAGGCATCCAGCG

CCGCATCCTCGGCTTCCTCAAGCCCGGGTTCAGGGATCTCCGAAGCACTCAGAGCTG

GAGCAGGTTCCGGCACTGGATACAACAAGGAATTCCTGCTCTACCTGGCGGGCTTC

GTCGACGGGGACGGCTCCATCTTTGCCTGTATCCGTCCGTCGCAGAGGGCTAAGTTC

AAGCACGTGCTGCAGCTCTGTTTCCGGGTCTTTCAGAAGACACAGCGCCGTTGGTTC

CTCGACAAGCTGGTGGACGAGATCGGTGTAGGTTACGTGTATGACCACGGCAGGGC

GAGCATCTACCAGCTGTCCCAGATCAAGCCTCTGCACAACTTCCTGACCCAGCTCCA

GCCCTTCCTGAAGCTCAAGCAGAAGCAGGCCAACCTCGTGCTGAAGATCATCGAGC

AGCTGCCCTCCGCCAAGGAATCCCCGGACAAGTTCCTGGAGGTGTGCACCTGGGTG

GACCAGATCGCCGCTCTGAACGACTCCCACACCCGCAAGACCACTTCCGAAACCGT

CCGCGCCGTTCTAGACAGTCTCTCCGAGAAGAAGAAGTCGTCCCCCTAA

SEQ ID NO:84

KEFLLYLAGFVDSDGSIYATIRPVQSTKFKHTLRLWFAVTQKTQRRWFLDKLVDEIGVG

YVYDNGSVSWYYLSEIKPLHNFLTQLQPFLKLKQKQANLVLKIIEQLPSAKESPDKFLEV

CTWVDQIAALNDSKTRKTTSETVRAVLD

SEQ ID NO:85

KEFLLYLAGFVDSDGSIFAVIEPVQSAKFKHRLKLSFVVTQKTQRRWFLDKLVDEIGVG

YVYDQGSVSFYRLSEIKPLHNFLTQLQPFLKLKQKQANLVLKIIEQLPSAKESPDKFLEV

CTWVDQIAALNDSKTRKTTSETVRAVLD

SEQ ID NO:86

KEFLLYLAGFVDSDGSIYASIMPIQTAKFKHRLKLQFAVAQKTQRRWFLDKLVDEIGVG

YVYDFGSVSYYRLSQIKPLHNFLTQLQPFLKLKQKQANLVLKIIEQLPSAKESPDKFLEV

CTWVDQIAALNDSKTRKTTSETVRAVLD

SEQ ID NO:87

KEFLLYLAGFVDSDGSIIAFIMPSQTAKFKHRLKLQFAVAQKTQRRWFLDKLVDEIGVG

YVYDFGSVSYYRLSQIKPLHNFLTQLQPFLKLKQKQANLVLKIIEQLPSAKESPDKFLEV

CTWVDQIAALNDSKTRKTTSETVRAVLD

SEQ ID NO:88

KEFLLYLAGFVDSDGSIMAFIMPTQTAKFKHRLKLQFAVAQKTQRRWFLDKLVDEIGV

GYVYDFGSVSYYRLSEIKPLHNFLTQLQPFLKLKQKQANLVLKIIEQLPSAKESPDKFLE

VCTWVDQIAALNDSKTRKTTSETVRAVLD

SEQ ID NO:89

KEFLLYLAGFVDSDGSIMAFILPEQHMKFKHRLRLQFAVAQKTQRRWFLDKLVDEIGV

GYVYDFGSVSYYRLSEIKPLHNFLTQLQPFLKLKQKQANLVLKIIEQLPSAKESPDKFLE

VCTWVDQIAALNDSKTRKTTSETVRAVLD

SEQ ID NO:90

KEFLLYLAGFVDSDGSIMAFILPEQHLKFKHRLRLQFAVAQKTQRRWFLDKLVDEIGVG

YVYDFGSVSYYRLSEIKPLHNFLTQLQPFLKLKQKQANLVLKIIEQLPSAKESPDKFLEV

CTWVDQIAALNDSKTRKTTSETVRAVLD

SEQ ID NO:91

KEFLLYLAGFVDSDGSIMAFILPEQGLKFKHRLRLQFAVAQKTQRRWFLDKLVDEIGVG

YVYDFGSVSYYRLSQIKPLHNFLTQLQPFLKLKQKQANLVLKIIEQLPSAKESPDKFLEV

CTWVDQIAALNDSKTRKTTSETVRAVLD

SEQ ID NO:92

KEFLLYLAGFVDSDGSIMAFIMPDQAPKFKHRLRLQFAVAQKTQRRWFLDKLVDEIGV

GYVYDFGSVSYYRLSEIKPLHNFLTQLQPFLKLKQKQANLVLKIIEQLPSAKESPDKFLE

VCTWVDQIAALNDSKTRKTTSETVRAVLD

SEQ ID NO:93

KEFLLYLAGFVDADGSIYACIKPHQQLKFKHQLLLYFEVYQKTQRRWFLDKLVDEIGV

GYVADRGSVSEYRLSQIKPLHNFLTQLQPFLKLKQKQANLVLKIIEQLPSAKESPDKFLE

VCTWVDQIAALNDSKTRKTTSETVRAVLD

SEQ ID NO:94

KEFLLYLAGFVDADGSIYACIKPHQQLKFKHQLLLYFEVYQKTQRRWFLDKLVDEIGV

GYVIDSGSVSTYRLSQIKPLHNFLTQLQPFLKLKQKQANLVLKIIEQLPSAKESPDKFLEV

CTWVDQIAALNDSKTRKTTSETVRAVLD

SEQ ID NO:95

KEFLLYLAGFVDADGSIYACIKPHQQLKFKHQLLLYFEVYQKTQRRWFLDKLVDEIGV

GYVADRGSVSEYRLSQIKPLHNFLTQLQPFLKLKQKQANLVLKIIEQLPSAKESPDKFLE

VCTWVDQIAALNDSKTRKTTSETVRAVLD

SEQ ID NO:96

KEFLLYLAGFVDSDGSIYACIKPHQQLKFKHQLLLYFEVYQKTQRRWFLDKLVDEIGVG

YVADRGSVSEYRLSQIKPLHNFLTQLQPFLKLKQKQANLVLKIIEQLPSAKESPDKFLEV

CTWVDQIAALNDSKTRKTTSETVRAVLD

SEQ ID NO:97

KEFLLYLAGFVDADGSIYACIKPHQQLKFKHQLLLYFEVYQKTQRRWFLDKLVDEIGV

GYVADRGSVSEYRLSQIKPLHNFLTQLQPFLKLKQKQANLVLKIIEQLPSAKESPDKFLE

VCTWVDQIAALNDSKTRKTTSETVRAVLD

SEQ ID NO:98

KEFLLYLAGFVDADGSIYACIKPHQQLKFKHQLLLYFEVYQKTQRRWFLDKLVDEIGV

GYVADRGSVSEYRLSQIKPLHNFLTQLQPFLKLKQKQANLVLKIIEQLPSAKESPDKFLE

VCTWVDQIAALNDSKTRKTTSETVRAVLD

SEQ ID NO:99

KEFLLYLAGFVDSDGSIYACIKPHQQLKFKHQLLLYFEVYQKTQRRWFLDKLVDEIGVG

YVADRGSVSEYRLSQIKPLHNFLTQLQPFLKLKQKQANLVLKIIEQLPSAKESPDKFLEV

CTWVDQIAALNDSKTRKTTSETVRAVLD

SEQ ID NO:100

KEFLLYLAGFVDADGSIYACIKPHQELKFKHQLLLYFEVYQKTQRRWFLDKLVDEIGVG

YVADRGSVSEYRLSEIKPLHNFLTQLQPFLKLKQKQANLVLKIIEQLPSAKESPDKFLEV

CTWVDQIAALNDSKTRKTTSETVRAVLD

SEQ ID NO:101

KEFLLYLAGFVDSDGSIVATIRPGQELKFKHGLRLRFYVCQKTQRRWFLDKLVDEIGVG

YVTDSGSVSRYELSQIKPLHNFLTQLQPFLKLKQKQANLVLKIIEQLPSAKESPDKFLEV

CTWVDQIAALNDSKTRKTTSETVRAVLD

SEQ ID NO:102

KEFLLYLAGFVDADGSIVATIRPGQELKFKHGLRLRFYVCQKTQRRWFLDKLVDEIGAG

YVTDSGSVSRYELSQIKPLHNFLTQLQPFLKLKQKQANLVLKIIEQLPSAKESPDKFLEV

CTWVDQIAALNDSKTRKTTSETVRAVLD

SEQ ID NO:103

KEFLLYLAGFVDADGSIVATIRPGQELKFKHGLRLRFYVCQKTQRRWFLDKLVDEIGVG

YVTDSGSVSRYELSQIKPLHNFLTQLQPFLKLKQKQANLVLKIIEQLPSAKESPDKFLEV

CTWVDQIAALNDSKTRKTTSETVRAVLD

SEQ ID NO:104

KEFLLYLAGFVDSDGSIVASIAPAQDCKFKHRLRLRFFVSQKTQRRWFLDKLVDEIGVG

YVSDSGSVSSYVLSEIKPLHNFLTQLQPFLKLKQKQANLVLKIIEQLPSAKESPDKFLEVC

TWVDQIAALNDSKTRKTTSETVRAVLD

SEQ ID NO:105

KEFLLYLAGFVDSDGSIVARIEPAQDCKFKHRLRLQFFVSQKTQRRWFLDKLVDEIGVG

YVRDSGSVSSYDLSQIKPLHNFLTQLQPFLKLKQKQANLVLKIIEQLPSAKESPDKFLEV

CTWVDQIAALNDSKTRKTTSETVRAVLD

SEQ ID NO:106

KEFLLYLAGFVDSDGSIVARIEPAQDCKFKHRLRLQFFVSQKTQRRWFLDKLVDEIGVG

YVRDSGSVSSYLLSQIKPLHNFLTQLQPFLKLKQKQANLVLKIIEQLPSAKESPDKFLEVC

TWVDQIAALNDSKTRKTTSETVRAVLD

SEQ ID NO:107

KEFLLYLAGFVDADGSIVARIEPAQDCKFKHRLRLQFFVSQKTQRRWFLDKLVDEIGVG

YVRDSGSVSSYNLSEIKPLHNFLTQLQPFLKLKQKQANLVLKIIEQLPSAKESPDKFLEVC

TWVDQIAALNDSKTRKTTSETVRAVLD

SEQ ID NO:108

KEFLLYLAGFVDGDGSICACIVPRQDRKFKHQLRLFFEVGQKTKRRWFLDKLVDEIGVG

YVEDTGRASRYRLSQIKPLHNFLTQLQPFLKLKQKQANLVLKIIEQLPSAKESPDKFLEV

CTWVDQIAALNDSRTRKTTSETVRAVLD

SEQ ID NO:109

KEFLLYLAGFVDGDGSICACIVPRQDRKFKHQLRLFFEVGQTTRRRWFLDKLVDEIGVG

YVFDKGSASMYRLSEIKPLHNFLTQLQPFLKLKQKQANLVLKIIEQLPSAKESPDKFLEV

CTWVDQIAALNDSRTRKTTSETVRAVLD

SEQ ID NO:110

KEFLLYLAGFVDGDGSICACIVPRQDRKFKHQLRLFFEVGQKTQRRWFLDKLVDEIGVG

YVRDLGSASTYRLSEIKPLHNFLTQLQPFLKLKQKQANLVLKIIEQLPSAKESPDKFLEV

CTWVDQIAALNDSRTRKTTSETVRAVLD

SEQ ID NO:111

KEFLLYLAGFVDGDGSICACIVPRQDRKFKHQLRLFFEIGQKTQRRWFLDKLVDEIGVG

YVRDLGSASTYRLSQIKPLHNFLTQLQPFLKLKQKQANLVLKIIEQLPSAKESPDKFLEV

CTWVDQIAALNDSKTRKTTSETVRAVLD

SEQ ID NO:112

KEFLLYLAGFVDGDGSICACIVPRQDRKFKHQLRLFFEVGQKTQRRWFLDKLVDEIGVG

YVRDLGSASTYRLSQIKPLHNFLTQLQPFLKLKQKQANLVLKIIEQLPSAKESPDKFLEV

CTWVDQIAALNDSRTRKTTSETVRAVLD

SEQ ID NO:113

KEFLLYLAGFVDGDGSICACIVPRQDRKFKHQLRLFFEVGQKTQRRWFLDKLVDEIGVG

YVRDLGSASTYRLSEIKPLHNFLTQLQPFLKLKQKQANLVLKIIEQLPSAKESPDKFLEV

CTWVDQIAALNDSRTRKTTSETVRAVLD

SEQ ID NO:114

KEFLLYLAGFVDGDGSICACIVPRQDRKFKHQLRLFFEVGQKTQRRWFLDKLVDEIGVG

YVRDLGSASTYRLSEIKPLHNFLTQLQPFLKLKQKQANLVLKIIEQLPSAKESPDKFLEV

CTWVDQIAALNDSRTRKTTSETVRAVLD

SEQ ID NO:115

KEFLLYLAGFVDGDGSICACIVPRQDRKFKHQLRLFFEVGQKTQRRWFLDKLVDEIGVG

YVRDLGSASTYRLSQIKPLHNFLTQLQPFLKLKQKQANLVLKIIEQLPSAKESPDKFLEV

CTWVDQIAALNDSRTRKTTSETVRAVLD

SEQ ID NO:116

KEFLLYLAGFVDGDGSICACIVPRQDRKFKHQLRLFFEVGQKTQRRWFLDKLVDEIGVG

YVRDLGSASTYRLSQIKPLHNFLTQLQPFLKLKQKQANLVLKIIEQLPSAKESPDKFLEV

CTWVDQIAALNDSRTRKTTSETVRAVLD

SEQ ID NO:117

KEFLLYLAGFVDGDGSIFASIMPTQWTKFKHSLLLRFRVTQSTRRRWFLDKLMDEIGVG

YVSDQGRASYYTLSEIKPLHNFLTQLQPFLKLKQKQANLVLKIIEQLPSAKESPDKFLEV

CTWVDQIAALNDSRTRKTTSETVRAVLD

SEQ ID NO:118

KEFLLYLAGFVDGDGSIFASIIPSQLVKFKHTLLLRFRVTQATRRRWFLDKLVDEIGVGY

VTDNGRASYYTLSEIKPLHNFLTQLQPFLKLKQKQANLVLKIIEQLPSAKESPDKFLEVC

TWVDQIAALNDSRTRKTTSETVRAVLD

SEQ ID NO:119

KEFLLYLAGFVDGDGSIFASIIPSQLVKFKHTLLLRFRVCQATKRRWFLDKLVDEIGVGY

VSDQGSASYYTLSEIKPLHNFLTQLQPFLKLKQKQANLVLKIIEQLPSAKESPDKFLEVCT

WVDQIAALNDSRTRKTTSETVRAVLD

SEQ ID NO:120

KEFLLYLAGFVDGDGSIFASIIPSQEVKFKHTLLLRFRVCQATKRRWFLDKLVDEIGVGY

VSDQGSASYYTLSEIKPLHNFLTQLQPFLKLKQKQANLVLKIIEQLPSAKESPDKFLEVCT

WVDQIAALNDSRTRKTTSETVRAVLD

SEQ ID NO:121

KEFLLYLAGFVDGDGSIFASIIPSQEVKFKHTLLLRFRVCQATKRRWFLDKLVDEIGVGY

VSDQGSASYYTLSEIKPLHNFLTQLQPFLKLKQKQANLVLKIIEQLPSAKESPDKFLEVCT

WVDQIAALNDSRTRKTTSETVRAVLD

SEQ ID NO:122

KEFLLYLAGFVDGDGSIFASIIPSQEVKFKHTLLLRFRVTQATKRRWFLDKLVDEIGVGY

VSDVGSASYYTLSEIKPLHNFLTQLQPFLKLKQKQANLVLKIIEQLPSAKESPDKFLEVCT

WVDQIAALNDSRTRKTTSETVRAVLD

SEQ ID NO:123

KEFLLYLAGFVDGDGSIFASIIPSQEVKFKHTLLLRFRVCQATKRRWFLDKLVDEIGVGY

VSDRGSASYYTLSEIKPLHNFLTQLQPFLKLKQKQANLVLKIIEQLPSAKESPDKFLEVCT

WVDQIAALNDSRTRKTTSETVRAVLD

SEQ ID NO:124

KEFLLYLAGFVDGDGSIFASIIPSQEVKFKHTLLLRFRVCQATKRRWFLDKLVDEIGVGY

VSDQGSASYYTLSQIKPLHNFLTQLQPFLKLKQKQANLVLKIIEQLPSAKESPDKFLEVC

TWVDQIAALNDSRTRKTTSETVRAVLD

SEQ ID NO:125

KEFLLYLAGFVDGDGSIFACIRPSQRAKFKHVLQLCFRVHQLTKRRWFLDKLVDEIGVG

YVYDCGSASFYHLSQIKPLHNFLTQLQPFLKLKQKQANLVLKIIEQLPSAKESPDKFLEV

CTWVDQIAALNDSKTRKTTSETVRAVLD

SEQ ID NO:126

KEFLLYLAGFVDGDGSIFACIRPSQRAKFKHVLQLCFRVHQKTKRRWFLDKLVDEIGVG

YVYDHGSASCYHLSEIKPLHNFLTQLQPFLKLKQKQANLVLKIIEQLPSAKESPDKFLEV

CTWVDQIAALNDSHTRKTTSETVRAVLD

SEQ ID NO:127

KEFLLYLAGFVDGDGSIFACIRPSQRAKFKHVLQLCFRVHQSTRRRWFLDKLVDEIGAG

YVYDHGSASLYSLSQIKPLHNFLTQLQPFLKLKQKQANLVLKIIEQLPSAKESPDKFLEV

CTWVDQIAALNDSHTRKTTSETVRAVLD

SEQ ID NO:128

KEFLLYLAGFVDGDGSIFACIRPSQRAKFKHVLQLCFRVFQKTQRRWFLDKLVDEIGVG

YVYDHGRASIYQLSQIKPLHNFLTQLQPFLKLKQKQANLVLKIIEQLPSAKESPDKFLEV

CTWVDQIAALNDSHTRKTTSETVRAVLD

SEQ ID NO:129

KEFLLYLAGFVDGDGSIFACIRPSQRAKFKHVLQLHFRVFQKTQRRWFLDKLVDEIGVG

YVYDHGRASIYQLSQIKPLHNFLTQLQPFLKLKQKQANLVLKIIEQLPSAKESPDKFLEV

CTWVDQIAALNDSHTRKTTSETVRAVLD

SEQ ID NO:130

KEFLLYLAGFVDGDGSIFACIRPSQRAKFKHVLQLCFRVFQKTQRRWFLDKLVDEIGVG

YVYDHGRASIYQLSQIKPLHNFLTQLQPFLKLKQKQANLVLKIIEQLPSAKESPDKFLEV

CTWVDQIAALNDSHTRKTTSETVRAVLD

SEQ ID NO:131

KEFLLYLAGFVDGDGSIFACIRPSQRAKFKHVLQLCFRVFQKTQRRWFLDKLVDEIGVG

YVYDHGRASIYQLSQIKPLHNFLTQLQPFLKLKQKQANLVLKIIEQLPSAKESPDKFLEV

CTWVDQIAALNDSHTRKTTSETVRAVLD

SEQ ID NO:132

SLPGSVGGLSPSQASSAASSASSSPGSGISEALRAGAGSGTG

SEQ ID NO:133

CGGGAGGTAATACATAATCC

SEQ ID NO:134

GGGTGGGTTGCTTTACCTCTC

SEQ ID NO:135

TGGGCTACTGCAACTCTGTT

SEQ ID NO:136

AGGACAAAAGAGGACGGTCTGCCCTGG

SEQ ID NO:137

TAAGACCCAGCTTCACGGAG

SEQ ID NO:138

TATGATCGCCTGTTCCTCCA

SEQ ID NO:139

CTGGCCGAAGTATAGGAA

SEQ ID NO:140

CGCAACATGTGACATAAAGAG

SEQ ID NO:141

TCTGGATATCCTCTTCTGGG

SEQ ID NO:142

CCTACATGGTGTATCTGAC

SEQ ID NO:143

GAACACCACCAGAAAAACAAG

SEQ ID NO:144

CACTTCCTGTAAGACAACCAG

SEQ ID NO:145

ATCCCTCATACCCAATC

SEQ ID NO:146

AAAAACCACGGTGCTGTTGA

SEQ ID NO:147

ATGGGGTCCGAGACTTTTCC

SEQ ID NO:148

GGGTGGGTTGCTTTACCTCTC

SEQ ID NO:149

AGAGCATGCCATCTGAGTC

SEQ ID NO:150

GTGAAGTAGCAAAGCACCTG

SEQ ID NO:151

AGAGCATGCCATCTGAGTC

SEQ ID NO:152

GGGTGGGTTGCTTTACCTCTC

SEQ ID NO:153

TTTGGTATGGGGTCCGAGAC

SEQ ID NO:154

GTGAAGTAGCAAAGCACCTG

SEQ ID NO:155

TTTGGTATGGGGTCCGAGAC

SEQ ID NO:156

GGGTGGGTTGCTTTACCTCTC

SEQ ID NO:157

GATTCTCAGAAATGGAGTGACTG

SEQ ID NO:158

GTGAAGTAGCAAAGCACCTG

SEQ ID NO:159

GATTCTCAGAAATGGAGTGACTG

SEQ ID NO:160

ATCAGAAGGATTATGTATAGGAATA

SEQ ID NO:161

GGGTGGGTTGCTTTACCTCT

SEQ ID NO:162

TCTGGATATCCTCTTCTGGG

SEQ ID NO:163

GTGAAGTAGCAAAGCACCTG

SEQ ID NO:164

GTGAAGTAGCAAAGCACCTG

SEQ ID NO:165

AGTCACTTCCTAAGCTAAGACAACC

SEQ ID NO:166

CAGAAGGATTATGTATGAGGGATA

SEQ ID NO:167

GTGAAGTAGCAAAGCACCTG

SEQ ID NO:168

ATGGGGTCCGAGACTTTTCC

SEQ ID NO:169

CGGCCGTCCGCCTTCGGCACCATCCTCACGACACCCAAATATGGCGACGGGTGAGGAATGGTGGGGAGTTATTTTTAGAGCGGTGAGGAAGGTGGGCAGGCAGCAGGTGTTGGCGCTCTAAAAATAACTCCCGGGAGTTATTTTTAGAGCGGAGGAATGGTGGACACCCAAATATGGCGACGGTTCCTCACCCGTCGCCATATTTGGGTGTCCGCCCTCGGCCGGGGCCGCATTCCTGGGGGCCGGGCGGTGCTCCCGCCCGCCTCGATAAAAGGCTCCGGGGCCGGCGGCGGCCCACGAGCTACCCGGAGGAGCGGGAGGCGCCAAGCTCTAGA

SEQ ID NO:170

CCATCCTGGTCTATAGAGAGAGTTCCAGAACAGCCAGGGCTACAGATAAACCCATCTGGAAAAACAAAGTTGAATGACCCAAGAGGGGTTCTCAGAGGGTGGCGTGTGCTCCCTGGCAAGCCTATGACATGGCCGGGGCCTGCCTCTCTCTGCCTCTGACCCTCAGTGGCTCCCATGAACTCCTTGCCCAATGGCATCTTTTTCCTGCGCTCCTTGGGTTATTCCAGTCTCCCCTCAGCATTCCTTCCTCAGGGCCTCGCTCTTCTCTCTGCTCCCTCCTTGCACAGCTGGCTCTGTCCACCTCAGATGTCACAGTGCTCTCTCAGAGGAGGAAGGCACCATGTACCCTCTGTTTCCCAGGTAAGGGTTCAATTTTTAAAAATGGTTTTTTGTTTGTTTGTTTGTTTGTTTGTTTGTTTGTTTTTCAAGACAGGGCTCCTCTGTGTAGTCCTAACTGTCTTGAAACTCCCTCTGTAGACCAGGTCGACCTCGAACTCTTGAAACCTGCCACGGACCACCCAGTCAGGTATGGAGGTCCCTGGAATGAGCGTCCTCGAAGCTAGGTGGGTAAGGGTTCGGCGGTGACAAACAGAAACAAACACAGAGGCAGTTTGAATCTGAGTGTATTTTGCAGCTCTCAAGCAGGGGATTTTATACATAAAAAAAAAAAAAAAAAAAAAACCAAACATTACATCTCTTAGAAACTATATCCAATGAAACAATCACAGATACCAACCAAAACCATTGGGCAGAGTAAAGCACAAAAATCATCCAAGCATTACAACTCTGAAACCATGTATTCAGTGAATCACAAACAGAACAGGTAACATCATTATTAATATAAATCACCAAAATATAACAATTCTAAAAGGATGTATCCAGTGGGGGCTGTCGTCCAAGGCTAGTGGCAGATTTCCAGGAGCAGGTTAGTAAATCTTAACCACTGAACTAACTCTCCAGCCCCATGGTCAATTATTATTTAGCATCTAGTGCCTAATTTTTTTTTATAAATCTTCACTATGTAATTTAAAACTATTTTAATTCTTCCTAATTAAGGCTTTCTTTACCATATACCAAAATTCACCTCCAATGACACACGCGTAGCCATATGAAATTTTATTGTTGGGAAAATTTGTACCTATCATAATAGTTTTGTAAATGATTTAAAAAGCAAAGTGTTAGCCGGGCGTGGTGGCACACGCCTTTAATCCCTGCACTCGGGAGGCAGGGGCAGGAGGATTTCTGAGTTTGAGGCCAGCCTGGTCTACAGAGTGAGTTCCAGGACAGCCAGGGCTACACAGAGAAACCCTGTCTCGAACCCCCCACCCCCCAAAAAAAGCAAAGTGTTGGTTTCCTTGGGGATAAAGTCATGTTAGTGGCCCATCTCTAGGCCCATCTCACCCATTATTCTCGCTTAAGATCTTGGCCTAGGCTACCAGGAACATGTAAATAAGAAAAGGAATAAGAGAAAACAAAACAGAGAGATTGCCATGAGAACTACGGCTCAATATTTTTTCTCTCCGGCGAAGAGTTCCACAACCATCTCCAGGAGGCCTCCACGTTTTGAGGTCAATGGCCTCAGTCTGTGGAACTTGTCACACAGATCTTACTGGAGGTGGTGTGGCAGAAACCCATTCCTTTTAGTGTCTTGGGCTAAAAGTAAAAGGCCCAGAGGAGGCCTTTGCTCATCTGACCATGCTGACAAGGAACACGGGTGCCAGGACAGAGGCTGGACCCCAGGAACACCTTAAACACTTCTTCCCTTCTCCGCCCCCTAGAGCAGGCTCCCCTCACCAGCCTGGGCAGAAATGGGGGAAGATGGAGTGAAGCCATACTGGCTACTCCAGAATCAACAGAGGGAGCCGGGGGCAATACTGGAGAAGCTGGTCTCCCCCCAGGGGCAATCCTGGCACCTCCCAGGCAGAAGAGGAAACTTCCACAGTGCATCTCACTTCCATGAATCCCCTCCTCGGACTCTGAGGTCCTTGGTCACAGCTGAGGTGCAAAAGGCTCCTGTCATATTGTGTCCTGCTCTGG

TCTGCCTTCCACAGCTTGGGGGCCACCTAGCCCACCTCTCCCTAGGGATGAGAGCAG

CCACTACGGGTCTAGGCTGCCCATGTAAGGAGGCAAGGCCTGGGGACACCCGAGAT

GCCTGGTTATAATTAACCCAGACATGTGGCTGCCCCCCCCCCCCCAACACCTGCTGC

CTGAGCCTCACCCCCACCCCGGTGCCTGGGTCTTAGGCTCTGTACACCATGGAGGAG

AAGCTCGCTCTAAAAATAACCCTGTCCCTGGTGGATCCAGGGTGAGGGGCAGGCTG

AGGGCGGCCACTTCCCTCAGCCGCAGGTTTGTTTTCCCAAGAATGGTTTTTCTGCTTC

TGTAGCTTTTCCTGTCAATTCTGCCATGGTGGAGCAGCCTGCACTGGGCTTCTGGGA

GAAACCAAACCGGGTTCTAACCTTTCAGCTACAGTTATTGCCTTTCCTGTAGATGGG

CGACTACAGCCCCACCCCCACCCCCGTCTCCTGTATCCTTCCTGGGCCTGGGGATCC

TAGGCTTTCACTGGAAATTTCCCCCCAGGTGCTGTAGGCTAGAGTCACGGCTCCCAA

GAACAGTGCTTGCCTGGCATGCATGGTTCTGAACCTCCAACTGCAAAAAATGACAC

ATACCTTGACCCTTGGAAGGCTGAGGCAGGGGGATTGCCATGAGTGCAAAGCCAGA

CTGGGTGGCATAGTTAGACCCTGTCTCAAAAAACCAAAAACAATTAAATAACTAAA

GTCAGGCAAGTAATCCTACTCGGGAGACTGAGGCAGAGGGATTGTTACATGTCTGA

GGCCAGCCTGGACTACATAGGGTTTCAGGCTAGCCCTGTCTACAGAGTAAGGCCCT

ATTTCAAAAACACAAACAAAATGGTTCTCCCAGCTGCTAATGCTCACCAGGCAATG

AAGCCTGGTGAGCATTAGCAATGAAGGCAATGAAGGAGGGTGCTGGCTACAATCAA

GGCTGTGGGGGACTGAGGGCAGGCTGTAACAGGCTTGGGGGCCAGGGCTTATACGT

GCCTGGGACTCCCAAAGTATTACTGTTCCATGTTCCCGGCGAAGGGCCAGCTGTCCC

CCGCCAGCTAGACTCAGCACTTAGTTTAGGAACCAGTGAGCAAGTCAGCCCTTGGG

GCAGCCCATACAAGGCCATGGGGCTGGGCAAGCTGCACGCCTGGGTCCGGGGTGGG

CACGGTGCCCGGGCAACGAGCTGAAAGCTCATCTGCTCTCAGGGGCCCCTCCCTGG

GGACAGCCCCTCCTGGCTAGTCACACCCTGTAGGCTCCTCTATATAACCCAGGGGCA

CAGGGGCTGCCCCCGGGTCAC

SEQ ID NO:171

CCTGAGTTTGAATCTCTCCAACTCAGCCAGCCTCAGTTTCCCCTCCACTCAGTCCCTA

GGAGGAAGGGGCGCCCAAGCGGGTTTCTGGGGTTAGACTGCCCTCCATTGCAATTG

GTCCTTCTCCCGGCCTCTGCTTCCTCCAGCTCACAGGGTATCTGCTCCTCCTGGAGCC

ACACCTTGGTTCCCCGAGGTGCCGCTGGGACTCGGGTAGGGGTGAGGGCCCAGGGG

CGACAGGGGGAGCCGAGGGCCACAGGAAGGGCTGGTGGCTGAAGGAGACTCAGGG

GCCAGGGGACGGTGGCTTCTACGTGCTTGGGACGTTCCCAGCCACCGTCCCATGTTC

CCGGCGGGGGCCAGCTGTCCCCACCGCCAGCCCAACTCAGCACTTGGTTAGGGTAT

CAGCTTGGTGGGGGCGTGAGCCCAGCCCTGGGGCGCTCAGCCCATACAAGGCCATG

GGGCTGGGCGCAAAGCATGCCTGGGTTCAGGGTGGGTATGGTGCCGGAGCAGGGA

GGTGAGAGGCTCAGCTGCCCTCCAGAACTCCTCCCTGGGGACAACCCCTCCCAGCC

AATAGCACAGCCTAGGTCCCCCTATATAAGGCCACGGCTGCTGGCCCTTCCTTTGGG

TCAGTGTCACCTCCAGGATACAGACAGCCCCCCTT

SEQ ID NO:172

CCACTACGGGTCTAGGCTGCCCATGTAAGGAGGCAAGGCCTGGGGACACCCGAGAT

GCCTGGTTATAATTAACCCAGACATGTGGCTGCCCCCCCCCCCCCAACACCTGCTGC

CTGAGCCTCACCCCCACCCCGGTGCCTGGGTCTTAGGCTCTGTACACCATGGAGGAG

AAGCTCGCTCTAAAAATAACCCTGTCCCTGGTGGAT

SEQ ID NO:173

CCACTACGGGTCTAGGCTGCCCATGTAAGGAGGCAAGGCCTGGGGACACCCGAGAT

GCCTGGTTATAATTAACCCCAACACCTGCTGCCCCCCCCCCCCCAACACCTGCTGCC

TGAGCCTGAGCGGTTACCCCACCCCGGTGCCTGGGTCTTAGGCTCTGTACACCATGG

AGGAGAAGCTCGCTCTAAAAATAACCCTGTCCCTGGTGGAT

SEQ ID NO:174

TGGCCACCGCCTTCGGCACCATCCTCACGACACCCAAATATGGCGACGGGTGAGGA

ATGGTGGGGAGTTATTTTTAGAGCGGTGAGGAAGGTGGGCAGGCAGCAGGTGTTGG

CGCTCTAAAAATAACTCCCGGGAGTTATTTTTAGAGCGGAGGAATGGTGGACACCC

AAATATGGCGACGGTTCCTCACCCGTCGCCATATTTGGGTGTCCGCCCTCGGCCGGG

GCCGCATTCCTGGGGGCCGGGCGGTGCTCCCGCCCGCCTCGATAAAAGGCTCCGGG

GCCGGCGGCGGCCCACGAGCTACCCGGAGGAGCGGGAGGCGCCAAGCTCTAGASEQ ID NO:175

AAGCTTGCATGTCTAAGCTAGACCCTTCAGATTAAAAATAACTGAGGTAAGGGCCT

GGGTAGGGGAGGTGGTGTGAGACGCTCCTGTCTCTCCTCTATCTGCCCATCGGCCCT

TTGGGGAGGAGGAATGTGCCCAAGGACTAAAAAAAGGCCATGGAGCCAGAGGGGC

GAGGGCAACAGACCTTTCATGGGCAAACCTTGGGGCCCTGCTGTCTAGCATGCCCC

ACTACGGGTCTAGGCTGCCCATGTAAGGAGGCAAGGCCTGGGGACACCCGAGATGC

CTGGTTATAATTAACCCAGACATGTGGCTGCCCCCCCCCCCCCAACACCTGCTGCCT

CTAAAAATAACCCTGTCCCTGGTGGATCCCCTGCATGCGAAGATCTTCGAACAAGG

CTGTGGGGGACTGAGGGCAGGCTGTAACAGGCTTGGGGGCCAGGGCTTATACGTGC

CTGGGACTCCCAAAGTATTACTGTTCCATGTTCCCGGCGAAGGGCCAGCTGTCCCCC

GCCAGCTAGACTCAGCACTTAGTTTAGGAACCAGTGAGCAAGTCAGCCCTTGGGGC

AGCCCATACAAGGCCATGGGGCTGGGCAAGCTGCACGCCTGGGTCCGGGGTGGGCA

CGGTGCCCGGGCAACGAGCTGAAAGCTCATCTGCTCTCAGGGGCCCCTCCCTGGGG

ACAGCCCCTCCTGGCTAGTCACACCCTGTAGGCTCCTCTATATAACCCAGGGGCACA

GGGGCTGCCCTCATTCTACCACCACCTCCACAGCACAGACAGACACTCAGGAGCAG

CCAGC

SEQ ID NO:176

CTAGACTAGCATGCTGCCCATGTAAGGAGGCAAGGCCTGGGGACACCCGAGATGCC

TGGTTATAATTAACCCAGACATGTGGCTGCCCCCCCCCCCCCAACACCTGCTGCCTC

TAAAAATAACCCTGCATGCCATGTTCCCGGCGAAGGGCCAGCTGTCCCCCGCCAGC

TAGACTCAGCACTTAGTTTAGGAACCAGTGAGCAAGTCAGCCCTTGGGGCAGCCCA

TACAAGGCCATGGGGCTGGGCAAGCTGCACGCCTGGGTCCGGGGTGGGCACGGTGC

CCGGGCAACGAGCTGAAAGCTCATCTGCTCTCAGGGGCCCCTCCCTGGGGACAGCC

CCTCCTGGCTAGTCACACCCTGTAGGCTCCTCTATATAACCCAGGGGCACAGGGGCT

GCCCTCATTCTACCACCACCTCCACAGCACAGACAGACACTCAGGAGCCAGCCAGCSEQ ID NO:177

TTCTGAGTCCTCTAAGGTCCCTCACTCCCAACTCAGCCCCATGTCCTGTCAATTCCCA

CTCAGTGTCTGATCTCCTTCTCCTCACCTTTCCCATCTCCCGTTTGACCCAGCTTCCT

GAGCTCTCCTCCCATTCCCCTTTTTGGAGTCCTCCTCCTCTCCCAGAACCCAGTAATA

AGTGGGCTCCTCCCTGGCCTGGACCCCCGTGGTAACCCTATAAGGCGAGGCAGCTG

CTGTCTGAGGCAGGGAGGGGCTGGTGTGGGAGGCTAAGGGCAGCTGCTAAGTTTAG

GGTGGCTCCTTCTCTCTTCTTAGAGACAACAGGTGGCTGGGGCCTCAGTGCCCAGAA

AAGAAAATGTCTTAGAGGTATCGGCATGGGCCTGGAGGAGGGGGGACAGGGCAGG

GGGAGGCATCTTCCTCAGGACATCGGGTCCTAGAGGACCTTGCTTCCTAGCTGGGCC

TTTCCTTCTCCTCTATAAATACCAGCTCTGGTATTTCGCCTTGGCAGCTGTTGCTGCT

AGGGAGACGGCTGGCTTGACATGCATCTCCTGACAAAACACAAACCCGTGGTGTGA

GTGGGTGTGGGCGGTGTGAGTAGGGGGATGAATCAGAGAGGGGGCGAGGGAGACA

GGGGCGCAGGAGTCAGGCAAAGGCGATGCGGGGGTGCGACTACACGCAGTTGGAA

ACAGTCGTCAGAAGATTCTGGAAACTATCTTGCTGGCTATAAACTTGAGGGAAGCA

GAAGGCCAACATTCCTCCCAAGGGAAACTGAGGCTCAGAGTTAAAACCCAGGTATC

AGTGATATGCATGTGCCCCGGCCAGGGTCACTCTCTGACTAACCGGTACCTACCCTA

CAGGCCTACCTAGAGACTCTTTTGAAAGGATGGTAGAGACCTGTCCGGGCTTTGCCC

ACAGTCGTTGGAAACCTCAGCATTTTCTAGGCAACTTGTGCGAATAAAACACTTCGG

GGGTCCTTCTTGTTCATTCCAATAACCTAAAACCTCTCCTCGGAGAAAATAGGGGGC

CTCAAACAAACGAAATTCTCTAGCCCGCTTTCCCCAGGATAAGGCAGGCATCCAAA

TGGAAAAAAAGGGGCCGGCCGGGGGTCTCCTGTCAGCTCCTTGCCCTGTGAAACCC

AGCAGGCCTGCCTGTCTTCTGTCCTCTTGGGGCTGTCCAGGGGCGCAGGCCTCTTGC

GGGGGAGCTGGCCTCCCCGCCCCCTCGCCTGTGGCCGCCCTTTTCCTGGCAGGACAG

AGGGATCCTGCAGCTGTCAGGGGAGGGGCGCCGGGGGGTGATGTCAGGAGGGCTA

CAAATAGTGCAGACAGCTAAGGGGCTCCGTCACCCATCTTCACATCCACTCCAGCC

GGCTGCCCGCCCGCTGCCTCCTCTGTGCGTCCGCCCAGCCAGCCTCGTCCACGCCGC

CACC

SEQ ID NO:178

ACCAACGACTGATTAACTCTACGTACGAAACGTATGAAGACGGACGACCCCTCGGA

CCCCTGAAAGGTGTGGCCCTCAATAAAAATCTCGCATATGGCGACGGCCCTTGGCA

GTACATCAAAACCTTTCAGGGCAATCACGATAACCGACCCCAGCCAATAGCACCAA

CGACTGATTAACTCTACGTACGAAACGTATGAAGACGGACGACCCCTCGGACCCCT

GAAAGGTGTGGCACTCCTTACCACGGTCCGTATAGCCCAAACTACATGACGGTTCCC

AGCCAATAGCCGCTCTAAAAATAACTCCCGGCAGCGGTATAAACCCACAGCGCTCT

AAAAATAACTCCCCCGGCAGCGGTATAGGGCCCCTCCCTGGGGACAGCCCCAACCT

TTCAGGGCAATCACGGTCCGCCCGGTAAATGGCACCCTCAATAAAAATCTCGCATC

CCTTTGGACTTCGGCCCCATTGACGTCAATGGGGTCCAAAAAATATATCAGGGGCTT

CAGGTTTCCCTACAAGGCCTGGGGACAACCCGATATGCCTGGGTCCAAAAAATATA

TCAGGTGGTTCAGTCGT

SEQ ID NO:179

ACAGGGGTCCGGAACGGCAGCGGTATAAACCCACAGTGGTTCAGTCGTCCGTCCGT

CGTCCACAACCGTCCAAAAAATATATCAGGAACTACATGACGGTTCACCAACGACT

GATTAACTCTACGTACGAAACGTATGAAGACGGACGACCCCTCGGACCCCTGAAAG

GTGTGGACCAACGACTGATTAACTCTACGTACGAAACGTATGAAGACGGACGACCC

CTCGGACCCCTGAAAGGTGTGGGTCCAAAAAATATATCAGGGGACACCCGAGATGC

CTGGTTAAACTACATGACGGTTCCCCCGACAGGGGTCCCTCCCCGGGTAATAACTGC

AGTTACCCG

SEQ ID NO:180

ACCAACGACTGATTAACTCTACGTACGAAACGTATGAAGACGGACGACCCCTCGGA

CCCCTGAAAGGTGTGGCTTGGCAGTACATCAAGCCCATTGACGTCAATAATCTTGGC

AGTACATCAAACCAACGACTGATTAACTCTACGTACGAAACGTATGAAGACGGACG

ACCCCTCGGACCCCTGAAAGGTGTGGACCAACGACTGATTAACTCTACGTACGAAA

CGTATGAAGACGGACGACCCCTCGGACCCCTGAAAGGTGTGGGTCCAAAAAATATA

TCAGGCAAGGCCTGGGGACA

SEQ ID NO:181

GCGGCCGCATCGATATTCGTAAACGCGTTCCTTGACACCTCTGTCTCCTCAGGTGCC

TGGCTCCCAGTCCCCAGAACGCCTCTCCTGTACCTTGCTTCCTAGCTGGGCCTTTCCT

TCTCCTCTATAAATACCAGCTCTGGTATTTCGCCTTGGCAGCTGTTGCTGCTAGGGC

GCGCCGTTTAAACCACGTGCTCGAGAGCAGCCACTACGGGTCTAGGCTGCCCATGT

AAGGAGGCAAGGCCTGGGGACACCCGAGATGCCTGGTTATAATTAACCCAGACATG

TGGCTGCCCCCCCCCACAACACCTGCTGCCTGAGCCTCACCCCCACCCCGGTGCCTG

GGTCTTAGGCTCTGTACACCATGGAGGAGAAGCTCGCTCTAAAAATAACCCTGTCG

ACACGTGTCTAGACTGATCAATCAAGGCTGTGGGGGACTGAGGGCAGGCTGTAACA

GGCTTGGGGGCCAGGGCTTATACGTGCCTGGGACTCCCAAAGTATTACTGTTCCATG

TTCCCGGCGAAGGGCCAGCTGTCCCCCGCCAGCTAGACTCAGCACTTAGTTTAGGA

ACCAGTGAGCAAGTCAGCCCTTGGGGCAGCCCATACAAGGCCATGGGGCTGGGCAA

GCTGCACGCCTGGGTCCGGGGTGGGCACGGTGCCCGGGCAACGAGCTGAAAGCTCA

TCTGCTCTCAGGGGCCCCTCCCTGGGGACAGCCCCTCCTGGCTGATCACACCCTGTA

GGCTCCTCTATATAACCCAGGGGCACTAGTGGGCTGCCCTCAGTTCACCACCACCTC

CACAGCACAGACAGACACTCAGGAGCCAGCCAGGTACCCAGGTAGGGACTGGCCA

CCCCAGCCCACCTGTCCCAATGCTGACTTAGTGCAAGGCGAGCCAGCAAGGAGGGA

GGACAGGTGGCAGTGGGGGGTGAGGAGCATCTAAAAATAGCCACAAACTGAGTTCT

TAAGTCTGAACCCGGTCTGCTCGCAGGTACCGGTCCCAAAGGCCGCCACCGCTAGC

GATATCGGATCCTCATGA

SEQ ID NO:182

MAADGYLPDWLEDNLSEGIREWWDLKPGAPKPKANQQKQDNGRGLVLPGYKYLGPF

NGLDKGEPVNAADAAALEHDKAYDQQLQAGDNPYLRYNHADAEFQERLQEDTSFGG

NLGRAVFQAKKRVLEPLGLVESPVKTAPGKKRPVEPSPQRSPDSSTGIGKKGQQPAKKR

LNFGQTGDSESVPDPQPIGEPPAGPSGLGSGTMAAGGGAPMADNNEGADGVGSSSGNW

HCDSTWLGDRVITTSTRTWALPTYNNHLYKQISNGTSGGSTNDNTYFGYSTPWGYFDF

NRFHCHFSPRDWQRLINNNWGFRPKRLNFKLFNIQVKEVTQNEGTKTIANNLTSTIQVF

TDSEYQLPYVLGSAHQGCLPPFPADVFMIPQYGYLTLNNGSQAVGRSSFYCLEYFPSQM

LRTGNNFEFSYNFEDVPFHSSYAHSQSLDRLMNPLIDQYLYYLSRTQSTGGTAGTQQLL

FSQAGPNNMSAQAKNWLPGPCYRQQRVSTTLSQNNNSNFAWTGATKYHLNGRDSLVN

PGVAMATHKDDEERFFPSSGVLMFGKQGAGKDNVDYSSVMLTSEEEIKTTNPVATEQY

GVVADNLQQQNAAPIVGAVNSQGALPGMVWQNRDVYLQGPIWAKIPHTDGNFHPSPL

MGGFGLKHPPPQILIKNTPVPADPPTTFNQAKLASFITQYSTGQVSVEIEWELQKENSKR

WNPEIQYTSNYYKSTNVDFAVNTEGTYSEPRPIGTRYLTRNL

SEQ ID NO:183

MAADGYLPDWLEDNLSEGIREWWALKPGAPQPKANQQHQDNARGLVLPGYKYLGPG

NGLDKGEPVNAADAAALEHDKAYDQQLKAGDNPYLKYNHADAEFQERLKEDTSFGG

NLGRAVFQAKKRLLEPLGLVEEAAKTAPGKKRPVEQSPQEPDSSAGIGKSGAQPAKKRL

NFGQTGDTESVPDPQPIGEPPAAPSGVGSLTMASGGGAPVADNNEGADGVGSSSGNWH

CDSQWLGDRVITTSTRTWALPTYNNHLYKQISNSTSGGSSNDNAYFGYSTPWGYFDFN

RFHCHFSPRDWQRLINNNWGFRPKRLNFKLFNIQVKEVTDNNGVKTIANNLTSTVQVFT

DSDYQLPYVLGSAHEGCLPPFPADVFMIPQYGYLTLNDGSQAVGRSSFYCLEYFPSQML

RTGNNFQFSYEFENVPFHSSYAHSQSLDRLMNPLIDQYLYYLSKTINGSGQNQQTLKFS

VAGPSNMAVQGRNYIPGPSYRQQRVSTTVTQNNNSEFAWPGASSWALNGRNSLMNPG

PAMASHKEGEDRFFPLSGSLIFGKQGTGRDNVDADKVMITNEEEIKTTNPVATESYGQV

ATNHQSAQAQAQTGWVQNQGILPGMVWQDRDVYLQGPIWAKIPHTDGNFHPSPLMG

GFGMKHPPPQILIKNTPVPADPPTAFNKDKLNSFITQYSTGQVSVEIEWELQKENSKRWN

PEIQYTSNYYKSNNVEFAVNTEGVYSEPRPIGTRYLTRNL

SEQ ID NO:184

GCTGAACAGTTTCTCAGAAAGACA

SEQ ID NO:185

GGCTGTTTTCATCCAGGTTGTG

SEQ ID NO:186

TCTTAAGGACCTCCAAGG

SEQ ID NO:187

GGGTGGGTTGCTTTACCTCTCTAG

SEQ ID NO:188

TCACATCATGAGATTTAGTCACTTCC

SEQ ID NO:189

TTGCTACTTCACAGTAACCACATGG

SEQ ID NO:190

GGGTGGGTTGCTTTACCTCT

SEQ ID NO:191

TCTGGATATCCTCTTCTGGG

SEQ ID NO:192

ATCAGAAGGATTATGTATAGGAATA

SEQ ID NO:193

GCTATCTGGATATCCTCTTCTGGG

Claims

1.一种多核苷酸，其包含编码第一工程化大范围核酸酶的第一核酸序列和编码第二工程化大范围核酸酶的第二核酸序列，

其中所述第一工程化大范围核酸酶在包含由肌营养不良蛋白基因中的SEQ ID NO:6的核酸序列组成的识别序列的位点处结合并切割核酸，并且所述第一工程化大范围核酸酶的氨基酸序列是SEQ ID NO:43，

和其中所述第二工程化大范围核酸酶在包含由所述肌营养不良蛋白基因中的SEQ IDNO:10的核酸序列组成的识别序列的位点处结合并切割核酸，其中所述第二工程化大范围核酸酶的氨基酸序列是SEQ ID NO:51。

2.根据权利要求1所述的多核苷酸，其中所述第一核酸序列和所述第二核酸序列被内部核糖体进入位点(IRES)序列或编码2A肽的核酸序列所分隔。

3.一种重组DNA构建体，其包含根据权利要求1所述的多核苷酸。

4.根据权利要求3所述的重组DNA构建体，其中所述第一核酸序列和所述第二核酸序列被IRES序列或编码2A肽的核酸序列所分隔。

5.根据权利要求4所述的重组DNA构建体，其中所述多核苷酸包含与所述第一核酸序列和所述第二核酸序列可操作地连接的肌细胞特异性启动子。

6.一种重组腺相关病毒(AAV)，其包含根据权利要求1所述的多核苷酸。

7.根据权利要求6所述的重组AAV，其中所述第一核酸序列和所述第二核酸序列被IRES序列或编码2A肽的核酸序列所分隔。

8.根据权利要求7所述的重组AAV，其中所述多核苷酸包含与所述第一核酸序列和所述第二核酸序列可操作地连接的肌细胞特异性启动子。

9.根据权利要求6所述的重组AAV，其中所述重组AAV具有包含SEQ ID NO:182的氨基酸序列的衣壳或包含SEQ ID NO:183的氨基酸序列的衣壳。

10.根据权利要求7所述的重组AAV，其中所述重组AAV具有包含SEQ ID NO:182的氨基酸序列的衣壳或包含SEQ ID NO:183的氨基酸序列的衣壳。

11.根据权利要求8所述的重组AAV，其中所述重组AAV具有包含SEQ ID NO:182的氨基酸序列的衣壳或包含SEQ ID NO:183的氨基酸序列的衣壳。