CN113166741A

CN113166741A - Dna文库的多重确定性组装

Info

Publication number: CN113166741A
Application number: CN201980081345.5A
Authority: CN
Inventors: E·J·迪安; K·帕特尔; A·米勒; K·梅赫塔; P·韦曼
Original assignee: Zymergen Inc
Current assignee: Zymergen Inc
Priority date: 2018-10-31
Filing date: 2019-10-31
Publication date: 2021-07-23
Also published as: JP2022513408A; US20200131508A1; US11066663B2; WO2020092704A1; EP3874037A1; SG11202104409YA; MX2021005028A; KR20210088615A; EP3874037A4; CA3117805A1; US20210324378A1

Abstract

本公开涉及体外或体内连接三或更多个感兴趣的双链(ds)或单链(ss)DNA分子的方法。该方法允许以确定性的方式连接大量DNA片段。它可以用于快速生成核酸文库，所述核酸文库随后可以用于多种应用，包含例如基因组编辑和途径组装。还公开了用于实施该方法的试剂盒。

Description

DNA文库的多重确定性组装

相关申请的交叉引用

本申请要求2018年10月31日提交的美国临时申请序列号62/753,254的优先权的权益，该美国临时申请通过引用以其整体并入本文用于所有目的。

技术领域

本公开涉及用于连接单链和/或双链核酸分子的组合物和方法，其允许在单个反应中体外或体内组装具有重叠端序列的多个核酸分子。所公开的方法和组合物可用于核酸序列的片段的确定性组装，并且可以用于编辑任何DNA序列，诸如例如所需的宿主细胞或生物体的基因组中的质粒、粘粒或特异性基因。

关于序列表的声明

与本申请相关联的序列表以文本形式提供，以代替纸质副本，并且据此通过引用被并入说明书中。包含序列表的文本文件的名称为ZYMR_029_01WO_SeqList_ST25.txt。文本文件为约262KB，并且创建于2019年10月31日，并经由EFS网以电子方式提交。

背景技术

传统上，核酸组装体诸如质粒或线性DNA以确定性的方式一次生成一个，因此可能是缓慢、昂贵和劳动密集型的。相比之下，目前用于生成复杂核酸组装体的文库的混合方法可以能够一次生成许多组装体，但通常产生代表组装体中的部件的集合之间所有可能组合的文库。此类方法是一种非确定性和组合性的组装方法，并且也可能是耗时的、劳动密集型的和昂贵的，特别是在其中序列的子集是组装反应的所需产物的情况下。

因此，在本领域中需要用于生成复杂核酸组装体的新方法，其不具有用于生成核酸组装体的传统方法固有的上述缺点。

发明内容

在一个方面中，本文提供了一种包括多核苷酸的混合物的组合物，所述混合物包括：含有成对的多核苷酸的第一池，其中第一池中的每对含有第一多核苷酸和第二多核苷酸；和插入多核苷酸的第二池，其中第二池中的每个插入多核苷酸包括在其5'端的与来自第一池的一对多核苷酸中的第一多核苷酸的3'端互补的第一组装重叠序列和在其相对的3'端的与第二多核苷酸的5'端互补的第二组装重叠序列。在一些情况下，组合物进一步包括克隆载体，其中，对于第一池中的每对，第一多核苷酸的5'端和第二多核苷酸的3'端包括与克隆载体互补的序列。在一些情况下，选择来自第一池的每一多核苷酸，使得除了第一池的成对的多核苷酸与第二池的插入多核苷酸之间、或第一池的成对的多核苷酸与克隆载体之间的设计的组装重叠序列之外，没有来自第一池的多核苷酸与来自第一池的超过指定的阈值的任何其他多核苷酸共享共同序列。在一些情况下，指定的阈值为5至15个连续核苷酸。在一些情况下，组合物进一步包括聚合酶。在一些情况下，聚合酶是链置换的或非链置换的。在一些情况下，聚合酶是非链置换的，并且组合物进一步包括拥挤剂。在一些情况下，拥挤剂是聚乙二醇(PEG)。在一些情况下，PEG以约3％至约7％(重量/体积)的浓度使用。在一些情况下，PEG选自PEG-200、PEG-4000、PEG-6000、PEG-8000或PEG-20,000。在一些情况下，聚合酶是链置换的，并且组合物进一步包括单链结合蛋白质。在一些情况下，单链DNA结合蛋白质是极端耐热的单链DNA结合蛋白质(ET SSB)、大肠杆菌recA、T7基因2.5产物、噬菌体λRedB或Rac前噬菌体RecT。在一些情况下，组合物进一步包括5'-3'核酸外切酶。在一些情况下，组合物进一步包括连接酶。在一些情况下，第一池中的每对是双链DNA(dsDNA)或单链(ssDNA)。在一些情况下，第二池中的每个插入多核苷酸是dsDNA或ssDNA。在一些情况下，对于第一池中的每对，第一多核苷酸和第二多核苷酸包括对应于宿主细胞中靶基因组基因座的序列。在一些情况下，对于第一池中的每对，第一多核苷酸和第二多核苷酸包括对应于作为代谢途径的一部分的基因的编码序列。在一些情况下，对于第一池中的每对，第一多核苷酸和第二多核苷酸包括对应于功能结构域或一或多种蛋白质的编码序列。在一些情况下，对于第一池中的每对，第一多核苷酸和第二多核苷酸在单个构建体中连接在一起，其中所述单个构建体包括用于第一多核苷酸与第二多核苷酸之间的一或多种位点特异性核酸酶的一或多个识别序列。在一些情况下，用于一或多种位点特异性核酸酶的一或多个识别序列包括归巢核酸内切酶识别序列。在一些情况下，第二池中的每个插入多核苷酸上的第一组装重叠序列和第二组装重叠序列包括分别与来自第一池的一对多核苷酸中的第一多核苷酸的3'端和第二多核苷酸的5'端互补的1或多个核苷酸。在一些情况下，第二池中的每个插入多核苷酸上的第一组装重叠序列和第二组装重叠序列包括分别与来自第一池的一对多核苷酸中的第一多核苷酸的3'端和第二多核苷酸的5'端互补的约25个核苷酸。在一些情况下，第二池中的每个插入多核苷酸包括位于第一组装重叠序列与第二组装重叠序列之间的一或多个有效负载序列。在一些情况下，一或多个有效负载序列选自启动子、基因、调节序列、编码降解决定子的核酸序列、编码溶解度标签的核酸序列、终止子、唯一标识符序列或其部分。在一些情况下，第一池中的每对第一多核苷酸和第二多核苷酸包括与第一池中的每个其他对相比对应于宿主细胞中不同靶基因组基因座的序列。在一些情况下，第一池中的每对第一多核苷酸和第二多核苷酸包括对应于宿主细胞中相同靶基因组基因座的序列。在一些情况下，第二池中的插入多核苷酸中的每个有效负载序列不同于第二池中的每个其他插入多核苷酸中的有效负载序列。在一些情况下，第二池中的插入多核苷酸中的每个有效负载序列与第二池中的每个其他插入多核苷酸中的有效负载序列相同。在一些情况下，位点特异性核酸酶是限制性核酸内切酶、IIs型核酸内切酶、归巢核酸内切酶、RNA导向的核酸酶、DNA导向的核酸酶、锌指核酸酶、TALEN或切口酶中的一或多种。

在另一个方面中，本文提供了一种用于生成多核苷酸的文库的方法，所述方法包括：a.组合多核苷酸的第一池和多核苷酸的第二池，其中第一池含有成对的多核苷酸，其中第一池中的每对含有第一多核苷酸和第二多核苷酸，其中第二池含有插入多核苷酸，其中第二池中的每个插入多核苷酸包括在其5'端的与来自第一池的一对多核苷酸中的第一多核苷酸的3'端互补的第一组装重叠序列和在其相对的3'端的与第二多核苷酸的5'端互补的第二组装重叠序列；b.将所述第一池和所述第二池组装成多核苷酸的文库，其中所述文库中的每一多核苷酸包括来自所述第二池的插入多核苷酸和来自所述第一池的一对第一多核苷酸和第二多核苷酸，其中所述组装通过体外克隆方法或体内克隆方法进行。在一些情况下，第二池中的每个插入多核苷酸上的第一组装重叠序列和第二组装重叠序列包括分别与来自第一池的一对多核苷酸中的第一多核苷酸的3'端和第二多核苷酸的5'端互补的1或多个核苷酸。在一些情况下，第二池中的每个插入多核苷酸上的第一组装重叠序列和第二组装重叠序列包括分别与来自第一池的一对多核苷酸中的第一多核苷酸的3'端和第二多核苷酸的5'端互补的约25个核苷酸。在一些情况下，对于第一池中的每对，第一多核苷酸和第二多核苷酸在单个构建体中连接在一起，其中所述单个构建体包括用于第一多核苷酸与第二多核苷酸之间的一或多种位点特异性核酸酶的一或多个识别序列。在一些情况下，用于一或多种位点特异性核酸酶的一或多个识别序列包括归巢核酸内切酶识别序列。在一些情况下，通过经由剪接和重叠延伸PCR(SOE-PCR)、限制-连接、钝端连接、基于重叠的组装方法、基于重组的方法、或连接第一多核苷酸和第二多核苷酸的任何其他酶促或化学方法，或者通过直接合成单个构建体，连接单独的第一多核苷酸和第二多核苷酸，来产生连接的单个构建体。在一些情况下，所述方法进一步包括在步骤(a)期间将克隆载体与第一池和第二池组合，其中对于第一池中的每对，克隆载体的相对端包括与第一多核苷酸的5'端和第二多核苷酸的3'端互补的序列。在一些情况下，所述方法进一步包括在步骤(a)之前将克隆载体与第一池组合，其中对于第一池中的每对，克隆载体的相对端包括与第一多核苷酸的5'端和第二多核苷酸的3'端互补的序列。在一些情况下，克隆载体和来自第一池的每对中的第一多核苷酸的5'端和第二多核苷酸的3'端包括用于一或多种位点特异性核酸酶的一或多个识别序列。在一些情况下，所述方法进一步包括通过添加用于一或多个识别序列的一或多种位点特异性核酸酶，在克隆载体的相对端与来自第一池的每对中的第一多核苷酸的5'端和第二多核苷酸的3'端之间生成单链互补突出物。在一些情况下，所述方法进一步包括连接克隆载体的相对端与来自第一池的每对中的第一多核苷酸的5'端和第二多核苷酸的3'端之间的单链互补突出物。可以使用DNA连接酶进行连接。在一些情况下，步骤(b)产生环状产物，所述环状产物包括来自第二池的插入多核苷酸、来自第一池的一对的第一多核苷酸和第二多核苷酸以及克隆载体。在一些情况下，通过从更大的一组此类序列中选择成对的多核苷酸序列来生成第一池，使得除了第一池的成对的多核苷酸与第二池的插入多核苷酸，或第一池的成对的多核苷酸与克隆载体之间的设计的组装重叠序列之外，没有来自第一池的多核苷酸与来自第一池的超过指定的阈值的任何其他多核苷酸共享共同序列。在一些情况下，指定的阈值为5至15个连续核苷酸。在一些情况下，组装是体外克隆方法，其中将第一池和第二池的混合物加热以使存在于第一池和第二池中的多核苷酸部分或完全变性，然后在组装之前被冷却至室温。在一些情况下，在步骤(a)之前，通过将含有来自成对的多核苷酸的每一个第一多核苷酸的混合物与含有来自成对的多核苷酸的每一个第二多核苷酸的混合物组合来生成多核苷酸的第一池。在一些情况下，第一池中的每对是双链DNA(dsDNA)或单链DNA(ssDNA)。在一些情况下，第二池中的每个插入多核苷酸是dsDNA或ssDNA。在一些情况下，对于第一池中的每对，第一多核苷酸和第二多核苷酸包括对应于宿主细胞中靶基因组基因座的序列。在一些情况下，对于第一池中的每对，第一多核苷酸和第二多核苷酸包括对应于作为代谢途径的一部分的基因的编码序列。在一些情况下，对于第一池中的每对，第一多核苷酸和第二多核苷酸包括对应于功能结构域或一或多种蛋白质的编码序列。在一些情况下，第二池中的每个插入多核苷酸包括位于第一组装重叠序列与第二组装重叠序列之间的一或多个有效负载序列。在一些情况下，一或多个有效负载序列选自启动子、基因、调节序列、编码降解决定子的核酸序列、编码溶解度标签的核酸序列、终止子、唯一标识符序列或其部分。在一些情况下，对于第一池中的每对，第一多核苷酸和第二多核苷酸包括与第一池中的每个其他对相比对应于宿主细胞中不同靶基因组基因座的序列。在一些情况下，对于第一池中的每对，第一多核苷酸和第二多核苷酸包括对应于宿主细胞中相同靶基因组基因座的序列。在一些情况下，第二池中的插入多核苷酸中的每个有效负载序列不同于第二池中的每个其他插入多核苷酸中的有效负载序列。在一些情况下，第二池中的插入多核苷酸中的每个有效负载序列与第二池中的每个其他插入多核苷酸中的有效负载序列相同。在一些情况下，第二池中的每个插入多核苷酸通过以下产生：(i)对包括有效负载序列、正向引物和反向引物的混合物进行聚合酶链反应(PCR)，其中所述正向引物包括5'至3'、与所述有效负载序列互补的一或多个核苷酸的短段、所述第一组装重叠序列、用于一或多种位点特异性核酸酶的一或多个识别序列、所述第二组装重叠序列和与所述有效负载序列互补的一或多个核苷酸的第二段，并且其中所述反向引物包括与所述有效负载序列互补的序列，其中所述PCR生成PCR产物，所述PCR产物包括5'至3'、与所述有效负载序列互补的核酸的短段、所述第一组装重叠序列、所述一或多个位点特异性核酸酶识别序列、所述第二组装重叠序列和所述有效负载序列；(ii)经由选自由剪接和重叠延伸PCR(SOE-PCR)、限制性连接、钝端连接、基于重叠的组装方法和基于重组的方法组成的群组的组装方法，或用于连接两个DNA分子的任何其他酶促或化学方法，使PCR产物环化；以及(iii)用一或多种识别一或多个位点特异性核酸酶识别序列的位点特异性核酸酶使环化的PCR产物线性化，从而生成多核苷酸的第二池。在一些情况下，位点特异性核酸酶是限制性核酸内切酶、IIs型核酸内切酶、归巢核酸内切酶、RNA导向的核酸酶、DNA导向的核酸酶、锌指核酸酶、TALEN或切口酶中的一或多种。

在又一个方面中，本文提供了一种用于生成多核苷酸的文库的方法，所述方法包括：(a)经由聚合酶链反应(PCR)扩增多核苷酸的第一池，其中第一池含有成对的多核苷酸，其中第一池中的每对含有第一多核苷酸和第二多核苷酸，并且其中一对中的每个第一多核苷酸和每个第二多核苷酸包括5'端和3'端，其中所述扩增在来自所述第一池的一对中的第一多核苷酸的5'端和第二多核苷酸的3'端上引入共同重叠序列，所述共同重叠序列包括用于一或多种位点特异性核酸酶的一或多个识别序列；(b)通过利用共同重叠序列将来自第一池的每对第一多核苷酸和第二多核苷酸组装成单个核酸片段，其中每对的单个核酸片段包括由共同重叠序列从第一多核苷酸的5'端和第二多核苷酸的3'端分离的第一多核苷酸和第二多核苷酸，并且其中每对的单个核酸片段中第一多核苷酸的3'端和第二多核苷酸的5'端位于单个核酸片段的相对末端上，远离一或多个位点特异性核酸酶识别序列；(c)将每对的单个核酸片段与含有插入多核苷酸的第二池组合，其中第二池中的每个插入多核苷酸包括在其5'端的与单个核酸片段中存在的第一多核苷酸的3'端互补的第一组装重叠序列和在其相对的3'端的与单个核酸片段中存在的第二多核苷酸的5'端互补的第二组装重叠序列；(d)将所述第一池和所述第二池组装成环化的产物的第三池，其中所述组装通过体外或体内重叠组装方法进行，并且其中所述第三池中的每种环化的产物包括来自所述第二池的插入序列和来自所述第一池的一对第一多核苷酸和第二多核苷酸；(e)经由一或多种位点特异性核酸酶的消化使第三池中的每种环化的产物线性化，所述位点特异性核酸酶识别位于第三池中的每种环化的产物中的第一多核苷酸序列与第二多核苷酸序列之间的一或多个位点特异性核酸酶识别序列；以及(f)通过体外或体内克隆方法将线性化的产物组装到克隆载体中。在一些情况下，位于第一多核苷酸序列与第二多核苷酸序列之间的一或多个位点特异性核酸酶识别序列是归巢核酸酶识别序列。在一些情况下，位于第一多核苷酸序列与第二多核苷酸序列之间的一或多个位点特异性核酸酶识别序列的一或多种位点特异性核酸酶是归巢核酸内切酶。在一些情况下，共同重叠序列包括至少1个核苷酸的组装重叠序列，并且步骤(b)中的组装通过基于重叠的DNA组装方法进行。在一些情况下，共同重叠序列包括10-25个核苷酸的组装重叠序列，并且步骤(b)中的组装通过基于重叠的DNA组装方法进行。在一些情况下，基于重叠的DNA组装方法选自SOE-PCR或体外重叠组装方法(例如HiFi组装)。在一些情况下，存在于第一多核苷酸的5'端的共同重叠序列中的一或多个位点特异性核酸酶识别序列与存在于每对中的第二多核苷酸的3'端上的共同重叠序列中的一或多个位点特异性核酸酶识别序列互补，并且其中在步骤(b)中利用每对中的第一多核苷酸和第二多核苷酸的共同重叠序列需要进行SOE-PCR。在一些情况下，在步骤(b)中利用每对中的第一多核苷酸和第二多核苷酸的共同重叠序列需要用一或多个位点特异性核酸酶识别序列的一或多种位点特异性核酸酶消化每对中第一多核苷酸的5'端和第二多核苷酸的3'端上的共同重叠序列中存在的一或多个位点特异性核酸酶识别序列，以在每对中第一多核苷酸的5'端和第二多核苷酸的3'端上生成包括互补序列的单链突出物；以及连接在每对中第一多核苷酸的5'端和第二多核苷酸的3'端上的单链突出物上存在的互补序列。在一些情况下，使用基于重叠的DNA组装方法进行步骤(d)的组装。在一些情况下，基于重叠的DNA组装选自SOE-PCR和体外重叠组装方法(例如HiFi组装)。在一些情况下，每对中的单个核酸片段中的第一多核苷酸的3'端和第二多核苷酸的5'端包括一组附加的一或多个位点特异性核酸酶识别序列，并且第二池中的每个插入多核苷酸中的第一组装重叠序列和第二组装重叠序列包括一或多个位点特异性核酸酶识别序列。在一些情况下，步骤(d)中的组装需要用每对中的单个核酸片段中的第一多核苷酸的3'端和第二多核苷酸的5'端上的附加的一或多个位点特异性核酸酶识别序列以及来自第二池的每个插入多核苷酸中的第一组装序列和第二组装序列中存在的一或多个位点特异性核酸酶识别序列的一或多种位点特异性核酸酶消化每对中的单个核酸片段中的第一多核苷酸的3'端和第二多核苷酸的5'端上存在的附加的一或多个位点特异性核酸酶识别序列和来自第二池的每个插入多核苷酸中的第一组装序列和第二组装序列中存在的一或多个位点特异性核酸酶识别序列，以在第一多核苷酸的3'端上生成单链突出物(其包括与来自第二池的插入多核苷酸的第一组装序列的5'端上的单链突出物上存在的序列互补的序列)和在第二多核苷酸的5'端上生成单链突出物(其包括与来自第二池的相同插入多核苷酸的第二组装序列的3'端上的单链突出物上存在的序列互补的序列)；以及连接单链突出物上存在的互补序列。在一些情况下，步骤(f)的克隆载体包括一或多个位点特异性核酸酶识别序列。在一些情况下，步骤(f)中的组装需要用克隆载体中存在的一或多个位点特异性核酸酶识别序列的一或多种位点特异性核酸酶消化克隆载体中的一或多个位点特异性核酸酶识别序列，其中消化在克隆载体的相对端生成单链突出物，其中克隆载体的相对端的一个上的单链突出物包括与步骤(e)中生成的线性化的产物的末端互补的序列，并且克隆载体的相对端的另一个上的单链突出物包括与步骤(e)中生成的线性化的产物的相对端互补的序列；以及连接克隆载体的单链突出物上存在的互补序列和来自步骤(e)的线性化的产物。在一些情况下，通过从更大的一组此类序列中选择成对的多核苷酸序列来生成第一池，使得除了第一池的成对的多核苷酸与第二池的插入多核苷酸，或第一池的成对的多核苷酸与克隆载体之间的设计的组装重叠序列之外，没有来自第一池的多核苷酸与来自第一池的超过指定的阈值的任何其他多核苷酸共享共同序列。在一些情况下，指定的阈值为5至15个连续核苷酸。在一些情况下，第二池中每个插入多核苷酸上的第一组装重叠序列和第二组装重叠序列包括1或多个与单个核酸片段的相对末端互补的核苷酸。在一些情况下，第二池中的每个插入多核苷酸上的第一组装重叠序列和第二组装重叠序列包括与单个核酸片段的相对末端互补的约25个核苷酸。在一些情况下，在步骤(a)之前，通过将含有来自成对的多核苷酸的每一个第一多核苷酸的混合物与含有来自成对的多核苷酸的每一个第二多核苷酸的混合物组合来生成多核苷酸的第一池。在一些情况下，第一池中的每对是双链DNA(dsDNA)或单链DNA(ssDNA)。在一些情况下，第二池中的每个插入多核苷酸是dsDNA或ssDNA。在一些情况下，对于第一池中的每对，第一多核苷酸和第二多核苷酸包括对应于宿主细胞中靶基因组基因座的序列。在一些情况下，对于第一池中的每对，第一多核苷酸和第二多核苷酸包括对应于作为代谢途径的一部分的基因的编码序列。在一些情况下，对于第一池中的每对，第一多核苷酸和第二多核苷酸包括对应于功能结构域或一或多种蛋白质的编码序列。在一些情况下，第二池中的每个插入多核苷酸包括位于第一组装重叠序列与第二组装重叠序列之间的一或多个有效负载序列。在一些情况下，一或多个有效负载序列选自启动子、基因、调节序列、编码降解决定子的核酸序列、编码溶解度标签的核酸序列、终止子、唯一标识符序列或其部分。在一些情况下，对于第一池中的每对，第一多核苷酸和第二多核苷酸包括与第一池中的每个其他对相比对应于宿主细胞中不同靶基因组基因座的序列。在一些情况下，对于第一池中的每对，第一多核苷酸和第二多核苷酸包括对应于宿主细胞中相同靶基因组基因座的序列。在一些情况下，第二池中的插入多核苷酸中的每个有效负载序列不同于第二池中的每个其他插入多核苷酸中的有效负载序列。在一些情况下，第二池中的插入多核苷酸中的每个有效负载序列与第二池中的每个其他插入多核苷酸中的有效负载序列相同。在一些情况下，第二池中的每个插入多核苷酸通过以下生成：(i)对包括有效负载序列、正向引物和反向引物的混合物进行聚合酶链反应(PCR)，其中正向引物包括5'至3'、与有效负载序列互补的一或多个核苷酸的短段、第一组装重叠序列、用于一或多种位点特异性核酸酶的一或多个识别序列、第二组装重叠序列和与有效负载序列互补的一或多个核苷酸的第二段，并且其中所述反向引物包括与所述有效负载序列或与所述有效负载序列下游的其他序列互补的序列，其中所述PCR生成PCR产物，所述PCR产物包括5'至3'、与所述有效负载序列互补的核酸的短段、所述第一组装重叠序列、所述一或多个位点特异性核酸酶识别序列、所述第二组装重叠序列和所述有效负载序列；(ii)经由选自由剪接和重叠延伸PCR(SOE-PCR)、限制性连接、钝端连接、基于重叠的组装方法和基于重组的方法组成的群组的组装方法，或用于连接两个DNA分子的任何其他酶促或化学方法，使PCR产物环化；以及(iii)用识别一或多个位点特异性核酸酶识别序列的一或多种位点特异性核酸酶使环化的PCR产物线性化，从而生成多核苷酸的第二池。在一些情况下，位点特异性核酸酶是限制性核酸内切酶、IIs型核酸内切酶、归巢核酸内切酶、RNA导向的核酸酶、DNA导向的核酸酶、锌指核酸酶、TALEN或切口酶中的一或多种。

附图说明

图1描绘了用于DNA文库的多重确定性组装的方法，其示出了插入多核苷酸和包括载体重叠组装序列的第一多核苷酸和包括载体重叠组装序列的第二多核苷酸以及任选的克隆载体的初始组合物。插入多核苷酸可以包括有效负载序列，如果缺失，该有效负载序列的长度为零个核苷酸，或者如果插入或替换，该有效负载序列的长度为非零。

图2示出了用于图1的方法中的将第一多核苷酸和第二多核苷酸预缔合的由内向外的组装方法，以允许组装比最大合成寡核苷酸长度更长的插入多核苷酸(例如启动子)。

图3示出了图1的方法的修改，以允许组装比最大合成寡核苷酸长度更长的插入多核苷酸(例如，启动子)。

图4示出了使用图1的方法的确定性文库的组装。在表中给出了每个文库中唯一基因座、有效负载和全部可能构建体的数量。

图5示出了采用包括精确设计的DNA部分的池的确定性文库的成功体外组装的结果，所述DNA部分包含环状排列的有效负载(插入物)。顶部的长条表示待在池中组装的质粒的结构，并且下方的较短条表示与来自组装体的池的三个单独样品的相应参考序列对齐的Sanger序列。读段内端的细垂直线表示Sanger读段尾端的预期测序伪影。

图6示出了混合的组装体的总成功率，对于所述混合的组装体，使用附加了源自宿主基因组的模板的组装重叠的引物经由PCR来创建含有有效负载的部分。

具体实施方式

定义

虽然以下术语被认为是本领域普通技术人员很好理解的，但是阐述以下定义以便于解释当前公开的主题。

如本文中所使用的，术语“一(a或an)”可以指一或多个该实体，即可以指多个指代物。因此，术语“一”、“一或多个”和“至少一个”在本文中可以互换地使用。此外，通过不定冠词“一”对“要素”的提及并不排除存在多于一个要素的可能性，除非上下文明确地要求存在一个要素并且仅存在一个要素。

除非上下文另有要求，否则在整个本说明书和权利要求书中，词语“包括”及其变体，诸如“包括(comprises和comprising)”应以开放的、包含的意义来解释，即“包含但不限于”。

在整个说明书中对“一个实施例(one embodiment)”或“一个实施例(anembodiment)”的提及意指结合该实施例描述的特定特征、结构或特性可以被包含在本公开的至少一个实施例中。因此，在整个本说明书的各处出现的短语“在一个实施例中(in oneembodiment)”或“在一个实施例中(in an embodiment)”可能不一定都指同一实施例。应当理解，为了清楚起见在单独实施例的上下文中描述的本公开的某些特征也可以在单个实施例中组合提供。相反，为了简洁起见在单个实施例的上下文中描述的本公开的各种特征也可以单独地或以任何合适的子组合来提供。

如本文中所使用的，术语“细胞生物体”、“微生物(microorganism)”或“微生物(microbe)”应被广义地理解。这些术语可互换地使用，并且包含但不限于两种原核生物域：细菌和古细菌，以及某些真核生物真菌和原生生物。在一些实施例中，本公开涉及本公开中存在的清单/表和图的“微生物”或“细胞生物体”或“微生物”。这种表征不仅可以指表和图的所鉴定的分类属，而且还可以指所鉴定的分类种，以及所述表或图中任何生物体的各种新的和最新鉴定的或设计的菌株。对于这些术语在本说明书的其他部分中(诸如在实例中)中的叙述来说，相同表征保持成立。

如本文中所使用的，术语“原核生物”是本领域公认的，并且是指不含有核或其他细胞器的细胞。原核生物通常按照两种域之一归类：细菌和古细菌。古细菌域和细菌域的生物体之间的决定性差异是基于16S核糖体RNA中的核苷酸碱基序列的根本差异。

如本文中所使用的，术语“古细菌”是指疵壁菌门(Mendosicutes)的生物体的类别，其通常在异常的环境中发现，并且通过若干标准(包含核糖体蛋白质的数量和细胞壁中胞壁酸的缺乏)与其余的原核生物区分开。根据ssrRNA分析，古生菌由系统发生学截然不同的两种群组组成：泉古菌门(Crenarchaeota)和广古菌门(Euryarchaeota)。根据它们的生理学，古细菌可以被分为三种类型：产甲烷菌(methanogens)(产甲烷的原核生物)；极端嗜盐菌(extreme halophiles)(生活在非常高浓度的盐(NaCl)下的原核生物)；和极端(超)嗜热菌(生活在非常高的温度下的原核生物)。除了将它们与细菌区分开的统一古细菌特征(即在细胞壁中没有胞壁质、酯连接的膜脂质等)之外，这些原核生物表现出使其适应其特定栖息地的独特的结构或生物化学属性。泉古菌门主要由极端嗜热性硫依赖性原核生物组成，并且广古菌门含有产甲烷菌和极端嗜盐菌。

如本文中所使用的，“细菌”或“真细菌(eubacteria)”可以指原核生物体的域。细菌至少包含如下11个不同的群组：(1)革兰氏阳性(革兰氏+)细菌，其中存在两个主要的亚门：(1)高G+C群组(放线菌(Actinomycetes)、分枝杆菌(Mycobacteria)、微球菌(Micrococcus)及其他)(2)低G+C群组(芽孢杆菌(Bacillus)、梭菌(Clostridia)、乳杆菌(Lactobacillus)、葡萄球菌(Staphylococci)、链球菌(Streptococci)、支原体(Mycoplasmas))；(2)变形菌门(Proteobacteria)，例如紫色光合成+非光合成革兰氏阴性菌(包含最“常见”的革兰氏阴性菌)；(3)蓝细菌(Cyanobacteria)，例如含氧光养生物；(4)螺旋体(Spirochetes)和相关菌种；(5)浮霉状菌属(Planctomyces)；(6)拟杆菌属(Bacteroides)、黄杆菌(Flavobacteria)；(7)衣原体(Chlamydia)；(8)绿色硫细菌(Greensulfur bacteria)；(9)绿色非硫细菌(也称厌氧光养生物)；(10)耐辐射微球菌和相关菌种；(11)热袍菌属(Thermotoga)和嗜热性热袍菌(Thermosipho thermophiles)。

如本文中所使用的，“真核生物”是其细胞含有核和封闭在膜内的其他细胞器的任何生物体。真核生物属于真核生物域(Eukarya或Eukaryota)分类单元。将真核细胞与原核细胞(上述细菌和古细菌)区分开来的决定性特征是，它们具有膜结合的细胞器，尤其是含有遗传物质并被核膜封闭的细胞核。

如本文中所使用的，术语“遗传修饰的宿主细胞”、“重组宿主细胞”和“重组菌株”在本文中可互换地使用，并且可以指已经通过本公开的克隆和转化方法进行遗传修饰的宿主细胞。因此，该术语包含宿主细胞(例如，细菌、酵母细胞、真菌细胞、CHO、人类细胞等)，其已经被遗传改变、修饰或工程改造，使得与其所来源于的天然存在的生物体相比，它表现出改变的、修饰的或不同的基因型和/或表型(例如，当遗传修饰影响微生物的编码核酸序列时)。应当理解，在一些实施例中，该术语不仅指所讨论的特定重组宿主细胞，而且还指此类宿主细胞的后代或潜在后代。

如本文中所使用的，术语“野生型微生物”或“野生型宿主细胞”可以描述在自然界中存在的细胞，即未经遗传修饰的细胞。

如本文中所使用的，术语“遗传工程改造的”可以指对宿主细胞的基因组的任何操作(例如通过核酸的插入、缺失、突变或替换)。

如本文中所使用的，术语“对照”或“对照宿主细胞”可以指用于确定遗传修饰或实验处理的效果的合适的比较宿主细胞。在一些实施例中，对照宿主细胞是野生型细胞。在其他实施例中，对照宿主细胞在基因上除了遗传修饰之外，与经遗传修饰的宿主细胞相同，从而有别于处理宿主细胞。在一些实施例中，本公开教导了使用亲本菌株作为对照宿主细胞(例如，使用S₁菌株作为菌株改良程序的基础)。在其他实施例中，宿主细胞可以是遗传上相同的细胞，其缺乏在处理宿主细胞中所测试的特定启动子或SNP。

如本文中所使用的，术语“等位基因”可以指基因的一或多种替代形式中的任何一种，所有这些等位基因都与至少一种性状或特性相关。在二倍体细胞中，给定基因的两个等位基因占据一对同源染色体上的相应基因座。

如本文中所使用的，术语“基因座(locus)”(复数形式的基因座(loci))可以表示期望对天然基因组序列进行编辑的任何位点。在一个实施例中，所述术语可以指染色体上的特定的一或多个位置或位点，在该位置或位点例如发现了基因或遗传标记物。

如本文中所使用的，术语“遗传连接的”可以指在繁殖期间两种或更多种性状以高速率共同遗传，使得它们难以通过杂交分离。

如本文中所使用的“重组”或“重组事件”可以指染色体杂交或独立的分类。

如本文中所使用的，术语“表型”可以指个体细胞、细胞培养物、生物体或生物体群组的可观察特性，其由该个体的基因组成(即基因型)与环境之间的相互作用产生。

如本文中所使用的，术语“嵌合的”或“重组的”当描述核酸序列或蛋白质序列时可以指将至少两个异源多核苷酸或两个异源多肽连接成单个大分子，或使至少一种天然核酸或蛋白质序列的一或多个元件重排的核酸或蛋白质序列。例如，术语“重组”可以指两个以其他方式分离的序列的片段的人工组合，例如通过化学合成或通过经由基因工程改造技术操纵核酸的分离的片段。

如本文中所使用的，“合成的核苷酸序列”或“合成的多核苷酸序列”是已知在自然界中不存在或不是天然存在的核苷酸序列。通常，当与任何其他天然存在的核苷酸序列相比时，此类合成核苷酸序列可以包括至少一种核苷酸差异。

如本文中所使用的，术语“核酸”可以指任何长度的核苷酸的聚合物形式：核糖核苷酸或脱氧核糖核苷酸或其类似物。该术语可以指分子的初级结构，并且因此包含双链和单链DNA，以及双链和单链RNA。它还包含修饰的核酸，诸如甲基化的和/或封端的核酸、含有修饰的碱基、主链修饰的核酸等。术语“核酸”和“核苷酸序列”可互换地使用。

如本文中所使用的，术语“基因”可以指与生物功能相关的任何DNA片段。因此，基因可以包含但不限于编码序列和/或其表达所需的调节序列。基因还可以包含未表达的DNA片段，其例如形成用于其他蛋白质的识别序列。基因可以从各种来源获得(包含从感兴趣的来源克隆或从已知或预测的序列信息合成)，并且可以包含被设计为具有所需参数的序列。

如本文中所使用的，术语“同源的”或“同源物”或“直系同源物(ortholog)”或“直系同源物(orthologue)”在本领域中是已知的，并且可以指共享共同祖先或家族成员并基于序列同一性的程度确定的相关序列。

术语“同源性”、“同源的”、“基本相似的”和“基本上对应的”在本文中可以互换地使用。所述术语可以指核酸片段，其中一或多个核苷酸碱基的变化不影响核酸片段介导基因表达或产生某种表型的能力。这些术语还可以指本公开的核酸片段的修饰，诸如相对于初始的、未修饰的片段基本上不改变所得核酸片段的功能性质的一或多个核苷酸的缺失或插入。因此，应当理解，如本领域技术人员将理解的，本公开涵盖除所述特定示例性序列之外的序列。这些术语描述了在一种物种、亚种、品种、栽培品种或品系中发现的基因与在另一种物种、亚种、品种、栽培品种或品系中发现的相应或等效基因之间的关系。为了本公开的目的，比较同源序列。

“同源序列”或“同源物”或“直系同源物”被认为、相信或已知在功能上是相关的。功能关系可以用多种方式中的任何一种来表示，包含但不限于：(a)序列同一性的程度和/或(b)相同或相似的生物学功能。优选地，指示(a)和(b)两者。氨基酸序列或核酸序列之间的序列同源性可以根据共同的祖先来定义。由于物种形成事件(直系同源物)或重复事件(旁系同源物)，核酸的两个片段可能具有共同的祖先。氨基酸序列或核酸序列之间的同源性可以从它们的序列相似性来推断，使得氨基酸序列或核酸序列被认为是同源的，即所述氨基酸序列或所述核酸序列共享显著的相似性。显著的相似性可以是两个序列通过从共同祖先的不同进化而相关的有力证据。多个序列的比对可以用于发现同源区域。同源性可以使用本领域中容易获得的软件程序来确定，诸如在分子生物学实验室指南(CurrentProtocols in Molecular Biology)(F.M.奥斯贝(F.M.Ausubel)等人编,1987)副刊30,第7.718章,表7.71中讨论的那些软件程序。一些比对程序为BLAST(NCBI),MacVector(牛津分子有限公司(Oxford Molecular Ltd)，英国牛津(Oxford,U.K.)),ALIGN Plus(科学和教育软件(Scientific and Educational Software)，宾夕法尼亚州(Pennsylvania))和AlignX(Vector NTI，英杰公司(Invitrogen)，加利福尼亚州卡尔斯巴德(Carlsbad,CA))。另一个比对程序是使用默认参数的Sequencher(基因代码(Gene Codes)，密歇根州安娜堡(AnnArbor,Michigan))。

如本文中所使用的，术语“内源性”或“内源性基因”可以指天然存在的基因，在其所处位置发现其天然地存在于宿主细胞基因组内。在本公开的上下文中，将异源启动子可操作地连接到内源基因意指在该基因天然存在的位置将异源启动子序列通过遗传方式插入到现有基因的前面。如本文所述的内源基因可以包含根据本公开的任何方法已经突变的天然存在的基因的等位基因。

如本文中所使用的，术语“外源的”与术语“异源的”可互换地使用，并且是指来自除其天然来源之外的一些来源的物质。例如，术语“外源蛋白质”或“外源基因”是指来自非天然来源或位置并且已经被人工提供给生物系统的蛋白质或基因。

如本文中所使用的，术语“核苷酸变化”是指例如核苷酸替代、缺失和/或插入，如本领域中所熟知的。例如，突变可以含有产生沉默替代、添加或缺失的改变，但不改变编码的蛋白质的性质或活性或蛋白质的制备方式。可替代地，突变可以是非同义替代或改变，其可以改变编码的蛋白质的氨基酸序列并且可以导致蛋白质的性质或活性的改变。

如本文中所使用的，术语“蛋白质修饰”可以指如本领域中所熟知的氨基酸替代、氨基酸修饰、缺失和/或插入。

如本文中所使用的，术语核酸或多肽的“至少一部分”或“片段”可以指具有此类序列的最小尺寸特征的部分，或全长分子的任何较大片段，直至并包含全长分子。本公开的多核苷酸的片段可以编码基因调节元件的生物活性部分。基因调节元件的生物活性部分可以通过分离本公开的多核苷酸之一的包括基因调节元件的一部分并评估如本文所述的活性来制备。类似地，多肽的一部分可以是4个氨基酸、5个氨基酸、6个氨基酸、7个氨基酸等，直至全长多肽。待使用的部分的长度将取决于特定应用。用作杂交探针的核酸的一部分可以短至12个核苷酸；在一些实施例中，它是20个核苷酸。用作表位的多肽的一部分可以短至4个氨基酸。发挥全长多肽的功能的多肽的一部分通常将比4个氨基酸长。

变体多核苷酸还可以涵盖来源于诱变和重组程序诸如DNA改组(shuffling)的序列。用于此类DNA改组的策略在本领域中是已知的。参见，例如，施特默尔(Stemmer)(1994)美国国家科学院院刊(PNAS)91:10747-10751；施特默尔(1994)自然(Nature)370:389-391；凯默瑞(Crameri)等人(1997)自然生物技术(Nature Biotech.)15:436-438；穆尔(Moore)等人(1997)分子生物学杂志(J.Mol.Biol.)272:336-347；张(Zhang)等人(1997)美国国家科学院院刊94:4504-4509；凯默瑞等人(1998)自然391:288-291；以及美国专利号5,605,793和5,837,458。

对于本文公开的PCR扩增，可以设计用于PCR反应的寡核苷酸引物，以从由任何感兴趣的生物体提取的cDNA或基因组DNA中扩增相应的DNA序列。用于设计PCR引物和PCR克隆的方法在本领域中是公知的，并且公开在萨布鲁克(Sambrook)等人(2001)分子克隆：实验室手册(Molecular Cloning:A Laboratory Manual)(第3版，冷泉港实验室出版社(ColdSpring Harbor Laboratory Press)，纽约普莱恩维尤(Plainview,NewYork))中。还参见英尼斯(Innis)等人编(1990)PCR方案：方法和应用指南(PCR Protocols:A Guide toMethods and Applications)(纽约学术出版社(Academic Press,New York))；英尼斯和盖尔范德(Gelfand)编(1995)PCR策略(PCR Strategies)(纽约学术出版社)；以及英尼斯和盖尔范德编(1999)PCR方法手册(PCR Methods Manual)(纽约学术出版社)。已知的PCR方法包含但不限于使用配对引物、巢式引物、单一特异性引物、简并引物、基因特异性引物、载体特异性引物、部分错配引物等的方法。

如本文中所使用的术语“引物”可以指寡核苷酸，其当置于其中诱导引物延伸产物的合成的条件下时(即在核苷酸和用于聚合的药剂诸如DNA聚合酶的存在下和在合适的温度和pH下)，能够退火至扩增靶，允许DNA聚合酶附着，从而用作DNA合成的起点。(扩增)引物可以是单链的以获得最大的扩增效率。引物可以是寡脱氧核糖核苷酸。引物必须足够长，以在用于聚合的药剂的存在下引发延伸产物的合成。引物的确切长度将取决于许多因素，包含引物的温度和组成(A/T相对于G/C含量)。一对双向引物由一个正向引物和一个反向引物组成，如在DNA扩增(诸如在PCR扩增中)领域中常用的。

如本文中所使用的，“启动子”可以指能够控制编码序列或功能性RNA的表达的DNA序列。在一些实施例中，启动子序列由近端和更远端上游元件组成，后者元件通常被称为增强子。因此，“增强子”可以是可以刺激启动子活性的DNA序列，并且可以是启动子的先天元件或被插入以增强启动子的水平或组织特异性的异源元件。启动子可以全部来源于天然基因，或者可以由来源于在自然界中发现的不同启动子的不同元件组成，或者甚至包括合成的DNA片段。本领域技术人员应理解，不同的启动子可以指导基因在不同组织或细胞类型中或在不同发育阶段或响应于不同环境条件的表达。进一步认识到，由于在大多数情况下调节序列的确切边界尚未完全确定，因此一些变异的DNA片段可能具有相同的启动子活性。

如本文中所使用的，短语“重组构建体”、“表达构建体”、“嵌合构建体”、“构建体”和“重组DNA构建体”在本文中可互换地使用。重组构建体可以包括核酸片段的人工组合，例如在自然界中未一同发现的调节序列和编码序列。例如，嵌合构建体可以包括来自不同来源的调节序列和编码序列，或来自相同来源但以不同于在自然界中发现的方式排列的调节序列和编码序列。此类构建体可以单独使用，或者可以与载体联合使用。如果使用载体，那么载体的选择取决于将用于转化宿主细胞的方法，如本领域技术人员所熟知的。例如，可以使用质粒载体。技术人员熟知在载体上必须存在的遗传元件，以便成功地转化、选择和繁殖包括本公开的任何分离的核酸片段的宿主细胞。技术人员还将认识到，不同的独立转化事件将导致不同的表达水平和模式(琼斯(Jones)等人(1985)欧洲分子生物学组织杂志(EMBOJ.)4:2411-2418；德·阿尔梅达(De Almeida)等人(1989)分子基因遗传学(Mol.Gen.Genetics)218:78-86)，并且因此必须筛选多个事件，以便获得显示所需表达水平和模式的细胞系。此类筛选可以通过直接测序、DNA的Southern分析、mRNA表达的Northern分析、蛋白质表达的免疫印迹分析或表型分析等来完成。载体可以是质粒、病毒、细菌噬菌体、前病毒、噬菌粒、转座子、人工染色体等，其自主地复制或者可以整合到宿主细胞的染色体中。载体也可以是非自主复制的裸RNA多核苷酸、裸DNA多核苷酸、由同一条链内的DNA和RNA组成的多核苷酸、聚赖氨酸缀合的DNA或RNA、肽缀合的DNA或RNA、脂质体缀合的DNA等。如本文中所使用的，术语“表达”是指功能性最终产物例如mRNA或蛋白质(前体或成熟物)的产生。

“可操作地连接的”或“功能性连接的”可以意指根据本公开的任何功能性有效负载(例如，启动子、终止子、降解决定子、溶解度标签等)与另外的寡核苷酸或多核苷酸的顺序排列。在一些情况下，顺序排列可以导致所述另外的多核苷酸的转录。在一些情况下，顺序排列可以导致所述另外的多核苷酸的翻译。功能性有效负载可以存在于另外的寡核苷酸或多核苷酸的上游或下游。在一个实例中，“可操作地连接的”或“功能性连接的”可以意指启动子控制与所述启动子相邻或其下游或3'的基因的转录。在另一个实例中，“可操作地连接的”或“功能性连接的”可以意指终止子控制与所述终止子相邻或其上游或5'的基因的转录的终止。

如本文中所使用的术语“感兴趣的产物”或“生物分子”可以指由来自原料的微生物产生的任何产物。在一些情况下，感兴趣的产物可以是小分子、酶、肽、氨基酸、有机酸、合成化合物、燃料、醇等。例如，感兴趣的产物或生物分子可以是任何初级或次级细胞外代谢物。初级代谢物尤其可以是乙醇、柠檬酸、乳酸、谷氨酸、谷氨酸盐、赖氨酸、苏氨酸、色氨酸和其他氨基酸、维生素、多糖等。次级代谢物尤其可以是抗生素化合物如青霉素、或免疫抑制剂如环孢菌素A(cyclosporin A)、植物激素如赤霉素(gibberellin)、他汀类药物(statin drug)如洛伐他汀(lovastatin)、杀真菌剂如灰黄霉素(griseofulvin)等。感兴趣的产物或生物分子也可以是由微生物产生的任何细胞内组分，诸如：微生物酶，包含：过氧化氢酶、淀粉酶、蛋白酶、果胶酶、葡萄糖异构酶、纤维素酶、半纤维素酶、脂肪酶、乳糖酶、链激酶和许多其他酶。细胞内组分还可以包含重组蛋白质，诸如胰岛素、乙肝疫苗、扰动素、粒细胞集落刺激因子、链激酶等。

如本文中所使用的，术语“HTP遗传设计文库”或“文库”是指根据本公开的遗传扰动的集合。在一些实施例中，本公开的文库可以表现为i)数据库或其他计算机文件中的序列信息的集合，ii)编码上述一系列遗传元件的遗传构建体的集合，或iii)包括所述遗传元件的宿主细胞菌株。在一些实施例中，本公开的文库可以指单个元件的集合(例如，PRO交换文库的启动子的集合，用于STOP交换文库的终止子的集合，溶解度标签交换文库的蛋白质溶解度标签的集合，或降解标签交换文库的蛋白质降解标签的集合)。在其他实施例中，本公开的文库还可以指遗传元件的组合，诸如启动子:基因、基因:终止子、或者甚至启动子:基因:终止子的组合。在一些实施例中，本公开的文库还可以指启动子、终止子、蛋白质溶解度标签和/或蛋白质降解标签的组合。在一些实施例中，本公开的文库进一步包括与在宿主生物体中应用文库的每个成员的效果相关的元数据。例如，如本文中所使用的文库可以包含启动子::基因序列组合的集合，以及那些组合对特定物种中的一或多种表型的所得效果，因此提高了在未来启动子交换中使用所述组合的未来预测价值。

如本文中所使用的，术语“SNP”是指小核多态性。在一些实施例中，本公开的SNP应当被广义地解释，并且包含单核苷酸多态性、序列插入、缺失、倒位和其他序列替换。如本文中所使用的，术语“非同义的”或非同义的SNP"是指导致宿主细胞蛋白质中的编码变化的突变。

基因组工程改造的“高通量(HTP)”方法可以涉及利用至少一件自动化设备(例如液体处理机或板处理机)来实施所述方法的至少一个步骤。

如本文中所使用的术语“多核苷酸”涵盖寡核苷酸，并且指任何长度的核酸。多核苷酸可以是DNA或RNA。除非另有说明，否则多核苷酸可以是单链的(ss)或双链的(ds)。多核苷酸可以是合成的，例如在DNA合成器中合成的，或天然存在的，例如从天然来源提取的，或衍生自克隆的或扩增的材料。本文所提及的多核苷酸可以含有修饰的碱基或核苷酸。

如本文中所使用的术语“池”可以指至少2种多核苷酸的集合。在一些实施例中，一组多核苷酸可以包括至少5个、至少10个、至少12个或至少15个或更多个多核苷酸。

如本文中所使用的术语“重叠序列”，或“重叠组装序列”或“组装重叠序列”可以指在两个多核苷酸中互补的序列，并且其中重叠序列是一个多核苷酸上的ss，使得它可以与另一个多核苷酸上的另一个重叠互补ss区杂交。重叠序列可以在两种不同的多核苷酸的末端处或接近末端(例如，在约5、10、20个核苷酸之内)。例如，如果两种不同的多核苷酸是单链的，则组装重叠序列将存在于每种单链多核苷酸的3'末端。可替代地，如果两种不同的多核苷酸是双链的，则一种多核苷酸的组装重叠序列可以存在于所述多核苷酸的3'末端(即，相对于ds多核苷酸的顶部链的3'端)，而另一种多核苷酸上的互补组装重叠序列可以存在于所述多核苷酸的5'端(即，相对于ds多核苷酸的顶部链的5'端)。根据需要，可以通过去除任何非重叠序列来获得任何ds多核苷酸上的组装重叠序列。去除可以是酶促的，诸如通过通过使用聚合酶的3'-5'核酸外切酶活性。

如本文中所使用的，术语“组装”可以指其中两个或更多、四个或更多、六个或更多、八个或更多、十个或更多、12个或更多、15个或更多的多核苷酸，例如四个或更多的多核苷酸彼此连接以形成更长的多核苷酸的反应。

如本文中所使用的，术语“在合适的反应条件下孵育”可以指将反应维持在合适的温度和时间以获得期望的结果，即多核苷酸组装。适合于在本方法中使用的酶和试剂的反应条件是已知的(例如，如在本文实例中所述)，并且因此可以容易地确定用于本方法的合适的反应条件。这些反应条件可以取决于所使用的酶(例如，取决于它们的最佳温度等)而变化。

如本文中所使用的，术语“连接”可以指两个序列之间共价键的产生。

如本文中所使用的，术语“组合物”可以指除了列出的试剂之外还可以含有其他试剂的试剂的组合，例如甘油、盐、dNTP等。组合物可以是任何形式，例如含水的或冻干的，并且可以是任何状态(例如，冷冻的或液体形式)。

如本文中所使用的，“载体”是合适的DNA，片段或DNA组装体可以被整合到其中，使得工程改造的载体可以在宿主细胞中复制。线性化的载体可以通过环状载体的限制性核酸内切酶消化或通过PCR产生。片段和/或线性化的载体的浓度可以通过凝胶电泳或其他方法来确定。

概述

本文提供了促进以确定性而非组合方式在单个反应中产生多个组装体的方法和组合物。本文提供的方法和组合物赋予了多重组装的时间、成本和通量益处，同时仍然能够创建文库，其中所有输出组装体都是预先确定的。本文提供的方法和组合物允许在单个组装反应中产生许多质粒或构建体，减少了产生数千个质粒或构建体的文库所需的总反应数。本文提供的方法和组合物还允许从大量可能组合的更大集合中组装所需的质粒或构建体的限定子集。在一些情况下，本文提供的方法和组合物通过不包含任何有效负载或插入序列特异性组装重叠，使需要从基因组扩增(或合成)的独特部分(“同源性臂”)的数目最小化。这可以消除扩增被设计用于与多个有效负载或插入序列组合的同一同源性臂对的多个拷贝的需要。此外，由有效负载/插入序列和同源性臂对的组合产生的多样性由有效负载/插入序列本身上的序列指定。大量所得的有效负载序列可以合成和廉价地产生。使用本文提供的方法和组合物生成的文库可以适合于任何数量的应用，诸如例如任何基因组编辑方法或任何混合的途径组装。本领域中已知的基因组编辑方法可以是那些不需要用于RCME(重组酶盒介导的交换)的定制位点以在多个任意位置编辑细胞的基因组的方法，诸如例如无疤痕的基因组编辑。

本文提供了一种组合物，其包括用于以确定性方式组装核酸构建体的文库的多核苷酸的混合物。混合物可以包括多核苷酸部分(例如，第一多核苷酸和第二多核苷酸)的n个池。n个池可以是至多、至少或恰好是多核苷酸的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个池。n个池可以各自包括相同数量的多核苷酸部分，或者它们可以包括不同数量的多核苷酸部分(例如，第一多核苷酸和第二多核苷酸)。在一个实施例中，混合物包括2个池，使得两个池中的一个包括第一多核苷酸，并且两个池中的另一个包括第二多核苷酸。第一多核苷酸的每个池可以在第二多核苷酸的单独池中包括配对的第二多核苷酸。除了任何上述实施例之外，混合物可以进一步包括插入或桥接多核苷酸的n-1个池。每个插入或桥接多核苷酸可以包括与其5'端的多核苷酸部分的n个池之一(例如第一多核苷酸)的元件和与其3'端的多核苷酸部分的其他池之一(例如第二多核苷酸)的元件互补的序列。可以设计插入序列，使得组装产生多核苷酸的文库，其中每个多核苷酸包括来自多核苷酸部分的n个池中的每一个的特定元件，散布有来自插入多核苷酸的n-1个池中的每一个的特定元件。

多核苷酸的混合物可以包括：含有成对的多核苷酸的第一池，其中第一池中的每对含有第一多核苷酸和第二多核苷酸；和插入多核苷酸的第二池，其中第二池中的每个插入多核苷酸包括在其5'端的与来自第一池的一对多核苷酸中的第一多核苷酸的3'端互补的第一组装重叠序列和在其相对的3'端的与第二多核苷酸的5'端互补的第二组装重叠序列。在一个实施例中，所述组合物可以进一步包括克隆载体，其中，对于第一池中的每对，第一多核苷酸的5'端和第二多核苷酸的3'端包括与克隆载体互补的序列。克隆载体可以是本领域中已知的适合于在宿主细胞诸如例如大肠杆菌(E.coli)或酿酒酵母(S.cerevisiae)中繁殖的任何克隆载体。在另一个实施例中，组合物还包括聚合酶、核酸外切酶、连接酶或其任意组合。聚合酶可以是链置换的或非链置换的。核酸外切酶可以是5'-3'核酸外切酶。第一池中的成对的多核苷酸可以是双链的、单链的或其组合。第二池中的插入多核苷酸可以是双链的、单链的或其组合。在一个实施例中，聚合酶是非链置换的，并且组合物进一步包括拥挤剂。拥挤剂可以选自聚乙二醇(PEG)、聚蔗糖或葡聚糖。在一个实施例中，拥挤剂是PEG。PEG可以以约3％至约7％(重量/体积)的浓度使用。PEG可以选自PEG-200、PEG-4000、PEG-6000、PEG-8000或PEG-20,000。在另一个实施例中，聚合酶是链置换的，并且组合物进一步包括单链结合蛋白质。单链DNA结合蛋白质可以是极端耐热的单链DNA结合蛋白质(ETSSB)、大肠杆菌recA、T7基因2.5产物、噬菌体λRedB或Rac前噬菌体RecT。

在一个实施例中，本文提供的组合物是以下多核苷酸的混合物：(1)一或多种第一多核苷酸，(2)一或多种插入多核苷酸，其中插入多核苷酸包括在其5'端的第一组装重叠序列和在其相对的3'端的第二组装重叠序列，和(3)一或多种第二多核苷酸。在另一个实施例中，组合物是以下多核苷酸的混合物：(1)一或多种第一多核苷酸，(2)一或多种插入多核苷酸，其中插入多核苷酸包括在其5'端的第一组装重叠序列和在其相对的3'端的第二组装重叠序列，(3)一或多种第二多核苷酸和(4)克隆载体。一或多种第一多核苷酸中的每一种可以包括在其3'端或远端的与存在于来自一或多种插入多核苷酸的插入多核苷酸的5'端或近端的第一组装重叠序列互补的序列。一或多种第二多核苷酸中的每一种可以包括在其5'端或近端的与存在于来自一或多种插入多核苷酸的插入多核苷酸的3'端或远端的第二组装重叠序列互补的序列。一或多种第一多核苷酸中的每一个可以与一或多种第二多核苷酸中的至少一个配对，从而形成一对或多对第一多核苷酸和第二多核苷酸。每对第一多核苷酸和第二多核苷酸可以包括在第一多核苷酸的远端的与来自一或多个插入多核苷酸的插入多核苷酸的近端上的第一组装重叠序列互补的序列；以及在第二多核苷酸的近端的与来自一或多个插入多核苷酸的插入多核苷酸的远端互补的序列。

本文提供了一种用于生成多核苷酸的文库的方法，该方法包括：a.组合多核苷酸部分的n个池(例如第一多核苷酸和第二多核苷酸)和插入或桥接多核苷酸的n-1个池；以及b.将多核苷酸部分的n个池和插入多核苷酸的n-1个池组装到多核苷酸的文库中，其中文库中的每个多核苷酸包括来自多核苷酸部分的n个池中的每一个的单个元件和桥接多核苷酸的限定组合。插入或桥接多核苷酸的n-1个池中的每个插入或桥接多核苷酸包括在其5'端的与第一多核苷酸的3'端互补的第一组装重叠序列和在其相对的3'端的与第一多核苷酸和第二多核苷酸的n个池中的第二多核苷酸的5'端互补的第二组装重叠序列。组装可以经由体外或体内重叠组装方法进行。在一些情况下，经由体外克隆方法进行组装，其中将多核苷酸部分的n个池和插入或桥接多核苷酸的n-1个池的混合物加热，以使存在的任何双链多核苷酸部分部分或完全变性，然后在进行体外克隆方法之前以低速冷却至室温。

本文还提供了一种用于生成多核苷酸的文库的方法，该方法包括：(a)组合多核苷酸的第一池和多核苷酸的第二池，其中第一池含有成对的多核苷酸，其中第一池中的每对含有第一多核苷酸和第二多核苷酸，其中第二池含有插入多核苷酸，其中第二池中的每个插入多核苷酸包括在其5'端的与来自第一池的一对多核苷酸中的第一多核苷酸的3'端互补的第一组装重叠序列和在其相对的3'端的与第二多核苷酸的5'端互补的第二组装重叠序列；(b)将第一池和第二池组装成多核苷酸的文库，其中文库中的每一多核苷酸包括来自第二池的插入多核苷酸和来自第一池的一对第一多核苷酸和第二多核苷酸。组装可以经由体外或体内重叠组装方法进行。在一些情况下，经由体外克隆方法进行组装，其中加热第一池和第二池的混合物以使存在于第一池和第二池中的多核苷酸部分或完全变性，然后在进行体外克隆方法之前以低速冷却至室温。在一些情况下，该方法进一步包括在步骤(a)期间将克隆载体与第一池和第二池组合，其中对于第一池中的每对，克隆载体的相对端包括与第一多核苷酸的5'端和第二多核苷酸的3'端互补的序列。在一些情况下，该方法进一步包括在步骤(a)之前将克隆载体与第一池组合，其中对于第一池中的每对，克隆载体的相对端包括与第一多核苷酸的5'端和第二多核苷酸的3'端互补的序列。在一些情况下，克隆载体和来自第一池的每对中的第一多核苷酸的5'端和第二多核苷酸的3'端包括用于一或多种位点特异性核酸酶的一或多个识别序列。在一些情况下，所述方法进一步包括通过添加用于一或多个识别序列的一或多种位点特异性核酸酶，在克隆载体的相对端与来自第一池的每对中的第一多核苷酸的5'端和第二多核苷酸的3'端之间生成单链互补突出物。在一些情况下，所述方法进一步包括连接克隆载体的相对端与来自第一池的每对中的第一多核苷酸的5'端和第二多核苷酸的3'端之间的单链互补突出物。可以使用DNA连接酶进行连接。在一些情况下，步骤(b)产生环状产物，所述环状产物包括来自第二池的插入多核苷酸、来自第一池的一对的第一多核苷酸和第二多核苷酸以及克隆载体。

在一个方面中，本文提供了一种用于生成多核苷酸的文库的方法，该方法包括：(a)通过聚合酶链反应(PCR)扩增多核苷酸的第一池，其中第一池含有成对的多核苷酸，其中第一池中的每对含有第一多核苷酸和第二多核苷酸，并且其中一对中的每个第一多核苷酸和每个第二多核苷酸包括5'端和3'端，其中该扩增在来自第一池的一对中的第一多核苷酸的5'端和第二多核苷酸的3'端上引入共同重叠序列，该共同重叠序列包括用于一或多种位点特异性核酸酶的一或多个识别序列；(b)通过利用共同重叠序列将来自第一池的每对第一多核苷酸和第二多核苷酸组装成单个核酸片段，其中每对的单个核酸片段包括由共同重叠序列从第一多核苷酸的5'端和第二多核苷酸的3'端分离的第一多核苷酸和第二多核苷酸，并且其中每对的单个核酸片段中第一多核苷酸的3'端和第二多核苷酸的5'端位于单个核酸片段的相对末端上，远离一或多个位点特异性核酸酶识别序列；(c)将每对的单个核酸片段与含有插入多核苷酸的第二池组合，其中第二池中的每个插入多核苷酸包括在其5'端的与单个核酸片段中存在的第一多核苷酸的3'端互补的第一组装重叠序列和在其相对的3'端的与单个核酸片段中存在的第二多核苷酸的5'端互补的第二组装重叠序列；(d)将第一池和第二池组装成环化的产物的第三池，其中所述组装经由体外或体内重叠组装方法进行，并且其中第三池中的每种环化的产物包括来自第二池的插入序列和来自第一池的一对第一多核苷酸和第二多核苷酸；(e)经由一或多种位点特异性核酸酶的消化使第三池中的每种环化的产物线性化，所述位点特异性核酸酶识别位于第三池中的每个环状产物中的第一多核苷酸序列与第二多核苷酸序列之间的一或多个位点特异性核酸酶识别序列；以及(f)经由体外或体内克隆方法将线性化的产物组装到克隆载体中。在一些情况下，共同重叠序列包括至少1个核苷酸的组装重叠序列，并且步骤(b)中的组装通过基于重叠的DNA组装方法进行。在一些情况下，共同重叠序列包括10-25个核苷酸的组装重叠序列，并且步骤(b)中的组装通过基于重叠的DNA组装方法进行。在一些情况下，基于重叠的DNA组装方法选自SOE-PCR或体外重叠组装方法(例如，使用

HiFi构建器的HiFi组装)。在一些情况下，存在于第一多核苷酸的5'端的共同重叠序列中的一或多个位点特异性核酸酶识别序列与存在于每对中的第二多核苷酸的3'端上的共同重叠序列中的一或多个位点特异性核酸酶识别序列互补，并且其中在步骤(b)中利用每对中的第一多核苷酸和第二多核苷酸的共同重叠序列需要进行SOE-PCR。在一些情况下，在步骤(b)中利用每对中的第一多核苷酸和第二多核苷酸的共同重叠序列需要用一或多个位点特异性核酸酶识别序列的一或多种位点特异性核酸酶消化每对中第一多核苷酸的5'端和第二多核苷酸的3'端上的共同重叠序列中存在的一或多个位点特异性核酸酶识别序列，以在每对中第一多核苷酸的5'端和第二多核苷酸的3'端上生成包括互补序列的单链突出物；以及连接在每对中第一多核苷酸的5'端和第二多核苷酸的3'端上的单链突出物上存在的互补序列。步骤(d)中的组装可以经由体外或体内重叠组装方法进行。步骤(d)的组装可以使用基于重叠的DNA组装方法进行。基于重叠的DNA组装可以选自SOE-PCR和体外重叠组装方法(例如，使用

HiFi构建器的HiFi组装)。在一些情况下，每对中的单个核酸片段中的第一多核苷酸的3'端和第二多核苷酸的5'端包括一组附加的一或多个位点特异性核酸酶识别序列，并且第二池中的每个插入多核苷酸中的第一组装重叠序列和第二组装重叠序列包括一或多个位点特异性核酸酶识别序列。在一些情况下，步骤(d)中的组装需要用每对中的单个核酸片段中的第一多核苷酸的3'端和第二多核苷酸的5'端上的附加的一或多个位点特异性核酸酶识别序列以及来自第二池的每个插入多核苷酸中的第一组装序列和第二组装序列中存在的一或多个位点特异性核酸酶识别序列的一或多种位点特异性核酸酶消化每对中的单个核酸片段中的第一多核苷酸的3'端和第二多核苷酸的5'端上存在的附加的一或多个位点特异性核酸酶识别序列和来自第二池的每个插入多核苷酸中的第一组装序列和第二组装序列中存在的一或多个位点特异性核酸酶识别序列，以在第一多核苷酸的3'端上生成单链突出物(其包括与来自第二池的插入多核苷酸的第一组装序列的5'端上的单链突出物上存在的序列互补的序列)和在第二多核苷酸的5'端上生成单链突出物(其包括与来自第二池的相同插入多核苷酸的第二组装序列的3'端上的单链突出物上存在的序列互补的序列)；以及连接单链突出物上存在的互补序列。在一些情况下，步骤(d)的组装经由体外克隆方法进行，其中将第一池和第二池的混合物加热以使存在于第一池和第二池中的多核苷酸部分或完全变性，然后在进行体外克隆方法之前以低速冷却至室温。步骤(f)中的组装可以经由体外克隆方法或体内克隆方法进行。在一些情况下，步骤(f)的克隆载体包括一或多个位点特异性核酸酶识别序列。在一些情况下，步骤(f)中的组装需要用克隆载体中存在的一或多个位点特异性核酸酶识别序列的一或多种位点特异性核酸酶消化克隆载体中的一或多个位点特异性核酸酶识别序列，其中消化在克隆载体的相对端生成单链突出物，其中克隆载体的相对端的一个上的单链突出物包括与步骤(e)中生成的线性化的产物的末端互补的序列，并且克隆载体的相对端的另一个上的单链突出物包括与步骤(e)中生成的线性化的产物的相对端互补的序列；以及连接克隆载体的单链突出物上存在的互补序列和来自步骤(e)的线性化的产物。用于本文提供的任何方法或组合物中的位点特异性核酸酶可以选自限制性核酸内切酶、IIs型核酸内切酶、归巢核酸内切酶、RNA导向的核酸酶、DNA导向的核酸酶、锌指核酸酶、TALEN和切口酶或其任意组合。位于第一多核苷酸序列与第二多核苷酸序列之间的一或多个位点特异性核酸酶识别序列可以是一或多个归巢核酸酶识别序列。位于第一多核苷酸序列与第二多核苷酸序列之间的一或多个位点特异性核酸酶识别序列的一或多种位点特异性核酸酶可以是归巢核酸内切酶。

在另一个方面中，本文提供了一种用于生成多核苷酸的文库的方法，该方法包括：(a)经由聚合酶链反应(PCR)扩增多核苷酸的第一池，其中第一池含有成对的多核苷酸，其中第一池中的每对含有第一多核苷酸和第二多核苷酸，并且其中一对中的每一个第一多核苷酸和每一个第二多核苷酸包括第一5'末端和相对的第二3'末端，其中该扩增将用于一或多种位点特异性核酸酶的一或多个识别序列引入到来自第一池的一对中的第一多核苷酸的第一5'末端和第二多核苷酸的3'端上，其中第一多核苷酸的第一5'末端上的一或多种位点特异性核酸酶的一或多个识别序列与该对中的第二多核苷酸的第一3'末端上的一或多种位点特异性核酸酶的一或多个识别序列互补；(b)通过利用每对中第一多核苷酸的第一5'末端和第二多核苷酸的3'端上的一或多个互补位点特异性核酸酶识别序列进行剪接和重叠延伸聚合酶链反应(SOE-PCR)将来自第一池的每对第一多核苷酸和第二多核苷酸组装成单个核酸片段，其中每对的单个核酸片段包括由一或多个位点特异性核酸酶识别序列从第一多核苷酸的第一5'末端和第二多核苷酸的3'端分离的第一多核苷酸和第二多核苷酸，并且其中每对的单个核酸片段中的第一多核苷酸的相对的第二3'末端和第二多核苷酸的5'端位于单个核酸片段的相对末端上，远离一或多个位点特异性核酸酶识别序列；(c)将每对的单个核酸片段与含有插入多核苷酸的第二池组合，其中第二池中的每个插入多核苷酸包括在其5'端的与单个核酸片段中存在的第一多核苷酸的相对3'末端之一的相对末端互补的第一组装重叠序列和在其相对的3'端的与单个核酸片段中存在的第二多核苷酸的相对的5'末端中的另一个互补的第二组装重叠序列；(d)将第一池和第二池组装成环化的产物的第三池，其中该组装经由体外或体内重叠组装方法进行，并且其中第三池中的每种环化的产物包括来自第二池的插入序列和来自第一池的一对第一多核苷酸和第二多核苷酸；(e)经由添加一或多种位点特异性核酸酶使第三池中的每种环化的产物线性化，该位点特异性核酸酶识别位于第三池中的每种环化的产物中的第一多核苷酸序列与第二多核苷酸序列之间的一或多个位点特异性核酸酶识别序列；以及(f)通过体外或体内克隆方法将线性化的产物组装到克隆载体中。步骤(d)中的组装可以经由体外或体内重叠组装方法进行。在一些情况下，使用基于重叠的DNA组装方法进行步骤(d)的组装。基于重叠的DNA组装可以选自SOE-PCR和体外重叠组装方法(例如，使用

HiFi构建器的HiFi组装)。在一些情况下，每对中的单个核酸片段中的第一多核苷酸的3'端和第二多核苷酸的5'端包括一组附加的一或多个位点特异性核酸酶识别序列，并且第二池中的每个插入多核苷酸中的第一组装重叠序列和第二组装重叠序列包括一或多个位点特异性核酸酶识别序列。在一些情况下，步骤(d)中的组装需要用每对中的单个核酸片段中的第一多核苷酸的3'端和第二多核苷酸的5'端上的附加的一或多个位点特异性核酸酶识别序列以及来自第二池的每个插入多核苷酸中的第一组装序列和第二组装序列中存在的一或多个位点特异性核酸酶识别序列的一或多种位点特异性核酸酶消化每对中的单个核酸片段中的第一多核苷酸的3'端和第二多核苷酸的5'端上存在的附加的一或多个位点特异性核酸酶识别序列和来自第二池的每个插入多核苷酸中的第一组装序列和第二组装序列中存在的一或多个位点特异性核酸酶识别序列，以在第一多核苷酸的3'端上生成单链突出物(其包括与来自第二池的插入多核苷酸的第一组装序列的5'端上的单链突出物上存在的序列互补的序列)和在第二多核苷酸的5'端上生成单链突出物(其包括与来自第二池的相同插入多核苷酸的第二组装序列的3'端上的单链突出物上存在的序列互补的序列)；以及连接单链突出物上存在的互补序列。在一些情况下，步骤(d)的组装经由体外克隆方法进行，其中将第一池和第二池的混合物加热以使存在于第一池和第二池中的多核苷酸部分或完全变性，然后在进行体外克隆方法之前以低速冷却至室温。步骤(f)中的组装可以经由体外克隆方法或体内克隆方法进行。在一些情况下，步骤(f)的克隆载体包括一或多个位点特异性核酸酶识别序列。在一些情况下，步骤(f)中的组装需要用克隆载体中存在的一或多个位点特异性核酸酶识别序列的一或多种位点特异性核酸酶消化克隆载体中的一或多个位点特异性核酸酶识别序列，其中消化在克隆载体的相对端生成单链突出物，其中克隆载体的相对端的一个上的单链突出物包括与步骤(e)中生成的线性化的产物的末端互补的序列，并且克隆载体的相对端的另一个上的单链突出物包括与步骤(e)中生成的线性化的产物的相对端互补的序列；以及连接克隆载体的单链突出物上存在的互补序列和来自步骤(e)的线性化的产物。用于本文提供的任何方法或组合物中的位点特异性核酸酶可以选自限制性核酸内切酶、IIs型核酸内切酶、归巢核酸内切酶、RNA导向的核酸酶、DNA导向的核酸酶、锌指核酸酶、TALEN和切口酶或其任意组合。

在一个实施例中，本文提供的方法和组合物中的第一多核苷酸和第二多核苷酸包括与宿主细胞中的靶基因组基因座互补或对应的序列。与第一多核苷酸和第二多核苷酸中存在的靶基因组基因座互补或对应的序列可以位于所述第一多核苷酸和所述第二多核苷酸的与所述第一多核苷酸和所述第二多核苷酸的末端相对的末端上，其包括与插入多核苷酸上存在的组装重叠序列互补的序列。当包括与宿主细胞中的靶基因组基因座互补或对应的序列时，第一多核苷酸和第二多核苷酸可以被称为同源性臂。特别地，每个第一多核苷酸可以被称为左同源性臂，而每个第二多核苷酸可以被称为右同源性臂。当包括与宿主细胞中的靶基因组基因座互补或对应的序列时，通过使用本文提供的组合物和方法组装成对的第一多核苷酸和第二多核苷酸和插入多核苷酸而生成核酸构建体的文库可以随后用于修饰宿主细胞的基因组的基因组编辑技术。宿主细胞可以是原核细胞或真核宿主细胞。

多核苷酸对

如本文所述，本文提供的组合物和方法可以包括或利用第一多核苷酸和第二多核苷酸，使得每个第一多核苷酸与第二多核苷酸配对。可以使用本领域已知的用于合成核酸的任何方法来化学合成(例如，阵列合成或柱合成)第一多核苷酸和第二多核苷酸。第一多核苷酸和第二多核苷酸可以经由延伸反应(例如PCR)从现有的DNA(诸如例如基因组DNA)扩增。

第一多核苷酸和第二多核苷酸中的每一种可以包括功能性序列和非功能性序列或其组合。功能性序列可以指代表基因或其部分或结构域或调节元件或其部分的序列。如本文进一步所述，基因或其部分可以编码作为代谢或生物化学途径的一部分的蛋白质。此外，如本文进一步所述，调节元件可以是启动子、终止子、溶解度标签、降解标签或降解决定子。非功能性序列可以指不代表基因或其部分或调节元件或其部分的序列。非功能性序列可以是有助于或用于所述第一多核苷酸和所述第二多核苷酸与如本文提供的插入多核苷酸组装的序列。在一个实施例中，第一多核苷酸和第二多核苷酸中的每一种包括功能性序列和非功能性序列的混合物。在另一个实施例中，第一多核苷酸和第二多核苷酸中的每一种包括功能性序列或非功能序列中的一个或另一个。在其中第一多核苷酸和第二多核苷酸仅包括功能性序列的实施例中，功能性序列或功能性序列的一部分可以用于所述第一多核苷酸和所述第二多核苷酸与如本文提供的插入多核苷酸的组装。

第一多核苷酸和/或第二多核苷酸各自可以在长度上变化，并且在一些情况下长度可以是至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、200、300、400、500、600、700、800、900、950或1000个核苷酸碱基和/或长度可以大于1kb或2kb。可替代地，第一多核苷酸和/或第二多核苷酸的长度可以是2kb或更大，或1kb或更大或大于900个碱基、800个碱基、700个碱基、600个碱基、500个碱基、400个碱基、300个碱基、200个碱基或100个碱基。第一多核苷酸和/或第二多核苷酸的长度可以在100个核苷酸至2kb的范围内，例如高达100、高达150、高达200、高达250、高达300、高达350、高达400、高达450、高达500、高达550、高达600、高达650、高达700、高达750或高达800、高达850、高达900、高达950、高达1000、高达1500或高达2000个核苷酸。第一多核苷酸和/或第二多核苷酸的最小长度可以由经验确定的优选的Tm来定义。

如本文所述，第一多核苷酸序列和第二多核苷酸序列中的每一个可以包括有助于所述第一多核苷酸和所述第二多核苷酸与插入多核苷酸的组装的序列。为了帮助所述组装，所述序列可以与插入多核苷酸上存在的组装重叠序列互补。与插入多核苷酸上存在的组装重叠序列互补的序列也可以被称为组装重叠序列。在一个实施例中，组装重叠序列代表整个第一多核苷酸和/或第二多核苷酸。在另一个实施例中，组装重叠序列仅代表第一多核苷酸和/或第二多核苷酸的一部分，并且第一多核苷酸和/或第二多核苷酸进一步包括除了组装重叠序列之外的附加序列。在一个实施例中，如本文提供的一对第一多核苷酸和第二多核苷酸中的第一多核苷酸包括在其远端或3'端的与存在于插入多核苷酸的5'端或近端的第一组装重叠序列互补的组装重叠序列，而所述一对中的第二多核苷酸包括在其近端或5'端的与存在于所述插入多核苷酸的3'端或远端的第二组装重叠序列互补的重叠组装重叠序列。除了该实施例之外，第一多核苷酸和第二多核苷酸可以各自包括除了组装重叠序列之外的附加序列。第一多核苷酸和/或第二多核苷酸的附加序列可以使所述第一多核苷酸和/或第二多核苷酸适应具体的应用。具体的应用可以是利用本领域中已知的核酸文库的任何应用，特别是那些将受益于混合的确定性组装的应用。示例性用途可以包含但不限于基因组编辑和途径组装。

存在于第一多核苷酸和/或第二多核苷酸上的组装重叠序列可以在长度上变化，并且在一些情况下，长度可以是至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30个核苷酸和/或长度可以是至多100个核苷酸(例如，长度高达50、高达30、高达25、高达20或高达15个核苷酸)。组装重叠序列的长度可以在15个核苷酸至100个核苷酸的范围内，例如高达20个、高达25个、高达30个、高达35个、高达40个、高达45个、高达50个、高达55个、高达60个、高达65个、高达70个、高达75个、高达80个核苷酸、高达85个核苷酸、高达90个核苷酸、高达95个核苷酸或高达100个核苷酸。组装重叠序列的长度可以与插入多核苷酸上存在的组装重叠序列的长度相同。组装重叠序列的最小长可以由经验确定的优选的Tm来定义。在一个实施例中，第一多核苷酸和/或第二多核苷酸上的组装重叠序列包括与插入多核苷酸的末端互补的1或多个核苷酸。在另一个实施例中，第一多核苷酸和/或第二多核苷酸上的组装重叠序列包括与插入多核苷酸的末端互补的约25个核苷酸。

如图1所示，每对第一多核苷酸和第二多核苷酸可以进一步包括具有克隆载体的载体重叠序列，使得第一多核苷酸(即，图1中的第一DNA片段)可以包括在其5'端的克隆载体的载体重叠序列，而第二多核苷酸(即，图1中的第二DNA片段)可以包括在其3'端的克隆载体的载体重叠序列。在实施例中，其中一对中的第一多核苷酸和第二多核苷酸中的每一个进一步包含如本文提供的第一DNA片段和第二DNA片段，所述第一DNA片段和所述第二DNA片段可以位于第一多核苷酸中克隆载体的载体重叠序列的下游和附近，以及第二多核苷酸中克隆载体的载体重叠序列的上游和附近。

载体重叠序列的长度可以变化，并且在一些情况下，长度可以是至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30个核苷酸和/或长度可以是高达100个核苷酸(例如，长度高达50个、高达30个、高达25个、高达20个或高达15个核苷酸)。可替代地，载体重叠序列可以是2kb或更小，或1kb或更小或小于900个碱基、800个碱基、700个碱基、600个碱基、500个碱基、400个碱基、300个碱基、200个碱基或100个碱基。载体重叠序列长度可以在15个核苷酸至80个核苷酸的范围内，例如高达20个、高达25个、高达30个、高达35个、高达40个、高达45个、高达50个、高达55个、高达60个、高达65个、高达70个、高达75个或高达80个核苷酸。载体重叠序列的最小长度可以由经验确定的优选的Tm来定义。

在一个实施例中，通过从更大的一组此类序列中选择成对的第一多核苷酸序列和第二多核苷酸序列来生成含有成对的第一多核苷酸和第二多核苷酸的池，使得除了如本文所提供的所述池的成对的多核苷酸和插入多核苷酸或其池，或所述池和克隆载体之间的设计的重叠组装序列之外，没有来自所述池的多核苷酸与来自所述池的超过指定的阈值的任何其他多核苷酸共享共同序列。指定的阈值至少是1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个连续核苷酸。指定的阈值最多为1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个连续核苷酸。指定的阈值为0至2、1至3、2至4、3至5、4至6、5至7、6至8、7至9、8至10、9至11、10至12、11至13、12至14、13至15、14至16、15至17、16至18、17至19、18至20或19至21个连续核苷酸。指定的阈值为0至5、0至10、0至15、0至20、5至10、5至15、5至20、10至15或10至20个连续核苷酸。在一个实施例中，指定的阈值是12个连续的核苷酸。超过指定的阈值的共享的共同序列的确定可以使用计算机程序来完成，该计算机程序使用BLAST分析或简单的子串搜索来确定组分是否与其他组分共享序列。如果发现共享的序列超出指定的阈值，则不会将组分一起放入池中。

在一个实施例中，如本文所述的插入多核苷酸与所需的一对第一多核苷酸和第二多核苷酸的配对可以通过使用如图2所示的“由内而外的组装”方法预组装所需的一对第一多核苷酸和第二多核苷酸来促进。在该方法中，可以通过PCR来扩增第一多核苷酸和第二多核苷酸，使得第一多核苷酸的载体近端各自含有一或多个独特的位点特异性核酸酶位点或识别序列。位点特异性核酸酶识别序列可以是选自限制性核酸内切酶、IIs型核酸内切酶、归巢核酸内切酶、RNA导向的核酸酶、DNA导向的核酸酶、锌指核酸酶、TALEN和切口酶及其任意组合的位点特异性核酸酶。在一个实施例中，第一多核苷酸的载体近端各自含有单一独特的核酸酶位点或识别序列。在一个实施例中，独特的核酸酶识别序列是独特的限制性核酸内切酶位点，使得所述限制性核酸内切酶位点不存在于本文提供的组合物中存在的任何多核苷酸中。在一个实施例中，独特的核酸酶位点是归巢核酸内切酶序列，诸如例如对I-SceI或I-CeuI特异的归巢核酸内切酶序列。将单对第一多核苷酸和第二多核苷酸组合，并进行剪接和重叠延伸聚合酶链反应(SOE-PCR)，以在添加的独特核酸酶位点(例如，在载体近端)组装两个多核苷酸，使与插入多核苷酸连接的末端游离。可替代地，可以使用本领域中已知的多种DNA合成方法中的任一种来直接合成包括连接的第一多核苷酸和第二多核苷酸的整个序列。使用本领域中已知和/或本文提供的体外或体内重叠组装方法，诸如例如酵母(例如酿酒酵母)或基于大肠杆菌同源重组的组装、Gibson组装或

HiFi构建体，将连接的第一多核苷酸和第二多核苷酸与插入多核苷酸组装。第一多核苷酸和第二多核苷酸与插入多核苷酸的环化的产物可以通过添加对独特的核酸酶序列特异的核酸酶(例如，对特异性归巢核酸内切酶序列特异的归巢核酸内切酶)而线性化，导致插入多核苷酸被第一多核苷酸和第二多核苷酸侧翼包围，然后可以使用Gibson组装或其他类似方法将第一多核苷酸和第二多核苷酸组装到载体中。

插入多核苷酸/有效负载序列

在一个实施例中，用于本文提供的组合物、试剂盒或方法中的插入多核苷酸包括：(1)所述插入多核苷酸的5'端或近端上的第一组装重叠序列，和(2)所述插入多核苷酸的相对的3'端或远端上的第二组装重叠序列。除了该实施例之外，第一组装重叠序列可以包括与来自一对第一多核苷酸和第二多核苷酸的第一多核苷酸的3'端或远端处的序列(例如组装重叠序列)互补的序列，而第二组装重叠序列可以包括与来自该对第一多核苷酸和第二多核苷酸的第二多核苷酸的5'端或近端处的序列(例如组装重叠序列)互补的序列。

本文提供的插入多核苷酸上的第一组装重叠序列和第二组装重叠序列的长度可以包括1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、35、40、45、50个或更多个核苷酸，和/或长度可以为高达100个核苷酸(例如，长度高达50个、高达30个、高达25个、高达20个或高达15个核苷酸)，它们分别与如本文提供的一对多核苷酸中的第一多核苷酸的3'端和第二多核苷酸的5'端互补。组装重叠序列的长度可以在15个核苷酸至100个核苷酸的范围内，例如高达20个、高达25个、高达30个、高达35个、高达40个、高达45个、高达50个、高达55个、高达60个、高达65个、高达70个、高达75个、高达80个核苷酸、高达85个核苷酸、高达90个核苷酸、高达95个核苷酸或高达100个核苷酸。在一个实施例中，本文提供的插入多核苷酸上的第一组装重叠序列和第二组装重叠序列包括分别与本文提供的一对多核苷酸中的第一多核苷酸的3'端和第二多核苷酸的5'端互补的1或多个核苷酸。在另一个实施例中，本文提供的插入多核苷酸上的第一组装重叠序列和第二组装重叠序列包括分别与本文提供的一对多核苷酸中的第一多核苷酸的3'端和第二多核苷酸的5'端互补的约25个核苷酸。

在另一个实施例中，插入多核苷酸进一步包括一或多个有效负载序列，使得所述一或多个有效负载序列位于第一组装重叠序列与第二组装重叠序列之间。有效负载序列可以是随机序列。有效负载序列可以是标记序列。标记序列可以是本领域中已知的任何标记序列。有效负载序列可以是基因或其一部分。该基因或其部分可以是代谢或生物化学途径的一部分。该基因或其部分可以编码蛋白质或其结构域。有效负载序列可以选自启动子、基因、调节序列、编码降解决定子的核酸序列、编码溶解度标签的核酸序列、编码降解标签的核酸序列、终止子、条形码、调节序列或其部分。在一些情况下，在用于本文提供的组装方法之前，插入多核苷酸的三个组分(即，第一组装重叠序列、第二组装重叠序列和有效负载序列)被合成或以其他方式组合成连续的DNA片段。在一个实施例中，第一组装重叠和第二组装重叠不是随机的，而是被设计成与第一多核苷酸和第二多核苷酸的特定对匹配。

在其中成对的第一多核苷酸和第二多核苷酸包括如本文所述的靶向序列的实施例中，存在于插入多核苷酸内的有效负载序列可以导致相对于由成对的第一多核苷酸和第二多核苷酸上的靶向序列靶向的原始基因座的插入，相对于由成对的第一多核苷酸和第二多核苷酸上的靶向序列靶向的原始基因座的序列的缺失，或一个序列被另一个序列替换。在插入或修饰的情况下，“有效负载”可以是预期的最终序列。在缺失的情况下，“有效负载”可以是标记序列，或者可以不是序列。

在一个实施例中，插入多核苷酸以混合的方式使用。除了该实施例之外，插入多核苷酸的池中的每个插入多核苷酸可以包括第一组装重叠序列和第二组装重叠序列，该第一组装重叠序列包括与来自一对第一多核苷酸和第二多核苷酸的第一多核苷酸的3'端或远端处的序列(例如组装重叠序列)互补的序列，该第二组装重叠序列包括与来自该对第一多核苷酸和第二多核苷酸的第二多核苷酸的5'端或近端处的序列(例如组装重叠序列)互补的序列。

插入多核苷酸的池可以含有任何数目的独特的插入多核苷酸序列。插入多核苷酸的数目可以是至少、至多或约1、5、10、25、50、75、100、125、150、175、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000、1100、1200、1300、1400、1500、1600、1700、1800、1900、2000、3000、4000、5000、6000、7000、8000、9000、10,000、20,000、30,000、40,000、50,000、75,000、100,000、150,000、200,000或250,000个具有或不具有有效负载序列的独特的插入多核苷酸。

有效负载序列的长度可以是至多或至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、150、200、250、300、350、400、450、500、600、700、800、900、1000、2000、3000、4000、5000、6000、7000、8000、9000或10,000个核苷酸。在一些情况下，有效负载序列的长度可以是0个核苷酸。有效负载序列的长度可以使得当被并入插入多核苷酸时，整个插入多核苷酸可以被化学合成。合成可以是如本领域中已知的基于阵列或基于柱的合成方法。在一个实施例中，有效负载序列的长度使得其可以与第一组装重叠和第二组装重叠一起直接被包含或合成在插入寡核苷酸中。可以被合成的插入多核苷酸的长度可以高达约1、5、10、20、30、40、50、60、70、80、90、100、110、120、130、140、150、160、170、180、190、200、210、220、250、300、350、400个或更多个核苷酸。

在另一个实施例中，可以使用图3中描述的方法在单个池中生成插入多核苷酸。如图3所示，有效负载序列(例如，图3中的启动子序列)可以经由PCR从三个组分生成：混合的正向引物、共同的反向引物和有效负载模板序列(例如，图3中的启动子)。有效负载序列模板可以是合成的DNA片段、PCR产物或其他单链或双链DNA片段。正向引物的池可以使用本领域中已知的基于阵列或基于柱的合成方法来合成。池中的每个正向引物可以包括(从5'到3')：1)与有效负载模板序列的远端或3'端互补的序列，2)包括与来自一对第一多核苷酸和第二多核苷酸的第二多核苷酸互补的序列的第二组装重叠序列，3)用于一或多种位点特异性核酸酶的一或多个识别序列(例如，归巢核酸内切酶位点或识别序列)，4)包括与来自一对第一多核苷酸和第二多核苷酸的第一多核苷酸互补的序列的第一组装重叠序列，和5)结合至有效负载模板序列的近端或5'端的启动序列。共同的反向引物可以结合至有效负载模板序列的远端或3'端或结合至有效负载序列下游的其他序列。可以使用混合的正向引物和共同的反向引物对有效负载模板序列(例如，图3中的启动子)进行PCR。在扩增后，可以使用本领域中已知的重叠组装方法，诸如例如Gibson组装、

HIFI组装或类似方法，将PCR产物环化以生成环状排列的有效负载(插入物)，并且然后使用识别一或多个位点特异性核酸酶识别序列的一或多种位点特异性核酸酶(例如，归巢核酸内切酶，图3中的I-SceI)将其线性化。核酸酶消化可以产生适合用作插入多核苷酸的片段(例如，图1中描述的“有效负载”部分)，其中大的有效负载侧接第一组装重叠序列和第二组装重叠序列(例如，图3中启动子序列侧翼的同源性臂或区域)。如图3所示，在有效负载序列的末端可以是小的部分核酸酶识别序列(例如，图3中的I-SceI)，其可以通过所使用的重叠组装方法(例如，Gibson组装试剂、

HIFI组装试剂或等效混合物的3'和5'核酸外切酶活性)切除。可以任选地在环化之后和在线性化之前对产物进行扩增(例如，RCA)。

在一个实施例中，每个插入多核苷酸包括有效负载序列，使得插入多核苷酸的池中的每个插入多核苷酸包括与所述池中的每个其他插入多核苷酸中的有效负载序列不同的有效负载序列。

在另一个实施例中，每个插入多核苷酸包括有效负载序列，使得插入多核苷酸的池中的每个插入多核苷酸包括与所述池中的每个其他插入多核苷酸中的有效负载序列相同的有效负载序列。

克隆方法

如本文所述，可以将包括成对的第一多核苷酸和第二多核苷酸以及插入多核苷酸的组合物组装到包括第一多核苷酸和第二多核苷酸且其间具有插入多核苷酸的核酸的文库中。如本文提供的成对的第一多核苷酸和第二多核苷酸与插入多核苷酸的组装可以通过体外或体内克隆方法进行。对于大DNA分子的组装，组装的最后步骤可以在体内(诸如，在酵母宿主细胞中)进行。体外和体内组装步骤的使用之间的平衡可以通过该方法在待组装的核酸分子的性质方面的实用性来确定。

在一个实施例中，使用体外克隆方法进行成对的第一核苷酸和第二多核苷酸与插入多核苷酸的组装。体外克隆方法可以是采用本领域中已知的重叠组装的任何体外克隆方法。在本文提供的方法中使用的体外克隆方法可以选自输注克隆

GoldenGate组装、网关组装、Gibson组装和

HIFI组装或本领域中已知的任何其他合适的体外克隆方法。输注克隆可能需要将如本文提供的成对的第一多核苷酸和第二多核苷酸的第一池和如本文描述的插入多核苷酸的第二池与输注克隆试剂混合，并且然后将所得的组装体转化到大肠杆菌克隆宿主细胞中。体外克隆方法可以是在US 8,968,999(其通过引用以其整体并入本文)中描述的任何重叠组装方法。体外克隆方法可以是在US20160060671(其通过引用以其整体并入本文)中描述的任何重叠组装方法。体外克隆方法可以是在浦野淳(Jun Urano)博士和克里斯汀·陈(Christine Chen)博士,Gibson

“引物-桥末端连接(PBnJ)克隆(Gibson

Primer-Bridge End Joining(PBnJ)Cloning)”,合成基因组学应用说明(Synthetic Genomics Application Note)(其通过引用以其整体并入本文)中描述的Gibson组装方法。在一个实施例中，包括成对的第一多核苷酸和第二多核苷酸、插入多核苷酸和克隆载体的组合物使用5'-3'核酸外切酶和也存在于组合物中的链置换聚合酶连接。该组合物还可以包括含有钾盐诸如氯化钾的缓冲液，其浓度范围为7mM至150mM，例如20mM至50mM。除钾盐外，还可以使用在10mM至100mM的范围内诸如20mM的钠盐(例如，氯化钠)。在一些实施例中，组合物不含有拥挤剂，诸如聚乙二醇(PEG)、聚蔗糖或葡聚糖。在一些实施例中，组合物包括单链(ss)结合蛋白质。用于组合物中的ss DNA结合蛋白质可以是大肠杆菌recA、T7基因2.5产物、RedB(来自噬菌体λ)或RecT(来自Rac前噬菌体)、ET SSB(极端热稳定的单链DNA结合蛋白质)，或者本领域中已知的任何其他ss DNA结合蛋白质可以用于组合物中。与在不存在ss结合蛋白质的情况下将以其他方式发生的相比，包含ss结合蛋白质可以提高组装的效率，特别是对于具有较长的重叠序列(例如，至少20个核苷酸)的核酸片段，如通过菌落数所测量的。在一些实施方案中，组合物不含有非链置换聚合酶。

在另一个实施例中，使用缺乏3'核酸外切酶活性的分离的非热稳定的5'至3'核酸外切酶、拥挤剂、具有3'核酸外切酶活性的非链置换DNA聚合酶、或所述DNA聚合酶与缺乏3'核酸外切酶活性的第二DNA聚合酶的混合物和连接酶，将包括成对的第一多核苷酸和第二多核苷酸、插入多核苷酸和克隆载体的组合物连接。在有效地连接多核苷酸和克隆载体的条件下，该组合物可以进一步包括dNTP和合适的缓冲液的混合物。在一些实施例中，组合物可以进一步包括拥挤剂。拥挤剂可以选自聚乙二醇(PEG)、葡聚糖或聚蔗糖。在一个实施例中，拥挤剂是PEG。PEG可以以约3％至约7％(重量/体积)的浓度使用。PEG可以选自PEG-200、PEG-4000、PEG-6000、PEG-8000或PEG-20,000。在一些实施例中，核酸外切酶是T5核酸外切酶，并且接触是在等温条件下进行的，并且/或者拥挤剂是PEG，并且/或者非链置换的DNA聚合酶是

DNA聚合酶或

DNA聚合酶，和/或Taq连接酶。

在一个实施例中，使用体内克隆方法进行成对的第一多核苷酸和第二多核苷酸与插入多核苷酸的组装。体内克隆方法可以是本领域中已知的任何体内克隆方法。体内克隆方法可以是同源重组介导的克隆方法。在本文提供的方法中使用的体内克隆方法可以选自大肠杆菌(RecA依赖性的、RecA非依赖性的或Red/ET依赖性的)同源重组、重叠延伸PCR和重组(OEPR)克隆、酵母同源重组以及芽孢杆菌中的转化相关的重组(TAR)克隆和基因组装，如在津下健治(Tsuge,Kenji)等人的枯草芽孢杆菌质粒中具有设计的顺序和取向的多个DNA片段的一步组装(One step assembly of multiple DNAfragments with a designedorder and orientation in Bacillus subtilis plasmid)核酸研究(Nucleic acidsresearch)中，第31,21卷(2003):e133(其通过引用并入本文)中描述的。

应用

本文提供的组合物和组装方法可以用于构建任何所需的组装体，诸如质粒、载体、基因、代谢途径、最小基因组、部分基因组、基因组、染色体、染色体外核酸，例如细胞质细胞器，诸如线粒体(动物)和叶绿体和质体(植物)中的细胞器等。

本文提供的组合物和组装方法可以用于生成核酸分子的文库，以及使用如由其生成的经修饰的全部或部分核酸分子的方法。文库可以含有2个或更多个变体，并且所述多个变体可以针对具有期望的特性的成员进行筛选，该期望的特性诸如期望的感兴趣产品的高生产水平、感兴趣产品的增强的功能性或降低的功能性(如果这是有利的)。此类筛选可以通过高通量方法进行，该高通量方法可以是如本文提供的机器人/自动化方法。

本公开还进一步包含通过本文提供的组合物和组装方法制备的产品，例如，所得的组装的合成基因或基因组(合成的或天然存在的)和修饰的优化的基因和基因组，及其用途。

本文提供的组合物和组装方法可以具有多种应用，允许例如设计用于合成感兴趣的所需产物的途径或者优化其基因产物在所需产物的合成或表达中起作用的一或多个序列。本文提供的组合物和组装方法还可以用于生成基因或其表达的优化的序列，或组合由基因编码的蛋白质的一或多个功能结构域或基序。该基因可以是生物化学或代谢途径的一部分。生物化学或代谢途径可以产生感兴趣的所需产物。

感兴趣的所需产物可以是任何可以在细胞培养物、真核或原核表达系统或转基因动物或植物中组装的分子。因此，由本文提供的确定性组装方法产生的核酸分子或其文库可以用于多种环境中以产生感兴趣的所需产物。在一些情况下，感兴趣的产物可以是小分子、酶、肽、氨基酸、有机酸、合成化合物、燃料、醇等。例如，感兴趣的产物或生物分子可以是任何初级或次级细胞外代谢物。初级代谢物尤其可以是乙醇、柠檬酸、乳酸、谷氨酸、谷氨酸盐、赖氨酸、苏氨酸、色氨酸和其他氨基酸、维生素、多糖等。次级代谢物尤其可以是抗生素化合物如青霉素，或免疫抑制剂如环孢菌素A，植物激素如赤霉素，他汀类药物如洛伐他汀，杀真菌剂如灰黄霉素等。感兴趣的产物或生物分子也可以是由宿主细胞产生的任何细胞内组分，诸如：微生物酶，包含：过氧化氢酶、淀粉酶、蛋白酶、果胶酶、葡萄糖异构酶、纤维素酶、半纤维素酶、脂肪酶、乳糖酶、链激酶和许多其他酶。细胞内组合还可以包含重组蛋白质，诸如：胰岛素、乙肝疫苗、扰动素、粒细胞集落刺激因子、链激酶等。感兴趣的产物也可以指感兴趣的蛋白质。

途径组装

在一个实施例中，本文提供的组合物和方法用于组装基因或其变体。该基因或其变体可以编码作为代谢或生物化学途径的一部分的蛋白质。变体可以是所述基因的密码子优化版本或突变版本。代谢或生物化学途径可以产生如本文提供的感兴趣的产物。在一个实施例中，基因序列或其变体可以作为有效负载序列存在于如本文提供的插入多核苷酸中。成对的第一多核苷酸和第二多核苷酸可以包括这样的序列，使得当与所述插入多核苷酸组装时，所述序列可以使用如本文提供的基因编辑方法来促进靶向并插入宿主细胞内的遗传元件(例如，基因组、质粒等)中的基因座。基因座可以是特定基因座或随机基因座。可替代地，成对的第一多核苷酸和第二多核苷酸可以包括这样的序列，当与所述插入多核苷酸组装时，所述序列可以用于促进所得的组装体与使用本文提供的方法生成的其他组装体的进一步组装。其他组装体可以包括存在于相同代谢或生物化学途径中的一或多个另外的基因，并且以这种方式促进所述代谢或生物化学途径的组装。所有的基因或其变体可以使用本文所述的重叠序列的技术在特定代谢或生物化学途径的单一载体上组装，或者所述途径的每个成员的独立载体可以通过在连续转化混合物中混合每个成员的载体来使用。第一多核苷酸和第二多核苷酸与插入多核苷酸的组装可以使用本文提供的组装重叠方法经由存在于每一多核苷酸中的组装重叠序列来完成。成对的第一多核苷酸和第二多核苷酸可以进一步包括如本文提供的载体重叠序列，以促进组装到合适的载体中。载体可以是复制的质粒。在一些情况下，第一多核苷酸和/或第二多核苷酸可以进一步包括调节元件或控制元件的序列，该调节元件或控制元件可以控制基因或其变体或由此编码的蛋白质的方面，诸如其转录、翻译、溶解度或降解。调节元件或控制元件可以是启动子、终止子、溶解度标签、降解标签或降解决定子。

在另一个实施例中，该基因序列或其变体跨过一对第一多核苷酸和第二多核苷酸和位于其间的插入多核苷酸分布，或跨过第一多核苷酸或第二多核苷酸和位于其间的插入多核苷酸分布。通过在每种多核苷酸上合适的组装重叠片段，含有所有多核苷酸的混合物可以使用如本文提供的重叠组装在单个反应混合物中以正确的顺序组装。所得到的将是该基因或其变体的全长编码序列。成对的第一多核苷酸和第二多核苷酸可以进一步包括这样的序列，使得当与所述插入多核苷酸组装时，该序列可以使用如本文提供的基因编辑方法来促进靶向并插入宿主细胞内的遗传元件(例如，基因组、质粒等)中的基因座。基因座可以是特定基因座或随机基因座。可替代地，成对的第一多核苷酸和第二多核苷酸可以进一步包括这样的序列，当与所述插入多核苷酸组装时，该序列可以用于促进所得的组装与使用本文提供的方法生成的其他组装体的进一步组装。其他组装体可以包括存在于相同代谢或生物化学途径中的一或多个另外的基因，并且以这种方式促进所述代谢或生物化学途径的组装。所有的基因或其变体可以使用本文所述的重叠序列的技术在特定代谢或生物化学途径的单一载体上组装，或者所述途径的每个成员的独立载体可以通过在连续转化混合物中混合每个成员的载体来使用。成对的第一多核苷酸和第二多核苷酸可以进一步包括如本文提供的载体重叠序列，以促进组装到合适的载体中。载体可以是复制的质粒。在一些情况下，第一多核苷酸和/或第二多核苷酸可以进一步包括调节元件或控制元件的序列，该调节元件或控制元件可以控制基因或其变体或由此编码的蛋白质的方面，诸如其转录、翻译、溶解度或降解。调节元件或控制元件可以是启动子、终止子、溶解度标签、降解标签或降解决定子。

在又另一个实施例中，本文提供的组合物和方法用于组装或组合编码靶蛋白质的基序或结构域的核酸序列。编码靶蛋白质的特定基序或结构域的核酸序列可以跨过一对第一多核苷酸和第二多核苷酸和位于其间的插入多核苷酸分布，或跨过第一多核苷酸或第二多核苷酸和位于其间的插入多核苷酸分布。编码靶蛋白质的特定基序或结构域的核酸序列可以存在于第一多核苷酸上，而靶蛋白质的第二基序或结构域可以存在于第二多核苷酸上，并且插入多核苷酸可以用于使用存在于每一多核苷酸上的组装重叠序列和如本文提供的重叠组装方法连接靶蛋白质的所述第一和第二基序或结构域。在一些情况下，插入多核苷酸可以包括第一和/或第二基序或结构域的一部分。在一些情况下，插入多核苷酸可以包括靶蛋白质的第三基序或结构域。成对的第一多核苷酸和第二多核苷酸可以进一步包括这样的序列，使得当与所述插入多核苷酸组装时，该序列可以使用如本文提供的基因编辑方法来促进靶向并插入宿主细胞内的遗传元件(例如，基因组、质粒等)中的基因座。基因座可以是特定基因座或随机基因座。成对的第一多核苷酸和第二多核苷酸可以进一步包括如本文提供的载体重叠序列，以促进组装到合适的载体中。载体可以是复制的质粒。

基因编辑

如本文所述，可以将包括成对的第一多核苷酸和第二多核苷酸以及插入多核苷酸的组合物组装到包括第一多核苷酸和第二多核苷酸且其间具有插入多核苷酸的核酸的文库中，该核酸的文库随后可以用于修饰宿主细胞的遗传内容物。如本文所提供的，核酸的文库可以包括控制元件(例如，启动子、终止子、溶解度标签、降解标签或降解决定子)、修饰形式的基因(例如，具有所需SNP的基因)、反义核酸和/或作为代谢或生物化学途径的一部分的一或多种基因。在一个实施例中，修饰需要宿主细胞的基因编辑。基因编辑可以需要编辑宿主细胞的基因组和/或存在于宿主细胞中的分离的遗传元件，诸如例如质粒或粘粒。可以利用使用如本文提供的方法和组合物生成的核酸组装体的基因编辑方法可以是本领域中已知的任何基因编辑方法或系统，并且可以基于希望进行基因编辑的宿主进行选择。基因编辑的非限制性示例包含同源重组、CRISPR、TALENS、FOK或其他核酸内切酶。

同源重组

在一个实施例中，基因编辑方法是本领域中已知的基于同源重组的方法。基于同源重组的方法可以选自单交换同源重组、双交换同源重组或λred重组工程。除了该实施例外，一对第一多核苷酸和第二多核苷酸中的第一多核苷酸和第二多核苷酸使得各自包括指向或互补于宿主细胞的核酸元件(例如，基因组、质粒或粘粒)中的所需基因座的序列，并且由此将位于其间的插入多核苷酸指向宿主细胞的遗传元件(例如，基因组、粘粒或质粒)中的所需基因座。因此，指向或互补于该对中存在的所需基因座的序列可以用于确定将被靶向编辑的基因组、粘粒或质粒中的位置。如图1中举例说明的，指向或互补于所需基因座的序列可以位于或朝向第一多核苷酸的近端或5'端，而在第二多核苷酸中，指向或互补于所需基因座的序列可以位于或接近远端或3'端。在第一多核苷酸中，指向或互补于所需基因座的序列可以位于第一多核苷酸中存在的组装重叠序列的上游和载体重叠序列的下游(如果存在的话)。在第二多核苷酸中，指向或互补于所需基因座的序列可以位于第二多核苷酸中存在的组装重叠序列的下游和载体重叠序列的上游(如果存在的话)。

在一个实施例中，对于含有成对的第一多核苷酸和第二多核苷酸的池中的每对，与一对中的所需基因座互补的序列与所述池中的彼此对相比与宿主细胞中的不同靶基因座互补。

在另一个实施例中，对于含有成对的第一多核苷酸和第二多核苷酸的池中的每对，与一对中的所需基因座互补的序列与所述池中的彼此对相比与宿主细胞中的相同靶基因座互补。

环入/环出(Loop-in/Loop-out)

在一些实施例中，本公开教导了从宿主生物体中环出DNA的所选区域的方法。环出方法可以如在中岛(Nakashima)等人.2014“通过基因组编辑和基因沉默的细菌细胞工程改造(Bacterial Cellular Engineering by Genome Editing and Gene Silencing).”国际分子科学杂志(Int.J.Mol.Sci.)15(2),2773-2793中所描述的。环出缺失技术在本领域中是已知的，并在(蒂尔(Tear)等人.2014“切除不稳定的人工基因特异性反向重复序列介导大肠杆菌的无瘢痕基因缺失(Excision of Unstable Artificial Gene-Specificinverted Repeats Mediates Scar-Free Gene Deletions in Escherichia coli.)”应用生物化学与生物技术(Appl.Biochem.Biotech.)175:1858-1867)中描述。在本文提供的方法中使用的环出方法可以使用单交换同源重组或双交换同源重组进行。在一个实施例中，环出所选区域可能需要使用单交换同源重组。

在一个实施例中，本文提供的组合物包括成对的第一多核苷酸和第二多核苷酸(例如，左/右同源性臂)、插入多核苷酸和载体，使得使用如本文提供的体外或体内组装方法将成对的第一多核苷酸和第二多核苷酸与插入多核苷酸和载体组装生成环出载体。在一个实施例中，在环出载体与宿主细胞基因组之间使用单交换同源重组以环入所述载体。载体可以包括标记物，该标记物有助于在环入步骤后选择环出的克隆。在另一个实施例中，在环出的载体与宿主细胞基因组之间使用双交换同源重组以便整合所述载体。环出的载体内的插入序列可以用这样的序列来设计，该序列是现有的或引入的邻近宿主序列的同向重复，使得该同向重复位于预定进行循环和缺失的DNA区域的侧面。插入序列可以进一步包括有助于选择环出克隆的标记物。一旦插入，含有环出质粒或载体的细胞可以被反向选择以缺失选择区域。

在本文提供的一个方面中，使用本文提供的组合物和/或方法生成的多核苷酸或多核苷酸文库可以用于可能需要使用来自一或多个重组系统的蛋白质的集合的基因编辑方法。所述重组系统对于微生物宿主细胞可以是内源的或者可以被异源引入。一或多个异源重组系统的蛋白质的集合可以作为核酸(例如，作为质粒、线性DNA或RNA、或整合子)被引入，并被整合到宿主细胞的基因组中或从染色体外元件被稳定表达。一或多个异源重组系统的蛋白质的集合可以作为RNA被引入并被宿主细胞翻译。一或多个异源重组系统的蛋白质的集合可以作为蛋白质被引入到宿主细胞中。一或多个重组系统的蛋白质的集合可以来自λRed重组系统、RecET重组系统、Red/ET重组系统、来自λRed重组系统、RecET重组系统或Red/ET重组系统的蛋白质的任何同源物、直系同源物或旁系同源物或其任何组合。来自RecET重组系统的重组方法和/或蛋白质的集合可以是如在张·Y(Zhang Y.),布赫霍尔茨·F(Buchholz F.),穆尔·J.P.P.(Muyrers J.P.P.)和斯蒂沃特·A.F.(Stewart A.F.)“利用大肠杆菌中的重组进行DNA工程改造的新逻辑(A new logic for DNA engineeringusing recombination in E.coli.)”自然遗传学(Nature Genetics)20(1998)123-128；穆尔·J.P.P.,张·Y.,泰斯塔·G(Testa,G.),斯蒂沃特·A.F.“通过ET重组快速修饰细菌人工染色体(Rapid modification of bacterial artificial chromosomes by ET-recombination)”核酸研究27(1999)1555-1557；张·Y.,穆尔·J.P.P.,泰斯塔·G和斯蒂沃特·A.F.“在大肠杆菌中通过同源重组进行DNA克隆(DNA cloning by homologousrecombination in E.coli.)”自然生物技术18(2000)1314-1317和穆尔·JP等人,“技术：重组工程——用于克隆和操作DNA的新选择(Techniques:Recombinogenic engineering--new options for cloning and manipulating DNA)”趋势生物化学科学(Trends BiochemSci.)2001年5月；26(5):325-31(其通过引用并入本文)中描述的那些中的任何一种。来自Red/ET重组系统的蛋白质的集合可以是如在里韦罗·穆勒·阿道夫(Rivero-Müller,Adolfo)等人“通过Red/ET重组的辅助大片段插入(ALFIRE)——用于大片段重组工程的替代和增强的方法(Assisted large fragment insertion by Red/ET-recombination(ALFIRE)--an alternative and enhanced method for large fragmentrecombineering)”,核酸研究,第35卷,10(2007):e78(其通过引用并入本文)中描述的任何蛋白质。

λRED介导的基因编辑

如本文所提供的，如本文所述的基因编辑可以使用λRed介导的同源重组进行，如达岑科(Datsenko)和万纳(Wanner),美国国家科学院院刊97:6640-6645(2000)(其内容通过引用以其整体并入本文)所述。

为了使用λred重组工程系统修饰靶DNA，可以将线性供体DNA底物(dsDNA或ssDNA)电穿孔到表达来自λred重组系统的蛋白质的集合的大肠杆菌中。来自λred重组系统的蛋白质的集合可以包括exo蛋白质、β蛋白质或gam蛋白质或其任意组合。Gam可以防止内源性RecBCD和SbcCD核酸酶两者消化被引入到微生物宿主细胞中的线性供体DNA(dsDNA或ssDNA)，而exo是一种5'→3'dsDNA依赖性核酸外切酶，其可以从5'端开始降解线性dsDNA并生成2种可能的产物(即具有单链3'突出物的部分dsDNA双链体或其整个互补链被降解的ssDNA)，并且β可以保护由Exo产生的ssDNA并促进其退火至细胞中的互补ssDNA靶。如在https://blog.addgene.org/lambda-red-a-homologous-recombination-based-technique-for-genetic-engineering(其内容通过引用并入本文)所述，对于基于λred的与ssDNA寡底物的重组可能需要β表达。

线性供体DNA底物(dsDNA或ssDNA)可以是使用本文提供的方法和组合物生成的包括一对第一多核苷酸和第二多核苷酸以及位于其间的插入多核苷酸的组装体。该对第一多核苷酸和第二多核苷酸可以包括基因组靶向序列，其将所述供体DNA底物靶向到宿主细胞的基因组中的特定基因座。然后，这些酶催化底物与靶DNA序列的同源重组。与其中遗传变化在试管中发生的限制性酶克隆相比，这意味着克隆在体内发生。供体DNA底物仅需要与用于重组的靶位点有约50个核苷酸的同源性。如在https://blog.addgene.org/lambda-red-a-homologous-recombination-based-technique-for-genetic-engineering所描述的，是否使用线性dsDNA底物或ssDNA底物可以取决于实验的目标。dsDNA底物对于大于大约20个核苷酸的插入或缺失可能是最佳的，而ssDNA底物对于仅几个碱基对的点突变或改变可能是最佳的。

可以使用本文提供的组合物和方法来制备dsDNA底物，使得成对的第一多核苷酸和第二多核苷酸包括与相对末端上的靶向的插入位点约50个碱基对的同源性。底物中存在的dsDNA插入多核苷酸可以包含：大的插入或缺失，包含可选择的DNA片段，诸如抗生素抗性基因，以及非选择性的DNA片段，诸如基因替换和标签。

还可以使用本文提供的组合物和方法来制备ssDNA底物，使得成对的第一多核苷酸和第二多核苷酸包括与相对末端上的靶向的插入位点约50个碱基对的同源性，并且可以具有位于序列的中心(即插入多核苷酸内)的所需改变。

ssDNA底物可以比dsDNA更有效，其中重组频率在0.1％至1％之间，并且可以通过设计避免或甲基导向的错配修复(MMR)系统的底物而使该ssDNA底物增加至高达25-50％。MMR的工作是纠正在DNA复制期间出现的DNA错配。可以通过以下来避免MMR的活化：1)使用具有被敲除的关键MMR蛋白质的细菌的菌株，或2)特殊设计的ssDNA底物以避免MMR：1)具有失活的MMR的大肠杆菌：使用具有失活的MMR的大肠杆菌肯定是两种选择中较容易的一种，但这些细胞易于突变，并且其基因组可能具有更多非预期的变化。2)设计避免MMR活化的ssDNA底物：在一个实施例中，引入了编辑位点的6个碱基对处或6个碱基对之内的C/C错配。在另一个实施例中，所需改变的两侧是摆动密码子中的4-5个沉默改变，即改变相邻的4-5个密码子的第三个碱基对，这改变了核苷酸序列，但不改变翻译的蛋白质的氨基酸序列。这些变化可以是所需变化的5'或3'。

在一个实施例中，使用本文提供的组合物和/或方法生成的多核苷酸或多核苷酸文库可以用于基因编辑方法，该方法在已经稳定地表达λred重组基因的微生物宿主细胞中实施，诸如在https://blog.addgene.org/lambda-red-a-homologous-recombination-based-technique-for-genetic-engineering(其内容通过引用并入本文)描述的DY380菌株。包括λred重组系统的组分并且可以用于生成使用本文提供的富集方法进行基因分型的生物体的其他细菌菌株(例如，CS-seq或SG-seq)可以在托马森(Thomason)等人(重组工程：使用同源重组的细菌中的基因工程(Recombineering:Genetic Engineering in BacteriaUsing Homologous Recombination),分子生物学实验室指南，106:V:1.16:1.16.1–1.16.39)和莎兰(Sharan)等人(重组工程：一种基于同源重组的基因工程方法(Recombineering:A Homologous Recombination-Based Method of GeneticEngineering).自然协议(Nature protocols).2009；4(2):206-223)(其每一个的内容通过引用并入本文)中找到。

如本文所提供的，可以在实施本领域中已知的和/或本文提供的任何编辑方法之前将λred重组系统的蛋白质的集合引入到微生物宿主细胞中。λred重组系统的每种蛋白质的基因可以被引入到核酸(例如，作为质粒、线性DNA或RNA、mini-λ、λred前噬菌体或整合子)上，并且被整合到宿主细胞的基因组中或从染色体外元件表达。在一些情况下，λred重组系统的每种组分(即，exo、β、gam或其组合)都可以作为RNA被引入并被宿主细胞翻译。在一些情况下，λred重组系统的每种组分(即，exo、β、gam或其组合)可以作为蛋白质被引入到宿主细胞中。

在一个实施例中，用于λred重组系统的蛋白质的集合的基因被引入到质粒上。质粒上λred重组系统的蛋白质的集合可以在启动子(诸如例如，内源性噬菌体pL启动子)的控制下。在一个实施例中，质粒上λred重组系统的蛋白质的集合在诱导型启动子的控制下。诱导型启动子可以通过添加或耗尽试剂或通过改变温度来诱导。在一个实施例中，质粒上λred重组系统的蛋白质的集合在诱导型启动子诸如IPTG诱导型lac启动子或阿拉伯糖诱导型pBAD启动子的控制下。表达用于λred重组系统的蛋白质的集合的基因的质粒也可以表达与特定启动子相关联的阻遏物，诸如例如，分别与IPTG诱导型lac启动子、阿拉伯糖诱导型pBAD启动子和内源性噬菌体pL启动子相关联的lacI、araC或cI857阻遏物。

在一个实施例中，用于λred重组系统的蛋白质的集合的基因被引入到mini-λ上，该mini-λ是噬菌体DNA的有缺陷的非复制的圆形片段，当被引入到微生物宿主细胞中时，其被整合到基因组中，如在https://blog.addgene.org/lambda-red-a-homologous-recombination-based-technique-for-genetic-engineering(其内容通过引用并入本文)所述。

在一个实施例中，用于λred重组系统的蛋白质的集合的基因被引入到λred前噬菌体上，这可以允许λred重组系统稳定整合到微生物宿主细胞中，诸如在https://blog.addgene.org/lambda-red-a-homologous-recombination-based-technique-for-genetic-engineering(其内容通过引用并入本文)所述。

CRISPR介导的基因编辑

在本文提供的一个方面中，宿主细胞的遗传元件(例如，基因组、粘粒或质粒)可以通过CRISPR修饰。

CRISPR/Cas系统是一种原核免疫系统，其赋予对外源遗传元件(诸如在质粒和噬菌体中存在的遗传元件)的抗性，并提供一种获得性免疫形式。CRISPR代表成簇的规律间隔的短回文重复序列(Clustered Regularly Interspaced Short Palindromic Repeat)，并且cas代表CRISPR相关联系统，并且指与CRISPR复合物相关联的小cas基因。

CRISPR-Cas系统被最广泛地表征为1类系统或2类系统。这两个系统之间的主要区别特征是Cas-效应子模块的性质。1类系统需要在复合物(被称为“级联复合物”)中组装多种Cas蛋白质来介导扰动，而2类系统使用大的单一Cas酶来介导扰动。根据特定Cas蛋白质的存在，将1类系统和2类系统各自进一步分为多种CRISPR-Cas类型。例如，1类系统被分为以下三种类型：I型系统，其含有Cas3蛋白质；III型系统，其含有Cas10蛋白质；和推定的IV型系统，其含有Csf1蛋白质(一种Cas8样蛋白质)。2类系统通常不如1类系统常见，并且被进一步分为以下三种类型：II型系统，其含有Cas9蛋白质；V型系统，其含有Cas12a蛋白质(以前被称为Cpf1，并且本文中被称为Cpf1)、Cas12b(以前被称为C2c1)、Cas12c(以前被称为C2c3)、Cas12d(以前被称为CasY)和Cas12e(以前被称为CasX)；和VI型系统，其含有Cas13a(以前被称为C2c2)、Cas13b和Cas13c。毕佐查(Pyzocha)等人,ACS化学生物学(ACSChemical Biology)，第13(2)卷，第347-356页。在一个实施例中，在本文提供的方法中使用的CRISPR-Cas系统是2类系统。在一个实施例中，在本文提供的方法中使用的CRISPR-Cas系统是II型系统、V型系统或VI型2类系统。在一个实施例中，在本文提供的方法中使用的CRISPR-Cas系统选自Cas9、Cas12a、Cas12b、Cas12c、Cas12d、Cas12e、Cas13a、Cas13b、Cas13c或其同源物、直系同源物或旁系同源物。

在本文公开的方法中使用的CRISPR系统包括Cas效应子模块，该Cas效应子模块包括一或多种核酸导向的CRISPR相关联(Cas)核酸酶，在本文中被称为Cas效应子蛋白质。在一些实施例中，Cas蛋白质可以包括一或多个核酸酶结构域。Cas效应子蛋白质可以靶向单链或双链核酸分子(例如，DNA或RNA核酸)，并且可以生成双链或单链断裂。在一些实施例中，Cas效应子蛋白质是野生型或天然存在的Cas蛋白质。在一些实施例中，Cas效应子蛋白质是突变体Cas蛋白质，其中在WT或天然存在的Cas蛋白质(例如，亲本Cas蛋白质)中进行一或多个突变、插入或缺失，以产生与亲本Cas蛋白质相比具有一或多个改变的特性的Cas蛋白质。

在一些情况下，Cas蛋白质是野生型(WT)核酸酶。在本公开中使用的合适的Cas蛋白质的非限制性示例包含C2cl、C2c2、C2c3、Cas1、Cas1B、Cas2、Cas3、Cas4、Cas5、Cas6、Cas7、Cas8、Cas9(也被称为Csn1和Csx12)、Cas10、Cpfl、Csy1、Csy2、Csy3、Cse1、Cse2、Csc1、Csc2、Csa5、Csn2、Csm1、Csm2、Csm3、Csm4、Csm5、Csm6、Cmr1、Cmr3、Cmr4、Cmr5、Cmr6、Csb1、Csb2、Csb3、Csx17、Csx14、Csx100、Csx16、CsaX、Csx3、Csxl、Csx15、Csf1、Csf2、Csf3、Csf4、MAD1-20、SmCsm1、其同源物、其直系同源物、其变体、其突变体或其修饰形式。合适的核酸导向的核酸酶(例如Cas 9)可以来自源自以下属的生物体，该属包含但不限于：硫微螺菌属(Thiomicrospira)、琥珀酸弧菌属(Succinivibrio)、暂定属(Candidatus)、卟啉单胞菌属(Porphyromonas)、酸单球菌(Acidomonococcus)、普氏菌属(Prevotella)、史密斯氏菌属(Smithella)、莫拉氏菌属(Moraxella)、互养菌属(Synergistes)、弗朗西斯氏菌属(Francisella)、钩端螺旋体属(Leptospira)、链型杆菌属(Catenibacterium)、坎德勒氏菌属(Kandleria)、梭菌属(Clostridium)、多尔氏菌属(Dorea)、粪球菌属(Coprococcus)、肠球菌属(Enterococcus)、嗜果糖乳酸菌属(Fructobacillus)、魏斯氏菌属(Weissella)、片球菌属(Pediococcus)、棒杆菌属(Corynebacter)、萨特氏菌属(Sutterella)、军团菌属(Legionella)、密螺旋体属(Treponema)、罗斯氏菌属(Roseburia)、产线菌属(Filifactor)、真杆菌属(Eubacterium)、链球菌属(Streptococcus)、乳酸杆菌属(Lactobacillus)、支原体属、拟杆菌属(Bacteroides)、弗维菌属(Flaviivola)、黄杆菌属(Flavobacterium)、单丝壳属(Sphaerochaeta)、固氮螺菌属(Azospirillum)、葡糖醋杆菌属(Gluconacetobacter)、奈瑟氏菌属(Neisseria)、罗斯氏菌属(Roseburia)、细小棒菌属(Parvibaculum)、葡萄球菌属(Staphylococcus)、硝酸盐破坏菌(Nitratifractor)、支原体属、脂环酸芽孢杆菌属(Alicyclobacillus)、短芽孢杆菌属(Brevibacilus)、芽孢杆菌属(Bacillus)、拟杆菌门(Bacteroidetes)、短芽孢杆菌属、肉杆菌属(Carnobacterium)、Clostridiaridium、梭菌属、脱硫弯曲杆菌(Desulfonatronum)、脱硫弧菌属(Desulfovibrio)、创伤球菌属(Helcococcus)、纤毛菌属(Leptotrichia)、李斯特菌属(Listeria)、Methanomethyophilus、甲基杆菌属(Methylobacterium)、丰祐菌科(Opitutaceae)、沼泽杆菌属(Paludibacter)、红杆菌属(Rhodobacter)、Sphaerochaeta、肿块芽孢杆菌属(Tuberibacillus)和弯曲菌属(Campylobacter)。此类属的生物体的物种可以是如本文中以其他方式所讨论的。

合适的核酸导向的核酸酶(例如，Cas9)可以来自源自以下门的生物体，该门包含但不限于厚壁菌门(Firmicute)、放线菌门(Actinobacteria)、拟杆菌门(Bacteroidetes)、变形菌门(Proteobacteria)、螺旋体门(Spirochates)和软壁菌门(Tenericutes)。合适的核酸导向的核酸酶可以来自源自以下纲的生物体，该纲包含但不限于丹毒丝菌纲(Erysipelotrichia)、梭菌纲(Clostridia)、芽孢杆菌纲(Bacilli)、放线菌纲(Actinobacteria)、拟杆菌纲(Bacteroidetes)、黄杆菌纲(Flavobacteria)、α变形杆菌纲(Alphaproteobacteria)、β变形杆菌纲(Betaproteobacteria)、γ变形杆菌纲(Gammaproteobacteria)、δ变形杆菌纲(Deltaproteobacteria)、ε变形杆菌纲(Epsilonproteobacteria)、螺旋体纲(Spirochaetes)和柔膜菌纲(Mollicutes)。合适的核酸导向的核酸酶可以来自源自以下目的生物体，该目包含但不限于梭菌目(Clostridiales)、乳杆菌目(Lactobacillales)、放线菌目(Actinomycetales)、拟杆菌目(Bacteroidales)、黄杆菌目(Flavobacteriales)、根瘤菌目(Rhizobiales)、红螺菌目(Rhodospirillales)、伯克氏菌目(Burkholderiales)、奈瑟菌目(Neisseriales)、军团菌目(Legionellales)、鹦鹉螺菌目(Nautiliales)、弯曲菌目(Campylobacterales)、螺旋体目(Spirochaetales)、支原体目(Mycoplasmatales)和硫发菌目(Thiotrichales)。合适的核酸导向的核酸酶可以来自源自以下科的生物体，该科包含但不限于毛螺菌科(Lachnospiraceae)、肠球菌科(Enterococcaceae)、明串珠菌科(Leuconostocaceae)、乳杆菌科(Lactobacillaceae)、链球菌科(Streptococcaceae)、消化链球菌科(Peptostreptococcaceae)、葡萄球菌科(Staphylococcaceae)、真杆菌科(Eubacteriaceae)、棒杆菌科(Corynebacterineae)、拟杆菌科(Bacteroidaceae)、黄杆菌属(Flavobacterium)、Cryomoorphaceae、红菌科(Rhodobiaceae)、红螺菌科(Rhodospirillaceae)、醋杆菌科(Acetobacteraceae)、梭菌科(Sutterellaceae)、奈瑟氏菌科(Neisseriaceae)、军团菌科(Legionellaceae)、鹦鹉螺菌科(Nautiliaceae)、弯曲菌科(Campylobacteraceae)、螺旋体科(Spirochaetaceae)、支原体科(Mycoplasmataceae)和弗朗西斯氏菌科(Francisellaceae)。

适用于本公开的方法、系统和组合物的其他核酸导向的核酸酶(例如，Cas9)包含源自以下生物体的核酸导向的核酸酶，该生物体诸如但不限于：硫微螺菌的种XS5(Thiomicrospira sp.XS5)、直肠真杆菌(Eubacterium rectale)、溶糊精琥珀酸弧菌(Succinivibrio dextrinosolvens)、候选白蚁甲烷枝原体(Candidatus Methanoplasmatermitum)、Candidatus Methanomethylophilus alvus、狗口腔卟啉单胞菌(Porphyromonas crevioricanis)、嗜鳃黄杆菌(Flavobacterium branchiophilum)、酸单球菌种(Acidomonococcus sp.)、毛螺菌科细菌COE1(Lachnospiraceae bacterium COE1)、短普雷沃氏菌(Prevotella brevis)ATCC 19188、史密斯氏菌属的种SCADC、牛眼莫拉氏菌(Moraxella bovoculi)、琼斯氏共生菌(Synergistes jonesii)、拟杆菌口腔分类群(Bacteroidetes oral taxon)274、土拉热弗朗西斯氏菌(Francisella tularensis)、稻田氏钩端螺旋体莱姆血清变型(Leptospira inadai serovar Lyme str.)10、酸单球菌种的晶体结构(5B43)、变异链球菌(S.mutans)、无乳链球菌(S.agalactiae)、类马链球菌(S.equisimilis)、血链球菌(S.sanguinis)、肺炎链球菌(S.pneumonia)；空肠弯曲杆菌(C.jejuni)、大肠弯曲杆菌(C.coli)、盐水硝酸盐破坏菌(N.salsuginis)、弧后硝酸盐破坏菌(N.tergarcus)；耳葡萄球菌(S.auricularis)、肉葡萄球菌(S.carnosus)；脑膜炎奈瑟氏菌(N.meningitides)、淋病奈瑟氏菌(N.gonorrhoeae)；单核细胞增多性李斯特菌(L.monocytogenes)、伊氏李斯特菌(L.ivanovii)；肉毒梭菌(C.botulinum)、艰难梭菌(C.difficile)、破伤风梭菌(C.tetani)、索氏梭菌(C.sordellii)；土拉热弗朗西斯氏菌1、易北普雷沃氏菌(Prevotella albensis)、毛螺旋菌科细菌(Lachnospiraceae bacterium)MC2017 1、瘤胃产氢丁酸弧菌(Butyrivibrio proteoclasticus)、异域菌门细菌(Peregrinibacteria bacterium)GW2011_GWA2_33_10、俭菌总门细菌(Parcubacteriabacterium)GW2011_GWC2_44_17、史密斯氏菌属的种SCADC、小基因组菌总门(Microgenomates)、氨基酸球菌属的种(Acidaminococcus sp.)BV3L6、毛螺旋菌科细菌(Lachnospiraceae bacterium)MA2020、候选白蚁甲烷枝原体、挑剔真杆菌(Eubacteriumeligens)、牛眼莫拉氏菌237、稻田钩端螺旋体(Leptospira inadai)、毛螺旋菌科细菌(Lachnospiraceae bacterium)ND2006、狗口腔卟啉单胞菌3、解糖胨普雷沃氏菌(Prevotella disiens)、猕猴卟啉单胞菌(Porphyromonas macacae)、链型杆菌属(Catenibacterium sp.)CAG:290、犊坎德勒氏菌(Kandleria vitulina)、梭菌目细菌(Clostridiales bacterium)KA00274、毛螺菌科细菌(Lachnospiraceae bacterium)3-2、长链多尔氏菌(Dorea longicatena)、灵巧粪球菌(Coprococcus catus)GD/7、哥伦比亚肠球菌(Enterococcus columbae)DSM 7374、果聚糖芽孢杆菌属的种(Fructobacillus sp.)EFB-N1、耐盐魏斯氏菌(Weissella halotolerans)、乳酸片球菌(Pediococcusacidilactici)、弯曲乳杆菌(Lactobacillus curvatus)、化脓性链球菌(Streptococcuspyogenes)、费斯莫尔德乳杆菌(Lactobacillus versmoldensis)和龈沟产线菌(Filifactor alocis)ATCC 35896。参见，美国专利号8,697,359；8,771,945；8,795,965；8,865,406；8,871,445；8,889,356；8,895,308；8,906,616；8,932,814；8,945,839；8,993,233；8,999,641；9,822,372；9,840,713；美国专利申请号13/842,859(US 2014/0068797A1)；9,260,723；9,023,649；9,834,791；9,637,739；美国专利申请号14/683,443(US 2015/0240261 A1)；美国专利申请号14/743,764(US 2015/0291961 A1)；9,790,490；9,688,972；9,580,701；9,745,562；9,816,081；9,677,090；9,738,687；美国申请号15/632,222(US2017/0369879 A1)；美国专利申请号15/631,989；美国专利申请号15/632,001和美国专利号9,896,696，其每一个通过引用并入本文。

在一些实施例中，Cas效应子蛋白质包含一或多种以下活性：

切口酶活性，即切割核酸分子的单链的能力；

双链核酸酶活性，即切割双链核酸的两条链并产生双链断裂的能力；

核酸内切酶活性；

核酸外切酶活性；和/或

解旋酶活性，即解开双链核酸的螺旋结构的能力。

在本公开的方面中，术语“导向核酸”是指这样的多核苷酸，其包括1)能够与靶序列杂交的导向序列(在本文中被称为“靶向片段”)和2)能够与如本文所述的核酸导向的核酸酶相互作用(单独或与tracrRNA分子组合)的支架序列(在本文中被称为“支架片段”)。导向核酸可以是DNA。导向核酸可以是RNA。导向核酸可以包括DNA和RNA两者。导向核酸可以包括修饰的非天然存在的核苷酸。在其中导向核酸包括RNA的情况下，RNA导向核酸可以由多核苷酸分子(诸如使用本文提供的方法和组合物生成的质粒、线性构建体)上的DNA序列编码。

在一些实施例中，本文所述的导向核酸是RNA导向核酸(“导向RNA”或“gRNA”)，并且包括靶向片段和支架片段。在一些实施例中，gRNA的支架片段被包括在一个RNA分子中，并且靶向片段被包括在另一个单独的RNA分子中。此类实施例在本文中被称为“双分子gRNA”或“两分子gRNA”或“双gRNA”。在一些实施例中，gRNA是单个RNA分子，并且在本文中被称为“单导向RNA”或“sgRNA”。术语“导向RNA”或“gRNA”包括在内，指两分子导向RNA和sgRNA两者。

在一个实施例中，使用本文提供的方法和组合物生成的包括一对第一多核苷酸和第二多核苷酸以及位于其间的插入多核苷酸的组合物是导向RNA(gRNA)。在一些情况下，本文提供的方法用于生成gRNA的文库。

gRNA的DNA靶向片段包括与靶核酸序列中的序列互补的核苷酸序列。因此，gRNA的靶向片段经由杂交(即，碱基配对)以序列特异性的方式与靶核酸相互作用，并且靶向片段的核苷酸序列决定gRNA将结合的靶DNA内的位置。当使用合适的比对算法进行最佳比对时，导向序列与其相应的靶序列之间的互补程度为约50％、60％、75％、80％、85％、90％、95％、97.5％、99％或更多或者大于约50％、60％、75％、80％、85％、90％、95％、97.5％、99％或更多。可以使用任何合适的用于比对序列的算法来确定最佳比对。在一些实施例中，导向序列的长度为约5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、45、50、75或更多个核苷酸或者大于约5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、45、50、75或更多个核苷酸。在一些实施例中，导向序列的长度小于约75、50、45、40、35、30、25、20个核苷酸。在各个方面中，导向序列是10-30个核苷酸长。导向序列的长度可以是15-20个核苷酸。导向序列的长度可以是15个核苷酸。导向序列的长度可以是16个核苷酸。导向序列的长度可以是17个核苷酸。导向序列的长度可以是18个核苷酸。导向序列的长度可以是19个核苷酸。导向序列的长度可以是20个核苷酸。

使导向RNA的支架片段与一或多种Cas效应子蛋白质相互作用，以形成核糖核蛋白质复合物(在本文中被称为CRISPR-RNP或RNP复合物)。导向RNA经由上述靶向片段将结合的多肽导向靶核酸序列内的特定核苷酸序列。导向RNA的支架片段包括核苷酸的两个段，它们彼此互补并形成双链RNA双链体。支架序列内的足以促进可靶向核酸酶复合物的形成的序列可以包含沿支架序列内的两个序列区域(诸如参与形成二级结构的一或两个序列区域)的长度的互补程度。在一些情况下，一或两个序列区域被包括在同一多核苷酸上或被编码在同一多核苷酸上。在一些情况下，一或两个序列区域被包括在单独的多核苷酸上或被编码在单独的多核苷酸上。最佳比对可以通过任何合适的比对算法来确定，并且可以进一步考虑二级结构，诸如一或两个序列区域内的自互补。在一些实施例中，当最佳对比时，在一或两个序列区域之间沿两个序列区域中较短者的长度的互补程度为约25％、30％、40％、50％、60％、70％、80％、90％、95％、97.5％、99％或更高或者大于约25％、30％、40％、50％、60％、70％、80％、90％、95％、97.5％、99％或更高。在一些实施例中，两个序列区中的至少一个的长度为约5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、40、50或更多个核苷酸或者大于约5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、40、50或更多个核苷酸。

本主题的gRNA的支架序列可以包括二级结构。二级结构可以包括假结区域或茎环结构。在一些实例中，导向核酸和核酸导向的核酸酶的相容性至少部分地由导向RNA的二级结构区域内或二级结构区域附近的序列确定。在一些情况下，导向核酸与核酸导向的核酸酶的结合动力学部分由支架序列内的二级结构确定。在一些情况下，导向核酸与核酸导向的核酸酶的结合动力学部分地由具有支架序列的核酸序列确定。

可以通过扫描与天然Cas核酸酶基因座相邻的序列来找到用于gRNA-Cas效应子蛋白质组合的相容性支架序列。换句话说，天然Cas核酸酶可以被编码在基因组上相应的相容性导向核酸或支架序列的附近处。

核酸导向的核酸酶可以与在核酸酶的内源性宿主内没有发现的导向核酸相容。此类正交导向核酸可以通过经验测试来确定。正交导向核酸可以来自不同的细菌物种，或者可以是合成的或以其他方式被工程改造为非天然存在的。与常见的核酸导向的核酸酶相容的正交导向核酸可以包括一或多个共同特征。共同特征可以包含假结区域外的序列。共同特征可以包含假结区域。共同特征可以包含一级序列或二级结构。

通过改变导向序列使得导向序列与靶序列互补，从而允许导向序列与靶序列之间的杂交，可以将导向核酸工程改造以靶向所需的靶序列。具有工程改造的导向序列的导向核酸可以被称为工程改造的导向核酸。工程改造的导向核酸通常是非天然存在的，并且在自然界中未找到。

在一些实施例中，本公开提供了一种编码使用本文提供的组合物和方法生成的gRNA的多核苷酸。在一些实施例中，包括一对第一多核苷酸和第二多核苷酸以及插入多核苷酸的组合物进一步包括表达载体，使得该对第一多核苷酸和第二多核苷酸与插入多核苷酸和表达载体的组装生成包括编码gRNA的核酸的表达载体。

在另一个实施例中，使用本文提供的方法和组合物生成的包括一对第一多核苷酸和第二多核苷酸以及位于其间的插入多核苷酸的组装体是供体DNA序列。在一些情况下，本文提供的方法用于生成供体DNA序列的文库。在使用同源定向修复(HDR)的CRISPR基因编辑方法中，供体DNA序列可以与导向RNA(gRNA)结合使用。CRISPR复合物可以导致靶基因内的链断裂，其可以通过使用同源定向修复(HDR)进行修复。可以通过用使用本文提供的方法和组合物生成的供体DNA序列共转化宿主细胞来促进HDR介导的修复。供体DNA序列可以包括所需的遗传扰动(例如，缺失、插入和/或单核苷酸多态性)以及源自第一多核苷酸和第二多核苷酸的靶向序列。在本实施例中，CRISPR复合物切割由一或多个gRNA指定的靶基因。然后，供体DNA序列可以用作同源重组机制的模板，以将所需的遗传扰动并入宿主细胞中。供体DNA可以是单链的、双链的或双链质粒。供体DNA可能缺少PAM序列，或包括加扰的、改变或非功能性的PAM，以便防止再切割。在一些情况下，供体DNA可以含有功能性或未改变的PAM位点。供体DNA中的突变的或编辑的序列(也位于同源性区域的两侧)防止在突变已经被并入基因组之后被CRISPR-复合物再次切割。

宿主细胞

如本文所提供的，使用本文提供的组合物和/或方法生成的核酸构建体的文库可以用于编辑或修饰宿主细胞的遗传元件(例如，基因组、粘粒或质粒)，或者经由将一或多种遗传元件(例如，质粒或粘粒)引入(例如，转化或转导)到所述宿主细胞来工程改造该宿主细胞。基因组工程改造或编辑方法可以适用于其中可以在遗传突变体的群体中鉴定出所需性状的任何生物体。生物体可以是微生物或高等真核生物。

因此，如本文中所使用的，术语“微生物”应被广义地理解。它包含但不限于两个原核域细菌和古细菌，以及某些真核真菌和原生生物。然而，在某些方面，“高等”真核生物诸如昆虫、植物和动物可以用于本文教导的方法中。

合适的宿主细胞包含但不限于：细菌细胞、藻类细胞、植物细胞、真菌细胞、昆虫细胞和哺乳动物细胞。在一个说明性的实施例中，合适的宿主细胞包含大肠杆菌(例如，可从马萨诸塞州伊普斯维奇的新英格兰BioLabs获得的SHuffleTM感受态大肠杆菌)。

本公开的其他合适的宿主生物体包含棒状杆菌(Corynebacterium)属的微生物。在一些实施例中，优选的棒状杆菌菌株/种包括：高效棒状杆菌(C.efficiens)，其中保存型菌株为DSM44549；谷氨酸棒状杆菌(C.glutamicum)，其中保存型菌株为ATCC13032；以及产氨棒状杆菌(C.ammoniagenes)，其中保存型菌株为ATCC6871。在一些实施例中，本公开的优选的宿主是谷氨酸棒状杆菌。

棒状杆菌属的合适的宿主菌株，特别是谷氨酸棒状杆菌种的合适的宿主菌株特别是已知的野生型菌株：谷氨酸棒状杆菌ATCC13032、醋麸酸棒状杆菌(Corynebacteriumacetoglutamicum)ATCC15806、嗜乙酰乙酸棒状杆菌(Corynebacteriumacetoacidophilum)ATCC13870、栖糖蜜棒杆菌(Corynebacterium melassecola)ATCC17965、热产氨棒状杆菌(Corynebacterium thermoaminogenes)FERM BP-1539、黄色短杆菌(Brevibacterium flavum)ATCC14067、乳酸发酵短杆菌(Brevibacteriumlactofermentum)ATCC13869和双歧短杆菌(Brevibacterium divaricatum)ATCC14020；以及由其制备的产生L-氨基酸的突变体或菌株，诸如例如产生L-赖氨酸的菌株：谷氨酸棒状杆菌FERM-P 1709、黄色短杆菌FERM-P 1708、乳酸发酵短杆菌FERM-P 1712、谷氨酸棒状杆菌FERM-P 6463、谷氨酸棒状杆菌FERM-P 6464、谷氨酸棒状杆菌DM58-1、谷氨酸棒状杆菌DG52-5、谷氨酸棒状杆菌DSM5714和谷氨酸棒状杆菌DSM12866。

术语“谷氨酸微球菌(Micrococcus glutamicus)”也被用于谷氨酸棒状杆菌。在现有技术中，高效棒状杆菌物种的一些代表也已经被称为热产氨棒状杆菌，例如诸如菌株FERM BP-1539。

在一些实施例中，本公开的宿主细胞是真核细胞。合适的真核宿主细胞包含但不限于：真菌细胞、藻类细胞、昆虫细胞、动物细胞和植物细胞。合适的真菌宿主细胞包含但不限于：子囊菌门(Ascomycota)、担子菌门(Basidiomycota)、半知菌门(Deuteromycota)、接合菌门(Zygomycota)、不完全菌类(Fungi imperfecti)。某些优选的真菌宿主细胞包含酵母细胞和丝状真菌细胞。合适的丝状真菌宿主细胞包含例如真菌亚门和卵菌亚门的任何丝状形式。(参见，例如，霍克索斯(Hawksworth)等人，于恩索斯(Ainsworth)和毕丝巴(Bisby)的真菌词典，第8版，1995年，CAB国际，大学出版社，英国剑桥(In Ainsworth and Bisby'sDictionary of The Fungi,8^th edition,1995,CAB International,University Press,Cambridge,UK)，其通过引用并入本文)。丝状真菌的特征在于营养菌丝体，其细胞壁由几丁质、纤维素和其他复杂的多糖组成。丝状真菌宿主细胞在形态上不同于酵母。

在某些说明性的但非限制性的实施例中，丝状真菌宿主细胞可以是下述物种的细胞：绵霉属(Achlya)、支顶孢属(Acremonium)、曲霉属(Aspergillus)、短梗霉属(Aureobasidium)、烟管霉属(Bjerkandera)、拟蜡菌属(Ceriporiopsis)、头孢霉属(Cephalosporium)、金孢属(Chrysosporium)、旋孢腔菌属(Cochliobolus)、棒囊壳属(Corynascus)、隐丛赤壳属(Cryphonectria)、隐球菌属(Cryptococcus)、鬼伞属(Coprinus)、革盖菌属(Coriolus)、色二孢属(Diplodia)、恩多蒂斯属(Endothis)、镰刀菌属(Fusarium)、赤霉菌属(Gibberella)、粘帚霉属(Gliocladium)、腐质霉属(Humicola)、肉座菌属(Hypocrea)、毁丝霉属(Myceliophthora)(例如，嗜热毁丝霉(Myceliophthorathermophila))、毛霉菌属(Mucor)、脉孢菌属(Neurospora)、青霉菌属(Penicillium)、柄孢壳菌属(Podospora)、射脉菌属(Phlebia)、瘤胃壶菌属(Piromyces)、梨孢属(Pyricularia)、根毛霉属(Rhizomucor)、根霉属(Rhizopus)、裂褶菌属(Schizophyllum)、柱顶孢霉属(Scytalidium)、孢子丝菌属(Sporotrichum)、踝节菌属(Talaromyces)、热子囊菌属(Thermoascus)、梭孢壳属(Thielavia)、栓菌属(Tramates)、弯颈霉属(Tolypocladium)、木霉属(Trichoderma)、轮枝孢属(Verticillium)、草菇属(Volvariella)，或其有性世代或无性世代，以及其同义词或分类等效物。

合适的酵母宿主细胞包含但不限于：假丝酵母属(Candida)、汉逊酵母属(Hansenula)、酵母属(Saccharomyces)、裂殖酵母属(Schizosaccharomyces)、毕赤酵母属(Pichia)、克鲁维酵母属(Kluyveromyces)和耶氏酵母属(Yarrowia)。在一些实施例中，该酵母细胞是多形汉逊酵母(Hansenula polymorpha)、酿酒酵母(Saccharomycescerevisiae)、卡尔斯伯酵母(Saccaromyces carlsbergensis)、糖化酵母(Saccharomycesdiastaticus)、诺地酵母(Saccharomyces norbensis)、克鲁维酵母(Saccharomyceskluyveri)、粟酒裂殖酵母(Schizosaccharomyces pombe)、巴斯德毕赤酵母(Pichiapastoris)、芬兰毕赤酵母(Pichia finlandica)、嗜海藻糖毕赤酵母(Pichiatrehalophila)、考达毕赤酵母(Pichia kodamae)、膜醭毕赤酵母(Pichiamembranaefaciens)、幸运毕赤酵母(Pichia opuntiae)、耐热毕赤酵母(Pichiathermotolerans)、萨利毕赤酵母(Pichia salictaria)、松栎毕赤酵母(Pichiaquercuum)、皮杰普氏毕赤酵母(Pichia pijperi)、树干毕赤酵母(Pichia stipitis)、嗜甲醇毕赤酵母(Pichia methanolica)、安格斯毕赤酵母(Pichia angusta)、乳酸克鲁维酵母(Kluyveromyces lactis)、白色念珠菌(Candida albicans)或解脂耶罗威亚酵母(Yarrowia lipolytica)。

在某些实施例中，宿主细胞是藻类细胞，诸如衣藻属(Chlamydomonas)(例如，莱茵衣藻(C.Reinhardtii))和席藻属(Phormidium)(席藻种ATCC29409)。

在其它实施例中，宿主细胞是原核细胞。合适的原核细胞包含革兰氏阳性、革兰氏阴性和革兰氏变异性细菌细胞。宿主细胞可以是(但不限于)以下物种：农杆菌属(Agrobacterium)、脂环酸芽孢杆菌属、鱼腥藻属(Anabaena)、倒囊藻属(Anacystis)、不动杆菌属(Acinetobacter)、酸热菌属(Acidothermus)、节杆菌属(Arthrobacter)、固氮菌属(Azobacter)、芽孢杆菌属(Bacillus)、双歧杆菌属(Bifidobacterium)、短杆菌属(Brevibacterium)、丁酸弧菌属(Butyrivibrio)、布赫纳氏菌属(Buchnera)、野油菜(Campestris)、弯曲杆菌属(Camplyobacter)、梭菌属(Clostridium)、棒状杆菌属(Corynebacterium)、红硫菌属(Chromatium)、粪球菌属(Coprococcus)、埃希氏杆菌属(Escherichia)、肠球菌属(Enterococcus)、肠杆菌属(Enterobacter)、欧文菌属(Erwinia)、梭杆菌属(Fusobacterium)、栖粪杆菌属(Faecalibacterium)、弗朗西斯氏菌属(Francisella)、黄杆菌属(Flavobacterium)、土芽孢杆菌属(Geobacillus)、嗜血杆菌属(Haemophilus)、螺旋杆菌属(Helicobacter)、克雷伯氏菌属(Klebsiella)、乳杆菌属(Lactobacillus)、乳球菌属(Lactococcus)、泥杆菌属(Ilyobacter)、微球菌属(Micrococcus)、微杆菌属(Microbacterium)、中间根瘤菌属(Mesorhizobium)、甲基杆菌属、甲基杆菌属、分枝杆菌属(Mycobacterium)、奈瑟菌属(Neisseria)、泛菌属(Pantoea)、假单胞菌属(Pseudomonas)、原绿球藻属(Prochlorococcus)、红细菌属(Rhodobacter)、红假单胞菌属(Rhodopseudomonas)、红假单胞菌属(Rhodopseudomonas)、罗斯氏菌属(Roseburia)、红螺菌属(Rhodospirillum)、红球菌属(Rhodococcus)、栅列藻属(Scenedesmus)、链霉菌属(Streptomyces)、链球菌属(Streptococcus)、聚球藻属(Synecoccus)、糖单孢菌属(Saccharomonospora)、葡萄球菌属(Staphylococcus)、沙雷氏菌属(Serratia)、沙门氏菌属(Salmonella)、志贺氏菌属(Shigella)、嗜热厌氧杆菌属(Thermoanaerobacterium)、养障体(Tropheryma)、土拉热菌属(Tularensis)、蒂梅丘拉(Temecula)、嗜热聚球藻属(Thermosynechococcus)、热球菌属(Thermococcus)、脲原体属(Ureaplasma)、黄单胞菌属(Xanthomonas)、木杆菌属(Xylella)、耶尔森氏菌属(Yersinia)和发酵单胞菌属(Zymomonas)。在一些实施例中，宿主细胞是谷氨酸棒状杆菌。

在一些实施例中，细菌宿主菌株是工业菌株。多种细菌工业菌株是已知的并且适用于本文所述的方法和组合物中。

在一些实施例中，细菌宿主细胞是农杆菌种(例如，放射形土壤杆菌(A.radiobacter)、发根农杆菌(A.rhizogenes)、悬钩子农杆菌(A.rubi))、节杆菌种(Arthrobacterspecies)(例如，金黄节杆菌(A.aurescens)、柠檬节杆菌(A.citreus)、球形节杆菌(A.globformis)、裂烃谷氨酸节杆菌(A.hydrocarboglutamicus)、迈索尔节杆菌(A.mysorens)、烟草节杆菌(A.nicotianae)、石蜡节杆菌(A.paraffineus)、畏光节杆菌(A.protophonniae)、玫瑰色石蜡节杆菌(A.roseoparaffinus)、硫磺色节杆菌(A.sulfureus)、产脲节杆菌(A.ureafaciens))、芽孢杆菌种(例如，苏云金芽孢杆菌(B.thuringiensis)、炭疽芽孢杆菌(B.anthracis)、巨大芽孢杆菌(B.megaterium)、枯草杆菌(B.subtilis)、迟缓芽胞杆菌(B.lentus)、环状芽孢杆菌(B.circulars)、短小芽孢杆菌(B.pumilus)、灿烂芽孢杆菌(B.lautus)、凝结芽孢杆菌(B.coagulans)、短小芽孢杆菌(B.brevis)、坚强芽胞杆菌(B.firmus)、嗜碱芽孢杆菌(B.alkaophius)、地衣芽孢杆菌(B.licheniformis)、克劳氏芽孢杆菌(B.clausii)、嗜热脂肪芽孢杆菌(B.stearothermophilus)、耐盐芽孢杆菌(B.halodurans)和解淀粉芽孢杆菌(B.amyloliquefaciens)。在特定实施例中，宿主细胞将是工业芽孢杆菌属菌株，包含但不限于枯草芽孢杆菌、短小芽孢杆菌、地衣芽孢杆菌、巨大芽孢杆菌、克劳氏芽孢杆菌、嗜热脂肪芽孢杆菌和解淀粉芽孢杆菌。在一些实施例中，宿主细胞将是工业梭菌属菌种(例如，丙酮丁醇梭菌(C.acetobutylicum)、破伤风梭菌E88(C.tetani E88)、象牙海岸梭菌(C.lituseburense)、糖丁酸梭菌(C.saccharobutylicum)、产气荚膜梭菌(C.perfringens)、拜氏梭菌(C.beijerinckii))。在一些实施例中，宿主细胞将是工业棒状杆菌属物种(例如，谷氨酸棒状杆菌、嗜乙酰乙酸棒状杆菌)。在一些实施例中，宿主细胞将是工业埃希氏杆菌属物种(例如，大肠杆菌)。在一些实施例中，宿主细胞将是工业欧文菌属物种(例如，噬夏孢欧文菌(E.uredovora)、胡萝卜软腐欧文菌(E.carotovora)、菠萝欧文氏菌(E.ananas)、草生欧文菌(E.herbicola)、点状欧文菌(E.punctata)、土生欧文菌(E.terreus))。在一些实施例中，宿主细胞是工业泛菌属物种(例如，柠檬泛菌(P.citrea)、成团泛菌(P.agglomerans))。在一些实施例中，宿主细胞将是工业假单胞菌属物种(例如，恶臭假单胞菌(P.putida)、铜绿假单胞菌(P.aeruginosa)、迈氏假单胞菌(P.mevalonii))。在一些实施例中，宿主细胞将是工业链球菌属物种(例如，类马链球菌、酿脓链球菌(S.pyogenes)、乳房链球菌(S.uberis))。在一些实施例中，宿主细胞将是工业链霉菌属物种(例如，产二素链霉菌(S.ambofaciens)、不产色链霉菌(S.achromogenes)、除虫链霉菌(S.avermitilis)、天蓝色链霉菌(S.coelicolor)、金霉素链霉菌(S.aureofaciens)、金色链霉菌(S.aureus)、杀真菌素链霉菌(S.fungicidicus)、灰色链霉菌(S.griseus)、变铅青链霉菌(S.lividans))。在一些实施例中，宿主细胞将是工业发酵单胞菌属物种(例如，运动发酵单胞菌(Z.mobilis)、解脂发酵单胞菌(Z.lipolytica))等。

在一些实施例中，宿主细胞将是工业埃希氏杆菌属物种(例如，大肠杆菌)。

大肠杆菌种的合适的宿主菌株包括：产肠毒素大肠杆菌(ETEC)、肠致病性大肠杆菌(EPEC)、肠侵袭性大肠杆菌(EIEC)、肠出血性大肠杆菌(EHEC)、尿致病性大肠杆菌(UPEC)、产生维罗毒素的大肠杆菌、大肠杆菌O157:H7、大肠杆菌O104:H4、大肠杆菌O121、大肠杆菌O104:H21、大肠杆菌K1和大肠杆菌NC101。在一些实施例中，本公开教导了大肠杆菌K12、大肠杆菌B和大肠杆菌C的基因组工程改造。

在一些实施例中，宿主细胞可以是大肠杆菌菌株NCTC 12757、NCTC 12779、NCTC12790、NCTC 12796、NCTC 12811、ATCC 11229、ATCC 25922、ATCC 8739、DSM 30083、BC5849、BC 8265、BC 8267、BC 8268、BC 8270、BC 8271、BC 8272、BC 8273、BC 8276、BC 8277、BC 8278、BC 8279、BC 8312、BC 8317、BC 8319、BC 8320、BC 8321、BC 8322、BC 8326、BC8327、BC 8331、BC 8335、BC 8338、BC 8341、BC 8344、BC 8345、BC 8346、BC 8347、BC 8348、BC 8863和BC 8864。

在一些实施例中，本公开教导了可以是产生维罗毒素的大肠杆菌(VTEC)的宿主细胞，诸如菌株BC 4734(O26:H11)、BC 4735(O157:H-)、BC 4736、BC 4737(n.d.)、BC 4738(O157:H7)、BC 4945(O26:H-)、BC 4946(O157:H7)、BC 4947(O111:H-)、BC 4948(O157:H)、BC 4949(O5)、BC 5579(O157:H7)、BC 5580(O157:H7)、BC 5582(O3:H)、BC 5643(O2:H5)、BC5644(O128)、BC 5645(O55:H-)、BC 5646(O69:H-)、BC 5647(O101:H9)、BC 5648(O103:H2)、BC 5850(O22:H8)、BC 5851(O55:H-)、BC 5852(O48:H21)、BC 5853(O26:H11)、BC 5854(O157:H7)、BC 5855(O157:H-)、BC 5856(O26:H-)、BC 5857(O103:H2)、BC 5858(O26:H11)、BC 7832、BC 7833(O原始形式：H-)、BC 7834(ONT:H-)、BC 7835(O103:H2)、BC 7836(O57:H-)、BC 7837(ONT:H-)、BC 7838、BC 7839(O128:H2)、BC 7840(O157:H-)、BC 7841(O23:H-)、BC 7842(O157:H-)、BC 7843、BC 7844(O157:H-)、BC 7845(O103:H2)、BC 7846(O26:H11)、BC 7847(O145:H-)、BC 7848(O157:H-)、BC 7849(O156:H47)、BC 7850、BC 7851(O157:H-)、BC 7852(O157:H-)、BC 7853(O5:H-)、BC 7854(O157:H7)、BC 7855(O157:H7)、BC 7856(O26:H-)、BC 7857、BC 7858、BC 7859(ONT:H-)、BC 7860(O129:H-)、BC 7861、BC7862(O103:H2)、BC 7863、BC 7864(O原始形式：H-)、BC 7865、BC 7866(O26:H-)、BC 7867(O原始形式：H-)、BC 7868、BC 7869(ONT:H-)、BC 7870(O113:H-)、BC 7871(ONT:H-)、BC 7872(ONT:H-)、BC 7873、BC 7874(O原始形式：H-)、BC 7875(O157:H-)、BC 7876(O111:H-)、BC7877(O146:H21)、BC 7878(O145:H-)、BC 7879(O22:H8)、BC 7880(O原始形式：H-)、BC 7881(O145:H-)、BC 8275(O157:H7)、BC 8318(O55:K-:H-)、BC 8325(O157:H7)和BC 8332(ONT)、BC 8333。

在一些实施例中，本公开教导了可以是肠侵袭性大肠杆菌(EIEC)的宿主细胞，诸如菌株BC 8246(O152:K-:H-)、BC 8247(O124:K(72):H3)、BC 8248(O124)、BC 8249(O112)、BC 8250(O136:K(78):H-)、BC 8251(O124:H-)、BC 8252(O144:K-:H-)、BC 8253(O143:K:H-)、BC 8254(O143)、BC 8255(O112)、BC 8256(O28a.e)、BC 8257(O124:H-)、BC 8258(O143)、BC 8259(O167:K-:H5)、BC 8260(O128a.c.:H35)、BC 8261(O164)、BC 8262(O164:K-:H-)、BC 8263(O164)和BC 8264(O124)。

在一些实施例中，本公开教导了可以是产肠毒素大肠杆菌(ETEC)的宿主细胞，诸如菌株BC 5581(O78:H11)、BC 5583(O2:K1)、BC 8221(O118)、BC 8222(O148:H-)、BC 8223(O111)、BC 8224(O110:H-)、BC 8225(O148)、BC 8226(O118)、BC 8227(O25:H42)、BC 8229(O6)、BC 8231(O153:H45)、BC 8232(O9)、BC 8233(O148)、BC 8234(O128)、BC 8235(O118)、BC 8237(O111)、BC 8238(O110:H17)、BC 8240(O148)、BC 8241(O6H16)、BC 8243(O153)、BC8244(O15:H-)、BC 8245(O20)、BC 8269(O125a.c:H-)、BC 8313(O6:H6)、BC 8315(O153:H-)、BC 8329、BC 8334(O118:H12)和BC 8339。

在一些实施例中，本公开教导了可以是肠致病性大肠杆菌(EPEC)的宿主细胞，诸如菌株BC 7567(O86)、BC 7568(O128)、BC 7571(O114)、BC 7572(O119)、BC 7573(O125)、BC7574(O124)、BC 7576(O127a)、BC 7577(O126)、BC 7578(O142)、BC 7579(O26)、BC 7580(OK26)、BC 7581(O142)、BC 7582(O55)、BC 7583(O158)、BC 7584(O-)、BC 7585(O-)、BC7586(O-)、BC 8330、BC 8550(O26)、BC 8551(O55)、BC 8552(O158)、BC 8553(O26)、BC 8554(O158)、BC 8555(O86)、BC 8556(O128)、BC 8557(OK26)、BC 8558(O55)、BC 8560(O158)、BC8561(O158)、BC 8562(O114)、BC 8563(O86)、BC 8564(O128)、BC 8565(O158)、BC 8566(O158)、BC 8567(O158)、BC 8568(O111)、BC 8569(O128)、BC 8570(O114)、BC 8571(O128)、BC 8572(O128)、BC 8573(O158)、BC 8574(O158)、BC 8575(O158)、BC 8576(O158)、BC 8577(O158)、BC 8578(O158)、BC 8581(O158)、BC 8583(O128)、BC 8584(O158)、BC 8585(O128)、BC 8586(O158)、BC 8588(O26)、BC 8589(O86)、BC 8590(O127)、BC 8591(O128)、BC 8592(O114)、BC 8593(O114)、BC 8594(O114)、BC 8595(O125)、BC 8596(O158)、BC 8597(O26)、BC 8598(O26)、BC 8599(O158)、BC 8605(O158)、BC 8606(O158)、BC 8607(O158)、BC 8608(O128)、BC 8609(O55)、BC 8610(O114)、BC 8615(O158)、BC 8616(O128)、BC 8617(O26)、BC8618(O86)、BC 8619、BC 8620、BC 8621、BC 8622、BC 8623、BC 8624(O158)和BC 8625(O158)。

在一些实施例中，本公开还教导了可以是志贺氏菌属生物体的宿主细胞，包含福氏志贺氏菌(Shigella flexneri)、痢疾志贺氏菌(Shigella dysenteriae)、鲍氏志贺氏菌(Shigella boydii)和宋内志贺氏菌(Shigella sonnei)。

本公开还适用于多种动物细胞类型，包含哺乳动物细胞，例如人(包含293、WI38、PER.C6和鲍氏黑色素瘤细胞)、小鼠(包含3T3、NS0、NS1、Sp2/0)、仓鼠(CHO、BHK)、猴(COS、FRhL、Vero)和杂交瘤细胞系。

在各种实施例中，可以用于实施本公开的菌株(包含原核菌株和真核菌株两者)容易公开获自多个培养物保藏中心，诸如美国典型培养物保藏中心(American Type CultureCollection)(ATCC)、德国微生物菌种保藏中心(Deutsche Sammlung vonMikroorganismen and Zellkulturen GmbH)(DSM))、荷兰微生物菌种保藏中心(Centraalbureau Voor Schimmelcultures)(CBS))以及美国农业研究菌种保藏中心，北部区域研究中心(Agricultural Research Service Patent Culture Collection,NorthernRegional Research Center(NRRL))。

在一些实施例中，本公开的方法还可适用于多细胞生物体。例如，该平台可以用于改善农作物的性能。生物体可以包括多种植物，诸如禾本科(Gramineae)、非突亚科(Fetucoideae)、颇考亚科(Poacoideae)、剪股颖属(Agrostis)、梯牧草属(Phleum)、鸭茅属(Dactylis)、高粱属(Sorgum)、狗尾草属(Setaria)、玉蜀黍属(Zea)、稻属(Oryza)、小麦属(Triticum)、黑麦属(Secale)、燕麦属(Avena)、大麦属(Hordeum)、甘蔗属(Saccharum)、早熟禾属(Poa)、羊茅属(Festuca)、钝叶草属(Stenotaphrum)、狗牙根属(Cynodon)、薏苡属(Coix)、莪利竹族(Olyreae)、原禾族(Phareae)、菊科(Compositae)或豆科(Leguminosae)。例如，植物可以是玉米、稻米、大豆、棉花、小麦、黑麦、燕麦、大麦、豌豆、菜豆、小扁豆、花生、地瓜、豇豆、绒毛豆、三叶草、苜蓿、羽扇豆、野豌豆、莲藕、草木樨、紫藤、香豌豆、高粱、小米、葵花、芥花等。类似地，生物体可以包含多种动物，诸如非人类哺乳动物、鱼、昆虫等。

宿主细胞的转化

在一些实施例中，可以使用多种技术中的任一种将通过本公开的方法生成的构建体引入到宿主细胞中，该技术包含转化、转染、转导、病毒感染、基因枪或Ti介导的基因转移。具体的方法包含磷酸钙转染、DEAE-葡聚糖介导的转染、脂转染或电穿孔(戴维斯·L(Davis,L.),迪布纳·M(Dibner,M.),巴格利·I(Battey,I.),1986“分子生物学的基本方法(Basic Methods in Molecular Biology)”)。其他转化方法包含例如乙酸锂转化和电穿孔。参见，例如，吉茨(Gietz)等人,核酸研究27:69-74(1992)；伊托(Ito)等人,细菌学杂志(J.Bacterol.)153:163-168(1983)；贝克尔(Becker)和瓜伦特(Guarente),酶学方法(Methods in Enzymology)194:182-187(1991)。在一些实施例中，转化的宿主细胞被称为重组宿主菌株。

自动化

在一个实施例中，将本文提供的组合物和方法并入到用于宿主细胞的基因工程改造的高通量(HTP)方法中。在另一个实施例中，本文提供的方法可以是分子工具，其是在PCT/US18/36360、PCT/US18/36333或WO 2017/100377(其每一个出于所有目的通过引用并入本文)中描述的HTP分子工具组的一部分，以产生HTP遗传设计文库，其尤其源自科学见解和迭代模式识别。本文提供的组合物和方法可以用于生成用于高通量方法的文库，诸如在PCT/US18/36360、PCT/US18/36333或WO 2017/100377中描述的那些。可以使用本文提供的方法生成的文库的示例可以包含但不限于启动子梯、终止子梯、溶解度标签梯或降解标签梯。可以利用本文提供的组合物和方法的高通量基因组工程改造方法的示例可以包含但不限于如在PCT/US18/36360、PCT/US18/36333或WO 2017/100377中所述的启动子交换、终止子(终止)交换、溶解度标签交换、降解标签交换或SNP交换。高通量方法可以是自动化的和/或利用机器人和液体处理平台(例如，本领域中已知的板机器人平台和液体处理机器)。高通量方法可以利用多孔板，诸如例如微量滴定板。

在一些实施例中，本公开的自动化方法包括机器人系统。本文概述的系统通常涉及96孔微量滴定板或384孔微量滴定板的使用，但如本领域技术人员将理解的，可以使用任何数量的不同板或配置。此外，本文概述的任何或所有步骤可以是自动化的；因此，例如，系统可以是完全或部分自动化的。与本文提供的方法和组合物相容的机器人系统可以是在PCT/US18/36360、PCT/US18/36333或WO 2017/100377中描述的那些机器人系统。

试剂盒

本公开还提供了用于实施用于生成如上所述的核酸组装体或由其衍生的文库的方法的试剂盒。试剂盒可以包括含有用于组装ssDNA分子(例如寡核苷酸)或dsDNA分子所需的所有试剂的混合物。在某些实施例中，本主题的试剂盒可以含有：i.含有成对的第一多核苷酸和第二多核苷酸的第一多核苷酸的池，ii.插入多核苷酸的第二池，和(iii)任选地，用于在合适的宿主细胞中繁殖所生成的组装体的合适的克隆载体。在一些情况下，试剂盒包含阳性对照。

在一个实施例中，本文提供的试剂盒进一步包括5'-3'核酸外切酶和链置换聚合酶。在另一个实施例中，本文提供的试剂盒进一步包括5'-3'核酸外切酶、连接酶和链置换聚合酶。在又一个实施例中，本文提供的试剂盒包括单链(ss)结合蛋白质。ss结合蛋白质可以是极端热稳定的单链DNA结合蛋白质(ET SSB)、大肠杆菌recA、T7基因2.5产物、噬菌体λRedB或Rac前噬菌体RecT。

在一个单独的实施例中，本文提供的试剂盒进一步包括适当量的缺乏3'核酸外切酶活性的5'至3'核酸外切酶、拥挤剂、具有3'核酸外切酶活性的热稳定的非链置换DNA聚合酶、或所述DNA聚合酶与缺乏3'核酸外切酶活性的第二DNA聚合酶的混合物，以及分离的热稳定连接酶。拥挤剂可以是PEG、葡聚糖或聚蔗糖。例如，试剂盒可以含有T5核酸外切酶、PEG、

DNA聚合酶和Taq连接酶。在另一个示例中，试剂盒包括：核酸外切酶III、PEG、AMPLITAQ

DNA聚合酶和Taq连接酶。

本文提供的任何试剂盒还可以含有可以用于本方法的上文和下文所述的其他试剂，例如错配修复酶诸如mutHLS、cel-1核酸酶、T7 endo 1、uvrD、T4 EndoVII、大肠杆菌EndoV、缓冲液、dNTP、插入合成子的质粒和/或接受质粒的感受态细胞、对照等，这取决于该方法的实现方式。

试剂盒的组分可以在一个容器中组合，或者每种组分可以在其自己的容器中。例如，试剂盒的组分可以在单个反应管中或者在一或多个不同的反应管中组合。

除了上述组分之外，本主题的试剂盒进一步包含使用试剂盒的组分来实施本主题的方法的说明书。用于实施本主题的方法的说明书通常被记录在合适的记录介质上。例如，说明书可以被印刷在基底(诸如纸或塑料等)上。因此，说明书可以作为包装插入物存在于试剂盒中，存在于试剂盒或其组分的容器的标签中(即，与包装或分包装相关联)等。在其他实施例中，在试剂盒中不存在实际的说明书，但是提供了用于例如经由互联网从远程来源获得说明书的手段。该实施例的示例是包含网址的试剂盒，在该网址中可以查看说明书和/或可以从该网址下载说明书。

如本文所述的用于组装第一池中成对的多核苷酸和第二池中的插入多核苷酸的组合物、试剂盒和方法产生作为dsDNA的产物，其可以用作PCR、RCA或多种其他分子生物学应用的模板，包含直接转化或转染感受态原核或真核宿主细胞。

实例

通过参考以下实例进一步说明本公开。然而，应当注意，与上述实施例类似，这些实例是说明性的并且不应被解释为以任何方式限制本公开的范围。

实例1——用于将DNA片段多重组装到质粒的确定性文库中的方法原理证明。

目的

本实例描述了使用如图1中示意性示出的体外组装反应来确定性地连接包括精确设计的DNA部分(其包括4种组分)的池，以生成所需质粒的文库。

方法/结果

插入序列(即，有效负载)在柱或阵列上合成，以生成柱合成的有效负载池和阵列合成的有效负载池，每个池含有下面所示的7个有效负载序列的混合物。

>pMB070_启动子

ACCGTGCGTGTTGACAATTTTACCTCTGGCGGTGATACTGGTTGCATGTACTAAGGAGGTTGT(SEQID NO.1)

>b2405_启动子

ATGTCGGATATCTGGTGGTGAAATACTTTATGCCATGATAATTTAATACGATGTATTTATTATATGGAGCACTTAATT(SEQ ID NO.2)

>b0605_启动子

TAATGGAAACGCATTAGCCGAATCGGCAAAAATTGGTTACCTTACATCTCATCGAAAACACGGAGGAAGTATAG(SEQ ID NO.3)

>pMB043_启动子

ACCGTGCGTGTTGACTATTTTACCTCTGGCGGTTAGAGTTAACATCCTACAAGGAGAACAAAAGC(SEQID NO.4)

>pMB071_启动子

ACCGTGCGTGTTGACTTAAATACCACTGGCGGTGATAATGGTTGCATGTACTAAGGAGGTTGT(SEQID NO.5)

>b0159_启动子

CTCTCCCGCGTGAGAAATACGCTTCCCCGTAAGCGCATGGTAAACTATGCCTTCAAATCGGGCTTATCGCGAGTAAATCT(SEQ ID NO.6)

>pMB090_启动子

ACCGTGCGTGTTTACAATTTTACCTCTGGCGGTGATAATTAACATCCTACAAGGAGAACAAAAGC(SEQID NO.7)

分别地，生成了6个包括成对的左同源性臂和右同源性臂的池(即，图4中引用的基因座池编号)。每个基因座池含有多个同源性臂，每个同源性臂包括与大肠杆菌宿主细胞的基因组中的单独的基因座互补的序列；独特基因座的数目(即成对的同源性臂的数目)在图4中每个池的图下面给出(即，图下面的表中的“池中的基因座”)。来自每个池的每对中每个同源性臂的序列是SEQ ID NO.8至SEQ ID NO.179。

柱合成的有效负载池和阵列合成的有效负载池分别与图4中指定的特定基因座池混合。应当注意，每种混合物含有的左同源性臂:有效负载:右同源性臂的摩尔比为大约1:10:1。存在过量的有效负载，因为有效负载池含有对应于100-500个独特的左同源性臂和右同源性臂的寡核苷酸，而在给定的反应中仅组装了10-19个同源性臂，假定一定比例的插入寡核苷酸在反应中将是惰性的。该混合物进一步包括NEB Hifi DNA组装主混合物和用于在大肠杆菌克隆菌株中繁殖的克隆载体。每种混合物含有约0.05pmol的相应基因座池、0.2-1pmol的相应有效负载池和0.0125pmol的克隆载体，理论上得到0.0125pmol的最终组装产物。一旦组装，使每种混合物经历用于体外重叠组装的NEB Hifi DNA组装方案，并在大肠杆菌克隆菌株中繁殖。在图4中的表中给出了每个文库中的独特基因座(同源性臂对)、有效负载和总的可能构建体的数目。

在繁殖后，将每个组装体至少100个菌落分别挑入液体培养物中并生长过夜。使用液体培养物作为模板，用于对整个克隆的质粒进行滚环扩增(RCA)。使用Tn5转座酶片段化和衔接子连接试剂盒(次世代(Nextera),依诺米那(Illumina))对RCA产物进行片段化。然后经由PCR添加样品特异性的索引条形码，并将来自文库的质粒混合并进行柱纯化。使用Tapestation仪器评估文库摩尔浓度，并将来自文库的质粒加载到MiSeq仪器(300个循环试剂盒)上以用于测序。在图4中示出了对每个组装体测序的质粒的数目。

为了确定在组装体的池中生成了什么组装体，使用算法以在原始测序读段中搜索每个唯一组装体中各部分之间的每个连接处的唯一20-mer序列，以便确定哪个DNA序列被组装。然后将读段映射至每个样品的相应参考序列，以便确定所生成的全长产物。在图4的图中，“序列完美”表示所有四个部分(载体主链、左同源性臂和右同源性臂和有效负载)被组装在一起，并且在质粒中没有突变。“带有突变的正确组装”表示所有四个部分都以正确的排列存在，但在质粒中具有一或多个点突变。“错组装”表示具有错配的同源性臂或部分(part)或部分的部分(portion)不存在的质粒。

结论

图4中所示的结果表明，图1中描述的工艺可以成功地用于生成DNA组装体的确定性文库。

实例2——使用环状排列的有效负载的大有效负载进行多路复用确定性组装的方法的原理证明。

目的

该实例描述了使用如图1中示意性示出的体外组装反应来确定性地连接包括精确设计的DNA部分的池，该DNA部分包含环状排列的有效负载(插入物)，其制备在图3中描述。

方法/结果

通过使用混合的正向引物扩增包括有效负载序列(约2670bp)的模板来制备插入物，该正向引物从5'至3'端包括有效负载右侧的组装重叠、HOM2的53bp、I-SceI限制性核酸内切酶识别位点、HOM1的53bp和有效负载左侧的引物结合位点。使用凯杰(Qiagen)凝胶提取试剂盒从琼脂糖凝胶上切下扩增产物。切除的产物在NEB HiFi组装反应中环化，经由AxyPrep mag珠清除法纯化，并使用I-SceI进行线性化(“环状排列”)。

分别地，从基因组DNA扩增各自包括与酿酒酵母宿主细胞的基因组中的单独基因座互补的序列的左同源性臂和右同源性臂。

将环状排列的混合的有效负载和一组左同源性臂和右同源性臂与克隆载体组合，并使用NEB HiFi反应进行组装。混合物含有的左同源性臂:混合的插入物:右同源性臂的摩尔比为大约1:5:1。使用过量的插入物，因为与组装中使用的十对左/右同源性臂相比，混合的插入物含有54个独特的序列。该混合物含有约16fmol的同源性臂池、80fmol的有效负载池和2.5fmol的克隆载体，理论上得到2.5fmol的最终组装产品。一旦组装，就使混合物经历用于体外重叠组装的NEB Hifi DNA组装方案，并在大肠杆菌克隆菌株中繁殖。

在繁殖后，将若干个菌落分别挑入液体培养物中并生长过夜。使用液体培养物作为模板，用于对整个克隆的质粒进行滚环扩增(RCA)。使用两条引物(一条正向引物和一条反向引物)通过Sanger测序对RCA产物进行测序。引物被设计成与克隆载体结合并读入同源性臂和有效负载。

为了确定在组装体的池中生成了什么组装体，使用算法以在测序读取的每个独特组装体中搜索唯一的20-mer序列。然后将读段与每个样品的相应参考序列进行比对，以验证预期的连接被建立，表明质粒已被正确组装。在图5中，顶部的长条表示要在池中组装的质粒的结构，并且下面的较短条表示与来自组装体的池的三个单独样品的相应参考序列对齐的Sanger序列。读段内端的细垂直线表示Sanger读段尾端的预期测序伪影。数据表明，所有预期的连接都被组装。

结论

图5中所示的结果表明，图1和图3中描述的工艺可以被成功地用于生成并入长的有效负载(例如>200bp)的DNA组装体的确定性文库。

实例3——使用PCR扩增的有效负载的大有效负载进行多路复用确定性组装的方法的原理证明。

方法/结果

图6示出了混合的组装体的总成功率，其中含有有效负载的部分是经由PCR使用附加了来自源自宿主基因组的模板的组装重叠的引物来创建的。扩增的有效负载长度在182-213bp的范围内。在使用NEB的HIFI组装主混合物进行组装之前，经由基于磁珠的方案纯化具有附加的25bp组装重叠的PCR扩增的部分，并且随后与含有同源性臂的左侧和右侧部分一起分别标准化至有效负载、左侧和右侧部分的总计.25皮摩尔，和.05皮摩尔的载体主链，并且随后被电穿孔到电感应态细胞中。成功率根据被回收并通过NGS-QC的质粒相对于尝试创建的质粒的百分比来计算。成功率是基于对每个池中下列数量的独特质粒进行回收和测序：池1：(48/70个质粒)，池2：(47/70个质粒)，池3：(46/70个质粒)，池4(56/70个质粒)，池5：(37/49个质粒)。对于池1:4，7个启动子有效负载靶向10个基因座，并且对于池5，7个启动子有效负载靶向7个基因座。在所有五个池中，我们总共创建了234/329或71.12％的质粒，并经NGS证实。

结论

图6中所示的结果表明，图1中描述的工艺可以成功地用于PCR扩增的插入片段，以生成并入长的有效负载(例如>200bp)的DNA组装体的确定性文库。

具有SEQ ID NO识别符的本公开的序列

本公开的编号的实施例

由本公开预期的其他主题在以下编号的实施例中阐述：

1.一种包括多核苷酸的混合物的组合物，所述混合物包括：

含有成对的多核苷酸的第一池，其中所述第一池中的每对含有第一多核苷酸和第二多核苷酸；和

插入多核苷酸的第二池，其中所述第二池中的每个插入多核苷酸包括在其5'端的与来自所述第一池的一对多核苷酸中的第一多核苷酸的3'端互补的第一组装重叠序列和在其相对的3'端的与第二多核苷酸的5'端互补的第二组装重叠序列。

2.根据实施例1所述的组合物，进一步包括克隆载体，其中，对于所述第一池中的每对，所述第一多核苷酸的5'端和所述第二多核苷酸的3'端包括与所述克隆载体互补的序列。

3.根据实施例2所述的组合物，其中选择来自所述第一池的每一多核苷酸，使得除了所述第一池的所述成对的多核苷酸与所述第二池的所述插入成对的多核苷酸之间、或所述第一池的所述成对的多核苷酸与所述克隆载体之间的设计的组装重叠序列之外，没有来自所述第一池的多核苷酸与来自所述第一池的超过指定的阈值的任何其他多核苷酸共享共同序列。

4.根据实施例3所述的组合物，其中所述指定的阈值为5至15个连续核苷酸。

5.根据实施例1至4中任一个所述的组合物，进一步包括聚合酶。

6.根据实施例5所述的组合物，其中所述聚合酶是链置换的或非链置换的。

7.根据实施例6所述的组合物，其中所述聚合酶是非链置换的，并且所述组合物进一步包括拥挤剂。

8.根据实施例7所述的组合物，其中所述拥挤剂是聚乙二醇(PEG)。

9.根据实施例8所述的组合物，其中所述PEG以约3％至约7％(重量/体积)的浓度使用。

10.根据实施例8或9所述的组合物，其中所述PEG选自PEG-200、PEG-4000、PEG-6000、PEG-8000或PEG-20,000。

11.根据实施例6所述的组合物，其中所述聚合酶是链置换的，并且所述组合物进一步包括单链结合蛋白质。

12.根据实施例11所述的组合物，其中所述单链DNA结合蛋白质是极端热稳定的单链DNA结合蛋白质(ET SSB)、大肠杆菌recA、T7基因2.5产物、噬菌体λRedB或Rac前噬菌体RecT。

13.根据上述实施例中任一个所述的组合物，进一步包括5'-3'核酸外切酶。

14.根据上述实施例中任一个所述的组合物，进一步包括连接酶。

15.根据上述实施例中任一个所述的组合物，其中所述第一池中的每对是双链DNA(dsDNA)或单链(ssDNA)。

16.根据上述实施例中任一个所述的组合物，其中所述第二池中的每个插入多核苷酸是dsDNA或ssDNA。

17.根据上述实施例中任一个所述的组合物，其中，对于所述第一池中的每对，所述第一多核苷酸和所述第二多核苷酸包括对应于宿主细胞中的靶基因组基因座的序列。

18.根据实施例1至16中任一个所述的组合物，其中，对于所述第一池中的每对，所述第一多核苷酸和所述第二多核苷酸包括对应于作为代谢途径的一部分的基因的编码序列。

19.根据实施例1至18中任一个所述的组合物，其中，对于所述第一池中的每对，所述第一多核苷酸和所述第二多核苷酸包括对应于功能结构域或一或多种蛋白质的编码序列。

20.根据上述实施例中任一个所述的组合物，其中，对于所述第一池中的每对，所述第一多核苷酸和所述第二多核苷酸在单个构建体中连接在一起，其中所述单个构建体包括用于所述第一多核苷酸与所述第二多核苷酸之间的一或多种位点特异性核酸酶的一或多个识别序列。

21.根据实施例20所述的组合物，其中用于一或多种位点特异性核酸酶的一或多个识别序列包括归巢核酸内切酶识别序列。

22.根据上述实施例中任一个所述的组合物，其中所述第二池中的每个插入多核苷酸上的所述第一组装重叠序列和所述第二组装重叠序列包括分别与来自所述第一池的一对多核苷酸中的第一多核苷酸的3'端和第二多核苷酸的5'端互补的1或多个核苷酸。

23.根据上述实施例中任一个所述的组合物，其中所述第二池中的每个插入多核苷酸上的所述第一组装重叠序列和所述第二组装重叠序列包括分别与来自所述第一池的一对多核苷酸中的第一多核苷酸的3'端和第二多核苷酸的5'端互补的约25个核苷酸。

24.根据上述实施例中任一个所述的组合物，其中所述第二池中的每个插入多核苷酸包括位于所述第一组装重叠序列与所述第二组装重叠序列之间的一或多个有效负载序列。

25.根据实施例24所述的组合物，其中所述一或多个有效负载序列选自启动子、基因、调节序列、编码降解决定子的核酸序列、编码溶解度标签的核酸序列、终止子、唯一标识符序列或其部分。

26.根据实施例17所述的组合物，其中所述第一池中的每对第一多核苷酸和第二多核苷酸包括与所述第一池中的每个其他对相比对应于宿主细胞中不同的靶基因组基因座的序列。

27.根据实施例17所述的组合物，其中，对于所述第一池中的每对，所述第一多核苷酸和所述第二多核苷酸包括对应于宿主细胞中相同靶基因组基因座的序列。

28.根据实施例24至27中任一个所述的组合物，其中所述第二池中的所述插入多核苷酸中的每个有效负载序列不同于所述第二池中的每个其他插入多核苷酸中的有效负载序列。

29.根据实施例24至27中任一个所述的组合物，其中所述第二池中的所述插入多核苷酸中的每个有效负载序列与所述第二池中的每个其他插入多核苷酸中的有效负载序列相同。

30.一种用于生成多核苷酸的文库的方法，所述方法包括：

(a)组合多核苷酸的第一池和多核苷酸的第二池，其中所述第一池含有成对的多核苷酸，其中所述第一池中的每对含有第一多核苷酸和第二多核苷酸，其中所述第二池含有插入多核苷酸，其中所述第二池中的每个插入多核苷酸包括在其5'端的与来自所述第一池的一对多核苷酸中的第一多核苷酸的3'端互补的第一组装重叠序列和在其相对的3'端的与第二多核苷酸的5'端互补的第二组装重叠序列；以及

(b)将所述第一池和所述第二池组装成多核苷酸的文库，其中所述文库中的每一多核苷酸包括来自所述第二池的插入多核苷酸和来自所述第一池的一对第一多核苷酸和第二多核苷酸，其中所述组装通过体外克隆方法或体内克隆方法进行。

31.根据实施例30所述的方法，其中所述第二池中的每个插入多核苷酸上的所述第一组装重叠序列和所述第二组装重叠序列包括分别与来自所述第一池的一对多核苷酸中的第一多核苷酸的3'端和第二多核苷酸的5'端互补的1或多个核苷酸。

32.根据实施例30或31所述的方法，其中所述第二池中的每个插入多核苷酸上的所述第一组装重叠序列和所述第二组装重叠序列包括分别与来自所述第一池的一对多核苷酸中的第一多核苷酸的3'端和第二多核苷酸的5'端互补的约25个核苷酸。

33.根据实施例30至32中任一个所述的方法，其中，对于所述第一池中的每对，所述第一多核苷酸和所述第二多核苷酸在单个构建体中连接在一起，其中所述单个构建体包括用于所述第一多核苷酸与所述第二多核苷酸之间的一或多种位点特异性核酸酶的一或多个识别序列。

34.根据实施例33所述的方法，其中用于一或多种位点特异性核酸酶的所述一或多个识别序列包括归巢核酸内切酶识别序列。

35.根据实施例33所述的方法，其中通过经由剪接和重叠延伸PCR(SOE-PCR)、限制连接、钝端连接、基于重叠的组装方法、基于重组的方法或连接所述第一多核苷酸和所述第二多核苷酸的任何其他酶促或化学方法连接各个第一多核苷酸和第二多核苷酸，或通过直接合成所述单个构建体来产生连接的单个构建体。

36.根据实施例30至32中任一个所述的方法，进一步包括在步骤(a)期间将克隆载体与所述第一池和所述第二池组合，其中，对于所述第一池中的每对，所述克隆载体的相对端包括与所述第一多核苷酸的5'端和所述第二多核苷酸的3'端互补的序列。

37.根据实施例30至32中任一个所述的方法，进一步包括在步骤(a)之前将克隆载体与所述第一池组合，其中，对于所述第一池中的每对，所述克隆载体的相对端包括与所述第一多核苷酸的5'端和所述第二多核苷酸的3'端互补的序列。

38.根据实施例36或37所述的方法，其中所述克隆载体和来自所述第一池的每对中的所述第一多核苷酸的5'端和所述第二多核苷酸的3'端包括用于一或多种位点特异性核酸酶的一或多个识别序列。

39.根据实施例38所述的方法，进一步包括通过添加所述一或多个识别序列的一或多种位点特异性核酸酶，在所述克隆载体的相对端与来自所述第一池的每对中的所述第一多核苷酸的5'端和所述第二多核苷酸的3'端之间生成单链互补突出物。

40.根据实施例39所述的方法，进一步包括连接所述克隆载体的所述相对端与来自所述第一池的每对中的所述第一多核苷酸的5'端和所述第二多核苷酸的3'端之间的所述单链互补突出物。

41.根据实施例36至40中任一个所述的方法，其中步骤(b)产生环状产物，所述环状产物包括来自所述第二池的插入多核苷酸、来自所述第一池的一对的第一多核苷酸和第二多核苷酸以及所述克隆载体。

42.根据实施例36至41中任一个所述的方法，其中所述第一池通过从更大组的此类序列中选择成对的多核苷酸序列来生成，使得除了所述第一池的所述成对的多核苷酸与所述第二池的所述插入多核苷酸之间、或所述第一池的所述成对的多核苷酸与所述克隆载体之间的设计的组装重叠序列之外，没有来自所述第一池的多核苷酸与来自所述第一池的超过指定的阈值的任何其他多核苷酸共享共同序列。

43.根据实施例42所述的方法，其中所述指定的阈值为5至15个连续核苷酸。

44.根据实施例30至43中任一个所述的方法，其中所述组装是体外克隆方法，其中将所述第一池和所述第二池的混合物加热以使存在于所述第一池和所述第二池中的多核苷酸部分或完全变性，然后在组装之前被冷却至室温。

45.一种用于生成多核苷酸的文库的方法，所述方法包括：

(a)经由聚合酶链反应(PCR)扩增多核苷酸的第一池，其中所述第一池含有成对的多核苷酸，其中所述第一池中的每对含有第一多核苷酸和第二多核苷酸，并且其中一对中的每一个第一多核苷酸和每一个第二多核苷酸包括5'端和3'端，其中所述扩增将包括用于一或多种位点特异性核酸酶的一或多个识别序列的共同重叠序列引入到来自所述第一池的一对中的第一多核苷酸的5'端和第二多核苷酸的3'端上；

(b)通过利用共同重叠序列将来自所述第一池的每对第一多核苷酸和第二多核苷酸组装成单个核酸片段，其中每对的所述单个核酸片段包括由所述共同重叠序列从所述第一多核苷酸的5'端和所述第二多核苷酸的3'端分离的第一多核苷酸和第二多核苷酸，并且其中每对的所述单个核酸片段中的所述第一多核苷酸的3'端和所述第二多核苷酸的5'端位于所述单个核酸片段的相对末端上，远离一或多个位点特异性核酸酶识别序列；

(c)将每对的所述单个核酸片段与含有插入多核苷酸的第二池组合，其中所述第二池中的每个插入多核苷酸包括在其5'端的与所述单个核酸片段中存在的所述第一多核苷酸的3'端互补的第一组装重叠序列和在其相对的3'端的与所述单个核酸片段中存在的所述第二多核苷酸的5'端互补的第二组装重叠序列；

(d)将所述第一池和所述第二池组装成环化的产物的第三池，其中所述组装经由体外或体内重叠组装方法进行，并且其中所述第三池中的每种环化的产物包括来自所述第二池的插入序列和来自所述第一池的一对第一多核苷酸和第二多核苷酸；

(e)经由一或多种位点特异性核酸酶的消化使所述第三池中的每种环化的产物线性化，所述位点特异性核酸酶识别位于所述第三池中的每种环化的产物中的所述第一多核苷酸序列和所述第二多核苷酸序列之间的一或多个位点特异性核酸酶识别序列；以及

(f)通过体外或体内克隆方法将线性化的产物组装到克隆载体中。

46.根据实施例45所述的方法，其中位于所述第一多核苷酸序列与所述第二多核苷酸序列之间的所述一或多个位点特异性核酸酶识别序列是归巢核酸酶识别序列。

47.根据实施例45或46所述的方法，其中位于所述第一多核苷酸序列与所述第二多核苷酸序列之间的所述一或多个位点特异性核酸酶识别序列的所述一或多种位点特异性核酸酶是归巢核酸内切酶。

48.根据实施例45至47中任一个所述的方法，其中所述共同重叠序列包括至少1个核苷酸的组装重叠序列，并且步骤(b)中的组装通过基于重叠的DNA组装方法进行。

49.根据实施例45至47中任一个所述的方法，其中所述共同重叠序列包括10-25个核苷酸的组装重叠序列，并且步骤(b)中的组装通过基于重叠的DNA组装方法进行。

50.根据实施例48或49所述的方法，其中所述基于重叠的DNA组装方法选自SOE-PCR或体外重叠组装方法。

51.根据实施例50所述的方法，其中存在于所述第一多核苷酸的5'端的共同重叠序列中的所述一或多个位点特异性核酸酶识别序列与存在于每对中的所述第二多核苷酸的3'端的共同重叠序列中的所述一或多个位点特异性核酸酶识别序列互补，并且其中在步骤(b)中利用每对中的所述第一多核苷酸和所述第二多核苷酸的所述共同重叠序列需要进行SOE-PCR。

52.根据实施例45至47中任一个所述的方法，其中在步骤(b)中利用每对中的所述第一多核苷酸和所述第二多核苷酸的所述共同重叠序列需要用一或多个位点特异性核酸酶识别序列的一或多种位点特异性核酸酶消化每对中的所述第一多核苷酸5'端和所述第二多核苷酸3'端上的所述共同重叠序列中存在的所述一或多个位点特异性核酸酶识别序列，以在每对中的所述第一多核苷酸的5'端和所述第二多核苷酸的3'端生成包括互补序列的单链突出物；以及连接在每对中的所述第一多核苷酸的5'端和所述第二多核苷酸的3'端上的所述单链突出物上存在的互补序列。

53.根据实施例45至52中任一个所述的方法，其中步骤(d)的所述组装使用基于重叠的DNA组装方法进行。

54.根据实施例53所述的方法，其中所述基于重叠的DNA组装选自SOE-PCR和体外重叠组装方法。

55.根据实施例45至52中任一个所述的方法，其中每对中的所述单个核酸片段中的所述第一多核苷酸的3'端和所述第二多核苷酸的5'端包括一组附加的一或多个位点特异性核酸酶识别序列，并且所述第二池中的每个插入多核苷酸中的所述第一组装重叠序列和所述第二组装重叠序列包括一或多个位点特异性核酸酶识别序列。

56.根据实施例55所述的方法，其中步骤(d)中的组装需要用每对中的所述单个核酸片段中的所述第一多核苷酸的3'端和所述第二多核苷酸的5'端上的附加的一或多个位点特异性核酸酶识别序列以及来自所述第二池的每个插入多核苷酸中的所述第一组装序列和所述第二组装序列中存在的一或多个位点特异性核酸酶识别序列的一或多种位点特异性核酸酶消化每对中的所述单个核酸片段中的所述第一多核苷酸的3'端和所述第二多核苷酸的5'端上存在的附加的一或多个位点特异性核酸酶识别序列和来自所述第二池的每个插入多核苷酸中的所述第一组装序列和所述第二组装序列中存在的一或多个位点特异性核酸酶识别序列，以在所述第一多核苷酸的3'端上生成包括与来自所述第二池的插入多核苷酸的所述第一组装序列的5'端上的单链突出物上存在的序列互补的序列的单链突出物和在所述第二多核苷酸的5'端上生成包括与来自所述第二池的相同插入多核苷酸的所述第二组装序列的3'端上的单链突出物上存在的序列互补的序列的单链突出物；以及连接所述单链突出物上存在的互补序列。

57.根据实施例45至56中任一个所述的方法，其中步骤(f)的所述克隆载体包括一或多个位点特异性核酸酶识别序列。

58.根据实施例57所述的方法，其中步骤(f)中的组装需要用所述克隆载体中存在的所述一或多个位点特异性核酸酶识别序列的所述一或多种位点特异性核酸酶消化所述克隆载体中的一或多个位点特异性核酸酶识别序列，其中所述消化在所述克隆载体的相对端上生成单链突出物，其中所述克隆载体的所述相对端的一个上的所述单链突出物包括与步骤(e)中生成的所述线性化的产物的端互补的序列，并且所述克隆载体的所述相对端的另一个上的所述单链突出物包括与步骤(e)中生成的所述线性化的产物的相对端互补的序列；以及连接所述克隆载体的所述单链突出物上存在的互补序列和来自步骤(e)的所述线性化的产物。

59.根据实施例45至58中任一个所述的方法，其中所述第一池通过从更大组的此类序列中选择成对的多核苷酸序列来生成，使得除了所述第一池的所述成对的多核苷酸与所述第二池的所述插入多核苷酸之间、或所述第一池的所述成对的多核苷酸与所述克隆载体之间的设计的组装重叠序列之外，没有来自所述第一池的多核苷酸与来自所述第一池的超过指定的阈值的任何其他多核苷酸共享共同序列。

60.根据实施例59所述的方法，其中所述指定的阈值为5至15个连续核苷酸。

61.根据实施例45至60中任一个所述的方法，其中所述第二池中的每个插入多核苷酸上的所述第一组装重叠序列和所述第二组装重叠序列包括与所述单个核酸片段的所述相对末端互补的1或多个核苷酸。

62.根据实施例45至61中任一个所述的方法，其中所述第二池中的每个插入多核苷酸上的所述第一组装重叠序列和所述第二组装重叠序列包括与所述单个核酸片段的所述相对末端互补的约25个核苷酸。

63.根据实施例30至62中任一个所述的方法，其中，在步骤(a)之前，通过将含有来自成对的多核苷酸的每一个第一多核苷酸的混合物与含有来自成对的多核苷酸的每一个第二多核苷酸的混合物组合来生成多核苷酸的所述第一池。

64.根据实施例30至63中任一个所述的方法，其中所述第一池中的每对是双链DNA(dsDNA)或单链DNA(ssDNA)。

65.根据实施例30至43中任一个所述的方法，其中所述第二池中的每个插入多核苷酸是dsDNA或ssDNA。

66.根据实施例30至65中任一个所述的方法，其中，对于所述第一池中的每对，所述第一多核苷酸和所述第二多核苷酸包括对应于宿主细胞中的靶基因组基因座的序列。

67.根据实施例30至65中任一个所述的方法，其中，对于所述第一池中的每对，所述第一多核苷酸和所述第二多核苷酸包括对应于作为代谢途径的一部分的基因的编码序列。

68.根据实施例30至65中任一个所述的方法，其中，对于所述第一池中的每对，所述第一多核苷酸和所述第二多核苷酸包括对应于功能结构域或一或多种蛋白质的编码序列。

69.根据实施例30至68中任一个所述的方法，其中所述第二池中的每个插入多核苷酸包括位于所述第一组装重叠序列与所述第二组装重叠序列之间的一或多个有效负载序列。

70.根据实施例69所述的方法，其中所述一或多个有效负载序列选自启动子、基因、调节序列、编码降解决定子的核酸序列、编码溶解度标签的核酸序列、终止子、唯一标识符序列或其部分。

71.根据实施例66所述的方法，其中，对于所述第一池中的每对，所述第一多核苷酸和所述第二多核苷酸包括与所述第一池中的每对相比对应于宿主细胞中不同的靶基因组基因座的序列。

72.根据实施例66所述的方法，其中，对于所述第一池中的每对，所述第一多核苷酸和所述第二多核苷酸包括对应于宿主细胞中相同靶基因组基因座的序列。

73.根据实施例69至72中任一个所述的方法，其中所述第二池中的所述插入多核苷酸中的每个有效负载序列不同于所述第二池中的每个其他插入多核苷酸中的有效负载序列。

74.根据实施例69至72中任一个所述的方法，其中所述第二池中的所述插入多核苷酸中的每个有效负载序列与所述第二池中的每个其他插入多核苷酸中的有效负载序列相同。

75.根据实施例30或69至74中任一个所述的方法，其中所述第二池中的每个插入多核苷酸通过以下生成：

(i)对包括所述有效负载序列、正向引物和反向引物的混合物进行聚合酶链反应(PCR)，其中所述正向引物包括5'至3'、与所述有效负载序列互补的一或多个核苷酸的短段、所述第一组装重叠序列、用于一或多种位点特异性核酸酶的一或多个识别序列、所述第二组装重叠序列和与所述有效负载序列互补的一或多个核苷酸的第二段，并且其中所述反向引物包括与所述有效负载序列或与所述有效负载序列下游的其他序列互补的序列，其中所述PCR生成PCR产物，所述PCR产物包括5'至3'、与所述有效负载序列互补的核酸的短段、所述第一组装重叠序列、所述一或多个位点特异性核酸酶识别序列、所述第二组装重叠序列和所述有效负载序列；

(ii)经由选自由剪接和重叠延伸PCR(SOE-PCR)、限制性连接、钝端连接、基于重叠的组装方法和基于重组的方法组成的群组的组装方法，或连接两个DNA分子的任何其他酶促或化学方法，使所述PCR产物环化；以及

(iii)用识别所述一或多个位点特异性核酸酶识别序列的一或多种位点特异性核酸酶使所述环化的PCR产物线性化，从而生成多核苷酸的所述第二池。

76.根据上述实施例中任一个所述的组合物或方法，其中所述位点特异性核酸酶是限制性核酸内切酶、IIs型核酸内切酶、归巢核酸内切酶、RNA导向的核酸酶、DNA导向的核酸酶、锌指核酸酶、TALEN或切口酶中的一或多种。

*******

上述各种实施例可以被组合以提供另外的实施例。本说明书中提及的和/或在申请数据表中列出的所有美国专利、美国专利申请出版物、美国专利申请、外国专利、外国专利申请和非专利出版物均通过引用以其整体并入本文。如果需要，可以修改实施例的方面，以采用各种专利、申请和出版物的概念来提供又另外的实施例。

根据以上详细描述，可以对实施例进行这些和其他改变。一般而言，在所附的权利要求中，所使用的术语不应被解释为将权利要求限制于说明书和权利要求中公开的特定实施例，而应被解释为包含所有可能的实施例以及这些权利要求有权得到的等同物的全部范围。因此，权利要求不受本公开的限制。

通过引用并入

本文所引用的所有参考文献、文章、出版物、专利、专利出版物和专利申请均通过引用以其整体并入用于所有目的。然而，本文所引用的任何参考文献、文章、出版物、专利、专利出版物和专利申请的提及不被视为，并且不应被视为承认或以任何形式暗示它们构成有效的现有技术或构成世界上任何国家的公知常识的一部分。

序列表

<110> 齐默尔根公司(ZYMERGEN INC.)

<120> DNA文库的多重确定性组装

<130> ZYMR-029/01WO 327574-2164

<150> US 62/753,254

<151> 2018-10-31

<160> 179

<170> PatentIn版本3.5

<210> 1

<211> 63

<212> DNA

<213> 人工序列

<220>

<223> pMB070_启动子

<400> 1

accgtgcgtg ttgacaattt tacctctggc ggtgatactg gttgcatgta ctaaggaggt 60

tgt 63

<210> 2

<211> 78

<212> DNA

<213> 人工序列

<220>

<223> b2405_启动子

<400> 2

atgtcggata tctggtggtg aaatacttta tgccatgata atttaatacg atgtatttat 60

tatatggagc acttaatt 78

<210> 3

<211> 74

<212> DNA

<213> 人工序列

<220>

<223> b0605_启动子

<400> 3

taatggaaac gcattagccg aatcggcaaa aattggttac cttacatctc atcgaaaaca 60

cggaggaagt atag 74

<210> 4

<211> 65

<212> DNA

<213> 人工序列

<220>

<223> pMB043_启动子

<400> 4

accgtgcgtg ttgactattt tacctctggc ggttagagtt aacatcctac aaggagaaca 60

aaagc 65

<210> 5

<211> 63

<212> DNA

<213> 人工序列

<220>

<223> pMB071_启动子

<400> 5

accgtgcgtg ttgacttaaa taccactggc ggtgataatg gttgcatgta ctaaggaggt 60

tgt 63

<210> 6

<211> 80

<212> DNA

<213> 人工序列

<220>

<223> b0159_启动子

<400> 6

ctctcccgcg tgagaaatac gcttccccgt aagcgcatgg taaactatgc cttcaaatcg 60

ggcttatcgc gagtaaatct 80

<210> 7

<211> 65

<212> DNA

<213> 人工序列

<220>

<223> pMB090_启动子

<400> 7

accgtgcgtg tttacaattt tacctctggc ggtgataatt aacatcctac aaggagaaca 60

aaagc 65

<210> 8

<211> 1050

<212> DNA

<213> 人工序列

<220>

<223> 基因编辑同源性臂池_1_b3748_左

<400> 8

caaatctcga agatttcttt catgcggtgg gagatataga caataccgcg gccttgcgat 60

ttcagctcgc ggatgacgcg gaacagggat tcggtttcgg tatcggtcag cgcatcggtc 120

ggttcatcca taatgatgac tttcgactca aagctcagca ctttggcgat ttcaaccatt 180

tgctggtcac cgatggaaag atcgcccacc agcttgtcgc ttttaaagcg caggttaagt 240

ttagccagca atttatccgc ttcggcatac atggttttcc agtcaatttt gccaaagcga 300

ttaacaaact cacgaccgag gaaaatgttt tcggcaatgg tcaactgcgg gatcaggttc 360

agttcctgat ggataatccc aatcccggct tcctgggaag attttggccc ggtaaatgtc 420

gtttctttcc ccagccataa aagcgtaccg gcatcgcgag tatagatgcc agtaagcact 480

ttcatcatgg tggatttacc cgcgccgttt tcgcccacca gcgccatcac gcggcccgga 540

tagacattta acgctgcgcc cgagagggct tttacgcccg ggaaggcttt atcgatgcct 600

ttaagctgaa gtaatgcttc catgacggcc tcagaacgtc acgccagcac agagaatgat 660

attcgcatac ggagaacatt ctccgctgcg aattaccgcc tgactttctg cggtttgttg 720

tttgaattgt tcatgcgtgg tgtaacgaat ttcaatggta tttccctggt gtttttgcag 780

ctgctcaagg tgagtgagca acgtttcgtg gagttgcgga ttatggtgtt tgatctcttc 840

cgcgataatg gccgcctcga cctgcatttc atttgtgacg acgcccagca cctgcataaa 900

agaaggtaca ccctgggtta atgccatatc gatacgcgtt gtacttttgg ggatgggtaa 960

accagcatca cacaccacca gcgtatcggt atgtcccaga cgggagatca ccgatgaaat 1020

atcagaatta agaacggtgc cttttttcat 1050

<210> 9

<211> 1047

<212> DNA

<213> 人工序列

<220>

<223> 基因编辑同源性臂池_1_b3748_右

<400> 9

caacctcgaa acgttttaca tggtgattaa ccatgaaaac aaaaacgccc ccttatgaag 60

aaaggaggcg tctggcgtta gatttcgacc tgagtaccca gttcgataac cctgtttggc 120

gggatttcaa attgatctgg tgcacgcagc gcattacgtt gcagcagcaa gtacagcttg 180

ccgcgcagac gcaaatacca cgggcgtttg ccgaggatca acgactcatg cgacataaag 240

aaggaggttt ccatcatccg gcaacttaat ccttccagac cgcagcggtg gaaaacttct 300

tctacgtttg gcgtttctcg ccaaccataa cttgccacca cgcgccagaa agtgggcgac 360

agttgttcaa tctgtacccg acggacgtta tggacatatg gagcgtcttc ggtgcgcaga 420

gttaacagaa tcacccgctc atgcaatacc ttgttatgtt taaggttatg catcagcgca 480

aagggaatga cgttgattgc acgcgacata tacaccgcgg tcccgggcac gcgaacaggc 540

ggtgatttct ccagcgaagc aatcatcgct tccagagagt taccatgttc atgcatccgc 600

cgcagcaagc ggaaacgctc gctcttccag gtggtcatca cgataaacat cacagtaccg 660

aggctcaatg gcaaccagcc gccggagagc agtttatcga ggttagcggt gaacaatgga 720

atatcgacac aaaggaaagc aatcaggatc agcgcaacaa aatacttatt ccagtgccag 780

ttctgacgtg ccacggtagt cgagagaata gacgtcagca ccatggttcc ggtcaccgca 840

atcccgtacg ccgccgccag gttgctggag tgctcaaagc tgacaatcac aatcacgacc 900

gcgacataga gcatccagtt cacaaacgga atatagattt gccctgactc catttcggag 960

gtgtgaataa tgcgcatcgg cgacaaatat cccagacgta ccgcctgacg cgtcaatgag 1020

aagacgccag agataaccgc ctgcgag 1047

<210> 10

<211> 1049

<212> DNA

<213> 人工序列

<220>

<223> 基因编辑同源性臂池_1_b0388_左

<400> 10

cgcttcgcca aagcagcgga aaatattcag cacatcagcg gtatcttctg gggttaccag 60

cgcgtttggc gttacggagg tcatcccggc attaaccagt gcgggagtgt tcggcatggc 120

gcggataatt ttccggtcat ggcccagcgc gcgggcaagc tggtcgagcg tgacacctgc 180

agcaatagaa acgaccagag agtctttatt caggctggag gtgatttcgc taagcacttt 240

aatcatgatg ccaggtttaa cggcagcaaa aatgatgtcg gcgatttgcg ccacttcttg 300

cgccgattct gcggcgttga tgccgaactg gtcatgcagg gcggcgactt tatccgggga 360

gggggtgtat acccagattt gccctggaag cacctgaccg ctggcaatca gaccgccgag 420

aatggctttt cccatattgc cgcagccaat aaaaccgatt ttcttttcca ttgcctcact 480

cctgccgtga aattcattgt tttgataatc gctggcagaa gcataaacag aactatgccg 540

gaaggcaaaa gcgcgacaca atagaggatt acccaacaaa ggatgacttt atgacaattt 600

gggtggatgc cgacgcgtgt cccaatgtaa ttaaagagat tttgtatcgc gcggcggaac 660

gtatgcagat gccgctggta ctggtagcaa accagagttt acgcgtgccg ccatcgcgat 720

ttattcgtac gctgcgcgtc gcggcaggtt tcgacgttgc cgataacgaa attgtccggc 780

agtgtgaagc gggcgatttg gtgatcaccg cagatatacc tttggctgct gaagccatcg 840

agaaaggcgc tgcggcgctt aatccgcgcg gcgaacgtta cacgccagcg accattcgtg 900

agcgcctgac gatgcgcgat tttatggata ccttacgtgc cagtgggatc cagaccggcg 960

gaccagatag cctttcacaa cgtgaccgcc aggcctttgc cgcggagctg gagaagtggt 1020

ggctggaagt gcaacgtagt cgtggctaa 1049

<210> 11

<211> 1046

<212> DNA

<213> 人工序列

<220>

<223> 基因编辑同源性臂池_1_b0388_右

<400> 11

atgacacaac ctctttttct gatcgggcct cggggctgtg gtaaaacaac ggtcggaatg 60

gcccttgccg attcgcttaa ccgtcggttt gtcgataccg atcagtggtt gcaatcacag 120

ctcaatatga cggtcgcgga gatcgtcgaa agggaagagt gggcgggatt tcgcgccaga 180

gaaacggcgg cgctggaagc ggtaactgcg ccatccaccg ttatcgctac aggcggcggc 240

attattctga cggaatttaa tcgtcacttc atgcaaaata acgggatcgt ggtttatttg 300

tgtgcgccag tatcagtcct ggttaaccga ctgcaagctg caccggaaga agatttacgg 360

ccaaccttaa cgggaaaacc gctgagcgaa gaagttcagg aagtgctgga agaacgcgat 420

gcgctatatc gcgaagttgc gcatattatc atcgacgcaa caaacgaacc cagccaggtg 480

atttctgaaa ttcgcagcgc cctggcacag acgatcaatt gttgattttc gagcgcctat 540

acttaacgtt catcccgtga aataaggaag aacgatgcca acgaaaccgc cttatcctcg 600

tgaagcatat atagtgacga ttgaaaaagg aaagccagga cagacggtaa cctggtacca 660

actcagagcc gatcatccta aaccagactc gttgatcagt gaacatccga ccgctcagga 720

agcgatggat gcgaaaaaac gctatgagga ccctgacaaa gagtgaccgc atcagactgc 780

tcggaaggga ttctgagtgc cactacaagg gatctgcgtc acatttttca taattcatgt 840

ttttctaata attagaatat taaacaataa caatccatta ctggaatcat ttggaatctt 900

tacattatgc cgtgcacgtc tgctgctacg ctttttgtca tttgtagcac aagtaagtgt 960

cagcagtggt gcttcacact tgcccggtaa ttaacgacga aagaaaagta aggtggatga 1020

acaatgagtg cgtcgttggc gatcct 1046

<210> 12

<211> 1050

<212> DNA

<213> 人工序列

<220>

<223> 基因编辑同源性臂池_1_b4348_左

<400> 12

gcagttcatc attgcatttc gtgctgaggg ggatgaaaaa aatatttcga tatattctgg 60

taaagcatct ttggttaatc gagctcgaat aagtttatca ggatatagca aattttgatg 120

ttgtaatttt ttcaataacc cacaaacacc aacaaattct aaacttccgt tatagcgagt 180

aaataaaaga tctccatctt gtaatttgtg gcggtttagt tcactttctg aacattctag 240

aaaccgaata tcgttttgat ctacatggcc agcacgtaca gaactaatgc gtagtattgg 300

atgaccaaca ccactttcat ttggctttga tgaaagacca ttacgtaatt cagttaagat 360

agattcaaaa tttaacttct taaatacaga atgttgcggc tcaaaattac gccatttttc 420

tgtcaatttt ccattaactg cgccccccaa taccgcttga cgaaaacgtt tcaggatttg 480

tgggatttgc tcaaaacgtg ctttggtgct gtctacctgc gccagcagcg tatcgagttt 540

ttcagcgatg attttttgtt cggcaagtgg tgggattggt atatttatca aatcaaagct 600

tgccggctta atattattaa tatttgcacc agcagaaagt gatgaaattt tgtttcgata 660

aagagaagat tttgtgaaat gagcaataaa accagaaaat ataagttttt caggacgtaa 720

tacaccgcaa aatgcgccga aactacattc aaatggtaga tgctgatgtg cggatttacc 780

aactacggat ttgctccctg atgacattgc aataacaata tcttcaggag atattttttg 840

actttcttta acaagatttt taggaacaaa aaccaagtcc gtagtatcaa acttgccatt 900

ctgaatattg ttcgcacgga taagaggcaa ataatcatct tttagataat ttattgcctg 960

ctctttttta tacgttactc ctcggattag agttgtgacc gtagatactg gggcgataac 1020

ccacccctcc ggcaatttcc ccgcactcat 1050

<210> 13

<211> 1050

<212> DNA

<213> 人工序列

<220>

<223> 基因编辑同源性臂池_1_b4348_右

<400> 13

tccttcaccc caccaaacgc ttcttccagc aactgacgct gcaaatcggc ctcatcgctc 60

gcccccagtt cacgcatcag cgcatccagt tcagacagcg cctgtaccag ttcgcccatc 120

gcttctgccg ctaatacatc cggctccggc aggctgtcgg catcaatact gtctttatct 180

ttcagccagg agatatccag cgaatcggat tttgcggtgc ggatccactc acggctgaac 240

ttgcgccagc ggctggtagc aagatgctgg tcggtgtttt tgttctcttc gctgtcggca 300

acttccgtct cttcggcgtt aaaactccat tcaccttcag tgcgcgggct taaaccgtgc 360

gggtcttcgc catacacgcg ctcaaacggc tgcaaatgct cgtcggtaaa cggtgtgcgc 420

ttgccgaaac tcggcatatt ggtacgcagg tcatacaccc acacatcatc ggtacagttc 480

ttatcctgat tcgggttcgc caccgtccct ttggtaaaga acagcacgtt ggtcttcacg 540

ccctgagcgt aaaaaatacc ggtcggcaga cgcagaatgg tgtgcagatg acacttatcc 600

atcaggtcac gacgaatgtc ggtgcctttg ccgccttcaa acagcacgtt atccggcacc 660

accaccgccg cacgaccgcc gggatgcagc gtttcgataa tatgctgcat aaagcacaac 720

tgtttgttgc tggtcgggtg aacaaaggtg cgggtaatgt tggtgcctgc ggcgctgcca 780

aacggcgggt tagtggcgac aatatgcgcc ttcggcaggt tttcaccgtc gctacccaga 840

gtgttgccca gacggattgc gccgccgtgg tcgaggttgc cttcaatatc gtgcagcagg 900

cagttcatca gtgccagacg acgggtgccg ggcaccagtt cgaggccgat aaacgcgcgg 960

tggatctgga aatcctgcgt gtcgccatca aggtcgtcca gatcattggt ttgcgactta 1020

acatagcggt cggcttcaat caaaaagccc 1050

<210> 14

<211> 1050

<212> DNA

<213> 人工序列

<220>

<223> 基因编辑同源性臂池_1_b1982_左

<400> 14

taagcgcatg ttaatgctga ccgtctggat gatgggcatc gcgacagcct tgattggtat 60

tcttccttca ttctcgacca ttgggtggtg ggcacctatt ttgctggtga cactgcgtgc 120

cattcaggga tttgcagtcg gcggcgaatg gggaggcgcg gcgttgcttt ccgttgaaag 180

tgcaccgaaa aataaaaaag ccttttacag tagcggtgta caagttggct acggtgtagg 240

tttactgctt tcaaccggac tggtttcatt gatcagtatg atgacgactg acgaacagtt 300

tttaagctgg ggctggcgca ttcctttcct gtttagcatc gtactggtac tgggagcatt 360

gtgggtgcgc aatggcatgg aggagtccgc ggaatttgaa caacagcaac attatcaagc 420

tgccgcgaaa aaacgcatcc cggttatcga agcgctgtta cgacatcccg gtgctttcct 480

gaagattatt gcgctacgac tgtgcgaatt gctgacgatg tacatcgtta ctgcctttgc 540

acttaattat tcaacccaga atatggggct accgcgcgaa cttttcctta atattggttt 600

gctggtaggt ggattaagct gcctgacaat tccctgtttt gcctggcttg ccgatcgttt 660

tggtcgccgt agggtttata tcacaggtac gttaatcgga acgttgagcg catttccttt 720

ctttatggcg cttgaagcac aatctatttt ctggatagtt ttcttctcca taatgctggc 780

aaacattgcg catgacatgg tggtgtgtgt gcaacaaccg atgtttaccg aaatgtttgg 840

tgccagttat cgctatagtg gcgctggagt cggttatcag gttgccagtg tggttggcgg 900

tggatttaca ccttttattg ccgctgcact catcacttac tttgccggga actggcatag 960

cgtcgccatt tatttgctgg ctggatgcct gatttccgca atgaccgctt tgttgatgaa 1020

agacagtcaa cgcgcttgat agcctggcga 1050

<210> 15

<211> 1050

<212> DNA

<213> 人工序列

<220>

<223> 基因编辑同源性臂池_1_b1982_右

<400> 15

atgaataata agggctccgg tctgacccca gctcaggcac tggataaact cgacgcgctg 60

tatgagcaat ctgtagtcgc attacgcaac gccattggca actatattac aagtggcgaa 120

ttacctgatg aaaacgcccg caaacaaggt ctttttgtct atccatcact gaccgtaacc 180

tgggacggta gcacaaccaa tccccccaaa acgcgcgcat ttggtcgctt tacccacgca 240

ggcagctaca ccaccacgat tactcgccct actctctttc gttcgtatct taatgaacaa 300

cttacgttgc tgtatcagga ttatggtgcg catatctcag tgcaaccctc gcagcatgaa 360

atcccttatc cttatgtcat cgatggctct gaattgacac ttgatcgctc aatgagcgct 420

gggttaactc gctacttccc gacaacagaa ctggcgcaaa ttggcgatga aactgcagac 480

ggcatttatc atccaactga attctccccg ctatcgcatt ttgatgcgcg ccgcgtcgat 540

ttttccctcg cacggttgcg ccattatacc ggtacgccag ttgaacattt tcagccgttc 600

gtcttgttta ccaactacac acgttatgtg gatgaattcg ttcgttgggg atgcagccag 660

atcctcgatc ctgatagtcc ctacattgcc ctttcttgtg ctggcgggaa ctggatcacc 720

gccgaaaccg aagcgccaga agaagccatt tccgaccttg catggaaaaa acatcagatg 780

ccagcatggc atttaattac cgccgatggt cagggtatta ctctggtgaa tattggcgtg 840

ggaccgtcaa atgctaaaac catctgcgat catctggcag tgctacgccc ggatgtctgg 900

ttgatgattg gtcactgtgg cggattacgt gaaagtcagg ccattggcga ttatgtactt 960

gcacacgctt atttacgcga tgaccacgtt cttgatgcgg ttctgccgcc cgatattcct 1020

attccgagca ttgctgaagt gcaacgtgcg 1050

<210> 16

<211> 1050

<212> DNA

<213> 人工序列

<220>

<223> 基因编辑同源性臂池_1_b4367_左

<400> 16

cgttaagccc gacggagaga gaaatattgc gctttatgtc gcgtggctac tcaatgacac 60

aaattgccga gcagcttaaa cgcaatatca aaacgatccg tgcacataaa tttaatgtga 120

tgtcgaaact gggcgtcagt tctgacgcag ggttgttgga ggccgcagat attctgttat 180

gtatgcggca ttgcgaaaca agtaatgtgt tgcatcccta ttaatccgca tgatgccggg 240

tttacttccc cggcagtgct ttcatttcag cgtacaatcg ccacattgct gcacatccgg 300

taagcgataa cgctggcagc aagtgcggcg caccagcagg ccgtcgcgca gtaccacggt 360

acgccagagt ggattatctt caccgttcgt gagcgttttc tcaaaaaaga gggcatggcg 420

cagcgattca acagtagcct cgccgagcag ttgcttcatc tcagtgagat accagttgat 480

caaataaccg gtattactcc agataagttt gccgttgatc tctccggtcg cttctagtgc 540

ttgcacaacc ggaaccagcg cctggctgat taacgtttcc attcgatgct gcggcgaatg 600

tggtgttgcg tttttatctt cacacacatc gacccagaaa caggcgacgc gtccggtttc 660

gtgaaactca gcatggaaat gttccggcga cacatctaat gccttttcct gcgtcagtag 720

cgccagcatt aatggtggca ccatcaggcc gatataccat tgtgcccata gtgagatcag 780

cggtttgttc tcgcggatca tcatcggttg gttgcgatag atatgatcgg aatagaccgc 840

cagcagagaa cttagcacat tcggtgatga ccattgcgcc agcgtcatgg cgttaagtgg 900

ggcaggttca tccaggcgga taaactccag caaatgttca cgatgttttg cgatcgtcgc 960

ccgcacggct tgcgcaagcg tgggatcctg cggctggaga tgcgttcgcc agatgacatc 1020

ttcatagagc ggtgcggaac gataggccat 1050

<210> 17

<211> 1050

<212> DNA

<213> 人工序列

<220>

<223> 基因编辑同源性臂池_1_b4367_右

<400> 17

aatcgggata gtaatctaaa tgataatgat tgctaatcat agcgataggt ttacccgata 60

gcaagggatt tatctggctt gcaaatgata aaaattatca tatgatattg gttatcatta 120

tcaatgaaag agatgaaatc atgttgcaac gtacgctggg cagtggctgg ggagtgttgc 180

tgccgggatt gctgattgca gggctgatgt atgcggattt atcgtcagat cagtggcgga 240

ttgtcattct gatgggatta gtattgacgc cgatgatgct gtatcacaaa cagttgcggc 300

attacatttt gctaccatcg tgcctggcac ttattgctgg catcatgctg atgataatga 360

atttgaatca gggatgaaaa atcaaggaag aaacaagaaa ggaagtaaag ataattggtg 420

cgaggggggg gacttgaacc cccacgtccg taaggacact aacacctgaa gctagcgcgt 480

ctaccaattc cgccaccttc gcacagtcat cttacttttt ttgatatcgc ctcgtttggt 540

gcgagggggg ggacttgaac ccccacgtcc gtaagaacac taacacctga agctagcgcg 600

tctaccaatt ccgccacctt cgcccagtgc gagcaatatc aacgtggttt ttggtgcgag 660

gggggggact tgaaccccca cgtccgtaag gacactaaca cctgaagcta gcgcgtctac 720

caattccgcc accttcgcat accatcaatt cttaaaaaga attgctacca cggaggcgca 780

ttctagtggt tttcagcttt tcgtcaatag ttaattatcg acagaggtgt aattgctgga 840

aaaatgtcca tcaggaaact agcgtgcagg tttggtatgc atgcgggggc agatgccaga 900

tgcgacgctg gcgcgtctta tctggcctac gaagggctaa cgtgcaggtt ttgtaggtcg 960

gataaggcgt tcacgccgca tccgacacgg tattcggcga gataattaac ctttcttcgc 1020

ctggcgggtc ataatggcgc gatacacctt 1050

<210> 18

<211> 1050

<212> DNA

<213> 人工序列

<220>

<223> 基因编辑同源性臂池_1_b2285_左

<400> 18

ctgtttcttc cccgcagatg tagcgccctg ccccggtatg gacgaacagt tcgaaatcga 60

aacctgttcc cataatgttt ttgccaagca gacccgcttc ggtggcttcg gcaatggcac 120

ggcgcagatt aactgccgct tcgatatatt cgccacgcag gaagatgtag ccacggtaag 180

ctttcagcgc aaacgcggag atgagcatac cttccaccag caggtgcggc agttgctcca 240

tcaacaggcg gtctttatag gtgcccggct ccatttcatc ggcattacac agcaggtaac 300

ggatgttcat ggattcgtct ttcggcatca ggctccattt caggccagtc gagaagcccg 360

cgccgccgcg ccctttcaga ccagcgtctt ttacctgatt aacgatttcg tccggagaca 420

gcccggtcag cgccttacgc gcgccttcgt aaccgttttt gctgcggtat tcgtccagcc 480

acactggctg tttgtcatcg cgcagacgcc aggtcagcgg atgcgtttcg ggagtacgga 540

taatgttttt catttatacc gctccagcag ttcagggatc gcttccgggg tcagatgcgc 600

gtgagtgtcc tcatcgatca tcatgtttgg ccctttatca cagttcccca ggcagcaagt 660

tggcagcagc gtaaagcggc catcaaatgt cgtttgccct ggtttgatgt tcagcttttt 720

ctcgagcgcc gcctgaatac cctgataacc gttgatatga cagaccacgc tgtcacaata 780

acggatcaca tggcgaccaa ccggctggcg gaagatctga ctgtagaacg ttgccacacc 840

ttcgacgtcg cttgccggaa tacccagcac atcggcgatc gcgtggatcg caccatccgg 900

cacccagcca cgctgcttct gaacgatttt cagcgcttca atggacgccg cacgcgggtc 960

ttcgtagtgg tgcatctcgt gctcgatcgc ttcacgctct gccgcactca gctcaaaagc 1020

ctcggtttgt ggttgttgat tctcgtgcat 1050

<210> 19

<211> 1050

<212> DNA

<213> 人工序列

<220>

<223> 基因编辑同源性臂池_1_b2285_右

<400> 19

aattagcggt ccacatctga cataacaaaa tcgatactgc ccagataaac aatcaggtca 60

gacaccaggc tgccgcggat cgccgccgga atttgctgca aatgcgcaaa gctcggggta 120

cgaacacggg tgcggtaact catggtgctg ccgtcgctgg tcaggtagta actgttgatc 180

cctttggtcg cctcaatcat ctggaaagat tcattggcag gcatcaccgg accccacgac 240

acttgcagga agtgggtgat cagggtttcg atatgttgca gcgtgcgctc tttcggcggc 300

ggcgtggtca gcgggtgatc cgctttgaac gggccttccg gcatgttgtt gaggcactgc 360

tcaagaatgc gcagactctg gcgcagctct tccactttaa gcattacgcg ggtgtagcag 420

tcagaaacgc caccacccac cgggatttca aagtcgaagt tttcatagcc agaataagga 480

cgcgccttac gcacgtcgaa gtcgatcccg gtagcacgca ggcccgcgcc agtggtgccc 540

cactccagcg cctctttcgc gccataggcg gcaacgccct gggaacgacc tttcagaatg 600

gtgttttgca gcgccgcttt ctcgtaagac gccagacgtt tcggcatcca gtcgaggaac 660

tcacgcagca ggcgatccca gccgcgcggc aggtcgtgcg ctacgccgcc aatacggaac 720

cacgccgggt gcatacggaa accagtgatt gcttccacca gatcgtaaat tttctgacga 780

tcggtaaagg cgaagaacac tggcgtcatt gcgccgacgt cctgaataaa ggtcgagata 840

tacagcaggt gactgttgat gcggaacagt tcggagagca taacgcgaat gacgttaacg 900

cgatccggca cggtgatccc ggccagtttc tctaccgcca gcacgtaagg catttcgtta 960

acgcagccgc cgaggtattc gatacggtca gtatacggaa tgtagctgtg ccaggactgg 1020

cgttcgccca ttttctccgc accacggtgg 1050

<210> 20

<211> 1025

<212> DNA

<213> 人工序列

<220>

<223> 基因编辑同源性臂池_1_b2405_左

<400> 20

gagcgaagcg agtcatcctg cacgacccac caatgtaaaa aagcgcccta aaggcgcttt 60

tttgctatct gcgatttgcg aaattgcctg atgcgcttca cttagcagac tactatttcc 120

ggcaattcct gtctcctcac ctactgtgtc aatgcagcca acagcttaac catcgcgggc 180

gtcacctgct gtgtttcata aacaatatat aaatctgcag ggatgcgctg tttgagcgga 240

cggaaaatga cacctggcca gttcatttgt gcgtagctgt ccgctatcaa tgtgatacca 300

atgcccatac tgaccatagc gagtaccgtt tgcggttcat taacttcgcg aataacaacc 360

ggtgaaaatc ccacctgctg gcaaactcgc tgcaaaaaat cccagtcagt gtaaacgggc 420

ggcattgtaa caaaatactc gtcacgtagc gcttccagcg ggacggtgga aaatgatgag 480

agatgatgct cttcaggcat cgccaccaga aacgccgatt catgcaaccg taagctggta 540

aaaccagtcg gtggttctgt cgccattcgc cagatcccgg catcaagttc gcggcgttcc 600

agcaaggcca tttgcatcgc gggcatcttt tcgcgaaaaa gaacgtcaac gttaggattt 660

tccctgagga atcgccgcat aaccgggcgc atccgtcccc acattgccgt tcccactacg 720

ccgagttcaa tccgccctgc ttctccccga cctatttgtt caatccgagc caatacatta 780

ttagcattca ccagcaatcg acgcgattct tccatcaaga ttttgcccgc gtgtgtcagt 840

acgacgctgc gcgaatggcg aataaaaagc tgcgtgccga gttgattttc cagctcttta 900

atatgaatgc tgagcggagg ctgagacata tttaaacgcg ctgctgcgcg gccaaaatgc 960

aactcttccg ctacggcaag aaaataacgg agcaacttaa gatctgttct gtatacgcgt 1020

tccat 1025

<210> 21

<211> 1050

<212> DNA

<213> 人工序列

<220>

<223> 基因编辑同源性臂池_1_b2405_右

<400> 21

aacaaagcac caataccaaa accaacgccg gaagaaaata aaatatcttt cactaattaa 60

cctttatcat aaaagcagct ctgaagagca gagccgcgaa tccttttaat gagtcaccgc 120

tcgatgcttt atcttttcag ggtcatgatt atatttaaac ccaaagaaaa atatcactgc 180

gagaaaaaga gcatatcctg caaacaccag ccagatagtt tgccagtctt ttacgccatc 240

caccgaaaag taatctactg ccatgccact cagaatcgag ccaacccatg cgccgacacc 300

atttaccatg gtcataaaga gcccctgcgc gctggcacga atgctggaat caacttcctg 360

ttcgacaaat accgaaccag aaatattgaa gaaatcgaat gcacagccat aaacaatcat 420

cgacagcagc agcaaaataa atccggttgt tgacggatcg ccataggcga agaagccaaa 480

gcgcagcgtc caggccacca tactcatcag catgacggtt ttaatgccaa atcgctttaa 540

aaagaatggg atagtcagta taaagcccac ttctgccatc tgtgaaactg acagtaaaat 600

ggagggatat ttcaccacaa aactgtcagc aaactccggg ttacgggcga aatcatgtag 660

gaacggatta ccaaaaacgt tggtaatttg cagtaccgca cccagcatca tggcaaagag 720

gaaaaagatg gccatgcgtg gatttttaaa cagcacgaag gcatccagac ccagcttgct 780

ggcaagcgat gtggtcgctt ttttctccgc aaccggaatc ttcggcaaag tcagcgcata 840

agccgacagc agcaatgacg caccggacgc gatatacagc tgcagactac tcaattccag 900

atgcagcagg cttactgccc acatcgcgac aatgaacccc accgtaccaa aaacgcgaat 960

gggcgggaaa gcggtcaccg ggtcaagccc tgcctgggca agacaggaat aagagacgct 1020

gttcgataac gcaatagtcg gcataaacgc 1050

<210> 22

<211> 1050

<212> DNA

<213> 人工序列

<220>

<223> 基因编辑同源性臂池_1_b0495_左

<400> 22

cgacccggcg tggagattaa tcccatcacc gatgatgtca tcacaatacg cccttcaccg 60

tgcggtaaca tcgcgggtaa caggcgcatg gtgagctggt gtgcgccgaa aaagttggcg 120

gaaaactgct gttccatctg cgcacggctg atggtggaaa gggggccata catgccgaat 180

ccggcattgt taaagatccc atacagacaa ttatcggtca gggcgatcac ctcgtcggct 240

gcgcgatcaa cactttctgg tgaatccaga tcgatcaaca cgccggtaaa tcccatgctg 300

ttcatgcgct caacatcatc cggtttccgg caacctgcca gcacatgaaa accctggcgt 360

tttaattcga gcgcgctttc caggccaatt ccactggaac atccggtaat taagaccgat 420

ttttgcataa ctttacctgt caggatctcc gttgctttat gagtcatgat ttactaaagg 480

ctgcaactgc ttcgccatcc agtcggcaat aaacggctgg gcgtcgcggt tgggatgaat 540

accgtcatcc tgcatccatt gtggcttgag gtagacctct tccataaaaa agggcagcag 600

cggaacatca aactctttgg cgagtttggg gtaaatggcg ctaaaggctt cattataacg 660

gcgaccatag tttgcaggca gacgtatttg cattaacaat ggttcagcgt tggcggcttt 720

gacatcctgc aaaatctggc gcagcgtttg ctcggtttgc tgtggctgaa aaccacgcaa 780

accgtcattg ccgcccagtt caaccagcac ccaacgcggc tgatgctgtt tcagcagagc 840

cggaaggcgc gccagtcctt gttgcgaggt gtcgccgctg atgctggcat taactaccga 900

cgttttactc tgccacttat cattcaacaa ggcaggccag gccgcgctgg cagacattcg 960

atacccggcg ctcaggctat cacccagaat caataacgtg tccgctgcgg cggcacggaa 1020

ggttaacagg accaggaaca ggaagggcaa 1050

<210> 23

<211> 1046

<212> DNA

<213> 人工序列

<220>

<223> 基因编辑同源性臂池_1_b0495_右

<400> 23

atgccagcgg aaaacattgt tgaagttcat catcttaaga agtccgtcgg tcagggggag 60

catgaactct ccatcctcac cggagttgag ctggttgtca aacgtggcga gaccatcgca 120

ctggtgggcg agtcgggatc gggtaagtca accttgctgg cgatcctcgc cgggcttgat 180

gacggcagca gtggcgaagt gagtctggtg ggacaaccgc tacataatat ggacgaagaa 240

gcgcgggcaa agttgcgcgc gaagcacgtc ggctttgttt ttcagtcatt tatgttaatt 300

cctaccctta acgcgctgga aaacgtcgag cttccggctc tgctgcgcgg tgagagtagc 360

gcggaaagtc gtaacggggc gaaagcgttg ctcgaacagt tagggctggg taaacgtctg 420

gatcatcttc cggcacagct ttccggcggt gaacagcaac gagtggcgct ggcacgagcc 480

tttaatggtc gacctgatgt gctgtttgcc gacgaaccca ccggcaacct tgaccgccag 540

acgggcgata aaattgccga cctgctgttt tccctcaacc gtgaacatgg caccacgttg 600

attatggtga cccacgacct gcaactggcg gcacgctgcg accgctgctt acggctggtg 660

aacgggcagt tgcaggagga agcatgattg cacgttggtt ctggcgcgaa tggcgttcgc 720

cgtcgctatt aattgtctgg ctggcgctaa gcctggcggt ggcctgcgtg ctggcgctgg 780

gcaatatcag cgatcgcatg gagaagggct taagccagca aagccgtgag tttatggcgg 840

gcgatcgggc gttgcgcagt tcacgcgaag tgccgcaagc gtggctggag gaagcgcaaa 900

agcgcggcct gaaagtcggc aagcagctga ctttcgccac aatgaccttt gcaggcgaca 960

caccgcagct ggcgaacgtc aaagcggtgg atgatatcta cccgatgtat ggcgatctgc 1020

aaactaatcc ccctggcctg aaaccg 1046

<210> 24

<211> 1050

<212> DNA

<213> 人工序列

<220>

<223> 基因编辑同源性臂池_1_b1646_左

<400> 24

aaaatcgttg gcgtcgcgtt ggcgtggtta gcgttcgcca ttctgcgtcc aggatcggat 60

gctcgtaaaa gccgccgcca tattcgcgcg ctgcgccggg attttgtcga tcagctaagc 120

cgccatccaa cactgagtga aagcgaattt gaatcgctca cttatcatca cgtcagtcag 180

ttgagtaaca gccaggatgc gctggctcgc cgttggttat tacgctgggg tgtagtgctg 240

ctgaactgtt ctcatgttgt ctggcaattg cgcgactggg aatcgcgttc cgatccgtta 300

tcgcgagtac gggataactg tatttcactg ttgcggggag tgatgagtga gcgtggcgtt 360

cagcaaaaat cactggcggc cacacttgaa gaattacagc ggatttgcga cagccttgcc 420

cgtcatcatc aacctgccgc ccgtgagctg gcggcaattg tctggcggct gtactgctcg 480

ctttcgcaac ttgagcaagc accaccgcaa ggtacgctgg cctcttaatt acttaattac 540

accacaggca tagcgttcac cgccaccgcc cagcggttta ggttgatcgg acatattatc 600

gccgccaacg tggaccatca gcgctttgtc tttgatttca tccagtgatt tcagacgagg 660

cgcgatgacg gcatcggtag ctttgccgtc attattgacg accagtgcag gcagatcgcc 720

taaatgcccg gcaccttctg gcccttcatg tttaccggta ttttgtggat caagatgccc 780

gcctgcggat tccgcggcgc tggctttgcc atctttggtg gctggctggc agcttccttt 840

ggcatgaata tggaagccat gttcaccggg gggtaatgct ttcagatcgg gcgaaaactc 900

cagaccttta tcggtttcag taatggtgac gctaccaatt gactgcccta ccccttgcga 960

cgtgacgagg ttcatctcga ctttttcact ggcagcttgt gcgccggttg caacaaccag 1020

cgccagaata gccagactaa aacgtttcat 1050

<210> 25

<211> 1050

<212> DNA

<213> 人工序列

<220>

<223> 基因编辑同源性臂池_1_b1646_右

<400> 25

ttacggtacg tcgtacccca gtgccgcttt acggatacga aaccattgtt gacgggtcat 60

tttcagtgtt tctgcttcga cagctgcccg tacgcgctca attttacctg aaccgataat 120

tggcagcggc tgcgatggta aacgtaatac ccaggcgtaa accacctgtt caatcgagcc 180

cgcgtttaac tcctctgcca ccacagccag ttcatcacgc agcggctgga aataatcatc 240

attaaacaga cgaccaccac caaggcagga ccacgccatc ggacgaacac gcagttgttg 300

tagttggtcg agcgtgccat ccagcagtaa cggctgatgc accggggata tttccacctg 360

attagtggca agggtaaacg gcagacgtga ttgcaacagg gcaaattgcg caggcgtaaa 420

gttcgatacg ccaaaatgac gcactttgcc gctctgatgc agatgtttga acgcgtccgc 480

cacttcatcg gcatccatta acgggtctgg tcggtggatt aacagcaaat ccagatgatc 540

ggtcgcgaga ttaattagcg actgttcggc gctcttaatg atgtgatcgc ggtcagtgat 600

gtaatgacca atgacgtttt cttcacgcgc ggtcgtcgcg ataccgcatt tactgacgat 660

ttccatccgt tcacgcaggt gaggtgccag tttcagtgcc tcgccaaacg ccgcttcgca 720

ctgatagcca ccataaatat cagcatggtc cacggtggtc acgccgagat ccagatgctc 780

ttcaataaaa ctgaccagct ggcgggcgga catattccag tccatcaatc gccagtagcc 840

catcacaaaa cgggaaaact ccgggccttg cggcgcaata gtaatacgct gaaccataat 900

cgcttcctct tatcagatat gagaggagta tacgcaagat taggttcaaa agagtgatgg 960

ttgctccggt tcgtctgatg acgctggctt atttgcgcgt aatttgcgca ttaatcgctg 1020

ccgacaaagg cgcagcacct cttgtttttc 1050

<210> 26

<211> 1050

<212> DNA

<213> 人工序列

<220>

<223> 基因编辑同源性臂池_1_b3189_左

<400> 26

attgctttcg atttcggcgt gcgcgcccat acggctcagc tctggcacat gcataaagcg 60

gttttcaaag accgtttcgg tgataaaccc ggtcccttct gccaccaggt tcaacagcgt 120

gaactgggcc tgcatatcgg tcgggaatgc cggatgcggc gcggtacgta cgttaacagc 180

cttcggacgt ttgccatgca tatccaggct aatccagtct tcgccgactt cgatgtccgc 240

tccagcgtca cgcagtttcg ccagcacggc gtcgagagta tctggctgcg cgttacggca 300

gataattttg ccgcgagaaa tcgccgccgc caccaggaaa gtaccggttt cgatacgatc 360

cggcagaacg cgatagacac cgccgcctaa acgttccaca ccttcgatga cgatacgatc 420

ggtgccctga ccgctaattt tcgcacccag cgtaatcagg aagttcgcgg tatcgacgat 480

ttccggttca cgcgctgcgt tttcaataat cgtggtgcct tccgccaggg ttgcagcaca 540

catgatggtc accgttgcgc caacgctgac tttatccatc acgatatgtg cacctttcaa 600

acgaccatcg acggaagctt taacgtaacc ttcttccagt ttgatggtcg cgcctaattg 660

ttcgaggcca gaaatgtgta gatcaaccgg acgcgcaccg atcgtacaac cgccaggtag 720

tgaaacttgc ccctgaccaa agcgcgctac cagcggcccc agcgcccaga tagaagcacg 780

catggtttta accagatcgt aaggtgcgca gaatacatta acgtcgcggg catcaatatg 840

cacagaacca ttacgttcta ctttcgcacc cagctggctt agcagcttca ttgatgtatc 900

gacgtctttc agtttcggga cgttctggat ctctaccggt tcttccgcca gtagtgcggc 960

aaaaaggata ggcagagcag catttttagc gccggaaatt gtgacttcgc cctggagctt 1020

cgttggcccc tgaacacgaa atttatccat 1050

<210> 27

<211> 1050

<212> DNA

<213> 人工序列

<220>

<223> 基因编辑同源性臂池_1_b3189_右

<400> 27

ttagtttgtt ctcagttaac aattcatatc cgctaccggc gaatcgccca tagctcaaaa 60

gccgttcagt ttgcgatcgc gcgcccactc cgcaggggta tacgctttga tcgacacagc 120

atgaatgcgg ttatccgcaa tatattccat cagcggacca tagaccgtct gctgtttttt 180

aacccgactc atgccgtcaa acaactcacc cacggcaata acctgaaagt ggctgccatc 240

gccggaaacg tggacttcct ggagggagag agcgttcatc aacacgctct gaatttcatt 300

attttccatg ggatcttcaa tcatcagtta ataaaccagc gaaacatctt agagcaaagt 360

tgcgctggca taaataagca aaaagcctcg ctgataaatc agacaaggct cgacttgcag 420

gcaggtttgc cggacaggcg gttaacgcca tatccggcct gaaaaaattt aacgaggcag 480

aacatcagca ggcaaattat acaatttcgc cagggtatac actttgtcgt ttaccccctg 540

aagcgtcaca ttgttgccct gctttttcgc cagatcgata agatggagca gcagtgccag 600

tccccccgta tccacgcggg agacacggct aagatcgatg caggtaatcc ccttcaccgc 660

ttcctcacgc atttcccaaa gcggtagcaa aacgtcctga tccagctctc cggataacgc 720

cagcgtgtca cccgtctgca tccagctcag tgactcgctc attatttttt ctcttccaga 780

gtgattttct gttgagaaat cgatttcagt tgcgcagtca ggccgtcgat acctttggta 840

cgcagcagcg ttccccactc gttttgtttg gtggtgatca tactgacgcc ttcagcaatc 900

atgtcgtaag cctgccaatt gcccgtctgg gagtttttac gccactggaa gtccagacgc 960

accggcggac ggccattcgg gtcaataatg gtaacgcgaa taggcacaat ggttttatcg 1020

cccagcggct gttctggcgc aatctgatag 1050

<210> 28

<211> 1048

<212> DNA

<213> 人工序列

<220>

<223> 基因编辑同源性臂池_2_b3125_左

<400> 28

gcgcaacctc gctggcagat aaactttctt tataagagtc tggggcgatt acgattttca 60

tacctatgcc tgttaccaca tgacgccgga gggcgtttct cttattcggc ctggattcca 120

ggcccggatt gcaatacgcc atccgggcac gacgtcatta acgagtaact tcgactttcg 180

ccagtttttc gtagtagcac gccagggcgc tatgatccgc cgttcctaaa ccatctgctc 240

gcagtgcctg catcatctcc ataaccgcag ctgtgagcgg cagttgtgcg ccgacgccgt 300

gagaagtatc cagcgcattc gccagatcct taatatgcag atcaatacgg aagcccggct 360

tgaagttgcg gtccatcacc atcggcgctt tggcatccag cacggtactg cccgccagtc 420

caccgcgaat tgcctgataa accaggtccg ggttaacgcc cgctttagtt gccagcgtta 480

acgcttctga catcgcggca atattcagcg ccacaatgac ctgatttgcc agtttggtga 540

cgttacctgc accgatttcc ccggtatgca ccacggaacc cgccatcgct ttcatcaaat 600

catagtattt gtcgaaaata gccttgtcgc cgcccaccat cactgacagc gtaccgtcga 660

tggctttcgg ttcaccgccg ctcaccggag catccagcat atcaatgcct ttcgctttca 720

gcgcttcgct gatttcacgg cttgccagcg gtgcgataga actcatatcg atcaataccg 780

tacctggctt cgcgccttca ataatgccat tctcacccag cgccacctct ttcacatgag 840

gggagtttgg cagcatggtt atgatgacgt cgcactgttc agcgatcgct ttagccgtag 900

acgctgtttc tgcacctgca gcaatcacgt cagcaatagc ttctgggtta cggtcagcaa 960

ccaccagcga gtaacctgct ttcagaaggt ttttactcat tggtttaccc ataatcccca 1020

ggccaataaa accaactttc atagtcat 1048

<210> 29

<211> 1050

<212> DNA

<213> 人工序列

<220>

<223> 基因编辑同源性臂池_2_b3125_右

<400> 29

atcaatcatc tctcttgttg cggtggtggt tattttttaa aggtatcagc cagtttctga 60

gtggcagagc ggaagacgcc gagatcgctg ccgacagcca caaacgtcgc gccccattcc 120

agataacgac gcgcatcggc ttcgaccggc gcgaggatac cgctgggttt gccgtgcgcg 180

ctggcacggt taaaaatgtg ctgaattgct ttttgtacat ccgggtgtga tgcattgccg 240

agatggccta atgccgcggc cagatcgctg gggccgacga agatgccgtc tacgccttcg 300

gtagcggcaa tggcatcgac gttatctacg ccctgctgac tttctatctg gaccagaata 360

gtgatgttct tgttcgactg agcgaaataa tccgccacgg tgccaaacat attggcgcgg 420

tgagaaacgg agacgccgcg aatgccttcc ggtgggtaac gggttgatgc caccgccagc 480

tctgcttcct cttttgtttc tacaaaagga atcaggaagt tatagaaacc gatatccaga 540

agacgcttaa taattaccgg ctcgttggtc ggcactcgca ctactggcgc gctggcgctg 600

cctttcaagg ccattaactg cggaataaac gtggagatat cgtttggcgc atgttcgcca 660

tccagcacca gccagtcaaa cccagccaaa ccaagaactt cagtgctaat cgggttagag 720

agtgctgacc agcaaccaat ttgtacctgt ttcgcagcca gtgcggcttt gaatttattc 780

gggaaaacat cgttattcat cgcttatacc tttgcttatt tctgcaattc catacgttta 840

atgtcgccaa ctacgaagag gtagcagacc atcgccatca gcgctgaaca tcccacgaaa 900

accagtgctg cattgaagga gtgcagttca cttaccaggt agccaatcac cagtggagtg 960

acaatggagg caacattgcc aaagacgtta aagacgccgc cgcagaggcc aacaatctct 1020

ttcggcgcgg tgtcagaaat caccggccag 1050

<210> 30

<211> 1050

<212> DNA

<213> 人工序列

<220>

<223> 基因编辑同源性臂池_2_b3787_左

<400> 30

ggcgatcagt tcagcgattt ccatcgccgg gctttcgcgc aggtcatcaa tattcggttt 60

aaacgccaga ccaaagcagg cgattttcag ttcactggcg cgtttatcgg tagccgccag 120

gcaatcagcc accgccgctt tcacctgatc gataacccag aacggtttgt gatcgttcac 180

ttcgcgcgcg gtacggataa gccgcgcctg ctgggggttc tgtgccacga taaaccacgg 240

atcaacagca atgcagtgac cgcccacgcc agggccaggc tgaagaatat taacgcgagg 300

gtgacgattc gccaggcgaa tcagttccca gacgttaatc ccctgatcgg cacaaatcag 360

cgacaattca ttagcaaaag cgatattcac atcgcggaag ctgttttcgg tgagcttaca 420

catttccgcc gtccgcgagt tagtgacgac acactcacct tcgaggaaaa ttttgtacag 480

ttcgctggcg cgggccgaac aaaccggcgt cataccacca atcacgcgat cgtttttaat 540

cagctcgacc attacctgtc ctggtaacac gcgttccggg cagtaagcaa tgttgacgtc 600

cgcctgctcg cccacctgct gcgggaaagt gagatccgga cgcatctctg ctaaccattc 660

tgccatcttc tcggttgacc ccaccggcga ggtggattca aggatcacca gcgcgccttt 720

tttcagcact ggcgcaatgg agcgagcagc cgattcaacg taggtcatat ctggctcatg 780

atcgccctta aacggcgtgg gtacagcaat cagccaggca tccgcttcaa ctggcgtcgt 840

gctcgctcgt aaaaaaccgc cttctacggc agtttttact acactcgcca aatcaggttc 900

gacgatatgg atttcgccac gattgatggt atcaaccgca tgttggttga tatcgacacc 960

aattacctgt ttttgccgtg aggcaaacgc tgctgccgtt ggcagcccga tataacccag 1020

tccgataaca gaaatggtcg caaaactcat 1050

<210> 31

<211> 1050

<212> DNA

<213> 人工序列

<220>

<223> 基因编辑同源性臂池_2_b3787_右

<400> 31

agtgatatcc gattattttt taacgcttcc agaatgcgag agcatgcctg accatcacca 60

tacgggttat gggcgcggct catagcttga tattcgtttt cgtcttttaa aagacgcgtc 120

acttcctcga caattcgctg cttatccgtg cctaccagac gcaccgtacc cgccgtcacc 180

gcttccggac gctcagtggt atcgcgcatc accagcacag gtttccccag cgaaggcgct 240

tcttcctgaa tgccgcctga gtcggtcaaa atcagccagg cgtggttcat cagccagaca 300

aacggtaaat actcctgggg atcgatcaga atgacatttt tcacatgccc cagaatgcga 360

ttgaccggtt ctctgacgtt cgggttgaga tgcaccggat agacaatctg gatgtcctgg 420

tgcgtggtgg cgatgtctgc cagcgcgtgg cagatttctt caaagccacg accgaaactc 480

tcacgcctgt gaccggtcac cagaatcatc tttttatcgg ggtcgataaa cgggtaattt 540

gccgccagtt ctgaacgcag cttgtcgctg ctcatcacct ggtcacgcac ccataacagt 600

gcatcaatga ctgtattacc ggtaatgaag attcggctat ccgcaacgtt ttcacgcagc 660

aagttttgcc gggaagtttc ggttggagag aagtgataca tcgccagatg cccggtcaat 720

gtacggttag cctcttccgg ccacggcgaa tagagatcgc ccgtgcgcag accagcctca 780

acgtgaccaa caggaatacg ctgataaaac gccgccaggc tggttgccag cgtcgtcgtc 840

gtatcgccgt gaaccagcac gacgtctggt ttgaactcgg caagaatagg ttttagccct 900

tccagaatcc gacaggttat ctctgtcagg ccctgtcctg gctgcattat gttgagatcg 960

tagtcaggta caatggaaaa gagtttcagc acctgatcga gcatctcccg atgctgcgca 1020

gtgacgcaaa ctttagcctc aaaaaaagga 1050

<210> 32

<211> 1050

<212> DNA

<213> 人工序列

<220>

<223> 基因编辑同源性臂池_2_b1948_左

<400> 32

aactggcgcg ataacctggt gcgccaggtg cagcattcac agctggagct ggtcgccaac 60

tttgccgata tctcgctacg cctgtcgcag attttaaaac tgaaccccgg cgacgtcctg 120

ccgatagaaa aacccgatcg catcatcgcc catgttgacg gcgtcccggt gctgaccagt 180

cagtatggca ccctcaacgg tcagtatgcg ttacggatag aacatttgat taacccgatt 240

ttaaattctc tgaacgagga acagcccaaa tgagtgacat gaataatccg gccgatgaca 300

acaacggcgc aatggacgat ctgtgggctg aagcgttgag cgaacaaaaa tcaaccagca 360

gcaaaagcgc tgccgagacg gtgttccagc aatttggcgg tggtgatgtc agcggaacgt 420

tgcaggatat cgacctgatt atggatattc cggtcaagct gaccgtcgag ctgggccgta 480

cgcggatgac catcaaagag ctgttgcgtc tgacgcaagg gtccgtcgtg gcgctggacg 540

gtctggcggg cgaaccactg gatattctga tcaacggtta tttaatcgcc cagggcgaag 600

tggtggtcgt tgccgataaa tatggcgtgc ggatcaccga tatcattact ccgtctgagc 660

gaatgcgccg cctgagccgt tagtgatgaa taaccacgct actgtgcaat cttccgcgcc 720

ggtttctgct gcgccactgc tgcaggtgag cggcgcactc atcgccatta ttgccctgat 780

cctcgctgct gcctggctgg taaaacggtt gggatttgcc cctaaacgca ctggcgttaa 840

cggtctgaaa attagcgcca gtgcttcact gggcgcgcgt gaaagggttg tggtggtcga 900

tgtggaagat gcacggctgg tgctcggcgt taccgcaggt caaatcaatc tgctgcataa 960

acttccccct tctgcaccaa cggaagagat accgcagacc gattttcagt cggtcatgaa 1020

aaatttgctt aagcgtagcg ggagatcctg 1050

<210> 33

<211> 1050

<212> DNA

<213> 人工序列

<220>

<223> 基因编辑同源性臂池_2_b1948_右

<400> 33

atgcgtcgtt tattgtctgt cgcacctgtc cttctctggc tgattacgcc cctcgccttc 60

gcgcaactgc cgggtatcac cagccagccg ctgcctggcg gtggacaaag ctggtcgctc 120

ccggtgcaga cgctggtgtt catcacctcg ttgacgttta ttccggcaat tttactgatg 180

atgaccagtt tcacccgcat catcattgtt tttggtttat tgcgtaacgc gctgggaaca 240

ccctccgcgc cacctaacca ggtattgctg gggctggcac tgtttttgac cttttttatt 300

atgtcaccgg tgatcgacaa aatttatgta gatgcgtacc agccattcag cgaagagaaa 360

atatcaatgc aggaggcgct ggaaaaaggg gcgcagccgc tgcgtgagtt tatgctgcgt 420

cagacccgtg aggcagattt agggttgttt gccagactgg cgaataccgg cccgttgcag 480

ggacctgaag ccgtgccgat gcgcattttg ctcccggcct acgtgaccag cgagttgaaa 540

accgcatttc agataggctt cacgattttc atcccttttt tgattatcga cctggtgata 600

gccagcgtgt tgatggcatt ggggatgatg atggttcccc cagccaccat tgctctgccc 660

tttaaactga tgctgtttgt actggtggat ggctggcaat tgctggtcgg ttcgctggcg 720

cagagctttt acagctagag aggcaaaatg acacctgaat cggtcatgat gatggggact 780

gaagcgatga aagtcgcgct ggcactggct gccccgctat tgttggtagc gttggtcacg 840

ggccttatca tcagtatttt gcaggccgcc acgcagatta acgaaatgac gctgtcgttt 900

attccgaaaa tcatcgccgt atttatcgcc attattattg ccggaccgtg gatgctcaat 960

ctgttgctgg attacgtccg caccttgttc actaacctgc cgtatatcat cgggtagccg 1020

tactatgttg caggtgacaa gcgaacaatg 1050

<210> 34

<211> 1050

<212> DNA

<213> 人工序列

<220>

<223> 基因编辑同源性臂池_2_b2790_左

<400> 34

ccacgggatc aaggccgata tctttggcca tttccgaacc ggcgatagag agcgtagcgc 60

ggtcgccgta gttgaaggat gtgacgataa acaacatcac cactatccag taacgagcat 120

ttgtgcgttt ttccacactg ctcgcagcct gacttaaaga actcattgtt gcactcctga 180

aaattcgcgt tagccacgct cactctggac tgcgacatcg ccaggaaatc agaggtgacg 240

tagggtgttt tttgccgttt ttataggtcg ttcgccgaat acggcgcgtg tttatatctg 300

gcaatagcag tataaaaagc gcgccatagc ggctcaccgt gcaacaacac aacattaatg 360

cgttcaatga ggcccgattt tggcattagc cctggacggt ggaatccact tcacggaaat 420

gaaaacaaga acaagaaagg aagggttaaa acgaagaaat aaagaagagt atgaaatgga 480

tcgcttgact ccaggcaaac gccagtaaaa atccgcgcta tgaagcagtt tttactggca 540

tttgcctgaa aagattcgat tcagcaccgc taaaacgaca tttaccgctc gctgaacata 600

tcaggacaac agcgtgcccc actgttcgac ccacggattt gattccgttt ccggttccgg 660

gttctcactg gcgtcaatca acagcatttc gccaacccgc tgagcgctct gttcctgcaa 720

caaggcatcg aactgtttgc cgccattgca gaaattcaca taactactgt cgccgagcgc 780

aatcacgcca taacgcagat tcggctggaa gcccagacta tctttgattc cctgaaagag 840

tggcacaatg ctatcaggaa ggtcgccctg cccggtcgtg gacgtaacca ccagaacata 900

cttatcctga tagggcagcc agtcgcttaa ttcaggatct tcaaataccg ttgctttgtg 960

gccctgcgcg gtcagaatcg cttccgcttc ttcggccact aacagtgaat tcccgtacat 1020

ggtgccgaca aaaataccaa tttccgccat 1050

<210> 35

<211> 1050

<212> DNA

<213> 人工序列

<220>

<223> 基因编辑同源性臂池_2_b2790_右

<400> 35

accgttttct ccctggatta ggaacttatc tctccatcct gacccgatgg cgcactgaac 60

tcaacccttt cattttcagg aagcagaccg cgccagccaa attgtgataa cgcctgcatc 120

caggtgtcgt ccaggcccgc gtgaatagtc agcggctcgc cagtaaaagg atgcgtcaat 180

gacaactgac tggcatgtag cattaaccgc tggaggccaa aatgctcagc accgctgcga 240

ttctggcgta aatcgccatg tttgctatcg ccaataatcg gatgacgcaa atgggcaaga 300

tgtcggcgaa gctgatgttt gcgtccggtt ttcggctcca gttccaccag gccgtagcgc 360

gtggtcgggt aacgtccggt cgctaccggc atttctacgg tcgccagacc gcgataatgc 420

gtcactgctg gctgcgggcc tttatcttcg cgggcaaatt tatcagcgat tttgtccagt 480

tcttccacca gtggataatc cagcaccgct tcttccatca accagccgcg cacaatcgca 540

tggtaacgtt tctggatttg gtgctgttca aactgttgtg ccagcagccg tccggcctcg 600

ctggataatc ccatcaacaa cacaccagaa gtgggtcggt ccagacgatg agcagtaaaa 660

acatgctggc ctatctggtc acgcacggtt tgcatgacca ctactttctc gtcgcgatcc 720

agccagctgc ggtgaaccag ccagccggag ggtttattta ccgcaaccag ccattcatcc 780

tgatagagta tttccagcat tagctcgcat catccgcaaa aagagcatcc agtttttcca 840

gctcagccag aataagcgcg cgttgcggat ggtccgtcgc cagcgccatt tcataatagg 900

gtgcaacggc aaaagcgccc ggtaacggct gtttgttatc taacaaatcg tgcattcgcg 960

ggatcagcac ccactgcaac cactccagtg gttccatggt gtccataaag aacggttggg 1020

tactattaaa ttgatgcggc tggggttcat 1050

<210> 36

<211> 1050

<212> DNA

<213> 人工序列

<220>

<223> 基因编辑同源性臂池_2_b3197_左

<400> 36

ttacggcttt ctgaaaatct tcagcggacc ggcgagtata cctgaagaaa ggacgttaga 60

tgcttttagc tacggcactg ttaattgttg gtttactttt ggtcgtttac agtgccgacc 120

gcctggtttt tgccgcgtct attctttgcc gaacctttgg catcccgccg ctgatcatcg 180

gcatgacggt ggtcagtatt ggtacatcgt taccagaagt catcgtctcg cttgccgcgt 240

ctctgcacga acaacgcgat ttagccgttg gtacagccct cggctcaaac attatcaata 300

tattgctgat cctcggtctg gctgcgctgg ttcgtccttt taccgtccat tctgatgttc 360

tacgccgtga attaccctta atgttgttgg tcagcgtggt ggccggttcc gtactctatg 420

acggacaact tagtcgcagc gatggtatct ttctcctctt tctggctgtg ctatggctgc 480

tgttcattgt taaacttgca cgtcaggctg aacgtcaggg gactgacagc ctgaccagag 540

agcagcttgc agagctgccg cgtgacggcg gattgcccgt cgcgttttta tggctcggca 600

ttgcgcttat catcatgcca gtggccacgc ggatggtggt tgataacgcc acggtgctgg 660

cgaattactt tgccatcagc gagttgacga tgggtctgac ggcaattgct atcggaacca 720

gcctgccgga actggcaacc gcaatagcgg gggttcgcaa aggtgaaaac gacattgctg 780

tcggaaatat cattggcgca aacattttta atattgtcat cgtgttgggt ttacccgcgc 840

tgataacgcc aggagagatt gatccactgg cgtacagtcg tgactacagc gtgatgttgc 900

tggtgagcat tatttttgcg ttgctgtgct ggcggcgctc cccgcaaccg ggccgtggtg 960

taggggtatt attaactggc ggatttatcg tatggctggc gatgttgtac tggttatcgc 1020

caatactcgt tgaataactg gaaacgcatt 1050

<210> 37

<211> 1043

<212> DNA

<213> 人工序列

<220>

<223> 基因编辑同源性臂池_2_b3197_右

<400> 37

atgtcgcacg tagagttaca accgggtttt gactttcagc aagcaggtaa agaagtcctg 60

gcgattgaac gtgaatgcct ggcggagctt gatcaataca tcaatcagaa tttcacgctt 120

gcctgtgaaa agatgttctg gtgtaaaggg aaagttgtcg tcatggggat gggaaaatcg 180

gggcatattg ggcgaaaaat ggcggcaacg tttgccagca ccggtacacc ttcatttttc 240

gtccatcctg gtgaagccgc gcatggtgat ttaggcatgg ttaccccaca ggatgtggtg 300

attgctatct ctaactctgg tgaatccagc gaaatcacgg ccttaattcc agtgcttaag 360

cgtcttcacg taccgttaat ctgcatcacc ggtcgcccgg agagcagcat ggcgcgcgcc 420

gcagatgtgc atctgtgtgt taaagtagcg aaagaagcct gtccgttagg gctggcaccg 480

accagcagca ccaccgccac gctggttatg ggcgatgccc tcgctgtcgc gctgttaaaa 540

gcacgcggct ttactgctga agattttgcg ctctcacacc caggcggcgc actgggtcgt 600

aaacttctgc tgcgcgtaaa cgatattatg catacgggcg atgagatccc gcatgttaag 660

aaaacggcca gtctgcgtga cgcgttgctg gaagttaccc gcaaaaatct tggtatgact 720

gtcatttgcg atgacaatat gatgattgaa ggcatcttta ccgacggtga tttacgccgt 780

gtcttcgata tgggcgtgga tgttcgtcag ttaagtattg ccgatgtgat gacgccgggg 840

ggaatacgtg tgcgccctgg cattctggcc gttgaggcac tgaacttaat gcagtcccgc 900

catatcacct ccgtgatggt tgccgatggc gaccatttac tcggtgtgtt acatatgcat 960

gatttactgc gtgcaggcgt agtgtaaaga ttcaaggata aacaacaatg agcaaagcag 1020

gtgcgtcgct tgcgacctgt tac 1043

<210> 38

<211> 1047

<212> DNA

<213> 人工序列

<220>

<223> 基因编辑同源性臂池_2_b3791_左

<400> 38

gcgctcgctc tctttggtgg tgtagcgatc ttcaccgtgg aactcaccaa agtgttcccc 60

cgcagggcaa ccgtgcagcg gaatgtaatg aaacaccgcc atgatttccg cttctttcag 120

aaagttaatc aacgcgctcc ggtcatcaat atcccgcagt ttaatgtaga acatatgcgc 180

gttctgcacg cagccatcgg gaatcgacgg cagctcgata cgcccggctt tcgccagagg 240

cgctaacgca tcgtagtagt tttgccacag cgccagacgt tgctggttga tacgatccgc 300

tgcttccagt tgcgcccaca ggtatgcagc ttgcagatcg gacatcaaat agctggagcc 360

aatatcgcgc caggtatatt tatcgacctg accacggaag aactggctgc ggttagtgcc 420

cttttcacgg atgatctcgg ctcgttcgat taacgcttta tcgttaatca gcgtcgcgcc 480

gccttcaccg cccgccgtgt agtttttggt ttcatggaag ctaaagcagc caatatgacc 540

aatggttccc agtgcacgcc ctttgtaagt ggacatcacg ccctgagcgg catcttctac 600

cacaaacaaa ttatgctttt tcgccaacgc cataatggtg tccatttcgc aggccacacc 660

cgcgtaatgg accggcacga taacgcgcgt tttgtcggtg atcgccgctt caatcagcgt 720

ttcgtcgatg ttcatggtgt ccgggcgaac atccacaaaa acgatttttg cgccacgcag 780

cacaaaggca ttggcggtgg agacaaaggt gtagctcggc atgatcactt catcgccagg 840

ctggatatcg agcagcagcg ccgccatctc cagcgaagcg gtgcaggacg gcgtcagtaa 900

cactttggcg ctgccaaaac gttgctccag ccactgctgg cagcgacggg taaaaccgcc 960

atcgccacac agtttgccgc tacccattgc cgactgcata tagtcgagtt cggttcccac 1020

caccggcggt gcgttaaatg gaatcat 1047

<210> 39

<211> 1048

<212> DNA

<213> 人工序列

<220>

<223> 基因编辑同源性臂池_2_b3791_右

<400> 39

gtgatcacct gtataaccag tacgcggtgc tttctacatt cgcaccactt tgtatgtatc 60

gtttaagcgc ggcggtgttg cccatttggg tcgccacccg caaagttgtt ttaccgcgag 120

catacgccca gtttagcgcc gtttgcatca gctcagcacc tgcaccgcgt ccagccagca 180

ggccaattcg cgcatctgtc gcattgagtt cccgtaaaga gacatagccg cgaatatcgc 240

cggacgccgc acgtaaaatc agacattgat gatcaaaggt gccgcgcacg gcattttcaa 300

tccactgtgc ataaaagcga ctgctggcgt caggcgcata ccacggcgca cgaaaacggc 360

tttgcgcaaa tgcggcgctg gctaactgac gtaatgcggg aatatcggtc tcttgtgcca 420

ctacagcacc gctatcactg gcattgttca cgggtagcgc caaatcaact tcaccttcta 480

ccagggagaa tcccagctgt tgcagggcat ccagttcacc cgtatttgat gccgcaattt 540

tggcctgcac ccgtgaccac ggcgctaacg cgtctggcgt caggagcggt gcttcagacg 600

taatgcgcac gatggcgctg ttaacaccaa agaaggcgtt ttcccaggtt agtggctcaa 660

tactggcgcg gacgggcacg aagtaactcc agcagatatt ggccgtagcc agttttcgct 720

aatgaactgg cagcacgctt cacaccctcg tcatcgagcc agccgttacg ccaggcaatc 780

tcttccaggc aggcaatctt aaagccctgg cgtttttcca ccgtctgtac aaaggtgctg 840

gcttcaatca ggctgtcgtg agtgccggta tccagccagg caaatccgcg cccgagcagt 900

tcaacggtca ggttgcccgc ctcgaggtac atctggttga tggaggtaat ctccagttca 960

ccacgctccg acggcttcac ctgctttgcg tactccacga ctttactgtc gtagaaataa 1020

agcccggtca ccgcccagtt tgacttcg 1048

<210> 40

<211> 1050

<212> DNA

<213> 人工序列

<220>

<223> 基因编辑同源性臂池_2_b4260_右

<400> 40

gttcagcact tcaacggttt gaccggacat ggtggttaac acatcgcccg gacgataggc 60

tcgtccgcca ggcatgtttt cgcagcctgc caacacgccg ataacgttaa tcggcagttg 120

tagctccgcg accatccgca tcacgccgta aaccgctgcc gcaccgcaca tatcgtactt 180

catctcatcc atgccttctg aaggcttgat cgagataccg ccggagtcga aggttaaacc 240

tttacccacc agcacgattg ggcgtgcatc ttccgacgcg ttgcctttgt actcaatcac 300

cgacatcagc gattcgtttt gcgaaccctg accgaccgcc agataggaat gcatccccag 360

ctctttcatc tgctgttcgc cgataacgcg ggtgatgaca ttcttgctgt agctgtcagc 420

cagctggcgc gcttgtgaag cgaggtaagc ggcgttacag atattcggcg gcatattgcc 480

gagatctttt gctgctttaa tcccggcggc aatcgccaga ccgtgctgga tcgcgcgctc 540

accgctggtc agttcacggc gggtcggcac gttgaacacc atcttacgca gcggacgacg 600

cggttcgctc ttgttcgttt tcagctgatc gaaactgtag agcgtctctt ttgccgtctc 660

gacagcctga cgcactttcc agtagttgtt acggccttta acgtgcagct cagtcagaaa 720

gcagaccgct tccattgagc cagtatcatt cagcgtatta atggttttct gaataacctg 780

cttgtactga cgctcatcca gctcacgttc tttgccgcaa ccaataagga gaattcgctc 840

ggaaagtaca ttcggaacat ggtgcagcaa caatgtctgc cccggttttc cttccagttc 900

gccccgacgt agcagggcgc tgatgtaccc atcgctgatt ttatcgagct gttctgcaat 960

cggagaaagg cgacgtggtt cgaagacgcc cacgacgatg caggcactcc gctgtttctc 1020

cgggctaccg ctttttacac taaactccat 1050

<210> 41

<211> 1049

<212> DNA

<213> 人工序列

<220>

<223> 基因编辑同源性臂池_2_b4260_右

<400> 41

tttacgggcg tatttaaagt gataatcata agatatctgg tgcgggagac gctcaaaagc 60

cagctggcga tactcttcat cttgcttttg atcttcttct gtcaaaagtt agtgaggatc 120

ctcggcgcag cggttgacgg cgatattccg gcgaatctgg tgctctccct tctcgggttg 180

ggcgtgccgg aaatggcgca gcttatcctg ccattaagcc tgttcctcgg gctgctgatg 240

acgctgggca aactgtatac cgaaagtgaa attacggtaa tgcatgcctg cggcctgagc 300

aaagcggttc tggtgaaagc ggcaatgatc cttgcggtat tcacggcaat cgtagcggcg 360

gttaacgtga tgtgggcggg accgtggtca tcgcgtcatc aggatgaagt gttagcagaa 420

gcgaaagcga accctggcat ggcggcgctg gcgcaagggc aattccagca agcgactaat 480

ggcagctcgg tgctgttcat cgaaagcgtt gacggcagcg atttcaaaga tgtgttcctc 540

gcgcaaattc gaccaaaagg taatgcacgt ccttctgtgg tggtggccga ttccggacat 600

ttaacccagc tgcgcgacgg ctcccaggtc gtcactctca accagggaac gcgcttcgaa 660

ggcactgcat tgttacgtga tttccgcatt acggacttcc aggattatca ggcgatcatt 720

ggtcaccagg cggtggcgct cgacccgaac gataccgacc agatggacat gcgcacattg 780

tggaacactg acaccgatcg tgctcgcgca gaactgaact ggcgtatcac gttggtattc 840

accgtgttta tgatggcact tatggtcgta ccgctgagcg tggttaaccc acgtcaggga 900

cgcgtactgt cgatgctgcc agccatgctg ctgtatctac ttttcttcct gatccagacc 960

tccctgaaat cgaacggcgg taaaggtaag ctggacccga cgctgtggat gtggaccgtt 1020

aacctgattt atctggcttt agcgattgt 1049

<210> 42

<211> 1050

<212> DNA

<213> 人工序列

<220>

<223> 基因编辑同源性臂池_2_b0071_左

<400> 42

ggactggaaa taccagcaat gattctggct ggctactatg tcaaacgtta tggtaagcgg 60

cgaatgatgg tcatagcagt ggcggcagga gtactgtttt acaccggatt gattttcttt 120

aatagccgta tggcgttgat gacgctgcaa ctttttaacg ctgtatttat cggcattgtt 180

gcgggtattg ggatgctatg gtttcaggat ttaatgcctg gaagagcggg ggcagctacc 240

accttattta ctaacagtat ttctaccggg gtaattctgg ctggcgttat tcagggagca 300

attgcacaaa gttgggggca ctttgctgtc tactgggtaa ttgcggttat ttctgttgtc 360

gcattatttt taaccgcaaa ggttaaagac gtttgatgac gtggacgata gcggaaagcc 420

cggtcatttg accgggcaag gggattaatt cataaacgca ggttgttttg cttcataagc 480

ggcaatggcg tcgtcgtgct gcaaggtaag cccaatactg tccagaccgt tcatcatgca 540

gtggcggcgg aaggcatcga tggtaaagcg ataggttttc tctcccgctt tcacctcttg 600

cgcttccaga tccacgtcga aatggatccc cggattagct ttcaccagcg caaacagttc 660

gtccacttct gcatcgctta atttcaccgg cagcagctgg ttgttaaagc tattgccgta 720

gaagatgtca gcaaaactcg gcgcaatcac cactttaaaa ccgtagtcgg tcaatgccca 780

gggcgcgtgc tcacgcgaag agccacagcc gaagttttct cgtgccagca aaatggaagc 840

gccctgatac tgcgggaagt tcagcacgaa gtccgggttt ggctgttggc ctttttcatc 900

cagaaaacgc cagtcgttaa acagatgcgc gccaaaaccc gtacgggtca ctttctgcaa 960

aaactgtttc gggatgattg catcggtatc gacattggcg gcatccagcg gaaccaccag 1020

gcctgtgtgt ttgataaatt tctctgccat 1050

<210> 43

<211> 1050

<212> DNA

<213> 人工序列

<220>

<223> 基因编辑同源性臂池_2_b0071_右

<400> 43

ggtgtgctcc ttatttaatg ttgcgaatgt cggcgaaatg tccggtcaca gcagcagcgg 60

cagccattgc cgggctgacc agatgcgtgc gcccgccgcg cccctggcgg ccttcaaagt 120

tacggttgct ggtggaggca caacgttcgc ccggattcag acggtcgttg ttcatcgcca 180

gacacattga gcagccaggc aagcgccatt caaaaccggc ttcaataaag attttatcca 240

gaccttccgc ttccgcctgg gcttttaccg ggccagagcc gggaaccacc agtgcctgca 300

cgcctggcgc gacttttcgc cctttggcga tctccgctgc cgcgcgtaaa tcttcaatgc 360

gcgagttggt acaggaaccg ataaacactt tgtcgatagc cacttcggtc agcggaatac 420

ccggtttcag ccccatatag gccagcgctt tttctgccga cgcgcgttca accggatcgg 480

caaacgaagc cggatcggga atattgtcgt tcacggaaat cacctggccg ggattggtgc 540

cccaggtgac ctgcggtgaa atttcttctg cttgcagagt gacaacggta tcgaaagttg 600

cgccttcgtc ggtttgcagg gttttccagt aggcaacggc gtcgtcgaaa tctttgcctt 660

tcggcgcatg cagacggcct ttgacatagt taaaggtggt ttcgtccggt gcaaccagac 720

cggcttttgc gcccatttcg attgccatat tgcacagggt catacgacct tccatgctta 780

aatcacggat tgcttcgccg caaaactcca ccacatgccc ggtgccgcct gcgctaccgg 840

ttttaccgat aattgccagc acgatatctt ttgcggtaat gcccggcgcg gctttgccct 900

ggacttcaat tttcatggtt tttgcgcggc cctgtttcag ggtttgcgtt gccagtacgt 960

gttcaacttc ggaagtgccg ataccaaagg ccagtgcgcc aaacgcgccg tgggtggcgg 1020

tatgcgagtc gccgcagaca atggtcatcc 1050

<210> 44

<211> 1050

<212> DNA

<213> 人工序列

<220>

<223> 基因编辑同源性臂池_2_b1687_左

<400> 44

aatgttcagc ccgagcatct cttggtcagg cacatcggta atcaactcgc tgacggaatg 60

ccagacaata tcttcccgcg ccagattcag cacttttgag tccaccgtct ctaccgaaag 120

cgcccgcgcc tcaaccataa acggcgcgtt acgcagcgca gagtcaaaag agtcatattt 180

gacgttcacc agacggcgca ctttaggcaa gcgtgtaata tccagccgcg cttcggtaat 240

aaaggccagc gtcccttctg aacccgtcag aatgcgcgtc aggtcgaact cggtcatctc 300

atcgttaaag acatgacgca gatcgtaacc ggtaagaaag cggttaagtt tggggaagtt 360

gtcgataatt aactggcgtt gctgacggca acgttgataa accgtgttat aaattcgccc 420

gattgtggta ttggatttac ccagcgtttc cgccaattcg acgggtaaag gttgcgtatc 480

gagaatatcg ccccccaaca acaccgcgcg tacgccaagt acgtgatctg acgttttgcc 540

atagaccagc gatccctgac cggatgcatc ggtattgatc atcccaccga gcgttgcccg 600

gttgctggtc gaaagttccg gcgcaaaaaa gtagccgaac ggtttcaggt actgattgag 660

ttgatctttt atcaccccgg cctcaacgcg cacccagccc tcttcagggt taatttcgat 720

gatgcggttc atatggcggg acatatcaac aataatcccc tggttgagcg cctgaccgtt 780

agtgccggtg ccgccgccgc ggggggtaaa gatcagcgat gaatagcgtt cctgcgcggc 840

aagacgggcg atcagcgcca catctgcggt tgaacgcgga aataccaccg catcggggag 900

aagttggtaa atactgttgt cggtcgacat tgtcagacga tcggcataac ttgtcgccgt 960

atcgccggta aaaccttgtt gctccagctc ttgcaaaaaa ttaagcacca gttgaacgac 1020

gccgggtgcc tgggaaatct gtggaatcat 1050

<210> 45

<211> 979

<212> DNA

<213> 人工序列

<220>

<223> 基因编辑同源性臂池_2_b1687_右

<400> 45

tatattgacc ctttcctgcg gtctgtgatg taggtcgata cactattctt tcaggctgct 60

gcaatagcgc actgaaaggt gatgtttgtt tactctatgg atttcgtgtt gcaggaaggc 120

ggcaagcgag tgaactccag gagcttacaa tagtaagtga ctggggtgaa cgaacgtagc 180

cgcagcacat gcaacttgaa atacgacgag taaatcgttt gcgtgttgcc tgagttgttg 240

taccacattt ttttctaaca cgcccatcag aattaagggc agaatcggcc tgttaaaaac 300

cgctgaaatt gctcatcatt atgcaggtga gtttcgcgtg ttcacgtcgc gtcgacgatt 360

tgacgcacaa aaaaggtgaa aagtagttat ggtaaatgtt cgtcagccca gggatgtcgc 420

acaaattctg ctttcggtgc tgtttttagc catcatgatt gtggcatgtc tgtggattgt 480

tcaacccttt attctcggct ttgcatgggc cggtacggtg gttatcgcca cctggccggt 540

attgttacgt ttgcaaaaga tcatgtttgg ccgccgctct ctcgccgttc tggtgatgac 600

gctgttatta gtgatggtgt ttatcatccc tattgctttg ctggttaaca gtatcgtcga 660

cggcagcggc ccgctaatta aagccatttc cagcggtgac atgacgttac ccgatctggc 720

gtggcttaat accattccgg tgattggcgc gaagctgtat gcaggctggc acaacttgct 780

ggatatgggg gggacggcga tcatggcgaa agtccgccct tatattggca ccaccaccac 840

ctggttcgtt gggcaggcgg cgcatatcgg gcgctttatg gtgcattgtg cgctgatgct 900

tctcttcagt gccctgctgt actggcgcgg tgaacaggtg gcacaaggca ttcgccattt 960

tgcaacccgt ctggcaggc 979

<210> 46

<211> 1050

<212> DNA

<213> 人工序列

<220>

<223> 基因编辑同源性臂池_2_b1006_左

<400> 46

ggccggaatg gtatgaatca gcgcaccaaa tttcggtgaa aagcccaaca gcatggcgat 60

gacggcagca gcaacaaaca ccagcgtcga gtagactttg gtcacggcca tcacaccgat 120

attttcagca taggtggtca cgccgctacc gccgacagag ccggaaagca tcgttgccag 180

accatcgcct acgaatgccc gccccatata cgggtccata ttgcgtccgg tcatcccggc 240

gactgccttg agatgaccta agttttccgc caccagaatc accgccacgg gcgcaatcag 300

catcattgcc tgaccattaa aagcaggagt ggaaaaatgt ggcagaccga accaggcagc 360

atggctgacg agagtaaaat cgacggcttt tcccagccct aaaacgttgg tcatcacgcc 420

atacagcaga caggcgacaa ttaatcctac gagaatcaat aaccgctgga tcatgccacg 480

ggtaaacacc gccaccagcc caatacacag caccgtcatt accgccatcc agctatcaaa 540

ggccgaagcc gatacacttt tcactgcgat aggcgctaag ttcaggccaa tcgccatcac 600

caccgcaccc gtcaccaccg gcggcatcag tcgttcaatc cagcgcgtac cgattttcat 660

caccaccagg ccaatgacgg tataaaccag cccacaggcg ataatcccgc ccagcgcaat 720

gctgatattc gggttaatgc cctgaccgtt aaagcccgtc gcggcgatca ccacgccgac 780

aaaagccgcg ctggagccga gataactggg gacgcgcccg ccggtaataa agaaaaacag 840

taacgtgccg atccccgaca ttaaaatgga aagattggga tccagcccca tcagaatcgg 900

cattaacacc gtcgcgccaa acatcgccac cgcgtgttga acgcccatta ctgccgtctg 960

agcaaacggc aatcgttcat ccggcgcgac cacgccgctc tctgtagagg tcgattttaa 1020

ctgccagtga ggaaaaccga acattgccat 1050

<210> 47

<211> 1044

<212> DNA

<213> 人工序列

<220>

<223> 基因编辑同源性臂池_2_b1006_右

<400> 47

cagctgtctc cttaaggagg ttaacaagca gggcgcatca gcgcgtgata actgcgatcg 60

aaccacacca gcccgtaggg tgtggtgtga cgatgaatcg cttcgatggc gcaaaacaga 120

atgtcgtggg tgccgacgct caccacctgg ctgatacggc agtcaaacga aaccagagcc 180

tcttccagtt gcgggcatcc ggtcaccccc gtctgccagc gggcggcggc aaagcggtgt 240

tccatgggcg ttttgccgcc aaaaaggttt gaaagcggct cctgcccggc gctaagtgta 300

tttacacaca gcgttcgatt ttcattgaat gccggccaga cggacgcccc acgattcagg 360

cacaccagta atgtgggcgg cgtatcggtc acactgcaga cggcgctggc ggtgaacccg 420

gcgcgcccgg ctggaccgtc cgtggtgata atattgaccg ccgcgcccat gcaggacatc 480

gcatcgcgaa aagtttgttg atcgacaatg ttcatagttt gctccttaca acagcccgca 540

ggcttcttca aaggacagac gtggcaggcg cgcataaagc ttgctgctat cgccatagcc 600

gatattaatc agcagattgc tcttcagcgt gctgcccgta aaaaaggcgt cgtccacgtg 660

ttgacggtca aagcccgaca tcgggccggt atccagtccc agcgcccggc aggcgacgat 720

cagataggcc gcctgcatgg aactgttgcg aaacgctgtt tcttcggcaa gttgtgggct 780

ggaggtaaac caactgcggg catcaccgtg gggaaacagt agtggtaacc gttcataaaa 840

ttcactgtcc caggcgacga tagcggtgac gggcgcggtc agggtttttt gcagattgcc 900

gctggaaagt gccgggcgca gacgttcttt tccttctgcc gtgcgggtaa acacgatccg 960

tgccggagaa cagttagctg atgtcggccc ccatttcatc agggcataaa tctcccgtaa 1020

cgtctcatcg ctgacgggtg tctc 1044

<210> 48

<211> 1050

<212> DNA

<213> 人工序列

<220>

<223> 基因编辑同源性臂池_3_b0335_左

<400> 48

atgatcaaag cccatgaaat tcagggctgc atcgcgctgg aaaactcctt taaccgcgtc 60

ggcctcgacc acgttctgtt agtgaaagtg gcttccaccg ccgtggtcgc cgaaatgctc 120

ggcctgaccc gcgaggaaat tctcaacgcc gtttcgctgg cgtgggtgga cggtcagtcg 180

ctgcgcacct atcgccatgc gccgaacacc ggcacgcgta aatcctgggc ggcgggcgat 240

gccacttccc gcgcggtacg tctggcactg atggcgaaaa cgggcgaaat gggttacccg 300

tcagccctga ctgcgccggt gtggggcttc tacgacgtct cctttaaagg tgaatcgttc 360

cgcttccagc gcccgtacgg ttcctacgtt atggaaaatg tgctgttcaa aatctccttc 420

ccggcggagt tccactccca gacggcagtt gaagcagcga tgacgctcta tgaacagatg 480

caggcagcag gcaaaacggc ggcggatatc gaaaaagtga ccattcgcac ccacgaagcc 540

tgtattcgca tcatcgacaa aaaagggccg ctcaataacc cggcagaccg cgatcactgc 600

attcagtaca tggtggcgat cccgctgcta ttcgggcgct taacggcggc agattacgag 660

gacaacgttg cgcaagataa acgcattgac gccctgcgcg agaagatcaa ttgctttgaa 720

gatccggcat ttaccgctga ctaccacgac ccggaaaaac gcgccatcgc caatgccatt 780

acccttgagt tcaccgacgg cacacgattt gaagaagtgg tggtggagta ccccattggt 840

catgctcgcc gccgtcagga tggtattccg aaactggtcg ataaattcaa aatcaatctc 900

gcgcgccagt tcccgactcg ccaacagcag cgcattctgg aggtttctct cgacagagct 960

cgcctggaac agatgccggt caatgagtat ctcgacctgt acgtcattta agtaaacggc 1020

ggtaaggcgt aagttcaaca ggagagcatt 1050

<210> 49

<211> 1050

<212> DNA

<213> 人工序列

<220>

<223> 基因编辑同源性臂池_3_b0335_右

<400> 49

atgtctttta gcgaatttta tcagcgttcg attaacgaac cggagcagtt ctgggccgag 60

caggcccggc gtattgactg gcagacgccc tttacgcaaa cgctcgatca cagcaatccg 120

ccgtttgccc gttggttttg tgaaggccga accaacttgt gccacaacgc catcgaccgc 180

tggctggaga aacagccaga ggcgctggcg ctgattgccg tctcttcgga aacagaagaa 240

gagcgcacct ttacctttcg tcagctgcat gacgaagtga acgcggtggc ctcaatgttg 300

cgttcattgg gtgtgcagcg cggcgatcgg gtgctggtgt atatgccgat gattgccgaa 360

gcgcatatta ctctgctggc ctgcgcgcgc attggcgcta ttcactcggt ggtgtttggt 420

ggatttgcct cgcacagcgt ggcggcgcga attgatgacg ctaaaccggt gctgattgtc 480

tcggctgatg ccggagcgcg cggtggcaaa atcattccct ataaaaaatt gctcgacgat 540

gcgataagtc aggcgcagca ccagccacgc catgttttgc tggtggatcg cgggctggcg 600

aaaatggcgc gcgtcagcgg gcgggatgtc gatttcgcgt cgttgcgcca tcaacacatc 660

ggcgcgcggg taccggtggc gtggctggaa tccaacgaaa cctcctgcat tctctacact 720

tccggcacga ccggcaaacc taaaggcgtg cagcgtgacg tcggcggata tgcggtggcg 780

ctggcgacct cgatggacac catttttggc ggcaaagcgg gcagcgtgtt cttttgcgca 840

tcggatatcg gctgggtggt ggggcattcg tatatcgttt acgcgccgct gctggcgggg 900

atggcgacta tcgtttacga aggattgccg acctggccgg actgcggcgt gtggtggaca 960

atcgtcgaga aatatcaggt tagccggatg ttctcagcgc cgaccgccat tcgcgtgctg 1020

aaaaaattcc ctaccgctga aattcgcaaa 1050

<210> 50

<211> 1050

<212> DNA

<213> 人工序列

<220>

<223> 基因编辑同源性臂池_3_b1940_左

<400> 50

aatgtctgat aacgatccgc gcgtggtggc gctggtcatt cgccagtgga taaataacga 60

tcatgagtaa cctgacaggc accgataaaa gcgtcatcct gctgatgacc attggcgaag 120

accgggcggc agaggtgttc aagcacctct cccagcgtga agtacaaacc ctgagcgctg 180

caatggcgaa cgtcacgcag atctccaaca agcagctaac cgatgtgctg gcggagtttg 240

agcaagaagc tgaacagttt gccgcactga atatcaacgc caacgattat ctgcgctcgg 300

tattggtcaa agctctgggt gaagaacgtg ccgccagcct gctggaagat attctcgaaa 360

ctcgcgatac cgccagcggt attgaaacgc tcaactttat ggagccacag agcgccgccg 420

atctgattcg cgatgagcat ccgcaaatta tcgccaccat tctggtgcat ctgaagcgcg 480

cccaagccgc cgatattctg gcgttgttcg atgaacgtct gcgccacgac gtgatgttgc 540

gtatcgccac ctttggcggc gtgcagccag ccgcgctggc ggagctgacc gaagtactga 600

atggcttgct cgacggtcag aatctcaagc gcagcaaaat gggcggcgtg agaacggcag 660

ccgaaattat caacctgatg aaaactcagc aggaagaagc cgttattacc gccgtgcgtg 720

aattcgacgg cgagctggcg cagaaaatca tcgacgagat gttcctgttc gagaatctgg 780

tggatgtcga cgatcgcagc attcagcgtc tgttgcagga agtggattcc gaatcgctgt 840

tgatcgcgct gaaaggagcc gagcagccac tgcgcgagaa attcttgcgc aatatgtcgc 900

agcgtgccgc cgatattctg cgcgacgatc tcgccaaccg tggtccggtg cgtctgtcgc 960

aggtggaaaa cgaacagaaa gcgattctgc tgattgtgcg ccgccttgcc gaaactggcg 1020

agatggtaat tggcagcggc gaggatacct 1050

<210> 51

<211> 1050

<212> DNA

<213> 人工序列

<220>

<223> 基因编辑同源性臂池_3_b1940_右

<400> 51

atgtctgata atctgccgtg gaaaacctgg acgccggacg atctcgcgcc accacaggca 60

gagtttgtgc ccatagtcga gccggaagaa accatcattg aagaggctga acccagcctt 120

gagcagcaac tggcgcaact gcaaatgcag gcccatgagc aaggttatca ggcgggtatt 180

gccgaaggtc gccagcaagg tcataagcag ggctatcagg aaggactggc ccaggggctg 240

gagcaaggtc tggcagaggc gaagtctcaa caagcgccaa ttcatgcccg gatgcagcaa 300

ctggtcagcg aatttcaaac tacccttgat gcacttgata gtgtgatagc gtcgcgcctg 360

atgcagatgg cgctggaggc ggcacgtcag gtcatcggtc agacgccaac ggtggataac 420

tcggcactga tcaaacagat ccaacagttg ttgcagcaag aaccgttatt cagcggtaaa 480

ccacagctgc gcgtgcaccc ggatgatctg caacgtgtgg atgatatgct cggcgctacc 540

ttaagtttgc atggctggcg cttgcggggc gatcccaccc tccatcctgg cggctgtaaa 600

gtctccgccg atgaaggcga tctcgacgcc agtgtcgcca ctcgctggca agaactctgc 660

cgtctggcag caccaggagt ggtgtaatga ccacgcgcct gactcgctgg ctaaccacgc 720

tggataactt tgaagccaaa atggcgcagt tgcctgcggt acgtcgctac gggcgattaa 780

cccgcgctac cgggctggtg ctggaagcca ccggattaca attgccgctc ggcgcaacct 840

gtgtcattga gcgccagaac ggcagcgaaa cgcacgaagt agaaagcgaa gtcgttggct 900

ttaacggtca acggctgttt ttaatgccgc tggaggaagt cgaaggtgtc ctgcccggcg 960

cgcgtgttta tgccaaaaac atttcggcag aagggctgca aagcggcaag cagttgccgc 1020

tcggtccggc gttattaggt cgcgttctgg 1050

<210> 52

<211> 1050

<212> DNA

<213> 人工序列

<220>

<223> 基因编辑同源性臂池_3_b0109_左

<400> 52

cagcacaggc gaggggcaaa aaacgaaacg ggaaagcaga ttccgaggtt ttttatttcg 60

ttgcagcgaa agacaagaaa tttgcgaggc gttacgaaga aagttgggga aggggagatt 120

atccgcccgc gatggagcgg ataaatctgt caactattag cgaaaacgca ttgaaaggtc 180

gagtgcttgt acgtgtttag ttagcgcacc gacggagata aagtccacgc ccgtttcggc 240

aaattcacgc agtgttttgt cagtgacgtt gccagacact tccagtagcg ccttgccgtt 300

ggtgcgtttg acggcttcgc gcatctgttc tgtttcgaag ttatccagca tgatgatatc 360

ggctcctgct ttcagggctt catcaagttc ttccagattc tctacttcga cttctactgg 420

cgcatccggg tgcagccagg acgctttttc gaccgcctgg cgcactgagc cggaggcaat 480

aatatggttt tctttgatca ggaaggcatc agaaagcccc agacggtgat tcgctccgcc 540

gccgcaaagt accgcgtatt tcagagctga acgcaggccg ggtaaggttt tgcgcgtatc 600

caacaactgc gtgttggtgc cttccagcaa ttcgacatag tggcgtacct tactggcaac 660

tcctgaaagg gtttgcacaa aattaagcgc agtgcgttcg cccgttaaca gcacgcggga 720

tgggccttca agttcgaaca aggattgatt ggcattgatg acatcgccgt catccacatg 780

ccagattatg gtgacatcgt cgcctgccag ttgaataaac acctcttcaa cccagcgttt 840

gccgcaaaag acgccattct cgcgggtgat caccgtggca tgagagcgag aattttccgg 900

taaaagtttt gccgtaatat cattgttggc atcgactgtt ccgcctaaat cttcccgcag 960

cgcctgggcc accgcgccgg ggatatcgag attaatgcgt tccagcagct cgtcacgtcg 1020

ggtgtcaggg ttatagcggc gaggcggcat 1050

<210> 53

<211> 1050

<212> DNA

<213> 人工序列

<220>

<223> 基因编辑同源性臂池_3_b0109_右

<400> 53

gttaaaactc cagatagcta acgaatcata aggtagaaac atgctactct gaaccgggta 60

ttagcaccac atataaggag atcctgcatg ttgttagaac aggggtggct ggttggcgcg 120

cgccgcgttc cctcaccaca ttacgattgc cgcccggatg acgaaacacc caccctgctg 180

gtggtgcaca atattagcct gccgccaggc gagtttggcg gtccgtggat cgacgcatta 240

ttcactggaa ctattgatcc gcaggcacat cctttctttg ctgagatcgc ccatttgcgc 300

gtctccgctc actgtttgat tcgccgtgat ggtgaaatag tccagtatgt tcctttcgat 360

aaacgtgcat ggcatgcggg agtctctcag tatcaggggc gcgaacgctg caatgatttt 420

tctattggga ttgagcttga aggcaccgat acgctggcgt ataccgatgc gcagtatcaa 480

cagcttgcgg cggttacgcg ggcactgatt gattgctatc cggatatcgc taaaaacatg 540

acgggccatt gtgatattgc gccggatcgg aaaaccgatc ccggtcctgc atttgattgg 600

gcacggtttc gtgtgctggt cagcaaggag acaacatgac gctatttaca accttactgg 660

tgttaatttt cgagcgcctg tttaagttgg gcgagcactg gcagcttgat catcgtcttg 720

aagcgttctt tcggcgggtg aaacattttt ctctcgggcg cacgttaggc atgaccatta 780

ttgcgatggg cgtgactttt ttactgttac gcgcattgca gggagtattg ttcaacgttc 840

ccacgctact ggtgtggctg ctgattggtt tgctgtgtat tggcgcaggt aaagttcgtc 900

ttcattatca tgcttatctg acagctgctt cacgtaatga tagccatgcc cgtgccacga 960

tggctggcga actcaccatg attcacggcg tcccggcagg ctgcgacgaa cgtgagtatt 1020

tgcgtgagct gcaaaatgca ttgctgtgga 1050

<210> 54

<211> 1048

<212> DNA

<213> 人工序列

<220>

<223> 基因编辑同源性臂池_3_b3399_左

<400> 54

gtcgcggcgc tcttttttgt ccgggcgtcg gtccgggtgc ggcatggtta aggcattaag 60

tttacgtgcc agcgccattt tttcgcgttt ctctacactt tccgcagtct cttcatacag 120

caaggctgcc tcgctggcgg ggcgacgctg ttcagtaatc gcctttacaa tcaccgtgcg 180

ttcgtcattt ccctggcgca gagtgagcgt ggcattcagc tcgacgattt tgctcggctt 240

gctgcgctgc ccgttgtaat gcaccttacc gccttcaatc atttcacggg ccagcgcgcg 300

ggttttataa aaacgggcag cccatagcca tttatccagt cgaacctcaa cagcaggttt 360

ctctttcatg gcgtctcctt cacattagcg aggggatcag gcggcggtag tcattcagtg 420

acggatggcg ttgatactgt ttctcggcaa tcccggaatc aggattagtc acgccgaggc 480

agtaacgaat accaaattgc gcggcagcat cgagaatcgc ttcgctgtca tcaataaaca 540

gcgttctttc agctttcaga cccgtagctt cggccaccgc atgccataac cgctgatcct 600

ctttcggata accaaatgtg tgggtggaaa gtaataaatc aaggtgtgcg tccagaccgg 660

tatgctcaag ttttaccgcc aggttgtgcg gatgcgcatt ggtgagcaaa attcgctgct 720

taccgctggc tttcagtgcc tcaagaaacg gaatggtatc ttcacgcagt acggcacgcg 780

gtcccatctc ggtggtcatc gcacagatat ccagacccag ttgctcactc cagtaatcaa 840

gacagtacca gtttagcgta tgctgtacgt cgtgatattg ctggcgcata tattccatcg 900

cttcctgtgg cgtaaccccg tttttcgcgc cccatgtttc aggcaccagc ttttgccaga 960

aatagttatc gaaggcgagg tcgagcaacg tgccgtccat atccagcaga acggtatcta 1020

cgtcctgcca ggcaatgttg atatgcat 1048

<210> 55

<211> 1034

<212> DNA

<213> 人工序列

<220>

<223> 基因编辑同源性臂池_3_b3399_右

<400> 55

gagggaaatc tccagagtga agcaatttgc gcgacagggt agcataacct gccgcgcaaa 60

cgtgttattc gataaggctt tctgaagggg tgatcagttg cgggttcagg cagctttcat 120

aataggcctg aatctccatc atgcgagtgc gatgacgctg gtaacgacgc caggcctgta 180

cgccattgta aatggcgcta cccagcatcg tcagtagcag caatgtggtg ctgagatagc 240

gccacaggcc ggaacgatcc gggatcggat gaaggccaat atgctgcgta ccattggcgt 300

cagtgaagat ttttgtgacg ataccctcgg cgttaaacgg cgtatgcatc agcatttgtg 360

ccagtttctg gaaagcgttc cactgttctt gcggcgggta gtcgtaaagt gatgccgaag 420

gccagggctg atcaacaaaa tcgctgcctt cgtcgctgac aatcaggaat ccgccggggg 480

ccggactgtt tagtgattgt gccgctcgcg ccgtttcatg cgtgataaac ggcgcggtgg 540

aggttgccac caggttatcc agcgattccg cactcaccgg gcgtaataac acattcacgc 600

catcgagctt cccggcgttg gcgcgtttta ccagcgcgtc ccagtcttta ctgttgccga 660

gattgaccag cgcatttttc agtcgcacac agtcatcttt ggcagaacat aaatccgctg 720

tcttcagtac aatgtcgcca aaatcatcaa gcaataccat gccggatttt tgaattgctg 780

aacgtaatga ggcactgacg cgagattcat cttccggttt agggtgcagc tggcgattaa 840

ctgcttcagt caatgccgtc gctttgttga ccagttcaga ttctggtaat ggcaatgagc 900

gggcgtcgtt ccagatgatc tgcgagcagt caaacggtaa aaaaggtgaa ttggttttcg 960

cgctccaggt tccggaagtt cgaatattac acattcccgt accgctaata cgcaatgtat 1020

cgcctacccg cacg 1034

<210> 56

<211> 1031

<212> DNA

<213> 人工序列

<220>

<223> 基因编辑同源性臂池_3_b2478_左

<400> 56

gtgccgcttc caggtaggct tcatcaccac tgacctgacg cttatagcgt gagtcagaac 60

tacaggcagc gagtaataaa acaagcgaaa cacccgcaac ctttgccagg cgcgactttt 120

gaacagagta agccatcaaa tctccctaaa ctttacagca aaccggcatg cttaagcgcc 180

gctctgaccg tctcacgacc actgtcggtg attggtgtca ttggcaggcg cagcgtatcg 240

gtcgccacaa gacccagttc cttacatgcc catttcaccg ggattggatt gggttcgaca 300

aatagtttgt tgtgtaatgg catcagacgc tgattaataa cgcgtgcctc ggcaaaatgc 360

ccttctgctg ccagtttgca catctgggcc atatcacgcg ctgcgacgtt agccgtaacg 420

gaaataaccc catgaccgcc caattgcatg aagtccagcg cgctcgcatc atcgccgctc 480

agcagaacaa aatcatctga aaccagctct ttgatctggt ttacacgcgt taagttccct 540

gttgcctctt tgattccgat aatatttttt actttcgcca gacggcccac cgtttccggg 600

agcagatcgc agccagtacg ggacggcaca ttatacagaa tttgcggcag gtcagtatgc 660

tcagcgatgg ctttgaaatg ctgatacaaa ccttcttgcg acggacgatt gtagtaaggg 720

gttaccgtca ggcagccgac gataccactg tcattgaagc gctgcgtcag gctaatggct 780

tccgcagtag cgttagcgcc ggtcccggca attaccggaa tgcgcccatc agccagatcc 840

agcgtcatca tcaccacatc agcatgttcg tcatgattta aggtagcgga ctcgccagtg 900

gtgccaacag aaacgatcgc cgaagtaccg ctggcgacat gataatcaat cagttttttc 960

aagctagccc gacagacatt acctttttca tccatcggag taacaatcgc gacaatactt 1020

cccgtgaaca t 1031

<210> 57

<211> 1050

<212> DNA

<213> 人工序列

<220>

<223> 基因编辑同源性臂池_3_b2478_右

<400> 57

gggccatcct ctgtgcaaac aagtgtctca atggtacgtt tggtatggca ttaaaagcaa 60

gcagacagaa ccgttctgat tgttgtatgc atgttttttt tatgctttcc ttaagaacaa 120

ctcacccctt aaaggaataa ccagtttgac actgtcatcg caacattatc tggtgatcac 180

tgcgttgggt gccgatcgcc ctggaattgt gaacaccatc acccgtcatg tcagtagttg 240

cggctgtaat attgaagaca gtcgcctggc gatgctggga gaagagttca cgtttattat 300

gctgctttcc ggttcatgga atgccattac tctgattgaa tcaacgttac cgttgaaagg 360

tgccgaactg gatcttttaa tcgtgatgaa gcgcacgacg gcgcgtccgc gtccgccaat 420

gccagcatct gtctgggttc aggtcgatgt ggcagactcc ccgcatttaa ttgaacgctt 480

cacagcactt ttcgacgcgc atcatatgaa cattgcggag ctggtgtcgc gcacgcaacc 540

tgctgaaaat gaacgggctg cgcagttgca tattcagata accgcccaca gccccgcatc 600

tgcggacgca gcaaatattg agcaagcgtt caaagcccta tgtacagaac tcaatgcaca 660

aggcagtatt aacgtcgtca attattccca acatgatgaa caggatggag ttaagtaatg 720

aatccactga aagccggtga tatcgcaccg aaatttagct tgccggatca agacggagaa 780

caagttaatt tgaccgactt ccagggacag cgtgttctgg tttatttcta cccgaaagcc 840

atgacccccg gctgtaccgt acaggcctgc ggcttacgcg ataacatgga tgagttgaaa 900

aaagcgggcg ttgatgtgct gggtatcagc accgataaac ccgaaaaact ctcccgtttt 960

gcggaaaaag agctgcttaa ctttacgctc ctgtctgatg aggaccacca ggtgtgcgaa 1020

caattcggcg tctggggtga aaagtccttc 1050

<210> 58

<211> 1050

<212> DNA

<213> 人工序列

<220>

<223> 基因编辑同源性臂池_3_b0320_左

<400> 58

atgatggtgg tattaaacag caggcgattg tgcagttatt gctggaacac ggtgccagcc 60

cgcatctgac cgataaatat ggcaaaacgc cactggaact ggcgcgggaa cggggctttg 120

aagagattgc gcagttactg attgccgcag gtgcataaac cgggaggctt gctatcaaca 180

caccagaaag acggtgtgtg tgggcgctaa ctgcggatgc ggattttctg gcgcagcggg 240

ggcaaggaca ggttgaacag gtctttgcca gagcggtaaa tatcgcactc ccggctcgcc 300

agcagttgct gacgctgctt tgtgaagagt acgacaatgc gccaaacagt tgtcggttgg 360

cactcactca ctttgatgat ctgttccggc atggtgataa ggttcagttt gacgatcaag 420

gtattacggt tggtcaacat cttcatatag agatgagtcg ttgtcggcgt tggctgtccc 480

caaccttgca aatgaccgct gtgaattttc accttatcgc ctggctacag tggcacgaca 540

ttattcatca gcacctgggg gaaaatgaaa ccctgtttaa ttatcgcggc gataatccgt 600

tttatcaggc gttaaataaa gaattacata ttaaacgacg ggcagttatt caggccgtaa 660

acgataaaca aaatatcgcc tcagcggtcg ccagtatgat ggggttaggg attggcctta 720

cgccatcagc cgacgattat ttaacaggtc tggcgcttat tttatttatt cccgggcatc 780

cggcggaaaa atacaaagag gaattttatc tcggtctgca acgcggcaaa aataatacca 840

cattattaag tgccataacg ctggaagccg cattacaaca acgctgccgg gaaaatattc 900

atcgttttat tcacaacatt atttatgaca tccctgggaa cgcaactcag gcaatagaaa 960

aaattaaaca tattggctcc agttccggct gcgacatgct gtatggcatg gccgatggtt 1020

gtgcgctgag ccaaacctac ggagggaatt 1050

<210> 59

<211> 1046

<212> DNA

<213> 人工序列

<220>

<223> 基因编辑同源性臂池_3_b0320_右

<400> 59

atgtcagtta aaatagtcat taaaccgaat acctattttg attctgtctc gctgatgtct 60

atctccacgc gtgcaaataa actcgacggc gtcgagcagg catttgtggc gatggcgacc 120

gaaatgaata aaggcgtgct gaagaattta ggactgctga cgccggagct ggagcaggcg 180

aaaaacggcg acctgatgat tgtcatcaat ggtaaatcgg gtgcggacaa cgagcagtta 240

ctggtggaga ttgaagaact gttcaacacc aaagcgcaaa gcggctcgca cgaggcgcgt 300

tacgccacta ttggcagcgc caaaaagcat atcccggaaa gtaacctggc ggtgatttcg 360

gtcaacggtc tgtttgccgc tcgcgaagcg cgtcaggcgc tgcaaaacga tctcaacgtg 420

atgctgtttt ccgataacgt ctcagttgaa gatgaactgg cgctcaagca actggcccac 480

gaaaaagggc tgctgatgat ggggccagac tgtggcacgg cgattatcaa cggcgcggcg 540

ctctgttttg gtaacgccgt gcgtcgcggc aacatcggta ttgttggcgc atccggcacc 600

ggcagtcagg agttgagcgt ccgcattcat gaatttggcg gcggcgtttc gcaactgatt 660

ggcaccggcg ggcgcgacct gagcgagaaa atcggcggcc tgatgatgct cgacgccatc 720

gggatgctgg aaaacgatcc gcaaactgaa atcattgcgc ttatctccaa accgcctgcg 780

cctgcggtgg cccgcaaagt gctggaacgt gcgcgcgcct gccgcaagcc ggtggtcgtc 840

tgcttcctcg atcgtggcga aacgccagtg gatgagcagg ggctacagtt tgcccgcggc 900

accaaagagg cagcgctaaa agcggtgatg ctctccggcg tgaaacagga aaatctcgac 960

ctgcatacgc ttaaccagcc gttgattgcg gatgtgcgtg cgcgtctgca accgcagcag 1020

aaatacattc gtggcctgtt ctgcgg 1046

<210> 60

<211> 1050

<212> DNA

<213> 人工序列

<220>

<223> 基因编辑同源性臂池_3_b4521_左

<400> 60

ccggagattg ctcaattttt aaatcacggc tggcaacgct ggcattaccc attaccgcaa 60

caatttctgc aacctgtgcg ctgtcagttt ttgccatttc gttggcttct gcgcaagtaa 120

tataggtttc tgacggcaaa ccgtttttaa tattgtagtc ctgcgcccag gtcattggtg 180

cgaaaacaaa caggcccgcc agtaaagcaa attttttcat catcattcct tatttcattt 240

tacccagaat tgcaccaccc gtaccgccaa tcacggcacc tttaatcgcc ccttcgaggc 300

cattgccggt cagaacgcca gtgacagcac caacggcggc acccactttt gcacctttac 360

gcgcattttt accgtcgcgg cctttttctg ttactgcacc aacaccagcg ccaacagctg 420

cacctttcag tacgccatta acaccattgc cagtaagtaa accaacgcct gcgcctagca 480

atgcaccttt cgtggtgcgg ttcatatccg ccatcgctgg cgtggagcag aacaatgctg 540

agataagccc gaaggcaagt atttttttct tcaacttaga tgtccggtat taagtaagtt 600

gcacacacaa taatttcgtc ttcaattaag atctgcttaa ctaaagaacg ctcgctatta 660

ttcagataat tcaaaatgag cgtggctgtg atgataggaa ttatgttttt tacgtgaatg 720

agaataatct taaatgagga ataactcatt gattgacaat atttttattc aagaagtgtc 780

attgactgtt aacgcaatgt tgtaaaggta agataatctg atttatcaat attattgtgt 840

gatttttatg tgagcagaag atattcatca gcaacgatta cattagtcat tttattttgc 900

cgacggcctc attgtcgaaa gataagcgta cgacagtatt atcagaaaag agtgattttt 960

tatccaacta cacttcagcg cactgcgtgt aaaaaatgcc tctttcttat gcgggatatc 1020

atcatttcat catgatgtct ttggtgagcg 1050

<210> 61

<211> 1049

<212> DNA

<213> 人工序列

<220>

<223> 基因编辑同源性臂池_3_b4521_右

<400> 61

gtgaacacaa tacacctgcg ctgtctcttc aggatgaatc ccctggtctg gtgcctgcgg 60

gctgatgttg cagcagagct taggtcactt agacgctact atcatttatc caatggcatg 120

gaatcgaaat cagtcgatac ccgcagtata tatcgtgaac tgggtgcaac gctgagttac 180

aacatgcgcc tggggaacgg tatggaaatg aaccctggct gaaggcggct gtgcgcaaag 240

aatttgtcga tgataaccgg gtgaaggtga ataatgacgg taatttcgtc aatgatttgt 300

cgggcagacg tggaatatac caggcagcta ttaaagcctc attcagcagt acgtttagcg 360

gacatctcgg ggtggggtat agccatggtg ccggtgtgga atccccgtgg aacgcggtgg 420

ctggtgtgaa ctggtcgttc tgaccatcaa cgattaaact gcgcttcggc gcagttttcg 480

tttacaggat gttgaaaggg aaaattctgg ggcaaaaaaa gcccgccagt tacggcggga 540

aacctcatcc tatgggagaa caatgaataa tgaaattgcg gggttatcat ctcccagtat 600

atccatacta acaataaggt tatttactca accaggcata aacattttgt tttgtgcgtg 660

ggaacagcct taaggtgtaa agggggaggt ggaaatagca atgaggagta tcagcaagaa 720

tactcgccgc tttaccacaa cgtggatgag agggatgaaa aactcaaggc agagataact 780

ctgccttgaa gataaatgcg cttttacagc gggcttattt cagctcttct gcttccggta 840

aggtcacgtt cagctcaaga atagaaatat cgccatcttt ttgctcaagc tgtacggtta 900

ccatctcagg atcaatttgt acgtatttac aaatgacctc aagaatatct ttacgcaact 960

gcggcagata atgcggttct gcatcgctgc gacggcgttc agcaacaata atctgcagcc 1020

gttcttttgc aatgttggct gtgtttttc 1049

<210> 62

<211> 1050

<212> DNA

<213> 人工序列

<220>

<223> 基因编辑同源性臂池_3_b2260_左

<400> 62

acgtccgaca atggtcagct tgccattatg catctcaccg cgatcgcgcg tagcgtacca 60

gccttcgtca ttaaccagtg aaaccagttg cccgttacgc cagtaacctt ctgccatact 120

ggcagcccgc agccacactt cattattaac gattttcact tcccgacccg gcagcggcga 180

accaacgtct gccaggccgt cggcttcttt cgcacacacc gtggaggcaa actcggtcag 240

accatagccg caaaagcaac gaatcccctg ctcgcgcgcc tgttccgtca actcgaccgg 300

gatagccgcg ccgccaagta acaccgcttt cagggaaacg gaactacggt taaccagcaa 360

acgccagagt tgtgttggca ccagtgaagc gtgagtacag cctgccagca tttgctccaa 420

tggctgttta tcacgtaccg tcatccgcgc accagcgtat aaccagcgcc acataattcc 480

ctgaccggag acgtgaaaca gcggtaaaga gagcaaccaa tcatcgtgat cgccaaacgg 540

aatcagcgat aacacacctt gcgcactggc aagatgggcc tgataagtat ggacagcggc 600

tttcggcaaa ccggtagaac ccgaggtcaa cgtcattgag cacagacgcg tcggctgcca 660

cgtagcggca tgtgcgcctt caaccagctg aatgtgcagc gacgttaatg ccggaaacgt 720

gttttcccca tccggcacca gagcaaattg cagcgtcaga ttgggcagca attcttcaag 780

caacggttgc ggcagctgag ggttcacggg caacacccgc gccccgcatt gcagtaacgc 840

cagccaggcg agcagcgttt gcggcgtatt ccacgcccgc aacatcacgc cgctgccctc 900

aaccaccccc tgcaccgcaa atccggaggc taattcatcg acgcgagcac aaagctcgcg 960

ccagttgagt tgctcgtcat taagacgtaa ggcgatggtt tctccccgca cttgccgcca 1020

gtgacgccac ggccagtcag agaagatcat 1050

<210> 63

<211> 1050

<212> DNA

<213> 人工序列

<220>

<223> 基因编辑同源性臂池_3_b2260_右

<400> 63

aacaaccgct ccagtgcatc aacttccacg acaggcagcg tgctacccgg ccagcgacgt 60

acctgctgcg cctgcatcag atccagcgtg tccagccctg gaatggtgtc cggcgttaac 120

caggcggcaa tccgcgccag ttgcgttaag cctaagctcg attcaatgga agaactgatc 180

accgccgtca gccccagcgc gtgcgccgcc tgtacctgct cgcgtacttt ttccagactg 240

cccgtgagcg tgggtttgat aactaccgcg cgcacgccct cttcagccac aaaggcaaaa 300

tccggctcgc gcaggctttc atcccaggca atggcaatgc cggtttcacg ggcaaacgct 360

cgcgaatcat cgcgggtttt gcacggctct tcgagaaacg cgatgcggtc gcgataatcc 420

gggttaacgt atttggcaaa ctgctgacct ttcagcggtg tccaggcgcg atttgcgtca 480

agacgcaaat gcagatccgg aattgcctcc agcaacagat tcaccaccat gccgtcgcgc 540

accgcttcgt acaatcccac tttgaccttc gccactttct cgcctggcat atctgcaagt 600

ttgaggatca gatcgtccgg atcgccatta cacagcggtg ccgcacggta gttggctgct 660

tgcggcaacg tatctgtcag ttctgccaat gcacagctta cgccaaaggc cacggaaggc 720

atctgcggta gctcgcaatc gcctgccagc cagttattta cccaggcaag cagcacactt 780

tgcgcctctt cccaggtttc ctgactgaag cccggcagtg gggagatctc cccccaccct 840

tcgcgctcgc cttcacgcag gcaaacatac agcccgtcgc gggtttttaa ccgcctgtcg 900

cgcagaacca cccccgcgtc catggggatc tgccagcggt atacctgcgc gctacgcatt 960

acggattccg tttgaatttg ctgaagtcag gctgacgttt ctggttgaag gcgttgcgac 1020

cttcctgacc ttcttccgtc atgtagaaca 1050

<210> 64

<211> 1047

<212> DNA

<213> 人工序列

<220>

<223> 基因编辑同源性臂池_3_b4169_左

<400> 64

tggaatgggc cgatgtggtg gtgattggtc ccggtctggg ccagcaagag tgggggaaaa 60

aagcactgca aaaagttgag aattttcgca aaccgatgtt gtgggatgcc gatgcattga 120

acctgctggc aatcaatccc gataagcgtc acaatcgcgt gatcacgccg catcctggcg 180

aggccgcacg gttgttaggc tgttccgtcg ctgaaattga aagtgaccgc ttacattgcg 240

ccaaacgtct ggtacaacgt tatggcggcg tagcggtgct gaaaggtgcc ggaaccgtgg 300

tcgccgccca tcctgacgct ttaggcatta ttgatgccgg aaatgcaggc atggcgagcg 360

gcggcatggg cgatgtgctc tctggtatta ttggcgcatt gcttgggcaa aaactgtcgc 420

cgtatgatgc agcctgtgca ggctgtgtcg cgcacggtgc ggcagctgac gtactggcgg 480

cgcgttttgg aacgcgcggg atgctggcaa ccgatctctt ttccacgcta cagcgtattg 540

ttaacccgga agtgactgat aaaaaccatg atgaatcgag taattccgct ccctgatgag 600

caggcaacat tagacctggg cgagcgggta gcgaaagcct gcgatggcgc aaccgtaatc 660

tatctgtatg gcgatttagg cgcaggtaaa accaccttta gccggggctt tttacaggct 720

ctgggtcatc agggtaatgt caaaagcccc acttatacgc tggtcgaacc ctatacgctc 780

gacaacttaa tggtctatca ctttgatttg taccgccttg ccgatcccga ggagctggag 840

tttatgggga tccgcgatta ttttgccaac gatgccatct gcctggtgga gtggccacaa 900

caaggtacag gtgttcttcc tgacccggat gtcgaaatac acattgatta tcaggcacaa 960

ggccgtgagg cgcgcgtgag tgcggtttcc tctgcgggtg aattgttgct ggcgcgttta 1020

gccggttaac ctttgaaagg tggcggg 1047

<210> 65

<211> 1050

<212> DNA

<213> 人工序列

<220>

<223> 基因编辑同源性臂池_3_b4169_右

<400> 65

atgatgtatc gcatcagaaa ttggttggta gcgacgctgc tgctgctgtg cacgccggtg 60

ggtgccgcga cgctctctga tattcaggtt tctaacggta atcaacaggc gcggataacg 120

ttgagtttta ttggcgatcc tgattatgcg tttagccatc aaagcaaacg caccgtggcg 180

ctcgatatca aacaaacggg cgtgattcag ggactgccgt tgttgttcag cggcaataat 240

ctggtgaagg cgattcgctc tggaacgcct aaagatgcac aaacgctacg gctggtggtc 300

gatcttaccg aaaacggtaa aaccgaagcg gtgaagcggc agaatggcag caattacact 360

gtcgtcttta cgattaacgc cgatgtgccg ccaccgcctc ctccgccgcc cgtggttgcg 420

aaacgcgttg aaacgcctgc ggttgtcgca ccgcgcgtca gcgaaccggc gcgcaatccg 480

tttaaaacgg aaagtaaccg cactacgggt gttatcagca gtaatacggt aacgcgtccg 540

gcagcgcgcg cgacggctaa cactggcgat aaaattatca tcgctattga tgccggacac 600

ggcggtcagg accctggcgc tatcggcccc ggtggtacgc gggagaaaaa tgtcaccatc 660

gccatcgcgc gtaaattgcg tactttgctc aatgacgatc cgatgtttaa aggcgtttta 720

acccgtgacg gggattactt tatctcggtg atggggcgca gtgatgtggc acgtaagcaa 780

aacgccaatt tcctcgtgtc gattcacgct gatgccgcac cgaaccgcag tgcgactggc 840

gcttccgtat gggtgctctc taaccgtcgc gccaacagtg aaatggccag ctggctggag 900

cagcacgaga aacagtcgga gctgctgggt ggggcgggtg atgtgctggc gaacagtcag 960

tctgacccct atttaagcca ggcggtgctg gatttacagt tcggtcattc ccagcgggta 1020

gggtatgatg tagcgaccag tatgatcagt 1050

<210> 66

<211> 1025

<212> DNA

<213> 人工序列

<220>

<223> 基因编辑同源性臂池_3_b2405_左

<400> 66

gagcgaagcg agtcatcctg cacgacccac caatgtaaaa aagcgcccta aaggcgcttt 60

tttgctatct gcgatttgcg aaattgcctg atgcgcttca cttagcagac tactatttcc 120

ggcaattcct gtctcctcac ctactgtgtc aatgcagcca acagcttaac catcgcgggc 180

gtcacctgct gtgtttcata aacaatatat aaatctgcag ggatgcgctg tttgagcgga 240

cggaaaatga cacctggcca gttcatttgt gcgtagctgt ccgctatcaa tgtgatacca 300

atgcccatac tgaccatagc gagtaccgtt tgcggttcat taacttcgcg aataacaacc 360

ggtgaaaatc ccacctgctg gcaaactcgc tgcaaaaaat cccagtcagt gtaaacgggc 420

ggcattgtaa caaaatactc gtcacgtagc gcttccagcg ggacggtgga aaatgatgag 480

agatgatgct cttcaggcat cgccaccaga aacgccgatt catgcaaccg taagctggta 540

aaaccagtcg gtggttctgt cgccattcgc cagatcccgg catcaagttc gcggcgttcc 600

agcaaggcca tttgcatcgc gggcatcttt tcgcgaaaaa gaacgtcaac gttaggattt 660

tccctgagga atcgccgcat aaccgggcgc atccgtcccc acattgccgt tcccactacg 720

ccgagttcaa tccgccctgc ttctccccga cctatttgtt caatccgagc caatacatta 780

ttagcattca ccagcaatcg acgcgattct tccatcaaga ttttgcccgc gtgtgtcagt 840

acgacgctgc gcgaatggcg aataaaaagc tgcgtgccga gttgattttc cagctcttta 900

atatgaatgc tgagcggagg ctgagacata tttaaacgcg ctgctgcgcg gccaaaatgc 960

aactcttccg ctacggcaag aaaataacgg agcaacttaa gatctgttct gtatacgcgt 1020

tccat 1025

<210> 67

<211> 1050

<212> DNA

<213> 人工序列

<220>

<223> 基因编辑同源性臂池_3_b2405_右

<400> 67

aacaaagcac caataccaaa accaacgccg gaagaaaata aaatatcttt cactaattaa 60

cctttatcat aaaagcagct ctgaagagca gagccgcgaa tccttttaat gagtcaccgc 120

tcgatgcttt atcttttcag ggtcatgatt atatttaaac ccaaagaaaa atatcactgc 180

gagaaaaaga gcatatcctg caaacaccag ccagatagtt tgccagtctt ttacgccatc 240

caccgaaaag taatctactg ccatgccact cagaatcgag ccaacccatg cgccgacacc 300

atttaccatg gtcataaaga gcccctgcgc gctggcacga atgctggaat caacttcctg 360

ttcgacaaat accgaaccag aaatattgaa gaaatcgaat gcacagccat aaacaatcat 420

cgacagcagc agcaaaataa atccggttgt tgacggatcg ccataggcga agaagccaaa 480

gcgcagcgtc caggccacca tactcatcag catgacggtt ttaatgccaa atcgctttaa 540

aaagaatggg atagtcagta taaagcccac ttctgccatc tgtgaaactg acagtaaaat 600

ggagggatat ttcaccacaa aactgtcagc aaactccggg ttacgggcga aatcatgtag 660

gaacggatta ccaaaaacgt tggtaatttg cagtaccgca cccagcatca tggcaaagag 720

gaaaaagatg gccatgcgtg gatttttaaa cagcacgaag gcatccagac ccagcttgct 780

ggcaagcgat gtggtcgctt ttttctccgc aaccggaatc ttcggcaaag tcagcgcata 840

agccgacagc agcaatgacg caccggacgc gatatacagc tgcagactac tcaattccag 900

atgcagcagg cttactgccc acatcgcgac aatgaacccc accgtaccaa aaacgcgaat 960

gggcgggaaa gcggtcaccg ggtcaagccc tgcctgggca agacaggaat aagagacgct 1020

gttcgataac gcaatagtcg gcataaacgc 1050

<210> 68

<211> 1050

<212> DNA

<213> 人工序列

<220>

<223> 基因编辑同源性臂池_4_b3493_左

<400> 68

agtgtcagaa acgcacagca taatgcggcg catctggcta cgttgatcaa gcgacagctt 60

gtcgtagctt tccacatcgg tggtcaacat acctttcagg cggttgagcg cgttaatggt 120

attcgacgga tggcagtgga actccgcagg ttgcgttgcg ccagcttccg gagccggtac 180

taactgatca gcaccggtag cctgtttgag cagcgcagga tgctgctcaa agtaagcttc 240

gacgttgttg atggcatcac gggtacgggt gatttcgtag ccagtggcat tcatgttcac 300

cacgaagcct gctggcgcga cgccaatcaa taccaacata accagaccaa tgcctttctg 360

accatcgttc gcgccgtgcg aaaacgccac gccgatagcg gaaaggatca gcgcaatacg 420

cgtccagaac ggcggctttt tcttgccgtc tttcttttca cgctccgctg gggtcaggtg 480

gatacgggcg cgtttcttgg tgccgctcca gtagcgacgc agcaagaaaa tcagaccgcc 540

agcaaacacc aggccgacaa taggggaaac gatcagagaa ccgaaaatac ttaatacttt 600

cgggatattg agtgcatcca ccactgacgt cccggtcatc aacgcattgg ttaaaccaat 660

cccgatgatc gcgccaatca gcgtatgaga gctggatgca ggtaaaccaa agtaccaggt 720

acccaggttc cagataatcg ccgccagcaa catagagaac accatggcaa ggccatgaga 780

cgatcccata ttaagcagca gatccgtcgg cagcatatgc acaatggcat aggcaacact 840

cagaccaccc agcaaaacac ccaaaaagtt gaataccgcc gccataacca cggcgagctg 900

agaacgcatc gcgcgggtat agataacggt tgccacggcg ttggctgtgt catggaaacc 960

attgatggct tcgtagaaca gcacaaaagc cagtgcaagc aataataaca gcccggtatg 1020

caaatccagg ccagcaaaca aatgtagcat 1050

<210> 69

<211> 1050

<212> DNA

<213> 人工序列

<220>

<223> 基因编辑同源性臂池_4_b3493_右

<400> 69

ttgccccctg tatggatttc actcaaaaaa taattatctt atataattca ggcaaatact 60

tccttttagt aatattgatg ctggtgcgac cactgaggaa tctttacaat tcacgcccgt 120

tttttctaag aggagcgcaa cgtggaaagg tttgatgcca ttattatagg cgctggtgcg 180

gcgggtatgt tctgttctgc gctggcaggt caggcaggac gccgggttct gctgatcgat 240

aatggtaaaa aaccagggcg caaaatcctt atgtctggcg gtgggcgctg caactttacc 300

aacctttatg tcgaaccagg cgcttatctg agccagaatc cgcatttttg taagtctgca 360

ctcgcacgtt ttacccagtg ggatttcatt gatctggtca ataaacacgg catcgcctgg 420

cacgagaaaa cgttagggca actcttctgc gatgactccg cgcagcagat tgtcgacatg 480

ctggtggatg agtgcgagaa gggcaatgtg accttcagat tgcgtagcga agtgctgagt 540

gtggcgaagg atgaaacagg cttcacgctt gatctgaacg gcatgactgt cggttgcgaa 600

aagctggtca tcgcgactgg tgggctgtca atgccggggc tgggcgcgtc gccgtttggt 660

tataagattg ccgaacaatt tggcctcaac gtgctgccga cccgcgcggg tctggtgcca 720

ttcactctgc ataaaccgtt gctcgaagag ttacaggtgc tggcgggcgt ggcggtgcct 780

tccgtgatta ccgctgaaaa cggcaccgtt ttccgtgaga acttactctt cacccaccgc 840

ggcttgtctg gaccggcggt gttgcagatt tcaagctact ggcaaccggg ggaatttgtc 900

agcatcaatc tgctaccgga tgtggacctc gaaaccttcc tgaatgagca gcgtaacgca 960

catccgaatc aaagcctgaa aaacacactg gcggttcatc taccgaagcg gttggttgaa 1020

cgcttacagc aactcgggca aatcccggat 1050

<210> 70

<211> 1050

<212> DNA

<213> 人工序列

<220>

<223> 基因编辑同源性臂池_4_b0479_左

<400> 70

cataccgata cgtcctggaa gcagctcctg agcgtagacc agaatggcag agaatgccga 60

agcgaggata aatccaataa tcaccgttaa aacccccgtc cagtgcaggc tggcgtaggg 120

taaaatcagc gtaaacggcg caacgccgag gatagagccc caaatcacat atttccgccc 180

aattttatcc cctacaggcc cgccgatcac cgtacctgcc gcaacggcaa acaggaaggc 240

aaacagatga agctgagcat tctggataga taatccgaat ttttgcatca gataaaaggt 300

gtaatagctg ctgatgctcg ccatatagaa atatttcgag aaaatgagga ttaacagaat 360

gctgaccgcc agtacaactt tattgcgcgg cagtggattg ataatcgtcg ctttgggttt 420

tcctttattc attcggtgct gtgccgagta ccaacggctg atttgcgcca acaccacgat 480

cgccagcagt gccgcaagca caaaccaggc aacgttgcct ttgccataag gcgcgataat 540

caccgccgcc agcaagggtc ccagggaact gccaaagttg ccgccgacct gaaagataga 600

ttgcgccagg ccatgccgcc cgccggaagc catacgggcc acgcgagaag attccggatg 660

aaagaccgat gaaccggtac cgaccagcgc cgccgccagc agaactgcgc caaaactgcc 720

cgccagcgca agcagcacca gaccgcttaa ggtaaagcac atgccaattg gcaacgacca 780

tggcatcgga tatttatcgg tccagtagcc gaccactggt tgcagtagcg aagaggcgag 840

ctggaaggtg agggttatca tgccaatctg cataaatgtc agagaaaatt ctgactgaag 900

cagcggataa atcgccagaa tcagcgattg gatcatgtcg ttcagcagat gtgagaggct 960

gatagcacct aaaataccaa acgatgttcg ggccttggtc gttgacgcag ccgcgcccgc 1020

cacaggctgg ggttgttcac tcattgccat 1050

<210> 71

<211> 1050

<212> DNA

<213> 人工序列

<220>

<223> 基因编辑同源性臂池_4_b0479_右

<400> 71

aggaaagtca ctttttcagg gttgcgatgt aaagaatgat cttatttgtg attattacca 60

gactaacata cctgtatgcg tcgtctgaag gaagtctcaa cgccgaatac agaatttcta 120

atctggatgc agatttatct tcaccggacg cagacttgtc tatgatgtcg cgtcatacta 180

tttttcaaca cgttgaaatc aggtcaggga gagaagtatg aaattattgc agcggggcgt 240

ggcgttagcg ctgttaacca catttacact ggcgagtgaa actgctctgg cgtatgagca 300

ggataaaacc tacaaaatta cagttctgca taccaatgat catcatgggc atttttggcg 360

caatgaatat ggcgaatatg gtctggcggc gcaaaaaacg ctggtggatg gtatccgcaa 420

agaggttgcg gctgaaggcg gtagcgtgct gctactttcc ggtggcgaca ttaacactgg 480

cgtgcccgag tctgacttac aggatgccga acctgatttt cgcggtatga atctggtggg 540

ctatgacgcg atggcgatcg gtaatcatga atttgataat ccgctcaccg tattacgcca 600

gcaggaaaag tgggccaagt tcccgttgct ttccgcgaat atctaccaga aaagtactgg 660

cgagcgcctg tttaaaccgt gggcgctgtt taagcgtcag gatctgaaaa ttgccgttat 720

tgggctgaca accgatgaca cagcaaaaat tggtaacccg gaatacttca ctgatatcga 780

atttcgtaag cccgccgatg aagcgaagct ggtgattcag gagctgcaac agacagaaaa 840

gccagacatt attatcgcgg cgacccatat ggggcattac gataatggtg agcacggctc 900

taacgcaccg ggcgatgtgg agatggcacg cgcgctgcct gccggatcgc tggcgatgat 960

cgtcggtggt cactcgcaag atccggtctg catggcggca gaaaacaaaa aacaggtcga 1020

ttacgtgccg ggtacgccat gcaaaccaga 1050

<210> 72

<211> 1032

<212> DNA

<213> 人工序列

<220>

<223> 基因编辑同源性臂池_4_b2470_左

<400> 72

ccaagcgtcg tctggaggtg ttgtatcagt gttcgcaggc gctgaacact agccagattg 60

atgtgcattg tttccgccat attttgcaga ttgttcgcga caatgaagcg gctgaatatc 120

tggagttaaa tgtcggtgaa aactggcgga ttagcgaagg gcaaccaaac ccggaattgc 180

cgatgcagat tttaccggtg acaatgcaag agacggttta cggcgaactg cactggcaaa 240

atagtcacgt ttcatcatca gaaccgctgc ttaacagcgt ttcgtcgatg ctgggacgcg 300

gtttgtactt taatcaggcg cagaagcatt ttcagcaatt attgttgatg gaagaacgtg 360

cgaccatcgc ccgcgaattg cacgactcgc tggctcaggt actttcttac ttacgtatcc 420

agttgacgtt actgaagcgt tcgataccgg aagataacgc caccgcacaa agtatcatgg 480

ccgatttttc ccaggcgttg aatgatgctt atcggcagtt acgcgagctg ttgactactt 540

tccgcctgac gctgcagcag gcggatctcc cctccgcatt gagggaaatg ctggatacgt 600

tacaaaatca aaccagcgcc aaactgaccc tcgactgccg tctgccaacc ctggcactgg 660

atgcgcaaat gcaggtgcat ttgttgcaaa ttattcgcga agcggtgctg aatgcgatga 720

agcacgccaa cgccagcgaa atcgccgtca gttgcgtcac cgcgccggac ggcaatcaca 780

cggtttatat ccgtgataac gggattggta tcggtgaacc gaaagaaccc gaaggtcatt 840

atggtctgaa tatcatgcgc gaacgcgcgg aacggctagg tgggacgctg actttttcac 900

aaccttccgg cggcggcacg ttagtgagta ttagctttcg ctctgcggag ggtgaggaaa 960

gtcagttaat gtaatgcctc ctactgacca aagaatactt gcacttaagg ttcagtataa 1020

aagggcatga ta 1032

<210> 73

<211> 1050

<212> DNA

<213> 人工序列

<220>

<223> 基因编辑同源性臂池_4_b2470_右

<400> 73

atggcgaatt tctttattga tcgccccatt tttgcctggg tgctggcaat cctgttgtgt 60

ctgacaggta ccctggcgat tttttcattg cccgttgaac aataccccga tctcgcgcca 120

ccgaatgtgc gagtgaccgc taactatccc ggcgcatcgg cccagacgct ggaaaacacc 180

gtgacccagg ttatcgagca aaatatgacc ggcctcgata atctcatgta tatgtcatct 240

cagagcagtg gcaccggtca ggcatctgtc actttaagtt ttaaagcagg caccgatccg 300

gacgaagccg tgcagcaagt acaaaaccag ctgcaatcag ccatgcgaaa gttaccgcag 360

gcggtgcaaa atcagggcgt gacggtgcgt aaaaccggcg ataccaacat tctgaccatt 420

gccttcgtct ctaccgatgg ttcgatggat aaacaggata ttgctgatta tgttgccagt 480

aatattcagg acccgttaag ccgcgtgaat ggcgtcgggg atatcgatgc ctatggttcg 540

caatattcca tgcgtatctg gctggacccg gcgaaactca acagtttcca gatgacggct 600

aaagatgtca ctgatgccat tgagtcacag aacgcgcaga ttgcggttgg gcaacttggt 660

ggtacacctt ccgtcgataa gcaggcgctc aacgccacca ttaacgccca gtcactgctg 720

caaacaccag aacagttccg cgatatcacc ttgcgggtca atcaggacgg ctcagaggta 780

aggctgggcg atgtcgccac cgtcgaaatg ggggcggaga aatacgatta tcttagccgc 840

ttcaatggta agccagcctc cgggctgggg gtaaaactgg cctccggcgc taacgaaatg 900

gcgacagcgg agctggtgct caatcgtctc gacgagctgg cgcagtattt cccgcatgga 960

ctggaataca aggtggcgta tgaaaccacc tcgtttgtta aagcctccat tgaagacgtg 1020

gtgaaaacgc tgctggaagc tatcgctctg 1050

<210> 74

<211> 1039

<212> DNA

<213> 人工序列

<220>

<223> 基因编辑同源性臂池_4_b1451_左

<400> 74

ccagttcacc acggtgtgtc cagcggctgt ctattccctg gtaatggcgt tgcagggtaa 60

tcacgccgcc cgcatgtgac gggttaagtt gtggtgccat gggtattgac tggtactggg 120

tcgtttctcg ctctccggca tacatcatca cactcatatc atcccgcgaa ctcaggctac 180

gctcatagcg caacccagcc tgagtttgct tgatggtttt tcgcgtgtcg tactgttctg 240

cacgaggcgc ttgttgtgga ttagccttcc attctgcttt ggttagccca cctgggtcat 300

ctgctttgat atccacacta ttgaaaatca gacttaattt gctggcttca tcaatgcgta 360

cgcccagttt ggcattggct aaatttttct gtgcgccact atggtcacga tagccgtggg 420

tcgtaaaacg cgtggttgag acggtgtaat cgacatcgcc aggctgtgtg ccgtctcccg 480

ttgcgcccgt tgctttcagc ccatagcgcc agctgccaaa actgccgtag taactactgg 540

cttcaatggt tggtggctgt tgtccggtct gggtggtgac attcattacc ccaccagacg 600

cgttgccata cagggcagag aaggggccac gcagcacttc cacattttgc acactgctta 660

aatcgatgtt ggatgtttgc ccttgcccgt cgggcatggt ggcgggaata ccgtccacat 720

acaggcgaat accgcgaata ccgtaagtgg agcgggagcc aaatccgcga atcgacagct 780

gtaaatcttg cgcatagttc tgccggtttt gtacctgcaa accaggcacg ccggtcagtg 840

attcggacaa gttaatgcgc ggtgttgcca ggcgcatctc ctcgccatcc accacgctta 900

ctgctgctgg ggtatccagt tctgaaacca cctgcggtgc ggcactgaca atcatagtct 960

gttcatcagc ggcaaaaaca acgggggaaa ggacaagcag tgcgggcaaa acggtctgtc 1020

ggacggaaaa aatcttcat 1039

<210> 75

<211> 1050

<212> DNA

<213> 人工序列

<220>

<223> 基因编辑同源性臂池_4_b1451_右

<400> 75

gaaaaaagcc aggttaagaa tgggaaaacg ccgtcatggt aatgaaattg taaatttatg 60

gaaaatgaaa cggcacaata cgttaagtaa ttgagaaaat tgtagtcgta acggcaagaa 120

atgctccaca tttgagaaaa taatgattac cattcccatt tataacaaga gcgtaacgat 180

gattacgctt agcgaagcat tgtgaagcag caaaaatatc ggttcatcaa agggagtcgt 240

catgcattta cgtcatctgt tttcatcgcg cctgcgtggt tcattactgt taggttcatt 300

gcttgttgtt tcatcattca gtacgcaggc cgcagaagaa atgctgcgta aagcggtagg 360

taaaggtgcc tacgaaatgg cttatagcca gcaagaaaac gcgctgtggc tcgccacttc 420

gcaaagccgc aaactggata aaggtggcgt ggtttatcgt cttgatccgg tcactctgga 480

agtgacgcag gcgatccata acgatctcaa gccgtttggt gccaccatca ataacacgac 540

tcagacgttg tggtttggta acaccgtaaa cagcgcggtc acggcgatag atgccaaaac 600

gggcgaagtg aaaggccgtc tggtgctgga tgatcgtaag cgcacggaag aggtgcgccc 660

gctgcaaccg cgtgagctgg tagctgacga tgccacgaac accgtttaca tcagtggtat 720

tggtaaagag agcgtgattt gggtcgttga tggcgggaat atcaaactga aaaccgccat 780

ccagaacacc ggtaaaatga gtaccggtct ggcgctggat agcgaaggca aacgtcttta 840

caccactaac gctgacggcg aattgattac catcgacacc gccgacaata aaatcctcag 900

ccgtaaaaag ctgctggatg acggcaaaga gcacttcttt atcaacatta gccttgatac 960

cgccaggcag cgtgcattta tcaccgattc taaagccgca gaagtgttag tggtcgatac 1020

ccgtaatggc aatattctgg cgaaggttgc 1050

<210> 76

<211> 1050

<212> DNA

<213> 人工序列

<220>

<223> 基因编辑同源性臂池_4_b1981_左

<400> 76

ggtgtcagga gttattgcga tataagcatc ttttatgatt gctgctgaac gtttaatcga 60

gggtggtaag gataaacggt agacattatt ataacaatcc actaatgccc tggctttatc 120

ttcacctttg ggtccatgaa cgatcactat tggtatatct gtttcacttt aaatttttgc 180

tattagattt tctgcaatcg ataatgaaaa tgtacgttcc tgcgagctac cttctaaatt 240

gaacgcaatg taagatccta acgatcgcat ttcctcgcgc acctcatcga gtacatcctc 300

acttagtggc aattcatata ttggcctgac tgctggaaaa cccgcctcac gcatcataaa 360

tgcccatgtc ataggtacgg gagcccggag tttctgatcc atactggacg cgttcttgca 420

caaaggggag aagcaattca tggttatacc aacaacctga aaattcgttt ttgctttcaa 480

ctgactgata aataacatcg ttttcaggtt ctttttacgc atcccctcaa tgcaaagatc 540

cggcgtaccg tattgctgtg ttatgttctt tgctaaatct tttatttctt ttaatgttgc 600

gtgatcctgc atagtcattg tgactaatgt taatttagtc tgttcaagtt taagcgcatt 660

aaagacttct aaattaattg tcgacgttac aattaaaaga tgcttaattt tatgcaattc 720

aagcgcccga ataacaggaa agatggccat agcatcgcca atctgatcgg gaatatggat 780

gacaacaaag tctgtttttt caatattgaa attataagct ttataatcgt agtaactaaa 840

tgcaatacgt ctcaacaatg atgctaaaaa catacctaac ctcgcctccc tactggttat 900

aatgcaatgc agtctatcag actcatcagg gtgccatttt gtgcatatgc ggacttttat 960

gtttcatatc tctaacctgt gggtcctctg cttaatcctt aaacaacacc agcaactcct 1020

gcgctttcat cttccatcga atttttcatg 1050

<210> 77

<211> 1036

<212> DNA

<213> 人工序列

<220>

<223> 基因编辑同源性臂池_4_b1981_右

<400> 77

atggactcca cgctcatctc cactcgtccc gatgaaggga cgctttcgtt aagtcgcgcc 60

cgacgagctg cgttaggcag cttcgctggt gccgtcgtcg actggtatga ttttttactc 120

tatggcatca ccgccgcact ggtgtttaat cgcgagtttt tcccgcaagt aagcccggcg 180

atgggaacgc tcgccgcatt tgctaccttt ggcgtcggat ttcttttccg tccgctcggc 240

ggtgtcattt tcggtcactt tggcgaccga ctgggacgta agcgcatgtt aatgctgacc 300

gtctggatga tgggcatcgc gacagccttg attggtattc ttccttcatt ctcgaccatt 360

gggtggtggg cacctatttt gctggtgaca ctgcgtgcca ttcagggatt tgcagtcggc 420

ggcgaatggg gaggcgcggc gttgctttcc gttgaaagtg caccgaaaaa taaaaaagcc 480

ttttacagta gcggtgtaca agttggctac ggtgtaggtt tactgctttc aaccggactg 540

gtttcattga tcagtatgat gacgactgac gaacagtttt taagctgggg ctggcgcatt 600

cctttcctgt ttagcatcgt actggtactg ggagcattgt gggtgcgcaa tggcatggag 660

gagtccgcgg aatttgaaca acagcaacat tatcaagctg ccgcgaaaaa acgcatcccg 720

gttatcgaag cgctgttacg acatcccggt gctttcctga agattattgc gctacgactg 780

tgcgaattgc tgacgatgta catcgttact gcctttgcac ttaattattc aacccagaat 840

atggggctac cgcgcgaact tttccttaat attggtttgc tggtaggtgg attaagctgc 900

ctgacaattc cctgttttgc ctggcttgcc gatcgttttg gtcgccgtag ggtttatatc 960

acaggtacgt taatcggaac gttgagcgca tttcctttct ttatggcgct tgaagcacaa 1020

tctattttct ggatag 1036

<210> 78

<211> 1050

<212> DNA

<213> 人工序列

<220>

<223> 基因编辑同源性臂池_4_b0237_左

<400> 78

cacaccgacg ttcagggagg tttcaaccac acctttggct acatcggagt tacgaatcac 60

accgttcggg gtggcgttca gcagacgaat aaaggtatcg cgagatttcg caatcagggc 120

agctttatcg ttcgctacag agtccagcaa caaggccaga tttttctctt tttctgccag 180

ctcgtttttc aggatctcct gataggtatt caccagagat ttcaggacgt cgactttatc 240

agctgcgaca gcaatggtcg caaaggcttc acgcgggatg gcgttacgca gtgtgccgcc 300

gttgaaatcg ataaggcgca gatccagttc ttccgcatga cccgccagga agcgcaccag 360

cagtttgttg gcattaccca gcccaacgtg gatttccccg ccggagtgac cgcctttcag 420

accttttaag gttaacttga aggtttcaaa accagctgga accgcttcac gatctaaatg 480

caggttggag gtgaagtcga taccccccgc acaacccatg tagatttcac cttcttcttc 540

ggagtcggtg ttaatcagaa tatcagcctg caaccagttg ccctgtaagc cgaacgcacc 600

gtccataccg gcttcttcgg tcatggtcag cagcacttcc agcgggccgt gaaccacgtt 660

ttcgtcagcc agaaccgcca gcgcagaggc cataccaatg ccgttatccg cacccagcgt 720

ggtgccgcgc gctttaaccc attcgccatc aatataaggc tggataggat ctttcgtgaa 780

gtcatgcacg gtgtcgttat ttttctgcgg caccatatcg aggtgggcct gtaagacgac 840

cggtttacga ttttccatac ctgcggtagc aggtttacga atcaggatat tacctacctg 900

atcgcgttcg acatggaaac ctttctcttt tgcccaacca acaatgtatt cagcgagttg 960

ctcttcatga taggacgggt gaggaataga acagattttg gcaaaaatat cccacagcgg 1020

ctgtggagat aattgagaca gttcagacac 1050

<210> 79

<211> 1039

<212> DNA

<213> 人工序列

<220>

<223> 基因编辑同源性臂池_4_b0237_右

<400> 79

catgtgaaat actggttttt agtgcgccag atctctataa tctcgcgcaa cctattttcc 60

cctcgaacac tttttaagcc gtagataaac aggctgggac acttcacatg agcgaaaaat 120

acatcgtcac ctgggacatg ttgcagatcc atgcacgtaa actcgcaagc cgactgatgc 180

cttctgaaca atggaaaggc attattgccg taagccgtgg cggtctggta ccgggtgcgt 240

tactggcgcg tgaactgggt attcgtcatg tcgataccgt ttgtatttcc agctacgatc 300

acgacaacca gcgcgagctt aaagtgctga aacgcgcaga aggcgatggc gaaggcttca 360

tcgttattga tgacctggtg gataccggtg gtactgcggt tgcgattcgt gaaatgtatc 420

caaaagcgca ctttgtcacc atcttcgcaa aaccggctgg tcgtccgctg gttgatgact 480

atgttgttga tatcccgcaa gatacctgga ttgaacagcc gtgggatatg ggcgtcgtat 540

tcgtcccgcc aatctccggt cgctaatctt ttcaacgcct ggcactgccg ggcgttgttc 600

tttttaactt caggcgggtt acaatagttt ccagtaagta ttctggaggc tgcatccatg 660

acacaggcaa acctgagcga aaccctgttc aaaccccgct ttaaacatcc tgaaacctcg 720

acgctagtcc gccgctttaa tcacggcgca caaccgcctg tgcagtcggc ccttgatggt 780

aaaaccatcc ctcactggta tcgcatgatt aaccgtctga tgtggatctg gcgcggcatt 840

gacccacgcg aaatcctcga cgtccaggca cgtattgtga tgagcgatgc cgaacgtacc 900

gacgatgatt tatacgatac ggtgattggc taccgtggcg gcaactggat ttatgagtgg 960

gccacccagg cgatggtgtg gcaacaaaaa gcctgtgcgg aagacgatcc gcaactcagt 1020

ggtcgtcact ggctgcatg 1039

<210> 80

<211> 1050

<212> DNA

<213> 人工序列

<220>

<223> 基因编辑同源性臂池_4_b2497_左

<400> 80

aataccggaa gcaccgatga caccataaag cagcagcgaa acgccgccca tcaccggcaa 60

tgggatcatc tggatagcgg cagccagttt accgacgcag gaaagcagga tagcgaaaat 120

cgccgccccg ccgataaccc aggtactgta aacacgggtg atcgccatca cgccaatgtt 180

ttctccgtaa gtagtatttg gcgtagagcc aaagaagccg gaaatcacgg tcgacaagcc 240

attagcaaac atcgaacggt gcagacctgg atcgcgcagc agatcttttt tgacgatatt 300

agccgttact accaggtgcc ctacgtgttc ggcaataacc actaacgccg ctggcagaat 360

agtcagaatg gcaaaccact cgaagcgcgg cgtatagagg gttggcagcg caaaccagtg 420

agcattaata atcggcgtgg tatcgacaat tcccattgcg aaagagagcg cgtaccccac 480

cagcacgcca attaaaatcg ggataattgc caggaaacca cgaaacagca cggaacctaa 540

aaccgtgacc gccagggtgg taatagagat gatgatggtt ttggagtctg gcgtttgccc 600

ttcagccggg agtaaacccg ccataccggc agctacgccc gccagctcca gaccgatgac 660

ggcaacgatt gcgcccattg ccgcaggtgg aaacagcacg tccagccagc cggtccccgc 720

tttcttcacg ataaaagaaa ccaggcagaa cagcacgccg cacataataa agccgcccag 780

cgcgacttca taccctaacg gcaacagtaa caataccggt gaaataaagg caaagctgga 840

accaagataa gccggaattt tccctttaca gatgaagaga tacagcagcg ttccaatacc 900

gttaaataac agtacagtcg ccgggttaat atgaaataag acgggcacca ggacggttgc 960

accaaacatg gcgaacaaat gttgcaaact aagcgggatt gtctgtaaaa gtggcggtct 1020

ttcactcacc ccgatagcac ggcgcgtcat 1050

<210> 81

<211> 1050

<212> DNA

<213> 人工序列

<220>

<223> 基因编辑同源性臂池_4_b2497_右

<400> 81

agtattatcc tctgtattat gtgttatagg cgctttactc aaaaaaaagc cgactcttaa 60

agtcggcttt aattattttt attctttatt tcgtaccaaa gattttgtca ccggcatcgc 120

cgaggcccgg aataatgtat ccgtgctcgt tcagtccctg atcaatcgat gcggtataca 180

gttcgacgtc cgggtgcgct ttttccagcg cagcgatacc ttctggcgca gctaccagca 240

ccagaacttt gatgctgctg cagcccgctt ttttcagcag gtcgatggtc gcgataacgg 300

aaccaccggt tgccagcatt gggtcaacga tcagcgccat acgctcatcg atgttagaaa 360

ccagtttctg gaagtacggt accggctcca gcgtttcttc attacggtac ataccgacaa 420

cgctgatgcg cgcgctcgga acgttttcca gcacaccgtc catcatacca agacccgcac 480

gcagaattgg cacaacggta attttcttac ctttgatctg gtcgatttct accgggccgt 540

tccagccttc gatagttact ttttccgttt cgaggtcggc ggtcgcttcg taagtcagca 600

ggctacccac ttcggaagcg agttcgcgaa agcgcttggt gctgatatct tgctcacgca 660

tcagtcccag cttgtgtttg acgagtgggt gtttgacttc cacgatcttc atactctttc 720

tcctttgagg ggcagccaca aaaaaaatcg acggattata cctcctttct tcaaggcggc 780

aatattcttt tcgttgactt tagtcaaaat gataacggtt tgagataaag ttattttata 840

ttcagatggt tatgaaagaa gattattcca tccgaaaact aacctttacc ctggcacaag 900

tcttctttcg ccgcgcgcct ggggaaaaga cgtgcaaaaa ggttgtgtaa agcagtctcg 960

caaacgtttg ctttccctgt tagaattgcg ccgaatttta tttttctacc gcaagtaacg 1020

cgtggggacc caagcagtga ccgataaaac 1050

<210> 82

<211> 1050

<212> DNA

<213> 人工序列

<220>

<223> 基因编辑同源性臂池_4_b4260_左

<400> 82

gttcagcact tcaacggttt gaccggacat ggtggttaac acatcgcccg gacgataggc 60

tcgtccgcca ggcatgtttt cgcagcctgc caacacgccg ataacgttaa tcggcagttg 120

tagctccgcg accatccgca tcacgccgta aaccgctgcc gcaccgcaca tatcgtactt 180

catctcatcc atgccttctg aaggcttgat cgagataccg ccggagtcga aggttaaacc 240

tttacccacc agcacgattg ggcgtgcatc ttccgacgcg ttgcctttgt actcaatcac 300

cgacatcagc gattcgtttt gcgaaccctg accgaccgcc agataggaat gcatccccag 360

ctctttcatc tgctgttcgc cgataacgcg ggtgatgaca ttcttgctgt agctgtcagc 420

cagctggcgc gcttgtgaag cgaggtaagc ggcgttacag atattcggcg gcatattgcc 480

gagatctttt gctgctttaa tcccggcggc aatcgccaga ccgtgctgga tcgcgcgctc 540

accgctggtc agttcacggc gggtcggcac gttgaacacc atcttacgca gcggacgacg 600

cggttcgctc ttgttcgttt tcagctgatc gaaactgtag agcgtctctt ttgccgtctc 660

gacagcctga cgcactttcc agtagttgtt acggccttta acgtgcagct cagtcagaaa 720

gcagaccgct tccattgagc cagtatcatt cagcgtatta atggttttct gaataacctg 780

cttgtactga cgctcatcca gctcacgttc tttgccgcaa ccaataagga gaattcgctc 840

ggaaagtaca ttcggaacat ggtgcagcaa caatgtctgc cccggttttc cttccagttc 900

gccccgacgt agcagggcgc tgatgtaccc atcgctgatt ttatcgagct gttctgcaat 960

cggagaaagg cgacgtggtt cgaagacgcc cacgacgatg caggcactcc gctgtttctc 1020

cgggctaccg ctttttacac taaactccat 1050

<210> 83

<211> 1049

<212> DNA

<213> 人工序列

<220>

<223> 基因编辑同源性臂池_4_b4260_右

<400> 83

tttacgggcg tatttaaagt gataatcata agatatctgg tgcgggagac gctcaaaagc 60

cagctggcga tactcttcat cttgcttttg atcttcttct gtcaaaagtt agtgaggatc 120

ctcggcgcag cggttgacgg cgatattccg gcgaatctgg tgctctccct tctcgggttg 180

ggcgtgccgg aaatggcgca gcttatcctg ccattaagcc tgttcctcgg gctgctgatg 240

acgctgggca aactgtatac cgaaagtgaa attacggtaa tgcatgcctg cggcctgagc 300

aaagcggttc tggtgaaagc ggcaatgatc cttgcggtat tcacggcaat cgtagcggcg 360

gttaacgtga tgtgggcggg accgtggtca tcgcgtcatc aggatgaagt gttagcagaa 420

gcgaaagcga accctggcat ggcggcgctg gcgcaagggc aattccagca agcgactaat 480

ggcagctcgg tgctgttcat cgaaagcgtt gacggcagcg atttcaaaga tgtgttcctc 540

gcgcaaattc gaccaaaagg taatgcacgt ccttctgtgg tggtggccga ttccggacat 600

ttaacccagc tgcgcgacgg ctcccaggtc gtcactctca accagggaac gcgcttcgaa 660

ggcactgcat tgttacgtga tttccgcatt acggacttcc aggattatca ggcgatcatt 720

ggtcaccagg cggtggcgct cgacccgaac gataccgacc agatggacat gcgcacattg 780

tggaacactg acaccgatcg tgctcgcgca gaactgaact ggcgtatcac gttggtattc 840

accgtgttta tgatggcact tatggtcgta ccgctgagcg tggttaaccc acgtcaggga 900

cgcgtactgt cgatgctgcc agccatgctg ctgtatctac ttttcttcct gatccagacc 960

tccctgaaat cgaacggcgg taaaggtaag ctggacccga cgctgtggat gtggaccgtt 1020

aacctgattt atctggcttt agcgattgt 1049

<210> 84

<211> 1050

<212> DNA

<213> 人工序列

<220>

<223> 基因编辑同源性臂池_4_b1412_左

<400> 84

aatgactgct ggtgtttatt taggggcgtt tccacgacat attccggcac agaatgcggt 60

tctggacgtc acctttgaat tccctcgcgg acgagccaca aaagatcgac tctatttttg 120

tgtaccgatg ctggatctgg tggttccgga agagggggag ctccgacagg ccgtggcgat 180

gctggaaaca ttacgcgaag agcaaggcag cgttctggtc cattgtgcat tgggattatc 240

gcgcagtgcg ctggtggtgg cggcatggtt gttatgttac ggacactgta aaaccgttaa 300

tgaagcgatt agctatattc gagccagacg cccgcagatt gtgctgacag acgagcacaa 360

agcgatgctg agattatggg aaaacaggta agtggattga gatgtggact gaatatctac 420

agtccacatc aagaccgtgt ccggttatgc agaaacaatg ctgtcgatgg ctgcttttgc 480

gtcagactgt gctttcgctg ccatttccgg accgtatgcg atcccttcgg cgaagacaaa 540

tttcacatcg gtaatgccga taaagccgag gaacgtggac agatacggcg tcaccaggtc 600

cgttggtcca tctttgtgga tcccgccgcg gctggtaata acgatggctt ttttacccgt 660

taccagacct tccggaccgt tctcggtata gcggaaagta acgcctgcgc gggcaaccag 720

gtcaaaatag tttttcaact gagtcgagat gttgaagtta tacatcggtg ccgcaataac 780

gataacgtcg tgggctttca gctcggcaat caactcatcg gaaagtgcca gagcttcctg 840

ctgacgcgga gtcagcggcg catcgctcgg acgcagagcg ccaaccagtt cgccatccag 900

taccggaatc ggatttgcag ccaggtcgcg aacggtgatt tcatcagcgg agtgcttttc 960

gcgccattgt tcaacaaaat aatcggacaa ctgattagac tgagagtacc ctgccaggat 1020

gctggattta agaactaata ccttgctcat 1050

<210> 85

<211> 1050

<212> DNA

<213> 人工序列

<220>

<223> 基因编辑同源性臂池_4_b1412_右

<400> 85

gaatttattg aacaacgcat agaaagccgc gatgtggtac tctatatcta tcatttaaaa 60

gaaaattaat caggcagact actgcccact aacgttatga cagaacaaca aaaattgacc 120

tttacggcct tgcagcagcg gctggattcg ctgatgctgc gtgacagact gcgtttttct 180

cgccgtctgc acggcgtgaa gaaggttaaa aatcctgatg cacaacaggc cattttccag 240

gagatggcga aagagattga ccaggcggca gggaaagtcc tgctgcgtga agcggcacga 300

ccggaaatta cttatcctga caatttaccg gttagtcaga aaaaacagga cattctcgaa 360

gcgattcgtg atcaccaggt ggtgatcgtc gccggggaaa cgggttctgg taaaacgact 420

cagttaccga aaatctgtat ggagctgggg cgcgggatta aaggactgat cggccatacc 480

cagccgcgtc gtctggcggc aagaacagtg gcgaaccgta ttgcggaaga gctgaaaacg 540

gagccgggcg gttgcatcgg ttacaaagtg cgtttcagcg atcacgtaag tgataacacg 600

atggtcaagc tgatgaccga cggtatcctg ctggcggaga tccagcaaga ccgcctgctg 660

atgcagtacg acactatcat tattgacgaa gcgcacgaac gcagcctgaa tatcgatttt 720

ttgctcggct atttgaaaga gttgctgccg cggcgtcctg acctaaaaat cattatcact 780

tccgcgacta tcgacccgga acgcttttcg cgccacttta ataatgcgcc gattattgaa 840

gtctccggtc ggacctatcc ggtggaagtg cgctatcgcc cgattgttga agaagccgat 900

gacaccgagc gcgatcagtt gcaggcgatt tttgacgccg tagacgaact gagtcaggaa 960

agccatggcg acattctgat ctttatgagc ggcgagcggg aaatccgcga taccgccgat 1020

gcgctgaaca agctgaactt acgccatacc 1050

<210> 86

<211> 1050

<212> DNA

<213> 人工序列

<220>

<223> 基因编辑同源性臂池_4_b4139_左

<400> 86

aacagtggtg tcgttaccga tgactttgaa gcatacctgg ttaaccactt ccggaacaac 60

cgggtttact ttagctggca tgatggaaga gcccgcctgc agttccggca ggttgatctc 120

gttcaggccg gcacgtgggc ctgaagagag caagcgcagg tcgttacaga ttttggacat 180

cttcacagcc aggcgtttca gcgcgccgtg aaccataaca taagcgccgc agtcagaggt 240

cgcttcgatc aggtcttcag ccggtacgca tgggaagcca gtaacttcag ccagtttttt 300

cactgccagc ggagagtact ctttcggcgt gttcagacca gtaccgattg ctgttgcacc 360

aaggttaact tccagcagca gttcagcggt acgttggatg tttttcactt cttctttcag 420

caggatgctg aaagcgcgga attcctgacc gagggtcatc ggtactgcgt cctgcagctg 480

ggtacgaccc attttcagga tgtcctggaa ttcgacagct ttacgttcaa agccttcacg 540

cagttggtta atcgcatcta ccagcttaat cagggaagag taaactgcga tacggaaacc 600

ggtcgggtag gcgtcgttag tggactgaca tttgttaaca tggtcgttcg ggttcaggta 660

ctgatattca cctttttggt gacccatcag ttccagaccg atattggcca gcacttcgtt 720

ggtgttcatg tttacggaag tacctgcgcc gccctggtag acgtctaccg ggaactgatc 780

catgcatttt ccgttgttca ggacttcatc acatgcggca atgatggcat tcgctacact 840

tttaggaatg gtttgcagct ctttgtttgc catagctgcg gcttttttaa ccattaccat 900

accgcgaaca aattcaggaa tatcactgat tttgttgttg ctgatataga agttttcaat 960

cgctctcaga gtgtgaacac catagtaggc atcagctgga acttccctgg tacccaacag 1020

atcttcttcg atacgaatgt tgtttgacat 1050

<210> 87

<211> 1041

<212> DNA

<213> 人工序列

<220>

<223> 基因编辑同源性臂池_4_b4139_右

<400> 87

ttttacccct taattattaa tttgtgaaat agatcaccgc tttgggatta ctaccaaaaa 60

tagttgcgca aacatcttga aattttgcta atgaccacaa tataagctaa acgcgattcg 120

caacccattc aggtagccgg ggttaaccgg ctgctattac aggagaaacc tttgcgctgg 180

ttacctttta ttgccatttt cctttatgtc tatattgaga tttcaatctt tattcaggtt 240

gcccatgtat tgggggtatt gctgaccctc gtgctggtta tattcacgtc agttatcggt 300

atgtcactgg tacgtaacca gggctttaag aatttcgtgc tgatgcagca aaaaatggcg 360

gcgggtgaaa acccagcggc ggagatgatt aaaagtgttt cgctgatcat tgctggtttg 420

ctgcttttat taccgggctt ttttaccgac ttcctcggtc ttctactttt attgccgccg 480

gtgcaaaagc atctgacagt gaagttgatg ccgcatttgc gcttttctcg catgcctggc 540

ggcggtttta gcgccgggac cggtggcggt aatacttttg atggtgagta ccagcgaaag 600

gatgatgagc gcgaccgcct tgatcataaa gacgatcgcc aggattaatg tcgaaacgcc 660

ggattatgtg gttatgccat tttccggcgt ttttcgtttt ggcagcaaca gccataaccc 720

cgccagcatg atcagcgcat agagactttt ccagccgacc attgccagta acagaacgca 780

taacagcccg ccaaccaccg ccagtagtcg ataacgtcct tgcaataatt tacagcctgc 840

cagcatgcat aacagataaa tcataataaa gatgccattg gcataaataa taagagcgtc 900

cagattgatc tctaaagcat gaatcaccaa agtgctcacc acacagcagc cgagcaccgc 960

attgagggca ttattcggga tatggcgaga agagaggcgt gccaggtagt ggtcaggatt 1020

atgttgcgcc tgcgaccaga c 1041

<210> 88

<211> 1044

<212> DNA

<213> 人工序列

<220>

<223> 基因编辑同源性臂池_4_b2039_左

<400> 88

ttgatgaacg tgagtgattg tcttgaacaa agctgaccgg atagcctaga atatgttcaa 60

atgctgattg attaaagctc tcataaaaga aacctctatc atcaccaaat actcttggct 120

ccagaattag cacatcttca atttcagttc taatcacatt cattaatttg aatccttcgt 180

cattttataa agatactgcc cataattatt ctttattagt ggtacagcta attttcttac 240

ttgctcaaca tcaataaaac ctttacgaaa tgcaatctct tcaggacagg aaaccttcaa 300

tccctggcgc tcttcaattg tcgcaataaa attacttgct tctatcagac tctgatgagt 360

ccccgtgtcc agccacgcgt agccacgccc catcatcgcg acagacagac gtccctgctc 420

aagataaata cggttaatat ctgtaatttc taactcacca cgtgcagacg gcttcaagtt 480

tttcgccatc tgaaccacgt cgttatcata aaagtacaga cctgtaacgg cgtaattact 540

ctttggttct aacggttttt cttccagact gattgccgta ccgtttttat caaactcaac 600

gacaccatag cgttctggat cattaacgtg ataggcaaat accgttgcac cactttcttt 660

gttaacagcg gcctccatta gcttcggcag atcgtgaccg taaaagatat tatcaccaag 720

aaccaaagca caatcatcac caccaataaa ctcttcaccg atgataaatg cctgcgcgag 780

gccatctggg ctaggttgca ctttgtactg aagattcagg ccccactggc taccgtcacc 840

cagcaattgt tgaaaacgag gagtatcctg aggtgtactg ataatcaaaa tatcgcgaat 900

acccgccaac atcagtgtag agagcgggta atagatcatc ggtttatcat aaataggtaa 960

tagctgttta ctgacagcca tagtcacagg ataaagacgt gtaccagaac cacccgctaa 1020

aataatacct ttacgcattt tcat 1044

<210> 89

<211> 1050

<212> DNA

<213> 人工序列

<220>

<223> 基因编辑同源性臂池_4_b2039_右

<400> 89

ttcatcattc cttttaattc atcttgctcc accatcacga acaagatgca aaaactatta 60

aattgctgta gtcgtaaata attcattgag cattcgtttc acgccaacct gccagtcagg 120

caagacaagc gcaaagttct gctgaaattt ttctgtatta aggcgagagt tatgtggacg 180

acgagctggt gtaggatagg ctgttgttgg tactgcgttg agcttgttga gtgcaagggg 240

aatgcctgct ttgcgcgcct cttcaaaaac cagcgcagca taatcgtacc aggttgtggt 300

accactggct accaaatggt acaagcctgc gacatccggt ttattcagtg cgacacgaat 360

ggcatgtgct gtacaatcag ccagcagttc agcacctgtt ggcgcaccaa actgatcgtt 420

aataaccgct aattcttcac gctcttttgc cagacgtaac atcgttttgg cgaagttatt 480

tccttttcct gcatagaccc agctggtccg gaaaataaga tgcttcgcgc aatattcctg 540

taacgctttt tctccggcta acttggtttc accgtaaaca tttagtggtg cggttgcatc 600

cgtctccagc catggcatat cgccatttcc agggaagacg taatcagtcg agtaatggat 660

aacccaggct ccaacttcat ttgctgcttt cgcaatcgct tcgacacttg ttgcgttaat 720

taattgtgca aactccggtt ctgattctgc tttgtctact gcggtgtgag cggctgcatt 780

gacaataata tccggccgaa tgcttcttac ggtttcagct acaccttcag gattactaaa 840

atcaccgcaa taatcagtag agtgaacatc aaaagcaatc aaattaccca aaggtgccag 900

agcacgctgt agttcccaac ctacctgccc tgttttgcca aaaaggagga tattcattac 960

tggcggccct catagttctg ttcaatccac gattgatagg caccactttt cacattatca 1020

acccattttg tattggacag gtaccattcc 1050

<210> 90

<211> 1050

<212> DNA

<213> 人工序列

<220>

<223> 基因编辑同源性臂池_4_b4473_左

<400> 90

catcacccgc ccatagtgag cgttggattg gtgcagcacc gcgccagcgt ggcagcagtg 60

aaccatgaac gttgatacag ccaagacgcg gcatctccag cactgctttc ggcagaatta 120

aaccataggc gacgacgacc ataacatcag cctgcagttc ggcgaccagt tgctggtttt 180

cttgtggacg cagggaaaca ggttgaaaaa cgggcagacc tttttcctca gccagaactt 240

taaccgggct gggcatcagt tttttaccgc gtcctgccgg tcggtctggc tgggtgaaca 300

cgccaacgac gttatgacca gaagacaaca gcgcgtcgag atgacgcgct gcaaagtcag 360

gtgtacccgc aaaaataata cgtagtgatt ctgacacgtt agttcttatc cttaagcccg 420

ggctttcaga cgatccagtt tttcaacttt ctgacgaata cgttgttgtt tcagcggtga 480

cagataatcc ataaacagtt tgccgaccag gtgatccatc tcatgctgaa tacagatggc 540

taacagaccg tctgcttcca gttcaaatgg tttaccgtcg cggtcaaggg cgcgaatttt 600

aactttctct gcgcgcggca ctaaagcacg ttgttcaggg atcgacaggc aaccttcttc 660

aatgcctgtt tcgccgcttt tttctaaaag ctctggattg attaacacta gccgttcgtc 720

acggttttcc gaaacatcaa taacaatgat acgttgatgg atatcaacct gggttgccgc 780

caggccaata ccttcttctg cgtacatcgt ctcgaacata tcatcgacga tacgctgaat 840

ttctgcattc acttcttcta ccggtttagc aactttgcga agccgctcgt ccggaatatg 900

taacacttgc aaaactgaca taaatctcca gagatgtgtt caggagttag aaagattatt 960

tcttctattc tagacaaatc cccctctgat tgacagcatc actgaccaat cgcaaagatt 1020

gctaaggctg cttatggcag ggagataagg 1050

<210> 91

<211> 1050

<212> DNA

<213> 人工序列

<220>

<223> 基因编辑同源性臂池_4_b4473_右

<400> 91

atggtcgata cagaaatttg gctgcgttta atgagtatca gcagcttgta cggcgatgat 60

atggtccgta tcgctcactg ggtggcaaaa cagtcgcata ttgatgcggt tgtattgcag 120

caaacagggc ttacattgcg gcaggcacaa cgctttcttt catttccacg aaagagtatc 180

gaaagctcac tttgttggtt ggagcaaccc aaccatcatt taattcctgc ggacagcgaa 240

ttttatcctc ctcaacttct ggcgacgaca gattaccccg gcgcactgtt tgttgaagga 300

gaactgcacg cgctgcattc atttcagctt gccgtagtgg ggagtcgggc gcattcatgg 360

tatggcgagc gatggggacg attattttgc gaaactctgg cgacgcgtgg agtgacaatt 420

acgagtggac tggcgcgtgg aatcgatggt gtagcgcata aagcagcctt acaggtaaat 480

ggcgtcagca ttgctgtatt ggggaatgga cttaatacca ttcatccccg ccgtcatgcc 540

cgactggctg ccagtctgct tgaacagggg ggcgctctcg tctcggaatt tcccctcgat 600

gttccacccc ttgcttacaa tttcccacga agaaatcgca ttatcagtgg tctaagtaaa 660

ggtgtactgg tggtggaagc ggctttgcgt agtggttcgc tggtgacagc acgttgtgcg 720

cttgagcagg ggcgagaagt ttttgccttg ccaggtccaa tagggaatcc gggaagcgaa 780

gggcctcact ggttaataaa acaaggtgcg attcttgtga cggaaccgga agaaattctg 840

gaaaacttgc aatttggatt gcactggttg ccagacgccc ctgaaaattc attttattca 900

ccagatcagc aagacgtggc attgccattt cctgagctcc tggctaacgt aggagatgag 960

gtaacacctg ttgacgtcgt cgctgaacgt gccggccaac ctgtgccaga ggtagttact 1020

caactactcg aactggagtt agcaggatgg 1050

<210> 92

<211> 1046

<212> DNA

<213> 人工序列

<220>

<223> 基因编辑同源性臂池_4_b3510_左

<400> 92

aatcaacgcc agttgcaaaa aaatgaaccc ggattactta tttaaccgcc catagcatca 60

acgcttacgg aactctttgt tcactttccc acagcacttt taaaacatta aacctgacta 120

cggaaaatat cagccatgat aatgtttgaa atggctaatt tgccatagag tgaaaaaaat 180

tagatgaaat tcagtaggtt gaaataatca ctagcaggta attatttcaa tgatagtgcg 240

caattgatct acaacactgc gtagcggaga gagtattaat cggatcatag tcacatcaag 300

tgactatgat ccgggtgaca accggggtaa ttattgctgc ttaacgaaca aactggcgaa 360

gctgaacagg ctggcggcgc taaatatcag ttcaattccc accagtgtgg aaaccagcgt 420

tacagacacc atcggcgttg caccaaggaa tatccaggca atgacgatat ccagcacacc 480

aataacgagc tgtagccagc tgcctttcat tgaacgctga cgataccaac tcatcaggcg 540

aataacccct gcaacacaga acaaaccggc aataaatgcc gcaatggcaa aaatgcccag 600

ctccggtgcg cggatgaaga aatagccgat caataaatag gcgactgcga cgaggaaacc 660

ggataatacc ggccagaaat tatgactgcg gttgctgaat aacccgacaa taagcgcaat 720

acccgagcag attaataatg cacccactac tgtgcttaaa atatcgccag agacgaacgg 780

gaaactgata cacagcaacc cgacgataaa cagcagcacg gcaataaact ggattgctct 840

gcgatgtttt ttaagcatct ccagatcaaa cttcaaaatt gttgccttat ctatatataa 900

catagaacca ccctataaaa ttaagaagaa aatcccctgc tatcaatcta tgccaaaaac 960

gcgtctaaga atgcagtcga tttaataaaa atttcctaat tgcagtatct gatgcatctg 1020

taactcattg tattgaaata aaaata 1046

<210> 93

<211> 1045

<212> DNA

<213> 人工序列

<220>

<223> 基因编辑同源性臂池_4_b3510_右

<400> 93

atgaaaaaag tattaggcgt tattcttggt ggtctgcttc ttctgccagt tgtgagcaat 60

gcagcggatg cgcaaaaagc agctgataac aaaaaaccgg tcaactcctg gacctgtgaa 120

gatttcctgg ctgtggacga atccttccag ccaactgcag ttggttttgc tgaagcgctg 180

aacaacaaag ataaaccaga agatgcggtt ttagatgttc agggtattgc aaccgtaacc 240

ccagctatcg ttcaggcttg tactcaggat aaacaagcca actttaaaga taaagttaaa 300

ggcgaatggg acaaaattaa gaaagatatg taattccggg aatgcgttac atcgtacttc 360

cttgcatatt gaacaggccg gaatatcttc tttaaaagca gctattcctc ctgttcatat 420

ataatctcta tattgaatgg gttacaaaat gaatatttca tctctccgta aagcgtttat 480

ttttatgggc gctgtagcgg ctttgtcact ggtgaacgca caatctgcgt tggcagccaa 540

tgaatccgct aaagatatga cctgccagga atttattgat ctgaatccaa aagcaatgac 600

cccggttgca tggtggatgc tgcatgaaga aacagtatat aaaggtggcg ataccgttac 660

tttaaatgaa accgatctca ctcaaattcc taaagtgatc gaatactgta agaaaaaccc 720

gcagaaaaat ttgtatacct tcaaaaatca agcatctaat gacttgccga attaatgagg 780

tgcaagtaaa aaggagtagc aagttgagcc atcttgctgc tcctttttgc atttttatat 840

gacagcagaa tttattatac gtcttatact cgcggcaatt gcctgtggcg ctattggcat 900

ggaaaggcaa atgcgcggca aaggagcagg gttacgcaca catgtattaa ttggcatggg 960

aagcgccctg tttatgattg tttcgaaata tggttttgct gacgtgctgt ctttagatca 1020

cgtcggactc gaccccagcc gtatt 1045

<210> 94

<211> 1050

<212> DNA

<213> 人工序列

<220>

<223> 基因编辑同源性臂池_4_b1007_左

<400> 94

tcattaccgc catccagcta tcaaaggccg aagccgatac acttttcact gcgataggcg 60

ctaagttcag gccaatcgcc atcaccaccg cacccgtcac caccggcggc atcagtcgtt 120

caatccagcg cgtaccgatt ttcatcacca ccaggccaat gacggtataa accagcccac 180

aggcgataat cccgcccagc gcaatgctga tattcgggtt aatgccctga ccgttaaagc 240

ccgtcgcggc gatcaccacg ccgacaaaag ccgcgctgga gccgagataa ctggggacgc 300

gcccgccggt aataaagaaa aacagtaacg tgccgatccc cgacattaaa atggaaagat 360

tgggatccag ccccatcaga atcggcatta acaccgtcgc gccaaacatc gccaccgcgt 420

gttgaacgcc cattactgcc gtctgagcaa acggcaatcg ttcatccggc gcgaccacgc 480

cgctctctgt agaggtcgat tttaactgcc agtgaggaaa accgaacatt gccatcagct 540

gtctccttaa ggaggttaac aagcagggcg catcagcgcg tgataactgc gatcgaacca 600

caccagcccg tagggtgtgg tgtgacgatg aatcgcttcg atggcgcaaa acagaatgtc 660

gtgggtgccg acgctcacca cctggctgat acggcagtca aacgaaacca gagcctcttc 720

cagttgcggg catccggtca cccccgtctg ccagcgggcg gcggcaaagc ggtgttccat 780

gggcgttttg ccgccaaaaa ggtttgaaag cggctcctgc ccggcgctaa gtgtatttac 840

acacagcgtt cgattttcat tgaatgccgg ccagacggac gccccacgat tcaggcacac 900

cagtaatgtg ggcggcgtat cggtcacact gcagacggcg ctggcggtga acccggcgcg 960

cccggctgga ccgtccgtgg tgataatatt gaccgccgcg cccatgcagg acatcgcatc 1020

gcgaaaagtt tgttgatcga caatgttcat 1050

<210> 95

<211> 1049

<212> DNA

<213> 人工序列

<220>

<223> 基因编辑同源性臂池_4_b1007_右

<400> 95

agtttgctcc ttacaacagc ccgcaggctt cttcaaagga cagacgtggc aggcgcgcat 60

aaagcttgct gctatcgcca tagccgatat taatcagcag attgctcttc agcgtgctgc 120

ccgtaaaaaa ggcgtcgtcc acgtgttgac ggtcaaagcc cgacatcggg ccggtatcca 180

gtcccagcgc ccggcaggcg acgatcagat aggccgcctg catggaactg ttgcgaaacg 240

ctgtttcttc ggcaagttgt gggctggagg taaaccaact gcgggcatca ccgtggggaa 300

acagtagtgg taaccgttca taaaattcac tgtcccaggc gacgatagcg gtgacgggcg 360

cggtcagggt tttttgcaga ttgccgctgg aaagtgccgg gcgcagacgt tcttttcctt 420

ctgccgtgcg ggtaaacacg atccgtgccg gagaacagtt agctgatgtc ggcccccatt 480

tcatcagggc ataaatctcc cgtaacgtct catcgctgac gggtgtctcc cgccagccgt 540

tgtgagtgcg ggcatcggtg aacagggtgc taagcgcacc tgggctaacg gcttcgttca 600

tagcaattcc ttacagggcg gcttcacggt gatgtaacag gctggcaagc ccgttgagta 660

acagagcatt aaacgtttcg ggatcggtca cgttgcaggc gtgtccgcca tagggcatca 720

ccattttctg gctatcgggc agggcggcat gaagttcact ggaacatgct gttggcacca 780

gcagatcatc actggcgcag atgatttgca ccgggcagcg gatgcgatcc gcatggtgac 840

taaagtcagc gcgtttgagg gcgttaagtc gacgcagtaa attatttttg ccctgaaaat 900

gcgccagtgc cagcgcgtct tctgcctcca ggcgaggtgc gcgggccgcc atccagtcgg 960

cgggatagag gaacaacggc tgcgcttcca cccatgcctg cgcgccgccg ctatacagta 1020

atcgttcgcg aacctgaaaa cagcggcgc 1049

<210> 96

<211> 1050

<212> DNA

<213> 人工序列

<220>

<223> 基因编辑同源性臂池_4_b3058_左

<400> 96

ggaacgaaaa ctcggaagca gcgtaacggc tcacccccat cagcatccca cctgaaatgg 60

tcgccccgga acgggagaaa cccggccaca gcgccagaca ctggaaacag ccaatcataa 120

atgcctgacg ataggtcata tcatcaagac ccggcgcacg cggctctttc ggcttcaggc 180

attcggcggc aatcagcaac aaaccgccaa cgaccagcgc atacatcaca tttatcgggt 240

taaacaatga cttaatcgtg tcgtggaaca acagccccaa taccaccgcc ggaatcatcc 300

ccagcaaaat gtggatcagc gttaaacgac ctttgctttc accttcgtgc tgcaacgggc 360

ggccaaagtg gatgccaatc aggccaaaca gacgccgcca gaacatcact actaccgcca 420

gaattgatcc taactggatc acaacttcaa aggttttcgc cgtgtcgccc tcaaacccca 480

acaagtgacc gacaataatc atatggcccg tgctggatac cggcagaaat tctgtcaatc 540

cttcgaccac acccaatatt gccgctatca gcagcgagtg catatcgctc atcaataaac 600

ccctaaatta ttaaaatgta ccgcttgtcc gaactactgc gtatgaccag gttataaccg 660

tttggtttaa cagctgtaaa attaattatt ttctttcaga ttattgccac gctcaatgat 720

tacgccaaca ttcgccgccc gcgccactgc gcctggcttg ctgagtttga tacgcaccca 780

cggcgagttg aagcgtgcta acagcagctc cgccacctct tcagccacgc gttccaccag 840

cgcaaaacgc gccccctcga cgtggctgac caccgtttct gcaatgtcag cgtaactgag 900

gcaatccgcc acatcatcac ttttcgccgc tttacggtta tcccacgcca tttcgatatc 960

gaacactaac ttctgttcga tggtctgttc ccagtcgtaa acaccaatag tggtgattac 1020

cgaaagttgc tctataaata caatatccat 1050

<210> 97

<211> 1050

<212> DNA

<213> 人工序列

<220>

<223> 基因编辑同源性臂池_4_b3058_右

<400> 97

cacgtcctgc ctgctttttg gctaaccgga taccacttcc ggcgaaatgt gcgtattatc 60

cacagattca tcgttgaaca cgaattttca aaacggaaca gcttatgagt gcaatcgcgc 120

ctggaatgat cctcatcgcg tacctctgcg gctccatttc cagtgccatt ctggtttgcc 180

gcttgtgtgg gctgcccgat ccgcgaacca gcggctccgg caatccaggc gcaaccaatg 240

tgttacgtat cggtggcaag ggagcagccg tagcagtact gattttcgac gttctgaaag 300

gaatgttgcc cgtctggggc gcgtatgaat taggtgtcag ccccttctgg ctaggcttaa 360

ttgccatcgc cgcctgtctt ggacacatct ggcccgtttt cttcggattt aaaggaggaa 420

aaggcgttgc taccgctttt ggtgccatcg cacccattgg ctgggatctc accggagtaa 480

tggcgggaac ctggttactg accgtgctat tgagcggata ctcgtcgctg ggagcgattg 540

tcagtgcact gattgctccg ttttatgtct ggtggtttaa gccacaattc accttcccgg 600

tttcgatgct ctcttgcctg atcctgctgc gtcatcatga caacatccaa cgtctgtggc 660

gtcgtcagga gacaaaaatc tggacgaaat tcaaaagaaa gcgcgaaaag gatcccgagt 720

gatttctggt ggatctacat gacctgatag ccttcatcgg gcttgcccag ccgttgctgg 780

caccatgccg ccagaaattc cacgcagaca cgtaatttca tgctgcgata gagcggctcc 840

cggtaaacag cccagatatt ggcgctttgt gcatactctg gcaatacttg caccagtttg 900

ccactctcca gaaacggcaa cacatcccac tcggaacgca gcataatccc tttgccctcc 960

agcgcccatt gcagcacaat ctcgccgcta ttggaggaaa gatgcccgct taccttcacc 1020

gattttttct cctgaccgtt ccccaactcc 1050

<210> 98

<211> 1050

<212> DNA

<213> 人工序列

<220>

<223> 基因编辑同源性臂池_4_b2688_左

<400> 98

gaggaatcgc acctgctgtt catctacacc aatcggcgag aacgggttga tgtccagcga 60

acgcacttca atatattcaa tgccgccacg taacagcgca tcagaaggcg actcgccgct 120

gcgggtaacg cgttttggac gaatcggcgc gtacagttcg ttttcaatct gcaacacgtt 180

gctgttgatt tgcagcctct taccgtcttt ctcaatacca atcttcgcgt actcttccga 240

tggcgttttg attgcctgtt taaggcccgc tacgtactcg taaagatcgt tgaaggtaat 300

accaagattg ctttgcgatt tattggtata gccgagatcg ctcaaacgaa gagaggtcgc 360

atacggcagg taatacatac cgcactcggt tttctcaaac ggcagcgacg ttggttttcc 420

ttgcaggaaa gaagaacaaa tcgccggaga tgcaccaaac agataaggaa tgacccaacc 480

gaaacgatag taattgcgga taacgcggaa atagcccgca gaaattttct ctttggcatc 540

agcgcccgag atatcaccgc acttcgcttg ccagaatgcc attggcaaag agaaattgta 600

gtgcacgccg gaaatggttt gcatcagcgc gccgtagcga tttttcagcc cttcacgata 660

cagcgtttta aagcgtccgg tgttagaagt gccgtactgt gccagttcga tgtcctgacc 720

ttctgcgatg tagcatggca tacttaacgg ccacatccgc tcatcgccca tattgcgcgc 780

cgtataacga tgcagatcgc gcataaaggt cagcatatgt tcaatatcac catccactgg 840

tgtaatgaat tccagcaatg cttccgcaaa atcggtagta atccatttgt gcgtcagtgc 900

ggaacctaat gcttcaggat gacctgttgt tgccagtgtg ccatcagcat taacacgcaa 960

agtttcgcgc tccagcccac gctgtatccc ctttaacgcc tgaggatgtt tttccagcca 1020

ggccagcgcc tgtgatacgt ccgggatcaa 1050

<210> 99

<211> 1039

<212> DNA

<213> 人工序列

<220>

<223> 基因编辑同源性臂池_4_b2688_右

<400> 99

attgacctcc cgcctgtcaa aatcgtttta attagcataa ctgtaatggt gaccatatgt 60

gcaggcctac aattagtgcc accacatcat gccctgaacg gtcgctgctg caactgcaac 120

atagcgtaac gctttaccaa ggcacaaaaa aaagattacc ggtccccacg agatgcgcat 180

ccatcccgct aacagacaca gtaaatcgcc aaccacgggc atccagctta ataatagcgt 240

gactgcacca tagcgtttca gccagccggt agctttctct tgccagcgcg atgttttacg 300

caatggaaag aaacgcccaa ggataacgtt agttaaccct ccaaggctat tacccattgt 360

tgctgttaaa actaaaaccc agggatgact gatcccggaa agcaacattg ccaccagcac 420

gacttcggag ttgccgggta atagtgtagc gctgagaaaa ctactggcaa acaacgagaa 480

aagcgataac gcttcactca cagcaagcga acatccacgg cgtccatgcc tgctgcacgg 540

gccgcctgaa taccgaaatc ggcatcttca aagaccacac actgcgtcgg ttgcacgccc 600

atacgctgcg cgcacaacaa aaatgtgtct ggcgcgggtt tatggtgttt gacgtgatcg 660

gcagcgacga cggcgtcaaa ataatggcgt aatcccaggt gcgccagcaa tgcctcagcg 720

atggcgcttt cactccccgt tcctacagcc attgggcgac gaccatgcca acttttcacc 780

acatcaacaa gaggaagcgg ttcgacgcta tccagcagca tacttcttac tgcttctgtt 840

ttttcacgcg ctaacgcatg cgggtcgaga tcggcctgat tcagctcaat aattgcctga 900

gcaatacgcc aggtgggcga tccattaagc gcaatcatcg cctgaatatc gtactgaaga 960

ccgtagtgcc ctaatacttc gcgccacgct ttacggtgcg taggctccgt atccaggatt 1020

gtgccatcca tatcaaaaa 1039

<210> 100

<211> 1050

<212> DNA

<213> 人工序列

<220>

<223> 基因编辑同源性臂池_4_b1716_左

<400> 100

agcgctttcc agttccgctt tacgcgcatt cagcgcctgc tgaacctgct ctttcgcttc 60

gttgataacc gcaccagctg ccggacgctc ttctggcggc agctcacgca gggtcgtcat 120

ctgaagggtt aagtgccctt ttttacccaa atattcgacg cgcacattat ctaacgcggc 180

aacatctgac gcctggctaa tggccgcctt cgcactggca accagttctg cgagatgtga 240

catggttttc ctcattgtgt cagtggtgac actggttcgt tggacttaga gcctatccca 300

tcaggctatt ttacttgcca ttttggtccc gggctgtgct cgaaattctc acgtacttaa 360

atacgctccg gtttctccgc gctggccgtg tccagtctgg ctgcgacaat tacacctgat 420

gagacaggct ttttattttt caaaacgcgc atacaaaaaa agcctccact gggaggcttt 480

caggcgctgt tttccgtttc tcttctcacg cgctagcctc ctggattcag gtgctaaagt 540

aaaaaaagaa gcggaaaata gcagcattca ttgcttgcgt taccttttgg tactcttcaa 600

aagaccttta ttgaaaaggc tacggcgata aaagtcaatg ttttgatggc gttgaaacga 660

aaagagggag actagctccc tctttcaact ggcttatgcc agagctgctt tcgctttttc 720

aaccagagcg gtgaacgcta ctttgtcgaa tactgcgata tcagccagga tcttacggtc 780

gatttcaaca gaggcttttt tcaggccatt gatgaatttg ctgtaagaaa taccgttctg 840

acgtgctgct gcgttgatac gcgcaatcca cagttgacgg aactgacgct tacgttgacg 900

acggtcacgg taagcatact gaccagcttt gataacagcc tggaaggcaa cgcggtatac 960

gcgagaacgc gcaccgtagt agcctttagc ttgtttcaaa attttcttgt gacgtgcacg 1020

tgcaataaca ccacgtttta cgcgagccat 1050

<210> 101

<211> 1049

<212> DNA

<213> 人工序列

<220>

<223> 基因编辑同源性臂池_4_b1716_右

<400> 101

ttatgcgtac ggcaggcacg cgattaccag gcccagatcg cctttggaaa ccatggcttt 60

cggacgcagg tgacgtttac gtttggtcgc ttttttggtc agaatgtgac gcaggttagc 120

gtgcttgtgc ttaaaaccac ctttaccggt ttttttgaag cgcttagcag caccgcgtac 180

ggtcttaatt tttggcattt taataacttc cacttcgcat tgttaataaa cgaaacaaag 240

gcgaacaaag cctgtgaagc ccgaaggctc cacagacagt gctacttgaa ggccttactg 300

tttcttctta ggagcgagca ccatgatcat ctggcggcct tcgatcttcg ttgggaagga 360

ttcgaccact gccagttctt gcaaatcgtc tttcacgcga ttaagcactt ccataccgat 420

ttgctggtgc gccatctcac gaccgcggaa acgcagcgtg attttggctt tatcaccctc 480

ttcgagaaag cgaatcaggc tgcggagttt tacctgatag tcgccttcat ctgtaccagg 540

acggaattta atttccttaa cctggataac tttttgcttt ttcttctgtt ccttagaaga 600

cttgctcttt tcatagagga atttgccgta atccattata cgacaaaccg gcggctcggc 660

gttagggctg atctcgacta agtctactcc ggcttcttct gctttctcca gagcttctct 720

cagactcaca ataccaagct gctcgccttc cagacctgtt aagcgaactt cctgggcgcg 780

aatttcgcca ttgatacggt tagggcgcgc cgtttgaact cgttttccgc ctttaatacc 840

ttattcctcc aattgtttaa gactgcggct gcgaatctct tgttgcagct tctcgatcac 900

ttcatttacg tccatgcttc ccaggtcttt accacggcgg gtgcgaacgg caactttgcc 960

tgattccacc tctttatcac cacagaccag catatatggg acgcgacgca aagtgtgctc 1020

gcggatttta aagccaatct tctcatttc 1049

<210> 102

<211> 1050

<212> DNA

<213> 人工序列

<220>

<223> 基因编辑同源性臂池_4_b3071_左

<400> 102

gtcgctggtt caagtccagc aggggccacc agatatagca aaggctgacg agaaatcgtc 60

agcctttttc tttttatata tcagttactt tgcgtgccag taagccgctg cacgtacccg 120

ctgtgggtca tactgttccg cttcaaagcg gcggcttaaa ttcttaacga ctttaccttc 180

gccggttatc cagatgaagt aatcatcggc agggatttgc atctgcgcca gacgcgcatc 240

taccgcctgc tcatcatgtg ccagccattc gatattaaaa ccatcaaggt gcgcgagata 300

atcctgacag gcgttatccc gcacgctaac cagcgcacta acttgcggtt taacggcaag 360

tttgctcaac gtttccaggc ggcggcgcaa tgcaggcatt ccggattcat cgcagacata 420

cagctgatac gcgtaatctt ccggcaccac cagcgaaccg cgcggacctg ccaccgtaag 480

tttatcgccc ggttgcgcct gcatcgccca gccgctggcg accccaccgt cgtgaataaa 540

gaaatcaatc gccagttcat ggcgtagttc gtcatacagc ggcgtatagt cacgcgacgg 600

tgggcgtggt ccttccggcc agacgatgcc ctcttccgtt accgttggcg gcacaaagtg 660

agcgtcaggt tgaggaaaga agagtttgct gtgatcgtca aagccacgcg atgtaaaacc 720

gtccagcgcc tcgccgccga ggacaatgcg ctgaaaaccg gcgctgatgc gctcaacgcg 780

taacacagtc agttcacgga agcgcagatc attgcgaacg cgctgcgggt agcggggggt 840

gttattcatt gttatcgcct tcgtgatggt aatcagatat atctaaataa aactcgcaaa 900

tgataatgat tgttaatcat gataaatgca agcgatttgt agaactgata tgtctatagt 960

ctgataagac gaaccgcctc ttctcaggca tcattactca acgccggatg cggcgtgaac 1020

gccttatccg gcctacgtgt gagatgagtc 1050

<210> 103

<211> 1050

<212> DNA

<213> 人工序列

<220>

<223> 基因编辑同源性臂池_4_b3071_右

<400> 103

atgagccatc atcacgaagg gtgttgtaaa catgaaggcc agccacgcca tgagggctgc 60

tgcaaaggtg agaagtcaga acacgagcac tgcggacacg gtcaccagca tgaacacggt 120

caatgctgcg gtggtcgcca cggtcgcggc ggcggtcgtc ggcaacgttt ctttggtcac 180

ggtgaattac gtctggtgat tctggatatt ctctcgcgcg atgacagcca cggttacgaa 240

ttgattaaag cgattgagaa tctaacccag gggaattaca ccccaagccc gggcgtcatc 300

tacccaacgc tggattttct gcaggagcag tcgctgatta ccatccgcga agaggaagga 360

ggtaagaagc agattgcgct gaccgaacaa ggcgcgcagt ggctggaaga aaaccgcgaa 420

caggtggaga tgattgaaga acgcatcaaa gcgcgttgcg ttggcgcggc gctgcgccag 480

aacccgcaaa tgaagcgggc gctggataat tttaaagcgg tgctggattt acgcgtcaac 540

cagagcgata tcagtgatgc acaaataaaa aagatcattg cggtgatcga ccgcgccgct 600

tttgatatta cgcaactgga ttaatcgccg catccgccag tggcgcggtg caattgccgg 660

atgcgacgct tgacgcgcct tatccggcct acacccgcta cacaccccgc aggcctgata 720

agatgcgcca gcatcgcatc aggcattgtg ctccaaccgc cggatccggc ataccgatta 780

atgcagtacc gtcaccgcgt cttccagtcg gctggcgcgg tgtttcacca tcgccgacac 840

ctgcgcactc tcttccacca gctcggcatt tttctgggtg atcaggttaa gctcatccac 900

tgcacgggtc aggctggaaa gcccatcggc ctgttccagc gttgaatggc taatctgggc 960

gatcaactgg gtgacgtttt tcacctgtgc cacaatatct tccatcgtcc gtccggcggc 1020

gtgtacctgc tgcgaaccgg attgcacctt 1050

<210> 104

<211> 1050

<212> DNA

<213> 人工序列

<220>

<223> 基因编辑同源性臂池_4_b2139_左

<400> 104

cttttgcgat atcgagattg gcgttaagac gaccactatc gaaaatgggt agcgtcaggc 60

ctgccgtaac gcccatttgc tgcgcggaat gacggaacag atcgcttaag tgcaacgcat 120

cctgttgcag gaaggccatc aggttgatgt caggataaaa tgccgctttt gccgcatcaa 180

tggtgcttag cgatgactca acgtaccagt gcgccgcctg caaatctgcc cgccgggcca 240

gtaaggagta ccccagttca tcaggaagct ggcttgccac tttcggcaac gcgaccggtt 300

taagcttcaa tgactttgtc tggttatttg taagtgcgct taaccgtgcc tcaataattt 360

tcattttccc cgcgacatcg ttgagctgct gccgggtttt gctggcatta atatcggttt 420

ccacaccttc aactgaagaa gtaatcccgt tctgatatag ctggcgatcg gtcgcgataa 480

tggtgttctg ctctttttct atttgctgca agaccgtgtt taacgccgcc tgggtttgcc 540

actcccagta caggcgggct acgctgccag ccagcaattg gcgggtttgc tcgcgttccg 600

ccgcccgtgc tttaaccgta cccaggcggg cagtaacctc cgcccgattc tttccccaga 660

tatcgagatg ccagcccgcc gttaagccaa aagtaccgtt ggtgtaccac gggccggtcg 720

tacctgcggc cggatcgttc agagcaaacg gccccattaa gccttctgcc gacatttttt 780

gccgctccat atccgccgaa aagtcgatct gcggaccatc ctgagtggca actgccttcg 840

cctgggcttc agctagctga atgcgctgtt cagccacctg catatccggt gcgttctgta 900

gtgcattgtt aattaaggaa gtgagttgat tatcgtgata ctccagccac cattggctgt 960

ctggccaacc attttcagcg ccgtgggtaa tgcggtgtca acttgtgcag cgggcgtttg 1020

ctggcttaac gcctggcggg tttcatgcat 1050

<210> 105

<211> 1047

<212> DNA

<213> 人工序列

<220>

<223> 基因编辑同源性臂池_4_b2139_右

<400> 105

aggcgcacac ccggccagca tcagtaacag cggaaaacag gcgatggctg gataaaagga 60

atcacgattc atgggggaat aatcaggtaa gaaaaggtgc gcggagatta ccgtgtgttg 120

cgatatattt tttagtttcg cgtggcaata catcagtggc aataaaacga catatccaga 180

aaaatataca ctaagtgaat gatatcttcc gatttatctt aatcgtttat ggataacggc 240

aaagggcttc gttttttcct atacttattc agcactcaca aataaaggaa cgccaatgaa 300

aattatactc tgggctgtat tgattatttt cctgattggg ctactggtgg tgactggcgt 360

atttaagatg atattttaaa attaattaat gtcatcaggt ccgaaaataa cgagaatatt 420

tcagtctctc atcctgttgc gctcctgtca tgtgcattgc ttcatataat cactggcgca 480

aggagcgcgc agggggcggc caatcgccgc cgccccctgc acccccgggc tctggcgaac 540

aaaatcgccg ctgcgcggtg ccctcggctt atcccttacg gctaccgggt cgggcgcgag 600

gtaacatccc tgtaaaacgc gccctcagcc cacatccatg tgggctgccc cggccttcag 660

ggaacgcctc ggcaattttg acgccaccaa acaaccgtgc ggcctattga taaagagcta 720

acacattgtc aaaaaacatc actatggttt tttagagttt ctcgatatca attgcctgaa 780

tagcccttgc aatatcaggg gaattattca acacccgaac atgctgaaat aattccgttg 840

cttcatcgta ttctttacgc aaataactca accactgttt aatccgcgca acgtgatata 900

acccggtatc gccctgcttt tccagacggg tatatttttg cagcaaagca accacctccg 960

gccacggcat tcgcggttcg ttatatttta ccacccggct caggttggga atattgagcg 1020

ccccgcgacc aatcatcact gcgtcgc 1047

<210> 106

<211> 1050

<212> DNA

<213> 人工序列

<220>

<223> 基因编辑同源性臂池_5_b2434_左

<400> 106

tcgctcactt tggtggacga cccaaaccag ttccacgggt tagcggcaga ccagttaact 60

gacgacatcg tggaacagcc ggtcagcatc aatggcatag cgcataacat taaacgcagc 120

gatttcatgt cacttccttt ggttattcaa taacgttgct tggagtgcaa attcaccaaa 180

aagtgccgtt attcttttac ttcataaaaa caagcgcgta aacgtcgatt ggtcagcagc 240

cagattaacg ccacaatatc cgccactacc agcgccagac cgataccgct aacggattca 300

ccgttcagcc acagccacgg ttgccagcaa agtaaaacca cctgcgccaa cagcaacaga 360

aaatagagta cacgccaggt gcgaggaaac gtagcccgcc gaccgctcaa caaaaacgcc 420

agcaccgccg gaatgccagg aatcagcccc agccagaaat tatcgtgatc gggataaaac 480

agatttagca gcgcagtacc ctgctcgcgc gacgcaccgg caatgacaaa cagcacccag 540

gttcgcgcct gaagcaatag cacaagccag aagagcaagg gtaaacgcag gcgaccgtgc 600

gcatcataat ggacaggatg aaactcagta ctcttcatct tcaatcaaac gcttacccag 660

actcagcacg tcggcgtgtt catatcccag gcgttcatac attccgagca ccatgtcgtt 720

atcttccggc acattgatct gaattttcgg gcagccacga gcaatcagct ttttctccag 780

ccgattaagc aacgcattgg caatcccacg cccacgaaac tctggatgca cgccaagata 840

ataagcagac ccgcgatgcc cgtcataacc gcccatcacc gttccgacca cgtcaccgtt 900

tacctcagcg accaaaaaca aactgacgtc atggttcatc ttacgctcga tgtccatttc 960

cggatcgttc cacggacgca gcaagtcgca acgctcccaa agggtgatga cctcttcgaa 1020

atcttcctgg cgaaatacgc gtatctccat 1050

<210> 107

<211> 1050

<212> DNA

<213> 人工序列

<220>

<223> 基因编辑同源性臂池_5_b2434_右

<400> 107

ggtattcgtt acctttttgc gggttaaaag gctgattatg gcgtgaacgg tcgaattagc 60

caatatctga cgaaaatcgg ttgaaaaagt ggcataatgg ggagttgtca actattgaaa 120

tgaaaagtaa aacaattctc aacagcaaac cgtcgtaacg gattacgcga tacgatataa 180

catctggaac tttattatta caactcaggc cgtatgagca cttttaaacc actaaaaaca 240

ctcacttcgc gccgccaggt gctgaaagcc ggtttggctg ccctgacgtt gtcaggaatg 300

tcgcaagcca tcgccaaaga cgaactttta aaaaccagca acggacacag caagccgaaa 360

gccaaaaaat ctggcggcaa acgtgtcgtt gttctcgatc caggtcacgg cggaattgat 420

accggagcga tcggacgcaa cggttcgaaa gaaaaacatg tggtgctggc gattgctaaa 480

aacgtccgtt ccattttgcg taatcatggg attgatgcgc gtttaacgcg ttctggcgat 540

acgtttatcc cactttacga tcgcgttgaa atcgcccata aacatggcgc agatctgttt 600

atgtcaattc atgccgatgg ctttaccaac ccgaaagctg ccggtgcttc ggtatttgcc 660

ctctctaacc gtggggcaag tagcgcaatg gcgaaatacc tgtctgaacg cgaaaaccgc 720

gccgatgaag ttgccggtaa aaaggcgact gacaaggatc acctattgca acaagtgctg 780

tttgatctgg tgcaaacaga taccattaaa aatagtctga cgctcggctc gcatattctg 840

aagaagatta agccggtgca taaactgcac agccgcaaca ccgaacaagc ggcatttgtg 900

gtgttgaaat caccgtcggt tccttcggtg ctggtggaaa cctcgtttat caccaacccg 960

gaagaagaac ggctgttagg cacggcggcg tttcgtcaga aaatcgccac agcgattgct 1020

gaaggcgtga tcagttattt ccactggttc 1050

<210> 108

<211> 1028

<212> DNA

<213> 人工序列

<220>

<223> 基因编辑同源性臂池_5_b2037_左

<400> 108

aatgaaataa gaaaaggcag aggcgatata atcattagca caatcactgc attatcatat 60

cccggcccta tacttatttt tactagtata gatgcaccca agagcagaat taatgaaaaa 120

gcaccaccaa tcaaactcaa gcaggtcaat gattttttaa ttaaaatcac acccttcaca 180

cgattaagaa caagcgtact tgatattctt gggtatattg cttgggtgat aggatttaat 240

agcccttgaa gcgcgtttct tatagtattg gccgcattaa aattccctac ggacgttggt 300

ccagatataa atcccaggat aataactatt cccgtagaat ataaactaat agcagatgtg 360

gaaataaaaa catgaaaacc gtctgctaaa gatcgacgca cattatgtaa tgatagcgta 420

actttaccaa tccaaccttc atgaacaacg atagctagtg caataattcc agcaaccaga 480

tttgcacttg actgaataaa accggcaatt gctatatctg actttgtgtt cacaaaaata 540

aatgttagag ggataatagc caagcgggat aaaatactac ttaaagtcag ccatttcatt 600

ttttcttttc cctgaaacag ccagataggg tagattaaat tcccgactaa tgcaggaaca 660

aacgaccata taattacggc atgcttgtta tattcaggaa caagcaaggt catcgacgtt 720

aagaaaatca atgtaatgac gataagaact atttttgaaa atatcaccgc ccaaaaaata 780

gacgttactt tatctttact atctgctgct ttggcaatac tctgagttgc tgtgagattg 840

aaaccatatt caacaaacat tatcatatat agcatagtcg cttggcaaaa accgaatata 900

ccgaaatttt caggaccaag tgttcttaca agatatggaa atgtaagcaa tggtaaaaga 960

taattgctac cttgaacgac agccagatat ataacgtttc ttcttaaaga taatttattc 1020

gtattcat 1028

<210> 109

<211> 1050

<212> DNA

<213> 人工序列

<220>

<223> 基因编辑同源性臂池_5_b2037_右

<400> 109

gcaattaatt ttaatctgat aagctcatct aacgtaaaga gcctttcatc ttttggcgaa 60

aggattaacc ctgatgtttg gggccaatca attgcaatgc gttcatcatt ccaacatatt 120

ccacaatcgc tttcaggatg ataatagttt gtagttttat attgaaattc agcgatatca 180

gacagaacca aaaagccatg agcaaaccct tttggtatcc acaactgctg cttattatca 240

gctgaaagca gaacaccaac ccatttacca aaggataccg aattgggtcg aatatcaaca 300

gcaacatcaa aaactgctcc atgagtgcag cgtacaagtt tatcttgtgc gtactcgccg 360

cgttgaaagt gaaggcctct gagtacattt tttgatgaac gtgagtgatt gtcttgaaca 420

aagctgaccg gatagcctag aatatgttca aatgctgatt gattaaagct ctcataaaag 480

aaacctctat catcaccaaa tactcttggc tccagaatta gcacatcttc aatttcagtt 540

ctaatcacat tcattaattt gaatccttcg tcattttata aagatactgc ccataattat 600

tctttattag tggtacagct aattttctta cttgctcaac atcaataaaa cctttacgaa 660

atgcaatctc ttcaggacag gaaaccttca atccctggcg ctcttcaatt gtcgcaataa 720

aattacttgc ttctatcaga ctctgatgag tccccgtgtc cagccacgcg tagccacgcc 780

ccatcatcgc gacagacaga cgtccctgct caagataaat acggttaata tctgtaattt 840

ctaactcacc acgtgcagac ggcttcaagt ttttcgccat ctgaaccacg tcgttatcat 900

aaaagtacag acctgtaacg gcgtaattac tctttggttc taacggtttt tcttccagac 960

tgattgccgt accgttttta tcaaactcaa cgacaccata gcgttctgga tcattaacgt 1020

gataggcaaa taccgttgca ccactttctt 1050

<210> 110

<211> 1050

<212> DNA

<213> 人工序列

<220>

<223> 基因编辑同源性臂池_5_b2451_左

<400> 110

cagatccgtt tcatcaatcg ggatcgccac cggcaaattg cgcagcggca gttgtacgcc 60

ctcaagccag attgtgctgc cagagagcga aagggtatgc gcgcccgcgc caatcaccgt 120

ggcgcgcacg gtttgcgccg gaaactgtac gttcatctca cgcaggcgcg gatggtcatg 180

cagcgcagtt gccagcagcg ggccaatatc ggcaaaacag aacgggtcgg cgggctggtg 240

gcgataacat tcgcccacgc cgccagaaag cgtaatgatt tcgggcgtaa cacctgcggg 300

cagcaaaccg gtttgcatca atgcctgcgc gagcggtgag agcgttccgt caatcacttc 360

gacaatcagt tctgccatcc gccgggtcac ctgcaccagc tgcgcgccgg tcagcgaacg 420

ggcgtcggtg cctgcaccga agcactcatc cacaatcatc tgccccggtt tatgagcgta 480

aaccacgcgc ccgtggctgt cggtttccag caggcgacca ccgacgttga ggcaggcagt 540

gccgctgatt tttccggcat cgaacagggc gtagttcgcg gtgccaccgc cgatgtcgat 600

attcagtacc cgacacagcc gttgttcaga aagggtttgt gccccggctc cgtgaccggc 660

gatcacggat tcgaggtgcg gcccggcgct ggcaacgaca aaatcgccca gcgactgaga 720

gagcgccatc accgccgggc gagcattgcg ggttttcgcg ctttcaccgg tgatgatgat 780

ggcaccagaa tcaacgcttt ccggctcaat acccgcagca tgatattgct cgagtattaa 840

ggttttcagt tccgcttctt ttaaaccgcc ctgtttatcg acaggggtaa agaacaccgg 900

actttgccag ctaatttcgc gtttaatgaa ttcgtagcgc ggcacctgcg acaccgccgc 960

acggttaacc agctccagcc gggagaaaat cacctgggtg gtggtggtgc cgatatcgat 1020

accgacgctc aatagctggc gagtgttcac 1050

<210> 111

<211> 1046

<212> DNA

<213> 人工序列

<220>

<223> 基因编辑同源性臂池_5_b2451_右

<400> 111

gattgtgcct ccgcttcggt tttagtcgcg gtcgcgtctt cttttggcac cagcatcatc 60

gccacgccaa tcgccgttac gccgccgatc aacttgccga caatcatcgg gaagatcatg 120

gcgttcatgt tggcagcggc gaagcctaag tggtcgccca gggcgaaagc agcggaaacg 180

gcgaaggcgc agttgatgac tttgccgcgg gtatccatct gcttcatcat gccgaacatc 240

gggatgttgt tggcaagcgt tgccaccatg ccggctgccg cgatgttgtt catattcagt 300

actttaccga cgctcatcag cggtttttca aaccagcgag tcagcagcag caccatcgga 360

tacgccccta acagaacgca ggagatagaa ccgataactt caatggcgcg catcacctca 420

ccgggtttat cgccaggggc cataaagata ggatccagac cggggatcag ttcccagcca 480

agcaggaatt tcactaccgc agcggcaaga ccgagggtga tcaatgcaac gaggaatttg 540

gcgaagatct ggaagccgtt gatcattttt tccgggatga atttcagccc cagcgccacc 600

agaatcgcaa caatgatcac cgggatcatg ttcatcagga tcagggcgaa agtgaattcc 660

accggctggc cgttgatctg cacaccggag tacatagcaa ccagaccacc agcgatacaa 720

ccaatcggaa tggtcacaat gcccgccagc acgccgagcg ccagataacg acggtcagaa 780

ggttcgataa tgccgagcgc caccggaatg gaaaacacaa tcgttggccc catcatcgac 840

ccgagaatta acccagagta tagccacgcg gctacgtcgc cgcccgccag ctctttggcg 900

aggaagaagc cgcccatatc gcacgccagc agtgttccgg cgaacatcga tgggttagcg 960

ccgagcattt cgtaaaccgg aataattacc ggcccgagaa cgtgagccag taccggtgcc 1020

agcgcggtca taccgaccat cgccag 1046

<210> 112

<211> 1050

<212> DNA

<213> 人工序列

<220>

<223> 基因编辑同源性臂池_5_b1902_左

<400> 112

acatcccagc cacgtttctg catctcttta tacagttcct ggccctgacg ttcgccaatt 60

ttagtcgccg ccatcatcac cagcggaacg gtatccattg gcttaccttt ggcgttaaca 120

aactggtcat ccacggcaat gactttcata tcgtagccac gcgctttcgc gacgatggca 180

gagccgagtt tggggtccgg agtacaaata acgaaacctt ttgcgccact ggcagccagg 240

ctgtcgatcg cgttcaatgt tttttcgcca tccggcacgg caatcttaat aacctcaaac 300

cctaaatcct tcccggcttt atcggcaaac ttccattcgg tctggaacca cggctcttcc 360

ggttgcttca ccagaaaacc gagcttcagg ttctccgcca tagcggattg tgacataacg 420

gctgccagac caatggctgc cagggcttta gtaaatttgt gcatggttct ctccagcttt 480

agtgtcgttt tgtgtagggc aaaaacgaat gacattcgtt aaattaatcg gaaaacaaag 540

cattaccttt taactaaaag ataagtgact gtgttgacat agttttagcg agaaattaat 600

tctccatagg agagcaatat cacatcgcag aattacagtg agaacgtgca taaatttagc 660

gggaaaagac ataagggaaa gccaatttgt cagacaaatt gtcgaatgca cagcagatta 720

atccataaga ttagcctgga aatccttgtt gtctttggta cccatgcggg atgtcttctt 780

tttaaccagt caataggccg cattacctgg cgttgagttt ttgaaatggt gtaataaccg 840

caactcaaag atgtggaaaa tgcacgtcat tcatttcgtc attaattatc actgtgctca 900

ttaattaaca gaacacgtat aatgagagcc atctcgcaaa aatgaaaaaa cgttttataa 960

aatcatcact tcatcatgaa ttcaaattca ttgattaata tcaacaagat acaaaaagca 1020

ctatcattaa aattcattgc agttacattg 1050

<210> 113

<211> 1048

<212> DNA

<213> 人工序列

<220>

<223> 基因编辑同源性臂池_5_b1902_右

<400> 113

atggcaaccg ctggaatgct tctcaaactc aactctcaaa tgaaccgcga gttttacgca 60

tccaatctct accttcacct gagtaactgg tgttctgaac agagtctgaa cggcaccgcc 120

actttccttc gcgcccaggc acagagtaat gtgacccaaa tgatgcgcat gtttaacttt 180

atgaagagtg tcggcgctac ccccatcgtt aaagccattg atgttcccgg tgaaaaactg 240

aactctctgg aagaactgtt ccaaaaaacg atggaagaat acgagcaacg ttctagtacg 300

ttggcacagt tagccgatga agcgaaagaa ctgaatgatg attcaaccgt caatttcctg 360

cgcgatctgg aaaaagaaca gcagcatgat ggtctgttgc tgcaaaccat tcttgatgaa 420

gtgcgcagtg cgaaacttgc gggtatgtgc cctgtgcaga ccgaccaaca tgttctgaat 480

gtcgtgtcac accagctgca ttgatcatca tcggcgctaa tgcattgcgc cgatgaaggt 540

tttgagaaac cgctgcctca tctgtttgaa gcagcggttt ttttaatggg attcaccctg 600

tggggtaaac ttgagttcaa taagcgcgat ggctttttgg attgcccgca tggtgaccgg 660

gtctgcggcg gcgggatggt tagtaaagtc gatattcttc agctgactgg acattttttc 720

acgaacttca acgggcgcga ttacatcgag aacatccaga atttgtttga taaccaactg 780

gcaagcaacc acatcagaaa ccaattcctg atcggcattc agcggctggg acatcgtaaa 840

ctcctgatag cattttgaaa gccgttatag tagcgacttc acatcttcag cgatagtcac 900

atccaccgtc atcaggacac aaaaaaacct gccggagcag gttttttgtt atcggaacat 960

attgcctggc ggtacgtctt tgaacgtctt gcaatagtta ttgaacatac ttttcaggat 1020

tttgcgcagt ttcatcgcgg cactccga 1048

<210> 114

<211> 1049

<212> DNA

<213> 人工序列

<220>

<223> 基因编辑同源性臂池_5_b4310_左

<400> 114

gctttgccgc ctgcagtttc accgccaata atcaatagac tattattcca gggcaatgat 60

actccgtagg cccgaccttg cgataattca cccgatttat cccatttccc gttatgccaa 120

agatgaatat cagtgctata tgattttttc aggccttcat gcgcatagtt cttaccgttc 180

tggtaatttt ctcgtgaacc tttgaatccg gcccctccgg caaatataag agaatcattg 240

cttatccccg caaaaccgcc agctacgcca tctggtgatg agacgggagc aagcttattc 300

cattttaaat tattaccggt gaaatcaagt tcaaatacgg catccgttcg caatcctggt 360

ttggcttcgc cattaataag ccaggtttta tcacctttat tcacaaccgc cgcaccagcc 420

gttccgtacc agggcgattc gccagcgtaa ctccattgct gtgttgaggg atcaaaagac 480

aacagaaact tattgaagaa ataatcttct gcttttttgt caaaatagtg agcattgatt 540

ttatctatag cggttgaatc ttttccagcc tcgttgagat cttcaaaata gccattgaag 600

atattctggt taacaccacc agtaacataa gccttgccgt tgtgtacaaa agtcacatgg 660

cccgccatgc ccatcggcgc gtgcgacatc aatttaaccc aactattggt tttggggttg 720

tatttgtgta cgtcattaaa tacctgagtc aagccctcgc tgtttttgcc aatgccgcca 780

aacacataca gattgccatc aataaatgca gaggttgctt gatctcttgg tccgccaggg 840

aatgcagcta acgctgtcca ttttttatct ttggcctgtg tatccagctt gtaccatgcc 900

gtacctgcgc tacctaaacc aatgtagaca gtgtcgttat caattgctcc ggtaccactt 960

ttaaatggca caggagtttc cggtaataca gacgcgtttg cggcaaatga agccatcatg 1020

atagcaagcg ccgttattgt tttattcat 1049

<210> 115

<211> 1021

<212> DNA

<213> 人工序列

<220>

<223> 基因编辑同源性臂池_5_b4310_右

<400> 115

tgtgactgtc tcctgtctac tacagtttaa atgacacacc aatgcgataa ctgttttccg 60

ataaattatc tctgccgttg taaacaccct gacggtcaag gtagtcatat tctatgtatg 120

gcgtaatatc gggcgtcata tggtattgta gaacaaatgc attttccgtc gcccatttct 180

tatggtttgc atagcgataa tcgttctgtt tgctgtatag cgtcgtttgc catgcgaagg 240

tgaaatcact attaatatgg taagtgacat atccatccca acgatgaacg ttatcacgag 300

acatatcacc ggataagtct tgttgtcggt aagctttcca gtcgtaacga tagcgaatgc 360

caaaattaag atcttttgtc gcgtcccagg acagttttac gtagggtccg tagcgtgtgc 420

cgttgctgct aaaatgcgtt aacattcccg ggcgcaccgt ccattgatca tcaagtttaa 480

tcgcgtaatt aacttcaacc tgaacatcat tgagtgcggc attttccttt ttattatcat 540

gaatggtatt ccaggtatta ctttccatgc ttgcccacca tccattttgc catccctcac 600

tgactttgag tcgagtctca taggcgtggc ttccactacg atatccacca cgtacgtcca 660

gtgtcgcagc ctgagaaatt aatggggacg aaaagcacag taataatacg ccagaaagta 720

ttttagcctt tttcataaat ttcactcatt tgtaggatac agaaagcaat acaaagcccg 780

cataaacaat tagcatttat gttgtgtaat atttttttgc caggcttata gtgtctttgg 840

caaccggtag ctgtatttta tatttttttg tataaggtct cctgtgaaaa atctcttttc 900

acattattta aataaacaga gatccagatt aaatacctga gtataaaatc tcttctgatg 960

tttaattgat ttgaatgttc gtaagctata tcacttactc aatccatttt acccagagtc 1020

a 1021

<210> 116

<211> 1050

<212> DNA

<213> 人工序列

<220>

<223> 基因编辑同源性臂池_5_b0676_左

<400> 116

cactttatcg gcttcggtga tttcaccggc aataacaatt ttttgcggat taaataagtt 60

gatagcaatg gcgatggttt tacccagatg acgaccgaca tactcaatta cttccgacgc 120

cagactatcg cctttgttcg cggctttgca gatagttttg atggtgcagt cgtccagcgg 180

cacgcggctc tggtagccct gctttaacag attcaacacc cgttgttcaa tggcagcgtt 240

ggcagcgata gtttccaggc agccaaagtt gccgcagtgg cagcgttcac ccagcggttc 300

gacctgaata tggccaattt caccgacgtt gccgttgcgg ccaataaaaa tgcgcccgtt 360

agagataatc ccggccccgg ttccgcgatg gacacgcacc agaatggagt cttcgcaatc 420

ctgacttgca ccgaagtagt gctccgccag cgccagacta cggatatcgt gaccaacgaa 480

acaggtcact ttaaaacgtt cttccagagc ttctaccagc ccccagtttt ctacctgaat 540

atgcggcatg taatgaattt tgccgctgtc cgggtcaaca agccctggca ggatcaccga 600

aatcgcgatc agctcgcgca gtttgcgctg gtagctatca ataaactgag caatggcatt 660

caacagggca tgttccagcg tttgctgggt acgttccggc agcgggtaat gttcttctgc 720

cagcactttg ctgctgagat caaacagagt gatggtggcg tcatgacgac caagccgtac 780

gccgattgcg tggaaattgc gggtttcggt gacgatggag atagcgcggc ggcccccggt 840

ggaggcctgc tgatcaactt ctttgatcag cccgcgttcg ataagctgac gcgtaatttt 900

ggttacgctg gcgggggcaa gctggctttg ctcggcaatc tgaatccgcg agattggccc 960

gtactggtca atcaggcgat aaaccgccgc gctgttaagc tgttttacga gatcaacatt 1020

acctatctga gcttgtccgc ctggtgtcat 1050

<210> 117

<211> 1050

<212> DNA

<213> 人工序列

<220>

<223> 基因编辑同源性臂池_5_b0676_右

<400> 117

actttctctt attgagttac gacctcgtta ccgttaacga tggtcttggt gattttaaaa 60

tcaggtgtga atgcagtcag gttggctact ttacctgcgg cgagtgtgcc gagacgtttc 120

tcaacgccaa tcgcacgcgc cggatagagc gtcgccatac gtagcacttc atccagtgcg 180

ataccgcaat gttcgaccag attacgcacg ccttcaatca tggttaagga tgaaccgctt 240

aacgtaccgt tctcatccac acaaagtccg ttacggtagt atattgtttt acccgcaaaa 300

atgaactgtt caatgttggc acctgctggc gcggtggcgt cagtaaccag acacagtttg 360

tcgcctttca gacgtttagc gttgcgaatg ttggcgtaat caacatgcag gccatcagca 420

ataataccgc aataaatgtc agcttcgtcg aggatcgcgc ccgccaggcc aggttcacga 480

ccggtaatat acggcatcgc gttgtacaga tgggtggcaa aggtaatccc cgcgcggaaa 540

ccggcttttg cttctttcaa cgtcgcgttg gagtgaccgg cagaaaccac aatcccggca 600

tttgccagtt tgctgatgac ttccgcagga accatttccg gtgccagggt cactttggta 660

atgacgtcgg cgttttcaca caggaaatcg accagcgcgg catcaggctt acgcacaaaa 720

ttcggattat gggtgccttt ttttaccaga ttcagccacg gaccttccag atgcagacct 780

aacgcctgat tcggatgttt tgccaggtac tcgcgcataa cgcgcacgcc ctgtttcatc 840

agctcatcgc tggtggtgat aagcgtcggc agatagttag tacagcctga tttctcattg 900

gctttctgca tgatttccag cgtttccacg ctgaccgctt cagcggtgtc gttaaactgt 960

acgccgccgc agccgtttaa ctgcacatcg ataaaaccgg gggagagaat ggccccgttc 1020

agtgaacgtt gttcgatctc tggcggcagt 1050

<210> 118

<211> 1007

<212> DNA

<213> 人工序列

<220>

<223> 基因编辑同源性臂池_5_b1497_左

<400> 118

actttagtaa tacgatgctt aggacaaccg ccattgcaga taggtttata tgcacattgc 60

tgacatttcg ctggaatccg ttttttttgc gctgtcagtt gtacactgtt catcgttttg 120

agttcagatt tattaatgtt tccaattttg tactgtggat agacaaaatg gtcgcattcg 180

taaatgtctc cattactttc aacaaccaga ttatccttgc aggactcctg gaaaatacaa 240

ctggtatgcc cattccccaa aaaacggctg acaaagcttt caaactgacg gatgaaaatt 300

tcacccacat cgtttttaac ccattgcata aaaatggttg acataaactt gccataagcc 360

gtgggaggca cagaaaaatc aatgatacgg aatgtgttct cactatgacc actgaaatca 420

atattcggcg tcccggtttc tagcaattcg ataaattgca tatgtttact gccgatagat 480

tttaaaaaat gataaacctc aagagggtaa tggacattaa cgttattaat gacggttaac 540

gtattaaact ctacttgata tgatttcaga cgctcgatgg ctgctatcac ttttgcaaaa 600

gtaccgttac ctgaattact gcgtctgtaa cggtcatgta actcctgggg gccatcgatc 660

gagataccaa ccagaaattc atgttctttg agaaaggcac accattcatt attcaataaa 720

atgccattcg tttgtaatgc attaaaaata cgtttttggc ctgcatagcg ttgttgatag 780

tgaataactt tacggaaaaa atccaggcca gccagagtgg gttcaccgcc ttgccaggta 840

aaatagacct gattgccaga cgctgcgata tattgtttga tgaactcttt cagagtgctg 900

tcatccatcc atttttcatg agtaaactgc gactcttttt caaggtaaaa acagtaatca 960

catttgagat tacattgaaa actggagggc ttggctgtaa cgtgcat 1007

<210> 119

<211> 1050

<212> DNA

<213> 人工序列

<220>

<223> 基因编辑同源性臂池_5_b1497_右

<400> 119

cgctatctcg ctcaataagg cggcggaaaa atccgccgca tgaaggttta gttatttcgc 60

ttcgcttagt gctttcttga tattgttaaa cttctcctga tttacctcgc taagcggtgg 120

ctggctgctg tcgataaact ctcttaccac gccttgcatc tctttaacga cctgcggatt 180

ggcggcggca aggttatctt tttgctgtag atccgtcagt ttgtagagac ctaactgatt 240

gttttctact gtatagacaa gcgaataatc gttatttctc accgtataag agaattggct 300

taagtcctca gtgttggggt tatgcgggta atcgtctgac tgatggcgaa caaatttgtg 360

gtaattatcc cagaatggaa tattttcctc gtcaaaccag tgagaataag aggttatcca 420

ggtcagattt ttatgtggct cgccttgttt cttatcttgc aaccagggca gcaaggaaac 480

gccatccagc ttaaggtctt ttggaatgct gatatcggct gcatcaagag ctgtcgggta 540

gaaatccatt gcggaaatca gcttgtcata attaccgggt tgaagttttc ctttccacca 600

cataaacatt ggggtgtgag taccgccagg ataggtctga ctcttatagc ctttttgcgc 660

cccgttcagc ggcagaggac catcgataac cgcaccatta tcggaggtaa agagaataat 720

tgtattgtca tactgtccgt ttttcttcag ttgttcgaga atgcgtttta caccctgatc 780

aacagaataa acggaagcgt agtagttatc tgctgtttga ctaccggtat taaattgctt 840

ctgatattga tccggtgcag gattatcatt tggcaggtgc ggagcattat aagccaggta 900

aagcataaaa ggctggtcaa gtgttttggc acgatcaaca acgccaattg cctcatcggt 960

taactgatcg ctgatataac cttttgcggg gacacgttca cgatttttga acagtgaagg 1020

ggagttgtaa tatgccgttc ctgcagcgtg 1050

<210> 120

<211> 1045

<212> DNA

<213> 人工序列

<220>

<223> 基因编辑同源性臂池_5_b0183_左

<400> 120

ccaacgcccg ctttgttggt gttgccgggc cacgaatgca ggctgaaggc tgcgaagcct 60

ggtacgaaat ggaagaactg gcggtgatgg gcattgttga agtgctcggt cgtctgcgtc 120

gcttactgca tattcgtgcc gatctgacaa agcgttttgg cgaactgaag ccagatgttt 180

ttgttggtat tgatgcgcct gacttcaata ttactcttga aggtaacctc aaaaagcagg 240

gtatcaaaac cattcattac gtcagtccgt cagtctgggc gtggcgacag aaacgtgttt 300

tcaaaatagg cagagccacc gatctggtgc tcgcatttct gcctttcgaa aaagcgtttt 360

atgacaaata caacgtaccg tgccgcttta tcggtcatac catggctgat gccatgccat 420

tagatccaga taaaaatgcc gcccgtgatg tgctggggat ccctcacgat gcccactgcc 480

tggcgttgct accggggagc cgtggtgcag aagttgaaat gcttagtgcc gatttcctga 540

aaacggccca gcttttgcgc cagacatatc cggatctcga aatcgtggtg ccactggtga 600

atgccaaacg ccgcgagcag tttgaacgca tcaaagctga agtcgcgcca gacctttcag 660

ttcatttgct ggatgggatg ggccgtgagg cgatggtcgc cagcgatgcg gcgctactgg 720

cgtcgggtac ggcagccctg gagtgtatgc tggcgaaatg cccgatggtg gtgggatatc 780

gcatgaagcc ttttaccttc tggttggcga agcggctggt gaaaactgat tatgtctcgc 840

tgccaaatct gctggcgggc agagagttag tcaaagaatt attgcaggaa gagtgtgagc 900

cgcaaaaact ggctgcggcg ctgttaccgc tgttggcgaa cgggaaaacc agccacgcga 960

tgcacgatac cttccgtgaa ctgcatcagc agatccgctg caatgccgat gagcaggcgg 1020

cacaagccgt tctggagtta gcaca 1045

<210> 121

<211> 1040

<212> DNA

<213> 人工序列

<220>

<223> 基因编辑同源性臂池_5_b0183_右

<400> 121

atgatcgaat ttgtttatcc gcacacgcag ctggttgcgg gtgtggatga agtcggacgc 60

gggccgttag ttggcgcggt cgtcaccgct gcggtgatcc ttgacccggc gcgcccgatt 120

gccgggctga atgattccaa aaagctgagc gaaaaacgcc gtctggcgct ctatgaagag 180

atcaaagaga aagcgttgag ctggagtctg ggccgcgcgg aaccccacga aatcgacgag 240

ctgaacattc ttcatgcgac catgctggcg atgcagcgtg ccgtcgctgg gctgcatatt 300

gcgccggaat atgtgttgat tgatggtaac cgctgcccga aattaccgat gcctgcgatg 360

gctgtggtga aaggcgatag ccgcgtaccg gaaatcagtg ccgcgtctat cctggcgaaa 420

gtgacgcgtg acgccgaaat ggcggcgctg gatattgttt tcccgcaata tggttttgcc 480

caacacaaag ggtacccaac cgcttttcat ctggaaaaac tggctgaaca cggcgcgacc 540

gaacaccatc ggcgcagctt tgggcctgtc aaacgcgcac tgggacttgc gtcctgattc 600

ttgtgtcgag attaagtaaa ccggaatctg aagatgtctg aaccacgttt cgtacacctg 660

cgggtgcaca gcgactactc gatgatcgat ggcctggcca aaaccgcacc gttggtaaaa 720

aaggcggcgg cgttgggtat gccagcactg gcgatcaccg atttcaccaa cctttgtggt 780

ctggtgaagt tctacggagc gggacatggc gcagggatta agcctatcgt cggggcagat 840

tttaacgtcc agtgcgacct gctgggtgat gagttaaccc acctgacggt actggcggcg 900

aacaataccg gctatcagaa tctgacgttg ctgatctcaa aagcgtatca gcgcgggtac 960

ggtgccgccg ggccgatcat cgatcgcgac tggcttatcg aattaaacga agggttgatc 1020

cttctttccg gcggacgcat 1040

<210> 122

<211> 1047

<212> DNA

<213> 人工序列

<220>

<223> 基因编辑同源性臂池_5_b3631_左

<400> 122

aatcctggtc ataaagatgc gatatcatgg ggatatgtta ttaactactc ctgtcatcag 60

tacgctcaag cagaattatc ctgatgcaaa aatcgatatg ctgctttatc aggacaccat 120

ccctattttg tctgaaaacc cggaaattaa tgcgctctat gggataagca ataaaggtgc 180

gggaactttc gataaaatta aaaatgtgct ttcgttgata aaaactctgc gtgcgaataa 240

ttatgacctg gtcattaatc ttacggatca gtggatggtg gcgctgctgg tacgttgttt 300

acctgcacgg atgaaaatat cgcaacttta tggtcatcgg cagcatggta tttggaaaaa 360

aagcttcaca cacttagcgc caatacacgg tacacatatt gttgagcgta atttatcggt 420

ccttgagcca ttaggtatta ccgatttcta caccgacaca acaatgagtt acgccgaaga 480

ttgctggaag aagatgcgcc gggaattaga tgccctgggc gtaaaagatc attatgttgt 540

catccaaccg acagcgcgtc agatatttaa gtgttgggat aacgataaat tttctaaggt 600

tatcgatgcg ctgcaacagc gaggctatca ggttgtgcta acctgtgggc cctcggcaga 660

tgatctcgct tgtgtagatg agattgcacg aggttgcgaa acaaaaccca ttactggcct 720

tgcaggtaaa acacgttttc ctgaactggg tgcattaatt gatcatgcag tgctttttat 780

tggtgtggat tctgcgccgg gacatattgc agcggcagtg aaaacgccag tcattagtct 840

atttggtgca acggatcacg tattctggcg tccctggacc gagaatatta ttcaattctg 900

ggcggggaat tatcagaaaa tgccgacccg gcatgaactt gaccgcaaca aaaaatatct 960

ttctgttatc ccagcggagg atgtgatcgc cgctacggaa aagctgttgc cagaagatgc 1020

cccttcagct gacaggaatg cacaatt 1047

<210> 123

<211> 1041

<212> DNA

<213> 人工序列

<220>

<223> 基因编辑同源性臂池_5_b3631_右

<400> 123

atgatcgtgg cgttttgttt atataaatat tttccatttg gtgggcttca acgtgacttt 60

atgcgcattg catcaacagt tgccgcacgg ggccaccatg ttcgggtata tacacagtcg 120

tgggaaggcg attgcccgaa agcatttgag cttattcagg tgccagttaa gtcccatacc 180

aaccatggac gcaatgcaga atattatgcc tgggtacaaa atcatctcaa agagcatccc 240

gcagatcgcg ttgttgggtt taataagatg cctggcctgg atgtttattt tgccgctgat 300

gtttgttacg ccgagaaagt tgcgcaagaa aaaggttttt tatatcgttt aacatcacga 360

tatcgccatt atgccgcatt tgagcgagcg actttcgagc agggtaaatc gacgaaactt 420

atgatgctga ccgataagca aatcgccgat ttccagaagc attatcaaac tgaacctgaa 480

cgttttcaaa ttcttcctcc cggtatttat ccggacagaa aatacagtga gcaaatccca 540

aacagccgtg aaatttatcg ccagaaaaat ggcataaaag agcaacaaaa cttattactg 600

caggttggat cagattttgg ccgtaaaggt gtagatcgct caattgaagc tttggcatcg 660

ttaccggaat cattacgtca caatacgctt ttatttgttg ttggtcagga taagccgcga 720

aaatttgaag cgctggcaga aaaactcggc gtgcggagca atgtgcattt cttctccggt 780

cgcaatgatg tgtcagaatt aatggcagcc gctgatttat tactgcatcc cgcttatcag 840

gaagccgcgg gtatcgttct tctagaagcg atcactgctg ggttacctgt tttaacaaca 900

gcggtatgtg ggtacgcgca ttatattgcg gatgccaatt gtggaacggt catcgctgaa 960

cctttctctc aggaacaatt aaatgaagtt ttacgtaaag cgttaactca gtcgccattg 1020

cgaatggcct gggcggagaa t 1041

<210> 124

<211> 1047

<212> DNA

<213> 人工序列

<220>

<223> 基因编辑同源性臂池_5_b3791_左

<400> 124

gcgctcgctc tctttggtgg tgtagcgatc ttcaccgtgg aactcaccaa agtgttcccc 60

cgcagggcaa ccgtgcagcg gaatgtaatg aaacaccgcc atgatttccg cttctttcag 120

aaagttaatc aacgcgctcc ggtcatcaat atcccgcagt ttaatgtaga acatatgcgc 180

gttctgcacg cagccatcgg gaatcgacgg cagctcgata cgcccggctt tcgccagagg 240

cgctaacgca tcgtagtagt tttgccacag cgccagacgt tgctggttga tacgatccgc 300

tgcttccagt tgcgcccaca ggtatgcagc ttgcagatcg gacatcaaat agctggagcc 360

aatatcgcgc caggtatatt tatcgacctg accacggaag aactggctgc ggttagtgcc 420

cttttcacgg atgatctcgg ctcgttcgat taacgcttta tcgttaatca gcgtcgcgcc 480

gccttcaccg cccgccgtgt agtttttggt ttcatggaag ctaaagcagc caatatgacc 540

aatggttccc agtgcacgcc ctttgtaagt ggacatcacg ccctgagcgg catcttctac 600

cacaaacaaa ttatgctttt tcgccaacgc cataatggtg tccatttcgc aggccacacc 660

cgcgtaatgg accggcacga taacgcgcgt tttgtcggtg atcgccgctt caatcagcgt 720

ttcgtcgatg ttcatggtgt ccgggcgaac atccacaaaa acgatttttg cgccacgcag 780

cacaaaggca ttggcggtgg agacaaaggt gtagctcggc atgatcactt catcgccagg 840

ctggatatcg agcagcagcg ccgccatctc cagcgaagcg gtgcaggacg gcgtcagtaa 900

cactttggcg ctgccaaaac gttgctccag ccactgctgg cagcgacggg taaaaccgcc 960

atcgccacac agtttgccgc tacccattgc cgactgcata tagtcgagtt cggttcccac 1020

caccggcggt gcgttaaatg gaatcat 1047

<210> 125

<211> 1048

<212> DNA

<213> 人工序列

<220>

<223> 基因编辑同源性臂池_5_b3791_右

<400> 125

gtgatcacct gtataaccag tacgcggtgc tttctacatt cgcaccactt tgtatgtatc 60

gtttaagcgc ggcggtgttg cccatttggg tcgccacccg caaagttgtt ttaccgcgag 120

catacgccca gtttagcgcc gtttgcatca gctcagcacc tgcaccgcgt ccagccagca 180

ggccaattcg cgcatctgtc gcattgagtt cccgtaaaga gacatagccg cgaatatcgc 240

cggacgccgc acgtaaaatc agacattgat gatcaaaggt gccgcgcacg gcattttcaa 300

tccactgtgc ataaaagcga ctgctggcgt caggcgcata ccacggcgca cgaaaacggc 360

tttgcgcaaa tgcggcgctg gctaactgac gtaatgcggg aatatcggtc tcttgtgcca 420

ctacagcacc gctatcactg gcattgttca cgggtagcgc caaatcaact tcaccttcta 480

ccagggagaa tcccagctgt tgcagggcat ccagttcacc cgtatttgat gccgcaattt 540

tggcctgcac ccgtgaccac ggcgctaacg cgtctggcgt caggagcggt gcttcagacg 600

taatgcgcac gatggcgctg ttaacaccaa agaaggcgtt ttcccaggtt agtggctcaa 660

tactggcgcg gacgggcacg aagtaactcc agcagatatt ggccgtagcc agttttcgct 720

aatgaactgg cagcacgctt cacaccctcg tcatcgagcc agccgttacg ccaggcaatc 780

tcttccaggc aggcaatctt aaagccctgg cgtttttcca ccgtctgtac aaaggtgctg 840

gcttcaatca ggctgtcgtg agtgccggta tccagccagg caaatccgcg cccgagcagt 900

tcaacggtca ggttgcccgc ctcgaggtac atctggttga tggaggtaat ctccagttca 960

ccacgctccg acggcttcac ctgctttgcg tactccacga ctttactgtc gtagaaataa 1020

agcccggtca ccgcccagtt tgacttcg 1048

<210> 126

<211> 1045

<212> DNA

<213> 人工序列

<220>

<223> 基因编辑同源性臂池_5_b0438_左

<400> 126

gtgactgaaa aagaaaccac tttcaacgag ctgatgaacc agcaggcgta atttacgcag 60

cataacgcgc taaattcgca caaaggcccg tcaccgccag gtggtgggct tttttttgtc 120

atgaattttg catggaaccg tgcgaaaagc ctctttcggt gttagcgtaa caacaaaaga 180

ttgttatgct tgaaatatgg tgatgccgta cccataacac agggactagc tgataatccg 240

tccataaggt tacaatcggt acagcaggtt ttttcaattt tatccaggag acggaaatgt 300

catacagcgg cgaacgagat aactttgcac cccatatggc gctggtgccg atggtcattg 360

aacagacctc acgcggtgag cgctcttttg atatctattc tcgtctactt aaggaacgcg 420

tcatttttct gactggccag gttgaagacc acatggctaa cctgattgtg gcgcagatgc 480

tgttcctgga agcggaaaac ccagaaaaag atatctatct gtacattaac tccccaggcg 540

gggtgatcac tgccgggatg tctatctatg acaccatgca gtttatcaag cctgatgtca 600

gcaccatctg tatgggccag gcggcctcga tgggcgcttt cttgctgacc gcaggggcaa 660

aaggtaaacg tttttgcctg ccgaattcgc gcgtgatgat tcaccaaccg ttgggcggct 720

accagggcca ggcgaccgat atcgaaattc atgcccgtga aattctgaaa gttaaagggc 780

gcatgaatga acttatggcg cttcatacgg gtcaatcatt agaacagatt gaacgtgata 840

ccgagcgcga tcgcttcctt tccgcccctg aagcggtgga atacggtctg gtcgattcga 900

ttctgaccca tcgtaattga tgccagaggc gcaactgtgc cgctatactt atccagggcg 960

gcacaacgct gtaagcggct tgcgcctgag aatggcattt gcgtcgtcgt gtgcggcaca 1020

aagaacaaag aagaggtttt gaccc 1045

<210> 127

<211> 1050

<212> DNA

<213> 人工序列

<220>

<223> 基因编辑同源性臂池_5_b0438_右

<400> 127

atgacagata aacgcaaaga tggctcaggc aaattgctgt attgctcttt ttgcggcaaa 60

agccagcatg aagtgcgcaa gctgattgcc ggtccatccg tgtatatctg cgacgaatgt 120

gttgatttat gtaacgacat cattcgcgaa gagattaaag aagttgcacc gcatcgtgaa 180

cgcagtgcgc taccgacgcc gcatgaaatt cgcaaccacc tggacgatta cgttatcggc 240

caggaacagg cgaaaaaagt gctggcggtc gcggtataca accattacaa acgtctgcgc 300

aacggcgata ccagcaatgg cgtcgagttg ggcaaaagta acattctgct gatcggtccg 360

accggttccg gtaaaacgct gctggctgaa acgctggcgc gcctgctgga tgttccgttc 420

accatggccg acgcgactac actgaccgaa gccggttatg tgggtgaaga cgttgaaaac 480

atcattcaga agctgttgca gaaatgcgac tacgatgtcc agaaagcaca gcgtggtatt 540

gtctacatcg atgaaatcga caagatttct cgtaagtcag acaacccgtc cattacccga 600

gacgtttccg gtgaaggcgt acagcaggca ctgttgaaac tgatcgaagg tacggtagct 660

gctgttccac cgcaaggtgg gcgtaaacat ccgcagcagg aattcttgca ggttgatacc 720

tctaagatcc tgtttatttg tggcggtgcg tttgccggtc tggataaagt gatttcccac 780

cgtgtagaaa ccggctccgg cattggtttt ggcgcgacgg taaaagcgaa gtccgacaaa 840

gcaagcgaag gcgagctgct ggcgcaggtt gaaccggaag atctgatcaa gtttggtctt 900

atccctgagt ttattggtcg tctgccggtt gtcgcaacgt tgaatgaact gagcgaagaa 960

gctctgattc agatcctcaa agagccgaaa aacgccctga ccaagcagta tcaggcgctg 1020

tttaatctgg aaggcgtgga tctggaattc 1050

<210> 128

<211> 1050

<212> DNA

<213> 人工序列

<220>

<223> 基因编辑同源性臂池_5_b1981_左

<400> 128

ggtgtcagga gttattgcga tataagcatc ttttatgatt gctgctgaac gtttaatcga 60

gggtggtaag gataaacggt agacattatt ataacaatcc actaatgccc tggctttatc 120

ttcacctttg ggtccatgaa cgatcactat tggtatatct gtttcacttt aaatttttgc 180

tattagattt tctgcaatcg ataatgaaaa tgtacgttcc tgcgagctac cttctaaatt 240

gaacgcaatg taagatccta acgatcgcat ttcctcgcgc acctcatcga gtacatcctc 300

acttagtggc aattcatata ttggcctgac tgctggaaaa cccgcctcac gcatcataaa 360

tgcccatgtc ataggtacgg gagcccggag tttctgatcc atactggacg cgttcttgca 420

caaaggggag aagcaattca tggttatacc aacaacctga aaattcgttt ttgctttcaa 480

ctgactgata aataacatcg ttttcaggtt ctttttacgc atcccctcaa tgcaaagatc 540

cggcgtaccg tattgctgtg ttatgttctt tgctaaatct tttatttctt ttaatgttgc 600

gtgatcctgc atagtcattg tgactaatgt taatttagtc tgttcaagtt taagcgcatt 660

aaagacttct aaattaattg tcgacgttac aattaaaaga tgcttaattt tatgcaattc 720

aagcgcccga ataacaggaa agatggccat agcatcgcca atctgatcgg gaatatggat 780

gacaacaaag tctgtttttt caatattgaa attataagct ttataatcgt agtaactaaa 840

tgcaatacgt ctcaacaatg atgctaaaaa catacctaac ctcgcctccc tactggttat 900

aatgcaatgc agtctatcag actcatcagg gtgccatttt gtgcatatgc ggacttttat 960

gtttcatatc tctaacctgt gggtcctctg cttaatcctt aaacaacacc agcaactcct 1020

gcgctttcat cttccatcga atttttcatg 1050

<210> 129

<211> 1036

<212> DNA

<213> 人工序列

<220>

<223> 基因编辑同源性臂池_5_b1981_右

<400> 129

atggactcca cgctcatctc cactcgtccc gatgaaggga cgctttcgtt aagtcgcgcc 60

cgacgagctg cgttaggcag cttcgctggt gccgtcgtcg actggtatga ttttttactc 120

tatggcatca ccgccgcact ggtgtttaat cgcgagtttt tcccgcaagt aagcccggcg 180

atgggaacgc tcgccgcatt tgctaccttt ggcgtcggat ttcttttccg tccgctcggc 240

ggtgtcattt tcggtcactt tggcgaccga ctgggacgta agcgcatgtt aatgctgacc 300

gtctggatga tgggcatcgc gacagccttg attggtattc ttccttcatt ctcgaccatt 360

gggtggtggg cacctatttt gctggtgaca ctgcgtgcca ttcagggatt tgcagtcggc 420

ggcgaatggg gaggcgcggc gttgctttcc gttgaaagtg caccgaaaaa taaaaaagcc 480

ttttacagta gcggtgtaca agttggctac ggtgtaggtt tactgctttc aaccggactg 540

gtttcattga tcagtatgat gacgactgac gaacagtttt taagctgggg ctggcgcatt 600

cctttcctgt ttagcatcgt actggtactg ggagcattgt gggtgcgcaa tggcatggag 660

gagtccgcgg aatttgaaca acagcaacat tatcaagctg ccgcgaaaaa acgcatcccg 720

gttatcgaag cgctgttacg acatcccggt gctttcctga agattattgc gctacgactg 780

tgcgaattgc tgacgatgta catcgttact gcctttgcac ttaattattc aacccagaat 840

atggggctac cgcgcgaact tttccttaat attggtttgc tggtaggtgg attaagctgc 900

ctgacaattc cctgttttgc ctggcttgcc gatcgttttg gtcgccgtag ggtttatatc 960

acaggtacgt taatcggaac gttgagcgca tttcctttct ttatggcgct tgaagcacaa 1020

tctattttct ggatag 1036

<210> 130

<211> 1050

<212> DNA

<213> 人工序列

<220>

<223> 基因编辑同源性臂池_5_b1709_左

<400> 130

cgaaacgatc gcgcatcgtc acaaccacaa atcccgaaca gtccacaccg cgccgcgtca 60

tgccaccata acgatacggc gtgccatgcc agctttgtag ctggtcgttc aaaccggcaa 120

taacggtaat cgaatcagaa agtctggcat ttggcggcgg tgctttatgg tggctacacc 180

cggccagaag cagtgctgtg atcaaaataa ggcagaaacg cattccgtac ggttcctctg 240

ttttttattc ttgcattaat ttagcgtcgt aattacccga ttttcaagat actaatgaaa 300

tcagatggtc gaaatcagca ttctgtgacc ttcgatatcc agacggcgaa aattcatccc 360

ataggcctgc gccagatttg gcggcgtgag cacctcttcc ctgcgtccac tggccagcat 420

ttttccacct tttagcaacc acgcccgatg cgcatgacgc aatgtgtggt tgagatcgtg 480

actgctcatc acaatcgcca gtccttgctg acacagcgcg ctcagaattt tgtctaacgc 540

actttgttgc gcaacatcaa gactgttcat cggctcatca agaagcagca attggcctgc 600

gggattggct tgtggtgtga tttgcaacac caccgcagca agacgtacgc gttgccattc 660

accgccggaa agttgattgg tgctacgtcc gagtttgtca tcaagagcca gcgcccctgc 720

gacatcattc agtagttcgg tacgcgtttt atcgtgctga tgcagtgtca ggtagtgcca 780

gaccggcgtt gcaaacggcg gcgtctgctg ttgtgaaaga taggcgcgat gcagcgcgag 840

ttttgttgcg gaccatgctt ccagtggttg ccccgcgaac tgaatgcttc ccttaccgct 900

ggtcattccg gccattcgcg ccagtaaggt actcttaccc gcgccattcg gccccaccag 960

gtgcaggatc tccccagccc gaacctcgcc agaaagcggc cccaggcggg tagattccgc 1020

aacatcttgt aactgcatca caatagacat 1050

<210> 131

<211> 1050

<212> DNA

<213> 人工序列

<220>

<223> 基因编辑同源性臂池_5_b1709_右

<400> 131

tattttgcca acgccagttt aatgctttcc atcacaatgg gatcttccgg cgtcatatcc 60

ggggaaaaac gctggatgac ttttccgtcc ctgccaacca ggaatttttc aaaattccat 120

aaaatatcat ccgggtacag cggtgcacgg cctttgctga ccatacgggc atagaatccg 180

ctctcttccg gcgcgactgc ggtcggcgct gcggcaatca atttttgata cagcggatgg 240

cgtccttcgc cattaacttc aatcttactg aacatcggga acgtcacccc ccatgtggtg 300

gtacagtaag ttttaatctc ttcatcgctg cccggttctt gttccagaaa ctggttgcac 360

gggaatccca gcaccataaa acctcgatcg acccaggctt tctgaatatt ctccaactgc 420

tcatattgcg gcgttaagcc acactttgag gcgacattga caatcaacag cacattaccg 480

gcgaacttct ccagcgtggt cacttcaccg tcgatatctt tcactacggt cgtcagaatg 540

gaatcttgca tcgtttctcc tgggtgtggt cagtaaaaat cttagctttt aatcatagac 600

cgtctttttg cggctaacgt cctgctttta acaataacca gataaacacc ggcgcaccta 660

acgttgcggt gaccacgcca ataggcagct ctgcggcagc taatgccagg cgcgctacaa 720

tatcggccag cagcaatgcg ctcgcccctg ccagcgcgca gccgggaagt aatacgcgat 780

gatcggttaa accacacaac cggagaatat gggggatcac cagaccaata aagccgatag 840

cacccgccag cgccacactg acgccaacca tccagccggt cgctgccacc agcacattgc 900

gccagaacca caggggtaaa cccagttgcc gcgccgagat ctcgccaagt gctaacatat 960

tcatcggcct ggactgacaa cagatccaca acaacacggg gatcaatgcc agcatcagcc 1020

agctttgccg ccagtctacg ccgccaaaac 1050

<210> 132

<211> 1050

<212> DNA

<213> 人工序列

<220>

<223> 基因编辑同源性臂池_5_b2176_左

<400> 132

atggattgca tgcgtttcac tcaattgtac tttaattgac caaccccgct tattaacttt 60

ctgtatcact ttttcttata aaaaatcatg taaaaccgct cgccaagacc gcaccaatcg 120

ggtaatctcg aactcgtttt gcctcggcgg tagattatcc tcacagcata taattttgtg 180

cgttagtcca cagatttggc cttaaggaat tgtttcaaca tgcccaggta attagtctcg 240

tgtcgcttgg cattttttta taacgatatt tgtcgttaag gacttcaagg gaaaacaaac 300

aacatggtca aatctcaacc gattttgaga tatatcttgc gcgggattcc cgcgattgca 360

gtagcggttc tgctttctgc atgtagtgca aataacaccg caaagaatat gcatcctgag 420

acacgtgcag tgggtagtga aacatcatca ctgcaagctt ctcaggatga atttgaaaac 480

ctggttcgta atgtcgacgt aaaatcgcga attatggatc agtatgctga ctggaaaggc 540

gtacgttatc gtctgggcgg cagcactaaa aaaggtatcg attgttctgg tttcgtacag 600

cgtacattcc gtgagcaatt tggcttagaa cttccgcgtt cgacttacga acagcaggaa 660

atgggtaaat ctgtttcccg cagtaatttg cgtacgggtg atttagttct gttccgtgcc 720

ggttcaacgg gacgccatgt cggtatttat atcggcaaca atcagtttgt ccatgcttcc 780

accagcagtg gtgttattat ttccagcatg aatgaaccgt actggaagaa gcgttacaac 840

gaagcacgcc gggttctcag ccgcagctaa taaaccgttt ggatgcaatc ccttggctat 900

cctgacgagt taactgaaag cactgcttag gcagtgcttt tttgttttca ttcatcagag 960

aaaatgatgt ttccgcgtct tgatccaggc tatagtccgg tcattgttat cttttaaatg 1020

ttgtcgtaat ttcaggaaat taacggaatc 1050

<210> 133

<211> 1050

<212> DNA

<213> 人工序列

<220>

<223> 基因编辑同源性臂池_5_b2176_右

<400> 133

atgttcatac gcgctcccaa ttttggacgt aagctcctgc ttacctgcat tgttgcaggc 60

gtaatgattg cgatactggt gagttgcctt cagtttttag tggcctggca taagcacgaa 120

gtcaaatacg acacactgat taccgacgta caaaagtatc tcgataccta ttttgccgac 180

ctgaaatcca ctactgaccg gctccagccg ctgaccttag atacctgcca gcaagctaac 240

cccgaactga ccgcccgcgc agcgtttagc atgaatgtcc gaacgtttgt gctggtgaaa 300

gataaaaaaa cattctgttc atctgcgacc ggtgagatgg acattccact caatgaattg 360

attccggcgc tcgacattaa taaaaacgtc gatatggcga tcttacccgg cacgccgatg 420

gtgccgaaca aacccgcaat cgtcatctgg tatcgcaacc ctttgctgaa aaatagcggc 480

gtctttgccg ctctgaatct caacctgacg ccttcactct tttatagttc acggcaggaa 540

gattacgatg gcgtcgccct cattattggc aatactgcgc tatctacctt ttcttcacgt 600

ttgatgaacg ttaacgaatt aaccgacatg ccagtccgtg aaactaaaat tgcgggcatt 660

cctctgaccg ttcggcttta tgcagatgac tggacatgga acgatgtgtg gtacgcattt 720

ttactgggcg gcatgagtgg aactgtcgtt ggcctgctct gctattacct gatgagcgta 780

cgtatgcgcc ccggcagaga aatcatgacc gccatcaagc gcgaacaatt ttacgtggcg 840

tatcaaccgg tggtggatac acaagctttg cgagtaacgg gcctggaagt actgctacgc 900

tggcggcatc ctgtcgcggg agaaattccc ccggatgcct tcattaactt tgccgaatcg 960

caaaagatga ttgtgccgct gactcagcac ctgtttgagt taattgcccg cgatgccgca 1020

gaattagaaa aagtgctgcc ggtaggcgtc 1050

<210> 134

<211> 1050

<212> DNA

<213> 人工序列

<220>

<223> 基因编辑同源性臂池_5_b2168_左

<400> 134

agttttgctt ttcgcgccgc cgcgcccagc agggtcttcg ccatataggc gcgtgcctga 60

ccgagattag cgtcaataat cagcagcgtt ttcattatgc ctctcctgct gtcagttaaa 120

aggttgtaag tcgacgcgcg ccatcattgc ggccaactgc ggacgatcgg taatacccac 180

attgctttga cttaccgcca gggctgcaac agctgtcgcc agacgcagtg tgtgttcact 240

ggattcacgc atcagcaagc cataaatcag gccaccaacc atagaatccc ctgcgccaac 300

ggtgcttacg acatcgactg acggtggttt ggcgatccat tcgccggagg cattaaccca 360

aagcgcgcct tcggcaccca gtgaaataac aacatgcgcg atgccttgtt cacgtagcgc 420

atgtgcagct tcaatcacat ctttcatttc aggcagttta cggcctgccc agatttccag 480

ctcgcggcgg ttaggtttca ccagccacgg tgccgctttc aaacctgcta ctaacgcttc 540

acggctacta tcaaagataa tgcaaggaca ctgactacgc aggcgagtca tccagtcggt 600

gaacgcttcc gggctgacgc ctgacggtaa gcttccgctg acacagacca tatcgaactg 660

accgagccag ctcagagaat cagtcacaaa gcgttcccag tcggcggggg tgacttcaaa 720

acccgagaag ttgaagtcgg tcacttcgcc gtctttttcc gtcagcttaa cgttaattcg 780

ggtgcgcccc tgtacaacct ggaaacggtt ggcaatgccc agctcgctga acagttgctg 840

aaaaccatcc tgattgtctt tacccaggaa gccgccaacg gtgacatcaa ttcccaggtc 900

ttttaatact ttggccacgt tgatgccttt acccgccgca tgcagaccgg tggttttcac 960

caggttcact tcgccgcgtt caatttccgg gcagaaacca acaaggtcat aagccggatt 1020

aagggtgata gtagcaacac gtctgctcat 1050

<210> 135

<211> 1046

<212> DNA

<213> 人工序列

<220>

<223> 基因编辑同源性臂池_5_b2168_右

<400> 135

tatgcgccct ccccaagacc agcagcgata gcgtcgccga ttgctttcag cgcctgttca 60

gcatctgcac cctgggcggt aaagcgtagg cgatgacctt tcttaacgcc aagtgccaca 120

actttcatca gactacgtcc gtttgccggt ttgccggtac catcaaggtt tgtcacggta 180

atatcactgt taaattgttt aatggtattg accagcatgg tacctggacg agcatgcagg 240

ccgtgttcat tgcgcaccac aaactccgcg cttaacacgt cgtcggtcgg cgcatcatcg 300

ctggtcagca gcgccagcaa cgttgccgca tccgctttca gcaagcggtc agctttattg 360

tcgagcaata aatcagcgag acgcttaaga accgcgatgg gctgatcgtc attcatcgcc 420

acactcacca gcatggctgc cgtttcgccg tccacatcaa aagcatttgc cgcacggctt 480

accgcaatcg cgctacgcag attgccttcg gcgctatcgc tcagccagat accctgtccg 540

agattcagcg gttgttcatt gatggctttg gtgacgaaag tggcgtcaac tgcccccgcc 600

tctttcagac gcgcagcgtt cagcgcctga agagtcagca gatcgctggc gacgatatcc 660

agtgtcagca tttcgttgtc gagcttcagc tgctcactct gcttttcgcc catcagtaat 720

gcgcgaagtt cttctgctgt tgttgctgac ttcagttgtt cagcaacgga atcatcgctc 780

agtacgtggg tcagctggcg tagcaggccc agatgttcat ccgagctggc agcaataccg 840

attgccacgt acgctacctg accgtcaccc caggtgacgc cttccgggaa ctgaaatacc 900

tgaacgccgg ttttcagcac ctgatcgcgg gtgtcggtag tgccgtgtgg aatagcaata 960

ccattgccga ggaacgttga ggtttgctgt tcgcgcgcca gcatgccatt gacgtagcct 1020

tctgctacat taccggcctg caccag 1046

<210> 136

<211> 1050

<212> DNA

<213> 人工序列

<220>

<223> 基因编辑同源性臂池_5_b1872_左

<400> 136

catcagcatt gtgcgattcg ccgccatcag ttcagcgagt ttgactatct gcgcttccgg 60

tacgccagta atttccgccg cccagaccgc gctcttcggc gtattatcgc tcttacctgt 120

cagatactct tcaaactgcg gatacccggt agtgtatttt tcaaggaaca ctttatcgtg 180

tttgccttgt gtcatcaggg tatgcgcaat ccctaacatc agtgccacgt cggtgcccat 240

attcggcgcg atccaggtgg cattatcgtc aaagaattcg atggtttcgg agcggatagg 300

atcaatggca atcactggtt tgccagattt tttcagctga tggaagtatt ccagcccttg 360

ctcatcggta ctgctccagg caatttttaa ggtattcagc gggttcattc cccacagcac 420

cacaacctgg ctgttttcca gaatcagcgg ccaggaggtc tgctgttcat acacctctac 480

agaaccgacc acatgcggca tgatcacctg tgctgccccg gttgaataat cgccgctatg 540

cccggaataa ccgcccgcca ggttcatata acgttgcagt aaggtttgcg ctttatgcaa 600

cacgccagaa gagcgccagc cgtaagatcc ggcaaaaatg gccgatggtc cgttagcttt 660

acgaatacga tcatgttgct catgaatcag ttttaatgcc tgttcccagc tcacctgtac 720

ataggtatct tcgccacgac ctttcgccgg ttgcagtgga ttatcgagat agctttttct 780

caccatcgga tgctgaatac gcgccgtggt gtgtacctga tccgccgccg tagactgtaa 840

ggaattcggt atggttttcg ccagcgcgcc tgttgaagaa acaatcttgc cgtccttcac 900

ttctacgttc atcgctcccc aacgtcccgc ggtgaggatt ttaccgccct tctcttctgc 960

ccatgcgggg agcggtgctg ccgatgtcac caccagcgct ccagcggcaa taccgctgtg 1020

tttaataaat tcacgtcttg ttaatgtcat 1050

<210> 137

<211> 1050

<212> DNA

<213> 人工序列

<220>

<223> 基因编辑同源性臂池_5_b1872_右

<400> 137

aacttcctcc ctgatcaacg aggatcactg tttctcggta atatctttgg cgttgtactg 60

gaaataccgc gttaaaatgt ccagttcgtt ttcgctcatg ctggttcgtg cccccattcc 120

tttggcaatg gacggccacg cattgacggt gtaatggtcg gcggcaatag gggcatgaca 180

accagcgcaa taggtatcgt caagtttttc agcgtattgc catagcggtt tacggtccgc 240

taatgcggga tcggtaagcg caccctgtaa agacgcctga cgccattgat tgccgtattc 300

gtcagcctgc cattccccgt ttacagtgag cgccttgata ccttcttcac ttaatgtggc 360

tagcgccagc cgttgacctg ccgccaggta gagcgtgttt tcactgccct gcatttgata 420

accctgcaac agaacgatcg gctgtttgcc actggcatca acgacggtga gatcggttcc 480

aggattcacg gtagccagct cgcctatgtg agaagttttg aaaggataaa tatgtgcgcc 540

attagtaact gaagtagcgg cctgactttc cagctcatgc gccgcgttgt catccatttt 600

tatttctggc ggaaaatggg caatgccttt atgacaatcg atacaggttt cgctgtcctt 660

ttgtgctttg ttatgcattt tctgcgcaga ttcactttgc gaggcaatat ccatggcatc 720

aaaagaatgg caactacggc acgttgcaga gtcagtggct tttaattctt tccatactgt 780

ttcggccatt tcctggcgat gagcttcgaa cttatcgtca ctgtctattt tgccgctaac 840

aaattcatga taaatatctt tagatgcctt taatttagca aataaataat ccatccctga 900

ctttggaata tggcaatcgg cacattccgc acgtatccct ttctggttcg aaaagtggac 960

agttccctga tattcctcaa aaggtttact catcgagtgg caggaaaggc aaaatgctgt 1020

atccgacgtt ttatgtaaga ctttttgcgc 1050

<210> 138

<211> 1050

<212> DNA

<213> 人工序列

<220>

<223> 基因编辑同源性臂池_5_b1203_左

<400> 138

gatgtaatct ttaccttctg cacgcatttt gcctgcttct ttcgcgcctt gttcaccttt 60

gtaagtgatg aaatcttcaa acgagatggt ttgtgcacgg ataaagcctt tttcaaaatc 120

agtatggatt ttgcccgctg cctgcggcgc ggttgctcca accggaatgg tccatgcacg 180

cacttctttc accccagcgg tgaagtaagt ttgcaggttc agcagtttat aaccggcacg 240

gatcacacgg ttcaggcccg gctcttccag cccaagctcc tgcataaact cgtcacgttc 300

ttcgtcgtcc agttcggcaa tgtctgcttc aacagcagca caaaccggaa ccacaacaga 360

accttctttc gccgcgattt cacgcacctg gtcaagatat gggttgtttt caaaaccgtc 420

ttcgttgacg ttggcgatgt acattgttgg tttcagcgtc aggaagctca ggtaacgaat 480

agccgctttc tcttcagcgc ttaaatccag cgcgcgcagc atacctgcat tttccaactg 540

gggcaggcat ttttccagga ccgccagctc agctttcgcg tctttatcgc cacctttggc 600

tttcttctgt acgcgatgaa tcgcacgttc gcaggtgtcg aggtctgcca gcgccagttc 660

ggtgttgata acttcaatat cgtcagccgg gttaactttg ccggaaacgt gaatgatgtt 720

gtcattttca aagcagcgaa caacgtgacc gatcgcttcg gtttcacgga tgttggtcag 780

gaactggtta cccagacctt cgcctttcga tgcgcctttt accagaccgg cgatatcgac 840

aaattccatg gtcgtgggaa gcgtacgctg cggttttacg atttcagcca gttgatccag 900

gcgaggatca ggcattggta cgacgcctgt gttcggctca atggtgcaga atggaaagtt 960

ggccgcttca ataccggctt tggtcagcgc gttgaacagg gtagatttcc cgacgttggg 1020

caaaccgacg ataccgcatt tgaatcccat 1050

<210> 139

<211> 1036

<212> DNA

<213> 人工序列

<220>

<223> 基因编辑同源性臂池_5_b1203_右

<400> 139

ttattgcgct ttaaaggcgt gcaatcggtt cgttgctttg gtcaagccat ctgtaaacca 60

catttcagta caacgcgccg cttcgtcaat ggcttcatca attaacttct gttcactaac 120

aggcggtttg cctaacacaa aaccgacaac tttattttta tcgcccggat gaccgattcc 180

gatgcgtaaa cggtgaaagt tagggttatt acccaattta ctgatgatgt ctttcagtcc 240

attgtgacca ccatggccac cgcccaattt aaatttggcg acgccaggag gcagatccag 300

ttcgtcgtgg gccaccagaa tttcgtccgg attaatgcgg aaaaaactgg ccatcgccgc 360

aacggctttg ccgctgagat tcataaatgt agtcgggact aacaggcgga catcttcgcc 420

tccaagagtg actcgcgaag tataaccaaa gaatttagcc tcttcgcgca gcggagcgcg 480

caaacgctct gccagtaagt caacgaacca ggcaccagca ttatgtcgcg ttgcggcgta 540

ttcagcaccg gggttcgcca ggccgacaat caatttaatc gtcacgtttt tttgtcctga 600

gtgtgtacat aactggcgcg tagtttactg gttgcggccc cgcttgacaa aaaactgcgt 660

atcaaatgca gataacgtaa taattgcctg agtggactat tagaaagtca aggtgttcag 720

gcgtttattt gtaaagtttt gttgaaataa gggttgtaat tgtgatcacg cccgcacata 780

acccactggg tgttgtctat actttacaca taaggaagag gggtattccc tgttacaacc 840

cagaaagttc cggaggtgac atatgaaacg caaaaacgct tcgttactcg gtaacgtgct 900

catggggttg ggtctggtgg taatggtggt cggcgtgggg tattcaatcc tcaaccagtt 960

accacagttt aatatgcccc agtatttcgc acatggtgca gtgctaagta ttttcgtcgg 1020

tgccattctc tggctg 1036

<210> 140

<211> 1050

<212> DNA

<213> 人工序列

<220>

<223> 基因编辑同源性臂池_5_b2231_左

<400> 140

gatgtctttc aggttcatga tcttcggctg accatggtgc aatgccacca tgttgatacc 60

gaaagaaacc tgcaactggg tctgggagta gaggttgttg agcacaactt caccgaccgc 120

atcgcgtttc acttcaatca cgatgcgcat accgtctttg tcagactcgt cacgcagcgc 180

gctgatgcct tccacgcgtt tttcttttac cagttccgca atcttctcga tcaggcgcgc 240

tttgtttacc tgatacggaa tttcgtggac gataatggtt tcacgaccgg ttttggcgtc 300

aacttccact tctgcgcgag cgcggatata caccttgccg cgaccggtac ggtaagcttc 360

ttcaataccg cgacgaccgt taatgattgc cgccgtcggg aagtccggcc ccgggatgtg 420

ttccatcagc ccttcaatgc tgatgtcttc atcatcaata tacgccagac aaccgttgat 480

gacttccgtc aggttgtgcg gcgggatgtt ggttgccata cctacggcga taccggaaga 540

accgttcacc agcaggttag gaattttggt tggcatgacg tccggaattt tttccgtgcc 600

gtcatagtta tcaacgaaat cgaccgtctc tttttcgaga tcggccatca gttcatgggc 660

aattttcgcc agacggattt ccgtataacg cattgccgcc gcagagtcgc cgtcgataga 720

accgaagtta ccctgaccgt ctaccagcat ataacgcagc gagaatggct gcgccatgcg 780

gacgatcgtg tcatagaccg ccgagtcacc atggggatgg tatttaccga ttacgtcacc 840

aacgacacgg gcagattttt tataggcttt gttccagtca ttgcctagta cgttcatggc 900

gtaaagtacg cgacggtgta ccggcttcag gccatctcgg acatctggca gcgcacggcc 960

aacaatgacc gacatcgcat aatccagata ggagctcttc agctcttcct caatgttgac 1020

cggtgtaatt tctctcgcaa ggtcgctcat 1050

<210> 141

<211> 1048

<212> DNA

<213> 人工序列

<220>

<223> 基因编辑同源性臂池_5_b2231_右

<400> 141

aatgcctgat atactcgttt gtcttgccaa ttacggagta gaagtgccaa tgaatgccga 60

aaaatcgccg gtaaaccata acgtagacca cgaagagatc gctaaatttg aagccgtcgc 120

ctcccgctgg tgggatctgg aaggtgagtt caaaccgctg caccgcatta acccgctgcg 180

tctgggctat attgccgagc gtgctggcgg tttatttggc aaaaaggtgc tcgatgtcgg 240

ttgtggcggc ggcattctgg ccgagagtat ggcgcgcgaa ggcgcgacgg tgaccggtct 300

ggatatgggc tttgagccat tgcaggtggc aaaactgcac gcactggaaa gcggcattca 360

ggtggattac gtgcaggaaa ccgtggaaga gcacgcggca aaacatgccg ggcagtatga 420

tgtggtgacc tgcatggaga tgctggagca cgtccccgat ccgcagtcag tggtcagagc 480

ctgtgcgcaa ctggtgaaac caggcggcga tgtctttttc tcgacactta accgcaacgg 540

caagtcatgg ctgatggcgg tggttggtgc ggaatatatt ttgcgcatgg tgcccaaagg 600

cacgcatgat gtgaagaagt ttattaaacc ggcagaattg ctgggctggg tggatcagac 660

cagtttaaaa gagcggcata tcactgggct gcattacaac ccgatcacta atacttttaa 720

actcggcccc ggcgtggatg tgaactatat gctgcacacg cagaataagt gaggttgatg 780

tttggccgcg ccaatgcctg atgcgacgct tgccgcgtct tatcaggcct acaaatgctc 840

cccgtaggcc ggataaggcg tttacgccgc atccggcaac cgtgccgact agacagtgat 900

taccatttca ccgtcatcga caaaaaccct gccgtctggg caaaatcatc actccctttc 960

tgccacgcca cgctgccgcg cagggacact cgctgactga tattgcccgt gactcccact 1020

tttatttcac cccgttgctt caccgcat 1048

<210> 142

<211> 1050

<212> DNA

<213> 人工序列

<220>

<223> 基因编辑同源性臂池_5_b1622_左

<400> 142

attatctcct cgctggtgat gggccttgtc ggcctggtga ttccattagt ctggccgatt 60

ttcgccatgg gtattagcgg cttgggccat atgataaaca gcgcgggtga tttcggaccg 120

atgctgtttg gtaccggtga acgtctgctg ttgccgtttg gtctgcatca cattctggtg 180

gcattaattc gctttaccga cgcaggcggc acgcaggaag tctgcggtca aaccgtcagc 240

ggcgcactga ccatcttcca ggcgcaattg agttgcccga ccactcacgg tttttctgaa 300

agcgccacgc gtttcctttc gcaaggtaaa atgcctgcgt ttctcggcgg tctgccaggt 360

gcagcgttag ctatgtatca ctgcgcgcgc ccggaaaatc gccataaaat taaaggtctg 420

ctgatttctg gcctgatcgc ctgcgtcgtt ggcggcacta ccgaaccgct ggaattcctg 480

ttcctgttcg tagcgccagt tctgtatgtc atccacgcgc tgttaaccgg cctcggcttc 540

accgtcatgt ctgtgctcgg cgtcaccatc ggtaataccg acggcaatat catcgacttc 600

gtggtgttcg gtattttgca tggtctgtca accaagtggt acatggtgcc agtggtggcg 660

gcaatctggt ttgtcgttta ctacgtcatc ttccgtttcg ctatcacccg cttcaatctg 720

aaaaccccgg ggcgcgatag cgaagttgcc agctcaatcg aaaaagccgt tgccggtgcg 780

ccgggtaaat caggttacaa cgttcctgca atcctcgaag cattaggcgg tgccgacaat 840

attgtcagcc tcgataactg cattacccgt ctgcgtttgt ctgtgaaaga tatgtcgctt 900

gttaatgtgc aggcactgaa ggacaatcgg gcaattggcg tagtacaact taatcaacat 960

aacctgcagg ttgttatcgg gccacaagtt cagtcagtaa aagatgaaat ggccggtctg 1020

atgcatactg tccaggcata aggataagat 1050

<210> 143

<211> 1050

<212> DNA

<213> 人工序列

<220>

<223> 基因编辑同源性臂池_5_b1622_右

<400> 143

atgttcgatt tttcaaaggt cgtggatcgt catggcacat ggtgtacaca gtgggattat 60

gtcgctgacc gtttcggcac tgctgacctg ttaccgttca cgatttcaga catggatttt 120

gccactgccc cctgcattat cgaggcgctg aatcagcgcc tgatgcacgg cgtatttggc 180

tacagccgct ggaaaaacga tgagtttctc gcggctattg cccactggtt ttccacccag 240

cattacaccg ccatcgattc tcagacggtg gtgtatggcc cttctgtcat ctatatggtt 300

tcagaactga ttcgtcagtg gtctgaaaca ggtgaaggcg tggtgatcca cacacccgcc 360

tatgacgcat tttacaaggc cattgaaggt aaccagcgca cagtaatgcc cgttgcttta 420

gagaagcagg ctgatggttg gttttgcgat atgggcaagt tggaagccgt gttggcgaaa 480

ccagaatgta aaattatgct cctgtgtagc ccacagaatc ctaccgggaa agtgtggacg 540

tgcgatgagc tggagatcat ggctgacctg tgcgagcgtc atggtgtgcg ggttatttcc 600

gatgaaatcc atatggatat ggtttggggc gagcagccgc atattccctg gagtaatgtg 660

gctcgcggag actgggcgtt gctaacgtcg ggctcgaaaa gtttcaatat tcccgccctg 720

accggtgctt acgggattat agaaaatagc agtagccgcg atgcctattt atcggcactg 780

aaaggccgtg atgggctttc ttccccttcg gtactggcgt taactgccca tatcgccgcc 840

tatcagcaag gcgcgccgtg gctggatgcc ttacgcatct atctgaaaga taacctgacg 900

tatatcgcag ataaaatgaa cgccgcgttt cctgaactca actggcagat cccacaatcc 960

acttatctgg catggcttga tttacgtccg ttgaatattg acgacaacgc gttgcaaaaa 1020

gcacttatcg aacaagaaaa agtcgcgatc 1050

<210> 144

<211> 1050

<212> DNA

<213> 人工序列

<220>

<223> 基因编辑同源性臂池_6_b1857_左

<400> 144

agcgacggcc agagtaagaa cggtgagcga ccccaacata acgcggtgtg gtcgcggtaa 60

attattaaac gccagggcga cagagcgggc tatctgttgc acgtaatcac ttcctcatta 120

atctcctttc aggcagctcg catactggtt ggctaattga ctcaggaatt ctgaatagct 180

tgttttaccc agtttgatat tcgtccccag gggatccaac gttcccatac gaacggatgt 240

ccctcgtgcg acgctctcaa cgaccgctgg cctgaactgt ggctcagcaa aaacgcaggt 300

tgctttttgc tcaaccaact gtgttcttat ttcatgtaaa cgctgcgcgc caggttgaat 360

ctcagggtta acggtaaaat gaccaagcgg tgtcagtcca aactgttttt cgaaatagcc 420

gtaagcatcg tgaaaaacga aataaccttt ccccttgagc ggcgcgagct cgttaccaac 480

ctgcgtttcg gttgaggcta attgtgcctc aaaatccttc aggttggcgt caagtttggc 540

tcgactttgc ggcataagtt ccactaattt tccatggatt gcaaccgctg tagcccgcgc 600

tatctctggg gaaagccaaa gatgcatgtt gaaatcgccg tgatggtgat cttcgtcact 660

tttttccgcg tggtcgtgat catcatcatc gccgtgaata cttttcatca gtagcggttt 720

cacatcttca agctgcgcaa tcgttacctg cttcgctcct ggtaatttgc ttaccggttt 780

ttgcataaac gcttccatct ccgggccaac ccaaacgact aagtccgcgt tctgtaagcg 840

ttttacatcc gatgggcgca gtgaataatc atgttctgaa gcgccgtcag gaagtaaaac 900

ctctgtttct gttaccccat cagcaatggc agaagcgatg aacccaacgg gtttaagcga 960

agcgacaacg gcggcatctg cggcctgtgt tgcacctccc cagagagcgg cggataatgc 1020

tgcgaaaaga agcgtttttt tatgtaacat 1050

<210> 145

<211> 1031

<212> DNA

<213> 人工序列

<220>

<223> 基因编辑同源性臂池_6_b1857_右

<400> 145

aatgcgacca ataatcgtaa tgaatatgag aagtgtgata ttataacatt tcatgactac 60

tgcaagacta aaattaacat gacaagtctg gtttccctgg aaaatgtctc ggtttctttt 120

ggccaacgcc gcgtcctctc tgatgtgtcg ctggaactta aacctggaaa aattttgact 180

ttacttgggc caaatggcgc aggtaagtcg acactggtac gggtagtgct cgggctggta 240

acacccgatg aaggggttat caagcgcaac ggaaaactgc gcatcggcta tgtaccgcag 300

aagctgtatc tcgacaccac gttgccactg accgtaaacc gttttttacg cttacgccct 360

ggtacacata aagaagatat tttgcctgca ctgaaacgtg tccaggccgg gcacctgatt 420

aacgcaccga tgcaaaagct ctctggtggc gaaacgcagc gtgtactatt agcgcgagca 480

ttgttaaatc gcccgcaatt attagtgctg gatgaaccca ctcaaggcgt ggatgtaaat 540

ggccaggtgg cgttatatga ccttattgac caactgcgtc gtgaactgga ttgtggcgtt 600

ttaatggttt ctcacgatct gcatctggtg atggcaaaaa ccgatgaagt gctgtgcctg 660

aatcaccaca tttgttgttc cggcacaccg gaagttgttt ccctgcatcc ggagtttatt 720

tcaatgtttg gtcctcgtgg tgctgaacaa ctgggtatct atcgccatca tcataaccat 780

cgtcacgatt tacagggacg aattgttttg cgtcggggaa atgatcgctc atgattgaat 840

tattatttcc cggttggtta gccgggatca tgctcgcctg tgccgcgggt ccgctgggtt 900

cgtttgtagt ctggcgtcgt atgtcttatt tcggtgatac gctggctcat gcctcattac 960

ttggcgtcgc gtttggtttg ttgctggacg tgaatccatt ctatgcggtg attgccgtta 1020

cgctgctgct g 1031

<210> 146

<211> 1050

<212> DNA

<213> 人工序列

<220>

<223> 基因编辑同源性臂池_6_b4024_左

<400> 146

tgccacgctc acttctgacg tggtgattaa gtctaccgaa atattatgcc gcgcgaggat 60

gccgaaaact tccgcgagga aaccgcgaga atgcagcata ttcaggctgt gcaaagtgag 120

cagagtctga ttgcgacgaa gcgccagagc gcggaacagc ggcggatttt cagttttatt 180

gcacaccagc gtaccacctg cgcgtgggtc tttgctggag ccgacaaaga ccgggatatc 240

gctgcgtact gcgggtagca acgttgccgg atgcagtact tttgcaccaa aagttgccat 300

ctctgccgct tcggcaaacg cgatttcatc aatgcgtttt gctgcggaaa ctacgcgtgg 360

atcggtggtg tagatgcccg ggacgtcggt ccagatatca acacgagatg cgtgtaaagc 420

ctccgccagc aaggctgccg tataatcgct gcctccacgg ccaagcgtcg ttgtacgacc 480

tttattttcg ctaccgataa atccctgggt gatcactaag ccttcattga gacgtgggag 540

cagctgcagc gcggccagtt ccgccagcgc ggctatatct ggctctgcac gaccaaatcg 600

gtcgttggta cgcatcactt tacgtacatc aaaccactgt gcctgaacat cgcgttcgcg 660

caggatctca acaaacagca gggtcgacat cagctcgccg tggctgacca gctcatctgt 720

cagcgccgga gacgttgcca gcgccgccgc ttctgccaga acagtaatgt tctccagcag 780

acgttcaatc tcttcacgga taacgttcgg gtaacgcaga cgttccagaa tggcaaactg 840

gatgttgcgg atagcgtcga gtttttcgaa tcgctcgcca ggttccagtc cttcagctaa 900

agcgaccagc agattagtga taccagcaga agccgagagg acaactaaac gcacgttggc 960

atcagaaagc acaatatcag cgctgcggtt catggcgtca aaatcagcta cgctggtacc 1020

gccaaatttg gagacaacaa tttcagacat 1050

<210> 147

<211> 1050

<212> DNA

<213> 人工序列

<220>

<223> 基因编辑同源性臂池_6_b4024_右

<400> 147

aactacctcg tgtcagggga tccattttca gccttggcac aagggaagag cggaagacgg 60

gtgggcgcag agcgatactt cgctactatt ttcacccaga agtgctccac cacttgcgaa 120

acgcccgact gcgaacgctt ctggtgacaa cccaggggat tcagcccctg tagccgatga 180

tgaacgtggc cagccgttca atcacctcgg cgatgcaccc cctcaggtgt tatcacagga 240

ctggctcctc caacaccgtt acttgggcaa cgcgcctctt ctggcctgcg ctagcgcagg 300

tagtacattt ataaataaag ggtgagcggg gcggttgtca acgatggggt catgcggatt 360

tttcatccac tcctggcggt cagtagttca gctaataaat gcttcactgc gctaagggtt 420

tacactcaac attacgctaa cggcactaaa accatcacat ttttctgtga ctggcgctac 480

aatcttccaa agtcacaatt ctcaaaatca gaagagtatt gctaatgaaa aacatcaatc 540

caacgcagac cgctgcctgg caggcactac agaaacactt cgatgaaatg aaagacgtta 600

cgatcgccga tctttttgct aaagacggcg atcgtttttc taagttctcc gcaaccttcg 660

acgatcagat gctggtggat tactccaaaa accgcatcac tgaagagacg ctggcgaaat 720

tacaggatct ggcgaaagag tgcgatctgg cgggcgcgat taagtcgatg ttctctggcg 780

agaagatcaa ccgcactgaa aaccgcgccg tgctgcacgt agcgctgcgt aaccgtagca 840

ataccccgat tttggttgat ggcaaagacg taatgccgga agtcaacgcg gtgctggaga 900

agatgaaaac cttctcagaa gcgattattt ccggtgagtg gaaaggttat accggcaaag 960

caatcactga cgtagtgaac atcgggatcg gcggttctga cctcggccca tacatggtga 1020

ccgaagctct gcgtccgtac aaaaaccacc 1050

<210> 148

<211> 1029

<212> DNA

<213> 人工序列

<220>

<223> 基因编辑同源性臂池_6_b3942_左

<400> 148

gctgcgggtc tgtacccact catacttgaa caggttctcg aagaaatagt tgctccactg 60

ggtcggcgtc tgggtccaga ctacttccag accagaggta atggcatctg cgccaacgcc 120

gctgccgtaa gtgctcgccc aacctaaacc ttgttcttca atcggtgcag cttctggatc 180

aggacctaca tttgatgtcg gaccggcacc gtgggtttta cccagcgtat gaccacccgc 240

aatcagcgcc acggtttctt cgtcgttcat gcccatgttg ccgaaggtcg cgcggatagc 300

tgctgccgca gaaagcggtt cgccgctgtg atccgggcct tccgggttaa cgtaaatcag 360

acccatctcg gttgcaccca gcggtgcttt cgccagcgct tccggatgac ggtgagtcag 420

ccaggctttt tcatcacccc agttaacatc cagatccggt tcccagacgt cttcacgacc 480

ggcaccaaaa ccgaaggtac ggaagccgga gttttctagc gccacgttac ccgcgaggat 540

aaacaggtcg gcccaggaga ttttctgacc atatttctgt ttgattggcc acaacaggcg 600

acgcgcttta tcgaggctta cgttatccgg ccaggagttc agcggtgcaa aacgttgctg 660

accacgaccc gcgccaccgc gtccatcgat tgaacggtaa gtccccgcgc cgtgccaggc 720

catacgaata aacagaccgg cgtaactgcc ccagtcggct ggccaccacg gttgagattc 780

tgtcaacagg gctttcagat cttttttcag gccgtagtaa tctaatttgc tgaattcttt 840

gcggtagtca aagtcctcac ccagtgggtt agaacgatta gaatgttggt ttaacaggtc 900

aacacgaagt tgatttggcc accagtcgcg agtggttgtg cccgcccccg cactctggtc 960

gtgaccgccc tgatggaacg ggcatttgcc agtggctgtg gtgttatgga tatcgtctga 1020

cgtgctcat 1029

<210> 149

<211> 1045

<212> DNA

<213> 人工序列

<220>

<223> 基因编辑同源性臂池_6_b3942_右

<400> 149

agttgagatc ttacatattg ttggttaaag agatgtagat caaattgatc ttaattaagc 60

ttttttgatt atgtccgaat tcggacaaat gctttataaa aaagggtttt agcttcatat 120

ccttcaagta atgagggaga aaacaaggct gataacctta ttttcccgcc ctcatttcga 180

ggcagcattt tgtgctctgt ttaaaatttg tgatcactgt gtgattttca caaaagccac 240

actatttata aaccaggtcg aacccccagc gtatggcaaa tcgcgtaact catttcagca 300

cggttaagcg tatagaagtg gaaatctttc actccttcac ggcttaaaat cttcaccata 360

tccatggcaa tattcgcgcc aaccagtttg cgggtttcgg catcatcatc cagaccgtcg 420

aacatttgcg ccatccacgc cggaatacgc acgttggtca tatcggcaaa tttcttcgcc 480

tgtttaaagt tagataccgg caaaattccc ggaataattt ccacatcaat gcccgccgat 540

acacagcggt cacgaaaacg caggtagctt tcgacatcga agaagaactg agtaatcgcg 600

cggttggctc cggcatccac tttgcgtttc agattaagca aatccgcctg agcgcttttt 660

gcttccgggt gaacttccgg atacgccgcc acggagatat cgaaatctgc cacttctttt 720

aacagcgtca ccaggtcaga agcatacatt tctggcttac cacttcccgg cggcagatcg 780

ccacgcagcg ccacgatatg acgaataccg ttattccagt agtcgcgtgc aatggtgcgc 840

agctcgtcgg gcgtcgcatc aatgcaagta agatgcggtg ccgcttccag accagtgcga 900

tctttaatgc ctttaataat gctgtgcgta cggtcgcgct cgccggagtt cgcgccatag 960

gtcaccgata caaacttcgg tttcaggctg ctaaggcgat cgatggagtt ccacagggtc 1020

tgctccattt cactggtacg cggcg 1045

<210> 150

<211> 1050

<212> DNA

<213> 人工序列

<220>

<223> 基因编辑同源性臂池_6_b0592_左

<400> 150

ttgattatcg gcgtgttgtt attgctggtg ctggtggagt tgcgacattt tcgccagacg 60

ccgccgcagg tgacagcgtc cgacagttaa tgcttaaaac agcgccttaa gcctatccag 120

cacttgcatg gcgctgtagt aatccagacg gaacgtctcg gttcccagcg cataaacctg 180

cttgttttgt actgcaggca ggtgcgcgag cagcggatta gcataaatag catcggcatc 240

tttctgatca ccggcgaaca ggaatagtga ctcgccattt aaccctgcag ccagattttc 300

cccaccaagc tgaatgatgt catggcgttt accctgactt tggctggcat ttaaccctgc 360

gggtaacttc gccagcgtaa agccgagttg ttccagcatc tgcccttgtg ctgattctgg 420

cgtccagaga ttggcactgt gtgcagcggc agtatagaca atggcagtga ccggctgcgg 480

cggtaatttg atttgctctt tcgccgccgc cagttgctta tcaaactgcg caatccgctc 540

tgccgcttgt ttctcatgcc cggtaatttc gccaagttgc gttaacagcg actgccagct 600

tttgtcgtcg taattgatga ttaatgtcgg ggcgatggtg gaaagctgat catacagtgc 660

cagcgccgaa tccccgccgg ttgcgctaat taaaatcaga tccggcattt gcgcggcaac 720

ggcttcggcg ctcggttcgc cgatatagag ccgttgcagt ttgcgttctt tcgccacctt 780

gctccactgg cgtaaaaagc cctggtcatc cgcgacgcgg ttattcggcg tggtcgcgcc 840

gctggcgatc accggagcat caatcgccag cagtgagccg gtcagggtga cgctggtgga 900

aacaatacgc tgcggctggc tttccagtgt atgtgtgcca cggctgtcag taatctgacg 960

cggccagtca gcggcctgaa ctgcggctat tcctgaaagc aaaagtcctg ttaatagaag 1020

ggcgttgcgg tagagcgggg cgagtctcac 1050

<210> 151

<211> 1050

<212> DNA

<213> 人工序列

<220>

<223> 基因编辑同源性臂池_6_b0592_右

<400> 151

aaatcagctt cctgttatta ataaggttaa gggcgtaatg acaaattcga caaagcgcac 60

aatccgtccc ctcgcccctt tggggagagg gttagggtga ggggaacagc cagcactggt 120

gcgaacatta accctcaccc cagccctcac cctggaaggg agagggggca gaacggcgca 180

ggacatcaca ttgcgcttat gcgaatccat caataatgct tctcattttc attgtaacca 240

caaccagatg caaccccgag ttgcagattg cgttacctca agagttgaca tagtgcgcgt 300

ttgcttttag gttagcgacc gaaaatataa atgataatca ttattaaagc ctttatcatt 360

ttgtggagga tgatatggat acgtcactgg ctgaggaagt acagcagacc atggcaacac 420

ttgcgcccaa tcgctttttc tttatgtcgc cgtaccgcag ttttacgacg tcaggatgtt 480

tcgcccgctt cgatgaaccg gctgtgaacg gggattcgcc cgacagtccc ttccagcaaa 540

aactcgccgc gctgtttgcc gatgccaaag cgcagggcat caaaaatccg gtgatggtcg 600

gggcgattcc cttcgatcca cgtcagcctt cgtcgctgta tattcctgaa tcctggcagt 660

cgttctcccg tcaggaaaaa caagcttccg cacgccgttt cacccgcagc cagtcgctga 720

atgtggtgga acgccaggca attccggagc aaaccacgtt tgaacagatg gttgcccgcg 780

ccgccgcact taccgccacg ccgcaggtcg acaaagtggt gttgtcacgg ttgattgata 840

tcaccactga cgccgccatt gatagtggcg tattgctgga acggttgatt gcgcaaaacc 900

cggttagtta caacttccat gttccgctgg ctgatggtgg cgtcctgctg ggggccagcc 960

cggaactgct gctacgtaaa gacggcgagc gttttagctc cattccgtta gccggttccg 1020

cgcgtcgtca gccggatgaa gtgctcgatc 1050

<210> 152

<211> 1024

<212> DNA

<213> 人工序列

<220>

<223> 基因编辑同源性臂池_6_b1415_左

<400> 152

gcatttcctt aaaagatatg tcaggcttgc ggagtggcgg ttaaggacat acgatttcct 60

cctttcagag tgctccgctt ctcactatta tctcacgcag tattcttaag ggaacgataa 120

ggaggaacca tgaacattac cccgtttccg acgctttcgc cggcaactat agatgccata 180

aatgttatcg gacagtggct ggcgcaggat gatttctccg gtgaggtgcc gtatcaggcc 240

gattgcgtga tccttgcagg caatgcggtt atgccgacta tcgatgcggc atgtaagatt 300

gcccgcgatc agcaaattcc tttactgatt agtggtggta tcggtcactc gacaactttt 360

ttgtatagcg ccatcgcaca gcatccgcac tacaacacta tccgcaccac tggcagagca 420

gaagcgacca tcctggcgga tatcgctcat cagttctggc acattccgca tgaaaaaatc 480

tggattgaag accagtcaac aaactgcggt gaaaacgcac gctttagcat cgcgctattg 540

aatcaggccg tagaacgagt tcatacggct atcgttgttc aggaccccac catgcagcgg 600

cgcacgatgg cgacgttccg ccgtatgact ggggacaatc ccgatgcacc acgctggtta 660

agttatcccg gattcgttcc tcagttagga aataacgcag acagtgtaat ctttattaat 720

cagttacaag gattatggcc agttgagcgt tatctctcac tactcactgg cgagctgccg 780

cgtttacgcg atgatagcga tggctacggt ccccgcgggc gagattttat cgttcacgtt 840

gattttccgg cagaagtcat ccatgcatgg caaacgctga aacatgatgc ggtgctcatc 900

gaggcgatgg aaagtcgctc gttacgttaa aaattgcccg tttgtgaacc acttgtttgc 960

aaacgggcat gactcctgac ttttatttct gccttttatt ccttttacac ttgtttttat 1020

gaag 1024

<210> 153

<211> 1050

<212> DNA

<213> 人工序列

<220>

<223> 基因编辑同源性臂池_6_b1415_右

<400> 153

atgtcagtac ccgttcaaca tcctatgtat atcgatggac agtttgttac ctggcgtgga 60

gacgcatgga ttgatgtggt aaaccctgct acagaggctg tcatttcccg catacccgat 120

ggtcaggccg aggatgcccg taaggcaatc gatgcagcag aacgtgcaca accagaatgg 180

gaagcgttgc ctgctattga acgcgccagt tggttgcgca aaatctccgc cgggatccgc 240

gaacgcgcca gtgaaatcag tgcgctgatt gttgaagaag ggggcaagat ccagcagctg 300

gctgaagtcg aagtggcttt tactgccgac tatatcgatt acatggcgga gtgggcacgg 360

cgttacgagg gcgagattat tcaaagcgat cgtccaggag aaaatattct tttgtttaaa 420

cgtgcgcttg gtgtgactac cggcattctg ccgtggaact tcccgttctt cctcattgcc 480

cgcaaaatgg ctcccgctct tttgaccggt aataccatcg tcattaaacc tagtgaattt 540

acgccaaaca atgcgattgc attcgccaaa atcgtcgatg aaataggcct tccgcgcggc 600

gtgtttaacc ttgtactggg gcgtggtgaa accgttgggc aagaactggc gggtaaccca 660

aaggtcgcaa tggtcagtat gacaggcagc gtctctgcag gtgagaagat catggcgact 720

gcggcgaaaa acatcaccaa agtgtgtctg gaattggggg gtaaagcacc agctatcgta 780

atggacgatg ccgatcttga actggcagtc aaagccatcg ttgattcacg cgtcattaat 840

agtgggcaag tgtgtaactg tgcagaacgt gtttatgtac agaaaggcat ttatgatcag 900

ttcgtcaatc ggctgggtga agcgatgcag gcggttcaat ttggtaaccc cgctgaacgc 960

aacgacattg cgatggggcc gttgattaac gccgcggcgc tggaaagggt cgagcaaaaa 1020

gtggcgcgcg cagtagaaga aggggcgaga 1050

<210> 154

<211> 1048

<212> DNA

<213> 人工序列

<220>

<223> 基因编辑同源性臂池_6_b1762_左

<400> 154

caggcgttta tgagtattta acggatgatg ctccccacgg aacatttctt atgggccaac 60

ggcatttctt actgtagtgc tcccaaaact gcttgtcgta acgataacac gcttcaagtt 120

cagcatccgt taactttctg cgatagcagc agatatgcca gtaaagaaat cccatttgac 180

tatttttttg ataatcttct tcgctttcga acaactcgtg cgcctttcga gaagcaagca 240

ttatataatg ccaggccagt tcttcttcaa ttgtcccgtt ttgaaaagct gtgcttgata 300

tcgagatcat ccatgataat tccgccgccc atattagctt cgccgaggat ttaccggagc 360

tatgattagc gcaatcagag atatagtctg agggaaaaac agcaaattta ttcaacaagg 420

cgataacctg ctctggggct tcctccatgt ttgctttaaa ggtattggct ccatggtcgc 480

cagaaagaaa atgctccatt aaggcacaat aactttcgct atcttcgata ccccattgat 540

cctctaaaga ctcgcgtctt ttacttatga tatcgatcga gtcaaaagga agcacatgat 600

attggaaggt atctttgcca ggttcaggct ttcgcggcca gaactccagc gtttcagacc 660

attgcttatg atagaatcga taaggtgcga tcaattgtag cgcctgtaac ttctcgatac 720

tgagcggctc aataccttta gcctgataat aatgcagttg ttcttttttt gctttaaaac 780

cggcccgaac aataagcccc atcataatta atagataaag aaaagagcat cccgcggtaa 840

tcaggcctct ttcattcaaa ccgttggatg ttatcgctgc gaacacaaac attacagcga 900

caacacatgt taaataaaac ccccacttac aaagcagcat ggccttattt tctttaatca 960

tccgttcaaa attactatta aatatttccc agccattaaa agaatacttc tcgctcccag 1020

gatggttttg taataaaact tttttcat 1048

<210> 155

<211> 1050

<212> DNA

<213> 人工序列

<220>

<223> 基因编辑同源性臂池_6_b1762_右

<400> 155

tcagaatatg actcgaatag cacgaaagat tcactcgctt acgctatcgc cccgcttccg 60

acttcatctg ctggcggact ttttttcgca ctacgtttac gcggtgcagc ctttttctta 120

tcagcactgc caccactgcc cggagccaca atgccgcgaa actgccgcac cggcgtacgt 180

ttggcttgat caataagctg atatagcgtc cccaccagcg gctgcataaa gtcctgatag 240

cgacactgct tttcgctgat ttgcgtcagc accgattccc agtgcgcggt catgtccggt 300

cgcgtcgcca tctccggcag cgaatggaat agcgcttttc cggcgtcggt ggagtggata 360

tagcgccctt ttttggtcag gaaaccacgc ttgaacaaca gttcaataat cccggcacgc 420

gttgcctctg tccccagacc atcggtcgca cggaggatct ttttcagatc tttatcctgc 480

acaaagcgcg cgatcccggt catcgccgaa agcagtgttg catcggtaaa atggcgcggc 540

ggctgggttt gccgctctac cacttcacct ttttcacaca gcaactcatc gcctttcgcc 600

accacaggca gtggcgtgcc gtcgttttct tcatcgcgct ctttgctgcc taacagcgtg 660

cgccagcctg cttcagcaag aaaacgcgct ttagcgacaa atttgccttt ggcaatgtcc 720

agttcgataa cacacttgcg gaacaccgca tccgggcaga attgcatcag atactgacgg 780

gcaatcaggt tatagacctt cgcttcgttc tccgtcaggt tgatcgcaga actccgtgcg 840

gtcggaatga tggcgtggtg cgcatcgacc tttttgtcat cccaacagcg gttgcgtata 900

tctggatcta ccactggctg cggcaacaga tccggtgcat gaacactgat ggcattcatc 960

accgcgtggc gtccggcaaa atgttcttct ggcaaatagc gacaatcaga acgcggataa 1020

gtgattagct tgtgcgtttc gtacagtttc 1050

<210> 156

<211> 1050

<212> DNA

<213> 人工序列

<220>

<223> 基因编辑同源性臂池_6_b3414_左

<400> 156

gcattaatcc aacagcaagc gccacgagga cgagagcgat gaagccgttc attttgaagc 60

ggatcatcag gagcaacaac aagattacac cgatagcaac aatgactaat ggcatgattt 120

acctggcctt tcatttgtta tgggtaacgt caattttctg acgacaaact ctaattatcc 180

caatcgggaa cagagatatt gcggcaccac gactgatacc cactaaaact aattattgta 240

gtcagatgtc aggagtatgt ttggtaccca tgtgaatgat acgggtaaca tctggcgttt 300

gagaatcacc agagcggggt aaatttaaat tatgagaggt tggtcatatt atcgcgggga 360

aacgaaccga ggatttgaca aagcaatgct gcgccaacgt ctggcacatg ttcaacgtag 420

gcccgaaatg acgctttagc gtcgcatcgg gcaatctaca aaagagggga taacttagta 480

gtaggagtgt tcgccgcgct ggtgttcggt gagatcgcgc acacctttca gctccgggaa 540

ttcgttcagc agctgcttct cgatcccttc tttcagcgtc acatcgacca tggaacaacc 600

gttacagccg ccgccaaatt gcagaatggc gtaaccgtct tcggtgattt ccatcagcga 660

aacgcgacca ccgtgaccag caagctgtgg gttgatctgc gactgcagca tatactccac 720

gcgctccatc agcggtgcat cgtctgccac tttacgcatt ttggcgttcg gggctttcag 780

cgttaactgg gaacccaact ggtcggtaac aaaatcgatc tctgcatctt ccaggtatgg 840

tgcgcttaac tcatcaacat acgcggtcag caggtcaaat ttcagggctg tgtcggtggc 900

ttccacagcg tccggcggac aataagaaac gccacattca gcgttaggcg tgccagggtt 960

aatcacaaat acgcggattt gtgtcccttc ttcctgattt gccagcagtt tggcaaagtg 1020

cgcttgtgca gcatcggaaa tacggatcat 1050

<210> 157

<211> 1032

<212> DNA

<213> 人工序列

<220>

<223> 基因编辑同源性臂池_6_b3414_右

<400> 157

agtaatggcc taatagttga ctattttagt tggttataat acgcccatca tcgaggctct 60

acaaggttcg acaaaggcac cagacctgga cagccgccgc accattgcgt aaaagcaact 120

gcgcaatctc tgcgacggta cttccggtgg taacgacatc atccacaatc accatatggc 180

gaccttgcac gggcaattca agacgaaagg catttttcag gttgcgcttg cgcagccggg 240

cactgagaaa atgctgggtc gcagtggccc gtgtacgtgt gacggcttcg ctatcccatt 300

ggcagtgcaa ccagcgtgat aacggctgac acagcaaatc gctctgatta aatccccgac 360

gccagtgacg ccgctgccat aacggaacgc tgacgatgcg atccggcaat tgcaacccgg 420

tggtgcgacg agcgtgtaag acttccaata gtaacagacg tgacagggcg ctggcgattt 480

cactgcgccg ggaaaattta agctggtgga taagcggact taacggcggc gcatagtcgg 540

caaccgtgac cagtctttgc cagggcggcg gtttttgcag gcagcgaccg cagggaagat 600

gggagtgtgt ggcgggtaat ccacattgtg ggcataacgt tttatctgtg cgggtggcgc 660

gtgaacagac cgaacaaatc ccccaatgac ctaacgccag tggcattcgg catagccagc 720

ataatcccgg tactgttagc atatgttcat ccttgtaagt caaaagagaa caatagcgga 780

tgaataacat ctggtggcag accaaaggtc aggggaatgt tcatcttgtg ctgctgcacg 840

gatggggact gaatgccgaa gtgtggcgtt gcattgacga ggaacttagc tcgcatttta 900

cgctgcacct tgttgacctg cccggcttcg ggcgtagccg gggatttggt gcgctgtcac 960

ttgctgatat ggccgaagcc gtgctgcaac aggcacctga taaagccatt tggttaggct 1020

ggagtctggg cg 1032

<210> 158

<211> 1049

<212> DNA

<213> 人工序列

<220>

<223> 基因编辑同源性臂池_6_b4374_左

<400> 158

gcgggcaggt catcctgtaa gtctccggca aacagaatac ggctttgttc gaaatcatca 60

ctgtgacgca gcaagacttc acttgccggg gtaaatgcag acatggaatg ctcctcaatt 120

gatactggcg gcgattatag ccatatgttg gcgcggtatc gacgaatttg ctatatttgc 180

gcccctgaca acaggagcga ttcgctatga catcccgacg agactggcag ttacagcaac 240

tgggcattac ccagtggtcg ctgcgtcgcc ctggcgcgtt gcagggggag attgccattg 300

cgatcccggc acacgtccgt ctggtgatgg tggcaaacga tcttcccgcc ctgactgatc 360

ctttagtgag cgatgttctg cgcgcattaa ccgtcagccc cgaccaggtg ctgcaactga 420

cgccagaaaa aatcgcgatg ctgccgcaag gcagtcactg caacagttgg cggttgggta 480

ctgacgaacc gctatcactg gaaggcgctc aggtggcatc accggcgctc accgatttac 540

gggcaaaccc aacggcacgc gccgcgttat ggcaacaaat ttgcacatat gaacacgatt 600

tcttccctcg aaacgactga tttaccggcg gcttaccaca ttgaacaacg cgcccacgcc 660

tttccgtgga gtgaaaaaac gtttgccagc aaccagggcg agcgttatct caactttcag 720

ttaacgcaaa acggcaaaat ggcggcgttt gcgattacgc aagtggtgct ggatgaagct 780

acattgttca atattgcggt cgatcctgac tatcagcgtc agggattggg aagggcgctg 840

ctggaacatc tgatcgacga actggaaaaa cgcggcgtgg cgacactatg gctggaagtc 900

cgtgcttcaa acgctgccgc cattgccctg tacgaaagtt taggctttaa cgaggcgacg 960

attcgccgca attactaccc caccacggac ggtcgcgaag acgccatcat catggcgttg 1020

ccaatcagta tgtaatacaa ggtggaata 1049

<210> 159

<211> 1037

<212> DNA

<213> 人工序列

<220>

<223> 基因编辑同源性臂池_6_b4374_右

<400> 159

atgaagtggg actggatttt ctttgatgcc gatgaaacgc tgtttacctt tgactcattc 60

accggcctgc agcggatgtt tcttgattac agcgtcacct ttaccgctga agattttcag 120

gactatcagg ccgttaacaa gccactgtgg gtggattatc aaaacggcgc gatcacttca 180

ttacagcttc agcacgggcg gtttgagagc tgggccgaac ggctgaacgt cgagccaggt 240

aaactcaacg aagcctttat taatgcgatg gcggaaatct gcacgccgct gccgggcgcg 300

gtttctctgc ttaacgccat tcgtggcaac gccaaaatcg gcatcatcac caacggcttt 360

agtgccttgc aacaggtgcg tctggaacgc acgggcctgc gtgattactt cgatttgctg 420

gtgatttccg aagaagttgg cgttgccaaa ccgaataaga aaattttcga ttatgcgctg 480

gaacaggcgg gcaatcctga ccgttcacgc gtgctgatgg ttggcgacac tgccgagtcc 540

gatattctcg gtggcatcaa cgccgggctt gcgacctgct ggctgaatgc acaccatcgc 600

gagcaaccag aaggcatcgc gcccacctgg accgtttctt cgttgcacga actggagcag 660

ctcctgtgta aacactgatt gcctcccccc cgttgatggg taaaatagcc gcaatttttc 720

gttttcaaca agcgcggcgc gatgccgctt actcaagaag aaagaattat gacgttgtct 780

ccttatttgc aagaggtggc gaagcgccgc acttttgcca ttatttctca cccggacgcc 840

ggtaagacta ccatcaccga gaaggtgctg ctgttcggac aggccattca gaccgccggt 900

acagtaaaag gccgtggttc caaccagcac gctaagtcgg actggatgga gatggaaaag 960

cagcgtggga tctccattac tacgtctgtg atgcagtttc cgtatcacga ttgcctggtt 1020

aacctgctcg acacccc 1037

<210> 160

<211> 1050

<212> DNA

<213> 人工序列

<220>

<223> 基因编辑同源性臂池_6_b2917_左

<400> 160

acgtgaacga ggatttgagc gcgcggcaca aaagctgtgc attacacaat cagccgtctc 60

acagcgcatt aagcaactgg aaaatatgtt cgggcagccg ctgttggtgc gtaccgtacc 120

gccgcgcccg acggaacaag ggcaaaaact gctggcactg ctgcgccagg tggagttgct 180

ggaagaagag tggctgggcg atgaacaaac cggttcgact ccgctgctgc tttcactggc 240

ggtcaacgcc gacagtctgg cgacgtggtt gcttcctgca ctggctcctg tgttggctga 300

ttcgcctatc cgcctcaact tgcaggtaga agatgaaacc cgcactcagg aacgtctgcg 360

ccgcggcgaa gtggtcggcg cggtgagtat tcaacatcag gcgctgccga gttgtcttgt 420

cgataaactt ggtgcgctcg actatctgtt cgtcagctca aaaccctttg ccgaaaaata 480

tttccctaac ggcgtaacgc gttcggcatt actgaaagcg ccagtggtcg cgtttgacca 540

tcttgacgat atgcaccagg cctttttgca gcaaaacttc gatctgcctc caggcagcgt 600

gccctgccat atcgttaatt cttcagaagc gttcgtacaa cttgctcgcc agggcaccac 660

ctgctgtatg atcccgcacc tgcaaatcga gaaagagctg gccagcggtg aactgattga 720

cttaacgcct gggctatttc aacgacggat gctctactgg caccgctttg ctcctgaaag 780

ccgcatgatg cgtaaagtca ctgatgcgtt actcgattat ggtcacaaag tccttcgtca 840

ggattaatcc atcaaataat gcctgatagc acatatcagg cgttgtcctc acttcttttt 900

gtattccttg aatcacatca caaaatagac aaatctcagg cggcaaaaaa cgacgtctga 960

atgcattttt tttgctggcg acaaacccac gtaaaaagct caccgtaggc gcaaataccc 1020

tcattttgat tgcgttttac ggagcaaata 1050

<210> 161

<211> 1033

<212> DNA

<213> 人工序列

<220>

<223> 基因编辑同源性臂池_6_b2917_右

<400> 161

atgtctaacg tgcaggagtg gcaacagctt gccaacaagg aattgagccg tcgggagaaa 60

actgtcgact cgctggttca tcaaaccgcg gaagggatcg ccatcaagcc gctgtatacc 120

gaagccgatc tcgataatct ggaggtgaca ggtacccttc ctggtttgcc gccctacgtt 180

cgtggcccgc gtgccactat gtataccgcc caaccgtgga ccatccgtca gtatgctggt 240

ttttcaacag caaaagagtc caacgctttt tatcgccgta acctggccgc cgggcaaaaa 300

ggtctttccg ttgcgtttga ccttgccacc caccgtggct acgactccga taacccgcgc 360

gtggcgggcg acgtcggcaa agcgggcgtc gctatcgaca ccgtggaaga tatgaaagtc 420

ctgttcgacc agatcccgct ggataaaatg tcggtttcga tgaccatgaa tggcgcagtg 480

ctaccagtac tggcgtttta tatcgtcgcc gcagaagagc aaggtgttac acctgataaa 540

ctgaccggca ccattcaaaa cgatattctc aaagagtacc tctgccgcaa cacctatatt 600

tacccaccaa aaccgtcaat gcgcattatc gccgacatca tcgcctggtg ttccggcaac 660

atgccgcgat ttaataccat cagtatcagc ggttaccaca tgggtgaagc gggtgccaac 720

tgcgtgcagc aggtagcatt tacgctcgct gatgggattg agtacatcaa agcagcaatc 780

tctgccggac tgaaaattga tgacttcgct cctcgcctgt cgttcttctt cggcatcggc 840

atggatctgt ttatgaacgt cgccatgttg cgtgcggcac gttatttatg gagcgaagcg 900

gtcagtggat ttggcgcaca ggacccgaaa tcactggcgc tgcgtaccca ctgccagacc 960

tcaggctgga gcctgactga acaggatccg tataacaacg ttatccgcac caccattgaa 1020

gcgctggctg cga 1033

<210> 162

<211> 1047

<212> DNA

<213> 人工序列

<220>

<223> 基因编辑同源性臂池_6_b0346_左

<400> 162

tcgtataacg ttactggttt cacattcacc accctgaatt gactctcttc cgggcgctat 60

catgccatac cgcgaaaggt tttgcgccat tcgatggtgt caacgtaaat gcatgccgct 120

tcgccttccg gccaccagaa tagcctgcga ttcaacccct tcttcgatct gttttgctac 180

ccgttgtagc gccggaagat gcttttccgc tgcctgttca atggtcattg cgctcgccat 240

atacaccaga ttcagacagc caatcacccg ttgttcactg cgcagcggta cggcgataga 300

ggcgatcttc tcctcctgat cccagccgcg gtagttctgt ccgtaaccct ctttgcgcgc 360

gcgcgccaga atggcttcca gctttaacgg ttcccgtgcc agttgatagt catcaccggg 420

gcgggaggct aacatttcga ttaattcctt gcggtcttgt tccgggcaaa aggccagcca 480

ggtcaggccc gaggcggttt tcagaagcgg caaacgtcgc ccgaccattg cccggtgaaa 540

ggataagcgg ctgaaacggt gagtggtttc gcgtaccacc attgcatcaa catccagcgt 600

ggacacatct gtcggccata ccacttcgcg caacagatcg cccagcagtg gggccgccag 660

tgcagaaatc cactgttcgt cacgaaatcc ttcgcttaat tgccgcactt tgatggtcag 720

tcgaaaacta tcatcggagg ggctacggcg gacatatccc tcttcctgca gcgtctccag 780

cagtcgccgc acagtggtgc gatgcaggcc gctgagttcc gccagcagcc cgacgctggc 840

accgccatca agtttattta acatatttaa taacattaga ccgcgggtta agccgcgcac 900

ggttttgtat tccgtctgct cattgttctg catattaatt gacatttcta tagttaaaac 960

aacgtggtgc acctggtgca cattcgggca tgttttgatt gtagccgaaa acacccttcc 1020

tatactgagc gcacaataaa aaatcat 1047

<210> 163

<211> 1049

<212> DNA

<213> 人工序列

<220>

<223> 基因编辑同源性臂池_6_b0346_右

<400> 163

cgtgaggtac tgaaatggca atacaacacc ctgacatcca gcctgctgtt aaccatagcg 60

ttcaggtggc gatcgctggt gccggcccgg ttgggctgat gatggcgaac tatctcggcc 120

agatgggcat tgacgtgctg gtggtggaga aactcgataa gttgatcgac tacccgcgtg 180

cgattggtat tgatgacgag gcgctgcgca ccatgcagtc ggtcggcctg gtcgatgatg 240

ttctgccgca cactacgccg tggcacgcga tgcgttttct caccccgaaa ggccgctgtt 300

ttgctgatat tcagccaatg accgatgaat ttggctggcc gcgccgtaac gcctttattc 360

agccgcaggt cgatgcggtg atgctggaag gggtgtcgcg ttttccgaat gtgcgctgct 420

tgttttcccg cgagctggag gccttcagtc agcaagatga cgaagtgacc ttgcacctga 480

aaacggcaga agggcagcgg gaaatagtca aagcccagtg gctggtagcc tgtgacggtg 540

gagcaagttt tgtccgtcgc actctgaatg tgccgtttga aggtaaaact gcgccaaatc 600

agtggattgt ggtagatatc gccaacgatc cgttaagtac gccgcatatc tatttgtgtt 660

gcgatccggt gcgcccgtat gtttctgccg cgctgcctca tgcggtacgt cgctttgaat 720

ttatggtgat gccgggagaa accgaagagc agctgcgtga gccgcaaaat atgcgcaagc 780

tgttaagcaa agtgctgcct aatccggaca atgttgaatt gattcgccag cgtgtctaca 840

cccacaacgc gcgactggcg caacgtttcc gtattgatcg cgtactgctg gcgggcgatg 900

ccgcgcacat catgccggta tggcaggggc agggctataa cagtggtatg cgcgacgcct 960

ttaacctcgc atggaaactg gcgttggtta tccaggggaa agcccgcgat gcgctgctcg 1020

atacctatca acaagaacgt cgcgatcac 1049

<210> 164

<211> 1050

<212> DNA

<213> 人工序列

<220>

<223> 基因编辑同源性臂池_6_b3966_左

<400> 164

ctcaacataa cctgtacccg gcgtcgtagt ctgtttctgc cagtcgacac ccgcaccaat 60

actaccgtga ccaacgatga cattgtttgc ccactggacg gtgtattgct tcatctcatc 120

gagcgtcgcc gacgaatcat aacgaccata atggggatcg tagttgtaat ctttgctatg 180

gctatagctg gtaatgagtt gtgatttaat cagttcgccg ttatagcgca gcccggcgtc 240

ccaactttgg ctatagagtt tacgggtatc gagcaacggt gaaccgggag aataatacgc 300

gtcataattg gtacggttat catagccata gccgcgcaca aagccgctcc aggcatcagt 360

aaagttatgc tccagcgcgc cataaagcgt tttacttaaa aaaccatcgt tatctgtctg 420

cgcttgcgtt ccggtattac cataggcaac aacatcataa ccatgagtat gggcataatc 480

gcccaacagc gttacccgtg tcttatcccc cagttgttgc tgcgtagaga catcatagtt 540

ctgataacta ttgcttcccc accctgctga aatttccgtt ccgggttcat cgcgcgtcgt 600

gatgatattc accaccccgc ctattgcatc ggaaccataa acagcggagc gcggcccacg 660

gatatattca acacgctgga caagcgcaat agggaactgg ctaaggtcgg cagaaccact 720

cacccccgcc agattcaggc gtacgccatc aattaacacc aacacatgac tggcatttgt 780

accgcgaata aaaatagatg agagctgacc tgaaccgccg ttttgggtga tatcgacgcc 840

cggaagacgg cgcagcacat cattgaccga ggtcgactgc cagcggtcga tatcctgacg 900

ggtcacaacg gtggttggtg caagcacagt gctgcgcggc tgttcaaaac ggttagcagt 960

aacgacgaga gtatccgggc tggtatcctg tgcccaagcg gaaaatgccg tgacggaaca 1020

cgccgtcagc agcgaagctt ttttaatcat 1050

<210> 165

<211> 1050

<212> DNA

<213> 人工序列

<220>

<223> 基因编辑同源性臂池_6_b3966_右

<400> 165

tgtaaagcat ccacaataga agaaggatgc cgcaggtttc atcaatatta cgcgatgatg 60

agaaccagat gcgacgttgg ccggcaggtc ttcgggcttg gaggggtatc taagatacta 120

agagatgatg acttcccacc gaatggcagt gtccgcataa cgcaatcatc gcacctttcc 180

ttaccgctgc gcgtcagctc cagattcgca ctggattccc tattaactca caggaccggc 240

aagtggatgc tacaggttgt aacaagttac tgtccagacg tagctcacaa ataggaattc 300

atcaagatct ggacatctga tgagcaatcc ctacaatcgc cgcgtacttt aatttttcag 360

gatacatcat gacccccgaa caccttccaa cagaacagta tgaagcgcag ttagccgaaa 420

aagtggtacg tttgcaaagt atgatggcac cgttttctga cctggttccg gaagtgtttc 480

gctcgccggt cagtcattac cggatgcgcg cggagttccg catctggcac gatggcgatg 540

acctgtatca catcattttc gatcaacaaa ccaaaagccg catccgcgtg gatagcttcc 600

ccgccgccag tgaacttatc aaccagttga tgacggcgat gattgcgggt gtgcgtaata 660

atcccgttct gcgccacaag ttgttccaga ttgattacct cactacactg agtaatcagg 720

cggtggtttc cctgctatac cataagaagc tggatgatga gtggcgtcag gaagcggagg 780

ccctgcgcga tgcactgcgc gcgcagaatc tgaatgtgca tctgattggt cgggcaacga 840

aaaccaaaat cgagctggat caggattaca tcgatgaacg tctgccggtc gcagggaaag 900

agatgatcta ccgtcaggta gaaaacagct ttacccagcc gaacgcggcg atgaatattc 960

agatgctgga atgggcgctg gacgtaacca aaggctcaaa aggcgattta ctggagctgt 1020

actgcggcaa cggtaacttt tcattagcgc 1050

<210> 166

<211> 1050

<212> DNA

<213> 人工序列

<220>

<223> 基因编辑同源性臂池_6_b0406_左

<400> 166

gtcgtttact gtcgctggac gggccgacgg gcgcgctgac gcacggtact ttcaccgatt 60

tacttgataa gctcaacccc ggcgatcttc tggtttttaa taatacccgc gtgatcccgg 120

cgcgcctgtt tgggcgtaaa gccagcggcg gcaagattga agtgctggtt gaacggatgc 180

tcgacgacaa acgcattctt gcgcatattc gcgcctcgaa agcgccaaaa cctggcgcag 240

aactgctgct gggcgatgac gaaagtatta acgcaacaat gaccgcgcgc cacggcgcac 300

tgtttgaagt cgaatttaat gatgaacgct cggtgctgga tattctcaac agcatcggcc 360

atatgccgct gccgccgtat atcgaccgtc cggacgaaga cgctgaccgc gaactttatc 420

aaaccgttta tagcgaaaaa ccgggcgcgg ttgcagcccc gaccgcaggt ctgcattttg 480

acgagccttt gctggaaaaa ttgcgcgcca aaggcgtgga gatggcgttt gtgacgttgc 540

acgttggtgc gggcaccttc cagccggtgc gcgtcgacac cattgaagat cacatcatgc 600

actcggaata cgctgaagta ccgcaggatg tggtagacgc ggtactggcg gcgaaagcgc 660

gcggtaaccg ggtgattgcg gttggcacca cttcagtacg ttcgctggaa agcgcggctc 720

aggcagcgaa aaacgatctc attgaaccgt tcttcgacga tacccaaatc tttatctatc 780

cgggcttcca gtacaaagtg gtcgatgcgc tggtgacgaa cttccacttg ccagagtcga 840

cgctgattat gctggtttcg gcctttgccg gttatcaaca caccatgaac gcctataaag 900

cagcggtaga agagaaatat cgctttttta gttacggtga tgcgatgttt atcacgtaca 960

atccgcaggc aattaatgag cgcgtcgggg agtaattccg cggcgctggt ttaaaacgtt 1020

ggactgtttt tctgacgtag tggagaaaaa 1050

<210> 167

<211> 1050

<212> DNA

<213> 人工序列

<220>

<223> 基因编辑同源性臂池_6_b0406_右

<400> 167

atgaaatttg aactggacac caccgacggt cgcgcacgcc gtggccgcct ggtctttgat 60

cgtggcgtag tggaaacgcc ttgttttatg cctgttggca cctacggcac cgtaaaaggg 120

atgacgccgg aagaagttga agccactggc gcgcaaatta tcctcggcaa caccttccac 180

ctgtggctgc gcccgggcca ggaaatcatg aaactgcacg gcgatctgca cgattttatg 240

cagtggaagg ggccgatcct caccgactcc ggcggcttcc aggtcttcag ccttggcgat 300

attcgtaaaa tcaccgaaca gggcgtgcac ttccgtaacc cgatcaacgg cgatccgatt 360

ttcctcgatc ctgaaaaatc aatggagatt cagtacgatc ttggttcgga tatcgtcatg 420

atctttgatg agtgtacgcc gtatcctgct gactgggatt acgcaaaacg ctccatggag 480

atgtctctgc gttgggcgaa gcgtagccgt gagcgttttg acagtctcgg aaacaaaaat 540

gcgctgtttg gtatcatcca gggcagcgtt tacgaagatt tacgtgatat ttctgttaaa 600

ggtctggtag atatcggttt tgatggctac gctgtcggcg gtctggctgt gggtgagccg 660

aaagcagata tgcaccgcat tctggagcat gtatgcccgc aaattccggc agacaaaccg 720

cgttacctga tgggcgttgg taaaccagaa gacctggttg aaggcgtacg tcgtggtatc 780

gatatgtttg actgcgtaat gccaacccgc aacgcccgaa atggtcattt gttcgtgacc 840

gatggcgtgg tgaaaatccg caatgcgaag tataagagcg atactggccc actcgatcct 900

gagtgtgatt gctacacctg tcgcaattat tcacgcgctt acttgcatca tcttgaccgt 960

tgcaacgaaa tattaggcgc gcgactcaac accattcata accttcgtta ctaccagcgt 1020

ttgatggcgg gtttacgcaa ggctattgaa 1050

<210> 168

<211> 1040

<212> DNA

<213> 人工序列

<220>

<223> 基因编辑同源性臂池_6_b0652_左

<400> 168

ccgcctgcta ccggaatatc ggtgcgatta agcaaggtca gcatacgcag aacattgcgt 60

aaggtttttt ctggtgtctg gtttccggcg gaagacgtaa ttgctttgac atcaagctct 120

ggtgaggcga gggcgagaac tattgcgata gcgtcgtcat gacctgggtc gcaatctaac 180

agaattggca gtgccattgt tgctccttgt tgtgtgcttc tttgcgacaa gggtaacgcc 240

aggatgtaac agatacgagg ggcgaaacga taaagcgtga gatggcgcgc aattgggtat 300

gcgcgccaga gtgattaatg caggattttc gcgaggaagt cttttgcgcg gtccgatttc 360

ggatcatcga agaaagcgtc tttcggcgag tcttcgacaa ttttaccctc gtccataaag 420

atcacccgat tcgccacttt acgggcaaag cccatttcgt gggtcaccac catcatggtc 480

attccttcgt tcgccagttc caccatcacg tccagtactt cgttgatcat ctccggatcc 540

agcgccgatg tcggttcgtc aaacagcatc gcaataggat ccatacacaa cgcgcgagcg 600

attgccacac gctgctgctg accgccggaa agctgcgccg gaaacttatt ggcgtgagca 660

gaaagcccga cacgctccag cagtttcagg gctttttcac gagccggcgc tttatcgcgt 720

ttaagcactt tcacctgcgc cagggtcagg ttttcgataa tcgacagatg agggaacagc 780

tcgaaatgct ggaataccat cccgacgcgg gaacgcagct ttgccagatc ggttttcttg 840

tcgttaacca cgataccatc gacggtgatt tcaccttgct gcaccggttc gaggccgttg 900

acggttttaa tcagcgttga tttgccggaa ccagacgggc cgcaaaccac caccacttcg 960

ccttttttca cttcggttga gcagtcggtc agcacctgaa agtgaccata ccattttgaa 1020

acatttttca gggtaatcat 1040

<210> 169

<211> 1041

<212> DNA

<213> 人工序列

<220>

<223> 基因编辑同源性臂池_6_b0652_右

<400> 169

tatgctgtcc ttcttttcaa gtagctgacc aacaacgacg cgctaagact aataacgaaa 60

taaacaaatc cggcaaacag gatcatctca acctgcgtac catcacgctc accaatggtt 120

gaggcggtac ggaagaaatc ggccagggat aacacataca ccagtgaggt atcctggaac 180

agtacgatgc cctgagtgag cagcagcggc accatcgcgc ggaacgcctg cggcagaata 240

atcagtttca tcgactgcca gtgagtcatt cccaacgcca gcgcggcgct cgattgacca 300

cgagaaatac tttgaatacc agcacggata atctctgaat agtaggccgc ttcaaacatc 360

gaaaacgcca ccatcgccga aattaaacgg atatcatttt ttggcgataa tcccagcacg 420

ttttgcagaa aacccggcac gatcaggtaa aaccacagca aaaccataac taaaggaatc 480

gagcggaata cgttaacgta ggctttggca aaccacgcca cgggcgcaaa gctggataaa 540

cgcatcaccg ccagcatcgt gccccacaaa ataccaatca ctaccgccgt gacggtgatt 600

ttcagggtga tcaccagccc gtcgagcaga tatggcaggg aagggacaat ggaactccag 660

tcaaactcgt acattatttg ccccccatgt tgccaggcag gcgaacttta cgttcaacca 720

gcgtcatcac cagcatgata aaagcgttaa tcaacacata cgccagcgta atggcggtaa 780

acgactccca ggcatgggct gagtaatcga gcaatttacc cgcctgcgcc gccatatcca 840

ccagaccgat agtcgaggcg atggcggagt ttttcaccag gttcatcatc tctgaggtca 900

tcggcgggac gataacgcga taagcattag gcagcagtac gtatcgataa gcctgcggta 960

gcgtcaggcc catcgccagc gcggcatttt tttgccctcg cggcagcgac tgaatcgcgg 1020

cgcgtacctg ttcgcaaaca c 1041

<210> 170

<211> 1050

<212> DNA

<213> 人工序列

<220>

<223> 基因编辑同源性臂池_6_b1493_左

<400> 170

ggcaacctgg taagaggcgt tctgtacttt ggtatagcct tcacgaccga ggcgcaggaa 60

ttcatagtac tgtgcaatta cctgacccgc cgggcgggag aagttgatgg caaaagtacc 120

aatttgacca cccaggtagt caacgttgaa caccagttcc tgcggcagcg cttcttcgtc 180

acgccagata acccagccgc agcccagcgg agccagaccg aatttatggc ctgaagcact 240

gatcgatttc acacgcggca ggcggaagtc ccagacgata tccggggcga cgaacggtgc 300

caggaagcca ccgctggcag cgtcgatgtg catgtcgatg tcgataccgg tatcggcctg 360

gaatttatcc agcgcatcgt gcagcggttg tgggaactca tagttaccag tgtaggtcac 420

gccgaaagtc ggcaccacgc cgatggtgtt ttcgtcacag gcttcaatca tgcgtttcgg 480

gtccataaac aactgaccgg ggcgcatagg gatctcacgc agctccacat cccagtagcg 540

ggcgaattta tgccagcaga tttgtaccgg accgcacacc aggtttggtt tatccgttgg 600

tttgcctgca gcttccatac gcttgcgcca acgccatttc atcgccatcc cgccgagcat 660

acaggcctcg gaagaaccaa tggtgttggt gccaacggcc tgaccatttt tcggcgcagg 720

cgcatgccac agatcggcaa ccatatttac gcaacgcagg tcgatggctg cggattgcgg 780

atattcttct ttgtcgatcc agtttttgtt aatggataaa tccatcaatt tgtggacatt 840

ttcgtcgtcc caggtctggc agaaagtggc caggttctga cgagcgttgc catcaagata 900

taattcgtca ttgataatct ggaatgcgac atcgtcgcgc atttcgtgca gcggaaaacg 960

ttttgattct gcgatagtgg aaatagactt cgcaccaaaa cgtgaatcga gtagttccga 1020

ccttaaatcc gttacttgct tcttatccat 1050

<210> 171

<211> 1046

<212> DNA

<213> 人工序列

<220>

<223> 基因编辑同源性臂池_6_b1493_右

<400> 171

acaaaatcct aatgttattt atcgtgagat attacgcgaa taatattttt tcattgaaaa 60

acaatacaat atgaaattct tgggtggtgg taaggtgttt tatgctgtta tttttatgcg 120

cattctgtgt ctcctgaatt atcacgtaaa aatcagacct taaaatatca ctattagtac 180

ttgattatta ttttgaacgc atttataaaa ttattacata aaaatagcga atattgctaa 240

aatccccgcc aacgatgtgt tgacggggct gttattattt tggcaataat actccggtat 300

aagtatttac cggatgagaa agatattgtt taacggcagt gttaacattc tctaccgtca 360

tttgtttcaa caattgctcc tgctcagtcc atgctgcagg atcgtcatat tgaataagac 420

tatttacaat agtgttcgct aattgttgaa cgctacgctg ttggatatcg aggctgcgct 480

gaacgttttg ctggtattca ttcagttctt gctcactgat ccctttagcc agacgcttaa 540

ccatcacttc attcgctaac gttaacagtt catcatgtcg ttctggttga caagtaaaag 600

ccagcaaatg actgatatct ttggcctgag gatcaaccga gaggcgagaa gaaacgctgt 660

atgctccaga tgcctgttca cgaatattaa cacgtagatc ttttgccagt gcgacgttaa 720

aagcatcgag cgccatacgc gtcggcagat taacaggtgt ccgggaatca taacgcttcc 780

actgtgaaac ctgtgccaca ggttcatttt gttcttttac agtaaccgat gcgttgtccg 840

tcgcgcgagt taatggttta cctgcggcta atggcgaatc agagtgtttg attgatccta 900

agtaacgcgt aattaacgcc acgagtttgt cttctgcgac attaccgaca atgacaaacg 960

tgatatccgc tggagatgaa aacaattggc gatcggcagc cagcgcatct gcggcagtaa 1020

actgtgcaat ctgattttct tgcagt 1046

<210> 172

<211> 1050

<212> DNA

<213> 人工序列

<220>

<223> 基因编辑同源性臂池_6_b4159_左

<400> 172

ataacgtaac cgttgcacac gcaactgcgc catttcggta tcaagctgtt gtggtttcgg 60

catttccggc agccgtgcca cctgcgcccg cagcgcttcg ccgagcagat tggacgatcc 120

cagccattgc gactgttcac gcagcgtatt caacgcctgc cggacctgta acgtctggct 180

ggcagcctga cgctgttgcg aggcaacgag atccatccgc tgcgcctgtt gattcaaagc 240

cgccgatagt tcgcggttaa ttttgaattg cgcgacgata tctttcggca aatcggcgct 300

gttttctgcc agcaattcgg tactttccag cgcccgctcc gcctcaagct gacgttggct 360

gtttaattga ttacgcaagg cctgcaaata cgcatccagt tgctggctct ctttttccgc 420

cagctctgag cgtaagcgcg ctaattcctg gcggttattg gcagacagct gcgccagctc 480

cagttcatca acgagcgcct taagacgtgc agagtcagac tgcaacgcga aattttgtgc 540

ctgattgagc ggagtattgc cggtaagcgt tcccaggcgg cgctcgatct catttaactg 600

acggcgggcg tcggtttgct gttgcggcag ttgattcagc gaatcggcaa tctcgcgggc 660

gcgctcctgc tcttgctggg cctgacggct tttatccagc aactggctgc tgacctggag 720

aatttcctga ttcagcgcgt cggtagacat tcccggcgac acgctgcgcg gctcgtcacg 780

catgttgttt aattgtgcgc gcagagtagc ggagagtttc ggataattat cgataacttg 840

ctgatattgt ttgatgcgct caagggaacc ttttcgttcc tcaagcgcat ttaaggcaga 900

ctggagcgcc tctacgactt ccggctgtgc gggtttcgcc gcttttgcct gctccagttc 960

ctgagtgatt tgtttgctat cgggggccgt cgcggcgtac gccccccaac tgaggcacca 1020

ggccatcaga aaagtgataa tcaggcgcac 1050

<210> 173

<211> 1050

<212> DNA

<213> 人工序列

<220>

<223> 基因编辑同源性臂池_6_b4159_右

<400> 173

gtcagcgttt cctttgatgg attagacctg gtcttttttg tcgtcaacca atgggctggc 60

gtcgtgttct gcttcgatct cttcagcagg aagcggggca ggttcagcgt ctggcgtaac 120

aaaggtttcg gtagatactg ccagcggctg gccaattttc gtgacagaca ggctttccag 180

ttgctcaacc agattcactt tacccggtgc aaacaggttg ataacggtgg aaccgagttt 240

aaagcgaccc atttcctggc ctttcagcag tgccacagaa ccgtcgtttt ccccggcagg 300

ccaggtccag cgcttgatga taccttcgcg cggcggcgta atggtgcccg cccagaccgt 360

ctcaatgctg ccaacaatcg tcgctccgac cagaatctgc gccattgggc caaattcggt 420

atcgaaaagg caaatcacgc gttcgttacg ggcaaacaga ttcggcacgt tctgagccgt 480

gagatggtta acggagaaga gatcgcccgg cacgtagatc atctcacgca gaataccgtt 540

gcacggcatg tgtacgcggt ggtagtcacg cggggagagg taagtggtca caaacgtacc 600

gttgcggaac aggtccgcca tcagatagtt gcctgccagc agggcttcga ggctgtagtt 660

gtggcctttg gcttgcagga ttttatcttc ttcgatttta cccaactggc tgataacgcc 720

atcggcaggc atgaccagta cattcggatc ggtatcgatt gggcgtactt cgtcacgcag 780

cggacggaca aagaattcgt taaaggtgcg gtagctggcg gtgtccggct tttgcgcctc 840

tttcatgtcg accttgtagt atttaacgaa cagatcgata accagttttg tcagccatcc 900

tgcccgcttg cttgcgcccc aacccgccag gcgagtaagc catagtttcg gcagaatgta 960

ctgtagcgaa agtttaaatg aatttaacaa ggtagcctcc aggccattgt tttgtcgttc 1020

ctgatccggc ctacatgccg gatcctgaaa 1050

<210> 174

<211> 1050

<212> DNA

<213> 人工序列

<220>

<223> 基因编辑同源性臂池_6_b3795_左

<400> 174

gttcaggcat gagccaatta gcagaatagc aatagatact gccacacccg caaccggtac 60

gccgtgacgg gaaactttcg ccattgccgc cggtaactga cggtttttcg ccagtgcgta 120

gagcatacgt ccgcaactgt acatgccgct gttacagcca gagagcgcag ccgtcagcac 180

cacaaagttg ataatgcccg ccgctgcggt aataccgatt ttggcaaaag tcagtacgaa 240

cgggctgccg ttgctgccta tttcattcca cgggaagatg gtgacgataa cgaaaatcgc 300

gcctacgtag aaaatcagga tccgccacag caccttgcct acggcactgc gcagcgtcac 360

ctgcggattc ttcgcttcac cggcagtaat gccaatcagc tccacgccct ggtaggacgc 420

caccacaata cacagagcgg tcaggaaccc tttccagcca cccgcaaaga aaccgccatg 480

ctctgtgaga ttgctaaaac caatcgactg cccgccattg ccaaagccaa agaaaatcac 540

gcccaggcca atgacaatca tcacgataat cgtggtgact ttgatcatcg cgaaccagaa 600

ctcgatttcg ccgtacaacc gcaccgccgc cagattcgcc aacgccacca gcgccactgc 660

gatcaatgcg ggtatccact gcgccatctc cgggaaccag aactggacat aaacgccaat 720

ggcggtgatt tcagagatcc ccaccgccat ccacataaac cagtaagacc aggcggtgag 780

atagccaaag aacgggctca tataacgatg cgcataaacg gcgaacgaac cggtaaccgg 840

ttcgaggaac aacatttcgc ccattgaacg catgatgaaa aagacgaaca gcccggcgat 900

gatataggcc aacaatacgg atggcccggc ccatttcagg gtactggcgg cccccataaa 960

caggccgacg ccaatggtgc cccccagggc gatgagttcg atatgtcgag cttccagccc 1020

acgctgtagc tctggtttgt tatctgccat 1050

<210> 175

<211> 1050

<212> DNA

<213> 人工序列

<220>

<223> 基因编辑同源性臂池_6_b3795_右

<400> 175

aaatcctcgt gttgtgtttg catgctttcc ggtgttaccg gttatcgtta tgggtacatc 60

gagtgttgca aatgttttcg taattcagga gaaatggcaa ataaagcatt aaaaatttga 120

atgctttgtg taataaaaaa gcagacaggc gacggagtga ccactccgtc gctttacaaa 180

gagaggaaaa tcataggttg ccggtgtagt gccagcgtaa ataacgcagc aaacgaagct 240

gacgcttaat gcggctcggc tgcgaaagca ggcggtagag ccactccagc cccagcgttt 300

gccagatttt cggtgcgcgt tttacgtgac cggtgaaaac atcgtaagtc ccgccaacgc 360

ccatatacag cgcatctgga tgtaccagac ggcagtcgcg catgatgatc tcctgctttg 420

gcgatcccat cgcaacggtg acgatttgcg caccgctggc atgaatgcgt tcaaacagcg 480

cctgacgctg ctcgggttta aaataaccat cctgactgcc aacgatattc acattccact 540

ggttgcgcag tttagcttca gtttgcgcca gcacttcagg tttaccgccc acaagaaata 600

ccggcgtccc ttctttgcct gcgcgcgcca tcagctcttc ccagagatcg gcaccggcaa 660

cgcgggaaac ctgcgcctgc gggtactttt tacgtactga acgtacaacg ctgatgccat 720

ccgcatattt aaattcggca gcgttaatta actccctgac ctcggcgtta tcttcaatag 780

tcagcatttt ttcagcatta atggcaacca gcgttccctg cttaagctgc ccgtcagcaa 840

acagataatc gagggcgtgc tgcatatcac gccaaccaat caactgtaag ccacgcagcg 900

tataggttgg tgccgtggtg ttgttattca ttgttatcct tcaacctgcg tccggagcga 960

tgattttgta cgtttatgaa tgagtccggc gctttcaaaa agccagtaca acagttttgc 1020

gatcatcaga catgcgccga agaccacgat 1050

<210> 176

<211> 1050

<212> DNA

<213> 人工序列

<220>

<223> 基因编辑同源性臂池_6_b4246_左

<400> 176

aaccagtgcc agtaacgcct ggcgagcgaa aatcccgttg cctgcctgct ggaagtacca 60

ggcgtgtggc gttttatcaa catccgtcgc aatctcatca acacgcggca gcggatgcag 120

cactttcata ttggctttgg cgttgtggag atcgctggcg cgaagaacaa actgcgcttt 180

cacgttggcg tactcggacg ggtccagacg ctctttttgc acgcgggtca tgtacaggat 240

gtctacttcc gccatcactt cttcaataga gctgtgcaga ctccatgcga tccctttttc 300

atcgagcata tccagaatgt attgcggcat tgccagcgcg tccggcgcga tgaagtaaaa 360

acggttgccg tcgaacttcg ctaacgcctg agtcagggag tgaacggtgc ggccatattt 420

caggtcacca accattgcga cgtggagatt gtccagacgc ccctgggttt cctgaatagt 480

gaataagtcc agcaaggttt gcgtcggatg ttggttggag ccatcaccgg cattcagtac 540

cggtacattg ccggaaaact cggtggccag gcgcgccgca ccttcctgcg gatgacgcat 600

cactatcgca tcgacgtaag tgctgataac cgaaatggta tcggccagcg tttcgccctt 660

tttacccagt gatgtattgg cgctgtcgga gaagcccacc acgctggccc ccaggcggtg 720

catagatgtt tcgaaagaga ggcgggtacg ggtagaggct tcgaagaaac agctggcaat 780

gactttgtgc ttcaacagct ctggttgcgg gtttgctttc agtttcgccg ctgtcgccag 840

caccagatta aggtcatcgc gactaaggtc gtttatggaa atgatatgtt tctgatatag 900

cggattagcc atcttttatc tcctgacgcc tgggcaaaaa aaagcccctc gattgagggg 960

ctgggaatgg gtgatcaacg ggaagaaaaa cggcaggcca gcgtcttttt tcagacgcgg 1020

taagacaaaa tgtcgaacac actgaaccat 1050

<210> 177

<211> 1050

<212> DNA

<213> 人工序列

<220>

<223> 基因编辑同源性臂池_6_b4246_右

<400> 177

actattgctt actgctcagg gatgcgcgct atcactttaa tttcaaaatc aaagcctgcc 60

agccatgtaa cacccaccgc cgtccagttt ggataaggtg gggcgctaaa tatttcattt 120

ttcaccgtca tgatgtcttc aaattggttt tctggatcgg tatggaagct cgtaacatca 180

atgatatcgt caaaagtgca tcccgcagct gccagggtcg catgcaaatt atcaaatgcc 240

agtctgactt gttgctgaaa atcgggttct ggtgttccgt cctctcgact tcctacttgc 300

ccggaaacaa acagcaaatc gccggaacga atagccgcag aataacgatg ctcagcatat 360

agtgaatgtc ggccagcagg gaaaacagcg gttctttcta ccatttggtt atcctcaaga 420

tttacgacat gaacagaaga tttctcttta ccgggagccg cttttagcgg acgacgtgag 480

taaacaaaac ccagacatca tggataatgg ctgggcttaa ttgagcgtag tcggttatgc 540

gccaaacgcg ccatcaatgg tatgcatcgc gccggtaaca aaactggctt ctggccctgc 600

taaccatgcg accataccag cgacctcttc cggttgccca tgtcttttga tagccatcaa 660

actatgcaac atatcgcgca ttggcccgtt ggcgggatta gcgtcggtat caattggccc 720

tggctggacg acgttaatgg tgatcccacg cggtccaaaa tcacgggcca gcccgcgcgc 780

catgccttgc agggcagatt tgctggcggc ataagcagcc atgcctgcaa caggcatacg 840

atcgccattc acggagccga tgattaagat gcgcccgcct tcgggcatct gccgggcggc 900

ttcaacagag gcatgataag gagcatgaat attgattttg aaaaggcgat caatatcgtc 960

ggcatttaat tccagggcct cgccaaagac gccaatacct gcatttacca ccaggatatc 1020

caatgcgccg ctcttacgaa cgacatcaat 1050

<210> 178

<211> 1050

<212> DNA

<213> 人工序列

<220>

<223> 基因编辑同源性臂池_6_b4440_左

<400> 178

atggtggatg ctgcgcacct ttggtgtaga gaaagtgtcg attctggggg gtggacttgc 60

aggctggcag cgcgatgatc tgctgttaga agaaggtgca gtagagctgc cggaaggaga 120

gtttaacgcc gcgtttaatc ctgaagccgt ggtgaaagta accgatgtat tattggcaag 180

ccatgaaaat acggcgcaaa ttattgatgc ccgcccggct gcacgtttta acgcagaagt 240

tgatgaacct cgcccaggtt tacgtcgcgg acatattccc ggagcactga atgttccgtg 300

gacggaactg gtgcgcgaag gcgaactaaa aacgaccgat gaactggatg cgatattttt 360

tggtcgcggc gtcagctacg acaaaccaat tatcgtcagc tgcggctctg gtgtaacggc 420

agccgtggtt ttgttagcac tcgcgacgct ggatgtgcca aacgtgaaac tgtacgacgg 480

cgcatggagt gaatggggcg cgcgggcaga tttaccggtt gagccagtga aataagtatt 540

ttacaggcaa taaaaaaccg ccgaatttgg cggtttttta ttgctagtct ggttcgcggc 600

ctttccagca ggttgacttg tgttacatga gcaacgcagg tgcttcacag caaaacaata 660

ctcaccagta actctctttt tgtcaagcaa aagagagtaa ttattgttta tttagcgtat 720

tatcgacacc ggccctttcc gccgtgttcg gtaataaaat aacctggctt attagtccga 780

attcagacaa atataaataa atcctgctca aaattaaaaa ttctaaccgg taaaagatat 840

tacttaaaca tgtaaattca ctttccttta aaaaacaaaa aaccgccaaa atcaggcggt 900

tttttgttgc tggtccggtt cgcggccttt ccagcaggtt gtattaccgt agtaatgcaa 960

gcgcgtctca gcggagacaa tactcgccag taactctctt tttgtcaagc aaaagagagt 1020

tattattgtt ctgttagtgt attatccact 1050

<210> 179

<211> 1050

<212> DNA

<213> 人工序列

<220>

<223> 基因编辑同源性臂池_6_b4440_右

<400> 179

gcggcccttt ccgccgtctc gcaaacgggc gctggcttta ggaaaggatg ttccgtggcc 60

gtaaatgcag gtgtttcaca gcgcttgcta tcgcggcaat atcgccagtg gtgctgtcgt 120

gatgcggtct tcgcatggac cgcacaatga agatacggtg cttttgtatc gtacttattg 180

tttctggtgc gctgttaacc gaggtaaata ataaccggag tctctccggc gacaatttac 240

tggtggttaa caaccttcag agcagcaagt aagcccgaat gccgcccttt gggcggcata 300

ttttagatta tccgattctg tttaaagtca cgcaaaaaac caccccagcg acgttcatag 360

aatggcgcaa tatgttcggt aataaagtgg ctaattcctt tttccccttt tttcacctga 420

caaatatcga ttggttcatc gccaggtaat gtatcggtcg ctacacttcc cgtcgcctga 480

ataatttctt cgatatcacc atcggcttca atgccaataa gtaaattagg ctgtgcctct 540

tcgttctctt taattgaaca aataaaagca cgcttcaccg gcttaatggt tttaaataag 600

gtggtgagtg aatcaatcat ttgtgctggc ggctctgcga cttccgataa tatcagcgat 660

tcaccgcctt ccaggatttc ctggctgctc agcggatttc cctcttcacc aatcaacaaa 720

ctgatttcac gcggcataaa ttctttaccg gttggcagtt tggcattaag gaagagcgtt 780

tcgccaagtg tcatctcaaa cagcgtgcga acgggcatta cgacaaatgc ctgttcgtct 840

tcaaccgcct gttgaagtgc ttctaacgag gtgaaaaaag gaatgacgct ggtgccgtct 900

tctttttccc agtgctgtaa atcaagcgcg ctatcttcaa ccacagcctc gccctgcgcc 960

gccgtaccag gcacccagac ggtggattcc agtagagtac ggaaaaaggc cgggcggtgc 1020

gccggttcag ttgctgcttt ttccagcagg 1050

Claims

1.一种包括多核苷酸的混合物的组合物，所述混合物包括：

2.根据权利要求1所述的组合物，进一步包括克隆载体，其中，对于所述第一池中的每对，所述第一多核苷酸的5'端和所述第二多核苷酸的3'端包括与所述克隆载体互补的序列。

3.根据权利要求2所述的组合物，其中选择来自所述第一池的每一多核苷酸，使得除了所述第一池的所述成对的多核苷酸与所述第二池的所述插入多核苷酸之间、或所述第一池的所述成对的多核苷酸与所述克隆载体之间的设计的组装重叠序列之外，没有来自所述第一池的多核苷酸与来自所述第一池的超过指定的阈值的任何其他多核苷酸共享共同序列。

4.根据权利要求3所述的组合物，其中所述指定的阈值为5至15个连续核苷酸。

5.根据权利要求1至4中任一权利要求所述的组合物，进一步包括聚合酶。

6.根据权利要求5所述的组合物，其中所述聚合酶是链置换的或非链置换的。

7.根据权利要求6所述的组合物，其中所述聚合酶是非链置换的，并且所述组合物进一步包括拥挤剂。

8.根据权利要求7所述的组合物，其中所述拥挤剂是聚乙二醇(PEG)。

9.根据权利要求8所述的组合物，其中所述PEG以约3％至约7％(重量/体积)的浓度使用。

10.根据权利要求8所述的组合物，其中所述PEG选自PEG-200、PEG-4000、PEG-6000、PEG-8000或PEG-20,000。

11.根据权利要求6所述的组合物，其中所述聚合酶是链置换的，并且所述组合物进一步包括单链结合蛋白质。

12.根据权利要求11所述的组合物，其中所述单链DNA结合蛋白质是极端热稳定的单链DNA结合蛋白质(ET SSB)、大肠杆菌recA、T7基因2.5产物、噬菌体λRedB或Rac前噬菌体RecT。

13.根据权利要求1所述的组合物，进一步包括5'-3'核酸外切酶。

14.根据权利要求1所述的组合物，进一步包括连接酶。

15.根据权利要求1所述的组合物，其中所述第一池中的每对是双链DNA(dsDNA)或单链(ssDNA)。

16.根据权利要求1所述的组合物，其中所述第二池中的每个插入多核苷酸是dsDNA或ssDNA。

17.根据权利要求1所述的组合物，其中，对于所述第一池中的每对，所述第一多核苷酸和所述第二多核苷酸包括对应于宿主细胞中的靶基因组基因座的序列。

18.根据权利要求1所述的组合物，其中，对于所述第一池中的每对，所述第一多核苷酸和所述第二多核苷酸包括对应于作为代谢途径的一部分的基因的编码序列。

19.根据权利要求1所述的组合物，其中，对于所述第一池中的每对，所述第一多核苷酸和所述第二多核苷酸包括对应于功能结构域或一或多种蛋白质的编码序列。

20.根据权利要求1所述的组合物，其中，对于所述第一池中的每对，所述第一多核苷酸和所述第二多核苷酸在单个构建体中连接在一起，其中所述单个构建体包括用于所述第一多核苷酸与所述第二多核苷酸之间的一或多种位点特异性核酸酶的一或多个识别序列。

21.根据权利要求20所述的组合物，其中用于一或多种位点特异性核酸酶的一或多个识别序列包括归巢核酸内切酶识别序列。

22.根据权利要求1所述的组合物，其中所述第二池中的每个插入多核苷酸上的所述第一组装重叠序列和所述第二组装重叠序列包括分别与来自所述第一池的一对多核苷酸中的第一多核苷酸的3'端和第二多核苷酸的5'端互补的1或多个核苷酸。

23.根据权利要求1所述的组合物，其中所述第二池中的每个插入多核苷酸上的所述第一组装重叠序列和所述第二组装重叠序列包括分别与来自所述第一池的一对多核苷酸中的第一多核苷酸的3'端和第二多核苷酸的5'端互补的约25个核苷酸。

24.根据权利要求1所述的组合物，其中所述第二池中的每个插入多核苷酸包括位于所述第一组装重叠序列与所述第二组装重叠序列之间的一或多个有效负载序列。

25.根据权利要求24所述的组合物，其中所述一或多个有效负载序列选自启动子、基因、调节序列、编码降解决定子的核酸序列、编码溶解度标签的核酸序列、终止子、唯一标识符序列或其部分。

26.根据权利要求17所述的组合物，其中所述第一池中的每对第一多核苷酸和第二多核苷酸包括与所述第一池中的每个其他对相比对应于宿主细胞中不同的靶基因组基因座的序列。

27.根据权利要求17所述的组合物，其中所述第一池中的每对第一多核苷酸和第二多核苷酸包括对应于宿主细胞中相同靶基因组基因座的序列。

28.根据权利要求24所述的组合物，其中所述第二池中的所述插入多核苷酸中的每个有效负载序列不同于所述第二池中的每个其他插入多核苷酸中的有效负载序列。

29.根据权利要求24所述的组合物，其中所述第二池中的所述插入多核苷酸中的每个有效负载序列与所述第二池中的每个其他插入多核苷酸中的有效负载序列相同。

30.一种用于生成多核苷酸的文库的方法，所述方法包括：

31.根据权利要求30所述的方法，其中所述第二池中的每个插入多核苷酸上的所述第一组装重叠序列和所述第二组装重叠序列包括分别与来自所述第一池的一对多核苷酸中的第一多核苷酸的3'端和第二多核苷酸的5'端互补的1或多个核苷酸。

32.根据权利要求30或31所述的方法，其中所述第二池中的每个插入多核苷酸上的所述第一组装重叠序列和所述第二组装重叠序列包括分别与来自所述第一池的一对多核苷酸中的第一多核苷酸的3'端和第二多核苷酸的5'端互补的约25个核苷酸。

33.根据权利要求30所述的方法，其中，对于所述第一池中的每对，所述第一多核苷酸和所述第二多核苷酸在单个构建体中连接在一起，其中所述单个构建体包括用于所述第一多核苷酸与所述第二多核苷酸之间的一或多种位点特异性核酸酶的一或多个识别序列。

34.根据权利要求33所述的方法，其中用于一或多种位点特异性核酸酶的所述一或多个识别序列包括归巢核酸内切酶识别序列。

35.根据权利要求33所述的方法，其中通过经由剪接和重叠延伸PCR(SOE-PCR)、限制连接、钝端连接、基于重叠的组装方法、基于重组的方法或连接所述第一多核苷酸和所述第二多核苷酸的任何其他酶促或化学方法连接各个第一多核苷酸和第二多核苷酸，或通过直接合成单个构建体来产生连接的单个构建体。

36.根据权利要求30所述的方法，进一步包括在步骤(a)期间将克隆载体与所述第一池和所述第二池组合，其中，对于所述第一池中的每对，所述克隆载体的相对端包括与所述第一多核苷酸的5'端和所述第二多核苷酸的3'端互补的序列。

37.根据权利要求30所述的方法，进一步包括在步骤(a)之前将克隆载体与所述第一池组合，其中，对于所述第一池中的每对，所述克隆载体的相对端包括与所述第一多核苷酸的5'端和所述第二多核苷酸的3'端互补的序列。

38.根据权利要求36或37所述的方法，其中所述克隆载体和来自所述第一池的每对中的所述第一多核苷酸的5'端和所述第二多核苷酸的3'端包括用于一或多种位点特异性核酸酶的一或多个识别序列。

39.根据权利要求38所述的方法，进一步包括通过添加所述一或多个识别序列的一或多种位点特异性核酸酶，在所述克隆载体的相对端与来自所述第一池的每对中的所述第一多核苷酸的5'端和所述第二多核苷酸的3'端之间生成单链互补突出物。

40.根据权利要求39所述的方法，进一步包括连接所述克隆载体的所述相对端与来自所述第一池的每对中的所述第一多核苷酸的5'端和所述第二多核苷酸的3'端之间的所述单链互补突出物。

41.根据权利要求36或37所述的方法，其中步骤(b)产生环状产物，所述环状产物包括来自所述第二池的插入多核苷酸、来自所述第一池的一对的第一多核苷酸和第二多核苷酸以及所述克隆载体。

42.根据权利要求36或37所述的方法，其中所述第一池通过从更大组的此类序列中选择成对的多核苷酸序列来生成，使得除了所述第一池的所述成对的多核苷酸与所述第二池的所述插入多核苷酸之间、或所述第一池的所述成对的多核苷酸与所述克隆载体之间的设计的组装重叠序列之外，没有来自所述第一池的多核苷酸与来自所述第一池的超过指定的阈值的任何其他多核苷酸共享共同序列。

43.根据权利要求42所述的方法，其中所述指定的阈值为5至15个连续核苷酸。

44.根据权利要求30所述的方法，其中所述组装是体外克隆方法，其中将所述第一池和所述第二池的混合物加热以使存在于所述第一池和所述第二池中的多核苷酸部分或完全变性，然后在组装之前被冷却至室温。

45.一种用于生成多核苷酸的文库的方法，所述方法包括：

(a)经由聚合酶链反应PCR扩增多核苷酸的第一池，其中所述第一池含有成对的多核苷酸，其中所述第一池中的每对含有第一多核苷酸和第二多核苷酸，并且其中一对中的每一个第一多核苷酸和每一个第二多核苷酸包括5'端和3'端，其中所述扩增将包括用于一或多种位点特异性核酸酶的一或多个识别序列的共同重叠序列引入到来自所述第一池的一对中的第一多核苷酸的5'端和第二多核苷酸的3'端上；

46.根据权利要求45所述的方法，其中位于所述第一多核苷酸序列与所述第二多核苷酸序列之间的所述一或多个位点特异性核酸酶识别序列是归巢核酸酶识别序列。

47.根据权利要求45或46所述的方法，其中位于所述第一多核苷酸序列与所述第二多核苷酸序列之间的所述一或多个位点特异性核酸酶识别序列的所述一或多种位点特异性核酸酶是归巢核酸内切酶。

48.根据权利要求45所述的方法，其中所述共同重叠序列包括至少1个核苷酸的组装重叠序列，并且步骤(b)中的组装通过基于重叠的DNA组装方法进行。

49.根据权利要求45所述的方法，其中所述共同重叠序列包括10-25个核苷酸的组装重叠序列，并且步骤(b)中的组装通过基于重叠的DNA组装方法进行。

50.根据权利要求48或49所述的方法，其中所述基于重叠的DNA组装方法选自SOE-PCR或体外重叠组装方法。

51.根据权利要求50所述的方法，其中存在于所述第一多核苷酸的5'端的所述共同重叠序列中的所述一或多个位点特异性核酸酶识别序列与存在于每对中的所述第二多核苷酸的3'端的所述共同重叠序列中的所述一或多个位点特异性核酸酶识别序列互补，并且其中在步骤(b)中利用每对中的所述第一多核苷酸和所述第二多核苷酸的所述共同重叠序列需要进行SOE-PCR。

52.根据权利要求45所述的方法，其中在步骤(b)中利用每对中的所述第一多核苷酸和所述第二多核苷酸的所述共同重叠序列需要用一或多个位点特异性核酸酶识别序列的一或多种位点特异性核酸酶消化每对中的所述第一多核苷酸5'端和所述第二多核苷酸3'端上的所述共同重叠序列中存在的所述一或多个位点特异性核酸酶识别序列，以在每对中的所述第一多核苷酸的5'端和所述第二多核苷酸的3'端生成包括互补序列的单链突出物；以及连接在每对中的所述第一多核苷酸的5'端和所述第二多核苷酸的3'端上的所述单链突出物上存在的互补序列。

53.根据权利要求45所述的方法，其中步骤(d)的所述组装使用基于重叠的DNA组装方法进行。

54.根据权利要求53所述的方法，其中所述基于重叠的DNA组装选自SOE-PCR和体外重叠组装方法。

55.根据权利要求45所述的方法，其中每对中的所述单个核酸片段中的所述第一多核苷酸的3'端和所述第二多核苷酸的5'端包括一组附加的一或多个位点特异性核酸酶识别序列，并且所述第二池中的每个插入多核苷酸中的所述第一组装重叠序列和所述第二组装重叠序列包括一或多个位点特异性核酸酶识别序列。

56.根据权利要求55所述的方法，其中步骤(d)中的组装需要用每对中的所述单个核酸片段中的所述第一多核苷酸的3'端和所述第二多核苷酸的5'端上的附加的一或多个位点特异性核酸酶识别序列以及来自所述第二池的每个插入多核苷酸中的所述第一组装序列和所述第二组装序列中存在的一或多个位点特异性核酸酶识别序列的一或多种位点特异性核酸酶消化每对中的所述单个核酸片段中的所述第一多核苷酸的3'端和所述第二多核苷酸的5'端上存在的附加的一或多个位点特异性核酸酶识别序列和来自所述第二池的每个插入多核苷酸中的所述第一组装序列和所述第二组装序列中存在的一或多个位点特异性核酸酶识别序列，以在所述第一多核苷酸的3'端上生成包括与来自所述第二池的插入多核苷酸的所述第一组装序列的5'端上的单链突出物上存在的序列互补的序列的单链突出物和在所述第二多核苷酸的5'端上生成包括与来自所述第二池的相同插入多核苷酸的所述第二组装序列的3'端上的单链突出物上存在的序列互补的序列的单链突出物；以及连接所述单链突出物上存在的互补序列。

57.根据权利要求45所述的方法，其中步骤(f)的所述克隆载体包括一或多个位点特异性核酸酶识别序列。

58.根据权利要求57所述的方法，其中步骤(f)中的组装需要用所述克隆载体中存在的所述一或多个位点特异性核酸酶识别序列的所述一或多种位点特异性核酸酶消化所述克隆载体中的一或多个位点特异性核酸酶识别序列，其中所述消化在所述克隆载体的相对端上生成单链突出物，其中所述克隆载体的所述相对端的一个上的所述单链突出物包括与步骤(e)中生成的所述线性化的产物的端互补的序列，并且所述克隆载体的所述相对端的另一个上的所述单链突出物包括与步骤(e)中生成的所述线性化的产物的相对端互补的序列；以及连接所述克隆载体的所述单链突出物上存在的互补序列和来自步骤(e)的所述线性化的产物。

59.根据权利要求45所述的方法，其中所述第一池通过从更大组的此类序列中选择成对的多核苷酸序列来生成，使得除了所述第一池的所述成对的多核苷酸与所述第二池的所述插入多核苷酸之间、或所述第一池的所述成对的多核苷酸与所述克隆载体之间的设计的组装重叠序列之外，没有来自所述第一池的多核苷酸与来自所述第一池的超过指定的阈值的任何其他多核苷酸共享共同序列。

60.根据权利要求59所述的方法，其中所述指定的阈值为5至15个连续核苷酸。

61.根据权利要求45所述的方法，其中所述第二池中的每个插入多核苷酸上的所述第一组装重叠序列和所述第二组装重叠序列包括与所述单个核酸片段的所述相对末端互补的1或多个核苷酸。

62.根据权利要求45所述的方法，其中所述第二池中的每个插入多核苷酸上的所述第一组装重叠序列和所述第二组装重叠序列包括与所述单个核酸片段的所述相对末端互补的约25个核苷酸。

63.根据权利要求30或45所述的方法，其中，在步骤(a)之前，通过将含有来自成对的多核苷酸的每一个第一多核苷酸的混合物与含有来自成对的多核苷酸的每一个第二多核苷酸的混合物组合来生成多核苷酸的所述第一池。

64.根据权利要求30或45所述的方法，其中所述第一池中的每对是双链DNA(dsDNA)或单链DNA(ssDNA)。

65.根据权利要求30或45所述的方法，其中所述第二池中的每个插入多核苷酸是dsDNA或ssDNA。

66.根据权利要求30或45所述的方法，其中，对于所述第一池中的每对，所述第一多核苷酸和所述第二多核苷酸包括对应于宿主细胞中的靶基因组基因座的序列。

67.根据权利要求30或45所述的方法，其中，对于所述第一池中的每对，所述第一多核苷酸和所述第二多核苷酸包括对应于作为代谢途径的一部分的基因的编码序列。

68.根据权利要求30或45所述的方法，其中，对于所述第一池中的每对，所述第一多核苷酸和所述第二多核苷酸包括对应于功能结构域或一或多种蛋白质的编码序列。

69.根据权利要求30或45所述的方法，其中所述第二池中的每个插入多核苷酸包括位于所述第一组装重叠序列与所述第二组装重叠序列之间的一或多个有效负载序列。

70.根据权利要求69所述的方法，其中所述一或多个有效负载序列选自启动子、基因、调节序列、编码降解决定子的核酸序列、编码溶解度标签的核酸序列、终止子、唯一标识符序列或其部分。

71.根据权利要求66所述的方法，其中，对于所述第一池中的每对，所述第一多核苷酸和所述第二多核苷酸包括与所述第一池中的每个其他对相比对应于宿主细胞中不同的靶基因组基因座的序列。

72.根据权利要求66所述的方法，其中，对于所述第一池中的每对，所述第一多核苷酸和所述第二多核苷酸包括对应于宿主细胞中相同靶基因组基因座的序列。

73.根据权利要求69所述的方法，其中所述第二池中的所述插入多核苷酸中的每个有效负载序列不同于所述第二池中的每个其他插入多核苷酸中的有效负载序列。

74.根据权利要求69所述的方法，其中所述第二池中的所述插入多核苷酸中的每个有效负载序列与所述第二池中的每个其他插入多核苷酸中的有效负载序列相同。

75.根据权利要求30或45所述的方法，其中所述第二池中的每个插入多核苷酸通过以下生成：

(i)对包括所述有效负载序列、正向引物和反向引物的混合物进行聚合酶链反应(PCR)，其中所述正向引物自5'至3'包括与所述有效负载序列互补的一或多个核苷酸的短段、所述第一组装重叠序列、用于一或多种位点特异性核酸酶的一或多个识别序列、所述第二组装重叠序列和与所述有效负载序列互补的一或多个核苷酸的第二段，并且其中所述反向引物包括与所述有效负载序列或与所述有效负载序列下游的其他序列互补的序列，其中所述PCR生成PCR产物，所述PCR产物自5'至3'包括与所述有效负载序列互补的核酸的短段、所述第一组装重叠序列、所述一或多个位点特异性核酸酶识别序列、所述第二组装重叠序列和所述有效负载序列；

76.根据权利要求20所述的组合物，其中所述位点特异性核酸酶是限制性核酸内切酶、IIs型核酸内切酶、归巢核酸内切酶、RNA导向的核酸酶、DNA导向的核酸酶、锌指核酸酶、TALEN或切口酶中的一或多种。

77.根据权利要求33或45所述的方法，其中所述位点特异性核酸酶是限制性核酸内切酶、IIs型核酸内切酶、归巢核酸内切酶、RNA导向的核酸酶、DNA导向的核酸酶、锌指核酸酶、TALEN或切口酶中的一或多种。