[go: up one dir, main page]

CN113166741A - Dna文库的多重确定性组装 - Google Patents

Dna文库的多重确定性组装 Download PDF

Info

Publication number
CN113166741A
CN113166741A CN201980081345.5A CN201980081345A CN113166741A CN 113166741 A CN113166741 A CN 113166741A CN 201980081345 A CN201980081345 A CN 201980081345A CN 113166741 A CN113166741 A CN 113166741A
Authority
CN
China
Prior art keywords
polynucleotide
pool
sequence
pair
polynucleotides
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201980081345.5A
Other languages
English (en)
Inventor
E·J·迪安
K·帕特尔
A·米勒
K·梅赫塔
P·韦曼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zymergen Inc
Original Assignee
Zymergen Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zymergen Inc filed Critical Zymergen Inc
Publication of CN113166741A publication Critical patent/CN113166741A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1068Template (nucleic acid) mediated chemical library synthesis, e.g. chemical and enzymatical DNA-templated organic molecule synthesis, libraries prepared by non ribosomal polypeptide synthesis [NRPS], DNA/RNA-polymerase mediated polypeptide synthesis
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1093General methods of preparing gene libraries, not provided for in other subgroups
    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B40/00Libraries per se, e.g. arrays, mixtures
    • C40B40/04Libraries containing only organic compounds
    • C40B40/06Libraries containing nucleotides or polynucleotides, or derivatives thereof
    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B50/00Methods of creating libraries, e.g. combinatorial synthesis
    • C40B50/06Biochemical methods, e.g. using enzymes or whole viable microorganisms

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Biochemistry (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Microbiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Medicinal Chemistry (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Immunology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

本公开涉及体外或体内连接三或更多个感兴趣的双链(ds)或单链(ss)DNA分子的方法。该方法允许以确定性的方式连接大量DNA片段。它可以用于快速生成核酸文库,所述核酸文库随后可以用于多种应用,包含例如基因组编辑和途径组装。还公开了用于实施该方法的试剂盒。

Description

DNA文库的多重确定性组装
相关申请的交叉引用
本申请要求2018年10月31日提交的美国临时申请序列号62/753,254的优先权的权益,该美国临时申请通过引用以其整体并入本文用于所有目的。
技术领域
本公开涉及用于连接单链和/或双链核酸分子的组合物和方法,其允许在单个反应中体外或体内组装具有重叠端序列的多个核酸分子。所公开的方法和组合物可用于核酸序列的片段的确定性组装,并且可以用于编辑任何DNA序列,诸如例如所需的宿主细胞或生物体的基因组中的质粒、粘粒或特异性基因。
关于序列表的声明
与本申请相关联的序列表以文本形式提供,以代替纸质副本,并且据此通过引用被并入说明书中。包含序列表的文本文件的名称为ZYMR_029_01WO_SeqList_ST25.txt。文本文件为约262KB,并且创建于2019年10月31日,并经由EFS网以电子方式提交。
背景技术
传统上,核酸组装体诸如质粒或线性DNA以确定性的方式一次生成一个,因此可能是缓慢、昂贵和劳动密集型的。相比之下,目前用于生成复杂核酸组装体的文库的混合方法可以能够一次生成许多组装体,但通常产生代表组装体中的部件的集合之间所有可能组合的文库。此类方法是一种非确定性和组合性的组装方法,并且也可能是耗时的、劳动密集型的和昂贵的,特别是在其中序列的子集是组装反应的所需产物的情况下。
因此,在本领域中需要用于生成复杂核酸组装体的新方法,其不具有用于生成核酸组装体的传统方法固有的上述缺点。
发明内容
在一个方面中,本文提供了一种包括多核苷酸的混合物的组合物,所述混合物包括:含有成对的多核苷酸的第一池,其中第一池中的每对含有第一多核苷酸和第二多核苷酸;和插入多核苷酸的第二池,其中第二池中的每个插入多核苷酸包括在其5'端的与来自第一池的一对多核苷酸中的第一多核苷酸的3'端互补的第一组装重叠序列和在其相对的3'端的与第二多核苷酸的5'端互补的第二组装重叠序列。在一些情况下,组合物进一步包括克隆载体,其中,对于第一池中的每对,第一多核苷酸的5'端和第二多核苷酸的3'端包括与克隆载体互补的序列。在一些情况下,选择来自第一池的每一多核苷酸,使得除了第一池的成对的多核苷酸与第二池的插入多核苷酸之间、或第一池的成对的多核苷酸与克隆载体之间的设计的组装重叠序列之外,没有来自第一池的多核苷酸与来自第一池的超过指定的阈值的任何其他多核苷酸共享共同序列。在一些情况下,指定的阈值为5至15个连续核苷酸。在一些情况下,组合物进一步包括聚合酶。在一些情况下,聚合酶是链置换的或非链置换的。在一些情况下,聚合酶是非链置换的,并且组合物进一步包括拥挤剂。在一些情况下,拥挤剂是聚乙二醇(PEG)。在一些情况下,PEG以约3%至约7%(重量/体积)的浓度使用。在一些情况下,PEG选自PEG-200、PEG-4000、PEG-6000、PEG-8000或PEG-20,000。在一些情况下,聚合酶是链置换的,并且组合物进一步包括单链结合蛋白质。在一些情况下,单链DNA结合蛋白质是极端耐热的单链DNA结合蛋白质(ET SSB)、大肠杆菌recA、T7基因2.5产物、噬菌体λRedB或Rac前噬菌体RecT。在一些情况下,组合物进一步包括5'-3'核酸外切酶。在一些情况下,组合物进一步包括连接酶。在一些情况下,第一池中的每对是双链DNA(dsDNA)或单链(ssDNA)。在一些情况下,第二池中的每个插入多核苷酸是dsDNA或ssDNA。在一些情况下,对于第一池中的每对,第一多核苷酸和第二多核苷酸包括对应于宿主细胞中靶基因组基因座的序列。在一些情况下,对于第一池中的每对,第一多核苷酸和第二多核苷酸包括对应于作为代谢途径的一部分的基因的编码序列。在一些情况下,对于第一池中的每对,第一多核苷酸和第二多核苷酸包括对应于功能结构域或一或多种蛋白质的编码序列。在一些情况下,对于第一池中的每对,第一多核苷酸和第二多核苷酸在单个构建体中连接在一起,其中所述单个构建体包括用于第一多核苷酸与第二多核苷酸之间的一或多种位点特异性核酸酶的一或多个识别序列。在一些情况下,用于一或多种位点特异性核酸酶的一或多个识别序列包括归巢核酸内切酶识别序列。在一些情况下,第二池中的每个插入多核苷酸上的第一组装重叠序列和第二组装重叠序列包括分别与来自第一池的一对多核苷酸中的第一多核苷酸的3'端和第二多核苷酸的5'端互补的1或多个核苷酸。在一些情况下,第二池中的每个插入多核苷酸上的第一组装重叠序列和第二组装重叠序列包括分别与来自第一池的一对多核苷酸中的第一多核苷酸的3'端和第二多核苷酸的5'端互补的约25个核苷酸。在一些情况下,第二池中的每个插入多核苷酸包括位于第一组装重叠序列与第二组装重叠序列之间的一或多个有效负载序列。在一些情况下,一或多个有效负载序列选自启动子、基因、调节序列、编码降解决定子的核酸序列、编码溶解度标签的核酸序列、终止子、唯一标识符序列或其部分。在一些情况下,第一池中的每对第一多核苷酸和第二多核苷酸包括与第一池中的每个其他对相比对应于宿主细胞中不同靶基因组基因座的序列。在一些情况下,第一池中的每对第一多核苷酸和第二多核苷酸包括对应于宿主细胞中相同靶基因组基因座的序列。在一些情况下,第二池中的插入多核苷酸中的每个有效负载序列不同于第二池中的每个其他插入多核苷酸中的有效负载序列。在一些情况下,第二池中的插入多核苷酸中的每个有效负载序列与第二池中的每个其他插入多核苷酸中的有效负载序列相同。在一些情况下,位点特异性核酸酶是限制性核酸内切酶、IIs型核酸内切酶、归巢核酸内切酶、RNA导向的核酸酶、DNA导向的核酸酶、锌指核酸酶、TALEN或切口酶中的一或多种。
在另一个方面中,本文提供了一种用于生成多核苷酸的文库的方法,所述方法包括:a.组合多核苷酸的第一池和多核苷酸的第二池,其中第一池含有成对的多核苷酸,其中第一池中的每对含有第一多核苷酸和第二多核苷酸,其中第二池含有插入多核苷酸,其中第二池中的每个插入多核苷酸包括在其5'端的与来自第一池的一对多核苷酸中的第一多核苷酸的3'端互补的第一组装重叠序列和在其相对的3'端的与第二多核苷酸的5'端互补的第二组装重叠序列;b.将所述第一池和所述第二池组装成多核苷酸的文库,其中所述文库中的每一多核苷酸包括来自所述第二池的插入多核苷酸和来自所述第一池的一对第一多核苷酸和第二多核苷酸,其中所述组装通过体外克隆方法或体内克隆方法进行。在一些情况下,第二池中的每个插入多核苷酸上的第一组装重叠序列和第二组装重叠序列包括分别与来自第一池的一对多核苷酸中的第一多核苷酸的3'端和第二多核苷酸的5'端互补的1或多个核苷酸。在一些情况下,第二池中的每个插入多核苷酸上的第一组装重叠序列和第二组装重叠序列包括分别与来自第一池的一对多核苷酸中的第一多核苷酸的3'端和第二多核苷酸的5'端互补的约25个核苷酸。在一些情况下,对于第一池中的每对,第一多核苷酸和第二多核苷酸在单个构建体中连接在一起,其中所述单个构建体包括用于第一多核苷酸与第二多核苷酸之间的一或多种位点特异性核酸酶的一或多个识别序列。在一些情况下,用于一或多种位点特异性核酸酶的一或多个识别序列包括归巢核酸内切酶识别序列。在一些情况下,通过经由剪接和重叠延伸PCR(SOE-PCR)、限制-连接、钝端连接、基于重叠的组装方法、基于重组的方法、或连接第一多核苷酸和第二多核苷酸的任何其他酶促或化学方法,或者通过直接合成单个构建体,连接单独的第一多核苷酸和第二多核苷酸,来产生连接的单个构建体。在一些情况下,所述方法进一步包括在步骤(a)期间将克隆载体与第一池和第二池组合,其中对于第一池中的每对,克隆载体的相对端包括与第一多核苷酸的5'端和第二多核苷酸的3'端互补的序列。在一些情况下,所述方法进一步包括在步骤(a)之前将克隆载体与第一池组合,其中对于第一池中的每对,克隆载体的相对端包括与第一多核苷酸的5'端和第二多核苷酸的3'端互补的序列。在一些情况下,克隆载体和来自第一池的每对中的第一多核苷酸的5'端和第二多核苷酸的3'端包括用于一或多种位点特异性核酸酶的一或多个识别序列。在一些情况下,所述方法进一步包括通过添加用于一或多个识别序列的一或多种位点特异性核酸酶,在克隆载体的相对端与来自第一池的每对中的第一多核苷酸的5'端和第二多核苷酸的3'端之间生成单链互补突出物。在一些情况下,所述方法进一步包括连接克隆载体的相对端与来自第一池的每对中的第一多核苷酸的5'端和第二多核苷酸的3'端之间的单链互补突出物。可以使用DNA连接酶进行连接。在一些情况下,步骤(b)产生环状产物,所述环状产物包括来自第二池的插入多核苷酸、来自第一池的一对的第一多核苷酸和第二多核苷酸以及克隆载体。在一些情况下,通过从更大的一组此类序列中选择成对的多核苷酸序列来生成第一池,使得除了第一池的成对的多核苷酸与第二池的插入多核苷酸,或第一池的成对的多核苷酸与克隆载体之间的设计的组装重叠序列之外,没有来自第一池的多核苷酸与来自第一池的超过指定的阈值的任何其他多核苷酸共享共同序列。在一些情况下,指定的阈值为5至15个连续核苷酸。在一些情况下,组装是体外克隆方法,其中将第一池和第二池的混合物加热以使存在于第一池和第二池中的多核苷酸部分或完全变性,然后在组装之前被冷却至室温。在一些情况下,在步骤(a)之前,通过将含有来自成对的多核苷酸的每一个第一多核苷酸的混合物与含有来自成对的多核苷酸的每一个第二多核苷酸的混合物组合来生成多核苷酸的第一池。在一些情况下,第一池中的每对是双链DNA(dsDNA)或单链DNA(ssDNA)。在一些情况下,第二池中的每个插入多核苷酸是dsDNA或ssDNA。在一些情况下,对于第一池中的每对,第一多核苷酸和第二多核苷酸包括对应于宿主细胞中靶基因组基因座的序列。在一些情况下,对于第一池中的每对,第一多核苷酸和第二多核苷酸包括对应于作为代谢途径的一部分的基因的编码序列。在一些情况下,对于第一池中的每对,第一多核苷酸和第二多核苷酸包括对应于功能结构域或一或多种蛋白质的编码序列。在一些情况下,第二池中的每个插入多核苷酸包括位于第一组装重叠序列与第二组装重叠序列之间的一或多个有效负载序列。在一些情况下,一或多个有效负载序列选自启动子、基因、调节序列、编码降解决定子的核酸序列、编码溶解度标签的核酸序列、终止子、唯一标识符序列或其部分。在一些情况下,对于第一池中的每对,第一多核苷酸和第二多核苷酸包括与第一池中的每个其他对相比对应于宿主细胞中不同靶基因组基因座的序列。在一些情况下,对于第一池中的每对,第一多核苷酸和第二多核苷酸包括对应于宿主细胞中相同靶基因组基因座的序列。在一些情况下,第二池中的插入多核苷酸中的每个有效负载序列不同于第二池中的每个其他插入多核苷酸中的有效负载序列。在一些情况下,第二池中的插入多核苷酸中的每个有效负载序列与第二池中的每个其他插入多核苷酸中的有效负载序列相同。在一些情况下,第二池中的每个插入多核苷酸通过以下产生:(i)对包括有效负载序列、正向引物和反向引物的混合物进行聚合酶链反应(PCR),其中所述正向引物包括5'至3'、与所述有效负载序列互补的一或多个核苷酸的短段、所述第一组装重叠序列、用于一或多种位点特异性核酸酶的一或多个识别序列、所述第二组装重叠序列和与所述有效负载序列互补的一或多个核苷酸的第二段,并且其中所述反向引物包括与所述有效负载序列互补的序列,其中所述PCR生成PCR产物,所述PCR产物包括5'至3'、与所述有效负载序列互补的核酸的短段、所述第一组装重叠序列、所述一或多个位点特异性核酸酶识别序列、所述第二组装重叠序列和所述有效负载序列;(ii)经由选自由剪接和重叠延伸PCR(SOE-PCR)、限制性连接、钝端连接、基于重叠的组装方法和基于重组的方法组成的群组的组装方法,或用于连接两个DNA分子的任何其他酶促或化学方法,使PCR产物环化;以及(iii)用一或多种识别一或多个位点特异性核酸酶识别序列的位点特异性核酸酶使环化的PCR产物线性化,从而生成多核苷酸的第二池。在一些情况下,位点特异性核酸酶是限制性核酸内切酶、IIs型核酸内切酶、归巢核酸内切酶、RNA导向的核酸酶、DNA导向的核酸酶、锌指核酸酶、TALEN或切口酶中的一或多种。
在又一个方面中,本文提供了一种用于生成多核苷酸的文库的方法,所述方法包括:(a)经由聚合酶链反应(PCR)扩增多核苷酸的第一池,其中第一池含有成对的多核苷酸,其中第一池中的每对含有第一多核苷酸和第二多核苷酸,并且其中一对中的每个第一多核苷酸和每个第二多核苷酸包括5'端和3'端,其中所述扩增在来自所述第一池的一对中的第一多核苷酸的5'端和第二多核苷酸的3'端上引入共同重叠序列,所述共同重叠序列包括用于一或多种位点特异性核酸酶的一或多个识别序列;(b)通过利用共同重叠序列将来自第一池的每对第一多核苷酸和第二多核苷酸组装成单个核酸片段,其中每对的单个核酸片段包括由共同重叠序列从第一多核苷酸的5'端和第二多核苷酸的3'端分离的第一多核苷酸和第二多核苷酸,并且其中每对的单个核酸片段中第一多核苷酸的3'端和第二多核苷酸的5'端位于单个核酸片段的相对末端上,远离一或多个位点特异性核酸酶识别序列;(c)将每对的单个核酸片段与含有插入多核苷酸的第二池组合,其中第二池中的每个插入多核苷酸包括在其5'端的与单个核酸片段中存在的第一多核苷酸的3'端互补的第一组装重叠序列和在其相对的3'端的与单个核酸片段中存在的第二多核苷酸的5'端互补的第二组装重叠序列;(d)将所述第一池和所述第二池组装成环化的产物的第三池,其中所述组装通过体外或体内重叠组装方法进行,并且其中所述第三池中的每种环化的产物包括来自所述第二池的插入序列和来自所述第一池的一对第一多核苷酸和第二多核苷酸;(e)经由一或多种位点特异性核酸酶的消化使第三池中的每种环化的产物线性化,所述位点特异性核酸酶识别位于第三池中的每种环化的产物中的第一多核苷酸序列与第二多核苷酸序列之间的一或多个位点特异性核酸酶识别序列;以及(f)通过体外或体内克隆方法将线性化的产物组装到克隆载体中。在一些情况下,位于第一多核苷酸序列与第二多核苷酸序列之间的一或多个位点特异性核酸酶识别序列是归巢核酸酶识别序列。在一些情况下,位于第一多核苷酸序列与第二多核苷酸序列之间的一或多个位点特异性核酸酶识别序列的一或多种位点特异性核酸酶是归巢核酸内切酶。在一些情况下,共同重叠序列包括至少1个核苷酸的组装重叠序列,并且步骤(b)中的组装通过基于重叠的DNA组装方法进行。在一些情况下,共同重叠序列包括10-25个核苷酸的组装重叠序列,并且步骤(b)中的组装通过基于重叠的DNA组装方法进行。在一些情况下,基于重叠的DNA组装方法选自SOE-PCR或体外重叠组装方法(例如HiFi组装)。在一些情况下,存在于第一多核苷酸的5'端的共同重叠序列中的一或多个位点特异性核酸酶识别序列与存在于每对中的第二多核苷酸的3'端上的共同重叠序列中的一或多个位点特异性核酸酶识别序列互补,并且其中在步骤(b)中利用每对中的第一多核苷酸和第二多核苷酸的共同重叠序列需要进行SOE-PCR。在一些情况下,在步骤(b)中利用每对中的第一多核苷酸和第二多核苷酸的共同重叠序列需要用一或多个位点特异性核酸酶识别序列的一或多种位点特异性核酸酶消化每对中第一多核苷酸的5'端和第二多核苷酸的3'端上的共同重叠序列中存在的一或多个位点特异性核酸酶识别序列,以在每对中第一多核苷酸的5'端和第二多核苷酸的3'端上生成包括互补序列的单链突出物;以及连接在每对中第一多核苷酸的5'端和第二多核苷酸的3'端上的单链突出物上存在的互补序列。在一些情况下,使用基于重叠的DNA组装方法进行步骤(d)的组装。在一些情况下,基于重叠的DNA组装选自SOE-PCR和体外重叠组装方法(例如HiFi组装)。在一些情况下,每对中的单个核酸片段中的第一多核苷酸的3'端和第二多核苷酸的5'端包括一组附加的一或多个位点特异性核酸酶识别序列,并且第二池中的每个插入多核苷酸中的第一组装重叠序列和第二组装重叠序列包括一或多个位点特异性核酸酶识别序列。在一些情况下,步骤(d)中的组装需要用每对中的单个核酸片段中的第一多核苷酸的3'端和第二多核苷酸的5'端上的附加的一或多个位点特异性核酸酶识别序列以及来自第二池的每个插入多核苷酸中的第一组装序列和第二组装序列中存在的一或多个位点特异性核酸酶识别序列的一或多种位点特异性核酸酶消化每对中的单个核酸片段中的第一多核苷酸的3'端和第二多核苷酸的5'端上存在的附加的一或多个位点特异性核酸酶识别序列和来自第二池的每个插入多核苷酸中的第一组装序列和第二组装序列中存在的一或多个位点特异性核酸酶识别序列,以在第一多核苷酸的3'端上生成单链突出物(其包括与来自第二池的插入多核苷酸的第一组装序列的5'端上的单链突出物上存在的序列互补的序列)和在第二多核苷酸的5'端上生成单链突出物(其包括与来自第二池的相同插入多核苷酸的第二组装序列的3'端上的单链突出物上存在的序列互补的序列);以及连接单链突出物上存在的互补序列。在一些情况下,步骤(f)的克隆载体包括一或多个位点特异性核酸酶识别序列。在一些情况下,步骤(f)中的组装需要用克隆载体中存在的一或多个位点特异性核酸酶识别序列的一或多种位点特异性核酸酶消化克隆载体中的一或多个位点特异性核酸酶识别序列,其中消化在克隆载体的相对端生成单链突出物,其中克隆载体的相对端的一个上的单链突出物包括与步骤(e)中生成的线性化的产物的末端互补的序列,并且克隆载体的相对端的另一个上的单链突出物包括与步骤(e)中生成的线性化的产物的相对端互补的序列;以及连接克隆载体的单链突出物上存在的互补序列和来自步骤(e)的线性化的产物。在一些情况下,通过从更大的一组此类序列中选择成对的多核苷酸序列来生成第一池,使得除了第一池的成对的多核苷酸与第二池的插入多核苷酸,或第一池的成对的多核苷酸与克隆载体之间的设计的组装重叠序列之外,没有来自第一池的多核苷酸与来自第一池的超过指定的阈值的任何其他多核苷酸共享共同序列。在一些情况下,指定的阈值为5至15个连续核苷酸。在一些情况下,第二池中每个插入多核苷酸上的第一组装重叠序列和第二组装重叠序列包括1或多个与单个核酸片段的相对末端互补的核苷酸。在一些情况下,第二池中的每个插入多核苷酸上的第一组装重叠序列和第二组装重叠序列包括与单个核酸片段的相对末端互补的约25个核苷酸。在一些情况下,在步骤(a)之前,通过将含有来自成对的多核苷酸的每一个第一多核苷酸的混合物与含有来自成对的多核苷酸的每一个第二多核苷酸的混合物组合来生成多核苷酸的第一池。在一些情况下,第一池中的每对是双链DNA(dsDNA)或单链DNA(ssDNA)。在一些情况下,第二池中的每个插入多核苷酸是dsDNA或ssDNA。在一些情况下,对于第一池中的每对,第一多核苷酸和第二多核苷酸包括对应于宿主细胞中靶基因组基因座的序列。在一些情况下,对于第一池中的每对,第一多核苷酸和第二多核苷酸包括对应于作为代谢途径的一部分的基因的编码序列。在一些情况下,对于第一池中的每对,第一多核苷酸和第二多核苷酸包括对应于功能结构域或一或多种蛋白质的编码序列。在一些情况下,第二池中的每个插入多核苷酸包括位于第一组装重叠序列与第二组装重叠序列之间的一或多个有效负载序列。在一些情况下,一或多个有效负载序列选自启动子、基因、调节序列、编码降解决定子的核酸序列、编码溶解度标签的核酸序列、终止子、唯一标识符序列或其部分。在一些情况下,对于第一池中的每对,第一多核苷酸和第二多核苷酸包括与第一池中的每个其他对相比对应于宿主细胞中不同靶基因组基因座的序列。在一些情况下,对于第一池中的每对,第一多核苷酸和第二多核苷酸包括对应于宿主细胞中相同靶基因组基因座的序列。在一些情况下,第二池中的插入多核苷酸中的每个有效负载序列不同于第二池中的每个其他插入多核苷酸中的有效负载序列。在一些情况下,第二池中的插入多核苷酸中的每个有效负载序列与第二池中的每个其他插入多核苷酸中的有效负载序列相同。在一些情况下,第二池中的每个插入多核苷酸通过以下生成:(i)对包括有效负载序列、正向引物和反向引物的混合物进行聚合酶链反应(PCR),其中正向引物包括5'至3'、与有效负载序列互补的一或多个核苷酸的短段、第一组装重叠序列、用于一或多种位点特异性核酸酶的一或多个识别序列、第二组装重叠序列和与有效负载序列互补的一或多个核苷酸的第二段,并且其中所述反向引物包括与所述有效负载序列或与所述有效负载序列下游的其他序列互补的序列,其中所述PCR生成PCR产物,所述PCR产物包括5'至3'、与所述有效负载序列互补的核酸的短段、所述第一组装重叠序列、所述一或多个位点特异性核酸酶识别序列、所述第二组装重叠序列和所述有效负载序列;(ii)经由选自由剪接和重叠延伸PCR(SOE-PCR)、限制性连接、钝端连接、基于重叠的组装方法和基于重组的方法组成的群组的组装方法,或用于连接两个DNA分子的任何其他酶促或化学方法,使PCR产物环化;以及(iii)用识别一或多个位点特异性核酸酶识别序列的一或多种位点特异性核酸酶使环化的PCR产物线性化,从而生成多核苷酸的第二池。在一些情况下,位点特异性核酸酶是限制性核酸内切酶、IIs型核酸内切酶、归巢核酸内切酶、RNA导向的核酸酶、DNA导向的核酸酶、锌指核酸酶、TALEN或切口酶中的一或多种。
附图说明
图1描绘了用于DNA文库的多重确定性组装的方法,其示出了插入多核苷酸和包括载体重叠组装序列的第一多核苷酸和包括载体重叠组装序列的第二多核苷酸以及任选的克隆载体的初始组合物。插入多核苷酸可以包括有效负载序列,如果缺失,该有效负载序列的长度为零个核苷酸,或者如果插入或替换,该有效负载序列的长度为非零。
图2示出了用于图1的方法中的将第一多核苷酸和第二多核苷酸预缔合的由内向外的组装方法,以允许组装比最大合成寡核苷酸长度更长的插入多核苷酸(例如启动子)。
图3示出了图1的方法的修改,以允许组装比最大合成寡核苷酸长度更长的插入多核苷酸(例如,启动子)。
图4示出了使用图1的方法的确定性文库的组装。在表中给出了每个文库中唯一基因座、有效负载和全部可能构建体的数量。
图5示出了采用包括精确设计的DNA部分的池的确定性文库的成功体外组装的结果,所述DNA部分包含环状排列的有效负载(插入物)。顶部的长条表示待在池中组装的质粒的结构,并且下方的较短条表示与来自组装体的池的三个单独样品的相应参考序列对齐的Sanger序列。读段内端的细垂直线表示Sanger读段尾端的预期测序伪影。
图6示出了混合的组装体的总成功率,对于所述混合的组装体,使用附加了源自宿主基因组的模板的组装重叠的引物经由PCR来创建含有有效负载的部分。
具体实施方式
定义
虽然以下术语被认为是本领域普通技术人员很好理解的,但是阐述以下定义以便于解释当前公开的主题。
如本文中所使用的,术语“一(a或an)”可以指一或多个该实体,即可以指多个指代物。因此,术语“一”、“一或多个”和“至少一个”在本文中可以互换地使用。此外,通过不定冠词“一”对“要素”的提及并不排除存在多于一个要素的可能性,除非上下文明确地要求存在一个要素并且仅存在一个要素。
除非上下文另有要求,否则在整个本说明书和权利要求书中,词语“包括”及其变体,诸如“包括(comprises和comprising)”应以开放的、包含的意义来解释,即“包含但不限于”。
在整个说明书中对“一个实施例(one embodiment)”或“一个实施例(anembodiment)”的提及意指结合该实施例描述的特定特征、结构或特性可以被包含在本公开的至少一个实施例中。因此,在整个本说明书的各处出现的短语“在一个实施例中(in oneembodiment)”或“在一个实施例中(in an embodiment)”可能不一定都指同一实施例。应当理解,为了清楚起见在单独实施例的上下文中描述的本公开的某些特征也可以在单个实施例中组合提供。相反,为了简洁起见在单个实施例的上下文中描述的本公开的各种特征也可以单独地或以任何合适的子组合来提供。
如本文中所使用的,术语“细胞生物体”、“微生物(microorganism)”或“微生物(microbe)”应被广义地理解。这些术语可互换地使用,并且包含但不限于两种原核生物域:细菌和古细菌,以及某些真核生物真菌和原生生物。在一些实施例中,本公开涉及本公开中存在的清单/表和图的“微生物”或“细胞生物体”或“微生物”。这种表征不仅可以指表和图的所鉴定的分类属,而且还可以指所鉴定的分类种,以及所述表或图中任何生物体的各种新的和最新鉴定的或设计的菌株。对于这些术语在本说明书的其他部分中(诸如在实例中)中的叙述来说,相同表征保持成立。
如本文中所使用的,术语“原核生物”是本领域公认的,并且是指不含有核或其他细胞器的细胞。原核生物通常按照两种域之一归类:细菌和古细菌。古细菌域和细菌域的生物体之间的决定性差异是基于16S核糖体RNA中的核苷酸碱基序列的根本差异。
如本文中所使用的,术语“古细菌”是指疵壁菌门(Mendosicutes)的生物体的类别,其通常在异常的环境中发现,并且通过若干标准(包含核糖体蛋白质的数量和细胞壁中胞壁酸的缺乏)与其余的原核生物区分开。根据ssrRNA分析,古生菌由系统发生学截然不同的两种群组组成:泉古菌门(Crenarchaeota)和广古菌门(Euryarchaeota)。根据它们的生理学,古细菌可以被分为三种类型:产甲烷菌(methanogens)(产甲烷的原核生物);极端嗜盐菌(extreme halophiles)(生活在非常高浓度的盐(NaCl)下的原核生物);和极端(超)嗜热菌(生活在非常高的温度下的原核生物)。除了将它们与细菌区分开的统一古细菌特征(即在细胞壁中没有胞壁质、酯连接的膜脂质等)之外,这些原核生物表现出使其适应其特定栖息地的独特的结构或生物化学属性。泉古菌门主要由极端嗜热性硫依赖性原核生物组成,并且广古菌门含有产甲烷菌和极端嗜盐菌。
如本文中所使用的,“细菌”或“真细菌(eubacteria)”可以指原核生物体的域。细菌至少包含如下11个不同的群组:(1)革兰氏阳性(革兰氏+)细菌,其中存在两个主要的亚门:(1)高G+C群组(放线菌(Actinomycetes)、分枝杆菌(Mycobacteria)、微球菌(Micrococcus)及其他)(2)低G+C群组(芽孢杆菌(Bacillus)、梭菌(Clostridia)、乳杆菌(Lactobacillus)、葡萄球菌(Staphylococci)、链球菌(Streptococci)、支原体(Mycoplasmas));(2)变形菌门(Proteobacteria),例如紫色光合成+非光合成革兰氏阴性菌(包含最“常见”的革兰氏阴性菌);(3)蓝细菌(Cyanobacteria),例如含氧光养生物;(4)螺旋体(Spirochetes)和相关菌种;(5)浮霉状菌属(Planctomyces);(6)拟杆菌属(Bacteroides)、黄杆菌(Flavobacteria);(7)衣原体(Chlamydia);(8)绿色硫细菌(Greensulfur bacteria);(9)绿色非硫细菌(也称厌氧光养生物);(10)耐辐射微球菌和相关菌种;(11)热袍菌属(Thermotoga)和嗜热性热袍菌(Thermosipho thermophiles)。
如本文中所使用的,“真核生物”是其细胞含有核和封闭在膜内的其他细胞器的任何生物体。真核生物属于真核生物域(Eukarya或Eukaryota)分类单元。将真核细胞与原核细胞(上述细菌和古细菌)区分开来的决定性特征是,它们具有膜结合的细胞器,尤其是含有遗传物质并被核膜封闭的细胞核。
如本文中所使用的,术语“遗传修饰的宿主细胞”、“重组宿主细胞”和“重组菌株”在本文中可互换地使用,并且可以指已经通过本公开的克隆和转化方法进行遗传修饰的宿主细胞。因此,该术语包含宿主细胞(例如,细菌、酵母细胞、真菌细胞、CHO、人类细胞等),其已经被遗传改变、修饰或工程改造,使得与其所来源于的天然存在的生物体相比,它表现出改变的、修饰的或不同的基因型和/或表型(例如,当遗传修饰影响微生物的编码核酸序列时)。应当理解,在一些实施例中,该术语不仅指所讨论的特定重组宿主细胞,而且还指此类宿主细胞的后代或潜在后代。
如本文中所使用的,术语“野生型微生物”或“野生型宿主细胞”可以描述在自然界中存在的细胞,即未经遗传修饰的细胞。
如本文中所使用的,术语“遗传工程改造的”可以指对宿主细胞的基因组的任何操作(例如通过核酸的插入、缺失、突变或替换)。
如本文中所使用的,术语“对照”或“对照宿主细胞”可以指用于确定遗传修饰或实验处理的效果的合适的比较宿主细胞。在一些实施例中,对照宿主细胞是野生型细胞。在其他实施例中,对照宿主细胞在基因上除了遗传修饰之外,与经遗传修饰的宿主细胞相同,从而有别于处理宿主细胞。在一些实施例中,本公开教导了使用亲本菌株作为对照宿主细胞(例如,使用S1菌株作为菌株改良程序的基础)。在其他实施例中,宿主细胞可以是遗传上相同的细胞,其缺乏在处理宿主细胞中所测试的特定启动子或SNP。
如本文中所使用的,术语“等位基因”可以指基因的一或多种替代形式中的任何一种,所有这些等位基因都与至少一种性状或特性相关。在二倍体细胞中,给定基因的两个等位基因占据一对同源染色体上的相应基因座。
如本文中所使用的,术语“基因座(locus)”(复数形式的基因座(loci))可以表示期望对天然基因组序列进行编辑的任何位点。在一个实施例中,所述术语可以指染色体上的特定的一或多个位置或位点,在该位置或位点例如发现了基因或遗传标记物。
如本文中所使用的,术语“遗传连接的”可以指在繁殖期间两种或更多种性状以高速率共同遗传,使得它们难以通过杂交分离。
如本文中所使用的“重组”或“重组事件”可以指染色体杂交或独立的分类。
如本文中所使用的,术语“表型”可以指个体细胞、细胞培养物、生物体或生物体群组的可观察特性,其由该个体的基因组成(即基因型)与环境之间的相互作用产生。
如本文中所使用的,术语“嵌合的”或“重组的”当描述核酸序列或蛋白质序列时可以指将至少两个异源多核苷酸或两个异源多肽连接成单个大分子,或使至少一种天然核酸或蛋白质序列的一或多个元件重排的核酸或蛋白质序列。例如,术语“重组”可以指两个以其他方式分离的序列的片段的人工组合,例如通过化学合成或通过经由基因工程改造技术操纵核酸的分离的片段。
如本文中所使用的,“合成的核苷酸序列”或“合成的多核苷酸序列”是已知在自然界中不存在或不是天然存在的核苷酸序列。通常,当与任何其他天然存在的核苷酸序列相比时,此类合成核苷酸序列可以包括至少一种核苷酸差异。
如本文中所使用的,术语“核酸”可以指任何长度的核苷酸的聚合物形式:核糖核苷酸或脱氧核糖核苷酸或其类似物。该术语可以指分子的初级结构,并且因此包含双链和单链DNA,以及双链和单链RNA。它还包含修饰的核酸,诸如甲基化的和/或封端的核酸、含有修饰的碱基、主链修饰的核酸等。术语“核酸”和“核苷酸序列”可互换地使用。
如本文中所使用的,术语“基因”可以指与生物功能相关的任何DNA片段。因此,基因可以包含但不限于编码序列和/或其表达所需的调节序列。基因还可以包含未表达的DNA片段,其例如形成用于其他蛋白质的识别序列。基因可以从各种来源获得(包含从感兴趣的来源克隆或从已知或预测的序列信息合成),并且可以包含被设计为具有所需参数的序列。
如本文中所使用的,术语“同源的”或“同源物”或“直系同源物(ortholog)”或“直系同源物(orthologue)”在本领域中是已知的,并且可以指共享共同祖先或家族成员并基于序列同一性的程度确定的相关序列。
术语“同源性”、“同源的”、“基本相似的”和“基本上对应的”在本文中可以互换地使用。所述术语可以指核酸片段,其中一或多个核苷酸碱基的变化不影响核酸片段介导基因表达或产生某种表型的能力。这些术语还可以指本公开的核酸片段的修饰,诸如相对于初始的、未修饰的片段基本上不改变所得核酸片段的功能性质的一或多个核苷酸的缺失或插入。因此,应当理解,如本领域技术人员将理解的,本公开涵盖除所述特定示例性序列之外的序列。这些术语描述了在一种物种、亚种、品种、栽培品种或品系中发现的基因与在另一种物种、亚种、品种、栽培品种或品系中发现的相应或等效基因之间的关系。为了本公开的目的,比较同源序列。
“同源序列”或“同源物”或“直系同源物”被认为、相信或已知在功能上是相关的。功能关系可以用多种方式中的任何一种来表示,包含但不限于:(a)序列同一性的程度和/或(b)相同或相似的生物学功能。优选地,指示(a)和(b)两者。氨基酸序列或核酸序列之间的序列同源性可以根据共同的祖先来定义。由于物种形成事件(直系同源物)或重复事件(旁系同源物),核酸的两个片段可能具有共同的祖先。氨基酸序列或核酸序列之间的同源性可以从它们的序列相似性来推断,使得氨基酸序列或核酸序列被认为是同源的,即所述氨基酸序列或所述核酸序列共享显著的相似性。显著的相似性可以是两个序列通过从共同祖先的不同进化而相关的有力证据。多个序列的比对可以用于发现同源区域。同源性可以使用本领域中容易获得的软件程序来确定,诸如在分子生物学实验室指南(CurrentProtocols in Molecular Biology)(F.M.奥斯贝(F.M.Ausubel)等人编,1987)副刊30,第7.718章,表7.71中讨论的那些软件程序。一些比对程序为BLAST(NCBI),MacVector(牛津分子有限公司(Oxford Molecular Ltd),英国牛津(Oxford,U.K.)),ALIGN Plus(科学和教育软件(Scientific and Educational Software),宾夕法尼亚州(Pennsylvania))和AlignX(Vector NTI,英杰公司(Invitrogen),加利福尼亚州卡尔斯巴德(Carlsbad,CA))。另一个比对程序是使用默认参数的Sequencher(基因代码(Gene Codes),密歇根州安娜堡(AnnArbor,Michigan))。
如本文中所使用的,术语“内源性”或“内源性基因”可以指天然存在的基因,在其所处位置发现其天然地存在于宿主细胞基因组内。在本公开的上下文中,将异源启动子可操作地连接到内源基因意指在该基因天然存在的位置将异源启动子序列通过遗传方式插入到现有基因的前面。如本文所述的内源基因可以包含根据本公开的任何方法已经突变的天然存在的基因的等位基因。
如本文中所使用的,术语“外源的”与术语“异源的”可互换地使用,并且是指来自除其天然来源之外的一些来源的物质。例如,术语“外源蛋白质”或“外源基因”是指来自非天然来源或位置并且已经被人工提供给生物系统的蛋白质或基因。
如本文中所使用的,术语“核苷酸变化”是指例如核苷酸替代、缺失和/或插入,如本领域中所熟知的。例如,突变可以含有产生沉默替代、添加或缺失的改变,但不改变编码的蛋白质的性质或活性或蛋白质的制备方式。可替代地,突变可以是非同义替代或改变,其可以改变编码的蛋白质的氨基酸序列并且可以导致蛋白质的性质或活性的改变。
如本文中所使用的,术语“蛋白质修饰”可以指如本领域中所熟知的氨基酸替代、氨基酸修饰、缺失和/或插入。
如本文中所使用的,术语核酸或多肽的“至少一部分”或“片段”可以指具有此类序列的最小尺寸特征的部分,或全长分子的任何较大片段,直至并包含全长分子。本公开的多核苷酸的片段可以编码基因调节元件的生物活性部分。基因调节元件的生物活性部分可以通过分离本公开的多核苷酸之一的包括基因调节元件的一部分并评估如本文所述的活性来制备。类似地,多肽的一部分可以是4个氨基酸、5个氨基酸、6个氨基酸、7个氨基酸等,直至全长多肽。待使用的部分的长度将取决于特定应用。用作杂交探针的核酸的一部分可以短至12个核苷酸;在一些实施例中,它是20个核苷酸。用作表位的多肽的一部分可以短至4个氨基酸。发挥全长多肽的功能的多肽的一部分通常将比4个氨基酸长。
变体多核苷酸还可以涵盖来源于诱变和重组程序诸如DNA改组(shuffling)的序列。用于此类DNA改组的策略在本领域中是已知的。参见,例如,施特默尔(Stemmer)(1994)美国国家科学院院刊(PNAS)91:10747-10751;施特默尔(1994)自然(Nature)370:389-391;凯默瑞(Crameri)等人(1997)自然生物技术(Nature Biotech.)15:436-438;穆尔(Moore)等人(1997)分子生物学杂志(J.Mol.Biol.)272:336-347;张(Zhang)等人(1997)美国国家科学院院刊94:4504-4509;凯默瑞等人(1998)自然391:288-291;以及美国专利号5,605,793和5,837,458。
对于本文公开的PCR扩增,可以设计用于PCR反应的寡核苷酸引物,以从由任何感兴趣的生物体提取的cDNA或基因组DNA中扩增相应的DNA序列。用于设计PCR引物和PCR克隆的方法在本领域中是公知的,并且公开在萨布鲁克(Sambrook)等人(2001)分子克隆:实验室手册(Molecular Cloning:A Laboratory Manual)(第3版,冷泉港实验室出版社(ColdSpring Harbor Laboratory Press),纽约普莱恩维尤(Plainview,NewYork))中。还参见英尼斯(Innis)等人编(1990)PCR方案:方法和应用指南(PCR Protocols:A Guide toMethods and Applications)(纽约学术出版社(Academic Press,New York));英尼斯和盖尔范德(Gelfand)编(1995)PCR策略(PCR Strategies)(纽约学术出版社);以及英尼斯和盖尔范德编(1999)PCR方法手册(PCR Methods Manual)(纽约学术出版社)。已知的PCR方法包含但不限于使用配对引物、巢式引物、单一特异性引物、简并引物、基因特异性引物、载体特异性引物、部分错配引物等的方法。
如本文中所使用的术语“引物”可以指寡核苷酸,其当置于其中诱导引物延伸产物的合成的条件下时(即在核苷酸和用于聚合的药剂诸如DNA聚合酶的存在下和在合适的温度和pH下),能够退火至扩增靶,允许DNA聚合酶附着,从而用作DNA合成的起点。(扩增)引物可以是单链的以获得最大的扩增效率。引物可以是寡脱氧核糖核苷酸。引物必须足够长,以在用于聚合的药剂的存在下引发延伸产物的合成。引物的确切长度将取决于许多因素,包含引物的温度和组成(A/T相对于G/C含量)。一对双向引物由一个正向引物和一个反向引物组成,如在DNA扩增(诸如在PCR扩增中)领域中常用的。
如本文中所使用的,“启动子”可以指能够控制编码序列或功能性RNA的表达的DNA序列。在一些实施例中,启动子序列由近端和更远端上游元件组成,后者元件通常被称为增强子。因此,“增强子”可以是可以刺激启动子活性的DNA序列,并且可以是启动子的先天元件或被插入以增强启动子的水平或组织特异性的异源元件。启动子可以全部来源于天然基因,或者可以由来源于在自然界中发现的不同启动子的不同元件组成,或者甚至包括合成的DNA片段。本领域技术人员应理解,不同的启动子可以指导基因在不同组织或细胞类型中或在不同发育阶段或响应于不同环境条件的表达。进一步认识到,由于在大多数情况下调节序列的确切边界尚未完全确定,因此一些变异的DNA片段可能具有相同的启动子活性。
如本文中所使用的,短语“重组构建体”、“表达构建体”、“嵌合构建体”、“构建体”和“重组DNA构建体”在本文中可互换地使用。重组构建体可以包括核酸片段的人工组合,例如在自然界中未一同发现的调节序列和编码序列。例如,嵌合构建体可以包括来自不同来源的调节序列和编码序列,或来自相同来源但以不同于在自然界中发现的方式排列的调节序列和编码序列。此类构建体可以单独使用,或者可以与载体联合使用。如果使用载体,那么载体的选择取决于将用于转化宿主细胞的方法,如本领域技术人员所熟知的。例如,可以使用质粒载体。技术人员熟知在载体上必须存在的遗传元件,以便成功地转化、选择和繁殖包括本公开的任何分离的核酸片段的宿主细胞。技术人员还将认识到,不同的独立转化事件将导致不同的表达水平和模式(琼斯(Jones)等人(1985)欧洲分子生物学组织杂志(EMBOJ.)4:2411-2418;德·阿尔梅达(De Almeida)等人(1989)分子基因遗传学(Mol.Gen.Genetics)218:78-86),并且因此必须筛选多个事件,以便获得显示所需表达水平和模式的细胞系。此类筛选可以通过直接测序、DNA的Southern分析、mRNA表达的Northern分析、蛋白质表达的免疫印迹分析或表型分析等来完成。载体可以是质粒、病毒、细菌噬菌体、前病毒、噬菌粒、转座子、人工染色体等,其自主地复制或者可以整合到宿主细胞的染色体中。载体也可以是非自主复制的裸RNA多核苷酸、裸DNA多核苷酸、由同一条链内的DNA和RNA组成的多核苷酸、聚赖氨酸缀合的DNA或RNA、肽缀合的DNA或RNA、脂质体缀合的DNA等。如本文中所使用的,术语“表达”是指功能性最终产物例如mRNA或蛋白质(前体或成熟物)的产生。
“可操作地连接的”或“功能性连接的”可以意指根据本公开的任何功能性有效负载(例如,启动子、终止子、降解决定子、溶解度标签等)与另外的寡核苷酸或多核苷酸的顺序排列。在一些情况下,顺序排列可以导致所述另外的多核苷酸的转录。在一些情况下,顺序排列可以导致所述另外的多核苷酸的翻译。功能性有效负载可以存在于另外的寡核苷酸或多核苷酸的上游或下游。在一个实例中,“可操作地连接的”或“功能性连接的”可以意指启动子控制与所述启动子相邻或其下游或3'的基因的转录。在另一个实例中,“可操作地连接的”或“功能性连接的”可以意指终止子控制与所述终止子相邻或其上游或5'的基因的转录的终止。
如本文中所使用的术语“感兴趣的产物”或“生物分子”可以指由来自原料的微生物产生的任何产物。在一些情况下,感兴趣的产物可以是小分子、酶、肽、氨基酸、有机酸、合成化合物、燃料、醇等。例如,感兴趣的产物或生物分子可以是任何初级或次级细胞外代谢物。初级代谢物尤其可以是乙醇、柠檬酸、乳酸、谷氨酸、谷氨酸盐、赖氨酸、苏氨酸、色氨酸和其他氨基酸、维生素、多糖等。次级代谢物尤其可以是抗生素化合物如青霉素、或免疫抑制剂如环孢菌素A(cyclosporin A)、植物激素如赤霉素(gibberellin)、他汀类药物(statin drug)如洛伐他汀(lovastatin)、杀真菌剂如灰黄霉素(griseofulvin)等。感兴趣的产物或生物分子也可以是由微生物产生的任何细胞内组分,诸如:微生物酶,包含:过氧化氢酶、淀粉酶、蛋白酶、果胶酶、葡萄糖异构酶、纤维素酶、半纤维素酶、脂肪酶、乳糖酶、链激酶和许多其他酶。细胞内组分还可以包含重组蛋白质,诸如胰岛素、乙肝疫苗、扰动素、粒细胞集落刺激因子、链激酶等。
如本文中所使用的,术语“HTP遗传设计文库”或“文库”是指根据本公开的遗传扰动的集合。在一些实施例中,本公开的文库可以表现为i)数据库或其他计算机文件中的序列信息的集合,ii)编码上述一系列遗传元件的遗传构建体的集合,或iii)包括所述遗传元件的宿主细胞菌株。在一些实施例中,本公开的文库可以指单个元件的集合(例如,PRO交换文库的启动子的集合,用于STOP交换文库的终止子的集合,溶解度标签交换文库的蛋白质溶解度标签的集合,或降解标签交换文库的蛋白质降解标签的集合)。在其他实施例中,本公开的文库还可以指遗传元件的组合,诸如启动子:基因、基因:终止子、或者甚至启动子:基因:终止子的组合。在一些实施例中,本公开的文库还可以指启动子、终止子、蛋白质溶解度标签和/或蛋白质降解标签的组合。在一些实施例中,本公开的文库进一步包括与在宿主生物体中应用文库的每个成员的效果相关的元数据。例如,如本文中所使用的文库可以包含启动子::基因序列组合的集合,以及那些组合对特定物种中的一或多种表型的所得效果,因此提高了在未来启动子交换中使用所述组合的未来预测价值。
如本文中所使用的,术语“SNP”是指小核多态性。在一些实施例中,本公开的SNP应当被广义地解释,并且包含单核苷酸多态性、序列插入、缺失、倒位和其他序列替换。如本文中所使用的,术语“非同义的”或非同义的SNP"是指导致宿主细胞蛋白质中的编码变化的突变。
基因组工程改造的“高通量(HTP)”方法可以涉及利用至少一件自动化设备(例如液体处理机或板处理机)来实施所述方法的至少一个步骤。
如本文中所使用的术语“多核苷酸”涵盖寡核苷酸,并且指任何长度的核酸。多核苷酸可以是DNA或RNA。除非另有说明,否则多核苷酸可以是单链的(ss)或双链的(ds)。多核苷酸可以是合成的,例如在DNA合成器中合成的,或天然存在的,例如从天然来源提取的,或衍生自克隆的或扩增的材料。本文所提及的多核苷酸可以含有修饰的碱基或核苷酸。
如本文中所使用的术语“池”可以指至少2种多核苷酸的集合。在一些实施例中,一组多核苷酸可以包括至少5个、至少10个、至少12个或至少15个或更多个多核苷酸。
如本文中所使用的术语“重叠序列”,或“重叠组装序列”或“组装重叠序列”可以指在两个多核苷酸中互补的序列,并且其中重叠序列是一个多核苷酸上的ss,使得它可以与另一个多核苷酸上的另一个重叠互补ss区杂交。重叠序列可以在两种不同的多核苷酸的末端处或接近末端(例如,在约5、10、20个核苷酸之内)。例如,如果两种不同的多核苷酸是单链的,则组装重叠序列将存在于每种单链多核苷酸的3'末端。可替代地,如果两种不同的多核苷酸是双链的,则一种多核苷酸的组装重叠序列可以存在于所述多核苷酸的3'末端(即,相对于ds多核苷酸的顶部链的3'端),而另一种多核苷酸上的互补组装重叠序列可以存在于所述多核苷酸的5'端(即,相对于ds多核苷酸的顶部链的5'端)。根据需要,可以通过去除任何非重叠序列来获得任何ds多核苷酸上的组装重叠序列。去除可以是酶促的,诸如通过通过使用聚合酶的3'-5'核酸外切酶活性。
如本文中所使用的,术语“组装”可以指其中两个或更多、四个或更多、六个或更多、八个或更多、十个或更多、12个或更多、15个或更多的多核苷酸,例如四个或更多的多核苷酸彼此连接以形成更长的多核苷酸的反应。
如本文中所使用的,术语“在合适的反应条件下孵育”可以指将反应维持在合适的温度和时间以获得期望的结果,即多核苷酸组装。适合于在本方法中使用的酶和试剂的反应条件是已知的(例如,如在本文实例中所述),并且因此可以容易地确定用于本方法的合适的反应条件。这些反应条件可以取决于所使用的酶(例如,取决于它们的最佳温度等)而变化。
如本文中所使用的,术语“连接”可以指两个序列之间共价键的产生。
如本文中所使用的,术语“组合物”可以指除了列出的试剂之外还可以含有其他试剂的试剂的组合,例如甘油、盐、dNTP等。组合物可以是任何形式,例如含水的或冻干的,并且可以是任何状态(例如,冷冻的或液体形式)。
如本文中所使用的,“载体”是合适的DNA,片段或DNA组装体可以被整合到其中,使得工程改造的载体可以在宿主细胞中复制。线性化的载体可以通过环状载体的限制性核酸内切酶消化或通过PCR产生。片段和/或线性化的载体的浓度可以通过凝胶电泳或其他方法来确定。
概述
本文提供了促进以确定性而非组合方式在单个反应中产生多个组装体的方法和组合物。本文提供的方法和组合物赋予了多重组装的时间、成本和通量益处,同时仍然能够创建文库,其中所有输出组装体都是预先确定的。本文提供的方法和组合物允许在单个组装反应中产生许多质粒或构建体,减少了产生数千个质粒或构建体的文库所需的总反应数。本文提供的方法和组合物还允许从大量可能组合的更大集合中组装所需的质粒或构建体的限定子集。在一些情况下,本文提供的方法和组合物通过不包含任何有效负载或插入序列特异性组装重叠,使需要从基因组扩增(或合成)的独特部分(“同源性臂”)的数目最小化。这可以消除扩增被设计用于与多个有效负载或插入序列组合的同一同源性臂对的多个拷贝的需要。此外,由有效负载/插入序列和同源性臂对的组合产生的多样性由有效负载/插入序列本身上的序列指定。大量所得的有效负载序列可以合成和廉价地产生。使用本文提供的方法和组合物生成的文库可以适合于任何数量的应用,诸如例如任何基因组编辑方法或任何混合的途径组装。本领域中已知的基因组编辑方法可以是那些不需要用于RCME(重组酶盒介导的交换)的定制位点以在多个任意位置编辑细胞的基因组的方法,诸如例如无疤痕的基因组编辑。
本文提供了一种组合物,其包括用于以确定性方式组装核酸构建体的文库的多核苷酸的混合物。混合物可以包括多核苷酸部分(例如,第一多核苷酸和第二多核苷酸)的n个池。n个池可以是至多、至少或恰好是多核苷酸的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个池。n个池可以各自包括相同数量的多核苷酸部分,或者它们可以包括不同数量的多核苷酸部分(例如,第一多核苷酸和第二多核苷酸)。在一个实施例中,混合物包括2个池,使得两个池中的一个包括第一多核苷酸,并且两个池中的另一个包括第二多核苷酸。第一多核苷酸的每个池可以在第二多核苷酸的单独池中包括配对的第二多核苷酸。除了任何上述实施例之外,混合物可以进一步包括插入或桥接多核苷酸的n-1个池。每个插入或桥接多核苷酸可以包括与其5'端的多核苷酸部分的n个池之一(例如第一多核苷酸)的元件和与其3'端的多核苷酸部分的其他池之一(例如第二多核苷酸)的元件互补的序列。可以设计插入序列,使得组装产生多核苷酸的文库,其中每个多核苷酸包括来自多核苷酸部分的n个池中的每一个的特定元件,散布有来自插入多核苷酸的n-1个池中的每一个的特定元件。
多核苷酸的混合物可以包括:含有成对的多核苷酸的第一池,其中第一池中的每对含有第一多核苷酸和第二多核苷酸;和插入多核苷酸的第二池,其中第二池中的每个插入多核苷酸包括在其5'端的与来自第一池的一对多核苷酸中的第一多核苷酸的3'端互补的第一组装重叠序列和在其相对的3'端的与第二多核苷酸的5'端互补的第二组装重叠序列。在一个实施例中,所述组合物可以进一步包括克隆载体,其中,对于第一池中的每对,第一多核苷酸的5'端和第二多核苷酸的3'端包括与克隆载体互补的序列。克隆载体可以是本领域中已知的适合于在宿主细胞诸如例如大肠杆菌(E.coli)或酿酒酵母(S.cerevisiae)中繁殖的任何克隆载体。在另一个实施例中,组合物还包括聚合酶、核酸外切酶、连接酶或其任意组合。聚合酶可以是链置换的或非链置换的。核酸外切酶可以是5'-3'核酸外切酶。第一池中的成对的多核苷酸可以是双链的、单链的或其组合。第二池中的插入多核苷酸可以是双链的、单链的或其组合。在一个实施例中,聚合酶是非链置换的,并且组合物进一步包括拥挤剂。拥挤剂可以选自聚乙二醇(PEG)、聚蔗糖或葡聚糖。在一个实施例中,拥挤剂是PEG。PEG可以以约3%至约7%(重量/体积)的浓度使用。PEG可以选自PEG-200、PEG-4000、PEG-6000、PEG-8000或PEG-20,000。在另一个实施例中,聚合酶是链置换的,并且组合物进一步包括单链结合蛋白质。单链DNA结合蛋白质可以是极端耐热的单链DNA结合蛋白质(ETSSB)、大肠杆菌recA、T7基因2.5产物、噬菌体λRedB或Rac前噬菌体RecT。
在一个实施例中,本文提供的组合物是以下多核苷酸的混合物:(1)一或多种第一多核苷酸,(2)一或多种插入多核苷酸,其中插入多核苷酸包括在其5'端的第一组装重叠序列和在其相对的3'端的第二组装重叠序列,和(3)一或多种第二多核苷酸。在另一个实施例中,组合物是以下多核苷酸的混合物:(1)一或多种第一多核苷酸,(2)一或多种插入多核苷酸,其中插入多核苷酸包括在其5'端的第一组装重叠序列和在其相对的3'端的第二组装重叠序列,(3)一或多种第二多核苷酸和(4)克隆载体。一或多种第一多核苷酸中的每一种可以包括在其3'端或远端的与存在于来自一或多种插入多核苷酸的插入多核苷酸的5'端或近端的第一组装重叠序列互补的序列。一或多种第二多核苷酸中的每一种可以包括在其5'端或近端的与存在于来自一或多种插入多核苷酸的插入多核苷酸的3'端或远端的第二组装重叠序列互补的序列。一或多种第一多核苷酸中的每一个可以与一或多种第二多核苷酸中的至少一个配对,从而形成一对或多对第一多核苷酸和第二多核苷酸。每对第一多核苷酸和第二多核苷酸可以包括在第一多核苷酸的远端的与来自一或多个插入多核苷酸的插入多核苷酸的近端上的第一组装重叠序列互补的序列;以及在第二多核苷酸的近端的与来自一或多个插入多核苷酸的插入多核苷酸的远端互补的序列。
本文提供了一种用于生成多核苷酸的文库的方法,该方法包括:a.组合多核苷酸部分的n个池(例如第一多核苷酸和第二多核苷酸)和插入或桥接多核苷酸的n-1个池;以及b.将多核苷酸部分的n个池和插入多核苷酸的n-1个池组装到多核苷酸的文库中,其中文库中的每个多核苷酸包括来自多核苷酸部分的n个池中的每一个的单个元件和桥接多核苷酸的限定组合。插入或桥接多核苷酸的n-1个池中的每个插入或桥接多核苷酸包括在其5'端的与第一多核苷酸的3'端互补的第一组装重叠序列和在其相对的3'端的与第一多核苷酸和第二多核苷酸的n个池中的第二多核苷酸的5'端互补的第二组装重叠序列。组装可以经由体外或体内重叠组装方法进行。在一些情况下,经由体外克隆方法进行组装,其中将多核苷酸部分的n个池和插入或桥接多核苷酸的n-1个池的混合物加热,以使存在的任何双链多核苷酸部分部分或完全变性,然后在进行体外克隆方法之前以低速冷却至室温。
本文还提供了一种用于生成多核苷酸的文库的方法,该方法包括:(a)组合多核苷酸的第一池和多核苷酸的第二池,其中第一池含有成对的多核苷酸,其中第一池中的每对含有第一多核苷酸和第二多核苷酸,其中第二池含有插入多核苷酸,其中第二池中的每个插入多核苷酸包括在其5'端的与来自第一池的一对多核苷酸中的第一多核苷酸的3'端互补的第一组装重叠序列和在其相对的3'端的与第二多核苷酸的5'端互补的第二组装重叠序列;(b)将第一池和第二池组装成多核苷酸的文库,其中文库中的每一多核苷酸包括来自第二池的插入多核苷酸和来自第一池的一对第一多核苷酸和第二多核苷酸。组装可以经由体外或体内重叠组装方法进行。在一些情况下,经由体外克隆方法进行组装,其中加热第一池和第二池的混合物以使存在于第一池和第二池中的多核苷酸部分或完全变性,然后在进行体外克隆方法之前以低速冷却至室温。在一些情况下,该方法进一步包括在步骤(a)期间将克隆载体与第一池和第二池组合,其中对于第一池中的每对,克隆载体的相对端包括与第一多核苷酸的5'端和第二多核苷酸的3'端互补的序列。在一些情况下,该方法进一步包括在步骤(a)之前将克隆载体与第一池组合,其中对于第一池中的每对,克隆载体的相对端包括与第一多核苷酸的5'端和第二多核苷酸的3'端互补的序列。在一些情况下,克隆载体和来自第一池的每对中的第一多核苷酸的5'端和第二多核苷酸的3'端包括用于一或多种位点特异性核酸酶的一或多个识别序列。在一些情况下,所述方法进一步包括通过添加用于一或多个识别序列的一或多种位点特异性核酸酶,在克隆载体的相对端与来自第一池的每对中的第一多核苷酸的5'端和第二多核苷酸的3'端之间生成单链互补突出物。在一些情况下,所述方法进一步包括连接克隆载体的相对端与来自第一池的每对中的第一多核苷酸的5'端和第二多核苷酸的3'端之间的单链互补突出物。可以使用DNA连接酶进行连接。在一些情况下,步骤(b)产生环状产物,所述环状产物包括来自第二池的插入多核苷酸、来自第一池的一对的第一多核苷酸和第二多核苷酸以及克隆载体。
在一个方面中,本文提供了一种用于生成多核苷酸的文库的方法,该方法包括:(a)通过聚合酶链反应(PCR)扩增多核苷酸的第一池,其中第一池含有成对的多核苷酸,其中第一池中的每对含有第一多核苷酸和第二多核苷酸,并且其中一对中的每个第一多核苷酸和每个第二多核苷酸包括5'端和3'端,其中该扩增在来自第一池的一对中的第一多核苷酸的5'端和第二多核苷酸的3'端上引入共同重叠序列,该共同重叠序列包括用于一或多种位点特异性核酸酶的一或多个识别序列;(b)通过利用共同重叠序列将来自第一池的每对第一多核苷酸和第二多核苷酸组装成单个核酸片段,其中每对的单个核酸片段包括由共同重叠序列从第一多核苷酸的5'端和第二多核苷酸的3'端分离的第一多核苷酸和第二多核苷酸,并且其中每对的单个核酸片段中第一多核苷酸的3'端和第二多核苷酸的5'端位于单个核酸片段的相对末端上,远离一或多个位点特异性核酸酶识别序列;(c)将每对的单个核酸片段与含有插入多核苷酸的第二池组合,其中第二池中的每个插入多核苷酸包括在其5'端的与单个核酸片段中存在的第一多核苷酸的3'端互补的第一组装重叠序列和在其相对的3'端的与单个核酸片段中存在的第二多核苷酸的5'端互补的第二组装重叠序列;(d)将第一池和第二池组装成环化的产物的第三池,其中所述组装经由体外或体内重叠组装方法进行,并且其中第三池中的每种环化的产物包括来自第二池的插入序列和来自第一池的一对第一多核苷酸和第二多核苷酸;(e)经由一或多种位点特异性核酸酶的消化使第三池中的每种环化的产物线性化,所述位点特异性核酸酶识别位于第三池中的每个环状产物中的第一多核苷酸序列与第二多核苷酸序列之间的一或多个位点特异性核酸酶识别序列;以及(f)经由体外或体内克隆方法将线性化的产物组装到克隆载体中。在一些情况下,共同重叠序列包括至少1个核苷酸的组装重叠序列,并且步骤(b)中的组装通过基于重叠的DNA组装方法进行。在一些情况下,共同重叠序列包括10-25个核苷酸的组装重叠序列,并且步骤(b)中的组装通过基于重叠的DNA组装方法进行。在一些情况下,基于重叠的DNA组装方法选自SOE-PCR或体外重叠组装方法(例如,使用
Figure BDA0003106371180000211
HiFi构建器的HiFi组装)。在一些情况下,存在于第一多核苷酸的5'端的共同重叠序列中的一或多个位点特异性核酸酶识别序列与存在于每对中的第二多核苷酸的3'端上的共同重叠序列中的一或多个位点特异性核酸酶识别序列互补,并且其中在步骤(b)中利用每对中的第一多核苷酸和第二多核苷酸的共同重叠序列需要进行SOE-PCR。在一些情况下,在步骤(b)中利用每对中的第一多核苷酸和第二多核苷酸的共同重叠序列需要用一或多个位点特异性核酸酶识别序列的一或多种位点特异性核酸酶消化每对中第一多核苷酸的5'端和第二多核苷酸的3'端上的共同重叠序列中存在的一或多个位点特异性核酸酶识别序列,以在每对中第一多核苷酸的5'端和第二多核苷酸的3'端上生成包括互补序列的单链突出物;以及连接在每对中第一多核苷酸的5'端和第二多核苷酸的3'端上的单链突出物上存在的互补序列。步骤(d)中的组装可以经由体外或体内重叠组装方法进行。步骤(d)的组装可以使用基于重叠的DNA组装方法进行。基于重叠的DNA组装可以选自SOE-PCR和体外重叠组装方法(例如,使用
Figure BDA0003106371180000221
HiFi构建器的HiFi组装)。在一些情况下,每对中的单个核酸片段中的第一多核苷酸的3'端和第二多核苷酸的5'端包括一组附加的一或多个位点特异性核酸酶识别序列,并且第二池中的每个插入多核苷酸中的第一组装重叠序列和第二组装重叠序列包括一或多个位点特异性核酸酶识别序列。在一些情况下,步骤(d)中的组装需要用每对中的单个核酸片段中的第一多核苷酸的3'端和第二多核苷酸的5'端上的附加的一或多个位点特异性核酸酶识别序列以及来自第二池的每个插入多核苷酸中的第一组装序列和第二组装序列中存在的一或多个位点特异性核酸酶识别序列的一或多种位点特异性核酸酶消化每对中的单个核酸片段中的第一多核苷酸的3'端和第二多核苷酸的5'端上存在的附加的一或多个位点特异性核酸酶识别序列和来自第二池的每个插入多核苷酸中的第一组装序列和第二组装序列中存在的一或多个位点特异性核酸酶识别序列,以在第一多核苷酸的3'端上生成单链突出物(其包括与来自第二池的插入多核苷酸的第一组装序列的5'端上的单链突出物上存在的序列互补的序列)和在第二多核苷酸的5'端上生成单链突出物(其包括与来自第二池的相同插入多核苷酸的第二组装序列的3'端上的单链突出物上存在的序列互补的序列);以及连接单链突出物上存在的互补序列。在一些情况下,步骤(d)的组装经由体外克隆方法进行,其中将第一池和第二池的混合物加热以使存在于第一池和第二池中的多核苷酸部分或完全变性,然后在进行体外克隆方法之前以低速冷却至室温。步骤(f)中的组装可以经由体外克隆方法或体内克隆方法进行。在一些情况下,步骤(f)的克隆载体包括一或多个位点特异性核酸酶识别序列。在一些情况下,步骤(f)中的组装需要用克隆载体中存在的一或多个位点特异性核酸酶识别序列的一或多种位点特异性核酸酶消化克隆载体中的一或多个位点特异性核酸酶识别序列,其中消化在克隆载体的相对端生成单链突出物,其中克隆载体的相对端的一个上的单链突出物包括与步骤(e)中生成的线性化的产物的末端互补的序列,并且克隆载体的相对端的另一个上的单链突出物包括与步骤(e)中生成的线性化的产物的相对端互补的序列;以及连接克隆载体的单链突出物上存在的互补序列和来自步骤(e)的线性化的产物。用于本文提供的任何方法或组合物中的位点特异性核酸酶可以选自限制性核酸内切酶、IIs型核酸内切酶、归巢核酸内切酶、RNA导向的核酸酶、DNA导向的核酸酶、锌指核酸酶、TALEN和切口酶或其任意组合。位于第一多核苷酸序列与第二多核苷酸序列之间的一或多个位点特异性核酸酶识别序列可以是一或多个归巢核酸酶识别序列。位于第一多核苷酸序列与第二多核苷酸序列之间的一或多个位点特异性核酸酶识别序列的一或多种位点特异性核酸酶可以是归巢核酸内切酶。
在另一个方面中,本文提供了一种用于生成多核苷酸的文库的方法,该方法包括:(a)经由聚合酶链反应(PCR)扩增多核苷酸的第一池,其中第一池含有成对的多核苷酸,其中第一池中的每对含有第一多核苷酸和第二多核苷酸,并且其中一对中的每一个第一多核苷酸和每一个第二多核苷酸包括第一5'末端和相对的第二3'末端,其中该扩增将用于一或多种位点特异性核酸酶的一或多个识别序列引入到来自第一池的一对中的第一多核苷酸的第一5'末端和第二多核苷酸的3'端上,其中第一多核苷酸的第一5'末端上的一或多种位点特异性核酸酶的一或多个识别序列与该对中的第二多核苷酸的第一3'末端上的一或多种位点特异性核酸酶的一或多个识别序列互补;(b)通过利用每对中第一多核苷酸的第一5'末端和第二多核苷酸的3'端上的一或多个互补位点特异性核酸酶识别序列进行剪接和重叠延伸聚合酶链反应(SOE-PCR)将来自第一池的每对第一多核苷酸和第二多核苷酸组装成单个核酸片段,其中每对的单个核酸片段包括由一或多个位点特异性核酸酶识别序列从第一多核苷酸的第一5'末端和第二多核苷酸的3'端分离的第一多核苷酸和第二多核苷酸,并且其中每对的单个核酸片段中的第一多核苷酸的相对的第二3'末端和第二多核苷酸的5'端位于单个核酸片段的相对末端上,远离一或多个位点特异性核酸酶识别序列;(c)将每对的单个核酸片段与含有插入多核苷酸的第二池组合,其中第二池中的每个插入多核苷酸包括在其5'端的与单个核酸片段中存在的第一多核苷酸的相对3'末端之一的相对末端互补的第一组装重叠序列和在其相对的3'端的与单个核酸片段中存在的第二多核苷酸的相对的5'末端中的另一个互补的第二组装重叠序列;(d)将第一池和第二池组装成环化的产物的第三池,其中该组装经由体外或体内重叠组装方法进行,并且其中第三池中的每种环化的产物包括来自第二池的插入序列和来自第一池的一对第一多核苷酸和第二多核苷酸;(e)经由添加一或多种位点特异性核酸酶使第三池中的每种环化的产物线性化,该位点特异性核酸酶识别位于第三池中的每种环化的产物中的第一多核苷酸序列与第二多核苷酸序列之间的一或多个位点特异性核酸酶识别序列;以及(f)通过体外或体内克隆方法将线性化的产物组装到克隆载体中。步骤(d)中的组装可以经由体外或体内重叠组装方法进行。在一些情况下,使用基于重叠的DNA组装方法进行步骤(d)的组装。基于重叠的DNA组装可以选自SOE-PCR和体外重叠组装方法(例如,使用
Figure BDA0003106371180000241
HiFi构建器的HiFi组装)。在一些情况下,每对中的单个核酸片段中的第一多核苷酸的3'端和第二多核苷酸的5'端包括一组附加的一或多个位点特异性核酸酶识别序列,并且第二池中的每个插入多核苷酸中的第一组装重叠序列和第二组装重叠序列包括一或多个位点特异性核酸酶识别序列。在一些情况下,步骤(d)中的组装需要用每对中的单个核酸片段中的第一多核苷酸的3'端和第二多核苷酸的5'端上的附加的一或多个位点特异性核酸酶识别序列以及来自第二池的每个插入多核苷酸中的第一组装序列和第二组装序列中存在的一或多个位点特异性核酸酶识别序列的一或多种位点特异性核酸酶消化每对中的单个核酸片段中的第一多核苷酸的3'端和第二多核苷酸的5'端上存在的附加的一或多个位点特异性核酸酶识别序列和来自第二池的每个插入多核苷酸中的第一组装序列和第二组装序列中存在的一或多个位点特异性核酸酶识别序列,以在第一多核苷酸的3'端上生成单链突出物(其包括与来自第二池的插入多核苷酸的第一组装序列的5'端上的单链突出物上存在的序列互补的序列)和在第二多核苷酸的5'端上生成单链突出物(其包括与来自第二池的相同插入多核苷酸的第二组装序列的3'端上的单链突出物上存在的序列互补的序列);以及连接单链突出物上存在的互补序列。在一些情况下,步骤(d)的组装经由体外克隆方法进行,其中将第一池和第二池的混合物加热以使存在于第一池和第二池中的多核苷酸部分或完全变性,然后在进行体外克隆方法之前以低速冷却至室温。步骤(f)中的组装可以经由体外克隆方法或体内克隆方法进行。在一些情况下,步骤(f)的克隆载体包括一或多个位点特异性核酸酶识别序列。在一些情况下,步骤(f)中的组装需要用克隆载体中存在的一或多个位点特异性核酸酶识别序列的一或多种位点特异性核酸酶消化克隆载体中的一或多个位点特异性核酸酶识别序列,其中消化在克隆载体的相对端生成单链突出物,其中克隆载体的相对端的一个上的单链突出物包括与步骤(e)中生成的线性化的产物的末端互补的序列,并且克隆载体的相对端的另一个上的单链突出物包括与步骤(e)中生成的线性化的产物的相对端互补的序列;以及连接克隆载体的单链突出物上存在的互补序列和来自步骤(e)的线性化的产物。用于本文提供的任何方法或组合物中的位点特异性核酸酶可以选自限制性核酸内切酶、IIs型核酸内切酶、归巢核酸内切酶、RNA导向的核酸酶、DNA导向的核酸酶、锌指核酸酶、TALEN和切口酶或其任意组合。
在一个实施例中,本文提供的方法和组合物中的第一多核苷酸和第二多核苷酸包括与宿主细胞中的靶基因组基因座互补或对应的序列。与第一多核苷酸和第二多核苷酸中存在的靶基因组基因座互补或对应的序列可以位于所述第一多核苷酸和所述第二多核苷酸的与所述第一多核苷酸和所述第二多核苷酸的末端相对的末端上,其包括与插入多核苷酸上存在的组装重叠序列互补的序列。当包括与宿主细胞中的靶基因组基因座互补或对应的序列时,第一多核苷酸和第二多核苷酸可以被称为同源性臂。特别地,每个第一多核苷酸可以被称为左同源性臂,而每个第二多核苷酸可以被称为右同源性臂。当包括与宿主细胞中的靶基因组基因座互补或对应的序列时,通过使用本文提供的组合物和方法组装成对的第一多核苷酸和第二多核苷酸和插入多核苷酸而生成核酸构建体的文库可以随后用于修饰宿主细胞的基因组的基因组编辑技术。宿主细胞可以是原核细胞或真核宿主细胞。
多核苷酸对
如本文所述,本文提供的组合物和方法可以包括或利用第一多核苷酸和第二多核苷酸,使得每个第一多核苷酸与第二多核苷酸配对。可以使用本领域已知的用于合成核酸的任何方法来化学合成(例如,阵列合成或柱合成)第一多核苷酸和第二多核苷酸。第一多核苷酸和第二多核苷酸可以经由延伸反应(例如PCR)从现有的DNA(诸如例如基因组DNA)扩增。
第一多核苷酸和第二多核苷酸中的每一种可以包括功能性序列和非功能性序列或其组合。功能性序列可以指代表基因或其部分或结构域或调节元件或其部分的序列。如本文进一步所述,基因或其部分可以编码作为代谢或生物化学途径的一部分的蛋白质。此外,如本文进一步所述,调节元件可以是启动子、终止子、溶解度标签、降解标签或降解决定子。非功能性序列可以指不代表基因或其部分或调节元件或其部分的序列。非功能性序列可以是有助于或用于所述第一多核苷酸和所述第二多核苷酸与如本文提供的插入多核苷酸组装的序列。在一个实施例中,第一多核苷酸和第二多核苷酸中的每一种包括功能性序列和非功能性序列的混合物。在另一个实施例中,第一多核苷酸和第二多核苷酸中的每一种包括功能性序列或非功能序列中的一个或另一个。在其中第一多核苷酸和第二多核苷酸仅包括功能性序列的实施例中,功能性序列或功能性序列的一部分可以用于所述第一多核苷酸和所述第二多核苷酸与如本文提供的插入多核苷酸的组装。
第一多核苷酸和/或第二多核苷酸各自可以在长度上变化,并且在一些情况下长度可以是至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、200、300、400、500、600、700、800、900、950或1000个核苷酸碱基和/或长度可以大于1kb或2kb。可替代地,第一多核苷酸和/或第二多核苷酸的长度可以是2kb或更大,或1kb或更大或大于900个碱基、800个碱基、700个碱基、600个碱基、500个碱基、400个碱基、300个碱基、200个碱基或100个碱基。第一多核苷酸和/或第二多核苷酸的长度可以在100个核苷酸至2kb的范围内,例如高达100、高达150、高达200、高达250、高达300、高达350、高达400、高达450、高达500、高达550、高达600、高达650、高达700、高达750或高达800、高达850、高达900、高达950、高达1000、高达1500或高达2000个核苷酸。第一多核苷酸和/或第二多核苷酸的最小长度可以由经验确定的优选的Tm来定义。
如本文所述,第一多核苷酸序列和第二多核苷酸序列中的每一个可以包括有助于所述第一多核苷酸和所述第二多核苷酸与插入多核苷酸的组装的序列。为了帮助所述组装,所述序列可以与插入多核苷酸上存在的组装重叠序列互补。与插入多核苷酸上存在的组装重叠序列互补的序列也可以被称为组装重叠序列。在一个实施例中,组装重叠序列代表整个第一多核苷酸和/或第二多核苷酸。在另一个实施例中,组装重叠序列仅代表第一多核苷酸和/或第二多核苷酸的一部分,并且第一多核苷酸和/或第二多核苷酸进一步包括除了组装重叠序列之外的附加序列。在一个实施例中,如本文提供的一对第一多核苷酸和第二多核苷酸中的第一多核苷酸包括在其远端或3'端的与存在于插入多核苷酸的5'端或近端的第一组装重叠序列互补的组装重叠序列,而所述一对中的第二多核苷酸包括在其近端或5'端的与存在于所述插入多核苷酸的3'端或远端的第二组装重叠序列互补的重叠组装重叠序列。除了该实施例之外,第一多核苷酸和第二多核苷酸可以各自包括除了组装重叠序列之外的附加序列。第一多核苷酸和/或第二多核苷酸的附加序列可以使所述第一多核苷酸和/或第二多核苷酸适应具体的应用。具体的应用可以是利用本领域中已知的核酸文库的任何应用,特别是那些将受益于混合的确定性组装的应用。示例性用途可以包含但不限于基因组编辑和途径组装。
存在于第一多核苷酸和/或第二多核苷酸上的组装重叠序列可以在长度上变化,并且在一些情况下,长度可以是至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30个核苷酸和/或长度可以是至多100个核苷酸(例如,长度高达50、高达30、高达25、高达20或高达15个核苷酸)。组装重叠序列的长度可以在15个核苷酸至100个核苷酸的范围内,例如高达20个、高达25个、高达30个、高达35个、高达40个、高达45个、高达50个、高达55个、高达60个、高达65个、高达70个、高达75个、高达80个核苷酸、高达85个核苷酸、高达90个核苷酸、高达95个核苷酸或高达100个核苷酸。组装重叠序列的长度可以与插入多核苷酸上存在的组装重叠序列的长度相同。组装重叠序列的最小长可以由经验确定的优选的Tm来定义。在一个实施例中,第一多核苷酸和/或第二多核苷酸上的组装重叠序列包括与插入多核苷酸的末端互补的1或多个核苷酸。在另一个实施例中,第一多核苷酸和/或第二多核苷酸上的组装重叠序列包括与插入多核苷酸的末端互补的约25个核苷酸。
如图1所示,每对第一多核苷酸和第二多核苷酸可以进一步包括具有克隆载体的载体重叠序列,使得第一多核苷酸(即,图1中的第一DNA片段)可以包括在其5'端的克隆载体的载体重叠序列,而第二多核苷酸(即,图1中的第二DNA片段)可以包括在其3'端的克隆载体的载体重叠序列。在实施例中,其中一对中的第一多核苷酸和第二多核苷酸中的每一个进一步包含如本文提供的第一DNA片段和第二DNA片段,所述第一DNA片段和所述第二DNA片段可以位于第一多核苷酸中克隆载体的载体重叠序列的下游和附近,以及第二多核苷酸中克隆载体的载体重叠序列的上游和附近。
载体重叠序列的长度可以变化,并且在一些情况下,长度可以是至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30个核苷酸和/或长度可以是高达100个核苷酸(例如,长度高达50个、高达30个、高达25个、高达20个或高达15个核苷酸)。可替代地,载体重叠序列可以是2kb或更小,或1kb或更小或小于900个碱基、800个碱基、700个碱基、600个碱基、500个碱基、400个碱基、300个碱基、200个碱基或100个碱基。载体重叠序列长度可以在15个核苷酸至80个核苷酸的范围内,例如高达20个、高达25个、高达30个、高达35个、高达40个、高达45个、高达50个、高达55个、高达60个、高达65个、高达70个、高达75个或高达80个核苷酸。载体重叠序列的最小长度可以由经验确定的优选的Tm来定义。
在一个实施例中,通过从更大的一组此类序列中选择成对的第一多核苷酸序列和第二多核苷酸序列来生成含有成对的第一多核苷酸和第二多核苷酸的池,使得除了如本文所提供的所述池的成对的多核苷酸和插入多核苷酸或其池,或所述池和克隆载体之间的设计的重叠组装序列之外,没有来自所述池的多核苷酸与来自所述池的超过指定的阈值的任何其他多核苷酸共享共同序列。指定的阈值至少是1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个连续核苷酸。指定的阈值最多为1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个连续核苷酸。指定的阈值为0至2、1至3、2至4、3至5、4至6、5至7、6至8、7至9、8至10、9至11、10至12、11至13、12至14、13至15、14至16、15至17、16至18、17至19、18至20或19至21个连续核苷酸。指定的阈值为0至5、0至10、0至15、0至20、5至10、5至15、5至20、10至15或10至20个连续核苷酸。在一个实施例中,指定的阈值是12个连续的核苷酸。超过指定的阈值的共享的共同序列的确定可以使用计算机程序来完成,该计算机程序使用BLAST分析或简单的子串搜索来确定组分是否与其他组分共享序列。如果发现共享的序列超出指定的阈值,则不会将组分一起放入池中。
在一个实施例中,如本文所述的插入多核苷酸与所需的一对第一多核苷酸和第二多核苷酸的配对可以通过使用如图2所示的“由内而外的组装”方法预组装所需的一对第一多核苷酸和第二多核苷酸来促进。在该方法中,可以通过PCR来扩增第一多核苷酸和第二多核苷酸,使得第一多核苷酸的载体近端各自含有一或多个独特的位点特异性核酸酶位点或识别序列。位点特异性核酸酶识别序列可以是选自限制性核酸内切酶、IIs型核酸内切酶、归巢核酸内切酶、RNA导向的核酸酶、DNA导向的核酸酶、锌指核酸酶、TALEN和切口酶及其任意组合的位点特异性核酸酶。在一个实施例中,第一多核苷酸的载体近端各自含有单一独特的核酸酶位点或识别序列。在一个实施例中,独特的核酸酶识别序列是独特的限制性核酸内切酶位点,使得所述限制性核酸内切酶位点不存在于本文提供的组合物中存在的任何多核苷酸中。在一个实施例中,独特的核酸酶位点是归巢核酸内切酶序列,诸如例如对I-SceI或I-CeuI特异的归巢核酸内切酶序列。将单对第一多核苷酸和第二多核苷酸组合,并进行剪接和重叠延伸聚合酶链反应(SOE-PCR),以在添加的独特核酸酶位点(例如,在载体近端)组装两个多核苷酸,使与插入多核苷酸连接的末端游离。可替代地,可以使用本领域中已知的多种DNA合成方法中的任一种来直接合成包括连接的第一多核苷酸和第二多核苷酸的整个序列。使用本领域中已知和/或本文提供的体外或体内重叠组装方法,诸如例如酵母(例如酿酒酵母)或基于大肠杆菌同源重组的组装、Gibson组装或
Figure BDA0003106371180000281
HiFi构建体,将连接的第一多核苷酸和第二多核苷酸与插入多核苷酸组装。第一多核苷酸和第二多核苷酸与插入多核苷酸的环化的产物可以通过添加对独特的核酸酶序列特异的核酸酶(例如,对特异性归巢核酸内切酶序列特异的归巢核酸内切酶)而线性化,导致插入多核苷酸被第一多核苷酸和第二多核苷酸侧翼包围,然后可以使用Gibson组装或其他类似方法将第一多核苷酸和第二多核苷酸组装到载体中。
插入多核苷酸/有效负载序列
在一个实施例中,用于本文提供的组合物、试剂盒或方法中的插入多核苷酸包括:(1)所述插入多核苷酸的5'端或近端上的第一组装重叠序列,和(2)所述插入多核苷酸的相对的3'端或远端上的第二组装重叠序列。除了该实施例之外,第一组装重叠序列可以包括与来自一对第一多核苷酸和第二多核苷酸的第一多核苷酸的3'端或远端处的序列(例如组装重叠序列)互补的序列,而第二组装重叠序列可以包括与来自该对第一多核苷酸和第二多核苷酸的第二多核苷酸的5'端或近端处的序列(例如组装重叠序列)互补的序列。
本文提供的插入多核苷酸上的第一组装重叠序列和第二组装重叠序列的长度可以包括1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、35、40、45、50个或更多个核苷酸,和/或长度可以为高达100个核苷酸(例如,长度高达50个、高达30个、高达25个、高达20个或高达15个核苷酸),它们分别与如本文提供的一对多核苷酸中的第一多核苷酸的3'端和第二多核苷酸的5'端互补。组装重叠序列的长度可以在15个核苷酸至100个核苷酸的范围内,例如高达20个、高达25个、高达30个、高达35个、高达40个、高达45个、高达50个、高达55个、高达60个、高达65个、高达70个、高达75个、高达80个核苷酸、高达85个核苷酸、高达90个核苷酸、高达95个核苷酸或高达100个核苷酸。在一个实施例中,本文提供的插入多核苷酸上的第一组装重叠序列和第二组装重叠序列包括分别与本文提供的一对多核苷酸中的第一多核苷酸的3'端和第二多核苷酸的5'端互补的1或多个核苷酸。在另一个实施例中,本文提供的插入多核苷酸上的第一组装重叠序列和第二组装重叠序列包括分别与本文提供的一对多核苷酸中的第一多核苷酸的3'端和第二多核苷酸的5'端互补的约25个核苷酸。
在另一个实施例中,插入多核苷酸进一步包括一或多个有效负载序列,使得所述一或多个有效负载序列位于第一组装重叠序列与第二组装重叠序列之间。有效负载序列可以是随机序列。有效负载序列可以是标记序列。标记序列可以是本领域中已知的任何标记序列。有效负载序列可以是基因或其一部分。该基因或其部分可以是代谢或生物化学途径的一部分。该基因或其部分可以编码蛋白质或其结构域。有效负载序列可以选自启动子、基因、调节序列、编码降解决定子的核酸序列、编码溶解度标签的核酸序列、编码降解标签的核酸序列、终止子、条形码、调节序列或其部分。在一些情况下,在用于本文提供的组装方法之前,插入多核苷酸的三个组分(即,第一组装重叠序列、第二组装重叠序列和有效负载序列)被合成或以其他方式组合成连续的DNA片段。在一个实施例中,第一组装重叠和第二组装重叠不是随机的,而是被设计成与第一多核苷酸和第二多核苷酸的特定对匹配。
在其中成对的第一多核苷酸和第二多核苷酸包括如本文所述的靶向序列的实施例中,存在于插入多核苷酸内的有效负载序列可以导致相对于由成对的第一多核苷酸和第二多核苷酸上的靶向序列靶向的原始基因座的插入,相对于由成对的第一多核苷酸和第二多核苷酸上的靶向序列靶向的原始基因座的序列的缺失,或一个序列被另一个序列替换。在插入或修饰的情况下,“有效负载”可以是预期的最终序列。在缺失的情况下,“有效负载”可以是标记序列,或者可以不是序列。
在一个实施例中,插入多核苷酸以混合的方式使用。除了该实施例之外,插入多核苷酸的池中的每个插入多核苷酸可以包括第一组装重叠序列和第二组装重叠序列,该第一组装重叠序列包括与来自一对第一多核苷酸和第二多核苷酸的第一多核苷酸的3'端或远端处的序列(例如组装重叠序列)互补的序列,该第二组装重叠序列包括与来自该对第一多核苷酸和第二多核苷酸的第二多核苷酸的5'端或近端处的序列(例如组装重叠序列)互补的序列。
插入多核苷酸的池可以含有任何数目的独特的插入多核苷酸序列。插入多核苷酸的数目可以是至少、至多或约1、5、10、25、50、75、100、125、150、175、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000、1100、1200、1300、1400、1500、1600、1700、1800、1900、2000、3000、4000、5000、6000、7000、8000、9000、10,000、20,000、30,000、40,000、50,000、75,000、100,000、150,000、200,000或250,000个具有或不具有有效负载序列的独特的插入多核苷酸。
有效负载序列的长度可以是至多或至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、150、200、250、300、350、400、450、500、600、700、800、900、1000、2000、3000、4000、5000、6000、7000、8000、9000或10,000个核苷酸。在一些情况下,有效负载序列的长度可以是0个核苷酸。有效负载序列的长度可以使得当被并入插入多核苷酸时,整个插入多核苷酸可以被化学合成。合成可以是如本领域中已知的基于阵列或基于柱的合成方法。在一个实施例中,有效负载序列的长度使得其可以与第一组装重叠和第二组装重叠一起直接被包含或合成在插入寡核苷酸中。可以被合成的插入多核苷酸的长度可以高达约1、5、10、20、30、40、50、60、70、80、90、100、110、120、130、140、150、160、170、180、190、200、210、220、250、300、350、400个或更多个核苷酸。
在另一个实施例中,可以使用图3中描述的方法在单个池中生成插入多核苷酸。如图3所示,有效负载序列(例如,图3中的启动子序列)可以经由PCR从三个组分生成:混合的正向引物、共同的反向引物和有效负载模板序列(例如,图3中的启动子)。有效负载序列模板可以是合成的DNA片段、PCR产物或其他单链或双链DNA片段。正向引物的池可以使用本领域中已知的基于阵列或基于柱的合成方法来合成。池中的每个正向引物可以包括(从5'到3'):1)与有效负载模板序列的远端或3'端互补的序列,2)包括与来自一对第一多核苷酸和第二多核苷酸的第二多核苷酸互补的序列的第二组装重叠序列,3)用于一或多种位点特异性核酸酶的一或多个识别序列(例如,归巢核酸内切酶位点或识别序列),4)包括与来自一对第一多核苷酸和第二多核苷酸的第一多核苷酸互补的序列的第一组装重叠序列,和5)结合至有效负载模板序列的近端或5'端的启动序列。共同的反向引物可以结合至有效负载模板序列的远端或3'端或结合至有效负载序列下游的其他序列。可以使用混合的正向引物和共同的反向引物对有效负载模板序列(例如,图3中的启动子)进行PCR。在扩增后,可以使用本领域中已知的重叠组装方法,诸如例如Gibson组装、
Figure BDA0003106371180000311
HIFI组装或类似方法,将PCR产物环化以生成环状排列的有效负载(插入物),并且然后使用识别一或多个位点特异性核酸酶识别序列的一或多种位点特异性核酸酶(例如,归巢核酸内切酶,图3中的I-SceI)将其线性化。核酸酶消化可以产生适合用作插入多核苷酸的片段(例如,图1中描述的“有效负载”部分),其中大的有效负载侧接第一组装重叠序列和第二组装重叠序列(例如,图3中启动子序列侧翼的同源性臂或区域)。如图3所示,在有效负载序列的末端可以是小的部分核酸酶识别序列(例如,图3中的I-SceI),其可以通过所使用的重叠组装方法(例如,Gibson组装试剂、
Figure BDA0003106371180000312
HIFI组装试剂或等效混合物的3'和5'核酸外切酶活性)切除。可以任选地在环化之后和在线性化之前对产物进行扩增(例如,RCA)。
在一个实施例中,每个插入多核苷酸包括有效负载序列,使得插入多核苷酸的池中的每个插入多核苷酸包括与所述池中的每个其他插入多核苷酸中的有效负载序列不同的有效负载序列。
在另一个实施例中,每个插入多核苷酸包括有效负载序列,使得插入多核苷酸的池中的每个插入多核苷酸包括与所述池中的每个其他插入多核苷酸中的有效负载序列相同的有效负载序列。
克隆方法
如本文所述,可以将包括成对的第一多核苷酸和第二多核苷酸以及插入多核苷酸的组合物组装到包括第一多核苷酸和第二多核苷酸且其间具有插入多核苷酸的核酸的文库中。如本文提供的成对的第一多核苷酸和第二多核苷酸与插入多核苷酸的组装可以通过体外或体内克隆方法进行。对于大DNA分子的组装,组装的最后步骤可以在体内(诸如,在酵母宿主细胞中)进行。体外和体内组装步骤的使用之间的平衡可以通过该方法在待组装的核酸分子的性质方面的实用性来确定。
在一个实施例中,使用体外克隆方法进行成对的第一核苷酸和第二多核苷酸与插入多核苷酸的组装。体外克隆方法可以是采用本领域中已知的重叠组装的任何体外克隆方法。在本文提供的方法中使用的体外克隆方法可以选自输注克隆
Figure BDA0003106371180000321
GoldenGate组装、网关组装、Gibson组装和
Figure BDA0003106371180000322
HIFI组装或本领域中已知的任何其他合适的体外克隆方法。输注克隆可能需要将如本文提供的成对的第一多核苷酸和第二多核苷酸的第一池和如本文描述的插入多核苷酸的第二池与输注克隆试剂混合,并且然后将所得的组装体转化到大肠杆菌克隆宿主细胞中。体外克隆方法可以是在US 8,968,999(其通过引用以其整体并入本文)中描述的任何重叠组装方法。体外克隆方法可以是在US20160060671(其通过引用以其整体并入本文)中描述的任何重叠组装方法。体外克隆方法可以是在浦野淳(Jun Urano)博士和克里斯汀·陈(Christine Chen)博士,Gibson
Figure BDA0003106371180000323
“引物-桥末端连接(PBnJ)克隆(Gibson
Figure BDA0003106371180000324
Primer-Bridge End Joining(PBnJ)Cloning)”,合成基因组学应用说明(Synthetic Genomics Application Note)(其通过引用以其整体并入本文)中描述的Gibson组装方法。在一个实施例中,包括成对的第一多核苷酸和第二多核苷酸、插入多核苷酸和克隆载体的组合物使用5'-3'核酸外切酶和也存在于组合物中的链置换聚合酶连接。该组合物还可以包括含有钾盐诸如氯化钾的缓冲液,其浓度范围为7mM至150mM,例如20mM至50mM。除钾盐外,还可以使用在10mM至100mM的范围内诸如20mM的钠盐(例如,氯化钠)。在一些实施例中,组合物不含有拥挤剂,诸如聚乙二醇(PEG)、聚蔗糖或葡聚糖。在一些实施例中,组合物包括单链(ss)结合蛋白质。用于组合物中的ss DNA结合蛋白质可以是大肠杆菌recA、T7基因2.5产物、RedB(来自噬菌体λ)或RecT(来自Rac前噬菌体)、ET SSB(极端热稳定的单链DNA结合蛋白质),或者本领域中已知的任何其他ss DNA结合蛋白质可以用于组合物中。与在不存在ss结合蛋白质的情况下将以其他方式发生的相比,包含ss结合蛋白质可以提高组装的效率,特别是对于具有较长的重叠序列(例如,至少20个核苷酸)的核酸片段,如通过菌落数所测量的。在一些实施方案中,组合物不含有非链置换聚合酶。
在另一个实施例中,使用缺乏3'核酸外切酶活性的分离的非热稳定的5'至3'核酸外切酶、拥挤剂、具有3'核酸外切酶活性的非链置换DNA聚合酶、或所述DNA聚合酶与缺乏3'核酸外切酶活性的第二DNA聚合酶的混合物和连接酶,将包括成对的第一多核苷酸和第二多核苷酸、插入多核苷酸和克隆载体的组合物连接。在有效地连接多核苷酸和克隆载体的条件下,该组合物可以进一步包括dNTP和合适的缓冲液的混合物。在一些实施例中,组合物可以进一步包括拥挤剂。拥挤剂可以选自聚乙二醇(PEG)、葡聚糖或聚蔗糖。在一个实施例中,拥挤剂是PEG。PEG可以以约3%至约7%(重量/体积)的浓度使用。PEG可以选自PEG-200、PEG-4000、PEG-6000、PEG-8000或PEG-20,000。在一些实施例中,核酸外切酶是T5核酸外切酶,并且接触是在等温条件下进行的,并且/或者拥挤剂是PEG,并且/或者非链置换的DNA聚合酶是
Figure BDA0003106371180000331
DNA聚合酶或
Figure BDA0003106371180000332
DNA聚合酶,和/或Taq连接酶。
在一个实施例中,使用体内克隆方法进行成对的第一多核苷酸和第二多核苷酸与插入多核苷酸的组装。体内克隆方法可以是本领域中已知的任何体内克隆方法。体内克隆方法可以是同源重组介导的克隆方法。在本文提供的方法中使用的体内克隆方法可以选自大肠杆菌(RecA依赖性的、RecA非依赖性的或Red/ET依赖性的)同源重组、重叠延伸PCR和重组(OEPR)克隆、酵母同源重组以及芽孢杆菌中的转化相关的重组(TAR)克隆和基因组装,如在津下健治(Tsuge,Kenji)等人的枯草芽孢杆菌质粒中具有设计的顺序和取向的多个DNA片段的一步组装(One step assembly of multiple DNAfragments with a designedorder and orientation in Bacillus subtilis plasmid)核酸研究(Nucleic acidsresearch)中,第31,21卷(2003):e133(其通过引用并入本文)中描述的。
应用
本文提供的组合物和组装方法可以用于构建任何所需的组装体,诸如质粒、载体、基因、代谢途径、最小基因组、部分基因组、基因组、染色体、染色体外核酸,例如细胞质细胞器,诸如线粒体(动物)和叶绿体和质体(植物)中的细胞器等。
本文提供的组合物和组装方法可以用于生成核酸分子的文库,以及使用如由其生成的经修饰的全部或部分核酸分子的方法。文库可以含有2个或更多个变体,并且所述多个变体可以针对具有期望的特性的成员进行筛选,该期望的特性诸如期望的感兴趣产品的高生产水平、感兴趣产品的增强的功能性或降低的功能性(如果这是有利的)。此类筛选可以通过高通量方法进行,该高通量方法可以是如本文提供的机器人/自动化方法。
本公开还进一步包含通过本文提供的组合物和组装方法制备的产品,例如,所得的组装的合成基因或基因组(合成的或天然存在的)和修饰的优化的基因和基因组,及其用途。
本文提供的组合物和组装方法可以具有多种应用,允许例如设计用于合成感兴趣的所需产物的途径或者优化其基因产物在所需产物的合成或表达中起作用的一或多个序列。本文提供的组合物和组装方法还可以用于生成基因或其表达的优化的序列,或组合由基因编码的蛋白质的一或多个功能结构域或基序。该基因可以是生物化学或代谢途径的一部分。生物化学或代谢途径可以产生感兴趣的所需产物。
感兴趣的所需产物可以是任何可以在细胞培养物、真核或原核表达系统或转基因动物或植物中组装的分子。因此,由本文提供的确定性组装方法产生的核酸分子或其文库可以用于多种环境中以产生感兴趣的所需产物。在一些情况下,感兴趣的产物可以是小分子、酶、肽、氨基酸、有机酸、合成化合物、燃料、醇等。例如,感兴趣的产物或生物分子可以是任何初级或次级细胞外代谢物。初级代谢物尤其可以是乙醇、柠檬酸、乳酸、谷氨酸、谷氨酸盐、赖氨酸、苏氨酸、色氨酸和其他氨基酸、维生素、多糖等。次级代谢物尤其可以是抗生素化合物如青霉素,或免疫抑制剂如环孢菌素A,植物激素如赤霉素,他汀类药物如洛伐他汀,杀真菌剂如灰黄霉素等。感兴趣的产物或生物分子也可以是由宿主细胞产生的任何细胞内组分,诸如:微生物酶,包含:过氧化氢酶、淀粉酶、蛋白酶、果胶酶、葡萄糖异构酶、纤维素酶、半纤维素酶、脂肪酶、乳糖酶、链激酶和许多其他酶。细胞内组合还可以包含重组蛋白质,诸如:胰岛素、乙肝疫苗、扰动素、粒细胞集落刺激因子、链激酶等。感兴趣的产物也可以指感兴趣的蛋白质。
途径组装
在一个实施例中,本文提供的组合物和方法用于组装基因或其变体。该基因或其变体可以编码作为代谢或生物化学途径的一部分的蛋白质。变体可以是所述基因的密码子优化版本或突变版本。代谢或生物化学途径可以产生如本文提供的感兴趣的产物。在一个实施例中,基因序列或其变体可以作为有效负载序列存在于如本文提供的插入多核苷酸中。成对的第一多核苷酸和第二多核苷酸可以包括这样的序列,使得当与所述插入多核苷酸组装时,所述序列可以使用如本文提供的基因编辑方法来促进靶向并插入宿主细胞内的遗传元件(例如,基因组、质粒等)中的基因座。基因座可以是特定基因座或随机基因座。可替代地,成对的第一多核苷酸和第二多核苷酸可以包括这样的序列,当与所述插入多核苷酸组装时,所述序列可以用于促进所得的组装体与使用本文提供的方法生成的其他组装体的进一步组装。其他组装体可以包括存在于相同代谢或生物化学途径中的一或多个另外的基因,并且以这种方式促进所述代谢或生物化学途径的组装。所有的基因或其变体可以使用本文所述的重叠序列的技术在特定代谢或生物化学途径的单一载体上组装,或者所述途径的每个成员的独立载体可以通过在连续转化混合物中混合每个成员的载体来使用。第一多核苷酸和第二多核苷酸与插入多核苷酸的组装可以使用本文提供的组装重叠方法经由存在于每一多核苷酸中的组装重叠序列来完成。成对的第一多核苷酸和第二多核苷酸可以进一步包括如本文提供的载体重叠序列,以促进组装到合适的载体中。载体可以是复制的质粒。在一些情况下,第一多核苷酸和/或第二多核苷酸可以进一步包括调节元件或控制元件的序列,该调节元件或控制元件可以控制基因或其变体或由此编码的蛋白质的方面,诸如其转录、翻译、溶解度或降解。调节元件或控制元件可以是启动子、终止子、溶解度标签、降解标签或降解决定子。
在另一个实施例中,该基因序列或其变体跨过一对第一多核苷酸和第二多核苷酸和位于其间的插入多核苷酸分布,或跨过第一多核苷酸或第二多核苷酸和位于其间的插入多核苷酸分布。通过在每种多核苷酸上合适的组装重叠片段,含有所有多核苷酸的混合物可以使用如本文提供的重叠组装在单个反应混合物中以正确的顺序组装。所得到的将是该基因或其变体的全长编码序列。成对的第一多核苷酸和第二多核苷酸可以进一步包括这样的序列,使得当与所述插入多核苷酸组装时,该序列可以使用如本文提供的基因编辑方法来促进靶向并插入宿主细胞内的遗传元件(例如,基因组、质粒等)中的基因座。基因座可以是特定基因座或随机基因座。可替代地,成对的第一多核苷酸和第二多核苷酸可以进一步包括这样的序列,当与所述插入多核苷酸组装时,该序列可以用于促进所得的组装与使用本文提供的方法生成的其他组装体的进一步组装。其他组装体可以包括存在于相同代谢或生物化学途径中的一或多个另外的基因,并且以这种方式促进所述代谢或生物化学途径的组装。所有的基因或其变体可以使用本文所述的重叠序列的技术在特定代谢或生物化学途径的单一载体上组装,或者所述途径的每个成员的独立载体可以通过在连续转化混合物中混合每个成员的载体来使用。成对的第一多核苷酸和第二多核苷酸可以进一步包括如本文提供的载体重叠序列,以促进组装到合适的载体中。载体可以是复制的质粒。在一些情况下,第一多核苷酸和/或第二多核苷酸可以进一步包括调节元件或控制元件的序列,该调节元件或控制元件可以控制基因或其变体或由此编码的蛋白质的方面,诸如其转录、翻译、溶解度或降解。调节元件或控制元件可以是启动子、终止子、溶解度标签、降解标签或降解决定子。
在又另一个实施例中,本文提供的组合物和方法用于组装或组合编码靶蛋白质的基序或结构域的核酸序列。编码靶蛋白质的特定基序或结构域的核酸序列可以跨过一对第一多核苷酸和第二多核苷酸和位于其间的插入多核苷酸分布,或跨过第一多核苷酸或第二多核苷酸和位于其间的插入多核苷酸分布。编码靶蛋白质的特定基序或结构域的核酸序列可以存在于第一多核苷酸上,而靶蛋白质的第二基序或结构域可以存在于第二多核苷酸上,并且插入多核苷酸可以用于使用存在于每一多核苷酸上的组装重叠序列和如本文提供的重叠组装方法连接靶蛋白质的所述第一和第二基序或结构域。在一些情况下,插入多核苷酸可以包括第一和/或第二基序或结构域的一部分。在一些情况下,插入多核苷酸可以包括靶蛋白质的第三基序或结构域。成对的第一多核苷酸和第二多核苷酸可以进一步包括这样的序列,使得当与所述插入多核苷酸组装时,该序列可以使用如本文提供的基因编辑方法来促进靶向并插入宿主细胞内的遗传元件(例如,基因组、质粒等)中的基因座。基因座可以是特定基因座或随机基因座。成对的第一多核苷酸和第二多核苷酸可以进一步包括如本文提供的载体重叠序列,以促进组装到合适的载体中。载体可以是复制的质粒。
基因编辑
如本文所述,可以将包括成对的第一多核苷酸和第二多核苷酸以及插入多核苷酸的组合物组装到包括第一多核苷酸和第二多核苷酸且其间具有插入多核苷酸的核酸的文库中,该核酸的文库随后可以用于修饰宿主细胞的遗传内容物。如本文所提供的,核酸的文库可以包括控制元件(例如,启动子、终止子、溶解度标签、降解标签或降解决定子)、修饰形式的基因(例如,具有所需SNP的基因)、反义核酸和/或作为代谢或生物化学途径的一部分的一或多种基因。在一个实施例中,修饰需要宿主细胞的基因编辑。基因编辑可以需要编辑宿主细胞的基因组和/或存在于宿主细胞中的分离的遗传元件,诸如例如质粒或粘粒。可以利用使用如本文提供的方法和组合物生成的核酸组装体的基因编辑方法可以是本领域中已知的任何基因编辑方法或系统,并且可以基于希望进行基因编辑的宿主进行选择。基因编辑的非限制性示例包含同源重组、CRISPR、TALENS、FOK或其他核酸内切酶。
同源重组
在一个实施例中,基因编辑方法是本领域中已知的基于同源重组的方法。基于同源重组的方法可以选自单交换同源重组、双交换同源重组或λred重组工程。除了该实施例外,一对第一多核苷酸和第二多核苷酸中的第一多核苷酸和第二多核苷酸使得各自包括指向或互补于宿主细胞的核酸元件(例如,基因组、质粒或粘粒)中的所需基因座的序列,并且由此将位于其间的插入多核苷酸指向宿主细胞的遗传元件(例如,基因组、粘粒或质粒)中的所需基因座。因此,指向或互补于该对中存在的所需基因座的序列可以用于确定将被靶向编辑的基因组、粘粒或质粒中的位置。如图1中举例说明的,指向或互补于所需基因座的序列可以位于或朝向第一多核苷酸的近端或5'端,而在第二多核苷酸中,指向或互补于所需基因座的序列可以位于或接近远端或3'端。在第一多核苷酸中,指向或互补于所需基因座的序列可以位于第一多核苷酸中存在的组装重叠序列的上游和载体重叠序列的下游(如果存在的话)。在第二多核苷酸中,指向或互补于所需基因座的序列可以位于第二多核苷酸中存在的组装重叠序列的下游和载体重叠序列的上游(如果存在的话)。
在一个实施例中,对于含有成对的第一多核苷酸和第二多核苷酸的池中的每对,与一对中的所需基因座互补的序列与所述池中的彼此对相比与宿主细胞中的不同靶基因座互补。
在另一个实施例中,对于含有成对的第一多核苷酸和第二多核苷酸的池中的每对,与一对中的所需基因座互补的序列与所述池中的彼此对相比与宿主细胞中的相同靶基因座互补。
环入/环出(Loop-in/Loop-out)
在一些实施例中,本公开教导了从宿主生物体中环出DNA的所选区域的方法。环出方法可以如在中岛(Nakashima)等人.2014“通过基因组编辑和基因沉默的细菌细胞工程改造(Bacterial Cellular Engineering by Genome Editing and Gene Silencing).”国际分子科学杂志(Int.J.Mol.Sci.)15(2),2773-2793中所描述的。环出缺失技术在本领域中是已知的,并在(蒂尔(Tear)等人.2014“切除不稳定的人工基因特异性反向重复序列介导大肠杆菌的无瘢痕基因缺失(Excision of Unstable Artificial Gene-Specificinverted Repeats Mediates Scar-Free Gene Deletions in Escherichia coli.)”应用生物化学与生物技术(Appl.Biochem.Biotech.)175:1858-1867)中描述。在本文提供的方法中使用的环出方法可以使用单交换同源重组或双交换同源重组进行。在一个实施例中,环出所选区域可能需要使用单交换同源重组。
在一个实施例中,本文提供的组合物包括成对的第一多核苷酸和第二多核苷酸(例如,左/右同源性臂)、插入多核苷酸和载体,使得使用如本文提供的体外或体内组装方法将成对的第一多核苷酸和第二多核苷酸与插入多核苷酸和载体组装生成环出载体。在一个实施例中,在环出载体与宿主细胞基因组之间使用单交换同源重组以环入所述载体。载体可以包括标记物,该标记物有助于在环入步骤后选择环出的克隆。在另一个实施例中,在环出的载体与宿主细胞基因组之间使用双交换同源重组以便整合所述载体。环出的载体内的插入序列可以用这样的序列来设计,该序列是现有的或引入的邻近宿主序列的同向重复,使得该同向重复位于预定进行循环和缺失的DNA区域的侧面。插入序列可以进一步包括有助于选择环出克隆的标记物。一旦插入,含有环出质粒或载体的细胞可以被反向选择以缺失选择区域。
在本文提供的一个方面中,使用本文提供的组合物和/或方法生成的多核苷酸或多核苷酸文库可以用于可能需要使用来自一或多个重组系统的蛋白质的集合的基因编辑方法。所述重组系统对于微生物宿主细胞可以是内源的或者可以被异源引入。一或多个异源重组系统的蛋白质的集合可以作为核酸(例如,作为质粒、线性DNA或RNA、或整合子)被引入,并被整合到宿主细胞的基因组中或从染色体外元件被稳定表达。一或多个异源重组系统的蛋白质的集合可以作为RNA被引入并被宿主细胞翻译。一或多个异源重组系统的蛋白质的集合可以作为蛋白质被引入到宿主细胞中。一或多个重组系统的蛋白质的集合可以来自λRed重组系统、RecET重组系统、Red/ET重组系统、来自λRed重组系统、RecET重组系统或Red/ET重组系统的蛋白质的任何同源物、直系同源物或旁系同源物或其任何组合。来自RecET重组系统的重组方法和/或蛋白质的集合可以是如在张·Y(Zhang Y.),布赫霍尔茨·F(Buchholz F.),穆尔·J.P.P.(Muyrers J.P.P.)和斯蒂沃特·A.F.(Stewart A.F.)“利用大肠杆菌中的重组进行DNA工程改造的新逻辑(A new logic for DNA engineeringusing recombination in E.coli.)”自然遗传学(Nature Genetics)20(1998)123-128;穆尔·J.P.P.,张·Y.,泰斯塔·G(Testa,G.),斯蒂沃特·A.F.“通过ET重组快速修饰细菌人工染色体(Rapid modification of bacterial artificial chromosomes by ET-recombination)”核酸研究27(1999)1555-1557;张·Y.,穆尔·J.P.P.,泰斯塔·G和斯蒂沃特·A.F.“在大肠杆菌中通过同源重组进行DNA克隆(DNA cloning by homologousrecombination in E.coli.)”自然生物技术18(2000)1314-1317和穆尔·JP等人,“技术:重组工程——用于克隆和操作DNA的新选择(Techniques:Recombinogenic engineering--new options for cloning and manipulating DNA)”趋势生物化学科学(Trends BiochemSci.)2001年5月;26(5):325-31(其通过引用并入本文)中描述的那些中的任何一种。来自Red/ET重组系统的蛋白质的集合可以是如在里韦罗·穆勒·阿道夫(Rivero-Müller,Adolfo)等人“通过Red/ET重组的辅助大片段插入(ALFIRE)——用于大片段重组工程的替代和增强的方法(Assisted large fragment insertion by Red/ET-recombination(ALFIRE)--an alternative and enhanced method for large fragmentrecombineering)”,核酸研究,第35卷,10(2007):e78(其通过引用并入本文)中描述的任何蛋白质。
λRED介导的基因编辑
如本文所提供的,如本文所述的基因编辑可以使用λRed介导的同源重组进行,如达岑科(Datsenko)和万纳(Wanner),美国国家科学院院刊97:6640-6645(2000)(其内容通过引用以其整体并入本文)所述。
为了使用λred重组工程系统修饰靶DNA,可以将线性供体DNA底物(dsDNA或ssDNA)电穿孔到表达来自λred重组系统的蛋白质的集合的大肠杆菌中。来自λred重组系统的蛋白质的集合可以包括exo蛋白质、β蛋白质或gam蛋白质或其任意组合。Gam可以防止内源性RecBCD和SbcCD核酸酶两者消化被引入到微生物宿主细胞中的线性供体DNA(dsDNA或ssDNA),而exo是一种5'→3'dsDNA依赖性核酸外切酶,其可以从5'端开始降解线性dsDNA并生成2种可能的产物(即具有单链3'突出物的部分dsDNA双链体或其整个互补链被降解的ssDNA),并且β可以保护由Exo产生的ssDNA并促进其退火至细胞中的互补ssDNA靶。如在https://blog.addgene.org/lambda-red-a-homologous-recombination-based-technique-for-genetic-engineering(其内容通过引用并入本文)所述,对于基于λred的与ssDNA寡底物的重组可能需要β表达。
线性供体DNA底物(dsDNA或ssDNA)可以是使用本文提供的方法和组合物生成的包括一对第一多核苷酸和第二多核苷酸以及位于其间的插入多核苷酸的组装体。该对第一多核苷酸和第二多核苷酸可以包括基因组靶向序列,其将所述供体DNA底物靶向到宿主细胞的基因组中的特定基因座。然后,这些酶催化底物与靶DNA序列的同源重组。与其中遗传变化在试管中发生的限制性酶克隆相比,这意味着克隆在体内发生。供体DNA底物仅需要与用于重组的靶位点有约50个核苷酸的同源性。如在https://blog.addgene.org/lambda-red-a-homologous-recombination-based-technique-for-genetic-engineering所描述的,是否使用线性dsDNA底物或ssDNA底物可以取决于实验的目标。dsDNA底物对于大于大约20个核苷酸的插入或缺失可能是最佳的,而ssDNA底物对于仅几个碱基对的点突变或改变可能是最佳的。
可以使用本文提供的组合物和方法来制备dsDNA底物,使得成对的第一多核苷酸和第二多核苷酸包括与相对末端上的靶向的插入位点约50个碱基对的同源性。底物中存在的dsDNA插入多核苷酸可以包含:大的插入或缺失,包含可选择的DNA片段,诸如抗生素抗性基因,以及非选择性的DNA片段,诸如基因替换和标签。
还可以使用本文提供的组合物和方法来制备ssDNA底物,使得成对的第一多核苷酸和第二多核苷酸包括与相对末端上的靶向的插入位点约50个碱基对的同源性,并且可以具有位于序列的中心(即插入多核苷酸内)的所需改变。
ssDNA底物可以比dsDNA更有效,其中重组频率在0.1%至1%之间,并且可以通过设计避免或甲基导向的错配修复(MMR)系统的底物而使该ssDNA底物增加至高达25-50%。MMR的工作是纠正在DNA复制期间出现的DNA错配。可以通过以下来避免MMR的活化:1)使用具有被敲除的关键MMR蛋白质的细菌的菌株,或2)特殊设计的ssDNA底物以避免MMR:1)具有失活的MMR的大肠杆菌:使用具有失活的MMR的大肠杆菌肯定是两种选择中较容易的一种,但这些细胞易于突变,并且其基因组可能具有更多非预期的变化。2)设计避免MMR活化的ssDNA底物:在一个实施例中,引入了编辑位点的6个碱基对处或6个碱基对之内的C/C错配。在另一个实施例中,所需改变的两侧是摆动密码子中的4-5个沉默改变,即改变相邻的4-5个密码子的第三个碱基对,这改变了核苷酸序列,但不改变翻译的蛋白质的氨基酸序列。这些变化可以是所需变化的5'或3'。
在一个实施例中,使用本文提供的组合物和/或方法生成的多核苷酸或多核苷酸文库可以用于基因编辑方法,该方法在已经稳定地表达λred重组基因的微生物宿主细胞中实施,诸如在https://blog.addgene.org/lambda-red-a-homologous-recombination-based-technique-for-genetic-engineering(其内容通过引用并入本文)描述的DY380菌株。包括λred重组系统的组分并且可以用于生成使用本文提供的富集方法进行基因分型的生物体的其他细菌菌株(例如,CS-seq或SG-seq)可以在托马森(Thomason)等人(重组工程:使用同源重组的细菌中的基因工程(Recombineering:Genetic Engineering in BacteriaUsing Homologous Recombination),分子生物学实验室指南,106:V:1.16:1.16.1–1.16.39)和莎兰(Sharan)等人(重组工程:一种基于同源重组的基因工程方法(Recombineering:A Homologous Recombination-Based Method of GeneticEngineering).自然协议(Nature protocols).2009;4(2):206-223)(其每一个的内容通过引用并入本文)中找到。
如本文所提供的,可以在实施本领域中已知的和/或本文提供的任何编辑方法之前将λred重组系统的蛋白质的集合引入到微生物宿主细胞中。λred重组系统的每种蛋白质的基因可以被引入到核酸(例如,作为质粒、线性DNA或RNA、mini-λ、λred前噬菌体或整合子)上,并且被整合到宿主细胞的基因组中或从染色体外元件表达。在一些情况下,λred重组系统的每种组分(即,exo、β、gam或其组合)都可以作为RNA被引入并被宿主细胞翻译。在一些情况下,λred重组系统的每种组分(即,exo、β、gam或其组合)可以作为蛋白质被引入到宿主细胞中。
在一个实施例中,用于λred重组系统的蛋白质的集合的基因被引入到质粒上。质粒上λred重组系统的蛋白质的集合可以在启动子(诸如例如,内源性噬菌体pL启动子)的控制下。在一个实施例中,质粒上λred重组系统的蛋白质的集合在诱导型启动子的控制下。诱导型启动子可以通过添加或耗尽试剂或通过改变温度来诱导。在一个实施例中,质粒上λred重组系统的蛋白质的集合在诱导型启动子诸如IPTG诱导型lac启动子或阿拉伯糖诱导型pBAD启动子的控制下。表达用于λred重组系统的蛋白质的集合的基因的质粒也可以表达与特定启动子相关联的阻遏物,诸如例如,分别与IPTG诱导型lac启动子、阿拉伯糖诱导型pBAD启动子和内源性噬菌体pL启动子相关联的lacI、araC或cI857阻遏物。
在一个实施例中,用于λred重组系统的蛋白质的集合的基因被引入到mini-λ上,该mini-λ是噬菌体DNA的有缺陷的非复制的圆形片段,当被引入到微生物宿主细胞中时,其被整合到基因组中,如在https://blog.addgene.org/lambda-red-a-homologous-recombination-based-technique-for-genetic-engineering(其内容通过引用并入本文)所述。
在一个实施例中,用于λred重组系统的蛋白质的集合的基因被引入到λred前噬菌体上,这可以允许λred重组系统稳定整合到微生物宿主细胞中,诸如在https://blog.addgene.org/lambda-red-a-homologous-recombination-based-technique-for-genetic-engineering(其内容通过引用并入本文)所述。
CRISPR介导的基因编辑
在本文提供的一个方面中,宿主细胞的遗传元件(例如,基因组、粘粒或质粒)可以通过CRISPR修饰。
CRISPR/Cas系统是一种原核免疫系统,其赋予对外源遗传元件(诸如在质粒和噬菌体中存在的遗传元件)的抗性,并提供一种获得性免疫形式。CRISPR代表成簇的规律间隔的短回文重复序列(Clustered Regularly Interspaced Short Palindromic Repeat),并且cas代表CRISPR相关联系统,并且指与CRISPR复合物相关联的小cas基因。
CRISPR-Cas系统被最广泛地表征为1类系统或2类系统。这两个系统之间的主要区别特征是Cas-效应子模块的性质。1类系统需要在复合物(被称为“级联复合物”)中组装多种Cas蛋白质来介导扰动,而2类系统使用大的单一Cas酶来介导扰动。根据特定Cas蛋白质的存在,将1类系统和2类系统各自进一步分为多种CRISPR-Cas类型。例如,1类系统被分为以下三种类型:I型系统,其含有Cas3蛋白质;III型系统,其含有Cas10蛋白质;和推定的IV型系统,其含有Csf1蛋白质(一种Cas8样蛋白质)。2类系统通常不如1类系统常见,并且被进一步分为以下三种类型:II型系统,其含有Cas9蛋白质;V型系统,其含有Cas12a蛋白质(以前被称为Cpf1,并且本文中被称为Cpf1)、Cas12b(以前被称为C2c1)、Cas12c(以前被称为C2c3)、Cas12d(以前被称为CasY)和Cas12e(以前被称为CasX);和VI型系统,其含有Cas13a(以前被称为C2c2)、Cas13b和Cas13c。毕佐查(Pyzocha)等人,ACS化学生物学(ACSChemical Biology),第13(2)卷,第347-356页。在一个实施例中,在本文提供的方法中使用的CRISPR-Cas系统是2类系统。在一个实施例中,在本文提供的方法中使用的CRISPR-Cas系统是II型系统、V型系统或VI型2类系统。在一个实施例中,在本文提供的方法中使用的CRISPR-Cas系统选自Cas9、Cas12a、Cas12b、Cas12c、Cas12d、Cas12e、Cas13a、Cas13b、Cas13c或其同源物、直系同源物或旁系同源物。
在本文公开的方法中使用的CRISPR系统包括Cas效应子模块,该Cas效应子模块包括一或多种核酸导向的CRISPR相关联(Cas)核酸酶,在本文中被称为Cas效应子蛋白质。在一些实施例中,Cas蛋白质可以包括一或多个核酸酶结构域。Cas效应子蛋白质可以靶向单链或双链核酸分子(例如,DNA或RNA核酸),并且可以生成双链或单链断裂。在一些实施例中,Cas效应子蛋白质是野生型或天然存在的Cas蛋白质。在一些实施例中,Cas效应子蛋白质是突变体Cas蛋白质,其中在WT或天然存在的Cas蛋白质(例如,亲本Cas蛋白质)中进行一或多个突变、插入或缺失,以产生与亲本Cas蛋白质相比具有一或多个改变的特性的Cas蛋白质。
在一些情况下,Cas蛋白质是野生型(WT)核酸酶。在本公开中使用的合适的Cas蛋白质的非限制性示例包含C2cl、C2c2、C2c3、Cas1、Cas1B、Cas2、Cas3、Cas4、Cas5、Cas6、Cas7、Cas8、Cas9(也被称为Csn1和Csx12)、Cas10、Cpfl、Csy1、Csy2、Csy3、Cse1、Cse2、Csc1、Csc2、Csa5、Csn2、Csm1、Csm2、Csm3、Csm4、Csm5、Csm6、Cmr1、Cmr3、Cmr4、Cmr5、Cmr6、Csb1、Csb2、Csb3、Csx17、Csx14、Csx100、Csx16、CsaX、Csx3、Csxl、Csx15、Csf1、Csf2、Csf3、Csf4、MAD1-20、SmCsm1、其同源物、其直系同源物、其变体、其突变体或其修饰形式。合适的核酸导向的核酸酶(例如Cas 9)可以来自源自以下属的生物体,该属包含但不限于:硫微螺菌属(Thiomicrospira)、琥珀酸弧菌属(Succinivibrio)、暂定属(Candidatus)、卟啉单胞菌属(Porphyromonas)、酸单球菌(Acidomonococcus)、普氏菌属(Prevotella)、史密斯氏菌属(Smithella)、莫拉氏菌属(Moraxella)、互养菌属(Synergistes)、弗朗西斯氏菌属(Francisella)、钩端螺旋体属(Leptospira)、链型杆菌属(Catenibacterium)、坎德勒氏菌属(Kandleria)、梭菌属(Clostridium)、多尔氏菌属(Dorea)、粪球菌属(Coprococcus)、肠球菌属(Enterococcus)、嗜果糖乳酸菌属(Fructobacillus)、魏斯氏菌属(Weissella)、片球菌属(Pediococcus)、棒杆菌属(Corynebacter)、萨特氏菌属(Sutterella)、军团菌属(Legionella)、密螺旋体属(Treponema)、罗斯氏菌属(Roseburia)、产线菌属(Filifactor)、真杆菌属(Eubacterium)、链球菌属(Streptococcus)、乳酸杆菌属(Lactobacillus)、支原体属、拟杆菌属(Bacteroides)、弗维菌属(Flaviivola)、黄杆菌属(Flavobacterium)、单丝壳属(Sphaerochaeta)、固氮螺菌属(Azospirillum)、葡糖醋杆菌属(Gluconacetobacter)、奈瑟氏菌属(Neisseria)、罗斯氏菌属(Roseburia)、细小棒菌属(Parvibaculum)、葡萄球菌属(Staphylococcus)、硝酸盐破坏菌(Nitratifractor)、支原体属、脂环酸芽孢杆菌属(Alicyclobacillus)、短芽孢杆菌属(Brevibacilus)、芽孢杆菌属(Bacillus)、拟杆菌门(Bacteroidetes)、短芽孢杆菌属、肉杆菌属(Carnobacterium)、Clostridiaridium、梭菌属、脱硫弯曲杆菌(Desulfonatronum)、脱硫弧菌属(Desulfovibrio)、创伤球菌属(Helcococcus)、纤毛菌属(Leptotrichia)、李斯特菌属(Listeria)、Methanomethyophilus、甲基杆菌属(Methylobacterium)、丰祐菌科(Opitutaceae)、沼泽杆菌属(Paludibacter)、红杆菌属(Rhodobacter)、Sphaerochaeta、肿块芽孢杆菌属(Tuberibacillus)和弯曲菌属(Campylobacter)。此类属的生物体的物种可以是如本文中以其他方式所讨论的。
合适的核酸导向的核酸酶(例如,Cas9)可以来自源自以下门的生物体,该门包含但不限于厚壁菌门(Firmicute)、放线菌门(Actinobacteria)、拟杆菌门(Bacteroidetes)、变形菌门(Proteobacteria)、螺旋体门(Spirochates)和软壁菌门(Tenericutes)。合适的核酸导向的核酸酶可以来自源自以下纲的生物体,该纲包含但不限于丹毒丝菌纲(Erysipelotrichia)、梭菌纲(Clostridia)、芽孢杆菌纲(Bacilli)、放线菌纲(Actinobacteria)、拟杆菌纲(Bacteroidetes)、黄杆菌纲(Flavobacteria)、α变形杆菌纲(Alphaproteobacteria)、β变形杆菌纲(Betaproteobacteria)、γ变形杆菌纲(Gammaproteobacteria)、δ变形杆菌纲(Deltaproteobacteria)、ε变形杆菌纲(Epsilonproteobacteria)、螺旋体纲(Spirochaetes)和柔膜菌纲(Mollicutes)。合适的核酸导向的核酸酶可以来自源自以下目的生物体,该目包含但不限于梭菌目(Clostridiales)、乳杆菌目(Lactobacillales)、放线菌目(Actinomycetales)、拟杆菌目(Bacteroidales)、黄杆菌目(Flavobacteriales)、根瘤菌目(Rhizobiales)、红螺菌目(Rhodospirillales)、伯克氏菌目(Burkholderiales)、奈瑟菌目(Neisseriales)、军团菌目(Legionellales)、鹦鹉螺菌目(Nautiliales)、弯曲菌目(Campylobacterales)、螺旋体目(Spirochaetales)、支原体目(Mycoplasmatales)和硫发菌目(Thiotrichales)。合适的核酸导向的核酸酶可以来自源自以下科的生物体,该科包含但不限于毛螺菌科(Lachnospiraceae)、肠球菌科(Enterococcaceae)、明串珠菌科(Leuconostocaceae)、乳杆菌科(Lactobacillaceae)、链球菌科(Streptococcaceae)、消化链球菌科(Peptostreptococcaceae)、葡萄球菌科(Staphylococcaceae)、真杆菌科(Eubacteriaceae)、棒杆菌科(Corynebacterineae)、拟杆菌科(Bacteroidaceae)、黄杆菌属(Flavobacterium)、Cryomoorphaceae、红菌科(Rhodobiaceae)、红螺菌科(Rhodospirillaceae)、醋杆菌科(Acetobacteraceae)、梭菌科(Sutterellaceae)、奈瑟氏菌科(Neisseriaceae)、军团菌科(Legionellaceae)、鹦鹉螺菌科(Nautiliaceae)、弯曲菌科(Campylobacteraceae)、螺旋体科(Spirochaetaceae)、支原体科(Mycoplasmataceae)和弗朗西斯氏菌科(Francisellaceae)。
适用于本公开的方法、系统和组合物的其他核酸导向的核酸酶(例如,Cas9)包含源自以下生物体的核酸导向的核酸酶,该生物体诸如但不限于:硫微螺菌的种XS5(Thiomicrospira sp.XS5)、直肠真杆菌(Eubacterium rectale)、溶糊精琥珀酸弧菌(Succinivibrio dextrinosolvens)、候选白蚁甲烷枝原体(Candidatus Methanoplasmatermitum)、Candidatus Methanomethylophilus alvus、狗口腔卟啉单胞菌(Porphyromonas crevioricanis)、嗜鳃黄杆菌(Flavobacterium branchiophilum)、酸单球菌种(Acidomonococcus sp.)、毛螺菌科细菌COE1(Lachnospiraceae bacterium COE1)、短普雷沃氏菌(Prevotella brevis)ATCC 19188、史密斯氏菌属的种SCADC、牛眼莫拉氏菌(Moraxella bovoculi)、琼斯氏共生菌(Synergistes jonesii)、拟杆菌口腔分类群(Bacteroidetes oral taxon)274、土拉热弗朗西斯氏菌(Francisella tularensis)、稻田氏钩端螺旋体莱姆血清变型(Leptospira inadai serovar Lyme str.)10、酸单球菌种的晶体结构(5B43)、变异链球菌(S.mutans)、无乳链球菌(S.agalactiae)、类马链球菌(S.equisimilis)、血链球菌(S.sanguinis)、肺炎链球菌(S.pneumonia);空肠弯曲杆菌(C.jejuni)、大肠弯曲杆菌(C.coli)、盐水硝酸盐破坏菌(N.salsuginis)、弧后硝酸盐破坏菌(N.tergarcus);耳葡萄球菌(S.auricularis)、肉葡萄球菌(S.carnosus);脑膜炎奈瑟氏菌(N.meningitides)、淋病奈瑟氏菌(N.gonorrhoeae);单核细胞增多性李斯特菌(L.monocytogenes)、伊氏李斯特菌(L.ivanovii);肉毒梭菌(C.botulinum)、艰难梭菌(C.difficile)、破伤风梭菌(C.tetani)、索氏梭菌(C.sordellii);土拉热弗朗西斯氏菌1、易北普雷沃氏菌(Prevotella albensis)、毛螺旋菌科细菌(Lachnospiraceae bacterium)MC2017 1、瘤胃产氢丁酸弧菌(Butyrivibrio proteoclasticus)、异域菌门细菌(Peregrinibacteria bacterium)GW2011_GWA2_33_10、俭菌总门细菌(Parcubacteriabacterium)GW2011_GWC2_44_17、史密斯氏菌属的种SCADC、小基因组菌总门(Microgenomates)、氨基酸球菌属的种(Acidaminococcus sp.)BV3L6、毛螺旋菌科细菌(Lachnospiraceae bacterium)MA2020、候选白蚁甲烷枝原体、挑剔真杆菌(Eubacteriumeligens)、牛眼莫拉氏菌237、稻田钩端螺旋体(Leptospira inadai)、毛螺旋菌科细菌(Lachnospiraceae bacterium)ND2006、狗口腔卟啉单胞菌3、解糖胨普雷沃氏菌(Prevotella disiens)、猕猴卟啉单胞菌(Porphyromonas macacae)、链型杆菌属(Catenibacterium sp.)CAG:290、犊坎德勒氏菌(Kandleria vitulina)、梭菌目细菌(Clostridiales bacterium)KA00274、毛螺菌科细菌(Lachnospiraceae bacterium)3-2、长链多尔氏菌(Dorea longicatena)、灵巧粪球菌(Coprococcus catus)GD/7、哥伦比亚肠球菌(Enterococcus columbae)DSM 7374、果聚糖芽孢杆菌属的种(Fructobacillus sp.)EFB-N1、耐盐魏斯氏菌(Weissella halotolerans)、乳酸片球菌(Pediococcusacidilactici)、弯曲乳杆菌(Lactobacillus curvatus)、化脓性链球菌(Streptococcuspyogenes)、费斯莫尔德乳杆菌(Lactobacillus versmoldensis)和龈沟产线菌(Filifactor alocis)ATCC 35896。参见,美国专利号8,697,359;8,771,945;8,795,965;8,865,406;8,871,445;8,889,356;8,895,308;8,906,616;8,932,814;8,945,839;8,993,233;8,999,641;9,822,372;9,840,713;美国专利申请号13/842,859(US 2014/0068797A1);9,260,723;9,023,649;9,834,791;9,637,739;美国专利申请号14/683,443(US 2015/0240261 A1);美国专利申请号14/743,764(US 2015/0291961 A1);9,790,490;9,688,972;9,580,701;9,745,562;9,816,081;9,677,090;9,738,687;美国申请号15/632,222(US2017/0369879 A1);美国专利申请号15/631,989;美国专利申请号15/632,001和美国专利号9,896,696,其每一个通过引用并入本文。
在一些实施例中,Cas效应子蛋白质包含一或多种以下活性:
切口酶活性,即切割核酸分子的单链的能力;
双链核酸酶活性,即切割双链核酸的两条链并产生双链断裂的能力;
核酸内切酶活性;
核酸外切酶活性;和/或
解旋酶活性,即解开双链核酸的螺旋结构的能力。
在本公开的方面中,术语“导向核酸”是指这样的多核苷酸,其包括1)能够与靶序列杂交的导向序列(在本文中被称为“靶向片段”)和2)能够与如本文所述的核酸导向的核酸酶相互作用(单独或与tracrRNA分子组合)的支架序列(在本文中被称为“支架片段”)。导向核酸可以是DNA。导向核酸可以是RNA。导向核酸可以包括DNA和RNA两者。导向核酸可以包括修饰的非天然存在的核苷酸。在其中导向核酸包括RNA的情况下,RNA导向核酸可以由多核苷酸分子(诸如使用本文提供的方法和组合物生成的质粒、线性构建体)上的DNA序列编码。
在一些实施例中,本文所述的导向核酸是RNA导向核酸(“导向RNA”或“gRNA”),并且包括靶向片段和支架片段。在一些实施例中,gRNA的支架片段被包括在一个RNA分子中,并且靶向片段被包括在另一个单独的RNA分子中。此类实施例在本文中被称为“双分子gRNA”或“两分子gRNA”或“双gRNA”。在一些实施例中,gRNA是单个RNA分子,并且在本文中被称为“单导向RNA”或“sgRNA”。术语“导向RNA”或“gRNA”包括在内,指两分子导向RNA和sgRNA两者。
在一个实施例中,使用本文提供的方法和组合物生成的包括一对第一多核苷酸和第二多核苷酸以及位于其间的插入多核苷酸的组合物是导向RNA(gRNA)。在一些情况下,本文提供的方法用于生成gRNA的文库。
gRNA的DNA靶向片段包括与靶核酸序列中的序列互补的核苷酸序列。因此,gRNA的靶向片段经由杂交(即,碱基配对)以序列特异性的方式与靶核酸相互作用,并且靶向片段的核苷酸序列决定gRNA将结合的靶DNA内的位置。当使用合适的比对算法进行最佳比对时,导向序列与其相应的靶序列之间的互补程度为约50%、60%、75%、80%、85%、90%、95%、97.5%、99%或更多或者大于约50%、60%、75%、80%、85%、90%、95%、97.5%、99%或更多。可以使用任何合适的用于比对序列的算法来确定最佳比对。在一些实施例中,导向序列的长度为约5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、45、50、75或更多个核苷酸或者大于约5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、45、50、75或更多个核苷酸。在一些实施例中,导向序列的长度小于约75、50、45、40、35、30、25、20个核苷酸。在各个方面中,导向序列是10-30个核苷酸长。导向序列的长度可以是15-20个核苷酸。导向序列的长度可以是15个核苷酸。导向序列的长度可以是16个核苷酸。导向序列的长度可以是17个核苷酸。导向序列的长度可以是18个核苷酸。导向序列的长度可以是19个核苷酸。导向序列的长度可以是20个核苷酸。
使导向RNA的支架片段与一或多种Cas效应子蛋白质相互作用,以形成核糖核蛋白质复合物(在本文中被称为CRISPR-RNP或RNP复合物)。导向RNA经由上述靶向片段将结合的多肽导向靶核酸序列内的特定核苷酸序列。导向RNA的支架片段包括核苷酸的两个段,它们彼此互补并形成双链RNA双链体。支架序列内的足以促进可靶向核酸酶复合物的形成的序列可以包含沿支架序列内的两个序列区域(诸如参与形成二级结构的一或两个序列区域)的长度的互补程度。在一些情况下,一或两个序列区域被包括在同一多核苷酸上或被编码在同一多核苷酸上。在一些情况下,一或两个序列区域被包括在单独的多核苷酸上或被编码在单独的多核苷酸上。最佳比对可以通过任何合适的比对算法来确定,并且可以进一步考虑二级结构,诸如一或两个序列区域内的自互补。在一些实施例中,当最佳对比时,在一或两个序列区域之间沿两个序列区域中较短者的长度的互补程度为约25%、30%、40%、50%、60%、70%、80%、90%、95%、97.5%、99%或更高或者大于约25%、30%、40%、50%、60%、70%、80%、90%、95%、97.5%、99%或更高。在一些实施例中,两个序列区中的至少一个的长度为约5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、40、50或更多个核苷酸或者大于约5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、40、50或更多个核苷酸。
本主题的gRNA的支架序列可以包括二级结构。二级结构可以包括假结区域或茎环结构。在一些实例中,导向核酸和核酸导向的核酸酶的相容性至少部分地由导向RNA的二级结构区域内或二级结构区域附近的序列确定。在一些情况下,导向核酸与核酸导向的核酸酶的结合动力学部分由支架序列内的二级结构确定。在一些情况下,导向核酸与核酸导向的核酸酶的结合动力学部分地由具有支架序列的核酸序列确定。
可以通过扫描与天然Cas核酸酶基因座相邻的序列来找到用于gRNA-Cas效应子蛋白质组合的相容性支架序列。换句话说,天然Cas核酸酶可以被编码在基因组上相应的相容性导向核酸或支架序列的附近处。
核酸导向的核酸酶可以与在核酸酶的内源性宿主内没有发现的导向核酸相容。此类正交导向核酸可以通过经验测试来确定。正交导向核酸可以来自不同的细菌物种,或者可以是合成的或以其他方式被工程改造为非天然存在的。与常见的核酸导向的核酸酶相容的正交导向核酸可以包括一或多个共同特征。共同特征可以包含假结区域外的序列。共同特征可以包含假结区域。共同特征可以包含一级序列或二级结构。
通过改变导向序列使得导向序列与靶序列互补,从而允许导向序列与靶序列之间的杂交,可以将导向核酸工程改造以靶向所需的靶序列。具有工程改造的导向序列的导向核酸可以被称为工程改造的导向核酸。工程改造的导向核酸通常是非天然存在的,并且在自然界中未找到。
在一些实施例中,本公开提供了一种编码使用本文提供的组合物和方法生成的gRNA的多核苷酸。在一些实施例中,包括一对第一多核苷酸和第二多核苷酸以及插入多核苷酸的组合物进一步包括表达载体,使得该对第一多核苷酸和第二多核苷酸与插入多核苷酸和表达载体的组装生成包括编码gRNA的核酸的表达载体。
在另一个实施例中,使用本文提供的方法和组合物生成的包括一对第一多核苷酸和第二多核苷酸以及位于其间的插入多核苷酸的组装体是供体DNA序列。在一些情况下,本文提供的方法用于生成供体DNA序列的文库。在使用同源定向修复(HDR)的CRISPR基因编辑方法中,供体DNA序列可以与导向RNA(gRNA)结合使用。CRISPR复合物可以导致靶基因内的链断裂,其可以通过使用同源定向修复(HDR)进行修复。可以通过用使用本文提供的方法和组合物生成的供体DNA序列共转化宿主细胞来促进HDR介导的修复。供体DNA序列可以包括所需的遗传扰动(例如,缺失、插入和/或单核苷酸多态性)以及源自第一多核苷酸和第二多核苷酸的靶向序列。在本实施例中,CRISPR复合物切割由一或多个gRNA指定的靶基因。然后,供体DNA序列可以用作同源重组机制的模板,以将所需的遗传扰动并入宿主细胞中。供体DNA可以是单链的、双链的或双链质粒。供体DNA可能缺少PAM序列,或包括加扰的、改变或非功能性的PAM,以便防止再切割。在一些情况下,供体DNA可以含有功能性或未改变的PAM位点。供体DNA中的突变的或编辑的序列(也位于同源性区域的两侧)防止在突变已经被并入基因组之后被CRISPR-复合物再次切割。
宿主细胞
如本文所提供的,使用本文提供的组合物和/或方法生成的核酸构建体的文库可以用于编辑或修饰宿主细胞的遗传元件(例如,基因组、粘粒或质粒),或者经由将一或多种遗传元件(例如,质粒或粘粒)引入(例如,转化或转导)到所述宿主细胞来工程改造该宿主细胞。基因组工程改造或编辑方法可以适用于其中可以在遗传突变体的群体中鉴定出所需性状的任何生物体。生物体可以是微生物或高等真核生物。
因此,如本文中所使用的,术语“微生物”应被广义地理解。它包含但不限于两个原核域细菌和古细菌,以及某些真核真菌和原生生物。然而,在某些方面,“高等”真核生物诸如昆虫、植物和动物可以用于本文教导的方法中。
合适的宿主细胞包含但不限于:细菌细胞、藻类细胞、植物细胞、真菌细胞、昆虫细胞和哺乳动物细胞。在一个说明性的实施例中,合适的宿主细胞包含大肠杆菌(例如,可从马萨诸塞州伊普斯维奇的新英格兰BioLabs获得的SHuffleTM感受态大肠杆菌)。
本公开的其他合适的宿主生物体包含棒状杆菌(Corynebacterium)属的微生物。在一些实施例中,优选的棒状杆菌菌株/种包括:高效棒状杆菌(C.efficiens),其中保存型菌株为DSM44549;谷氨酸棒状杆菌(C.glutamicum),其中保存型菌株为ATCC13032;以及产氨棒状杆菌(C.ammoniagenes),其中保存型菌株为ATCC6871。在一些实施例中,本公开的优选的宿主是谷氨酸棒状杆菌。
棒状杆菌属的合适的宿主菌株,特别是谷氨酸棒状杆菌种的合适的宿主菌株特别是已知的野生型菌株:谷氨酸棒状杆菌ATCC13032、醋麸酸棒状杆菌(Corynebacteriumacetoglutamicum)ATCC15806、嗜乙酰乙酸棒状杆菌(Corynebacteriumacetoacidophilum)ATCC13870、栖糖蜜棒杆菌(Corynebacterium melassecola)ATCC17965、热产氨棒状杆菌(Corynebacterium thermoaminogenes)FERM BP-1539、黄色短杆菌(Brevibacterium flavum)ATCC14067、乳酸发酵短杆菌(Brevibacteriumlactofermentum)ATCC13869和双歧短杆菌(Brevibacterium divaricatum)ATCC14020;以及由其制备的产生L-氨基酸的突变体或菌株,诸如例如产生L-赖氨酸的菌株:谷氨酸棒状杆菌FERM-P 1709、黄色短杆菌FERM-P 1708、乳酸发酵短杆菌FERM-P 1712、谷氨酸棒状杆菌FERM-P 6463、谷氨酸棒状杆菌FERM-P 6464、谷氨酸棒状杆菌DM58-1、谷氨酸棒状杆菌DG52-5、谷氨酸棒状杆菌DSM5714和谷氨酸棒状杆菌DSM12866。
术语“谷氨酸微球菌(Micrococcus glutamicus)”也被用于谷氨酸棒状杆菌。在现有技术中,高效棒状杆菌物种的一些代表也已经被称为热产氨棒状杆菌,例如诸如菌株FERM BP-1539。
在一些实施例中,本公开的宿主细胞是真核细胞。合适的真核宿主细胞包含但不限于:真菌细胞、藻类细胞、昆虫细胞、动物细胞和植物细胞。合适的真菌宿主细胞包含但不限于:子囊菌门(Ascomycota)、担子菌门(Basidiomycota)、半知菌门(Deuteromycota)、接合菌门(Zygomycota)、不完全菌类(Fungi imperfecti)。某些优选的真菌宿主细胞包含酵母细胞和丝状真菌细胞。合适的丝状真菌宿主细胞包含例如真菌亚门和卵菌亚门的任何丝状形式。(参见,例如,霍克索斯(Hawksworth)等人,于恩索斯(Ainsworth)和毕丝巴(Bisby)的真菌词典,第8版,1995年,CAB国际,大学出版社,英国剑桥(In Ainsworth and Bisby'sDictionary of The Fungi,8th edition,1995,CAB International,University Press,Cambridge,UK),其通过引用并入本文)。丝状真菌的特征在于营养菌丝体,其细胞壁由几丁质、纤维素和其他复杂的多糖组成。丝状真菌宿主细胞在形态上不同于酵母。
在某些说明性的但非限制性的实施例中,丝状真菌宿主细胞可以是下述物种的细胞:绵霉属(Achlya)、支顶孢属(Acremonium)、曲霉属(Aspergillus)、短梗霉属(Aureobasidium)、烟管霉属(Bjerkandera)、拟蜡菌属(Ceriporiopsis)、头孢霉属(Cephalosporium)、金孢属(Chrysosporium)、旋孢腔菌属(Cochliobolus)、棒囊壳属(Corynascus)、隐丛赤壳属(Cryphonectria)、隐球菌属(Cryptococcus)、鬼伞属(Coprinus)、革盖菌属(Coriolus)、色二孢属(Diplodia)、恩多蒂斯属(Endothis)、镰刀菌属(Fusarium)、赤霉菌属(Gibberella)、粘帚霉属(Gliocladium)、腐质霉属(Humicola)、肉座菌属(Hypocrea)、毁丝霉属(Myceliophthora)(例如,嗜热毁丝霉(Myceliophthorathermophila))、毛霉菌属(Mucor)、脉孢菌属(Neurospora)、青霉菌属(Penicillium)、柄孢壳菌属(Podospora)、射脉菌属(Phlebia)、瘤胃壶菌属(Piromyces)、梨孢属(Pyricularia)、根毛霉属(Rhizomucor)、根霉属(Rhizopus)、裂褶菌属(Schizophyllum)、柱顶孢霉属(Scytalidium)、孢子丝菌属(Sporotrichum)、踝节菌属(Talaromyces)、热子囊菌属(Thermoascus)、梭孢壳属(Thielavia)、栓菌属(Tramates)、弯颈霉属(Tolypocladium)、木霉属(Trichoderma)、轮枝孢属(Verticillium)、草菇属(Volvariella),或其有性世代或无性世代,以及其同义词或分类等效物。
合适的酵母宿主细胞包含但不限于:假丝酵母属(Candida)、汉逊酵母属(Hansenula)、酵母属(Saccharomyces)、裂殖酵母属(Schizosaccharomyces)、毕赤酵母属(Pichia)、克鲁维酵母属(Kluyveromyces)和耶氏酵母属(Yarrowia)。在一些实施例中,该酵母细胞是多形汉逊酵母(Hansenula polymorpha)、酿酒酵母(Saccharomycescerevisiae)、卡尔斯伯酵母(Saccaromyces carlsbergensis)、糖化酵母(Saccharomycesdiastaticus)、诺地酵母(Saccharomyces norbensis)、克鲁维酵母(Saccharomyceskluyveri)、粟酒裂殖酵母(Schizosaccharomyces pombe)、巴斯德毕赤酵母(Pichiapastoris)、芬兰毕赤酵母(Pichia finlandica)、嗜海藻糖毕赤酵母(Pichiatrehalophila)、考达毕赤酵母(Pichia kodamae)、膜醭毕赤酵母(Pichiamembranaefaciens)、幸运毕赤酵母(Pichia opuntiae)、耐热毕赤酵母(Pichiathermotolerans)、萨利毕赤酵母(Pichia salictaria)、松栎毕赤酵母(Pichiaquercuum)、皮杰普氏毕赤酵母(Pichia pijperi)、树干毕赤酵母(Pichia stipitis)、嗜甲醇毕赤酵母(Pichia methanolica)、安格斯毕赤酵母(Pichia angusta)、乳酸克鲁维酵母(Kluyveromyces lactis)、白色念珠菌(Candida albicans)或解脂耶罗威亚酵母(Yarrowia lipolytica)。
在某些实施例中,宿主细胞是藻类细胞,诸如衣藻属(Chlamydomonas)(例如,莱茵衣藻(C.Reinhardtii))和席藻属(Phormidium)(席藻种ATCC29409)。
在其它实施例中,宿主细胞是原核细胞。合适的原核细胞包含革兰氏阳性、革兰氏阴性和革兰氏变异性细菌细胞。宿主细胞可以是(但不限于)以下物种:农杆菌属(Agrobacterium)、脂环酸芽孢杆菌属、鱼腥藻属(Anabaena)、倒囊藻属(Anacystis)、不动杆菌属(Acinetobacter)、酸热菌属(Acidothermus)、节杆菌属(Arthrobacter)、固氮菌属(Azobacter)、芽孢杆菌属(Bacillus)、双歧杆菌属(Bifidobacterium)、短杆菌属(Brevibacterium)、丁酸弧菌属(Butyrivibrio)、布赫纳氏菌属(Buchnera)、野油菜(Campestris)、弯曲杆菌属(Camplyobacter)、梭菌属(Clostridium)、棒状杆菌属(Corynebacterium)、红硫菌属(Chromatium)、粪球菌属(Coprococcus)、埃希氏杆菌属(Escherichia)、肠球菌属(Enterococcus)、肠杆菌属(Enterobacter)、欧文菌属(Erwinia)、梭杆菌属(Fusobacterium)、栖粪杆菌属(Faecalibacterium)、弗朗西斯氏菌属(Francisella)、黄杆菌属(Flavobacterium)、土芽孢杆菌属(Geobacillus)、嗜血杆菌属(Haemophilus)、螺旋杆菌属(Helicobacter)、克雷伯氏菌属(Klebsiella)、乳杆菌属(Lactobacillus)、乳球菌属(Lactococcus)、泥杆菌属(Ilyobacter)、微球菌属(Micrococcus)、微杆菌属(Microbacterium)、中间根瘤菌属(Mesorhizobium)、甲基杆菌属、甲基杆菌属、分枝杆菌属(Mycobacterium)、奈瑟菌属(Neisseria)、泛菌属(Pantoea)、假单胞菌属(Pseudomonas)、原绿球藻属(Prochlorococcus)、红细菌属(Rhodobacter)、红假单胞菌属(Rhodopseudomonas)、红假单胞菌属(Rhodopseudomonas)、罗斯氏菌属(Roseburia)、红螺菌属(Rhodospirillum)、红球菌属(Rhodococcus)、栅列藻属(Scenedesmus)、链霉菌属(Streptomyces)、链球菌属(Streptococcus)、聚球藻属(Synecoccus)、糖单孢菌属(Saccharomonospora)、葡萄球菌属(Staphylococcus)、沙雷氏菌属(Serratia)、沙门氏菌属(Salmonella)、志贺氏菌属(Shigella)、嗜热厌氧杆菌属(Thermoanaerobacterium)、养障体(Tropheryma)、土拉热菌属(Tularensis)、蒂梅丘拉(Temecula)、嗜热聚球藻属(Thermosynechococcus)、热球菌属(Thermococcus)、脲原体属(Ureaplasma)、黄单胞菌属(Xanthomonas)、木杆菌属(Xylella)、耶尔森氏菌属(Yersinia)和发酵单胞菌属(Zymomonas)。在一些实施例中,宿主细胞是谷氨酸棒状杆菌。
在一些实施例中,细菌宿主菌株是工业菌株。多种细菌工业菌株是已知的并且适用于本文所述的方法和组合物中。
在一些实施例中,细菌宿主细胞是农杆菌种(例如,放射形土壤杆菌(A.radiobacter)、发根农杆菌(A.rhizogenes)、悬钩子农杆菌(A.rubi))、节杆菌种(Arthrobacterspecies)(例如,金黄节杆菌(A.aurescens)、柠檬节杆菌(A.citreus)、球形节杆菌(A.globformis)、裂烃谷氨酸节杆菌(A.hydrocarboglutamicus)、迈索尔节杆菌(A.mysorens)、烟草节杆菌(A.nicotianae)、石蜡节杆菌(A.paraffineus)、畏光节杆菌(A.protophonniae)、玫瑰色石蜡节杆菌(A.roseoparaffinus)、硫磺色节杆菌(A.sulfureus)、产脲节杆菌(A.ureafaciens))、芽孢杆菌种(例如,苏云金芽孢杆菌(B.thuringiensis)、炭疽芽孢杆菌(B.anthracis)、巨大芽孢杆菌(B.megaterium)、枯草杆菌(B.subtilis)、迟缓芽胞杆菌(B.lentus)、环状芽孢杆菌(B.circulars)、短小芽孢杆菌(B.pumilus)、灿烂芽孢杆菌(B.lautus)、凝结芽孢杆菌(B.coagulans)、短小芽孢杆菌(B.brevis)、坚强芽胞杆菌(B.firmus)、嗜碱芽孢杆菌(B.alkaophius)、地衣芽孢杆菌(B.licheniformis)、克劳氏芽孢杆菌(B.clausii)、嗜热脂肪芽孢杆菌(B.stearothermophilus)、耐盐芽孢杆菌(B.halodurans)和解淀粉芽孢杆菌(B.amyloliquefaciens)。在特定实施例中,宿主细胞将是工业芽孢杆菌属菌株,包含但不限于枯草芽孢杆菌、短小芽孢杆菌、地衣芽孢杆菌、巨大芽孢杆菌、克劳氏芽孢杆菌、嗜热脂肪芽孢杆菌和解淀粉芽孢杆菌。在一些实施例中,宿主细胞将是工业梭菌属菌种(例如,丙酮丁醇梭菌(C.acetobutylicum)、破伤风梭菌E88(C.tetani E88)、象牙海岸梭菌(C.lituseburense)、糖丁酸梭菌(C.saccharobutylicum)、产气荚膜梭菌(C.perfringens)、拜氏梭菌(C.beijerinckii))。在一些实施例中,宿主细胞将是工业棒状杆菌属物种(例如,谷氨酸棒状杆菌、嗜乙酰乙酸棒状杆菌)。在一些实施例中,宿主细胞将是工业埃希氏杆菌属物种(例如,大肠杆菌)。在一些实施例中,宿主细胞将是工业欧文菌属物种(例如,噬夏孢欧文菌(E.uredovora)、胡萝卜软腐欧文菌(E.carotovora)、菠萝欧文氏菌(E.ananas)、草生欧文菌(E.herbicola)、点状欧文菌(E.punctata)、土生欧文菌(E.terreus))。在一些实施例中,宿主细胞是工业泛菌属物种(例如,柠檬泛菌(P.citrea)、成团泛菌(P.agglomerans))。在一些实施例中,宿主细胞将是工业假单胞菌属物种(例如,恶臭假单胞菌(P.putida)、铜绿假单胞菌(P.aeruginosa)、迈氏假单胞菌(P.mevalonii))。在一些实施例中,宿主细胞将是工业链球菌属物种(例如,类马链球菌、酿脓链球菌(S.pyogenes)、乳房链球菌(S.uberis))。在一些实施例中,宿主细胞将是工业链霉菌属物种(例如,产二素链霉菌(S.ambofaciens)、不产色链霉菌(S.achromogenes)、除虫链霉菌(S.avermitilis)、天蓝色链霉菌(S.coelicolor)、金霉素链霉菌(S.aureofaciens)、金色链霉菌(S.aureus)、杀真菌素链霉菌(S.fungicidicus)、灰色链霉菌(S.griseus)、变铅青链霉菌(S.lividans))。在一些实施例中,宿主细胞将是工业发酵单胞菌属物种(例如,运动发酵单胞菌(Z.mobilis)、解脂发酵单胞菌(Z.lipolytica))等。
在一些实施例中,宿主细胞将是工业埃希氏杆菌属物种(例如,大肠杆菌)。
大肠杆菌种的合适的宿主菌株包括:产肠毒素大肠杆菌(ETEC)、肠致病性大肠杆菌(EPEC)、肠侵袭性大肠杆菌(EIEC)、肠出血性大肠杆菌(EHEC)、尿致病性大肠杆菌(UPEC)、产生维罗毒素的大肠杆菌、大肠杆菌O157:H7、大肠杆菌O104:H4、大肠杆菌O121、大肠杆菌O104:H21、大肠杆菌K1和大肠杆菌NC101。在一些实施例中,本公开教导了大肠杆菌K12、大肠杆菌B和大肠杆菌C的基因组工程改造。
在一些实施例中,宿主细胞可以是大肠杆菌菌株NCTC 12757、NCTC 12779、NCTC12790、NCTC 12796、NCTC 12811、ATCC 11229、ATCC 25922、ATCC 8739、DSM 30083、BC5849、BC 8265、BC 8267、BC 8268、BC 8270、BC 8271、BC 8272、BC 8273、BC 8276、BC 8277、BC 8278、BC 8279、BC 8312、BC 8317、BC 8319、BC 8320、BC 8321、BC 8322、BC 8326、BC8327、BC 8331、BC 8335、BC 8338、BC 8341、BC 8344、BC 8345、BC 8346、BC 8347、BC 8348、BC 8863和BC 8864。
在一些实施例中,本公开教导了可以是产生维罗毒素的大肠杆菌(VTEC)的宿主细胞,诸如菌株BC 4734(O26:H11)、BC 4735(O157:H-)、BC 4736、BC 4737(n.d.)、BC 4738(O157:H7)、BC 4945(O26:H-)、BC 4946(O157:H7)、BC 4947(O111:H-)、BC 4948(O157:H)、BC 4949(O5)、BC 5579(O157:H7)、BC 5580(O157:H7)、BC 5582(O3:H)、BC 5643(O2:H5)、BC5644(O128)、BC 5645(O55:H-)、BC 5646(O69:H-)、BC 5647(O101:H9)、BC 5648(O103:H2)、BC 5850(O22:H8)、BC 5851(O55:H-)、BC 5852(O48:H21)、BC 5853(O26:H11)、BC 5854(O157:H7)、BC 5855(O157:H-)、BC 5856(O26:H-)、BC 5857(O103:H2)、BC 5858(O26:H11)、BC 7832、BC 7833(O原始形式:H-)、BC 7834(ONT:H-)、BC 7835(O103:H2)、BC 7836(O57:H-)、BC 7837(ONT:H-)、BC 7838、BC 7839(O128:H2)、BC 7840(O157:H-)、BC 7841(O23:H-)、BC 7842(O157:H-)、BC 7843、BC 7844(O157:H-)、BC 7845(O103:H2)、BC 7846(O26:H11)、BC 7847(O145:H-)、BC 7848(O157:H-)、BC 7849(O156:H47)、BC 7850、BC 7851(O157:H-)、BC 7852(O157:H-)、BC 7853(O5:H-)、BC 7854(O157:H7)、BC 7855(O157:H7)、BC 7856(O26:H-)、BC 7857、BC 7858、BC 7859(ONT:H-)、BC 7860(O129:H-)、BC 7861、BC7862(O103:H2)、BC 7863、BC 7864(O原始形式:H-)、BC 7865、BC 7866(O26:H-)、BC 7867(O原始形式:H-)、BC 7868、BC 7869(ONT:H-)、BC 7870(O113:H-)、BC 7871(ONT:H-)、BC 7872(ONT:H-)、BC 7873、BC 7874(O原始形式:H-)、BC 7875(O157:H-)、BC 7876(O111:H-)、BC7877(O146:H21)、BC 7878(O145:H-)、BC 7879(O22:H8)、BC 7880(O原始形式:H-)、BC 7881(O145:H-)、BC 8275(O157:H7)、BC 8318(O55:K-:H-)、BC 8325(O157:H7)和BC 8332(ONT)、BC 8333。
在一些实施例中,本公开教导了可以是肠侵袭性大肠杆菌(EIEC)的宿主细胞,诸如菌株BC 8246(O152:K-:H-)、BC 8247(O124:K(72):H3)、BC 8248(O124)、BC 8249(O112)、BC 8250(O136:K(78):H-)、BC 8251(O124:H-)、BC 8252(O144:K-:H-)、BC 8253(O143:K:H-)、BC 8254(O143)、BC 8255(O112)、BC 8256(O28a.e)、BC 8257(O124:H-)、BC 8258(O143)、BC 8259(O167:K-:H5)、BC 8260(O128a.c.:H35)、BC 8261(O164)、BC 8262(O164:K-:H-)、BC 8263(O164)和BC 8264(O124)。
在一些实施例中,本公开教导了可以是产肠毒素大肠杆菌(ETEC)的宿主细胞,诸如菌株BC 5581(O78:H11)、BC 5583(O2:K1)、BC 8221(O118)、BC 8222(O148:H-)、BC 8223(O111)、BC 8224(O110:H-)、BC 8225(O148)、BC 8226(O118)、BC 8227(O25:H42)、BC 8229(O6)、BC 8231(O153:H45)、BC 8232(O9)、BC 8233(O148)、BC 8234(O128)、BC 8235(O118)、BC 8237(O111)、BC 8238(O110:H17)、BC 8240(O148)、BC 8241(O6H16)、BC 8243(O153)、BC8244(O15:H-)、BC 8245(O20)、BC 8269(O125a.c:H-)、BC 8313(O6:H6)、BC 8315(O153:H-)、BC 8329、BC 8334(O118:H12)和BC 8339。
在一些实施例中,本公开教导了可以是肠致病性大肠杆菌(EPEC)的宿主细胞,诸如菌株BC 7567(O86)、BC 7568(O128)、BC 7571(O114)、BC 7572(O119)、BC 7573(O125)、BC7574(O124)、BC 7576(O127a)、BC 7577(O126)、BC 7578(O142)、BC 7579(O26)、BC 7580(OK26)、BC 7581(O142)、BC 7582(O55)、BC 7583(O158)、BC 7584(O-)、BC 7585(O-)、BC7586(O-)、BC 8330、BC 8550(O26)、BC 8551(O55)、BC 8552(O158)、BC 8553(O26)、BC 8554(O158)、BC 8555(O86)、BC 8556(O128)、BC 8557(OK26)、BC 8558(O55)、BC 8560(O158)、BC8561(O158)、BC 8562(O114)、BC 8563(O86)、BC 8564(O128)、BC 8565(O158)、BC 8566(O158)、BC 8567(O158)、BC 8568(O111)、BC 8569(O128)、BC 8570(O114)、BC 8571(O128)、BC 8572(O128)、BC 8573(O158)、BC 8574(O158)、BC 8575(O158)、BC 8576(O158)、BC 8577(O158)、BC 8578(O158)、BC 8581(O158)、BC 8583(O128)、BC 8584(O158)、BC 8585(O128)、BC 8586(O158)、BC 8588(O26)、BC 8589(O86)、BC 8590(O127)、BC 8591(O128)、BC 8592(O114)、BC 8593(O114)、BC 8594(O114)、BC 8595(O125)、BC 8596(O158)、BC 8597(O26)、BC 8598(O26)、BC 8599(O158)、BC 8605(O158)、BC 8606(O158)、BC 8607(O158)、BC 8608(O128)、BC 8609(O55)、BC 8610(O114)、BC 8615(O158)、BC 8616(O128)、BC 8617(O26)、BC8618(O86)、BC 8619、BC 8620、BC 8621、BC 8622、BC 8623、BC 8624(O158)和BC 8625(O158)。
在一些实施例中,本公开还教导了可以是志贺氏菌属生物体的宿主细胞,包含福氏志贺氏菌(Shigella flexneri)、痢疾志贺氏菌(Shigella dysenteriae)、鲍氏志贺氏菌(Shigella boydii)和宋内志贺氏菌(Shigella sonnei)。
本公开还适用于多种动物细胞类型,包含哺乳动物细胞,例如人(包含293、WI38、PER.C6和鲍氏黑色素瘤细胞)、小鼠(包含3T3、NS0、NS1、Sp2/0)、仓鼠(CHO、BHK)、猴(COS、FRhL、Vero)和杂交瘤细胞系。
在各种实施例中,可以用于实施本公开的菌株(包含原核菌株和真核菌株两者)容易公开获自多个培养物保藏中心,诸如美国典型培养物保藏中心(American Type CultureCollection)(ATCC)、德国微生物菌种保藏中心(Deutsche Sammlung vonMikroorganismen and Zellkulturen GmbH)(DSM))、荷兰微生物菌种保藏中心(Centraalbureau Voor Schimmelcultures)(CBS))以及美国农业研究菌种保藏中心,北部区域研究中心(Agricultural Research Service Patent Culture Collection,NorthernRegional Research Center(NRRL))。
在一些实施例中,本公开的方法还可适用于多细胞生物体。例如,该平台可以用于改善农作物的性能。生物体可以包括多种植物,诸如禾本科(Gramineae)、非突亚科(Fetucoideae)、颇考亚科(Poacoideae)、剪股颖属(Agrostis)、梯牧草属(Phleum)、鸭茅属(Dactylis)、高粱属(Sorgum)、狗尾草属(Setaria)、玉蜀黍属(Zea)、稻属(Oryza)、小麦属(Triticum)、黑麦属(Secale)、燕麦属(Avena)、大麦属(Hordeum)、甘蔗属(Saccharum)、早熟禾属(Poa)、羊茅属(Festuca)、钝叶草属(Stenotaphrum)、狗牙根属(Cynodon)、薏苡属(Coix)、莪利竹族(Olyreae)、原禾族(Phareae)、菊科(Compositae)或豆科(Leguminosae)。例如,植物可以是玉米、稻米、大豆、棉花、小麦、黑麦、燕麦、大麦、豌豆、菜豆、小扁豆、花生、地瓜、豇豆、绒毛豆、三叶草、苜蓿、羽扇豆、野豌豆、莲藕、草木樨、紫藤、香豌豆、高粱、小米、葵花、芥花等。类似地,生物体可以包含多种动物,诸如非人类哺乳动物、鱼、昆虫等。
宿主细胞的转化
在一些实施例中,可以使用多种技术中的任一种将通过本公开的方法生成的构建体引入到宿主细胞中,该技术包含转化、转染、转导、病毒感染、基因枪或Ti介导的基因转移。具体的方法包含磷酸钙转染、DEAE-葡聚糖介导的转染、脂转染或电穿孔(戴维斯·L(Davis,L.),迪布纳·M(Dibner,M.),巴格利·I(Battey,I.),1986“分子生物学的基本方法(Basic Methods in Molecular Biology)”)。其他转化方法包含例如乙酸锂转化和电穿孔。参见,例如,吉茨(Gietz)等人,核酸研究27:69-74(1992);伊托(Ito)等人,细菌学杂志(J.Bacterol.)153:163-168(1983);贝克尔(Becker)和瓜伦特(Guarente),酶学方法(Methods in Enzymology)194:182-187(1991)。在一些实施例中,转化的宿主细胞被称为重组宿主菌株。
自动化
在一个实施例中,将本文提供的组合物和方法并入到用于宿主细胞的基因工程改造的高通量(HTP)方法中。在另一个实施例中,本文提供的方法可以是分子工具,其是在PCT/US18/36360、PCT/US18/36333或WO 2017/100377(其每一个出于所有目的通过引用并入本文)中描述的HTP分子工具组的一部分,以产生HTP遗传设计文库,其尤其源自科学见解和迭代模式识别。本文提供的组合物和方法可以用于生成用于高通量方法的文库,诸如在PCT/US18/36360、PCT/US18/36333或WO 2017/100377中描述的那些。可以使用本文提供的方法生成的文库的示例可以包含但不限于启动子梯、终止子梯、溶解度标签梯或降解标签梯。可以利用本文提供的组合物和方法的高通量基因组工程改造方法的示例可以包含但不限于如在PCT/US18/36360、PCT/US18/36333或WO 2017/100377中所述的启动子交换、终止子(终止)交换、溶解度标签交换、降解标签交换或SNP交换。高通量方法可以是自动化的和/或利用机器人和液体处理平台(例如,本领域中已知的板机器人平台和液体处理机器)。高通量方法可以利用多孔板,诸如例如微量滴定板。
在一些实施例中,本公开的自动化方法包括机器人系统。本文概述的系统通常涉及96孔微量滴定板或384孔微量滴定板的使用,但如本领域技术人员将理解的,可以使用任何数量的不同板或配置。此外,本文概述的任何或所有步骤可以是自动化的;因此,例如,系统可以是完全或部分自动化的。与本文提供的方法和组合物相容的机器人系统可以是在PCT/US18/36360、PCT/US18/36333或WO 2017/100377中描述的那些机器人系统。
试剂盒
本公开还提供了用于实施用于生成如上所述的核酸组装体或由其衍生的文库的方法的试剂盒。试剂盒可以包括含有用于组装ssDNA分子(例如寡核苷酸)或dsDNA分子所需的所有试剂的混合物。在某些实施例中,本主题的试剂盒可以含有:i.含有成对的第一多核苷酸和第二多核苷酸的第一多核苷酸的池,ii.插入多核苷酸的第二池,和(iii)任选地,用于在合适的宿主细胞中繁殖所生成的组装体的合适的克隆载体。在一些情况下,试剂盒包含阳性对照。
在一个实施例中,本文提供的试剂盒进一步包括5'-3'核酸外切酶和链置换聚合酶。在另一个实施例中,本文提供的试剂盒进一步包括5'-3'核酸外切酶、连接酶和链置换聚合酶。在又一个实施例中,本文提供的试剂盒包括单链(ss)结合蛋白质。ss结合蛋白质可以是极端热稳定的单链DNA结合蛋白质(ET SSB)、大肠杆菌recA、T7基因2.5产物、噬菌体λRedB或Rac前噬菌体RecT。
在一个单独的实施例中,本文提供的试剂盒进一步包括适当量的缺乏3'核酸外切酶活性的5'至3'核酸外切酶、拥挤剂、具有3'核酸外切酶活性的热稳定的非链置换DNA聚合酶、或所述DNA聚合酶与缺乏3'核酸外切酶活性的第二DNA聚合酶的混合物,以及分离的热稳定连接酶。拥挤剂可以是PEG、葡聚糖或聚蔗糖。例如,试剂盒可以含有T5核酸外切酶、PEG、
Figure BDA0003106371180000561
DNA聚合酶和Taq连接酶。在另一个示例中,试剂盒包括:核酸外切酶III、PEG、AMPLITAQ
Figure BDA0003106371180000562
DNA聚合酶和Taq连接酶。
本文提供的任何试剂盒还可以含有可以用于本方法的上文和下文所述的其他试剂,例如错配修复酶诸如mutHLS、cel-1核酸酶、T7 endo 1、uvrD、T4 EndoVII、大肠杆菌EndoV、缓冲液、dNTP、插入合成子的质粒和/或接受质粒的感受态细胞、对照等,这取决于该方法的实现方式。
试剂盒的组分可以在一个容器中组合,或者每种组分可以在其自己的容器中。例如,试剂盒的组分可以在单个反应管中或者在一或多个不同的反应管中组合。
除了上述组分之外,本主题的试剂盒进一步包含使用试剂盒的组分来实施本主题的方法的说明书。用于实施本主题的方法的说明书通常被记录在合适的记录介质上。例如,说明书可以被印刷在基底(诸如纸或塑料等)上。因此,说明书可以作为包装插入物存在于试剂盒中,存在于试剂盒或其组分的容器的标签中(即,与包装或分包装相关联)等。在其他实施例中,在试剂盒中不存在实际的说明书,但是提供了用于例如经由互联网从远程来源获得说明书的手段。该实施例的示例是包含网址的试剂盒,在该网址中可以查看说明书和/或可以从该网址下载说明书。
如本文所述的用于组装第一池中成对的多核苷酸和第二池中的插入多核苷酸的组合物、试剂盒和方法产生作为dsDNA的产物,其可以用作PCR、RCA或多种其他分子生物学应用的模板,包含直接转化或转染感受态原核或真核宿主细胞。
实例
通过参考以下实例进一步说明本公开。然而,应当注意,与上述实施例类似,这些实例是说明性的并且不应被解释为以任何方式限制本公开的范围。
实例1——用于将DNA片段多重组装到质粒的确定性文库中的方法原理证明。
目的
本实例描述了使用如图1中示意性示出的体外组装反应来确定性地连接包括精确设计的DNA部分(其包括4种组分)的池,以生成所需质粒的文库。
方法/结果
插入序列(即,有效负载)在柱或阵列上合成,以生成柱合成的有效负载池和阵列合成的有效负载池,每个池含有下面所示的7个有效负载序列的混合物。
>pMB070_启动子
ACCGTGCGTGTTGACAATTTTACCTCTGGCGGTGATACTGGTTGCATGTACTAAGGAGGTTGT(SEQID NO.1)
>b2405_启动子
ATGTCGGATATCTGGTGGTGAAATACTTTATGCCATGATAATTTAATACGATGTATTTATTATATGGAGCACTTAATT(SEQ ID NO.2)
>b0605_启动子
TAATGGAAACGCATTAGCCGAATCGGCAAAAATTGGTTACCTTACATCTCATCGAAAACACGGAGGAAGTATAG(SEQ ID NO.3)
>pMB043_启动子
ACCGTGCGTGTTGACTATTTTACCTCTGGCGGTTAGAGTTAACATCCTACAAGGAGAACAAAAGC(SEQID NO.4)
>pMB071_启动子
ACCGTGCGTGTTGACTTAAATACCACTGGCGGTGATAATGGTTGCATGTACTAAGGAGGTTGT(SEQID NO.5)
>b0159_启动子
CTCTCCCGCGTGAGAAATACGCTTCCCCGTAAGCGCATGGTAAACTATGCCTTCAAATCGGGCTTATCGCGAGTAAATCT(SEQ ID NO.6)
>pMB090_启动子
ACCGTGCGTGTTTACAATTTTACCTCTGGCGGTGATAATTAACATCCTACAAGGAGAACAAAAGC(SEQID NO.7)
分别地,生成了6个包括成对的左同源性臂和右同源性臂的池(即,图4中引用的基因座池编号)。每个基因座池含有多个同源性臂,每个同源性臂包括与大肠杆菌宿主细胞的基因组中的单独的基因座互补的序列;独特基因座的数目(即成对的同源性臂的数目)在图4中每个池的图下面给出(即,图下面的表中的“池中的基因座”)。来自每个池的每对中每个同源性臂的序列是SEQ ID NO.8至SEQ ID NO.179。
柱合成的有效负载池和阵列合成的有效负载池分别与图4中指定的特定基因座池混合。应当注意,每种混合物含有的左同源性臂:有效负载:右同源性臂的摩尔比为大约1:10:1。存在过量的有效负载,因为有效负载池含有对应于100-500个独特的左同源性臂和右同源性臂的寡核苷酸,而在给定的反应中仅组装了10-19个同源性臂,假定一定比例的插入寡核苷酸在反应中将是惰性的。该混合物进一步包括NEB Hifi DNA组装主混合物和用于在大肠杆菌克隆菌株中繁殖的克隆载体。每种混合物含有约0.05pmol的相应基因座池、0.2-1pmol的相应有效负载池和0.0125pmol的克隆载体,理论上得到0.0125pmol的最终组装产物。一旦组装,使每种混合物经历用于体外重叠组装的NEB Hifi DNA组装方案,并在大肠杆菌克隆菌株中繁殖。在图4中的表中给出了每个文库中的独特基因座(同源性臂对)、有效负载和总的可能构建体的数目。
在繁殖后,将每个组装体至少100个菌落分别挑入液体培养物中并生长过夜。使用液体培养物作为模板,用于对整个克隆的质粒进行滚环扩增(RCA)。使用Tn5转座酶片段化和衔接子连接试剂盒(次世代(Nextera),依诺米那(Illumina))对RCA产物进行片段化。然后经由PCR添加样品特异性的索引条形码,并将来自文库的质粒混合并进行柱纯化。使用Tapestation仪器评估文库摩尔浓度,并将来自文库的质粒加载到MiSeq仪器(300个循环试剂盒)上以用于测序。在图4中示出了对每个组装体测序的质粒的数目。
为了确定在组装体的池中生成了什么组装体,使用算法以在原始测序读段中搜索每个唯一组装体中各部分之间的每个连接处的唯一20-mer序列,以便确定哪个DNA序列被组装。然后将读段映射至每个样品的相应参考序列,以便确定所生成的全长产物。在图4的图中,“序列完美”表示所有四个部分(载体主链、左同源性臂和右同源性臂和有效负载)被组装在一起,并且在质粒中没有突变。“带有突变的正确组装”表示所有四个部分都以正确的排列存在,但在质粒中具有一或多个点突变。“错组装”表示具有错配的同源性臂或部分(part)或部分的部分(portion)不存在的质粒。
结论
图4中所示的结果表明,图1中描述的工艺可以成功地用于生成DNA组装体的确定性文库。
实例2——使用环状排列的有效负载的大有效负载进行多路复用确定性组装的方法的原理证明。
目的
该实例描述了使用如图1中示意性示出的体外组装反应来确定性地连接包括精确设计的DNA部分的池,该DNA部分包含环状排列的有效负载(插入物),其制备在图3中描述。
方法/结果
通过使用混合的正向引物扩增包括有效负载序列(约2670bp)的模板来制备插入物,该正向引物从5'至3'端包括有效负载右侧的组装重叠、HOM2的53bp、I-SceI限制性核酸内切酶识别位点、HOM1的53bp和有效负载左侧的引物结合位点。使用凯杰(Qiagen)凝胶提取试剂盒从琼脂糖凝胶上切下扩增产物。切除的产物在NEB HiFi组装反应中环化,经由AxyPrep mag珠清除法纯化,并使用I-SceI进行线性化(“环状排列”)。
分别地,从基因组DNA扩增各自包括与酿酒酵母宿主细胞的基因组中的单独基因座互补的序列的左同源性臂和右同源性臂。
将环状排列的混合的有效负载和一组左同源性臂和右同源性臂与克隆载体组合,并使用NEB HiFi反应进行组装。混合物含有的左同源性臂:混合的插入物:右同源性臂的摩尔比为大约1:5:1。使用过量的插入物,因为与组装中使用的十对左/右同源性臂相比,混合的插入物含有54个独特的序列。该混合物含有约16fmol的同源性臂池、80fmol的有效负载池和2.5fmol的克隆载体,理论上得到2.5fmol的最终组装产品。一旦组装,就使混合物经历用于体外重叠组装的NEB Hifi DNA组装方案,并在大肠杆菌克隆菌株中繁殖。
在繁殖后,将若干个菌落分别挑入液体培养物中并生长过夜。使用液体培养物作为模板,用于对整个克隆的质粒进行滚环扩增(RCA)。使用两条引物(一条正向引物和一条反向引物)通过Sanger测序对RCA产物进行测序。引物被设计成与克隆载体结合并读入同源性臂和有效负载。
为了确定在组装体的池中生成了什么组装体,使用算法以在测序读取的每个独特组装体中搜索唯一的20-mer序列。然后将读段与每个样品的相应参考序列进行比对,以验证预期的连接被建立,表明质粒已被正确组装。在图5中,顶部的长条表示要在池中组装的质粒的结构,并且下面的较短条表示与来自组装体的池的三个单独样品的相应参考序列对齐的Sanger序列。读段内端的细垂直线表示Sanger读段尾端的预期测序伪影。数据表明,所有预期的连接都被组装。
结论
图5中所示的结果表明,图1和图3中描述的工艺可以被成功地用于生成并入长的有效负载(例如>200bp)的DNA组装体的确定性文库。
实例3——使用PCR扩增的有效负载的大有效负载进行多路复用确定性组装的方法的原理证明。
方法/结果
图6示出了混合的组装体的总成功率,其中含有有效负载的部分是经由PCR使用附加了来自源自宿主基因组的模板的组装重叠的引物来创建的。扩增的有效负载长度在182-213bp的范围内。在使用NEB的HIFI组装主混合物进行组装之前,经由基于磁珠的方案纯化具有附加的25bp组装重叠的PCR扩增的部分,并且随后与含有同源性臂的左侧和右侧部分一起分别标准化至有效负载、左侧和右侧部分的总计.25皮摩尔,和.05皮摩尔的载体主链,并且随后被电穿孔到电感应态细胞中。成功率根据被回收并通过NGS-QC的质粒相对于尝试创建的质粒的百分比来计算。成功率是基于对每个池中下列数量的独特质粒进行回收和测序:池1:(48/70个质粒),池2:(47/70个质粒),池3:(46/70个质粒),池4(56/70个质粒),池5:(37/49个质粒)。对于池1:4,7个启动子有效负载靶向10个基因座,并且对于池5,7个启动子有效负载靶向7个基因座。在所有五个池中,我们总共创建了234/329或71.12%的质粒,并经NGS证实。
结论
图6中所示的结果表明,图1中描述的工艺可以成功地用于PCR扩增的插入片段,以生成并入长的有效负载(例如>200bp)的DNA组装体的确定性文库。
具有SEQ ID NO识别符的本公开的序列
Figure BDA0003106371180000601
Figure BDA0003106371180000611
Figure BDA0003106371180000621
Figure BDA0003106371180000631
Figure BDA0003106371180000641
本公开的编号的实施例
由本公开预期的其他主题在以下编号的实施例中阐述:
1.一种包括多核苷酸的混合物的组合物,所述混合物包括:
含有成对的多核苷酸的第一池,其中所述第一池中的每对含有第一多核苷酸和第二多核苷酸;和
插入多核苷酸的第二池,其中所述第二池中的每个插入多核苷酸包括在其5'端的与来自所述第一池的一对多核苷酸中的第一多核苷酸的3'端互补的第一组装重叠序列和在其相对的3'端的与第二多核苷酸的5'端互补的第二组装重叠序列。
2.根据实施例1所述的组合物,进一步包括克隆载体,其中,对于所述第一池中的每对,所述第一多核苷酸的5'端和所述第二多核苷酸的3'端包括与所述克隆载体互补的序列。
3.根据实施例2所述的组合物,其中选择来自所述第一池的每一多核苷酸,使得除了所述第一池的所述成对的多核苷酸与所述第二池的所述插入成对的多核苷酸之间、或所述第一池的所述成对的多核苷酸与所述克隆载体之间的设计的组装重叠序列之外,没有来自所述第一池的多核苷酸与来自所述第一池的超过指定的阈值的任何其他多核苷酸共享共同序列。
4.根据实施例3所述的组合物,其中所述指定的阈值为5至15个连续核苷酸。
5.根据实施例1至4中任一个所述的组合物,进一步包括聚合酶。
6.根据实施例5所述的组合物,其中所述聚合酶是链置换的或非链置换的。
7.根据实施例6所述的组合物,其中所述聚合酶是非链置换的,并且所述组合物进一步包括拥挤剂。
8.根据实施例7所述的组合物,其中所述拥挤剂是聚乙二醇(PEG)。
9.根据实施例8所述的组合物,其中所述PEG以约3%至约7%(重量/体积)的浓度使用。
10.根据实施例8或9所述的组合物,其中所述PEG选自PEG-200、PEG-4000、PEG-6000、PEG-8000或PEG-20,000。
11.根据实施例6所述的组合物,其中所述聚合酶是链置换的,并且所述组合物进一步包括单链结合蛋白质。
12.根据实施例11所述的组合物,其中所述单链DNA结合蛋白质是极端热稳定的单链DNA结合蛋白质(ET SSB)、大肠杆菌recA、T7基因2.5产物、噬菌体λRedB或Rac前噬菌体RecT。
13.根据上述实施例中任一个所述的组合物,进一步包括5'-3'核酸外切酶。
14.根据上述实施例中任一个所述的组合物,进一步包括连接酶。
15.根据上述实施例中任一个所述的组合物,其中所述第一池中的每对是双链DNA(dsDNA)或单链(ssDNA)。
16.根据上述实施例中任一个所述的组合物,其中所述第二池中的每个插入多核苷酸是dsDNA或ssDNA。
17.根据上述实施例中任一个所述的组合物,其中,对于所述第一池中的每对,所述第一多核苷酸和所述第二多核苷酸包括对应于宿主细胞中的靶基因组基因座的序列。
18.根据实施例1至16中任一个所述的组合物,其中,对于所述第一池中的每对,所述第一多核苷酸和所述第二多核苷酸包括对应于作为代谢途径的一部分的基因的编码序列。
19.根据实施例1至18中任一个所述的组合物,其中,对于所述第一池中的每对,所述第一多核苷酸和所述第二多核苷酸包括对应于功能结构域或一或多种蛋白质的编码序列。
20.根据上述实施例中任一个所述的组合物,其中,对于所述第一池中的每对,所述第一多核苷酸和所述第二多核苷酸在单个构建体中连接在一起,其中所述单个构建体包括用于所述第一多核苷酸与所述第二多核苷酸之间的一或多种位点特异性核酸酶的一或多个识别序列。
21.根据实施例20所述的组合物,其中用于一或多种位点特异性核酸酶的一或多个识别序列包括归巢核酸内切酶识别序列。
22.根据上述实施例中任一个所述的组合物,其中所述第二池中的每个插入多核苷酸上的所述第一组装重叠序列和所述第二组装重叠序列包括分别与来自所述第一池的一对多核苷酸中的第一多核苷酸的3'端和第二多核苷酸的5'端互补的1或多个核苷酸。
23.根据上述实施例中任一个所述的组合物,其中所述第二池中的每个插入多核苷酸上的所述第一组装重叠序列和所述第二组装重叠序列包括分别与来自所述第一池的一对多核苷酸中的第一多核苷酸的3'端和第二多核苷酸的5'端互补的约25个核苷酸。
24.根据上述实施例中任一个所述的组合物,其中所述第二池中的每个插入多核苷酸包括位于所述第一组装重叠序列与所述第二组装重叠序列之间的一或多个有效负载序列。
25.根据实施例24所述的组合物,其中所述一或多个有效负载序列选自启动子、基因、调节序列、编码降解决定子的核酸序列、编码溶解度标签的核酸序列、终止子、唯一标识符序列或其部分。
26.根据实施例17所述的组合物,其中所述第一池中的每对第一多核苷酸和第二多核苷酸包括与所述第一池中的每个其他对相比对应于宿主细胞中不同的靶基因组基因座的序列。
27.根据实施例17所述的组合物,其中,对于所述第一池中的每对,所述第一多核苷酸和所述第二多核苷酸包括对应于宿主细胞中相同靶基因组基因座的序列。
28.根据实施例24至27中任一个所述的组合物,其中所述第二池中的所述插入多核苷酸中的每个有效负载序列不同于所述第二池中的每个其他插入多核苷酸中的有效负载序列。
29.根据实施例24至27中任一个所述的组合物,其中所述第二池中的所述插入多核苷酸中的每个有效负载序列与所述第二池中的每个其他插入多核苷酸中的有效负载序列相同。
30.一种用于生成多核苷酸的文库的方法,所述方法包括:
(a)组合多核苷酸的第一池和多核苷酸的第二池,其中所述第一池含有成对的多核苷酸,其中所述第一池中的每对含有第一多核苷酸和第二多核苷酸,其中所述第二池含有插入多核苷酸,其中所述第二池中的每个插入多核苷酸包括在其5'端的与来自所述第一池的一对多核苷酸中的第一多核苷酸的3'端互补的第一组装重叠序列和在其相对的3'端的与第二多核苷酸的5'端互补的第二组装重叠序列;以及
(b)将所述第一池和所述第二池组装成多核苷酸的文库,其中所述文库中的每一多核苷酸包括来自所述第二池的插入多核苷酸和来自所述第一池的一对第一多核苷酸和第二多核苷酸,其中所述组装通过体外克隆方法或体内克隆方法进行。
31.根据实施例30所述的方法,其中所述第二池中的每个插入多核苷酸上的所述第一组装重叠序列和所述第二组装重叠序列包括分别与来自所述第一池的一对多核苷酸中的第一多核苷酸的3'端和第二多核苷酸的5'端互补的1或多个核苷酸。
32.根据实施例30或31所述的方法,其中所述第二池中的每个插入多核苷酸上的所述第一组装重叠序列和所述第二组装重叠序列包括分别与来自所述第一池的一对多核苷酸中的第一多核苷酸的3'端和第二多核苷酸的5'端互补的约25个核苷酸。
33.根据实施例30至32中任一个所述的方法,其中,对于所述第一池中的每对,所述第一多核苷酸和所述第二多核苷酸在单个构建体中连接在一起,其中所述单个构建体包括用于所述第一多核苷酸与所述第二多核苷酸之间的一或多种位点特异性核酸酶的一或多个识别序列。
34.根据实施例33所述的方法,其中用于一或多种位点特异性核酸酶的所述一或多个识别序列包括归巢核酸内切酶识别序列。
35.根据实施例33所述的方法,其中通过经由剪接和重叠延伸PCR(SOE-PCR)、限制连接、钝端连接、基于重叠的组装方法、基于重组的方法或连接所述第一多核苷酸和所述第二多核苷酸的任何其他酶促或化学方法连接各个第一多核苷酸和第二多核苷酸,或通过直接合成所述单个构建体来产生连接的单个构建体。
36.根据实施例30至32中任一个所述的方法,进一步包括在步骤(a)期间将克隆载体与所述第一池和所述第二池组合,其中,对于所述第一池中的每对,所述克隆载体的相对端包括与所述第一多核苷酸的5'端和所述第二多核苷酸的3'端互补的序列。
37.根据实施例30至32中任一个所述的方法,进一步包括在步骤(a)之前将克隆载体与所述第一池组合,其中,对于所述第一池中的每对,所述克隆载体的相对端包括与所述第一多核苷酸的5'端和所述第二多核苷酸的3'端互补的序列。
38.根据实施例36或37所述的方法,其中所述克隆载体和来自所述第一池的每对中的所述第一多核苷酸的5'端和所述第二多核苷酸的3'端包括用于一或多种位点特异性核酸酶的一或多个识别序列。
39.根据实施例38所述的方法,进一步包括通过添加所述一或多个识别序列的一或多种位点特异性核酸酶,在所述克隆载体的相对端与来自所述第一池的每对中的所述第一多核苷酸的5'端和所述第二多核苷酸的3'端之间生成单链互补突出物。
40.根据实施例39所述的方法,进一步包括连接所述克隆载体的所述相对端与来自所述第一池的每对中的所述第一多核苷酸的5'端和所述第二多核苷酸的3'端之间的所述单链互补突出物。
41.根据实施例36至40中任一个所述的方法,其中步骤(b)产生环状产物,所述环状产物包括来自所述第二池的插入多核苷酸、来自所述第一池的一对的第一多核苷酸和第二多核苷酸以及所述克隆载体。
42.根据实施例36至41中任一个所述的方法,其中所述第一池通过从更大组的此类序列中选择成对的多核苷酸序列来生成,使得除了所述第一池的所述成对的多核苷酸与所述第二池的所述插入多核苷酸之间、或所述第一池的所述成对的多核苷酸与所述克隆载体之间的设计的组装重叠序列之外,没有来自所述第一池的多核苷酸与来自所述第一池的超过指定的阈值的任何其他多核苷酸共享共同序列。
43.根据实施例42所述的方法,其中所述指定的阈值为5至15个连续核苷酸。
44.根据实施例30至43中任一个所述的方法,其中所述组装是体外克隆方法,其中将所述第一池和所述第二池的混合物加热以使存在于所述第一池和所述第二池中的多核苷酸部分或完全变性,然后在组装之前被冷却至室温。
45.一种用于生成多核苷酸的文库的方法,所述方法包括:
(a)经由聚合酶链反应(PCR)扩增多核苷酸的第一池,其中所述第一池含有成对的多核苷酸,其中所述第一池中的每对含有第一多核苷酸和第二多核苷酸,并且其中一对中的每一个第一多核苷酸和每一个第二多核苷酸包括5'端和3'端,其中所述扩增将包括用于一或多种位点特异性核酸酶的一或多个识别序列的共同重叠序列引入到来自所述第一池的一对中的第一多核苷酸的5'端和第二多核苷酸的3'端上;
(b)通过利用共同重叠序列将来自所述第一池的每对第一多核苷酸和第二多核苷酸组装成单个核酸片段,其中每对的所述单个核酸片段包括由所述共同重叠序列从所述第一多核苷酸的5'端和所述第二多核苷酸的3'端分离的第一多核苷酸和第二多核苷酸,并且其中每对的所述单个核酸片段中的所述第一多核苷酸的3'端和所述第二多核苷酸的5'端位于所述单个核酸片段的相对末端上,远离一或多个位点特异性核酸酶识别序列;
(c)将每对的所述单个核酸片段与含有插入多核苷酸的第二池组合,其中所述第二池中的每个插入多核苷酸包括在其5'端的与所述单个核酸片段中存在的所述第一多核苷酸的3'端互补的第一组装重叠序列和在其相对的3'端的与所述单个核酸片段中存在的所述第二多核苷酸的5'端互补的第二组装重叠序列;
(d)将所述第一池和所述第二池组装成环化的产物的第三池,其中所述组装经由体外或体内重叠组装方法进行,并且其中所述第三池中的每种环化的产物包括来自所述第二池的插入序列和来自所述第一池的一对第一多核苷酸和第二多核苷酸;
(e)经由一或多种位点特异性核酸酶的消化使所述第三池中的每种环化的产物线性化,所述位点特异性核酸酶识别位于所述第三池中的每种环化的产物中的所述第一多核苷酸序列和所述第二多核苷酸序列之间的一或多个位点特异性核酸酶识别序列;以及
(f)通过体外或体内克隆方法将线性化的产物组装到克隆载体中。
46.根据实施例45所述的方法,其中位于所述第一多核苷酸序列与所述第二多核苷酸序列之间的所述一或多个位点特异性核酸酶识别序列是归巢核酸酶识别序列。
47.根据实施例45或46所述的方法,其中位于所述第一多核苷酸序列与所述第二多核苷酸序列之间的所述一或多个位点特异性核酸酶识别序列的所述一或多种位点特异性核酸酶是归巢核酸内切酶。
48.根据实施例45至47中任一个所述的方法,其中所述共同重叠序列包括至少1个核苷酸的组装重叠序列,并且步骤(b)中的组装通过基于重叠的DNA组装方法进行。
49.根据实施例45至47中任一个所述的方法,其中所述共同重叠序列包括10-25个核苷酸的组装重叠序列,并且步骤(b)中的组装通过基于重叠的DNA组装方法进行。
50.根据实施例48或49所述的方法,其中所述基于重叠的DNA组装方法选自SOE-PCR或体外重叠组装方法。
51.根据实施例50所述的方法,其中存在于所述第一多核苷酸的5'端的共同重叠序列中的所述一或多个位点特异性核酸酶识别序列与存在于每对中的所述第二多核苷酸的3'端的共同重叠序列中的所述一或多个位点特异性核酸酶识别序列互补,并且其中在步骤(b)中利用每对中的所述第一多核苷酸和所述第二多核苷酸的所述共同重叠序列需要进行SOE-PCR。
52.根据实施例45至47中任一个所述的方法,其中在步骤(b)中利用每对中的所述第一多核苷酸和所述第二多核苷酸的所述共同重叠序列需要用一或多个位点特异性核酸酶识别序列的一或多种位点特异性核酸酶消化每对中的所述第一多核苷酸5'端和所述第二多核苷酸3'端上的所述共同重叠序列中存在的所述一或多个位点特异性核酸酶识别序列,以在每对中的所述第一多核苷酸的5'端和所述第二多核苷酸的3'端生成包括互补序列的单链突出物;以及连接在每对中的所述第一多核苷酸的5'端和所述第二多核苷酸的3'端上的所述单链突出物上存在的互补序列。
53.根据实施例45至52中任一个所述的方法,其中步骤(d)的所述组装使用基于重叠的DNA组装方法进行。
54.根据实施例53所述的方法,其中所述基于重叠的DNA组装选自SOE-PCR和体外重叠组装方法。
55.根据实施例45至52中任一个所述的方法,其中每对中的所述单个核酸片段中的所述第一多核苷酸的3'端和所述第二多核苷酸的5'端包括一组附加的一或多个位点特异性核酸酶识别序列,并且所述第二池中的每个插入多核苷酸中的所述第一组装重叠序列和所述第二组装重叠序列包括一或多个位点特异性核酸酶识别序列。
56.根据实施例55所述的方法,其中步骤(d)中的组装需要用每对中的所述单个核酸片段中的所述第一多核苷酸的3'端和所述第二多核苷酸的5'端上的附加的一或多个位点特异性核酸酶识别序列以及来自所述第二池的每个插入多核苷酸中的所述第一组装序列和所述第二组装序列中存在的一或多个位点特异性核酸酶识别序列的一或多种位点特异性核酸酶消化每对中的所述单个核酸片段中的所述第一多核苷酸的3'端和所述第二多核苷酸的5'端上存在的附加的一或多个位点特异性核酸酶识别序列和来自所述第二池的每个插入多核苷酸中的所述第一组装序列和所述第二组装序列中存在的一或多个位点特异性核酸酶识别序列,以在所述第一多核苷酸的3'端上生成包括与来自所述第二池的插入多核苷酸的所述第一组装序列的5'端上的单链突出物上存在的序列互补的序列的单链突出物和在所述第二多核苷酸的5'端上生成包括与来自所述第二池的相同插入多核苷酸的所述第二组装序列的3'端上的单链突出物上存在的序列互补的序列的单链突出物;以及连接所述单链突出物上存在的互补序列。
57.根据实施例45至56中任一个所述的方法,其中步骤(f)的所述克隆载体包括一或多个位点特异性核酸酶识别序列。
58.根据实施例57所述的方法,其中步骤(f)中的组装需要用所述克隆载体中存在的所述一或多个位点特异性核酸酶识别序列的所述一或多种位点特异性核酸酶消化所述克隆载体中的一或多个位点特异性核酸酶识别序列,其中所述消化在所述克隆载体的相对端上生成单链突出物,其中所述克隆载体的所述相对端的一个上的所述单链突出物包括与步骤(e)中生成的所述线性化的产物的端互补的序列,并且所述克隆载体的所述相对端的另一个上的所述单链突出物包括与步骤(e)中生成的所述线性化的产物的相对端互补的序列;以及连接所述克隆载体的所述单链突出物上存在的互补序列和来自步骤(e)的所述线性化的产物。
59.根据实施例45至58中任一个所述的方法,其中所述第一池通过从更大组的此类序列中选择成对的多核苷酸序列来生成,使得除了所述第一池的所述成对的多核苷酸与所述第二池的所述插入多核苷酸之间、或所述第一池的所述成对的多核苷酸与所述克隆载体之间的设计的组装重叠序列之外,没有来自所述第一池的多核苷酸与来自所述第一池的超过指定的阈值的任何其他多核苷酸共享共同序列。
60.根据实施例59所述的方法,其中所述指定的阈值为5至15个连续核苷酸。
61.根据实施例45至60中任一个所述的方法,其中所述第二池中的每个插入多核苷酸上的所述第一组装重叠序列和所述第二组装重叠序列包括与所述单个核酸片段的所述相对末端互补的1或多个核苷酸。
62.根据实施例45至61中任一个所述的方法,其中所述第二池中的每个插入多核苷酸上的所述第一组装重叠序列和所述第二组装重叠序列包括与所述单个核酸片段的所述相对末端互补的约25个核苷酸。
63.根据实施例30至62中任一个所述的方法,其中,在步骤(a)之前,通过将含有来自成对的多核苷酸的每一个第一多核苷酸的混合物与含有来自成对的多核苷酸的每一个第二多核苷酸的混合物组合来生成多核苷酸的所述第一池。
64.根据实施例30至63中任一个所述的方法,其中所述第一池中的每对是双链DNA(dsDNA)或单链DNA(ssDNA)。
65.根据实施例30至43中任一个所述的方法,其中所述第二池中的每个插入多核苷酸是dsDNA或ssDNA。
66.根据实施例30至65中任一个所述的方法,其中,对于所述第一池中的每对,所述第一多核苷酸和所述第二多核苷酸包括对应于宿主细胞中的靶基因组基因座的序列。
67.根据实施例30至65中任一个所述的方法,其中,对于所述第一池中的每对,所述第一多核苷酸和所述第二多核苷酸包括对应于作为代谢途径的一部分的基因的编码序列。
68.根据实施例30至65中任一个所述的方法,其中,对于所述第一池中的每对,所述第一多核苷酸和所述第二多核苷酸包括对应于功能结构域或一或多种蛋白质的编码序列。
69.根据实施例30至68中任一个所述的方法,其中所述第二池中的每个插入多核苷酸包括位于所述第一组装重叠序列与所述第二组装重叠序列之间的一或多个有效负载序列。
70.根据实施例69所述的方法,其中所述一或多个有效负载序列选自启动子、基因、调节序列、编码降解决定子的核酸序列、编码溶解度标签的核酸序列、终止子、唯一标识符序列或其部分。
71.根据实施例66所述的方法,其中,对于所述第一池中的每对,所述第一多核苷酸和所述第二多核苷酸包括与所述第一池中的每对相比对应于宿主细胞中不同的靶基因组基因座的序列。
72.根据实施例66所述的方法,其中,对于所述第一池中的每对,所述第一多核苷酸和所述第二多核苷酸包括对应于宿主细胞中相同靶基因组基因座的序列。
73.根据实施例69至72中任一个所述的方法,其中所述第二池中的所述插入多核苷酸中的每个有效负载序列不同于所述第二池中的每个其他插入多核苷酸中的有效负载序列。
74.根据实施例69至72中任一个所述的方法,其中所述第二池中的所述插入多核苷酸中的每个有效负载序列与所述第二池中的每个其他插入多核苷酸中的有效负载序列相同。
75.根据实施例30或69至74中任一个所述的方法,其中所述第二池中的每个插入多核苷酸通过以下生成:
(i)对包括所述有效负载序列、正向引物和反向引物的混合物进行聚合酶链反应(PCR),其中所述正向引物包括5'至3'、与所述有效负载序列互补的一或多个核苷酸的短段、所述第一组装重叠序列、用于一或多种位点特异性核酸酶的一或多个识别序列、所述第二组装重叠序列和与所述有效负载序列互补的一或多个核苷酸的第二段,并且其中所述反向引物包括与所述有效负载序列或与所述有效负载序列下游的其他序列互补的序列,其中所述PCR生成PCR产物,所述PCR产物包括5'至3'、与所述有效负载序列互补的核酸的短段、所述第一组装重叠序列、所述一或多个位点特异性核酸酶识别序列、所述第二组装重叠序列和所述有效负载序列;
(ii)经由选自由剪接和重叠延伸PCR(SOE-PCR)、限制性连接、钝端连接、基于重叠的组装方法和基于重组的方法组成的群组的组装方法,或连接两个DNA分子的任何其他酶促或化学方法,使所述PCR产物环化;以及
(iii)用识别所述一或多个位点特异性核酸酶识别序列的一或多种位点特异性核酸酶使所述环化的PCR产物线性化,从而生成多核苷酸的所述第二池。
76.根据上述实施例中任一个所述的组合物或方法,其中所述位点特异性核酸酶是限制性核酸内切酶、IIs型核酸内切酶、归巢核酸内切酶、RNA导向的核酸酶、DNA导向的核酸酶、锌指核酸酶、TALEN或切口酶中的一或多种。
*******
上述各种实施例可以被组合以提供另外的实施例。本说明书中提及的和/或在申请数据表中列出的所有美国专利、美国专利申请出版物、美国专利申请、外国专利、外国专利申请和非专利出版物均通过引用以其整体并入本文。如果需要,可以修改实施例的方面,以采用各种专利、申请和出版物的概念来提供又另外的实施例。
根据以上详细描述,可以对实施例进行这些和其他改变。一般而言,在所附的权利要求中,所使用的术语不应被解释为将权利要求限制于说明书和权利要求中公开的特定实施例,而应被解释为包含所有可能的实施例以及这些权利要求有权得到的等同物的全部范围。因此,权利要求不受本公开的限制。
通过引用并入
本文所引用的所有参考文献、文章、出版物、专利、专利出版物和专利申请均通过引用以其整体并入用于所有目的。然而,本文所引用的任何参考文献、文章、出版物、专利、专利出版物和专利申请的提及不被视为,并且不应被视为承认或以任何形式暗示它们构成有效的现有技术或构成世界上任何国家的公知常识的一部分。
序列表
<110> 齐默尔根公司(ZYMERGEN INC.)
<120> DNA文库的多重确定性组装
<130> ZYMR-029/01WO 327574-2164
<150> US 62/753,254
<151> 2018-10-31
<160> 179
<170> PatentIn版本3.5
<210> 1
<211> 63
<212> DNA
<213> 人工序列
<220>
<223> pMB070_启动子
<400> 1
accgtgcgtg ttgacaattt tacctctggc ggtgatactg gttgcatgta ctaaggaggt 60
tgt 63
<210> 2
<211> 78
<212> DNA
<213> 人工序列
<220>
<223> b2405_启动子
<400> 2
atgtcggata tctggtggtg aaatacttta tgccatgata atttaatacg atgtatttat 60
tatatggagc acttaatt 78
<210> 3
<211> 74
<212> DNA
<213> 人工序列
<220>
<223> b0605_启动子
<400> 3
taatggaaac gcattagccg aatcggcaaa aattggttac cttacatctc atcgaaaaca 60
cggaggaagt atag 74
<210> 4
<211> 65
<212> DNA
<213> 人工序列
<220>
<223> pMB043_启动子
<400> 4
accgtgcgtg ttgactattt tacctctggc ggttagagtt aacatcctac aaggagaaca 60
aaagc 65
<210> 5
<211> 63
<212> DNA
<213> 人工序列
<220>
<223> pMB071_启动子
<400> 5
accgtgcgtg ttgacttaaa taccactggc ggtgataatg gttgcatgta ctaaggaggt 60
tgt 63
<210> 6
<211> 80
<212> DNA
<213> 人工序列
<220>
<223> b0159_启动子
<400> 6
ctctcccgcg tgagaaatac gcttccccgt aagcgcatgg taaactatgc cttcaaatcg 60
ggcttatcgc gagtaaatct 80
<210> 7
<211> 65
<212> DNA
<213> 人工序列
<220>
<223> pMB090_启动子
<400> 7
accgtgcgtg tttacaattt tacctctggc ggtgataatt aacatcctac aaggagaaca 60
aaagc 65
<210> 8
<211> 1050
<212> DNA
<213> 人工序列
<220>
<223> 基因编辑同源性臂池_1_b3748_左
<400> 8
caaatctcga agatttcttt catgcggtgg gagatataga caataccgcg gccttgcgat 60
ttcagctcgc ggatgacgcg gaacagggat tcggtttcgg tatcggtcag cgcatcggtc 120
ggttcatcca taatgatgac tttcgactca aagctcagca ctttggcgat ttcaaccatt 180
tgctggtcac cgatggaaag atcgcccacc agcttgtcgc ttttaaagcg caggttaagt 240
ttagccagca atttatccgc ttcggcatac atggttttcc agtcaatttt gccaaagcga 300
ttaacaaact cacgaccgag gaaaatgttt tcggcaatgg tcaactgcgg gatcaggttc 360
agttcctgat ggataatccc aatcccggct tcctgggaag attttggccc ggtaaatgtc 420
gtttctttcc ccagccataa aagcgtaccg gcatcgcgag tatagatgcc agtaagcact 480
ttcatcatgg tggatttacc cgcgccgttt tcgcccacca gcgccatcac gcggcccgga 540
tagacattta acgctgcgcc cgagagggct tttacgcccg ggaaggcttt atcgatgcct 600
ttaagctgaa gtaatgcttc catgacggcc tcagaacgtc acgccagcac agagaatgat 660
attcgcatac ggagaacatt ctccgctgcg aattaccgcc tgactttctg cggtttgttg 720
tttgaattgt tcatgcgtgg tgtaacgaat ttcaatggta tttccctggt gtttttgcag 780
ctgctcaagg tgagtgagca acgtttcgtg gagttgcgga ttatggtgtt tgatctcttc 840
cgcgataatg gccgcctcga cctgcatttc atttgtgacg acgcccagca cctgcataaa 900
agaaggtaca ccctgggtta atgccatatc gatacgcgtt gtacttttgg ggatgggtaa 960
accagcatca cacaccacca gcgtatcggt atgtcccaga cgggagatca ccgatgaaat 1020
atcagaatta agaacggtgc cttttttcat 1050
<210> 9
<211> 1047
<212> DNA
<213> 人工序列
<220>
<223> 基因编辑同源性臂池_1_b3748_右
<400> 9
caacctcgaa acgttttaca tggtgattaa ccatgaaaac aaaaacgccc ccttatgaag 60
aaaggaggcg tctggcgtta gatttcgacc tgagtaccca gttcgataac cctgtttggc 120
gggatttcaa attgatctgg tgcacgcagc gcattacgtt gcagcagcaa gtacagcttg 180
ccgcgcagac gcaaatacca cgggcgtttg ccgaggatca acgactcatg cgacataaag 240
aaggaggttt ccatcatccg gcaacttaat ccttccagac cgcagcggtg gaaaacttct 300
tctacgtttg gcgtttctcg ccaaccataa cttgccacca cgcgccagaa agtgggcgac 360
agttgttcaa tctgtacccg acggacgtta tggacatatg gagcgtcttc ggtgcgcaga 420
gttaacagaa tcacccgctc atgcaatacc ttgttatgtt taaggttatg catcagcgca 480
aagggaatga cgttgattgc acgcgacata tacaccgcgg tcccgggcac gcgaacaggc 540
ggtgatttct ccagcgaagc aatcatcgct tccagagagt taccatgttc atgcatccgc 600
cgcagcaagc ggaaacgctc gctcttccag gtggtcatca cgataaacat cacagtaccg 660
aggctcaatg gcaaccagcc gccggagagc agtttatcga ggttagcggt gaacaatgga 720
atatcgacac aaaggaaagc aatcaggatc agcgcaacaa aatacttatt ccagtgccag 780
ttctgacgtg ccacggtagt cgagagaata gacgtcagca ccatggttcc ggtcaccgca 840
atcccgtacg ccgccgccag gttgctggag tgctcaaagc tgacaatcac aatcacgacc 900
gcgacataga gcatccagtt cacaaacgga atatagattt gccctgactc catttcggag 960
gtgtgaataa tgcgcatcgg cgacaaatat cccagacgta ccgcctgacg cgtcaatgag 1020
aagacgccag agataaccgc ctgcgag 1047
<210> 10
<211> 1049
<212> DNA
<213> 人工序列
<220>
<223> 基因编辑同源性臂池_1_b0388_左
<400> 10
cgcttcgcca aagcagcgga aaatattcag cacatcagcg gtatcttctg gggttaccag 60
cgcgtttggc gttacggagg tcatcccggc attaaccagt gcgggagtgt tcggcatggc 120
gcggataatt ttccggtcat ggcccagcgc gcgggcaagc tggtcgagcg tgacacctgc 180
agcaatagaa acgaccagag agtctttatt caggctggag gtgatttcgc taagcacttt 240
aatcatgatg ccaggtttaa cggcagcaaa aatgatgtcg gcgatttgcg ccacttcttg 300
cgccgattct gcggcgttga tgccgaactg gtcatgcagg gcggcgactt tatccgggga 360
gggggtgtat acccagattt gccctggaag cacctgaccg ctggcaatca gaccgccgag 420
aatggctttt cccatattgc cgcagccaat aaaaccgatt ttcttttcca ttgcctcact 480
cctgccgtga aattcattgt tttgataatc gctggcagaa gcataaacag aactatgccg 540
gaaggcaaaa gcgcgacaca atagaggatt acccaacaaa ggatgacttt atgacaattt 600
gggtggatgc cgacgcgtgt cccaatgtaa ttaaagagat tttgtatcgc gcggcggaac 660
gtatgcagat gccgctggta ctggtagcaa accagagttt acgcgtgccg ccatcgcgat 720
ttattcgtac gctgcgcgtc gcggcaggtt tcgacgttgc cgataacgaa attgtccggc 780
agtgtgaagc gggcgatttg gtgatcaccg cagatatacc tttggctgct gaagccatcg 840
agaaaggcgc tgcggcgctt aatccgcgcg gcgaacgtta cacgccagcg accattcgtg 900
agcgcctgac gatgcgcgat tttatggata ccttacgtgc cagtgggatc cagaccggcg 960
gaccagatag cctttcacaa cgtgaccgcc aggcctttgc cgcggagctg gagaagtggt 1020
ggctggaagt gcaacgtagt cgtggctaa 1049
<210> 11
<211> 1046
<212> DNA
<213> 人工序列
<220>
<223> 基因编辑同源性臂池_1_b0388_右
<400> 11
atgacacaac ctctttttct gatcgggcct cggggctgtg gtaaaacaac ggtcggaatg 60
gcccttgccg attcgcttaa ccgtcggttt gtcgataccg atcagtggtt gcaatcacag 120
ctcaatatga cggtcgcgga gatcgtcgaa agggaagagt gggcgggatt tcgcgccaga 180
gaaacggcgg cgctggaagc ggtaactgcg ccatccaccg ttatcgctac aggcggcggc 240
attattctga cggaatttaa tcgtcacttc atgcaaaata acgggatcgt ggtttatttg 300
tgtgcgccag tatcagtcct ggttaaccga ctgcaagctg caccggaaga agatttacgg 360
ccaaccttaa cgggaaaacc gctgagcgaa gaagttcagg aagtgctgga agaacgcgat 420
gcgctatatc gcgaagttgc gcatattatc atcgacgcaa caaacgaacc cagccaggtg 480
atttctgaaa ttcgcagcgc cctggcacag acgatcaatt gttgattttc gagcgcctat 540
acttaacgtt catcccgtga aataaggaag aacgatgcca acgaaaccgc cttatcctcg 600
tgaagcatat atagtgacga ttgaaaaagg aaagccagga cagacggtaa cctggtacca 660
actcagagcc gatcatccta aaccagactc gttgatcagt gaacatccga ccgctcagga 720
agcgatggat gcgaaaaaac gctatgagga ccctgacaaa gagtgaccgc atcagactgc 780
tcggaaggga ttctgagtgc cactacaagg gatctgcgtc acatttttca taattcatgt 840
ttttctaata attagaatat taaacaataa caatccatta ctggaatcat ttggaatctt 900
tacattatgc cgtgcacgtc tgctgctacg ctttttgtca tttgtagcac aagtaagtgt 960
cagcagtggt gcttcacact tgcccggtaa ttaacgacga aagaaaagta aggtggatga 1020
acaatgagtg cgtcgttggc gatcct 1046
<210> 12
<211> 1050
<212> DNA
<213> 人工序列
<220>
<223> 基因编辑同源性臂池_1_b4348_左
<400> 12
gcagttcatc attgcatttc gtgctgaggg ggatgaaaaa aatatttcga tatattctgg 60
taaagcatct ttggttaatc gagctcgaat aagtttatca ggatatagca aattttgatg 120
ttgtaatttt ttcaataacc cacaaacacc aacaaattct aaacttccgt tatagcgagt 180
aaataaaaga tctccatctt gtaatttgtg gcggtttagt tcactttctg aacattctag 240
aaaccgaata tcgttttgat ctacatggcc agcacgtaca gaactaatgc gtagtattgg 300
atgaccaaca ccactttcat ttggctttga tgaaagacca ttacgtaatt cagttaagat 360
agattcaaaa tttaacttct taaatacaga atgttgcggc tcaaaattac gccatttttc 420
tgtcaatttt ccattaactg cgccccccaa taccgcttga cgaaaacgtt tcaggatttg 480
tgggatttgc tcaaaacgtg ctttggtgct gtctacctgc gccagcagcg tatcgagttt 540
ttcagcgatg attttttgtt cggcaagtgg tgggattggt atatttatca aatcaaagct 600
tgccggctta atattattaa tatttgcacc agcagaaagt gatgaaattt tgtttcgata 660
aagagaagat tttgtgaaat gagcaataaa accagaaaat ataagttttt caggacgtaa 720
tacaccgcaa aatgcgccga aactacattc aaatggtaga tgctgatgtg cggatttacc 780
aactacggat ttgctccctg atgacattgc aataacaata tcttcaggag atattttttg 840
actttcttta acaagatttt taggaacaaa aaccaagtcc gtagtatcaa acttgccatt 900
ctgaatattg ttcgcacgga taagaggcaa ataatcatct tttagataat ttattgcctg 960
ctctttttta tacgttactc ctcggattag agttgtgacc gtagatactg gggcgataac 1020
ccacccctcc ggcaatttcc ccgcactcat 1050
<210> 13
<211> 1050
<212> DNA
<213> 人工序列
<220>
<223> 基因编辑同源性臂池_1_b4348_右
<400> 13
tccttcaccc caccaaacgc ttcttccagc aactgacgct gcaaatcggc ctcatcgctc 60
gcccccagtt cacgcatcag cgcatccagt tcagacagcg cctgtaccag ttcgcccatc 120
gcttctgccg ctaatacatc cggctccggc aggctgtcgg catcaatact gtctttatct 180
ttcagccagg agatatccag cgaatcggat tttgcggtgc ggatccactc acggctgaac 240
ttgcgccagc ggctggtagc aagatgctgg tcggtgtttt tgttctcttc gctgtcggca 300
acttccgtct cttcggcgtt aaaactccat tcaccttcag tgcgcgggct taaaccgtgc 360
gggtcttcgc catacacgcg ctcaaacggc tgcaaatgct cgtcggtaaa cggtgtgcgc 420
ttgccgaaac tcggcatatt ggtacgcagg tcatacaccc acacatcatc ggtacagttc 480
ttatcctgat tcgggttcgc caccgtccct ttggtaaaga acagcacgtt ggtcttcacg 540
ccctgagcgt aaaaaatacc ggtcggcaga cgcagaatgg tgtgcagatg acacttatcc 600
atcaggtcac gacgaatgtc ggtgcctttg ccgccttcaa acagcacgtt atccggcacc 660
accaccgccg cacgaccgcc gggatgcagc gtttcgataa tatgctgcat aaagcacaac 720
tgtttgttgc tggtcgggtg aacaaaggtg cgggtaatgt tggtgcctgc ggcgctgcca 780
aacggcgggt tagtggcgac aatatgcgcc ttcggcaggt tttcaccgtc gctacccaga 840
gtgttgccca gacggattgc gccgccgtgg tcgaggttgc cttcaatatc gtgcagcagg 900
cagttcatca gtgccagacg acgggtgccg ggcaccagtt cgaggccgat aaacgcgcgg 960
tggatctgga aatcctgcgt gtcgccatca aggtcgtcca gatcattggt ttgcgactta 1020
acatagcggt cggcttcaat caaaaagccc 1050
<210> 14
<211> 1050
<212> DNA
<213> 人工序列
<220>
<223> 基因编辑同源性臂池_1_b1982_左
<400> 14
taagcgcatg ttaatgctga ccgtctggat gatgggcatc gcgacagcct tgattggtat 60
tcttccttca ttctcgacca ttgggtggtg ggcacctatt ttgctggtga cactgcgtgc 120
cattcaggga tttgcagtcg gcggcgaatg gggaggcgcg gcgttgcttt ccgttgaaag 180
tgcaccgaaa aataaaaaag ccttttacag tagcggtgta caagttggct acggtgtagg 240
tttactgctt tcaaccggac tggtttcatt gatcagtatg atgacgactg acgaacagtt 300
tttaagctgg ggctggcgca ttcctttcct gtttagcatc gtactggtac tgggagcatt 360
gtgggtgcgc aatggcatgg aggagtccgc ggaatttgaa caacagcaac attatcaagc 420
tgccgcgaaa aaacgcatcc cggttatcga agcgctgtta cgacatcccg gtgctttcct 480
gaagattatt gcgctacgac tgtgcgaatt gctgacgatg tacatcgtta ctgcctttgc 540
acttaattat tcaacccaga atatggggct accgcgcgaa cttttcctta atattggttt 600
gctggtaggt ggattaagct gcctgacaat tccctgtttt gcctggcttg ccgatcgttt 660
tggtcgccgt agggtttata tcacaggtac gttaatcgga acgttgagcg catttccttt 720
ctttatggcg cttgaagcac aatctatttt ctggatagtt ttcttctcca taatgctggc 780
aaacattgcg catgacatgg tggtgtgtgt gcaacaaccg atgtttaccg aaatgtttgg 840
tgccagttat cgctatagtg gcgctggagt cggttatcag gttgccagtg tggttggcgg 900
tggatttaca ccttttattg ccgctgcact catcacttac tttgccggga actggcatag 960
cgtcgccatt tatttgctgg ctggatgcct gatttccgca atgaccgctt tgttgatgaa 1020
agacagtcaa cgcgcttgat agcctggcga 1050
<210> 15
<211> 1050
<212> DNA
<213> 人工序列
<220>
<223> 基因编辑同源性臂池_1_b1982_右
<400> 15
atgaataata agggctccgg tctgacccca gctcaggcac tggataaact cgacgcgctg 60
tatgagcaat ctgtagtcgc attacgcaac gccattggca actatattac aagtggcgaa 120
ttacctgatg aaaacgcccg caaacaaggt ctttttgtct atccatcact gaccgtaacc 180
tgggacggta gcacaaccaa tccccccaaa acgcgcgcat ttggtcgctt tacccacgca 240
ggcagctaca ccaccacgat tactcgccct actctctttc gttcgtatct taatgaacaa 300
cttacgttgc tgtatcagga ttatggtgcg catatctcag tgcaaccctc gcagcatgaa 360
atcccttatc cttatgtcat cgatggctct gaattgacac ttgatcgctc aatgagcgct 420
gggttaactc gctacttccc gacaacagaa ctggcgcaaa ttggcgatga aactgcagac 480
ggcatttatc atccaactga attctccccg ctatcgcatt ttgatgcgcg ccgcgtcgat 540
ttttccctcg cacggttgcg ccattatacc ggtacgccag ttgaacattt tcagccgttc 600
gtcttgttta ccaactacac acgttatgtg gatgaattcg ttcgttgggg atgcagccag 660
atcctcgatc ctgatagtcc ctacattgcc ctttcttgtg ctggcgggaa ctggatcacc 720
gccgaaaccg aagcgccaga agaagccatt tccgaccttg catggaaaaa acatcagatg 780
ccagcatggc atttaattac cgccgatggt cagggtatta ctctggtgaa tattggcgtg 840
ggaccgtcaa atgctaaaac catctgcgat catctggcag tgctacgccc ggatgtctgg 900
ttgatgattg gtcactgtgg cggattacgt gaaagtcagg ccattggcga ttatgtactt 960
gcacacgctt atttacgcga tgaccacgtt cttgatgcgg ttctgccgcc cgatattcct 1020
attccgagca ttgctgaagt gcaacgtgcg 1050
<210> 16
<211> 1050
<212> DNA
<213> 人工序列
<220>
<223> 基因编辑同源性臂池_1_b4367_左
<400> 16
cgttaagccc gacggagaga gaaatattgc gctttatgtc gcgtggctac tcaatgacac 60
aaattgccga gcagcttaaa cgcaatatca aaacgatccg tgcacataaa tttaatgtga 120
tgtcgaaact gggcgtcagt tctgacgcag ggttgttgga ggccgcagat attctgttat 180
gtatgcggca ttgcgaaaca agtaatgtgt tgcatcccta ttaatccgca tgatgccggg 240
tttacttccc cggcagtgct ttcatttcag cgtacaatcg ccacattgct gcacatccgg 300
taagcgataa cgctggcagc aagtgcggcg caccagcagg ccgtcgcgca gtaccacggt 360
acgccagagt ggattatctt caccgttcgt gagcgttttc tcaaaaaaga gggcatggcg 420
cagcgattca acagtagcct cgccgagcag ttgcttcatc tcagtgagat accagttgat 480
caaataaccg gtattactcc agataagttt gccgttgatc tctccggtcg cttctagtgc 540
ttgcacaacc ggaaccagcg cctggctgat taacgtttcc attcgatgct gcggcgaatg 600
tggtgttgcg tttttatctt cacacacatc gacccagaaa caggcgacgc gtccggtttc 660
gtgaaactca gcatggaaat gttccggcga cacatctaat gccttttcct gcgtcagtag 720
cgccagcatt aatggtggca ccatcaggcc gatataccat tgtgcccata gtgagatcag 780
cggtttgttc tcgcggatca tcatcggttg gttgcgatag atatgatcgg aatagaccgc 840
cagcagagaa cttagcacat tcggtgatga ccattgcgcc agcgtcatgg cgttaagtgg 900
ggcaggttca tccaggcgga taaactccag caaatgttca cgatgttttg cgatcgtcgc 960
ccgcacggct tgcgcaagcg tgggatcctg cggctggaga tgcgttcgcc agatgacatc 1020
ttcatagagc ggtgcggaac gataggccat 1050
<210> 17
<211> 1050
<212> DNA
<213> 人工序列
<220>
<223> 基因编辑同源性臂池_1_b4367_右
<400> 17
aatcgggata gtaatctaaa tgataatgat tgctaatcat agcgataggt ttacccgata 60
gcaagggatt tatctggctt gcaaatgata aaaattatca tatgatattg gttatcatta 120
tcaatgaaag agatgaaatc atgttgcaac gtacgctggg cagtggctgg ggagtgttgc 180
tgccgggatt gctgattgca gggctgatgt atgcggattt atcgtcagat cagtggcgga 240
ttgtcattct gatgggatta gtattgacgc cgatgatgct gtatcacaaa cagttgcggc 300
attacatttt gctaccatcg tgcctggcac ttattgctgg catcatgctg atgataatga 360
atttgaatca gggatgaaaa atcaaggaag aaacaagaaa ggaagtaaag ataattggtg 420
cgaggggggg gacttgaacc cccacgtccg taaggacact aacacctgaa gctagcgcgt 480
ctaccaattc cgccaccttc gcacagtcat cttacttttt ttgatatcgc ctcgtttggt 540
gcgagggggg ggacttgaac ccccacgtcc gtaagaacac taacacctga agctagcgcg 600
tctaccaatt ccgccacctt cgcccagtgc gagcaatatc aacgtggttt ttggtgcgag 660
gggggggact tgaaccccca cgtccgtaag gacactaaca cctgaagcta gcgcgtctac 720
caattccgcc accttcgcat accatcaatt cttaaaaaga attgctacca cggaggcgca 780
ttctagtggt tttcagcttt tcgtcaatag ttaattatcg acagaggtgt aattgctgga 840
aaaatgtcca tcaggaaact agcgtgcagg tttggtatgc atgcgggggc agatgccaga 900
tgcgacgctg gcgcgtctta tctggcctac gaagggctaa cgtgcaggtt ttgtaggtcg 960
gataaggcgt tcacgccgca tccgacacgg tattcggcga gataattaac ctttcttcgc 1020
ctggcgggtc ataatggcgc gatacacctt 1050
<210> 18
<211> 1050
<212> DNA
<213> 人工序列
<220>
<223> 基因编辑同源性臂池_1_b2285_左
<400> 18
ctgtttcttc cccgcagatg tagcgccctg ccccggtatg gacgaacagt tcgaaatcga 60
aacctgttcc cataatgttt ttgccaagca gacccgcttc ggtggcttcg gcaatggcac 120
ggcgcagatt aactgccgct tcgatatatt cgccacgcag gaagatgtag ccacggtaag 180
ctttcagcgc aaacgcggag atgagcatac cttccaccag caggtgcggc agttgctcca 240
tcaacaggcg gtctttatag gtgcccggct ccatttcatc ggcattacac agcaggtaac 300
ggatgttcat ggattcgtct ttcggcatca ggctccattt caggccagtc gagaagcccg 360
cgccgccgcg ccctttcaga ccagcgtctt ttacctgatt aacgatttcg tccggagaca 420
gcccggtcag cgccttacgc gcgccttcgt aaccgttttt gctgcggtat tcgtccagcc 480
acactggctg tttgtcatcg cgcagacgcc aggtcagcgg atgcgtttcg ggagtacgga 540
taatgttttt catttatacc gctccagcag ttcagggatc gcttccgggg tcagatgcgc 600
gtgagtgtcc tcatcgatca tcatgtttgg ccctttatca cagttcccca ggcagcaagt 660
tggcagcagc gtaaagcggc catcaaatgt cgtttgccct ggtttgatgt tcagcttttt 720
ctcgagcgcc gcctgaatac cctgataacc gttgatatga cagaccacgc tgtcacaata 780
acggatcaca tggcgaccaa ccggctggcg gaagatctga ctgtagaacg ttgccacacc 840
ttcgacgtcg cttgccggaa tacccagcac atcggcgatc gcgtggatcg caccatccgg 900
cacccagcca cgctgcttct gaacgatttt cagcgcttca atggacgccg cacgcgggtc 960
ttcgtagtgg tgcatctcgt gctcgatcgc ttcacgctct gccgcactca gctcaaaagc 1020
ctcggtttgt ggttgttgat tctcgtgcat 1050
<210> 19
<211> 1050
<212> DNA
<213> 人工序列
<220>
<223> 基因编辑同源性臂池_1_b2285_右
<400> 19
aattagcggt ccacatctga cataacaaaa tcgatactgc ccagataaac aatcaggtca 60
gacaccaggc tgccgcggat cgccgccgga atttgctgca aatgcgcaaa gctcggggta 120
cgaacacggg tgcggtaact catggtgctg ccgtcgctgg tcaggtagta actgttgatc 180
cctttggtcg cctcaatcat ctggaaagat tcattggcag gcatcaccgg accccacgac 240
acttgcagga agtgggtgat cagggtttcg atatgttgca gcgtgcgctc tttcggcggc 300
ggcgtggtca gcgggtgatc cgctttgaac gggccttccg gcatgttgtt gaggcactgc 360
tcaagaatgc gcagactctg gcgcagctct tccactttaa gcattacgcg ggtgtagcag 420
tcagaaacgc caccacccac cgggatttca aagtcgaagt tttcatagcc agaataagga 480
cgcgccttac gcacgtcgaa gtcgatcccg gtagcacgca ggcccgcgcc agtggtgccc 540
cactccagcg cctctttcgc gccataggcg gcaacgccct gggaacgacc tttcagaatg 600
gtgttttgca gcgccgcttt ctcgtaagac gccagacgtt tcggcatcca gtcgaggaac 660
tcacgcagca ggcgatccca gccgcgcggc aggtcgtgcg ctacgccgcc aatacggaac 720
cacgccgggt gcatacggaa accagtgatt gcttccacca gatcgtaaat tttctgacga 780
tcggtaaagg cgaagaacac tggcgtcatt gcgccgacgt cctgaataaa ggtcgagata 840
tacagcaggt gactgttgat gcggaacagt tcggagagca taacgcgaat gacgttaacg 900
cgatccggca cggtgatccc ggccagtttc tctaccgcca gcacgtaagg catttcgtta 960
acgcagccgc cgaggtattc gatacggtca gtatacggaa tgtagctgtg ccaggactgg 1020
cgttcgccca ttttctccgc accacggtgg 1050
<210> 20
<211> 1025
<212> DNA
<213> 人工序列
<220>
<223> 基因编辑同源性臂池_1_b2405_左
<400> 20
gagcgaagcg agtcatcctg cacgacccac caatgtaaaa aagcgcccta aaggcgcttt 60
tttgctatct gcgatttgcg aaattgcctg atgcgcttca cttagcagac tactatttcc 120
ggcaattcct gtctcctcac ctactgtgtc aatgcagcca acagcttaac catcgcgggc 180
gtcacctgct gtgtttcata aacaatatat aaatctgcag ggatgcgctg tttgagcgga 240
cggaaaatga cacctggcca gttcatttgt gcgtagctgt ccgctatcaa tgtgatacca 300
atgcccatac tgaccatagc gagtaccgtt tgcggttcat taacttcgcg aataacaacc 360
ggtgaaaatc ccacctgctg gcaaactcgc tgcaaaaaat cccagtcagt gtaaacgggc 420
ggcattgtaa caaaatactc gtcacgtagc gcttccagcg ggacggtgga aaatgatgag 480
agatgatgct cttcaggcat cgccaccaga aacgccgatt catgcaaccg taagctggta 540
aaaccagtcg gtggttctgt cgccattcgc cagatcccgg catcaagttc gcggcgttcc 600
agcaaggcca tttgcatcgc gggcatcttt tcgcgaaaaa gaacgtcaac gttaggattt 660
tccctgagga atcgccgcat aaccgggcgc atccgtcccc acattgccgt tcccactacg 720
ccgagttcaa tccgccctgc ttctccccga cctatttgtt caatccgagc caatacatta 780
ttagcattca ccagcaatcg acgcgattct tccatcaaga ttttgcccgc gtgtgtcagt 840
acgacgctgc gcgaatggcg aataaaaagc tgcgtgccga gttgattttc cagctcttta 900
atatgaatgc tgagcggagg ctgagacata tttaaacgcg ctgctgcgcg gccaaaatgc 960
aactcttccg ctacggcaag aaaataacgg agcaacttaa gatctgttct gtatacgcgt 1020
tccat 1025
<210> 21
<211> 1050
<212> DNA
<213> 人工序列
<220>
<223> 基因编辑同源性臂池_1_b2405_右
<400> 21
aacaaagcac caataccaaa accaacgccg gaagaaaata aaatatcttt cactaattaa 60
cctttatcat aaaagcagct ctgaagagca gagccgcgaa tccttttaat gagtcaccgc 120
tcgatgcttt atcttttcag ggtcatgatt atatttaaac ccaaagaaaa atatcactgc 180
gagaaaaaga gcatatcctg caaacaccag ccagatagtt tgccagtctt ttacgccatc 240
caccgaaaag taatctactg ccatgccact cagaatcgag ccaacccatg cgccgacacc 300
atttaccatg gtcataaaga gcccctgcgc gctggcacga atgctggaat caacttcctg 360
ttcgacaaat accgaaccag aaatattgaa gaaatcgaat gcacagccat aaacaatcat 420
cgacagcagc agcaaaataa atccggttgt tgacggatcg ccataggcga agaagccaaa 480
gcgcagcgtc caggccacca tactcatcag catgacggtt ttaatgccaa atcgctttaa 540
aaagaatggg atagtcagta taaagcccac ttctgccatc tgtgaaactg acagtaaaat 600
ggagggatat ttcaccacaa aactgtcagc aaactccggg ttacgggcga aatcatgtag 660
gaacggatta ccaaaaacgt tggtaatttg cagtaccgca cccagcatca tggcaaagag 720
gaaaaagatg gccatgcgtg gatttttaaa cagcacgaag gcatccagac ccagcttgct 780
ggcaagcgat gtggtcgctt ttttctccgc aaccggaatc ttcggcaaag tcagcgcata 840
agccgacagc agcaatgacg caccggacgc gatatacagc tgcagactac tcaattccag 900
atgcagcagg cttactgccc acatcgcgac aatgaacccc accgtaccaa aaacgcgaat 960
gggcgggaaa gcggtcaccg ggtcaagccc tgcctgggca agacaggaat aagagacgct 1020
gttcgataac gcaatagtcg gcataaacgc 1050
<210> 22
<211> 1050
<212> DNA
<213> 人工序列
<220>
<223> 基因编辑同源性臂池_1_b0495_左
<400> 22
cgacccggcg tggagattaa tcccatcacc gatgatgtca tcacaatacg cccttcaccg 60
tgcggtaaca tcgcgggtaa caggcgcatg gtgagctggt gtgcgccgaa aaagttggcg 120
gaaaactgct gttccatctg cgcacggctg atggtggaaa gggggccata catgccgaat 180
ccggcattgt taaagatccc atacagacaa ttatcggtca gggcgatcac ctcgtcggct 240
gcgcgatcaa cactttctgg tgaatccaga tcgatcaaca cgccggtaaa tcccatgctg 300
ttcatgcgct caacatcatc cggtttccgg caacctgcca gcacatgaaa accctggcgt 360
tttaattcga gcgcgctttc caggccaatt ccactggaac atccggtaat taagaccgat 420
ttttgcataa ctttacctgt caggatctcc gttgctttat gagtcatgat ttactaaagg 480
ctgcaactgc ttcgccatcc agtcggcaat aaacggctgg gcgtcgcggt tgggatgaat 540
accgtcatcc tgcatccatt gtggcttgag gtagacctct tccataaaaa agggcagcag 600
cggaacatca aactctttgg cgagtttggg gtaaatggcg ctaaaggctt cattataacg 660
gcgaccatag tttgcaggca gacgtatttg cattaacaat ggttcagcgt tggcggcttt 720
gacatcctgc aaaatctggc gcagcgtttg ctcggtttgc tgtggctgaa aaccacgcaa 780
accgtcattg ccgcccagtt caaccagcac ccaacgcggc tgatgctgtt tcagcagagc 840
cggaaggcgc gccagtcctt gttgcgaggt gtcgccgctg atgctggcat taactaccga 900
cgttttactc tgccacttat cattcaacaa ggcaggccag gccgcgctgg cagacattcg 960
atacccggcg ctcaggctat cacccagaat caataacgtg tccgctgcgg cggcacggaa 1020
ggttaacagg accaggaaca ggaagggcaa 1050
<210> 23
<211> 1046
<212> DNA
<213> 人工序列
<220>
<223> 基因编辑同源性臂池_1_b0495_右
<400> 23
atgccagcgg aaaacattgt tgaagttcat catcttaaga agtccgtcgg tcagggggag 60
catgaactct ccatcctcac cggagttgag ctggttgtca aacgtggcga gaccatcgca 120
ctggtgggcg agtcgggatc gggtaagtca accttgctgg cgatcctcgc cgggcttgat 180
gacggcagca gtggcgaagt gagtctggtg ggacaaccgc tacataatat ggacgaagaa 240
gcgcgggcaa agttgcgcgc gaagcacgtc ggctttgttt ttcagtcatt tatgttaatt 300
cctaccctta acgcgctgga aaacgtcgag cttccggctc tgctgcgcgg tgagagtagc 360
gcggaaagtc gtaacggggc gaaagcgttg ctcgaacagt tagggctggg taaacgtctg 420
gatcatcttc cggcacagct ttccggcggt gaacagcaac gagtggcgct ggcacgagcc 480
tttaatggtc gacctgatgt gctgtttgcc gacgaaccca ccggcaacct tgaccgccag 540
acgggcgata aaattgccga cctgctgttt tccctcaacc gtgaacatgg caccacgttg 600
attatggtga cccacgacct gcaactggcg gcacgctgcg accgctgctt acggctggtg 660
aacgggcagt tgcaggagga agcatgattg cacgttggtt ctggcgcgaa tggcgttcgc 720
cgtcgctatt aattgtctgg ctggcgctaa gcctggcggt ggcctgcgtg ctggcgctgg 780
gcaatatcag cgatcgcatg gagaagggct taagccagca aagccgtgag tttatggcgg 840
gcgatcgggc gttgcgcagt tcacgcgaag tgccgcaagc gtggctggag gaagcgcaaa 900
agcgcggcct gaaagtcggc aagcagctga ctttcgccac aatgaccttt gcaggcgaca 960
caccgcagct ggcgaacgtc aaagcggtgg atgatatcta cccgatgtat ggcgatctgc 1020
aaactaatcc ccctggcctg aaaccg 1046
<210> 24
<211> 1050
<212> DNA
<213> 人工序列
<220>
<223> 基因编辑同源性臂池_1_b1646_左
<400> 24
aaaatcgttg gcgtcgcgtt ggcgtggtta gcgttcgcca ttctgcgtcc aggatcggat 60
gctcgtaaaa gccgccgcca tattcgcgcg ctgcgccggg attttgtcga tcagctaagc 120
cgccatccaa cactgagtga aagcgaattt gaatcgctca cttatcatca cgtcagtcag 180
ttgagtaaca gccaggatgc gctggctcgc cgttggttat tacgctgggg tgtagtgctg 240
ctgaactgtt ctcatgttgt ctggcaattg cgcgactggg aatcgcgttc cgatccgtta 300
tcgcgagtac gggataactg tatttcactg ttgcggggag tgatgagtga gcgtggcgtt 360
cagcaaaaat cactggcggc cacacttgaa gaattacagc ggatttgcga cagccttgcc 420
cgtcatcatc aacctgccgc ccgtgagctg gcggcaattg tctggcggct gtactgctcg 480
ctttcgcaac ttgagcaagc accaccgcaa ggtacgctgg cctcttaatt acttaattac 540
accacaggca tagcgttcac cgccaccgcc cagcggttta ggttgatcgg acatattatc 600
gccgccaacg tggaccatca gcgctttgtc tttgatttca tccagtgatt tcagacgagg 660
cgcgatgacg gcatcggtag ctttgccgtc attattgacg accagtgcag gcagatcgcc 720
taaatgcccg gcaccttctg gcccttcatg tttaccggta ttttgtggat caagatgccc 780
gcctgcggat tccgcggcgc tggctttgcc atctttggtg gctggctggc agcttccttt 840
ggcatgaata tggaagccat gttcaccggg gggtaatgct ttcagatcgg gcgaaaactc 900
cagaccttta tcggtttcag taatggtgac gctaccaatt gactgcccta ccccttgcga 960
cgtgacgagg ttcatctcga ctttttcact ggcagcttgt gcgccggttg caacaaccag 1020
cgccagaata gccagactaa aacgtttcat 1050
<210> 25
<211> 1050
<212> DNA
<213> 人工序列
<220>
<223> 基因编辑同源性臂池_1_b1646_右
<400> 25
ttacggtacg tcgtacccca gtgccgcttt acggatacga aaccattgtt gacgggtcat 60
tttcagtgtt tctgcttcga cagctgcccg tacgcgctca attttacctg aaccgataat 120
tggcagcggc tgcgatggta aacgtaatac ccaggcgtaa accacctgtt caatcgagcc 180
cgcgtttaac tcctctgcca ccacagccag ttcatcacgc agcggctgga aataatcatc 240
attaaacaga cgaccaccac caaggcagga ccacgccatc ggacgaacac gcagttgttg 300
tagttggtcg agcgtgccat ccagcagtaa cggctgatgc accggggata tttccacctg 360
attagtggca agggtaaacg gcagacgtga ttgcaacagg gcaaattgcg caggcgtaaa 420
gttcgatacg ccaaaatgac gcactttgcc gctctgatgc agatgtttga acgcgtccgc 480
cacttcatcg gcatccatta acgggtctgg tcggtggatt aacagcaaat ccagatgatc 540
ggtcgcgaga ttaattagcg actgttcggc gctcttaatg atgtgatcgc ggtcagtgat 600
gtaatgacca atgacgtttt cttcacgcgc ggtcgtcgcg ataccgcatt tactgacgat 660
ttccatccgt tcacgcaggt gaggtgccag tttcagtgcc tcgccaaacg ccgcttcgca 720
ctgatagcca ccataaatat cagcatggtc cacggtggtc acgccgagat ccagatgctc 780
ttcaataaaa ctgaccagct ggcgggcgga catattccag tccatcaatc gccagtagcc 840
catcacaaaa cgggaaaact ccgggccttg cggcgcaata gtaatacgct gaaccataat 900
cgcttcctct tatcagatat gagaggagta tacgcaagat taggttcaaa agagtgatgg 960
ttgctccggt tcgtctgatg acgctggctt atttgcgcgt aatttgcgca ttaatcgctg 1020
ccgacaaagg cgcagcacct cttgtttttc 1050
<210> 26
<211> 1050
<212> DNA
<213> 人工序列
<220>
<223> 基因编辑同源性臂池_1_b3189_左
<400> 26
attgctttcg atttcggcgt gcgcgcccat acggctcagc tctggcacat gcataaagcg 60
gttttcaaag accgtttcgg tgataaaccc ggtcccttct gccaccaggt tcaacagcgt 120
gaactgggcc tgcatatcgg tcgggaatgc cggatgcggc gcggtacgta cgttaacagc 180
cttcggacgt ttgccatgca tatccaggct aatccagtct tcgccgactt cgatgtccgc 240
tccagcgtca cgcagtttcg ccagcacggc gtcgagagta tctggctgcg cgttacggca 300
gataattttg ccgcgagaaa tcgccgccgc caccaggaaa gtaccggttt cgatacgatc 360
cggcagaacg cgatagacac cgccgcctaa acgttccaca ccttcgatga cgatacgatc 420
ggtgccctga ccgctaattt tcgcacccag cgtaatcagg aagttcgcgg tatcgacgat 480
ttccggttca cgcgctgcgt tttcaataat cgtggtgcct tccgccaggg ttgcagcaca 540
catgatggtc accgttgcgc caacgctgac tttatccatc acgatatgtg cacctttcaa 600
acgaccatcg acggaagctt taacgtaacc ttcttccagt ttgatggtcg cgcctaattg 660
ttcgaggcca gaaatgtgta gatcaaccgg acgcgcaccg atcgtacaac cgccaggtag 720
tgaaacttgc ccctgaccaa agcgcgctac cagcggcccc agcgcccaga tagaagcacg 780
catggtttta accagatcgt aaggtgcgca gaatacatta acgtcgcggg catcaatatg 840
cacagaacca ttacgttcta ctttcgcacc cagctggctt agcagcttca ttgatgtatc 900
gacgtctttc agtttcggga cgttctggat ctctaccggt tcttccgcca gtagtgcggc 960
aaaaaggata ggcagagcag catttttagc gccggaaatt gtgacttcgc cctggagctt 1020
cgttggcccc tgaacacgaa atttatccat 1050
<210> 27
<211> 1050
<212> DNA
<213> 人工序列
<220>
<223> 基因编辑同源性臂池_1_b3189_右
<400> 27
ttagtttgtt ctcagttaac aattcatatc cgctaccggc gaatcgccca tagctcaaaa 60
gccgttcagt ttgcgatcgc gcgcccactc cgcaggggta tacgctttga tcgacacagc 120
atgaatgcgg ttatccgcaa tatattccat cagcggacca tagaccgtct gctgtttttt 180
aacccgactc atgccgtcaa acaactcacc cacggcaata acctgaaagt ggctgccatc 240
gccggaaacg tggacttcct ggagggagag agcgttcatc aacacgctct gaatttcatt 300
attttccatg ggatcttcaa tcatcagtta ataaaccagc gaaacatctt agagcaaagt 360
tgcgctggca taaataagca aaaagcctcg ctgataaatc agacaaggct cgacttgcag 420
gcaggtttgc cggacaggcg gttaacgcca tatccggcct gaaaaaattt aacgaggcag 480
aacatcagca ggcaaattat acaatttcgc cagggtatac actttgtcgt ttaccccctg 540
aagcgtcaca ttgttgccct gctttttcgc cagatcgata agatggagca gcagtgccag 600
tccccccgta tccacgcggg agacacggct aagatcgatg caggtaatcc ccttcaccgc 660
ttcctcacgc atttcccaaa gcggtagcaa aacgtcctga tccagctctc cggataacgc 720
cagcgtgtca cccgtctgca tccagctcag tgactcgctc attatttttt ctcttccaga 780
gtgattttct gttgagaaat cgatttcagt tgcgcagtca ggccgtcgat acctttggta 840
cgcagcagcg ttccccactc gttttgtttg gtggtgatca tactgacgcc ttcagcaatc 900
atgtcgtaag cctgccaatt gcccgtctgg gagtttttac gccactggaa gtccagacgc 960
accggcggac ggccattcgg gtcaataatg gtaacgcgaa taggcacaat ggttttatcg 1020
cccagcggct gttctggcgc aatctgatag 1050
<210> 28
<211> 1048
<212> DNA
<213> 人工序列
<220>
<223> 基因编辑同源性臂池_2_b3125_左
<400> 28
gcgcaacctc gctggcagat aaactttctt tataagagtc tggggcgatt acgattttca 60
tacctatgcc tgttaccaca tgacgccgga gggcgtttct cttattcggc ctggattcca 120
ggcccggatt gcaatacgcc atccgggcac gacgtcatta acgagtaact tcgactttcg 180
ccagtttttc gtagtagcac gccagggcgc tatgatccgc cgttcctaaa ccatctgctc 240
gcagtgcctg catcatctcc ataaccgcag ctgtgagcgg cagttgtgcg ccgacgccgt 300
gagaagtatc cagcgcattc gccagatcct taatatgcag atcaatacgg aagcccggct 360
tgaagttgcg gtccatcacc atcggcgctt tggcatccag cacggtactg cccgccagtc 420
caccgcgaat tgcctgataa accaggtccg ggttaacgcc cgctttagtt gccagcgtta 480
acgcttctga catcgcggca atattcagcg ccacaatgac ctgatttgcc agtttggtga 540
cgttacctgc accgatttcc ccggtatgca ccacggaacc cgccatcgct ttcatcaaat 600
catagtattt gtcgaaaata gccttgtcgc cgcccaccat cactgacagc gtaccgtcga 660
tggctttcgg ttcaccgccg ctcaccggag catccagcat atcaatgcct ttcgctttca 720
gcgcttcgct gatttcacgg cttgccagcg gtgcgataga actcatatcg atcaataccg 780
tacctggctt cgcgccttca ataatgccat tctcacccag cgccacctct ttcacatgag 840
gggagtttgg cagcatggtt atgatgacgt cgcactgttc agcgatcgct ttagccgtag 900
acgctgtttc tgcacctgca gcaatcacgt cagcaatagc ttctgggtta cggtcagcaa 960
ccaccagcga gtaacctgct ttcagaaggt ttttactcat tggtttaccc ataatcccca 1020
ggccaataaa accaactttc atagtcat 1048
<210> 29
<211> 1050
<212> DNA
<213> 人工序列
<220>
<223> 基因编辑同源性臂池_2_b3125_右
<400> 29
atcaatcatc tctcttgttg cggtggtggt tattttttaa aggtatcagc cagtttctga 60
gtggcagagc ggaagacgcc gagatcgctg ccgacagcca caaacgtcgc gccccattcc 120
agataacgac gcgcatcggc ttcgaccggc gcgaggatac cgctgggttt gccgtgcgcg 180
ctggcacggt taaaaatgtg ctgaattgct ttttgtacat ccgggtgtga tgcattgccg 240
agatggccta atgccgcggc cagatcgctg gggccgacga agatgccgtc tacgccttcg 300
gtagcggcaa tggcatcgac gttatctacg ccctgctgac tttctatctg gaccagaata 360
gtgatgttct tgttcgactg agcgaaataa tccgccacgg tgccaaacat attggcgcgg 420
tgagaaacgg agacgccgcg aatgccttcc ggtgggtaac gggttgatgc caccgccagc 480
tctgcttcct cttttgtttc tacaaaagga atcaggaagt tatagaaacc gatatccaga 540
agacgcttaa taattaccgg ctcgttggtc ggcactcgca ctactggcgc gctggcgctg 600
cctttcaagg ccattaactg cggaataaac gtggagatat cgtttggcgc atgttcgcca 660
tccagcacca gccagtcaaa cccagccaaa ccaagaactt cagtgctaat cgggttagag 720
agtgctgacc agcaaccaat ttgtacctgt ttcgcagcca gtgcggcttt gaatttattc 780
gggaaaacat cgttattcat cgcttatacc tttgcttatt tctgcaattc catacgttta 840
atgtcgccaa ctacgaagag gtagcagacc atcgccatca gcgctgaaca tcccacgaaa 900
accagtgctg cattgaagga gtgcagttca cttaccaggt agccaatcac cagtggagtg 960
acaatggagg caacattgcc aaagacgtta aagacgccgc cgcagaggcc aacaatctct 1020
ttcggcgcgg tgtcagaaat caccggccag 1050
<210> 30
<211> 1050
<212> DNA
<213> 人工序列
<220>
<223> 基因编辑同源性臂池_2_b3787_左
<400> 30
ggcgatcagt tcagcgattt ccatcgccgg gctttcgcgc aggtcatcaa tattcggttt 60
aaacgccaga ccaaagcagg cgattttcag ttcactggcg cgtttatcgg tagccgccag 120
gcaatcagcc accgccgctt tcacctgatc gataacccag aacggtttgt gatcgttcac 180
ttcgcgcgcg gtacggataa gccgcgcctg ctgggggttc tgtgccacga taaaccacgg 240
atcaacagca atgcagtgac cgcccacgcc agggccaggc tgaagaatat taacgcgagg 300
gtgacgattc gccaggcgaa tcagttccca gacgttaatc ccctgatcgg cacaaatcag 360
cgacaattca ttagcaaaag cgatattcac atcgcggaag ctgttttcgg tgagcttaca 420
catttccgcc gtccgcgagt tagtgacgac acactcacct tcgaggaaaa ttttgtacag 480
ttcgctggcg cgggccgaac aaaccggcgt cataccacca atcacgcgat cgtttttaat 540
cagctcgacc attacctgtc ctggtaacac gcgttccggg cagtaagcaa tgttgacgtc 600
cgcctgctcg cccacctgct gcgggaaagt gagatccgga cgcatctctg ctaaccattc 660
tgccatcttc tcggttgacc ccaccggcga ggtggattca aggatcacca gcgcgccttt 720
tttcagcact ggcgcaatgg agcgagcagc cgattcaacg taggtcatat ctggctcatg 780
atcgccctta aacggcgtgg gtacagcaat cagccaggca tccgcttcaa ctggcgtcgt 840
gctcgctcgt aaaaaaccgc cttctacggc agtttttact acactcgcca aatcaggttc 900
gacgatatgg atttcgccac gattgatggt atcaaccgca tgttggttga tatcgacacc 960
aattacctgt ttttgccgtg aggcaaacgc tgctgccgtt ggcagcccga tataacccag 1020
tccgataaca gaaatggtcg caaaactcat 1050
<210> 31
<211> 1050
<212> DNA
<213> 人工序列
<220>
<223> 基因编辑同源性臂池_2_b3787_右
<400> 31
agtgatatcc gattattttt taacgcttcc agaatgcgag agcatgcctg accatcacca 60
tacgggttat gggcgcggct catagcttga tattcgtttt cgtcttttaa aagacgcgtc 120
acttcctcga caattcgctg cttatccgtg cctaccagac gcaccgtacc cgccgtcacc 180
gcttccggac gctcagtggt atcgcgcatc accagcacag gtttccccag cgaaggcgct 240
tcttcctgaa tgccgcctga gtcggtcaaa atcagccagg cgtggttcat cagccagaca 300
aacggtaaat actcctgggg atcgatcaga atgacatttt tcacatgccc cagaatgcga 360
ttgaccggtt ctctgacgtt cgggttgaga tgcaccggat agacaatctg gatgtcctgg 420
tgcgtggtgg cgatgtctgc cagcgcgtgg cagatttctt caaagccacg accgaaactc 480
tcacgcctgt gaccggtcac cagaatcatc tttttatcgg ggtcgataaa cgggtaattt 540
gccgccagtt ctgaacgcag cttgtcgctg ctcatcacct ggtcacgcac ccataacagt 600
gcatcaatga ctgtattacc ggtaatgaag attcggctat ccgcaacgtt ttcacgcagc 660
aagttttgcc gggaagtttc ggttggagag aagtgataca tcgccagatg cccggtcaat 720
gtacggttag cctcttccgg ccacggcgaa tagagatcgc ccgtgcgcag accagcctca 780
acgtgaccaa caggaatacg ctgataaaac gccgccaggc tggttgccag cgtcgtcgtc 840
gtatcgccgt gaaccagcac gacgtctggt ttgaactcgg caagaatagg ttttagccct 900
tccagaatcc gacaggttat ctctgtcagg ccctgtcctg gctgcattat gttgagatcg 960
tagtcaggta caatggaaaa gagtttcagc acctgatcga gcatctcccg atgctgcgca 1020
gtgacgcaaa ctttagcctc aaaaaaagga 1050
<210> 32
<211> 1050
<212> DNA
<213> 人工序列
<220>
<223> 基因编辑同源性臂池_2_b1948_左
<400> 32
aactggcgcg ataacctggt gcgccaggtg cagcattcac agctggagct ggtcgccaac 60
tttgccgata tctcgctacg cctgtcgcag attttaaaac tgaaccccgg cgacgtcctg 120
ccgatagaaa aacccgatcg catcatcgcc catgttgacg gcgtcccggt gctgaccagt 180
cagtatggca ccctcaacgg tcagtatgcg ttacggatag aacatttgat taacccgatt 240
ttaaattctc tgaacgagga acagcccaaa tgagtgacat gaataatccg gccgatgaca 300
acaacggcgc aatggacgat ctgtgggctg aagcgttgag cgaacaaaaa tcaaccagca 360
gcaaaagcgc tgccgagacg gtgttccagc aatttggcgg tggtgatgtc agcggaacgt 420
tgcaggatat cgacctgatt atggatattc cggtcaagct gaccgtcgag ctgggccgta 480
cgcggatgac catcaaagag ctgttgcgtc tgacgcaagg gtccgtcgtg gcgctggacg 540
gtctggcggg cgaaccactg gatattctga tcaacggtta tttaatcgcc cagggcgaag 600
tggtggtcgt tgccgataaa tatggcgtgc ggatcaccga tatcattact ccgtctgagc 660
gaatgcgccg cctgagccgt tagtgatgaa taaccacgct actgtgcaat cttccgcgcc 720
ggtttctgct gcgccactgc tgcaggtgag cggcgcactc atcgccatta ttgccctgat 780
cctcgctgct gcctggctgg taaaacggtt gggatttgcc cctaaacgca ctggcgttaa 840
cggtctgaaa attagcgcca gtgcttcact gggcgcgcgt gaaagggttg tggtggtcga 900
tgtggaagat gcacggctgg tgctcggcgt taccgcaggt caaatcaatc tgctgcataa 960
acttccccct tctgcaccaa cggaagagat accgcagacc gattttcagt cggtcatgaa 1020
aaatttgctt aagcgtagcg ggagatcctg 1050
<210> 33
<211> 1050
<212> DNA
<213> 人工序列
<220>
<223> 基因编辑同源性臂池_2_b1948_右
<400> 33
atgcgtcgtt tattgtctgt cgcacctgtc cttctctggc tgattacgcc cctcgccttc 60
gcgcaactgc cgggtatcac cagccagccg ctgcctggcg gtggacaaag ctggtcgctc 120
ccggtgcaga cgctggtgtt catcacctcg ttgacgttta ttccggcaat tttactgatg 180
atgaccagtt tcacccgcat catcattgtt tttggtttat tgcgtaacgc gctgggaaca 240
ccctccgcgc cacctaacca ggtattgctg gggctggcac tgtttttgac cttttttatt 300
atgtcaccgg tgatcgacaa aatttatgta gatgcgtacc agccattcag cgaagagaaa 360
atatcaatgc aggaggcgct ggaaaaaggg gcgcagccgc tgcgtgagtt tatgctgcgt 420
cagacccgtg aggcagattt agggttgttt gccagactgg cgaataccgg cccgttgcag 480
ggacctgaag ccgtgccgat gcgcattttg ctcccggcct acgtgaccag cgagttgaaa 540
accgcatttc agataggctt cacgattttc atcccttttt tgattatcga cctggtgata 600
gccagcgtgt tgatggcatt ggggatgatg atggttcccc cagccaccat tgctctgccc 660
tttaaactga tgctgtttgt actggtggat ggctggcaat tgctggtcgg ttcgctggcg 720
cagagctttt acagctagag aggcaaaatg acacctgaat cggtcatgat gatggggact 780
gaagcgatga aagtcgcgct ggcactggct gccccgctat tgttggtagc gttggtcacg 840
ggccttatca tcagtatttt gcaggccgcc acgcagatta acgaaatgac gctgtcgttt 900
attccgaaaa tcatcgccgt atttatcgcc attattattg ccggaccgtg gatgctcaat 960
ctgttgctgg attacgtccg caccttgttc actaacctgc cgtatatcat cgggtagccg 1020
tactatgttg caggtgacaa gcgaacaatg 1050
<210> 34
<211> 1050
<212> DNA
<213> 人工序列
<220>
<223> 基因编辑同源性臂池_2_b2790_左
<400> 34
ccacgggatc aaggccgata tctttggcca tttccgaacc ggcgatagag agcgtagcgc 60
ggtcgccgta gttgaaggat gtgacgataa acaacatcac cactatccag taacgagcat 120
ttgtgcgttt ttccacactg ctcgcagcct gacttaaaga actcattgtt gcactcctga 180
aaattcgcgt tagccacgct cactctggac tgcgacatcg ccaggaaatc agaggtgacg 240
tagggtgttt tttgccgttt ttataggtcg ttcgccgaat acggcgcgtg tttatatctg 300
gcaatagcag tataaaaagc gcgccatagc ggctcaccgt gcaacaacac aacattaatg 360
cgttcaatga ggcccgattt tggcattagc cctggacggt ggaatccact tcacggaaat 420
gaaaacaaga acaagaaagg aagggttaaa acgaagaaat aaagaagagt atgaaatgga 480
tcgcttgact ccaggcaaac gccagtaaaa atccgcgcta tgaagcagtt tttactggca 540
tttgcctgaa aagattcgat tcagcaccgc taaaacgaca tttaccgctc gctgaacata 600
tcaggacaac agcgtgcccc actgttcgac ccacggattt gattccgttt ccggttccgg 660
gttctcactg gcgtcaatca acagcatttc gccaacccgc tgagcgctct gttcctgcaa 720
caaggcatcg aactgtttgc cgccattgca gaaattcaca taactactgt cgccgagcgc 780
aatcacgcca taacgcagat tcggctggaa gcccagacta tctttgattc cctgaaagag 840
tggcacaatg ctatcaggaa ggtcgccctg cccggtcgtg gacgtaacca ccagaacata 900
cttatcctga tagggcagcc agtcgcttaa ttcaggatct tcaaataccg ttgctttgtg 960
gccctgcgcg gtcagaatcg cttccgcttc ttcggccact aacagtgaat tcccgtacat 1020
ggtgccgaca aaaataccaa tttccgccat 1050
<210> 35
<211> 1050
<212> DNA
<213> 人工序列
<220>
<223> 基因编辑同源性臂池_2_b2790_右
<400> 35
accgttttct ccctggatta ggaacttatc tctccatcct gacccgatgg cgcactgaac 60
tcaacccttt cattttcagg aagcagaccg cgccagccaa attgtgataa cgcctgcatc 120
caggtgtcgt ccaggcccgc gtgaatagtc agcggctcgc cagtaaaagg atgcgtcaat 180
gacaactgac tggcatgtag cattaaccgc tggaggccaa aatgctcagc accgctgcga 240
ttctggcgta aatcgccatg tttgctatcg ccaataatcg gatgacgcaa atgggcaaga 300
tgtcggcgaa gctgatgttt gcgtccggtt ttcggctcca gttccaccag gccgtagcgc 360
gtggtcgggt aacgtccggt cgctaccggc atttctacgg tcgccagacc gcgataatgc 420
gtcactgctg gctgcgggcc tttatcttcg cgggcaaatt tatcagcgat tttgtccagt 480
tcttccacca gtggataatc cagcaccgct tcttccatca accagccgcg cacaatcgca 540
tggtaacgtt tctggatttg gtgctgttca aactgttgtg ccagcagccg tccggcctcg 600
ctggataatc ccatcaacaa cacaccagaa gtgggtcggt ccagacgatg agcagtaaaa 660
acatgctggc ctatctggtc acgcacggtt tgcatgacca ctactttctc gtcgcgatcc 720
agccagctgc ggtgaaccag ccagccggag ggtttattta ccgcaaccag ccattcatcc 780
tgatagagta tttccagcat tagctcgcat catccgcaaa aagagcatcc agtttttcca 840
gctcagccag aataagcgcg cgttgcggat ggtccgtcgc cagcgccatt tcataatagg 900
gtgcaacggc aaaagcgccc ggtaacggct gtttgttatc taacaaatcg tgcattcgcg 960
ggatcagcac ccactgcaac cactccagtg gttccatggt gtccataaag aacggttggg 1020
tactattaaa ttgatgcggc tggggttcat 1050
<210> 36
<211> 1050
<212> DNA
<213> 人工序列
<220>
<223> 基因编辑同源性臂池_2_b3197_左
<400> 36
ttacggcttt ctgaaaatct tcagcggacc ggcgagtata cctgaagaaa ggacgttaga 60
tgcttttagc tacggcactg ttaattgttg gtttactttt ggtcgtttac agtgccgacc 120
gcctggtttt tgccgcgtct attctttgcc gaacctttgg catcccgccg ctgatcatcg 180
gcatgacggt ggtcagtatt ggtacatcgt taccagaagt catcgtctcg cttgccgcgt 240
ctctgcacga acaacgcgat ttagccgttg gtacagccct cggctcaaac attatcaata 300
tattgctgat cctcggtctg gctgcgctgg ttcgtccttt taccgtccat tctgatgttc 360
tacgccgtga attaccctta atgttgttgg tcagcgtggt ggccggttcc gtactctatg 420
acggacaact tagtcgcagc gatggtatct ttctcctctt tctggctgtg ctatggctgc 480
tgttcattgt taaacttgca cgtcaggctg aacgtcaggg gactgacagc ctgaccagag 540
agcagcttgc agagctgccg cgtgacggcg gattgcccgt cgcgttttta tggctcggca 600
ttgcgcttat catcatgcca gtggccacgc ggatggtggt tgataacgcc acggtgctgg 660
cgaattactt tgccatcagc gagttgacga tgggtctgac ggcaattgct atcggaacca 720
gcctgccgga actggcaacc gcaatagcgg gggttcgcaa aggtgaaaac gacattgctg 780
tcggaaatat cattggcgca aacattttta atattgtcat cgtgttgggt ttacccgcgc 840
tgataacgcc aggagagatt gatccactgg cgtacagtcg tgactacagc gtgatgttgc 900
tggtgagcat tatttttgcg ttgctgtgct ggcggcgctc cccgcaaccg ggccgtggtg 960
taggggtatt attaactggc ggatttatcg tatggctggc gatgttgtac tggttatcgc 1020
caatactcgt tgaataactg gaaacgcatt 1050
<210> 37
<211> 1043
<212> DNA
<213> 人工序列
<220>
<223> 基因编辑同源性臂池_2_b3197_右
<400> 37
atgtcgcacg tagagttaca accgggtttt gactttcagc aagcaggtaa agaagtcctg 60
gcgattgaac gtgaatgcct ggcggagctt gatcaataca tcaatcagaa tttcacgctt 120
gcctgtgaaa agatgttctg gtgtaaaggg aaagttgtcg tcatggggat gggaaaatcg 180
gggcatattg ggcgaaaaat ggcggcaacg tttgccagca ccggtacacc ttcatttttc 240
gtccatcctg gtgaagccgc gcatggtgat ttaggcatgg ttaccccaca ggatgtggtg 300
attgctatct ctaactctgg tgaatccagc gaaatcacgg ccttaattcc agtgcttaag 360
cgtcttcacg taccgttaat ctgcatcacc ggtcgcccgg agagcagcat ggcgcgcgcc 420
gcagatgtgc atctgtgtgt taaagtagcg aaagaagcct gtccgttagg gctggcaccg 480
accagcagca ccaccgccac gctggttatg ggcgatgccc tcgctgtcgc gctgttaaaa 540
gcacgcggct ttactgctga agattttgcg ctctcacacc caggcggcgc actgggtcgt 600
aaacttctgc tgcgcgtaaa cgatattatg catacgggcg atgagatccc gcatgttaag 660
aaaacggcca gtctgcgtga cgcgttgctg gaagttaccc gcaaaaatct tggtatgact 720
gtcatttgcg atgacaatat gatgattgaa ggcatcttta ccgacggtga tttacgccgt 780
gtcttcgata tgggcgtgga tgttcgtcag ttaagtattg ccgatgtgat gacgccgggg 840
ggaatacgtg tgcgccctgg cattctggcc gttgaggcac tgaacttaat gcagtcccgc 900
catatcacct ccgtgatggt tgccgatggc gaccatttac tcggtgtgtt acatatgcat 960
gatttactgc gtgcaggcgt agtgtaaaga ttcaaggata aacaacaatg agcaaagcag 1020
gtgcgtcgct tgcgacctgt tac 1043
<210> 38
<211> 1047
<212> DNA
<213> 人工序列
<220>
<223> 基因编辑同源性臂池_2_b3791_左
<400> 38
gcgctcgctc tctttggtgg tgtagcgatc ttcaccgtgg aactcaccaa agtgttcccc 60
cgcagggcaa ccgtgcagcg gaatgtaatg aaacaccgcc atgatttccg cttctttcag 120
aaagttaatc aacgcgctcc ggtcatcaat atcccgcagt ttaatgtaga acatatgcgc 180
gttctgcacg cagccatcgg gaatcgacgg cagctcgata cgcccggctt tcgccagagg 240
cgctaacgca tcgtagtagt tttgccacag cgccagacgt tgctggttga tacgatccgc 300
tgcttccagt tgcgcccaca ggtatgcagc ttgcagatcg gacatcaaat agctggagcc 360
aatatcgcgc caggtatatt tatcgacctg accacggaag aactggctgc ggttagtgcc 420
cttttcacgg atgatctcgg ctcgttcgat taacgcttta tcgttaatca gcgtcgcgcc 480
gccttcaccg cccgccgtgt agtttttggt ttcatggaag ctaaagcagc caatatgacc 540
aatggttccc agtgcacgcc ctttgtaagt ggacatcacg ccctgagcgg catcttctac 600
cacaaacaaa ttatgctttt tcgccaacgc cataatggtg tccatttcgc aggccacacc 660
cgcgtaatgg accggcacga taacgcgcgt tttgtcggtg atcgccgctt caatcagcgt 720
ttcgtcgatg ttcatggtgt ccgggcgaac atccacaaaa acgatttttg cgccacgcag 780
cacaaaggca ttggcggtgg agacaaaggt gtagctcggc atgatcactt catcgccagg 840
ctggatatcg agcagcagcg ccgccatctc cagcgaagcg gtgcaggacg gcgtcagtaa 900
cactttggcg ctgccaaaac gttgctccag ccactgctgg cagcgacggg taaaaccgcc 960
atcgccacac agtttgccgc tacccattgc cgactgcata tagtcgagtt cggttcccac 1020
caccggcggt gcgttaaatg gaatcat 1047
<210> 39
<211> 1048
<212> DNA
<213> 人工序列
<220>
<223> 基因编辑同源性臂池_2_b3791_右
<400> 39
gtgatcacct gtataaccag tacgcggtgc tttctacatt cgcaccactt tgtatgtatc 60
gtttaagcgc ggcggtgttg cccatttggg tcgccacccg caaagttgtt ttaccgcgag 120
catacgccca gtttagcgcc gtttgcatca gctcagcacc tgcaccgcgt ccagccagca 180
ggccaattcg cgcatctgtc gcattgagtt cccgtaaaga gacatagccg cgaatatcgc 240
cggacgccgc acgtaaaatc agacattgat gatcaaaggt gccgcgcacg gcattttcaa 300
tccactgtgc ataaaagcga ctgctggcgt caggcgcata ccacggcgca cgaaaacggc 360
tttgcgcaaa tgcggcgctg gctaactgac gtaatgcggg aatatcggtc tcttgtgcca 420
ctacagcacc gctatcactg gcattgttca cgggtagcgc caaatcaact tcaccttcta 480
ccagggagaa tcccagctgt tgcagggcat ccagttcacc cgtatttgat gccgcaattt 540
tggcctgcac ccgtgaccac ggcgctaacg cgtctggcgt caggagcggt gcttcagacg 600
taatgcgcac gatggcgctg ttaacaccaa agaaggcgtt ttcccaggtt agtggctcaa 660
tactggcgcg gacgggcacg aagtaactcc agcagatatt ggccgtagcc agttttcgct 720
aatgaactgg cagcacgctt cacaccctcg tcatcgagcc agccgttacg ccaggcaatc 780
tcttccaggc aggcaatctt aaagccctgg cgtttttcca ccgtctgtac aaaggtgctg 840
gcttcaatca ggctgtcgtg agtgccggta tccagccagg caaatccgcg cccgagcagt 900
tcaacggtca ggttgcccgc ctcgaggtac atctggttga tggaggtaat ctccagttca 960
ccacgctccg acggcttcac ctgctttgcg tactccacga ctttactgtc gtagaaataa 1020
agcccggtca ccgcccagtt tgacttcg 1048
<210> 40
<211> 1050
<212> DNA
<213> 人工序列
<220>
<223> 基因编辑同源性臂池_2_b4260_右
<400> 40
gttcagcact tcaacggttt gaccggacat ggtggttaac acatcgcccg gacgataggc 60
tcgtccgcca ggcatgtttt cgcagcctgc caacacgccg ataacgttaa tcggcagttg 120
tagctccgcg accatccgca tcacgccgta aaccgctgcc gcaccgcaca tatcgtactt 180
catctcatcc atgccttctg aaggcttgat cgagataccg ccggagtcga aggttaaacc 240
tttacccacc agcacgattg ggcgtgcatc ttccgacgcg ttgcctttgt actcaatcac 300
cgacatcagc gattcgtttt gcgaaccctg accgaccgcc agataggaat gcatccccag 360
ctctttcatc tgctgttcgc cgataacgcg ggtgatgaca ttcttgctgt agctgtcagc 420
cagctggcgc gcttgtgaag cgaggtaagc ggcgttacag atattcggcg gcatattgcc 480
gagatctttt gctgctttaa tcccggcggc aatcgccaga ccgtgctgga tcgcgcgctc 540
accgctggtc agttcacggc gggtcggcac gttgaacacc atcttacgca gcggacgacg 600
cggttcgctc ttgttcgttt tcagctgatc gaaactgtag agcgtctctt ttgccgtctc 660
gacagcctga cgcactttcc agtagttgtt acggccttta acgtgcagct cagtcagaaa 720
gcagaccgct tccattgagc cagtatcatt cagcgtatta atggttttct gaataacctg 780
cttgtactga cgctcatcca gctcacgttc tttgccgcaa ccaataagga gaattcgctc 840
ggaaagtaca ttcggaacat ggtgcagcaa caatgtctgc cccggttttc cttccagttc 900
gccccgacgt agcagggcgc tgatgtaccc atcgctgatt ttatcgagct gttctgcaat 960
cggagaaagg cgacgtggtt cgaagacgcc cacgacgatg caggcactcc gctgtttctc 1020
cgggctaccg ctttttacac taaactccat 1050
<210> 41
<211> 1049
<212> DNA
<213> 人工序列
<220>
<223> 基因编辑同源性臂池_2_b4260_右
<400> 41
tttacgggcg tatttaaagt gataatcata agatatctgg tgcgggagac gctcaaaagc 60
cagctggcga tactcttcat cttgcttttg atcttcttct gtcaaaagtt agtgaggatc 120
ctcggcgcag cggttgacgg cgatattccg gcgaatctgg tgctctccct tctcgggttg 180
ggcgtgccgg aaatggcgca gcttatcctg ccattaagcc tgttcctcgg gctgctgatg 240
acgctgggca aactgtatac cgaaagtgaa attacggtaa tgcatgcctg cggcctgagc 300
aaagcggttc tggtgaaagc ggcaatgatc cttgcggtat tcacggcaat cgtagcggcg 360
gttaacgtga tgtgggcggg accgtggtca tcgcgtcatc aggatgaagt gttagcagaa 420
gcgaaagcga accctggcat ggcggcgctg gcgcaagggc aattccagca agcgactaat 480
ggcagctcgg tgctgttcat cgaaagcgtt gacggcagcg atttcaaaga tgtgttcctc 540
gcgcaaattc gaccaaaagg taatgcacgt ccttctgtgg tggtggccga ttccggacat 600
ttaacccagc tgcgcgacgg ctcccaggtc gtcactctca accagggaac gcgcttcgaa 660
ggcactgcat tgttacgtga tttccgcatt acggacttcc aggattatca ggcgatcatt 720
ggtcaccagg cggtggcgct cgacccgaac gataccgacc agatggacat gcgcacattg 780
tggaacactg acaccgatcg tgctcgcgca gaactgaact ggcgtatcac gttggtattc 840
accgtgttta tgatggcact tatggtcgta ccgctgagcg tggttaaccc acgtcaggga 900
cgcgtactgt cgatgctgcc agccatgctg ctgtatctac ttttcttcct gatccagacc 960
tccctgaaat cgaacggcgg taaaggtaag ctggacccga cgctgtggat gtggaccgtt 1020
aacctgattt atctggcttt agcgattgt 1049
<210> 42
<211> 1050
<212> DNA
<213> 人工序列
<220>
<223> 基因编辑同源性臂池_2_b0071_左
<400> 42
ggactggaaa taccagcaat gattctggct ggctactatg tcaaacgtta tggtaagcgg 60
cgaatgatgg tcatagcagt ggcggcagga gtactgtttt acaccggatt gattttcttt 120
aatagccgta tggcgttgat gacgctgcaa ctttttaacg ctgtatttat cggcattgtt 180
gcgggtattg ggatgctatg gtttcaggat ttaatgcctg gaagagcggg ggcagctacc 240
accttattta ctaacagtat ttctaccggg gtaattctgg ctggcgttat tcagggagca 300
attgcacaaa gttgggggca ctttgctgtc tactgggtaa ttgcggttat ttctgttgtc 360
gcattatttt taaccgcaaa ggttaaagac gtttgatgac gtggacgata gcggaaagcc 420
cggtcatttg accgggcaag gggattaatt cataaacgca ggttgttttg cttcataagc 480
ggcaatggcg tcgtcgtgct gcaaggtaag cccaatactg tccagaccgt tcatcatgca 540
gtggcggcgg aaggcatcga tggtaaagcg ataggttttc tctcccgctt tcacctcttg 600
cgcttccaga tccacgtcga aatggatccc cggattagct ttcaccagcg caaacagttc 660
gtccacttct gcatcgctta atttcaccgg cagcagctgg ttgttaaagc tattgccgta 720
gaagatgtca gcaaaactcg gcgcaatcac cactttaaaa ccgtagtcgg tcaatgccca 780
gggcgcgtgc tcacgcgaag agccacagcc gaagttttct cgtgccagca aaatggaagc 840
gccctgatac tgcgggaagt tcagcacgaa gtccgggttt ggctgttggc ctttttcatc 900
cagaaaacgc cagtcgttaa acagatgcgc gccaaaaccc gtacgggtca ctttctgcaa 960
aaactgtttc gggatgattg catcggtatc gacattggcg gcatccagcg gaaccaccag 1020
gcctgtgtgt ttgataaatt tctctgccat 1050
<210> 43
<211> 1050
<212> DNA
<213> 人工序列
<220>
<223> 基因编辑同源性臂池_2_b0071_右
<400> 43
ggtgtgctcc ttatttaatg ttgcgaatgt cggcgaaatg tccggtcaca gcagcagcgg 60
cagccattgc cgggctgacc agatgcgtgc gcccgccgcg cccctggcgg ccttcaaagt 120
tacggttgct ggtggaggca caacgttcgc ccggattcag acggtcgttg ttcatcgcca 180
gacacattga gcagccaggc aagcgccatt caaaaccggc ttcaataaag attttatcca 240
gaccttccgc ttccgcctgg gcttttaccg ggccagagcc gggaaccacc agtgcctgca 300
cgcctggcgc gacttttcgc cctttggcga tctccgctgc cgcgcgtaaa tcttcaatgc 360
gcgagttggt acaggaaccg ataaacactt tgtcgatagc cacttcggtc agcggaatac 420
ccggtttcag ccccatatag gccagcgctt tttctgccga cgcgcgttca accggatcgg 480
caaacgaagc cggatcggga atattgtcgt tcacggaaat cacctggccg ggattggtgc 540
cccaggtgac ctgcggtgaa atttcttctg cttgcagagt gacaacggta tcgaaagttg 600
cgccttcgtc ggtttgcagg gttttccagt aggcaacggc gtcgtcgaaa tctttgcctt 660
tcggcgcatg cagacggcct ttgacatagt taaaggtggt ttcgtccggt gcaaccagac 720
cggcttttgc gcccatttcg attgccatat tgcacagggt catacgacct tccatgctta 780
aatcacggat tgcttcgccg caaaactcca ccacatgccc ggtgccgcct gcgctaccgg 840
ttttaccgat aattgccagc acgatatctt ttgcggtaat gcccggcgcg gctttgccct 900
ggacttcaat tttcatggtt tttgcgcggc cctgtttcag ggtttgcgtt gccagtacgt 960
gttcaacttc ggaagtgccg ataccaaagg ccagtgcgcc aaacgcgccg tgggtggcgg 1020
tatgcgagtc gccgcagaca atggtcatcc 1050
<210> 44
<211> 1050
<212> DNA
<213> 人工序列
<220>
<223> 基因编辑同源性臂池_2_b1687_左
<400> 44
aatgttcagc ccgagcatct cttggtcagg cacatcggta atcaactcgc tgacggaatg 60
ccagacaata tcttcccgcg ccagattcag cacttttgag tccaccgtct ctaccgaaag 120
cgcccgcgcc tcaaccataa acggcgcgtt acgcagcgca gagtcaaaag agtcatattt 180
gacgttcacc agacggcgca ctttaggcaa gcgtgtaata tccagccgcg cttcggtaat 240
aaaggccagc gtcccttctg aacccgtcag aatgcgcgtc aggtcgaact cggtcatctc 300
atcgttaaag acatgacgca gatcgtaacc ggtaagaaag cggttaagtt tggggaagtt 360
gtcgataatt aactggcgtt gctgacggca acgttgataa accgtgttat aaattcgccc 420
gattgtggta ttggatttac ccagcgtttc cgccaattcg acgggtaaag gttgcgtatc 480
gagaatatcg ccccccaaca acaccgcgcg tacgccaagt acgtgatctg acgttttgcc 540
atagaccagc gatccctgac cggatgcatc ggtattgatc atcccaccga gcgttgcccg 600
gttgctggtc gaaagttccg gcgcaaaaaa gtagccgaac ggtttcaggt actgattgag 660
ttgatctttt atcaccccgg cctcaacgcg cacccagccc tcttcagggt taatttcgat 720
gatgcggttc atatggcggg acatatcaac aataatcccc tggttgagcg cctgaccgtt 780
agtgccggtg ccgccgccgc ggggggtaaa gatcagcgat gaatagcgtt cctgcgcggc 840
aagacgggcg atcagcgcca catctgcggt tgaacgcgga aataccaccg catcggggag 900
aagttggtaa atactgttgt cggtcgacat tgtcagacga tcggcataac ttgtcgccgt 960
atcgccggta aaaccttgtt gctccagctc ttgcaaaaaa ttaagcacca gttgaacgac 1020
gccgggtgcc tgggaaatct gtggaatcat 1050
<210> 45
<211> 979
<212> DNA
<213> 人工序列
<220>
<223> 基因编辑同源性臂池_2_b1687_右
<400> 45
tatattgacc ctttcctgcg gtctgtgatg taggtcgata cactattctt tcaggctgct 60
gcaatagcgc actgaaaggt gatgtttgtt tactctatgg atttcgtgtt gcaggaaggc 120
ggcaagcgag tgaactccag gagcttacaa tagtaagtga ctggggtgaa cgaacgtagc 180
cgcagcacat gcaacttgaa atacgacgag taaatcgttt gcgtgttgcc tgagttgttg 240
taccacattt ttttctaaca cgcccatcag aattaagggc agaatcggcc tgttaaaaac 300
cgctgaaatt gctcatcatt atgcaggtga gtttcgcgtg ttcacgtcgc gtcgacgatt 360
tgacgcacaa aaaaggtgaa aagtagttat ggtaaatgtt cgtcagccca gggatgtcgc 420
acaaattctg ctttcggtgc tgtttttagc catcatgatt gtggcatgtc tgtggattgt 480
tcaacccttt attctcggct ttgcatgggc cggtacggtg gttatcgcca cctggccggt 540
attgttacgt ttgcaaaaga tcatgtttgg ccgccgctct ctcgccgttc tggtgatgac 600
gctgttatta gtgatggtgt ttatcatccc tattgctttg ctggttaaca gtatcgtcga 660
cggcagcggc ccgctaatta aagccatttc cagcggtgac atgacgttac ccgatctggc 720
gtggcttaat accattccgg tgattggcgc gaagctgtat gcaggctggc acaacttgct 780
ggatatgggg gggacggcga tcatggcgaa agtccgccct tatattggca ccaccaccac 840
ctggttcgtt gggcaggcgg cgcatatcgg gcgctttatg gtgcattgtg cgctgatgct 900
tctcttcagt gccctgctgt actggcgcgg tgaacaggtg gcacaaggca ttcgccattt 960
tgcaacccgt ctggcaggc 979
<210> 46
<211> 1050
<212> DNA
<213> 人工序列
<220>
<223> 基因编辑同源性臂池_2_b1006_左
<400> 46
ggccggaatg gtatgaatca gcgcaccaaa tttcggtgaa aagcccaaca gcatggcgat 60
gacggcagca gcaacaaaca ccagcgtcga gtagactttg gtcacggcca tcacaccgat 120
attttcagca taggtggtca cgccgctacc gccgacagag ccggaaagca tcgttgccag 180
accatcgcct acgaatgccc gccccatata cgggtccata ttgcgtccgg tcatcccggc 240
gactgccttg agatgaccta agttttccgc caccagaatc accgccacgg gcgcaatcag 300
catcattgcc tgaccattaa aagcaggagt ggaaaaatgt ggcagaccga accaggcagc 360
atggctgacg agagtaaaat cgacggcttt tcccagccct aaaacgttgg tcatcacgcc 420
atacagcaga caggcgacaa ttaatcctac gagaatcaat aaccgctgga tcatgccacg 480
ggtaaacacc gccaccagcc caatacacag caccgtcatt accgccatcc agctatcaaa 540
ggccgaagcc gatacacttt tcactgcgat aggcgctaag ttcaggccaa tcgccatcac 600
caccgcaccc gtcaccaccg gcggcatcag tcgttcaatc cagcgcgtac cgattttcat 660
caccaccagg ccaatgacgg tataaaccag cccacaggcg ataatcccgc ccagcgcaat 720
gctgatattc gggttaatgc cctgaccgtt aaagcccgtc gcggcgatca ccacgccgac 780
aaaagccgcg ctggagccga gataactggg gacgcgcccg ccggtaataa agaaaaacag 840
taacgtgccg atccccgaca ttaaaatgga aagattggga tccagcccca tcagaatcgg 900
cattaacacc gtcgcgccaa acatcgccac cgcgtgttga acgcccatta ctgccgtctg 960
agcaaacggc aatcgttcat ccggcgcgac cacgccgctc tctgtagagg tcgattttaa 1020
ctgccagtga ggaaaaccga acattgccat 1050
<210> 47
<211> 1044
<212> DNA
<213> 人工序列
<220>
<223> 基因编辑同源性臂池_2_b1006_右
<400> 47
cagctgtctc cttaaggagg ttaacaagca gggcgcatca gcgcgtgata actgcgatcg 60
aaccacacca gcccgtaggg tgtggtgtga cgatgaatcg cttcgatggc gcaaaacaga 120
atgtcgtggg tgccgacgct caccacctgg ctgatacggc agtcaaacga aaccagagcc 180
tcttccagtt gcgggcatcc ggtcaccccc gtctgccagc gggcggcggc aaagcggtgt 240
tccatgggcg ttttgccgcc aaaaaggttt gaaagcggct cctgcccggc gctaagtgta 300
tttacacaca gcgttcgatt ttcattgaat gccggccaga cggacgcccc acgattcagg 360
cacaccagta atgtgggcgg cgtatcggtc acactgcaga cggcgctggc ggtgaacccg 420
gcgcgcccgg ctggaccgtc cgtggtgata atattgaccg ccgcgcccat gcaggacatc 480
gcatcgcgaa aagtttgttg atcgacaatg ttcatagttt gctccttaca acagcccgca 540
ggcttcttca aaggacagac gtggcaggcg cgcataaagc ttgctgctat cgccatagcc 600
gatattaatc agcagattgc tcttcagcgt gctgcccgta aaaaaggcgt cgtccacgtg 660
ttgacggtca aagcccgaca tcgggccggt atccagtccc agcgcccggc aggcgacgat 720
cagataggcc gcctgcatgg aactgttgcg aaacgctgtt tcttcggcaa gttgtgggct 780
ggaggtaaac caactgcggg catcaccgtg gggaaacagt agtggtaacc gttcataaaa 840
ttcactgtcc caggcgacga tagcggtgac gggcgcggtc agggtttttt gcagattgcc 900
gctggaaagt gccgggcgca gacgttcttt tccttctgcc gtgcgggtaa acacgatccg 960
tgccggagaa cagttagctg atgtcggccc ccatttcatc agggcataaa tctcccgtaa 1020
cgtctcatcg ctgacgggtg tctc 1044
<210> 48
<211> 1050
<212> DNA
<213> 人工序列
<220>
<223> 基因编辑同源性臂池_3_b0335_左
<400> 48
atgatcaaag cccatgaaat tcagggctgc atcgcgctgg aaaactcctt taaccgcgtc 60
ggcctcgacc acgttctgtt agtgaaagtg gcttccaccg ccgtggtcgc cgaaatgctc 120
ggcctgaccc gcgaggaaat tctcaacgcc gtttcgctgg cgtgggtgga cggtcagtcg 180
ctgcgcacct atcgccatgc gccgaacacc ggcacgcgta aatcctgggc ggcgggcgat 240
gccacttccc gcgcggtacg tctggcactg atggcgaaaa cgggcgaaat gggttacccg 300
tcagccctga ctgcgccggt gtggggcttc tacgacgtct cctttaaagg tgaatcgttc 360
cgcttccagc gcccgtacgg ttcctacgtt atggaaaatg tgctgttcaa aatctccttc 420
ccggcggagt tccactccca gacggcagtt gaagcagcga tgacgctcta tgaacagatg 480
caggcagcag gcaaaacggc ggcggatatc gaaaaagtga ccattcgcac ccacgaagcc 540
tgtattcgca tcatcgacaa aaaagggccg ctcaataacc cggcagaccg cgatcactgc 600
attcagtaca tggtggcgat cccgctgcta ttcgggcgct taacggcggc agattacgag 660
gacaacgttg cgcaagataa acgcattgac gccctgcgcg agaagatcaa ttgctttgaa 720
gatccggcat ttaccgctga ctaccacgac ccggaaaaac gcgccatcgc caatgccatt 780
acccttgagt tcaccgacgg cacacgattt gaagaagtgg tggtggagta ccccattggt 840
catgctcgcc gccgtcagga tggtattccg aaactggtcg ataaattcaa aatcaatctc 900
gcgcgccagt tcccgactcg ccaacagcag cgcattctgg aggtttctct cgacagagct 960
cgcctggaac agatgccggt caatgagtat ctcgacctgt acgtcattta agtaaacggc 1020
ggtaaggcgt aagttcaaca ggagagcatt 1050
<210> 49
<211> 1050
<212> DNA
<213> 人工序列
<220>
<223> 基因编辑同源性臂池_3_b0335_右
<400> 49
atgtctttta gcgaatttta tcagcgttcg attaacgaac cggagcagtt ctgggccgag 60
caggcccggc gtattgactg gcagacgccc tttacgcaaa cgctcgatca cagcaatccg 120
ccgtttgccc gttggttttg tgaaggccga accaacttgt gccacaacgc catcgaccgc 180
tggctggaga aacagccaga ggcgctggcg ctgattgccg tctcttcgga aacagaagaa 240
gagcgcacct ttacctttcg tcagctgcat gacgaagtga acgcggtggc ctcaatgttg 300
cgttcattgg gtgtgcagcg cggcgatcgg gtgctggtgt atatgccgat gattgccgaa 360
gcgcatatta ctctgctggc ctgcgcgcgc attggcgcta ttcactcggt ggtgtttggt 420
ggatttgcct cgcacagcgt ggcggcgcga attgatgacg ctaaaccggt gctgattgtc 480
tcggctgatg ccggagcgcg cggtggcaaa atcattccct ataaaaaatt gctcgacgat 540
gcgataagtc aggcgcagca ccagccacgc catgttttgc tggtggatcg cgggctggcg 600
aaaatggcgc gcgtcagcgg gcgggatgtc gatttcgcgt cgttgcgcca tcaacacatc 660
ggcgcgcggg taccggtggc gtggctggaa tccaacgaaa cctcctgcat tctctacact 720
tccggcacga ccggcaaacc taaaggcgtg cagcgtgacg tcggcggata tgcggtggcg 780
ctggcgacct cgatggacac catttttggc ggcaaagcgg gcagcgtgtt cttttgcgca 840
tcggatatcg gctgggtggt ggggcattcg tatatcgttt acgcgccgct gctggcgggg 900
atggcgacta tcgtttacga aggattgccg acctggccgg actgcggcgt gtggtggaca 960
atcgtcgaga aatatcaggt tagccggatg ttctcagcgc cgaccgccat tcgcgtgctg 1020
aaaaaattcc ctaccgctga aattcgcaaa 1050
<210> 50
<211> 1050
<212> DNA
<213> 人工序列
<220>
<223> 基因编辑同源性臂池_3_b1940_左
<400> 50
aatgtctgat aacgatccgc gcgtggtggc gctggtcatt cgccagtgga taaataacga 60
tcatgagtaa cctgacaggc accgataaaa gcgtcatcct gctgatgacc attggcgaag 120
accgggcggc agaggtgttc aagcacctct cccagcgtga agtacaaacc ctgagcgctg 180
caatggcgaa cgtcacgcag atctccaaca agcagctaac cgatgtgctg gcggagtttg 240
agcaagaagc tgaacagttt gccgcactga atatcaacgc caacgattat ctgcgctcgg 300
tattggtcaa agctctgggt gaagaacgtg ccgccagcct gctggaagat attctcgaaa 360
ctcgcgatac cgccagcggt attgaaacgc tcaactttat ggagccacag agcgccgccg 420
atctgattcg cgatgagcat ccgcaaatta tcgccaccat tctggtgcat ctgaagcgcg 480
cccaagccgc cgatattctg gcgttgttcg atgaacgtct gcgccacgac gtgatgttgc 540
gtatcgccac ctttggcggc gtgcagccag ccgcgctggc ggagctgacc gaagtactga 600
atggcttgct cgacggtcag aatctcaagc gcagcaaaat gggcggcgtg agaacggcag 660
ccgaaattat caacctgatg aaaactcagc aggaagaagc cgttattacc gccgtgcgtg 720
aattcgacgg cgagctggcg cagaaaatca tcgacgagat gttcctgttc gagaatctgg 780
tggatgtcga cgatcgcagc attcagcgtc tgttgcagga agtggattcc gaatcgctgt 840
tgatcgcgct gaaaggagcc gagcagccac tgcgcgagaa attcttgcgc aatatgtcgc 900
agcgtgccgc cgatattctg cgcgacgatc tcgccaaccg tggtccggtg cgtctgtcgc 960
aggtggaaaa cgaacagaaa gcgattctgc tgattgtgcg ccgccttgcc gaaactggcg 1020
agatggtaat tggcagcggc gaggatacct 1050
<210> 51
<211> 1050
<212> DNA
<213> 人工序列
<220>
<223> 基因编辑同源性臂池_3_b1940_右
<400> 51
atgtctgata atctgccgtg gaaaacctgg acgccggacg atctcgcgcc accacaggca 60
gagtttgtgc ccatagtcga gccggaagaa accatcattg aagaggctga acccagcctt 120
gagcagcaac tggcgcaact gcaaatgcag gcccatgagc aaggttatca ggcgggtatt 180
gccgaaggtc gccagcaagg tcataagcag ggctatcagg aaggactggc ccaggggctg 240
gagcaaggtc tggcagaggc gaagtctcaa caagcgccaa ttcatgcccg gatgcagcaa 300
ctggtcagcg aatttcaaac tacccttgat gcacttgata gtgtgatagc gtcgcgcctg 360
atgcagatgg cgctggaggc ggcacgtcag gtcatcggtc agacgccaac ggtggataac 420
tcggcactga tcaaacagat ccaacagttg ttgcagcaag aaccgttatt cagcggtaaa 480
ccacagctgc gcgtgcaccc ggatgatctg caacgtgtgg atgatatgct cggcgctacc 540
ttaagtttgc atggctggcg cttgcggggc gatcccaccc tccatcctgg cggctgtaaa 600
gtctccgccg atgaaggcga tctcgacgcc agtgtcgcca ctcgctggca agaactctgc 660
cgtctggcag caccaggagt ggtgtaatga ccacgcgcct gactcgctgg ctaaccacgc 720
tggataactt tgaagccaaa atggcgcagt tgcctgcggt acgtcgctac gggcgattaa 780
cccgcgctac cgggctggtg ctggaagcca ccggattaca attgccgctc ggcgcaacct 840
gtgtcattga gcgccagaac ggcagcgaaa cgcacgaagt agaaagcgaa gtcgttggct 900
ttaacggtca acggctgttt ttaatgccgc tggaggaagt cgaaggtgtc ctgcccggcg 960
cgcgtgttta tgccaaaaac atttcggcag aagggctgca aagcggcaag cagttgccgc 1020
tcggtccggc gttattaggt cgcgttctgg 1050
<210> 52
<211> 1050
<212> DNA
<213> 人工序列
<220>
<223> 基因编辑同源性臂池_3_b0109_左
<400> 52
cagcacaggc gaggggcaaa aaacgaaacg ggaaagcaga ttccgaggtt ttttatttcg 60
ttgcagcgaa agacaagaaa tttgcgaggc gttacgaaga aagttgggga aggggagatt 120
atccgcccgc gatggagcgg ataaatctgt caactattag cgaaaacgca ttgaaaggtc 180
gagtgcttgt acgtgtttag ttagcgcacc gacggagata aagtccacgc ccgtttcggc 240
aaattcacgc agtgttttgt cagtgacgtt gccagacact tccagtagcg ccttgccgtt 300
ggtgcgtttg acggcttcgc gcatctgttc tgtttcgaag ttatccagca tgatgatatc 360
ggctcctgct ttcagggctt catcaagttc ttccagattc tctacttcga cttctactgg 420
cgcatccggg tgcagccagg acgctttttc gaccgcctgg cgcactgagc cggaggcaat 480
aatatggttt tctttgatca ggaaggcatc agaaagcccc agacggtgat tcgctccgcc 540
gccgcaaagt accgcgtatt tcagagctga acgcaggccg ggtaaggttt tgcgcgtatc 600
caacaactgc gtgttggtgc cttccagcaa ttcgacatag tggcgtacct tactggcaac 660
tcctgaaagg gtttgcacaa aattaagcgc agtgcgttcg cccgttaaca gcacgcggga 720
tgggccttca agttcgaaca aggattgatt ggcattgatg acatcgccgt catccacatg 780
ccagattatg gtgacatcgt cgcctgccag ttgaataaac acctcttcaa cccagcgttt 840
gccgcaaaag acgccattct cgcgggtgat caccgtggca tgagagcgag aattttccgg 900
taaaagtttt gccgtaatat cattgttggc atcgactgtt ccgcctaaat cttcccgcag 960
cgcctgggcc accgcgccgg ggatatcgag attaatgcgt tccagcagct cgtcacgtcg 1020
ggtgtcaggg ttatagcggc gaggcggcat 1050
<210> 53
<211> 1050
<212> DNA
<213> 人工序列
<220>
<223> 基因编辑同源性臂池_3_b0109_右
<400> 53
gttaaaactc cagatagcta acgaatcata aggtagaaac atgctactct gaaccgggta 60
ttagcaccac atataaggag atcctgcatg ttgttagaac aggggtggct ggttggcgcg 120
cgccgcgttc cctcaccaca ttacgattgc cgcccggatg acgaaacacc caccctgctg 180
gtggtgcaca atattagcct gccgccaggc gagtttggcg gtccgtggat cgacgcatta 240
ttcactggaa ctattgatcc gcaggcacat cctttctttg ctgagatcgc ccatttgcgc 300
gtctccgctc actgtttgat tcgccgtgat ggtgaaatag tccagtatgt tcctttcgat 360
aaacgtgcat ggcatgcggg agtctctcag tatcaggggc gcgaacgctg caatgatttt 420
tctattggga ttgagcttga aggcaccgat acgctggcgt ataccgatgc gcagtatcaa 480
cagcttgcgg cggttacgcg ggcactgatt gattgctatc cggatatcgc taaaaacatg 540
acgggccatt gtgatattgc gccggatcgg aaaaccgatc ccggtcctgc atttgattgg 600
gcacggtttc gtgtgctggt cagcaaggag acaacatgac gctatttaca accttactgg 660
tgttaatttt cgagcgcctg tttaagttgg gcgagcactg gcagcttgat catcgtcttg 720
aagcgttctt tcggcgggtg aaacattttt ctctcgggcg cacgttaggc atgaccatta 780
ttgcgatggg cgtgactttt ttactgttac gcgcattgca gggagtattg ttcaacgttc 840
ccacgctact ggtgtggctg ctgattggtt tgctgtgtat tggcgcaggt aaagttcgtc 900
ttcattatca tgcttatctg acagctgctt cacgtaatga tagccatgcc cgtgccacga 960
tggctggcga actcaccatg attcacggcg tcccggcagg ctgcgacgaa cgtgagtatt 1020
tgcgtgagct gcaaaatgca ttgctgtgga 1050
<210> 54
<211> 1048
<212> DNA
<213> 人工序列
<220>
<223> 基因编辑同源性臂池_3_b3399_左
<400> 54
gtcgcggcgc tcttttttgt ccgggcgtcg gtccgggtgc ggcatggtta aggcattaag 60
tttacgtgcc agcgccattt tttcgcgttt ctctacactt tccgcagtct cttcatacag 120
caaggctgcc tcgctggcgg ggcgacgctg ttcagtaatc gcctttacaa tcaccgtgcg 180
ttcgtcattt ccctggcgca gagtgagcgt ggcattcagc tcgacgattt tgctcggctt 240
gctgcgctgc ccgttgtaat gcaccttacc gccttcaatc atttcacggg ccagcgcgcg 300
ggttttataa aaacgggcag cccatagcca tttatccagt cgaacctcaa cagcaggttt 360
ctctttcatg gcgtctcctt cacattagcg aggggatcag gcggcggtag tcattcagtg 420
acggatggcg ttgatactgt ttctcggcaa tcccggaatc aggattagtc acgccgaggc 480
agtaacgaat accaaattgc gcggcagcat cgagaatcgc ttcgctgtca tcaataaaca 540
gcgttctttc agctttcaga cccgtagctt cggccaccgc atgccataac cgctgatcct 600
ctttcggata accaaatgtg tgggtggaaa gtaataaatc aaggtgtgcg tccagaccgg 660
tatgctcaag ttttaccgcc aggttgtgcg gatgcgcatt ggtgagcaaa attcgctgct 720
taccgctggc tttcagtgcc tcaagaaacg gaatggtatc ttcacgcagt acggcacgcg 780
gtcccatctc ggtggtcatc gcacagatat ccagacccag ttgctcactc cagtaatcaa 840
gacagtacca gtttagcgta tgctgtacgt cgtgatattg ctggcgcata tattccatcg 900
cttcctgtgg cgtaaccccg tttttcgcgc cccatgtttc aggcaccagc ttttgccaga 960
aatagttatc gaaggcgagg tcgagcaacg tgccgtccat atccagcaga acggtatcta 1020
cgtcctgcca ggcaatgttg atatgcat 1048
<210> 55
<211> 1034
<212> DNA
<213> 人工序列
<220>
<223> 基因编辑同源性臂池_3_b3399_右
<400> 55
gagggaaatc tccagagtga agcaatttgc gcgacagggt agcataacct gccgcgcaaa 60
cgtgttattc gataaggctt tctgaagggg tgatcagttg cgggttcagg cagctttcat 120
aataggcctg aatctccatc atgcgagtgc gatgacgctg gtaacgacgc caggcctgta 180
cgccattgta aatggcgcta cccagcatcg tcagtagcag caatgtggtg ctgagatagc 240
gccacaggcc ggaacgatcc gggatcggat gaaggccaat atgctgcgta ccattggcgt 300
cagtgaagat ttttgtgacg ataccctcgg cgttaaacgg cgtatgcatc agcatttgtg 360
ccagtttctg gaaagcgttc cactgttctt gcggcgggta gtcgtaaagt gatgccgaag 420
gccagggctg atcaacaaaa tcgctgcctt cgtcgctgac aatcaggaat ccgccggggg 480
ccggactgtt tagtgattgt gccgctcgcg ccgtttcatg cgtgataaac ggcgcggtgg 540
aggttgccac caggttatcc agcgattccg cactcaccgg gcgtaataac acattcacgc 600
catcgagctt cccggcgttg gcgcgtttta ccagcgcgtc ccagtcttta ctgttgccga 660
gattgaccag cgcatttttc agtcgcacac agtcatcttt ggcagaacat aaatccgctg 720
tcttcagtac aatgtcgcca aaatcatcaa gcaataccat gccggatttt tgaattgctg 780
aacgtaatga ggcactgacg cgagattcat cttccggttt agggtgcagc tggcgattaa 840
ctgcttcagt caatgccgtc gctttgttga ccagttcaga ttctggtaat ggcaatgagc 900
gggcgtcgtt ccagatgatc tgcgagcagt caaacggtaa aaaaggtgaa ttggttttcg 960
cgctccaggt tccggaagtt cgaatattac acattcccgt accgctaata cgcaatgtat 1020
cgcctacccg cacg 1034
<210> 56
<211> 1031
<212> DNA
<213> 人工序列
<220>
<223> 基因编辑同源性臂池_3_b2478_左
<400> 56
gtgccgcttc caggtaggct tcatcaccac tgacctgacg cttatagcgt gagtcagaac 60
tacaggcagc gagtaataaa acaagcgaaa cacccgcaac ctttgccagg cgcgactttt 120
gaacagagta agccatcaaa tctccctaaa ctttacagca aaccggcatg cttaagcgcc 180
gctctgaccg tctcacgacc actgtcggtg attggtgtca ttggcaggcg cagcgtatcg 240
gtcgccacaa gacccagttc cttacatgcc catttcaccg ggattggatt gggttcgaca 300
aatagtttgt tgtgtaatgg catcagacgc tgattaataa cgcgtgcctc ggcaaaatgc 360
ccttctgctg ccagtttgca catctgggcc atatcacgcg ctgcgacgtt agccgtaacg 420
gaaataaccc catgaccgcc caattgcatg aagtccagcg cgctcgcatc atcgccgctc 480
agcagaacaa aatcatctga aaccagctct ttgatctggt ttacacgcgt taagttccct 540
gttgcctctt tgattccgat aatatttttt actttcgcca gacggcccac cgtttccggg 600
agcagatcgc agccagtacg ggacggcaca ttatacagaa tttgcggcag gtcagtatgc 660
tcagcgatgg ctttgaaatg ctgatacaaa ccttcttgcg acggacgatt gtagtaaggg 720
gttaccgtca ggcagccgac gataccactg tcattgaagc gctgcgtcag gctaatggct 780
tccgcagtag cgttagcgcc ggtcccggca attaccggaa tgcgcccatc agccagatcc 840
agcgtcatca tcaccacatc agcatgttcg tcatgattta aggtagcgga ctcgccagtg 900
gtgccaacag aaacgatcgc cgaagtaccg ctggcgacat gataatcaat cagttttttc 960
aagctagccc gacagacatt acctttttca tccatcggag taacaatcgc gacaatactt 1020
cccgtgaaca t 1031
<210> 57
<211> 1050
<212> DNA
<213> 人工序列
<220>
<223> 基因编辑同源性臂池_3_b2478_右
<400> 57
gggccatcct ctgtgcaaac aagtgtctca atggtacgtt tggtatggca ttaaaagcaa 60
gcagacagaa ccgttctgat tgttgtatgc atgttttttt tatgctttcc ttaagaacaa 120
ctcacccctt aaaggaataa ccagtttgac actgtcatcg caacattatc tggtgatcac 180
tgcgttgggt gccgatcgcc ctggaattgt gaacaccatc acccgtcatg tcagtagttg 240
cggctgtaat attgaagaca gtcgcctggc gatgctggga gaagagttca cgtttattat 300
gctgctttcc ggttcatgga atgccattac tctgattgaa tcaacgttac cgttgaaagg 360
tgccgaactg gatcttttaa tcgtgatgaa gcgcacgacg gcgcgtccgc gtccgccaat 420
gccagcatct gtctgggttc aggtcgatgt ggcagactcc ccgcatttaa ttgaacgctt 480
cacagcactt ttcgacgcgc atcatatgaa cattgcggag ctggtgtcgc gcacgcaacc 540
tgctgaaaat gaacgggctg cgcagttgca tattcagata accgcccaca gccccgcatc 600
tgcggacgca gcaaatattg agcaagcgtt caaagcccta tgtacagaac tcaatgcaca 660
aggcagtatt aacgtcgtca attattccca acatgatgaa caggatggag ttaagtaatg 720
aatccactga aagccggtga tatcgcaccg aaatttagct tgccggatca agacggagaa 780
caagttaatt tgaccgactt ccagggacag cgtgttctgg tttatttcta cccgaaagcc 840
atgacccccg gctgtaccgt acaggcctgc ggcttacgcg ataacatgga tgagttgaaa 900
aaagcgggcg ttgatgtgct gggtatcagc accgataaac ccgaaaaact ctcccgtttt 960
gcggaaaaag agctgcttaa ctttacgctc ctgtctgatg aggaccacca ggtgtgcgaa 1020
caattcggcg tctggggtga aaagtccttc 1050
<210> 58
<211> 1050
<212> DNA
<213> 人工序列
<220>
<223> 基因编辑同源性臂池_3_b0320_左
<400> 58
atgatggtgg tattaaacag caggcgattg tgcagttatt gctggaacac ggtgccagcc 60
cgcatctgac cgataaatat ggcaaaacgc cactggaact ggcgcgggaa cggggctttg 120
aagagattgc gcagttactg attgccgcag gtgcataaac cgggaggctt gctatcaaca 180
caccagaaag acggtgtgtg tgggcgctaa ctgcggatgc ggattttctg gcgcagcggg 240
ggcaaggaca ggttgaacag gtctttgcca gagcggtaaa tatcgcactc ccggctcgcc 300
agcagttgct gacgctgctt tgtgaagagt acgacaatgc gccaaacagt tgtcggttgg 360
cactcactca ctttgatgat ctgttccggc atggtgataa ggttcagttt gacgatcaag 420
gtattacggt tggtcaacat cttcatatag agatgagtcg ttgtcggcgt tggctgtccc 480
caaccttgca aatgaccgct gtgaattttc accttatcgc ctggctacag tggcacgaca 540
ttattcatca gcacctgggg gaaaatgaaa ccctgtttaa ttatcgcggc gataatccgt 600
tttatcaggc gttaaataaa gaattacata ttaaacgacg ggcagttatt caggccgtaa 660
acgataaaca aaatatcgcc tcagcggtcg ccagtatgat ggggttaggg attggcctta 720
cgccatcagc cgacgattat ttaacaggtc tggcgcttat tttatttatt cccgggcatc 780
cggcggaaaa atacaaagag gaattttatc tcggtctgca acgcggcaaa aataatacca 840
cattattaag tgccataacg ctggaagccg cattacaaca acgctgccgg gaaaatattc 900
atcgttttat tcacaacatt atttatgaca tccctgggaa cgcaactcag gcaatagaaa 960
aaattaaaca tattggctcc agttccggct gcgacatgct gtatggcatg gccgatggtt 1020
gtgcgctgag ccaaacctac ggagggaatt 1050
<210> 59
<211> 1046
<212> DNA
<213> 人工序列
<220>
<223> 基因编辑同源性臂池_3_b0320_右
<400> 59
atgtcagtta aaatagtcat taaaccgaat acctattttg attctgtctc gctgatgtct 60
atctccacgc gtgcaaataa actcgacggc gtcgagcagg catttgtggc gatggcgacc 120
gaaatgaata aaggcgtgct gaagaattta ggactgctga cgccggagct ggagcaggcg 180
aaaaacggcg acctgatgat tgtcatcaat ggtaaatcgg gtgcggacaa cgagcagtta 240
ctggtggaga ttgaagaact gttcaacacc aaagcgcaaa gcggctcgca cgaggcgcgt 300
tacgccacta ttggcagcgc caaaaagcat atcccggaaa gtaacctggc ggtgatttcg 360
gtcaacggtc tgtttgccgc tcgcgaagcg cgtcaggcgc tgcaaaacga tctcaacgtg 420
atgctgtttt ccgataacgt ctcagttgaa gatgaactgg cgctcaagca actggcccac 480
gaaaaagggc tgctgatgat ggggccagac tgtggcacgg cgattatcaa cggcgcggcg 540
ctctgttttg gtaacgccgt gcgtcgcggc aacatcggta ttgttggcgc atccggcacc 600
ggcagtcagg agttgagcgt ccgcattcat gaatttggcg gcggcgtttc gcaactgatt 660
ggcaccggcg ggcgcgacct gagcgagaaa atcggcggcc tgatgatgct cgacgccatc 720
gggatgctgg aaaacgatcc gcaaactgaa atcattgcgc ttatctccaa accgcctgcg 780
cctgcggtgg cccgcaaagt gctggaacgt gcgcgcgcct gccgcaagcc ggtggtcgtc 840
tgcttcctcg atcgtggcga aacgccagtg gatgagcagg ggctacagtt tgcccgcggc 900
accaaagagg cagcgctaaa agcggtgatg ctctccggcg tgaaacagga aaatctcgac 960
ctgcatacgc ttaaccagcc gttgattgcg gatgtgcgtg cgcgtctgca accgcagcag 1020
aaatacattc gtggcctgtt ctgcgg 1046
<210> 60
<211> 1050
<212> DNA
<213> 人工序列
<220>
<223> 基因编辑同源性臂池_3_b4521_左
<400> 60
ccggagattg ctcaattttt aaatcacggc tggcaacgct ggcattaccc attaccgcaa 60
caatttctgc aacctgtgcg ctgtcagttt ttgccatttc gttggcttct gcgcaagtaa 120
tataggtttc tgacggcaaa ccgtttttaa tattgtagtc ctgcgcccag gtcattggtg 180
cgaaaacaaa caggcccgcc agtaaagcaa attttttcat catcattcct tatttcattt 240
tacccagaat tgcaccaccc gtaccgccaa tcacggcacc tttaatcgcc ccttcgaggc 300
cattgccggt cagaacgcca gtgacagcac caacggcggc acccactttt gcacctttac 360
gcgcattttt accgtcgcgg cctttttctg ttactgcacc aacaccagcg ccaacagctg 420
cacctttcag tacgccatta acaccattgc cagtaagtaa accaacgcct gcgcctagca 480
atgcaccttt cgtggtgcgg ttcatatccg ccatcgctgg cgtggagcag aacaatgctg 540
agataagccc gaaggcaagt atttttttct tcaacttaga tgtccggtat taagtaagtt 600
gcacacacaa taatttcgtc ttcaattaag atctgcttaa ctaaagaacg ctcgctatta 660
ttcagataat tcaaaatgag cgtggctgtg atgataggaa ttatgttttt tacgtgaatg 720
agaataatct taaatgagga ataactcatt gattgacaat atttttattc aagaagtgtc 780
attgactgtt aacgcaatgt tgtaaaggta agataatctg atttatcaat attattgtgt 840
gatttttatg tgagcagaag atattcatca gcaacgatta cattagtcat tttattttgc 900
cgacggcctc attgtcgaaa gataagcgta cgacagtatt atcagaaaag agtgattttt 960
tatccaacta cacttcagcg cactgcgtgt aaaaaatgcc tctttcttat gcgggatatc 1020
atcatttcat catgatgtct ttggtgagcg 1050
<210> 61
<211> 1049
<212> DNA
<213> 人工序列
<220>
<223> 基因编辑同源性臂池_3_b4521_右
<400> 61
gtgaacacaa tacacctgcg ctgtctcttc aggatgaatc ccctggtctg gtgcctgcgg 60
gctgatgttg cagcagagct taggtcactt agacgctact atcatttatc caatggcatg 120
gaatcgaaat cagtcgatac ccgcagtata tatcgtgaac tgggtgcaac gctgagttac 180
aacatgcgcc tggggaacgg tatggaaatg aaccctggct gaaggcggct gtgcgcaaag 240
aatttgtcga tgataaccgg gtgaaggtga ataatgacgg taatttcgtc aatgatttgt 300
cgggcagacg tggaatatac caggcagcta ttaaagcctc attcagcagt acgtttagcg 360
gacatctcgg ggtggggtat agccatggtg ccggtgtgga atccccgtgg aacgcggtgg 420
ctggtgtgaa ctggtcgttc tgaccatcaa cgattaaact gcgcttcggc gcagttttcg 480
tttacaggat gttgaaaggg aaaattctgg ggcaaaaaaa gcccgccagt tacggcggga 540
aacctcatcc tatgggagaa caatgaataa tgaaattgcg gggttatcat ctcccagtat 600
atccatacta acaataaggt tatttactca accaggcata aacattttgt tttgtgcgtg 660
ggaacagcct taaggtgtaa agggggaggt ggaaatagca atgaggagta tcagcaagaa 720
tactcgccgc tttaccacaa cgtggatgag agggatgaaa aactcaaggc agagataact 780
ctgccttgaa gataaatgcg cttttacagc gggcttattt cagctcttct gcttccggta 840
aggtcacgtt cagctcaaga atagaaatat cgccatcttt ttgctcaagc tgtacggtta 900
ccatctcagg atcaatttgt acgtatttac aaatgacctc aagaatatct ttacgcaact 960
gcggcagata atgcggttct gcatcgctgc gacggcgttc agcaacaata atctgcagcc 1020
gttcttttgc aatgttggct gtgtttttc 1049
<210> 62
<211> 1050
<212> DNA
<213> 人工序列
<220>
<223> 基因编辑同源性臂池_3_b2260_左
<400> 62
acgtccgaca atggtcagct tgccattatg catctcaccg cgatcgcgcg tagcgtacca 60
gccttcgtca ttaaccagtg aaaccagttg cccgttacgc cagtaacctt ctgccatact 120
ggcagcccgc agccacactt cattattaac gattttcact tcccgacccg gcagcggcga 180
accaacgtct gccaggccgt cggcttcttt cgcacacacc gtggaggcaa actcggtcag 240
accatagccg caaaagcaac gaatcccctg ctcgcgcgcc tgttccgtca actcgaccgg 300
gatagccgcg ccgccaagta acaccgcttt cagggaaacg gaactacggt taaccagcaa 360
acgccagagt tgtgttggca ccagtgaagc gtgagtacag cctgccagca tttgctccaa 420
tggctgttta tcacgtaccg tcatccgcgc accagcgtat aaccagcgcc acataattcc 480
ctgaccggag acgtgaaaca gcggtaaaga gagcaaccaa tcatcgtgat cgccaaacgg 540
aatcagcgat aacacacctt gcgcactggc aagatgggcc tgataagtat ggacagcggc 600
tttcggcaaa ccggtagaac ccgaggtcaa cgtcattgag cacagacgcg tcggctgcca 660
cgtagcggca tgtgcgcctt caaccagctg aatgtgcagc gacgttaatg ccggaaacgt 720
gttttcccca tccggcacca gagcaaattg cagcgtcaga ttgggcagca attcttcaag 780
caacggttgc ggcagctgag ggttcacggg caacacccgc gccccgcatt gcagtaacgc 840
cagccaggcg agcagcgttt gcggcgtatt ccacgcccgc aacatcacgc cgctgccctc 900
aaccaccccc tgcaccgcaa atccggaggc taattcatcg acgcgagcac aaagctcgcg 960
ccagttgagt tgctcgtcat taagacgtaa ggcgatggtt tctccccgca cttgccgcca 1020
gtgacgccac ggccagtcag agaagatcat 1050
<210> 63
<211> 1050
<212> DNA
<213> 人工序列
<220>
<223> 基因编辑同源性臂池_3_b2260_右
<400> 63
aacaaccgct ccagtgcatc aacttccacg acaggcagcg tgctacccgg ccagcgacgt 60
acctgctgcg cctgcatcag atccagcgtg tccagccctg gaatggtgtc cggcgttaac 120
caggcggcaa tccgcgccag ttgcgttaag cctaagctcg attcaatgga agaactgatc 180
accgccgtca gccccagcgc gtgcgccgcc tgtacctgct cgcgtacttt ttccagactg 240
cccgtgagcg tgggtttgat aactaccgcg cgcacgccct cttcagccac aaaggcaaaa 300
tccggctcgc gcaggctttc atcccaggca atggcaatgc cggtttcacg ggcaaacgct 360
cgcgaatcat cgcgggtttt gcacggctct tcgagaaacg cgatgcggtc gcgataatcc 420
gggttaacgt atttggcaaa ctgctgacct ttcagcggtg tccaggcgcg atttgcgtca 480
agacgcaaat gcagatccgg aattgcctcc agcaacagat tcaccaccat gccgtcgcgc 540
accgcttcgt acaatcccac tttgaccttc gccactttct cgcctggcat atctgcaagt 600
ttgaggatca gatcgtccgg atcgccatta cacagcggtg ccgcacggta gttggctgct 660
tgcggcaacg tatctgtcag ttctgccaat gcacagctta cgccaaaggc cacggaaggc 720
atctgcggta gctcgcaatc gcctgccagc cagttattta cccaggcaag cagcacactt 780
tgcgcctctt cccaggtttc ctgactgaag cccggcagtg gggagatctc cccccaccct 840
tcgcgctcgc cttcacgcag gcaaacatac agcccgtcgc gggtttttaa ccgcctgtcg 900
cgcagaacca cccccgcgtc catggggatc tgccagcggt atacctgcgc gctacgcatt 960
acggattccg tttgaatttg ctgaagtcag gctgacgttt ctggttgaag gcgttgcgac 1020
cttcctgacc ttcttccgtc atgtagaaca 1050
<210> 64
<211> 1047
<212> DNA
<213> 人工序列
<220>
<223> 基因编辑同源性臂池_3_b4169_左
<400> 64
tggaatgggc cgatgtggtg gtgattggtc ccggtctggg ccagcaagag tgggggaaaa 60
aagcactgca aaaagttgag aattttcgca aaccgatgtt gtgggatgcc gatgcattga 120
acctgctggc aatcaatccc gataagcgtc acaatcgcgt gatcacgccg catcctggcg 180
aggccgcacg gttgttaggc tgttccgtcg ctgaaattga aagtgaccgc ttacattgcg 240
ccaaacgtct ggtacaacgt tatggcggcg tagcggtgct gaaaggtgcc ggaaccgtgg 300
tcgccgccca tcctgacgct ttaggcatta ttgatgccgg aaatgcaggc atggcgagcg 360
gcggcatggg cgatgtgctc tctggtatta ttggcgcatt gcttgggcaa aaactgtcgc 420
cgtatgatgc agcctgtgca ggctgtgtcg cgcacggtgc ggcagctgac gtactggcgg 480
cgcgttttgg aacgcgcggg atgctggcaa ccgatctctt ttccacgcta cagcgtattg 540
ttaacccgga agtgactgat aaaaaccatg atgaatcgag taattccgct ccctgatgag 600
caggcaacat tagacctggg cgagcgggta gcgaaagcct gcgatggcgc aaccgtaatc 660
tatctgtatg gcgatttagg cgcaggtaaa accaccttta gccggggctt tttacaggct 720
ctgggtcatc agggtaatgt caaaagcccc acttatacgc tggtcgaacc ctatacgctc 780
gacaacttaa tggtctatca ctttgatttg taccgccttg ccgatcccga ggagctggag 840
tttatgggga tccgcgatta ttttgccaac gatgccatct gcctggtgga gtggccacaa 900
caaggtacag gtgttcttcc tgacccggat gtcgaaatac acattgatta tcaggcacaa 960
ggccgtgagg cgcgcgtgag tgcggtttcc tctgcgggtg aattgttgct ggcgcgttta 1020
gccggttaac ctttgaaagg tggcggg 1047
<210> 65
<211> 1050
<212> DNA
<213> 人工序列
<220>
<223> 基因编辑同源性臂池_3_b4169_右
<400> 65
atgatgtatc gcatcagaaa ttggttggta gcgacgctgc tgctgctgtg cacgccggtg 60
ggtgccgcga cgctctctga tattcaggtt tctaacggta atcaacaggc gcggataacg 120
ttgagtttta ttggcgatcc tgattatgcg tttagccatc aaagcaaacg caccgtggcg 180
ctcgatatca aacaaacggg cgtgattcag ggactgccgt tgttgttcag cggcaataat 240
ctggtgaagg cgattcgctc tggaacgcct aaagatgcac aaacgctacg gctggtggtc 300
gatcttaccg aaaacggtaa aaccgaagcg gtgaagcggc agaatggcag caattacact 360
gtcgtcttta cgattaacgc cgatgtgccg ccaccgcctc ctccgccgcc cgtggttgcg 420
aaacgcgttg aaacgcctgc ggttgtcgca ccgcgcgtca gcgaaccggc gcgcaatccg 480
tttaaaacgg aaagtaaccg cactacgggt gttatcagca gtaatacggt aacgcgtccg 540
gcagcgcgcg cgacggctaa cactggcgat aaaattatca tcgctattga tgccggacac 600
ggcggtcagg accctggcgc tatcggcccc ggtggtacgc gggagaaaaa tgtcaccatc 660
gccatcgcgc gtaaattgcg tactttgctc aatgacgatc cgatgtttaa aggcgtttta 720
acccgtgacg gggattactt tatctcggtg atggggcgca gtgatgtggc acgtaagcaa 780
aacgccaatt tcctcgtgtc gattcacgct gatgccgcac cgaaccgcag tgcgactggc 840
gcttccgtat gggtgctctc taaccgtcgc gccaacagtg aaatggccag ctggctggag 900
cagcacgaga aacagtcgga gctgctgggt ggggcgggtg atgtgctggc gaacagtcag 960
tctgacccct atttaagcca ggcggtgctg gatttacagt tcggtcattc ccagcgggta 1020
gggtatgatg tagcgaccag tatgatcagt 1050
<210> 66
<211> 1025
<212> DNA
<213> 人工序列
<220>
<223> 基因编辑同源性臂池_3_b2405_左
<400> 66
gagcgaagcg agtcatcctg cacgacccac caatgtaaaa aagcgcccta aaggcgcttt 60
tttgctatct gcgatttgcg aaattgcctg atgcgcttca cttagcagac tactatttcc 120
ggcaattcct gtctcctcac ctactgtgtc aatgcagcca acagcttaac catcgcgggc 180
gtcacctgct gtgtttcata aacaatatat aaatctgcag ggatgcgctg tttgagcgga 240
cggaaaatga cacctggcca gttcatttgt gcgtagctgt ccgctatcaa tgtgatacca 300
atgcccatac tgaccatagc gagtaccgtt tgcggttcat taacttcgcg aataacaacc 360
ggtgaaaatc ccacctgctg gcaaactcgc tgcaaaaaat cccagtcagt gtaaacgggc 420
ggcattgtaa caaaatactc gtcacgtagc gcttccagcg ggacggtgga aaatgatgag 480
agatgatgct cttcaggcat cgccaccaga aacgccgatt catgcaaccg taagctggta 540
aaaccagtcg gtggttctgt cgccattcgc cagatcccgg catcaagttc gcggcgttcc 600
agcaaggcca tttgcatcgc gggcatcttt tcgcgaaaaa gaacgtcaac gttaggattt 660
tccctgagga atcgccgcat aaccgggcgc atccgtcccc acattgccgt tcccactacg 720
ccgagttcaa tccgccctgc ttctccccga cctatttgtt caatccgagc caatacatta 780
ttagcattca ccagcaatcg acgcgattct tccatcaaga ttttgcccgc gtgtgtcagt 840
acgacgctgc gcgaatggcg aataaaaagc tgcgtgccga gttgattttc cagctcttta 900
atatgaatgc tgagcggagg ctgagacata tttaaacgcg ctgctgcgcg gccaaaatgc 960
aactcttccg ctacggcaag aaaataacgg agcaacttaa gatctgttct gtatacgcgt 1020
tccat 1025
<210> 67
<211> 1050
<212> DNA
<213> 人工序列
<220>
<223> 基因编辑同源性臂池_3_b2405_右
<400> 67
aacaaagcac caataccaaa accaacgccg gaagaaaata aaatatcttt cactaattaa 60
cctttatcat aaaagcagct ctgaagagca gagccgcgaa tccttttaat gagtcaccgc 120
tcgatgcttt atcttttcag ggtcatgatt atatttaaac ccaaagaaaa atatcactgc 180
gagaaaaaga gcatatcctg caaacaccag ccagatagtt tgccagtctt ttacgccatc 240
caccgaaaag taatctactg ccatgccact cagaatcgag ccaacccatg cgccgacacc 300
atttaccatg gtcataaaga gcccctgcgc gctggcacga atgctggaat caacttcctg 360
ttcgacaaat accgaaccag aaatattgaa gaaatcgaat gcacagccat aaacaatcat 420
cgacagcagc agcaaaataa atccggttgt tgacggatcg ccataggcga agaagccaaa 480
gcgcagcgtc caggccacca tactcatcag catgacggtt ttaatgccaa atcgctttaa 540
aaagaatggg atagtcagta taaagcccac ttctgccatc tgtgaaactg acagtaaaat 600
ggagggatat ttcaccacaa aactgtcagc aaactccggg ttacgggcga aatcatgtag 660
gaacggatta ccaaaaacgt tggtaatttg cagtaccgca cccagcatca tggcaaagag 720
gaaaaagatg gccatgcgtg gatttttaaa cagcacgaag gcatccagac ccagcttgct 780
ggcaagcgat gtggtcgctt ttttctccgc aaccggaatc ttcggcaaag tcagcgcata 840
agccgacagc agcaatgacg caccggacgc gatatacagc tgcagactac tcaattccag 900
atgcagcagg cttactgccc acatcgcgac aatgaacccc accgtaccaa aaacgcgaat 960
gggcgggaaa gcggtcaccg ggtcaagccc tgcctgggca agacaggaat aagagacgct 1020
gttcgataac gcaatagtcg gcataaacgc 1050
<210> 68
<211> 1050
<212> DNA
<213> 人工序列
<220>
<223> 基因编辑同源性臂池_4_b3493_左
<400> 68
agtgtcagaa acgcacagca taatgcggcg catctggcta cgttgatcaa gcgacagctt 60
gtcgtagctt tccacatcgg tggtcaacat acctttcagg cggttgagcg cgttaatggt 120
attcgacgga tggcagtgga actccgcagg ttgcgttgcg ccagcttccg gagccggtac 180
taactgatca gcaccggtag cctgtttgag cagcgcagga tgctgctcaa agtaagcttc 240
gacgttgttg atggcatcac gggtacgggt gatttcgtag ccagtggcat tcatgttcac 300
cacgaagcct gctggcgcga cgccaatcaa taccaacata accagaccaa tgcctttctg 360
accatcgttc gcgccgtgcg aaaacgccac gccgatagcg gaaaggatca gcgcaatacg 420
cgtccagaac ggcggctttt tcttgccgtc tttcttttca cgctccgctg gggtcaggtg 480
gatacgggcg cgtttcttgg tgccgctcca gtagcgacgc agcaagaaaa tcagaccgcc 540
agcaaacacc aggccgacaa taggggaaac gatcagagaa ccgaaaatac ttaatacttt 600
cgggatattg agtgcatcca ccactgacgt cccggtcatc aacgcattgg ttaaaccaat 660
cccgatgatc gcgccaatca gcgtatgaga gctggatgca ggtaaaccaa agtaccaggt 720
acccaggttc cagataatcg ccgccagcaa catagagaac accatggcaa ggccatgaga 780
cgatcccata ttaagcagca gatccgtcgg cagcatatgc acaatggcat aggcaacact 840
cagaccaccc agcaaaacac ccaaaaagtt gaataccgcc gccataacca cggcgagctg 900
agaacgcatc gcgcgggtat agataacggt tgccacggcg ttggctgtgt catggaaacc 960
attgatggct tcgtagaaca gcacaaaagc cagtgcaagc aataataaca gcccggtatg 1020
caaatccagg ccagcaaaca aatgtagcat 1050
<210> 69
<211> 1050
<212> DNA
<213> 人工序列
<220>
<223> 基因编辑同源性臂池_4_b3493_右
<400> 69
ttgccccctg tatggatttc actcaaaaaa taattatctt atataattca ggcaaatact 60
tccttttagt aatattgatg ctggtgcgac cactgaggaa tctttacaat tcacgcccgt 120
tttttctaag aggagcgcaa cgtggaaagg tttgatgcca ttattatagg cgctggtgcg 180
gcgggtatgt tctgttctgc gctggcaggt caggcaggac gccgggttct gctgatcgat 240
aatggtaaaa aaccagggcg caaaatcctt atgtctggcg gtgggcgctg caactttacc 300
aacctttatg tcgaaccagg cgcttatctg agccagaatc cgcatttttg taagtctgca 360
ctcgcacgtt ttacccagtg ggatttcatt gatctggtca ataaacacgg catcgcctgg 420
cacgagaaaa cgttagggca actcttctgc gatgactccg cgcagcagat tgtcgacatg 480
ctggtggatg agtgcgagaa gggcaatgtg accttcagat tgcgtagcga agtgctgagt 540
gtggcgaagg atgaaacagg cttcacgctt gatctgaacg gcatgactgt cggttgcgaa 600
aagctggtca tcgcgactgg tgggctgtca atgccggggc tgggcgcgtc gccgtttggt 660
tataagattg ccgaacaatt tggcctcaac gtgctgccga cccgcgcggg tctggtgcca 720
ttcactctgc ataaaccgtt gctcgaagag ttacaggtgc tggcgggcgt ggcggtgcct 780
tccgtgatta ccgctgaaaa cggcaccgtt ttccgtgaga acttactctt cacccaccgc 840
ggcttgtctg gaccggcggt gttgcagatt tcaagctact ggcaaccggg ggaatttgtc 900
agcatcaatc tgctaccgga tgtggacctc gaaaccttcc tgaatgagca gcgtaacgca 960
catccgaatc aaagcctgaa aaacacactg gcggttcatc taccgaagcg gttggttgaa 1020
cgcttacagc aactcgggca aatcccggat 1050
<210> 70
<211> 1050
<212> DNA
<213> 人工序列
<220>
<223> 基因编辑同源性臂池_4_b0479_左
<400> 70
cataccgata cgtcctggaa gcagctcctg agcgtagacc agaatggcag agaatgccga 60
agcgaggata aatccaataa tcaccgttaa aacccccgtc cagtgcaggc tggcgtaggg 120
taaaatcagc gtaaacggcg caacgccgag gatagagccc caaatcacat atttccgccc 180
aattttatcc cctacaggcc cgccgatcac cgtacctgcc gcaacggcaa acaggaaggc 240
aaacagatga agctgagcat tctggataga taatccgaat ttttgcatca gataaaaggt 300
gtaatagctg ctgatgctcg ccatatagaa atatttcgag aaaatgagga ttaacagaat 360
gctgaccgcc agtacaactt tattgcgcgg cagtggattg ataatcgtcg ctttgggttt 420
tcctttattc attcggtgct gtgccgagta ccaacggctg atttgcgcca acaccacgat 480
cgccagcagt gccgcaagca caaaccaggc aacgttgcct ttgccataag gcgcgataat 540
caccgccgcc agcaagggtc ccagggaact gccaaagttg ccgccgacct gaaagataga 600
ttgcgccagg ccatgccgcc cgccggaagc catacgggcc acgcgagaag attccggatg 660
aaagaccgat gaaccggtac cgaccagcgc cgccgccagc agaactgcgc caaaactgcc 720
cgccagcgca agcagcacca gaccgcttaa ggtaaagcac atgccaattg gcaacgacca 780
tggcatcgga tatttatcgg tccagtagcc gaccactggt tgcagtagcg aagaggcgag 840
ctggaaggtg agggttatca tgccaatctg cataaatgtc agagaaaatt ctgactgaag 900
cagcggataa atcgccagaa tcagcgattg gatcatgtcg ttcagcagat gtgagaggct 960
gatagcacct aaaataccaa acgatgttcg ggccttggtc gttgacgcag ccgcgcccgc 1020
cacaggctgg ggttgttcac tcattgccat 1050
<210> 71
<211> 1050
<212> DNA
<213> 人工序列
<220>
<223> 基因编辑同源性臂池_4_b0479_右
<400> 71
aggaaagtca ctttttcagg gttgcgatgt aaagaatgat cttatttgtg attattacca 60
gactaacata cctgtatgcg tcgtctgaag gaagtctcaa cgccgaatac agaatttcta 120
atctggatgc agatttatct tcaccggacg cagacttgtc tatgatgtcg cgtcatacta 180
tttttcaaca cgttgaaatc aggtcaggga gagaagtatg aaattattgc agcggggcgt 240
ggcgttagcg ctgttaacca catttacact ggcgagtgaa actgctctgg cgtatgagca 300
ggataaaacc tacaaaatta cagttctgca taccaatgat catcatgggc atttttggcg 360
caatgaatat ggcgaatatg gtctggcggc gcaaaaaacg ctggtggatg gtatccgcaa 420
agaggttgcg gctgaaggcg gtagcgtgct gctactttcc ggtggcgaca ttaacactgg 480
cgtgcccgag tctgacttac aggatgccga acctgatttt cgcggtatga atctggtggg 540
ctatgacgcg atggcgatcg gtaatcatga atttgataat ccgctcaccg tattacgcca 600
gcaggaaaag tgggccaagt tcccgttgct ttccgcgaat atctaccaga aaagtactgg 660
cgagcgcctg tttaaaccgt gggcgctgtt taagcgtcag gatctgaaaa ttgccgttat 720
tgggctgaca accgatgaca cagcaaaaat tggtaacccg gaatacttca ctgatatcga 780
atttcgtaag cccgccgatg aagcgaagct ggtgattcag gagctgcaac agacagaaaa 840
gccagacatt attatcgcgg cgacccatat ggggcattac gataatggtg agcacggctc 900
taacgcaccg ggcgatgtgg agatggcacg cgcgctgcct gccggatcgc tggcgatgat 960
cgtcggtggt cactcgcaag atccggtctg catggcggca gaaaacaaaa aacaggtcga 1020
ttacgtgccg ggtacgccat gcaaaccaga 1050
<210> 72
<211> 1032
<212> DNA
<213> 人工序列
<220>
<223> 基因编辑同源性臂池_4_b2470_左
<400> 72
ccaagcgtcg tctggaggtg ttgtatcagt gttcgcaggc gctgaacact agccagattg 60
atgtgcattg tttccgccat attttgcaga ttgttcgcga caatgaagcg gctgaatatc 120
tggagttaaa tgtcggtgaa aactggcgga ttagcgaagg gcaaccaaac ccggaattgc 180
cgatgcagat tttaccggtg acaatgcaag agacggttta cggcgaactg cactggcaaa 240
atagtcacgt ttcatcatca gaaccgctgc ttaacagcgt ttcgtcgatg ctgggacgcg 300
gtttgtactt taatcaggcg cagaagcatt ttcagcaatt attgttgatg gaagaacgtg 360
cgaccatcgc ccgcgaattg cacgactcgc tggctcaggt actttcttac ttacgtatcc 420
agttgacgtt actgaagcgt tcgataccgg aagataacgc caccgcacaa agtatcatgg 480
ccgatttttc ccaggcgttg aatgatgctt atcggcagtt acgcgagctg ttgactactt 540
tccgcctgac gctgcagcag gcggatctcc cctccgcatt gagggaaatg ctggatacgt 600
tacaaaatca aaccagcgcc aaactgaccc tcgactgccg tctgccaacc ctggcactgg 660
atgcgcaaat gcaggtgcat ttgttgcaaa ttattcgcga agcggtgctg aatgcgatga 720
agcacgccaa cgccagcgaa atcgccgtca gttgcgtcac cgcgccggac ggcaatcaca 780
cggtttatat ccgtgataac gggattggta tcggtgaacc gaaagaaccc gaaggtcatt 840
atggtctgaa tatcatgcgc gaacgcgcgg aacggctagg tgggacgctg actttttcac 900
aaccttccgg cggcggcacg ttagtgagta ttagctttcg ctctgcggag ggtgaggaaa 960
gtcagttaat gtaatgcctc ctactgacca aagaatactt gcacttaagg ttcagtataa 1020
aagggcatga ta 1032
<210> 73
<211> 1050
<212> DNA
<213> 人工序列
<220>
<223> 基因编辑同源性臂池_4_b2470_右
<400> 73
atggcgaatt tctttattga tcgccccatt tttgcctggg tgctggcaat cctgttgtgt 60
ctgacaggta ccctggcgat tttttcattg cccgttgaac aataccccga tctcgcgcca 120
ccgaatgtgc gagtgaccgc taactatccc ggcgcatcgg cccagacgct ggaaaacacc 180
gtgacccagg ttatcgagca aaatatgacc ggcctcgata atctcatgta tatgtcatct 240
cagagcagtg gcaccggtca ggcatctgtc actttaagtt ttaaagcagg caccgatccg 300
gacgaagccg tgcagcaagt acaaaaccag ctgcaatcag ccatgcgaaa gttaccgcag 360
gcggtgcaaa atcagggcgt gacggtgcgt aaaaccggcg ataccaacat tctgaccatt 420
gccttcgtct ctaccgatgg ttcgatggat aaacaggata ttgctgatta tgttgccagt 480
aatattcagg acccgttaag ccgcgtgaat ggcgtcgggg atatcgatgc ctatggttcg 540
caatattcca tgcgtatctg gctggacccg gcgaaactca acagtttcca gatgacggct 600
aaagatgtca ctgatgccat tgagtcacag aacgcgcaga ttgcggttgg gcaacttggt 660
ggtacacctt ccgtcgataa gcaggcgctc aacgccacca ttaacgccca gtcactgctg 720
caaacaccag aacagttccg cgatatcacc ttgcgggtca atcaggacgg ctcagaggta 780
aggctgggcg atgtcgccac cgtcgaaatg ggggcggaga aatacgatta tcttagccgc 840
ttcaatggta agccagcctc cgggctgggg gtaaaactgg cctccggcgc taacgaaatg 900
gcgacagcgg agctggtgct caatcgtctc gacgagctgg cgcagtattt cccgcatgga 960
ctggaataca aggtggcgta tgaaaccacc tcgtttgtta aagcctccat tgaagacgtg 1020
gtgaaaacgc tgctggaagc tatcgctctg 1050
<210> 74
<211> 1039
<212> DNA
<213> 人工序列
<220>
<223> 基因编辑同源性臂池_4_b1451_左
<400> 74
ccagttcacc acggtgtgtc cagcggctgt ctattccctg gtaatggcgt tgcagggtaa 60
tcacgccgcc cgcatgtgac gggttaagtt gtggtgccat gggtattgac tggtactggg 120
tcgtttctcg ctctccggca tacatcatca cactcatatc atcccgcgaa ctcaggctac 180
gctcatagcg caacccagcc tgagtttgct tgatggtttt tcgcgtgtcg tactgttctg 240
cacgaggcgc ttgttgtgga ttagccttcc attctgcttt ggttagccca cctgggtcat 300
ctgctttgat atccacacta ttgaaaatca gacttaattt gctggcttca tcaatgcgta 360
cgcccagttt ggcattggct aaatttttct gtgcgccact atggtcacga tagccgtggg 420
tcgtaaaacg cgtggttgag acggtgtaat cgacatcgcc aggctgtgtg ccgtctcccg 480
ttgcgcccgt tgctttcagc ccatagcgcc agctgccaaa actgccgtag taactactgg 540
cttcaatggt tggtggctgt tgtccggtct gggtggtgac attcattacc ccaccagacg 600
cgttgccata cagggcagag aaggggccac gcagcacttc cacattttgc acactgctta 660
aatcgatgtt ggatgtttgc ccttgcccgt cgggcatggt ggcgggaata ccgtccacat 720
acaggcgaat accgcgaata ccgtaagtgg agcgggagcc aaatccgcga atcgacagct 780
gtaaatcttg cgcatagttc tgccggtttt gtacctgcaa accaggcacg ccggtcagtg 840
attcggacaa gttaatgcgc ggtgttgcca ggcgcatctc ctcgccatcc accacgctta 900
ctgctgctgg ggtatccagt tctgaaacca cctgcggtgc ggcactgaca atcatagtct 960
gttcatcagc ggcaaaaaca acgggggaaa ggacaagcag tgcgggcaaa acggtctgtc 1020
ggacggaaaa aatcttcat 1039
<210> 75
<211> 1050
<212> DNA
<213> 人工序列
<220>
<223> 基因编辑同源性臂池_4_b1451_右
<400> 75
gaaaaaagcc aggttaagaa tgggaaaacg ccgtcatggt aatgaaattg taaatttatg 60
gaaaatgaaa cggcacaata cgttaagtaa ttgagaaaat tgtagtcgta acggcaagaa 120
atgctccaca tttgagaaaa taatgattac cattcccatt tataacaaga gcgtaacgat 180
gattacgctt agcgaagcat tgtgaagcag caaaaatatc ggttcatcaa agggagtcgt 240
catgcattta cgtcatctgt tttcatcgcg cctgcgtggt tcattactgt taggttcatt 300
gcttgttgtt tcatcattca gtacgcaggc cgcagaagaa atgctgcgta aagcggtagg 360
taaaggtgcc tacgaaatgg cttatagcca gcaagaaaac gcgctgtggc tcgccacttc 420
gcaaagccgc aaactggata aaggtggcgt ggtttatcgt cttgatccgg tcactctgga 480
agtgacgcag gcgatccata acgatctcaa gccgtttggt gccaccatca ataacacgac 540
tcagacgttg tggtttggta acaccgtaaa cagcgcggtc acggcgatag atgccaaaac 600
gggcgaagtg aaaggccgtc tggtgctgga tgatcgtaag cgcacggaag aggtgcgccc 660
gctgcaaccg cgtgagctgg tagctgacga tgccacgaac accgtttaca tcagtggtat 720
tggtaaagag agcgtgattt gggtcgttga tggcgggaat atcaaactga aaaccgccat 780
ccagaacacc ggtaaaatga gtaccggtct ggcgctggat agcgaaggca aacgtcttta 840
caccactaac gctgacggcg aattgattac catcgacacc gccgacaata aaatcctcag 900
ccgtaaaaag ctgctggatg acggcaaaga gcacttcttt atcaacatta gccttgatac 960
cgccaggcag cgtgcattta tcaccgattc taaagccgca gaagtgttag tggtcgatac 1020
ccgtaatggc aatattctgg cgaaggttgc 1050
<210> 76
<211> 1050
<212> DNA
<213> 人工序列
<220>
<223> 基因编辑同源性臂池_4_b1981_左
<400> 76
ggtgtcagga gttattgcga tataagcatc ttttatgatt gctgctgaac gtttaatcga 60
gggtggtaag gataaacggt agacattatt ataacaatcc actaatgccc tggctttatc 120
ttcacctttg ggtccatgaa cgatcactat tggtatatct gtttcacttt aaatttttgc 180
tattagattt tctgcaatcg ataatgaaaa tgtacgttcc tgcgagctac cttctaaatt 240
gaacgcaatg taagatccta acgatcgcat ttcctcgcgc acctcatcga gtacatcctc 300
acttagtggc aattcatata ttggcctgac tgctggaaaa cccgcctcac gcatcataaa 360
tgcccatgtc ataggtacgg gagcccggag tttctgatcc atactggacg cgttcttgca 420
caaaggggag aagcaattca tggttatacc aacaacctga aaattcgttt ttgctttcaa 480
ctgactgata aataacatcg ttttcaggtt ctttttacgc atcccctcaa tgcaaagatc 540
cggcgtaccg tattgctgtg ttatgttctt tgctaaatct tttatttctt ttaatgttgc 600
gtgatcctgc atagtcattg tgactaatgt taatttagtc tgttcaagtt taagcgcatt 660
aaagacttct aaattaattg tcgacgttac aattaaaaga tgcttaattt tatgcaattc 720
aagcgcccga ataacaggaa agatggccat agcatcgcca atctgatcgg gaatatggat 780
gacaacaaag tctgtttttt caatattgaa attataagct ttataatcgt agtaactaaa 840
tgcaatacgt ctcaacaatg atgctaaaaa catacctaac ctcgcctccc tactggttat 900
aatgcaatgc agtctatcag actcatcagg gtgccatttt gtgcatatgc ggacttttat 960
gtttcatatc tctaacctgt gggtcctctg cttaatcctt aaacaacacc agcaactcct 1020
gcgctttcat cttccatcga atttttcatg 1050
<210> 77
<211> 1036
<212> DNA
<213> 人工序列
<220>
<223> 基因编辑同源性臂池_4_b1981_右
<400> 77
atggactcca cgctcatctc cactcgtccc gatgaaggga cgctttcgtt aagtcgcgcc 60
cgacgagctg cgttaggcag cttcgctggt gccgtcgtcg actggtatga ttttttactc 120
tatggcatca ccgccgcact ggtgtttaat cgcgagtttt tcccgcaagt aagcccggcg 180
atgggaacgc tcgccgcatt tgctaccttt ggcgtcggat ttcttttccg tccgctcggc 240
ggtgtcattt tcggtcactt tggcgaccga ctgggacgta agcgcatgtt aatgctgacc 300
gtctggatga tgggcatcgc gacagccttg attggtattc ttccttcatt ctcgaccatt 360
gggtggtggg cacctatttt gctggtgaca ctgcgtgcca ttcagggatt tgcagtcggc 420
ggcgaatggg gaggcgcggc gttgctttcc gttgaaagtg caccgaaaaa taaaaaagcc 480
ttttacagta gcggtgtaca agttggctac ggtgtaggtt tactgctttc aaccggactg 540
gtttcattga tcagtatgat gacgactgac gaacagtttt taagctgggg ctggcgcatt 600
cctttcctgt ttagcatcgt actggtactg ggagcattgt gggtgcgcaa tggcatggag 660
gagtccgcgg aatttgaaca acagcaacat tatcaagctg ccgcgaaaaa acgcatcccg 720
gttatcgaag cgctgttacg acatcccggt gctttcctga agattattgc gctacgactg 780
tgcgaattgc tgacgatgta catcgttact gcctttgcac ttaattattc aacccagaat 840
atggggctac cgcgcgaact tttccttaat attggtttgc tggtaggtgg attaagctgc 900
ctgacaattc cctgttttgc ctggcttgcc gatcgttttg gtcgccgtag ggtttatatc 960
acaggtacgt taatcggaac gttgagcgca tttcctttct ttatggcgct tgaagcacaa 1020
tctattttct ggatag 1036
<210> 78
<211> 1050
<212> DNA
<213> 人工序列
<220>
<223> 基因编辑同源性臂池_4_b0237_左
<400> 78
cacaccgacg ttcagggagg tttcaaccac acctttggct acatcggagt tacgaatcac 60
accgttcggg gtggcgttca gcagacgaat aaaggtatcg cgagatttcg caatcagggc 120
agctttatcg ttcgctacag agtccagcaa caaggccaga tttttctctt tttctgccag 180
ctcgtttttc aggatctcct gataggtatt caccagagat ttcaggacgt cgactttatc 240
agctgcgaca gcaatggtcg caaaggcttc acgcgggatg gcgttacgca gtgtgccgcc 300
gttgaaatcg ataaggcgca gatccagttc ttccgcatga cccgccagga agcgcaccag 360
cagtttgttg gcattaccca gcccaacgtg gatttccccg ccggagtgac cgcctttcag 420
accttttaag gttaacttga aggtttcaaa accagctgga accgcttcac gatctaaatg 480
caggttggag gtgaagtcga taccccccgc acaacccatg tagatttcac cttcttcttc 540
ggagtcggtg ttaatcagaa tatcagcctg caaccagttg ccctgtaagc cgaacgcacc 600
gtccataccg gcttcttcgg tcatggtcag cagcacttcc agcgggccgt gaaccacgtt 660
ttcgtcagcc agaaccgcca gcgcagaggc cataccaatg ccgttatccg cacccagcgt 720
ggtgccgcgc gctttaaccc attcgccatc aatataaggc tggataggat ctttcgtgaa 780
gtcatgcacg gtgtcgttat ttttctgcgg caccatatcg aggtgggcct gtaagacgac 840
cggtttacga ttttccatac ctgcggtagc aggtttacga atcaggatat tacctacctg 900
atcgcgttcg acatggaaac ctttctcttt tgcccaacca acaatgtatt cagcgagttg 960
ctcttcatga taggacgggt gaggaataga acagattttg gcaaaaatat cccacagcgg 1020
ctgtggagat aattgagaca gttcagacac 1050
<210> 79
<211> 1039
<212> DNA
<213> 人工序列
<220>
<223> 基因编辑同源性臂池_4_b0237_右
<400> 79
catgtgaaat actggttttt agtgcgccag atctctataa tctcgcgcaa cctattttcc 60
cctcgaacac tttttaagcc gtagataaac aggctgggac acttcacatg agcgaaaaat 120
acatcgtcac ctgggacatg ttgcagatcc atgcacgtaa actcgcaagc cgactgatgc 180
cttctgaaca atggaaaggc attattgccg taagccgtgg cggtctggta ccgggtgcgt 240
tactggcgcg tgaactgggt attcgtcatg tcgataccgt ttgtatttcc agctacgatc 300
acgacaacca gcgcgagctt aaagtgctga aacgcgcaga aggcgatggc gaaggcttca 360
tcgttattga tgacctggtg gataccggtg gtactgcggt tgcgattcgt gaaatgtatc 420
caaaagcgca ctttgtcacc atcttcgcaa aaccggctgg tcgtccgctg gttgatgact 480
atgttgttga tatcccgcaa gatacctgga ttgaacagcc gtgggatatg ggcgtcgtat 540
tcgtcccgcc aatctccggt cgctaatctt ttcaacgcct ggcactgccg ggcgttgttc 600
tttttaactt caggcgggtt acaatagttt ccagtaagta ttctggaggc tgcatccatg 660
acacaggcaa acctgagcga aaccctgttc aaaccccgct ttaaacatcc tgaaacctcg 720
acgctagtcc gccgctttaa tcacggcgca caaccgcctg tgcagtcggc ccttgatggt 780
aaaaccatcc ctcactggta tcgcatgatt aaccgtctga tgtggatctg gcgcggcatt 840
gacccacgcg aaatcctcga cgtccaggca cgtattgtga tgagcgatgc cgaacgtacc 900
gacgatgatt tatacgatac ggtgattggc taccgtggcg gcaactggat ttatgagtgg 960
gccacccagg cgatggtgtg gcaacaaaaa gcctgtgcgg aagacgatcc gcaactcagt 1020
ggtcgtcact ggctgcatg 1039
<210> 80
<211> 1050
<212> DNA
<213> 人工序列
<220>
<223> 基因编辑同源性臂池_4_b2497_左
<400> 80
aataccggaa gcaccgatga caccataaag cagcagcgaa acgccgccca tcaccggcaa 60
tgggatcatc tggatagcgg cagccagttt accgacgcag gaaagcagga tagcgaaaat 120
cgccgccccg ccgataaccc aggtactgta aacacgggtg atcgccatca cgccaatgtt 180
ttctccgtaa gtagtatttg gcgtagagcc aaagaagccg gaaatcacgg tcgacaagcc 240
attagcaaac atcgaacggt gcagacctgg atcgcgcagc agatcttttt tgacgatatt 300
agccgttact accaggtgcc ctacgtgttc ggcaataacc actaacgccg ctggcagaat 360
agtcagaatg gcaaaccact cgaagcgcgg cgtatagagg gttggcagcg caaaccagtg 420
agcattaata atcggcgtgg tatcgacaat tcccattgcg aaagagagcg cgtaccccac 480
cagcacgcca attaaaatcg ggataattgc caggaaacca cgaaacagca cggaacctaa 540
aaccgtgacc gccagggtgg taatagagat gatgatggtt ttggagtctg gcgtttgccc 600
ttcagccggg agtaaacccg ccataccggc agctacgccc gccagctcca gaccgatgac 660
ggcaacgatt gcgcccattg ccgcaggtgg aaacagcacg tccagccagc cggtccccgc 720
tttcttcacg ataaaagaaa ccaggcagaa cagcacgccg cacataataa agccgcccag 780
cgcgacttca taccctaacg gcaacagtaa caataccggt gaaataaagg caaagctgga 840
accaagataa gccggaattt tccctttaca gatgaagaga tacagcagcg ttccaatacc 900
gttaaataac agtacagtcg ccgggttaat atgaaataag acgggcacca ggacggttgc 960
accaaacatg gcgaacaaat gttgcaaact aagcgggatt gtctgtaaaa gtggcggtct 1020
ttcactcacc ccgatagcac ggcgcgtcat 1050
<210> 81
<211> 1050
<212> DNA
<213> 人工序列
<220>
<223> 基因编辑同源性臂池_4_b2497_右
<400> 81
agtattatcc tctgtattat gtgttatagg cgctttactc aaaaaaaagc cgactcttaa 60
agtcggcttt aattattttt attctttatt tcgtaccaaa gattttgtca ccggcatcgc 120
cgaggcccgg aataatgtat ccgtgctcgt tcagtccctg atcaatcgat gcggtataca 180
gttcgacgtc cgggtgcgct ttttccagcg cagcgatacc ttctggcgca gctaccagca 240
ccagaacttt gatgctgctg cagcccgctt ttttcagcag gtcgatggtc gcgataacgg 300
aaccaccggt tgccagcatt gggtcaacga tcagcgccat acgctcatcg atgttagaaa 360
ccagtttctg gaagtacggt accggctcca gcgtttcttc attacggtac ataccgacaa 420
cgctgatgcg cgcgctcgga acgttttcca gcacaccgtc catcatacca agacccgcac 480
gcagaattgg cacaacggta attttcttac ctttgatctg gtcgatttct accgggccgt 540
tccagccttc gatagttact ttttccgttt cgaggtcggc ggtcgcttcg taagtcagca 600
ggctacccac ttcggaagcg agttcgcgaa agcgcttggt gctgatatct tgctcacgca 660
tcagtcccag cttgtgtttg acgagtgggt gtttgacttc cacgatcttc atactctttc 720
tcctttgagg ggcagccaca aaaaaaatcg acggattata cctcctttct tcaaggcggc 780
aatattcttt tcgttgactt tagtcaaaat gataacggtt tgagataaag ttattttata 840
ttcagatggt tatgaaagaa gattattcca tccgaaaact aacctttacc ctggcacaag 900
tcttctttcg ccgcgcgcct ggggaaaaga cgtgcaaaaa ggttgtgtaa agcagtctcg 960
caaacgtttg ctttccctgt tagaattgcg ccgaatttta tttttctacc gcaagtaacg 1020
cgtggggacc caagcagtga ccgataaaac 1050
<210> 82
<211> 1050
<212> DNA
<213> 人工序列
<220>
<223> 基因编辑同源性臂池_4_b4260_左
<400> 82
gttcagcact tcaacggttt gaccggacat ggtggttaac acatcgcccg gacgataggc 60
tcgtccgcca ggcatgtttt cgcagcctgc caacacgccg ataacgttaa tcggcagttg 120
tagctccgcg accatccgca tcacgccgta aaccgctgcc gcaccgcaca tatcgtactt 180
catctcatcc atgccttctg aaggcttgat cgagataccg ccggagtcga aggttaaacc 240
tttacccacc agcacgattg ggcgtgcatc ttccgacgcg ttgcctttgt actcaatcac 300
cgacatcagc gattcgtttt gcgaaccctg accgaccgcc agataggaat gcatccccag 360
ctctttcatc tgctgttcgc cgataacgcg ggtgatgaca ttcttgctgt agctgtcagc 420
cagctggcgc gcttgtgaag cgaggtaagc ggcgttacag atattcggcg gcatattgcc 480
gagatctttt gctgctttaa tcccggcggc aatcgccaga ccgtgctgga tcgcgcgctc 540
accgctggtc agttcacggc gggtcggcac gttgaacacc atcttacgca gcggacgacg 600
cggttcgctc ttgttcgttt tcagctgatc gaaactgtag agcgtctctt ttgccgtctc 660
gacagcctga cgcactttcc agtagttgtt acggccttta acgtgcagct cagtcagaaa 720
gcagaccgct tccattgagc cagtatcatt cagcgtatta atggttttct gaataacctg 780
cttgtactga cgctcatcca gctcacgttc tttgccgcaa ccaataagga gaattcgctc 840
ggaaagtaca ttcggaacat ggtgcagcaa caatgtctgc cccggttttc cttccagttc 900
gccccgacgt agcagggcgc tgatgtaccc atcgctgatt ttatcgagct gttctgcaat 960
cggagaaagg cgacgtggtt cgaagacgcc cacgacgatg caggcactcc gctgtttctc 1020
cgggctaccg ctttttacac taaactccat 1050
<210> 83
<211> 1049
<212> DNA
<213> 人工序列
<220>
<223> 基因编辑同源性臂池_4_b4260_右
<400> 83
tttacgggcg tatttaaagt gataatcata agatatctgg tgcgggagac gctcaaaagc 60
cagctggcga tactcttcat cttgcttttg atcttcttct gtcaaaagtt agtgaggatc 120
ctcggcgcag cggttgacgg cgatattccg gcgaatctgg tgctctccct tctcgggttg 180
ggcgtgccgg aaatggcgca gcttatcctg ccattaagcc tgttcctcgg gctgctgatg 240
acgctgggca aactgtatac cgaaagtgaa attacggtaa tgcatgcctg cggcctgagc 300
aaagcggttc tggtgaaagc ggcaatgatc cttgcggtat tcacggcaat cgtagcggcg 360
gttaacgtga tgtgggcggg accgtggtca tcgcgtcatc aggatgaagt gttagcagaa 420
gcgaaagcga accctggcat ggcggcgctg gcgcaagggc aattccagca agcgactaat 480
ggcagctcgg tgctgttcat cgaaagcgtt gacggcagcg atttcaaaga tgtgttcctc 540
gcgcaaattc gaccaaaagg taatgcacgt ccttctgtgg tggtggccga ttccggacat 600
ttaacccagc tgcgcgacgg ctcccaggtc gtcactctca accagggaac gcgcttcgaa 660
ggcactgcat tgttacgtga tttccgcatt acggacttcc aggattatca ggcgatcatt 720
ggtcaccagg cggtggcgct cgacccgaac gataccgacc agatggacat gcgcacattg 780
tggaacactg acaccgatcg tgctcgcgca gaactgaact ggcgtatcac gttggtattc 840
accgtgttta tgatggcact tatggtcgta ccgctgagcg tggttaaccc acgtcaggga 900
cgcgtactgt cgatgctgcc agccatgctg ctgtatctac ttttcttcct gatccagacc 960
tccctgaaat cgaacggcgg taaaggtaag ctggacccga cgctgtggat gtggaccgtt 1020
aacctgattt atctggcttt agcgattgt 1049
<210> 84
<211> 1050
<212> DNA
<213> 人工序列
<220>
<223> 基因编辑同源性臂池_4_b1412_左
<400> 84
aatgactgct ggtgtttatt taggggcgtt tccacgacat attccggcac agaatgcggt 60
tctggacgtc acctttgaat tccctcgcgg acgagccaca aaagatcgac tctatttttg 120
tgtaccgatg ctggatctgg tggttccgga agagggggag ctccgacagg ccgtggcgat 180
gctggaaaca ttacgcgaag agcaaggcag cgttctggtc cattgtgcat tgggattatc 240
gcgcagtgcg ctggtggtgg cggcatggtt gttatgttac ggacactgta aaaccgttaa 300
tgaagcgatt agctatattc gagccagacg cccgcagatt gtgctgacag acgagcacaa 360
agcgatgctg agattatggg aaaacaggta agtggattga gatgtggact gaatatctac 420
agtccacatc aagaccgtgt ccggttatgc agaaacaatg ctgtcgatgg ctgcttttgc 480
gtcagactgt gctttcgctg ccatttccgg accgtatgcg atcccttcgg cgaagacaaa 540
tttcacatcg gtaatgccga taaagccgag gaacgtggac agatacggcg tcaccaggtc 600
cgttggtcca tctttgtgga tcccgccgcg gctggtaata acgatggctt ttttacccgt 660
taccagacct tccggaccgt tctcggtata gcggaaagta acgcctgcgc gggcaaccag 720
gtcaaaatag tttttcaact gagtcgagat gttgaagtta tacatcggtg ccgcaataac 780
gataacgtcg tgggctttca gctcggcaat caactcatcg gaaagtgcca gagcttcctg 840
ctgacgcgga gtcagcggcg catcgctcgg acgcagagcg ccaaccagtt cgccatccag 900
taccggaatc ggatttgcag ccaggtcgcg aacggtgatt tcatcagcgg agtgcttttc 960
gcgccattgt tcaacaaaat aatcggacaa ctgattagac tgagagtacc ctgccaggat 1020
gctggattta agaactaata ccttgctcat 1050
<210> 85
<211> 1050
<212> DNA
<213> 人工序列
<220>
<223> 基因编辑同源性臂池_4_b1412_右
<400> 85
gaatttattg aacaacgcat agaaagccgc gatgtggtac tctatatcta tcatttaaaa 60
gaaaattaat caggcagact actgcccact aacgttatga cagaacaaca aaaattgacc 120
tttacggcct tgcagcagcg gctggattcg ctgatgctgc gtgacagact gcgtttttct 180
cgccgtctgc acggcgtgaa gaaggttaaa aatcctgatg cacaacaggc cattttccag 240
gagatggcga aagagattga ccaggcggca gggaaagtcc tgctgcgtga agcggcacga 300
ccggaaatta cttatcctga caatttaccg gttagtcaga aaaaacagga cattctcgaa 360
gcgattcgtg atcaccaggt ggtgatcgtc gccggggaaa cgggttctgg taaaacgact 420
cagttaccga aaatctgtat ggagctgggg cgcgggatta aaggactgat cggccatacc 480
cagccgcgtc gtctggcggc aagaacagtg gcgaaccgta ttgcggaaga gctgaaaacg 540
gagccgggcg gttgcatcgg ttacaaagtg cgtttcagcg atcacgtaag tgataacacg 600
atggtcaagc tgatgaccga cggtatcctg ctggcggaga tccagcaaga ccgcctgctg 660
atgcagtacg acactatcat tattgacgaa gcgcacgaac gcagcctgaa tatcgatttt 720
ttgctcggct atttgaaaga gttgctgccg cggcgtcctg acctaaaaat cattatcact 780
tccgcgacta tcgacccgga acgcttttcg cgccacttta ataatgcgcc gattattgaa 840
gtctccggtc ggacctatcc ggtggaagtg cgctatcgcc cgattgttga agaagccgat 900
gacaccgagc gcgatcagtt gcaggcgatt tttgacgccg tagacgaact gagtcaggaa 960
agccatggcg acattctgat ctttatgagc ggcgagcggg aaatccgcga taccgccgat 1020
gcgctgaaca agctgaactt acgccatacc 1050
<210> 86
<211> 1050
<212> DNA
<213> 人工序列
<220>
<223> 基因编辑同源性臂池_4_b4139_左
<400> 86
aacagtggtg tcgttaccga tgactttgaa gcatacctgg ttaaccactt ccggaacaac 60
cgggtttact ttagctggca tgatggaaga gcccgcctgc agttccggca ggttgatctc 120
gttcaggccg gcacgtgggc ctgaagagag caagcgcagg tcgttacaga ttttggacat 180
cttcacagcc aggcgtttca gcgcgccgtg aaccataaca taagcgccgc agtcagaggt 240
cgcttcgatc aggtcttcag ccggtacgca tgggaagcca gtaacttcag ccagtttttt 300
cactgccagc ggagagtact ctttcggcgt gttcagacca gtaccgattg ctgttgcacc 360
aaggttaact tccagcagca gttcagcggt acgttggatg tttttcactt cttctttcag 420
caggatgctg aaagcgcgga attcctgacc gagggtcatc ggtactgcgt cctgcagctg 480
ggtacgaccc attttcagga tgtcctggaa ttcgacagct ttacgttcaa agccttcacg 540
cagttggtta atcgcatcta ccagcttaat cagggaagag taaactgcga tacggaaacc 600
ggtcgggtag gcgtcgttag tggactgaca tttgttaaca tggtcgttcg ggttcaggta 660
ctgatattca cctttttggt gacccatcag ttccagaccg atattggcca gcacttcgtt 720
ggtgttcatg tttacggaag tacctgcgcc gccctggtag acgtctaccg ggaactgatc 780
catgcatttt ccgttgttca ggacttcatc acatgcggca atgatggcat tcgctacact 840
tttaggaatg gtttgcagct ctttgtttgc catagctgcg gcttttttaa ccattaccat 900
accgcgaaca aattcaggaa tatcactgat tttgttgttg ctgatataga agttttcaat 960
cgctctcaga gtgtgaacac catagtaggc atcagctgga acttccctgg tacccaacag 1020
atcttcttcg atacgaatgt tgtttgacat 1050
<210> 87
<211> 1041
<212> DNA
<213> 人工序列
<220>
<223> 基因编辑同源性臂池_4_b4139_右
<400> 87
ttttacccct taattattaa tttgtgaaat agatcaccgc tttgggatta ctaccaaaaa 60
tagttgcgca aacatcttga aattttgcta atgaccacaa tataagctaa acgcgattcg 120
caacccattc aggtagccgg ggttaaccgg ctgctattac aggagaaacc tttgcgctgg 180
ttacctttta ttgccatttt cctttatgtc tatattgaga tttcaatctt tattcaggtt 240
gcccatgtat tgggggtatt gctgaccctc gtgctggtta tattcacgtc agttatcggt 300
atgtcactgg tacgtaacca gggctttaag aatttcgtgc tgatgcagca aaaaatggcg 360
gcgggtgaaa acccagcggc ggagatgatt aaaagtgttt cgctgatcat tgctggtttg 420
ctgcttttat taccgggctt ttttaccgac ttcctcggtc ttctactttt attgccgccg 480
gtgcaaaagc atctgacagt gaagttgatg ccgcatttgc gcttttctcg catgcctggc 540
ggcggtttta gcgccgggac cggtggcggt aatacttttg atggtgagta ccagcgaaag 600
gatgatgagc gcgaccgcct tgatcataaa gacgatcgcc aggattaatg tcgaaacgcc 660
ggattatgtg gttatgccat tttccggcgt ttttcgtttt ggcagcaaca gccataaccc 720
cgccagcatg atcagcgcat agagactttt ccagccgacc attgccagta acagaacgca 780
taacagcccg ccaaccaccg ccagtagtcg ataacgtcct tgcaataatt tacagcctgc 840
cagcatgcat aacagataaa tcataataaa gatgccattg gcataaataa taagagcgtc 900
cagattgatc tctaaagcat gaatcaccaa agtgctcacc acacagcagc cgagcaccgc 960
attgagggca ttattcggga tatggcgaga agagaggcgt gccaggtagt ggtcaggatt 1020
atgttgcgcc tgcgaccaga c 1041
<210> 88
<211> 1044
<212> DNA
<213> 人工序列
<220>
<223> 基因编辑同源性臂池_4_b2039_左
<400> 88
ttgatgaacg tgagtgattg tcttgaacaa agctgaccgg atagcctaga atatgttcaa 60
atgctgattg attaaagctc tcataaaaga aacctctatc atcaccaaat actcttggct 120
ccagaattag cacatcttca atttcagttc taatcacatt cattaatttg aatccttcgt 180
cattttataa agatactgcc cataattatt ctttattagt ggtacagcta attttcttac 240
ttgctcaaca tcaataaaac ctttacgaaa tgcaatctct tcaggacagg aaaccttcaa 300
tccctggcgc tcttcaattg tcgcaataaa attacttgct tctatcagac tctgatgagt 360
ccccgtgtcc agccacgcgt agccacgccc catcatcgcg acagacagac gtccctgctc 420
aagataaata cggttaatat ctgtaatttc taactcacca cgtgcagacg gcttcaagtt 480
tttcgccatc tgaaccacgt cgttatcata aaagtacaga cctgtaacgg cgtaattact 540
ctttggttct aacggttttt cttccagact gattgccgta ccgtttttat caaactcaac 600
gacaccatag cgttctggat cattaacgtg ataggcaaat accgttgcac cactttcttt 660
gttaacagcg gcctccatta gcttcggcag atcgtgaccg taaaagatat tatcaccaag 720
aaccaaagca caatcatcac caccaataaa ctcttcaccg atgataaatg cctgcgcgag 780
gccatctggg ctaggttgca ctttgtactg aagattcagg ccccactggc taccgtcacc 840
cagcaattgt tgaaaacgag gagtatcctg aggtgtactg ataatcaaaa tatcgcgaat 900
acccgccaac atcagtgtag agagcgggta atagatcatc ggtttatcat aaataggtaa 960
tagctgttta ctgacagcca tagtcacagg ataaagacgt gtaccagaac cacccgctaa 1020
aataatacct ttacgcattt tcat 1044
<210> 89
<211> 1050
<212> DNA
<213> 人工序列
<220>
<223> 基因编辑同源性臂池_4_b2039_右
<400> 89
ttcatcattc cttttaattc atcttgctcc accatcacga acaagatgca aaaactatta 60
aattgctgta gtcgtaaata attcattgag cattcgtttc acgccaacct gccagtcagg 120
caagacaagc gcaaagttct gctgaaattt ttctgtatta aggcgagagt tatgtggacg 180
acgagctggt gtaggatagg ctgttgttgg tactgcgttg agcttgttga gtgcaagggg 240
aatgcctgct ttgcgcgcct cttcaaaaac cagcgcagca taatcgtacc aggttgtggt 300
accactggct accaaatggt acaagcctgc gacatccggt ttattcagtg cgacacgaat 360
ggcatgtgct gtacaatcag ccagcagttc agcacctgtt ggcgcaccaa actgatcgtt 420
aataaccgct aattcttcac gctcttttgc cagacgtaac atcgttttgg cgaagttatt 480
tccttttcct gcatagaccc agctggtccg gaaaataaga tgcttcgcgc aatattcctg 540
taacgctttt tctccggcta acttggtttc accgtaaaca tttagtggtg cggttgcatc 600
cgtctccagc catggcatat cgccatttcc agggaagacg taatcagtcg agtaatggat 660
aacccaggct ccaacttcat ttgctgcttt cgcaatcgct tcgacacttg ttgcgttaat 720
taattgtgca aactccggtt ctgattctgc tttgtctact gcggtgtgag cggctgcatt 780
gacaataata tccggccgaa tgcttcttac ggtttcagct acaccttcag gattactaaa 840
atcaccgcaa taatcagtag agtgaacatc aaaagcaatc aaattaccca aaggtgccag 900
agcacgctgt agttcccaac ctacctgccc tgttttgcca aaaaggagga tattcattac 960
tggcggccct catagttctg ttcaatccac gattgatagg caccactttt cacattatca 1020
acccattttg tattggacag gtaccattcc 1050
<210> 90
<211> 1050
<212> DNA
<213> 人工序列
<220>
<223> 基因编辑同源性臂池_4_b4473_左
<400> 90
catcacccgc ccatagtgag cgttggattg gtgcagcacc gcgccagcgt ggcagcagtg 60
aaccatgaac gttgatacag ccaagacgcg gcatctccag cactgctttc ggcagaatta 120
aaccataggc gacgacgacc ataacatcag cctgcagttc ggcgaccagt tgctggtttt 180
cttgtggacg cagggaaaca ggttgaaaaa cgggcagacc tttttcctca gccagaactt 240
taaccgggct gggcatcagt tttttaccgc gtcctgccgg tcggtctggc tgggtgaaca 300
cgccaacgac gttatgacca gaagacaaca gcgcgtcgag atgacgcgct gcaaagtcag 360
gtgtacccgc aaaaataata cgtagtgatt ctgacacgtt agttcttatc cttaagcccg 420
ggctttcaga cgatccagtt tttcaacttt ctgacgaata cgttgttgtt tcagcggtga 480
cagataatcc ataaacagtt tgccgaccag gtgatccatc tcatgctgaa tacagatggc 540
taacagaccg tctgcttcca gttcaaatgg tttaccgtcg cggtcaaggg cgcgaatttt 600
aactttctct gcgcgcggca ctaaagcacg ttgttcaggg atcgacaggc aaccttcttc 660
aatgcctgtt tcgccgcttt tttctaaaag ctctggattg attaacacta gccgttcgtc 720
acggttttcc gaaacatcaa taacaatgat acgttgatgg atatcaacct gggttgccgc 780
caggccaata ccttcttctg cgtacatcgt ctcgaacata tcatcgacga tacgctgaat 840
ttctgcattc acttcttcta ccggtttagc aactttgcga agccgctcgt ccggaatatg 900
taacacttgc aaaactgaca taaatctcca gagatgtgtt caggagttag aaagattatt 960
tcttctattc tagacaaatc cccctctgat tgacagcatc actgaccaat cgcaaagatt 1020
gctaaggctg cttatggcag ggagataagg 1050
<210> 91
<211> 1050
<212> DNA
<213> 人工序列
<220>
<223> 基因编辑同源性臂池_4_b4473_右
<400> 91
atggtcgata cagaaatttg gctgcgttta atgagtatca gcagcttgta cggcgatgat 60
atggtccgta tcgctcactg ggtggcaaaa cagtcgcata ttgatgcggt tgtattgcag 120
caaacagggc ttacattgcg gcaggcacaa cgctttcttt catttccacg aaagagtatc 180
gaaagctcac tttgttggtt ggagcaaccc aaccatcatt taattcctgc ggacagcgaa 240
ttttatcctc ctcaacttct ggcgacgaca gattaccccg gcgcactgtt tgttgaagga 300
gaactgcacg cgctgcattc atttcagctt gccgtagtgg ggagtcgggc gcattcatgg 360
tatggcgagc gatggggacg attattttgc gaaactctgg cgacgcgtgg agtgacaatt 420
acgagtggac tggcgcgtgg aatcgatggt gtagcgcata aagcagcctt acaggtaaat 480
ggcgtcagca ttgctgtatt ggggaatgga cttaatacca ttcatccccg ccgtcatgcc 540
cgactggctg ccagtctgct tgaacagggg ggcgctctcg tctcggaatt tcccctcgat 600
gttccacccc ttgcttacaa tttcccacga agaaatcgca ttatcagtgg tctaagtaaa 660
ggtgtactgg tggtggaagc ggctttgcgt agtggttcgc tggtgacagc acgttgtgcg 720
cttgagcagg ggcgagaagt ttttgccttg ccaggtccaa tagggaatcc gggaagcgaa 780
gggcctcact ggttaataaa acaaggtgcg attcttgtga cggaaccgga agaaattctg 840
gaaaacttgc aatttggatt gcactggttg ccagacgccc ctgaaaattc attttattca 900
ccagatcagc aagacgtggc attgccattt cctgagctcc tggctaacgt aggagatgag 960
gtaacacctg ttgacgtcgt cgctgaacgt gccggccaac ctgtgccaga ggtagttact 1020
caactactcg aactggagtt agcaggatgg 1050
<210> 92
<211> 1046
<212> DNA
<213> 人工序列
<220>
<223> 基因编辑同源性臂池_4_b3510_左
<400> 92
aatcaacgcc agttgcaaaa aaatgaaccc ggattactta tttaaccgcc catagcatca 60
acgcttacgg aactctttgt tcactttccc acagcacttt taaaacatta aacctgacta 120
cggaaaatat cagccatgat aatgtttgaa atggctaatt tgccatagag tgaaaaaaat 180
tagatgaaat tcagtaggtt gaaataatca ctagcaggta attatttcaa tgatagtgcg 240
caattgatct acaacactgc gtagcggaga gagtattaat cggatcatag tcacatcaag 300
tgactatgat ccgggtgaca accggggtaa ttattgctgc ttaacgaaca aactggcgaa 360
gctgaacagg ctggcggcgc taaatatcag ttcaattccc accagtgtgg aaaccagcgt 420
tacagacacc atcggcgttg caccaaggaa tatccaggca atgacgatat ccagcacacc 480
aataacgagc tgtagccagc tgcctttcat tgaacgctga cgataccaac tcatcaggcg 540
aataacccct gcaacacaga acaaaccggc aataaatgcc gcaatggcaa aaatgcccag 600
ctccggtgcg cggatgaaga aatagccgat caataaatag gcgactgcga cgaggaaacc 660
ggataatacc ggccagaaat tatgactgcg gttgctgaat aacccgacaa taagcgcaat 720
acccgagcag attaataatg cacccactac tgtgcttaaa atatcgccag agacgaacgg 780
gaaactgata cacagcaacc cgacgataaa cagcagcacg gcaataaact ggattgctct 840
gcgatgtttt ttaagcatct ccagatcaaa cttcaaaatt gttgccttat ctatatataa 900
catagaacca ccctataaaa ttaagaagaa aatcccctgc tatcaatcta tgccaaaaac 960
gcgtctaaga atgcagtcga tttaataaaa atttcctaat tgcagtatct gatgcatctg 1020
taactcattg tattgaaata aaaata 1046
<210> 93
<211> 1045
<212> DNA
<213> 人工序列
<220>
<223> 基因编辑同源性臂池_4_b3510_右
<400> 93
atgaaaaaag tattaggcgt tattcttggt ggtctgcttc ttctgccagt tgtgagcaat 60
gcagcggatg cgcaaaaagc agctgataac aaaaaaccgg tcaactcctg gacctgtgaa 120
gatttcctgg ctgtggacga atccttccag ccaactgcag ttggttttgc tgaagcgctg 180
aacaacaaag ataaaccaga agatgcggtt ttagatgttc agggtattgc aaccgtaacc 240
ccagctatcg ttcaggcttg tactcaggat aaacaagcca actttaaaga taaagttaaa 300
ggcgaatggg acaaaattaa gaaagatatg taattccggg aatgcgttac atcgtacttc 360
cttgcatatt gaacaggccg gaatatcttc tttaaaagca gctattcctc ctgttcatat 420
ataatctcta tattgaatgg gttacaaaat gaatatttca tctctccgta aagcgtttat 480
ttttatgggc gctgtagcgg ctttgtcact ggtgaacgca caatctgcgt tggcagccaa 540
tgaatccgct aaagatatga cctgccagga atttattgat ctgaatccaa aagcaatgac 600
cccggttgca tggtggatgc tgcatgaaga aacagtatat aaaggtggcg ataccgttac 660
tttaaatgaa accgatctca ctcaaattcc taaagtgatc gaatactgta agaaaaaccc 720
gcagaaaaat ttgtatacct tcaaaaatca agcatctaat gacttgccga attaatgagg 780
tgcaagtaaa aaggagtagc aagttgagcc atcttgctgc tcctttttgc atttttatat 840
gacagcagaa tttattatac gtcttatact cgcggcaatt gcctgtggcg ctattggcat 900
ggaaaggcaa atgcgcggca aaggagcagg gttacgcaca catgtattaa ttggcatggg 960
aagcgccctg tttatgattg tttcgaaata tggttttgct gacgtgctgt ctttagatca 1020
cgtcggactc gaccccagcc gtatt 1045
<210> 94
<211> 1050
<212> DNA
<213> 人工序列
<220>
<223> 基因编辑同源性臂池_4_b1007_左
<400> 94
tcattaccgc catccagcta tcaaaggccg aagccgatac acttttcact gcgataggcg 60
ctaagttcag gccaatcgcc atcaccaccg cacccgtcac caccggcggc atcagtcgtt 120
caatccagcg cgtaccgatt ttcatcacca ccaggccaat gacggtataa accagcccac 180
aggcgataat cccgcccagc gcaatgctga tattcgggtt aatgccctga ccgttaaagc 240
ccgtcgcggc gatcaccacg ccgacaaaag ccgcgctgga gccgagataa ctggggacgc 300
gcccgccggt aataaagaaa aacagtaacg tgccgatccc cgacattaaa atggaaagat 360
tgggatccag ccccatcaga atcggcatta acaccgtcgc gccaaacatc gccaccgcgt 420
gttgaacgcc cattactgcc gtctgagcaa acggcaatcg ttcatccggc gcgaccacgc 480
cgctctctgt agaggtcgat tttaactgcc agtgaggaaa accgaacatt gccatcagct 540
gtctccttaa ggaggttaac aagcagggcg catcagcgcg tgataactgc gatcgaacca 600
caccagcccg tagggtgtgg tgtgacgatg aatcgcttcg atggcgcaaa acagaatgtc 660
gtgggtgccg acgctcacca cctggctgat acggcagtca aacgaaacca gagcctcttc 720
cagttgcggg catccggtca cccccgtctg ccagcgggcg gcggcaaagc ggtgttccat 780
gggcgttttg ccgccaaaaa ggtttgaaag cggctcctgc ccggcgctaa gtgtatttac 840
acacagcgtt cgattttcat tgaatgccgg ccagacggac gccccacgat tcaggcacac 900
cagtaatgtg ggcggcgtat cggtcacact gcagacggcg ctggcggtga acccggcgcg 960
cccggctgga ccgtccgtgg tgataatatt gaccgccgcg cccatgcagg acatcgcatc 1020
gcgaaaagtt tgttgatcga caatgttcat 1050
<210> 95
<211> 1049
<212> DNA
<213> 人工序列
<220>
<223> 基因编辑同源性臂池_4_b1007_右
<400> 95
agtttgctcc ttacaacagc ccgcaggctt cttcaaagga cagacgtggc aggcgcgcat 60
aaagcttgct gctatcgcca tagccgatat taatcagcag attgctcttc agcgtgctgc 120
ccgtaaaaaa ggcgtcgtcc acgtgttgac ggtcaaagcc cgacatcggg ccggtatcca 180
gtcccagcgc ccggcaggcg acgatcagat aggccgcctg catggaactg ttgcgaaacg 240
ctgtttcttc ggcaagttgt gggctggagg taaaccaact gcgggcatca ccgtggggaa 300
acagtagtgg taaccgttca taaaattcac tgtcccaggc gacgatagcg gtgacgggcg 360
cggtcagggt tttttgcaga ttgccgctgg aaagtgccgg gcgcagacgt tcttttcctt 420
ctgccgtgcg ggtaaacacg atccgtgccg gagaacagtt agctgatgtc ggcccccatt 480
tcatcagggc ataaatctcc cgtaacgtct catcgctgac gggtgtctcc cgccagccgt 540
tgtgagtgcg ggcatcggtg aacagggtgc taagcgcacc tgggctaacg gcttcgttca 600
tagcaattcc ttacagggcg gcttcacggt gatgtaacag gctggcaagc ccgttgagta 660
acagagcatt aaacgtttcg ggatcggtca cgttgcaggc gtgtccgcca tagggcatca 720
ccattttctg gctatcgggc agggcggcat gaagttcact ggaacatgct gttggcacca 780
gcagatcatc actggcgcag atgatttgca ccgggcagcg gatgcgatcc gcatggtgac 840
taaagtcagc gcgtttgagg gcgttaagtc gacgcagtaa attatttttg ccctgaaaat 900
gcgccagtgc cagcgcgtct tctgcctcca ggcgaggtgc gcgggccgcc atccagtcgg 960
cgggatagag gaacaacggc tgcgcttcca cccatgcctg cgcgccgccg ctatacagta 1020
atcgttcgcg aacctgaaaa cagcggcgc 1049
<210> 96
<211> 1050
<212> DNA
<213> 人工序列
<220>
<223> 基因编辑同源性臂池_4_b3058_左
<400> 96
ggaacgaaaa ctcggaagca gcgtaacggc tcacccccat cagcatccca cctgaaatgg 60
tcgccccgga acgggagaaa cccggccaca gcgccagaca ctggaaacag ccaatcataa 120
atgcctgacg ataggtcata tcatcaagac ccggcgcacg cggctctttc ggcttcaggc 180
attcggcggc aatcagcaac aaaccgccaa cgaccagcgc atacatcaca tttatcgggt 240
taaacaatga cttaatcgtg tcgtggaaca acagccccaa taccaccgcc ggaatcatcc 300
ccagcaaaat gtggatcagc gttaaacgac ctttgctttc accttcgtgc tgcaacgggc 360
ggccaaagtg gatgccaatc aggccaaaca gacgccgcca gaacatcact actaccgcca 420
gaattgatcc taactggatc acaacttcaa aggttttcgc cgtgtcgccc tcaaacccca 480
acaagtgacc gacaataatc atatggcccg tgctggatac cggcagaaat tctgtcaatc 540
cttcgaccac acccaatatt gccgctatca gcagcgagtg catatcgctc atcaataaac 600
ccctaaatta ttaaaatgta ccgcttgtcc gaactactgc gtatgaccag gttataaccg 660
tttggtttaa cagctgtaaa attaattatt ttctttcaga ttattgccac gctcaatgat 720
tacgccaaca ttcgccgccc gcgccactgc gcctggcttg ctgagtttga tacgcaccca 780
cggcgagttg aagcgtgcta acagcagctc cgccacctct tcagccacgc gttccaccag 840
cgcaaaacgc gccccctcga cgtggctgac caccgtttct gcaatgtcag cgtaactgag 900
gcaatccgcc acatcatcac ttttcgccgc tttacggtta tcccacgcca tttcgatatc 960
gaacactaac ttctgttcga tggtctgttc ccagtcgtaa acaccaatag tggtgattac 1020
cgaaagttgc tctataaata caatatccat 1050
<210> 97
<211> 1050
<212> DNA
<213> 人工序列
<220>
<223> 基因编辑同源性臂池_4_b3058_右
<400> 97
cacgtcctgc ctgctttttg gctaaccgga taccacttcc ggcgaaatgt gcgtattatc 60
cacagattca tcgttgaaca cgaattttca aaacggaaca gcttatgagt gcaatcgcgc 120
ctggaatgat cctcatcgcg tacctctgcg gctccatttc cagtgccatt ctggtttgcc 180
gcttgtgtgg gctgcccgat ccgcgaacca gcggctccgg caatccaggc gcaaccaatg 240
tgttacgtat cggtggcaag ggagcagccg tagcagtact gattttcgac gttctgaaag 300
gaatgttgcc cgtctggggc gcgtatgaat taggtgtcag ccccttctgg ctaggcttaa 360
ttgccatcgc cgcctgtctt ggacacatct ggcccgtttt cttcggattt aaaggaggaa 420
aaggcgttgc taccgctttt ggtgccatcg cacccattgg ctgggatctc accggagtaa 480
tggcgggaac ctggttactg accgtgctat tgagcggata ctcgtcgctg ggagcgattg 540
tcagtgcact gattgctccg ttttatgtct ggtggtttaa gccacaattc accttcccgg 600
tttcgatgct ctcttgcctg atcctgctgc gtcatcatga caacatccaa cgtctgtggc 660
gtcgtcagga gacaaaaatc tggacgaaat tcaaaagaaa gcgcgaaaag gatcccgagt 720
gatttctggt ggatctacat gacctgatag ccttcatcgg gcttgcccag ccgttgctgg 780
caccatgccg ccagaaattc cacgcagaca cgtaatttca tgctgcgata gagcggctcc 840
cggtaaacag cccagatatt ggcgctttgt gcatactctg gcaatacttg caccagtttg 900
ccactctcca gaaacggcaa cacatcccac tcggaacgca gcataatccc tttgccctcc 960
agcgcccatt gcagcacaat ctcgccgcta ttggaggaaa gatgcccgct taccttcacc 1020
gattttttct cctgaccgtt ccccaactcc 1050
<210> 98
<211> 1050
<212> DNA
<213> 人工序列
<220>
<223> 基因编辑同源性臂池_4_b2688_左
<400> 98
gaggaatcgc acctgctgtt catctacacc aatcggcgag aacgggttga tgtccagcga 60
acgcacttca atatattcaa tgccgccacg taacagcgca tcagaaggcg actcgccgct 120
gcgggtaacg cgttttggac gaatcggcgc gtacagttcg ttttcaatct gcaacacgtt 180
gctgttgatt tgcagcctct taccgtcttt ctcaatacca atcttcgcgt actcttccga 240
tggcgttttg attgcctgtt taaggcccgc tacgtactcg taaagatcgt tgaaggtaat 300
accaagattg ctttgcgatt tattggtata gccgagatcg ctcaaacgaa gagaggtcgc 360
atacggcagg taatacatac cgcactcggt tttctcaaac ggcagcgacg ttggttttcc 420
ttgcaggaaa gaagaacaaa tcgccggaga tgcaccaaac agataaggaa tgacccaacc 480
gaaacgatag taattgcgga taacgcggaa atagcccgca gaaattttct ctttggcatc 540
agcgcccgag atatcaccgc acttcgcttg ccagaatgcc attggcaaag agaaattgta 600
gtgcacgccg gaaatggttt gcatcagcgc gccgtagcga tttttcagcc cttcacgata 660
cagcgtttta aagcgtccgg tgttagaagt gccgtactgt gccagttcga tgtcctgacc 720
ttctgcgatg tagcatggca tacttaacgg ccacatccgc tcatcgccca tattgcgcgc 780
cgtataacga tgcagatcgc gcataaaggt cagcatatgt tcaatatcac catccactgg 840
tgtaatgaat tccagcaatg cttccgcaaa atcggtagta atccatttgt gcgtcagtgc 900
ggaacctaat gcttcaggat gacctgttgt tgccagtgtg ccatcagcat taacacgcaa 960
agtttcgcgc tccagcccac gctgtatccc ctttaacgcc tgaggatgtt tttccagcca 1020
ggccagcgcc tgtgatacgt ccgggatcaa 1050
<210> 99
<211> 1039
<212> DNA
<213> 人工序列
<220>
<223> 基因编辑同源性臂池_4_b2688_右
<400> 99
attgacctcc cgcctgtcaa aatcgtttta attagcataa ctgtaatggt gaccatatgt 60
gcaggcctac aattagtgcc accacatcat gccctgaacg gtcgctgctg caactgcaac 120
atagcgtaac gctttaccaa ggcacaaaaa aaagattacc ggtccccacg agatgcgcat 180
ccatcccgct aacagacaca gtaaatcgcc aaccacgggc atccagctta ataatagcgt 240
gactgcacca tagcgtttca gccagccggt agctttctct tgccagcgcg atgttttacg 300
caatggaaag aaacgcccaa ggataacgtt agttaaccct ccaaggctat tacccattgt 360
tgctgttaaa actaaaaccc agggatgact gatcccggaa agcaacattg ccaccagcac 420
gacttcggag ttgccgggta atagtgtagc gctgagaaaa ctactggcaa acaacgagaa 480
aagcgataac gcttcactca cagcaagcga acatccacgg cgtccatgcc tgctgcacgg 540
gccgcctgaa taccgaaatc ggcatcttca aagaccacac actgcgtcgg ttgcacgccc 600
atacgctgcg cgcacaacaa aaatgtgtct ggcgcgggtt tatggtgttt gacgtgatcg 660
gcagcgacga cggcgtcaaa ataatggcgt aatcccaggt gcgccagcaa tgcctcagcg 720
atggcgcttt cactccccgt tcctacagcc attgggcgac gaccatgcca acttttcacc 780
acatcaacaa gaggaagcgg ttcgacgcta tccagcagca tacttcttac tgcttctgtt 840
ttttcacgcg ctaacgcatg cgggtcgaga tcggcctgat tcagctcaat aattgcctga 900
gcaatacgcc aggtgggcga tccattaagc gcaatcatcg cctgaatatc gtactgaaga 960
ccgtagtgcc ctaatacttc gcgccacgct ttacggtgcg taggctccgt atccaggatt 1020
gtgccatcca tatcaaaaa 1039
<210> 100
<211> 1050
<212> DNA
<213> 人工序列
<220>
<223> 基因编辑同源性臂池_4_b1716_左
<400> 100
agcgctttcc agttccgctt tacgcgcatt cagcgcctgc tgaacctgct ctttcgcttc 60
gttgataacc gcaccagctg ccggacgctc ttctggcggc agctcacgca gggtcgtcat 120
ctgaagggtt aagtgccctt ttttacccaa atattcgacg cgcacattat ctaacgcggc 180
aacatctgac gcctggctaa tggccgcctt cgcactggca accagttctg cgagatgtga 240
catggttttc ctcattgtgt cagtggtgac actggttcgt tggacttaga gcctatccca 300
tcaggctatt ttacttgcca ttttggtccc gggctgtgct cgaaattctc acgtacttaa 360
atacgctccg gtttctccgc gctggccgtg tccagtctgg ctgcgacaat tacacctgat 420
gagacaggct ttttattttt caaaacgcgc atacaaaaaa agcctccact gggaggcttt 480
caggcgctgt tttccgtttc tcttctcacg cgctagcctc ctggattcag gtgctaaagt 540
aaaaaaagaa gcggaaaata gcagcattca ttgcttgcgt taccttttgg tactcttcaa 600
aagaccttta ttgaaaaggc tacggcgata aaagtcaatg ttttgatggc gttgaaacga 660
aaagagggag actagctccc tctttcaact ggcttatgcc agagctgctt tcgctttttc 720
aaccagagcg gtgaacgcta ctttgtcgaa tactgcgata tcagccagga tcttacggtc 780
gatttcaaca gaggcttttt tcaggccatt gatgaatttg ctgtaagaaa taccgttctg 840
acgtgctgct gcgttgatac gcgcaatcca cagttgacgg aactgacgct tacgttgacg 900
acggtcacgg taagcatact gaccagcttt gataacagcc tggaaggcaa cgcggtatac 960
gcgagaacgc gcaccgtagt agcctttagc ttgtttcaaa attttcttgt gacgtgcacg 1020
tgcaataaca ccacgtttta cgcgagccat 1050
<210> 101
<211> 1049
<212> DNA
<213> 人工序列
<220>
<223> 基因编辑同源性臂池_4_b1716_右
<400> 101
ttatgcgtac ggcaggcacg cgattaccag gcccagatcg cctttggaaa ccatggcttt 60
cggacgcagg tgacgtttac gtttggtcgc ttttttggtc agaatgtgac gcaggttagc 120
gtgcttgtgc ttaaaaccac ctttaccggt ttttttgaag cgcttagcag caccgcgtac 180
ggtcttaatt tttggcattt taataacttc cacttcgcat tgttaataaa cgaaacaaag 240
gcgaacaaag cctgtgaagc ccgaaggctc cacagacagt gctacttgaa ggccttactg 300
tttcttctta ggagcgagca ccatgatcat ctggcggcct tcgatcttcg ttgggaagga 360
ttcgaccact gccagttctt gcaaatcgtc tttcacgcga ttaagcactt ccataccgat 420
ttgctggtgc gccatctcac gaccgcggaa acgcagcgtg attttggctt tatcaccctc 480
ttcgagaaag cgaatcaggc tgcggagttt tacctgatag tcgccttcat ctgtaccagg 540
acggaattta atttccttaa cctggataac tttttgcttt ttcttctgtt ccttagaaga 600
cttgctcttt tcatagagga atttgccgta atccattata cgacaaaccg gcggctcggc 660
gttagggctg atctcgacta agtctactcc ggcttcttct gctttctcca gagcttctct 720
cagactcaca ataccaagct gctcgccttc cagacctgtt aagcgaactt cctgggcgcg 780
aatttcgcca ttgatacggt tagggcgcgc cgtttgaact cgttttccgc ctttaatacc 840
ttattcctcc aattgtttaa gactgcggct gcgaatctct tgttgcagct tctcgatcac 900
ttcatttacg tccatgcttc ccaggtcttt accacggcgg gtgcgaacgg caactttgcc 960
tgattccacc tctttatcac cacagaccag catatatggg acgcgacgca aagtgtgctc 1020
gcggatttta aagccaatct tctcatttc 1049
<210> 102
<211> 1050
<212> DNA
<213> 人工序列
<220>
<223> 基因编辑同源性臂池_4_b3071_左
<400> 102
gtcgctggtt caagtccagc aggggccacc agatatagca aaggctgacg agaaatcgtc 60
agcctttttc tttttatata tcagttactt tgcgtgccag taagccgctg cacgtacccg 120
ctgtgggtca tactgttccg cttcaaagcg gcggcttaaa ttcttaacga ctttaccttc 180
gccggttatc cagatgaagt aatcatcggc agggatttgc atctgcgcca gacgcgcatc 240
taccgcctgc tcatcatgtg ccagccattc gatattaaaa ccatcaaggt gcgcgagata 300
atcctgacag gcgttatccc gcacgctaac cagcgcacta acttgcggtt taacggcaag 360
tttgctcaac gtttccaggc ggcggcgcaa tgcaggcatt ccggattcat cgcagacata 420
cagctgatac gcgtaatctt ccggcaccac cagcgaaccg cgcggacctg ccaccgtaag 480
tttatcgccc ggttgcgcct gcatcgccca gccgctggcg accccaccgt cgtgaataaa 540
gaaatcaatc gccagttcat ggcgtagttc gtcatacagc ggcgtatagt cacgcgacgg 600
tgggcgtggt ccttccggcc agacgatgcc ctcttccgtt accgttggcg gcacaaagtg 660
agcgtcaggt tgaggaaaga agagtttgct gtgatcgtca aagccacgcg atgtaaaacc 720
gtccagcgcc tcgccgccga ggacaatgcg ctgaaaaccg gcgctgatgc gctcaacgcg 780
taacacagtc agttcacgga agcgcagatc attgcgaacg cgctgcgggt agcggggggt 840
gttattcatt gttatcgcct tcgtgatggt aatcagatat atctaaataa aactcgcaaa 900
tgataatgat tgttaatcat gataaatgca agcgatttgt agaactgata tgtctatagt 960
ctgataagac gaaccgcctc ttctcaggca tcattactca acgccggatg cggcgtgaac 1020
gccttatccg gcctacgtgt gagatgagtc 1050
<210> 103
<211> 1050
<212> DNA
<213> 人工序列
<220>
<223> 基因编辑同源性臂池_4_b3071_右
<400> 103
atgagccatc atcacgaagg gtgttgtaaa catgaaggcc agccacgcca tgagggctgc 60
tgcaaaggtg agaagtcaga acacgagcac tgcggacacg gtcaccagca tgaacacggt 120
caatgctgcg gtggtcgcca cggtcgcggc ggcggtcgtc ggcaacgttt ctttggtcac 180
ggtgaattac gtctggtgat tctggatatt ctctcgcgcg atgacagcca cggttacgaa 240
ttgattaaag cgattgagaa tctaacccag gggaattaca ccccaagccc gggcgtcatc 300
tacccaacgc tggattttct gcaggagcag tcgctgatta ccatccgcga agaggaagga 360
ggtaagaagc agattgcgct gaccgaacaa ggcgcgcagt ggctggaaga aaaccgcgaa 420
caggtggaga tgattgaaga acgcatcaaa gcgcgttgcg ttggcgcggc gctgcgccag 480
aacccgcaaa tgaagcgggc gctggataat tttaaagcgg tgctggattt acgcgtcaac 540
cagagcgata tcagtgatgc acaaataaaa aagatcattg cggtgatcga ccgcgccgct 600
tttgatatta cgcaactgga ttaatcgccg catccgccag tggcgcggtg caattgccgg 660
atgcgacgct tgacgcgcct tatccggcct acacccgcta cacaccccgc aggcctgata 720
agatgcgcca gcatcgcatc aggcattgtg ctccaaccgc cggatccggc ataccgatta 780
atgcagtacc gtcaccgcgt cttccagtcg gctggcgcgg tgtttcacca tcgccgacac 840
ctgcgcactc tcttccacca gctcggcatt tttctgggtg atcaggttaa gctcatccac 900
tgcacgggtc aggctggaaa gcccatcggc ctgttccagc gttgaatggc taatctgggc 960
gatcaactgg gtgacgtttt tcacctgtgc cacaatatct tccatcgtcc gtccggcggc 1020
gtgtacctgc tgcgaaccgg attgcacctt 1050
<210> 104
<211> 1050
<212> DNA
<213> 人工序列
<220>
<223> 基因编辑同源性臂池_4_b2139_左
<400> 104
cttttgcgat atcgagattg gcgttaagac gaccactatc gaaaatgggt agcgtcaggc 60
ctgccgtaac gcccatttgc tgcgcggaat gacggaacag atcgcttaag tgcaacgcat 120
cctgttgcag gaaggccatc aggttgatgt caggataaaa tgccgctttt gccgcatcaa 180
tggtgcttag cgatgactca acgtaccagt gcgccgcctg caaatctgcc cgccgggcca 240
gtaaggagta ccccagttca tcaggaagct ggcttgccac tttcggcaac gcgaccggtt 300
taagcttcaa tgactttgtc tggttatttg taagtgcgct taaccgtgcc tcaataattt 360
tcattttccc cgcgacatcg ttgagctgct gccgggtttt gctggcatta atatcggttt 420
ccacaccttc aactgaagaa gtaatcccgt tctgatatag ctggcgatcg gtcgcgataa 480
tggtgttctg ctctttttct atttgctgca agaccgtgtt taacgccgcc tgggtttgcc 540
actcccagta caggcgggct acgctgccag ccagcaattg gcgggtttgc tcgcgttccg 600
ccgcccgtgc tttaaccgta cccaggcggg cagtaacctc cgcccgattc tttccccaga 660
tatcgagatg ccagcccgcc gttaagccaa aagtaccgtt ggtgtaccac gggccggtcg 720
tacctgcggc cggatcgttc agagcaaacg gccccattaa gccttctgcc gacatttttt 780
gccgctccat atccgccgaa aagtcgatct gcggaccatc ctgagtggca actgccttcg 840
cctgggcttc agctagctga atgcgctgtt cagccacctg catatccggt gcgttctgta 900
gtgcattgtt aattaaggaa gtgagttgat tatcgtgata ctccagccac cattggctgt 960
ctggccaacc attttcagcg ccgtgggtaa tgcggtgtca acttgtgcag cgggcgtttg 1020
ctggcttaac gcctggcggg tttcatgcat 1050
<210> 105
<211> 1047
<212> DNA
<213> 人工序列
<220>
<223> 基因编辑同源性臂池_4_b2139_右
<400> 105
aggcgcacac ccggccagca tcagtaacag cggaaaacag gcgatggctg gataaaagga 60
atcacgattc atgggggaat aatcaggtaa gaaaaggtgc gcggagatta ccgtgtgttg 120
cgatatattt tttagtttcg cgtggcaata catcagtggc aataaaacga catatccaga 180
aaaatataca ctaagtgaat gatatcttcc gatttatctt aatcgtttat ggataacggc 240
aaagggcttc gttttttcct atacttattc agcactcaca aataaaggaa cgccaatgaa 300
aattatactc tgggctgtat tgattatttt cctgattggg ctactggtgg tgactggcgt 360
atttaagatg atattttaaa attaattaat gtcatcaggt ccgaaaataa cgagaatatt 420
tcagtctctc atcctgttgc gctcctgtca tgtgcattgc ttcatataat cactggcgca 480
aggagcgcgc agggggcggc caatcgccgc cgccccctgc acccccgggc tctggcgaac 540
aaaatcgccg ctgcgcggtg ccctcggctt atcccttacg gctaccgggt cgggcgcgag 600
gtaacatccc tgtaaaacgc gccctcagcc cacatccatg tgggctgccc cggccttcag 660
ggaacgcctc ggcaattttg acgccaccaa acaaccgtgc ggcctattga taaagagcta 720
acacattgtc aaaaaacatc actatggttt tttagagttt ctcgatatca attgcctgaa 780
tagcccttgc aatatcaggg gaattattca acacccgaac atgctgaaat aattccgttg 840
cttcatcgta ttctttacgc aaataactca accactgttt aatccgcgca acgtgatata 900
acccggtatc gccctgcttt tccagacggg tatatttttg cagcaaagca accacctccg 960
gccacggcat tcgcggttcg ttatatttta ccacccggct caggttggga atattgagcg 1020
ccccgcgacc aatcatcact gcgtcgc 1047
<210> 106
<211> 1050
<212> DNA
<213> 人工序列
<220>
<223> 基因编辑同源性臂池_5_b2434_左
<400> 106
tcgctcactt tggtggacga cccaaaccag ttccacgggt tagcggcaga ccagttaact 60
gacgacatcg tggaacagcc ggtcagcatc aatggcatag cgcataacat taaacgcagc 120
gatttcatgt cacttccttt ggttattcaa taacgttgct tggagtgcaa attcaccaaa 180
aagtgccgtt attcttttac ttcataaaaa caagcgcgta aacgtcgatt ggtcagcagc 240
cagattaacg ccacaatatc cgccactacc agcgccagac cgataccgct aacggattca 300
ccgttcagcc acagccacgg ttgccagcaa agtaaaacca cctgcgccaa cagcaacaga 360
aaatagagta cacgccaggt gcgaggaaac gtagcccgcc gaccgctcaa caaaaacgcc 420
agcaccgccg gaatgccagg aatcagcccc agccagaaat tatcgtgatc gggataaaac 480
agatttagca gcgcagtacc ctgctcgcgc gacgcaccgg caatgacaaa cagcacccag 540
gttcgcgcct gaagcaatag cacaagccag aagagcaagg gtaaacgcag gcgaccgtgc 600
gcatcataat ggacaggatg aaactcagta ctcttcatct tcaatcaaac gcttacccag 660
actcagcacg tcggcgtgtt catatcccag gcgttcatac attccgagca ccatgtcgtt 720
atcttccggc acattgatct gaattttcgg gcagccacga gcaatcagct ttttctccag 780
ccgattaagc aacgcattgg caatcccacg cccacgaaac tctggatgca cgccaagata 840
ataagcagac ccgcgatgcc cgtcataacc gcccatcacc gttccgacca cgtcaccgtt 900
tacctcagcg accaaaaaca aactgacgtc atggttcatc ttacgctcga tgtccatttc 960
cggatcgttc cacggacgca gcaagtcgca acgctcccaa agggtgatga cctcttcgaa 1020
atcttcctgg cgaaatacgc gtatctccat 1050
<210> 107
<211> 1050
<212> DNA
<213> 人工序列
<220>
<223> 基因编辑同源性臂池_5_b2434_右
<400> 107
ggtattcgtt acctttttgc gggttaaaag gctgattatg gcgtgaacgg tcgaattagc 60
caatatctga cgaaaatcgg ttgaaaaagt ggcataatgg ggagttgtca actattgaaa 120
tgaaaagtaa aacaattctc aacagcaaac cgtcgtaacg gattacgcga tacgatataa 180
catctggaac tttattatta caactcaggc cgtatgagca cttttaaacc actaaaaaca 240
ctcacttcgc gccgccaggt gctgaaagcc ggtttggctg ccctgacgtt gtcaggaatg 300
tcgcaagcca tcgccaaaga cgaactttta aaaaccagca acggacacag caagccgaaa 360
gccaaaaaat ctggcggcaa acgtgtcgtt gttctcgatc caggtcacgg cggaattgat 420
accggagcga tcggacgcaa cggttcgaaa gaaaaacatg tggtgctggc gattgctaaa 480
aacgtccgtt ccattttgcg taatcatggg attgatgcgc gtttaacgcg ttctggcgat 540
acgtttatcc cactttacga tcgcgttgaa atcgcccata aacatggcgc agatctgttt 600
atgtcaattc atgccgatgg ctttaccaac ccgaaagctg ccggtgcttc ggtatttgcc 660
ctctctaacc gtggggcaag tagcgcaatg gcgaaatacc tgtctgaacg cgaaaaccgc 720
gccgatgaag ttgccggtaa aaaggcgact gacaaggatc acctattgca acaagtgctg 780
tttgatctgg tgcaaacaga taccattaaa aatagtctga cgctcggctc gcatattctg 840
aagaagatta agccggtgca taaactgcac agccgcaaca ccgaacaagc ggcatttgtg 900
gtgttgaaat caccgtcggt tccttcggtg ctggtggaaa cctcgtttat caccaacccg 960
gaagaagaac ggctgttagg cacggcggcg tttcgtcaga aaatcgccac agcgattgct 1020
gaaggcgtga tcagttattt ccactggttc 1050
<210> 108
<211> 1028
<212> DNA
<213> 人工序列
<220>
<223> 基因编辑同源性臂池_5_b2037_左
<400> 108
aatgaaataa gaaaaggcag aggcgatata atcattagca caatcactgc attatcatat 60
cccggcccta tacttatttt tactagtata gatgcaccca agagcagaat taatgaaaaa 120
gcaccaccaa tcaaactcaa gcaggtcaat gattttttaa ttaaaatcac acccttcaca 180
cgattaagaa caagcgtact tgatattctt gggtatattg cttgggtgat aggatttaat 240
agcccttgaa gcgcgtttct tatagtattg gccgcattaa aattccctac ggacgttggt 300
ccagatataa atcccaggat aataactatt cccgtagaat ataaactaat agcagatgtg 360
gaaataaaaa catgaaaacc gtctgctaaa gatcgacgca cattatgtaa tgatagcgta 420
actttaccaa tccaaccttc atgaacaacg atagctagtg caataattcc agcaaccaga 480
tttgcacttg actgaataaa accggcaatt gctatatctg actttgtgtt cacaaaaata 540
aatgttagag ggataatagc caagcgggat aaaatactac ttaaagtcag ccatttcatt 600
ttttcttttc cctgaaacag ccagataggg tagattaaat tcccgactaa tgcaggaaca 660
aacgaccata taattacggc atgcttgtta tattcaggaa caagcaaggt catcgacgtt 720
aagaaaatca atgtaatgac gataagaact atttttgaaa atatcaccgc ccaaaaaata 780
gacgttactt tatctttact atctgctgct ttggcaatac tctgagttgc tgtgagattg 840
aaaccatatt caacaaacat tatcatatat agcatagtcg cttggcaaaa accgaatata 900
ccgaaatttt caggaccaag tgttcttaca agatatggaa atgtaagcaa tggtaaaaga 960
taattgctac cttgaacgac agccagatat ataacgtttc ttcttaaaga taatttattc 1020
gtattcat 1028
<210> 109
<211> 1050
<212> DNA
<213> 人工序列
<220>
<223> 基因编辑同源性臂池_5_b2037_右
<400> 109
gcaattaatt ttaatctgat aagctcatct aacgtaaaga gcctttcatc ttttggcgaa 60
aggattaacc ctgatgtttg gggccaatca attgcaatgc gttcatcatt ccaacatatt 120
ccacaatcgc tttcaggatg ataatagttt gtagttttat attgaaattc agcgatatca 180
gacagaacca aaaagccatg agcaaaccct tttggtatcc acaactgctg cttattatca 240
gctgaaagca gaacaccaac ccatttacca aaggataccg aattgggtcg aatatcaaca 300
gcaacatcaa aaactgctcc atgagtgcag cgtacaagtt tatcttgtgc gtactcgccg 360
cgttgaaagt gaaggcctct gagtacattt tttgatgaac gtgagtgatt gtcttgaaca 420
aagctgaccg gatagcctag aatatgttca aatgctgatt gattaaagct ctcataaaag 480
aaacctctat catcaccaaa tactcttggc tccagaatta gcacatcttc aatttcagtt 540
ctaatcacat tcattaattt gaatccttcg tcattttata aagatactgc ccataattat 600
tctttattag tggtacagct aattttctta cttgctcaac atcaataaaa cctttacgaa 660
atgcaatctc ttcaggacag gaaaccttca atccctggcg ctcttcaatt gtcgcaataa 720
aattacttgc ttctatcaga ctctgatgag tccccgtgtc cagccacgcg tagccacgcc 780
ccatcatcgc gacagacaga cgtccctgct caagataaat acggttaata tctgtaattt 840
ctaactcacc acgtgcagac ggcttcaagt ttttcgccat ctgaaccacg tcgttatcat 900
aaaagtacag acctgtaacg gcgtaattac tctttggttc taacggtttt tcttccagac 960
tgattgccgt accgttttta tcaaactcaa cgacaccata gcgttctgga tcattaacgt 1020
gataggcaaa taccgttgca ccactttctt 1050
<210> 110
<211> 1050
<212> DNA
<213> 人工序列
<220>
<223> 基因编辑同源性臂池_5_b2451_左
<400> 110
cagatccgtt tcatcaatcg ggatcgccac cggcaaattg cgcagcggca gttgtacgcc 60
ctcaagccag attgtgctgc cagagagcga aagggtatgc gcgcccgcgc caatcaccgt 120
ggcgcgcacg gtttgcgccg gaaactgtac gttcatctca cgcaggcgcg gatggtcatg 180
cagcgcagtt gccagcagcg ggccaatatc ggcaaaacag aacgggtcgg cgggctggtg 240
gcgataacat tcgcccacgc cgccagaaag cgtaatgatt tcgggcgtaa cacctgcggg 300
cagcaaaccg gtttgcatca atgcctgcgc gagcggtgag agcgttccgt caatcacttc 360
gacaatcagt tctgccatcc gccgggtcac ctgcaccagc tgcgcgccgg tcagcgaacg 420
ggcgtcggtg cctgcaccga agcactcatc cacaatcatc tgccccggtt tatgagcgta 480
aaccacgcgc ccgtggctgt cggtttccag caggcgacca ccgacgttga ggcaggcagt 540
gccgctgatt tttccggcat cgaacagggc gtagttcgcg gtgccaccgc cgatgtcgat 600
attcagtacc cgacacagcc gttgttcaga aagggtttgt gccccggctc cgtgaccggc 660
gatcacggat tcgaggtgcg gcccggcgct ggcaacgaca aaatcgccca gcgactgaga 720
gagcgccatc accgccgggc gagcattgcg ggttttcgcg ctttcaccgg tgatgatgat 780
ggcaccagaa tcaacgcttt ccggctcaat acccgcagca tgatattgct cgagtattaa 840
ggttttcagt tccgcttctt ttaaaccgcc ctgtttatcg acaggggtaa agaacaccgg 900
actttgccag ctaatttcgc gtttaatgaa ttcgtagcgc ggcacctgcg acaccgccgc 960
acggttaacc agctccagcc gggagaaaat cacctgggtg gtggtggtgc cgatatcgat 1020
accgacgctc aatagctggc gagtgttcac 1050
<210> 111
<211> 1046
<212> DNA
<213> 人工序列
<220>
<223> 基因编辑同源性臂池_5_b2451_右
<400> 111
gattgtgcct ccgcttcggt tttagtcgcg gtcgcgtctt cttttggcac cagcatcatc 60
gccacgccaa tcgccgttac gccgccgatc aacttgccga caatcatcgg gaagatcatg 120
gcgttcatgt tggcagcggc gaagcctaag tggtcgccca gggcgaaagc agcggaaacg 180
gcgaaggcgc agttgatgac tttgccgcgg gtatccatct gcttcatcat gccgaacatc 240
gggatgttgt tggcaagcgt tgccaccatg ccggctgccg cgatgttgtt catattcagt 300
actttaccga cgctcatcag cggtttttca aaccagcgag tcagcagcag caccatcgga 360
tacgccccta acagaacgca ggagatagaa ccgataactt caatggcgcg catcacctca 420
ccgggtttat cgccaggggc cataaagata ggatccagac cggggatcag ttcccagcca 480
agcaggaatt tcactaccgc agcggcaaga ccgagggtga tcaatgcaac gaggaatttg 540
gcgaagatct ggaagccgtt gatcattttt tccgggatga atttcagccc cagcgccacc 600
agaatcgcaa caatgatcac cgggatcatg ttcatcagga tcagggcgaa agtgaattcc 660
accggctggc cgttgatctg cacaccggag tacatagcaa ccagaccacc agcgatacaa 720
ccaatcggaa tggtcacaat gcccgccagc acgccgagcg ccagataacg acggtcagaa 780
ggttcgataa tgccgagcgc caccggaatg gaaaacacaa tcgttggccc catcatcgac 840
ccgagaatta acccagagta tagccacgcg gctacgtcgc cgcccgccag ctctttggcg 900
aggaagaagc cgcccatatc gcacgccagc agtgttccgg cgaacatcga tgggttagcg 960
ccgagcattt cgtaaaccgg aataattacc ggcccgagaa cgtgagccag taccggtgcc 1020
agcgcggtca taccgaccat cgccag 1046
<210> 112
<211> 1050
<212> DNA
<213> 人工序列
<220>
<223> 基因编辑同源性臂池_5_b1902_左
<400> 112
acatcccagc cacgtttctg catctcttta tacagttcct ggccctgacg ttcgccaatt 60
ttagtcgccg ccatcatcac cagcggaacg gtatccattg gcttaccttt ggcgttaaca 120
aactggtcat ccacggcaat gactttcata tcgtagccac gcgctttcgc gacgatggca 180
gagccgagtt tggggtccgg agtacaaata acgaaacctt ttgcgccact ggcagccagg 240
ctgtcgatcg cgttcaatgt tttttcgcca tccggcacgg caatcttaat aacctcaaac 300
cctaaatcct tcccggcttt atcggcaaac ttccattcgg tctggaacca cggctcttcc 360
ggttgcttca ccagaaaacc gagcttcagg ttctccgcca tagcggattg tgacataacg 420
gctgccagac caatggctgc cagggcttta gtaaatttgt gcatggttct ctccagcttt 480
agtgtcgttt tgtgtagggc aaaaacgaat gacattcgtt aaattaatcg gaaaacaaag 540
cattaccttt taactaaaag ataagtgact gtgttgacat agttttagcg agaaattaat 600
tctccatagg agagcaatat cacatcgcag aattacagtg agaacgtgca taaatttagc 660
gggaaaagac ataagggaaa gccaatttgt cagacaaatt gtcgaatgca cagcagatta 720
atccataaga ttagcctgga aatccttgtt gtctttggta cccatgcggg atgtcttctt 780
tttaaccagt caataggccg cattacctgg cgttgagttt ttgaaatggt gtaataaccg 840
caactcaaag atgtggaaaa tgcacgtcat tcatttcgtc attaattatc actgtgctca 900
ttaattaaca gaacacgtat aatgagagcc atctcgcaaa aatgaaaaaa cgttttataa 960
aatcatcact tcatcatgaa ttcaaattca ttgattaata tcaacaagat acaaaaagca 1020
ctatcattaa aattcattgc agttacattg 1050
<210> 113
<211> 1048
<212> DNA
<213> 人工序列
<220>
<223> 基因编辑同源性臂池_5_b1902_右
<400> 113
atggcaaccg ctggaatgct tctcaaactc aactctcaaa tgaaccgcga gttttacgca 60
tccaatctct accttcacct gagtaactgg tgttctgaac agagtctgaa cggcaccgcc 120
actttccttc gcgcccaggc acagagtaat gtgacccaaa tgatgcgcat gtttaacttt 180
atgaagagtg tcggcgctac ccccatcgtt aaagccattg atgttcccgg tgaaaaactg 240
aactctctgg aagaactgtt ccaaaaaacg atggaagaat acgagcaacg ttctagtacg 300
ttggcacagt tagccgatga agcgaaagaa ctgaatgatg attcaaccgt caatttcctg 360
cgcgatctgg aaaaagaaca gcagcatgat ggtctgttgc tgcaaaccat tcttgatgaa 420
gtgcgcagtg cgaaacttgc gggtatgtgc cctgtgcaga ccgaccaaca tgttctgaat 480
gtcgtgtcac accagctgca ttgatcatca tcggcgctaa tgcattgcgc cgatgaaggt 540
tttgagaaac cgctgcctca tctgtttgaa gcagcggttt ttttaatggg attcaccctg 600
tggggtaaac ttgagttcaa taagcgcgat ggctttttgg attgcccgca tggtgaccgg 660
gtctgcggcg gcgggatggt tagtaaagtc gatattcttc agctgactgg acattttttc 720
acgaacttca acgggcgcga ttacatcgag aacatccaga atttgtttga taaccaactg 780
gcaagcaacc acatcagaaa ccaattcctg atcggcattc agcggctggg acatcgtaaa 840
ctcctgatag cattttgaaa gccgttatag tagcgacttc acatcttcag cgatagtcac 900
atccaccgtc atcaggacac aaaaaaacct gccggagcag gttttttgtt atcggaacat 960
attgcctggc ggtacgtctt tgaacgtctt gcaatagtta ttgaacatac ttttcaggat 1020
tttgcgcagt ttcatcgcgg cactccga 1048
<210> 114
<211> 1049
<212> DNA
<213> 人工序列
<220>
<223> 基因编辑同源性臂池_5_b4310_左
<400> 114
gctttgccgc ctgcagtttc accgccaata atcaatagac tattattcca gggcaatgat 60
actccgtagg cccgaccttg cgataattca cccgatttat cccatttccc gttatgccaa 120
agatgaatat cagtgctata tgattttttc aggccttcat gcgcatagtt cttaccgttc 180
tggtaatttt ctcgtgaacc tttgaatccg gcccctccgg caaatataag agaatcattg 240
cttatccccg caaaaccgcc agctacgcca tctggtgatg agacgggagc aagcttattc 300
cattttaaat tattaccggt gaaatcaagt tcaaatacgg catccgttcg caatcctggt 360
ttggcttcgc cattaataag ccaggtttta tcacctttat tcacaaccgc cgcaccagcc 420
gttccgtacc agggcgattc gccagcgtaa ctccattgct gtgttgaggg atcaaaagac 480
aacagaaact tattgaagaa ataatcttct gcttttttgt caaaatagtg agcattgatt 540
ttatctatag cggttgaatc ttttccagcc tcgttgagat cttcaaaata gccattgaag 600
atattctggt taacaccacc agtaacataa gccttgccgt tgtgtacaaa agtcacatgg 660
cccgccatgc ccatcggcgc gtgcgacatc aatttaaccc aactattggt tttggggttg 720
tatttgtgta cgtcattaaa tacctgagtc aagccctcgc tgtttttgcc aatgccgcca 780
aacacataca gattgccatc aataaatgca gaggttgctt gatctcttgg tccgccaggg 840
aatgcagcta acgctgtcca ttttttatct ttggcctgtg tatccagctt gtaccatgcc 900
gtacctgcgc tacctaaacc aatgtagaca gtgtcgttat caattgctcc ggtaccactt 960
ttaaatggca caggagtttc cggtaataca gacgcgtttg cggcaaatga agccatcatg 1020
atagcaagcg ccgttattgt tttattcat 1049
<210> 115
<211> 1021
<212> DNA
<213> 人工序列
<220>
<223> 基因编辑同源性臂池_5_b4310_右
<400> 115
tgtgactgtc tcctgtctac tacagtttaa atgacacacc aatgcgataa ctgttttccg 60
ataaattatc tctgccgttg taaacaccct gacggtcaag gtagtcatat tctatgtatg 120
gcgtaatatc gggcgtcata tggtattgta gaacaaatgc attttccgtc gcccatttct 180
tatggtttgc atagcgataa tcgttctgtt tgctgtatag cgtcgtttgc catgcgaagg 240
tgaaatcact attaatatgg taagtgacat atccatccca acgatgaacg ttatcacgag 300
acatatcacc ggataagtct tgttgtcggt aagctttcca gtcgtaacga tagcgaatgc 360
caaaattaag atcttttgtc gcgtcccagg acagttttac gtagggtccg tagcgtgtgc 420
cgttgctgct aaaatgcgtt aacattcccg ggcgcaccgt ccattgatca tcaagtttaa 480
tcgcgtaatt aacttcaacc tgaacatcat tgagtgcggc attttccttt ttattatcat 540
gaatggtatt ccaggtatta ctttccatgc ttgcccacca tccattttgc catccctcac 600
tgactttgag tcgagtctca taggcgtggc ttccactacg atatccacca cgtacgtcca 660
gtgtcgcagc ctgagaaatt aatggggacg aaaagcacag taataatacg ccagaaagta 720
ttttagcctt tttcataaat ttcactcatt tgtaggatac agaaagcaat acaaagcccg 780
cataaacaat tagcatttat gttgtgtaat atttttttgc caggcttata gtgtctttgg 840
caaccggtag ctgtatttta tatttttttg tataaggtct cctgtgaaaa atctcttttc 900
acattattta aataaacaga gatccagatt aaatacctga gtataaaatc tcttctgatg 960
tttaattgat ttgaatgttc gtaagctata tcacttactc aatccatttt acccagagtc 1020
a 1021
<210> 116
<211> 1050
<212> DNA
<213> 人工序列
<220>
<223> 基因编辑同源性臂池_5_b0676_左
<400> 116
cactttatcg gcttcggtga tttcaccggc aataacaatt ttttgcggat taaataagtt 60
gatagcaatg gcgatggttt tacccagatg acgaccgaca tactcaatta cttccgacgc 120
cagactatcg cctttgttcg cggctttgca gatagttttg atggtgcagt cgtccagcgg 180
cacgcggctc tggtagccct gctttaacag attcaacacc cgttgttcaa tggcagcgtt 240
ggcagcgata gtttccaggc agccaaagtt gccgcagtgg cagcgttcac ccagcggttc 300
gacctgaata tggccaattt caccgacgtt gccgttgcgg ccaataaaaa tgcgcccgtt 360
agagataatc ccggccccgg ttccgcgatg gacacgcacc agaatggagt cttcgcaatc 420
ctgacttgca ccgaagtagt gctccgccag cgccagacta cggatatcgt gaccaacgaa 480
acaggtcact ttaaaacgtt cttccagagc ttctaccagc ccccagtttt ctacctgaat 540
atgcggcatg taatgaattt tgccgctgtc cgggtcaaca agccctggca ggatcaccga 600
aatcgcgatc agctcgcgca gtttgcgctg gtagctatca ataaactgag caatggcatt 660
caacagggca tgttccagcg tttgctgggt acgttccggc agcgggtaat gttcttctgc 720
cagcactttg ctgctgagat caaacagagt gatggtggcg tcatgacgac caagccgtac 780
gccgattgcg tggaaattgc gggtttcggt gacgatggag atagcgcggc ggcccccggt 840
ggaggcctgc tgatcaactt ctttgatcag cccgcgttcg ataagctgac gcgtaatttt 900
ggttacgctg gcgggggcaa gctggctttg ctcggcaatc tgaatccgcg agattggccc 960
gtactggtca atcaggcgat aaaccgccgc gctgttaagc tgttttacga gatcaacatt 1020
acctatctga gcttgtccgc ctggtgtcat 1050
<210> 117
<211> 1050
<212> DNA
<213> 人工序列
<220>
<223> 基因编辑同源性臂池_5_b0676_右
<400> 117
actttctctt attgagttac gacctcgtta ccgttaacga tggtcttggt gattttaaaa 60
tcaggtgtga atgcagtcag gttggctact ttacctgcgg cgagtgtgcc gagacgtttc 120
tcaacgccaa tcgcacgcgc cggatagagc gtcgccatac gtagcacttc atccagtgcg 180
ataccgcaat gttcgaccag attacgcacg ccttcaatca tggttaagga tgaaccgctt 240
aacgtaccgt tctcatccac acaaagtccg ttacggtagt atattgtttt acccgcaaaa 300
atgaactgtt caatgttggc acctgctggc gcggtggcgt cagtaaccag acacagtttg 360
tcgcctttca gacgtttagc gttgcgaatg ttggcgtaat caacatgcag gccatcagca 420
ataataccgc aataaatgtc agcttcgtcg aggatcgcgc ccgccaggcc aggttcacga 480
ccggtaatat acggcatcgc gttgtacaga tgggtggcaa aggtaatccc cgcgcggaaa 540
ccggcttttg cttctttcaa cgtcgcgttg gagtgaccgg cagaaaccac aatcccggca 600
tttgccagtt tgctgatgac ttccgcagga accatttccg gtgccagggt cactttggta 660
atgacgtcgg cgttttcaca caggaaatcg accagcgcgg catcaggctt acgcacaaaa 720
ttcggattat gggtgccttt ttttaccaga ttcagccacg gaccttccag atgcagacct 780
aacgcctgat tcggatgttt tgccaggtac tcgcgcataa cgcgcacgcc ctgtttcatc 840
agctcatcgc tggtggtgat aagcgtcggc agatagttag tacagcctga tttctcattg 900
gctttctgca tgatttccag cgtttccacg ctgaccgctt cagcggtgtc gttaaactgt 960
acgccgccgc agccgtttaa ctgcacatcg ataaaaccgg gggagagaat ggccccgttc 1020
agtgaacgtt gttcgatctc tggcggcagt 1050
<210> 118
<211> 1007
<212> DNA
<213> 人工序列
<220>
<223> 基因编辑同源性臂池_5_b1497_左
<400> 118
actttagtaa tacgatgctt aggacaaccg ccattgcaga taggtttata tgcacattgc 60
tgacatttcg ctggaatccg ttttttttgc gctgtcagtt gtacactgtt catcgttttg 120
agttcagatt tattaatgtt tccaattttg tactgtggat agacaaaatg gtcgcattcg 180
taaatgtctc cattactttc aacaaccaga ttatccttgc aggactcctg gaaaatacaa 240
ctggtatgcc cattccccaa aaaacggctg acaaagcttt caaactgacg gatgaaaatt 300
tcacccacat cgtttttaac ccattgcata aaaatggttg acataaactt gccataagcc 360
gtgggaggca cagaaaaatc aatgatacgg aatgtgttct cactatgacc actgaaatca 420
atattcggcg tcccggtttc tagcaattcg ataaattgca tatgtttact gccgatagat 480
tttaaaaaat gataaacctc aagagggtaa tggacattaa cgttattaat gacggttaac 540
gtattaaact ctacttgata tgatttcaga cgctcgatgg ctgctatcac ttttgcaaaa 600
gtaccgttac ctgaattact gcgtctgtaa cggtcatgta actcctgggg gccatcgatc 660
gagataccaa ccagaaattc atgttctttg agaaaggcac accattcatt attcaataaa 720
atgccattcg tttgtaatgc attaaaaata cgtttttggc ctgcatagcg ttgttgatag 780
tgaataactt tacggaaaaa atccaggcca gccagagtgg gttcaccgcc ttgccaggta 840
aaatagacct gattgccaga cgctgcgata tattgtttga tgaactcttt cagagtgctg 900
tcatccatcc atttttcatg agtaaactgc gactcttttt caaggtaaaa acagtaatca 960
catttgagat tacattgaaa actggagggc ttggctgtaa cgtgcat 1007
<210> 119
<211> 1050
<212> DNA
<213> 人工序列
<220>
<223> 基因编辑同源性臂池_5_b1497_右
<400> 119
cgctatctcg ctcaataagg cggcggaaaa atccgccgca tgaaggttta gttatttcgc 60
ttcgcttagt gctttcttga tattgttaaa cttctcctga tttacctcgc taagcggtgg 120
ctggctgctg tcgataaact ctcttaccac gccttgcatc tctttaacga cctgcggatt 180
ggcggcggca aggttatctt tttgctgtag atccgtcagt ttgtagagac ctaactgatt 240
gttttctact gtatagacaa gcgaataatc gttatttctc accgtataag agaattggct 300
taagtcctca gtgttggggt tatgcgggta atcgtctgac tgatggcgaa caaatttgtg 360
gtaattatcc cagaatggaa tattttcctc gtcaaaccag tgagaataag aggttatcca 420
ggtcagattt ttatgtggct cgccttgttt cttatcttgc aaccagggca gcaaggaaac 480
gccatccagc ttaaggtctt ttggaatgct gatatcggct gcatcaagag ctgtcgggta 540
gaaatccatt gcggaaatca gcttgtcata attaccgggt tgaagttttc ctttccacca 600
cataaacatt ggggtgtgag taccgccagg ataggtctga ctcttatagc ctttttgcgc 660
cccgttcagc ggcagaggac catcgataac cgcaccatta tcggaggtaa agagaataat 720
tgtattgtca tactgtccgt ttttcttcag ttgttcgaga atgcgtttta caccctgatc 780
aacagaataa acggaagcgt agtagttatc tgctgtttga ctaccggtat taaattgctt 840
ctgatattga tccggtgcag gattatcatt tggcaggtgc ggagcattat aagccaggta 900
aagcataaaa ggctggtcaa gtgttttggc acgatcaaca acgccaattg cctcatcggt 960
taactgatcg ctgatataac cttttgcggg gacacgttca cgatttttga acagtgaagg 1020
ggagttgtaa tatgccgttc ctgcagcgtg 1050
<210> 120
<211> 1045
<212> DNA
<213> 人工序列
<220>
<223> 基因编辑同源性臂池_5_b0183_左
<400> 120
ccaacgcccg ctttgttggt gttgccgggc cacgaatgca ggctgaaggc tgcgaagcct 60
ggtacgaaat ggaagaactg gcggtgatgg gcattgttga agtgctcggt cgtctgcgtc 120
gcttactgca tattcgtgcc gatctgacaa agcgttttgg cgaactgaag ccagatgttt 180
ttgttggtat tgatgcgcct gacttcaata ttactcttga aggtaacctc aaaaagcagg 240
gtatcaaaac cattcattac gtcagtccgt cagtctgggc gtggcgacag aaacgtgttt 300
tcaaaatagg cagagccacc gatctggtgc tcgcatttct gcctttcgaa aaagcgtttt 360
atgacaaata caacgtaccg tgccgcttta tcggtcatac catggctgat gccatgccat 420
tagatccaga taaaaatgcc gcccgtgatg tgctggggat ccctcacgat gcccactgcc 480
tggcgttgct accggggagc cgtggtgcag aagttgaaat gcttagtgcc gatttcctga 540
aaacggccca gcttttgcgc cagacatatc cggatctcga aatcgtggtg ccactggtga 600
atgccaaacg ccgcgagcag tttgaacgca tcaaagctga agtcgcgcca gacctttcag 660
ttcatttgct ggatgggatg ggccgtgagg cgatggtcgc cagcgatgcg gcgctactgg 720
cgtcgggtac ggcagccctg gagtgtatgc tggcgaaatg cccgatggtg gtgggatatc 780
gcatgaagcc ttttaccttc tggttggcga agcggctggt gaaaactgat tatgtctcgc 840
tgccaaatct gctggcgggc agagagttag tcaaagaatt attgcaggaa gagtgtgagc 900
cgcaaaaact ggctgcggcg ctgttaccgc tgttggcgaa cgggaaaacc agccacgcga 960
tgcacgatac cttccgtgaa ctgcatcagc agatccgctg caatgccgat gagcaggcgg 1020
cacaagccgt tctggagtta gcaca 1045
<210> 121
<211> 1040
<212> DNA
<213> 人工序列
<220>
<223> 基因编辑同源性臂池_5_b0183_右
<400> 121
atgatcgaat ttgtttatcc gcacacgcag ctggttgcgg gtgtggatga agtcggacgc 60
gggccgttag ttggcgcggt cgtcaccgct gcggtgatcc ttgacccggc gcgcccgatt 120
gccgggctga atgattccaa aaagctgagc gaaaaacgcc gtctggcgct ctatgaagag 180
atcaaagaga aagcgttgag ctggagtctg ggccgcgcgg aaccccacga aatcgacgag 240
ctgaacattc ttcatgcgac catgctggcg atgcagcgtg ccgtcgctgg gctgcatatt 300
gcgccggaat atgtgttgat tgatggtaac cgctgcccga aattaccgat gcctgcgatg 360
gctgtggtga aaggcgatag ccgcgtaccg gaaatcagtg ccgcgtctat cctggcgaaa 420
gtgacgcgtg acgccgaaat ggcggcgctg gatattgttt tcccgcaata tggttttgcc 480
caacacaaag ggtacccaac cgcttttcat ctggaaaaac tggctgaaca cggcgcgacc 540
gaacaccatc ggcgcagctt tgggcctgtc aaacgcgcac tgggacttgc gtcctgattc 600
ttgtgtcgag attaagtaaa ccggaatctg aagatgtctg aaccacgttt cgtacacctg 660
cgggtgcaca gcgactactc gatgatcgat ggcctggcca aaaccgcacc gttggtaaaa 720
aaggcggcgg cgttgggtat gccagcactg gcgatcaccg atttcaccaa cctttgtggt 780
ctggtgaagt tctacggagc gggacatggc gcagggatta agcctatcgt cggggcagat 840
tttaacgtcc agtgcgacct gctgggtgat gagttaaccc acctgacggt actggcggcg 900
aacaataccg gctatcagaa tctgacgttg ctgatctcaa aagcgtatca gcgcgggtac 960
ggtgccgccg ggccgatcat cgatcgcgac tggcttatcg aattaaacga agggttgatc 1020
cttctttccg gcggacgcat 1040
<210> 122
<211> 1047
<212> DNA
<213> 人工序列
<220>
<223> 基因编辑同源性臂池_5_b3631_左
<400> 122
aatcctggtc ataaagatgc gatatcatgg ggatatgtta ttaactactc ctgtcatcag 60
tacgctcaag cagaattatc ctgatgcaaa aatcgatatg ctgctttatc aggacaccat 120
ccctattttg tctgaaaacc cggaaattaa tgcgctctat gggataagca ataaaggtgc 180
gggaactttc gataaaatta aaaatgtgct ttcgttgata aaaactctgc gtgcgaataa 240
ttatgacctg gtcattaatc ttacggatca gtggatggtg gcgctgctgg tacgttgttt 300
acctgcacgg atgaaaatat cgcaacttta tggtcatcgg cagcatggta tttggaaaaa 360
aagcttcaca cacttagcgc caatacacgg tacacatatt gttgagcgta atttatcggt 420
ccttgagcca ttaggtatta ccgatttcta caccgacaca acaatgagtt acgccgaaga 480
ttgctggaag aagatgcgcc gggaattaga tgccctgggc gtaaaagatc attatgttgt 540
catccaaccg acagcgcgtc agatatttaa gtgttgggat aacgataaat tttctaaggt 600
tatcgatgcg ctgcaacagc gaggctatca ggttgtgcta acctgtgggc cctcggcaga 660
tgatctcgct tgtgtagatg agattgcacg aggttgcgaa acaaaaccca ttactggcct 720
tgcaggtaaa acacgttttc ctgaactggg tgcattaatt gatcatgcag tgctttttat 780
tggtgtggat tctgcgccgg gacatattgc agcggcagtg aaaacgccag tcattagtct 840
atttggtgca acggatcacg tattctggcg tccctggacc gagaatatta ttcaattctg 900
ggcggggaat tatcagaaaa tgccgacccg gcatgaactt gaccgcaaca aaaaatatct 960
ttctgttatc ccagcggagg atgtgatcgc cgctacggaa aagctgttgc cagaagatgc 1020
cccttcagct gacaggaatg cacaatt 1047
<210> 123
<211> 1041
<212> DNA
<213> 人工序列
<220>
<223> 基因编辑同源性臂池_5_b3631_右
<400> 123
atgatcgtgg cgttttgttt atataaatat tttccatttg gtgggcttca acgtgacttt 60
atgcgcattg catcaacagt tgccgcacgg ggccaccatg ttcgggtata tacacagtcg 120
tgggaaggcg attgcccgaa agcatttgag cttattcagg tgccagttaa gtcccatacc 180
aaccatggac gcaatgcaga atattatgcc tgggtacaaa atcatctcaa agagcatccc 240
gcagatcgcg ttgttgggtt taataagatg cctggcctgg atgtttattt tgccgctgat 300
gtttgttacg ccgagaaagt tgcgcaagaa aaaggttttt tatatcgttt aacatcacga 360
tatcgccatt atgccgcatt tgagcgagcg actttcgagc agggtaaatc gacgaaactt 420
atgatgctga ccgataagca aatcgccgat ttccagaagc attatcaaac tgaacctgaa 480
cgttttcaaa ttcttcctcc cggtatttat ccggacagaa aatacagtga gcaaatccca 540
aacagccgtg aaatttatcg ccagaaaaat ggcataaaag agcaacaaaa cttattactg 600
caggttggat cagattttgg ccgtaaaggt gtagatcgct caattgaagc tttggcatcg 660
ttaccggaat cattacgtca caatacgctt ttatttgttg ttggtcagga taagccgcga 720
aaatttgaag cgctggcaga aaaactcggc gtgcggagca atgtgcattt cttctccggt 780
cgcaatgatg tgtcagaatt aatggcagcc gctgatttat tactgcatcc cgcttatcag 840
gaagccgcgg gtatcgttct tctagaagcg atcactgctg ggttacctgt tttaacaaca 900
gcggtatgtg ggtacgcgca ttatattgcg gatgccaatt gtggaacggt catcgctgaa 960
cctttctctc aggaacaatt aaatgaagtt ttacgtaaag cgttaactca gtcgccattg 1020
cgaatggcct gggcggagaa t 1041
<210> 124
<211> 1047
<212> DNA
<213> 人工序列
<220>
<223> 基因编辑同源性臂池_5_b3791_左
<400> 124
gcgctcgctc tctttggtgg tgtagcgatc ttcaccgtgg aactcaccaa agtgttcccc 60
cgcagggcaa ccgtgcagcg gaatgtaatg aaacaccgcc atgatttccg cttctttcag 120
aaagttaatc aacgcgctcc ggtcatcaat atcccgcagt ttaatgtaga acatatgcgc 180
gttctgcacg cagccatcgg gaatcgacgg cagctcgata cgcccggctt tcgccagagg 240
cgctaacgca tcgtagtagt tttgccacag cgccagacgt tgctggttga tacgatccgc 300
tgcttccagt tgcgcccaca ggtatgcagc ttgcagatcg gacatcaaat agctggagcc 360
aatatcgcgc caggtatatt tatcgacctg accacggaag aactggctgc ggttagtgcc 420
cttttcacgg atgatctcgg ctcgttcgat taacgcttta tcgttaatca gcgtcgcgcc 480
gccttcaccg cccgccgtgt agtttttggt ttcatggaag ctaaagcagc caatatgacc 540
aatggttccc agtgcacgcc ctttgtaagt ggacatcacg ccctgagcgg catcttctac 600
cacaaacaaa ttatgctttt tcgccaacgc cataatggtg tccatttcgc aggccacacc 660
cgcgtaatgg accggcacga taacgcgcgt tttgtcggtg atcgccgctt caatcagcgt 720
ttcgtcgatg ttcatggtgt ccgggcgaac atccacaaaa acgatttttg cgccacgcag 780
cacaaaggca ttggcggtgg agacaaaggt gtagctcggc atgatcactt catcgccagg 840
ctggatatcg agcagcagcg ccgccatctc cagcgaagcg gtgcaggacg gcgtcagtaa 900
cactttggcg ctgccaaaac gttgctccag ccactgctgg cagcgacggg taaaaccgcc 960
atcgccacac agtttgccgc tacccattgc cgactgcata tagtcgagtt cggttcccac 1020
caccggcggt gcgttaaatg gaatcat 1047
<210> 125
<211> 1048
<212> DNA
<213> 人工序列
<220>
<223> 基因编辑同源性臂池_5_b3791_右
<400> 125
gtgatcacct gtataaccag tacgcggtgc tttctacatt cgcaccactt tgtatgtatc 60
gtttaagcgc ggcggtgttg cccatttggg tcgccacccg caaagttgtt ttaccgcgag 120
catacgccca gtttagcgcc gtttgcatca gctcagcacc tgcaccgcgt ccagccagca 180
ggccaattcg cgcatctgtc gcattgagtt cccgtaaaga gacatagccg cgaatatcgc 240
cggacgccgc acgtaaaatc agacattgat gatcaaaggt gccgcgcacg gcattttcaa 300
tccactgtgc ataaaagcga ctgctggcgt caggcgcata ccacggcgca cgaaaacggc 360
tttgcgcaaa tgcggcgctg gctaactgac gtaatgcggg aatatcggtc tcttgtgcca 420
ctacagcacc gctatcactg gcattgttca cgggtagcgc caaatcaact tcaccttcta 480
ccagggagaa tcccagctgt tgcagggcat ccagttcacc cgtatttgat gccgcaattt 540
tggcctgcac ccgtgaccac ggcgctaacg cgtctggcgt caggagcggt gcttcagacg 600
taatgcgcac gatggcgctg ttaacaccaa agaaggcgtt ttcccaggtt agtggctcaa 660
tactggcgcg gacgggcacg aagtaactcc agcagatatt ggccgtagcc agttttcgct 720
aatgaactgg cagcacgctt cacaccctcg tcatcgagcc agccgttacg ccaggcaatc 780
tcttccaggc aggcaatctt aaagccctgg cgtttttcca ccgtctgtac aaaggtgctg 840
gcttcaatca ggctgtcgtg agtgccggta tccagccagg caaatccgcg cccgagcagt 900
tcaacggtca ggttgcccgc ctcgaggtac atctggttga tggaggtaat ctccagttca 960
ccacgctccg acggcttcac ctgctttgcg tactccacga ctttactgtc gtagaaataa 1020
agcccggtca ccgcccagtt tgacttcg 1048
<210> 126
<211> 1045
<212> DNA
<213> 人工序列
<220>
<223> 基因编辑同源性臂池_5_b0438_左
<400> 126
gtgactgaaa aagaaaccac tttcaacgag ctgatgaacc agcaggcgta atttacgcag 60
cataacgcgc taaattcgca caaaggcccg tcaccgccag gtggtgggct tttttttgtc 120
atgaattttg catggaaccg tgcgaaaagc ctctttcggt gttagcgtaa caacaaaaga 180
ttgttatgct tgaaatatgg tgatgccgta cccataacac agggactagc tgataatccg 240
tccataaggt tacaatcggt acagcaggtt ttttcaattt tatccaggag acggaaatgt 300
catacagcgg cgaacgagat aactttgcac cccatatggc gctggtgccg atggtcattg 360
aacagacctc acgcggtgag cgctcttttg atatctattc tcgtctactt aaggaacgcg 420
tcatttttct gactggccag gttgaagacc acatggctaa cctgattgtg gcgcagatgc 480
tgttcctgga agcggaaaac ccagaaaaag atatctatct gtacattaac tccccaggcg 540
gggtgatcac tgccgggatg tctatctatg acaccatgca gtttatcaag cctgatgtca 600
gcaccatctg tatgggccag gcggcctcga tgggcgcttt cttgctgacc gcaggggcaa 660
aaggtaaacg tttttgcctg ccgaattcgc gcgtgatgat tcaccaaccg ttgggcggct 720
accagggcca ggcgaccgat atcgaaattc atgcccgtga aattctgaaa gttaaagggc 780
gcatgaatga acttatggcg cttcatacgg gtcaatcatt agaacagatt gaacgtgata 840
ccgagcgcga tcgcttcctt tccgcccctg aagcggtgga atacggtctg gtcgattcga 900
ttctgaccca tcgtaattga tgccagaggc gcaactgtgc cgctatactt atccagggcg 960
gcacaacgct gtaagcggct tgcgcctgag aatggcattt gcgtcgtcgt gtgcggcaca 1020
aagaacaaag aagaggtttt gaccc 1045
<210> 127
<211> 1050
<212> DNA
<213> 人工序列
<220>
<223> 基因编辑同源性臂池_5_b0438_右
<400> 127
atgacagata aacgcaaaga tggctcaggc aaattgctgt attgctcttt ttgcggcaaa 60
agccagcatg aagtgcgcaa gctgattgcc ggtccatccg tgtatatctg cgacgaatgt 120
gttgatttat gtaacgacat cattcgcgaa gagattaaag aagttgcacc gcatcgtgaa 180
cgcagtgcgc taccgacgcc gcatgaaatt cgcaaccacc tggacgatta cgttatcggc 240
caggaacagg cgaaaaaagt gctggcggtc gcggtataca accattacaa acgtctgcgc 300
aacggcgata ccagcaatgg cgtcgagttg ggcaaaagta acattctgct gatcggtccg 360
accggttccg gtaaaacgct gctggctgaa acgctggcgc gcctgctgga tgttccgttc 420
accatggccg acgcgactac actgaccgaa gccggttatg tgggtgaaga cgttgaaaac 480
atcattcaga agctgttgca gaaatgcgac tacgatgtcc agaaagcaca gcgtggtatt 540
gtctacatcg atgaaatcga caagatttct cgtaagtcag acaacccgtc cattacccga 600
gacgtttccg gtgaaggcgt acagcaggca ctgttgaaac tgatcgaagg tacggtagct 660
gctgttccac cgcaaggtgg gcgtaaacat ccgcagcagg aattcttgca ggttgatacc 720
tctaagatcc tgtttatttg tggcggtgcg tttgccggtc tggataaagt gatttcccac 780
cgtgtagaaa ccggctccgg cattggtttt ggcgcgacgg taaaagcgaa gtccgacaaa 840
gcaagcgaag gcgagctgct ggcgcaggtt gaaccggaag atctgatcaa gtttggtctt 900
atccctgagt ttattggtcg tctgccggtt gtcgcaacgt tgaatgaact gagcgaagaa 960
gctctgattc agatcctcaa agagccgaaa aacgccctga ccaagcagta tcaggcgctg 1020
tttaatctgg aaggcgtgga tctggaattc 1050
<210> 128
<211> 1050
<212> DNA
<213> 人工序列
<220>
<223> 基因编辑同源性臂池_5_b1981_左
<400> 128
ggtgtcagga gttattgcga tataagcatc ttttatgatt gctgctgaac gtttaatcga 60
gggtggtaag gataaacggt agacattatt ataacaatcc actaatgccc tggctttatc 120
ttcacctttg ggtccatgaa cgatcactat tggtatatct gtttcacttt aaatttttgc 180
tattagattt tctgcaatcg ataatgaaaa tgtacgttcc tgcgagctac cttctaaatt 240
gaacgcaatg taagatccta acgatcgcat ttcctcgcgc acctcatcga gtacatcctc 300
acttagtggc aattcatata ttggcctgac tgctggaaaa cccgcctcac gcatcataaa 360
tgcccatgtc ataggtacgg gagcccggag tttctgatcc atactggacg cgttcttgca 420
caaaggggag aagcaattca tggttatacc aacaacctga aaattcgttt ttgctttcaa 480
ctgactgata aataacatcg ttttcaggtt ctttttacgc atcccctcaa tgcaaagatc 540
cggcgtaccg tattgctgtg ttatgttctt tgctaaatct tttatttctt ttaatgttgc 600
gtgatcctgc atagtcattg tgactaatgt taatttagtc tgttcaagtt taagcgcatt 660
aaagacttct aaattaattg tcgacgttac aattaaaaga tgcttaattt tatgcaattc 720
aagcgcccga ataacaggaa agatggccat agcatcgcca atctgatcgg gaatatggat 780
gacaacaaag tctgtttttt caatattgaa attataagct ttataatcgt agtaactaaa 840
tgcaatacgt ctcaacaatg atgctaaaaa catacctaac ctcgcctccc tactggttat 900
aatgcaatgc agtctatcag actcatcagg gtgccatttt gtgcatatgc ggacttttat 960
gtttcatatc tctaacctgt gggtcctctg cttaatcctt aaacaacacc agcaactcct 1020
gcgctttcat cttccatcga atttttcatg 1050
<210> 129
<211> 1036
<212> DNA
<213> 人工序列
<220>
<223> 基因编辑同源性臂池_5_b1981_右
<400> 129
atggactcca cgctcatctc cactcgtccc gatgaaggga cgctttcgtt aagtcgcgcc 60
cgacgagctg cgttaggcag cttcgctggt gccgtcgtcg actggtatga ttttttactc 120
tatggcatca ccgccgcact ggtgtttaat cgcgagtttt tcccgcaagt aagcccggcg 180
atgggaacgc tcgccgcatt tgctaccttt ggcgtcggat ttcttttccg tccgctcggc 240
ggtgtcattt tcggtcactt tggcgaccga ctgggacgta agcgcatgtt aatgctgacc 300
gtctggatga tgggcatcgc gacagccttg attggtattc ttccttcatt ctcgaccatt 360
gggtggtggg cacctatttt gctggtgaca ctgcgtgcca ttcagggatt tgcagtcggc 420
ggcgaatggg gaggcgcggc gttgctttcc gttgaaagtg caccgaaaaa taaaaaagcc 480
ttttacagta gcggtgtaca agttggctac ggtgtaggtt tactgctttc aaccggactg 540
gtttcattga tcagtatgat gacgactgac gaacagtttt taagctgggg ctggcgcatt 600
cctttcctgt ttagcatcgt actggtactg ggagcattgt gggtgcgcaa tggcatggag 660
gagtccgcgg aatttgaaca acagcaacat tatcaagctg ccgcgaaaaa acgcatcccg 720
gttatcgaag cgctgttacg acatcccggt gctttcctga agattattgc gctacgactg 780
tgcgaattgc tgacgatgta catcgttact gcctttgcac ttaattattc aacccagaat 840
atggggctac cgcgcgaact tttccttaat attggtttgc tggtaggtgg attaagctgc 900
ctgacaattc cctgttttgc ctggcttgcc gatcgttttg gtcgccgtag ggtttatatc 960
acaggtacgt taatcggaac gttgagcgca tttcctttct ttatggcgct tgaagcacaa 1020
tctattttct ggatag 1036
<210> 130
<211> 1050
<212> DNA
<213> 人工序列
<220>
<223> 基因编辑同源性臂池_5_b1709_左
<400> 130
cgaaacgatc gcgcatcgtc acaaccacaa atcccgaaca gtccacaccg cgccgcgtca 60
tgccaccata acgatacggc gtgccatgcc agctttgtag ctggtcgttc aaaccggcaa 120
taacggtaat cgaatcagaa agtctggcat ttggcggcgg tgctttatgg tggctacacc 180
cggccagaag cagtgctgtg atcaaaataa ggcagaaacg cattccgtac ggttcctctg 240
ttttttattc ttgcattaat ttagcgtcgt aattacccga ttttcaagat actaatgaaa 300
tcagatggtc gaaatcagca ttctgtgacc ttcgatatcc agacggcgaa aattcatccc 360
ataggcctgc gccagatttg gcggcgtgag cacctcttcc ctgcgtccac tggccagcat 420
ttttccacct tttagcaacc acgcccgatg cgcatgacgc aatgtgtggt tgagatcgtg 480
actgctcatc acaatcgcca gtccttgctg acacagcgcg ctcagaattt tgtctaacgc 540
actttgttgc gcaacatcaa gactgttcat cggctcatca agaagcagca attggcctgc 600
gggattggct tgtggtgtga tttgcaacac caccgcagca agacgtacgc gttgccattc 660
accgccggaa agttgattgg tgctacgtcc gagtttgtca tcaagagcca gcgcccctgc 720
gacatcattc agtagttcgg tacgcgtttt atcgtgctga tgcagtgtca ggtagtgcca 780
gaccggcgtt gcaaacggcg gcgtctgctg ttgtgaaaga taggcgcgat gcagcgcgag 840
ttttgttgcg gaccatgctt ccagtggttg ccccgcgaac tgaatgcttc ccttaccgct 900
ggtcattccg gccattcgcg ccagtaaggt actcttaccc gcgccattcg gccccaccag 960
gtgcaggatc tccccagccc gaacctcgcc agaaagcggc cccaggcggg tagattccgc 1020
aacatcttgt aactgcatca caatagacat 1050
<210> 131
<211> 1050
<212> DNA
<213> 人工序列
<220>
<223> 基因编辑同源性臂池_5_b1709_右
<400> 131
tattttgcca acgccagttt aatgctttcc atcacaatgg gatcttccgg cgtcatatcc 60
ggggaaaaac gctggatgac ttttccgtcc ctgccaacca ggaatttttc aaaattccat 120
aaaatatcat ccgggtacag cggtgcacgg cctttgctga ccatacgggc atagaatccg 180
ctctcttccg gcgcgactgc ggtcggcgct gcggcaatca atttttgata cagcggatgg 240
cgtccttcgc cattaacttc aatcttactg aacatcggga acgtcacccc ccatgtggtg 300
gtacagtaag ttttaatctc ttcatcgctg cccggttctt gttccagaaa ctggttgcac 360
gggaatccca gcaccataaa acctcgatcg acccaggctt tctgaatatt ctccaactgc 420
tcatattgcg gcgttaagcc acactttgag gcgacattga caatcaacag cacattaccg 480
gcgaacttct ccagcgtggt cacttcaccg tcgatatctt tcactacggt cgtcagaatg 540
gaatcttgca tcgtttctcc tgggtgtggt cagtaaaaat cttagctttt aatcatagac 600
cgtctttttg cggctaacgt cctgctttta acaataacca gataaacacc ggcgcaccta 660
acgttgcggt gaccacgcca ataggcagct ctgcggcagc taatgccagg cgcgctacaa 720
tatcggccag cagcaatgcg ctcgcccctg ccagcgcgca gccgggaagt aatacgcgat 780
gatcggttaa accacacaac cggagaatat gggggatcac cagaccaata aagccgatag 840
cacccgccag cgccacactg acgccaacca tccagccggt cgctgccacc agcacattgc 900
gccagaacca caggggtaaa cccagttgcc gcgccgagat ctcgccaagt gctaacatat 960
tcatcggcct ggactgacaa cagatccaca acaacacggg gatcaatgcc agcatcagcc 1020
agctttgccg ccagtctacg ccgccaaaac 1050
<210> 132
<211> 1050
<212> DNA
<213> 人工序列
<220>
<223> 基因编辑同源性臂池_5_b2176_左
<400> 132
atggattgca tgcgtttcac tcaattgtac tttaattgac caaccccgct tattaacttt 60
ctgtatcact ttttcttata aaaaatcatg taaaaccgct cgccaagacc gcaccaatcg 120
ggtaatctcg aactcgtttt gcctcggcgg tagattatcc tcacagcata taattttgtg 180
cgttagtcca cagatttggc cttaaggaat tgtttcaaca tgcccaggta attagtctcg 240
tgtcgcttgg cattttttta taacgatatt tgtcgttaag gacttcaagg gaaaacaaac 300
aacatggtca aatctcaacc gattttgaga tatatcttgc gcgggattcc cgcgattgca 360
gtagcggttc tgctttctgc atgtagtgca aataacaccg caaagaatat gcatcctgag 420
acacgtgcag tgggtagtga aacatcatca ctgcaagctt ctcaggatga atttgaaaac 480
ctggttcgta atgtcgacgt aaaatcgcga attatggatc agtatgctga ctggaaaggc 540
gtacgttatc gtctgggcgg cagcactaaa aaaggtatcg attgttctgg tttcgtacag 600
cgtacattcc gtgagcaatt tggcttagaa cttccgcgtt cgacttacga acagcaggaa 660
atgggtaaat ctgtttcccg cagtaatttg cgtacgggtg atttagttct gttccgtgcc 720
ggttcaacgg gacgccatgt cggtatttat atcggcaaca atcagtttgt ccatgcttcc 780
accagcagtg gtgttattat ttccagcatg aatgaaccgt actggaagaa gcgttacaac 840
gaagcacgcc gggttctcag ccgcagctaa taaaccgttt ggatgcaatc ccttggctat 900
cctgacgagt taactgaaag cactgcttag gcagtgcttt tttgttttca ttcatcagag 960
aaaatgatgt ttccgcgtct tgatccaggc tatagtccgg tcattgttat cttttaaatg 1020
ttgtcgtaat ttcaggaaat taacggaatc 1050
<210> 133
<211> 1050
<212> DNA
<213> 人工序列
<220>
<223> 基因编辑同源性臂池_5_b2176_右
<400> 133
atgttcatac gcgctcccaa ttttggacgt aagctcctgc ttacctgcat tgttgcaggc 60
gtaatgattg cgatactggt gagttgcctt cagtttttag tggcctggca taagcacgaa 120
gtcaaatacg acacactgat taccgacgta caaaagtatc tcgataccta ttttgccgac 180
ctgaaatcca ctactgaccg gctccagccg ctgaccttag atacctgcca gcaagctaac 240
cccgaactga ccgcccgcgc agcgtttagc atgaatgtcc gaacgtttgt gctggtgaaa 300
gataaaaaaa cattctgttc atctgcgacc ggtgagatgg acattccact caatgaattg 360
attccggcgc tcgacattaa taaaaacgtc gatatggcga tcttacccgg cacgccgatg 420
gtgccgaaca aacccgcaat cgtcatctgg tatcgcaacc ctttgctgaa aaatagcggc 480
gtctttgccg ctctgaatct caacctgacg ccttcactct tttatagttc acggcaggaa 540
gattacgatg gcgtcgccct cattattggc aatactgcgc tatctacctt ttcttcacgt 600
ttgatgaacg ttaacgaatt aaccgacatg ccagtccgtg aaactaaaat tgcgggcatt 660
cctctgaccg ttcggcttta tgcagatgac tggacatgga acgatgtgtg gtacgcattt 720
ttactgggcg gcatgagtgg aactgtcgtt ggcctgctct gctattacct gatgagcgta 780
cgtatgcgcc ccggcagaga aatcatgacc gccatcaagc gcgaacaatt ttacgtggcg 840
tatcaaccgg tggtggatac acaagctttg cgagtaacgg gcctggaagt actgctacgc 900
tggcggcatc ctgtcgcggg agaaattccc ccggatgcct tcattaactt tgccgaatcg 960
caaaagatga ttgtgccgct gactcagcac ctgtttgagt taattgcccg cgatgccgca 1020
gaattagaaa aagtgctgcc ggtaggcgtc 1050
<210> 134
<211> 1050
<212> DNA
<213> 人工序列
<220>
<223> 基因编辑同源性臂池_5_b2168_左
<400> 134
agttttgctt ttcgcgccgc cgcgcccagc agggtcttcg ccatataggc gcgtgcctga 60
ccgagattag cgtcaataat cagcagcgtt ttcattatgc ctctcctgct gtcagttaaa 120
aggttgtaag tcgacgcgcg ccatcattgc ggccaactgc ggacgatcgg taatacccac 180
attgctttga cttaccgcca gggctgcaac agctgtcgcc agacgcagtg tgtgttcact 240
ggattcacgc atcagcaagc cataaatcag gccaccaacc atagaatccc ctgcgccaac 300
ggtgcttacg acatcgactg acggtggttt ggcgatccat tcgccggagg cattaaccca 360
aagcgcgcct tcggcaccca gtgaaataac aacatgcgcg atgccttgtt cacgtagcgc 420
atgtgcagct tcaatcacat ctttcatttc aggcagttta cggcctgccc agatttccag 480
ctcgcggcgg ttaggtttca ccagccacgg tgccgctttc aaacctgcta ctaacgcttc 540
acggctacta tcaaagataa tgcaaggaca ctgactacgc aggcgagtca tccagtcggt 600
gaacgcttcc gggctgacgc ctgacggtaa gcttccgctg acacagacca tatcgaactg 660
accgagccag ctcagagaat cagtcacaaa gcgttcccag tcggcggggg tgacttcaaa 720
acccgagaag ttgaagtcgg tcacttcgcc gtctttttcc gtcagcttaa cgttaattcg 780
ggtgcgcccc tgtacaacct ggaaacggtt ggcaatgccc agctcgctga acagttgctg 840
aaaaccatcc tgattgtctt tacccaggaa gccgccaacg gtgacatcaa ttcccaggtc 900
ttttaatact ttggccacgt tgatgccttt acccgccgca tgcagaccgg tggttttcac 960
caggttcact tcgccgcgtt caatttccgg gcagaaacca acaaggtcat aagccggatt 1020
aagggtgata gtagcaacac gtctgctcat 1050
<210> 135
<211> 1046
<212> DNA
<213> 人工序列
<220>
<223> 基因编辑同源性臂池_5_b2168_右
<400> 135
tatgcgccct ccccaagacc agcagcgata gcgtcgccga ttgctttcag cgcctgttca 60
gcatctgcac cctgggcggt aaagcgtagg cgatgacctt tcttaacgcc aagtgccaca 120
actttcatca gactacgtcc gtttgccggt ttgccggtac catcaaggtt tgtcacggta 180
atatcactgt taaattgttt aatggtattg accagcatgg tacctggacg agcatgcagg 240
ccgtgttcat tgcgcaccac aaactccgcg cttaacacgt cgtcggtcgg cgcatcatcg 300
ctggtcagca gcgccagcaa cgttgccgca tccgctttca gcaagcggtc agctttattg 360
tcgagcaata aatcagcgag acgcttaaga accgcgatgg gctgatcgtc attcatcgcc 420
acactcacca gcatggctgc cgtttcgccg tccacatcaa aagcatttgc cgcacggctt 480
accgcaatcg cgctacgcag attgccttcg gcgctatcgc tcagccagat accctgtccg 540
agattcagcg gttgttcatt gatggctttg gtgacgaaag tggcgtcaac tgcccccgcc 600
tctttcagac gcgcagcgtt cagcgcctga agagtcagca gatcgctggc gacgatatcc 660
agtgtcagca tttcgttgtc gagcttcagc tgctcactct gcttttcgcc catcagtaat 720
gcgcgaagtt cttctgctgt tgttgctgac ttcagttgtt cagcaacgga atcatcgctc 780
agtacgtggg tcagctggcg tagcaggccc agatgttcat ccgagctggc agcaataccg 840
attgccacgt acgctacctg accgtcaccc caggtgacgc cttccgggaa ctgaaatacc 900
tgaacgccgg ttttcagcac ctgatcgcgg gtgtcggtag tgccgtgtgg aatagcaata 960
ccattgccga ggaacgttga ggtttgctgt tcgcgcgcca gcatgccatt gacgtagcct 1020
tctgctacat taccggcctg caccag 1046
<210> 136
<211> 1050
<212> DNA
<213> 人工序列
<220>
<223> 基因编辑同源性臂池_5_b1872_左
<400> 136
catcagcatt gtgcgattcg ccgccatcag ttcagcgagt ttgactatct gcgcttccgg 60
tacgccagta atttccgccg cccagaccgc gctcttcggc gtattatcgc tcttacctgt 120
cagatactct tcaaactgcg gatacccggt agtgtatttt tcaaggaaca ctttatcgtg 180
tttgccttgt gtcatcaggg tatgcgcaat ccctaacatc agtgccacgt cggtgcccat 240
attcggcgcg atccaggtgg cattatcgtc aaagaattcg atggtttcgg agcggatagg 300
atcaatggca atcactggtt tgccagattt tttcagctga tggaagtatt ccagcccttg 360
ctcatcggta ctgctccagg caatttttaa ggtattcagc gggttcattc cccacagcac 420
cacaacctgg ctgttttcca gaatcagcgg ccaggaggtc tgctgttcat acacctctac 480
agaaccgacc acatgcggca tgatcacctg tgctgccccg gttgaataat cgccgctatg 540
cccggaataa ccgcccgcca ggttcatata acgttgcagt aaggtttgcg ctttatgcaa 600
cacgccagaa gagcgccagc cgtaagatcc ggcaaaaatg gccgatggtc cgttagcttt 660
acgaatacga tcatgttgct catgaatcag ttttaatgcc tgttcccagc tcacctgtac 720
ataggtatct tcgccacgac ctttcgccgg ttgcagtgga ttatcgagat agctttttct 780
caccatcgga tgctgaatac gcgccgtggt gtgtacctga tccgccgccg tagactgtaa 840
ggaattcggt atggttttcg ccagcgcgcc tgttgaagaa acaatcttgc cgtccttcac 900
ttctacgttc atcgctcccc aacgtcccgc ggtgaggatt ttaccgccct tctcttctgc 960
ccatgcgggg agcggtgctg ccgatgtcac caccagcgct ccagcggcaa taccgctgtg 1020
tttaataaat tcacgtcttg ttaatgtcat 1050
<210> 137
<211> 1050
<212> DNA
<213> 人工序列
<220>
<223> 基因编辑同源性臂池_5_b1872_右
<400> 137
aacttcctcc ctgatcaacg aggatcactg tttctcggta atatctttgg cgttgtactg 60
gaaataccgc gttaaaatgt ccagttcgtt ttcgctcatg ctggttcgtg cccccattcc 120
tttggcaatg gacggccacg cattgacggt gtaatggtcg gcggcaatag gggcatgaca 180
accagcgcaa taggtatcgt caagtttttc agcgtattgc catagcggtt tacggtccgc 240
taatgcggga tcggtaagcg caccctgtaa agacgcctga cgccattgat tgccgtattc 300
gtcagcctgc cattccccgt ttacagtgag cgccttgata ccttcttcac ttaatgtggc 360
tagcgccagc cgttgacctg ccgccaggta gagcgtgttt tcactgccct gcatttgata 420
accctgcaac agaacgatcg gctgtttgcc actggcatca acgacggtga gatcggttcc 480
aggattcacg gtagccagct cgcctatgtg agaagttttg aaaggataaa tatgtgcgcc 540
attagtaact gaagtagcgg cctgactttc cagctcatgc gccgcgttgt catccatttt 600
tatttctggc ggaaaatggg caatgccttt atgacaatcg atacaggttt cgctgtcctt 660
ttgtgctttg ttatgcattt tctgcgcaga ttcactttgc gaggcaatat ccatggcatc 720
aaaagaatgg caactacggc acgttgcaga gtcagtggct tttaattctt tccatactgt 780
ttcggccatt tcctggcgat gagcttcgaa cttatcgtca ctgtctattt tgccgctaac 840
aaattcatga taaatatctt tagatgcctt taatttagca aataaataat ccatccctga 900
ctttggaata tggcaatcgg cacattccgc acgtatccct ttctggttcg aaaagtggac 960
agttccctga tattcctcaa aaggtttact catcgagtgg caggaaaggc aaaatgctgt 1020
atccgacgtt ttatgtaaga ctttttgcgc 1050
<210> 138
<211> 1050
<212> DNA
<213> 人工序列
<220>
<223> 基因编辑同源性臂池_5_b1203_左
<400> 138
gatgtaatct ttaccttctg cacgcatttt gcctgcttct ttcgcgcctt gttcaccttt 60
gtaagtgatg aaatcttcaa acgagatggt ttgtgcacgg ataaagcctt tttcaaaatc 120
agtatggatt ttgcccgctg cctgcggcgc ggttgctcca accggaatgg tccatgcacg 180
cacttctttc accccagcgg tgaagtaagt ttgcaggttc agcagtttat aaccggcacg 240
gatcacacgg ttcaggcccg gctcttccag cccaagctcc tgcataaact cgtcacgttc 300
ttcgtcgtcc agttcggcaa tgtctgcttc aacagcagca caaaccggaa ccacaacaga 360
accttctttc gccgcgattt cacgcacctg gtcaagatat gggttgtttt caaaaccgtc 420
ttcgttgacg ttggcgatgt acattgttgg tttcagcgtc aggaagctca ggtaacgaat 480
agccgctttc tcttcagcgc ttaaatccag cgcgcgcagc atacctgcat tttccaactg 540
gggcaggcat ttttccagga ccgccagctc agctttcgcg tctttatcgc cacctttggc 600
tttcttctgt acgcgatgaa tcgcacgttc gcaggtgtcg aggtctgcca gcgccagttc 660
ggtgttgata acttcaatat cgtcagccgg gttaactttg ccggaaacgt gaatgatgtt 720
gtcattttca aagcagcgaa caacgtgacc gatcgcttcg gtttcacgga tgttggtcag 780
gaactggtta cccagacctt cgcctttcga tgcgcctttt accagaccgg cgatatcgac 840
aaattccatg gtcgtgggaa gcgtacgctg cggttttacg atttcagcca gttgatccag 900
gcgaggatca ggcattggta cgacgcctgt gttcggctca atggtgcaga atggaaagtt 960
ggccgcttca ataccggctt tggtcagcgc gttgaacagg gtagatttcc cgacgttggg 1020
caaaccgacg ataccgcatt tgaatcccat 1050
<210> 139
<211> 1036
<212> DNA
<213> 人工序列
<220>
<223> 基因编辑同源性臂池_5_b1203_右
<400> 139
ttattgcgct ttaaaggcgt gcaatcggtt cgttgctttg gtcaagccat ctgtaaacca 60
catttcagta caacgcgccg cttcgtcaat ggcttcatca attaacttct gttcactaac 120
aggcggtttg cctaacacaa aaccgacaac tttattttta tcgcccggat gaccgattcc 180
gatgcgtaaa cggtgaaagt tagggttatt acccaattta ctgatgatgt ctttcagtcc 240
attgtgacca ccatggccac cgcccaattt aaatttggcg acgccaggag gcagatccag 300
ttcgtcgtgg gccaccagaa tttcgtccgg attaatgcgg aaaaaactgg ccatcgccgc 360
aacggctttg ccgctgagat tcataaatgt agtcgggact aacaggcgga catcttcgcc 420
tccaagagtg actcgcgaag tataaccaaa gaatttagcc tcttcgcgca gcggagcgcg 480
caaacgctct gccagtaagt caacgaacca ggcaccagca ttatgtcgcg ttgcggcgta 540
ttcagcaccg gggttcgcca ggccgacaat caatttaatc gtcacgtttt tttgtcctga 600
gtgtgtacat aactggcgcg tagtttactg gttgcggccc cgcttgacaa aaaactgcgt 660
atcaaatgca gataacgtaa taattgcctg agtggactat tagaaagtca aggtgttcag 720
gcgtttattt gtaaagtttt gttgaaataa gggttgtaat tgtgatcacg cccgcacata 780
acccactggg tgttgtctat actttacaca taaggaagag gggtattccc tgttacaacc 840
cagaaagttc cggaggtgac atatgaaacg caaaaacgct tcgttactcg gtaacgtgct 900
catggggttg ggtctggtgg taatggtggt cggcgtgggg tattcaatcc tcaaccagtt 960
accacagttt aatatgcccc agtatttcgc acatggtgca gtgctaagta ttttcgtcgg 1020
tgccattctc tggctg 1036
<210> 140
<211> 1050
<212> DNA
<213> 人工序列
<220>
<223> 基因编辑同源性臂池_5_b2231_左
<400> 140
gatgtctttc aggttcatga tcttcggctg accatggtgc aatgccacca tgttgatacc 60
gaaagaaacc tgcaactggg tctgggagta gaggttgttg agcacaactt caccgaccgc 120
atcgcgtttc acttcaatca cgatgcgcat accgtctttg tcagactcgt cacgcagcgc 180
gctgatgcct tccacgcgtt tttcttttac cagttccgca atcttctcga tcaggcgcgc 240
tttgtttacc tgatacggaa tttcgtggac gataatggtt tcacgaccgg ttttggcgtc 300
aacttccact tctgcgcgag cgcggatata caccttgccg cgaccggtac ggtaagcttc 360
ttcaataccg cgacgaccgt taatgattgc cgccgtcggg aagtccggcc ccgggatgtg 420
ttccatcagc ccttcaatgc tgatgtcttc atcatcaata tacgccagac aaccgttgat 480
gacttccgtc aggttgtgcg gcgggatgtt ggttgccata cctacggcga taccggaaga 540
accgttcacc agcaggttag gaattttggt tggcatgacg tccggaattt tttccgtgcc 600
gtcatagtta tcaacgaaat cgaccgtctc tttttcgaga tcggccatca gttcatgggc 660
aattttcgcc agacggattt ccgtataacg cattgccgcc gcagagtcgc cgtcgataga 720
accgaagtta ccctgaccgt ctaccagcat ataacgcagc gagaatggct gcgccatgcg 780
gacgatcgtg tcatagaccg ccgagtcacc atggggatgg tatttaccga ttacgtcacc 840
aacgacacgg gcagattttt tataggcttt gttccagtca ttgcctagta cgttcatggc 900
gtaaagtacg cgacggtgta ccggcttcag gccatctcgg acatctggca gcgcacggcc 960
aacaatgacc gacatcgcat aatccagata ggagctcttc agctcttcct caatgttgac 1020
cggtgtaatt tctctcgcaa ggtcgctcat 1050
<210> 141
<211> 1048
<212> DNA
<213> 人工序列
<220>
<223> 基因编辑同源性臂池_5_b2231_右
<400> 141
aatgcctgat atactcgttt gtcttgccaa ttacggagta gaagtgccaa tgaatgccga 60
aaaatcgccg gtaaaccata acgtagacca cgaagagatc gctaaatttg aagccgtcgc 120
ctcccgctgg tgggatctgg aaggtgagtt caaaccgctg caccgcatta acccgctgcg 180
tctgggctat attgccgagc gtgctggcgg tttatttggc aaaaaggtgc tcgatgtcgg 240
ttgtggcggc ggcattctgg ccgagagtat ggcgcgcgaa ggcgcgacgg tgaccggtct 300
ggatatgggc tttgagccat tgcaggtggc aaaactgcac gcactggaaa gcggcattca 360
ggtggattac gtgcaggaaa ccgtggaaga gcacgcggca aaacatgccg ggcagtatga 420
tgtggtgacc tgcatggaga tgctggagca cgtccccgat ccgcagtcag tggtcagagc 480
ctgtgcgcaa ctggtgaaac caggcggcga tgtctttttc tcgacactta accgcaacgg 540
caagtcatgg ctgatggcgg tggttggtgc ggaatatatt ttgcgcatgg tgcccaaagg 600
cacgcatgat gtgaagaagt ttattaaacc ggcagaattg ctgggctggg tggatcagac 660
cagtttaaaa gagcggcata tcactgggct gcattacaac ccgatcacta atacttttaa 720
actcggcccc ggcgtggatg tgaactatat gctgcacacg cagaataagt gaggttgatg 780
tttggccgcg ccaatgcctg atgcgacgct tgccgcgtct tatcaggcct acaaatgctc 840
cccgtaggcc ggataaggcg tttacgccgc atccggcaac cgtgccgact agacagtgat 900
taccatttca ccgtcatcga caaaaaccct gccgtctggg caaaatcatc actccctttc 960
tgccacgcca cgctgccgcg cagggacact cgctgactga tattgcccgt gactcccact 1020
tttatttcac cccgttgctt caccgcat 1048
<210> 142
<211> 1050
<212> DNA
<213> 人工序列
<220>
<223> 基因编辑同源性臂池_5_b1622_左
<400> 142
attatctcct cgctggtgat gggccttgtc ggcctggtga ttccattagt ctggccgatt 60
ttcgccatgg gtattagcgg cttgggccat atgataaaca gcgcgggtga tttcggaccg 120
atgctgtttg gtaccggtga acgtctgctg ttgccgtttg gtctgcatca cattctggtg 180
gcattaattc gctttaccga cgcaggcggc acgcaggaag tctgcggtca aaccgtcagc 240
ggcgcactga ccatcttcca ggcgcaattg agttgcccga ccactcacgg tttttctgaa 300
agcgccacgc gtttcctttc gcaaggtaaa atgcctgcgt ttctcggcgg tctgccaggt 360
gcagcgttag ctatgtatca ctgcgcgcgc ccggaaaatc gccataaaat taaaggtctg 420
ctgatttctg gcctgatcgc ctgcgtcgtt ggcggcacta ccgaaccgct ggaattcctg 480
ttcctgttcg tagcgccagt tctgtatgtc atccacgcgc tgttaaccgg cctcggcttc 540
accgtcatgt ctgtgctcgg cgtcaccatc ggtaataccg acggcaatat catcgacttc 600
gtggtgttcg gtattttgca tggtctgtca accaagtggt acatggtgcc agtggtggcg 660
gcaatctggt ttgtcgttta ctacgtcatc ttccgtttcg ctatcacccg cttcaatctg 720
aaaaccccgg ggcgcgatag cgaagttgcc agctcaatcg aaaaagccgt tgccggtgcg 780
ccgggtaaat caggttacaa cgttcctgca atcctcgaag cattaggcgg tgccgacaat 840
attgtcagcc tcgataactg cattacccgt ctgcgtttgt ctgtgaaaga tatgtcgctt 900
gttaatgtgc aggcactgaa ggacaatcgg gcaattggcg tagtacaact taatcaacat 960
aacctgcagg ttgttatcgg gccacaagtt cagtcagtaa aagatgaaat ggccggtctg 1020
atgcatactg tccaggcata aggataagat 1050
<210> 143
<211> 1050
<212> DNA
<213> 人工序列
<220>
<223> 基因编辑同源性臂池_5_b1622_右
<400> 143
atgttcgatt tttcaaaggt cgtggatcgt catggcacat ggtgtacaca gtgggattat 60
gtcgctgacc gtttcggcac tgctgacctg ttaccgttca cgatttcaga catggatttt 120
gccactgccc cctgcattat cgaggcgctg aatcagcgcc tgatgcacgg cgtatttggc 180
tacagccgct ggaaaaacga tgagtttctc gcggctattg cccactggtt ttccacccag 240
cattacaccg ccatcgattc tcagacggtg gtgtatggcc cttctgtcat ctatatggtt 300
tcagaactga ttcgtcagtg gtctgaaaca ggtgaaggcg tggtgatcca cacacccgcc 360
tatgacgcat tttacaaggc cattgaaggt aaccagcgca cagtaatgcc cgttgcttta 420
gagaagcagg ctgatggttg gttttgcgat atgggcaagt tggaagccgt gttggcgaaa 480
ccagaatgta aaattatgct cctgtgtagc ccacagaatc ctaccgggaa agtgtggacg 540
tgcgatgagc tggagatcat ggctgacctg tgcgagcgtc atggtgtgcg ggttatttcc 600
gatgaaatcc atatggatat ggtttggggc gagcagccgc atattccctg gagtaatgtg 660
gctcgcggag actgggcgtt gctaacgtcg ggctcgaaaa gtttcaatat tcccgccctg 720
accggtgctt acgggattat agaaaatagc agtagccgcg atgcctattt atcggcactg 780
aaaggccgtg atgggctttc ttccccttcg gtactggcgt taactgccca tatcgccgcc 840
tatcagcaag gcgcgccgtg gctggatgcc ttacgcatct atctgaaaga taacctgacg 900
tatatcgcag ataaaatgaa cgccgcgttt cctgaactca actggcagat cccacaatcc 960
acttatctgg catggcttga tttacgtccg ttgaatattg acgacaacgc gttgcaaaaa 1020
gcacttatcg aacaagaaaa agtcgcgatc 1050
<210> 144
<211> 1050
<212> DNA
<213> 人工序列
<220>
<223> 基因编辑同源性臂池_6_b1857_左
<400> 144
agcgacggcc agagtaagaa cggtgagcga ccccaacata acgcggtgtg gtcgcggtaa 60
attattaaac gccagggcga cagagcgggc tatctgttgc acgtaatcac ttcctcatta 120
atctcctttc aggcagctcg catactggtt ggctaattga ctcaggaatt ctgaatagct 180
tgttttaccc agtttgatat tcgtccccag gggatccaac gttcccatac gaacggatgt 240
ccctcgtgcg acgctctcaa cgaccgctgg cctgaactgt ggctcagcaa aaacgcaggt 300
tgctttttgc tcaaccaact gtgttcttat ttcatgtaaa cgctgcgcgc caggttgaat 360
ctcagggtta acggtaaaat gaccaagcgg tgtcagtcca aactgttttt cgaaatagcc 420
gtaagcatcg tgaaaaacga aataaccttt ccccttgagc ggcgcgagct cgttaccaac 480
ctgcgtttcg gttgaggcta attgtgcctc aaaatccttc aggttggcgt caagtttggc 540
tcgactttgc ggcataagtt ccactaattt tccatggatt gcaaccgctg tagcccgcgc 600
tatctctggg gaaagccaaa gatgcatgtt gaaatcgccg tgatggtgat cttcgtcact 660
tttttccgcg tggtcgtgat catcatcatc gccgtgaata cttttcatca gtagcggttt 720
cacatcttca agctgcgcaa tcgttacctg cttcgctcct ggtaatttgc ttaccggttt 780
ttgcataaac gcttccatct ccgggccaac ccaaacgact aagtccgcgt tctgtaagcg 840
ttttacatcc gatgggcgca gtgaataatc atgttctgaa gcgccgtcag gaagtaaaac 900
ctctgtttct gttaccccat cagcaatggc agaagcgatg aacccaacgg gtttaagcga 960
agcgacaacg gcggcatctg cggcctgtgt tgcacctccc cagagagcgg cggataatgc 1020
tgcgaaaaga agcgtttttt tatgtaacat 1050
<210> 145
<211> 1031
<212> DNA
<213> 人工序列
<220>
<223> 基因编辑同源性臂池_6_b1857_右
<400> 145
aatgcgacca ataatcgtaa tgaatatgag aagtgtgata ttataacatt tcatgactac 60
tgcaagacta aaattaacat gacaagtctg gtttccctgg aaaatgtctc ggtttctttt 120
ggccaacgcc gcgtcctctc tgatgtgtcg ctggaactta aacctggaaa aattttgact 180
ttacttgggc caaatggcgc aggtaagtcg acactggtac gggtagtgct cgggctggta 240
acacccgatg aaggggttat caagcgcaac ggaaaactgc gcatcggcta tgtaccgcag 300
aagctgtatc tcgacaccac gttgccactg accgtaaacc gttttttacg cttacgccct 360
ggtacacata aagaagatat tttgcctgca ctgaaacgtg tccaggccgg gcacctgatt 420
aacgcaccga tgcaaaagct ctctggtggc gaaacgcagc gtgtactatt agcgcgagca 480
ttgttaaatc gcccgcaatt attagtgctg gatgaaccca ctcaaggcgt ggatgtaaat 540
ggccaggtgg cgttatatga ccttattgac caactgcgtc gtgaactgga ttgtggcgtt 600
ttaatggttt ctcacgatct gcatctggtg atggcaaaaa ccgatgaagt gctgtgcctg 660
aatcaccaca tttgttgttc cggcacaccg gaagttgttt ccctgcatcc ggagtttatt 720
tcaatgtttg gtcctcgtgg tgctgaacaa ctgggtatct atcgccatca tcataaccat 780
cgtcacgatt tacagggacg aattgttttg cgtcggggaa atgatcgctc atgattgaat 840
tattatttcc cggttggtta gccgggatca tgctcgcctg tgccgcgggt ccgctgggtt 900
cgtttgtagt ctggcgtcgt atgtcttatt tcggtgatac gctggctcat gcctcattac 960
ttggcgtcgc gtttggtttg ttgctggacg tgaatccatt ctatgcggtg attgccgtta 1020
cgctgctgct g 1031
<210> 146
<211> 1050
<212> DNA
<213> 人工序列
<220>
<223> 基因编辑同源性臂池_6_b4024_左
<400> 146
tgccacgctc acttctgacg tggtgattaa gtctaccgaa atattatgcc gcgcgaggat 60
gccgaaaact tccgcgagga aaccgcgaga atgcagcata ttcaggctgt gcaaagtgag 120
cagagtctga ttgcgacgaa gcgccagagc gcggaacagc ggcggatttt cagttttatt 180
gcacaccagc gtaccacctg cgcgtgggtc tttgctggag ccgacaaaga ccgggatatc 240
gctgcgtact gcgggtagca acgttgccgg atgcagtact tttgcaccaa aagttgccat 300
ctctgccgct tcggcaaacg cgatttcatc aatgcgtttt gctgcggaaa ctacgcgtgg 360
atcggtggtg tagatgcccg ggacgtcggt ccagatatca acacgagatg cgtgtaaagc 420
ctccgccagc aaggctgccg tataatcgct gcctccacgg ccaagcgtcg ttgtacgacc 480
tttattttcg ctaccgataa atccctgggt gatcactaag ccttcattga gacgtgggag 540
cagctgcagc gcggccagtt ccgccagcgc ggctatatct ggctctgcac gaccaaatcg 600
gtcgttggta cgcatcactt tacgtacatc aaaccactgt gcctgaacat cgcgttcgcg 660
caggatctca acaaacagca gggtcgacat cagctcgccg tggctgacca gctcatctgt 720
cagcgccgga gacgttgcca gcgccgccgc ttctgccaga acagtaatgt tctccagcag 780
acgttcaatc tcttcacgga taacgttcgg gtaacgcaga cgttccagaa tggcaaactg 840
gatgttgcgg atagcgtcga gtttttcgaa tcgctcgcca ggttccagtc cttcagctaa 900
agcgaccagc agattagtga taccagcaga agccgagagg acaactaaac gcacgttggc 960
atcagaaagc acaatatcag cgctgcggtt catggcgtca aaatcagcta cgctggtacc 1020
gccaaatttg gagacaacaa tttcagacat 1050
<210> 147
<211> 1050
<212> DNA
<213> 人工序列
<220>
<223> 基因编辑同源性臂池_6_b4024_右
<400> 147
aactacctcg tgtcagggga tccattttca gccttggcac aagggaagag cggaagacgg 60
gtgggcgcag agcgatactt cgctactatt ttcacccaga agtgctccac cacttgcgaa 120
acgcccgact gcgaacgctt ctggtgacaa cccaggggat tcagcccctg tagccgatga 180
tgaacgtggc cagccgttca atcacctcgg cgatgcaccc cctcaggtgt tatcacagga 240
ctggctcctc caacaccgtt acttgggcaa cgcgcctctt ctggcctgcg ctagcgcagg 300
tagtacattt ataaataaag ggtgagcggg gcggttgtca acgatggggt catgcggatt 360
tttcatccac tcctggcggt cagtagttca gctaataaat gcttcactgc gctaagggtt 420
tacactcaac attacgctaa cggcactaaa accatcacat ttttctgtga ctggcgctac 480
aatcttccaa agtcacaatt ctcaaaatca gaagagtatt gctaatgaaa aacatcaatc 540
caacgcagac cgctgcctgg caggcactac agaaacactt cgatgaaatg aaagacgtta 600
cgatcgccga tctttttgct aaagacggcg atcgtttttc taagttctcc gcaaccttcg 660
acgatcagat gctggtggat tactccaaaa accgcatcac tgaagagacg ctggcgaaat 720
tacaggatct ggcgaaagag tgcgatctgg cgggcgcgat taagtcgatg ttctctggcg 780
agaagatcaa ccgcactgaa aaccgcgccg tgctgcacgt agcgctgcgt aaccgtagca 840
ataccccgat tttggttgat ggcaaagacg taatgccgga agtcaacgcg gtgctggaga 900
agatgaaaac cttctcagaa gcgattattt ccggtgagtg gaaaggttat accggcaaag 960
caatcactga cgtagtgaac atcgggatcg gcggttctga cctcggccca tacatggtga 1020
ccgaagctct gcgtccgtac aaaaaccacc 1050
<210> 148
<211> 1029
<212> DNA
<213> 人工序列
<220>
<223> 基因编辑同源性臂池_6_b3942_左
<400> 148
gctgcgggtc tgtacccact catacttgaa caggttctcg aagaaatagt tgctccactg 60
ggtcggcgtc tgggtccaga ctacttccag accagaggta atggcatctg cgccaacgcc 120
gctgccgtaa gtgctcgccc aacctaaacc ttgttcttca atcggtgcag cttctggatc 180
aggacctaca tttgatgtcg gaccggcacc gtgggtttta cccagcgtat gaccacccgc 240
aatcagcgcc acggtttctt cgtcgttcat gcccatgttg ccgaaggtcg cgcggatagc 300
tgctgccgca gaaagcggtt cgccgctgtg atccgggcct tccgggttaa cgtaaatcag 360
acccatctcg gttgcaccca gcggtgcttt cgccagcgct tccggatgac ggtgagtcag 420
ccaggctttt tcatcacccc agttaacatc cagatccggt tcccagacgt cttcacgacc 480
ggcaccaaaa ccgaaggtac ggaagccgga gttttctagc gccacgttac ccgcgaggat 540
aaacaggtcg gcccaggaga ttttctgacc atatttctgt ttgattggcc acaacaggcg 600
acgcgcttta tcgaggctta cgttatccgg ccaggagttc agcggtgcaa aacgttgctg 660
accacgaccc gcgccaccgc gtccatcgat tgaacggtaa gtccccgcgc cgtgccaggc 720
catacgaata aacagaccgg cgtaactgcc ccagtcggct ggccaccacg gttgagattc 780
tgtcaacagg gctttcagat cttttttcag gccgtagtaa tctaatttgc tgaattcttt 840
gcggtagtca aagtcctcac ccagtgggtt agaacgatta gaatgttggt ttaacaggtc 900
aacacgaagt tgatttggcc accagtcgcg agtggttgtg cccgcccccg cactctggtc 960
gtgaccgccc tgatggaacg ggcatttgcc agtggctgtg gtgttatgga tatcgtctga 1020
cgtgctcat 1029
<210> 149
<211> 1045
<212> DNA
<213> 人工序列
<220>
<223> 基因编辑同源性臂池_6_b3942_右
<400> 149
agttgagatc ttacatattg ttggttaaag agatgtagat caaattgatc ttaattaagc 60
ttttttgatt atgtccgaat tcggacaaat gctttataaa aaagggtttt agcttcatat 120
ccttcaagta atgagggaga aaacaaggct gataacctta ttttcccgcc ctcatttcga 180
ggcagcattt tgtgctctgt ttaaaatttg tgatcactgt gtgattttca caaaagccac 240
actatttata aaccaggtcg aacccccagc gtatggcaaa tcgcgtaact catttcagca 300
cggttaagcg tatagaagtg gaaatctttc actccttcac ggcttaaaat cttcaccata 360
tccatggcaa tattcgcgcc aaccagtttg cgggtttcgg catcatcatc cagaccgtcg 420
aacatttgcg ccatccacgc cggaatacgc acgttggtca tatcggcaaa tttcttcgcc 480
tgtttaaagt tagataccgg caaaattccc ggaataattt ccacatcaat gcccgccgat 540
acacagcggt cacgaaaacg caggtagctt tcgacatcga agaagaactg agtaatcgcg 600
cggttggctc cggcatccac tttgcgtttc agattaagca aatccgcctg agcgcttttt 660
gcttccgggt gaacttccgg atacgccgcc acggagatat cgaaatctgc cacttctttt 720
aacagcgtca ccaggtcaga agcatacatt tctggcttac cacttcccgg cggcagatcg 780
ccacgcagcg ccacgatatg acgaataccg ttattccagt agtcgcgtgc aatggtgcgc 840
agctcgtcgg gcgtcgcatc aatgcaagta agatgcggtg ccgcttccag accagtgcga 900
tctttaatgc ctttaataat gctgtgcgta cggtcgcgct cgccggagtt cgcgccatag 960
gtcaccgata caaacttcgg tttcaggctg ctaaggcgat cgatggagtt ccacagggtc 1020
tgctccattt cactggtacg cggcg 1045
<210> 150
<211> 1050
<212> DNA
<213> 人工序列
<220>
<223> 基因编辑同源性臂池_6_b0592_左
<400> 150
ttgattatcg gcgtgttgtt attgctggtg ctggtggagt tgcgacattt tcgccagacg 60
ccgccgcagg tgacagcgtc cgacagttaa tgcttaaaac agcgccttaa gcctatccag 120
cacttgcatg gcgctgtagt aatccagacg gaacgtctcg gttcccagcg cataaacctg 180
cttgttttgt actgcaggca ggtgcgcgag cagcggatta gcataaatag catcggcatc 240
tttctgatca ccggcgaaca ggaatagtga ctcgccattt aaccctgcag ccagattttc 300
cccaccaagc tgaatgatgt catggcgttt accctgactt tggctggcat ttaaccctgc 360
gggtaacttc gccagcgtaa agccgagttg ttccagcatc tgcccttgtg ctgattctgg 420
cgtccagaga ttggcactgt gtgcagcggc agtatagaca atggcagtga ccggctgcgg 480
cggtaatttg atttgctctt tcgccgccgc cagttgctta tcaaactgcg caatccgctc 540
tgccgcttgt ttctcatgcc cggtaatttc gccaagttgc gttaacagcg actgccagct 600
tttgtcgtcg taattgatga ttaatgtcgg ggcgatggtg gaaagctgat catacagtgc 660
cagcgccgaa tccccgccgg ttgcgctaat taaaatcaga tccggcattt gcgcggcaac 720
ggcttcggcg ctcggttcgc cgatatagag ccgttgcagt ttgcgttctt tcgccacctt 780
gctccactgg cgtaaaaagc cctggtcatc cgcgacgcgg ttattcggcg tggtcgcgcc 840
gctggcgatc accggagcat caatcgccag cagtgagccg gtcagggtga cgctggtgga 900
aacaatacgc tgcggctggc tttccagtgt atgtgtgcca cggctgtcag taatctgacg 960
cggccagtca gcggcctgaa ctgcggctat tcctgaaagc aaaagtcctg ttaatagaag 1020
ggcgttgcgg tagagcgggg cgagtctcac 1050
<210> 151
<211> 1050
<212> DNA
<213> 人工序列
<220>
<223> 基因编辑同源性臂池_6_b0592_右
<400> 151
aaatcagctt cctgttatta ataaggttaa gggcgtaatg acaaattcga caaagcgcac 60
aatccgtccc ctcgcccctt tggggagagg gttagggtga ggggaacagc cagcactggt 120
gcgaacatta accctcaccc cagccctcac cctggaaggg agagggggca gaacggcgca 180
ggacatcaca ttgcgcttat gcgaatccat caataatgct tctcattttc attgtaacca 240
caaccagatg caaccccgag ttgcagattg cgttacctca agagttgaca tagtgcgcgt 300
ttgcttttag gttagcgacc gaaaatataa atgataatca ttattaaagc ctttatcatt 360
ttgtggagga tgatatggat acgtcactgg ctgaggaagt acagcagacc atggcaacac 420
ttgcgcccaa tcgctttttc tttatgtcgc cgtaccgcag ttttacgacg tcaggatgtt 480
tcgcccgctt cgatgaaccg gctgtgaacg gggattcgcc cgacagtccc ttccagcaaa 540
aactcgccgc gctgtttgcc gatgccaaag cgcagggcat caaaaatccg gtgatggtcg 600
gggcgattcc cttcgatcca cgtcagcctt cgtcgctgta tattcctgaa tcctggcagt 660
cgttctcccg tcaggaaaaa caagcttccg cacgccgttt cacccgcagc cagtcgctga 720
atgtggtgga acgccaggca attccggagc aaaccacgtt tgaacagatg gttgcccgcg 780
ccgccgcact taccgccacg ccgcaggtcg acaaagtggt gttgtcacgg ttgattgata 840
tcaccactga cgccgccatt gatagtggcg tattgctgga acggttgatt gcgcaaaacc 900
cggttagtta caacttccat gttccgctgg ctgatggtgg cgtcctgctg ggggccagcc 960
cggaactgct gctacgtaaa gacggcgagc gttttagctc cattccgtta gccggttccg 1020
cgcgtcgtca gccggatgaa gtgctcgatc 1050
<210> 152
<211> 1024
<212> DNA
<213> 人工序列
<220>
<223> 基因编辑同源性臂池_6_b1415_左
<400> 152
gcatttcctt aaaagatatg tcaggcttgc ggagtggcgg ttaaggacat acgatttcct 60
cctttcagag tgctccgctt ctcactatta tctcacgcag tattcttaag ggaacgataa 120
ggaggaacca tgaacattac cccgtttccg acgctttcgc cggcaactat agatgccata 180
aatgttatcg gacagtggct ggcgcaggat gatttctccg gtgaggtgcc gtatcaggcc 240
gattgcgtga tccttgcagg caatgcggtt atgccgacta tcgatgcggc atgtaagatt 300
gcccgcgatc agcaaattcc tttactgatt agtggtggta tcggtcactc gacaactttt 360
ttgtatagcg ccatcgcaca gcatccgcac tacaacacta tccgcaccac tggcagagca 420
gaagcgacca tcctggcgga tatcgctcat cagttctggc acattccgca tgaaaaaatc 480
tggattgaag accagtcaac aaactgcggt gaaaacgcac gctttagcat cgcgctattg 540
aatcaggccg tagaacgagt tcatacggct atcgttgttc aggaccccac catgcagcgg 600
cgcacgatgg cgacgttccg ccgtatgact ggggacaatc ccgatgcacc acgctggtta 660
agttatcccg gattcgttcc tcagttagga aataacgcag acagtgtaat ctttattaat 720
cagttacaag gattatggcc agttgagcgt tatctctcac tactcactgg cgagctgccg 780
cgtttacgcg atgatagcga tggctacggt ccccgcgggc gagattttat cgttcacgtt 840
gattttccgg cagaagtcat ccatgcatgg caaacgctga aacatgatgc ggtgctcatc 900
gaggcgatgg aaagtcgctc gttacgttaa aaattgcccg tttgtgaacc acttgtttgc 960
aaacgggcat gactcctgac ttttatttct gccttttatt ccttttacac ttgtttttat 1020
gaag 1024
<210> 153
<211> 1050
<212> DNA
<213> 人工序列
<220>
<223> 基因编辑同源性臂池_6_b1415_右
<400> 153
atgtcagtac ccgttcaaca tcctatgtat atcgatggac agtttgttac ctggcgtgga 60
gacgcatgga ttgatgtggt aaaccctgct acagaggctg tcatttcccg catacccgat 120
ggtcaggccg aggatgcccg taaggcaatc gatgcagcag aacgtgcaca accagaatgg 180
gaagcgttgc ctgctattga acgcgccagt tggttgcgca aaatctccgc cgggatccgc 240
gaacgcgcca gtgaaatcag tgcgctgatt gttgaagaag ggggcaagat ccagcagctg 300
gctgaagtcg aagtggcttt tactgccgac tatatcgatt acatggcgga gtgggcacgg 360
cgttacgagg gcgagattat tcaaagcgat cgtccaggag aaaatattct tttgtttaaa 420
cgtgcgcttg gtgtgactac cggcattctg ccgtggaact tcccgttctt cctcattgcc 480
cgcaaaatgg ctcccgctct tttgaccggt aataccatcg tcattaaacc tagtgaattt 540
acgccaaaca atgcgattgc attcgccaaa atcgtcgatg aaataggcct tccgcgcggc 600
gtgtttaacc ttgtactggg gcgtggtgaa accgttgggc aagaactggc gggtaaccca 660
aaggtcgcaa tggtcagtat gacaggcagc gtctctgcag gtgagaagat catggcgact 720
gcggcgaaaa acatcaccaa agtgtgtctg gaattggggg gtaaagcacc agctatcgta 780
atggacgatg ccgatcttga actggcagtc aaagccatcg ttgattcacg cgtcattaat 840
agtgggcaag tgtgtaactg tgcagaacgt gtttatgtac agaaaggcat ttatgatcag 900
ttcgtcaatc ggctgggtga agcgatgcag gcggttcaat ttggtaaccc cgctgaacgc 960
aacgacattg cgatggggcc gttgattaac gccgcggcgc tggaaagggt cgagcaaaaa 1020
gtggcgcgcg cagtagaaga aggggcgaga 1050
<210> 154
<211> 1048
<212> DNA
<213> 人工序列
<220>
<223> 基因编辑同源性臂池_6_b1762_左
<400> 154
caggcgttta tgagtattta acggatgatg ctccccacgg aacatttctt atgggccaac 60
ggcatttctt actgtagtgc tcccaaaact gcttgtcgta acgataacac gcttcaagtt 120
cagcatccgt taactttctg cgatagcagc agatatgcca gtaaagaaat cccatttgac 180
tatttttttg ataatcttct tcgctttcga acaactcgtg cgcctttcga gaagcaagca 240
ttatataatg ccaggccagt tcttcttcaa ttgtcccgtt ttgaaaagct gtgcttgata 300
tcgagatcat ccatgataat tccgccgccc atattagctt cgccgaggat ttaccggagc 360
tatgattagc gcaatcagag atatagtctg agggaaaaac agcaaattta ttcaacaagg 420
cgataacctg ctctggggct tcctccatgt ttgctttaaa ggtattggct ccatggtcgc 480
cagaaagaaa atgctccatt aaggcacaat aactttcgct atcttcgata ccccattgat 540
cctctaaaga ctcgcgtctt ttacttatga tatcgatcga gtcaaaagga agcacatgat 600
attggaaggt atctttgcca ggttcaggct ttcgcggcca gaactccagc gtttcagacc 660
attgcttatg atagaatcga taaggtgcga tcaattgtag cgcctgtaac ttctcgatac 720
tgagcggctc aataccttta gcctgataat aatgcagttg ttcttttttt gctttaaaac 780
cggcccgaac aataagcccc atcataatta atagataaag aaaagagcat cccgcggtaa 840
tcaggcctct ttcattcaaa ccgttggatg ttatcgctgc gaacacaaac attacagcga 900
caacacatgt taaataaaac ccccacttac aaagcagcat ggccttattt tctttaatca 960
tccgttcaaa attactatta aatatttccc agccattaaa agaatacttc tcgctcccag 1020
gatggttttg taataaaact tttttcat 1048
<210> 155
<211> 1050
<212> DNA
<213> 人工序列
<220>
<223> 基因编辑同源性臂池_6_b1762_右
<400> 155
tcagaatatg actcgaatag cacgaaagat tcactcgctt acgctatcgc cccgcttccg 60
acttcatctg ctggcggact ttttttcgca ctacgtttac gcggtgcagc ctttttctta 120
tcagcactgc caccactgcc cggagccaca atgccgcgaa actgccgcac cggcgtacgt 180
ttggcttgat caataagctg atatagcgtc cccaccagcg gctgcataaa gtcctgatag 240
cgacactgct tttcgctgat ttgcgtcagc accgattccc agtgcgcggt catgtccggt 300
cgcgtcgcca tctccggcag cgaatggaat agcgcttttc cggcgtcggt ggagtggata 360
tagcgccctt ttttggtcag gaaaccacgc ttgaacaaca gttcaataat cccggcacgc 420
gttgcctctg tccccagacc atcggtcgca cggaggatct ttttcagatc tttatcctgc 480
acaaagcgcg cgatcccggt catcgccgaa agcagtgttg catcggtaaa atggcgcggc 540
ggctgggttt gccgctctac cacttcacct ttttcacaca gcaactcatc gcctttcgcc 600
accacaggca gtggcgtgcc gtcgttttct tcatcgcgct ctttgctgcc taacagcgtg 660
cgccagcctg cttcagcaag aaaacgcgct ttagcgacaa atttgccttt ggcaatgtcc 720
agttcgataa cacacttgcg gaacaccgca tccgggcaga attgcatcag atactgacgg 780
gcaatcaggt tatagacctt cgcttcgttc tccgtcaggt tgatcgcaga actccgtgcg 840
gtcggaatga tggcgtggtg cgcatcgacc tttttgtcat cccaacagcg gttgcgtata 900
tctggatcta ccactggctg cggcaacaga tccggtgcat gaacactgat ggcattcatc 960
accgcgtggc gtccggcaaa atgttcttct ggcaaatagc gacaatcaga acgcggataa 1020
gtgattagct tgtgcgtttc gtacagtttc 1050
<210> 156
<211> 1050
<212> DNA
<213> 人工序列
<220>
<223> 基因编辑同源性臂池_6_b3414_左
<400> 156
gcattaatcc aacagcaagc gccacgagga cgagagcgat gaagccgttc attttgaagc 60
ggatcatcag gagcaacaac aagattacac cgatagcaac aatgactaat ggcatgattt 120
acctggcctt tcatttgtta tgggtaacgt caattttctg acgacaaact ctaattatcc 180
caatcgggaa cagagatatt gcggcaccac gactgatacc cactaaaact aattattgta 240
gtcagatgtc aggagtatgt ttggtaccca tgtgaatgat acgggtaaca tctggcgttt 300
gagaatcacc agagcggggt aaatttaaat tatgagaggt tggtcatatt atcgcgggga 360
aacgaaccga ggatttgaca aagcaatgct gcgccaacgt ctggcacatg ttcaacgtag 420
gcccgaaatg acgctttagc gtcgcatcgg gcaatctaca aaagagggga taacttagta 480
gtaggagtgt tcgccgcgct ggtgttcggt gagatcgcgc acacctttca gctccgggaa 540
ttcgttcagc agctgcttct cgatcccttc tttcagcgtc acatcgacca tggaacaacc 600
gttacagccg ccgccaaatt gcagaatggc gtaaccgtct tcggtgattt ccatcagcga 660
aacgcgacca ccgtgaccag caagctgtgg gttgatctgc gactgcagca tatactccac 720
gcgctccatc agcggtgcat cgtctgccac tttacgcatt ttggcgttcg gggctttcag 780
cgttaactgg gaacccaact ggtcggtaac aaaatcgatc tctgcatctt ccaggtatgg 840
tgcgcttaac tcatcaacat acgcggtcag caggtcaaat ttcagggctg tgtcggtggc 900
ttccacagcg tccggcggac aataagaaac gccacattca gcgttaggcg tgccagggtt 960
aatcacaaat acgcggattt gtgtcccttc ttcctgattt gccagcagtt tggcaaagtg 1020
cgcttgtgca gcatcggaaa tacggatcat 1050
<210> 157
<211> 1032
<212> DNA
<213> 人工序列
<220>
<223> 基因编辑同源性臂池_6_b3414_右
<400> 157
agtaatggcc taatagttga ctattttagt tggttataat acgcccatca tcgaggctct 60
acaaggttcg acaaaggcac cagacctgga cagccgccgc accattgcgt aaaagcaact 120
gcgcaatctc tgcgacggta cttccggtgg taacgacatc atccacaatc accatatggc 180
gaccttgcac gggcaattca agacgaaagg catttttcag gttgcgcttg cgcagccggg 240
cactgagaaa atgctgggtc gcagtggccc gtgtacgtgt gacggcttcg ctatcccatt 300
ggcagtgcaa ccagcgtgat aacggctgac acagcaaatc gctctgatta aatccccgac 360
gccagtgacg ccgctgccat aacggaacgc tgacgatgcg atccggcaat tgcaacccgg 420
tggtgcgacg agcgtgtaag acttccaata gtaacagacg tgacagggcg ctggcgattt 480
cactgcgccg ggaaaattta agctggtgga taagcggact taacggcggc gcatagtcgg 540
caaccgtgac cagtctttgc cagggcggcg gtttttgcag gcagcgaccg cagggaagat 600
gggagtgtgt ggcgggtaat ccacattgtg ggcataacgt tttatctgtg cgggtggcgc 660
gtgaacagac cgaacaaatc ccccaatgac ctaacgccag tggcattcgg catagccagc 720
ataatcccgg tactgttagc atatgttcat ccttgtaagt caaaagagaa caatagcgga 780
tgaataacat ctggtggcag accaaaggtc aggggaatgt tcatcttgtg ctgctgcacg 840
gatggggact gaatgccgaa gtgtggcgtt gcattgacga ggaacttagc tcgcatttta 900
cgctgcacct tgttgacctg cccggcttcg ggcgtagccg gggatttggt gcgctgtcac 960
ttgctgatat ggccgaagcc gtgctgcaac aggcacctga taaagccatt tggttaggct 1020
ggagtctggg cg 1032
<210> 158
<211> 1049
<212> DNA
<213> 人工序列
<220>
<223> 基因编辑同源性臂池_6_b4374_左
<400> 158
gcgggcaggt catcctgtaa gtctccggca aacagaatac ggctttgttc gaaatcatca 60
ctgtgacgca gcaagacttc acttgccggg gtaaatgcag acatggaatg ctcctcaatt 120
gatactggcg gcgattatag ccatatgttg gcgcggtatc gacgaatttg ctatatttgc 180
gcccctgaca acaggagcga ttcgctatga catcccgacg agactggcag ttacagcaac 240
tgggcattac ccagtggtcg ctgcgtcgcc ctggcgcgtt gcagggggag attgccattg 300
cgatcccggc acacgtccgt ctggtgatgg tggcaaacga tcttcccgcc ctgactgatc 360
ctttagtgag cgatgttctg cgcgcattaa ccgtcagccc cgaccaggtg ctgcaactga 420
cgccagaaaa aatcgcgatg ctgccgcaag gcagtcactg caacagttgg cggttgggta 480
ctgacgaacc gctatcactg gaaggcgctc aggtggcatc accggcgctc accgatttac 540
gggcaaaccc aacggcacgc gccgcgttat ggcaacaaat ttgcacatat gaacacgatt 600
tcttccctcg aaacgactga tttaccggcg gcttaccaca ttgaacaacg cgcccacgcc 660
tttccgtgga gtgaaaaaac gtttgccagc aaccagggcg agcgttatct caactttcag 720
ttaacgcaaa acggcaaaat ggcggcgttt gcgattacgc aagtggtgct ggatgaagct 780
acattgttca atattgcggt cgatcctgac tatcagcgtc agggattggg aagggcgctg 840
ctggaacatc tgatcgacga actggaaaaa cgcggcgtgg cgacactatg gctggaagtc 900
cgtgcttcaa acgctgccgc cattgccctg tacgaaagtt taggctttaa cgaggcgacg 960
attcgccgca attactaccc caccacggac ggtcgcgaag acgccatcat catggcgttg 1020
ccaatcagta tgtaatacaa ggtggaata 1049
<210> 159
<211> 1037
<212> DNA
<213> 人工序列
<220>
<223> 基因编辑同源性臂池_6_b4374_右
<400> 159
atgaagtggg actggatttt ctttgatgcc gatgaaacgc tgtttacctt tgactcattc 60
accggcctgc agcggatgtt tcttgattac agcgtcacct ttaccgctga agattttcag 120
gactatcagg ccgttaacaa gccactgtgg gtggattatc aaaacggcgc gatcacttca 180
ttacagcttc agcacgggcg gtttgagagc tgggccgaac ggctgaacgt cgagccaggt 240
aaactcaacg aagcctttat taatgcgatg gcggaaatct gcacgccgct gccgggcgcg 300
gtttctctgc ttaacgccat tcgtggcaac gccaaaatcg gcatcatcac caacggcttt 360
agtgccttgc aacaggtgcg tctggaacgc acgggcctgc gtgattactt cgatttgctg 420
gtgatttccg aagaagttgg cgttgccaaa ccgaataaga aaattttcga ttatgcgctg 480
gaacaggcgg gcaatcctga ccgttcacgc gtgctgatgg ttggcgacac tgccgagtcc 540
gatattctcg gtggcatcaa cgccgggctt gcgacctgct ggctgaatgc acaccatcgc 600
gagcaaccag aaggcatcgc gcccacctgg accgtttctt cgttgcacga actggagcag 660
ctcctgtgta aacactgatt gcctcccccc cgttgatggg taaaatagcc gcaatttttc 720
gttttcaaca agcgcggcgc gatgccgctt actcaagaag aaagaattat gacgttgtct 780
ccttatttgc aagaggtggc gaagcgccgc acttttgcca ttatttctca cccggacgcc 840
ggtaagacta ccatcaccga gaaggtgctg ctgttcggac aggccattca gaccgccggt 900
acagtaaaag gccgtggttc caaccagcac gctaagtcgg actggatgga gatggaaaag 960
cagcgtggga tctccattac tacgtctgtg atgcagtttc cgtatcacga ttgcctggtt 1020
aacctgctcg acacccc 1037
<210> 160
<211> 1050
<212> DNA
<213> 人工序列
<220>
<223> 基因编辑同源性臂池_6_b2917_左
<400> 160
acgtgaacga ggatttgagc gcgcggcaca aaagctgtgc attacacaat cagccgtctc 60
acagcgcatt aagcaactgg aaaatatgtt cgggcagccg ctgttggtgc gtaccgtacc 120
gccgcgcccg acggaacaag ggcaaaaact gctggcactg ctgcgccagg tggagttgct 180
ggaagaagag tggctgggcg atgaacaaac cggttcgact ccgctgctgc tttcactggc 240
ggtcaacgcc gacagtctgg cgacgtggtt gcttcctgca ctggctcctg tgttggctga 300
ttcgcctatc cgcctcaact tgcaggtaga agatgaaacc cgcactcagg aacgtctgcg 360
ccgcggcgaa gtggtcggcg cggtgagtat tcaacatcag gcgctgccga gttgtcttgt 420
cgataaactt ggtgcgctcg actatctgtt cgtcagctca aaaccctttg ccgaaaaata 480
tttccctaac ggcgtaacgc gttcggcatt actgaaagcg ccagtggtcg cgtttgacca 540
tcttgacgat atgcaccagg cctttttgca gcaaaacttc gatctgcctc caggcagcgt 600
gccctgccat atcgttaatt cttcagaagc gttcgtacaa cttgctcgcc agggcaccac 660
ctgctgtatg atcccgcacc tgcaaatcga gaaagagctg gccagcggtg aactgattga 720
cttaacgcct gggctatttc aacgacggat gctctactgg caccgctttg ctcctgaaag 780
ccgcatgatg cgtaaagtca ctgatgcgtt actcgattat ggtcacaaag tccttcgtca 840
ggattaatcc atcaaataat gcctgatagc acatatcagg cgttgtcctc acttcttttt 900
gtattccttg aatcacatca caaaatagac aaatctcagg cggcaaaaaa cgacgtctga 960
atgcattttt tttgctggcg acaaacccac gtaaaaagct caccgtaggc gcaaataccc 1020
tcattttgat tgcgttttac ggagcaaata 1050
<210> 161
<211> 1033
<212> DNA
<213> 人工序列
<220>
<223> 基因编辑同源性臂池_6_b2917_右
<400> 161
atgtctaacg tgcaggagtg gcaacagctt gccaacaagg aattgagccg tcgggagaaa 60
actgtcgact cgctggttca tcaaaccgcg gaagggatcg ccatcaagcc gctgtatacc 120
gaagccgatc tcgataatct ggaggtgaca ggtacccttc ctggtttgcc gccctacgtt 180
cgtggcccgc gtgccactat gtataccgcc caaccgtgga ccatccgtca gtatgctggt 240
ttttcaacag caaaagagtc caacgctttt tatcgccgta acctggccgc cgggcaaaaa 300
ggtctttccg ttgcgtttga ccttgccacc caccgtggct acgactccga taacccgcgc 360
gtggcgggcg acgtcggcaa agcgggcgtc gctatcgaca ccgtggaaga tatgaaagtc 420
ctgttcgacc agatcccgct ggataaaatg tcggtttcga tgaccatgaa tggcgcagtg 480
ctaccagtac tggcgtttta tatcgtcgcc gcagaagagc aaggtgttac acctgataaa 540
ctgaccggca ccattcaaaa cgatattctc aaagagtacc tctgccgcaa cacctatatt 600
tacccaccaa aaccgtcaat gcgcattatc gccgacatca tcgcctggtg ttccggcaac 660
atgccgcgat ttaataccat cagtatcagc ggttaccaca tgggtgaagc gggtgccaac 720
tgcgtgcagc aggtagcatt tacgctcgct gatgggattg agtacatcaa agcagcaatc 780
tctgccggac tgaaaattga tgacttcgct cctcgcctgt cgttcttctt cggcatcggc 840
atggatctgt ttatgaacgt cgccatgttg cgtgcggcac gttatttatg gagcgaagcg 900
gtcagtggat ttggcgcaca ggacccgaaa tcactggcgc tgcgtaccca ctgccagacc 960
tcaggctgga gcctgactga acaggatccg tataacaacg ttatccgcac caccattgaa 1020
gcgctggctg cga 1033
<210> 162
<211> 1047
<212> DNA
<213> 人工序列
<220>
<223> 基因编辑同源性臂池_6_b0346_左
<400> 162
tcgtataacg ttactggttt cacattcacc accctgaatt gactctcttc cgggcgctat 60
catgccatac cgcgaaaggt tttgcgccat tcgatggtgt caacgtaaat gcatgccgct 120
tcgccttccg gccaccagaa tagcctgcga ttcaacccct tcttcgatct gttttgctac 180
ccgttgtagc gccggaagat gcttttccgc tgcctgttca atggtcattg cgctcgccat 240
atacaccaga ttcagacagc caatcacccg ttgttcactg cgcagcggta cggcgataga 300
ggcgatcttc tcctcctgat cccagccgcg gtagttctgt ccgtaaccct ctttgcgcgc 360
gcgcgccaga atggcttcca gctttaacgg ttcccgtgcc agttgatagt catcaccggg 420
gcgggaggct aacatttcga ttaattcctt gcggtcttgt tccgggcaaa aggccagcca 480
ggtcaggccc gaggcggttt tcagaagcgg caaacgtcgc ccgaccattg cccggtgaaa 540
ggataagcgg ctgaaacggt gagtggtttc gcgtaccacc attgcatcaa catccagcgt 600
ggacacatct gtcggccata ccacttcgcg caacagatcg cccagcagtg gggccgccag 660
tgcagaaatc cactgttcgt cacgaaatcc ttcgcttaat tgccgcactt tgatggtcag 720
tcgaaaacta tcatcggagg ggctacggcg gacatatccc tcttcctgca gcgtctccag 780
cagtcgccgc acagtggtgc gatgcaggcc gctgagttcc gccagcagcc cgacgctggc 840
accgccatca agtttattta acatatttaa taacattaga ccgcgggtta agccgcgcac 900
ggttttgtat tccgtctgct cattgttctg catattaatt gacatttcta tagttaaaac 960
aacgtggtgc acctggtgca cattcgggca tgttttgatt gtagccgaaa acacccttcc 1020
tatactgagc gcacaataaa aaatcat 1047
<210> 163
<211> 1049
<212> DNA
<213> 人工序列
<220>
<223> 基因编辑同源性臂池_6_b0346_右
<400> 163
cgtgaggtac tgaaatggca atacaacacc ctgacatcca gcctgctgtt aaccatagcg 60
ttcaggtggc gatcgctggt gccggcccgg ttgggctgat gatggcgaac tatctcggcc 120
agatgggcat tgacgtgctg gtggtggaga aactcgataa gttgatcgac tacccgcgtg 180
cgattggtat tgatgacgag gcgctgcgca ccatgcagtc ggtcggcctg gtcgatgatg 240
ttctgccgca cactacgccg tggcacgcga tgcgttttct caccccgaaa ggccgctgtt 300
ttgctgatat tcagccaatg accgatgaat ttggctggcc gcgccgtaac gcctttattc 360
agccgcaggt cgatgcggtg atgctggaag gggtgtcgcg ttttccgaat gtgcgctgct 420
tgttttcccg cgagctggag gccttcagtc agcaagatga cgaagtgacc ttgcacctga 480
aaacggcaga agggcagcgg gaaatagtca aagcccagtg gctggtagcc tgtgacggtg 540
gagcaagttt tgtccgtcgc actctgaatg tgccgtttga aggtaaaact gcgccaaatc 600
agtggattgt ggtagatatc gccaacgatc cgttaagtac gccgcatatc tatttgtgtt 660
gcgatccggt gcgcccgtat gtttctgccg cgctgcctca tgcggtacgt cgctttgaat 720
ttatggtgat gccgggagaa accgaagagc agctgcgtga gccgcaaaat atgcgcaagc 780
tgttaagcaa agtgctgcct aatccggaca atgttgaatt gattcgccag cgtgtctaca 840
cccacaacgc gcgactggcg caacgtttcc gtattgatcg cgtactgctg gcgggcgatg 900
ccgcgcacat catgccggta tggcaggggc agggctataa cagtggtatg cgcgacgcct 960
ttaacctcgc atggaaactg gcgttggtta tccaggggaa agcccgcgat gcgctgctcg 1020
atacctatca acaagaacgt cgcgatcac 1049
<210> 164
<211> 1050
<212> DNA
<213> 人工序列
<220>
<223> 基因编辑同源性臂池_6_b3966_左
<400> 164
ctcaacataa cctgtacccg gcgtcgtagt ctgtttctgc cagtcgacac ccgcaccaat 60
actaccgtga ccaacgatga cattgtttgc ccactggacg gtgtattgct tcatctcatc 120
gagcgtcgcc gacgaatcat aacgaccata atggggatcg tagttgtaat ctttgctatg 180
gctatagctg gtaatgagtt gtgatttaat cagttcgccg ttatagcgca gcccggcgtc 240
ccaactttgg ctatagagtt tacgggtatc gagcaacggt gaaccgggag aataatacgc 300
gtcataattg gtacggttat catagccata gccgcgcaca aagccgctcc aggcatcagt 360
aaagttatgc tccagcgcgc cataaagcgt tttacttaaa aaaccatcgt tatctgtctg 420
cgcttgcgtt ccggtattac cataggcaac aacatcataa ccatgagtat gggcataatc 480
gcccaacagc gttacccgtg tcttatcccc cagttgttgc tgcgtagaga catcatagtt 540
ctgataacta ttgcttcccc accctgctga aatttccgtt ccgggttcat cgcgcgtcgt 600
gatgatattc accaccccgc ctattgcatc ggaaccataa acagcggagc gcggcccacg 660
gatatattca acacgctgga caagcgcaat agggaactgg ctaaggtcgg cagaaccact 720
cacccccgcc agattcaggc gtacgccatc aattaacacc aacacatgac tggcatttgt 780
accgcgaata aaaatagatg agagctgacc tgaaccgccg ttttgggtga tatcgacgcc 840
cggaagacgg cgcagcacat cattgaccga ggtcgactgc cagcggtcga tatcctgacg 900
ggtcacaacg gtggttggtg caagcacagt gctgcgcggc tgttcaaaac ggttagcagt 960
aacgacgaga gtatccgggc tggtatcctg tgcccaagcg gaaaatgccg tgacggaaca 1020
cgccgtcagc agcgaagctt ttttaatcat 1050
<210> 165
<211> 1050
<212> DNA
<213> 人工序列
<220>
<223> 基因编辑同源性臂池_6_b3966_右
<400> 165
tgtaaagcat ccacaataga agaaggatgc cgcaggtttc atcaatatta cgcgatgatg 60
agaaccagat gcgacgttgg ccggcaggtc ttcgggcttg gaggggtatc taagatacta 120
agagatgatg acttcccacc gaatggcagt gtccgcataa cgcaatcatc gcacctttcc 180
ttaccgctgc gcgtcagctc cagattcgca ctggattccc tattaactca caggaccggc 240
aagtggatgc tacaggttgt aacaagttac tgtccagacg tagctcacaa ataggaattc 300
atcaagatct ggacatctga tgagcaatcc ctacaatcgc cgcgtacttt aatttttcag 360
gatacatcat gacccccgaa caccttccaa cagaacagta tgaagcgcag ttagccgaaa 420
aagtggtacg tttgcaaagt atgatggcac cgttttctga cctggttccg gaagtgtttc 480
gctcgccggt cagtcattac cggatgcgcg cggagttccg catctggcac gatggcgatg 540
acctgtatca catcattttc gatcaacaaa ccaaaagccg catccgcgtg gatagcttcc 600
ccgccgccag tgaacttatc aaccagttga tgacggcgat gattgcgggt gtgcgtaata 660
atcccgttct gcgccacaag ttgttccaga ttgattacct cactacactg agtaatcagg 720
cggtggtttc cctgctatac cataagaagc tggatgatga gtggcgtcag gaagcggagg 780
ccctgcgcga tgcactgcgc gcgcagaatc tgaatgtgca tctgattggt cgggcaacga 840
aaaccaaaat cgagctggat caggattaca tcgatgaacg tctgccggtc gcagggaaag 900
agatgatcta ccgtcaggta gaaaacagct ttacccagcc gaacgcggcg atgaatattc 960
agatgctgga atgggcgctg gacgtaacca aaggctcaaa aggcgattta ctggagctgt 1020
actgcggcaa cggtaacttt tcattagcgc 1050
<210> 166
<211> 1050
<212> DNA
<213> 人工序列
<220>
<223> 基因编辑同源性臂池_6_b0406_左
<400> 166
gtcgtttact gtcgctggac gggccgacgg gcgcgctgac gcacggtact ttcaccgatt 60
tacttgataa gctcaacccc ggcgatcttc tggtttttaa taatacccgc gtgatcccgg 120
cgcgcctgtt tgggcgtaaa gccagcggcg gcaagattga agtgctggtt gaacggatgc 180
tcgacgacaa acgcattctt gcgcatattc gcgcctcgaa agcgccaaaa cctggcgcag 240
aactgctgct gggcgatgac gaaagtatta acgcaacaat gaccgcgcgc cacggcgcac 300
tgtttgaagt cgaatttaat gatgaacgct cggtgctgga tattctcaac agcatcggcc 360
atatgccgct gccgccgtat atcgaccgtc cggacgaaga cgctgaccgc gaactttatc 420
aaaccgttta tagcgaaaaa ccgggcgcgg ttgcagcccc gaccgcaggt ctgcattttg 480
acgagccttt gctggaaaaa ttgcgcgcca aaggcgtgga gatggcgttt gtgacgttgc 540
acgttggtgc gggcaccttc cagccggtgc gcgtcgacac cattgaagat cacatcatgc 600
actcggaata cgctgaagta ccgcaggatg tggtagacgc ggtactggcg gcgaaagcgc 660
gcggtaaccg ggtgattgcg gttggcacca cttcagtacg ttcgctggaa agcgcggctc 720
aggcagcgaa aaacgatctc attgaaccgt tcttcgacga tacccaaatc tttatctatc 780
cgggcttcca gtacaaagtg gtcgatgcgc tggtgacgaa cttccacttg ccagagtcga 840
cgctgattat gctggtttcg gcctttgccg gttatcaaca caccatgaac gcctataaag 900
cagcggtaga agagaaatat cgctttttta gttacggtga tgcgatgttt atcacgtaca 960
atccgcaggc aattaatgag cgcgtcgggg agtaattccg cggcgctggt ttaaaacgtt 1020
ggactgtttt tctgacgtag tggagaaaaa 1050
<210> 167
<211> 1050
<212> DNA
<213> 人工序列
<220>
<223> 基因编辑同源性臂池_6_b0406_右
<400> 167
atgaaatttg aactggacac caccgacggt cgcgcacgcc gtggccgcct ggtctttgat 60
cgtggcgtag tggaaacgcc ttgttttatg cctgttggca cctacggcac cgtaaaaggg 120
atgacgccgg aagaagttga agccactggc gcgcaaatta tcctcggcaa caccttccac 180
ctgtggctgc gcccgggcca ggaaatcatg aaactgcacg gcgatctgca cgattttatg 240
cagtggaagg ggccgatcct caccgactcc ggcggcttcc aggtcttcag ccttggcgat 300
attcgtaaaa tcaccgaaca gggcgtgcac ttccgtaacc cgatcaacgg cgatccgatt 360
ttcctcgatc ctgaaaaatc aatggagatt cagtacgatc ttggttcgga tatcgtcatg 420
atctttgatg agtgtacgcc gtatcctgct gactgggatt acgcaaaacg ctccatggag 480
atgtctctgc gttgggcgaa gcgtagccgt gagcgttttg acagtctcgg aaacaaaaat 540
gcgctgtttg gtatcatcca gggcagcgtt tacgaagatt tacgtgatat ttctgttaaa 600
ggtctggtag atatcggttt tgatggctac gctgtcggcg gtctggctgt gggtgagccg 660
aaagcagata tgcaccgcat tctggagcat gtatgcccgc aaattccggc agacaaaccg 720
cgttacctga tgggcgttgg taaaccagaa gacctggttg aaggcgtacg tcgtggtatc 780
gatatgtttg actgcgtaat gccaacccgc aacgcccgaa atggtcattt gttcgtgacc 840
gatggcgtgg tgaaaatccg caatgcgaag tataagagcg atactggccc actcgatcct 900
gagtgtgatt gctacacctg tcgcaattat tcacgcgctt acttgcatca tcttgaccgt 960
tgcaacgaaa tattaggcgc gcgactcaac accattcata accttcgtta ctaccagcgt 1020
ttgatggcgg gtttacgcaa ggctattgaa 1050
<210> 168
<211> 1040
<212> DNA
<213> 人工序列
<220>
<223> 基因编辑同源性臂池_6_b0652_左
<400> 168
ccgcctgcta ccggaatatc ggtgcgatta agcaaggtca gcatacgcag aacattgcgt 60
aaggtttttt ctggtgtctg gtttccggcg gaagacgtaa ttgctttgac atcaagctct 120
ggtgaggcga gggcgagaac tattgcgata gcgtcgtcat gacctgggtc gcaatctaac 180
agaattggca gtgccattgt tgctccttgt tgtgtgcttc tttgcgacaa gggtaacgcc 240
aggatgtaac agatacgagg ggcgaaacga taaagcgtga gatggcgcgc aattgggtat 300
gcgcgccaga gtgattaatg caggattttc gcgaggaagt cttttgcgcg gtccgatttc 360
ggatcatcga agaaagcgtc tttcggcgag tcttcgacaa ttttaccctc gtccataaag 420
atcacccgat tcgccacttt acgggcaaag cccatttcgt gggtcaccac catcatggtc 480
attccttcgt tcgccagttc caccatcacg tccagtactt cgttgatcat ctccggatcc 540
agcgccgatg tcggttcgtc aaacagcatc gcaataggat ccatacacaa cgcgcgagcg 600
attgccacac gctgctgctg accgccggaa agctgcgccg gaaacttatt ggcgtgagca 660
gaaagcccga cacgctccag cagtttcagg gctttttcac gagccggcgc tttatcgcgt 720
ttaagcactt tcacctgcgc cagggtcagg ttttcgataa tcgacagatg agggaacagc 780
tcgaaatgct ggaataccat cccgacgcgg gaacgcagct ttgccagatc ggttttcttg 840
tcgttaacca cgataccatc gacggtgatt tcaccttgct gcaccggttc gaggccgttg 900
acggttttaa tcagcgttga tttgccggaa ccagacgggc cgcaaaccac caccacttcg 960
ccttttttca cttcggttga gcagtcggtc agcacctgaa agtgaccata ccattttgaa 1020
acatttttca gggtaatcat 1040
<210> 169
<211> 1041
<212> DNA
<213> 人工序列
<220>
<223> 基因编辑同源性臂池_6_b0652_右
<400> 169
tatgctgtcc ttcttttcaa gtagctgacc aacaacgacg cgctaagact aataacgaaa 60
taaacaaatc cggcaaacag gatcatctca acctgcgtac catcacgctc accaatggtt 120
gaggcggtac ggaagaaatc ggccagggat aacacataca ccagtgaggt atcctggaac 180
agtacgatgc cctgagtgag cagcagcggc accatcgcgc ggaacgcctg cggcagaata 240
atcagtttca tcgactgcca gtgagtcatt cccaacgcca gcgcggcgct cgattgacca 300
cgagaaatac tttgaatacc agcacggata atctctgaat agtaggccgc ttcaaacatc 360
gaaaacgcca ccatcgccga aattaaacgg atatcatttt ttggcgataa tcccagcacg 420
ttttgcagaa aacccggcac gatcaggtaa aaccacagca aaaccataac taaaggaatc 480
gagcggaata cgttaacgta ggctttggca aaccacgcca cgggcgcaaa gctggataaa 540
cgcatcaccg ccagcatcgt gccccacaaa ataccaatca ctaccgccgt gacggtgatt 600
ttcagggtga tcaccagccc gtcgagcaga tatggcaggg aagggacaat ggaactccag 660
tcaaactcgt acattatttg ccccccatgt tgccaggcag gcgaacttta cgttcaacca 720
gcgtcatcac cagcatgata aaagcgttaa tcaacacata cgccagcgta atggcggtaa 780
acgactccca ggcatgggct gagtaatcga gcaatttacc cgcctgcgcc gccatatcca 840
ccagaccgat agtcgaggcg atggcggagt ttttcaccag gttcatcatc tctgaggtca 900
tcggcgggac gataacgcga taagcattag gcagcagtac gtatcgataa gcctgcggta 960
gcgtcaggcc catcgccagc gcggcatttt tttgccctcg cggcagcgac tgaatcgcgg 1020
cgcgtacctg ttcgcaaaca c 1041
<210> 170
<211> 1050
<212> DNA
<213> 人工序列
<220>
<223> 基因编辑同源性臂池_6_b1493_左
<400> 170
ggcaacctgg taagaggcgt tctgtacttt ggtatagcct tcacgaccga ggcgcaggaa 60
ttcatagtac tgtgcaatta cctgacccgc cgggcgggag aagttgatgg caaaagtacc 120
aatttgacca cccaggtagt caacgttgaa caccagttcc tgcggcagcg cttcttcgtc 180
acgccagata acccagccgc agcccagcgg agccagaccg aatttatggc ctgaagcact 240
gatcgatttc acacgcggca ggcggaagtc ccagacgata tccggggcga cgaacggtgc 300
caggaagcca ccgctggcag cgtcgatgtg catgtcgatg tcgataccgg tatcggcctg 360
gaatttatcc agcgcatcgt gcagcggttg tgggaactca tagttaccag tgtaggtcac 420
gccgaaagtc ggcaccacgc cgatggtgtt ttcgtcacag gcttcaatca tgcgtttcgg 480
gtccataaac aactgaccgg ggcgcatagg gatctcacgc agctccacat cccagtagcg 540
ggcgaattta tgccagcaga tttgtaccgg accgcacacc aggtttggtt tatccgttgg 600
tttgcctgca gcttccatac gcttgcgcca acgccatttc atcgccatcc cgccgagcat 660
acaggcctcg gaagaaccaa tggtgttggt gccaacggcc tgaccatttt tcggcgcagg 720
cgcatgccac agatcggcaa ccatatttac gcaacgcagg tcgatggctg cggattgcgg 780
atattcttct ttgtcgatcc agtttttgtt aatggataaa tccatcaatt tgtggacatt 840
ttcgtcgtcc caggtctggc agaaagtggc caggttctga cgagcgttgc catcaagata 900
taattcgtca ttgataatct ggaatgcgac atcgtcgcgc atttcgtgca gcggaaaacg 960
ttttgattct gcgatagtgg aaatagactt cgcaccaaaa cgtgaatcga gtagttccga 1020
ccttaaatcc gttacttgct tcttatccat 1050
<210> 171
<211> 1046
<212> DNA
<213> 人工序列
<220>
<223> 基因编辑同源性臂池_6_b1493_右
<400> 171
acaaaatcct aatgttattt atcgtgagat attacgcgaa taatattttt tcattgaaaa 60
acaatacaat atgaaattct tgggtggtgg taaggtgttt tatgctgtta tttttatgcg 120
cattctgtgt ctcctgaatt atcacgtaaa aatcagacct taaaatatca ctattagtac 180
ttgattatta ttttgaacgc atttataaaa ttattacata aaaatagcga atattgctaa 240
aatccccgcc aacgatgtgt tgacggggct gttattattt tggcaataat actccggtat 300
aagtatttac cggatgagaa agatattgtt taacggcagt gttaacattc tctaccgtca 360
tttgtttcaa caattgctcc tgctcagtcc atgctgcagg atcgtcatat tgaataagac 420
tatttacaat agtgttcgct aattgttgaa cgctacgctg ttggatatcg aggctgcgct 480
gaacgttttg ctggtattca ttcagttctt gctcactgat ccctttagcc agacgcttaa 540
ccatcacttc attcgctaac gttaacagtt catcatgtcg ttctggttga caagtaaaag 600
ccagcaaatg actgatatct ttggcctgag gatcaaccga gaggcgagaa gaaacgctgt 660
atgctccaga tgcctgttca cgaatattaa cacgtagatc ttttgccagt gcgacgttaa 720
aagcatcgag cgccatacgc gtcggcagat taacaggtgt ccgggaatca taacgcttcc 780
actgtgaaac ctgtgccaca ggttcatttt gttcttttac agtaaccgat gcgttgtccg 840
tcgcgcgagt taatggttta cctgcggcta atggcgaatc agagtgtttg attgatccta 900
agtaacgcgt aattaacgcc acgagtttgt cttctgcgac attaccgaca atgacaaacg 960
tgatatccgc tggagatgaa aacaattggc gatcggcagc cagcgcatct gcggcagtaa 1020
actgtgcaat ctgattttct tgcagt 1046
<210> 172
<211> 1050
<212> DNA
<213> 人工序列
<220>
<223> 基因编辑同源性臂池_6_b4159_左
<400> 172
ataacgtaac cgttgcacac gcaactgcgc catttcggta tcaagctgtt gtggtttcgg 60
catttccggc agccgtgcca cctgcgcccg cagcgcttcg ccgagcagat tggacgatcc 120
cagccattgc gactgttcac gcagcgtatt caacgcctgc cggacctgta acgtctggct 180
ggcagcctga cgctgttgcg aggcaacgag atccatccgc tgcgcctgtt gattcaaagc 240
cgccgatagt tcgcggttaa ttttgaattg cgcgacgata tctttcggca aatcggcgct 300
gttttctgcc agcaattcgg tactttccag cgcccgctcc gcctcaagct gacgttggct 360
gtttaattga ttacgcaagg cctgcaaata cgcatccagt tgctggctct ctttttccgc 420
cagctctgag cgtaagcgcg ctaattcctg gcggttattg gcagacagct gcgccagctc 480
cagttcatca acgagcgcct taagacgtgc agagtcagac tgcaacgcga aattttgtgc 540
ctgattgagc ggagtattgc cggtaagcgt tcccaggcgg cgctcgatct catttaactg 600
acggcgggcg tcggtttgct gttgcggcag ttgattcagc gaatcggcaa tctcgcgggc 660
gcgctcctgc tcttgctggg cctgacggct tttatccagc aactggctgc tgacctggag 720
aatttcctga ttcagcgcgt cggtagacat tcccggcgac acgctgcgcg gctcgtcacg 780
catgttgttt aattgtgcgc gcagagtagc ggagagtttc ggataattat cgataacttg 840
ctgatattgt ttgatgcgct caagggaacc ttttcgttcc tcaagcgcat ttaaggcaga 900
ctggagcgcc tctacgactt ccggctgtgc gggtttcgcc gcttttgcct gctccagttc 960
ctgagtgatt tgtttgctat cgggggccgt cgcggcgtac gccccccaac tgaggcacca 1020
ggccatcaga aaagtgataa tcaggcgcac 1050
<210> 173
<211> 1050
<212> DNA
<213> 人工序列
<220>
<223> 基因编辑同源性臂池_6_b4159_右
<400> 173
gtcagcgttt cctttgatgg attagacctg gtcttttttg tcgtcaacca atgggctggc 60
gtcgtgttct gcttcgatct cttcagcagg aagcggggca ggttcagcgt ctggcgtaac 120
aaaggtttcg gtagatactg ccagcggctg gccaattttc gtgacagaca ggctttccag 180
ttgctcaacc agattcactt tacccggtgc aaacaggttg ataacggtgg aaccgagttt 240
aaagcgaccc atttcctggc ctttcagcag tgccacagaa ccgtcgtttt ccccggcagg 300
ccaggtccag cgcttgatga taccttcgcg cggcggcgta atggtgcccg cccagaccgt 360
ctcaatgctg ccaacaatcg tcgctccgac cagaatctgc gccattgggc caaattcggt 420
atcgaaaagg caaatcacgc gttcgttacg ggcaaacaga ttcggcacgt tctgagccgt 480
gagatggtta acggagaaga gatcgcccgg cacgtagatc atctcacgca gaataccgtt 540
gcacggcatg tgtacgcggt ggtagtcacg cggggagagg taagtggtca caaacgtacc 600
gttgcggaac aggtccgcca tcagatagtt gcctgccagc agggcttcga ggctgtagtt 660
gtggcctttg gcttgcagga ttttatcttc ttcgatttta cccaactggc tgataacgcc 720
atcggcaggc atgaccagta cattcggatc ggtatcgatt gggcgtactt cgtcacgcag 780
cggacggaca aagaattcgt taaaggtgcg gtagctggcg gtgtccggct tttgcgcctc 840
tttcatgtcg accttgtagt atttaacgaa cagatcgata accagttttg tcagccatcc 900
tgcccgcttg cttgcgcccc aacccgccag gcgagtaagc catagtttcg gcagaatgta 960
ctgtagcgaa agtttaaatg aatttaacaa ggtagcctcc aggccattgt tttgtcgttc 1020
ctgatccggc ctacatgccg gatcctgaaa 1050
<210> 174
<211> 1050
<212> DNA
<213> 人工序列
<220>
<223> 基因编辑同源性臂池_6_b3795_左
<400> 174
gttcaggcat gagccaatta gcagaatagc aatagatact gccacacccg caaccggtac 60
gccgtgacgg gaaactttcg ccattgccgc cggtaactga cggtttttcg ccagtgcgta 120
gagcatacgt ccgcaactgt acatgccgct gttacagcca gagagcgcag ccgtcagcac 180
cacaaagttg ataatgcccg ccgctgcggt aataccgatt ttggcaaaag tcagtacgaa 240
cgggctgccg ttgctgccta tttcattcca cgggaagatg gtgacgataa cgaaaatcgc 300
gcctacgtag aaaatcagga tccgccacag caccttgcct acggcactgc gcagcgtcac 360
ctgcggattc ttcgcttcac cggcagtaat gccaatcagc tccacgccct ggtaggacgc 420
caccacaata cacagagcgg tcaggaaccc tttccagcca cccgcaaaga aaccgccatg 480
ctctgtgaga ttgctaaaac caatcgactg cccgccattg ccaaagccaa agaaaatcac 540
gcccaggcca atgacaatca tcacgataat cgtggtgact ttgatcatcg cgaaccagaa 600
ctcgatttcg ccgtacaacc gcaccgccgc cagattcgcc aacgccacca gcgccactgc 660
gatcaatgcg ggtatccact gcgccatctc cgggaaccag aactggacat aaacgccaat 720
ggcggtgatt tcagagatcc ccaccgccat ccacataaac cagtaagacc aggcggtgag 780
atagccaaag aacgggctca tataacgatg cgcataaacg gcgaacgaac cggtaaccgg 840
ttcgaggaac aacatttcgc ccattgaacg catgatgaaa aagacgaaca gcccggcgat 900
gatataggcc aacaatacgg atggcccggc ccatttcagg gtactggcgg cccccataaa 960
caggccgacg ccaatggtgc cccccagggc gatgagttcg atatgtcgag cttccagccc 1020
acgctgtagc tctggtttgt tatctgccat 1050
<210> 175
<211> 1050
<212> DNA
<213> 人工序列
<220>
<223> 基因编辑同源性臂池_6_b3795_右
<400> 175
aaatcctcgt gttgtgtttg catgctttcc ggtgttaccg gttatcgtta tgggtacatc 60
gagtgttgca aatgttttcg taattcagga gaaatggcaa ataaagcatt aaaaatttga 120
atgctttgtg taataaaaaa gcagacaggc gacggagtga ccactccgtc gctttacaaa 180
gagaggaaaa tcataggttg ccggtgtagt gccagcgtaa ataacgcagc aaacgaagct 240
gacgcttaat gcggctcggc tgcgaaagca ggcggtagag ccactccagc cccagcgttt 300
gccagatttt cggtgcgcgt tttacgtgac cggtgaaaac atcgtaagtc ccgccaacgc 360
ccatatacag cgcatctgga tgtaccagac ggcagtcgcg catgatgatc tcctgctttg 420
gcgatcccat cgcaacggtg acgatttgcg caccgctggc atgaatgcgt tcaaacagcg 480
cctgacgctg ctcgggttta aaataaccat cctgactgcc aacgatattc acattccact 540
ggttgcgcag tttagcttca gtttgcgcca gcacttcagg tttaccgccc acaagaaata 600
ccggcgtccc ttctttgcct gcgcgcgcca tcagctcttc ccagagatcg gcaccggcaa 660
cgcgggaaac ctgcgcctgc gggtactttt tacgtactga acgtacaacg ctgatgccat 720
ccgcatattt aaattcggca gcgttaatta actccctgac ctcggcgtta tcttcaatag 780
tcagcatttt ttcagcatta atggcaacca gcgttccctg cttaagctgc ccgtcagcaa 840
acagataatc gagggcgtgc tgcatatcac gccaaccaat caactgtaag ccacgcagcg 900
tataggttgg tgccgtggtg ttgttattca ttgttatcct tcaacctgcg tccggagcga 960
tgattttgta cgtttatgaa tgagtccggc gctttcaaaa agccagtaca acagttttgc 1020
gatcatcaga catgcgccga agaccacgat 1050
<210> 176
<211> 1050
<212> DNA
<213> 人工序列
<220>
<223> 基因编辑同源性臂池_6_b4246_左
<400> 176
aaccagtgcc agtaacgcct ggcgagcgaa aatcccgttg cctgcctgct ggaagtacca 60
ggcgtgtggc gttttatcaa catccgtcgc aatctcatca acacgcggca gcggatgcag 120
cactttcata ttggctttgg cgttgtggag atcgctggcg cgaagaacaa actgcgcttt 180
cacgttggcg tactcggacg ggtccagacg ctctttttgc acgcgggtca tgtacaggat 240
gtctacttcc gccatcactt cttcaataga gctgtgcaga ctccatgcga tccctttttc 300
atcgagcata tccagaatgt attgcggcat tgccagcgcg tccggcgcga tgaagtaaaa 360
acggttgccg tcgaacttcg ctaacgcctg agtcagggag tgaacggtgc ggccatattt 420
caggtcacca accattgcga cgtggagatt gtccagacgc ccctgggttt cctgaatagt 480
gaataagtcc agcaaggttt gcgtcggatg ttggttggag ccatcaccgg cattcagtac 540
cggtacattg ccggaaaact cggtggccag gcgcgccgca ccttcctgcg gatgacgcat 600
cactatcgca tcgacgtaag tgctgataac cgaaatggta tcggccagcg tttcgccctt 660
tttacccagt gatgtattgg cgctgtcgga gaagcccacc acgctggccc ccaggcggtg 720
catagatgtt tcgaaagaga ggcgggtacg ggtagaggct tcgaagaaac agctggcaat 780
gactttgtgc ttcaacagct ctggttgcgg gtttgctttc agtttcgccg ctgtcgccag 840
caccagatta aggtcatcgc gactaaggtc gtttatggaa atgatatgtt tctgatatag 900
cggattagcc atcttttatc tcctgacgcc tgggcaaaaa aaagcccctc gattgagggg 960
ctgggaatgg gtgatcaacg ggaagaaaaa cggcaggcca gcgtcttttt tcagacgcgg 1020
taagacaaaa tgtcgaacac actgaaccat 1050
<210> 177
<211> 1050
<212> DNA
<213> 人工序列
<220>
<223> 基因编辑同源性臂池_6_b4246_右
<400> 177
actattgctt actgctcagg gatgcgcgct atcactttaa tttcaaaatc aaagcctgcc 60
agccatgtaa cacccaccgc cgtccagttt ggataaggtg gggcgctaaa tatttcattt 120
ttcaccgtca tgatgtcttc aaattggttt tctggatcgg tatggaagct cgtaacatca 180
atgatatcgt caaaagtgca tcccgcagct gccagggtcg catgcaaatt atcaaatgcc 240
agtctgactt gttgctgaaa atcgggttct ggtgttccgt cctctcgact tcctacttgc 300
ccggaaacaa acagcaaatc gccggaacga atagccgcag aataacgatg ctcagcatat 360
agtgaatgtc ggccagcagg gaaaacagcg gttctttcta ccatttggtt atcctcaaga 420
tttacgacat gaacagaaga tttctcttta ccgggagccg cttttagcgg acgacgtgag 480
taaacaaaac ccagacatca tggataatgg ctgggcttaa ttgagcgtag tcggttatgc 540
gccaaacgcg ccatcaatgg tatgcatcgc gccggtaaca aaactggctt ctggccctgc 600
taaccatgcg accataccag cgacctcttc cggttgccca tgtcttttga tagccatcaa 660
actatgcaac atatcgcgca ttggcccgtt ggcgggatta gcgtcggtat caattggccc 720
tggctggacg acgttaatgg tgatcccacg cggtccaaaa tcacgggcca gcccgcgcgc 780
catgccttgc agggcagatt tgctggcggc ataagcagcc atgcctgcaa caggcatacg 840
atcgccattc acggagccga tgattaagat gcgcccgcct tcgggcatct gccgggcggc 900
ttcaacagag gcatgataag gagcatgaat attgattttg aaaaggcgat caatatcgtc 960
ggcatttaat tccagggcct cgccaaagac gccaatacct gcatttacca ccaggatatc 1020
caatgcgccg ctcttacgaa cgacatcaat 1050
<210> 178
<211> 1050
<212> DNA
<213> 人工序列
<220>
<223> 基因编辑同源性臂池_6_b4440_左
<400> 178
atggtggatg ctgcgcacct ttggtgtaga gaaagtgtcg attctggggg gtggacttgc 60
aggctggcag cgcgatgatc tgctgttaga agaaggtgca gtagagctgc cggaaggaga 120
gtttaacgcc gcgtttaatc ctgaagccgt ggtgaaagta accgatgtat tattggcaag 180
ccatgaaaat acggcgcaaa ttattgatgc ccgcccggct gcacgtttta acgcagaagt 240
tgatgaacct cgcccaggtt tacgtcgcgg acatattccc ggagcactga atgttccgtg 300
gacggaactg gtgcgcgaag gcgaactaaa aacgaccgat gaactggatg cgatattttt 360
tggtcgcggc gtcagctacg acaaaccaat tatcgtcagc tgcggctctg gtgtaacggc 420
agccgtggtt ttgttagcac tcgcgacgct ggatgtgcca aacgtgaaac tgtacgacgg 480
cgcatggagt gaatggggcg cgcgggcaga tttaccggtt gagccagtga aataagtatt 540
ttacaggcaa taaaaaaccg ccgaatttgg cggtttttta ttgctagtct ggttcgcggc 600
ctttccagca ggttgacttg tgttacatga gcaacgcagg tgcttcacag caaaacaata 660
ctcaccagta actctctttt tgtcaagcaa aagagagtaa ttattgttta tttagcgtat 720
tatcgacacc ggccctttcc gccgtgttcg gtaataaaat aacctggctt attagtccga 780
attcagacaa atataaataa atcctgctca aaattaaaaa ttctaaccgg taaaagatat 840
tacttaaaca tgtaaattca ctttccttta aaaaacaaaa aaccgccaaa atcaggcggt 900
tttttgttgc tggtccggtt cgcggccttt ccagcaggtt gtattaccgt agtaatgcaa 960
gcgcgtctca gcggagacaa tactcgccag taactctctt tttgtcaagc aaaagagagt 1020
tattattgtt ctgttagtgt attatccact 1050
<210> 179
<211> 1050
<212> DNA
<213> 人工序列
<220>
<223> 基因编辑同源性臂池_6_b4440_右
<400> 179
gcggcccttt ccgccgtctc gcaaacgggc gctggcttta ggaaaggatg ttccgtggcc 60
gtaaatgcag gtgtttcaca gcgcttgcta tcgcggcaat atcgccagtg gtgctgtcgt 120
gatgcggtct tcgcatggac cgcacaatga agatacggtg cttttgtatc gtacttattg 180
tttctggtgc gctgttaacc gaggtaaata ataaccggag tctctccggc gacaatttac 240
tggtggttaa caaccttcag agcagcaagt aagcccgaat gccgcccttt gggcggcata 300
ttttagatta tccgattctg tttaaagtca cgcaaaaaac caccccagcg acgttcatag 360
aatggcgcaa tatgttcggt aataaagtgg ctaattcctt tttccccttt tttcacctga 420
caaatatcga ttggttcatc gccaggtaat gtatcggtcg ctacacttcc cgtcgcctga 480
ataatttctt cgatatcacc atcggcttca atgccaataa gtaaattagg ctgtgcctct 540
tcgttctctt taattgaaca aataaaagca cgcttcaccg gcttaatggt tttaaataag 600
gtggtgagtg aatcaatcat ttgtgctggc ggctctgcga cttccgataa tatcagcgat 660
tcaccgcctt ccaggatttc ctggctgctc agcggatttc cctcttcacc aatcaacaaa 720
ctgatttcac gcggcataaa ttctttaccg gttggcagtt tggcattaag gaagagcgtt 780
tcgccaagtg tcatctcaaa cagcgtgcga acgggcatta cgacaaatgc ctgttcgtct 840
tcaaccgcct gttgaagtgc ttctaacgag gtgaaaaaag gaatgacgct ggtgccgtct 900
tctttttccc agtgctgtaa atcaagcgcg ctatcttcaa ccacagcctc gccctgcgcc 960
gccgtaccag gcacccagac ggtggattcc agtagagtac ggaaaaaggc cgggcggtgc 1020
gccggttcag ttgctgcttt ttccagcagg 1050

Claims (77)

1.一种包括多核苷酸的混合物的组合物,所述混合物包括:
含有成对的多核苷酸的第一池,其中所述第一池中的每对含有第一多核苷酸和第二多核苷酸;和
插入多核苷酸的第二池,其中所述第二池中的每个插入多核苷酸包括在其5'端的与来自所述第一池的一对多核苷酸中的第一多核苷酸的3'端互补的第一组装重叠序列和在其相对的3'端的与第二多核苷酸的5'端互补的第二组装重叠序列。
2.根据权利要求1所述的组合物,进一步包括克隆载体,其中,对于所述第一池中的每对,所述第一多核苷酸的5'端和所述第二多核苷酸的3'端包括与所述克隆载体互补的序列。
3.根据权利要求2所述的组合物,其中选择来自所述第一池的每一多核苷酸,使得除了所述第一池的所述成对的多核苷酸与所述第二池的所述插入多核苷酸之间、或所述第一池的所述成对的多核苷酸与所述克隆载体之间的设计的组装重叠序列之外,没有来自所述第一池的多核苷酸与来自所述第一池的超过指定的阈值的任何其他多核苷酸共享共同序列。
4.根据权利要求3所述的组合物,其中所述指定的阈值为5至15个连续核苷酸。
5.根据权利要求1至4中任一权利要求所述的组合物,进一步包括聚合酶。
6.根据权利要求5所述的组合物,其中所述聚合酶是链置换的或非链置换的。
7.根据权利要求6所述的组合物,其中所述聚合酶是非链置换的,并且所述组合物进一步包括拥挤剂。
8.根据权利要求7所述的组合物,其中所述拥挤剂是聚乙二醇(PEG)。
9.根据权利要求8所述的组合物,其中所述PEG以约3%至约7%(重量/体积)的浓度使用。
10.根据权利要求8所述的组合物,其中所述PEG选自PEG-200、PEG-4000、PEG-6000、PEG-8000或PEG-20,000。
11.根据权利要求6所述的组合物,其中所述聚合酶是链置换的,并且所述组合物进一步包括单链结合蛋白质。
12.根据权利要求11所述的组合物,其中所述单链DNA结合蛋白质是极端热稳定的单链DNA结合蛋白质(ET SSB)、大肠杆菌recA、T7基因2.5产物、噬菌体λRedB或Rac前噬菌体RecT。
13.根据权利要求1所述的组合物,进一步包括5'-3'核酸外切酶。
14.根据权利要求1所述的组合物,进一步包括连接酶。
15.根据权利要求1所述的组合物,其中所述第一池中的每对是双链DNA(dsDNA)或单链(ssDNA)。
16.根据权利要求1所述的组合物,其中所述第二池中的每个插入多核苷酸是dsDNA或ssDNA。
17.根据权利要求1所述的组合物,其中,对于所述第一池中的每对,所述第一多核苷酸和所述第二多核苷酸包括对应于宿主细胞中的靶基因组基因座的序列。
18.根据权利要求1所述的组合物,其中,对于所述第一池中的每对,所述第一多核苷酸和所述第二多核苷酸包括对应于作为代谢途径的一部分的基因的编码序列。
19.根据权利要求1所述的组合物,其中,对于所述第一池中的每对,所述第一多核苷酸和所述第二多核苷酸包括对应于功能结构域或一或多种蛋白质的编码序列。
20.根据权利要求1所述的组合物,其中,对于所述第一池中的每对,所述第一多核苷酸和所述第二多核苷酸在单个构建体中连接在一起,其中所述单个构建体包括用于所述第一多核苷酸与所述第二多核苷酸之间的一或多种位点特异性核酸酶的一或多个识别序列。
21.根据权利要求20所述的组合物,其中用于一或多种位点特异性核酸酶的一或多个识别序列包括归巢核酸内切酶识别序列。
22.根据权利要求1所述的组合物,其中所述第二池中的每个插入多核苷酸上的所述第一组装重叠序列和所述第二组装重叠序列包括分别与来自所述第一池的一对多核苷酸中的第一多核苷酸的3'端和第二多核苷酸的5'端互补的1或多个核苷酸。
23.根据权利要求1所述的组合物,其中所述第二池中的每个插入多核苷酸上的所述第一组装重叠序列和所述第二组装重叠序列包括分别与来自所述第一池的一对多核苷酸中的第一多核苷酸的3'端和第二多核苷酸的5'端互补的约25个核苷酸。
24.根据权利要求1所述的组合物,其中所述第二池中的每个插入多核苷酸包括位于所述第一组装重叠序列与所述第二组装重叠序列之间的一或多个有效负载序列。
25.根据权利要求24所述的组合物,其中所述一或多个有效负载序列选自启动子、基因、调节序列、编码降解决定子的核酸序列、编码溶解度标签的核酸序列、终止子、唯一标识符序列或其部分。
26.根据权利要求17所述的组合物,其中所述第一池中的每对第一多核苷酸和第二多核苷酸包括与所述第一池中的每个其他对相比对应于宿主细胞中不同的靶基因组基因座的序列。
27.根据权利要求17所述的组合物,其中所述第一池中的每对第一多核苷酸和第二多核苷酸包括对应于宿主细胞中相同靶基因组基因座的序列。
28.根据权利要求24所述的组合物,其中所述第二池中的所述插入多核苷酸中的每个有效负载序列不同于所述第二池中的每个其他插入多核苷酸中的有效负载序列。
29.根据权利要求24所述的组合物,其中所述第二池中的所述插入多核苷酸中的每个有效负载序列与所述第二池中的每个其他插入多核苷酸中的有效负载序列相同。
30.一种用于生成多核苷酸的文库的方法,所述方法包括:
(a)组合多核苷酸的第一池和多核苷酸的第二池,其中所述第一池含有成对的多核苷酸,其中所述第一池中的每对含有第一多核苷酸和第二多核苷酸,其中所述第二池含有插入多核苷酸,其中所述第二池中的每个插入多核苷酸包括在其5'端的与来自所述第一池的一对多核苷酸中的第一多核苷酸的3'端互补的第一组装重叠序列和在其相对的3'端的与第二多核苷酸的5'端互补的第二组装重叠序列;以及
(b)将所述第一池和所述第二池组装成多核苷酸的文库,其中所述文库中的每一多核苷酸包括来自所述第二池的插入多核苷酸和来自所述第一池的一对第一多核苷酸和第二多核苷酸,其中所述组装通过体外克隆方法或体内克隆方法进行。
31.根据权利要求30所述的方法,其中所述第二池中的每个插入多核苷酸上的所述第一组装重叠序列和所述第二组装重叠序列包括分别与来自所述第一池的一对多核苷酸中的第一多核苷酸的3'端和第二多核苷酸的5'端互补的1或多个核苷酸。
32.根据权利要求30或31所述的方法,其中所述第二池中的每个插入多核苷酸上的所述第一组装重叠序列和所述第二组装重叠序列包括分别与来自所述第一池的一对多核苷酸中的第一多核苷酸的3'端和第二多核苷酸的5'端互补的约25个核苷酸。
33.根据权利要求30所述的方法,其中,对于所述第一池中的每对,所述第一多核苷酸和所述第二多核苷酸在单个构建体中连接在一起,其中所述单个构建体包括用于所述第一多核苷酸与所述第二多核苷酸之间的一或多种位点特异性核酸酶的一或多个识别序列。
34.根据权利要求33所述的方法,其中用于一或多种位点特异性核酸酶的所述一或多个识别序列包括归巢核酸内切酶识别序列。
35.根据权利要求33所述的方法,其中通过经由剪接和重叠延伸PCR(SOE-PCR)、限制连接、钝端连接、基于重叠的组装方法、基于重组的方法或连接所述第一多核苷酸和所述第二多核苷酸的任何其他酶促或化学方法连接各个第一多核苷酸和第二多核苷酸,或通过直接合成单个构建体来产生连接的单个构建体。
36.根据权利要求30所述的方法,进一步包括在步骤(a)期间将克隆载体与所述第一池和所述第二池组合,其中,对于所述第一池中的每对,所述克隆载体的相对端包括与所述第一多核苷酸的5'端和所述第二多核苷酸的3'端互补的序列。
37.根据权利要求30所述的方法,进一步包括在步骤(a)之前将克隆载体与所述第一池组合,其中,对于所述第一池中的每对,所述克隆载体的相对端包括与所述第一多核苷酸的5'端和所述第二多核苷酸的3'端互补的序列。
38.根据权利要求36或37所述的方法,其中所述克隆载体和来自所述第一池的每对中的所述第一多核苷酸的5'端和所述第二多核苷酸的3'端包括用于一或多种位点特异性核酸酶的一或多个识别序列。
39.根据权利要求38所述的方法,进一步包括通过添加所述一或多个识别序列的一或多种位点特异性核酸酶,在所述克隆载体的相对端与来自所述第一池的每对中的所述第一多核苷酸的5'端和所述第二多核苷酸的3'端之间生成单链互补突出物。
40.根据权利要求39所述的方法,进一步包括连接所述克隆载体的所述相对端与来自所述第一池的每对中的所述第一多核苷酸的5'端和所述第二多核苷酸的3'端之间的所述单链互补突出物。
41.根据权利要求36或37所述的方法,其中步骤(b)产生环状产物,所述环状产物包括来自所述第二池的插入多核苷酸、来自所述第一池的一对的第一多核苷酸和第二多核苷酸以及所述克隆载体。
42.根据权利要求36或37所述的方法,其中所述第一池通过从更大组的此类序列中选择成对的多核苷酸序列来生成,使得除了所述第一池的所述成对的多核苷酸与所述第二池的所述插入多核苷酸之间、或所述第一池的所述成对的多核苷酸与所述克隆载体之间的设计的组装重叠序列之外,没有来自所述第一池的多核苷酸与来自所述第一池的超过指定的阈值的任何其他多核苷酸共享共同序列。
43.根据权利要求42所述的方法,其中所述指定的阈值为5至15个连续核苷酸。
44.根据权利要求30所述的方法,其中所述组装是体外克隆方法,其中将所述第一池和所述第二池的混合物加热以使存在于所述第一池和所述第二池中的多核苷酸部分或完全变性,然后在组装之前被冷却至室温。
45.一种用于生成多核苷酸的文库的方法,所述方法包括:
(a)经由聚合酶链反应PCR扩增多核苷酸的第一池,其中所述第一池含有成对的多核苷酸,其中所述第一池中的每对含有第一多核苷酸和第二多核苷酸,并且其中一对中的每一个第一多核苷酸和每一个第二多核苷酸包括5'端和3'端,其中所述扩增将包括用于一或多种位点特异性核酸酶的一或多个识别序列的共同重叠序列引入到来自所述第一池的一对中的第一多核苷酸的5'端和第二多核苷酸的3'端上;
(b)通过利用共同重叠序列将来自所述第一池的每对第一多核苷酸和第二多核苷酸组装成单个核酸片段,其中每对的所述单个核酸片段包括由所述共同重叠序列从所述第一多核苷酸的5'端和所述第二多核苷酸的3'端分离的第一多核苷酸和第二多核苷酸,并且其中每对的所述单个核酸片段中的所述第一多核苷酸的3'端和所述第二多核苷酸的5'端位于所述单个核酸片段的相对末端上,远离一或多个位点特异性核酸酶识别序列;
(c)将每对的所述单个核酸片段与含有插入多核苷酸的第二池组合,其中所述第二池中的每个插入多核苷酸包括在其5'端的与所述单个核酸片段中存在的所述第一多核苷酸的3'端互补的第一组装重叠序列和在其相对的3'端的与所述单个核酸片段中存在的所述第二多核苷酸的5'端互补的第二组装重叠序列;
(d)将所述第一池和所述第二池组装成环化的产物的第三池,其中所述组装经由体外或体内重叠组装方法进行,并且其中所述第三池中的每种环化的产物包括来自所述第二池的插入序列和来自所述第一池的一对第一多核苷酸和第二多核苷酸;
(e)经由一或多种位点特异性核酸酶的消化使所述第三池中的每种环化的产物线性化,所述位点特异性核酸酶识别位于所述第三池中的每种环化的产物中的所述第一多核苷酸序列和所述第二多核苷酸序列之间的一或多个位点特异性核酸酶识别序列;以及
(f)通过体外或体内克隆方法将线性化的产物组装到克隆载体中。
46.根据权利要求45所述的方法,其中位于所述第一多核苷酸序列与所述第二多核苷酸序列之间的所述一或多个位点特异性核酸酶识别序列是归巢核酸酶识别序列。
47.根据权利要求45或46所述的方法,其中位于所述第一多核苷酸序列与所述第二多核苷酸序列之间的所述一或多个位点特异性核酸酶识别序列的所述一或多种位点特异性核酸酶是归巢核酸内切酶。
48.根据权利要求45所述的方法,其中所述共同重叠序列包括至少1个核苷酸的组装重叠序列,并且步骤(b)中的组装通过基于重叠的DNA组装方法进行。
49.根据权利要求45所述的方法,其中所述共同重叠序列包括10-25个核苷酸的组装重叠序列,并且步骤(b)中的组装通过基于重叠的DNA组装方法进行。
50.根据权利要求48或49所述的方法,其中所述基于重叠的DNA组装方法选自SOE-PCR或体外重叠组装方法。
51.根据权利要求50所述的方法,其中存在于所述第一多核苷酸的5'端的所述共同重叠序列中的所述一或多个位点特异性核酸酶识别序列与存在于每对中的所述第二多核苷酸的3'端的所述共同重叠序列中的所述一或多个位点特异性核酸酶识别序列互补,并且其中在步骤(b)中利用每对中的所述第一多核苷酸和所述第二多核苷酸的所述共同重叠序列需要进行SOE-PCR。
52.根据权利要求45所述的方法,其中在步骤(b)中利用每对中的所述第一多核苷酸和所述第二多核苷酸的所述共同重叠序列需要用一或多个位点特异性核酸酶识别序列的一或多种位点特异性核酸酶消化每对中的所述第一多核苷酸5'端和所述第二多核苷酸3'端上的所述共同重叠序列中存在的所述一或多个位点特异性核酸酶识别序列,以在每对中的所述第一多核苷酸的5'端和所述第二多核苷酸的3'端生成包括互补序列的单链突出物;以及连接在每对中的所述第一多核苷酸的5'端和所述第二多核苷酸的3'端上的所述单链突出物上存在的互补序列。
53.根据权利要求45所述的方法,其中步骤(d)的所述组装使用基于重叠的DNA组装方法进行。
54.根据权利要求53所述的方法,其中所述基于重叠的DNA组装选自SOE-PCR和体外重叠组装方法。
55.根据权利要求45所述的方法,其中每对中的所述单个核酸片段中的所述第一多核苷酸的3'端和所述第二多核苷酸的5'端包括一组附加的一或多个位点特异性核酸酶识别序列,并且所述第二池中的每个插入多核苷酸中的所述第一组装重叠序列和所述第二组装重叠序列包括一或多个位点特异性核酸酶识别序列。
56.根据权利要求55所述的方法,其中步骤(d)中的组装需要用每对中的所述单个核酸片段中的所述第一多核苷酸的3'端和所述第二多核苷酸的5'端上的附加的一或多个位点特异性核酸酶识别序列以及来自所述第二池的每个插入多核苷酸中的所述第一组装序列和所述第二组装序列中存在的一或多个位点特异性核酸酶识别序列的一或多种位点特异性核酸酶消化每对中的所述单个核酸片段中的所述第一多核苷酸的3'端和所述第二多核苷酸的5'端上存在的附加的一或多个位点特异性核酸酶识别序列和来自所述第二池的每个插入多核苷酸中的所述第一组装序列和所述第二组装序列中存在的一或多个位点特异性核酸酶识别序列,以在所述第一多核苷酸的3'端上生成包括与来自所述第二池的插入多核苷酸的所述第一组装序列的5'端上的单链突出物上存在的序列互补的序列的单链突出物和在所述第二多核苷酸的5'端上生成包括与来自所述第二池的相同插入多核苷酸的所述第二组装序列的3'端上的单链突出物上存在的序列互补的序列的单链突出物;以及连接所述单链突出物上存在的互补序列。
57.根据权利要求45所述的方法,其中步骤(f)的所述克隆载体包括一或多个位点特异性核酸酶识别序列。
58.根据权利要求57所述的方法,其中步骤(f)中的组装需要用所述克隆载体中存在的所述一或多个位点特异性核酸酶识别序列的所述一或多种位点特异性核酸酶消化所述克隆载体中的一或多个位点特异性核酸酶识别序列,其中所述消化在所述克隆载体的相对端上生成单链突出物,其中所述克隆载体的所述相对端的一个上的所述单链突出物包括与步骤(e)中生成的所述线性化的产物的端互补的序列,并且所述克隆载体的所述相对端的另一个上的所述单链突出物包括与步骤(e)中生成的所述线性化的产物的相对端互补的序列;以及连接所述克隆载体的所述单链突出物上存在的互补序列和来自步骤(e)的所述线性化的产物。
59.根据权利要求45所述的方法,其中所述第一池通过从更大组的此类序列中选择成对的多核苷酸序列来生成,使得除了所述第一池的所述成对的多核苷酸与所述第二池的所述插入多核苷酸之间、或所述第一池的所述成对的多核苷酸与所述克隆载体之间的设计的组装重叠序列之外,没有来自所述第一池的多核苷酸与来自所述第一池的超过指定的阈值的任何其他多核苷酸共享共同序列。
60.根据权利要求59所述的方法,其中所述指定的阈值为5至15个连续核苷酸。
61.根据权利要求45所述的方法,其中所述第二池中的每个插入多核苷酸上的所述第一组装重叠序列和所述第二组装重叠序列包括与所述单个核酸片段的所述相对末端互补的1或多个核苷酸。
62.根据权利要求45所述的方法,其中所述第二池中的每个插入多核苷酸上的所述第一组装重叠序列和所述第二组装重叠序列包括与所述单个核酸片段的所述相对末端互补的约25个核苷酸。
63.根据权利要求30或45所述的方法,其中,在步骤(a)之前,通过将含有来自成对的多核苷酸的每一个第一多核苷酸的混合物与含有来自成对的多核苷酸的每一个第二多核苷酸的混合物组合来生成多核苷酸的所述第一池。
64.根据权利要求30或45所述的方法,其中所述第一池中的每对是双链DNA(dsDNA)或单链DNA(ssDNA)。
65.根据权利要求30或45所述的方法,其中所述第二池中的每个插入多核苷酸是dsDNA或ssDNA。
66.根据权利要求30或45所述的方法,其中,对于所述第一池中的每对,所述第一多核苷酸和所述第二多核苷酸包括对应于宿主细胞中的靶基因组基因座的序列。
67.根据权利要求30或45所述的方法,其中,对于所述第一池中的每对,所述第一多核苷酸和所述第二多核苷酸包括对应于作为代谢途径的一部分的基因的编码序列。
68.根据权利要求30或45所述的方法,其中,对于所述第一池中的每对,所述第一多核苷酸和所述第二多核苷酸包括对应于功能结构域或一或多种蛋白质的编码序列。
69.根据权利要求30或45所述的方法,其中所述第二池中的每个插入多核苷酸包括位于所述第一组装重叠序列与所述第二组装重叠序列之间的一或多个有效负载序列。
70.根据权利要求69所述的方法,其中所述一或多个有效负载序列选自启动子、基因、调节序列、编码降解决定子的核酸序列、编码溶解度标签的核酸序列、终止子、唯一标识符序列或其部分。
71.根据权利要求66所述的方法,其中,对于所述第一池中的每对,所述第一多核苷酸和所述第二多核苷酸包括与所述第一池中的每个其他对相比对应于宿主细胞中不同的靶基因组基因座的序列。
72.根据权利要求66所述的方法,其中,对于所述第一池中的每对,所述第一多核苷酸和所述第二多核苷酸包括对应于宿主细胞中相同靶基因组基因座的序列。
73.根据权利要求69所述的方法,其中所述第二池中的所述插入多核苷酸中的每个有效负载序列不同于所述第二池中的每个其他插入多核苷酸中的有效负载序列。
74.根据权利要求69所述的方法,其中所述第二池中的所述插入多核苷酸中的每个有效负载序列与所述第二池中的每个其他插入多核苷酸中的有效负载序列相同。
75.根据权利要求30或45所述的方法,其中所述第二池中的每个插入多核苷酸通过以下生成:
(i)对包括所述有效负载序列、正向引物和反向引物的混合物进行聚合酶链反应(PCR),其中所述正向引物自5'至3'包括与所述有效负载序列互补的一或多个核苷酸的短段、所述第一组装重叠序列、用于一或多种位点特异性核酸酶的一或多个识别序列、所述第二组装重叠序列和与所述有效负载序列互补的一或多个核苷酸的第二段,并且其中所述反向引物包括与所述有效负载序列或与所述有效负载序列下游的其他序列互补的序列,其中所述PCR生成PCR产物,所述PCR产物自5'至3'包括与所述有效负载序列互补的核酸的短段、所述第一组装重叠序列、所述一或多个位点特异性核酸酶识别序列、所述第二组装重叠序列和所述有效负载序列;
(ii)经由选自由剪接和重叠延伸PCR(SOE-PCR)、限制性连接、钝端连接、基于重叠的组装方法和基于重组的方法组成的群组的组装方法,或连接两个DNA分子的任何其他酶促或化学方法,使所述PCR产物环化;以及
(iii)用识别所述一或多个位点特异性核酸酶识别序列的一或多种位点特异性核酸酶使所述环化的PCR产物线性化,从而生成多核苷酸的所述第二池。
76.根据权利要求20所述的组合物,其中所述位点特异性核酸酶是限制性核酸内切酶、IIs型核酸内切酶、归巢核酸内切酶、RNA导向的核酸酶、DNA导向的核酸酶、锌指核酸酶、TALEN或切口酶中的一或多种。
77.根据权利要求33或45所述的方法,其中所述位点特异性核酸酶是限制性核酸内切酶、IIs型核酸内切酶、归巢核酸内切酶、RNA导向的核酸酶、DNA导向的核酸酶、锌指核酸酶、TALEN或切口酶中的一或多种。
CN201980081345.5A 2018-10-31 2019-10-31 Dna文库的多重确定性组装 Pending CN113166741A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201862753254P 2018-10-31 2018-10-31
US62/753,254 2018-10-31
PCT/US2019/059051 WO2020092704A1 (en) 2018-10-31 2019-10-31 Multiplexed deterministic assembly of dna libraries

Publications (1)

Publication Number Publication Date
CN113166741A true CN113166741A (zh) 2021-07-23

Family

ID=70327918

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201980081345.5A Pending CN113166741A (zh) 2018-10-31 2019-10-31 Dna文库的多重确定性组装

Country Status (9)

Country Link
US (2) US11066663B2 (zh)
EP (1) EP3874037A4 (zh)
JP (1) JP2022513408A (zh)
KR (1) KR20210088615A (zh)
CN (1) CN113166741A (zh)
CA (1) CA3117805A1 (zh)
MX (1) MX2021005028A (zh)
SG (1) SG11202104409YA (zh)
WO (1) WO2020092704A1 (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020092704A1 (en) 2018-10-31 2020-05-07 Zymergen Inc. Multiplexed deterministic assembly of dna libraries
KR102616636B1 (ko) 2022-12-02 2023-12-21 (주)그린재킷 캐디 통합 관리 시스템

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104837984A (zh) * 2012-10-12 2015-08-12 格林考瓦因有限公司 宿主细胞修饰方法
US20160060671A1 (en) * 2014-08-27 2016-03-03 New England Biolabs, Inc. Synthon Formation
WO2018005655A2 (en) * 2016-06-30 2018-01-04 Zymergen Inc. Methods for generating a bacterial hemoglobin library and uses thereof
WO2018138385A1 (en) * 2017-01-30 2018-08-02 Kws Saat Se Repair template linkage to endonucleases for genome engineering

Family Cites Families (40)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5928905A (en) * 1995-04-18 1999-07-27 Glaxo Group Limited End-complementary polymerase reaction
US5837458A (en) 1994-02-17 1998-11-17 Maxygen, Inc. Methods and compositions for cellular and metabolic engineering
US5605793A (en) 1994-02-17 1997-02-25 Affymax Technologies N.V. Methods for in vitro recombination
US6159688A (en) 1997-03-18 2000-12-12 Novo Nordisk A/S Methods of producing polynucleotide variants
US6221597B1 (en) * 1999-05-21 2001-04-24 Rosetta Inpharmatics, Inc. Essential genes of yeast as targets for antifungal agents, herbicides, insecticides and anti-proliferative drugs
US7575860B2 (en) 2000-03-07 2009-08-18 Evans David H DNA joining method
WO2002070720A1 (en) 2001-03-02 2002-09-12 Riken Cloning vectors and method for molecular cloning
US7026123B1 (en) * 2001-08-29 2006-04-11 Pioneer Hi-Bred International, Inc. UTR tag assay for gene function discovery
US7642055B2 (en) 2004-09-21 2010-01-05 Applied Biosystems, Llc Two-color real-time/end-point quantitation of microRNAs (miRNAs)
US9580719B2 (en) 2007-04-27 2017-02-28 Pfenex, Inc. Method for rapidly screening microbial hosts to identify certain strains with improved yield and/or quality in the expression of heterologous proteins
DK2255013T3 (en) 2008-02-15 2016-09-12 Synthetic Genomics Inc Methods for in vitro joining and combinatorial assembly of nucleic acid molecules.
KR101794298B1 (ko) * 2008-11-19 2017-11-20 아미리스 인코퍼레이티드 폴리뉴클레오타이드의 집합체 조성물 및 이에 대한 방법
AU2012212292B2 (en) 2011-02-02 2014-02-06 Amyris, Inc. Methods of developing terpene synthase variants
SI3415619T1 (sl) * 2011-04-28 2021-04-30 The Board of Trustees of the Leland Stanford Junior University Office of the General Counsel Building 170, Third Floor, Main Quad Identifikacija polinukleotidov, povezanih z vzorcem
US9637739B2 (en) 2012-03-20 2017-05-02 Vilnius University RNA-directed DNA cleavage by the Cas9-crRNA complex
LT2800811T (lt) 2012-05-25 2017-09-11 The Regents Of The University Of California Būdai ir kompozicijos, skirti tikslinės dnr modifikavimui, panaudojant adresuotą rnr, ir transkripcijos moduliavimui, panaudojant adresuotą rnr
UA116639C2 (uk) 2012-10-09 2018-04-25 Рег'Юлес Терап'Ютікс Інк. Способи лікування синдрому альпорта
WO2014093694A1 (en) 2012-12-12 2014-06-19 The Broad Institute, Inc. Crispr-cas nickase systems, methods and compositions for sequence manipulation in eukaryotes
US8697359B1 (en) 2012-12-12 2014-04-15 The Broad Institute, Inc. CRISPR-Cas systems and methods for altering expression of gene products
ES2542015T3 (es) 2012-12-12 2015-07-29 The Broad Institute, Inc. Ingeniería de sistemas, métodos y composiciones de guía optimizadas para manipulación de secuencias
US20140189896A1 (en) 2012-12-12 2014-07-03 Feng Zhang Crispr-cas component systems, methods and compositions for sequence manipulation
PT2931898E (pt) 2012-12-12 2016-06-16 Harvard College Manipulação e otimização de sistemas, métodos e composições para manipulação de sequências com domínios funcionais
ES2786193T3 (es) 2012-12-12 2020-10-09 Broad Inst Inc Modificación por tecnología genética y optimización de sistemas, métodos y composiciones enzimáticas mejorados para la manipulación de secuencias
US20140308710A1 (en) 2012-12-13 2014-10-16 Synthetic Genomics, Inc. Peg-mediated assembly of nucleic acid molecules
CN105121641A (zh) 2012-12-17 2015-12-02 哈佛大学校长及研究员协会 Rna-引导的人类基因组工程化
DK3066201T3 (en) 2013-11-07 2018-06-06 Editas Medicine Inc CRISPR-RELATED PROCEDURES AND COMPOSITIONS WITH LEADING GRADES
US10287627B2 (en) * 2014-02-08 2019-05-14 The Regents Of The University Of Colorado, A Body Corporate Multiplexed linking PCR
IL288263B (en) * 2015-01-28 2022-07-01 Caribou Biosciences Inc Crispr hybrid dna/rna polynucleotides and methods of use
US9738687B2 (en) 2015-04-10 2017-08-22 Feldan Bio Inc. Polypeptide-based shuttle agents for improving the transduction efficiency of polypeptide cargos to the cytosol of target eukaryotic cells, uses thereof, methods and kits relating to same
US9790490B2 (en) 2015-06-18 2017-10-17 The Broad Institute Inc. CRISPR enzymes and systems
US9677090B2 (en) 2015-10-23 2017-06-13 Caribou Biosciences, Inc. Engineered nucleic-acid targeting nucleic acids
US11151497B2 (en) * 2016-04-27 2021-10-19 Zymergen Inc. Microbial strain design system and methods for improved large-scale production of engineered nucleotide sequences
CN108027849B (zh) 2015-12-07 2020-03-20 齐默尔根公司 利用htp基因组工程平台对微生物菌株的改良
US9896696B2 (en) 2016-02-15 2018-02-20 Benson Hill Biosystems, Inc. Compositions and methods for modifying genomes
JP7227162B2 (ja) 2017-06-06 2023-02-21 ザイマージェン インコーポレイテッド 真菌株を改良するためのhtpゲノム操作プラットフォーム
EP3878961A1 (en) 2017-06-06 2021-09-15 Zymergen, Inc. A htp genomic engineering platform for improving escherichia coli
US10011849B1 (en) * 2017-06-23 2018-07-03 Inscripta, Inc. Nucleic acid-guided nucleases
US9982279B1 (en) 2017-06-23 2018-05-29 Inscripta, Inc. Nucleic acid-guided nucleases
WO2020092704A1 (en) 2018-10-31 2020-05-07 Zymergen Inc. Multiplexed deterministic assembly of dna libraries
US20230159955A1 (en) * 2020-04-16 2023-05-25 Zymergen Inc. Circular-permuted nucleic acids for homology-directed editing

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104837984A (zh) * 2012-10-12 2015-08-12 格林考瓦因有限公司 宿主细胞修饰方法
US20160060671A1 (en) * 2014-08-27 2016-03-03 New England Biolabs, Inc. Synthon Formation
WO2018005655A2 (en) * 2016-06-30 2018-01-04 Zymergen Inc. Methods for generating a bacterial hemoglobin library and uses thereof
WO2018138385A1 (en) * 2017-01-30 2018-08-02 Kws Saat Se Repair template linkage to endonucleases for genome engineering

Also Published As

Publication number Publication date
JP2022513408A (ja) 2022-02-07
US20200131508A1 (en) 2020-04-30
US11066663B2 (en) 2021-07-20
WO2020092704A1 (en) 2020-05-07
EP3874037A1 (en) 2021-09-08
SG11202104409YA (en) 2021-05-28
MX2021005028A (es) 2021-08-24
KR20210088615A (ko) 2021-07-14
EP3874037A4 (en) 2021-12-15
CA3117805A1 (en) 2020-05-07
US20210324378A1 (en) 2021-10-21

Similar Documents

Publication Publication Date Title
KR102339365B1 (ko) 키메라 게놈 조작 분자 및 방법
KR101659101B1 (ko) 박테리아 [2Fe-2S] 다이하이드록시산 탈수효소의 동정 및 용도
EP4166662A1 (en) Methods for modification of target nucleic acids using fused guide rna - donor molecules
AU2016380351A1 (en) Novel CRISPR-associated transposases and uses thereof
CN104109687A (zh) 运动发酵单胞菌CRISPR-Cas9系统的构建与应用
US20240336905A1 (en) Class ii, type v crispr systems
KR20130117753A (ko) 포스포케톨라아제를 포함하는 재조합 숙주 세포
JP6552969B2 (ja) 定方向進化のためのライブラリーの作製方法
CN112166180A (zh) 操纵涉及信号转导的基因以控制发酵和生产期间的真菌形态
KR20210136997A (ko) 미생물에서 반복적 게놈 편집
CN113166798A (zh) 通过核酸内切酶保护的靶向富集
KR20210137009A (ko) 미생물에서 풀링 게놈 편집
CN113166741A (zh) Dna文库的多重确定性组装
TW202309291A (zh) 用於室內空氣修復之組合物及方法
KR20200134333A (ko) 발효에 의한 히스타민 생산을 위해 조작된 생합성 경로
KR20220150328A (ko) 낮은 내지 중간 발현을 부여하는 구성적 박테리아 프로모터를 생산하는 방법
US6391631B1 (en) Bacterial plasmids
US20230159955A1 (en) Circular-permuted nucleic acids for homology-directed editing
US20230265460A1 (en) A modular and pooled approach for multiplexed crispr genome editing
KR20240049306A (ko) Ruvc 도메인을 갖는 효소
CN114958808A (zh) 一种小型编辑基因组的CRISPR/Cas系统及其专用的CasX蛋白
KR20140109922A (ko) 연관된 방선균의 유전적 형질전환을 위한 플라스미드인 액티노플라네스 sp. SE50/110으로부터 유래한 신규한 방선균류 통합 및 접합 인자
US20210115500A1 (en) Genotyping edited microbial strains
CN115605589A (zh) 改进的用于生产类异戊二烯的方法
CN112175981A (zh) 一种基于无水乙醇或十二烷基磺酸钠刺激的哈维弧菌定点基因敲除的方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40057701

Country of ref document: HK

WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20210723

WD01 Invention patent application deemed withdrawn after publication