CN109689856A - 用于海藻宿主细胞的CRISPR-Cas系统 - Google Patents
用于海藻宿主细胞的CRISPR-Cas系统 Download PDFInfo
- Publication number
- CN109689856A CN109689856A CN201780055558.1A CN201780055558A CN109689856A CN 109689856 A CN109689856 A CN 109689856A CN 201780055558 A CN201780055558 A CN 201780055558A CN 109689856 A CN109689856 A CN 109689856A
- Authority
- CN
- China
- Prior art keywords
- polynucleotides
- sequence
- host cell
- guidance
- cas
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
- C12N15/102—Mutagenizing nucleic acids
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/111—General methods applicable to biologically active non-coding nucleic acids
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/85—Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
- C12N15/86—Viral vectors
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/16—Hydrolases (3) acting on ester bonds (3.1)
- C12N9/22—Ribonucleases RNAses, DNAses
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P21/00—Preparation of peptides or proteins
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/10—Type of nucleic acid
- C12N2310/20—Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2800/00—Nucleic acids vectors
- C12N2800/80—Vectors containing sites for inducing double-stranded breaks, e.g. meganuclease restriction sites
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2521/00—Reaction characterised by the enzymatic activity
- C12Q2521/30—Phosphoric diester hydrolysing, i.e. nuclease
- C12Q2521/301—Endonuclease
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Genetics & Genomics (AREA)
- Engineering & Computer Science (AREA)
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- Biomedical Technology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biotechnology (AREA)
- General Engineering & Computer Science (AREA)
- Molecular Biology (AREA)
- Microbiology (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- Biophysics (AREA)
- Plant Pathology (AREA)
- Medicinal Chemistry (AREA)
- Virology (AREA)
- General Chemical & Material Sciences (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Crystallography & Structural Chemistry (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Medicines Containing Plant Substances (AREA)
Abstract
本发明涉及分子生物学和细胞生物学领域。更具体地,本发明涉及用于网粘菌纲(Labyrinthulomycete)宿主细胞的CRISPR‑Cas系统。
Description
相关申请的交叉引用
本申请要求2016年7月13日提交的美国临时专利申请号62/361,741的申请日的权益,其公开内容通过提述以其整体并入本文。
背景
技术领域
本公开涉及分子生物学和细胞生物学领域。更具体地,本发明涉及用于海藻网粘菌纲(Labyrinthulomycete)宿主细胞的CRISPR-Cas系统。
相关技术领域的描述
基因组技术和分析方法的最新进展已经显著加速了编目和定位与多种生物功能和疾病相关的遗传因子的能力。需要精确的基因组工程技术,通过允许选择性扰动个体遗传原件以实现因果遗传变异的系统逆向工程,以及推进合成生物学、生物技术和医学应用。虽然基因组编辑技术如设计者锌指、转录激活因子样效应核酸酶(TALENs)或归巢大型核酸酶可用于产生靶向基因组扰动,但仍需要新的基因组工程技术,这些技术价格合理、易于设置、可扩展且能够靶向基因组内的多个位点。对于大多数的学术研究者而言,大型核酸内切酶设计具有挑战性,因为这些酶的DNA识别和切割功能在单个域中交织在一起。由于需要考虑系列中各个指域之间的依赖于上下文的影响,因此对于许多实验室而言,工程化锌指系列的稳固构造也被证明是困难的。因此,迫切需要用于靶向具有广泛应用的宿主细胞内的特定序列的替代的和稳固的技术。此技术问题的解决方案是提供权利要求书中表征的实施方案。
发明内容
本发明基于CRISPR-Cas系统,所述系统不需要产生针对靶特异性序列的定制的蛋白质,而需要可通过引导多核苷酸编程以识别特定的多核苷酸靶物的单个Cas酶;换言之,可使用所述的引导多核苷酸分子将Cas酶募集至特定的多核苷酸靶物。将CRISPR-Cas系统增加至基因组技术和分析方法的库(repertoire)中可显著简化分子生物学领域中的现有方法。
本发明提供非天然存在或工程化的组合物,其包含CRISPR-Cas系统的来源,所述CRISPR-Cas系统包含引导多核苷酸和Cas蛋白,其中所述引导多核苷酸包含基本上为宿主细胞中靶多核苷酸的反向互补物的序列,且所述引导多核苷酸可指导Cas蛋白在宿主细胞中靶多核苷酸处的结合以形成CRISPR-Cas复合物。
本发明进一步涉及调控细胞中多核苷酸表达的方法,其包括使宿主细胞与根据本发明的组合物接触,其中所述引导多核苷酸指导Cas蛋白在所述宿主细胞中的靶多核苷酸处的结合以形成CRISPR-Cas复合物。
本发明进一步涉及包含根据本发明的组合物的宿主细胞。
本发明进一步涉及产生宿主细胞的方法,其包括使宿主细胞与根据本发明的组合物接触,其中所述引导多核苷酸指导Cas蛋白在所述宿主细胞中的靶多核苷酸处的结合以形成CRISPR-Cas复合物。
本发明进一步涉及用于产生感兴趣的化合物的方法,其包括在有益于产生所述感兴趣的化合物的条件下培养根据本发明的宿主细胞,以及任选纯化或分离所述感兴趣的化合物。
附图简述
为了进一步理解本公开的性质、目的和优点,应结合以下附图参考以下详细描述,其中相同的附图数字表示相同的要素。
图1描绘典型的引导多核苷酸的实例。两种引导多核苷酸是包含引导序列(crRNA)和引导多核苷酸结构组分的引导RNA。在上图中,该引导多核苷酸结构组分由两个彼此杂交的单独分子组成;单个组分可称为tracr序列和tracr配对序列。在下图中,所述引导多核苷酸结构组分由具有内部杂交的单个分子组成。此图改编自Sander和Joung,2014和Mali等,Nat Methods.10(10):957-63,2013。
图2描绘所述引导多核苷酸(引导RNA自处理核酶,其缩写为gRSR)是怎样构建的。锤头状核酶和HDV核酶剪切RNA分子形成最终且功能性成熟的引导多核苷酸(引导RNA)。
图3显示在1%的琼脂糖凝胶上运行的消化的质粒和PCR扩增的片段。
图4显示由pYB32和pYB33细菌转化产生的转化子的菌落PCR的结果。
图5显示琼脂糖凝胶,其中源自T188和T189转化子的基因组DNA的扩增子是分离的,其测试启动子和部分Cas9的存在。
图6显示在琼脂糖凝胶上运行的源自T188和T189转化子的基因组DNA的扩增子,其验证Cas9整合至OrfA/Pfa1基因座。
图7显示从基因组DNA扩增且在1%琼脂糖凝胶上运行的裂殖壶菌属(Schizochytrium)脂肪酸合酶(FAS)。
图8显示将巴龙霉素(paromomycin)和gRNA盒PCR克隆至载体pCL400中的FAS基因座的结果。
图9显示分别进行扩增包含前3个CS gRNA靶物的整个区域作为一个扩增子的PCR结果,以及扩增gRNA3 CS4靶物的另一个PCR结果。
图10显示分别从T206转化子的基因组DNA扩增gRNA3 CS1靶物的PCR结果。
图11显示pLC122-Cas9和pYB30质粒的消化的结果。
图12显示由pYB61细菌转化产生的转化子的菌落PCR的结果。
图13显示1%琼脂糖凝胶上的消化pCL122质粒的结果。
图14显示1%琼脂糖凝胶上的用于pYB66克隆的gRNA3 CS1盒的扩增子。
图15显示1%琼脂糖凝胶上的消化gRNA3 CS1(pYB66片段)的结果。
图16描绘由pYB66细菌转化产生的转化子的菌落PCR的结果。
图17显示1%琼脂糖凝胶上的消化pYB61质粒的结果。
图18显示1%琼脂糖凝胶上的用于pYB73克隆的gRNA3 CS1盒的扩增子。
图19显示由pYB73细菌转化产生的转化子的菌落PCR的结果。
图20显示琼脂糖凝胶,其中源自T212转化子的基因组DNA的扩增子得到分离,其测试CarG基因的存在。
图21显示琼脂糖凝胶,其中源自T280、T281、T285和T286转化子的基因组DNA的扩增子得到分离,其测试部分启动子和Cas9序列的存在。
图22显示琼脂糖凝胶,其中源自T281和T286转化子的基因组DNA的扩增子得到分离,其测试gRNA盒的存在。
图23显示琼脂糖凝胶,其中源自T282和T287转化子的基因组DNA的扩增子得到分离,其测试部分gRNA盒的存在。
图24显示分别自T281、T282、T286和T287转化子的基因组DNA进行扩增gRNA3 CS1靶物的PCR结果。
序列表说明
SEQ ID NO:1列出了pCL122-Cas9载体核苷酸序列。
SEQ ID NO:2列出了pYB31载体核苷酸序列。
SEQ ID NO:3列出了pYB32载体核苷酸序列。
SEQ ID NO:4列出了pYB33载体核苷酸序列。
SEQ ID NO:5列出了pCL399载体核苷酸序列。
SEQ ID NO:6列出了pCL400载体核苷酸序列。
SEQ ID NO:7列出了pCL401载体核苷酸序列。
SEQ ID NO:8列出了pCL402载体核苷酸序列。
SEQ ID NO:9列出了pYB36载体核苷酸序列。
SEQ ID NO:10列出了pYB37载体核苷酸序列。
SEQ ID NO:11列出了pYB38载体核苷酸序列。
SEQ ID NO:12列出了pYB39载体核苷酸序列。
SEQ ID NO:13列出了121Tub seq F引物核苷酸序列。
SEQ ID NO:14列出了pYB32/3C R1引物核苷酸序列。
SEQ ID NO:15列出了CS pro Kpn IF F1引物核苷酸序列。
SEQ ID NO:16列出了CS pro BamH IF R1引物核苷酸序列。
SEQ ID NO:17列出了CS pro BamH IF F2引物核苷酸序列。
SEQ ID NO:18列出了CS pro Nde IF R2引物核苷酸序列。
SEQ ID NO:19列出了O A1-KO F引物核苷酸序列。
SEQ ID NO:20列出了pYB32/3SV40R1引物核苷酸序列。
SEQ ID NO:21列出了O A1-KO R引物核苷酸序列。
SEQ ID NO:22列出了pYB32/3C F1引物核苷酸序列。
SEQ ID NO:23列出了5’FAS PmeNde引物核苷酸序列。
SEQ ID NO:24列出了3’FAS PmeHpa引物核苷酸序列。
SEQ ID NO:25列出了pCL402 IF F引物核苷酸序列。
SEQ ID NO:26列出了pCL402 IF R引物核苷酸序列。
SEQ ID NO:27列出了pYB36 CS1 F引物核苷酸序列。
SEQ ID NO:28列出了pYB36 CS1 R引物核苷酸序列。
SEQ ID NO:29列出了pYB36 CS3 R引物核苷酸序列。
SEQ ID NO:30列出了pYB36 CS4 F引物核苷酸序列。
SEQ ID NO:31列出了pYB36 CS4 R引物核苷酸序列。
SEQ ID NO:32列出了pYB30载体核苷酸序列。
SEQ ID NO:33列出了pYB61载体核苷酸序列。
SEQ ID NO:34列出了pYB66载体核苷酸序列。
SEQ ID NO:35列出了pYB73载体核苷酸序列。
SEQ ID NO:36列出了pCL310载体核苷酸序列。
SEQ ID NO:37列出了pCL122载体核苷酸序列。
SEQ ID NO:38列出了pYB66 BamBgl F载体核苷酸序列。
SEQ ID NO:39列出了pYB66 Nde R引物核苷酸序列。
SEQ ID NO:40列出了pYB66 EF1seq F引物核苷酸序列。
SEQ ID NO:41列出了pCL122 OrfC R引物核苷酸序列。
SEQ ID NO:42列出了pYB73 gRNA PstKpn IF F引物核苷酸序列。
SEQ ID NO:43列出了pYB73 gRNA XhoPst IF R引物核苷酸序列。
SEQ ID NO:44列出了pYB73 seq F引物核苷酸序列。
SEQ ID NO:45列出了pYB73 seq R引物核苷酸序列。
SEQ ID NO:46列出了pYB13 pYB1 seq F引物核苷酸序列。
SEQ ID NO:47列出了TT pYB73 HDV R引物核苷酸序列。
发明详述
再进一步描述本主题公开之前,应理解,本公开不限于下面描述的本公开的特定实施方案,因为可以进行特定实施方案的变化并且仍落入所附权利要求的范围内。还应理解,所采用的术语是出于描述特定实施方案的目的,并不是限制性的。相反,本公开的范围将由所附权利要求确定。
在第一方面中,本发明提供包含CRISPR-Cas系统的来源的非天然存在或工程化的组合物,所述系统包含引导多核苷酸和Cas蛋白,其中所述引导多核苷酸包含基本上为宿主细胞中靶多核苷酸的反向互补物的引导序列,且所述引导多核苷酸可指导Cas蛋白在宿主细胞中靶多核苷酸处的结合以形成CRISPR-Cas复合物,其中所述引导序列基本上为宿主细胞的基因组中的5′-(N)yPAM-3′多核苷酸序列靶物的(N)y部分的反向互补物,其中y是8-30的整数,更优选10-30,更优选15-30,更优选17-27,更优选17-20,更优选17、18、19、20、21、22、23、24、25、26或27,其中PAM是前间区序列邻近基序,其中所述宿主细胞是网粘菌纲(Labyrinthulomycete)的,优选破囊壶菌目(Thraustochytriales)的,更优选破囊壶菌科(Thraustochytriaceae)的,更优选选自下组的菌属的成员:Aurantiochytrium、Oblongichytrium、裂殖壶菌属(Schizochytrium)、破囊壶菌属(Thraustochytrium)和吾肯氏壶菌属(Ulkenia),甚至更优选裂殖壶菌属菌种ATCC#20888,且其中PAM优选选自下列的序列:5′-XGG-3′、5′-XGGXG-3′、5′-XXAGAAW-3′、5′-XXXXGATT-3′、5′-XXAGAA-3′、5′-XAAAAC-3′,其中X可为任何核苷酸或其类似物,优选地,X可为任何核苷酸;且W为A或T。
所述组合物、来源、CRISPR-Cas系统、引导多核苷酸、Cas蛋白、靶多核苷酸、宿主细胞和CRISPR-Cas复合物在本文中称为根据本发明的组合物、来源、CRISPR-Cas系统、引导多核苷酸、Cas蛋白、靶多核苷酸、宿主细胞和CRISPR-Cas复合物。为了完整起见,由于“一个(a)”在本文别处定义为“至少一个”,则根据本发明的组合物包含至少一个(即一个、两个、三个或多个)引导多核苷酸来源和/或至少一个(即一个、两个、三个或多个)Cas蛋白。因此,本发明方便地提供多重CRISPR-Cas系统。这种多重CRISPR-Cas系统可方便地用于导入供体多核苷酸、缺失多核苷酸以及将多核苷酸库插入宿主细胞的基因组中。本文中,多重CRISPR-Cas系统可指使用一个或多个Cas蛋白、一个或多个引导多核苷酸和/或一个或多个供体多核苷酸。
术语“CRISPR系统”、“CRISPR-Cas系统”和“CRISPR酶系统”在本文中可互换使用,且在本发明的所有实施方案的上下文中指需要而与靶多核苷酸一起形成CRISPR-Cas复合物的要素的集合;这些元件包含但不限于Cas蛋白和引导多核苷酸。
在本发明的所有实施方案的上下文中,术语“CRISPR-Cas复合物”指包含与靶多核苷酸杂交的引导多核苷酸且与Cas蛋白复合的复合物。在最直接的形式中,在使用非突变的Cas蛋白(例如,但不限于酿脓链球菌(Streptococcus pyogenes)的Cas9蛋白)的情况下,CRISPR-Cas复合物的形成导致靶多核苷酸中或附近(例如距靶多核苷酸1、2、3、4、5、6、7、8、9、10、20、50或更多个碱基对)的一个或两个多核苷酸链的切割。通常,根据本发明的靶多核苷酸(下文定义)与PAM序列(下文定义)相关,并且PAM序列优选紧邻靶多核苷酸的下游(3');CRISPR-Cas复合物的形成通常导致PAM序列上游(5')3个碱基对的一条或两条多核苷酸链切割。
在本发明的所有实施方案的上下文中,术语“非天然存在的组合物”是指组合物,其在本发明中使用的形式不在自然界中存在。各个元件可(例如)本身天然存在或与自然界中的其他元件组合存在,但非天然存在的组合物包括(例如)至少一种元件,其多于或少于天然组合物。
在本发明的所有实施方案的上下文中,术语“工程化的组合物”是指组合物,其中至少一种元件已经被改造,即由人修饰的,使得所得元件不存在于自然界中。因此,由于包含至少一种工程化元件,工程化组合物不存在于自然界中。
术语“多核苷酸”、“核苷酸序列”和“核酸”在本文中可互换使用,并且在本发明的所有实施方案的上下文中是指任何长度的核苷酸的聚合形式(即脱氧核糖核苷酸或核糖核苷酸),或其混合物或类似物。多核苷酸可以具有任何三维结构,并且可实施已知或未知的任何功能。以下是多核苷酸的非限制性实例:基因或基因片段的编码或非编码区,由连锁分析定义的基因座,外显子,内含子,信使RNA(mRNA),转运RNA(tRNA),核糖体RNA(rRNA),短干扰RNA(siRNA),短发夹RNA(shRNA),微RNA(miRNA),核酶,cDNA,重组多核苷酸,支链多核苷酸,质粒,载体,任何序列的分离的DNA,任何序列的分离的RNA序列,核酸探针,寡核苷酸和引物。多核苷酸可包含一个或多个修饰的核苷酸,例如甲基化的核苷酸和核苷酸类似物或核苷酸等同物,其中核苷酸类似物或等同物定义为具有修饰的碱基、和/或修饰的骨架、和/或非天然核苷间键合、或这些修饰的组合的残基。优选的核苷酸类似物和等同物描述于“一般定义”部分。根据需要,可在组装多核苷酸之前或之后引入对核苷酸结构的修饰。聚合后可进一步修饰多核苷酸,例如通过与标记化合物缀合。
如本文所用,“多核苷酸”可包含常见的磷酸二酯键或非常见的键(例如,酰胺键,如其在肽核酸(PNA)中发现)。多核苷酸可含有全长cDNA序列的核苷酸序列,其包括非翻译的5'和3'序列、编码序列以及核酸序列的片段、表位、域和变体。多核苷酸可由任何多核糖核苷酸或多脱氧核糖核苷酸组成,其可为未修饰的RNA或DNA或修饰的RNA或DNA。例如,多核苷酸可由单链和双链DNA,作为单链和双链区的混合物的DNA,单链和双链RNA以及作为单链和双链区的混合物的RNA,包含DNA和RNA的杂交分子(其可为单链的,或更通常是双链的或单链和双链区的混合物)组成。另外,多核苷酸可由包含RNA或DNA或RNA和DNA两者的三链区组成。多核苷酸可含有核糖核苷(腺苷、鸟苷、尿苷或胞苷;“RNA分子”)或脱氧核糖核苷(脱氧腺苷、脱氧鸟苷、脱氧胸苷或脱氧胞苷;“DNA分子”),或其任何磷酸酯类似物,如硫代磷酸酯和硫酯。多核苷酸还可含有一个或多个修饰的碱基或为稳定性或其他原因而修饰的DNA或RNA骨架。“修饰的”碱基包括,例如,三苯甲基化的碱基和不常见的碱基(如肌苷)。可对DNA和RNA进行各种修饰;因此,“多核苷酸”包含化学、酶促或代谢修饰的形式。术语核酸分子仅指分子的一级和二级结构,并不限于任何特定的三级形式。因此,该术语包括(尤其)在线性或环状DNA分子(例如限制性片段)、质粒和染色体中发现的双链DNA。在讨论特定双链DNA分子的结构时,本文可根据仅沿着DNA的非转录链的5'至3'方向给出序列的常规惯例来描述序列(即具有与mRNA同源的序列的链)。
术语“分离的”核酸分子是指已从其天然环境中除去的核酸分子、DNA或RNA。分离的核酸分子的进一步实例包括核酸分子,其包含维持在异源宿主细胞中的重组多核苷酸或溶液中纯化的(部分或基本上)多核苷酸。分离的RNA分子包括本发明的多核苷酸的体内或体外RNA转录物。根据本发明的分离的核酸分子进一步包括合成产生的这种分子。另外,核酸分子或多核苷酸可包括调控元件,例如启动子、核糖体结合位点或转录终止子。
“基因”是指编码多肽的核苷酸集合,且包括cDNA和基因组DNA核酸。“基因”还指表达特定蛋白质的核酸片段,其包括各个编码区段(外显子)之间的间插序列(内含子)以及编码序列之前(5'非编码序列)和之后(3'非编码序列)的调控序列。“天然基因”是指在自然界中发现的具有其自身调控序列的基因。
在一些实施方案中,核酸分子包含与本文报道的多核苷酸序列至少约80%、85%或90%相同的多核苷酸序列,或与本文报道的多核苷酸序列至少约95%、96%、97%、98%、99%或100%相同的多核苷酸序列。如本领域已知的,术语“百分比同一性”是两个或更多个氨基酸序列或两个或更多个多核苷酸序列之间的关系,如通过比较序列所确定的。在本领域中,“同一性”还表示氨基酸或多核苷酸序列之间的序列相关程度,视情况而定,如通过这些序列的字串之间的匹配所确定的。
依据具有至少(例如)与本发明的参考多核苷酸序列95%“相同”的多核苷酸序列的核酸分子,除了多核苷酸序列可包含参考多核苷酸序列的每100个核苷酸多达五个核苷酸差异外,其意图是核酸分子的多核苷酸序列与参考序列相同。换言之,为了获得具有与参考多核苷酸序列至少95%相同的多核苷酸序列的核酸分子,参考序列中多达5%的核苷酸可被缺失或由另一核苷酸或多个核苷酸取代。参考序列中高达5%的总核苷酸可插入参考序列中。
实际上,可使用已知的计算机程序常规地确定任何特定的多核苷酸序列或氨基酸序列是否与本发明的多核苷酸序列或氨基酸序列至少80%、85%、90%、95%、96%、97%、98%或99%的相同。可使用序列的比对和计算同一性得分来确定用于确定查询序列(本发明的序列)与主题序列之间的最佳总体匹配的方法。使用具有参考算法和Geneious参考汇编程序的图谱的计算机程序Geneious(www.geneious.com)完成比对。
根据本发明的引导多核苷酸至少包含能够与靶多核苷酸杂交且能够指导CRISPR-Cas系统序列特异性地结合至靶多核苷酸以形成CRISPR-Cas复合物的引导序列。为了能够形成活性CRISPR-Cas复合物,引导多核苷酸还优选地包含具有特定二级结构的序列且允许Cas蛋白结合至引导多核苷酸。这些序列在本领域中已知为tracr RNA、tracr序列、tracr支架或引导多核苷酸结构组分,这些术语在本文中可互换地施用;其中所述tracr是反式激活CRISPR的缩写;因此,tracr RNA意指反式激活CRISPR RNA。原始CRISPR-Cas系统中的tracrRNA是将crRNA(引导序列)与Cas核酸酶(其能够结合任何crRNA)连接的内源细菌RNA。引导多核苷酸结构组分可由单个多核苷酸分子组成或由两个或更多个彼此杂交的分子;或与Cas蛋白或相似功能的其他核酸酶相关联的两个或更多个分子组成。引导多核苷酸的这些组分可指tracr序列和tracr配对序列。
因此,引导多核苷酸还优选地包含tracr序列和/或tracr配对序列。引导多核苷酸是根据上文列出的多核苷酸的常规定义的多核苷酸;优选的引导多核苷酸包含核糖多核苷酸,更优选的引导多核苷酸是RNA(引导RNA)。引导多核苷酸结构的两个实例在图1中描述。
在本发明的上下文中,如果主题序列能够与靶序列或靶核酸序列杂交(优选在生理条件下如在宿主细胞中杂交),则序列称之为基本上为靶序列或靶核酸序列的反向互补物。当使用合适的比对算法最佳比对时,引导序列和其相应的靶序列之间的互补性程度优选高于50%、60%、75%、80%、85%、90%、95%、97.5%、99%序列同一性。当靶多核苷酸是双链多核苷酸时,主题序列(如引导序列)可能够与靶多核苷酸的任一链(例如编码链或非编码链)杂交。
任选地,根据本发明的引导序列靶向靶物中唯一的靶序列。优选地,根据本发明的引导序列与紧邻PAM序列的靶多核苷酸中的8、9、10、11、12、13、14、15、16、17、18、19或20个(更优选8、9、10、11或12个)核苷酸具有100%序列同一性。
根据本发明的引导序列优选为8-30个核苷酸长度,更优选10-30个,更优选15-30个,更优选17-27个,更优选17-20个,更优选17、18、19、20、21、22、23、24、25、26或27个。引导序列指导CRISPR-Cas序列特异性结合至靶核酸以形成CRISPR-Cas复合物的能力可由任何适合的测定法评估。例如,可将足以形成CRISPR-Cas复合物的CRISPR系统的组分(包括待测的引导序列)提供至具有相应靶序列的宿主细胞中,如通过用编码CRISPR-Cas系统的组分的载体转染,随后评估优先剪切和/或由靶序列内的细胞修复机制诱导的所得突变(如通过标准序列分析测定)。还可通过提供靶多核苷酸、CRISPR-Cas系统组分(包括待测的引导序列和不同于检测引导序列的对照引导序列),并且比较测试和对照引导序列反应之间的靶序列处的结合和剪切速率而在试管中评价靶多核酸序列的剪切。其他测定是可能的,并且是本领域技术人员已知的。
据信引导多核苷酸结构组分对于形成活性CRISPR-Cas复合物是必需的。不认为所述引导多核苷酸结构组分对于可操作连接至引导序列是必需的;然而,引导多核苷酸结构组分可操作地连接至引导多核苷酸内的引导序列中。根据本发明的引导多核苷酸结构组分(其可包含全部或部分野生型引导多核苷酸结构组分或由其组成(如野生型tracr序列的约或多于约20,26,32,45,48,54,63,67,85或更多个核苷酸))形成部分CRISPR-Cas复合物;如通过使根据本发明的trace序列的至少一部分与根据本发明的tracr配对序列的全部或一部分杂交,且优选可操作地连接至根据本发明的引导序列。根据本发明的tracr序列具有与根据本发明的tracr配对序列的足够的互补性以杂交(优选在生理条件下,如在宿主细胞中)并促进形成CRISPR-Cas复合物。与根据本发明的靶序列一样,认为不需要完全互补,只要有足够的互补性以起作用。优选地,当最佳比对时,根据本发明的tracr序列沿着根据本发明的trace配对序列的长度具有至少50%、60%、70%、80%、90%、95%或99%序列同一性。如上所讨论的,可使用任何适合的算法以对齐序列来确定最佳比对。
通常,根据本发明的tracr配对序列包括与根据本发明的tracr序列具有足够互补性的任何序列,以促进在靶序列上形成CRISPR-Cas复合物,其中CRISPR-Cas复合物包含与根据本发明的tracr序列杂交的根据本发明的tracr配对序列。根据本发明的tracr序列和根据本发明的tracr配对序列的互补程度优选地相对于tracr配对序列和tracr序列沿着两个序列中较短的序列的长度的最佳比对来定义。如上所讨论的,可使用任何比对序列的合适的算法来确定最佳比对。
优选地,对于根据本发明的tracr配对序列和根据本发明的tracr序列,考虑二级结构,如tracr序列或tracr配对序列内的自身互补性。优选地,在最佳比对时,根据本发明的tracr序列与根据本发明的tracr配对序列之间沿着两个序列中较短的序列的长度的互补程度高于50%、60%、75%、80%、85%、90%、95%、97.5%、99%序列同一性。优选地,根据本发明的tracr配对序列长度为5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、40、50或更多个核苷酸。优选地,根据本发明的tracr序列长度为5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、40、50或更多个核苷酸。优选地,根据本发明的tracr序列和tracr配对序列,即根据本发明的引导多核苷酸结构组分包含在单个转录物内,使得两者之间的杂交产生包含二级结构的杂交复合物,例如发夹。当tracr序列和tracr配对序列不包含在单个转录物中时,也可形成这种杂交复合物。根据本发明的tracr序列中的优选的形成环的序列和/或根据本发明的tracr配对序列和/或根据本发明的用于形成发夹结构的引导多核苷酸结构组分的长度为4个核苷酸,并且最优选具有序列GAAA;可使用更长或更短的环序列,也可使用替代序列。环序列优选包括核苷酸三联体(例如AAA)和另外的核苷酸(例如C或G)。环成形序列的实例包括CAAA和AAAG。优选地,根据本发明的tracr序列和/或根据本发明的tracr配对序列或其杂交复合物和/或根据本发明的引导多核苷酸结构组分包含或能够形成至少两个或更多个发夹。更优选地,根据本发明的tracr序列和/或根据本发明的tracr配对序列或其杂交复合物和/或根据本发明的引导多核苷酸结构组分包含或能够形成两个、三个、四个或五个发夹。优选地,根据本发明的tracr序列和/或根据本发明的tracr配对序列或其杂交复合物和/或根据本发明的指导多核苷酸结构成分包含或能够形成至多五个发夹。优选地,根据本发明的tracr序列的单个转录物和根据本发明的tracr-mate序列或根据本发明的tracr序列的杂交复合物和根据本发明的tracr配对序列和/或根据本发明的引导多核苷酸结构组分进一步包含转录终止序列;优选地,这是polyT序列,例如6个T核苷酸。如上所述,引导多核苷酸结构组分是本领域技术人员已知的;背景信息可在(例如)Gaj等,2013中发现。
在根据本发明的所有实施方案的上下文中,术语“靶多核苷酸”是指根据本发明的靶序列,其中根据本发明的引导序列被设计成与该序列具有互补性,其中根据本发明的靶序列与根据本发明的引导序列之间的杂交促进形成CRISPR-Cas复合物。如果存在足够的互补性以引起杂交并促进CRISPR-Cas复合物的形成,则不一定需要完全互补。优选地,根据本发明的引导序列靶向靶物中唯一的靶序列。优选地,根据本发明的引导序列与紧邻PAM序列的靶多核苷酸中的8、9、10、11、12、13、14、15、16、17、18、19或20个核苷酸(更优选8、9、10、11或12个)具有100%的序列同一性。根据本发明的靶多核苷酸可包含任何多核苷酸(例如DNA或RNA多核苷酸),并且可为单链或双链的。当靶多核苷酸是双链多核苷酸时,根据本发明的引导序列可能够与靶多核苷酸的任一链杂交,例如编码链或非编码链。
根据本发明的靶多核苷酸可位于细胞的细胞核或细胞质中。根据本发明的靶多核苷酸可以位于宿主细胞的细胞器中,例如位于线粒体或质体中。根据本发明的靶多核苷酸可以包含在基因组中,可包含在染色体中或可为染色体外的,可包含在人工染色体中,可存在于任何染色体实体或染色体外实体中例如常染色体复制实体(例如附加型质粒或载体)。根据本发明的靶多核苷酸对宿主细胞而言可为天然的或外来的。
根据本发明的靶多核苷酸优选与前间区序列邻近基序(PAM)关联,所述PAM是由CRISPR-Cas复合物识别的短多核苷酸。优选地,靶多核苷酸和PAM连接,其中PAM优选紧邻靶多核苷酸的下游(3')。PAM的精确序列序和长度可变化,例如具有相似功能的不同Cas蛋白和核酸酶可需要不同的PAM序列。根据本发明的优选的PAM是长度为2-8个核苷酸的多核苷酸。优选的PAM选自下组:5′-XGG-3′、5′-XGGXG-3′、5′-XXAGAAW-3′、5′-XXXXGATT-3′、5′-XXAGAA-3′、5′-XAAAAC-3′,其中X可为任何核苷酸或其类似物,优选任何核苷酸;而W是A或T。更优选的PAM是5'-XGG-3'。PAM优选与Cas蛋白匹配。最广泛使用的CAS/CRISPR系统源自酿脓链球菌(S.pyogenes),且匹配的PAM序列5'-XGG-3'位于靶序列的紧邻下游(3')。脑膜炎奈瑟氏菌(Neisseria meningitidis)Cas蛋白的优选PAM是5'-XXXXGATT-3';嗜热链球菌(Streptococcus thermophilus)Cas蛋白的优选PAM是5'-XXAGAA-3';齿垢密螺旋体(Treponema denticola)的优选PAM是5'-XAAAAC-3'。优选的PAM与所用的Cas蛋白匹配。可改造根据本发明的Cas蛋白以匹配与匹配野生型Cas蛋白的天然PAM不同的PAM。因此,根据本发明的CRISPR-Cas系统可用于定制的特异性靶向。
术语“杂交”是指其中一种或多种多核苷酸反应形成复合物的反应,所述复合物经由核苷酸残基的碱基之间的氢键合。所述氢键合可通过Watson Crick碱基配对、Hoogstein结合或以任何其他序列特异性方式发生。所述复合物可包含形成双链结构的两条链,形成多链复合物的三条或更多条链,单一自杂交链或这些的任何组合。杂交反应可构成更广泛过程中的步骤,例如通过酶剪切多核苷酸。优选的杂交条件是根据本发明的宿主细胞内的生理条件。
在本发明所有实施方案的上下文中,术语“来源”是指包含引导多核苷酸和Cas蛋白的CRISPR-Cas系统的任何来源。所述引导多核苷酸和Cas蛋白可存在于不同的来源。在这种情况下,根据本发明的组合物包含CRISPR-Cas系统,其包含引导多核苷酸的来源和Cas蛋白的来源。任何来源意指引导多核苷酸和Cas蛋白可以它们可在CRISPR-Cas系统内起作用的形式存在。引导多核苷酸和/或Cas蛋白可以其活性形式提供,并且可(例如)由非活性形式或由另一种实体提供。引导多核苷酸可(例如)存在于另一多核苷酸上或可由多核苷酸编码,所述多核苷酸被转录以提供实际的引导多核苷酸。Cas蛋白可由多核苷酸(例如DNA或mRNA)编码,所述多核苷酸被转录和/或翻译以提供实际的Cas蛋白。编码的多核苷酸可存在于如本文定义的核酸构建体中和/或如本文定义的载体中。此类核酸构建体和载体在本文中称为根据本发明的核酸构建体和根据本发明的载体。
优选地,在根据本发明的组合物中,相关功能的Cas蛋白或核酸酶由多核苷酸编码和/或所述引导多核苷酸由多核苷酸编码或存在于多核苷酸上。
优选地,在根据本发明的组合物中,相关功能的Cas蛋白或核酸酶由多核苷酸编码和/或所述引导多核苷酸由另一多核苷酸编码或存在于另一多核苷酸上,且所述多核苷酸包含在载体中。
优选地,在根据本发明的组合物中,所述引导多核苷酸由多核苷酸编码,所述多核苷酸被转录以提供实际的引导多核苷酸。因此,在一个实施方案中,在根据本发明的组合物中,优选地,所述引导多核苷酸以编码所述引导多核苷酸的多核苷酸的形式存在,并且引导多核苷酸是在宿主细胞中转录所述多核苷酸时获得的。
优选地,在根据本发明的组合物中,所述Cas蛋白由多核苷酸编码,并且所述引导多核苷酸由另一多核苷酸编码或存在于另一多核苷酸上,并且所述多核苷酸包含在一个载体中。
优选地,在根据本发明的组合物中,所述Cas蛋白由包含在载体中的多核苷酸编码,并且引导多核苷酸由包含在另一载体中的另一多核苷酸编码或存在于包含在另一载体中的另一多核苷酸上。优选地,编码Cas蛋白的载体是低拷贝载体和/或驱动Cas转录物表达的启动子是低强度启动子,且编码引导多核苷酸的载体是高拷贝载体和/或驱动gRNA转录物表达的启动子是高强度启动子。这允许Cas蛋白和引导多核苷酸的差异表达;Cas蛋白可(例如)以低于引导多核苷酸的水平表达。可通过任何方法估计启动子强度,例如通过RNA测序。RNA测序(RNAseq)是一种高灵敏度和精准的用于测量不同条件下的转录组的表达的工具。它允许在转录水平上定量基因表达的近似值,其被报道为RPKM值(每百万映射读段的转录物的每千碱基读段)。来自裂殖壶菌属(Schizochytrium)的代表性基因的RPKM值和相对启动子强度在表1中提供。
表1
低强度(即弱)裂殖壶菌属启动子的实例包括但不限于那些驱动类胡萝卜素合酶表达的启动子。中等强度(即中等)裂殖壶菌属启动子的实例包括但不限于那些驱动α微管蛋白表达的启动子。高强度(即强)裂殖壶菌属启动子的实例包括但不限于那些驱动延长因子-1(EF-1)表达的启动子。尽管认为RPKM值通常指示相对启动子强度,但本领域技术人员已知在其天然基因组环境中的启动子在表达载体的上下文中可不具有完全相同的强度。因此,本领域技术人员会理解,表1中提供的相对启动子强度可在本发明的上下文中变化。
因此,本发明提供同样供给引导多核苷酸和Cas蛋白的可能性,或它们在载体上编码或存在于载体上的可能性。在后者,编码的多核苷酸可各自在分开的载体上或可同时在单个载体上。因此,在实施方案中,本发明提供根据本发明的组合物,其中编码根据本发明的Cas蛋白的多核苷酸、引导多核苷酸或编码根据本发明的引导多核苷酸的多核苷酸存在于单个载体上,所述载体可进一步包含表达编码产物所必需的任何元件,例如启动子和终止子元件。这种单个(一体化)载体具有CRISPR-Cas系统所必需的所有组分一起存在的优势,此外,单个转化事件(任选与供体多核苷酸组合)足以将所有组分导入宿主细胞中。
载体
在本发明的所有实施方案的上下文中,载体可为任何载体(如质粒或病毒),其可便利地进行重组DNA过程且可介导根据本发明的多核苷酸的表达。载体的选择将通常取决于载体与宿主细胞的相容性,其中所述载体导入该细胞中。优选的载体是用于本文实施例中的载体。载体可为线性多核苷酸或线性或闭环的质粒。载体可为整合的或自主复制的载体(即以染色体或染色体外实体存在的载体,其复制取决于或独立于染色体复制,如质粒、染色体外元件、微型染色体或人工染色体)。
优选地,载体可为当引入宿主细胞时整合到基因组中并与其整合的染色体一起复制的载体。整合载体可随机地或在宿主细胞的染色体中的预定靶基因座处整合。优选的整合载体包含DNA片段,其与宿主细胞基因组中预定靶基因座中的DNA序列同源,用于靶向载体整合至该预定基因座。为了促进靶向整合,优选在转化细胞之前将载体线性化。优选进行线性化,使得载体的至少一个但优选任一末端侧翼有靶基因座同源的序列。靶基因座侧翼的同源序列的长度优选为至少30bp、优选至少50bp、优选至少0.1kb、甚至优选至少0.2kb、更优选至少0.5kb、甚至更优选至少1kb、最优选至少2kb。优选地,通过增强的宿主细胞的同源重组能力,增加靶向整合到宿主细胞基因组中的效率,即在预定靶基因座中的整合。
载体中的同源侧翼DNA序列(其与靶基因座同源)可源自表达的基因座,意味着它们源自基因,其能够在宿主细胞中表达。侧翼DNA序列可与选择标记基因连接,从而当向培养基补充合适的选择试剂时,转化的细胞会生长。侧翼DNA序列可通过本领域技术人员已知的任何方法设计;一种优选的设计将同源重组引导至编码饱和和/或多不饱和脂肪酸合酶(PUFA合酶)的基因,使得这些合酶的突变或破坏产生针对饱和和/或多不饱和脂肪酸的营养缺陷型。对饱和和/或不饱和脂肪酸营养缺陷的细胞需要饱和和/或多不饱和脂肪作为生长补充剂。另一种优选的设计能够表达显性选择标记基因,使得所述选择标记基因的转化子能够在适当的显性选择试剂存在下生长。
可将根据本发明的一个以上拷贝的多核苷酸插入微生物宿主细胞中以介导由所述多核苷酸编码的产物的产生。这可优选地通过将多个拷贝的多核苷酸整合到宿主细胞的基因组中,或通过在可操作的构型中靶向多核苷酸在高度表达的基因座处的整合来完成。或者,通过将可扩增的选择标记基因与根据本发明的多核苷酸包括在一起,可实现多拷贝的整合,从而可通过在适当的选择试剂存在下培养该细胞来选择含有扩增拷贝的选择标记基因(以及由此含有附加拷贝的核酸序列)的细胞。为了进一步增加根据本发明的多核苷酸拷贝数,可使用WO98/46772中所述的基因转换技术。
当编码根据本发明的的Cas蛋白的根据本发明的多核苷酸和/或根据本发明的引导多核苷酸整合至宿主细胞的基因组中,可为合意的是从基因组切除多核苷酸,如当所需的基因组编辑已经发生时。多核苷酸的切除可通过本领域技术人员已知的任何方法进行;一个优选的方法是通过用修复基因突变或破坏的核苷酸的二级转化,所述基因突变或破坏诱导营养缺陷型,使得已经治愈营养缺陷型的细胞反而可通过在其中营养缺陷型所需的营养已经被省略的培养基中生长来选择。另一种切除方法是使用根据本发明的CRISPR-Cas系统。
根据本发明的载体可为单个载体或质粒或包含两个或更多个载体或质粒的载体系统,其一起含有待导入宿主细胞中的根据本发明的多核苷酸。
根据本发明的载体可含有一个或多个选择标记,其允许简单选择转化的细胞。在实施方案中,在根据本发明的组合物中,一个或多个或所有载体包含选择标记,优选各载体包含不同选择标记。选择标记是基因,其产物提供杀生物剂或病毒抗性,对重金属的抗性,针对营养缺陷型的原养性等。可将选择标记作为表达盒引入细胞中的载体上或可引入单独的载体上。
用于网粘菌纲(Labyrinthulomycete)细胞中的选择标记可选自下组,其包括但不限于nptII(新霉素磷酸转移酶II,赋予巴龙霉素抗性)、ALS(乙酰乳酸合酶,赋予甲嘧磺隆(sulfometuronmethyl)抗性)、bsd(杀稻瘟菌素-S-脱氨酶,赋予杀稻瘟菌素抗性)和Sh ble(结合腐草霉素,赋予博来霉素(zeocin)抗性)。
或者,可使用特异性选择标记,如营养缺陷型标记,其需要携带如前所述的菌株的饱和或多不饱和脂肪酸合酶基因的失活突变的相应突变的宿主细胞。在优选的实施方案中,在引入表达构建体后,从转化的宿主细胞中缺失选择标记,以获得能够产生无选择标记基因的多核苷酸的转化的宿主细胞。
用于连接上述元件以构建根据本发明的载体的方法是本领域技术人员熟知的(参见,例如Sambrook和Russell,Molecular Cloning:A Laboratory Manual,第3版,CSHLPress,Cold Spring Harbor,NY,2001;和Ausubel等,Current Protocols in MolecularBiology,Wiley InterScience,NY,1995)。
在本发明所有实施方案的上下文中,Cas蛋白是指适用于本发明目的的任何Cas蛋白。Cas蛋白可包含酶活性或者可不包含酶活性。Cas蛋白的非限制性实例包括Cas1、Cas1B、Cas2、Cas3、Cas4、Cas5、Cas6、Cas7、Cas8、Cas9(也称为Csn1和Csx12)、Cas10、Csy1、Csy2、Csy3、Cse1、Cse2、Csc1、Csc2、Csa5、Csn2、Csm2、Csm3、Csm4、Csm5、Csm6、Cmr1、Cmr3、Cmr4、Cmr5、Cmr6、Csb1、Csb2、Csb3、Csx17、Csx14、Csx10、Csx16、CsaX、Csx3、Csx1、Csx1S、Csf1、Csf2、Csf3、Csf4、其同源物或其修饰形式。这些Cas蛋白质是本领域技术人员已知的;例如,酿脓链球菌(S.pyogenes)Cas9蛋白的氨基酸序列可在SwissProt数据库中以登录号Q99ZW2找到。优选地,根据本发明的未修饰的Cas蛋白具有DNA切割活性,例如Cas9。优选地,相应的Cas蛋白质是Cas9,并且可为来自酿脓链球菌或肺炎链球菌(S.pneumoniae)的Cas9。优选地,根据本发明的Cas蛋白指导靶多核苷酸位点处的一条或两条多核苷酸链的剪切,如在靶多核苷酸内和/或靶多核苷酸的反向互补物内。靶多核苷酸的位点处在本文中定义为在距靶多核苷酸的第一个或最后一个核苷酸约1、2、3、4、5、6、7、8、9、10、15、20、25、50、100、200、500或更多个核苷酸内;更优选地,在距靶多核苷酸的第一个或最后一个核苷酸1、2、3、4、5、6、7、8、9、10、15、20、25、50、100、200、500或更多个核苷酸内;甚至更优选地,在距靶多核苷酸的第一个或最后一个核苷酸1、2、3、4、5、6、7、8、9、10、15、20、25、50个核苷酸内。因此,根据本发明的Cas蛋白质优选地指导在距靶多核苷酸的第一个或最后一个核苷酸约1、2、3、4、5、6、7、8、9、10、15、20、25、50、100、200、500个核苷酸内的一条或两条多核苷酸链的剪切;更优选地,在距靶多核苷酸的第一个或最后一个核苷酸1、2、3、4、5、6、7、8、9、10、15、20、25、50、100、200、500或更多个核苷酸内的一条或两条多核苷酸链的剪切;甚至更优选地,在距靶多核苷酸的第一个或最后一个核苷酸1、2、3、4、5、6、7、8、9、10、15、20、25、50个核苷酸内的一条或两条多核苷酸链的剪切。通常,根据本发明的靶多核苷酸与PAM序列相关联(在本文别处定义)且PAM序列优选紧邻靶序列的下游(3');通常,CRISPR-Cas复合物的形成通常导致PAM序列上游(5')3个碱基对的一条或两条多核苷酸链的切割。
优选地,根据本发明的组合物中的Cas蛋白质具有指导剪切靶多核苷酸的位点处的两个多核苷酸链的活性。通常,Cas核酸酶活性通过两个单独的催化域进行,即RuvC和HNH。每个域切割一条多核苷酸链,每个域可通过单个点突变失活。
因此,可相对于相应的野生型Cas蛋白方便地突变根据本发明的Cas蛋白,使得突变的Cas蛋白具有改变的核酸酶活性且缺乏剪切靶多核苷酸的一条或两条链的能力。例如,来自酿脓链球菌的Cas9的RuvC I催化域中的天冬氨酸至丙氨酸取代(D10A)将Cas9从将剪切两条链的核酸酶转换为切口酶,该切口酶在本文中定义为切割靶多核苷酸的单个链的Cas蛋白。使Cas9成为切口酶的突变的其他实例包括但不限于H840A、N854A和N863A。在本发明的上下文中,具有切口酶活性的Cas蛋白可通过同源重组用于基因组编辑,优选根据Ran等,2013的双切口技术。因此,根据本发明优选的Cas蛋白包含至少一个突变,使得该蛋白相较于相应的野生型Cas蛋白,具有已经改变的核酸酶活性,优选具有在靶序列的位点处直接剪切单个多核苷酸链的活性。这种所谓的切口酶突变体可方便地用于双链体装配,即在根据本发明的组合物中,其包含具有RuvC突变的Cas蛋白切口酶突变体和其中NHN突变的Cas蛋白切口酶突变体,使得一个Cas蛋白质突变体使多核苷酸靶物的一条链断口,且另一个Cas蛋白质突变体使多核苷酸靶物的另一条链断口。取决于所用的两种引导多核苷酸,两种不同的CRISPR-Cas复合物将有效地在多核苷酸靶物中产生两个单链切口;这些切口可为几个核苷酸,相隔多至5、10、20、30或更多。这种双切口方法极大地增强了非同源末端连接(NEJH)的特异性。关于双切口的背景知识可在例如Ran等,2013中发现。
根据本发明的Cas蛋白可包含两个或更多个Cas9的突变的催化域(例如RuvC I、RuvC II和/或RuvC III),以导致基本上缺乏所有DNA切割活性的突变的Cas9。在一些实施方案中,D10A突变与H840A、N854A或N863A突变中的一个或多个组合,以产生基本上缺乏所有DNA切割活性的Cas9酶。优选地,相对于其非突变形式,当突变酶的DNA剪切活性小于约25%、10%、5%、1%、0.1%、0.01%或更低时,认为Cas蛋白基本上缺乏所有DNA剪切活性。基本上缺乏所有酶活性的Cas蛋白可方便地用于基因沉默或表达的下调,因为CRISPR-Cas复合物将阻碍靶多核苷酸的转录。其他突变可能是有用的;其中Cas9或其他Cas蛋白来自除酿脓链球菌外的物种,可进行相应的氨基酸中的突变以实现类似的效果;本领域技术人员知道如何鉴定这些相应的氨基酸。
根据本发明的Cas蛋白可为融合蛋白并且包含至少一个异源功能域,这种域优选是包含FokI活性的域,如由Aggarwal等(Aggarwal,A.K.;Wah,D.A.;Hirsch,J.A.;Dorner,L.F.;Schildkraut,I.(1997)“Structure of the multimodular endonuclease FokIbound to DNA”.Nature 388(6637):97-100)所述。FokI酶天然存在于海床黄杆菌(Flavobacterium okeanokoites)中且是一种细菌IIS型限制性内切核酸酶,其由N-末端DNA结合域和C末端处的非特异性DNA切割域组成(Durai等,2005)。当FokI蛋白通过其在5'-GGATG-3':3'-CATCC-5'识别位点处的DNA结合域与双链DNA结合时,DNA剪切域被激活并剪切(而无进一步的序列特异性)识别位点的最近核苷酸的第一条链下游9个核苷酸和第二条链上游13个核苷酸(Wah等,1998)。Cas9-FokI融合已经在(尤其是)Guilinger等,2014中;和在Tsai等,2014中进行了描述。
除Cas蛋白外,根据本发明的Cas融合蛋白可包含1、2、3、4、5、6、7、8、9、10或更多个域。可与Cas蛋白融合的蛋白域的实例包括但不限于表位标签、报告基因序列和具有以下一种或多种活性的蛋白结构域:甲基化酶活性、去甲基化酶活性、转录激活活性、转录抑制活性、转录释放因子活性、组蛋白修饰活性、RNA切割活性和核酸结合活性。表位标签的非限制性实例包括组氨酸(His)标签、V5标签、FLAG标签、流感血凝素(HA)标签、Myc标签、VSV-G标签和硫氧还蛋白(Trx)标签。报告基因的实例包括但不限于谷胱甘肽-S-转移酶(GST)、辣根过氧化物酶(HRP)、氯霉素乙酰转移酶(CAT)、β-半乳糖苷酶、β-葡糖醛酸酶、荧光素酶、绿色荧光蛋白(GFP)、HcRed、DsRed、青色荧光蛋白(CFP)、黄色荧光蛋白(YFP)和自发荧光蛋白(包括蓝色荧光蛋白(BFP))。Cas蛋白可融合至编码蛋白或结合DNA分子或结合其他细胞分子的蛋白的片段(包括但不限于麦芽糖结合蛋白(MBP)、S标签、Lex A DNA结合域(DBD)融合物,GAL4DNA结合域融合物和单纯疱疹病毒(HSV)BP16蛋白融合物)的基因序列。可形成包含CRISPR酶的融合蛋白的一部分的其他域描述于US20110059502中。标记的Cas蛋白可用于鉴定靶多核苷酸的位点。根据本发明优选的Cas融合蛋白包含如上文所定义的FokI域。
根据本发明优选的Cas蛋白包含核定位序列,优选异源核定位序列。这种核定位序列也称为核定位信号。优选地,这种核定位信号赋予CRISPR-Cas复合物足够的强度以在宿主细胞的细胞核中以可检测的量驱动所述CRISPR-Cas复合物的积累。不希望受理论束缚,认为在宿主细胞中核定位序列对于CRISPR-Cas活性不是必需的,但包括此类序列的核定位序列增强了所述系统的活性,尤其是将核酸分子靶向细胞核中的活性。这种核定位序列优选存在于Cas蛋白中,但也可存在于其他任何地方使得促进CRISPR-Cas系统靶向细胞核。优选的核定位序列是SV40核定位序列。
在根据本发明的组合物和任何其他实施方案中,Cas蛋白编码多核苷酸优选地是其待在宿主细胞中表达的密码子优化的,更优选地,Cas蛋白编码多核苷酸是密码子对优化的。通常,密码子优化是指通过用保持天然氨基酸序列的宿主细胞基因中更频繁或最常用的密码子替换天然序列的至少一个密码子(例如超过1、2、3、4、5、10、15、20、25、50或更多个密码子)来修饰核酸序列以增强目的宿主细胞中的表达的方法。各种物种对特定氨基酸的某些密码子表现出特别的偏好。密码子偏好(生物体之间密码子使用的差异)通常与信使RNA(mRNA)的翻译效率相关,而认为信使RNA(mRNA)的翻译效率取决于(除了其它方面)被翻译的密码子的特性和特定转运RNA(tRNA)分子的可用性。所选择的tRNA在细胞中的优势通常是肽合成中最常使用的密码子的反映。因此,可基于密码子优化来定制在给定生物中最佳基因表达的基因。密码子使用表是容易获得的,例如在“密码子使用数据库”中,并且这些表可以多种方式进行调整。参见,例如Nakamura,Y.,等,2000。还可得到用于密码子优化特定序列以在特定宿主细胞中表达的计算机算法,如Gene Forge(Aptagen;Jacobus,PA)。优选地,编码Cas蛋白的序列中的一个或多个密码子(例如1、2、3、4、5、10、15、20、25、50或更多个或所有密码子)对应于特定的氨基酸的最常用的密码子。用于密码子优化的优选方法描述于WO2006/077258和WO2008/000632中。WO2008/000632解决了密码子对优化。密码子对优化是一种方法,其中编码多肽的核苷酸序列已经就其密码子使用方面进行修饰,特别是使用的密码子对,以获得编码多肽的核苷酸序列的改善的表达和/或改进的产生编码的多肽。密码子对被定义为编码序列中的两个后续三联体(密码子)的集合。根据本发明的组合物中的来源中Cas蛋白的量可变化,并且可针对最佳性能进行优化。在宿主细胞中避免过高水平的Cas蛋白可能是方便的,因为高水平的Cas蛋白可能对宿主细胞有毒,即使没有引导多核苷酸存在(参见,例如Ryan等,2014和Jacobs等,2014)。本领域技术人员知道如何调控表达水平,如通过选择较弱的启动子、阻抑性启动子或诱导型启动子来表达Cas蛋白。适用于表达蛋白的启动子的实例在本文别处描述。
在根据本发明的组合物中,其中根据本发明的引导多核苷酸由多核苷酸编码,可通过与编码多核苷酸可操作地连接的启动子促进引导多核苷酸的表达。这种启动子可为本领域技术人员已知的任何合适的启动子。可使用几种类型的启动子。使用RNA聚合酶III启动子或RNA聚合酶II启动子可为方便的。可在Marck等,2006中找到关于RNA聚合酶III及其启动子的背景知识。因此,使用RNA聚合酶II启动子可为便利的;这些是本领域技术人员已知的,且在(例如)Kornberg,1999中进行了综述。然而,来自RNA II聚合酶的转录物通常具有复杂的转录终止子,转录物是多腺苷酸化的;这可能妨碍引导多核苷酸的要求,因为需要精确定义其5'和3'末端以实现产生功能性CRISPR-Cas系统所需的二级结构。然而,可避免这些缺点。在使用RNA聚合酶II启动子的情况下,编码引导多核苷酸的多核苷酸也可编码自处理核酶,并且可以与RNA聚合酶II启动子可操作地连接;如此,多核苷酸编码包含引导多核苷酸和自处理核酶的前引导多核苷酸,其中,当转录时,引导多核苷酸由来自前引导多核苷酸转录物的自处理核酶释放。包含编码与RNA聚合酶II启动子可操作地连接的根据本发明的前引导多核苷酸的多核苷酸的优选构建体是本文实施例1-4中描述的那些。关于这种构建体的背景知识可在(例如)Gao等,2014中发现。
优选地,在根据本发明的组合物中,所述引导多核苷酸由多核苷酸编码。优选地,在根据本发明的组合物中,其中所述引导多核苷酸由多核苷酸编码,所述多核苷酸与RNA聚合酶II启动子可操作地连接,并编码包含引导多核苷酸和自处理核酶的前引导多核苷酸,其中,当转录时,引导多核苷酸由来自前引导多核苷酸转录物的自处理核酶释放。包含与RNA聚合酶II启动子可操作地连接的编码本发明的前引导多核苷酸的多核苷酸的优选构建体是本文实施例1-4中描述的那些。方便地,多个前引导多核苷酸和多个自处理核酶可由单个多核苷酸编码,所述多核苷酸与一个或多个RNA聚合酶II启动子可操作地连接。
根据本发明第一方面的组合物可方便地用于调节宿主细胞中多核苷酸的表达。因此,在第二方面,本发明提供了调节宿主细胞中多核苷酸表达的方法,其包含使宿主细胞与根据本发明第一方面的组合物接触,其中所述引导多核苷酸指导Cas蛋白在宿主细胞中的靶多核苷酸处的结合以形成CRISPR-Cas复合物。
本发明上下文中的术语“表达”在本文中定义为多核苷酸模板转录多核苷酸的过程(例如将DNA模板多核苷酸转录成mRNA多核苷酸转录物或其他RNA转录物)和/或随后将mRNA转录物翻译成肽、多肽或蛋白质的过程。转录物和编码的多肽可统称为“基因产物”。如果所述多核苷酸转录物源自基因组模板DNA,则表达可包括在宿主细胞中mRNA转录物的剪接。术语“调节表达”在本文中是指与亲本宿主细胞相比增加或减少的表达,所述亲本宿主中当使用相同条件测定时表达未被调节。减少的表达可为转录物(如mRNA)的减少量和/或翻译产物(如多肽)的减少量。由此可见,增加的表达可为转录物的增加量(如mRNA)和/或翻译产物(如多肽)的增加量。
优选地,所述CRISPR-Cas复合物在靶多核苷酸的位点处剪切一条或两条多核苷酸链,其形成基因产物的调节表达。所述CRISPR-Cas复合物也可具有改变的核酸酶活性,并且基本上缺乏剪切靶多核苷酸的一条或两条链的能力;在这种情况下,通过复合物与靶多核苷酸的结合来调节表达。基本上缺乏所有酶活性的Cas蛋白可方便地用于基因沉默或表达的下调,因为所述CRISPR-Cas复合物会阻碍从靶多核苷酸的转录。或者,可将Cas蛋白修饰成转录因子以用于感兴趣的基因的可编程的转录激活或沉默(Larson等,2013)。
根据本发明第一方面的组合物可方便地用于多核苷酸的缺失。在实施方案中,当根据本发明第一方面的组合物包含至少一种或两种引导多核苷酸的来源和/或至少一种Cas蛋白的来源,形成至少一个CRISPR-Cas复合物或两种不同的CRISPR-Cas复合物,其在靶多核苷酸的一个位点或不同位点处剪切一条或两条多核苷酸链,其导致来自靶多核苷酸中多核苷酸片段的缺失。优选地,根据本发明的包含至少一种或两种引导多核苷酸和/或至少一种Cas蛋白的来源的这类组合物额外地包含如下文定义的外源多核苷酸,其与由引导多核苷酸靶向的至少一个或两个靶多核苷酸部分地互补。这种待缺失的多核苷酸片段或缺失的片段可为几个核苷酸长度,多至几千个核苷酸长度,可以缺失整个基因或缺失一簇基因。因此,本发明提供了调节宿主细胞中多核苷酸表达的方法,其中从靶多核苷酸中缺失多核苷酸片段。
在一个实施方案中,调节表达的方法包括在靶多核苷酸的至少一个位点处剪切一条或两条多核苷酸链,然后通过具有外源多核苷酸的同源重组修饰靶多核苷酸。在这种情况下,优选地,根据本发明第一方面的组合物进一步包含这种外源多核苷酸。这种修饰可导致靶多核苷酸中至少一个核苷酸的插入、缺失或取代,其中插入或取代核苷酸可源自外源多核苷酸。当外源多核苷酸是非整合实体时,也可进行修饰,如Dong等和Beetham等所述;在这种情况下,所述靶多核苷酸被修饰,但外源多核苷酸的核苷酸不被引入靶多核苷酸中。因此,当将根据本发明的Cas蛋白质作为蛋白质引入宿主细胞中时,所得宿主是非重组宿主细胞。外源多核苷酸可为任何感兴趣的多核苷酸,如编码如下文定义的感兴趣的化合物的多核苷酸,或这种多核苷酸的一部分或其变体。此类外源多核苷酸在本文中称为根据本发明的外源多核苷酸,且可为单链或双链的。
本领域技术人员可考虑用于根据本发明的组合物和方法的各种应用。可使用根据本发明的组合物和方法修饰、编辑或断裂基因组中的多核苷酸(或基因)。例如,当使用完全活性的Cas蛋白剪切靶多核苷酸的两条链时,且当没有外源多核苷酸作为合适的修复模板存在时,通过非同源末端连接修复(NHEJ)修复双链断裂。在NHEJ期间,可能发生一个或几个核苷酸的插入和/或缺失(可能在某些情况下其被解释为取代),这些在修复位点处随机插入或缺失;这是NHEJ的特点。这种插入和/或缺失可能影响编码序列的阅读框,其导致基因产物中的氨基酸变化或甚至在(过早)终止密码子的发生或剪接位点的改变的情况下截短的蛋白质。
当外源多核苷酸作为修复模板存在时,可使用同源末端连接修复(HEJ,也称为同源定向修复(HDR)),使用根据本发明的组合物和方法修饰、编辑或断裂基因组中的多核苷酸(或基因)。例如,当具有与靶多核苷酸序列同一性的外源多核苷酸(即断裂的双链上游(5')和下游(3'))与根据本发明的CRISPR-Cas系统一起存在时,HDR会在靶多核苷酸中的双链断裂处引入(或者实际上是复制)外源多核苷酸的相应核苷酸。优选地,根据本发明的外源多核苷酸不含其后是功能性PAM序列的靶序列本身,以避免外源多核苷酸本身或修饰的靶多核苷酸被CRISPR-Cas系统(再)切割的风险。
在本发明的实施方案中,当根据本发明的CRISPR-Cas系统包含外源多核苷酸(供体多核苷酸、供体DNA、修复模板)时,根据本发明的CRISPR-Cas系统优选地包含由一个或多个单独的多核苷酸或载体编码或存在于一个或多个单独的多核苷酸或载体上的两个或更多个引导多核苷酸,且两个或更多个外源多核苷酸与所述CRISPR-Cas系统一起提供,其使得能够形成两个或更多个CRISPR-Cas复合物。在根据本发明的方法中,根据本发明的这种CRISPR-Cas系统可方便地用于调节两个或多个靶多核苷酸处的表达,即靶向多个靶位点的方法。根据本发明的这种CRISPR-Cas系统会偶然地在一个或多个靶多核苷酸处形成一个、两个或更多个CRISPR-Cas复合物。此类方法可用于在宿主细胞的基因组中产生一个或多个插入、缺失、取代(任选地与一个或多个外源多核苷酸组合),或通过形成的CRISPR-Cas复合物调节基因的表达。
宿主细胞
在根据本发明此方面的方法中,优选的宿主细胞包含编码如本文其他地方所定义的感兴趣的化合物的多核苷酸。
在根据本发明此方面的方法中,所述宿主细胞可为重组宿主细胞或者可为非重组宿主细胞。
在一些实施方案中,所述宿主细胞是网粘菌纲(Labyrinthulomycete),优选是破囊壶菌目的成员,优选是破囊壶菌科的成员,更优选是选自下组的菌属的成员:Aurantiochytrium、Oblongichytrium、裂殖壶菌属(Schizochytrium)、破囊壶菌属(Thraustochytrium)和吾肯氏壶菌属(Ulkenia),甚至更优选裂殖壶菌属菌种ATCC#20888。
根据本发明的此方面的调控宿主细胞中多核苷酸表达的方法得到修饰的宿主细胞,其优选包含根据本发明的第一方面的组合物的组分。因此,在第三方面,本发明提供了包含根据本发明第一方面的组合物的宿主细胞。此类宿主细胞可为如本文所定义的任何宿主细胞,并且可进一步包含编码本文其他地方所定义的感兴趣的化合物的多核苷酸。
在第四方面,本发明提供了一种产生宿主细胞的方法,其包括使宿主细胞与根据本发明第一方面的组合物接触,其中所述引导多核苷酸指导Cas蛋白在宿主细胞中的靶多核苷酸处的结合以形成CRISPR-Cas复合物。在一个实施方案中,与根据本发明第一方面的组合物的接触可以分两步进行,其中首先使所述宿主细胞与根据本发明的Cas蛋白来源接触,然后使所述宿主细胞与根据本发明的引导多核苷酸来源和任选的根据本发明的外源多核苷酸接触。本发明该实施方案中的宿主细胞可为如本文所定义的任何类型的宿主细胞,并且可包含编码如本文其他地方所定义的感兴趣的化合物的多核苷酸。产生根据本发明的宿主细胞的优选方法包含产生后代宿主细胞的步骤,其中在所述后代宿主细胞中,不再存在根据本发明的CRISPR-Cas系统的组分。
根据本发明第一方面的组合物可为本文定义的任何此类组合物。使宿主细胞与根据本发明的组合物接触可通过本领域技术人员已知的任何方法进行。可简单地将根据本发明的宿主细胞置于包含根据本发明的组合物的溶液中。可使用将根据本发明的组合物递送到宿主细胞中的具体方法。本领域技术人员知道这些方法(参见例如Sambrook和Russell;Ausubel,同上),其包括但不限于电穿孔方法、粒子轰击或微粒轰击、原生质体方法和土壤杆菌介导的转化(AMT)。可使用本领域已知的任何方法转化网粘菌纲。破囊壶菌的遗传转化的一般技术在美国专利号7,001,772和8,637,651中以及由Cheng等(2012)详细描述,其所有通过提述以其整体并入本文。
优选地,所述CRISPR-Cas复合物在靶多核苷酸的位点处剪切一条或两条多核苷酸链,其得到基因产物的调控表达。所述CRISPR-Cas复合物也可能具有改变的核酸酶活性,并且缺乏剪切靶多核苷酸的一条或两条链的能力;在这种情况下,通过所述复合物与靶多核苷酸的结合来调控表达。
在一个实施方案中,当根据本发明第一方面的组合物包含至少一个或两个引导多核苷酸来源和/或至少一个Cas蛋白来源时,形成至少一个CRISPR-Cas复合物或两个不同的CRISPR-Cas复合物,其在靶多核苷酸的一个位点或不同位点处剪切一条或两条多核苷酸链,导致多核苷酸片段从靶多核苷酸中缺失。优选地,根据本发明的这种组合物包含至少一个或两个引导多核苷酸和/或至少一个Cas蛋白的来源,额外地包含如下文所定义的外源多核苷酸,其与由引导多核苷酸靶向的至少一个或两个靶多核苷酸至少部分地互补。待缺失的这种多核苷酸片段或缺失的片段长度可为从几个核苷酸多至几千个核苷酸,可缺失整个基因或缺失一簇基因。因此,本发明提供了调控宿主细胞中多核苷酸表达的方法,其中从靶多核苷酸中缺失多核苷酸片段。
在一个实施方案中,调节宿主细胞中多核苷酸表达的方法(其中从靶多核苷酸中缺失多核苷酸片段)包含使宿主细胞与本文所述的组合物接触,其中所述引导多核苷酸指导Cas蛋白在宿主细胞中靶多核苷酸处结合以形成CRISPR-Cas复合物。优选地,调节宿主细胞中多核苷酸表达的方法(其中从靶多核苷酸中缺失多核苷酸片段)包含使宿主细胞与本文所述的组合物接触,其中所述引导多核苷酸指导Cas蛋白在宿主细胞中的靶多核苷酸处结合以形成CRISPR-Cas复合物。在另一个优选的实施方案中,调节宿主细胞中多核苷酸表达的方法(其中多核苷酸片段从靶多核苷酸中缺失)包含使宿主细胞与本文所述的组合物接触,其中所述引导多核苷酸指导Cas蛋白在宿主细胞中靶多核苷酸处结合以形成CRISPR-Cas复合物,其中如本文所述的组合物不包含外源或供体多核苷酸。在调节宿主细胞中多核苷酸表达的方法的另一个实施方案中,该组合物包含在自主复制载体中。
因此,在一个实施方案中,本发明涉及调节细胞中多核苷酸表达的方法(其中从靶多核苷酸中缺失多核苷酸片段)包括使宿主细胞与本文所述的但优选不包含如本文所定义的供体多核苷酸组合物接触,其中所述引导多核苷酸指导Cas蛋白在宿主细胞中靶多核苷酸处的结合以形成CRISPR-Cas复合物。
在一个优选的实施方案中,所述Cas蛋白具有指导靶序列的位点处的两条多核苷酸链的剪切活性,且其中所述剪切发生在包含在两个同源区之间的基因组区域中,所述两个同源区由Cas蛋白剪切后彼此重组以得到包含在所述区域之间的多核苷酸的缺失。优选地,所述两个同源区之间的同源性程度是允许同源重组的。优选地,所述两个同源区在同源区的整个长度上具有至少60%、70%、80%、90%、99%或100%的序列同一性。令人惊讶地发现,即使在网粘菌纲中同源区的长度也可非常短,其中通常需要至少1个或几个kbp的长度以允许同源重组。因此,在优选的实施方案中,所述同源区的长度优选为至多1kb、至多0.5kb、至多100bp、至多50bp、至多40bp、至多30bp、至多20bp、至多10bp。
优选地,所述两个同源区之间的距离为至多10kb、至多9kb、至多8kb、至多7kb、至多6kb、至多5kb、至多4kb、至多3kb、至多2kb、最多1kb、至多0.5kb、至多100bp、至多50bp、至多40bp、至多30bp、至多20bp、至多10bp。
在一个方面,本发明涉及能够识别基因组中PAM位点的软件算法以设计靶向一个或多个PAM位点的方法和在不使用供体DNA的情况下产生多核苷酸的缺失,所述基因组包含在PAM位点附近约7-20bp的同源区之间。
上述方法可用于以设计的方式有效去除多核苷酸序列。例如,在将Cas9表达盒引入基因组DNA中并且在由CRISPR/CAS9系统介导的几轮修饰后,可通过引入靶向Cas9表达中的位点的gRNA从所述基因组中去除Cas9表达盒,且其中Cas9表达盒包含在如上定义的两个同源区之间,优选100-bp长,更优选20-bp、15-bp长或更短,并切除Cas9开放阅读框或大部分表达盒。
上述方法也可用于基因的瞬时失活。例如,可以通过在类胡萝卜素合成酶或饱和脂肪酸合酶或多不饱和脂肪酸合酶的ORF中插入多核苷酸序列来使基因(例如,类胡萝卜素合成酶或饱和脂肪酸合酶或多不饱和脂肪酸合酶)无功能,其包含分别在5'-末端和3'-末端处包含两个同源区,其中优选同源区是100bp,更优选20bp、15bp长或更短。如上所述,可使用不含供体DNA的CRISPR-Cas9系统再次使上述合酶基因发挥功能。
在一个实施方案中,调节表达的方法包含在靶多核苷酸的至少一个位点处剪切一条或两条多核苷酸链,然后通过用外源多核苷酸的同源重组修饰靶多核苷酸。在这种情况下,根据本发明第一方面的组合物优选地进一步包含这种外源多核苷酸。这种修饰可导致靶多核苷酸中至少一个核苷酸的插入、缺失或取代,其中所述插入或取代核苷酸可以或可以不源自外源多核苷酸。在一个实施方案中,所述外源多核苷酸包含与靶多核苷酸同源的区域。优选地,这些同源区之间的同源性程度是如此允许同源重组的。优选地,同源区在同源区的整个长度上具有至少60%、70%、80%、90%、99%或100%的序列同一性。当外源多核苷酸是非整合实体时,也可进行修饰;在这种情况下,靶多核苷酸被修饰,但不将外源多核苷酸的核苷酸引入靶多核苷酸。因此,当将根据本发明的Cas蛋白质引入宿主细胞中时,所得宿主是非重组宿主。在根据本发明该方面的方法中,所述宿主细胞可因此是重组宿主细胞或可为非重组宿主细胞。外源多核苷酸可为任何感兴趣的多核苷酸,如如本文所定义的编码感兴趣的化合物的多核苷酸,或这种多核苷酸的一部分或其变体。
在另一方面,本发明提供了产生感兴趣的化合物的方法,其包括在有益于感兴趣的化合物的条件下培养根据本发明第三或第四方面的宿主细胞或通过根据本发明第二方面的方法获得的宿主细胞,或通过根据本发明第四方面的方法可获得的宿主细胞,以及任选地纯化或分离感兴趣的化合物。
在本发明所有实施方案的上下文中的感兴趣的化合物可为任何生物化合物。该生物化合物可为生物质或生物聚合物或代谢物。该生物化合物可由构成生物合成或代谢途径的单个多核苷酸或一系列多核苷酸编码,或者可为单个多核苷酸的产物或一系列多核苷酸的产物的直接结果,所述多核苷酸可为基因,所述一系列多核苷酸可为基因簇。在本发明的所有实施方案中,编码感兴趣的生物化合物的单个多核苷酸或一系列多核苷酸或与感兴趣的生物化合物相关的生物合成或代谢途径是根据本发明的组合物和方法的优选靶物。生物化合物对于宿主细胞可为天然的,或者对于宿主细胞可为异源的。
术语“异源生物化合物”在本文中定义为对于所述细胞不是天然的生物化合物;或其中已经进行结构修饰以改变天然生物化合物的天然生物化合物。
术语“生物聚合物”在本文中定义为相同、相似或不相的亚单元(单体)的链(或聚合物)。生物聚合物可为任何生物聚合物。生物聚合物可例如为但不限于核酸、多胺、多元醇、多肽(或聚酰胺)或多糖。
生物聚合物可为多肽。所述多肽可为具有感兴趣的生物活性的任何多肽。术语“多肽”在本文中并不是指特定长度的编码产物,且因此包括肽、寡肽和蛋白质。术语多肽是指任何长度的氨基酸聚合物。所述聚合物可为直链或支链的,它可包含修饰的氨基酸,并且它可由非氨基酸中断。该术语还包括已经修饰的氨基酸聚合物;例如,二硫键形成、糖基化、脂化、乙酰化、磷酸化或任何其他操作(如与标记组分的缀合)。如本文所用,术语“氨基酸”包括天然和/或非天然或合成的氨基酸,其包括甘氨酸和D或L两种光学异构体,以及氨基酸类似物和肽模拟物。多肽进一步包括上述多肽的天然存在的等位的和工程化变体以及杂合多肽。所述多肽对于宿主细胞可为天然的或可为异源的。所述多肽可为胶原蛋白或明胶,或其变体或杂合体。所述多肽可为抗体或其部分、抗原、凝血因子、酶、激素或激素变体、受体或其部分、调控蛋白、结构蛋白、报道分子或转运蛋白、参与分泌过程的蛋白质、参与折叠过程的蛋白质、分子伴侣、肽氨基酸转运蛋白、糖基化因子、转录因子、合成肽或寡肽、细胞内蛋白质。细胞内蛋白可为酶,如蛋白酶、神经酰胺酶、环氧化物水解酶、氨肽酶、酰化酶、醛缩酶、羟化酶、氨肽酶、脂肪酶。所述多肽也可为细胞外分泌的酶。这些酶可以属于下组:氧化还原酶、转移酶、水解酶、裂合酶、异构酶、连接酶、过氧化氢酶、纤维素酶、几丁质酶、角质酶、脱氧核糖核酸酶、右旋糖酐酶、酯酶。所述酶可为糖酶,例如纤维素酶(如内切葡聚糖酶、β-葡聚糖酶、纤维二糖水解酶或β-葡糖苷酶)、半纤维素酶或果胶分解酶如木聚糖酶、木糖苷酶、甘露聚糖酶、半乳聚糖酶、半乳糖苷酶、果胶甲基酯酶、果胶裂合酶、果胶酸裂合酶、内多聚半乳糖醛酸酶、外多聚半乳糖醛酸酶鼠李糖基半乳糖醛酸酶、阿拉伯聚糖酶、阿拉伯呋喃糖苷酶、阿拉伯木聚糖水解酶、半乳糖醛酸酶、裂合酶或淀粉分解酶;水解酶、异构酶或连接酶、磷酸酶(如肌醇六磷酸酶)、酯酶(如脂肪酶)、蛋白水解酶、氧化还原酶(如氧化酶)、转移酶或异构酶。所述酶可为肌醇六磷酸酶。所述酶可为氨肽酶、天冬酰胺酶、淀粉酶、产麦芽糖淀粉酶、糖酶、羧肽酶、内切蛋白酶、金属蛋白酶、丝氨酸蛋白酶过氧化氢酶、几丁质酶、角质酶、环糊精糖基转移酶、脱氧核糖核酸酶、酯酶、α-半乳糖苷酶、β-半乳糖苷酶、葡糖淀粉酶、α-葡糖苷酶、β-葡萄糖苷酶、卤过氧化物酶、蛋白质脱氨酶、转化酶、漆酶、脂肪酶、甘露糖苷酶、变聚糖酶、氧化酶、果胶分解酶、过氧化物酶、磷脂酶、半乳糖脂肪酶、叶绿素酶、多酚氧化酶、核糖核酸酶、转谷氨酰胺酶、葡萄糖氧化酶、己糖氧化酶、单加氧酶。
根据本发明,感兴趣的化合物可为如WO2010/102982中所述的具有改进的分泌特征的多肽或酶。根据本发明,感兴趣的化合物可为融合或杂合多肽,其中另一多肽在所述多肽或其片段的N-末端或C-末端融合。通过将编码一种多肽的核酸序列(或其部分)与编码另一种多肽的核酸序列(或其部分)融合来产生融合多肽。
用于产生融合多肽的技术是本领域已知的,并且包括连接编码多肽的编码序列使得它们在框内并且融合多肽的表达在相同的启动子和终止子的控制下。所述杂合多肽可包含从至少两种不同多肽获得的部分或完整多肽序列的组合物,其中一种或多种多肽对于宿主细胞可为异源的。融合多肽和信号序列融合的实例是(例如)如WO2010/121933中所述。
生物聚合物可为多糖。所述多糖可为任何多糖,其包括但不限于粘多糖(例如肝素和透明质酸)和含氮多糖(例如几丁质)。在优选的选择中,所述多糖是透明质酸。
编码感兴趣的化合物或编码参与本发明的感兴趣的化合物产生的化合物的多核苷酸可编码参与初级或次级代谢产物,如有机酸、类胡萝卜素、(β-内酰胺)抗生素和维生素的合成的酶。这种代谢物可被认为是根据本发明的生物化合物。
术语“代谢物”包括初级和次级代谢物;所述代谢物可为任何代谢物。优选的代谢物是不饱和脂肪和脂质(其包括但不限于脂肪酸二十二碳六烯酸、二十二碳五烯酸、芥酸、二十烯酸,十八碳烯酸(顺式或反式)、二十碳五烯酸、二十碳四烯酸(n-3)、花生四烯酸(n-6)、十八碳五烯酸、十八碳四烯酸、亚麻酸(n6或n3)、亚油酸、油酸、棕榈油酸、二十八碳八烯酸(octacosaoctaenoic acid)及其包含的脂质)、饱和脂肪和脂质(其包括但不限于脂肪酸:己酸、辛酸、癸酸、月桂酸、肉豆蔻酸、棕榈酸、硬脂酸、花生酸、山嵛酸/二十二烷酸及其包含的脂质)、硫酸化脂质、槐糖脂、内酯、神经酰胺、磷脂、脂肪醇、脂肪酸酯、脂肪酸醚、脂肪酸醛、甾醇、类胡萝卜素、脂氧化物(oxylipins)、消退素(resolvins)、白三烯、前列腺素、有机酸(其包括但不限于乙酸、丁酸、柠檬酸、葡萄糖酸、己二酸、富马酸、衣康酸、苹果酸、甲羟戊酸和琥珀酸)、糖醇和糖酸。
代谢物可由(例如)生物合成途径或代谢途径中一种或多种基因编码。初级代谢产物是细胞的初级或一般代谢产物,其涉及能量代谢、生长和结构。次级代谢产物是次级代谢产物(参见,例如R.B.Herbert,The Biosynthesis of Secondary Metabolites,Chapman和Hall,New York,1981)。
初级代谢物可为但不限于氨基酸、脂肪酸、核苷、核苷酸、糖、甘油三酯或维生素。
次级代谢产物可为但不限于生物碱、香豆素、类黄酮、聚酮化合物、奎宁、类固醇、肽或萜烯。次级代谢产物可为抗生素、拒食剂、引诱剂、杀菌剂、杀真菌剂、激素、杀虫剂或杀啮齿类剂。
生物化合物也可为选择标记的产物。选择标记是感兴趣的多核苷酸的产物,该产物提供抗生物剂或病毒抗性、对重金属的抗性、针对营养缺陷型的原养型等。选择标记包括但不限于nptII(新霉素磷酸转移酶II)、ALS(乙酰乳酸合酶)、bsd(杀稻瘟素-S-脱氨酶)和Sh ble(腐草霉素结合)以及其等同物。
根据本发明,感兴趣的化合物优选是感兴趣的化合物列表中描述的多肽。
根据本发明的另一个实施方案,感兴趣的化合物优选是代谢物。
根据本发明的宿主细胞可已经能够产生所述感兴趣的化合物。所述宿主细胞还可以具有编码多肽的同源或异源核酸构建体,其中所述多肽可为感兴趣的化合物或参与感兴趣的化合物产生的多肽。本领域技术人员知道如何修饰藻类宿主细胞,使其能够产生感兴趣的化合物。
一般定义
在整个说明书和所附权利要求书中,词语“包含(comprise)”、“包括(include)”和“具有(having)”以及变型如“包含(comprises,comprising)”、“包括(includes,including)”为包含性解释的。也就是说,这些词语旨在传达可能包含上下文允许的未具体叙述的其他元素或整数。
术语“a,an”在本文中用于指代文中的语法对象中的一个或一个以上(即一个或至少一个)。举例来说,“元件”可表示一个元件或一个以上的元件。
词语“约”或“大约”当与数值结合使用(如约10)时,优选地表示该值可为给定值(10)多或少1%的值。
除非另外定义,否则本文使用的所有技术和科学术语具有与本公开所属领域的普通技术人员通常理解的含义相同的含义。
优选的核苷酸类似物或等同物包含修饰的骨架。这种骨架的实例由吗啉代骨架、氨基甲酸酯骨架、硅氧烷骨架、硫化物、亚砜和砜骨架、甲酰基和硫代甲酰基骨架、亚甲基甲酰基骨架、核乙酰基(riboacetyl)骨架、含烯烃的骨架、氨基磺酸酯、磺酸酯和磺酰胺骨架、亚甲基亚氨基和亚甲基肼基骨架,以及酰胺骨干。进一步优选骨架中残基之间的键不包括磷原子,如由短链烷基或环烷基核苷间键、混合杂原子和烷基或环烷基核苷间键,或一个或多个短链杂原子或杂环核苷间键形成的键。
优选的核苷酸类似物或等同物包含具有修饰的聚酰胺骨架的肽核酸(PNA)(Nielsen,等(1991)Science 254,1497-1500)。基于PNA的分子在碱基对识别方面是DNA分子的真实模拟物。PNA的骨架由通过肽键连接的N-(2-氨基乙基)-甘氨酸单元组成,其中核碱基通过亚甲基羰基键与骨架连接。另一种骨架包含一碳延伸的吡咯烷PNA单体(Govindaraju和Kumar(2005)Chem.Commun,495-497)。由于PNA分子的骨架不含有带电荷的磷酸基团,因此PNA-RNA杂合体通常分别比RNA-RNA或RNA-DNA杂合体更稳定(Egholm等(1993)Nature 365,566-568)。
进一步优选的骨架包含吗啉代核苷酸类似物或等同物,其中核糖或脱氧核糖由6元吗啉代环替代。最优选的核苷酸类似物或等同物包含二氨基磷酸酯吗啉代寡聚物(phosphorodiamidate morpholino oligomer)(PMO),其中核糖或脱氧核糖由6元吗啉代环替代,且相邻吗啉代环之间的阴离子磷酸二酯键由非离子二氨基磷酸酯键取代。
进一步优选的核苷酸类似物或等同物包含磷酸二酯键中至少一个非桥接氧的取代。这种修饰使碱基配对轻微不稳定,但增加了对核酸酶降解的显著抗性。优选的核苷酸类似物或等同物包括硫代磷酸酯、手性硫代磷酸酯、二硫代磷酸酯、磷酸三酯、氨基烷基磷酸三酯、H-膦酸酯、甲基和其它烷基膦酸酯(包括3'-亚烷基膦酸酯、5'-亚烷基膦酸酯和手性膦酸酯、次膦酸酯、氨基磷酸酯(包括3'-氨基氨基磷酸酯和氨基烷基氨基磷酸酯、硫代氨基磷酸酯、硫代烷基膦酸酯、硫代烷基磷酸三酯、硒磷酸酯或硼烷磷酸酯))。
进一步优选的核苷酸类似物或等同物包含一个或多个在2'、3'和/或5'位置单或双取代的糖部分;所述取代例如-OH;-F;取代或未取代的,直链或支链的低级(C1-C10)烷基、烯基、炔基、烷芳基、烯丙基、芳基或芳烷基,其可由一个或多个杂原子中断;O-、S-或N-烷基;O-、S-或N-烯基;O-、S-或N-炔基;O-、S-或N-烯丙基;O-烷基-O-烷基、-甲氧基、-氨基丙氧基;氨氧基、甲氧基乙氧基;-二甲基氨基氧基乙氧基;和-二甲基氨基乙氧基乙氧基。所述糖部分可为吡喃糖或其衍生物,或脱氧吡喃糖或其衍生物,优选核糖或其衍生物,或脱氧核糖或其衍生物。这种优选的衍生糖部分包括锁核酸(LNA),其中2'-碳原子与糖环的3'或4'碳原子连接,由此形成双环糖部分。优选的LNA包含2'-O,4'-C-亚乙基桥连的核酸(Morita等,2001.Nucleic Acid Res Supplement No.1:241-242)。这些取代使得核苷酸类似物或等同的RNA酶H和核酸酶具有抗性并增加对靶物的亲和力。
本发明上下文中氨基酸-或核酸-序列的“序列同一性”或“同一性”在本文中定义为通过比较序列确定的两个或更多个氨基酸(肽、多肽或蛋白质)序列或两种或更多种核酸(核苷酸、寡核苷酸、多核苷酸)序列之间的关系。在本领域中,“同一性”还表示氨基酸或核苷酸序列之间的序列相关程度,视情况而定,如通过这些序列的字符串之间的匹配所确定的。在本发明中,特定序列的序列同一性优选是指在所述特定多肽或多核苷酸序列的整个长度上的序列同一性。
通过比较一种肽或多肽的氨基酸序列及其保守氨基酸替代物与第二种肽或多肽的序列来确定两个氨基酸序列之间的“相似性”。在优选的实施方案中,在如本文鉴定的整个序列(SEQ ID NO:)上计算同一性或相似性。可容易地通过已知方法计算“同一性”和“相似性”,其包括但不限于Computational Molecular Biology,Lesk,A.M.,等,OxfordUniversity Press,New York,1988;Biocomputing:Informatics and Genome Projects,Smith,D.W.,等,Academic Press,New York,1993;Computer Analysis of SequenceData,Part I,Griffin,A.M.,和Griffin,H.G.编,Humana Press,New Jersey,1994;Sequence Analysis in Molecular Biology,von Heine,G.,Academic Press,1987;和Sequence Analysis Primer,Gribskov,M.和Devereux,J.编,M Stockton Press,NewYork,1991;和Carillo,H.,和Lipman,D.,SIAM J.Applied Math.,48:1073(1988)中描述的那些。
设计确定同一性的优选的方法以给出测试序列之间的最大匹配。确定同一性和相似性的方法在公开可用的计算机程序中编码。用于确定两个序列之间的同一性和相似性的优选的计算机程序方法包括(如)GCG程序包(Devereux,J.,等,Nucleic Acids Research12(1):387(1984))、BestFit、BLASTP、BLASTN和FASTA(Altschul,S.F.等,J.Mol.Biol.215:403-410(1990)。BLAST X程序可从NCBI和其他资源公开获得(BLAST Manual,Altschul,S.,等,NCBI NLM NIH Bethesda,MD 20894;Altschul,S.等,J.Mol.Biol.215:403-410(1990)。已知的Smith Waterman算法也可用于确定同一性。
用于多肽序列比较的优选参数如下:算法:Needleman和Wunsch,J.Mol,J.Mol.Biol.48:443-453(1970);比较矩阵:BLOSSUM62,其来自Hentikoff和Hentikoff,Proc.Natl.Acad.Sci.USA.89:10915-10919(1992);缺口罚分:12;和缺口长度罚分:4。用于这些参数的程序可根据位于威斯康星州麦迪逊市的Genetics Computer Group的“Ogap”程序公开获得。上述参数是氨基酸比较的默认参数(连同没有对末端缺口的罚分)。
用于核酸比较的优选参数如下:算法:Needleman和Wunsch,J.Mol.Biol.48:443-453(1970);比较矩阵:匹配=+10,不匹配=0;缺口罚分:50;缺口长度罚分:3。可从位于威斯康星州麦迪逊市的Genetics Computer Group获得Gap程序。以上是核酸比较的默认参数。
任选地,在确定氨基酸相似性程度时,技术人员还可考虑所谓的“保守”氨基酸取代,这是本领域技术人员清楚的。保守氨基酸取代是指具有相似侧链的残基的可互换性。例如,具有脂肪族侧链的一组氨基酸是甘氨酸、丙氨酸、缬氨酸、亮氨酸和异亮氨酸。具有脂肪族-羟基侧链的一组氨基酸是丝氨酸和苏氨酸;具有含酰胺侧链的一组氨基酸是天冬酰胺和谷氨酰胺;具有芳香族侧链的一组氨基酸是苯丙氨酸、酪氨酸和色氨酸;具有碱性侧链的一组氨基酸是赖氨酸、精氨酸和组氨酸;具有含硫侧链的一组氨基酸是半胱氨酸和甲硫氨酸。优选的保守氨基酸取代组是:缬氨酸-亮氨酸-异亮氨酸、苯丙氨酸-酪氨酸、赖氨酸-精氨酸、丙氨酸-缬氨酸和天冬酰胺-谷氨酰胺。本文公开的氨基酸序列的取代变体是其中已除去所公开序列中的至少一个残基并在其位点插入不同残基的那些变体。优选地,氨基酸变化是保守的。每种天然存在的氨基酸的优选保守取代如下:Ala变为Ser;Arg变为lys;Asn变为Gln或His;Asp变为Glu;Cys变为Ser或Ala;Gln变为Asn;Glu变为Asp;Gly到Pro;His变为Asn或Gln;Ile变为Leu或Val;Leu变为Ile或Val;Lys变为Arg;Gln或Glu;Met变为Leu或Ile;Phe变为Met、Leu或Tyr;Ser变为Thr;Thr变为Ser;Trp变为Tyr;Tyr变为Trp或Phe;以及Val变为Ile或Leu。
根据本发明的多核苷酸由核苷酸序列表示。根据本发明的多肽由氨基酸序列表示。根据本发明的核酸构建体定义为从天然存在的基因中分离的多核苷酸,或者已被修饰为含有多核苷酸区段的多核苷酸,所述多核苷酸区段以自然界中不存在的方式组合或并置。任选地,存在于根据本发明的核酸构建体中的多核苷酸与一个或多个控制序列可操作地连接,所述控制序列指导编码产物在宿主细胞或无细胞系统中的产生或表达。
本文提供的序列信息不应如此狭窄地解释为需要包含错误识别的碱基。技术人员能够识别这种错误识别的基础并且知道如何校正这种错误。
本发明的所有实施方案(即根据本发明的组合物、调节表达的方法、包含根据本发明的组合物的宿主细胞、产生根据本发明的宿主细胞的方法、根据本发明的宿主细胞和产生根据本发明感兴趣的合物的方法)优选是指宿主细胞,而非指无细胞的体外系统;换言之,根据本发明的CRISPR-Cas系统优选是宿主细胞系统,而非无细胞的体外系统。
在本发明的所有实施方案中(例如根据本发明的组合物,调节表达的方法、包含根据本发明的组合物的宿主细胞、产生根据本发明的宿主细胞的方法,根据本发明的宿主细胞和产生根据本发明的感兴趣的化合物的方法),所述宿主细胞可为单倍体、二倍体或多倍体宿主细胞。
根据本发明的宿主细胞是网粘菌纲宿主细胞,优选为破囊壶菌目,更优选为破囊壶菌科,更优选为选自下组的菌属:Aurantiochytrium、Oblongichytrium、裂殖壶菌属、破囊壶菌属和吾肯氏壶菌属(Ulkenia),甚至更优选裂殖壶菌菌种ATCC#20888。
优选在基因组中的修饰在本文中解释为一种或多种修饰。优选在根据本发明的宿主细胞的基因组中的修饰可通过下列实现
a)对亲本宿主细胞进行重组遗传操作技术;和/或
b)对亲本宿主细胞进行(传统的)诱变;和/或
c)对亲本宿主细胞施用抑制性化合物或组合物。
宿主细胞基因组的修饰在本文中定义为导致该宿主细胞基因组中多核苷酸序列变化的任何事件。
优选地,根据本发明的宿主细胞具有修饰(优选在其基因组中),当在相同条件下分时,与未经修饰的亲本宿主细胞相比,所述修饰导致如本文所定义的不合意的化合物的减少或不产生。
可通过本领域技术人员已知的任何方法引入修饰,例如但不限于传统的菌株改良,随机诱变后选择。也可通过定点诱变引入修饰。
可通过引入(插入)、取代(置换)或去除(缺失)多核苷酸序列中一个或多个核苷酸来完成修饰。可实现编码不合意的化合物(如多肽)的多核苷酸的完全或部分缺失。不合意的化合物可为本文其他地方列出的任何不合意的化合物;它也可为合成不需要的化合物(如代谢物)的生物途径中的蛋白质和/或酶。或者,编码所述不合意的化合物的多核苷酸可部分地或完全地由不编码所述不合意的化合物或编码部分或完全失活形式的所述不合意的化合物的多核苷酸序列取代。在另一个替代中,可将一个或多个核苷酸插入编码所述不合意的化合物的多核苷酸中,其导致所述多核苷酸的断裂以及随后使由断裂的多核苷酸编码的所述不合意的化合物部分或完全失活。
在一个实施方案中,根据本发明的突变的微生物宿主细胞包含选自下列的其基因组中的修饰
a)完全或部分缺失编码不合意的化合物的多核苷酸,
b)用不编码所述不合意的化合物或编码部分或完全失活形式的所述不合意的化合物的多核苷酸序列完全或部分置换编码不合意的化合物的多核苷酸,
c)通过在多核苷酸序列中插入一个或多个核苷酸来破坏编码不合意的化合物的多核苷酸,且随后通过破坏的多核苷酸部分或完全失活所述不合意的化合物。
例如,该修饰可在编码序列或所述不合意的化合物的转录或翻译所需的调控元件中。例如,可插入或去除核苷酸,以导致终止密码子的引入,起始密码子的去除或编码序列的开放阅读框的改变或移码。编码序列或其调控元件的修饰可通过定点或随机诱变、DNA改组方法、DNA组装方法、基因合成(参见如Young和Dong(2004),Nucleic Acids Research 32(7)电子版于nar.oupjournals.org/cgi/reprint/32/7/e59或Gupta等(1968),Proc.Natl.Acad.Sci USA,60:1338-1344;Scarpulla等(1982),Anal.Biochem.121:356-365;Stemmer等(1995),Gene 164:49-53)或依照本领域熟知的PCR产生的诱变来完成。随机诱变方法的实例是本领域熟知的,例如化学诱变(例如NTG)或物理诱变(例如UV)。定点诱变步骤的实例是QuickChangeTM定点诱变试剂盒(Stratagene Cloning Systems,La Jolla,CA),AlteredII体外诱变系统(Promega Corporation)或通过使用如Ho等(“Site-directed mutagenesis by overlap extension using the polymerase chainreaction”,Gene,1989Apr 15,77(1):51-9)所述的PCR或使用如Molecular Biology:Current Innovations and Future Trends.(Eds.A.M.Griffin和H.G.Griffin.ISBN 1-898486-01-8;1995Horizon Scientific Press,PO Box1,Wymondham,Norfolk,U.K.)中所述的PCR的重叠延伸。
优选的修饰方法基于重组遗传操作技术,如部分或完全基因置换或部分或完全基因缺失。
例如,在置换多核苷酸、核酸构建体或表达盒的情况下,可在待置换的靶基因座处引入合适的DNA序列。所述合适的DNA序列优选存在于克隆载体上。优选的整合克隆载体包含DNA片段,其与多核苷酸同源和/或与待替换基因座侧翼的多核苷酸具有同源性,用于靶向将克隆载体整合至此预定的基因座。为了促进靶向整合,优选在转化细胞之前将所述克隆载体线性化。优选地,进行线性化,使得所述克隆载体的至少一端但优选任一端侧翼为与待置换的DNA序列(或侧翼序列)同源的序列。该过程称为同源重组,并且该技术也可用于实现(部分)基因缺失。
例如,对应于内源多核苷酸的多核苷酸可由缺陷的多核苷酸取代,所述缺陷的多核苷酸是不能产生(完全功能)多肽的多核苷酸。通过同源重组,所述缺陷的多核苷酸取代内源多核苷酸。可能需要缺陷的多核苷酸也编码标记,所述标记可用于选择其中已修饰了核酸序列的转化子。
可通过不同方法获得导致减少或不产生不合意的化合物的修饰,例如通过针对这种不合意的化合物或化学抑制剂或蛋白质抑制剂或物理抑制剂的抗体(Tour O.等,“Genetically targeted chromophore-assisted light inactivation”,(2003)Nat.Biotech)。或者,或与上述技术组合,也可减少或不产生不合意的化合物,例如,通过UV或化学诱变(Lian等,“Increase of docosahexaenoic acid production bySchizochytrium sp.through mutagenesis and enzyme assay”(2010)ApplBiochemBiotechnol 162(4):935-941)或通过使用抑制剂抑制如本文所述的非合意的多肽的酶活性(例如,作为β-葡糖苷酶的抑制剂的野尻霉素(Ren等,“Effect of biotinand cerulenin addition on DHA production by Schizochytrium sp.”(2012-01)Chinese J Bioprocess Engineering)。
在本发明的一个实施方案中,根据本发明的宿主细胞的基因组中的修饰是编码不合意的化合物的多核苷酸的至少一个位置的修饰。
细胞在产生化合物(例如不合意的化合物,如非期望的多肽和/或酶)方面的缺陷在本文中定义为已被修饰(优选在其基因组中)以产生表型特征的突变微生物宿主细胞,其中所述细胞:当在相同条件下分析时,与未修饰的亲本宿主细胞相比,a)产生较少的不合意的化合物或基本上不产生任何不合意的化合物和/或b)产生具有降低的活性或降低的比活性的不合意的化合物或不具有活性或无比活性的不合意的化合物以及这些可能性中的一种或多种组合。
优选地,如果与在相同条件下未经修饰和测定的亲本宿主细胞相比,根据本发明的经修饰的宿主细胞产生少于1%的不合意的化合物、至少少于5%的不合意的化合物、至少少于10%的不合意的化合物、至少少于20%的不合意的化合物、至少少于30%的不合意的化合物、至少少于40%的不合意的化合物、至少少于50%的不合意的化合物、至少60%的不合意的化合物、至少70%的不合意的化合物、至少80%的不合意的化合物,至少90%的非期望化合物、至少91%的不合意的化合物、至少92%的不合意的化合物、至少93%的不合意的化合物、至少94%的不合意的化合物、至少95%的不合意的化合物、至少96%的不合意的化合物、至少97%的不合意的化合物、至少98%的不合意的化合物、至少99%的不合意的化合物、至少99.9%的不合意的化合物或最优选少于100%的不合意的化合物。
本文提供的序列信息不应如此狭窄地解释为需要包含错误识别的碱基。技术人员能够识别这种错误识别的基础并且知道如何校正这种错误。
本文所述的每篇参考文献的公开内容通过提述以其整体并入本文。
通过以下实施例进一步说明本发明:
实施例
实施例1
设计和构建用于转化的Cas9载体
酿脓链球菌(Streptococcus pyogenes)MGAS5005Cas9序列经密码子优化以在裂殖壶菌属中表达。所用的基本的Cas9肽序列与Jinek等,2013所用的序列基本上相同,但其不具有描述的HA标签或GFP融合物(参见下文)。合成Cas9(DNA2.0,Newark,CA)后,将其克隆到包含巴龙霉素选择盒的pCL122载体中,其产生命名为pCL122-Cas9(SEQ ID)的载体。合成OrfA/Pfa1侧翼,并克隆(Genscript USA,Piscataway,NJ)到pCL121(其具有博来霉素选择盒)中,且将最终的载体命名为pYB31(SEQ ID NO:2);参见例如US 8,940,88。经由使用BamHI和NdeI限制性酶切位点和酶(New England Biolabs,Ipswich,MA)(图3)以及快速DNA连接试剂盒(罗氏,Risch-Rotkreuz,瑞士)的消化和连接将Cas9基因从pCL122-Cas9载体亚克隆至pYB31载体。转化NEB10β化学感受态细胞(New England Biolabs),且使用选择的菌落、带有引物121Tub seq F(SEQ ID NO:13)和pYB32/3C R1(SEQ ID NO:14)(表2)以及5%DMSO(v:v)的GoTaq Green主混合物(Promega,Chicago,IL)通过菌落PCR筛选得到的菌落,并将下列循环条件应用于所述反应:95℃ 5分钟,(95℃ 30秒,59℃ 30秒,72℃ 1分钟)x35循环,72℃ 5分钟(图4)。从PCR为阳性的菌落分离质粒,测序,并将一个所得的载体命名为pYB32(SEQ ID NO:3)。
表2
引物名称 | SEQ ID NO | 引物序列,5′→3′ |
121Tub seq F | 13 | GGATCTCATGCTGGAGTTCTTC |
pYB32/3C R1 | 14 | GTACTTCTCGTGGTAGGCAACC |
如先前所述,其他研究已经表明Cas9表达水平对于优化转化子活力或核酸酶活性是重要的。在pYB32质粒中,Cas9基因在α微管蛋白启动(中等强度启动子)的控制下。选择来自胡萝卜素合成酶(CS)基因的弱启动子同时进行测试,并通过InFusion PCR克隆(Clontech/Takara Bio USA,Inc.,Mountain View,CA)将其克隆到pYB31中。用KpnI和NdeI酶(New England Biolabs)消化pYB31质粒以准备InFusion克隆。用CS pro KpnI IF F1(SEQ ID NO:15)和CS pro BamHI IF R1引物(SEQ ID NO:16)(表3),用5%DMSO(v:v)、KODHotStart Master混合物(EMD Millipore,Billerica,MA)和具有CS启动子的pTH043质粒(用作模板)扩增CS启动子。反应循环条件如下:95℃ 2分钟,(95℃ 20秒,66℃ 10秒,70℃20秒)x35循环,70℃ 2分钟。用CS pro BamHI IF F2(SEQ ID NO:17)和CS pro NdeI IF R2(SEQ ID NO:18)引物(表3),用5%DMSO(v:v)、KOD HotStart主混合物和用作模板的pCL122-Cas9扩增Cas9。反应循环条件如下:95℃ 2分钟,(95℃ 20秒,65℃ 10秒,70℃ 1分45秒)x35循环,70℃ 2分钟。
表3
PCR产物在1%琼脂糖凝胶(Lonza,巴塞尔,瑞士)上电泳,切下预期大小的条带,并使用QIA快速凝胶提取试剂盒(Qiagen,希尔登,德国)纯化凝胶(图3)。按照制造商的InFusion克隆方案,连接Cas9PCR片段、CS启动PCR片段和线性化的Pyb31片段,转化NEB10β化学感受态细胞,并通过上述的菌落PCR(图4)(72℃处1分钟30秒的延伸时间)筛选得到的菌落。序列验证后,将得到的含有与CS启动子可操作连接的Cas9的载体之一命名为pYB33(SEQ ID NO:4)。
通过消化、连接和InFusion PCR克隆的组合进行pYB32和pYB33的克隆。如图3所示,在柱纯化后产生所有片段并具有预期大小的条带。消化的质粒和PCR扩增的片段在1%琼脂糖凝胶上运行。在所有泳道中观察到预期的片段大小如下:pYB31-BamHI+NdeI=838bp+6555bp、pYB31-KpnI+NdeI=1289bp+6104bp、Cas9-BamHI+NdeI=4157bp+5773bp、CS PCR片段=1046bp、Cas9PCR片段=4189bp。在该凝胶和所有后续凝胶中使用的分子量标记是DNA Quanti梯度(Origene,Rockville,MD)-片段大小在图3右侧的图面中指示。
通过菌落PCR分析由pYB32和pYB33细菌转化得到的菌落,且具有预期大小的扩增子的菌落在图4中以粗体字标记。这些菌落是:pYB32-2、-4、-9、-14、-15、-24、-25、-28和pYB33-16和pYB33D-1、-14。pYB32-2和pYB33-16属于经验证具有正确序列的那些,并用于后续工作。对于克隆pBB32和pYB33的菌落PCR结果,预期的扩增子大小如下:pYB32=1028bp、pYB33=1584bp。
实施例2
转化和选择Cas9转化子
使用粒子轰击法和如下所述的基因枪仪器(Bio-Rad,Raleigh,NC),将裂殖壶菌属菌种ATCC 20888的野生型菌株用于pYB32和pYB33的转化。简言之,将20888在250mL光滑底部锥形瓶中的25mL的M50-20培养基(参见如US8,003,772)中于27℃生长,以200rpm振荡过夜。然后,将培养物以1/100稀释到250mL带挡板的烧瓶中的50mL M2B培养基(参见如US 8,003,772)中,并在相同条件下过夜生长。当裂殖壶菌属培养物处于早期对数期(0.6-2OD单位/mL)时,通过以3,220x g离心10分钟收获培养物。倾析上清液,将沉淀重悬浮于M2B中至终浓度为20OD单位/mL,并将100μL的所得细胞悬浮物在约三分之一的非选择性M2B琼脂平板(直径约4cm)上以圆周运动涂布。用SwaI在25℃过夜消化质粒pYB32和pYB33,并使用QIA快速PCR纯化试剂盒(Qiagen,希尔登,德国)纯化。然后将5μg的每种纯化的质粒与50μL的2.5M CaCl2、20μL的0.1M亚精胺和50μL制备的M10钨珠混合(依照制造商的方案,Bio-Rad),涡旋1分钟,然后在室温温育10分钟以使珠子沉降。用250μL100%乙醇洗涤DNA包被的珠子一次,然后将珠子重悬于60μL 100%乙醇中。每个制备的大载体(依照制造商的大载体组装制备方案)具有出现在大载体盘的中心的10μL的在乙醇中包被的珠子,并使乙醇干燥。在70%异丙醇中短暂灭菌后,破裂盘支架具有置于内部的1,100psi级破裂盘,且组装好的大载体安装在顶部搁架位置的基因枪平台上,并将具有裂殖壶菌属的细胞碎片的M2B琼脂平板细胞侧面向上(cell-side-up)置于从顶部开始的第三个架子上。当基因枪室内的真空达到~27psi时,射出氦气直至破裂盘失效,将氦气流关闭,将该腔室减压至大气,从腔室中移出轰击的板。对所有样品和对照重复所述轰击过程,将用pYB32轰击的裂殖壶菌属菌种20888命名为T188,将用pYB33轰击的裂殖壶菌属培养物命名为T189。将轰击的板在27℃温育4小时,然后用~1mL的M2B从板上洗掉细胞,并在含有0.4%随机甲基化β-环糊精(CTD股份有限公司,普林斯顿,FL)中的0.5mM DHA(Nu-Chek Prep,沃特维尔,MN)和50μg/mL博来霉素(Thermo Fisher Scientific,沃尔瑟姆,MA)的4个M2B琼脂平板之间平均分配。用3mm无菌玻璃珠涂布细胞,取出珠子并包裹平板并在27℃温育约7-10天。当菌落大小达到2-4毫米时,将每个菌落在具有或不具有DHA(如上所述与随机甲基化的β-环糊精复合)的含有100μg/mL博来霉素的M2B琼脂平板上复制修复,以选择通过破坏OrfA/Pfa1基因诱导的营养缺陷型。
挑选确认为对于DHA营养缺陷的菌落,并将其接种到250mL光滑底部锥形瓶中的补充有500μL的40%β-环糊精和50mM DHA溶液的50mL M50-20中并置于27℃的振荡器以200rpm进行48小时。培养48小时后,通过以5,000x g离心10分钟收集2mL培养物,倾析上清液,依照改良的苯酚-氯仿提取,将沉淀用于基因组DNA分离。提取基因组DNA并用作GoTaqGreen主混合物(Promega,达拉谟,NC)的PCR模板,以使用引物、GoTaq Green主混合物和如用于菌落PCR筛选pYB32和pYB33所述的循环条件来验证博来霉素盒和Cas9基因的存在(图5)。通过PCR验证T188和T189转化子中OrfA/Pfa1基因的破坏。具体地,用O A1-KO F(SEQ IDNO:19)和pYB32/3SV40R1(SEQ ID NO:20)引物(表4)、GoTaq Green主混合物、5%DMSO(v:v)和作为模板的T188/T189gDNA通过PCR考察5'侧翼区,且循环条件如下:95℃保持2分钟,(95℃保持30秒,60℃保持30秒,72℃保持2分15秒)×35循环,72℃保持5分钟。此外,用O A1-KOR(SEQ ID NO:21)和pYB32/2CF 1(SEQ ID NO:22)引物(表4)、GoTaq Green主混合物、5%DMSO(v:v)和作为模板的T188/T189gDNA通过PCR考察3'侧翼区,循环条件如下:95℃2分钟,(95℃30秒,59℃30秒,72℃2分钟)×35循环,72℃5分钟(图6)。
表4
引物名称 | SEQ ID NO | 引物序列,5′→3′ |
O A1-KO F | 19 | CCAAGTTCGCCAAGGCTTC |
pYB32/3 SV40R1 | 20 | GTGGAATCGAAATCTCGTAGCAC |
O A1-KO R | 21 | GCTGTTGCAACTTTGCTCCAC |
pYB32/3CF1 | 22 | GTTAAGAAGACCGAGGTCCAGAC |
将经由PCR确定的Cas9基因整合和OrfA/Pfa1处破坏的阳性培养物接种到补充有随机甲基化β-环糊精和DHA的25mL的M50-20中,并如前所述生长24小时。测量该培养物的OD600,并将2个OD单位的各培养物接种到250mL带挡板的锥形瓶中的补充有随机甲基化的β-环糊精和DHA的50mL SPFM,pH 6.75中,并在27℃的振荡器中以200rpm生长48小时然后加入5%甘油(v:v)用于冷冻保存。选择两个克隆T188-1-20和T189-1-20用于进一步的工作,每个克隆来自各个转化组。
通过轰击用pYB32和pYB33质粒转化野生型裂殖壶菌属菌种20888,导致由于在多不饱和脂肪酸(PUFA)合酶的OrfA/PFA1基因座处插入Cas9所致20888中的DHA营养缺陷型。将菌落计数并在有或没有DHA的选择性平板上进行修复。从两个转化组中随机挑选对于DHA营养缺陷的菌落,并用于进一步表征。
如下表5中所示,用pYB33质粒的转化效率低于用pYB32质粒的情况,并且也观察到与发现的营养缺陷型菌落的分数类似的趋势。
表5
转化 | 每5μg DNA总克隆 | 营养缺陷型克隆 | %敲除 |
T188:pYB32—Tub pro-Cas9 | 160 | 80 | 50% |
T189:pYB33—CS pro-Cas9 | 96 | 37 | 38.5% |
考察T188和T189转化子是否存在与Cas9连接的启动子以及Cas9基因的上游区域。对于T188克隆,预期的扩增子大小为1028bp,对于T189-1584bp。如图5所示,除了克隆T189-1-30之外的所有产生预期的扩增子大小并用于进一步测试。
通过PCR验证了Cas9在OrfA/Pfa1基因座中的整合,用野生型特异性外部引物和Cas9特异性内部引物的组合扩增了5'和3'二者侧翼区,使得只有在发生整合时才可得到扩增子(图6)。Cas9整合位点5'侧翼的预期扩增子大小为2229bp,3'侧翼的预期扩增子大小为1973bp。所有测试的菌株均对于Cas9在OrfA/Pfa1基因座上整合是阳性的。
实施例3
设计和建立gRNA载体
设计所有指导RNA(gRNA)盒以由来自裂殖壶菌属的延伸因子1α(EF-1α)启动子表达。在每种情况下,gRNA序列侧翼为两个核酶序列,锤头状(Hammerhead)和HDV(Gao Y和Zhao Y“Self-processing of ribozyme-flanked RNAs into guide RNAs in vitro andin vivo for CRISPR-mediated genome editing”J Integr Plant Biol.56(4):343-349(2014))。在胡萝卜素合酶基因内鉴定出含有“NGG”原型间隔区相邻基序的4个靶序列,并选择每个上游紧邻的20bp作为靶序列。合成包括两种核酶、靶序列和引导RNA的一个盒,并使用BglII和NdeI位点(DNA2.0)将其克隆到pCL122载体中,得到命名为pCL401的载体-用于额外克隆的前体质粒(SEQ ID NO:7)。为了制备最终gRNA盒载体,用NdeI和HpaI消化质粒pSP73(Promega),并将得到的较大片段进行凝胶纯化。从裂殖壶菌属菌种20888基因组DNA用5'FAS PmeNde(SEQ ID NO:23)和3'FAS PmeHpa(SEQ ID NO:24)引物(表6),KOD HotStart主混合物和5%DMSO通过PCR扩增裂殖壶菌属脂肪酸合酶片段(FAS)的片段,使用以下循环条件:95℃ 2分钟,(95℃ 20秒,62℃ 10秒,70℃ 51秒)×40循环,70℃5分钟(图7)。将得到的片段用HpaI和NdeI限制酶消化并纯化。
表6
引物名称 | SEQ ID NO | 引物序列,5′→3′ |
5′FAS PmeNde | 23 | TAGCATATGTTTAAACTCGCGGCGTCTTTCGC |
3′FAS PmeHpa | 24 | AGTTAACGTTTAAACAGAGGAGGTGGCTGGC |
使用快速DNA连接试剂盒(Roche)连接合适的纯化和消化的pSP73和FAS片段,并转化到NEB10β细胞(New England Biolabs)中,得到载体pCL399(SEQ ID NO:5)。然后单独用NdeI内切核酸酶消化pCL399载体,用绿豆核酸酶(New England Biolabs)使末端平端化,并用快速DNA连接试剂盒重新连接载体,由此除去NdeI位点。将所得载体命名为pCL400(SEQID NO:6)。通过InFusion PCR克隆使用作为模板的pCL401(SEQ ID NO:7)扩增巴龙霉素表达盒和gRNA盒以将其插入到用XhoI预消化的pCL400中以产生载体pCL402(SEQ ID NO:8)。简言之,使用pCL402IF F(SEQ ID NO:25)和PCL402IF R(SEQ ID NO:26)引物(表7)、5%DMSO(v:v)、KOD Hot Start主混合物、pCL401质粒模板使用以下循环条件从pCL401扩增所需片段:95℃2分钟(95℃20秒,60℃10秒,70℃1分25秒)×35循环,70℃5分钟(图8)。将得到的载体命名为pCL402。
表7
合成了具有BglII和NdeI侧翼位点的四种基因组胡萝卜素合酶靶序列(Eurofins,Mebane,NC)。将这些片段命名为gRNA3 CS1、CS2、CS3和CS4。用BglII和NdeI消化全部4个片段和载体pCL0402。将所有合适的片段进行凝胶或柱纯化,然后使用快速DNA连接试剂盒(Roche)连接在一起,并将所得载体命名为pYB36(gRNA3 CS1;SEQ ID NO:9)、pYB37(gRNA3CS2;SEQ ID NO:10)、pYB38(gRNA3 CS3;SEQ ID NO:11)和pYB39(gRNA3 CS4;SEQ ID NO:12)。
为了从裂殖壶菌属去除基因编辑组分,设计Cas9和引导RNA盒以破坏(“敲除”)基因从而诱导营养缺陷型。虽然具有Cas9选择的营养缺陷型是针对DHA的,但由于脂肪酸合酶基因座(FAS)的破坏,用于gRNA插入的诱导的营养缺陷型是针对棕榈酸的。从裂殖壶菌属菌种20888基因组DNA扩增FAS基因的部分,然后在1%琼脂糖凝胶上运行(图8)。扩增子的预期大小为2530bp。制备两个样品并加载到凝胶上,预期的大小条带是PCR的主要产物,但是存在其他较小尺寸的条带,该条带指示PCR条件可能不太理想并且可能需要在将来进行优化。切出2.5kbp条带,凝胶纯化并用于克隆载体pCL399。
建立PCR以用于将巴龙霉素和gRNA盒克隆到载体pCL400中的FAS基因座中。扩增子的预期大小为3376bp,且它是凝胶上出现的主要条带(图8)。然后将该片段克隆到pCL400中以产生pCL402。
实施例4
转化和选择gRNA构建体
将T188-1-20和T189-1-20菌株(二者均通过PCR验证含有分别在不同启动子(α微管蛋白和CS)的调节下的Cas9表达盒,所述Cas9表达盒在PUFA合酶的OrfA/PFA1基因座处插入)接种到含有25mL的补充有0.4%随机甲基化β-环糊精及0.5mM DHA的M50-20光滑底部的锥形瓶中,并在27℃,200rpm过夜生长。将两种菌株以1/50稀释到含有如上所述补充有β-环糊精和DHA的50mL的M2B的带挡板的烧瓶中,并在27℃过夜生长。如上所述,在第二天收获T188和T189培养物,并如上所述进行轰击制备。在轰击之前用PmeI消化pYB36-39质粒并纯化柱,将所有四种消化的质粒用于转化两种菌株,产生命名为T202-209的转化(分别为具有pYB36-39的T188,具有pYB36-39的T189)。将得到的转化子铺板于含有0.4%的β-环糊精及0.5mM DHA、0.5mM C 16:0(棕榈酸,Sigma-Aldrich,St.Louis,MO)和50μg/mL巴龙霉素的M2B平板上4小时,然后从轰击中恢复。包裹平板并在27℃温育7-10天。一旦直径为2-4mm,将菌落复制修复到M2B+0.4%β-环糊精+0.5mM DHA+50μg/mL巴龙霉素(具有或不具有0.5mM棕榈酸)上,以验证由于在FAS基因座处插入gRNA盒而产生的对于棕榈酸的营养缺陷型。挑选来自证实是DHA和棕榈酸的营养缺陷型的8个转化的每个转化中的10个菌落,并将其接种到含有补充有0.4%β-环糊精、0.5mM DHA和0.5mM棕榈酸的25mL的M50-20的平滑底部锥形瓶中,培养物在27℃、200rpm生长48小时,此时收集2mL每种培养物以用于基因组DNA制备。在用苯酚:氯仿提取基因组DNA后,进行PCR以扩增含有gRNA盒靶向的区域的胡萝卜素合酶基因座。使用pYB36CS1F(SEQ ID NO:27)和pYB36CS3R(SEQ ID NO:29)引物(表8)、5%DMSO(v:v)、KOD Hot Start主混合物、作为模板的各gDNA使用以下循环条件通过PCR扩增来自T202、203、204、207、208的选择的转化子的gDNA:95℃ 2分钟,(95℃ 20秒,61℃ 10秒,70℃ 21秒)x35循环,70℃ 5分钟(图9)。用pYB36CS1F和pYB36CS1R(SEQ ID NO:28)引物(表8),5%DMSO(v:v),KOD Hot Start主混合物使用以下循环条件扩增来自T206的gDNA:95℃ 2分钟,(95℃ 20秒,61℃ 10秒,70℃ 11秒)x35循环,70℃ 5分钟(图10)。使用pYB36CS4F(SEQ IDNO:30)和pYB36CS4R(SEQ ID NO:31)引物(表8),5%DMSO(v:v)、KOD Hot Start主混合物使用以下扩增循环扩增来自T205和T209的gDNA:95℃ 2分钟,(95℃ 20秒,61℃ 10秒,70℃21秒)x35循环,70℃ 5分钟(图9)。
表8
将得到的PCR扩增子柱纯化,克隆到pJet1.2载体中(Thermo Fisher,沃尔瑟姆,MA)中,微量制备所得的细菌转化子,并用试剂盒中提供的引物对插入物测序。使用Geneious软件比对序列。
成功进行了用编码gRNA的载体转化两个Cas9背景(T188和T189),并产生许多双重营养缺陷型菌株,如下表9中所示(称为T202-209)。随后在遗传水平上分析选择的菌株以检测类胡萝卜素合酶基因座的任何突变,其指示非同源末端连接(NHEJ)事件。
表9
从显示为营养缺陷型的gRNA+Cas9转化子(需要补充DHA和棕榈酸)中分离gDNA后,分别使用一个PCR以扩增包含前3个CS gRNA靶物的整个区域作为一个扩增子以及另一个PCR以扩增gRNA3 CS4靶物(图9)。来自gRNA3 CS1-3转化子DNA的扩增子的预期大小为1040bp,来自gRNA 3 CS4转化子的预期大小为715bp。在gRNA CS1-3靶物的扩增子的情况下,来自T188谱系的样品具有正确大小的单一条带。然而,来自T189的样品(包括来自T189亲本菌株本身的gDNA)具有多个条带,其中~1kbp条带最突出,~1.5kbp条带是第二最突出的。将1.5kbp条带被判断为非特异性扩增的产物。为了减少非特异性条带的存在,没有进行PCR的优化,并且对于所有转化子从凝胶中切出~1kbp带并用于pJet1.2克隆。所有CS4扩增子都是正确大小的单一条带。将携带来自每个Cas9/gRNA转化子的几个所得的pJet转化子菌落送去测序以确定Cas9/gRNA是否对CS序列具有任何影响。
此外,对克隆的T206谱系进行分析,如图9中所描述,T206转化子提取gDNA并用作仅扩增gRNA3 CS1靶序列的PCR的模板,且预期的扩增子大小为689bp。在凝胶上观察到这种大小的条带,这是在其他更高分子量的条带中的主要条带,类似于上图中观察到的那些。切割并纯化并纯化预期~700bp大小的凝胶片段,并用于pJet1.2克隆和片段测序,以确定Cas9-gDNA是否诱导了CS基因中的任何序列变化(图10)。
对含有来自Cas9和gRNA编码载体二者转化的克隆的CS基因座的扩增子的多个pJet载体测序后,观察到发生的几种变化(表10)。先前的工作表明CAS9切割DNA并在PAM序列上游三个碱基对的位点处产生双链断裂(Jinek等,“A programmable dual-RNA-guidedDNA endonuclease in adaptive bacterial immunity”Science 337(6096):816-821,2012)。已知在双链断裂位点处突变可形成不精确的非同源末端连接(NHEJ)介导的修复,其可产生可变长度的插入和/或缺失突变(Sander和Joung,“CRISPR-Cas systems forediting,regulating and targeting genomes”Nat Biotechnol.32(4):347-355,2014)。观察到的所有变化均发生在相对于PAM(在此情况中为AGG)的-3位置中。在Cas9+gRNA转化子中检测到的裂殖壶菌属菌种20888的类胡萝卜素合酶的例示性突变显示在表10中,缺失显示为破折号,插入显示为下划线文本。
表10
野生型核苷酸位置# | 15 | 16 | 17 | 18 | 19 | 20 | PAM/NGG |
野生型 | A | C | G | C | G | C | AGG |
CS1靶物-变体#1 | A | C | G | C | - | - | AGG |
CS1靶物-变体#2 | A | C | - | C | G | C | AGG |
CS1靶物-变体#3 | A | C | G | <u>C</u>C | G | C | AGG |
CS1靶物-变体#4 | A | C | G | <u>T</u>C | G | C | AGG |
本说明书中引用的所有参考文献均通过提述并入本文,如同每个参考文献被具体和单独地指出通过提述并入。任何参考文献的引用均为其在申请日之前的公开内容,且不应被解释为承认本公开内容无权凭借在先发明而先于此类参考文献。
应当理解,上述元件中的每一个、或者两个或更多个元件一起也可以在与上述类型不同的其他类型的方法中找到有用的应用。在没有进一步分析的情况下,上述内容将如此充分地揭示本公开的主旨,即其他人可以(通过应用当前知识)容易地将其适用于各种应用而不会遗漏(从现有技术的角度来看)完全构成所附权利要求中阐述的本发明的一般或特定方面的基因特征的特征。上述实施方案仅以实施例呈现;本公开的范围仅由以上权利要求限制。
实施例5
设计和构建Cas9载体(pYB61)
先前,设计Cas9质粒用于在PUFA合酶基因(OrfA亚基;参见pYB32和pYB33)处的靶向整合。以这种方式设计的Cas9盒的整合导致OrfA基因敲除和DHA营养缺陷型。营养缺陷型的诱导使得能够更容易地筛选转化子以便随后在OrfA基因座处整合,但使得CRISPR介导的胡萝卜素合成酶敲除的区别更加困难。构建具有Cas9表达盒而不靶向任何染色体基因座的质粒,以测试异位、随机整合的作用。用BamHI-HF(NEB)和NdeI(NEB)消化质粒pCL122-Cas9(SEQ ID NO:1),得到两个片段,大小为4140bp和5780bp。将4140bp片段在1%琼脂糖凝胶上分离,切下,并使用QIA快速凝胶提取试剂盒(Qiagen)纯化(图11)。质粒pYB30(SEQ ID NO:32)包含α-微管蛋白启动子的部分片段,该启动子驱动GFP和博来霉素抗性的表达。用BamHI-HF(NEB)和NdeI(NEB)消化此质粒,得到两个片段,838bp和4724bp。将4724bp片段在1%琼脂糖凝胶上分离,切下,并使用QIA快速凝胶提取试剂盒(Qiagen)纯化(图11)。使用快速DNA连接试剂盒(Roche)连接所述两个感兴趣的片段。然后用一些连接反应转化NEB10β化学感受态细胞(NEB)。得到的菌落用作模板用于通过使用如下的PCR进行筛选:2x GoTaqGreen主混合物(Promega)、引物121Tub seq F和pYB32/3C R1和5%终DMSO。应用下列循环条件:95℃5分钟,[95℃ 30秒,59℃ 30秒,72℃ 1分钟]35循环和72℃ 5分钟(如先前所述)(图12)。从通过PCR确认为阳性转化子的菌落中提取质粒,测序,并将得到的载体命名为pYB61(SEQ ID NO:33)。
表11
引物名称 | SEQ ID NO | 引物序列,5’→3’ |
121Tub seq F | 13 | GGATCTCATGCTGGAGTTCTTC |
pYB32/3C R1 | 14 | GTACTTCTCGTGGTAGGCAACC |
实施例6
设计和构建非靶向gRNA载体(pYB66)
先前,gRNA质粒靶向脂肪酸合酶(FAS)基因座,由此产生对棕榈酸的营养缺陷型需求。此营养缺陷型掩盖了由CRISPR介导的胡萝卜素合成酶失活引起的表型。为了更好地辨别参与类胡萝卜素生物合成的基因座上的CRISPR介导的表型变化,制备了非靶向gRNA载体。用BamHI-HF(NEB)和NdeI(NEB)消化质粒pCL122(SEQ ID NO:37)以除去编码GFP的阅读框,产生两个片段,大小为838bp和5773bp。在1%琼脂糖凝胶上分离5773bp片段,切下,并使用QIA快速凝胶提取试剂盒(Qiagen)纯化(图13)。通过使用质粒pYB36(SEQ ID NO:9)作为模板及如下的PCR扩增编码gRNA3 CS1的盒:2x KOD Hot Start主混合物(EMD Millipore)、引物pYB66BamBgl F和pYB66Nde R和5%终DMSO。应用下列循环条件:95℃2分钟,[95℃20秒,59℃10秒,70℃5秒]35个循环,72℃2分钟(图14)。使用QIA快速PCR纯化试剂盒(Qiagen)对得到的PCR片段柱纯化,并用BamHI-HF(NEB)和NdeI(NEB)消化。消化后,再次使用QIA快速PCR纯化试剂盒纯化得到的DNA片段(图15)。使用快速DNA连接试剂盒(Roche)连接消化的pCL122和gRNA片段。然后用连接反应的部分转化NEB10β化学感受态细胞,并使用2x GoTaqGreen主混合物(Promega)、引物pYB66EF1seq F和pCL122OrfC R以及5%终体积的DMSO及下列循环条件通过菌落PCR筛选得到的细菌菌落:95℃ 10分钟,[95℃ 30秒,60℃ 30秒,72℃45秒]35循环,72℃ 5分钟(图16)。从通过PCR确定为阳性的菌落中提取质粒,测序,并将得到的载体命名为pYB66(SEQ ID NO:34)。
表12
引物名称 | SEQ ID NO | 引物序列,5’→3’ |
pYB66BamBgl F | 38 | CAAGGGATCCAGATCTTCCGCACTGATGAGTC |
pYB66Nde R | 39 | AACTCATATGGTCCCATTCGCCA |
pYB66EF1seq F | 40 | GAGAGGATAGTATCTTGCGTGCTTG |
pCL122OrfC R | 41 | GCAAGGTTGGAACATTACGATCAAG |
实施例7
设计和构建Cas9和gRNA载体(pYB73)
建立含有在相同载体上具有单一显性选择标记的Cas9和gRNA盒二者载体,以测试这种构型对基因组编辑的效率。用PstI(NEB)消化质粒pYB61,并通过QIA快速PCR纯化试剂盒(Qiagen)纯化(图17)。使用PCR及如下从pYB36扩增gRNA表达盒:2x KOD热启动主混合物(Novagen)、引物pYB73gRNA PstKpn IF F和pYB73gRNA XhoPst IF R和5%终DMSO。使用如下循环条件:95℃ 2分钟,[95℃ 20秒,58℃ 10秒,70℃ 38秒]35循环,70℃ 2分钟(图18)。使用QIA快速PCR纯化试剂盒(Qiagen)对得到的PCR片段柱纯化。使用InFusion试剂盒(Clontech)按照制造商的方案将纯化的、消化的pYB61片段连接到纯化的消化的gRNA PCR片段上。用InFusion反应的部分转化NEB10β化学感受态细胞,并通过使用如下的PCR筛选得到的细菌菌落:2x GoTaq Green主混合物(Promega),引物pYB73seq F和pYB73seq R和5%终DMSO。应用以下循环条件:95℃ 10分钟,[95℃ 30秒,60℃ 30秒,72℃ 2分钟]35循环和72℃ 5分钟(图19)。从通过PCR确定为阳性的菌落中提取质粒,测序,并将得到的载体命名为pYB73(SEQ ID NO:35)。质粒pYB73不是用于靶向任何特定基因而设计的。
表13
实施例8
设计、构建和转化CarG菌株
为了改善具有CRIPSR介导的胡萝卜素合成酶基因失活(白色菌落表型)和没有CRIPSR介导的胡萝卜素合成酶基因失活(黄橙色菌落表型)的转化子之间的区别,将来自卷枝毛霉(Mucor circinelloides)的CarG基因(牻牛儿基牻牛儿基焦磷酸合酶)密码子优化用于裂殖壶菌属中表达。通过DNA2.0合成CarG基因(其可增加产生的类胡萝卜素的总量并使转化子更加橙色)并克隆到含有杀稻瘟素选择盒的裂殖壶菌属表达载体中。将得到的载体命名为pCL310(SEQ ID NO:36)。
裂殖壶菌属菌种ATCC 20888的野生型菌株用于通过粒子轰击方法(Bio-Rad)用pCL310的转化。ATCC 20888在250mL光滑底部锥形瓶中的25mL的M50-20培养基中在+27℃、以200rpm振荡过夜生长。然后,将该20888培养物以1/100稀释到250mL带挡板的烧瓶中的50mL的M2B培养基中,并在先前使用的条件下过夜生长。当该20888培养物处于早期对数期(0.6-2OD单位/mL)时,通过在3,220×g离心10分钟收获。倾析上清液,将沉淀重悬于M2B中至终浓度为20OD单位/mL。将100μL所得细胞悬浮液涂布在约三分之一的非选择性M2B琼脂平板(直径约2英寸)上。将5μg质粒DNA和5μg pCL310与50μL的2.5M CaCl2、20μL的0.1M亚精胺和50μL制备的M10钨珠(依照制造商的方案)混合,涡旋1分钟,然后在室温温育10分钟以使珠子沉降。用250μL的100%乙醇洗涤DNA包被的珠子一次,然后将珠子重悬于60μL的100%乙醇中。每个制备的大载体(依照制造商的用于大载体组装制备的方案)具有在导致来自罩的最小振动的条件下位置在中心的10μL的乙醇中包被的珠子,并使乙醇干燥。将两者在70%异丙醇中短暂灭菌后,破裂盘支架内固定在1,100psi破裂盘上。组装好的大载体平台置于顶部搁架位置,并将具有裂殖壶菌属菌种20888的细胞碎片的M2B琼脂平板细胞侧面向上(cell-side-up)置于从顶部开始的第三个架子上。当轰击机械内的真空达到27英寸汞柱时,射出氦气直至破裂盘失效。然后,将氦气流关闭,将该腔室通风至大气。从腔室中移出轰击的板。对所有样品和对照重复所述轰击过程。将用pCL310轰击的20888菌株命名为T212。将轰击的板在+27℃温育器温育4小时,然后用~1mL M2B从板上洗掉细胞,并在含有100μg/mL杀稻瘟菌素(Thermo Fisher)的4个M2B琼脂平板之间平均分配。用3mm无菌玻璃珠涂布细胞。移出珠子后,包裹平板并在+27℃温育约5至8天。当菌落大小达到2-4毫米时,将菌落在含有100μg/mL杀稻瘟菌素的M2B琼脂平板上修复。挑选确认为对杀稻瘟菌素有抗性的菌落,并将其接种到250mL光滑底部锥形瓶中的50mL M50-20中,并置于+27℃和200rpm的振荡器中48小时。48小时温育时间后,通过以4,000×g离心10分钟收集2毫升培养物。倾析上清,并依照改良的苯酚-氯仿提取,将沉淀用于基因组DNA分离。提取基因组DNA并用作使用GoTaq Green主混合物(Promega)的PCR模板,使用引物pYB13pYB1seq F和pCL122OrfC R和5%终浓度DMSO以验证Cas9盒的存在。应用下列循环条件:95℃ 2分钟,[95℃ 3秒,63℃30秒,72℃ 1分45秒]35循环,和72℃ 5分钟(图20)。如通过PCR测定的pCL130转化DNA的存在呈阳性并且与野生型对照相比呈现更深橙色的几个转化子通过UV-Vis方法分析总类胡萝卜素。在该分析中,鉴定出两个菌株具有较高的总类胡萝卜素,即T212-3-1和T212-3-2。选择T212-3-2用于随后的基因组编辑元件的工作。
表14
引物名称 | SEQ ID NO | 引物序列,5’→3’ |
pYB13pYB1seq F | 46 | GAGAGGATAGTATCTTGCGTGCTTGG |
pCL122OrfC R | 41 | GCAAGGTTGGAACATTACGATCAAG |
实施例9
用pYB61、pYB66和pYB73转化T212和20888
为了测试非靶向载体对裂殖壶菌中编辑效率的影响,使用上述粒子轰击方法进行了几次转化。转化设置如下:T280—用pYB61转化T280-T212-3-2菌株,和T285—用pYB61转化ATCC 20888野生型菌株。进行两种转化以产生预表达Cas9的受体菌株用于gRNA测试工作。后续转化设置如下:T281—用pYB61和pYB66共转化T212-3-2菌株,和T286—用pYB61和pYB66共转化ATCC 20888野生型菌株。进行T281和T286转化以评估未设计成用于靶向基因组中任何特定基因座的质粒的编辑效率。完成T282—用pYB73转化T212-3-2菌株和T287—用pYB73转化ATCC 20888野生型菌株以评估用携带用于基因组编辑的两个元件的单个质粒的编辑效率。在补充有50μg/mL的博来霉素(Thermo Fisher)的M2B平板上选择T280、T282、T285、T287转化。在补充有50μg/mL的博来霉素和100μg/mL的巴龙霉素(Sigma)的M2B平板上选择T281和T286转化。将由所有这些转化产生的菌落在仅含有100μg/mL单独的博来霉素或同时含有100μg/mL博来霉素和100μg/mL巴龙霉素的选择性M2B平板上进行修复。选择在修复平板上稳固生长且在适用时显示白色菌落表型的修复物用于进一步分析。将这些菌株从修复平板上取下并接种到250mL锥形光滑底部烧瓶中25mL的M50-20培养基中。烧瓶在+27℃、200rpm生长约24小时。取2mL等分试样的每份接种物并置于微量离心管中,以7,500×g离心10分钟。倾析上清液,使用改良的酚-氯仿提取法将沉淀物用于制备基因组DNA。通过PCR对得到的gDNA进行分析,以确定选择盒和感兴趣的基因的存在。对于T280、T281、T285、T286,使用以下扩增选择盒终止子和Cas9基因起点之间的连接:2X GoTaq Green主混合物、引物121Tub seq F和pYB32/3 CR1、5%终浓度的DMSO和gDNA。应用下列循环条件:95℃ 2分钟,[95℃ 30秒,28℃ 30秒,72℃ 1分2秒]35循环和72℃ 5分钟(图21)。对于T281和T286,通过如下PCR扩增整个gRNA盒来评估gRNA盒的存在:2x GoTaq Green主混合物、引物pYB66EF1seq F和pCL122OrfC R、5%终浓度的DMSO和gDNA。应用下列循环条件:95℃2分钟,[95℃ 30秒,60℃ 30秒,72℃ 47秒]35循环和72℃ 5分钟(图22)。对于T282和T287,通过如下PCR评估gRNA盒的存在:2x GoTaq Green主混合物、引物pYB66EF1seq F和TT pYB73HDVR、5%终浓度的DMSO和gDNA。应用下列循环条件:95℃ 2分钟[95℃ 30秒,60.9℃ 30秒,72℃16秒]35循环和72℃ 5分钟(图23)。对通过PCR测试对于Cas9和gRNA呈阳性的T281、T282、T286和T287转化子进行PCR以扩增gRNA影响变化的部分CS基因的部分,以对PCR扩增子测序并观察由此引起基因编辑实验的插入或缺失(indels)的类型。用下列准备用于扩增CS基因的相关部分的PCR:2X KOD Hot Star主混合物、引物pYB36CS1F和pYB36CS1R、5%终浓度的DMSO和gDNA。应用下列循环条件:95℃ 2分钟,[95℃ 20秒,61℃ 10秒,70℃ 11秒)]35个循环和70℃ 5分钟(图24)。使用QIA快速PCR纯化试剂盒(Qiagen)对PCR片段柱纯化,并用pYB36CS1F和pYB36CS1R进行序列验证。
表15
引物名称 | SEQ ID NO | 引物序列,5’→3’ |
pYB66 EF1 seq F | 40 | GAGAGGATAGTATCTTGCGTGCTTG |
pCL122 OrfC R | 41 | GCAAGGTTGGAACATTACGATCAAG |
TT pYB73 HDV R | 47 | GAAGCATGTTGCCCAGCC |
pYB36 CS1 F | 27 | GAGTCGAAGGAGACGTTGTCG |
pYB36 CS1 R | 28 | GTCATTGCGAATGATGCGATATG |
序列表
<110> 帝斯曼知识产权资产管理有限公司(DSM IP ASSETS B.V.)
<120> 用于海藻宿主细胞的CRISPR-Cas系统
<130> 32176-WO-PCT
<140> TBD
<141> 2017-07-13
<150> US62/361,741
<151> 2016-07-13
<160> 47
<170> PatentIn版本3.5
<210> 1
<211> 9920
<212> DNA
<213> 人工序列
<220>
<223> pCL122-Cas9载体
<220>
<221> misc_特征
<222> (1)..(1064)
<223> EF-1α启动子
<220>
<221> misc_特征
<222> (1070)..(5209)
<223> Cas9
<220>
<221> misc_特征
<222> (5229)..(5868)
<223> OrfC_终止子
<220>
<221> misc_特征
<222> (7153)..(8013)
<223> AmpR_基因
<220>
<221> misc_特征
<222> (8403)..(8851)
<223> α_微管蛋白_启动子
<220>
<221> misc_特征
<222> (8852)..(9646)
<223> 巴龙霉素_抗性_基因
<220>
<221> misc_特征
<222> (9647)..(9920)
<223> SV40_终止子
<400> 1
ctcttatctg cctcgcgccg ttgaccgccg cttgactctt ggcgcttgcc gctcgcatcc 60
tgcctcgctc gcgcaggcgg gcgggcgagt gggtgggtcc gcagccttcc gcgctcgccc 120
gctagctcgc tcgcgccgtg ctgcagccag cagggcagca ccgcacggca ggcaggtccc 180
ggcgcggatc gatcgatcca tcgatccatc gatccatcga tcgtgcggtc aaaaagaaag 240
gaagaagaaa ggaaaaagaa aggcgtgcgc acccgagtgc gcgctgagcg cccgctcgcg 300
gtcccgcgga gcctccgcgt tagtccccgc cccgcgccgc gcagtccccc gggaggcatc 360
gcgcacctct cgccgccccc tcgcgcctcg ccgattcccc gcctcccctt ttccgcttct 420
tcgccgcctc cgctcgcggc cgcgtcgccc gcgccccgct ccctatctgc tccccagggg 480
ggcactccgc accttttgcg cccgctgccg ccgccgcggc cgccccgccg ccctggtttc 540
ccccgcgagc gcggccgcgt cgccgcgcaa agactcgccg cgtgccgccc cgagcaacgg 600
gtggcggcgg cgcggcggcg ggcggggcgc ggcggcgcgt aggcggggct aggcgccggc 660
taggcgaaac gccgcccccg ggcgccgccg ccgcccgctc cagagcagtc gccgcgccag 720
accgccaacg cagagaccga gaccgaggta cgtcgcgccc gagcacgccg cgacgcgcgg 780
cagggacgag gagcacgacg ccgcgccgcg ccgcgcgggg ggggggaggg agaggcagga 840
cgcgggagcg agcgtgcatg tttccgcgcg agacgacgcc gcgcgcgctg gagaggagat 900
aaggcgcttg gatcgcgaga gggccagcca ggctggaggc gaaaatgggt ggagaggata 960
gtatcttgcg tgcttggacg aggagactga cgaggaggac ggatacgtcg atgatgatgt 1020
gcacagagaa gaagcagttc gaaagcgact actagcaagc aagggatcca tggataagaa 1080
gtactcgatc ggcctcgaca ttggcaccaa cagcgtcggc tgggccgtca ttactgatga 1140
gtacaaggtc ccgtcgaaga agtttaaggt cctcggcaac actgaccgcc actccatcaa 1200
gaagaacctc atcggtgccc tcctttttga ctccggcgag accgctgagg ccactcgcct 1260
caagcgcact gcccgccgcc gttacacccg ccgcaagaac cgcatctgct acctccagga 1320
gattttctcg aacgaaatgg ccaaggtcga tgactccttt ttccaccgtc tcgaagaatc 1380
gttcctcgtc gaggaggaca agaagcacga gcgccacccc atcttcggta acattgtcga 1440
tgaggttgcc taccacgaga agtacccgac catctaccac ctccgcaaga agctcgtcga 1500
ctccaccgac aaggccgatc tccgccttat ctacctcgcc ctcgcccaca tgatcaagtt 1560
ccgcggccac tttcttatcg agggtgatct caaccctgat aactctgacg tcgacaagct 1620
tttcatccag ctcgtccaga cttacaacca gctcttcgag gagaacccca tcaacgcttc 1680
cggcgtcgac gcgaaggcca ttctcagcgc ccgcctcagc aagtcccgcc gcctcgaaaa 1740
cctcattgcc cagcttcccg gcgagaagaa gaacggcctc ttcggcaacc tcattgccct 1800
cagccttggc ctcaccccta acttcaagtc gaactttgac ctcgccgagg acgccaagct 1860
ccagctttcc aaggacactt acgacgacga tctcgacaac ctcctcgctc agattggcga 1920
ccagtacgct gacctcttcc tcgccgccaa gaaccttagc gatgccatcc tcctctccga 1980
catccttcgt gttaacacgg aaatcacgaa ggctccgctc tccgcctcca tgatcaagcg 2040
ttacgacgag caccatcagg acctcaccct cctcaaggcc ctcgtccgcc agcagctccc 2100
cgagaagtac aaggagatct tcttcgacca gagcaagaac ggctacgccg gctacattga 2160
cggcggcgcg tcgcaggagg agttttacaa gtttatcaag cccattcttg agaagatgga 2220
cggcaccgag gagctcctcg tcaagctcaa ccgtgaggac cttctccgca agcagcgcac 2280
gttcgacaac ggctctattc cccatcagat ccacctcggt gagcttcacg cgattcttcg 2340
ccgccaggaa gacttttacc cgttcctcaa ggacaaccgc gagaagattg agaagatcct 2400
cacctttcgc attccctact acgtcggccc cctcgcccgc ggcaactcgc gctttgcttg 2460
gatgacccgc aagtccgagg agaccatcac cccgtggaac ttcgaagagg tcgtcgacaa 2520
gggcgcctcc gcgcagtctt tcatcgagcg catgactaac tttgacaaga acctcccgaa 2580
cgagaaggtc ctccccaagc acagcctcct ttacgaatac tttacggtgt acaacgagct 2640
cacgaaggtc aagtacgtca ctgagggcat gcgcaagccg gcgttccttt cgggcgagca 2700
gaagaaggct atcgtcgacc tccttttcaa gaccaaccgc aaggttaccg tcaagcagct 2760
caaggaggac tacttcaaga agatcgagtg ctttgactcg gtcgagattt cgggcgtgga 2820
ggaccgtttc aacgcctccc tcggcactta ccacgacctt ctcaagatca tcaaggacaa 2880
ggactttctc gacaacgagg agaacgagga cattctcgag gacatcgtcc tcacgctcac 2940
cctctttgag gaccgtgaga tgatcgagga gcgcctcaag acctacgccc atctctttga 3000
cgacaaggtc atgaagcagc tcaagcgccg ccgctacacc ggctggggcc gcctttcccg 3060
caagctcatc aacggcatcc gcgacaagca gtctggcaag accatccttg actttcttaa 3120
gtctgatggt ttcgccaacc gcaacttcat gcagctcatc cacgacgaca gcctcacttt 3180
caaggaggac attcagaagg cccaggtctc cggccagggt gactctctcc acgaacacat 3240
cgccaacctt gctggcagcc cggctattaa gaagggcatc ctccagaccg tcaaggtcgt 3300
cgacgagctc gtcaaggtta tgggccgcca caagcccgag aacatcgtca ttgagatggc 3360
tcgcgaaaac cagaccaccc agaagggtca gaagaactcc cgcgagcgca tgaagcgtat 3420
cgaggagggc atcaaggagc tcggcagcca gatcctcaag gagcacccgg tcgagaacac 3480
ccagctccag aacgaaaagc tctacctcta ctacctccag aacggccgtg acatgtacgt 3540
tgaccaggag ctcgacatta accgcctctc cgattacgac gtcgaccata ttgtccccca 3600
gagctttctc aaggacgaca gcatcgacaa caaggtcctc acccgctcgg acaagaaccg 3660
cggcaagtcc gacaacgtcc cttccgagga ggtcgtgaag aagatgaaga actactggcg 3720
ccagcttctc aacgctaagc ttattactca gcgcaagttc gataacctca ccaaggccga 3780
acgcggcggc ctctccgagc tcgacaaggc cggttttatc aagcgccagc tcgttgagac 3840
tcgccagatc accaagcacg tggcgcagat cctcgactcg cgcatgaaca cgaagtacga 3900
cgagaacgac aagctcatcc gcgaggtcaa ggtcatcacc cttaagtcga agctcgtgtc 3960
cgactttcgc aaggacttcc agttctacaa ggtccgtgaa attaacaact accaccacgc 4020
tcacgacgct tacctcaacg cggtcgtggg taccgcgctc atcaagaagt acccgaagct 4080
cgagtcggag tttgtctacg gcgactacaa ggtctacgac gtgcgcaaga tgatcgccaa 4140
gtccgagcag gagatcggca aggccacggc caagtacttt ttctactcca acattatgaa 4200
cttctttaag actgagatca cccttgccaa cggcgagatc cgcaagcgcc cccttatcga 4260
gaccaacggc gagaccggcg aaattgtgtg ggataagggt cgcgactttg ccaccgtccg 4320
caaggtcctc agcatgcccc aggtcaacat tgttaagaag accgaggtcc agacgggcgg 4380
ctttagcaag gagtctatcc tccccaagcg taacagcgac aagctcatcg cccgcaagaa 4440
ggactgggac cctaagaagt acggcggctt cgattcgcct acggtcgcct acagcgtcct 4500
cgtcgtcgcc aaggtcgaga agggcaagtc caagaagctc aagtccgtca aggagctcct 4560
cggcatcacg atcatggagc gctccagctt tgagaagaac cccattgact tcctcgaggc 4620
taagggttac aaggaggtca agaaggacct tatcatcaag ctccccaagt actccctctt 4680
tgagctcgaa aacggccgca agcgtatgct cgctagcgct ggcgaactcc agaagggcaa 4740
cgagctcgcc ctccccagca agtacgtcaa ctttctctac ctcgcctccc actacgagaa 4800
gctcaagggt agcccggagg ataacgagca gaagcagctt tttgtggagc agcacaagca 4860
ctaccttgac gagatcattg aacagatctc cgagttctcc aagcgtgtta ttcttgctga 4920
cgccaacctc gataaggtgc tctccgcgta caacaagcac cgcgacaagc ctatccgcga 4980
gcaggccgag aacatcatcc acctctttac cctcaccaac ctcggcgccc cggccgcctt 5040
taagtacttt gatacgacta tcgaccgcaa gcgctacact tcgactaagg aggtcctcga 5100
cgctaccctc attcaccagt ccattaccgg cctctacgag acccgcattg acctttcgca 5160
gctcggtggc gactcgcgtg cggaccctaa gaagaagcgc aaggtctaac atatgagtta 5220
tgagatccga aagtgaacct tgtcctaacc cgacagcgaa tggcgggagg gggcgggcta 5280
aaagatcgta ttacatagta tttttcccct actctttgtg tttgtctttt tttttttttt 5340
gaacgcattc aagccacttg tctgggttta cttgtttgtt tgcttgcttg cttgcttgct 5400
tgcctgcttc ttggtcagac ggcccaaaaa agggaaaaaa ttcattcatg gcacagataa 5460
gaaaaagaaa aagtttgtcg accaccgtca tcagaaagca agagaagaga aacactcgcg 5520
ctcacattct cgctcgcgta agaatcttag ccacgcatac gaagtaattt gtccatctgg 5580
cgaatcttta catgagcgtt ttcaagctgg agcgtgagat catacctttc ttgatcgtaa 5640
tgttccaacc ttgcataggc ctcgttgcga tccgctagca atgcgtcgta ctcccgttgc 5700
aactgcgcca tcgcctcatt gtgacgtgag ttcagattct tctcgagacc ttcgagcgct 5760
gctaatttcg cctgacgctc cttcttttgt gcttccatga cacgccgctt caccgtgcgt 5820
tccacttctt cctcagacat gcccttggct gcctcgacct gctcggtaaa acgggcccca 5880
gcacgtgcta cgagatttcg attccaccgc cgccttctat gaaaggttgg gcttcggaat 5940
cgttttccgg gacgccggct ggatgatcct ccagcgcggg gatctcatgc tggagttctt 6000
cgcccacccc aacttgttta ttgcagctta taatggttac aaataaagca atagcatcac 6060
aaatttcaca aataaagcat ttttttcact gcattctagt tgtggtttgt ccaaactcat 6120
caatgtatct tatcatacat ggtcgacctg caggaacctg cattaatgaa tcggccaacg 6180
cgcggggaga ggcggtttgc gtattgggcg ctcttccgct tcctcgctca ctgactcgct 6240
gcgctcggtc gttcggctgc ggcgagcggt atcagctcac tcaaaggcgg taatacggtt 6300
atccacagaa tcaggggata acgcaggaaa gaacatgtga gcaaaaggcc agcaaaaggc 6360
caggaaccgt aaaaaggccg cgttgctggc gtttttccat aggctccgcc cccctgacga 6420
gcatcacaaa aatcgacgct caagtcagag gtggcgaaac ccgacaggac tataaagata 6480
ccaggcgttt ccccctggaa gctccctcgt gcgctctcct gttccgaccc tgccgcttac 6540
cggatacctg tccgcctttc tcccttcggg aagcgtggcg ctttctcata gctcacgctg 6600
taggtatctc agttcggtgt aggtcgttcg ctccaagctg ggctgtgtgc acgaaccccc 6660
cgttcagccc gaccgctgcg ccttatccgg taactatcgt cttgagtcca acccggtaag 6720
acacgactta tcgccactgg cagcagccac tggtaacagg attagcagag cgaggtatgt 6780
aggcggtgct acagagttct tgaagtggtg gcctaactac ggctacacta gaagaacagt 6840
atttggtatc tgcgctctgc tgaagccagt taccttcgga aaaagagttg gtagctcttg 6900
atccggcaaa caaaccaccg ctggtagcgg tggttttttt gtttgcaagc agcagattac 6960
gcgcagaaaa aaaggatctc aagaagatcc tttgatcttt tctacggggt ctgacgctca 7020
gtggaacgaa aactcacgtt aagggatttt ggtcatgaga ttatcaaaaa ggatcttcac 7080
ctagatcctt ttaaattaaa aatgaagttt taaatcaatc taaagtatat atgagtaaac 7140
ttggtctgac agttaccaat gcttaatcag tgaggcacct atctcagcga tctgtctatt 7200
tcgttcatcc atagttgcct gactccccgt cgtgtagata actacgatac gggagggctt 7260
accatctggc cccagtgctg caatgatacc gcgagaccca cgctcaccgg ctccagattt 7320
atcagcaata aaccagccag ccggaagggc cgagcgcaga agtggtcctg caactttatc 7380
cgcctccatc cagtctatta attgttgccg ggaagctaga gtaagtagtt cgccagttaa 7440
tagtttgcgc aacgttgttg ccattgctac aggcatcgtg gtgtcacgct cgtcgtttgg 7500
tatggcttca ttcagctccg gttcccaacg atcaaggcga gttacatgat cccccatgtt 7560
gtgcaaaaaa gcggttagct ccttcggtcc tccgatcgtt gtcagaagta agttggccgc 7620
agtgttatca ctcatggtta tggcagcact gcataattct cttactgtca tgccatccgt 7680
aagatgcttt tctgtgactg gtgagtactc aaccaagtca ttctgagaat agtgtatgcg 7740
gcgaccgagt tgctcttgcc cggcgtcaat acgggataat accgcgccac atagcagaac 7800
tttaaaagtg ctcatcattg gaaaacgttc ttcggggcga aaactctcaa ggatcttacc 7860
gctgttgaga tccagttcga tgtaacccac tcgtgcaccc aactgatctt cagcatcttt 7920
tactttcacc agcgtttctg ggtgagcaaa aacaggaagg caaaatgccg caaaaaaggg 7980
aataagggcg acacggaaat gttgaatact catactcttc ctttttcaat attattgaag 8040
catttatcag ggttattgtc tcatgagcgg atacatattt gaatgtattt agaaaaataa 8100
acaaataggg gttccgcgca catttccccg aaaagtgcca cctgacgtct aagaaaccat 8160
tattatcatg acattaacct ataaaaatag gcgtatcacg aggccctttc gtctcgcgcg 8220
tttcggtgat gacggtgaaa acctctgaca catgcagctc ccggagacgg tcacagcttg 8280
tctgtaagcg gatgccggga gcagacaagc ccgtcagggc gcgtcagcgg gtgttggcgg 8340
gtgtcggggc tggcttaact atgcggcatc agagcagatt gtactgagag tgcaccaagc 8400
ttccaatttt aggcccccca ctgaccgagg tctgtcgata atccactttt ccattgattt 8460
tccaggtttc gttaactcat gccactgagc aaaacttcgg tctttcctaa caaaagctct 8520
cctcacaaag catggcgcgg caacggacgt gtcctcatac tccactgcca cacaaggtcg 8580
ataaactaag ctcctcacaa atagaggaga attccactga caactgaaaa caatgtatga 8640
gagacgatca ccactggagc ggcgcggcgg ttgggcgcgg aggtcggcag caaaaacaag 8700
cgactcgccg agcaaacccg aatcagcctt cagacggtcg tgcctaacaa cacgccgttc 8760
taccccgcct tcttcgcgcc ccttcgcgtc caagcatcct tcaagtttat ctctctagtt 8820
caacttcaag aagaacaaca ccaccaacac catgattgaa caagatggat tgcacgcagg 8880
ttctccggcc gcttgggtgg agaggctatt cggctatgac tgggcacaac agacaatcgg 8940
ctgctctgat gccgccgtgt tccggctgtc agcgcagggg cgcccggttc tttttgtcaa 9000
gaccgacctg tccggtgccc tgaatgaact gcaggacgag gcagcgcggc tatcgtggct 9060
ggccacgacg ggcgttcctt gcgcagctgt gctcgacgtt gtcactgaag cgggaaggga 9120
ctggctgcta ttgggcgaag tgccggggca ggatctcctg tcatctcacc ttgctcctgc 9180
cgagaaagta tccatcatgg ctgatgcaat gcggcggctg catacgcttg atccggctac 9240
ctgcccattc gaccaccaag cgaaacatcg catcgagcga gcacgtactc ggatggaagc 9300
cggtcttgtc gatcaggatg atctggacga agagcatcag gggctcgcgc cagccgaact 9360
gttcgccagg ctcaaggcgc gcatgcccga cggcgatgat ctcgtcgtga cccatggcga 9420
tgcctgcttg ccgaatatca tggtggaaaa tggccgcttt tctggattca tcgactgtgg 9480
ccggctgggt gtggcggacc gctatcagga catagcgttg gctacccgtg atattgctga 9540
agagcttggc ggcgaatggg ctgaccgctt cctcgtgctt tacggtatcg ccgctcccga 9600
ttcgcagcgc atcgccttct atcgccttct tgacgagttc ttctgacacg tgctacgaga 9660
tttcgattcc accgccgcct tctatgaaag gttgggcttc ggaatcgttt tccgggacgc 9720
cggctggatg atcctccagc gcggggatct catgctggag ttcttcgccc accccaactt 9780
gtttattgca gcttataatg gttacaaata aagcaatagc atcacaaatt tcacaaataa 9840
agcatttttt tcactgcatt ctagttgtgg tttgtccaaa ctcatcaatg tatcttatca 9900
tgtctgaatt cccggggtac 9920
<210> 2
<211> 7393
<212> DNA
<213> 人工序列
<220>
<223> pYB31载体
<220>
<221> misc_特征
<222> (2)..(450)
<223> α_微管蛋白_启动子
<220>
<221> misc_特征
<222> (457)..(549)
<223> Sec1_信号_针对_eGFP
<220>
<221> misc_特征
<222> (550)..(1266)
<223> eGFP
<220>
<221> misc_特征
<222> (1294)..(2293)
<223> OrfA_终止子
<220>
<221> misc_特征
<222> (4971)..(5970)
<223> OrfA_UP_同源
<220>
<221> misc_特征
<222> (5974)..(6289)
<223> OrfC_终止子
<220>
<221> misc_特征
<222> (6296)..(6744)
<223> α_微管蛋白_启动子
<220>
<221> misc_特征
<222> (6745)..(7119)
<223> Sh_ble_基因
<220>
<221> misc_特征
<222> (7120)..(7393)
<223> SV40_终止子
<400> 2
cccaatttta ggccccccac tgaccgaggt ctgtcgataa tccacttttc cattgatttt 60
ccaggtttcg ttaactcatg ccactgagca aaacttcggt ctttcctaac aaaagctctc 120
ctcacaaagc atggcgcggc aacggacgtg tcctcatact ccactgccac acaaggtcga 180
taaactaagc tcctcacaaa tagaggagaa ttccactgac aactgaaaac aatgtatgag 240
agacgatcac cactggagcg gcgcggcggt tgggcgcgga ggtcggcagc aaaaacaagc 300
gactcgccga gcaaacccga atcagccttc agacggtcgt gcctaacaac acgccgttct 360
accccgcctt cttcgcgccc cttcgcgtcc aagcatcctt caagtttatc tctctagttc 420
aacttcaaga agaacaacac caccaacacc ggatccatga agttcgcgac ctcggtcgca 480
attttgcttg tggccaacat agccaccgcc ctcgcgcaga gcgatggctg cacccccacc 540
gaccagacga tggtgagcaa gggcgaggag ctgttcaccg gggtggtgcc catcctggtc 600
gagctggacg gcgacgtaaa cggccacaag ttcagcgtgt ccggcgaggg cgagggcgat 660
gccacctacg gcaagctgac cctgaagttc atctgcacca ccggcaagct gcccgtgccc 720
tggcccaccc tcgtgaccac cctgacctac ggcgtgcagt gcttcagccg ctaccccgac 780
cacatgaagc agcacgactt cttcaagtcc gccatgcccg aaggctacgt ccaggagcgc 840
accatcttct tcaaggacga cggcaactac aagacccgcg ccgaggtgaa gttcgagggc 900
gacaccctgg tgaaccgcat cgagctgaag ggcatcgact tcaaggagga cggcaacatc 960
ctgggacaca agctggagta caactacaac agccacaacg tctatatcat ggccgacaag 1020
cagaagaacg gcatcaaggt gaacttcaag atccgccaca acatcgagga cggcagcgtg 1080
cagctcgccg accactacca gcagaacacc cccatcggcg acggccccgt gctgctgccc 1140
gacaaccact acctgagcac ccagtccgcc ctgagcaaag accccaacga gaagcgcgat 1200
cacatggtcc tgctggagtt cgtgaccgcc gccgggatca ctctcggcat ggacgagctg 1260
tacaagcacc accatcacca ccactaacat atgatctaaa ctagtgaatc gcgacaagtt 1320
gtctttttgt tactctacgt actgctcttt ctaattttac gacgtatgct tctgctcttg 1380
acgacgacaa ccatggcaat aaaagtaagg caagaagtga gtgcgtgctc gctcacaagg 1440
tctaggccga aacgaggcgc cttaggattg gttgtctccg tcgtaagtca tgacggagcg 1500
taggacaccg acggcctgcc gcgcaaatat acgaaccgct gcacaattct tttcgttgag 1560
aacaacctcg aacggcctgc cttgctgagc tgccgacacg gtggaaggaa gcatagcggc 1620
caatcgaggg gatgctatta attaggcttg gcgctgctgc cgccgtgcct gaagatgtgc 1680
gcaagcgtgg caacaccgtc caccttgcca ttaaagtcat gcactccaaa tacctcgaac 1740
agagcctctc gcatgtttgg ccaagcacct tcgagagagt ctggactctc actccttcct 1800
caccgttgtc gccattctca gcgagctcat gcaatcacca ggacggagag acggccagct 1860
gcttttctgc tttccattgt tattagagaa acgcttctcg ctctcatcgt cttagtagac 1920
attccgatgg cttcgttcgc caatttgtca cctaagtaag ctagagtgtt aagtctaaat 1980
gcctttgacc cgcgtacggc gtcacgtaga tgcctgtcct tgccagcaaa cgctagttcg 2040
cggtgtgcgt aatttggccc gcattatgct ggctctcaaa atcaaccgcc accactcgcg 2100
gctgcacgat gattttcgtg cactcatgac atgagaaatg tgatactcaa actagtatag 2160
acctcctact cctactgctg cttttctcgt cagagctgtc tccggaaaag ttgacaagtt 2220
gttggccttc ttcttctctg ctagtaagta gatcatcatg gatgagacga tgatgataat 2280
gatgatgatg ataatttaaa tctcgagacc ttcgagcgct gctaatttcg cctgacgctc 2340
cttcttttgt gcttccatga cacgccgctt caccgtgcgt tccacttctt cctcagacat 2400
gcccttggct gcctcgacct gctcggtaaa acgggcccca gcacgtgcta cgagatttcg 2460
attccaccgc cgccttctat gaaaggttgg gcttcggaat cgttttccgg gacgccggct 2520
ggatgatcct ccagcgcggg gatctcatgc tggagttctt cgcccacccc aacttgttta 2580
ttgcagctta taatggttac aaataaagca atagcatcac aaatttcaca aataaagcat 2640
ttttttcact gcattctagt tgtggtttgt ccaaactcat caatgtatct tatcatacat 2700
ggtcgacctg caggaacctg cattaatgaa tcggccaacg cgcggggaga ggcggtttgc 2760
gtattgggcg ctcttccgct tcctcgctca ctgactcgct gcgctcggtc gttcggctgc 2820
ggcgagcggt atcagctcac tcaaaggcgg taatacggtt atccacagaa tcaggggata 2880
acgcaggaaa gaacatgtga gcaaaaggcc agcaaaaggc caggaaccgt aaaaaggccg 2940
cgttgctggc gtttttccat aggctccgcc cccctgacga gcatcacaaa aatcgacgct 3000
caagtcagag gtggcgaaac ccgacaggac tataaagata ccaggcgttt ccccctggaa 3060
gctccctcgt gcgctctcct gttccgaccc tgccgcttac cggatacctg tccgcctttc 3120
tcccttcggg aagcgtggcg ctttctcata gctcacgctg taggtatctc agttcggtgt 3180
aggtcgttcg ctccaagctg ggctgtgtgc acgaaccccc cgttcagccc gaccgctgcg 3240
ccttatccgg taactatcgt cttgagtcca acccggtaag acacgactta tcgccactgg 3300
cagcagccac tggtaacagg attagcagag cgaggtatgt aggcggtgct acagagttct 3360
tgaagtggtg gcctaactac ggctacacta gaagaacagt atttggtatc tgcgctctgc 3420
tgaagccagt taccttcgga aaaagagttg gtagctcttg atccggcaaa caaaccaccg 3480
ctggtagcgg tggttttttt gtttgcaagc agcagattac gcgcagaaaa aaaggatctc 3540
aagaagatcc tttgatcttt tctacggggt ctgacgctca gtggaacgaa aactcacgtt 3600
aagggatttt ggtcatgaga ttatcaaaaa ggatcttcac ctagatcctt ttaaattaaa 3660
aatgaagttt taaatcaatc taaagtatat atgagtaaac ttggtctgac agttaccaat 3720
gcttaatcag tgaggcacct atctcagcga tctgtctatt tcgttcatcc atagttgcct 3780
gactccccgt cgtgtagata actacgatac gggagggctt accatctggc cccagtgctg 3840
caatgatacc gcgagaccca cgctcaccgg ctccagattt atcagcaata aaccagccag 3900
ccggaagggc cgagcgcaga agtggtcctg caactttatc cgcctccatc cagtctatta 3960
attgttgccg ggaagctaga gtaagtagtt cgccagttaa tagtttgcgc aacgttgttg 4020
ccattgctac aggcatcgtg gtgtcacgct cgtcgtttgg tatggcttca ttcagctccg 4080
gttcccaacg atcaaggcga gttacatgat cccccatgtt gtgcaaaaaa gcggttagct 4140
ccttcggtcc tccgatcgtt gtcagaagta agttggccgc agtgttatca ctcatggtta 4200
tggcagcact gcataattct cttactgtca tgccatccgt aagatgcttt tctgtgactg 4260
gtgagtactc aaccaagtca ttctgagaat agtgtatgcg gcgaccgagt tgctcttgcc 4320
cggcgtcaat acgggataat accgcgccac atagcagaac tttaaaagtg ctcatcattg 4380
gaaaacgttc ttcggggcga aaactctcaa ggatcttacc gctgttgaga tccagttcga 4440
tgtaacccac tcgtgcaccc aactgatctt cagcatcttt tactttcacc agcgtttctg 4500
ggtgagcaaa aacaggaagg caaaatgccg caaaaaaggg aataagggcg acacggaaat 4560
gttgaatact catactcttc ctttttcaat attattgaag catttatcag ggttattgtc 4620
tcatgagcgg atacatattt gaatgtattt agaaaaataa acaaataggg gttccgcgca 4680
catttccccg aaaagtgcca cctgacgtct aagaaaccat tattatcatg acattaacct 4740
ataaaaatag gcgtatcacg aggccctttc gtctcgcgcg tttcggtgat gacggtgaaa 4800
acctctgaca catgcagctc ccggagacgg tcacagcttg tctgtaagcg gatgccggga 4860
gcagacaagc ccgtcagggc gcgtcagcgg gtgttggcgg gtgtcggggc tggcttaact 4920
atgcggcatc agagcagatt gtactgagag tgcaccaagc ttatttaaat ctttatcggt 4980
gtggcgcgcc ttgacggccg cctcggattc acttcgcagg gcacttctga cgcgctcaag 5040
cgtgcccagc gtggtgccat ctttggcctc tgcaagacca tcggcctcga gtggtccgag 5100
tctgacgtct tttcccgcgg cgtggacatt gctcagggca tgcaccccga ggatgccgcc 5160
gtggcgattg tgcgcgagat ggcgtgcgct gacattcgca ttcgcgaggt cggcattggc 5220
gcaaaccagc agcgctgcac gatccgtgcc gccaagctcg agaccggcaa cccgcagcgc 5280
cagatcgcca aggacgacgt gctgctcgtt tctggcggcg ctcgcggcat cacgcctctt 5340
tgcatccggg agatcacgcg ccagatcgcg ggcggcaagt acattctgct tggccgcagc 5400
aaggtctctg cgagcgaacc ggcatggtgc gctggcatca ctgacgagaa ggctgtgcaa 5460
aaggctgcta cccaggagct caagcgcgcc tttagcgctg gcgagggccc caagcccacg 5520
ccccgcgctg tcactaagct tgtgggctct gttcttggcg ctcgcgaggt gcgcagctct 5580
attgctgcga ttgaagcgct cggcggcaag gccatctact cgtcgtgcga cgtgaactct 5640
gccgccgacg tggccaaggc cgtgcgcgat gccgagtccc agctcggtgc ccgcgtctcg 5700
ggcatcgttc atgcctcggg cgtgctccgc gaccgtctca tcgagaagaa gctccccgac 5760
gagttcgacg ccgtctttgg caccaaggtc accggtctcg agaacctcct cgccgccgtc 5820
gaccgcgcca acctcaagca catggtcctc ttcagctcgc tcgccggctt ccacggcaac 5880
gtcggccagt ctgactacgc catggccaac gaggccctta acaagatggg cctcgagctc 5940
gccaaggacg tctcggtcaa gtcgatctgc taagaaagtg aaccttgtcc taacccgaca 6000
gcgaatggcg ggagggggcg ggctaaaaga tcgtattaca tagtattttc ccctactctt 6060
tgtgtttgtc tttttttttt ttgaacgcat tcaagccact tgtcttggtt tacttgtttg 6120
tttgcttgct tgcttgcttg cttgcctgct tcttggtcag acggacccaa aaaagggaaa 6180
aaattcattc atggcacaga taagaaaaag aaaaagtttg tcgaccaccg tcatcagaaa 6240
gcaagagaag agaaacactc gcgctcacat tctcgctcgc gtaagaatca agcttccaat 6300
tttaggcccc ccactgaccg aggtctgtcg ataatccact tttccattga ttttccaggt 6360
ttcgttaact catgccactg agcaaaactt cggtctttcc taacaaaagc tctcctcaca 6420
aagcatggcg cggcaacgga cgtgtcctca tactccactg ccacacaagg tcgataaact 6480
aagctcctca caaatagagg agaattccac tgacaactga aaacaatgta tgagagacga 6540
tcaccactgg agcggcgcgg cggttgggcg cggaggtcgg cagcaaaaac aagcgactcg 6600
ccgagcaaac ccgaatcagc cttcagacgg tcgtgcctaa caacacgccg ttctaccccg 6660
ccttcttcgc gccccttcgc gtccaagcat ccttcaagtt tatctctcta gttcaacttc 6720
aagaagaaca acaccaccaa caccatggcc aagttgacca gtgccgttcc ggtgctcacc 6780
gcgcgcgacg tcgccggagc ggtcgagttc tggaccgacc ggctcgggtt ctcccgggac 6840
ttcgtggagg acgacttcgc cggtgtggtc cgggacgacg tgaccctgtt catcagcgcg 6900
gtccaggacc aggtggtgcc ggacaacacc ctggcctggg tgtgggtgcg cggcctggac 6960
gagctgtacg ccgagtggtc ggaggtcgtg tccacgaact tccgggacgc ctccgggccg 7020
gccatgaccg agatcggcga gcagccgtgg gggcgggagt tcgccctgcg cgacccggcc 7080
ggcaactgcg tgcacttcgt ggccgaggag caggactgac acgtgctacg agatttcgat 7140
tccaccgccg ccttctatga aaggttgggc ttcggaatcg ttttccggga cgccggctgg 7200
atgatcctcc agcgcgggga tctcatgctg gagttcttcg cccaccccaa cttgtttatt 7260
gcagcttata atggttacaa ataaagcaat agcatcacaa atttcacaaa taaagcattt 7320
ttttcactgc attctagttg tggtttgtcc aaactcatca atgtatctta tcatgtctga 7380
attcccgggg tac 7393
<210> 3
<211> 10702
<212> DNA
<213> 人工序列
<220>
<223> pYB32载体
<220>
<221> misc_特征
<222> (2)..(450)
<223> α微管蛋白启动子
<220>
<221> misc_特征
<222> (457)..(4596)
<223> Cas9
<220>
<221> misc_特征
<222> (4603)..(5602)
<223> OrfA 终止子
<220>
<221> misc_特征
<222> (8280)..(9279)
<223> OrfA UP 同源
<220>
<221> misc_特征
<222> (9283)..(9598)
<223> OrfC 终止子
<220>
<221> misc_特征
<222> (9605)..(10053)
<223> α 微管蛋白启动子
<220>
<221> misc_特征
<222> (10054)..(10428)
<223> Sh ble 基因
<220>
<221> misc_特征
<222> (10429)..(10702)
<223> SV40_终止子
<400> 3
cccaatttta ggccccccac tgaccgaggt ctgtcgataa tccacttttc cattgatttt 60
ccaggtttcg ttaactcatg ccactgagca aaacttcggt ctttcctaac aaaagctctc 120
ctcacaaagc atggcgcggc aacggacgtg tcctcatact ccactgccac acaaggtcga 180
taaactaagc tcctcacaaa tagaggagaa ttccactgac aactgaaaac aatgtatgag 240
agacgatcac cactggagcg gcgcggcggt tgggcgcgga ggtcggcagc aaaaacaagc 300
gactcgccga gcaaacccga atcagccttc agacggtcgt gcctaacaac acgccgttct 360
accccgcctt cttcgcgccc cttcgcgtcc aagcatcctt caagtttatc tctctagttc 420
aacttcaaga agaacaacac caccaacacc ggatccatgg ataagaagta ctcgatcggc 480
ctcgacattg gcaccaacag cgtcggctgg gccgtcatta ctgatgagta caaggtcccg 540
tcgaagaagt ttaaggtcct cggcaacact gaccgccact ccatcaagaa gaacctcatc 600
ggtgccctcc tttttgactc cggcgagacc gctgaggcca ctcgcctcaa gcgcactgcc 660
cgccgccgtt acacccgccg caagaaccgc atctgctacc tccaggagat tttctcgaac 720
gaaatggcca aggtcgatga ctcctttttc caccgtctcg aagaatcgtt cctcgtcgag 780
gaggacaaga agcacgagcg ccaccccatc ttcggtaaca ttgtcgatga ggttgcctac 840
cacgagaagt acccgaccat ctaccacctc cgcaagaagc tcgtcgactc caccgacaag 900
gccgatctcc gccttatcta cctcgccctc gcccacatga tcaagttccg cggccacttt 960
cttatcgagg gtgatctcaa ccctgataac tctgacgtcg acaagctttt catccagctc 1020
gtccagactt acaaccagct cttcgaggag aaccccatca acgcttccgg cgtcgacgcg 1080
aaggccattc tcagcgcccg cctcagcaag tcccgccgcc tcgaaaacct cattgcccag 1140
cttcccggcg agaagaagaa cggcctcttc ggcaacctca ttgccctcag ccttggcctc 1200
acccctaact tcaagtcgaa ctttgacctc gccgaggacg ccaagctcca gctttccaag 1260
gacacttacg acgacgatct cgacaacctc ctcgctcaga ttggcgacca gtacgctgac 1320
ctcttcctcg ccgccaagaa ccttagcgat gccatcctcc tctccgacat ccttcgtgtt 1380
aacacggaaa tcacgaaggc tccgctctcc gcctccatga tcaagcgtta cgacgagcac 1440
catcaggacc tcaccctcct caaggccctc gtccgccagc agctccccga gaagtacaag 1500
gagatcttct tcgaccagag caagaacggc tacgccggct acattgacgg cggcgcgtcg 1560
caggaggagt tttacaagtt tatcaagccc attcttgaga agatggacgg caccgaggag 1620
ctcctcgtca agctcaaccg tgaggacctt ctccgcaagc agcgcacgtt cgacaacggc 1680
tctattcccc atcagatcca cctcggtgag cttcacgcga ttcttcgccg ccaggaagac 1740
ttttacccgt tcctcaagga caaccgcgag aagattgaga agatcctcac ctttcgcatt 1800
ccctactacg tcggccccct cgcccgcggc aactcgcgct ttgcttggat gacccgcaag 1860
tccgaggaga ccatcacccc gtggaacttc gaagaggtcg tcgacaaggg cgcctccgcg 1920
cagtctttca tcgagcgcat gactaacttt gacaagaacc tcccgaacga gaaggtcctc 1980
cccaagcaca gcctccttta cgaatacttt acggtgtaca acgagctcac gaaggtcaag 2040
tacgtcactg agggcatgcg caagccggcg ttcctttcgg gcgagcagaa gaaggctatc 2100
gtcgacctcc ttttcaagac caaccgcaag gttaccgtca agcagctcaa ggaggactac 2160
ttcaagaaga tcgagtgctt tgactcggtc gagatttcgg gcgtggagga ccgtttcaac 2220
gcctccctcg gcacttacca cgaccttctc aagatcatca aggacaagga ctttctcgac 2280
aacgaggaga acgaggacat tctcgaggac atcgtcctca cgctcaccct ctttgaggac 2340
cgtgagatga tcgaggagcg cctcaagacc tacgcccatc tctttgacga caaggtcatg 2400
aagcagctca agcgccgccg ctacaccggc tggggccgcc tttcccgcaa gctcatcaac 2460
ggcatccgcg acaagcagtc tggcaagacc atccttgact ttcttaagtc tgatggtttc 2520
gccaaccgca acttcatgca gctcatccac gacgacagcc tcactttcaa ggaggacatt 2580
cagaaggccc aggtctccgg ccagggtgac tctctccacg aacacatcgc caaccttgct 2640
ggcagcccgg ctattaagaa gggcatcctc cagaccgtca aggtcgtcga cgagctcgtc 2700
aaggttatgg gccgccacaa gcccgagaac atcgtcattg agatggctcg cgaaaaccag 2760
accacccaga agggtcagaa gaactcccgc gagcgcatga agcgtatcga ggagggcatc 2820
aaggagctcg gcagccagat cctcaaggag cacccggtcg agaacaccca gctccagaac 2880
gaaaagctct acctctacta cctccagaac ggccgtgaca tgtacgttga ccaggagctc 2940
gacattaacc gcctctccga ttacgacgtc gaccatattg tcccccagag ctttctcaag 3000
gacgacagca tcgacaacaa ggtcctcacc cgctcggaca agaaccgcgg caagtccgac 3060
aacgtccctt ccgaggaggt cgtgaagaag atgaagaact actggcgcca gcttctcaac 3120
gctaagctta ttactcagcg caagttcgat aacctcacca aggccgaacg cggcggcctc 3180
tccgagctcg acaaggccgg ttttatcaag cgccagctcg ttgagactcg ccagatcacc 3240
aagcacgtgg cgcagatcct cgactcgcgc atgaacacga agtacgacga gaacgacaag 3300
ctcatccgcg aggtcaaggt catcaccctt aagtcgaagc tcgtgtccga ctttcgcaag 3360
gacttccagt tctacaaggt ccgtgaaatt aacaactacc accacgctca cgacgcttac 3420
ctcaacgcgg tcgtgggtac cgcgctcatc aagaagtacc cgaagctcga gtcggagttt 3480
gtctacggcg actacaaggt ctacgacgtg cgcaagatga tcgccaagtc cgagcaggag 3540
atcggcaagg ccacggccaa gtactttttc tactccaaca ttatgaactt ctttaagact 3600
gagatcaccc ttgccaacgg cgagatccgc aagcgccccc ttatcgagac caacggcgag 3660
accggcgaaa ttgtgtggga taagggtcgc gactttgcca ccgtccgcaa ggtcctcagc 3720
atgccccagg tcaacattgt taagaagacc gaggtccaga cgggcggctt tagcaaggag 3780
tctatcctcc ccaagcgtaa cagcgacaag ctcatcgccc gcaagaagga ctgggaccct 3840
aagaagtacg gcggcttcga ttcgcctacg gtcgcctaca gcgtcctcgt cgtcgccaag 3900
gtcgagaagg gcaagtccaa gaagctcaag tccgtcaagg agctcctcgg catcacgatc 3960
atggagcgct ccagctttga gaagaacccc attgacttcc tcgaggctaa gggttacaag 4020
gaggtcaaga aggaccttat catcaagctc cccaagtact ccctctttga gctcgaaaac 4080
ggccgcaagc gtatgctcgc tagcgctggc gaactccaga agggcaacga gctcgccctc 4140
cccagcaagt acgtcaactt tctctacctc gcctcccact acgagaagct caagggtagc 4200
ccggaggata acgagcagaa gcagcttttt gtggagcagc acaagcacta ccttgacgag 4260
atcattgaac agatctccga gttctccaag cgtgttattc ttgctgacgc caacctcgat 4320
aaggtgctct ccgcgtacaa caagcaccgc gacaagccta tccgcgagca ggccgagaac 4380
atcatccacc tctttaccct caccaacctc ggcgccccgg ccgcctttaa gtactttgat 4440
acgactatcg accgcaagcg ctacacttcg actaaggagg tcctcgacgc taccctcatt 4500
caccagtcca ttaccggcct ctacgagacc cgcattgacc tttcgcagct cggtggcgac 4560
tcgcgtgcgg accctaagaa gaagcgcaag gtctaacata tgatctaaac tagtgaatcg 4620
cgacaagttg tctttttgtt actctacgta ctgctctttc taattttacg acgtatgctt 4680
ctgctcttga cgacgacaac catggcaata aaagtaaggc aagaagtgag tgcgtgctcg 4740
ctcacaaggt ctaggccgaa acgaggcgcc ttaggattgg ttgtctccgt cgtaagtcat 4800
gacggagcgt aggacaccga cggcctgccg cgcaaatata cgaaccgctg cacaattctt 4860
ttcgttgaga acaacctcga acggcctgcc ttgctgagct gccgacacgg tggaaggaag 4920
catagcggcc aatcgagggg atgctattaa ttaggcttgg cgctgctgcc gccgtgcctg 4980
aagatgtgcg caagcgtggc aacaccgtcc accttgccat taaagtcatg cactccaaat 5040
acctcgaaca gagcctctcg catgtttggc caagcacctt cgagagagtc tggactctca 5100
ctccttcctc accgttgtcg ccattctcag cgagctcatg caatcaccag gacggagaga 5160
cggccagctg cttttctgct ttccattgtt attagagaaa cgcttctcgc tctcatcgtc 5220
ttagtagaca ttccgatggc ttcgttcgcc aatttgtcac ctaagtaagc tagagtgtta 5280
agtctaaatg cctttgaccc gcgtacggcg tcacgtagat gcctgtcctt gccagcaaac 5340
gctagttcgc ggtgtgcgta atttggcccg cattatgctg gctctcaaaa tcaaccgcca 5400
ccactcgcgg ctgcacgatg attttcgtgc actcatgaca tgagaaatgt gatactcaaa 5460
ctagtataga cctcctactc ctactgctgc ttttctcgtc agagctgtct ccggaaaagt 5520
tgacaagttg ttggccttct tcttctctgc tagtaagtag atcatcatgg atgagacgat 5580
gatgataatg atgatgatga taatttaaat ctcgagacct tcgagcgctg ctaatttcgc 5640
ctgacgctcc ttcttttgtg cttccatgac acgccgcttc accgtgcgtt ccacttcttc 5700
ctcagacatg cccttggctg cctcgacctg ctcggtaaaa cgggccccag cacgtgctac 5760
gagatttcga ttccaccgcc gccttctatg aaaggttggg cttcggaatc gttttccggg 5820
acgccggctg gatgatcctc cagcgcgggg atctcatgct ggagttcttc gcccacccca 5880
acttgtttat tgcagcttat aatggttaca aataaagcaa tagcatcaca aatttcacaa 5940
ataaagcatt tttttcactg cattctagtt gtggtttgtc caaactcatc aatgtatctt 6000
atcatacatg gtcgacctgc aggaacctgc attaatgaat cggccaacgc gcggggagag 6060
gcggtttgcg tattgggcgc tcttccgctt cctcgctcac tgactcgctg cgctcggtcg 6120
ttcggctgcg gcgagcggta tcagctcact caaaggcggt aatacggtta tccacagaat 6180
caggggataa cgcaggaaag aacatgtgag caaaaggcca gcaaaaggcc aggaaccgta 6240
aaaaggccgc gttgctggcg tttttccata ggctccgccc ccctgacgag catcacaaaa 6300
atcgacgctc aagtcagagg tggcgaaacc cgacaggact ataaagatac caggcgtttc 6360
cccctggaag ctccctcgtg cgctctcctg ttccgaccct gccgcttacc ggatacctgt 6420
ccgcctttct cccttcggga agcgtggcgc tttctcatag ctcacgctgt aggtatctca 6480
gttcggtgta ggtcgttcgc tccaagctgg gctgtgtgca cgaacccccc gttcagcccg 6540
accgctgcgc cttatccggt aactatcgtc ttgagtccaa cccggtaaga cacgacttat 6600
cgccactggc agcagccact ggtaacagga ttagcagagc gaggtatgta ggcggtgcta 6660
cagagttctt gaagtggtgg cctaactacg gctacactag aagaacagta tttggtatct 6720
gcgctctgct gaagccagtt accttcggaa aaagagttgg tagctcttga tccggcaaac 6780
aaaccaccgc tggtagcggt ggtttttttg tttgcaagca gcagattacg cgcagaaaaa 6840
aaggatctca agaagatcct ttgatctttt ctacggggtc tgacgctcag tggaacgaaa 6900
actcacgtta agggattttg gtcatgagat tatcaaaaag gatcttcacc tagatccttt 6960
taaattaaaa atgaagtttt aaatcaatct aaagtatata tgagtaaact tggtctgaca 7020
gttaccaatg cttaatcagt gaggcaccta tctcagcgat ctgtctattt cgttcatcca 7080
tagttgcctg actccccgtc gtgtagataa ctacgatacg ggagggctta ccatctggcc 7140
ccagtgctgc aatgataccg cgagacccac gctcaccggc tccagattta tcagcaataa 7200
accagccagc cggaagggcc gagcgcagaa gtggtcctgc aactttatcc gcctccatcc 7260
agtctattaa ttgttgccgg gaagctagag taagtagttc gccagttaat agtttgcgca 7320
acgttgttgc cattgctaca ggcatcgtgg tgtcacgctc gtcgtttggt atggcttcat 7380
tcagctccgg ttcccaacga tcaaggcgag ttacatgatc ccccatgttg tgcaaaaaag 7440
cggttagctc cttcggtcct ccgatcgttg tcagaagtaa gttggccgca gtgttatcac 7500
tcatggttat ggcagcactg cataattctc ttactgtcat gccatccgta agatgctttt 7560
ctgtgactgg tgagtactca accaagtcat tctgagaata gtgtatgcgg cgaccgagtt 7620
gctcttgccc ggcgtcaata cgggataata ccgcgccaca tagcagaact ttaaaagtgc 7680
tcatcattgg aaaacgttct tcggggcgaa aactctcaag gatcttaccg ctgttgagat 7740
ccagttcgat gtaacccact cgtgcaccca actgatcttc agcatctttt actttcacca 7800
gcgtttctgg gtgagcaaaa acaggaaggc aaaatgccgc aaaaaaggga ataagggcga 7860
cacggaaatg ttgaatactc atactcttcc tttttcaata ttattgaagc atttatcagg 7920
gttattgtct catgagcgga tacatatttg aatgtattta gaaaaataaa caaatagggg 7980
ttccgcgcac atttccccga aaagtgccac ctgacgtcta agaaaccatt attatcatga 8040
cattaaccta taaaaatagg cgtatcacga ggccctttcg tctcgcgcgt ttcggtgatg 8100
acggtgaaaa cctctgacac atgcagctcc cggagacggt cacagcttgt ctgtaagcgg 8160
atgccgggag cagacaagcc cgtcagggcg cgtcagcggg tgttggcggg tgtcggggct 8220
ggcttaacta tgcggcatca gagcagattg tactgagagt gcaccaagct tatttaaatc 8280
tttatcggtg tggcgcgcct tgacggccgc ctcggattca cttcgcaggg cacttctgac 8340
gcgctcaagc gtgcccagcg tggtgccatc tttggcctct gcaagaccat cggcctcgag 8400
tggtccgagt ctgacgtctt ttcccgcggc gtggacattg ctcagggcat gcaccccgag 8460
gatgccgccg tggcgattgt gcgcgagatg gcgtgcgctg acattcgcat tcgcgaggtc 8520
ggcattggcg caaaccagca gcgctgcacg atccgtgccg ccaagctcga gaccggcaac 8580
ccgcagcgcc agatcgccaa ggacgacgtg ctgctcgttt ctggcggcgc tcgcggcatc 8640
acgcctcttt gcatccggga gatcacgcgc cagatcgcgg gcggcaagta cattctgctt 8700
ggccgcagca aggtctctgc gagcgaaccg gcatggtgcg ctggcatcac tgacgagaag 8760
gctgtgcaaa aggctgctac ccaggagctc aagcgcgcct ttagcgctgg cgagggcccc 8820
aagcccacgc cccgcgctgt cactaagctt gtgggctctg ttcttggcgc tcgcgaggtg 8880
cgcagctcta ttgctgcgat tgaagcgctc ggcggcaagg ccatctactc gtcgtgcgac 8940
gtgaactctg ccgccgacgt ggccaaggcc gtgcgcgatg ccgagtccca gctcggtgcc 9000
cgcgtctcgg gcatcgttca tgcctcgggc gtgctccgcg accgtctcat cgagaagaag 9060
ctccccgacg agttcgacgc cgtctttggc accaaggtca ccggtctcga gaacctcctc 9120
gccgccgtcg accgcgccaa cctcaagcac atggtcctct tcagctcgct cgccggcttc 9180
cacggcaacg tcggccagtc tgactacgcc atggccaacg aggcccttaa caagatgggc 9240
ctcgagctcg ccaaggacgt ctcggtcaag tcgatctgct aagaaagtga accttgtcct 9300
aacccgacag cgaatggcgg gagggggcgg gctaaaagat cgtattacat agtattttcc 9360
cctactcttt gtgtttgtct tttttttttt tgaacgcatt caagccactt gtcttggttt 9420
acttgtttgt ttgcttgctt gcttgcttgc ttgcctgctt cttggtcaga cggacccaaa 9480
aaagggaaaa aattcattca tggcacagat aagaaaaaga aaaagtttgt cgaccaccgt 9540
catcagaaag caagagaaga gaaacactcg cgctcacatt ctcgctcgcg taagaatcaa 9600
gcttccaatt ttaggccccc cactgaccga ggtctgtcga taatccactt ttccattgat 9660
tttccaggtt tcgttaactc atgccactga gcaaaacttc ggtctttcct aacaaaagct 9720
ctcctcacaa agcatggcgc ggcaacggac gtgtcctcat actccactgc cacacaaggt 9780
cgataaacta agctcctcac aaatagagga gaattccact gacaactgaa aacaatgtat 9840
gagagacgat caccactgga gcggcgcggc ggttgggcgc ggaggtcggc agcaaaaaca 9900
agcgactcgc cgagcaaacc cgaatcagcc ttcagacggt cgtgcctaac aacacgccgt 9960
tctaccccgc cttcttcgcg ccccttcgcg tccaagcatc cttcaagttt atctctctag 10020
ttcaacttca agaagaacaa caccaccaac accatggcca agttgaccag tgccgttccg 10080
gtgctcaccg cgcgcgacgt cgccggagcg gtcgagttct ggaccgaccg gctcgggttc 10140
tcccgggact tcgtggagga cgacttcgcc ggtgtggtcc gggacgacgt gaccctgttc 10200
atcagcgcgg tccaggacca ggtggtgccg gacaacaccc tggcctgggt gtgggtgcgc 10260
ggcctggacg agctgtacgc cgagtggtcg gaggtcgtgt ccacgaactt ccgggacgcc 10320
tccgggccgg ccatgaccga gatcggcgag cagccgtggg ggcgggagtt cgccctgcgc 10380
gacccggccg gcaactgcgt gcacttcgtg gccgaggagc aggactgaca cgtgctacga 10440
gatttcgatt ccaccgccgc cttctatgaa aggttgggct tcggaatcgt tttccgggac 10500
gccggctgga tgatcctcca gcgcggggat ctcatgctgg agttcttcgc ccaccccaac 10560
ttgtttattg cagcttataa tggttacaaa taaagcaata gcatcacaaa tttcacaaat 10620
aaagcatttt tttcactgca ttctagttgt ggtttgtcca aactcatcaa tgtatcttat 10680
catgtctgaa ttcccggggt ac 10702
<210> 4
<211> 11332
<212> DNA
<213> 人工序列
<220>
<223> pYB33载体
<220>
<221> misc_特征
<222> (2)..(1006)
<223> CS_启动子
<220>
<221> misc_特征
<222> (1013)..(5152)
<223> Cas9
<220>
<221> misc_特征
<222> (5159)..(6158)
<223> OrfA_终止子
<220>
<221> misc_特征
<222> (8836)..(9835)
<223> OrfA_UP_同源
<220>
<221> misc_特征
<222> (9839)..(10154)
<223> OrfC_终止子
<220>
<221> misc_特征
<222> (10161)..(10609)
<223> α_微管蛋白_启动子
<220>
<221> misc_特征
<222> (10610)..(10984)
<223> Sh_ble_基因
<220>
<221> misc_特征
<222> (10985)..(11258)
<223> SV40_终止子
<400> 4
cgagcgggcg attccaccgt caactggtct tcgcctgtgc cttccagcgc agtgcgcctt 60
gccccgctcg gtcttattat tcttggcgct ctcgtcaatg tgatcatgat ctagtcgaac 120
gtgcaatcta gccaatgaaa aaagagtcca gttctatctg aatttttcac tttctaaatc 180
tcgcatcgac aatctacttt tcaaatctcg caacaaagct gatcttgttt ctccctcacc 240
cagttctatc tgaatttttc cttttctgaa gctcgcgtta acaatctact tttcgaatct 300
gtcaacaaag ctgatcttgt ttctcccccc tatccccttc cctcccccct tctttgggat 360
cttgttgtgc gtgtcgcccc ttcaacttct ttgttcgacg atgacctcca cctagcctgt 420
gaagctcatc gtctccgagt atttctggcc tgctccaatt cctctcttcc attctccatc 480
gcatacatgc atgttctttg gtctcactcc gagccatgct tcttcggtca ctacttcatc 540
tatttgacta ggcctctgtt cgagcgacga accctccgtg ttcgcgggtg ttcattctct 600
gcaaagtggt ccgtaaccgt gactaccgga cacctcgcgt acactacatt cgggacggac 660
gcggccgagc gcgacgtctc tgggcccggc ctgccgcccc cggggccgcg gcttcctcgc 720
gccgccagcc gcgtccaagt cgccagcgcg aggtcgcgcg agtcgaagga gacgttgtcg 780
atctcgaccc tcgccatgcg cgtgacgggt gaccgcctca ccggatcccg ccctccgcgc 840
gctgccttca ttccttcatt ccttcattcc ttcactcaat cctgcatcat ccatcgcccg 900
cccgcccgct cgcacgcacc agaggcgcgc attgcgggcc agggcgccgc ctgcagaccg 960
ccatcgcgcc cgccttctgc cgcgcctcgc tcgctcggag accgagggat ccatggataa 1020
gaagtactcg atcggcctcg acattggcac caacagcgtc ggctgggccg tcattactga 1080
tgagtacaag gtcccgtcga agaagtttaa ggtcctcggc aacactgacc gccactccat 1140
caagaagaac ctcatcggtg ccctcctttt tgactccggc gagaccgctg aggccactcg 1200
cctcaagcgc actgcccgcc gccgttacac ccgccgcaag aaccgcatct gctacctcca 1260
ggagattttc tcgaacgaaa tggccaaggt cgatgactcc tttttccacc gtctcgaaga 1320
atcgttcctc gtcgaggagg acaagaagca cgagcgccac cccatcttcg gtaacattgt 1380
cgatgaggtt gcctaccacg agaagtaccc gaccatctac cacctccgca agaagctcgt 1440
cgactccacc gacaaggccg atctccgcct tatctacctc gccctcgccc acatgatcaa 1500
gttccgcggc cactttctta tcgagggtga tctcaaccct gataactctg acgtcgacaa 1560
gcttttcatc cagctcgtcc agacttacaa ccagctcttc gaggagaacc ccatcaacgc 1620
ttccggcgtc gacgcgaagg ccattctcag cgcccgcctc agcaagtccc gccgcctcga 1680
aaacctcatt gcccagcttc ccggcgagaa gaagaacggc ctcttcggca acctcattgc 1740
cctcagcctt ggcctcaccc ctaacttcaa gtcgaacttt gacctcgccg aggacgccaa 1800
gctccagctt tccaaggaca cttacgacga cgatctcgac aacctcctcg ctcagattgg 1860
cgaccagtac gctgacctct tcctcgccgc caagaacctt agcgatgcca tcctcctctc 1920
cgacatcctt cgtgttaaca cggaaatcac gaaggctccg ctctccgcct ccatgatcaa 1980
gcgttacgac gagcaccatc aggacctcac cctcctcaag gccctcgtcc gccagcagct 2040
ccccgagaag tacaaggaga tcttcttcga ccagagcaag aacggctacg ccggctacat 2100
tgacggcggc gcgtcgcagg aggagtttta caagtttatc aagcccattc ttgagaagat 2160
ggacggcacc gaggagctcc tcgtcaagct caaccgtgag gaccttctcc gcaagcagcg 2220
cacgttcgac aacggctcta ttccccatca gatccacctc ggtgagcttc acgcgattct 2280
tcgccgccag gaagactttt acccgttcct caaggacaac cgcgagaaga ttgagaagat 2340
cctcaccttt cgcattccct actacgtcgg ccccctcgcc cgcggcaact cgcgctttgc 2400
ttggatgacc cgcaagtccg aggagaccat caccccgtgg aacttcgaag aggtcgtcga 2460
caagggcgcc tccgcgcagt ctttcatcga gcgcatgact aactttgaca agaacctccc 2520
gaacgagaag gtcctcccca agcacagcct cctttacgaa tactttacgg tgtacaacga 2580
gctcacgaag gtcaagtacg tcactgaggg catgcgcaag ccggcgttcc tttcgggcga 2640
gcagaagaag gctatcgtcg acctcctttt caagaccaac cgcaaggtta ccgtcaagca 2700
gctcaaggag gactacttca agaagatcga gtgctttgac tcggtcgaga tttcgggcgt 2760
ggaggaccgt ttcaacgcct ccctcggcac ttaccacgac cttctcaaga tcatcaagga 2820
caaggacttt ctcgacaacg aggagaacga ggacattctc gaggacatcg tcctcacgct 2880
caccctcttt gaggaccgtg agatgatcga ggagcgcctc aagacctacg cccatctctt 2940
tgacgacaag gtcatgaagc agctcaagcg ccgccgctac accggctggg gccgcctttc 3000
ccgcaagctc atcaacggca tccgcgacaa gcagtctggc aagaccatcc ttgactttct 3060
taagtctgat ggtttcgcca accgcaactt catgcagctc atccacgacg acagcctcac 3120
tttcaaggag gacattcaga aggcccaggt ctccggccag ggtgactctc tccacgaaca 3180
catcgccaac cttgctggca gcccggctat taagaagggc atcctccaga ccgtcaaggt 3240
cgtcgacgag ctcgtcaagg ttatgggccg ccacaagccc gagaacatcg tcattgagat 3300
ggctcgcgaa aaccagacca cccagaaggg tcagaagaac tcccgcgagc gcatgaagcg 3360
tatcgaggag ggcatcaagg agctcggcag ccagatcctc aaggagcacc cggtcgagaa 3420
cacccagctc cagaacgaaa agctctacct ctactacctc cagaacggcc gtgacatgta 3480
cgttgaccag gagctcgaca ttaaccgcct ctccgattac gacgtcgacc atattgtccc 3540
ccagagcttt ctcaaggacg acagcatcga caacaaggtc ctcacccgct cggacaagaa 3600
ccgcggcaag tccgacaacg tcccttccga ggaggtcgtg aagaagatga agaactactg 3660
gcgccagctt ctcaacgcta agcttattac tcagcgcaag ttcgataacc tcaccaaggc 3720
cgaacgcggc ggcctctccg agctcgacaa ggccggtttt atcaagcgcc agctcgttga 3780
gactcgccag atcaccaagc acgtggcgca gatcctcgac tcgcgcatga acacgaagta 3840
cgacgagaac gacaagctca tccgcgaggt caaggtcatc acccttaagt cgaagctcgt 3900
gtccgacttt cgcaaggact tccagttcta caaggtccgt gaaattaaca actaccacca 3960
cgctcacgac gcttacctca acgcggtcgt gggtaccgcg ctcatcaaga agtacccgaa 4020
gctcgagtcg gagtttgtct acggcgacta caaggtctac gacgtgcgca agatgatcgc 4080
caagtccgag caggagatcg gcaaggccac ggccaagtac tttttctact ccaacattat 4140
gaacttcttt aagactgaga tcacccttgc caacggcgag atccgcaagc gcccccttat 4200
cgagaccaac ggcgagaccg gcgaaattgt gtgggataag ggtcgcgact ttgccaccgt 4260
ccgcaaggtc ctcagcatgc cccaggtcaa cattgttaag aagaccgagg tccagacggg 4320
cggctttagc aaggagtcta tcctccccaa gcgtaacagc gacaagctca tcgcccgcaa 4380
gaaggactgg gaccctaaga agtacggcgg cttcgattcg cctacggtcg cctacagcgt 4440
cctcgtcgtc gccaaggtcg agaagggcaa gtccaagaag ctcaagtccg tcaaggagct 4500
cctcggcatc acgatcatgg agcgctccag ctttgagaag aaccccattg acttcctcga 4560
ggctaagggt tacaaggagg tcaagaagga ccttatcatc aagctcccca agtactccct 4620
ctttgagctc gaaaacggcc gcaagcgtat gctcgctagc gctggcgaac tccagaaggg 4680
caacgagctc gccctcccca gcaagtacgt caactttctc tacctcgcct cccactacga 4740
gaagctcaag ggtagcccgg aggataacga gcagaagcag ctttttgtgg agcagcacaa 4800
gcactacctt gacgagatca ttgaacagat ctccgagttc tccaagcgtg ttattcttgc 4860
tgacgccaac ctcgataagg tgctctccgc gtacaacaag caccgcgaca agcctatccg 4920
cgagcaggcc gagaacatca tccacctctt taccctcacc aacctcggcg ccccggccgc 4980
ctttaagtac tttgatacga ctatcgaccg caagcgctac acttcgacta aggaggtcct 5040
cgacgctacc ctcattcacc agtccattac cggcctctac gagacccgca ttgacctttc 5100
gcagctcggt ggcgactcgc gtgcggaccc taagaagaag cgcaaggtct aacatatgat 5160
ctaaactagt gaatcgcgac aagttgtctt tttgttactc tacgtactgc tctttctaat 5220
tttacgacgt atgcttctgc tcttgacgac gacaaccatg gcaataaaag taaggcaaga 5280
agtgagtgcg tgctcgctca caaggtctag gccgaaacga ggcgccttag gattggttgt 5340
ctccgtcgta agtcatgacg gagcgtagga caccgacggc ctgccgcgca aatatacgaa 5400
ccgctgcaca attcttttcg ttgagaacaa cctcgaacgg cctgccttgc tgagctgccg 5460
acacggtgga aggaagcata gcggccaatc gaggggatgc tattaattag gcttggcgct 5520
gctgccgccg tgcctgaaga tgtgcgcaag cgtggcaaca ccgtccacct tgccattaaa 5580
gtcatgcact ccaaatacct cgaacagagc ctctcgcatg tttggccaag caccttcgag 5640
agagtctgga ctctcactcc ttcctcaccg ttgtcgccat tctcagcgag ctcatgcaat 5700
caccaggacg gagagacggc cagctgcttt tctgctttcc attgttatta gagaaacgct 5760
tctcgctctc atcgtcttag tagacattcc gatggcttcg ttcgccaatt tgtcacctaa 5820
gtaagctaga gtgttaagtc taaatgcctt tgacccgcgt acggcgtcac gtagatgcct 5880
gtccttgcca gcaaacgcta gttcgcggtg tgcgtaattt ggcccgcatt atgctggctc 5940
tcaaaatcaa ccgccaccac tcgcggctgc acgatgattt tcgtgcactc atgacatgag 6000
aaatgtgata ctcaaactag tatagacctc ctactcctac tgctgctttt ctcgtcagag 6060
ctgtctccgg aaaagttgac aagttgttgg ccttcttctt ctctgctagt aagtagatca 6120
tcatggatga gacgatgatg ataatgatga tgatgataat ttaaatctcg agaccttcga 6180
gcgctgctaa tttcgcctga cgctccttct tttgtgcttc catgacacgc cgcttcaccg 6240
tgcgttccac ttcttcctca gacatgccct tggctgcctc gacctgctcg gtaaaacggg 6300
ccccagcacg tgctacgaga tttcgattcc accgccgcct tctatgaaag gttgggcttc 6360
ggaatcgttt tccgggacgc cggctggatg atcctccagc gcggggatct catgctggag 6420
ttcttcgccc accccaactt gtttattgca gcttataatg gttacaaata aagcaatagc 6480
atcacaaatt tcacaaataa agcatttttt tcactgcatt ctagttgtgg tttgtccaaa 6540
ctcatcaatg tatcttatca tacatggtcg acctgcagga acctgcatta atgaatcggc 6600
caacgcgcgg ggagaggcgg tttgcgtatt gggcgctctt ccgcttcctc gctcactgac 6660
tcgctgcgct cggtcgttcg gctgcggcga gcggtatcag ctcactcaaa ggcggtaata 6720
cggttatcca cagaatcagg ggataacgca ggaaagaaca tgtgagcaaa aggccagcaa 6780
aaggccagga accgtaaaaa ggccgcgttg ctggcgtttt tccataggct ccgcccccct 6840
gacgagcatc acaaaaatcg acgctcaagt cagaggtggc gaaacccgac aggactataa 6900
agataccagg cgtttccccc tggaagctcc ctcgtgcgct ctcctgttcc gaccctgccg 6960
cttaccggat acctgtccgc ctttctccct tcgggaagcg tggcgctttc tcatagctca 7020
cgctgtaggt atctcagttc ggtgtaggtc gttcgctcca agctgggctg tgtgcacgaa 7080
ccccccgttc agcccgaccg ctgcgcctta tccggtaact atcgtcttga gtccaacccg 7140
gtaagacacg acttatcgcc actggcagca gccactggta acaggattag cagagcgagg 7200
tatgtaggcg gtgctacaga gttcttgaag tggtggccta actacggcta cactagaaga 7260
acagtatttg gtatctgcgc tctgctgaag ccagttacct tcggaaaaag agttggtagc 7320
tcttgatccg gcaaacaaac caccgctggt agcggtggtt tttttgtttg caagcagcag 7380
attacgcgca gaaaaaaagg atctcaagaa gatcctttga tcttttctac ggggtctgac 7440
gctcagtgga acgaaaactc acgttaaggg attttggtca tgagattatc aaaaaggatc 7500
ttcacctaga tccttttaaa ttaaaaatga agttttaaat caatctaaag tatatatgag 7560
taaacttggt ctgacagtta ccaatgctta atcagtgagg cacctatctc agcgatctgt 7620
ctatttcgtt catccatagt tgcctgactc cccgtcgtgt agataactac gatacgggag 7680
ggcttaccat ctggccccag tgctgcaatg ataccgcgag acccacgctc accggctcca 7740
gatttatcag caataaacca gccagccgga agggccgagc gcagaagtgg tcctgcaact 7800
ttatccgcct ccatccagtc tattaattgt tgccgggaag ctagagtaag tagttcgcca 7860
gttaatagtt tgcgcaacgt tgttgccatt gctacaggca tcgtggtgtc acgctcgtcg 7920
tttggtatgg cttcattcag ctccggttcc caacgatcaa ggcgagttac atgatccccc 7980
atgttgtgca aaaaagcggt tagctccttc ggtcctccga tcgttgtcag aagtaagttg 8040
gccgcagtgt tatcactcat ggttatggca gcactgcata attctcttac tgtcatgcca 8100
tccgtaagat gcttttctgt gactggtgag tactcaacca agtcattctg agaatagtgt 8160
atgcggcgac cgagttgctc ttgcccggcg tcaatacggg ataataccgc gccacatagc 8220
agaactttaa aagtgctcat cattggaaaa cgttcttcgg ggcgaaaact ctcaaggatc 8280
ttaccgctgt tgagatccag ttcgatgtaa cccactcgtg cacccaactg atcttcagca 8340
tcttttactt tcaccagcgt ttctgggtga gcaaaaacag gaaggcaaaa tgccgcaaaa 8400
aagggaataa gggcgacacg gaaatgttga atactcatac tcttcctttt tcaatattat 8460
tgaagcattt atcagggtta ttgtctcatg agcggataca tatttgaatg tatttagaaa 8520
aataaacaaa taggggttcc gcgcacattt ccccgaaaag tgccacctga cgtctaagaa 8580
accattatta tcatgacatt aacctataaa aataggcgta tcacgaggcc ctttcgtctc 8640
gcgcgtttcg gtgatgacgg tgaaaacctc tgacacatgc agctcccgga gacggtcaca 8700
gcttgtctgt aagcggatgc cgggagcaga caagcccgtc agggcgcgtc agcgggtgtt 8760
ggcgggtgtc ggggctggct taactatgcg gcatcagagc agattgtact gagagtgcac 8820
caagcttatt taaatcttta tcggtgtggc gcgccttgac ggccgcctcg gattcacttc 8880
gcagggcact tctgacgcgc tcaagcgtgc ccagcgtggt gccatctttg gcctctgcaa 8940
gaccatcggc ctcgagtggt ccgagtctga cgtcttttcc cgcggcgtgg acattgctca 9000
gggcatgcac cccgaggatg ccgccgtggc gattgtgcgc gagatggcgt gcgctgacat 9060
tcgcattcgc gaggtcggca ttggcgcaaa ccagcagcgc tgcacgatcc gtgccgccaa 9120
gctcgagacc ggcaacccgc agcgccagat cgccaaggac gacgtgctgc tcgtttctgg 9180
cggcgctcgc ggcatcacgc ctctttgcat ccgggagatc acgcgccaga tcgcgggcgg 9240
caagtacatt ctgcttggcc gcagcaaggt ctctgcgagc gaaccggcat ggtgcgctgg 9300
catcactgac gagaaggctg tgcaaaaggc tgctacccag gagctcaagc gcgcctttag 9360
cgctggcgag ggccccaagc ccacgccccg cgctgtcact aagcttgtgg gctctgttct 9420
tggcgctcgc gaggtgcgca gctctattgc tgcgattgaa gcgctcggcg gcaaggccat 9480
ctactcgtcg tgcgacgtga actctgccgc cgacgtggcc aaggccgtgc gcgatgccga 9540
gtcccagctc ggtgcccgcg tctcgggcat cgttcatgcc tcgggcgtgc tccgcgaccg 9600
tctcatcgag aagaagctcc ccgacgagtt cgacgccgtc tttggcacca aggtcaccgg 9660
tctcgagaac ctcctcgccg ccgtcgaccg cgccaacctc aagcacatgg tcctcttcag 9720
ctcgctcgcc ggcttccacg gcaacgtcgg ccagtctgac tacgccatgg ccaacgaggc 9780
ccttaacaag atgggcctcg agctcgccaa ggacgtctcg gtcaagtcga tctgctaaga 9840
aagtgaacct tgtcctaacc cgacagcgaa tggcgggagg gggcgggcta aaagatcgta 9900
ttacatagta ttttccccta ctctttgtgt ttgtcttttt tttttttgaa cgcattcaag 9960
ccacttgtct tggtttactt gtttgtttgc ttgcttgctt gcttgcttgc ctgcttcttg 10020
gtcagacgga cccaaaaaag ggaaaaaatt cattcatggc acagataaga aaaagaaaaa 10080
gtttgtcgac caccgtcatc agaaagcaag agaagagaaa cactcgcgct cacattctcg 10140
ctcgcgtaag aatcaagctt ccaattttag gccccccact gaccgaggtc tgtcgataat 10200
ccacttttcc attgattttc caggtttcgt taactcatgc cactgagcaa aacttcggtc 10260
tttcctaaca aaagctctcc tcacaaagca tggcgcggca acggacgtgt cctcatactc 10320
cactgccaca caaggtcgat aaactaagct cctcacaaat agaggagaat tccactgaca 10380
actgaaaaca atgtatgaga gacgatcacc actggagcgg cgcggcggtt gggcgcggag 10440
gtcggcagca aaaacaagcg actcgccgag caaacccgaa tcagccttca gacggtcgtg 10500
cctaacaaca cgccgttcta ccccgccttc ttcgcgcccc ttcgcgtcca agcatccttc 10560
aagtttatct ctctagttca acttcaagaa gaacaacacc accaacaccc caattttagg 10620
ccccccactg accgaggtct gtcgataatc cacttttcca ttgattttcc aggtttcgtt 10680
aactcatgcc actgagcaaa acttcggtct ttcctaacaa aagctctcct cacaaagcat 10740
ggcgcggcaa cggacgtgtc ctcatactcc actgccacac aaggtcgata aactaagctc 10800
ctcacaaata gaggagaatt ccactgacaa ctgaaaacaa tgtatgagag acgatcacca 10860
ctggagcggc gcggcggttg ggcgcggagg tcggcagcaa aaacaagcga ctcgccgagc 10920
aaacccgaat cagccttcag acggtcgtgc ctaacaacac gccgttctac cccgccttct 10980
tcgcgcccct tcgcgtccaa gcatccttca agtttatctc tctagttcaa cttcaagaag 11040
aacaacacca ccaacaccca cgtgctacga gatttcgatt ccaccgccgc cttctatgaa 11100
aggttgggct tcggaatcgt tttccgggac gccggctgga tgatcctcca gcgcggggat 11160
ctcatgctgg agttcttcgc ccaccccaac ttgtttattg cagcttataa tggttacaaa 11220
taaagcaata gcatcacaaa tttcacaaat aaagcatttt tttcactgca ttctagttgt 11280
ggtttgtcca aactcatcaa tgtatcttat catgtctgaa ttcccggggt ac 11332
<210> 5
<211> 4777
<212> DNA
<213> 人工序列
<220>
<223> pCL399载体
<220>
<221> misc_特征
<222> (1)..(2523)
<223> FAS_片段
<220>
<221> misc_特征
<222> (2528)..(4777)
<223> pSP73_片段
<400> 5
gtttaaactc gcggcgtctt cgccgtcgag gcgcgtcttt cgaggcgggc gaggtgtttt 60
tcttttcttt tcttctcgct gcagctgcgc cgcggcgaac gcagttcgcc gcggcggctg 120
cgacgcgcct gcgatgtcta tgcgcaggca aggcacgacg tcttgcggcg ccgcttcctg 180
cgccgccttg cgtcttggcc ccgccgacga cgcaagcagc ggcggcgccc ccccgccctc 240
ctccactgtg ggccgcagcc ctccttttcg cgcgcccgca gccgcgcggc gcgccccgcg 300
aacaaagagc cgccgcgccg gtccgcactg cgcgggccgc cccgcaagtg ccgcaaacgc 360
cggcccgaac cgccgcaaac gcgcccgcag ccgcgcccgc agccgcgcgc gacccgcggt 420
ggggacgcgc gccaagcgtc cccttccgcg ggatgacgta ggcggcggcc ccgcctatgc 480
aatacgggag gaaccaggaa ccgggagggg gggggggcgg cgcgcgcgcc gtccagtgcg 540
ggaccgatcg gcgccgggat gcccgggcgg gagggacaca gccaggcagt cagtcagtca 600
gccgcacaga gagagcgcgc ctgcgagtcc cgtctggtct cggaattgta tcccgcgcag 660
agctcagaat cgcaggtcga tcgatcgagc gatggatcca tcgctctatc cgtccatcga 720
tccatcgcat ccatcgcatc catcgcatcc atcgttgcat cgcttgcacc gcccgcttgc 780
atcgcgtgcg tgcgcaggcg ggcggcggcc acgacgcgac cgagagcggc ggcgagtgca 840
gacgccgccg gcgcccgcgg ctgcgtcgcc gcaggaagaa ggaggggggc gcgtgtttcc 900
cgcgggaggg aggagggagg gagggaggtg gttgggccaa aaagggcggc ctggacaggc 960
aggcaggccg gaagcgacgc cagcgagcga aggaagagga gagagccgcg cgggcggcca 1020
gcgcggggcg ggcggcagca aacccgctac tcagggtaaa agacagacag ctcttcgagc 1080
gagcttgttc acttcgcgga agcacgcgcg caggcacgca ggcacgcagg cagcatagcg 1140
agcagcagca gcatcgcgag cagcattgcg agaggaggcg ctgaccgccg gcctcgagca 1200
acaaaagaag cagcagcagc agcagcacga gcagcagcag cagcagcacg agcagcagca 1260
gcacgagcag cagcagcagc agcagcaaga tggcgcagcc cgagtcgacg acgccgacca 1320
tgacgcccga ggaaggccag atggaggggg cgccgcagca ggataatgcc caggtgaaga 1380
agcactgctt cgccgacgcc gatgtggcaa cctgcatcgc cgcctttggc ggtcagggaa 1440
gcgactggct cagtgagctg cgctccctcc aggaaaaggg ccagaccaac gtgcgagaaa 1500
ccatcgaact cgcactcgac aaactcgagg atcttgtcaa ggccgagccc tggtacgagg 1560
agcacggagg atgcgatatc cgcgcctggc tcgagagcga cgacaatgtc cccaacttcg 1620
acctcctccg ctacgcgccc gtctccttcc ccctcatctt cctcacccaa atgtgcaatt 1680
acatgcgtgt cctcgagaaa ctcggcacct gccatgaaga cgccctccaa aagggctggg 1740
tcaaggcctc gctcggacac agccagggcg tcgtctccgc cgccgtcgtt gccgcagcca 1800
acaccgaccg cgagctgcgc aacctcgtgg tctccggcct cgaatacatg tcaaaagtcg 1860
gcatcgccgc ccagcgcacg ctcgactacg agctcggacg ccgcaacgcc ggcccggaga 1920
ccccgatgct cgctgtacag ggaatggacg aaaaagtcct taccaaggcc ttcaaggccg 1980
ccgtctcgct ctccaacgag aagcaggcca tgatggccaa aatctcccca cggccgccgc 2040
cgccaccgcc gccccggccg ccgttagcga cgaagatcgc ttctccatcg ccctccgcaa 2100
cggccacgac gactttgtcg tctgcggcga gcccaaggac ctgcgcgtcc tccgcaaggt 2160
catcgagaaa cagagcgccg agcccggcaa ggaggcacag gcgcgcacgc ccttttccaa 2220
gcgcaagccc gtcacccaga ccaccttcct ccgcatgacg gccgtcttcc acagcgctct 2280
caacaaggac gccctcgccc agatcaacac atgggccccg gagtccgcct ttagcaaggc 2340
cttcgcccag gcctcgctcc gtgttcccgt ctttgacacc aagtctggcg ctaatctgca 2400
agatgttccc gccgccgatg ttgtcgccca tcttaccacc aacatgctca ctgagcgcgc 2460
cgacgttctc gtctccctcc gtgccgccga gaccaagacc gacgccagcc acctcctctg 2520
tttaaacgtt aacctgcatt aatgaatcgg ccaacgcgcg gggagaggcg gtttgcgtat 2580
tgggcgctct tccgcttcct cgctcactga ctcgctgcgc tcggtcgttc ggctgcggcg 2640
agcggtatca gctcactcaa aggcggtaat acggttatcc acagaatcag gggataacgc 2700
aggaaagaac atgtgagcaa aaggccagca aaaggccagg aaccgtaaaa aggccgcgtt 2760
gctggcgttt ttccataggc tccgcccccc tgacgagcat cacaaaaatc gacgctcaag 2820
tcagaggtgg cgaaacccga caggactata aagataccag gcgtttcccc ctggaagctc 2880
cctcgtgcgc tctcctgttc cgaccctgcc gcttaccgga tacctgtccg cctttctccc 2940
ttcgggaagc gtggcgcttt ctcaatgctc acgctgtagg tatctcagtt cggtgtaggt 3000
cgttcgctcc aagctgggct gtgtgcacga accccccgtt cagcccgacc gctgcgcctt 3060
atccggtaac tatcgtcttg agtccaaccc ggtaagacac gacttatcgc cactggcagc 3120
agccactggt aacaggatta gcagagcgag gtatgtaggc ggtgctacag agttcttgaa 3180
gtggtggcct aactacggct acactagaag gacagtattt ggtatctgcg ctctgctgaa 3240
gccagttacc ttcggaaaaa gagttggtag ctcttgatcc ggcaaacaaa ccaccgctgg 3300
tagcggtggt ttttttgttt gcaagcagca gattacgcgc agaaaaaaag gatctcaaga 3360
agatcctttg atcttttcta cggggtctga cgctcagtgg aacgaaaact cacgttaagg 3420
gattttggtc atgagattat caaaaaggat cttcacctag atccttttaa attaaaaatg 3480
aagttttaaa tcaatctaaa gtatatatga gtaaacttgg tctgacagtt accaatgctt 3540
aatcagtgag gcacctatct cagcgatctg tctatttcgt tcatccatag ttgcctgact 3600
ccccgtcgtg tagataacta cgatacggga gggcttacca tctggcccca gtgctgcaat 3660
gataccgcga gacccacgct caccggctcc agatttatca gcaataaacc agccagccgg 3720
aagggccgag cgcagaagtg gtcctgcaac tttatccgcc tccatccagt ctattaattg 3780
ttgccgggaa gctagagtaa gtagttcgcc agttaatagt ttgcgcaacg ttgttgccat 3840
tgctacaggc atcgtggtgt cacgctcgtc gtttggtatg gcttcattca gctccggttc 3900
ccaacgatca aggcgagtta catgatcccc catgttgtgc aaaaaagcgg ttagctcctt 3960
cggtcctccg atcgttgtca gaagtaagtt ggccgcagtg ttatcactca tggttatggc 4020
agcactgcat aattctctta ctgtcatgcc atccgtaaga tgcttttctg tgactggtga 4080
gtactcaacc aagtcattct gagaatagtg tatgcggcga ccgagttgct cttgcccggc 4140
gtcaatacgg gataataccg cgccacatag cagaacttta aaagtgctca tcattggaaa 4200
acgttcttcg gggcgaaaac tctcaaggat cttaccgctg ttgagatcca gttcgatgta 4260
acccactcgt gcacccaact gatcttcagc atcttttact ttcaccagcg tttctgggtg 4320
agcaaaaaca ggaaggcaaa atgccgcaaa aaagggaata agggcgacac ggaaatgttg 4380
aatactcata ctcttccttt ttcaatatta ttgaagcatt tatcagggtt attgtctcat 4440
gagcggatac atatttgaat gtatttagaa aaataaacaa ataggggttc cgcgcacatt 4500
tccccgaaaa gtgccacctg acgtctaaga aaccattatt atcatgacat taacctataa 4560
aaataggcgt atcacgaggc cctttcgtct cgcgcgtttc ggtgatgacg gtgaaaacct 4620
ctgacacatg cagctcccgg agacggtcac agcttgtctg taagcggatg ccgggagcag 4680
acaagcccgt cagggcgcgt cagcgggtgt tggcgggtgt cggggctggc ttaactatgc 4740
ggcatcagag cagattgtac tgagagtgca ccatatg 4777
<210> 6
<211> 4775
<212> DNA
<213> 人工序列
<220>
<223> pCL400载体
<220>
<221> misc_特征
<222> (1)..(2528)
<223> Fas_片段
<220>
<221> misc_特征
<222> (2533)..(4775)
<223> pSP73_片段
<400> 6
ccatggttta aactcgcggc gtcttcgccg tcgaggcgcg tctttcgagg cgggcgaggt 60
gtttttcttt tcttttcttc tcgctgcagc tgcgccgcgg cgaacgcagt tcgccgcggc 120
ggctgcgacg cgcctgcgat gtctatgcgc aggcaaggca cgacgtcttg cggcgccgct 180
tcctgcgccg ccttgcgtct tggccccgcc gacgacgcaa gcagcggcgg cgcccccccg 240
ccctcctcca ctgtgggccg cagccctcct tttcgcgcgc ccgcagccgc gcggcgcgcc 300
ccgcgaacaa agagccgccg cgccggtccg cactgcgcgg gccgccccgc aagtgccgca 360
aacgccggcc cgaaccgccg caaacgcgcc cgcagccgcg cccgcagccg cgcgcgaccc 420
gcggtgggga cgcgcgccaa gcgtcccctt ccgcgggatg acgtaggcgg cggccccgcc 480
tatgcaatac gggaggaacc aggaaccggg aggggggggg ggcggcgcgc gcgccgtcca 540
gtgcgggacc gatcggcgcc gggatgcccg ggcgggaggg acacagccag gcagtcagtc 600
agtcagccgc acagagagag cgcgcctgcg agtcccgtct ggtctcggaa ttgtatcccg 660
cgcagagctc agaatcgcag gtcgatcgat cgagcgatgg atccatcgct ctatccgtcc 720
atcgatccat cgcatccatc gcatccatcg catccatcgt tgcatcgctt gcaccgcccg 780
cttgcatcgc gtgcgtgcgc aggcgggcgg cggccacgac gcgaccgaga gcggcggcga 840
gtgcagacgc cgccggcgcc cgcggctgcg tcgccgcagg aagaaggagg ggggcgcgtg 900
tttcccgcgg gagggaggag ggagggaggg aggtggttgg gccaaaaagg gcggcctgga 960
caggcaggca ggccggaagc gacgccagcg agcgaaggaa gaggagagag ccgcgcgggc 1020
ggccagcgcg gggcgggcgg cagcaaaccc gctactcagg gtaaaagaca gacagctctt 1080
cgagcgagct tgttcacttc gcggaagcac gcgcgcaggc acgcaggcac gcaggcagca 1140
tagcgagcag cagcagcatc gcgagcagca ttgcgagagg aggcgctgac cgccggcctc 1200
gagcaacaaa agaagcagca gcagcagcag cacgagcagc agcagcagca gcacgagcag 1260
cagcagcacg agcagcagca gcagcagcag caagatggcg cagcccgagt cgacgacgcc 1320
gaccatgacg cccgaggaag gccagatgga gggggcgccg cagcaggata atgcccaggt 1380
gaagaagcac tgcttcgccg acgccgatgt ggcaacctgc atcgccgcct ttggcggtca 1440
gggaagcgac tggctcagtg agctgcgctc cctccaggaa aagggccaga ccaacgtgcg 1500
agaaaccatc gaactcgcac tcgacaaact cgaggatctt gtcaaggccg agccctggta 1560
cgaggagcac ggaggatgcg atatccgcgc ctggctcgag agcgacgaca atgtccccaa 1620
cttcgacctc ctccgctacg cgcccgtctc cttccccctc atcttcctca cccaaatgtg 1680
caattacatg cgtgtcctcg agaaactcgg cacctgccat gaagacgccc tccaaaaggg 1740
ctgggtcaag gcctcgctcg gacacagcca gggcgtcgtc tccgccgccg tcgttgccgc 1800
agccaacacc gaccgcgagc tgcgcaacct cgtggtctcc ggcctcgaat acatgtcaaa 1860
agtcggcatc gccgcccagc gcacgctcga ctacgagctc ggacgccgca acgccggccc 1920
ggagaccccg atgctcgctg tacagggaat ggacgaaaaa gtccttacca aggccttcaa 1980
ggccgccgtc tcgctctcca acgagaagca ggccatgatg gccaaaatct ccccacggcc 2040
gccgccgcca ccgccgcccc ggccgccgtt agcgacgaag atcgcttctc catcgccctc 2100
cgcaacggcc acgacgactt tgtcgtctgc ggcgagccca aggacctgcg cgtcctccgc 2160
aaggtcatcg agaaacagag cgccgagccc ggcaaggagg cacaggcgcg cacgcccttt 2220
tccaagcgca agcccgtcac ccagaccacc ttcctccgca tgacggccgt cttccacagc 2280
gctctcaaca aggacgccct cgcccagatc aacacatggg ccccggagtc cgcctttagc 2340
aaggccttcg cccaggcctc gctccgtgtt cccgtctttg acaccaagtc tggcgctaat 2400
ctgcaagatg ttcccgccgc cgatgttgtc gcccatctta ccaccaacat gctcactgag 2460
cgcgccgacg ttctcgtctc cctccgtgcc gccgagacca agaccgacgc cagccacctc 2520
ctctgtttaa acgttaacct gcattaatga atcggccaac gcgcggggag aggcggtttg 2580
cgtattgggc gctcttccgc ttcctcgctc actgactcgc tgcgctcggt cgttcggctg 2640
cggcgagcgg tatcagctca ctcaaaggcg gtaatacggt tatccacaga atcaggggat 2700
aacgcaggaa agaacatgtg agcaaaaggc cagcaaaagg ccaggaaccg taaaaaggcc 2760
gcgttgctgg cgtttttcca taggctccgc ccccctgacg agcatcacaa aaatcgacgc 2820
tcaagtcaga ggtggcgaaa cccgacagga ctataaagat accaggcgtt tccccctgga 2880
agctccctcg tgcgctctcc tgttccgacc ctgccgctta ccggatacct gtccgccttt 2940
ctcccttcgg gaagcgtggc gctttctcaa tgctcacgct gtaggtatct cagttcggtg 3000
taggtcgttc gctccaagct gggctgtgtg cacgaacccc ccgttcagcc cgaccgctgc 3060
gccttatccg gtaactatcg tcttgagtcc aacccggtaa gacacgactt atcgccactg 3120
gcagcagcca ctggtaacag gattagcaga gcgaggtatg taggcggtgc tacagagttc 3180
ttgaagtggt ggcctaacta cggctacact agaaggacag tatttggtat ctgcgctctg 3240
ctgaagccag ttaccttcgg aaaaagagtt ggtagctctt gatccggcaa acaaaccacc 3300
gctggtagcg gtggtttttt tgtttgcaag cagcagatta cgcgcagaaa aaaaggatct 3360
caagaagatc ctttgatctt ttctacgggg tctgacgctc agtggaacga aaactcacgt 3420
taagggattt tggtcatgag attatcaaaa aggatcttca cctagatcct tttaaattaa 3480
aaatgaagtt ttaaatcaat ctaaagtata tatgagtaaa cttggtctga cagttaccaa 3540
tgcttaatca gtgaggcacc tatctcagcg atctgtctat ttcgttcatc catagttgcc 3600
tgactccccg tcgtgtagat aactacgata cgggagggct taccatctgg ccccagtgct 3660
gcaatgatac cgcgagaccc acgctcaccg gctccagatt tatcagcaat aaaccagcca 3720
gccggaaggg ccgagcgcag aagtggtcct gcaactttat ccgcctccat ccagtctatt 3780
aattgttgcc gggaagctag agtaagtagt tcgccagtta atagtttgcg caacgttgtt 3840
gccattgcta caggcatcgt ggtgtcacgc tcgtcgtttg gtatggcttc attcagctcc 3900
ggttcccaac gatcaaggcg agttacatga tcccccatgt tgtgcaaaaa agcggttagc 3960
tccttcggtc ctccgatcgt tgtcagaagt aagttggccg cagtgttatc actcatggtt 4020
atggcagcac tgcataattc tcttactgtc atgccatccg taagatgctt ttctgtgact 4080
ggtgagtact caaccaagtc attctgagaa tagtgtatgc ggcgaccgag ttgctcttgc 4140
ccggcgtcaa tacgggataa taccgcgcca catagcagaa ctttaaaagt gctcatcatt 4200
ggaaaacgtt cttcggggcg aaaactctca aggatcttac cgctgttgag atccagttcg 4260
atgtaaccca ctcgtgcacc caactgatct tcagcatctt ttactttcac cagcgtttct 4320
gggtgagcaa aaacaggaag gcaaaatgcc gcaaaaaagg gaataagggc gacacggaaa 4380
tgttgaatac tcatactctt cctttttcaa tattattgaa gcatttatca gggttattgt 4440
ctcatgagcg gatacatatt tgaatgtatt tagaaaaata aacaaatagg ggttccgcgc 4500
acatttcccc gaaaagtgcc acctgacgtc taagaaacca ttattatcat gacattaacc 4560
tataaaaata ggcgtatcac gaggcccttt cgtctcgcgc gtttcggtga tgacggtgaa 4620
aacctctgac acatgcagct cccggagacg gtcacagctt gtctgtaagc ggatgccggg 4680
agcagacaag cccgtcaggg cgcgtcagcg ggtgttggcg ggtgtcgggg ctggcttaac 4740
tatgcggcat cagagcagat tgtactgaga gtgca 4775
<210> 7
<211> 5991
<212> DNA
<213> 人工序列
<220>
<223> pCL401载体
<220>
<221> misc_特征
<222> (1)..(1063)
<223> EF-1_α_启动子
<220>
<221> misc_特征
<222> (1076)..(1112)
<223> 锤头状_核酶
<220>
<221> misc_特征
<222> (1113)..(1132)
<223> 胡萝卜素_合成酶_靶标_1
<220>
<221> misc_特征
<222> (1133)..(1212)
<223> gRNA
<220>
<221> misc_特征
<222> (1213)..(1280)
<223> HDV_核酶
<220>
<221> misc_特征
<222> (1300)..(1939)
<223> OrfC_终止子
<220>
<221> misc_特征
<222> (4474)..(4922)
<223> α_微管蛋白_启动子
<220>
<221> misc_特征
<222> (4923)..(5717)
<223> 巴龙霉素_抗性_基因
<220>
<221> misc_特征
<222> (5718)..(5991)
<223> SV40_终止子
<400> 7
ctcttatctg cctcgcgccg ttgaccgccg cttgactctt ggcgcttgcc gctcgcatcc 60
tgcctcgctc gcgcaggcgg gcgggcgagt gggtgggtcc gcagccttcc gcgctcgccc 120
gctagctcgc tcgcgccgtg ctgcagccag cagggcagca ccgcacggca ggcaggtccc 180
ggcgcggatc gatcgatcca tcgatccatc gatccatcga tcgtgcggtc aaaaagaaag 240
gaagaagaaa ggaaaaagaa aggcgtgcgc acccgagtgc gcgctgagcg cccgctcgcg 300
gtcccgcgga gcctccgcgt tagtccccgc cccgcgccgc gcagtccccc gggaggcatc 360
gcgcacctct cgccgccccc tcgcgcctcg ccgattcccc gcctcccctt ttccgcttct 420
tcgccgcctc cgctcgcggc cgcgtcgccc gcgccccgct ccctatctgc tccccagggg 480
ggcactccgc accttttgcg cccgctgccg ccgccgcggc cgccccgccg ccctggtttc 540
ccccgcgagc gcggccgcgt cgccgcgcaa agactcgccg cgtgccgccc cgagcaacgg 600
gtggcggcgg cgcggcggcg ggcggggcgc ggcggcgcgt aggcggggct aggcgccggc 660
taggcgaaac gccgcccccg ggcgccgccg ccgcccgctc cagagcagtc gccgcgccag 720
accgccaacg cagagaccga gaccgaggta cgtcgcgccc gagcacgccg cgacgcgcgg 780
cagggacgag gagcacgacg ccgcgccgcg ccgcgcgggg ggggggaggg agaggcagga 840
cgcgggagcg agcgtgcatg tttccgcgcg agacgacgcc gcgcgcgctg gagaggagat 900
aaggcgcttg gatcgcgaga gggccagcca ggctggaggc gaaaatgggt ggagaggata 960
gtatcttgcg tgcttggacg aggagactga cgaggaggac ggatacgtcg atgatgatgt 1020
gcacagagaa gaagcagttc gaaagcgact actagcaagc aagagatcta gcacgctgat 1080
gagtccgtga ggacgaaacg agtaagctcg tctgcggacg tcgtggacgc gcgttttaga 1140
gctagaaata gcaagttaaa ataaggctag tccgttatca acttgaaaaa gtggcaccga 1200
gtcggtgctt ttggccggca tggtcccagc ctcctcgctg gcgccggctg ggcaacatgc 1260
ttcggcatgg cgaatgggac catatgagtt atgagatccg aaagtgaacc ttgtcctaac 1320
ccgacagcga atggcgggag ggggcgggct aaaagatcgt attacatagt atttttcccc 1380
tactctttgt gtttgtcttt tttttttttt tgaacgcatt caagccactt gtctgggttt 1440
acttgtttgt ttgcttgctt gcttgcttgc ttgcctgctt cttggtcaga cggcccaaaa 1500
aagggaaaaa attcattcat ggcacagata agaaaaagaa aaagtttgtc gaccaccgtc 1560
atcagaaagc aagagaagag aaacactcgc gctcacattc tcgctcgcgt aagaatctta 1620
gccacgcata cgaagtaatt tgtccatctg gcgaatcttt acatgagcgt tttcaagctg 1680
gagcgtgaga tcataccttt cttgatcgta atgttccaac cttgcatagg cctcgttgcg 1740
atccgctagc aatgcgtcgt actcccgttg caactgcgcc atcgcctcat tgtgacgtga 1800
gttcagattc ttctcgagac cttcgagcgc tgctaatttc gcctgacgct ccttcttttg 1860
tgcttccatg acacgccgct tcaccgtgcg ttccacttct tcctcagaca tgcccttggc 1920
tgcctcgacc tgctcggtaa aacgggcccc agcacgtgct acgagatttc gattccaccg 1980
ccgccttcta tgaaaggttg ggcttcggaa tcgttttccg ggacgccggc tggatgatcc 2040
tccagcgcgg ggatctcatg ctggagttct tcgcccaccc caacttgttt attgcagctt 2100
ataatggtta caaataaagc aatagcatca caaatttcac aaataaagca tttttttcac 2160
tgcattctag ttgtggtttg tccaaactca tcaatgtatc ttatcataca tggtcgacct 2220
gcaggaacct gcattaatga atcggccaac gcgcggggag aggcggtttg cgtattgggc 2280
gctcttccgc ttcctcgctc actgactcgc tgcgctcggt cgttcggctg cggcgagcgg 2340
tatcagctca ctcaaaggcg gtaatacggt tatccacaga atcaggggat aacgcaggaa 2400
agaacatgtg agcaaaaggc cagcaaaagg ccaggaaccg taaaaaggcc gcgttgctgg 2460
cgtttttcca taggctccgc ccccctgacg agcatcacaa aaatcgacgc tcaagtcaga 2520
ggtggcgaaa cccgacagga ctataaagat accaggcgtt tccccctgga agctccctcg 2580
tgcgctctcc tgttccgacc ctgccgctta ccggatacct gtccgccttt ctcccttcgg 2640
gaagcgtggc gctttctcat agctcacgct gtaggtatct cagttcggtg taggtcgttc 2700
gctccaagct gggctgtgtg cacgaacccc ccgttcagcc cgaccgctgc gccttatccg 2760
gtaactatcg tcttgagtcc aacccggtaa gacacgactt atcgccactg gcagcagcca 2820
ctggtaacag gattagcaga gcgaggtatg taggcggtgc tacagagttc ttgaagtggt 2880
ggcctaacta cggctacact agaagaacag tatttggtat ctgcgctctg ctgaagccag 2940
ttaccttcgg aaaaagagtt ggtagctctt gatccggcaa acaaaccacc gctggtagcg 3000
gtggtttttt tgtttgcaag cagcagatta cgcgcagaaa aaaaggatct caagaagatc 3060
ctttgatctt ttctacgggg tctgacgctc agtggaacga aaactcacgt taagggattt 3120
tggtcatgag attatcaaaa aggatcttca cctagatcct tttaaattaa aaatgaagtt 3180
ttaaatcaat ctaaagtata tatgagtaaa cttggtctga cagttaccaa tgcttaatca 3240
gtgaggcacc tatctcagcg atctgtctat ttcgttcatc catagttgcc tgactccccg 3300
tcgtgtagat aactacgata cgggagggct taccatctgg ccccagtgct gcaatgatac 3360
cgcgagaccc acgctcaccg gctccagatt tatcagcaat aaaccagcca gccggaaggg 3420
ccgagcgcag aagtggtcct gcaactttat ccgcctccat ccagtctatt aattgttgcc 3480
gggaagctag agtaagtagt tcgccagtta atagtttgcg caacgttgtt gccattgcta 3540
caggcatcgt ggtgtcacgc tcgtcgtttg gtatggcttc attcagctcc ggttcccaac 3600
gatcaaggcg agttacatga tcccccatgt tgtgcaaaaa agcggttagc tccttcggtc 3660
ctccgatcgt tgtcagaagt aagttggccg cagtgttatc actcatggtt atggcagcac 3720
tgcataattc tcttactgtc atgccatccg taagatgctt ttctgtgact ggtgagtact 3780
caaccaagtc attctgagaa tagtgtatgc ggcgaccgag ttgctcttgc ccggcgtcaa 3840
tacgggataa taccgcgcca catagcagaa ctttaaaagt gctcatcatt ggaaaacgtt 3900
cttcggggcg aaaactctca aggatcttac cgctgttgag atccagttcg atgtaaccca 3960
ctcgtgcacc caactgatct tcagcatctt ttactttcac cagcgtttct gggtgagcaa 4020
aaacaggaag gcaaaatgcc gcaaaaaagg gaataagggc gacacggaaa tgttgaatac 4080
tcatactctt cctttttcaa tattattgaa gcatttatca gggttattgt ctcatgagcg 4140
gatacatatt tgaatgtatt tagaaaaata aacaaatagg ggttccgcgc acatttcccc 4200
gaaaagtgcc acctgacgtc taagaaacca ttattatcat gacattaacc tataaaaata 4260
ggcgtatcac gaggcccttt cgtctcgcgc gtttcggtga tgacggtgaa aacctctgac 4320
acatgcagct cccggagacg gtcacagctt gtctgtaagc ggatgccggg agcagacaag 4380
cccgtcaggg cgcgtcagcg ggtgttggcg ggtgtcgggg ctggcttaac tatgcggcat 4440
cagagcagat tgtactgaga gtgcaccaag cttccaattt taggcccccc actgaccgag 4500
gtctgtcgat aatccacttt tccattgatt ttccaggttt cgttaactca tgccactgag 4560
caaaacttcg gtctttccta acaaaagctc tcctcacaaa gcatggcgcg gcaacggacg 4620
tgtcctcata ctccactgcc acacaaggtc gataaactaa gctcctcaca aatagaggag 4680
aattccactg acaactgaaa acaatgtatg agagacgatc accactggag cggcgcggcg 4740
gttgggcgcg gaggtcggca gcaaaaacaa gcgactcgcc gagcaaaccc gaatcagcct 4800
tcagacggtc gtgcctaaca acacgccgtt ctaccccgcc ttcttcgcgc cccttcgcgt 4860
ccaagcatcc ttcaagttta tctctctagt tcaacttcaa gaagaacaac accaccaaca 4920
ccatgattga acaagatgga ttgcacgcag gttctccggc cgcttgggtg gagaggctat 4980
tcggctatga ctgggcacaa cagacaatcg gctgctctga tgccgccgtg ttccggctgt 5040
cagcgcaggg gcgcccggtt ctttttgtca agaccgacct gtccggtgcc ctgaatgaac 5100
tgcaggacga ggcagcgcgg ctatcgtggc tggccacgac gggcgttcct tgcgcagctg 5160
tgctcgacgt tgtcactgaa gcgggaaggg actggctgct attgggcgaa gtgccggggc 5220
aggatctcct gtcatctcac cttgctcctg ccgagaaagt atccatcatg gctgatgcaa 5280
tgcggcggct gcatacgctt gatccggcta cctgcccatt cgaccaccaa gcgaaacatc 5340
gcatcgagcg agcacgtact cggatggaag ccggtcttgt cgatcaggat gatctggacg 5400
aagagcatca ggggctcgcg ccagccgaac tgttcgccag gctcaaggcg cgcatgcccg 5460
acggcgatga tctcgtcgtg acccatggcg atgcctgctt gccgaatatc atggtggaaa 5520
atggccgctt ttctggattc atcgactgtg gccggctggg tgtggcggac cgctatcagg 5580
acatagcgtt ggctacccgt gatattgctg aagagcttgg cggcgaatgg gctgaccgct 5640
tcctcgtgct ttacggtatc gccgctcccg attcgcagcg catcgccttc tatcgccttc 5700
ttgacgagtt cttctgacac gtgctacgag atttcgattc caccgccgcc ttctatgaaa 5760
ggttgggctt cggaatcgtt ttccgggacg ccggctggat gatcctccag cgcggggatc 5820
tcatgctgga gttcttcgcc caccccaact tgtttattgc agcttataat ggttacaaat 5880
aaagcaatag catcacaaat ttcacaaata aagcattttt ttcactgcat tctagttgtg 5940
gtttgtccaa actcatcaat gtatcttatc atgtctgaat tcccggggta c 5991
<210> 8
<211> 7612
<212> DNA
<213> 人工序列
<220>
<223> pCL402载体
<220>
<221> misc_特征
<222> (5)..(1198)
<223> FAS_上游_片段
<220>
<221> misc_特征
<222> (1199)..(1647)
<223> α_微管蛋白_启动子
<220>
<221> misc_特征
<222> (1648)..(2442)
<223> 巴龙霉素_抗性_基因
<220>
<221> misc_特征
<222> (2443)..(2716)
<223> SV40_终止子
<220>
<221> misc_特征
<222> (2717)..(3779)
<223> EF-1_alpha_启动子
<220>
<221> misc_特征
<222> (3792)..(3828)
<223> 锤头状_核酶
<220>
<221> misc_特征
<222> (3829)..(3848)
<223> 胡萝卜素_合成酶_靶标_1
<220>
<221> misc_特征
<222> (3849)..(3928)
<223> gRNA
<220>
<221> misc_特征
<222> (3929)..(3996)
<223> HDV_核酶
<220>
<221> misc_特征
<222> (4016)..(4534)
<223> OrfC_终止子
<220>
<221> misc_特征
<222> (4535)..(5360)
<223> FAS_下游_片段
<220>
<221> misc_特征
<222> (5365)..(7612)
<223> pSP73
<400> 8
gtttaaactc gcggcgtctt cgccgtcgag gcgcgtcttt cgaggcgggc gaggtgtttt 60
tcttttcttt tcttctcgct gcagctgcgc cgcggcgaac gcagttcgcc gcggcggctg 120
cgacgcgcct gcgatgtcta tgcgcaggca aggcacgacg tcttgcggcg ccgcttcctg 180
cgccgccttg cgtcttggcc ccgccgacga cgcaagcagc ggcggcgccc ccccgccctc 240
ctccactgtg ggccgcagcc ctccttttcg cgcgcccgca gccgcgcggc gcgccccgcg 300
aacaaagagc cgccgcgccg gtccgcactg cgcgggccgc cccgcaagtg ccgcaaacgc 360
cggcccgaac cgccgcaaac gcgcccgcag ccgcgcccgc agccgcgcgc gacccgcggt 420
ggggacgcgc gccaagcgtc cccttccgcg ggatgacgta ggcggcggcc ccgcctatgc 480
aatacgggag gaaccaggaa ccgggagggg gggggggcgg cgcgcgcgcc gtccagtgcg 540
ggaccgatcg gcgccgggat gcccgggcgg gagggacaca gccaggcagt cagtcagtca 600
gccgcacaga gagagcgcgc ctgcgagtcc cgtctggtct cggaattgta tcccgcgcag 660
agctcagaat cgcaggtcga tcgatcgagc gatggatcca tcgctctatc cgtccatcga 720
tccatcgcat ccatcgcatc catcgcatcc atcgttgcat cgcttgcacc gcccgcttgc 780
atcgcgtgcg tgcgcaggcg ggcggcggcc acgacgcgac cgagagcggc ggcgagtgca 840
gacgccgccg gcgcccgcgg ctgcgtcgcc gcaggaagaa ggaggggggc gcgtgtttcc 900
cgcgggaggg aggagggagg gagggaggtg gttgggccaa aaagggcggc ctggacaggc 960
aggcaggccg gaagcgacgc cagcgagcga aggaagagga gagagccgcg cgggcggcca 1020
gcgcggggcg ggcggcagca aacccgctac tcagggtaaa agacagacag ctcttcgagc 1080
gagcttgttc acttcgcgga agcacgcgcg caggcacgca ggcacgcagg cagcatagcg 1140
agcagcagca gcatcgcgag cagcattgcg agaggaggcg ctgaccgccg gcctcgagcc 1200
aattttaggc cccccactga ccgaggtctg tcgataatcc acttttccat tgattttcca 1260
ggtttcgtta actcatgcca ctgagcaaaa cttcggtctt tcctaacaaa agctctcctc 1320
acaaagcatg gcgcggcaac ggacgtgtcc tcatactcca ctgccacaca aggtcgataa 1380
actaagctcc tcacaaatag aggagaattc cactgacaac tgaaaacaat gtatgagaga 1440
cgatcaccac tggagcggcg cggcggttgg gcgcggaggt cggcagcaaa aacaagcgac 1500
tcgccgagca aacccgaatc agccttcaga cggtcgtgcc taacaacacg ccgttctacc 1560
ccgccttctt cgcgcccctt cgcgtccaag catccttcaa gtttatctct ctagttcaac 1620
ttcaagaaga acaacaccac caacaccatg attgaacaag atggattgca cgcaggttct 1680
ccggccgctt gggtggagag gctattcggc tatgactggg cacaacagac aatcggctgc 1740
tctgatgccg ccgtgttccg gctgtcagcg caggggcgcc cggttctttt tgtcaagacc 1800
gacctgtccg gtgccctgaa tgaactgcag gacgaggcag cgcggctatc gtggctggcc 1860
acgacgggcg ttccttgcgc agctgtgctc gacgttgtca ctgaagcggg aagggactgg 1920
ctgctattgg gcgaagtgcc ggggcaggat ctcctgtcat ctcaccttgc tcctgccgag 1980
aaagtatcca tcatggctga tgcaatgcgg cggctgcata cgcttgatcc ggctacctgc 2040
ccattcgacc accaagcgaa acatcgcatc gagcgagcac gtactcggat ggaagccggt 2100
cttgtcgatc aggatgatct ggacgaagag catcaggggc tcgcgccagc cgaactgttc 2160
gccaggctca aggcgcgcat gcccgacggc gatgatctcg tcgtgaccca tggcgatgcc 2220
tgcttgccga atatcatggt ggaaaatggc cgcttttctg gattcatcga ctgtggccgg 2280
ctgggtgtgg cggaccgcta tcaggacata gcgttggcta cccgtgatat tgctgaagag 2340
cttggcggcg aatgggctga ccgcttcctc gtgctttacg gtatcgccgc tcccgattcg 2400
cagcgcatcg ccttctatcg ccttcttgac gagttcttct gacacgtgct acgagatttc 2460
gattccaccg ccgccttcta tgaaaggttg ggcttcggaa tcgttttccg ggacgccggc 2520
tggatgatcc tccagcgcgg ggatctcatg ctggagttct tcgcccaccc caacttgttt 2580
attgcagctt ataatggtta caaataaagc aatagcatca caaatttcac aaataaagca 2640
tttttttcac tgcattctag ttgtggtttg tccaaactca tcaatgtatc ttatcatgtc 2700
tgaattcccg gggtacctct tatctgcctc gcgccgttga ccgccgcttg actcttggcg 2760
cttgccgctc gcatcctgcc tcgctcgcgc aggcgggcgg gcgagtgggt gggtccgcag 2820
ccttccgcgc tcgcccgcta gctcgctcgc gccgtgctgc agccagcagg gcagcaccgc 2880
acggcaggca ggtcccggcg cggatcgatc gatccatcga tccatcgatc catcgatcgt 2940
gcggtcaaaa agaaaggaag aagaaaggaa aaagaaaggc gtgcgcaccc gagtgcgcgc 3000
tgagcgcccg ctcgcggtcc cgcggagcct ccgcgttagt ccccgccccg cgccgcgcag 3060
tcccccggga ggcatcgcgc acctctcgcc gccccctcgc gcctcgccga ttccccgcct 3120
ccccttttcc gcttcttcgc cgcctccgct cgcggccgcg tcgcccgcgc cccgctccct 3180
atctgctccc caggggggca ctccgcacct tttgcgcccg ctgccgccgc cgcggccgcc 3240
ccgccgccct ggtttccccc gcgagcgcgg ccgcgtcgcc gcgcaaagac tcgccgcgtg 3300
ccgccccgag caacgggtgg cggcggcgcg gcggcgggcg gggcgcggcg gcgcgtaggc 3360
ggggctaggc gccggctagg cgaaacgccg cccccgggcg ccgccgccgc ccgctccaga 3420
gcagtcgccg cgccagaccg ccaacgcaga gaccgagacc gaggtacgtc gcgcccgagc 3480
acgccgcgac gcgcggcagg gacgaggagc acgacgccgc gccgcgccgc gcgggggggg 3540
ggagggagag gcaggacgcg ggagcgagcg tgcatgtttc cgcgcgagac gacgccgcgc 3600
gcgctggaga ggagataagg cgcttggatc gcgagagggc cagccaggct ggaggcgaaa 3660
atgggtggag aggatagtat cttgcgtgct tggacgagga gactgacgag gaggacggat 3720
acgtcgatga tgatgtgcac agagaagaag cagttcgaaa gcgactacta gcaagcaaga 3780
gatctagcac gctgatgagt ccgtgaggac gaaacgagta agctcgtctg cggacgtcgt 3840
ggacgcgcgt tttagagcta gaaatagcaa gttaaaataa ggctagtccg ttatcaactt 3900
gaaaaagtgg caccgagtcg gtgcttttgg ccggcatggt cccagcctcc tcgctggcgc 3960
cggctgggca acatgcttcg gcatggcgaa tgggaccata tgagttatga gatccgaaag 4020
tgaaccttgt cctaacccga cagcgaatgg cgggaggggg cgggctaaaa gatcgtatta 4080
catagtattt ttcccctact ctttgtgttt gtcttttttt tttttttgaa cgcattcaag 4140
ccacttgtct gggtttactt gtttgtttgc ttgcttgctt gcttgcttgc ctgcttcttg 4200
gtcagacggc ccaaaaaagg gaaaaaattc attcatggca cagataagaa aaagaaaaag 4260
tttgtcgacc accgtcatca gaaagcaaga gaagagaaac actcgcgctc acattctcgc 4320
tcgcgtaaga atcttagcca cgcatacgaa gtaatttgtc catctggcga atctttacat 4380
gagcgttttc aagctggagc gtgagatcat acctttcttg atcgtaatgt tccaaccttg 4440
cataggcctc gttgcgatcc gctagcaatg cgtcgtactc ccgttgcaac tgcgccatcg 4500
cctcattgtg acgtgagttc agattcttct cgagaaactc ggcacctgcc atgaagacgc 4560
cctccaaaag ggctgggtca aggcctcgct cggacacagc cagggcgtcg tctccgccgc 4620
cgtcgttgcc gcagccaaca ccgaccgcga gctgcgcaac ctcgtggtct ccggcctcga 4680
atacatgtca aaagtcggca tcgccgccca gcgcacgctc gactacgagc tcggacgccg 4740
caacgccggc ccggagaccc cgatgctcgc tgtacaggga atggacgaaa aagtccttac 4800
caaggccttc aaggccgccg tctcgctctc caacgagaag caggccatga tggccaaaat 4860
ctccccacgg ccgccgccgc caccgccgcc ccggccgccg ttagcgacga agatcgcttc 4920
tccatcgccc tccgcaacgg ccacgacgac tttgtcgtct gcggcgagcc caaggacctg 4980
cgcgtcctcc gcaaggtcat cgagaaacag agcgccgagc ccggcaagga ggcacaggcg 5040
cgcacgccct tttccaagcg caagcccgtc acccagacca ccttcctccg catgacggcc 5100
gtcttccaca gcgctctcaa caaggacgcc ctcgcccaga tcaacacatg ggccccggag 5160
tccgccttta gcaaggcctt cgcccaggcc tcgctccgtg ttcccgtctt tgacaccaag 5220
tctggcgcta atctgcaaga tgttcccgcc gccgatgttg tcgcccatct taccaccaac 5280
atgctcactg agcgcgccga cgttctcgtc tccctccgtg ccgccgagac caagaccgac 5340
gccagccacc tcctctgttt aaacgttaac ctgcattaat gaatcggcca acgcgcgggg 5400
agaggcggtt tgcgtattgg gcgctcttcc gcttcctcgc tcactgactc gctgcgctcg 5460
gtcgttcggc tgcggcgagc ggtatcagct cactcaaagg cggtaatacg gttatccaca 5520
gaatcagggg ataacgcagg aaagaacatg tgagcaaaag gccagcaaaa ggccaggaac 5580
cgtaaaaagg ccgcgttgct ggcgtttttc cataggctcc gcccccctga cgagcatcac 5640
aaaaatcgac gctcaagtca gaggtggcga aacccgacag gactataaag ataccaggcg 5700
tttccccctg gaagctccct cgtgcgctct cctgttccga ccctgccgct taccggatac 5760
ctgtccgcct ttctcccttc gggaagcgtg gcgctttctc aatgctcacg ctgtaggtat 5820
ctcagttcgg tgtaggtcgt tcgctccaag ctgggctgtg tgcacgaacc ccccgttcag 5880
cccgaccgct gcgccttatc cggtaactat cgtcttgagt ccaacccggt aagacacgac 5940
ttatcgccac tggcagcagc cactggtaac aggattagca gagcgaggta tgtaggcggt 6000
gctacagagt tcttgaagtg gtggcctaac tacggctaca ctagaaggac agtatttggt 6060
atctgcgctc tgctgaagcc agttaccttc ggaaaaagag ttggtagctc ttgatccggc 6120
aaacaaacca ccgctggtag cggtggtttt tttgtttgca agcagcagat tacgcgcaga 6180
aaaaaaggat ctcaagaaga tcctttgatc ttttctacgg ggtctgacgc tcagtggaac 6240
gaaaactcac gttaagggat tttggtcatg agattatcaa aaaggatctt cacctagatc 6300
cttttaaatt aaaaatgaag ttttaaatca atctaaagta tatatgagta aacttggtct 6360
gacagttacc aatgcttaat cagtgaggca cctatctcag cgatctgtct atttcgttca 6420
tccatagttg cctgactccc cgtcgtgtag ataactacga tacgggaggg cttaccatct 6480
ggccccagtg ctgcaatgat accgcgagac ccacgctcac cggctccaga tttatcagca 6540
ataaaccagc cagccggaag ggccgagcgc agaagtggtc ctgcaacttt atccgcctcc 6600
atccagtcta ttaattgttg ccgggaagct agagtaagta gttcgccagt taatagtttg 6660
cgcaacgttg ttgccattgc tacaggcatc gtggtgtcac gctcgtcgtt tggtatggct 6720
tcattcagct ccggttccca acgatcaagg cgagttacat gatcccccat gttgtgcaaa 6780
aaagcggtta gctccttcgg tcctccgatc gttgtcagaa gtaagttggc cgcagtgtta 6840
tcactcatgg ttatggcagc actgcataat tctcttactg tcatgccatc cgtaagatgc 6900
ttttctgtga ctggtgagta ctcaaccaag tcattctgag aatagtgtat gcggcgaccg 6960
agttgctctt gcccggcgtc aatacgggat aataccgcgc cacatagcag aactttaaaa 7020
gtgctcatca ttggaaaacg ttcttcgggg cgaaaactct caaggatctt accgctgttg 7080
agatccagtt cgatgtaacc cactcgtgca cccaactgat cttcagcatc ttttactttc 7140
accagcgttt ctgggtgagc aaaaacagga aggcaaaatg ccgcaaaaaa gggaataagg 7200
gcgacacgga aatgttgaat actcatactc ttcctttttc aatattattg aagcatttat 7260
cagggttatt gtctcatgag cggatacata tttgaatgta tttagaaaaa taaacaaata 7320
ggggttccgc gcacatttcc ccgaaaagtg ccacctgacg tctaagaaac cattattatc 7380
atgacattaa cctataaaaa taggcgtatc acgaggccct ttcgtctcgc gcgtttcggt 7440
gatgacggtg aaaacctctg acacatgcag ctcccggaga cggtcacagc ttgtctgtaa 7500
gcggatgccg ggagcagaca agcccgtcag ggcgcgtcag cgggtgttgg cgggtgtcgg 7560
ggctggctta actatgcggc atcagagcag attgtactga gagtgcacca tg 7612
<210> 9
<211> 7609
<212> DNA
<213> 人工序列
<220>
<223> pYB36载体
<220>
<221> misc_特征
<222> (2)..(1192)
<223> FAS_上游_片段
<220>
<221> misc_特征
<222> (1200)..(1648)
<223> α_微管蛋白_启动子
<220>
<221> misc_特征
<222> (1679)..(2443)
<223> 巴龙霉素_抗性_基因
<220>
<221> misc_特征
<222> (2444)..(2717)
<223> SV40_终止子
<220>
<221> misc_特征
<222> (2718)..(3780)
<223> EF-1_α_启动子
<220>
<221> misc_特征
<222> (3797)..(3829)
<223> 锤头状_核酶
<220>
<221> misc_特征
<222> (3830)..(3849)
<223> 胡萝卜素_合成酶_靶标_1
<220>
<221> misc_特征
<222> (3850)..(3929)
<223> gRNA
<220>
<221> misc_特征
<222> (3930)..(3997)
<223> HDV_核酶
<220>
<221> misc_特征
<222> (4017)..(4535)
<223> OrfC_终止子
<220>
<221> misc_特征
<222> (4536)..(5368)
<223> FAS_下游_片段
<220>
<221> misc_特征
<222> (6367)..(7227)
<223> AmpR_基因
<400> 9
gtttaaactc gcggcgtctt cgccgtcgag gcgcgtcttt cgaggcgggc gaggtgtttt 60
tcttttcttt tcttctcgct gcagctgcgc cgcggcgaac gcagttcgcc gcggcggctg 120
cgacgcgcct gcgatgtcta tgcgcaggca aggcacgacg tcttgcggcg ccgcttcctg 180
cgccgccttg cgtcttggcc ccgccgacga cgcaagcagc ggcggcgccc ccccgccctc 240
ctccactgtg ggccgcagcc ctccttttcg cgcgcccgca gccgcgcggc gcgccccgcg 300
aacaaagagc cgccgcgccg gtccgcactg cgcgggccgc cccgcaagtg ccgcaaacgc 360
cggcccgaac cgccgcaaac gcgcccgcag ccgcgcccgc agccgcgcgc gacccgcggt 420
ggggacgcgc gccaagcgtc cccttccgcg ggatgacgta ggcggcggcc ccgcctatgc 480
aatacgggag gaaccaggaa ccgggagggg gggggggcgg cgcgcgcgcc gtccagtgcg 540
ggaccgatcg gcgccgggat gcccgggcgg gagggacaca gccaggcagt cagtcagtca 600
gccgcacaga gagagcgcgc ctgcgagtcc cgtctggtct cggaattgta tcccgcgcag 660
agctcagaat cgcaggtcga tcgatcgagc gatggatcca tcgctctatc cgtccatcga 720
tccatcgcat ccatcgcatc catcgcatcc atcgttgcat cgcttgcacc gcccgcttgc 780
atcgcgtgcg tgcgcaggcg ggcggcggcc acgacgcgac cgagagcggc ggcgagtgca 840
gacgccgccg gcgcccgcgg ctgcgtcgcc gcaggaagaa ggaggggggc gcgtgtttcc 900
cgcgggaggg aggagggagg gagggaggtg gttgggccaa aaagggcggc ctggacaggc 960
aggcaggccg gaagcgacgc cagcgagcga aggaagagga gagagccgcg cgggcggcca 1020
gcgcggggcg ggcggcagca aacccgctac tcagggtaaa agacagacag ctcttcgagc 1080
gagcttgttc acttcgcgga agcacgcgcg caggcacgca ggcacgcagg cagcatagcg 1140
agcagcagca gcatcgcgag cagcattgcg agaggaggcg ctgaccgccg gccaagcttc 1200
caattttagg ccccccactg accgaggtct gtcgataatc cacttttcca ttgattttcc 1260
aggtttcgtt aactcatgcc actgagcaaa acttcggtct ttcctaacaa aagctctcct 1320
cacaaagcat ggcgcggcaa cggacgtgtc ctcatactcc actgccacac aaggtcgata 1380
aactaagctc ctcacaaata gaggagaatt ccactgacaa ctgaaaacaa tgtatgagag 1440
acgatcacca ctggagcggc gcggcggttg ggcgcggagg tcggcagcaa aaacaagcga 1500
ctcgccgagc aaacccgaat cagccttcag acggtcgtgc ctaacaacac gccgttctac 1560
cccgccttct tcgcgcccct tcgcgtccaa gcatccttca agtttatctc tctagttcaa 1620
cttcaagaag aacaacacca ccaacaccat gattgaacaa gatggattgc acgcaggttc 1680
tccggccgct tgggtggaga ggctattcgg ctatgactgg gcacaacaga caatcggctg 1740
ctctgatgcc gccgtgttcc ggctgtcagc gcaggggcgc ccggttcttt ttgtcaagac 1800
cgacctgtcc ggtgccctga atgaactgca ggacgaggca gcgcggctat cgtggctggc 1860
cacgacgggc gttccttgcg cagctgtgct cgacgttgtc actgaagcgg gaagggactg 1920
gctgctattg ggcgaagtgc cggggcagga tctcctgtca tctcaccttg ctcctgccga 1980
gaaagtatcc atcatggctg atgcaatgcg gcggctgcat acgcttgatc cggctacctg 2040
cccattcgac caccaagcga aacatcgcat cgagcgagca cgtactcgga tggaagccgg 2100
tcttgtcgat caggatgatc tggacgaaga gcatcagggg ctcgcgccag ccgaactgtt 2160
cgccaggctc aaggcgcgca tgcccgacgg cgatgatctc gtcgtgaccc atggcgatgc 2220
ctgcttgccg aatatcatgg tggaaaatgg ccgcttttct ggattcatcg actgtggccg 2280
gctgggtgtg gcggaccgct atcaggacat agcgttggct acccgtgata ttgctgaaga 2340
gcttggcggc gaatgggctg accgcttcct cgtgctttac ggtatcgccg ctcccgattc 2400
gcagcgcatc gccttctatc gccttcttga cgagttcttc tgacacgtgc tacgagattt 2460
cgattccacc gccgccttct atgaaaggtt gggcttcgga atcgttttcc gggacgccgg 2520
ctggatgatc ctccagcgcg gggatctcat gctggagttc ttcgcccacc ccaacttgtt 2580
tattgcagct tataatggtt acaaataaag caatagcatc acaaatttca caaataaagc 2640
atttttttca ctgcattcta gttgtggttt gtccaaactc atcaatgtat cttatcatgt 2700
ctgaattccc ggggtacctc ttatctgcct cgcgccgttg accgccgctt gactcttggc 2760
gcttgccgct cgcatcctgc ctcgctcgcg caggcgggcg ggcgagtggg tgggtccgca 2820
gccttccgcg ctcgcccgct agctcgctcg cgccgtgctg cagccagcag ggcagcaccg 2880
cacggcaggc aggtcccggc gcggatcgat cgatccatcg atccatcgat ccatcgatcg 2940
tgcggtcaaa aagaaaggaa gaagaaagga aaaagaaagg cgtgcgcacc cgagtgcgcg 3000
ctgagcgccc gctcgcggtc ccgcggagcc tccgcgttag tccccgcccc gcgccgcgca 3060
gtcccccggg aggcatcgcg cacctctcgc cgccccctcg cgcctcgccg attccccgcc 3120
tccccttttc cgcttcttcg ccgcctccgc tcgcggccgc gtcgcccgcg ccccgctccc 3180
tatctgctcc ccaggggggc actccgcacc ttttgcgccc gctgccgccg ccgcggccgc 3240
cccgccgccc tggtttcccc cgcgagcgcg gccgcgtcgc cgcgcaaaga ctcgccgcgt 3300
gccgccccga gcaacgggtg gcggcggcgc ggcggcgggc ggggcgcggc ggcgcgtagg 3360
cggggctagg cgccggctag gcgaaacgcc gcccccgggc gccgccgccg cccgctccag 3420
agcagtcgcc gcgccagacc gccaacgcag agaccgagac cgaggtacgt cgcgcccgag 3480
cacgccgcga cgcgcggcag ggacgaggag cacgacgccg cgccgcgccg cgcggggggg 3540
gggagggaga ggcaggacgc gggagcgagc gtgcatgttt ccgcgcgaga cgacgccgcg 3600
cgcgctggag aggagataag gcgcttggat cgcgagaggg ccagccaggc tggaggcgaa 3660
aatgggtgga gaggatagta tcttgcgtgc ttggacgagg agactgacga ggaggacgga 3720
tacgtcgatg atgatgtgca cagagaagaa gcagttcgaa agcgactact agcaagcaag 3780
agatcttccg cactgatgag tccgtgagga cgaaacgagt aagctcgtct gcggacgtcg 3840
tggacgcgcg ttttagagct agaaatagca agttaaaata aggctagtcc gttatcaact 3900
tgaaaaagtg gcaccgagtc ggtgcttttg gccggcatgg tcccagcctc ctcgctggcg 3960
ccggctgggc aacatgcttc ggcatggcga atgggaccat atgagttatg agatccgaaa 4020
gtgaaccttg tcctaacccg acagcgaatg gcgggagggg gcgggctaaa agatcgtatt 4080
acatagtatt tttcccctac tctttgtgtt tgtctttttt ttttttttga acgcattcaa 4140
gccacttgtc tgggtttact tgtttgtttg cttgcttgct tgcttgcttg cctgcttctt 4200
ggtcagacgg cccaaaaaag ggaaaaaatt cattcatggc acagataaga aaaagaaaaa 4260
gtttgtcgac caccgtcatc agaaagcaag agaagagaaa cactcgcgct cacattctcg 4320
ctcgcgtaag aatcttagcc acgcatacga agtaatttgt ccatctggcg aatctttaca 4380
tgagcgtttt caagctggag cgtgagatca tacctttctt gatcgtaatg ttccaacctt 4440
gcataggcct cgttgcgatc cgctagcaat gcgtcgtact cccgttgcaa ctgcgccatc 4500
gcctcattgt gacgtgagtt cagattcttc tcgagaaact cggcacctgc catgaagacg 4560
ccctccaaaa gggctgggtc aaggcctcgc tcggacacag ccagggcgtc gtctccgccg 4620
ccgtcgttgc cgcagccaac accgaccgcg agctgcgcaa cctcgtggtc tccggcctcg 4680
aatacatgtc aaaagtcggc atcgccgccc agcgcacgct cgactacgag ctcggacgcc 4740
gcaacgccgg cccggagacc ccgatgctcg ctgtacaggg aatggacgaa aaagtcctta 4800
ccaaggcctt caaggccgcc gtctcgctct ccaacgagaa gcaggccatg atggccaaaa 4860
tctccccacg gccgccgccg ccaccgccgc cccggccgcc gttagcgacg aagatcgctt 4920
ctccatcgcc ctccgcaacg gccacgacga ctttgtcgtc tgcggcgagc ccaaggacct 4980
gcgcgtcctc cgcaaggtca tcgagaaaca gagcgccgag cccggcaagg aggcacaggc 5040
gcgcacgccc ttttccaagc gcaagcccgt cacccagacc accttcctcc gcatgacggc 5100
cgtcttccac agcgctctca acaaggacgc cctcgcccag atcaacacat gggccccgga 5160
gtccgccttt agcaaggcct tcgcccaggc ctcgctccgt gttcccgtct ttgacaccaa 5220
gtctggcgct aatctgcaag atgttcccgc cgccgatgtt gtcgcccatc ttaccaccaa 5280
catgctcact gagcgcgccg acgttctcgt ctccctccgt gccgccgaga ccaagaccga 5340
cgccagccac ctcctctgtt taaacgttaa cctgcattaa tgaatcggcc aacgcgcggg 5400
gagaggcggt ttgcgtattg ggcgctcttc cgcttcctcg ctcactgact cgctgcgctc 5460
ggtcgttcgg ctgcggcgag cggtatcagc tcactcaaag gcggtaatac ggttatccac 5520
agaatcaggg gataacgcag gaaagaacat gtgagcaaaa ggccagcaaa aggccaggaa 5580
ccgtaaaaag gccgcgttgc tggcgttttt ccataggctc cgcccccctg acgagcatca 5640
caaaaatcga cgctcaagtc agaggtggcg aaacccgaca ggactataaa gataccaggc 5700
gtttccccct ggaagctccc tcgtgcgctc tcctgttccg accctgccgc ttaccggata 5760
cctgtccgcc tttctccctt cgggaagcgt ggcgctttct catagctcac gctgtaggta 5820
tctcagttcg gtgtaggtcg ttcgctccaa gctgggctgt gtgcacgaac cccccgttca 5880
gcccgaccgc tgcgccttat ccggtaacta tcgtcttgag tccaacccgg taagacacga 5940
cttatcgcca ctggcagcag ccactggtaa caggattagc agagcgaggt atgtaggcgg 6000
tgctacagag ttcttgaagt ggtggcctaa ctacggctac actagaagaa cagtatttgg 6060
tatctgcgct ctgctgaagc cagttacctt cggaaaaaga gttggtagct cttgatccgg 6120
caaacaaacc accgctggta gcggtggttt ttttgtttgc aagcagcaga ttacgcgcag 6180
aaaaaaagga tctcaagaag atcctttgat cttttctacg gggtctgacg ctcagtggaa 6240
cgaaaactca cgttaaggga ttttggtcat gagattatca aaaaggatct tcacctagat 6300
ccttttaaat taaaaatgaa gttttaaatc aatctaaagt atatatgagt aaacttggtc 6360
tgacagttac caatgcttaa tcagtgaggc acctatctca gcgatctgtc tatttcgttc 6420
atccatagtt gcctgactcc ccgtcgtgta gataactacg atacgggagg gcttaccatc 6480
tggccccagt gctgcaatga taccgcgaga cccacgctca ccggctccag atttatcagc 6540
aataaaccag ccagccggaa gggccgagcg cagaagtggt cctgcaactt tatccgcctc 6600
catccagtct attaattgtt gccgggaagc tagagtaagt agttcgccag ttaatagttt 6660
gcgcaacgtt gttgccattg ctacaggcat cgtggtgtca cgctcgtcgt ttggtatggc 6720
ttcattcagc tccggttccc aacgatcaag gcgagttaca tgatccccca tgttgtgcaa 6780
aaaagcggtt agctccttcg gtcctccgat cgttgtcaga agtaagttgg ccgcagtgtt 6840
atcactcatg gttatggcag cactgcataa ttctcttact gtcatgccat ccgtaagatg 6900
cttttctgtg actggtgagt actcaaccaa gtcattctga gaatagtgta tgcggcgacc 6960
gagttgctct tgcccggcgt caatacggga taataccgcg ccacatagca gaactttaaa 7020
agtgctcatc attggaaaac gttcttcggg gcgaaaactc tcaaggatct taccgctgtt 7080
gagatccagt tcgatgtaac ccactcgtgc acccaactga tcttcagcat cttttacttt 7140
caccagcgtt tctgggtgag caaaaacagg aaggcaaaat gccgcaaaaa agggaataag 7200
ggcgacacgg aaatgttgaa tactcatact cttccttttt caatattatt gaagcattta 7260
tcagggttat tgtctcatga gcggatacat atttgaatgt atttagaaaa ataaacaaat 7320
aggggttccg cgcacatttc cccgaaaagt gccacctgac gtctaagaaa ccattattat 7380
catgacatta acctataaaa ataggcgtat cacgaggccc tttcgtctcg cgcgtttcgg 7440
tgatgacggt gaaaacctct gacacatgca gctcccggag acggtcacag cttgtctgta 7500
agcggatgcc gggagcagac aagcccgtca gggcgcgtca gcgggtgttg gcgggtgtcg 7560
gggctggctt aactatgcgg catcagagca gattgtactg agagtgcac 7609
<210> 10
<211> 7609
<212> DNA
<213> 人工序列
<220>
<223> pYB37载体
<220>
<221> misc_特征
<222> (2)..(1192)
<223> FAS_上游_片段
<220>
<221> misc_特征
<222> (1200)..(1648)
<223> α_微管蛋白_启动子
<220>
<221> misc_特征
<222> (1679)..(2443)
<223> 巴龙霉素_抗性_基因
<220>
<221> misc_特征
<222> (2444)..(2717)
<223> SV40_终止子
<220>
<221> misc_特征
<222> (2718)..(3780)
<223> EF-1_alpha_启动子
<220>
<221> misc_特征
<222> (3797)..(3829)
<223> 锤头状_核酶
<220>
<221> misc_特征
<222> (3830)..(3849)
<223> 胡萝卜素_合成酶_靶标_2
<220>
<221> misc_特征
<222> (3850)..(3929)
<223> gRNA
<220>
<221> misc_特征
<222> (3930)..(3997)
<223> HDV_核酶
<220>
<221> misc_特征
<222> (4017)..(4535)
<223> OrfC_终止子
<220>
<221> misc_特征
<222> (4536)..(5368)
<223> FAS_下游_片段
<220>
<221> misc_特征
<222> (6367)..(7227)
<223> AmpR_基因
<400> 10
gtttaaactc gcggcgtctt cgccgtcgag gcgcgtcttt cgaggcgggc gaggtgtttt 60
tcttttcttt tcttctcgct gcagctgcgc cgcggcgaac gcagttcgcc gcggcggctg 120
cgacgcgcct gcgatgtcta tgcgcaggca aggcacgacg tcttgcggcg ccgcttcctg 180
cgccgccttg cgtcttggcc ccgccgacga cgcaagcagc ggcggcgccc ccccgccctc 240
ctccactgtg ggccgcagcc ctccttttcg cgcgcccgca gccgcgcggc gcgccccgcg 300
aacaaagagc cgccgcgccg gtccgcactg cgcgggccgc cccgcaagtg ccgcaaacgc 360
cggcccgaac cgccgcaaac gcgcccgcag ccgcgcccgc agccgcgcgc gacccgcggt 420
ggggacgcgc gccaagcgtc cccttccgcg ggatgacgta ggcggcggcc ccgcctatgc 480
aatacgggag gaaccaggaa ccgggagggg gggggggcgg cgcgcgcgcc gtccagtgcg 540
ggaccgatcg gcgccgggat gcccgggcgg gagggacaca gccaggcagt cagtcagtca 600
gccgcacaga gagagcgcgc ctgcgagtcc cgtctggtct cggaattgta tcccgcgcag 660
agctcagaat cgcaggtcga tcgatcgagc gatggatcca tcgctctatc cgtccatcga 720
tccatcgcat ccatcgcatc catcgcatcc atcgttgcat cgcttgcacc gcccgcttgc 780
atcgcgtgcg tgcgcaggcg ggcggcggcc acgacgcgac cgagagcggc ggcgagtgca 840
gacgccgccg gcgcccgcgg ctgcgtcgcc gcaggaagaa ggaggggggc gcgtgtttcc 900
cgcgggaggg aggagggagg gagggaggtg gttgggccaa aaagggcggc ctggacaggc 960
aggcaggccg gaagcgacgc cagcgagcga aggaagagga gagagccgcg cgggcggcca 1020
gcgcggggcg ggcggcagca aacccgctac tcagggtaaa agacagacag ctcttcgagc 1080
gagcttgttc acttcgcgga agcacgcgcg caggcacgca ggcacgcagg cagcatagcg 1140
agcagcagca gcatcgcgag cagcattgcg agaggaggcg ctgaccgccg gccaagcttc 1200
caattttagg ccccccactg accgaggtct gtcgataatc cacttttcca ttgattttcc 1260
aggtttcgtt aactcatgcc actgagcaaa acttcggtct ttcctaacaa aagctctcct 1320
cacaaagcat ggcgcggcaa cggacgtgtc ctcatactcc actgccacac aaggtcgata 1380
aactaagctc ctcacaaata gaggagaatt ccactgacaa ctgaaaacaa tgtatgagag 1440
acgatcacca ctggagcggc gcggcggttg ggcgcggagg tcggcagcaa aaacaagcga 1500
ctcgccgagc aaacccgaat cagccttcag acggtcgtgc ctaacaacac gccgttctac 1560
cccgccttct tcgcgcccct tcgcgtccaa gcatccttca agtttatctc tctagttcaa 1620
cttcaagaag aacaacacca ccaacaccat gattgaacaa gatggattgc acgcaggttc 1680
tccggccgct tgggtggaga ggctattcgg ctatgactgg gcacaacaga caatcggctg 1740
ctctgatgcc gccgtgttcc ggctgtcagc gcaggggcgc ccggttcttt ttgtcaagac 1800
cgacctgtcc ggtgccctga atgaactgca ggacgaggca gcgcggctat cgtggctggc 1860
cacgacgggc gttccttgcg cagctgtgct cgacgttgtc actgaagcgg gaagggactg 1920
gctgctattg ggcgaagtgc cggggcagga tctcctgtca tctcaccttg ctcctgccga 1980
gaaagtatcc atcatggctg atgcaatgcg gcggctgcat acgcttgatc cggctacctg 2040
cccattcgac caccaagcga aacatcgcat cgagcgagca cgtactcgga tggaagccgg 2100
tcttgtcgat caggatgatc tggacgaaga gcatcagggg ctcgcgccag ccgaactgtt 2160
cgccaggctc aaggcgcgca tgcccgacgg cgatgatctc gtcgtgaccc atggcgatgc 2220
ctgcttgccg aatatcatgg tggaaaatgg ccgcttttct ggattcatcg actgtggccg 2280
gctgggtgtg gcggaccgct atcaggacat agcgttggct acccgtgata ttgctgaaga 2340
gcttggcggc gaatgggctg accgcttcct cgtgctttac ggtatcgccg ctcccgattc 2400
gcagcgcatc gccttctatc gccttcttga cgagttcttc tgacacgtgc tacgagattt 2460
cgattccacc gccgccttct atgaaaggtt gggcttcgga atcgttttcc gggacgccgg 2520
ctggatgatc ctccagcgcg gggatctcat gctggagttc ttcgcccacc ccaacttgtt 2580
tattgcagct tataatggtt acaaataaag caatagcatc acaaatttca caaataaagc 2640
atttttttca ctgcattcta gttgtggttt gtccaaactc atcaatgtat cttatcatgt 2700
ctgaattccc ggggtacctc ttatctgcct cgcgccgttg accgccgctt gactcttggc 2760
gcttgccgct cgcatcctgc ctcgctcgcg caggcgggcg ggcgagtggg tgggtccgca 2820
gccttccgcg ctcgcccgct agctcgctcg cgccgtgctg cagccagcag ggcagcaccg 2880
cacggcaggc aggtcccggc gcggatcgat cgatccatcg atccatcgat ccatcgatcg 2940
tgcggtcaaa aagaaaggaa gaagaaagga aaaagaaagg cgtgcgcacc cgagtgcgcg 3000
ctgagcgccc gctcgcggtc ccgcggagcc tccgcgttag tccccgcccc gcgccgcgca 3060
gtcccccggg aggcatcgcg cacctctcgc cgccccctcg cgcctcgccg attccccgcc 3120
tccccttttc cgcttcttcg ccgcctccgc tcgcggccgc gtcgcccgcg ccccgctccc 3180
tatctgctcc ccaggggggc actccgcacc ttttgcgccc gctgccgccg ccgcggccgc 3240
cccgccgccc tggtttcccc cgcgagcgcg gccgcgtcgc cgcgcaaaga ctcgccgcgt 3300
gccgccccga gcaacgggtg gcggcggcgc ggcggcgggc ggggcgcggc ggcgcgtagg 3360
cggggctagg cgccggctag gcgaaacgcc gcccccgggc gccgccgccg cccgctccag 3420
agcagtcgcc gcgccagacc gccaacgcag agaccgagac cgaggtacgt cgcgcccgag 3480
cacgccgcga cgcgcggcag ggacgaggag cacgacgccg cgccgcgccg cgcggggggg 3540
gggagggaga ggcaggacgc gggagcgagc gtgcatgttt ccgcgcgaga cgacgccgcg 3600
cgcgctggag aggagataag gcgcttggat cgcgagaggg ccagccaggc tggaggcgaa 3660
aatgggtgga gaggatagta tcttgcgtgc ttggacgagg agactgacga ggaggacgga 3720
tacgtcgatg atgatgtgca cagagaagaa gcagttcgaa agcgactact agcaagcaag 3780
agatcttccg cactgatgag tccgtgagga cgaaacgagt aagctcgtcg cagaccttaa 3840
gttcgacgcg ttttagagct agaaatagca agttaaaata aggctagtcc gttatcaact 3900
tgaaaaagtg gcaccgagtc ggtgcttttg gccggcatgg tcccagcctc ctcgctggcg 3960
ccggctgggc aacatgcttc ggcatggcga atgggaccat atgagttatg agatccgaaa 4020
gtgaaccttg tcctaacccg acagcgaatg gcgggagggg gcgggctaaa agatcgtatt 4080
acatagtatt tttcccctac tctttgtgtt tgtctttttt ttttttttga acgcattcaa 4140
gccacttgtc tgggtttact tgtttgtttg cttgcttgct tgcttgcttg cctgcttctt 4200
ggtcagacgg cccaaaaaag ggaaaaaatt cattcatggc acagataaga aaaagaaaaa 4260
gtttgtcgac caccgtcatc agaaagcaag agaagagaaa cactcgcgct cacattctcg 4320
ctcgcgtaag aatcttagcc acgcatacga agtaatttgt ccatctggcg aatctttaca 4380
tgagcgtttt caagctggag cgtgagatca tacctttctt gatcgtaatg ttccaacctt 4440
gcataggcct cgttgcgatc cgctagcaat gcgtcgtact cccgttgcaa ctgcgccatc 4500
gcctcattgt gacgtgagtt cagattcttc tcgagaaact cggcacctgc catgaagacg 4560
ccctccaaaa gggctgggtc aaggcctcgc tcggacacag ccagggcgtc gtctccgccg 4620
ccgtcgttgc cgcagccaac accgaccgcg agctgcgcaa cctcgtggtc tccggcctcg 4680
aatacatgtc aaaagtcggc atcgccgccc agcgcacgct cgactacgag ctcggacgcc 4740
gcaacgccgg cccggagacc ccgatgctcg ctgtacaggg aatggacgaa aaagtcctta 4800
ccaaggcctt caaggccgcc gtctcgctct ccaacgagaa gcaggccatg atggccaaaa 4860
tctccccacg gccgccgccg ccaccgccgc cccggccgcc gttagcgacg aagatcgctt 4920
ctccatcgcc ctccgcaacg gccacgacga ctttgtcgtc tgcggcgagc ccaaggacct 4980
gcgcgtcctc cgcaaggtca tcgagaaaca gagcgccgag cccggcaagg aggcacaggc 5040
gcgcacgccc ttttccaagc gcaagcccgt cacccagacc accttcctcc gcatgacggc 5100
cgtcttccac agcgctctca acaaggacgc cctcgcccag atcaacacat gggccccgga 5160
gtccgccttt agcaaggcct tcgcccaggc ctcgctccgt gttcccgtct ttgacaccaa 5220
gtctggcgct aatctgcaag atgttcccgc cgccgatgtt gtcgcccatc ttaccaccaa 5280
catgctcact gagcgcgccg acgttctcgt ctccctccgt gccgccgaga ccaagaccga 5340
cgccagccac ctcctctgtt taaacgttaa cctgcattaa tgaatcggcc aacgcgcggg 5400
gagaggcggt ttgcgtattg ggcgctcttc cgcttcctcg ctcactgact cgctgcgctc 5460
ggtcgttcgg ctgcggcgag cggtatcagc tcactcaaag gcggtaatac ggttatccac 5520
agaatcaggg gataacgcag gaaagaacat gtgagcaaaa ggccagcaaa aggccaggaa 5580
ccgtaaaaag gccgcgttgc tggcgttttt ccataggctc cgcccccctg acgagcatca 5640
caaaaatcga cgctcaagtc agaggtggcg aaacccgaca ggactataaa gataccaggc 5700
gtttccccct ggaagctccc tcgtgcgctc tcctgttccg accctgccgc ttaccggata 5760
cctgtccgcc tttctccctt cgggaagcgt ggcgctttct catagctcac gctgtaggta 5820
tctcagttcg gtgtaggtcg ttcgctccaa gctgggctgt gtgcacgaac cccccgttca 5880
gcccgaccgc tgcgccttat ccggtaacta tcgtcttgag tccaacccgg taagacacga 5940
cttatcgcca ctggcagcag ccactggtaa caggattagc agagcgaggt atgtaggcgg 6000
tgctacagag ttcttgaagt ggtggcctaa ctacggctac actagaagaa cagtatttgg 6060
tatctgcgct ctgctgaagc cagttacctt cggaaaaaga gttggtagct cttgatccgg 6120
caaacaaacc accgctggta gcggtggttt ttttgtttgc aagcagcaga ttacgcgcag 6180
aaaaaaagga tctcaagaag atcctttgat cttttctacg gggtctgacg ctcagtggaa 6240
cgaaaactca cgttaaggga ttttggtcat gagattatca aaaaggatct tcacctagat 6300
ccttttaaat taaaaatgaa gttttaaatc aatctaaagt atatatgagt aaacttggtc 6360
tgacagttac caatgcttaa tcagtgaggc acctatctca gcgatctgtc tatttcgttc 6420
atccatagtt gcctgactcc ccgtcgtgta gataactacg atacgggagg gcttaccatc 6480
tggccccagt gctgcaatga taccgcgaga cccacgctca ccggctccag atttatcagc 6540
aataaaccag ccagccggaa gggccgagcg cagaagtggt cctgcaactt tatccgcctc 6600
catccagtct attaattgtt gccgggaagc tagagtaagt agttcgccag ttaatagttt 6660
gcgcaacgtt gttgccattg ctacaggcat cgtggtgtca cgctcgtcgt ttggtatggc 6720
ttcattcagc tccggttccc aacgatcaag gcgagttaca tgatccccca tgttgtgcaa 6780
aaaagcggtt agctccttcg gtcctccgat cgttgtcaga agtaagttgg ccgcagtgtt 6840
atcactcatg gttatggcag cactgcataa ttctcttact gtcatgccat ccgtaagatg 6900
cttttctgtg actggtgagt actcaaccaa gtcattctga gaatagtgta tgcggcgacc 6960
gagttgctct tgcccggcgt caatacggga taataccgcg ccacatagca gaactttaaa 7020
agtgctcatc attggaaaac gttcttcggg gcgaaaactc tcaaggatct taccgctgtt 7080
gagatccagt tcgatgtaac ccactcgtgc acccaactga tcttcagcat cttttacttt 7140
caccagcgtt tctgggtgag caaaaacagg aaggcaaaat gccgcaaaaa agggaataag 7200
ggcgacacgg aaatgttgaa tactcatact cttccttttt caatattatt gaagcattta 7260
tcagggttat tgtctcatga gcggatacat atttgaatgt atttagaaaa ataaacaaat 7320
aggggttccg cgcacatttc cccgaaaagt gccacctgac gtctaagaaa ccattattat 7380
catgacatta acctataaaa ataggcgtat cacgaggccc tttcgtctcg cgcgtttcgg 7440
tgatgacggt gaaaacctct gacacatgca gctcccggag acggtcacag cttgtctgta 7500
agcggatgcc gggagcagac aagcccgtca gggcgcgtca gcgggtgttg gcgggtgtcg 7560
gggctggctt aactatgcgg catcagagca gattgtactg agagtgcac 7609
<210> 11
<211> 7609
<212> DNA
<213> 人工序列
<220>
<223> pYB38载体
<220>
<221> misc_特征
<222> (2)..(1192)
<223> FAS_上游_片段
<220>
<221> misc_特征
<222> (1200)..(1648)
<223> α_微管蛋白_启动子
<220>
<221> misc_特征
<222> (1679)..(2443)
<223> 巴龙霉素_抗性_基因
<220>
<221> misc_特征
<222> (2444)..(2717)
<223> SV40_终止子
<220>
<221> misc_特征
<222> (2718)..(3780)
<223> EF-1_α_启动子
<220>
<221> misc_特征
<222> (3797)..(3829)
<223> 锤头状_核酶
<220>
<221> misc_特征
<222> (3830)..(3849)
<223> 胡萝卜素_合成酶_靶标_3
<220>
<221> misc_特征
<222> (3850)..(3929)
<223> gRNA
<220>
<221> misc_特征
<222> (3930)..(3997)
<223> HDV_核酶
<220>
<221> misc_特征
<222> (4017)..(4535)
<223> OrfC_终止子
<220>
<221> misc_特征
<222> (4536)..(5368)
<223> FAS_下游_片段
<220>
<221> misc_特征
<222> (6367)..(7227)
<223> AmpR_基因
<400> 11
gtttaaactc gcggcgtctt cgccgtcgag gcgcgtcttt cgaggcgggc gaggtgtttt 60
tcttttcttt tcttctcgct gcagctgcgc cgcggcgaac gcagttcgcc gcggcggctg 120
cgacgcgcct gcgatgtcta tgcgcaggca aggcacgacg tcttgcggcg ccgcttcctg 180
cgccgccttg cgtcttggcc ccgccgacga cgcaagcagc ggcggcgccc ccccgccctc 240
ctccactgtg ggccgcagcc ctccttttcg cgcgcccgca gccgcgcggc gcgccccgcg 300
aacaaagagc cgccgcgccg gtccgcactg cgcgggccgc cccgcaagtg ccgcaaacgc 360
cggcccgaac cgccgcaaac gcgcccgcag ccgcgcccgc agccgcgcgc gacccgcggt 420
ggggacgcgc gccaagcgtc cccttccgcg ggatgacgta ggcggcggcc ccgcctatgc 480
aatacgggag gaaccaggaa ccgggagggg gggggggcgg cgcgcgcgcc gtccagtgcg 540
ggaccgatcg gcgccgggat gcccgggcgg gagggacaca gccaggcagt cagtcagtca 600
gccgcacaga gagagcgcgc ctgcgagtcc cgtctggtct cggaattgta tcccgcgcag 660
agctcagaat cgcaggtcga tcgatcgagc gatggatcca tcgctctatc cgtccatcga 720
tccatcgcat ccatcgcatc catcgcatcc atcgttgcat cgcttgcacc gcccgcttgc 780
atcgcgtgcg tgcgcaggcg ggcggcggcc acgacgcgac cgagagcggc ggcgagtgca 840
gacgccgccg gcgcccgcgg ctgcgtcgcc gcaggaagaa ggaggggggc gcgtgtttcc 900
cgcgggaggg aggagggagg gagggaggtg gttgggccaa aaagggcggc ctggacaggc 960
aggcaggccg gaagcgacgc cagcgagcga aggaagagga gagagccgcg cgggcggcca 1020
gcgcggggcg ggcggcagca aacccgctac tcagggtaaa agacagacag ctcttcgagc 1080
gagcttgttc acttcgcgga agcacgcgcg caggcacgca ggcacgcagg cagcatagcg 1140
agcagcagca gcatcgcgag cagcattgcg agaggaggcg ctgaccgccg gccaagcttc 1200
caattttagg ccccccactg accgaggtct gtcgataatc cacttttcca ttgattttcc 1260
aggtttcgtt aactcatgcc actgagcaaa acttcggtct ttcctaacaa aagctctcct 1320
cacaaagcat ggcgcggcaa cggacgtgtc ctcatactcc actgccacac aaggtcgata 1380
aactaagctc ctcacaaata gaggagaatt ccactgacaa ctgaaaacaa tgtatgagag 1440
acgatcacca ctggagcggc gcggcggttg ggcgcggagg tcggcagcaa aaacaagcga 1500
ctcgccgagc aaacccgaat cagccttcag acggtcgtgc ctaacaacac gccgttctac 1560
cccgccttct tcgcgcccct tcgcgtccaa gcatccttca agtttatctc tctagttcaa 1620
cttcaagaag aacaacacca ccaacaccat gattgaacaa gatggattgc acgcaggttc 1680
tccggccgct tgggtggaga ggctattcgg ctatgactgg gcacaacaga caatcggctg 1740
ctctgatgcc gccgtgttcc ggctgtcagc gcaggggcgc ccggttcttt ttgtcaagac 1800
cgacctgtcc ggtgccctga atgaactgca ggacgaggca gcgcggctat cgtggctggc 1860
cacgacgggc gttccttgcg cagctgtgct cgacgttgtc actgaagcgg gaagggactg 1920
gctgctattg ggcgaagtgc cggggcagga tctcctgtca tctcaccttg ctcctgccga 1980
gaaagtatcc atcatggctg atgcaatgcg gcggctgcat acgcttgatc cggctacctg 2040
cccattcgac caccaagcga aacatcgcat cgagcgagca cgtactcgga tggaagccgg 2100
tcttgtcgat caggatgatc tggacgaaga gcatcagggg ctcgcgccag ccgaactgtt 2160
cgccaggctc aaggcgcgca tgcccgacgg cgatgatctc gtcgtgaccc atggcgatgc 2220
ctgcttgccg aatatcatgg tggaaaatgg ccgcttttct ggattcatcg actgtggccg 2280
gctgggtgtg gcggaccgct atcaggacat agcgttggct acccgtgata ttgctgaaga 2340
gcttggcggc gaatgggctg accgcttcct cgtgctttac ggtatcgccg ctcccgattc 2400
gcagcgcatc gccttctatc gccttcttga cgagttcttc tgacacgtgc tacgagattt 2460
cgattccacc gccgccttct atgaaaggtt gggcttcgga atcgttttcc gggacgccgg 2520
ctggatgatc ctccagcgcg gggatctcat gctggagttc ttcgcccacc ccaacttgtt 2580
tattgcagct tataatggtt acaaataaag caatagcatc acaaatttca caaataaagc 2640
atttttttca ctgcattcta gttgtggttt gtccaaactc atcaatgtat cttatcatgt 2700
ctgaattccc ggggtacctc ttatctgcct cgcgccgttg accgccgctt gactcttggc 2760
gcttgccgct cgcatcctgc ctcgctcgcg caggcgggcg ggcgagtggg tgggtccgca 2820
gccttccgcg ctcgcccgct agctcgctcg cgccgtgctg cagccagcag ggcagcaccg 2880
cacggcaggc aggtcccggc gcggatcgat cgatccatcg atccatcgat ccatcgatcg 2940
tgcggtcaaa aagaaaggaa gaagaaagga aaaagaaagg cgtgcgcacc cgagtgcgcg 3000
ctgagcgccc gctcgcggtc ccgcggagcc tccgcgttag tccccgcccc gcgccgcgca 3060
gtcccccggg aggcatcgcg cacctctcgc cgccccctcg cgcctcgccg attccccgcc 3120
tccccttttc cgcttcttcg ccgcctccgc tcgcggccgc gtcgcccgcg ccccgctccc 3180
tatctgctcc ccaggggggc actccgcacc ttttgcgccc gctgccgccg ccgcggccgc 3240
cccgccgccc tggtttcccc cgcgagcgcg gccgcgtcgc cgcgcaaaga ctcgccgcgt 3300
gccgccccga gcaacgggtg gcggcggcgc ggcggcgggc ggggcgcggc ggcgcgtagg 3360
cggggctagg cgccggctag gcgaaacgcc gcccccgggc gccgccgccg cccgctccag 3420
agcagtcgcc gcgccagacc gccaacgcag agaccgagac cgaggtacgt cgcgcccgag 3480
cacgccgcga cgcgcggcag ggacgaggag cacgacgccg cgccgcgccg cgcggggggg 3540
gggagggaga ggcaggacgc gggagcgagc gtgcatgttt ccgcgcgaga cgacgccgcg 3600
cgcgctggag aggagataag gcgcttggat cgcgagaggg ccagccaggc tggaggcgaa 3660
aatgggtgga gaggatagta tcttgcgtgc ttggacgagg agactgacga ggaggacgga 3720
tacgtcgatg atgatgtgca cagagaagaa gcagttcgaa agcgactact agcaagcaag 3780
agatcttccg cactgatgag tccgtgagga cgaaacgagt aagctcgtcc cgactcgtcg 3840
accgtctcag ttttagagct agaaatagca agttaaaata aggctagtcc gttatcaact 3900
tgaaaaagtg gcaccgagtc ggtgcttttg gccggcatgg tcccagcctc ctcgctggcg 3960
ccggctgggc aacatgcttc ggcatggcga atgggaccat atgagttatg agatccgaaa 4020
gtgaaccttg tcctaacccg acagcgaatg gcgggagggg gcgggctaaa agatcgtatt 4080
acatagtatt tttcccctac tctttgtgtt tgtctttttt ttttttttga acgcattcaa 4140
gccacttgtc tgggtttact tgtttgtttg cttgcttgct tgcttgcttg cctgcttctt 4200
ggtcagacgg cccaaaaaag ggaaaaaatt cattcatggc acagataaga aaaagaaaaa 4260
gtttgtcgac caccgtcatc agaaagcaag agaagagaaa cactcgcgct cacattctcg 4320
ctcgcgtaag aatcttagcc acgcatacga agtaatttgt ccatctggcg aatctttaca 4380
tgagcgtttt caagctggag cgtgagatca tacctttctt gatcgtaatg ttccaacctt 4440
gcataggcct cgttgcgatc cgctagcaat gcgtcgtact cccgttgcaa ctgcgccatc 4500
gcctcattgt gacgtgagtt cagattcttc tcgagaaact cggcacctgc catgaagacg 4560
ccctccaaaa gggctgggtc aaggcctcgc tcggacacag ccagggcgtc gtctccgccg 4620
ccgtcgttgc cgcagccaac accgaccgcg agctgcgcaa cctcgtggtc tccggcctcg 4680
aatacatgtc aaaagtcggc atcgccgccc agcgcacgct cgactacgag ctcggacgcc 4740
gcaacgccgg cccggagacc ccgatgctcg ctgtacaggg aatggacgaa aaagtcctta 4800
ccaaggcctt caaggccgcc gtctcgctct ccaacgagaa gcaggccatg atggccaaaa 4860
tctccccacg gccgccgccg ccaccgccgc cccggccgcc gttagcgacg aagatcgctt 4920
ctccatcgcc ctccgcaacg gccacgacga ctttgtcgtc tgcggcgagc ccaaggacct 4980
gcgcgtcctc cgcaaggtca tcgagaaaca gagcgccgag cccggcaagg aggcacaggc 5040
gcgcacgccc ttttccaagc gcaagcccgt cacccagacc accttcctcc gcatgacggc 5100
cgtcttccac agcgctctca acaaggacgc cctcgcccag atcaacacat gggccccgga 5160
gtccgccttt agcaaggcct tcgcccaggc ctcgctccgt gttcccgtct ttgacaccaa 5220
gtctggcgct aatctgcaag atgttcccgc cgccgatgtt gtcgcccatc ttaccaccaa 5280
catgctcact gagcgcgccg acgttctcgt ctccctccgt gccgccgaga ccaagaccga 5340
cgccagccac ctcctctgtt taaacgttaa cctgcattaa tgaatcggcc aacgcgcggg 5400
gagaggcggt ttgcgtattg ggcgctcttc cgcttcctcg ctcactgact cgctgcgctc 5460
ggtcgttcgg ctgcggcgag cggtatcagc tcactcaaag gcggtaatac ggttatccac 5520
agaatcaggg gataacgcag gaaagaacat gtgagcaaaa ggccagcaaa aggccaggaa 5580
ccgtaaaaag gccgcgttgc tggcgttttt ccataggctc cgcccccctg acgagcatca 5640
caaaaatcga cgctcaagtc agaggtggcg aaacccgaca ggactataaa gataccaggc 5700
gtttccccct ggaagctccc tcgtgcgctc tcctgttccg accctgccgc ttaccggata 5760
cctgtccgcc tttctccctt cgggaagcgt ggcgctttct catagctcac gctgtaggta 5820
tctcagttcg gtgtaggtcg ttcgctccaa gctgggctgt gtgcacgaac cccccgttca 5880
gcccgaccgc tgcgccttat ccggtaacta tcgtcttgag tccaacccgg taagacacga 5940
cttatcgcca ctggcagcag ccactggtaa caggattagc agagcgaggt atgtaggcgg 6000
tgctacagag ttcttgaagt ggtggcctaa ctacggctac actagaagaa cagtatttgg 6060
tatctgcgct ctgctgaagc cagttacctt cggaaaaaga gttggtagct cttgatccgg 6120
caaacaaacc accgctggta gcggtggttt ttttgtttgc aagcagcaga ttacgcgcag 6180
aaaaaaagga tctcaagaag atcctttgat cttttctacg gggtctgacg ctcagtggaa 6240
cgaaaactca cgttaaggga ttttggtcat gagattatca aaaaggatct tcacctagat 6300
ccttttaaat taaaaatgaa gttttaaatc aatctaaagt atatatgagt aaacttggtc 6360
tgacagttac caatgcttaa tcagtgaggc acctatctca gcgatctgtc tatttcgttc 6420
atccatagtt gcctgactcc ccgtcgtgta gataactacg atacgggagg gcttaccatc 6480
tggccccagt gctgcaatga taccgcgaga cccacgctca ccggctccag atttatcagc 6540
aataaaccag ccagccggaa gggccgagcg cagaagtggt cctgcaactt tatccgcctc 6600
catccagtct attaattgtt gccgggaagc tagagtaagt agttcgccag ttaatagttt 6660
gcgcaacgtt gttgccattg ctacaggcat cgtggtgtca cgctcgtcgt ttggtatggc 6720
ttcattcagc tccggttccc aacgatcaag gcgagttaca tgatccccca tgttgtgcaa 6780
aaaagcggtt agctccttcg gtcctccgat cgttgtcaga agtaagttgg ccgcagtgtt 6840
atcactcatg gttatggcag cactgcataa ttctcttact gtcatgccat ccgtaagatg 6900
cttttctgtg actggtgagt actcaaccaa gtcattctga gaatagtgta tgcggcgacc 6960
gagttgctct tgcccggcgt caatacggga taataccgcg ccacatagca gaactttaaa 7020
agtgctcatc attggaaaac gttcttcggg gcgaaaactc tcaaggatct taccgctgtt 7080
gagatccagt tcgatgtaac ccactcgtgc acccaactga tcttcagcat cttttacttt 7140
caccagcgtt tctgggtgag caaaaacagg aaggcaaaat gccgcaaaaa agggaataag 7200
ggcgacacgg aaatgttgaa tactcatact cttccttttt caatattatt gaagcattta 7260
tcagggttat tgtctcatga gcggatacat atttgaatgt atttagaaaa ataaacaaat 7320
aggggttccg cgcacatttc cccgaaaagt gccacctgac gtctaagaaa ccattattat 7380
catgacatta acctataaaa ataggcgtat cacgaggccc tttcgtctcg cgcgtttcgg 7440
tgatgacggt gaaaacctct gacacatgca gctcccggag acggtcacag cttgtctgta 7500
agcggatgcc gggagcagac aagcccgtca gggcgcgtca gcgggtgttg gcgggtgtcg 7560
gggctggctt aactatgcgg catcagagca gattgtactg agagtgcac 7609
<210> 12
<211> 7608
<212> DNA
<213> 人工序列
<220>
<223> pYB39载体
<220>
<221> misc_特征
<222> (2)..(1192)
<223> FAS_上游_片段
<220>
<221> misc_特征
<222> (1200)..(1648)
<223> α_微管蛋白_启动子
<220>
<221> misc_特征
<222> (1679)..(2443)
<223> 巴龙霉素_抗性_基因
<220>
<221> misc_特征
<222> (2444)..(2717)
<223> SV40_终止子
<220>
<221> misc_特征
<222> (2718)..(3780)
<223> EF-1_α_启动子
<220>
<221> misc_特征
<222> (3792)..(3828)
<223> 锤头状_核酶
<220>
<221> misc_特征
<222> (3829)..(3848)
<223> 胡萝卜素_合成酶_靶标_4
<220>
<221> misc_特征
<222> (3848)..(3928)
<223> gRNA
<220>
<221> misc_特征
<222> (3929)..(3996)
<223> HDV_核酶
<220>
<221> misc_特征
<222> (4016)..(4534)
<223> OrfC_终止子
<220>
<221> misc_特征
<222> (4535)..(5367)
<223> FAS_下游_片段
<220>
<221> misc_特征
<222> (6366)..(7226)
<223> AmpR_基因
<400> 12
gtttaaactc gcggcgtctt cgccgtcgag gcgcgtcttt cgaggcgggc gaggtgtttt 60
tcttttcttt tcttctcgct gcagctgcgc cgcggcgaac gcagttcgcc gcggcggctg 120
cgacgcgcct gcgatgtcta tgcgcaggca aggcacgacg tcttgcggcg ccgcttcctg 180
cgccgccttg cgtcttggcc ccgccgacga cgcaagcagc ggcggcgccc ccccgccctc 240
ctccactgtg ggccgcagcc ctccttttcg cgcgcccgca gccgcgcggc gcgccccgcg 300
aacaaagagc cgccgcgccg gtccgcactg cgcgggccgc cccgcaagtg ccgcaaacgc 360
cggcccgaac cgccgcaaac gcgcccgcag ccgcgcccgc agccgcgcgc gacccgcggt 420
ggggacgcgc gccaagcgtc cccttccgcg ggatgacgta ggcggcggcc ccgcctatgc 480
aatacgggag gaaccaggaa ccgggagggg gggggggcgg cgcgcgcgcc gtccagtgcg 540
ggaccgatcg gcgccgggat gcccgggcgg gagggacaca gccaggcagt cagtcagtca 600
gccgcacaga gagagcgcgc ctgcgagtcc cgtctggtct cggaattgta tcccgcgcag 660
agctcagaat cgcaggtcga tcgatcgagc gatggatcca tcgctctatc cgtccatcga 720
tccatcgcat ccatcgcatc catcgcatcc atcgttgcat cgcttgcacc gcccgcttgc 780
atcgcgtgcg tgcgcaggcg ggcggcggcc acgacgcgac cgagagcggc ggcgagtgca 840
gacgccgccg gcgcccgcgg ctgcgtcgcc gcaggaagaa ggaggggggc gcgtgtttcc 900
cgcgggaggg aggagggagg gagggaggtg gttgggccaa aaagggcggc ctggacaggc 960
aggcaggccg gaagcgacgc cagcgagcga aggaagagga gagagccgcg cgggcggcca 1020
gcgcggggcg ggcggcagca aacccgctac tcagggtaaa agacagacag ctcttcgagc 1080
gagcttgttc acttcgcgga agcacgcgcg caggcacgca ggcacgcagg cagcatagcg 1140
agcagcagca gcatcgcgag cagcattgcg agaggaggcg ctgaccgccg gccaagcttc 1200
caattttagg ccccccactg accgaggtct gtcgataatc cacttttcca ttgattttcc 1260
aggtttcgtt aactcatgcc actgagcaaa acttcggtct ttcctaacaa aagctctcct 1320
cacaaagcat ggcgcggcaa cggacgtgtc ctcatactcc actgccacac aaggtcgata 1380
aactaagctc ctcacaaata gaggagaatt ccactgacaa ctgaaaacaa tgtatgagag 1440
acgatcacca ctggagcggc gcggcggttg ggcgcggagg tcggcagcaa aaacaagcga 1500
ctcgccgagc aaacccgaat cagccttcag acggtcgtgc ctaacaacac gccgttctac 1560
cccgccttct tcgcgcccct tcgcgtccaa gcatccttca agtttatctc tctagttcaa 1620
cttcaagaag aacaacacca ccaacaccat gattgaacaa gatggattgc acgcaggttc 1680
tccggccgct tgggtggaga ggctattcgg ctatgactgg gcacaacaga caatcggctg 1740
ctctgatgcc gccgtgttcc ggctgtcagc gcaggggcgc ccggttcttt ttgtcaagac 1800
cgacctgtcc ggtgccctga atgaactgca ggacgaggca gcgcggctat cgtggctggc 1860
cacgacgggc gttccttgcg cagctgtgct cgacgttgtc actgaagcgg gaagggactg 1920
gctgctattg ggcgaagtgc cggggcagga tctcctgtca tctcaccttg ctcctgccga 1980
gaaagtatcc atcatggctg atgcaatgcg gcggctgcat acgcttgatc cggctacctg 2040
cccattcgac caccaagcga aacatcgcat cgagcgagca cgtactcgga tggaagccgg 2100
tcttgtcgat caggatgatc tggacgaaga gcatcagggg ctcgcgccag ccgaactgtt 2160
cgccaggctc aaggcgcgca tgcccgacgg cgatgatctc gtcgtgaccc atggcgatgc 2220
ctgcttgccg aatatcatgg tggaaaatgg ccgcttttct ggattcatcg actgtggccg 2280
gctgggtgtg gcggaccgct atcaggacat agcgttggct acccgtgata ttgctgaaga 2340
gcttggcggc gaatgggctg accgcttcct cgtgctttac ggtatcgccg ctcccgattc 2400
gcagcgcatc gccttctatc gccttcttga cgagttcttc tgacacgtgc tacgagattt 2460
cgattccacc gccgccttct atgaaaggtt gggcttcgga atcgttttcc gggacgccgg 2520
ctggatgatc ctccagcgcg gggatctcat gctggagttc ttcgcccacc ccaacttgtt 2580
tattgcagct tataatggtt acaaataaag caatagcatc acaaatttca caaataaagc 2640
atttttttca ctgcattcta gttgtggttt gtccaaactc atcaatgtat cttatcatgt 2700
ctgaattccc ggggtacctc ttatctgcct cgcgccgttg accgccgctt gactcttggc 2760
gcttgccgct cgcatcctgc ctcgctcgcg caggcgggcg ggcgagtggg tgggtccgca 2820
gccttccgcg ctcgcccgct agctcgctcg cgccgtgctg cagccagcag ggcagcaccg 2880
cacggcaggc aggtcccggc gcggatcgat cgatccatcg atccatcgat ccatcgatcg 2940
tgcggtcaaa aagaaaggaa gaagaaagga aaaagaaagg cgtgcgcacc cgagtgcgcg 3000
ctgagcgccc gctcgcggtc ccgcggagcc tccgcgttag tccccgcccc gcgccgcgca 3060
gtcccccggg aggcatcgcg cacctctcgc cgccccctcg cgcctcgccg attccccgcc 3120
tccccttttc cgcttcttcg ccgcctccgc tcgcggccgc gtcgcccgcg ccccgctccc 3180
tatctgctcc ccaggggggc actccgcacc ttttgcgccc gctgccgccg ccgcggccgc 3240
cccgccgccc tggtttcccc cgcgagcgcg gccgcgtcgc cgcgcaaaga ctcgccgcgt 3300
gccgccccga gcaacgggtg gcggcggcgc ggcggcgggc ggggcgcggc ggcgcgtagg 3360
cggggctagg cgccggctag gcgaaacgcc gcccccgggc gccgccgccg cccgctccag 3420
agcagtcgcc gcgccagacc gccaacgcag agaccgagac cgaggtacgt cgcgcccgag 3480
cacgccgcga cgcgcggcag ggacgaggag cacgacgccg cgccgcgccg cgcggggggg 3540
gggagggaga ggcaggacgc gggagcgagc gtgcatgttt ccgcgcgaga cgacgccgcg 3600
cgcgctggag aggagataag gcgcttggat cgcgagaggg ccagccaggc tggaggcgaa 3660
aatgggtgga gaggatagta tcttgcgtgc ttggacgagg agactgacga ggaggacgga 3720
tacgtcgatg atgatgtgca cagagaagaa gcagttcgaa agcgactact agcaagcaag 3780
agatcttctt cctgatgagt ccgtgaggac gaaacgagta agctcgtcga agaacatgta 3840
ctcttcaagt tttagagcta gaaatagcaa gttaaaataa ggctagtccg ttatcaactt 3900
gaaaaagtgg caccgagtcg gtgcttttgg ccggcatggt cccagcctcc tcgctggcgc 3960
cggctgggca acatgcttcg gcatggcgaa tgggaccata tgagttatga gatccgaaag 4020
tgaaccttgt cctaacccga cagcgaatgg cgggaggggg cgggctaaaa gatcgtatta 4080
catagtattt ttcccctact ctttgtgttt gtcttttttt tttttttgaa cgcattcaag 4140
ccacttgtct gggtttactt gtttgtttgc ttgcttgctt gcttgcttgc ctgcttcttg 4200
gtcagacggc ccaaaaaagg gaaaaaattc attcatggca cagataagaa aaagaaaaag 4260
tttgtcgacc accgtcatca gaaagcaaga gaagagaaac actcgcgctc acattctcgc 4320
tcgcgtaaga atcttagcca cgcatacgaa gtaatttgtc catctggcga atctttacat 4380
gagcgttttc aagctggagc gtgagatcat acctttcttg atcgtaatgt tccaaccttg 4440
cataggcctc gttgcgatcc gctagcaatg cgtcgtactc ccgttgcaac tgcgccatcg 4500
cctcattgtg acgtgagttc agattcttct cgagaaactc ggcacctgcc atgaagacgc 4560
cctccaaaag ggctgggtca aggcctcgct cggacacagc cagggcgtcg tctccgccgc 4620
cgtcgttgcc gcagccaaca ccgaccgcga gctgcgcaac ctcgtggtct ccggcctcga 4680
atacatgtca aaagtcggca tcgccgccca gcgcacgctc gactacgagc tcggacgccg 4740
caacgccggc ccggagaccc cgatgctcgc tgtacaggga atggacgaaa aagtccttac 4800
caaggccttc aaggccgccg tctcgctctc caacgagaag caggccatga tggccaaaat 4860
ctccccacgg ccgccgccgc caccgccgcc ccggccgccg ttagcgacga agatcgcttc 4920
tccatcgccc tccgcaacgg ccacgacgac tttgtcgtct gcggcgagcc caaggacctg 4980
cgcgtcctcc gcaaggtcat cgagaaacag agcgccgagc ccggcaagga ggcacaggcg 5040
cgcacgccct tttccaagcg caagcccgtc acccagacca ccttcctccg catgacggcc 5100
gtcttccaca gcgctctcaa caaggacgcc ctcgcccaga tcaacacatg ggccccggag 5160
tccgccttta gcaaggcctt cgcccaggcc tcgctccgtg ttcccgtctt tgacaccaag 5220
tctggcgcta atctgcaaga tgttcccgcc gccgatgttg tcgcccatct taccaccaac 5280
atgctcactg agcgcgccga cgttctcgtc tccctccgtg ccgccgagac caagaccgac 5340
gccagccacc tcctctgttt aaacgttaac ctgcattaat gaatcggcca acgcgcgggg 5400
agaggcggtt tgcgtattgg gcgctcttcc gcttcctcgc tcactgactc gctgcgctcg 5460
gtcgttcggc tgcggcgagc ggtatcagct cactcaaagg cggtaatacg gttatccaca 5520
gaatcagggg ataacgcagg aaagaacatg tgagcaaaag gccagcaaaa ggccaggaac 5580
cgtaaaaagg ccgcgttgct ggcgtttttc cataggctcc gcccccctga cgagcatcac 5640
aaaaatcgac gctcaagtca gaggtggcga aacccgacag gactataaag ataccaggcg 5700
tttccccctg gaagctccct cgtgcgctct cctgttccga ccctgccgct taccggatac 5760
ctgtccgcct ttctcccttc gggaagcgtg gcgctttctc atagctcacg ctgtaggtat 5820
ctcagttcgg tgtaggtcgt tcgctccaag ctgggctgtg tgcacgaacc ccccgttcag 5880
cccgaccgct gcgccttatc cggtaactat cgtcttgagt ccaacccggt aagacacgac 5940
ttatcgccac tggcagcagc cactggtaac aggattagca gagcgaggta tgtaggcggt 6000
gctacagagt tcttgaagtg gtggcctaac tacggctaca ctagaagaac agtatttggt 6060
atctgcgctc tgctgaagcc agttaccttc ggaaaaagag ttggtagctc ttgatccggc 6120
aaacaaacca ccgctggtag cggtggtttt tttgtttgca agcagcagat tacgcgcaga 6180
aaaaaaggat ctcaagaaga tcctttgatc ttttctacgg ggtctgacgc tcagtggaac 6240
gaaaactcac gttaagggat tttggtcatg agattatcaa aaaggatctt cacctagatc 6300
cttttaaatt aaaaatgaag ttttaaatca atctaaagta tatatgagta aacttggtct 6360
gacagttacc aatgcttaat cagtgaggca cctatctcag cgatctgtct atttcgttca 6420
tccatagttg cctgactccc cgtcgtgtag ataactacga tacgggaggg cttaccatct 6480
ggccccagtg ctgcaatgat accgcgagac ccacgctcac cggctccaga tttatcagca 6540
ataaaccagc cagccggaag ggccgagcgc agaagtggtc ctgcaacttt atccgcctcc 6600
atccagtcta ttaattgttg ccgggaagct agagtaagta gttcgccagt taatagtttg 6660
cgcaacgttg ttgccattgc tacaggcatc gtggtgtcac gctcgtcgtt tggtatggct 6720
tcattcagct ccggttccca acgatcaagg cgagttacat gatcccccat gttgtgcaaa 6780
aaagcggtta gctccttcgg tcctccgatc gttgtcagaa gtaagttggc cgcagtgtta 6840
tcactcatgg ttatggcagc actgcataat tctcttactg tcatgccatc cgtaagatgc 6900
ttttctgtga ctggtgagta ctcaaccaag tcattctgag aatagtgtat gcggcgaccg 6960
agttgctctt gcccggcgtc aatacgggat aataccgcgc cacatagcag aactttaaaa 7020
gtgctcatca ttggaaaacg ttcttcgggg cgaaaactct caaggatctt accgctgttg 7080
agatccagtt cgatgtaacc cactcgtgca cccaactgat cttcagcatc ttttactttc 7140
accagcgttt ctgggtgagc aaaaacagga aggcaaaatg ccgcaaaaaa gggaataagg 7200
gcgacacgga aatgttgaat actcatactc ttcctttttc aatattattg aagcatttat 7260
cagggttatt gtctcatgag cggatacata tttgaatgta tttagaaaaa taaacaaata 7320
ggggttccgc gcacatttcc ccgaaaagtg ccacctgacg tctaagaaac cattattatc 7380
atgacattaa cctataaaaa taggcgtatc acgaggccct ttcgtctcgc gcgtttcggt 7440
gatgacggtg aaaacctctg acacatgcag ctcccggaga cggtcacagc ttgtctgtaa 7500
gcggatgccg ggagcagaca agcccgtcag ggcgcgtcag cgggtgttgg cgggtgtcgg 7560
ggctggctta actatgcggc atcagagcag attgtactga gagtgcac 7608
<210> 13
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 12 Tub seq F引物
<400> 13
ggatctcatg ctggagttct tc 22
<210> 14
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> pYB32/3C R1引物
<400> 14
gtacttctcg tggtaggcaa cc 22
<210> 15
<211> 40
<212> DNA
<213> 人工序列
<220>
<223> CS pro Kpn IF F1引物
<400> 15
gtctgaattc ccggggtacc gagcgggcga ttccaccgtc 40
<210> 16
<211> 42
<212> DNA
<213> 人工序列
<220>
<223> CS pro BamH IF R1引物
<400> 16
gtacttctta tccatggatc cctcggtctc cgagcgagcg ag 42
<210> 17
<211> 41
<212> DNA
<213> 人工序列
<220>
<223> CS pro BamH IF F2引物
<400> 17
tcgctcgctc ggagaccgag ggatccatgg ataagaagta c 41
<210> 18
<211> 51
<212> DNA
<213> 人工序列
<220>
<223> CS pro Nde IF R2引物
<400> 18
gattcactag tttagatcat atgttagacc ttgcgcttct tcttagggtc c 51
<210> 19
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> O A1-KO F引物
<400> 19
ccaagttcgc caaggcttc 19
<210> 20
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> pYB32/3 SV40 R1引物
<400> 20
gtggaatcga aatctcgtag cac 23
<210> 21
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> O A1-KO R引物
<400> 21
gctgttgcaa ctttgctcca c 21
<210> 22
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> pYB32/3C F1引物
<400> 22
gttaagaaga ccgaggtcca gac 23
<210> 23
<211> 32
<212> DNA
<213> 人工序列
<220>
<223> 5' FAS PmeNde引物
<400> 23
tagcatatgt ttaaactcgc ggcgtctttc gc 32
<210> 24
<211> 31
<212> DNA
<213> 人工序列
<220>
<223> 3' FAS PmeHpa引物
<400> 24
agttaacgtt taaacagagg aggtggctgg c 31
<210> 25
<211> 38
<212> DNA
<213> 人工序列
<220>
<223> pCL402 IF F引物
<400> 25
gaggcgctga ccgccggcca agcttccaat tttaggcc 38
<210> 26
<211> 40
<212> DNA
<213> 人工序列
<220>
<223> pCL402 IF R引物
<400> 26
gcaggtgccg agtttctcga gaagaatctg aactcacgtc 40
<210> 27
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> pYB36 CS1 F引物
<400> 27
gagtcgaagg agacgttgtc g 21
<210> 28
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> pYB36 CS1 R引物
<400> 28
gtcattgcga atgatgcgat atg 23
<210> 29
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> pYB36 CS3 R引物
<400> 29
ggtcatcatg gaatacaacg cag 23
<210> 30
<211> 26
<212> DNA
<213> 人工序列
<220>
<223> pYB36 CS4 F引物
<400> 30
cgagctcatt tgtgctacac tctatg 26
<210> 31
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> pYB36 CS4 R引物
<400> 31
cacaagattt gcaggattga tgc 23
<210> 32
<211> 5562
<212> DNA
<213> 人工序列
<220>
<223> pYB30载体 (5562 bp)
<220>
<221> misc_特征
<222> (2)..(450)
<223> α_微管蛋白_启动子
<220>
<221> misc_特征
<222> (457)..(549)
<223> Sec1_分泌_序列
<220>
<221> misc_特征
<222> (550)..(1287)
<223> eGFP
<220>
<221> misc_特征
<222> (1307)..(1946)
<223> OrfC_终止子
<220>
<221> misc_特征
<222> (4481)..(4929)
<223> α_微管蛋白_启动子
<220>
<221> misc_特征
<222> (4930)..(5304)
<223> Sh_ble_基因
<220>
<221> misc_特征
<222> (5305)..(5562)
<223> SV40_终止子
<400> 32
cccaatttta ggccccccac tgaccgaggt ctgtcgataa tccacttttc cattgatttt 60
ccaggtttcg ttaactcatg ccactgagca aaacttcggt ctttcctaac aaaagctctc 120
ctcacaaagc atggcgcggc aacggacgtg tcctcatact ccactgccac acaaggtcga 180
taaactaagc tcctcacaaa tagaggagaa ttccactgac aactgaaaac aatgtatgag 240
agacgatcac cactggagcg gcgcggcggt tgggcgcgga ggtcggcagc aaaaacaagc 300
gactcgccga gcaaacccga atcagccttc agacggtcgt gcctaacaac acgccgttct 360
accccgcctt cttcgcgccc cttcgcgtcc aagcatcctt caagtttatc tctctagttc 420
aacttcaaga agaacaacac caccaacacc ggatccatga agttcgcgac ctcggtcgca 480
attttgcttg tggccaacat agccaccgcc ctcgcgcaga gcgatggctg cacccccacc 540
gaccagacga tggtgagcaa gggcgaggag ctgttcaccg gggtggtgcc catcctggtc 600
gagctggacg gcgacgtaaa cggccacaag ttcagcgtgt ccggcgaggg cgagggcgat 660
gccacctacg gcaagctgac cctgaagttc atctgcacca ccggcaagct gcccgtgccc 720
tggcccaccc tcgtgaccac cctgacctac ggcgtgcagt gcttcagccg ctaccccgac 780
cacatgaagc agcacgactt cttcaagtcc gccatgcccg aaggctacgt ccaggagcgc 840
accatcttct tcaaggacga cggcaactac aagacccgcg ccgaggtgaa gttcgagggc 900
gacaccctgg tgaaccgcat cgagctgaag ggcatcgact tcaaggagga cggcaacatc 960
ctgggacaca agctggagta caactacaac agccacaacg tctatatcat ggccgacaag 1020
cagaagaacg gcatcaaggt gaacttcaag atccgccaca acatcgagga cggcagcgtg 1080
cagctcgccg accactacca gcagaacacc cccatcggcg acggccccgt gctgctgccc 1140
gacaaccact acctgagcac ccagtccgcc ctgagcaaag accccaacga gaagcgcgat 1200
cacatggtcc tgctggagtt cgtgaccgcc gccgggatca ctctcggcat ggacgagctg 1260
tacaagcacc accatcacca ccactaacat atgagttatg agatccgaaa gtgaaccttg 1320
tcctaacccg acagcgaatg gcgggagggg gcgggctaaa agatcgtatt acatagtatt 1380
tttcccctac tctttgtgtt tgtctttttt ttttttttga acgcattcaa gccacttgtc 1440
tgggtttact tgtttgtttg cttgcttgct tgcttgcttg cctgcttctt ggtcagacgg 1500
cccaaaaaag ggaaaaaatt cattcatggc acagataaga aaaagaaaaa gtttgtcgac 1560
caccgtcatc agaaagcaag agaagagaaa cactcgcgct cacattctcg ctcgcgtaag 1620
aatcttagcc acgcatacga agtaatttgt ccatctggcg aatctttaca tgagcgtttt 1680
caagctggag cgtgagatca tacctttctt gatcgtaatg ttccaacctt gcataggcct 1740
cgttgcgatc cgctagcaat gcgtcgtact cccgttgcaa ctgcgccatc gcctcattgt 1800
gacgtgagtt cagattcttc tcgagacctt cgagcgctgc taatttcgcc tgacgctcct 1860
tcttttgtgc ttccatgaca cgccgcttca ccgtgcgttc cacttcttcc tcagacatgc 1920
ccttggctgc ctcgacctgc tcggtaaaac gggccccagc acgtgctacg agatttcgat 1980
tccaccgccg ccttctatga aaggttgggc ttcggaatcg ttttccggga cgccggctgg 2040
atgatcctcc agcgcgggga tctcatgctg gagttcttcg cccaccccaa cttgtttatt 2100
gcagcttata atggttacaa ataaagcaat agcatcacaa atttcacaaa taaagcattt 2160
ttttcactgc attctagttg tggtttgtcc aaactcatca atgtatctta tcatacatgg 2220
tcgacctgca ggaacctgca ttaatgaatc ggccaacgcg cggggagagg cggtttgcgt 2280
attgggcgct cttccgcttc ctcgctcact gactcgctgc gctcggtcgt tcggctgcgg 2340
cgagcggtat cagctcactc aaaggcggta atacggttat ccacagaatc aggggataac 2400
gcaggaaaga acatgtgagc aaaaggccag caaaaggcca ggaaccgtaa aaaggccgcg 2460
ttgctggcgt ttttccatag gctccgcccc cctgacgagc atcacaaaaa tcgacgctca 2520
agtcagaggt ggcgaaaccc gacaggacta taaagatacc aggcgtttcc ccctggaagc 2580
tccctcgtgc gctctcctgt tccgaccctg ccgcttaccg gatacctgtc cgcctttctc 2640
ccttcgggaa gcgtggcgct ttctcatagc tcacgctgta ggtatctcag ttcggtgtag 2700
gtcgttcgct ccaagctggg ctgtgtgcac gaaccccccg ttcagcccga ccgctgcgcc 2760
ttatccggta actatcgtct tgagtccaac ccggtaagac acgacttatc gccactggca 2820
gcagccactg gtaacaggat tagcagagcg aggtatgtag gcggtgctac agagttcttg 2880
aagtggtggc ctaactacgg ctacactaga agaacagtat ttggtatctg cgctctgctg 2940
aagccagtta ccttcggaaa aagagttggt agctcttgat ccggcaaaca aaccaccgct 3000
ggtagcggtg gtttttttgt ttgcaagcag cagattacgc gcagaaaaaa aggatctcaa 3060
gaagatcctt tgatcttttc tacggggtct gacgctcagt ggaacgaaaa ctcacgttaa 3120
gggattttgg tcatgagatt atcaaaaagg atcttcacct agatcctttt aaattaaaaa 3180
tgaagtttta aatcaatcta aagtatatat gagtaaactt ggtctgacag ttaccaatgc 3240
ttaatcagtg aggcacctat ctcagcgatc tgtctatttc gttcatccat agttgcctga 3300
ctccccgtcg tgtagataac tacgatacgg gagggcttac catctggccc cagtgctgca 3360
atgataccgc gagacccacg ctcaccggct ccagatttat cagcaataaa ccagccagcc 3420
ggaagggccg agcgcagaag tggtcctgca actttatccg cctccatcca gtctattaat 3480
tgttgccggg aagctagagt aagtagttcg ccagttaata gtttgcgcaa cgttgttgcc 3540
attgctacag gcatcgtggt gtcacgctcg tcgtttggta tggcttcatt cagctccggt 3600
tcccaacgat caaggcgagt tacatgatcc cccatgttgt gcaaaaaagc ggttagctcc 3660
ttcggtcctc cgatcgttgt cagaagtaag ttggccgcag tgttatcact catggttatg 3720
gcagcactgc ataattctct tactgtcatg ccatccgtaa gatgcttttc tgtgactggt 3780
gagtactcaa ccaagtcatt ctgagaatag tgtatgcggc gaccgagttg ctcttgcccg 3840
gcgtcaatac gggataatac cgcgccacat agcagaactt taaaagtgct catcattgga 3900
aaacgttctt cggggcgaaa actctcaagg atcttaccgc tgttgagatc cagttcgatg 3960
taacccactc gtgcacccaa ctgatcttca gcatctttta ctttcaccag cgtttctggg 4020
tgagcaaaaa caggaaggca aaatgccgca aaaaagggaa taagggcgac acggaaatgt 4080
tgaatactca tactcttcct ttttcaatat tattgaagca tttatcaggg ttattgtctc 4140
atgagcggat acatatttga atgtatttag aaaaataaac aaataggggt tccgcgcaca 4200
tttccccgaa aagtgccacc tgacgtctaa gaaaccatta ttatcatgac attaacctat 4260
aaaaataggc gtatcacgag gccctttcgt ctcgcgcgtt tcggtgatga cggtgaaaac 4320
ctctgacaca tgcagctccc ggagacggtc acagcttgtc tgtaagcgga tgccgggagc 4380
agacaagccc gtcagggcgc gtcagcgggt gttggcgggt gtcggggctg gcttaactat 4440
gcggcatcag agcagattgt actgagagtg caccaagctt ccaattttag gccccccact 4500
gaccgaggtc tgtcgataat ccacttttcc attgattttc caggtttcgt taactcatgc 4560
cactgagcaa aacttcggtc tttcctaaca aaagctctcc tcacaaagca tggcgcggca 4620
acggacgtgt cctcatactc cactgccaca caaggtcgat aaactaagct cctcacaaat 4680
agaggagaat tccactgaca actgaaaaca atgtatgaga gacgatcacc actggagcgg 4740
cgcggcggtt gggcgcggag gtcggcagca aaaacaagcg actcgccgag caaacccgaa 4800
tcagccttca gacggtcgtg cctaacaaca cgccgttcta ccccgccttc ttcgcgcccc 4860
ttcgcgtcca agcatccttc aagtttatct ctctagttca acttcaagaa gaacaacacc 4920
accaacacca tggccaagtt gaccagtgcc gttccggtgc tcaccgcgcg cgacgtcgcc 4980
ggagcggtcg agttctggac cgaccggctc gggttctccc gggacttcgt ggaggacgac 5040
ttcgccggtg tggtccggga cgacgtgacc ctgttcatca gcgcggtcca ggaccaggtg 5100
gtgccggaca acaccctggc ctgggtgtgg gtgcgcggcc tggacgagct gtacgccgag 5160
tggtcggagg tcgtgtccac gaacttccgg gacgcctccg ggccggccat gaccgagatc 5220
ggcgagcagc cgtgggggcg ggagttcgcc ctgcgcgacc cggccggcaa ctgcgtgcac 5280
ttcgtggccg aggagcagga ctgacacgtg ctacgagatt tcgattccac cgccgccttc 5340
tatgaaaggt tgggcttcgg aatcgttttc cgggacgccg gctggatgat cctccagcgc 5400
ggggatctca tgctggagtt cttcgcccac cccaacttgt ttattgcagc ttataatggt 5460
tacaaataaa gcaatagcat cacaaatttc acaaataaag catttttttc actgcattct 5520
agttgtggtt tgtccaaact catcaatgta tcttatcggt ac 5562
<210> 33
<211> 8887
<212> DNA
<213> 人工序列
<220>
<223> pYB61载体 (8887 bp)
<220>
<221> misc_特征
<222> (2)..(450)
<223> α_微管蛋白_启动子
<220>
<221> misc_特征
<222> (457)..(4596)
<223> Cas9
<220>
<221> misc_特征
<222> (4616)..(5255)
<223> OrfC_终止子
<220>
<221> misc_特征
<222> (6540)..(7400)
<223> 氨苄青霉素_抗性_基因
<220>
<221> misc_特征
<222> (7790)..(8238)
<223> α_微管蛋白_启动子
<220>
<221> misc_特征
<222> (8239)..(8613)
<223> Sh_ble_基因
<220>
<221> misc_特征
<222> (8614)..(8887)
<223> SV40_终止子
<400> 33
cccaatttta ggccccccac tgaccgaggt ctgtcgataa tccacttttc cattgatttt 60
ccaggtttcg ttaactcatg ccactgagca aaacttcggt ctttcctaac aaaagctctc 120
ctcacaaagc atggcgcggc aacggacgtg tcctcatact ccactgccac acaaggtcga 180
taaactaagc tcctcacaaa tagaggagaa ttccactgac aactgaaaac aatgtatgag 240
agacgatcac cactggagcg gcgcggcggt tgggcgcgga ggtcggcagc aaaaacaagc 300
gactcgccga gcaaacccga atcagccttc agacggtcgt gcctaacaac acgccgttct 360
accccgcctt cttcgcgccc cttcgcgtcc aagcatcctt caagtttatc tctctagttc 420
aacttcaaga agaacaacac caccaacacc ggatccatgg ataagaagta ctcgatcggc 480
ctcgacattg gcaccaacag cgtcggctgg gccgtcatta ctgatgagta caaggtcccg 540
tcgaagaagt ttaaggtcct cggcaacact gaccgccact ccatcaagaa gaacctcatc 600
ggtgccctcc tttttgactc cggcgagacc gctgaggcca ctcgcctcaa gcgcactgcc 660
cgccgccgtt acacccgccg caagaaccgc atctgctacc tccaggagat tttctcgaac 720
gaaatggcca aggtcgatga ctcctttttc caccgtctcg aagaatcgtt cctcgtcgag 780
gaggacaaga agcacgagcg ccaccccatc ttcggtaaca ttgtcgatga ggttgcctac 840
cacgagaagt acccgaccat ctaccacctc cgcaagaagc tcgtcgactc caccgacaag 900
gccgatctcc gccttatcta cctcgccctc gcccacatga tcaagttccg cggccacttt 960
cttatcgagg gtgatctcaa ccctgataac tctgacgtcg acaagctttt catccagctc 1020
gtccagactt acaaccagct cttcgaggag aaccccatca acgcttccgg cgtcgacgcg 1080
aaggccattc tcagcgcccg cctcagcaag tcccgccgcc tcgaaaacct cattgcccag 1140
cttcccggcg agaagaagaa cggcctcttc ggcaacctca ttgccctcag ccttggcctc 1200
acccctaact tcaagtcgaa ctttgacctc gccgaggacg ccaagctcca gctttccaag 1260
gacacttacg acgacgatct cgacaacctc ctcgctcaga ttggcgacca gtacgctgac 1320
ctcttcctcg ccgccaagaa ccttagcgat gccatcctcc tctccgacat ccttcgtgtt 1380
aacacggaaa tcacgaaggc tccgctctcc gcctccatga tcaagcgtta cgacgagcac 1440
catcaggacc tcaccctcct caaggccctc gtccgccagc agctccccga gaagtacaag 1500
gagatcttct tcgaccagag caagaacggc tacgccggct acattgacgg cggcgcgtcg 1560
caggaggagt tttacaagtt tatcaagccc attcttgaga agatggacgg caccgaggag 1620
ctcctcgtca agctcaaccg tgaggacctt ctccgcaagc agcgcacgtt cgacaacggc 1680
tctattcccc atcagatcca cctcggtgag cttcacgcga ttcttcgccg ccaggaagac 1740
ttttacccgt tcctcaagga caaccgcgag aagattgaga agatcctcac ctttcgcatt 1800
ccctactacg tcggccccct cgcccgcggc aactcgcgct ttgcttggat gacccgcaag 1860
tccgaggaga ccatcacccc gtggaacttc gaagaggtcg tcgacaaggg cgcctccgcg 1920
cagtctttca tcgagcgcat gactaacttt gacaagaacc tcccgaacga gaaggtcctc 1980
cccaagcaca gcctccttta cgaatacttt acggtgtaca acgagctcac gaaggtcaag 2040
tacgtcactg agggcatgcg caagccggcg ttcctttcgg gcgagcagaa gaaggctatc 2100
gtcgacctcc ttttcaagac caaccgcaag gttaccgtca agcagctcaa ggaggactac 2160
ttcaagaaga tcgagtgctt tgactcggtc gagatttcgg gcgtggagga ccgtttcaac 2220
gcctccctcg gcacttacca cgaccttctc aagatcatca aggacaagga ctttctcgac 2280
aacgaggaga acgaggacat tctcgaggac atcgtcctca cgctcaccct ctttgaggac 2340
cgtgagatga tcgaggagcg cctcaagacc tacgcccatc tctttgacga caaggtcatg 2400
aagcagctca agcgccgccg ctacaccggc tggggccgcc tttcccgcaa gctcatcaac 2460
ggcatccgcg acaagcagtc tggcaagacc atccttgact ttcttaagtc tgatggtttc 2520
gccaaccgca acttcatgca gctcatccac gacgacagcc tcactttcaa ggaggacatt 2580
cagaaggccc aggtctccgg ccagggtgac tctctccacg aacacatcgc caaccttgct 2640
ggcagcccgg ctattaagaa gggcatcctc cagaccgtca aggtcgtcga cgagctcgtc 2700
aaggttatgg gccgccacaa gcccgagaac atcgtcattg agatggctcg cgaaaaccag 2760
accacccaga agggtcagaa gaactcccgc gagcgcatga agcgtatcga ggagggcatc 2820
aaggagctcg gcagccagat cctcaaggag cacccggtcg agaacaccca gctccagaac 2880
gaaaagctct acctctacta cctccagaac ggccgtgaca tgtacgttga ccaggagctc 2940
gacattaacc gcctctccga ttacgacgtc gaccatattg tcccccagag ctttctcaag 3000
gacgacagca tcgacaacaa ggtcctcacc cgctcggaca agaaccgcgg caagtccgac 3060
aacgtccctt ccgaggaggt cgtgaagaag atgaagaact actggcgcca gcttctcaac 3120
gctaagctta ttactcagcg caagttcgat aacctcacca aggccgaacg cggcggcctc 3180
tccgagctcg acaaggccgg ttttatcaag cgccagctcg ttgagactcg ccagatcacc 3240
aagcacgtgg cgcagatcct cgactcgcgc atgaacacga agtacgacga gaacgacaag 3300
ctcatccgcg aggtcaaggt catcaccctt aagtcgaagc tcgtgtccga ctttcgcaag 3360
gacttccagt tctacaaggt ccgtgaaatt aacaactacc accacgctca cgacgcttac 3420
ctcaacgcgg tcgtgggtac cgcgctcatc aagaagtacc cgaagctcga gtcggagttt 3480
gtctacggcg actacaaggt ctacgacgtg cgcaagatga tcgccaagtc cgagcaggag 3540
atcggcaagg ccacggccaa gtactttttc tactccaaca ttatgaactt ctttaagact 3600
gagatcaccc ttgccaacgg cgagatccgc aagcgccccc ttatcgagac caacggcgag 3660
accggcgaaa ttgtgtggga taagggtcgc gactttgcca ccgtccgcaa ggtcctcagc 3720
atgccccagg tcaacattgt taagaagacc gaggtccaga cgggcggctt tagcaaggag 3780
tctatcctcc ccaagcgtaa cagcgacaag ctcatcgccc gcaagaagga ctgggaccct 3840
aagaagtacg gcggcttcga ttcgcctacg gtcgcctaca gcgtcctcgt cgtcgccaag 3900
gtcgagaagg gcaagtccaa gaagctcaag tccgtcaagg agctcctcgg catcacgatc 3960
atggagcgct ccagctttga gaagaacccc attgacttcc tcgaggctaa gggttacaag 4020
gaggtcaaga aggaccttat catcaagctc cccaagtact ccctctttga gctcgaaaac 4080
ggccgcaagc gtatgctcgc tagcgctggc gaactccaga agggcaacga gctcgccctc 4140
cccagcaagt acgtcaactt tctctacctc gcctcccact acgagaagct caagggtagc 4200
ccggaggata acgagcagaa gcagcttttt gtggagcagc acaagcacta ccttgacgag 4260
atcattgaac agatctccga gttctccaag cgtgttattc ttgctgacgc caacctcgat 4320
aaggtgctct ccgcgtacaa caagcaccgc gacaagccta tccgcgagca ggccgagaac 4380
atcatccacc tctttaccct caccaacctc ggcgccccgg ccgcctttaa gtactttgat 4440
acgactatcg accgcaagcg ctacacttcg actaaggagg tcctcgacgc taccctcatt 4500
caccagtcca ttaccggcct ctacgagacc cgcattgacc tttcgcagct cggtggcgac 4560
tcgcgtgcgg accctaagaa gaagcgcaag gtctaacata tgagttatga gatccgaaag 4620
tgaaccttgt cctaacccga cagcgaatgg cgggaggggg cgggctaaaa gatcgtatta 4680
catagtattt ttcccctact ctttgtgttt gtcttttttt tttttttgaa cgcattcaag 4740
ccacttgtct gggtttactt gtttgtttgc ttgcttgctt gcttgcttgc ctgcttcttg 4800
gtcagacggc ccaaaaaagg gaaaaaattc attcatggca cagataagaa aaagaaaaag 4860
tttgtcgacc accgtcatca gaaagcaaga gaagagaaac actcgcgctc acattctcgc 4920
tcgcgtaaga atcttagcca cgcatacgaa gtaatttgtc catctggcga atctttacat 4980
gagcgttttc aagctggagc gtgagatcat acctttcttg atcgtaatgt tccaaccttg 5040
cataggcctc gttgcgatcc gctagcaatg cgtcgtactc ccgttgcaac tgcgccatcg 5100
cctcattgtg acgtgagttc agattcttct cgagaccttc gagcgctgct aatttcgcct 5160
gacgctcctt cttttgtgct tccatgacac gccgcttcac cgtgcgttcc acttcttcct 5220
cagacatgcc cttggctgcc tcgacctgct cggtaaaacg ggccccagca cgtgctacga 5280
gatttcgatt ccaccgccgc cttctatgaa aggttgggct tcggaatcgt tttccgggac 5340
gccggctgga tgatcctcca gcgcggggat ctcatgctgg agttcttcgc ccaccccaac 5400
ttgtttattg cagcttataa tggttacaaa taaagcaata gcatcacaaa tttcacaaat 5460
aaagcatttt tttcactgca ttctagttgt ggtttgtcca aactcatcaa tgtatcttat 5520
catacatggt cgacctgcag gaacctgcat taatgaatcg gccaacgcgc ggggagaggc 5580
ggtttgcgta ttgggcgctc ttccgcttcc tcgctcactg actcgctgcg ctcggtcgtt 5640
cggctgcggc gagcggtatc agctcactca aaggcggtaa tacggttatc cacagaatca 5700
ggggataacg caggaaagaa catgtgagca aaaggccagc aaaaggccag gaaccgtaaa 5760
aaggccgcgt tgctggcgtt tttccatagg ctccgccccc ctgacgagca tcacaaaaat 5820
cgacgctcaa gtcagaggtg gcgaaacccg acaggactat aaagatacca ggcgtttccc 5880
cctggaagct ccctcgtgcg ctctcctgtt ccgaccctgc cgcttaccgg atacctgtcc 5940
gcctttctcc cttcgggaag cgtggcgctt tctcatagct cacgctgtag gtatctcagt 6000
tcggtgtagg tcgttcgctc caagctgggc tgtgtgcacg aaccccccgt tcagcccgac 6060
cgctgcgcct tatccggtaa ctatcgtctt gagtccaacc cggtaagaca cgacttatcg 6120
ccactggcag cagccactgg taacaggatt agcagagcga ggtatgtagg cggtgctaca 6180
gagttcttga agtggtggcc taactacggc tacactagaa gaacagtatt tggtatctgc 6240
gctctgctga agccagttac cttcggaaaa agagttggta gctcttgatc cggcaaacaa 6300
accaccgctg gtagcggtgg tttttttgtt tgcaagcagc agattacgcg cagaaaaaaa 6360
ggatctcaag aagatccttt gatcttttct acggggtctg acgctcagtg gaacgaaaac 6420
tcacgttaag ggattttggt catgagatta tcaaaaagga tcttcaccta gatcctttta 6480
aattaaaaat gaagttttaa atcaatctaa agtatatatg agtaaacttg gtctgacagt 6540
taccaatgct taatcagtga ggcacctatc tcagcgatct gtctatttcg ttcatccata 6600
gttgcctgac tccccgtcgt gtagataact acgatacggg agggcttacc atctggcccc 6660
agtgctgcaa tgataccgcg agacccacgc tcaccggctc cagatttatc agcaataaac 6720
cagccagccg gaagggccga gcgcagaagt ggtcctgcaa ctttatccgc ctccatccag 6780
tctattaatt gttgccggga agctagagta agtagttcgc cagttaatag tttgcgcaac 6840
gttgttgcca ttgctacagg catcgtggtg tcacgctcgt cgtttggtat ggcttcattc 6900
agctccggtt cccaacgatc aaggcgagtt acatgatccc ccatgttgtg caaaaaagcg 6960
gttagctcct tcggtcctcc gatcgttgtc agaagtaagt tggccgcagt gttatcactc 7020
atggttatgg cagcactgca taattctctt actgtcatgc catccgtaag atgcttttct 7080
gtgactggtg agtactcaac caagtcattc tgagaatagt gtatgcggcg accgagttgc 7140
tcttgcccgg cgtcaatacg ggataatacc gcgccacata gcagaacttt aaaagtgctc 7200
atcattggaa aacgttcttc ggggcgaaaa ctctcaagga tcttaccgct gttgagatcc 7260
agttcgatgt aacccactcg tgcacccaac tgatcttcag catcttttac tttcaccagc 7320
gtttctgggt gagcaaaaac aggaaggcaa aatgccgcaa aaaagggaat aagggcgaca 7380
cggaaatgtt gaatactcat actcttcctt tttcaatatt attgaagcat ttatcagggt 7440
tattgtctca tgagcggata catatttgaa tgtatttaga aaaataaaca aataggggtt 7500
ccgcgcacat ttccccgaaa agtgccacct gacgtctaag aaaccattat tatcatgaca 7560
ttaacctata aaaataggcg tatcacgagg ccctttcgtc tcgcgcgttt cggtgatgac 7620
ggtgaaaacc tctgacacat gcagctcccg gagacggtca cagcttgtct gtaagcggat 7680
gccgggagca gacaagcccg tcagggcgcg tcagcgggtg ttggcgggtg tcggggctgg 7740
cttaactatg cggcatcaga gcagattgta ctgagagtgc accaagcttc caattttagg 7800
ccccccactg accgaggtct gtcgataatc cacttttcca ttgattttcc aggtttcgtt 7860
aactcatgcc actgagcaaa acttcggtct ttcctaacaa aagctctcct cacaaagcat 7920
ggcgcggcaa cggacgtgtc ctcatactcc actgccacac aaggtcgata aactaagctc 7980
ctcacaaata gaggagaatt ccactgacaa ctgaaaacaa tgtatgagag acgatcacca 8040
ctggagcggc gcggcggttg ggcgcggagg tcggcagcaa aaacaagcga ctcgccgagc 8100
aaacccgaat cagccttcag acggtcgtgc ctaacaacac gccgttctac cccgccttct 8160
tcgcgcccct tcgcgtccaa gcatccttca agtttatctc tctagttcaa cttcaagaag 8220
aacaacacca ccaacaccat ggccaagttg accagtgccg ttccggtgct caccgcgcgc 8280
gacgtcgccg gagcggtcga gttctggacc gaccggctcg ggttctcccg ggacttcgtg 8340
gaggacgact tcgccggtgt ggtccgggac gacgtgaccc tgttcatcag cgcggtccag 8400
gaccaggtgg tgccggacaa caccctggcc tgggtgtggg tgcgcggcct ggacgagctg 8460
tacgccgagt ggtcggaggt cgtgtccacg aacttccggg acgcctccgg gccggccatg 8520
accgagatcg gcgagcagcc gtgggggcgg gagttcgccc tgcgcgaccc ggccggcaac 8580
tgcgtgcact tcgtggccga ggagcaggac tgacacgtgc tacgagattt cgattccacc 8640
gccgccttct atgaaaggtt gggcttcgga atcgttttcc gggacgccgg ctggatgatc 8700
ctccagcgcg gggatctcat gctggagttc ttcgcccacc ccaacttgtt tattgcagct 8760
tataatggtt acaaataaag caatagcatc acaaatttca caaataaagc atttttttca 8820
ctgcattcta gttgtggttt gtccaaactc atcaatgtat cttatcatgt ctgaattccc 8880
ggggtac 8887
<210> 34
<211> 5997
<212> DNA
<213> 人工序列
<220>
<223> pYB66载体 (5997 bp)
<220>
<221> misc_特征
<222> (1)..(1064)
<223> EF-1α_启动子
<220>
<221> misc_特征
<222> (1082)..(1118)
<223> 锤头状_核酶
<220>
<221> misc_特征
<222> (1119)..(1138)
<223> gRNA3_CS1_靶标_序列
<220>
<221> misc_特征
<222> (1139)..(1218)
<223> gRNA_骨架
<220>
<221> misc_特征
<222> (1219)..(1286)
<223> HDV_核酶
<220>
<221> misc_特征
<222> (1306)..(1945)
<223> OrfC_终止子
<220>
<221> misc_特征
<222> (4480)..(4928)
<223> α_微管蛋白_启动子
<220>
<221> misc_特征
<222> (4929)..(5723)
<223> 新霉素_磷酸转移酶_基因
<220>
<221> misc_特征
<222> (5724)..(5997)
<223> SV40_终止子
<400> 34
ctcttatctg cctcgcgccg ttgaccgccg cttgactctt ggcgcttgcc gctcgcatcc 60
tgcctcgctc gcgcaggcgg gcgggcgagt gggtgggtcc gcagccttcc gcgctcgccc 120
gctagctcgc tcgcgccgtg ctgcagccag cagggcagca ccgcacggca ggcaggtccc 180
ggcgcggatc gatcgatcca tcgatccatc gatccatcga tcgtgcggtc aaaaagaaag 240
gaagaagaaa ggaaaaagaa aggcgtgcgc acccgagtgc gcgctgagcg cccgctcgcg 300
gtcccgcgga gcctccgcgt tagtccccgc cccgcgccgc gcagtccccc gggaggcatc 360
gcgcacctct cgccgccccc tcgcgcctcg ccgattcccc gcctcccctt ttccgcttct 420
tcgccgcctc cgctcgcggc cgcgtcgccc gcgccccgct ccctatctgc tccccagggg 480
ggcactccgc accttttgcg cccgctgccg ccgccgcggc cgccccgccg ccctggtttc 540
ccccgcgagc gcggccgcgt cgccgcgcaa agactcgccg cgtgccgccc cgagcaacgg 600
gtggcggcgg cgcggcggcg ggcggggcgc ggcggcgcgt aggcggggct aggcgccggc 660
taggcgaaac gccgcccccg ggcgccgccg ccgcccgctc cagagcagtc gccgcgccag 720
accgccaacg cagagaccga gaccgaggta cgtcgcgccc gagcacgccg cgacgcgcgg 780
cagggacgag gagcacgacg ccgcgccgcg ccgcgcgggg ggggggaggg agaggcagga 840
cgcgggagcg agcgtgcatg tttccgcgcg agacgacgcc gcgcgcgctg gagaggagat 900
aaggcgcttg gatcgcgaga gggccagcca ggctggaggc gaaaatgggt ggagaggata 960
gtatcttgcg tgcttggacg aggagactga cgaggaggac ggatacgtcg atgatgatgt 1020
gcacagagaa gaagcagttc gaaagcgact actagcaagc aagggatcca gatcttccgc 1080
actgatgagt ccgtgaggac gaaacgagta agctcgtctg cggacgtcgt ggacgcgcgt 1140
tttagagcta gaaatagcaa gttaaaataa ggctagtccg ttatcaactt gaaaaagtgg 1200
caccgagtcg gtgcttttgg ccggcatggt cccagcctcc tcgctggcgc cggctgggca 1260
acatgcttcg gcatggcgaa tgggaccata tgagttatga gatccgaaag tgaaccttgt 1320
cctaacccga cagcgaatgg cgggaggggg cgggctaaaa gatcgtatta catagtattt 1380
ttcccctact ctttgtgttt gtcttttttt tttttttgaa cgcattcaag ccacttgtct 1440
gggtttactt gtttgtttgc ttgcttgctt gcttgcttgc ctgcttcttg gtcagacggc 1500
ccaaaaaagg gaaaaaattc attcatggca cagataagaa aaagaaaaag tttgtcgacc 1560
accgtcatca gaaagcaaga gaagagaaac actcgcgctc acattctcgc tcgcgtaaga 1620
atcttagcca cgcatacgaa gtaatttgtc catctggcga atctttacat gagcgttttc 1680
aagctggagc gtgagatcat acctttcttg atcgtaatgt tccaaccttg cataggcctc 1740
gttgcgatcc gctagcaatg cgtcgtactc ccgttgcaac tgcgccatcg cctcattgtg 1800
acgtgagttc agattcttct cgagaccttc gagcgctgct aatttcgcct gacgctcctt 1860
cttttgtgct tccatgacac gccgcttcac cgtgcgttcc acttcttcct cagacatgcc 1920
cttggctgcc tcgacctgct cggtaaaacg ggccccagca cgtgctacga gatttcgatt 1980
ccaccgccgc cttctatgaa aggttgggct tcggaatcgt tttccgggac gccggctgga 2040
tgatcctcca gcgcggggat ctcatgctgg agttcttcgc ccaccccaac ttgtttattg 2100
cagcttataa tggttacaaa taaagcaata gcatcacaaa tttcacaaat aaagcatttt 2160
tttcactgca ttctagttgt ggtttgtcca aactcatcaa tgtatcttat catacatggt 2220
cgacctgcag gaacctgcat taatgaatcg gccaacgcgc ggggagaggc ggtttgcgta 2280
ttgggcgctc ttccgcttcc tcgctcactg actcgctgcg ctcggtcgtt cggctgcggc 2340
gagcggtatc agctcactca aaggcggtaa tacggttatc cacagaatca ggggataacg 2400
caggaaagaa catgtgagca aaaggccagc aaaaggccag gaaccgtaaa aaggccgcgt 2460
tgctggcgtt tttccatagg ctccgccccc ctgacgagca tcacaaaaat cgacgctcaa 2520
gtcagaggtg gcgaaacccg acaggactat aaagatacca ggcgtttccc cctggaagct 2580
ccctcgtgcg ctctcctgtt ccgaccctgc cgcttaccgg atacctgtcc gcctttctcc 2640
cttcgggaag cgtggcgctt tctcatagct cacgctgtag gtatctcagt tcggtgtagg 2700
tcgttcgctc caagctgggc tgtgtgcacg aaccccccgt tcagcccgac cgctgcgcct 2760
tatccggtaa ctatcgtctt gagtccaacc cggtaagaca cgacttatcg ccactggcag 2820
cagccactgg taacaggatt agcagagcga ggtatgtagg cggtgctaca gagttcttga 2880
agtggtggcc taactacggc tacactagaa gaacagtatt tggtatctgc gctctgctga 2940
agccagttac cttcggaaaa agagttggta gctcttgatc cggcaaacaa accaccgctg 3000
gtagcggtgg tttttttgtt tgcaagcagc agattacgcg cagaaaaaaa ggatctcaag 3060
aagatccttt gatcttttct acggggtctg acgctcagtg gaacgaaaac tcacgttaag 3120
ggattttggt catgagatta tcaaaaagga tcttcaccta gatcctttta aattaaaaat 3180
gaagttttaa atcaatctaa agtatatatg agtaaacttg gtctgacagt taccaatgct 3240
taatcagtga ggcacctatc tcagcgatct gtctatttcg ttcatccata gttgcctgac 3300
tccccgtcgt gtagataact acgatacggg agggcttacc atctggcccc agtgctgcaa 3360
tgataccgcg agacccacgc tcaccggctc cagatttatc agcaataaac cagccagccg 3420
gaagggccga gcgcagaagt ggtcctgcaa ctttatccgc ctccatccag tctattaatt 3480
gttgccggga agctagagta agtagttcgc cagttaatag tttgcgcaac gttgttgcca 3540
ttgctacagg catcgtggtg tcacgctcgt cgtttggtat ggcttcattc agctccggtt 3600
cccaacgatc aaggcgagtt acatgatccc ccatgttgtg caaaaaagcg gttagctcct 3660
tcggtcctcc gatcgttgtc agaagtaagt tggccgcagt gttatcactc atggttatgg 3720
cagcactgca taattctctt actgtcatgc catccgtaag atgcttttct gtgactggtg 3780
agtactcaac caagtcattc tgagaatagt gtatgcggcg accgagttgc tcttgcccgg 3840
cgtcaatacg ggataatacc gcgccacata gcagaacttt aaaagtgctc atcattggaa 3900
aacgttcttc ggggcgaaaa ctctcaagga tcttaccgct gttgagatcc agttcgatgt 3960
aacccactcg tgcacccaac tgatcttcag catcttttac tttcaccagc gtttctgggt 4020
gagcaaaaac aggaaggcaa aatgccgcaa aaaagggaat aagggcgaca cggaaatgtt 4080
gaatactcat actcttcctt tttcaatatt attgaagcat ttatcagggt tattgtctca 4140
tgagcggata catatttgaa tgtatttaga aaaataaaca aataggggtt ccgcgcacat 4200
ttccccgaaa agtgccacct gacgtctaag aaaccattat tatcatgaca ttaacctata 4260
aaaataggcg tatcacgagg ccctttcgtc tcgcgcgttt cggtgatgac ggtgaaaacc 4320
tctgacacat gcagctcccg gagacggtca cagcttgtct gtaagcggat gccgggagca 4380
gacaagcccg tcagggcgcg tcagcgggtg ttggcgggtg tcggggctgg cttaactatg 4440
cggcatcaga gcagattgta ctgagagtgc accaagcttc caattttagg ccccccactg 4500
accgaggtct gtcgataatc cacttttcca ttgattttcc aggtttcgtt aactcatgcc 4560
actgagcaaa acttcggtct ttcctaacaa aagctctcct cacaaagcat ggcgcggcaa 4620
cggacgtgtc ctcatactcc actgccacac aaggtcgata aactaagctc ctcacaaata 4680
gaggagaatt ccactgacaa ctgaaaacaa tgtatgagag acgatcacca ctggagcggc 4740
gcggcggttg ggcgcggagg tcggcagcaa aaacaagcga ctcgccgagc aaacccgaat 4800
cagccttcag acggtcgtgc ctaacaacac gccgttctac cccgccttct tcgcgcccct 4860
tcgcgtccaa gcatccttca agtttatctc tctagttcaa cttcaagaag aacaacacca 4920
ccaacaccat gattgaacaa gatggattgc acgcaggttc tccggccgct tgggtggaga 4980
ggctattcgg ctatgactgg gcacaacaga caatcggctg ctctgatgcc gccgtgttcc 5040
ggctgtcagc gcaggggcgc ccggttcttt ttgtcaagac cgacctgtcc ggtgccctga 5100
atgaactgca ggacgaggca gcgcggctat cgtggctggc cacgacgggc gttccttgcg 5160
cagctgtgct cgacgttgtc actgaagcgg gaagggactg gctgctattg ggcgaagtgc 5220
cggggcagga tctcctgtca tctcaccttg ctcctgccga gaaagtatcc atcatggctg 5280
atgcaatgcg gcggctgcat acgcttgatc cggctacctg cccattcgac caccaagcga 5340
aacatcgcat cgagcgagca cgtactcgga tggaagccgg tcttgtcgat caggatgatc 5400
tggacgaaga gcatcagggg ctcgcgccag ccgaactgtt cgccaggctc aaggcgcgca 5460
tgcccgacgg cgatgatctc gtcgtgaccc atggcgatgc ctgcttgccg aatatcatgg 5520
tggaaaatgg ccgcttttct ggattcatcg actgtggccg gctgggtgtg gcggaccgct 5580
atcaggacat agcgttggct acccgtgata ttgctgaaga gcttggcggc gaatgggctg 5640
accgcttcct cgtgctttac ggtatcgccg ctcccgattc gcagcgcatc gccttctatc 5700
gccttcttga cgagttcttc tgacacgtgc tacgagattt cgattccacc gccgccttct 5760
atgaaaggtt gggcttcgga atcgttttcc gggacgccgg ctggatgatc ctccagcgcg 5820
gggatctcat gctggagttc ttcgcccacc ccaacttgtt tattgcagct tataatggtt 5880
acaaataaag caatagcatc acaaatttca caaataaagc atttttttca ctgcattcta 5940
gttgtggttt gtccaaactc atcaatgtat cttatcatgt ctgaattccc ggggtac 5997
<210> 35
<211> 10700
<212> DNA
<213> 人工序列
<220>
<223> pYB73载体 (10700 bp)
<220>
<221> misc_特征
<222> (2)..(450)
<223> α_微管蛋白_启动子
<220>
<221> misc_特征
<222> (457)..(4596)
<223> Cas9
<220>
<221> misc_特征
<222> (4616)..(5255)
<223> OrfC_终止子
<220>
<221> misc_特征
<222> (5546)..(6608)
<223> EF_1alpha_启动子
<220>
<221> misc_特征
<222> (6621)..(6657)
<223> 锤头状_核酶
<220>
<221> misc_特征
<222> (6658)..(6677)
<223> gRNA3_CS1_靶标_序列
<220>
<221> misc_特征
<222> (6678)..(6757)
<223> gRNA_骨架
<220>
<221> misc_特征
<222> (6758)..(6825)
<223> HDV_核酶
<220>
<221> misc_特征
<222> (6845)..(7363)
<223> OrfC_终止子
<220>
<221> misc_特征
<222> (8369)..(9229)
<223> 氨苄青霉素_抗性_基因
<220>
<221> misc_特征
<222> (9619)..(10067)
<223> α_微管蛋白_启动子
<220>
<221> misc_特征
<222> (10068)..(10442)
<223> Sh_ble_基因
<220>
<221> misc_特征
<222> (10443)..(10700)
<223> SV40_终止子
<400> 35
cccaatttta ggccccccac tgaccgaggt ctgtcgataa tccacttttc cattgatttt 60
ccaggtttcg ttaactcatg ccactgagca aaacttcggt ctttcctaac aaaagctctc 120
ctcacaaagc atggcgcggc aacggacgtg tcctcatact ccactgccac acaaggtcga 180
taaactaagc tcctcacaaa tagaggagaa ttccactgac aactgaaaac aatgtatgag 240
agacgatcac cactggagcg gcgcggcggt tgggcgcgga ggtcggcagc aaaaacaagc 300
gactcgccga gcaaacccga atcagccttc agacggtcgt gcctaacaac acgccgttct 360
accccgcctt cttcgcgccc cttcgcgtcc aagcatcctt caagtttatc tctctagttc 420
aacttcaaga agaacaacac caccaacacc ggatccatgg ataagaagta ctcgatcggc 480
ctcgacattg gcaccaacag cgtcggctgg gccgtcatta ctgatgagta caaggtcccg 540
tcgaagaagt ttaaggtcct cggcaacact gaccgccact ccatcaagaa gaacctcatc 600
ggtgccctcc tttttgactc cggcgagacc gctgaggcca ctcgcctcaa gcgcactgcc 660
cgccgccgtt acacccgccg caagaaccgc atctgctacc tccaggagat tttctcgaac 720
gaaatggcca aggtcgatga ctcctttttc caccgtctcg aagaatcgtt cctcgtcgag 780
gaggacaaga agcacgagcg ccaccccatc ttcggtaaca ttgtcgatga ggttgcctac 840
cacgagaagt acccgaccat ctaccacctc cgcaagaagc tcgtcgactc caccgacaag 900
gccgatctcc gccttatcta cctcgccctc gcccacatga tcaagttccg cggccacttt 960
cttatcgagg gtgatctcaa ccctgataac tctgacgtcg acaagctttt catccagctc 1020
gtccagactt acaaccagct cttcgaggag aaccccatca acgcttccgg cgtcgacgcg 1080
aaggccattc tcagcgcccg cctcagcaag tcccgccgcc tcgaaaacct cattgcccag 1140
cttcccggcg agaagaagaa cggcctcttc ggcaacctca ttgccctcag ccttggcctc 1200
acccctaact tcaagtcgaa ctttgacctc gccgaggacg ccaagctcca gctttccaag 1260
gacacttacg acgacgatct cgacaacctc ctcgctcaga ttggcgacca gtacgctgac 1320
ctcttcctcg ccgccaagaa ccttagcgat gccatcctcc tctccgacat ccttcgtgtt 1380
aacacggaaa tcacgaaggc tccgctctcc gcctccatga tcaagcgtta cgacgagcac 1440
catcaggacc tcaccctcct caaggccctc gtccgccagc agctccccga gaagtacaag 1500
gagatcttct tcgaccagag caagaacggc tacgccggct acattgacgg cggcgcgtcg 1560
caggaggagt tttacaagtt tatcaagccc attcttgaga agatggacgg caccgaggag 1620
ctcctcgtca agctcaaccg tgaggacctt ctccgcaagc agcgcacgtt cgacaacggc 1680
tctattcccc atcagatcca cctcggtgag cttcacgcga ttcttcgccg ccaggaagac 1740
ttttacccgt tcctcaagga caaccgcgag aagattgaga agatcctcac ctttcgcatt 1800
ccctactacg tcggccccct cgcccgcggc aactcgcgct ttgcttggat gacccgcaag 1860
tccgaggaga ccatcacccc gtggaacttc gaagaggtcg tcgacaaggg cgcctccgcg 1920
cagtctttca tcgagcgcat gactaacttt gacaagaacc tcccgaacga gaaggtcctc 1980
cccaagcaca gcctccttta cgaatacttt acggtgtaca acgagctcac gaaggtcaag 2040
tacgtcactg agggcatgcg caagccggcg ttcctttcgg gcgagcagaa gaaggctatc 2100
gtcgacctcc ttttcaagac caaccgcaag gttaccgtca agcagctcaa ggaggactac 2160
ttcaagaaga tcgagtgctt tgactcggtc gagatttcgg gcgtggagga ccgtttcaac 2220
gcctccctcg gcacttacca cgaccttctc aagatcatca aggacaagga ctttctcgac 2280
aacgaggaga acgaggacat tctcgaggac atcgtcctca cgctcaccct ctttgaggac 2340
cgtgagatga tcgaggagcg cctcaagacc tacgcccatc tctttgacga caaggtcatg 2400
aagcagctca agcgccgccg ctacaccggc tggggccgcc tttcccgcaa gctcatcaac 2460
ggcatccgcg acaagcagtc tggcaagacc atccttgact ttcttaagtc tgatggtttc 2520
gccaaccgca acttcatgca gctcatccac gacgacagcc tcactttcaa ggaggacatt 2580
cagaaggccc aggtctccgg ccagggtgac tctctccacg aacacatcgc caaccttgct 2640
ggcagcccgg ctattaagaa gggcatcctc cagaccgtca aggtcgtcga cgagctcgtc 2700
aaggttatgg gccgccacaa gcccgagaac atcgtcattg agatggctcg cgaaaaccag 2760
accacccaga agggtcagaa gaactcccgc gagcgcatga agcgtatcga ggagggcatc 2820
aaggagctcg gcagccagat cctcaaggag cacccggtcg agaacaccca gctccagaac 2880
gaaaagctct acctctacta cctccagaac ggccgtgaca tgtacgttga ccaggagctc 2940
gacattaacc gcctctccga ttacgacgtc gaccatattg tcccccagag ctttctcaag 3000
gacgacagca tcgacaacaa ggtcctcacc cgctcggaca agaaccgcgg caagtccgac 3060
aacgtccctt ccgaggaggt cgtgaagaag atgaagaact actggcgcca gcttctcaac 3120
gctaagctta ttactcagcg caagttcgat aacctcacca aggccgaacg cggcggcctc 3180
tccgagctcg acaaggccgg ttttatcaag cgccagctcg ttgagactcg ccagatcacc 3240
aagcacgtgg cgcagatcct cgactcgcgc atgaacacga agtacgacga gaacgacaag 3300
ctcatccgcg aggtcaaggt catcaccctt aagtcgaagc tcgtgtccga ctttcgcaag 3360
gacttccagt tctacaaggt ccgtgaaatt aacaactacc accacgctca cgacgcttac 3420
ctcaacgcgg tcgtgggtac cgcgctcatc aagaagtacc cgaagctcga gtcggagttt 3480
gtctacggcg actacaaggt ctacgacgtg cgcaagatga tcgccaagtc cgagcaggag 3540
atcggcaagg ccacggccaa gtactttttc tactccaaca ttatgaactt ctttaagact 3600
gagatcaccc ttgccaacgg cgagatccgc aagcgccccc ttatcgagac caacggcgag 3660
accggcgaaa ttgtgtggga taagggtcgc gactttgcca ccgtccgcaa ggtcctcagc 3720
atgccccagg tcaacattgt taagaagacc gaggtccaga cgggcggctt tagcaaggag 3780
tctatcctcc ccaagcgtaa cagcgacaag ctcatcgccc gcaagaagga ctgggaccct 3840
aagaagtacg gcggcttcga ttcgcctacg gtcgcctaca gcgtcctcgt cgtcgccaag 3900
gtcgagaagg gcaagtccaa gaagctcaag tccgtcaagg agctcctcgg catcacgatc 3960
atggagcgct ccagctttga gaagaacccc attgacttcc tcgaggctaa gggttacaag 4020
gaggtcaaga aggaccttat catcaagctc cccaagtact ccctctttga gctcgaaaac 4080
ggccgcaagc gtatgctcgc tagcgctggc gaactccaga agggcaacga gctcgccctc 4140
cccagcaagt acgtcaactt tctctacctc gcctcccact acgagaagct caagggtagc 4200
ccggaggata acgagcagaa gcagcttttt gtggagcagc acaagcacta ccttgacgag 4260
atcattgaac agatctccga gttctccaag cgtgttattc ttgctgacgc caacctcgat 4320
aaggtgctct ccgcgtacaa caagcaccgc gacaagccta tccgcgagca ggccgagaac 4380
atcatccacc tctttaccct caccaacctc ggcgccccgg ccgcctttaa gtactttgat 4440
acgactatcg accgcaagcg ctacacttcg actaaggagg tcctcgacgc taccctcatt 4500
caccagtcca ttaccggcct ctacgagacc cgcattgacc tttcgcagct cggtggcgac 4560
tcgcgtgcgg accctaagaa gaagcgcaag gtctaacata tgagttatga gatccgaaag 4620
tgaaccttgt cctaacccga cagcgaatgg cgggaggggg cgggctaaaa gatcgtatta 4680
catagtattt ttcccctact ctttgtgttt gtcttttttt tttttttgaa cgcattcaag 4740
ccacttgtct gggtttactt gtttgtttgc ttgcttgctt gcttgcttgc ctgcttcttg 4800
gtcagacggc ccaaaaaagg gaaaaaattc attcatggca cagataagaa aaagaaaaag 4860
tttgtcgacc accgtcatca gaaagcaaga gaagagaaac actcgcgctc acattctcgc 4920
tcgcgtaaga atcttagcca cgcatacgaa gtaatttgtc catctggcga atctttacat 4980
gagcgttttc aagctggagc gtgagatcat acctttcttg atcgtaatgt tccaaccttg 5040
cataggcctc gttgcgatcc gctagcaatg cgtcgtactc ccgttgcaac tgcgccatcg 5100
cctcattgtg acgtgagttc agattcttct cgagaccttc gagcgctgct aatttcgcct 5160
gacgctcctt cttttgtgct tccatgacac gccgcttcac cgtgcgttcc acttcttcct 5220
cagacatgcc cttggctgcc tcgacctgct cggtaaaacg ggccccagca cgtgctacga 5280
gatttcgatt ccaccgccgc cttctatgaa aggttgggct tcggaatcgt tttccgggac 5340
gccggctgga tgatcctcca gcgcggggat ctcatgctgg agttcttcgc ccaccccaac 5400
ttgtttattg cagcttataa tggttacaaa taaagcaata gcatcacaaa tttcacaaat 5460
aaagcatttt tttcactgca ttctagttgt ggtttgtcca aactcatcaa tgtatcttat 5520
catacatggt cgacctgcag ggtacctctt atctgcctcg cgccgttgac cgccgcttga 5580
ctcttggcgc ttgccgctcg catcctgcct cgctcgcgca ggcgggcggg cgagtgggtg 5640
ggtccgcagc cttccgcgct cgcccgctag ctcgctcgcg ccgtgctgca gccagcaggg 5700
cagcaccgca cggcaggcag gtcccggcgc ggatcgatcg atccatcgat ccatcgatcc 5760
atcgatcgtg cggtcaaaaa gaaaggaaga agaaaggaaa aagaaaggcg tgcgcacccg 5820
agtgcgcgct gagcgcccgc tcgcggtccc gcggagcctc cgcgttagtc cccgccccgc 5880
gccgcgcagt cccccgggag gcatcgcgca cctctcgccg ccccctcgcg cctcgccgat 5940
tccccgcctc cccttttccg cttcttcgcc gcctccgctc gcggccgcgt cgcccgcgcc 6000
ccgctcccta tctgctcccc aggggggcac tccgcacctt ttgcgcccgc tgccgccgcc 6060
gcggccgccc cgccgccctg gtttcccccg cgagcgcggc cgcgtcgccg cgcaaagact 6120
cgccgcgtgc cgccccgagc aacgggtggc ggcggcgcgg cggcgggcgg ggcgcggcgg 6180
cgcgtaggcg gggctaggcg ccggctaggc gaaacgccgc ccccgggcgc cgccgccgcc 6240
cgctccagag cagtcgccgc gccagaccgc caacgcagag accgagaccg aggtacgtcg 6300
cgcccgagca cgccgcgacg cgcggcaggg acgaggagca cgacgccgcg ccgcgccgcg 6360
cggggggggg gagggagagg caggacgcgg gagcgagcgt gcatgtttcc gcgcgagacg 6420
acgccgcgcg cgctggagag gagataaggc gcttggatcg cgagagggcc agccaggctg 6480
gaggcgaaaa tgggtggaga ggatagtatc ttgcgtgctt ggacgaggag actgacgagg 6540
aggacggata cgtcgatgat gatgtgcaca gagaagaagc agttcgaaag cgactactag 6600
caagcaagag atcttccgca ctgatgagtc cgtgaggacg aaacgagtaa gctcgtctgc 6660
ggacgtcgtg gacgcgcgtt ttagagctag aaatagcaag ttaaaataag gctagtccgt 6720
tatcaacttg aaaaagtggc accgagtcgg tgcttttggc cggcatggtc ccagcctcct 6780
cgctggcgcc ggctgggcaa catgcttcgg catggcgaat gggaccatat gagttatgag 6840
atccgaaagt gaaccttgtc ctaacccgac agcgaatggc gggagggggc gggctaaaag 6900
atcgtattac atagtatttt tcccctactc tttgtgtttg tctttttttt ttttttgaac 6960
gcattcaagc cacttgtctg ggtttacttg tttgtttgct tgcttgcttg cttgcttgcc 7020
tgcttcttgg tcagacggcc caaaaaaggg aaaaaattca ttcatggcac agataagaaa 7080
aagaaaaagt ttgtcgacca ccgtcatcag aaagcaagag aagagaaaca ctcgcgctca 7140
cattctcgct cgcgtaagaa tcttagccac gcatacgaag taatttgtcc atctggcgaa 7200
tctttacatg agcgttttca agctggagcg tgagatcata cctttcttga tcgtaatgtt 7260
ccaaccttgc ataggcctcg ttgcgatccg ctagcaatgc gtcgtactcc cgttgcaact 7320
gcgccatcgc ctcattgtga cgtgagttca gattcttctc gagctgcagg aacctgcatt 7380
aatgaatcgg ccaacgcgcg gggagaggcg gtttgcgtat tgggcgctct tccgcttcct 7440
cgctcactga ctcgctgcgc tcggtcgttc ggctgcggcg agcggtatca gctcactcaa 7500
aggcggtaat acggttatcc acagaatcag gggataacgc aggaaagaac atgtgagcaa 7560
aaggccagca aaaggccagg aaccgtaaaa aggccgcgtt gctggcgttt ttccataggc 7620
tccgcccccc tgacgagcat cacaaaaatc gacgctcaag tcagaggtgg cgaaacccga 7680
caggactata aagataccag gcgtttcccc ctggaagctc cctcgtgcgc tctcctgttc 7740
cgaccctgcc gcttaccgga tacctgtccg cctttctccc ttcgggaagc gtggcgcttt 7800
ctcatagctc acgctgtagg tatctcagtt cggtgtaggt cgttcgctcc aagctgggct 7860
gtgtgcacga accccccgtt cagcccgacc gctgcgcctt atccggtaac tatcgtcttg 7920
agtccaaccc ggtaagacac gacttatcgc cactggcagc agccactggt aacaggatta 7980
gcagagcgag gtatgtaggc ggtgctacag agttcttgaa gtggtggcct aactacggct 8040
acactagaag aacagtattt ggtatctgcg ctctgctgaa gccagttacc ttcggaaaaa 8100
gagttggtag ctcttgatcc ggcaaacaaa ccaccgctgg tagcggtggt ttttttgttt 8160
gcaagcagca gattacgcgc agaaaaaaag gatctcaaga agatcctttg atcttttcta 8220
cggggtctga cgctcagtgg aacgaaaact cacgttaagg gattttggtc atgagattat 8280
caaaaaggat cttcacctag atccttttaa attaaaaatg aagttttaaa tcaatctaaa 8340
gtatatatga gtaaacttgg tctgacagtt accaatgctt aatcagtgag gcacctatct 8400
cagcgatctg tctatttcgt tcatccatag ttgcctgact ccccgtcgtg tagataacta 8460
cgatacggga gggcttacca tctggcccca gtgctgcaat gataccgcga gacccacgct 8520
caccggctcc agatttatca gcaataaacc agccagccgg aagggccgag cgcagaagtg 8580
gtcctgcaac tttatccgcc tccatccagt ctattaattg ttgccgggaa gctagagtaa 8640
gtagttcgcc agttaatagt ttgcgcaacg ttgttgccat tgctacaggc atcgtggtgt 8700
cacgctcgtc gtttggtatg gcttcattca gctccggttc ccaacgatca aggcgagtta 8760
catgatcccc catgttgtgc aaaaaagcgg ttagctcctt cggtcctccg atcgttgtca 8820
gaagtaagtt ggccgcagtg ttatcactca tggttatggc agcactgcat aattctctta 8880
ctgtcatgcc atccgtaaga tgcttttctg tgactggtga gtactcaacc aagtcattct 8940
gagaatagtg tatgcggcga ccgagttgct cttgcccggc gtcaatacgg gataataccg 9000
cgccacatag cagaacttta aaagtgctca tcattggaaa acgttcttcg gggcgaaaac 9060
tctcaaggat cttaccgctg ttgagatcca gttcgatgta acccactcgt gcacccaact 9120
gatcttcagc atcttttact ttcaccagcg tttctgggtg agcaaaaaca ggaaggcaaa 9180
atgccgcaaa aaagggaata agggcgacac ggaaatgttg aatactcata ctcttccttt 9240
ttcaatatta ttgaagcatt tatcagggtt attgtctcat gagcggatac atatttgaat 9300
gtatttagaa aaataaacaa ataggggttc cgcgcacatt tccccgaaaa gtgccacctg 9360
acgtctaaga aaccattatt atcatgacat taacctataa aaataggcgt atcacgaggc 9420
cctttcgtct cgcgcgtttc ggtgatgacg gtgaaaacct ctgacacatg cagctcccgg 9480
agacggtcac agcttgtctg taagcggatg ccgggagcag acaagcccgt cagggcgcgt 9540
cagcgggtgt tggcgggtgt cggggctggc ttaactatgc ggcatcagag cagattgtac 9600
tgagagtgca ccaagcttcc aattttaggc cccccactga ccgaggtctg tcgataatcc 9660
acttttccat tgattttcca ggtttcgtta actcatgcca ctgagcaaaa cttcggtctt 9720
tcctaacaaa agctctcctc acaaagcatg gcgcggcaac ggacgtgtcc tcatactcca 9780
ctgccacaca aggtcgataa actaagctcc tcacaaatag aggagaattc cactgacaac 9840
tgaaaacaat gtatgagaga cgatcaccac tggagcggcg cggcggttgg gcgcggaggt 9900
cggcagcaaa aacaagcgac tcgccgagca aacccgaatc agccttcaga cggtcgtgcc 9960
taacaacacg ccgttctacc ccgccttctt cgcgcccctt cgcgtccaag catccttcaa 10020
gtttatctct ctagttcaac ttcaagaaga acaacaccac caacaccatg gccaagttga 10080
ccagtgccgt tccggtgctc accgcgcgcg acgtcgccgg agcggtcgag ttctggaccg 10140
accggctcgg gttctcccgg gacttcgtgg aggacgactt cgccggtgtg gtccgggacg 10200
acgtgaccct gttcatcagc gcggtccagg accaggtggt gccggacaac accctggcct 10260
gggtgtgggt gcgcggcctg gacgagctgt acgccgagtg gtcggaggtc gtgtccacga 10320
acttccggga cgcctccggg ccggccatga ccgagatcgg cgagcagccg tgggggcggg 10380
agttcgccct gcgcgacccg gccggcaact gcgtgcactt cgtggccgag gagcaggact 10440
gacacgtgct acgagatttc gattccaccg ccgccttcta tgaaaggttg ggcttcggaa 10500
tcgttttccg ggacgccggc tggatgatcc tccagcgcgg ggatctcatg ctggagttct 10560
tcgcccaccc caacttgttt attgcagctt ataatggtta caaataaagc aatagcatca 10620
caaatttcac aaataaagca tttttttcac tgcattctag ttgtggtttg tccaaactca 10680
tcaatgtatc ttatcggtac 10700
<210> 36
<211> 6300
<212> DNA
<213> 人工序列
<220>
<223> pCL310载体 (6300 bp)
<220>
<221> misc_特征
<222> (1)..(1064)
<223> EF_1α_启动子
<220>
<221> misc_特征
<222> (1070)..(1981)
<223> CarG_基因
<220>
<221> misc_特征
<222> (2001)..(2640)
<223> OrfC_终止子
<220>
<221> misc_特征
<222> (5175)..(5623)
<223> α_微管蛋白_启动子
<220>
<221> misc_特征
<222> (5627)..(6019)
<223> Bsd_基因
<220>
<221> misc_特征
<222> (6020)..(6300)
<223> SV40_终止子
<400> 36
ctcttatctg cctcgcgccg ttgaccgccg cttgactctt ggcgcttgcc gctcgcatcc 60
tgcctcgctc gcgcaggcgg gcgggcgagt gggtgggtcc gcagccttcc gcgctcgccc 120
gctagctcgc tcgcgccgtg ctgcagccag cagggcagca ccgcacggca ggcaggtccc 180
ggcgcggatc gatcgatcca tcgatccatc gatccatcga tcgtgcggtc aaaaagaaag 240
gaagaagaaa ggaaaaagaa aggcgtgcgc acccgagtgc gcgctgagcg cccgctcgcg 300
gtcccgcgga gcctccgcgt tagtccccgc cccgcgccgc gcagtccccc gggaggcatc 360
gcgcacctct cgccgccccc tcgcgcctcg ccgattcccc gcctcccctt ttccgcttct 420
tcgccgcctc cgctcgcggc cgcgtcgccc gcgccccgct ccctatctgc tccccagggg 480
ggcactccgc accttttgcg cccgctgccg ccgccgcggc cgccccgccg ccctggtttc 540
ccccgcgagc gcggccgcgt cgccgcgcaa agactcgccg cgtgccgccc cgagcaacgg 600
gtggcggcgg cgcggcggcg ggcggggcgc ggcggcgcgt aggcggggct aggcgccggc 660
taggcgaaac gccgcccccg ggcgccgccg ccgcccgctc cagagcagtc gccgcgccag 720
accgccaacg cagagaccga gaccgaggta cgtcgcgccc gagcacgccg cgacgcgcgg 780
cagggacgag gagcacgacg ccgcgccgcg ccgcgcgggg ggggggaggg agaggcagga 840
cgcgggagcg agcgtgcatg tttccgcgcg agacgacgcc gcgcgcgctg gagaggagat 900
aaggcgcttg gatcgcgaga gggccagcca ggctggaggc gaaaatgggt ggagaggata 960
gtatcttgcg tgcttggacg aggagactga cgaggaggac ggatacgtcg atgatgatgt 1020
gcacagagaa gaagcagttc gaaagcgact actagcaagc aagggatcca tgctcaactc 1080
gcacaaccgc actgaggagc gctccactga ggacatcatc cttgagccct acacctacct 1140
catttcccag cccggcaagg acatccgcgc taagcttatt tccgctttcg acctctggct 1200
ccatgtcccc aaggacgtcc tctgcgtcat caacaagatt attggcatgc ttcacaacgc 1260
ctccctcatg atcgacgatg tccaggatga ctccgacctt cgccgtggcg tccccgtcgc 1320
ccaccatatc tacggcgtcc cccagacgat caacaccgct aactacgtca tttttctcgc 1380
tctccaggag gtcatgaagc tcaacatccc ctccatgatg caggtctgca ctgaggagct 1440
catcaacctt caccgcggcc agggtatcga gctctactgg cgcgattcgc ttacttgccc 1500
cactgaggag gagtacattg acatggtcaa caacaagacg tccggccttc tccgtcttgc 1560
cgtccgtctc atgcaggccg cctcggagtc cgacatcgac tacacccctc tcgtcaacat 1620
catcggtatt cactttcagg tccgcgacga ttacatgaac ctccagtcca ctagctacac 1680
gaacaacaag ggtttctgcg aggacctcac ggagggcaag ttttcgttcc ccatcatcca 1740
cgccattcgc aaggacccca gcaaccgcca gctccttaac attatctccc agaagcctac 1800
gtccattgag gttaagaagt acgcccttga ggttattcgc aaggccggca gctttgagta 1860
cgttcgcgag ttcctgcgcc agaaggaggc cgagtccctt aaggagatca agcgccttgg 1920
aggcaaccct ctcctcgaga agtacattga gaccatccgc gtcgaggcca cgaacgacta 1980
acatatgagt tatgagatcc gaaagtgaac cttgtcctaa cccgacagcg aatggcggga 2040
gggggcgggc taaaagatcg tattacatag tatttttccc ctactctttg tgtttgtctt 2100
tttttttttt ttgaacgcat tcaagccact tgtctgggtt tacttgtttg tttgcttgct 2160
tgcttgcttg cttgcctgct tcttggtcag acggcccaaa aaagggaaaa aattcattca 2220
tggcacagat aagaaaaaga aaaagtttgt cgaccaccgt catcagaaag caagagaaga 2280
gaaacactcg cgctcacatt ctcgctcgcg taagaatctt agccacgcat acgaagtaat 2340
ttgtccatct ggcgaatctt tacatgagcg ttttcaagct ggagcgtgag atcatacctt 2400
tcttgatcgt aatgttccaa ccttgcatag gcctcgttgc gatccgctag caatgcgtcg 2460
tactcccgtt gcaactgcgc catcgcctca ttgtgacgtg agttcagatt cttctcgaga 2520
ccttcgagcg ctgctaattt cgcctgacgc tccttctttt gtgcttccat gacacgccgc 2580
ttcaccgtgc gttccacttc ttcctcagac atgcccttgg ctgcctcgac ctgctcggta 2640
aaacgggccc cagcacgtgc tacgagattt cgattccacc gccgccttct atgaaaggtt 2700
gggcttcgga atcgttttcc gggacgccgg ctggatgatc ctccagcgcg gggatctcat 2760
gctggagttc ttcgcccacc ccaacttgtt tattgcagct tataatggtt acaaataaag 2820
caatagcatc acaaatttca caaataaagc atttttttca ctgcattcta gttgtggttt 2880
gtccaaactc atcaatgtat cttatcatac atggtcgacc tgcaggaacc tgcattaatg 2940
aatcggccaa cgcgcgggga gaggcggttt gcgtattggg cgctcttccg cttcctcgct 3000
cactgactcg ctgcgctcgg tcgttcggct gcggcgagcg gtatcagctc actcaaaggc 3060
ggtaatacgg ttatccacag aatcagggga taacgcagga aagaacatgt gagcaaaagg 3120
ccagcaaaag gccaggaacc gtaaaaaggc cgcgttgctg gcgtttttcc ataggctccg 3180
cccccctgac gagcatcaca aaaatcgacg ctcaagtcag aggtggcgaa acccgacagg 3240
actataaaga taccaggcgt ttccccctgg aagctccctc gtgcgctctc ctgttccgac 3300
cctgccgctt accggatacc tgtccgcctt tctcccttcg ggaagcgtgg cgctttctca 3360
tagctcacgc tgtaggtatc tcagttcggt gtaggtcgtt cgctccaagc tgggctgtgt 3420
gcacgaaccc cccgttcagc ccgaccgctg cgccttatcc ggtaactatc gtcttgagtc 3480
caacccggta agacacgact tatcgccact ggcagcagcc actggtaaca ggattagcag 3540
agcgaggtat gtaggcggtg ctacagagtt cttgaagtgg tggcctaact acggctacac 3600
tagaagaaca gtatttggta tctgcgctct gctgaagcca gttaccttcg gaaaaagagt 3660
tggtagctct tgatccggca aacaaaccac cgctggtagc ggtggttttt ttgtttgcaa 3720
gcagcagatt acgcgcagaa aaaaaggatc tcaagaagat cctttgatct tttctacggg 3780
gtctgacgct cagtggaacg aaaactcacg ttaagggatt ttggtcatga gattatcaaa 3840
aaggatcttc acctagatcc ttttaaatta aaaatgaagt tttaaatcaa tctaaagtat 3900
atatgagtaa acttggtctg acagttacca atgcttaatc agtgaggcac ctatctcagc 3960
gatctgtcta tttcgttcat ccatagttgc ctgactcccc gtcgtgtaga taactacgat 4020
acgggagggc ttaccatctg gccccagtgc tgcaatgata ccgcgagacc cacgctcacc 4080
ggctccagat ttatcagcaa taaaccagcc agccggaagg gccgagcgca gaagtggtcc 4140
tgcaacttta tccgcctcca tccagtctat taattgttgc cgggaagcta gagtaagtag 4200
ttcgccagtt aatagtttgc gcaacgttgt tgccattgct acaggcatcg tggtgtcacg 4260
ctcgtcgttt ggtatggctt cattcagctc cggttcccaa cgatcaaggc gagttacatg 4320
atcccccatg ttgtgcaaaa aagcggttag ctccttcggt cctccgatcg ttgtcagaag 4380
taagttggcc gcagtgttat cactcatggt tatggcagca ctgcataatt ctcttactgt 4440
catgccatcc gtaagatgct tttctgtgac tggtgagtac tcaaccaagt cattctgaga 4500
atagtgtatg cggcgaccga gttgctcttg cccggcgtca atacgggata ataccgcgcc 4560
acatagcaga actttaaaag tgctcatcat tggaaaacgt tcttcggggc gaaaactctc 4620
aaggatctta ccgctgttga gatccagttc gatgtaaccc actcgtgcac ccaactgatc 4680
ttcagcatct tttactttca ccagcgtttc tgggtgagca aaaacaggaa ggcaaaatgc 4740
cgcaaaaaag ggaataaggg cgacacggaa atgttgaata ctcatactct tcctttttca 4800
atattattga agcatttatc agggttattg tctcatgagc ggatacatat ttgaatgtat 4860
ttagaaaaat aaacaaatag gggttccgcg cacatttccc cgaaaagtgc cacctgacgt 4920
ctaagaaacc attattatca tgacattaac ctataaaaat aggcgtatca cgaggccctt 4980
tcgtctcgcg cgtttcggtg atgacggtga aaacctctga cacatgcagc tcccggagac 5040
ggtcacagct tgtctgtaag cggatgccgg gagcagacaa gcccgtcagg gcgcgtcagc 5100
gggtgttggc gggtgtcggg gctggcttaa ctatgcggca tcagagcaga ttgtactgag 5160
agtgcaccaa gcttccaatt ttaggccccc cactgaccga ggtctgtcga taatccactt 5220
ttccattgat tttccaggtt tcgttaactc atgccactga gcaaaacttc ggtctttcct 5280
aacaaaagct ctcctcacaa agcatggcgc ggcaacggac gtgtcctcat actccactgc 5340
cacacaaggt cgataaacta agctcctcac aaatagagga gaattccact gacaactgaa 5400
aacaatgtat gagagacgat caccactgga gcggcgcggc ggttgggcgc ggaggtcggc 5460
agcaaaaaca agcgactcgc cgagcaaacc cgaatcagcc ttcagacggt cgtgcctaac 5520
aacacgccgt tctaccccgc cttcttcgcg ccccttcgcg tccaagcatc cttcaagttt 5580
atctctctag ttcaacttca agaagaacaa caccaccaac accatgatgc ctttgtctca 5640
agaagaatcc accctcattg aaagagcaac ggctacaatc aacagcatcc ccatctctga 5700
agactacagc gtcgccagcg cagctctctc tagcgacggc cgcatcttca ctggtgtcaa 5760
tgtatatcat tttactgggg gaccttgtgc agaactcgtg gtgctgggca ctgctgctgc 5820
tgcggcagct ggcaacctga cttgtatcgt cgcgatcgga aatgagaaca ggggcatctt 5880
gagcccctgt ggacggtgcc gacaggtgct tctcgatctg catcctggga tcaaagccat 5940
agtgaaggac agtgatggac agccgacggc agttgggatt cgtgaattgc tgccctctgg 6000
ttatgtgtgg gagggctaac acgtgctccg tgctacgaga tttcgattcc accgccgcct 6060
tctatgaaag gttgggcttc ggaatcgttt tccgggacgc cggctggatg atcctccagc 6120
gcggggatct catgctggag ttcttcgccc accccaactt gtttattgca gcttataatg 6180
gttacaaata aagcaatagc atcacaaatt tcacaaataa agcatttttt tcactgcatt 6240
ctagttgtgg tttgtccaaa ctcatcaatg tatcttatca tgtctgaatt cccggggtac 6300
<210> 37
<211> 6611
<212> DNA
<213> 人工序列
<220>
<223> pCL122载体 (6611 bp)
<220>
<221> misc_特征
<222> (1)..(1064)
<223> EF_1α_启动子
<220>
<221> misc_特征
<222> (1070)..(1162)
<223> Sec1_分泌_信号
<220>
<221> misc_特征
<222> (1163)..(1900)
<223> eGFP_基因
<220>
<221> misc_特征
<222> (1920)..(2559)
<223> OrfC_终止子
<220>
<221> misc_特征
<222> (5094)..(5542)
<223> α_微管蛋白_启动子
<220>
<221> misc_特征
<222> (5543)..(6337)
<223> NPT_基因
<220>
<221> misc_特征
<222> (6338)..(6611)
<223> SV40_终止子
<400> 37
ctcttatctg cctcgcgccg ttgaccgccg cttgactctt ggcgcttgcc gctcgcatcc 60
tgcctcgctc gcgcaggcgg gcgggcgagt gggtgggtcc gcagccttcc gcgctcgccc 120
gctagctcgc tcgcgccgtg ctgcagccag cagggcagca ccgcacggca ggcaggtccc 180
ggcgcggatc gatcgatcca tcgatccatc gatccatcga tcgtgcggtc aaaaagaaag 240
gaagaagaaa ggaaaaagaa aggcgtgcgc acccgagtgc gcgctgagcg cccgctcgcg 300
gtcccgcgga gcctccgcgt tagtccccgc cccgcgccgc gcagtccccc gggaggcatc 360
gcgcacctct cgccgccccc tcgcgcctcg ccgattcccc gcctcccctt ttccgcttct 420
tcgccgcctc cgctcgcggc cgcgtcgccc gcgccccgct ccctatctgc tccccagggg 480
ggcactccgc accttttgcg cccgctgccg ccgccgcggc cgccccgccg ccctggtttc 540
ccccgcgagc gcggccgcgt cgccgcgcaa agactcgccg cgtgccgccc cgagcaacgg 600
gtggcggcgg cgcggcggcg ggcggggcgc ggcggcgcgt aggcggggct aggcgccggc 660
taggcgaaac gccgcccccg ggcgccgccg ccgcccgctc cagagcagtc gccgcgccag 720
accgccaacg cagagaccga gaccgaggta cgtcgcgccc gagcacgccg cgacgcgcgg 780
cagggacgag gagcacgacg ccgcgccgcg ccgcgcgggg ggggggaggg agaggcagga 840
cgcgggagcg agcgtgcatg tttccgcgcg agacgacgcc gcgcgcgctg gagaggagat 900
aaggcgcttg gatcgcgaga gggccagcca ggctggaggc gaaaatgggt ggagaggata 960
gtatcttgcg tgcttggacg aggagactga cgaggaggac ggatacgtcg atgatgatgt 1020
gcacagagaa gaagcagttc gaaagcgact actagcaagc aagggatcca tgaagttcgc 1080
gacctcggtc gcaattttgc ttgtggccaa catagccacc gccctcgcgc agagcgatgg 1140
ctgcaccccc accgaccaga cgatggtgag caagggcgag gagctgttca ccggggtggt 1200
gcccatcctg gtcgagctgg acggcgacgt aaacggccac aagttcagcg tgtccggcga 1260
gggcgagggc gatgccacct acggcaagct gaccctgaag ttcatctgca ccaccggcaa 1320
gctgcccgtg ccctggccca ccctcgtgac caccctgacc tacggcgtgc agtgcttcag 1380
ccgctacccc gaccacatga agcagcacga cttcttcaag tccgccatgc ccgaaggcta 1440
cgtccaggag cgcaccatct tcttcaagga cgacggcaac tacaagaccc gcgccgaggt 1500
gaagttcgag ggcgacaccc tggtgaaccg catcgagctg aagggcatcg acttcaagga 1560
ggacggcaac atcctgggac acaagctgga gtacaactac aacagccaca acgtctatat 1620
catggccgac aagcagaaga acggcatcaa ggtgaacttc aagatccgcc acaacatcga 1680
ggacggcagc gtgcagctcg ccgaccacta ccagcagaac acccccatcg gcgacggccc 1740
cgtgctgctg cccgacaacc actacctgag cacccagtcc gccctgagca aagaccccaa 1800
cgagaagcgc gatcacatgg tcctgctgga gttcgtgacc gccgccggga tcactctcgg 1860
catggacgag ctgtacaagc accaccatca ccaccactaa catatgagtt atgagatccg 1920
aaagtgaacc ttgtcctaac ccgacagcga atggcgggag ggggcgggct aaaagatcgt 1980
attacatagt atttttcccc tactctttgt gtttgtcttt tttttttttt tgaacgcatt 2040
caagccactt gtctgggttt acttgtttgt ttgcttgctt gcttgcttgc ttgcctgctt 2100
cttggtcaga cggcccaaaa aagggaaaaa attcattcat ggcacagata agaaaaagaa 2160
aaagtttgtc gaccaccgtc atcagaaagc aagagaagag aaacactcgc gctcacattc 2220
tcgctcgcgt aagaatctta gccacgcata cgaagtaatt tgtccatctg gcgaatcttt 2280
acatgagcgt tttcaagctg gagcgtgaga tcataccttt cttgatcgta atgttccaac 2340
cttgcatagg cctcgttgcg atccgctagc aatgcgtcgt actcccgttg caactgcgcc 2400
atcgcctcat tgtgacgtga gttcagattc ttctcgagac cttcgagcgc tgctaatttc 2460
gcctgacgct ccttcttttg tgcttccatg acacgccgct tcaccgtgcg ttccacttct 2520
tcctcagaca tgcccttggc tgcctcgacc tgctcggtaa aacgggcccc agcacgtgct 2580
acgagatttc gattccaccg ccgccttcta tgaaaggttg ggcttcggaa tcgttttccg 2640
ggacgccggc tggatgatcc tccagcgcgg ggatctcatg ctggagttct tcgcccaccc 2700
caacttgttt attgcagctt ataatggtta caaataaagc aatagcatca caaatttcac 2760
aaataaagca tttttttcac tgcattctag ttgtggtttg tccaaactca tcaatgtatc 2820
ttatcataca tggtcgacct gcaggaacct gcattaatga atcggccaac gcgcggggag 2880
aggcggtttg cgtattgggc gctcttccgc ttcctcgctc actgactcgc tgcgctcggt 2940
cgttcggctg cggcgagcgg tatcagctca ctcaaaggcg gtaatacggt tatccacaga 3000
atcaggggat aacgcaggaa agaacatgtg agcaaaaggc cagcaaaagg ccaggaaccg 3060
taaaaaggcc gcgttgctgg cgtttttcca taggctccgc ccccctgacg agcatcacaa 3120
aaatcgacgc tcaagtcaga ggtggcgaaa cccgacagga ctataaagat accaggcgtt 3180
tccccctgga agctccctcg tgcgctctcc tgttccgacc ctgccgctta ccggatacct 3240
gtccgccttt ctcccttcgg gaagcgtggc gctttctcat agctcacgct gtaggtatct 3300
cagttcggtg taggtcgttc gctccaagct gggctgtgtg cacgaacccc ccgttcagcc 3360
cgaccgctgc gccttatccg gtaactatcg tcttgagtcc aacccggtaa gacacgactt 3420
atcgccactg gcagcagcca ctggtaacag gattagcaga gcgaggtatg taggcggtgc 3480
tacagagttc ttgaagtggt ggcctaacta cggctacact agaagaacag tatttggtat 3540
ctgcgctctg ctgaagccag ttaccttcgg aaaaagagtt ggtagctctt gatccggcaa 3600
acaaaccacc gctggtagcg gtggtttttt tgtttgcaag cagcagatta cgcgcagaaa 3660
aaaaggatct caagaagatc ctttgatctt ttctacgggg tctgacgctc agtggaacga 3720
aaactcacgt taagggattt tggtcatgag attatcaaaa aggatcttca cctagatcct 3780
tttaaattaa aaatgaagtt ttaaatcaat ctaaagtata tatgagtaaa cttggtctga 3840
cagttaccaa tgcttaatca gtgaggcacc tatctcagcg atctgtctat ttcgttcatc 3900
catagttgcc tgactccccg tcgtgtagat aactacgata cgggagggct taccatctgg 3960
ccccagtgct gcaatgatac cgcgagaccc acgctcaccg gctccagatt tatcagcaat 4020
aaaccagcca gccggaaggg ccgagcgcag aagtggtcct gcaactttat ccgcctccat 4080
ccagtctatt aattgttgcc gggaagctag agtaagtagt tcgccagtta atagtttgcg 4140
caacgttgtt gccattgcta caggcatcgt ggtgtcacgc tcgtcgtttg gtatggcttc 4200
attcagctcc ggttcccaac gatcaaggcg agttacatga tcccccatgt tgtgcaaaaa 4260
agcggttagc tccttcggtc ctccgatcgt tgtcagaagt aagttggccg cagtgttatc 4320
actcatggtt atggcagcac tgcataattc tcttactgtc atgccatccg taagatgctt 4380
ttctgtgact ggtgagtact caaccaagtc attctgagaa tagtgtatgc ggcgaccgag 4440
ttgctcttgc ccggcgtcaa tacgggataa taccgcgcca catagcagaa ctttaaaagt 4500
gctcatcatt ggaaaacgtt cttcggggcg aaaactctca aggatcttac cgctgttgag 4560
atccagttcg atgtaaccca ctcgtgcacc caactgatct tcagcatctt ttactttcac 4620
cagcgtttct gggtgagcaa aaacaggaag gcaaaatgcc gcaaaaaagg gaataagggc 4680
gacacggaaa tgttgaatac tcatactctt cctttttcaa tattattgaa gcatttatca 4740
gggttattgt ctcatgagcg gatacatatt tgaatgtatt tagaaaaata aacaaatagg 4800
ggttccgcgc acatttcccc gaaaagtgcc acctgacgtc taagaaacca ttattatcat 4860
gacattaacc tataaaaata ggcgtatcac gaggcccttt cgtctcgcgc gtttcggtga 4920
tgacggtgaa aacctctgac acatgcagct cccggagacg gtcacagctt gtctgtaagc 4980
ggatgccggg agcagacaag cccgtcaggg cgcgtcagcg ggtgttggcg ggtgtcgggg 5040
ctggcttaac tatgcggcat cagagcagat tgtactgaga gtgcaccaag cttccaattt 5100
taggcccccc actgaccgag gtctgtcgat aatccacttt tccattgatt ttccaggttt 5160
cgttaactca tgccactgag caaaacttcg gtctttccta acaaaagctc tcctcacaaa 5220
gcatggcgcg gcaacggacg tgtcctcata ctccactgcc acacaaggtc gataaactaa 5280
gctcctcaca aatagaggag aattccactg acaactgaaa acaatgtatg agagacgatc 5340
accactggag cggcgcggcg gttgggcgcg gaggtcggca gcaaaaacaa gcgactcgcc 5400
gagcaaaccc gaatcagcct tcagacggtc gtgcctaaca acacgccgtt ctaccccgcc 5460
ttcttcgcgc cccttcgcgt ccaagcatcc ttcaagttta tctctctagt tcaacttcaa 5520
gaagaacaac accaccaaca ccatgattga acaagatgga ttgcacgcag gttctccggc 5580
cgcttgggtg gagaggctat tcggctatga ctgggcacaa cagacaatcg gctgctctga 5640
tgccgccgtg ttccggctgt cagcgcaggg gcgcccggtt ctttttgtca agaccgacct 5700
gtccggtgcc ctgaatgaac tgcaggacga ggcagcgcgg ctatcgtggc tggccacgac 5760
gggcgttcct tgcgcagctg tgctcgacgt tgtcactgaa gcgggaaggg actggctgct 5820
attgggcgaa gtgccggggc aggatctcct gtcatctcac cttgctcctg ccgagaaagt 5880
atccatcatg gctgatgcaa tgcggcggct gcatacgctt gatccggcta cctgcccatt 5940
cgaccaccaa gcgaaacatc gcatcgagcg agcacgtact cggatggaag ccggtcttgt 6000
cgatcaggat gatctggacg aagagcatca ggggctcgcg ccagccgaac tgttcgccag 6060
gctcaaggcg cgcatgcccg acggcgatga tctcgtcgtg acccatggcg atgcctgctt 6120
gccgaatatc atggtggaaa atggccgctt ttctggattc atcgactgtg gccggctggg 6180
tgtggcggac cgctatcagg acatagcgtt ggctacccgt gatattgctg aagagcttgg 6240
cggcgaatgg gctgaccgct tcctcgtgct ttacggtatc gccgctcccg attcgcagcg 6300
catcgccttc tatcgccttc ttgacgagtt cttctgacac gtgctacgag atttcgattc 6360
caccgccgcc ttctatgaaa ggttgggctt cggaatcgtt ttccgggacg ccggctggat 6420
gatcctccag cgcggggatc tcatgctgga gttcttcgcc caccccaact tgtttattgc 6480
agcttataat ggttacaaat aaagcaatag catcacaaat ttcacaaata aagcattttt 6540
ttcactgcat tctagttgtg gtttgtccaa actcatcaat gtatcttatc atgtctgaat 6600
tcccggggta c 6611
<210> 38
<211> 32
<212> DNA
<213> 人工序列
<220>
<223> pYB66 Bambgl F引物
<400> 38
caagggatcc agatcttccg cactgatgag tc 32
<210> 39
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> pYB66 Nde R引物
<400> 39
aactcatatg gtcccattcg cca 23
<210> 40
<211> 25
<212> DNA
<213> 人工序列
<220>
<223> pYB66 EF1seq F引物
<400> 40
gagaggatag tatcttgcgt gcttg 25
<210> 41
<211> 25
<212> DNA
<213> 人工序列
<220>
<223> pCL122 OrfC R引物
<400> 41
gcaaggttgg aacattacga tcaag 25
<210> 42
<211> 41
<212> DNA
<213> 人工序列
<220>
<223> pYB73 gRNA Pst Kpn IF F引物
<400> 42
catacatggt cgacctgcag ggtacctctt atctgcctcg c 41
<210> 43
<211> 45
<212> DNA
<213> 人工序列
<220>
<223> pYB73 gRNA Xho Pst IF R引物
<400> 43
attaatgcag gttcctgcag ctcgagaaga atctgaactc acgtc 45
<210> 44
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> pYB73 seq F引物
<400> 44
caccccaact tgtttattgc ag 22
<210> 45
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> pYB73 seq R引物
<400> 45
gagcgaggaa gcggaagag 19
<210> 46
<211> 26
<212> DNA
<213> 人工序列
<220>
<223> pYB13 pYB1 seq F引物
<400> 46
gagaggatag tatcttgcgt gcttgg 26
<210> 47
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> TT pYB73 HDV R引物
<400> 47
gaagcatgtt gcccagcc 18
Claims (25)
1.一种非天然存在的或工程化的组合物,其包含CRISPR-Cas系统的来源,所述CRISPR-Cas系统包含引导多核苷酸和Cas蛋白,其中所述引导多核苷酸包含引导序列,所述引导序列基本上为宿主细胞中靶多核苷酸的反向互补物,且所述引导多核苷酸可指导Cas蛋白在所述宿主细胞中靶多核苷酸处的结合以形成CRISPR-Cas复合物,其中所述引导序列基本上是所述宿主细胞的基因组中的5′-(N)yPAM-3′多核苷酸序列靶物的(N)y部分的反向互补物,其中y是8-30的整数,其中PAM是前间区序列邻近基序,其中所述宿主细胞是网粘菌纲(Labyrinthulomycete),优选破囊壶菌目(Thraustochytriales)的成员,优选破囊壶菌科(Thraustochytriaceae)成员,更优选选自下组的菌属的成员:Aurantiochytrium、Oblongichytrium、裂殖壶菌属(Schizochytrium)、破囊壶菌属(Thraustochytrium)和吾肯氏壶菌属(Ulkenia),甚至更优选裂殖壶菌属菌种ATCC#20888,且其中PAM优选为选自下列的序列:5′-XGG-3′、5′-XGGXG-3′、5′-XXAGAAW-3′、5′-XXXXGATT-3′、5′-XXAGAA-3′、5′-XAAAAC-3′,其中X可为任何核苷酸或其类似物,优选地,X可为任何核苷酸;且W是A或T。
2.根据权利要求1的组合物,其中所述Cas蛋白由多核苷酸编码和/或所述引导多核苷酸由多核苷酸编码或存在于多核苷酸上。
3.根据权利要求1或2的组合物,其中所述Cas蛋白由多核苷酸编码和/或所述引导多核苷酸由另一个多核苷酸编码或存在于另一个多核苷酸上,且所述多核苷酸包含在载体中。
4.根据前述权利要求中任一项的组合物,其中所述引导多核苷酸由多核苷酸编码,所述多核苷酸被转录以提供实际的引导多核苷酸。
5.根据权利要求1-3中任一项的组合物,其中所述Cas蛋白由多核苷酸编码,且所述引导多核苷酸由另一个多核苷酸编码或存在于另一个多核苷酸上且所述多核苷酸包含在一个载体中。
6.根据权利要求1-3中任一项的组合物,其中所述Cas蛋白由包含在载体中的多核苷酸编码,且所述引导多核苷酸由包含在另一个载体中的另一个多核苷酸编码,或存在于包含在另一个载体中的另一个多核苷酸上,其中,优选地,编码所述Cas蛋白的载体由低强度启动子驱动,且编码所述引导多核苷酸的载体由高强度启动子驱动。
7.根据权利要求6的组合物,其中一个或多个或全部载体包含选择性标记,优选每个载体包含不同的选择性标记。
8.根据前述权利要求中任一项的组合物,其中一个或多个外源多核苷酸可操作地连接至所述引导多核苷酸。
9.根据前述权利要求中任一项的组合物,其中所述Cas蛋白包含至少一个核定位序列,优选异源核定位序列。
10.根据前述权利要求中任一项的组合物,其中所述Cas蛋白具有在所述靶序列的位点处直接剪切两个多核苷酸链的活性。
11.根据前述权利要求中任一项的组合物,其中所述Cas蛋白编码多核苷酸是针对所述宿主细胞密码子优化的,优选密码子对优化。
12.根据前述权利要求中任一项的组合物,其中所述引导多核苷酸由多核苷酸编码,所述多核苷酸可操作连接至RNA聚合酶II或III启动子,优选连接至网粘菌纲EF-1启动子。
13.根据权利要求1-12中任一项的组合物,其中可操作地连接至RNA聚合酶II启动子的多核苷酸编码包含所述引导多核苷酸和自处理核酶的前引导多核苷酸,其中,当转录时,所述引导多核苷酸通过自处理核酶从前引导多核苷酸转录物中释放。
14.一种调控细胞中多核苷酸表达的方法,其包括使宿主细胞与根据权利要求1-13中任一项的组合物接触,其中所述引导多核苷酸指导Cas蛋白在所述宿主细胞中的靶多核苷酸处的结合以形成CRISPR-Cas复合物。
15.根据权利要求14的方法,其中所述宿主细胞包含编码感兴趣的化合物的多核苷酸。
16.根据权利要求14或15的方法,其中所述宿主细胞是重组宿主细胞。
17.一种包含根据权利要求1-13中任一项的组合物的宿主细胞。
18.一种产生宿主细胞的方法,其包括使宿主细胞与根据权利要求1-13中任一项的组合物接触,其中所述引导多核苷酸指导Cas蛋白在所述宿主细胞中的靶多核苷酸处的结合以形成CRISPR-Cas复合物。
19.根据权利要求18的方法,其中所述宿主细胞首先与Cas蛋白的来源接触,且随后与引导多核苷酸的来源和任选的外源多核苷酸接触。
20.根据权利要求19的方法或根据权利要求17的宿主细胞,其中所述宿主细胞包含编码感兴趣的化合物的多核苷酸。
21.根据权利要求18-20中任一项的方法或根据权利要求17的宿主细胞,其中所述宿主细胞是重组宿主细胞。
22.一种用于产生感兴趣的化合物的方法,其包括在有益于产生所述感兴趣的化合物的条件下培养可通过权利要求18-20中任一项的方法获得的宿主细胞或根据权利要求17的宿主细胞或根据权利要求18-20中任一项的方法产生的宿主细胞,以及任选地纯化或分离所述感兴趣的化合物。
23.根据权利要求14-16和18-22中任一项的方法,其中所述Cas蛋白是Cas9蛋白。
24.根据权利要求18-20中任一项的方法,其中所述Cas蛋白的表达由中等强度的启动子驱动。
25.根据权利要求24的方法,其中所述中等强度的启动子是α微管蛋白启动子。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201662361741P | 2016-07-13 | 2016-07-13 | |
US62/361,741 | 2016-07-13 | ||
PCT/US2017/041949 WO2018013821A1 (en) | 2016-07-13 | 2017-07-13 | A crispr-cas system for an algal host cell |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109689856A true CN109689856A (zh) | 2019-04-26 |
Family
ID=60952752
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201780055558.1A Pending CN109689856A (zh) | 2016-07-13 | 2017-07-13 | 用于海藻宿主细胞的CRISPR-Cas系统 |
Country Status (7)
Country | Link |
---|---|
US (2) | US11466269B2 (zh) |
EP (1) | EP3484994A4 (zh) |
JP (2) | JP2019520069A (zh) |
KR (1) | KR102319845B1 (zh) |
CN (1) | CN109689856A (zh) |
BR (1) | BR112019000430A2 (zh) |
WO (1) | WO2018013821A1 (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110747223A (zh) * | 2019-11-29 | 2020-02-04 | 中国科学院海洋研究所 | 一种紫菜功能基因沉默的方法及其应用 |
Families Citing this family (25)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2013066438A2 (en) | 2011-07-22 | 2013-05-10 | President And Fellows Of Harvard College | Evaluation and improvement of nuclease cleavage specificity |
US9163284B2 (en) | 2013-08-09 | 2015-10-20 | President And Fellows Of Harvard College | Methods for identifying a target site of a Cas9 nuclease |
US9359599B2 (en) | 2013-08-22 | 2016-06-07 | President And Fellows Of Harvard College | Engineered transcription activator-like effector (TALE) domains and uses thereof |
US9526784B2 (en) | 2013-09-06 | 2016-12-27 | President And Fellows Of Harvard College | Delivery system for functional nucleases |
US9388430B2 (en) | 2013-09-06 | 2016-07-12 | President And Fellows Of Harvard College | Cas9-recombinase fusion proteins and uses thereof |
US9228207B2 (en) | 2013-09-06 | 2016-01-05 | President And Fellows Of Harvard College | Switchable gRNAs comprising aptamers |
US20150166985A1 (en) | 2013-12-12 | 2015-06-18 | President And Fellows Of Harvard College | Methods for correcting von willebrand factor point mutations |
CA2956224A1 (en) | 2014-07-30 | 2016-02-11 | President And Fellows Of Harvard College | Cas9 proteins including ligand-dependent inteins |
DK3242949T3 (da) * | 2015-01-06 | 2022-01-24 | Dsm Ip Assets Bv | Crispr-cas-system til en gærværtscelle |
JP7067793B2 (ja) | 2015-10-23 | 2022-05-16 | プレジデント アンド フェローズ オブ ハーバード カレッジ | 核酸塩基編集因子およびその使用 |
GB2568182A (en) | 2016-08-03 | 2019-05-08 | Harvard College | Adenosine nucleobase editors and uses thereof |
EP3497214B1 (en) | 2016-08-09 | 2023-06-28 | President and Fellows of Harvard College | Programmable cas9-recombinase fusion proteins and uses thereof |
WO2018039438A1 (en) | 2016-08-24 | 2018-03-01 | President And Fellows Of Harvard College | Incorporation of unnatural amino acids into proteins using base editing |
GB2573062A (en) | 2016-10-14 | 2019-10-23 | Harvard College | AAV delivery of nucleobase editors |
US10745677B2 (en) | 2016-12-23 | 2020-08-18 | President And Fellows Of Harvard College | Editing of CCR5 receptor gene to protect against HIV infection |
EP3592853A1 (en) | 2017-03-09 | 2020-01-15 | President and Fellows of Harvard College | Suppression of pain by gene editing |
US11542496B2 (en) | 2017-03-10 | 2023-01-03 | President And Fellows Of Harvard College | Cytosine to guanine base editor |
US11268082B2 (en) | 2017-03-23 | 2022-03-08 | President And Fellows Of Harvard College | Nucleobase editors comprising nucleic acid programmable DNA binding proteins |
WO2018209320A1 (en) | 2017-05-12 | 2018-11-15 | President And Fellows Of Harvard College | Aptazyme-embedded guide rnas for use with crispr-cas9 in genome editing and transcriptional activation |
CN111801345A (zh) | 2017-07-28 | 2020-10-20 | 哈佛大学的校长及成员们 | 使用噬菌体辅助连续进化(pace)的进化碱基编辑器的方法和组合物 |
WO2019139645A2 (en) | 2017-08-30 | 2019-07-18 | President And Fellows Of Harvard College | High efficiency base editors comprising gam |
EP3697906A1 (en) | 2017-10-16 | 2020-08-26 | The Broad Institute, Inc. | Uses of adenosine base editors |
EP3797160A1 (en) | 2018-05-23 | 2021-03-31 | The Broad Institute Inc. | Base editors and uses thereof |
WO2020191248A1 (en) | 2019-03-19 | 2020-09-24 | The Broad Institute, Inc. | Method and compositions for editing nucleotide sequences |
EP4146804A1 (en) | 2020-05-08 | 2023-03-15 | The Broad Institute Inc. | Methods and compositions for simultaneous editing of both strands of a target double-stranded nucleotide sequence |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102648207A (zh) * | 2009-03-16 | 2012-08-22 | 马太克生物科学公司 | 在网粘菌门微生物中产生蛋白质 |
WO2015086798A2 (en) * | 2013-12-13 | 2015-06-18 | Cellectis | New method of selection of algal-transformed cells using nuclease |
CN104988078A (zh) * | 2009-03-19 | 2015-10-21 | 帝斯曼知识产权资产管理有限公司 | 破囊壶菌、脂肪酸组合物和其制备方法及用途 |
CN105238806A (zh) * | 2015-11-02 | 2016-01-13 | 中国科学院天津工业生物技术研究所 | 一种用于微生物的CRISPR/Cas9基因编辑载体的构建及其应用 |
WO2016109840A2 (en) * | 2014-12-31 | 2016-07-07 | Synthetic Genomics, Inc. | Compositions and methods for high efficiency in vivo genome editing |
Family Cites Families (23)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO1998046772A2 (en) | 1997-04-11 | 1998-10-22 | Dsm N.V. | Gene conversion as a tool for the construction of recombinant industrial filamentous fungi |
US8003772B2 (en) | 1999-01-14 | 2011-08-23 | Martek Biosciences Corporation | Chimeric PUFA polyketide synthase systems and uses thereof |
TWI324181B (en) | 2001-04-16 | 2010-05-01 | Martek Biosciences Corp | Product and process for transformation of thraustochytriales microorganisms |
WO2006077258A1 (en) | 2005-01-24 | 2006-07-27 | Dsm Ip Assets B.V. | Method for producing a compound of interest in a filamentous fungal cell |
JP4796786B2 (ja) * | 2005-04-28 | 2011-10-19 | 富士フイルム株式会社 | ラビリンチュラ類を形質転換可能なベクター |
ES2534282T3 (es) | 2006-06-29 | 2015-04-21 | Dsm Ip Assets B.V. | Un método para lograr la expresión polipeptídica mejorada |
CN102741421B (zh) | 2009-03-10 | 2015-03-25 | 帝斯曼知识产权资产管理有限公司 | 用于提高多肽产率的方法 |
BRPI1006435B1 (pt) | 2009-03-19 | 2021-01-19 | Dsm Ip Assets B.V. | molécula de ácido nucleico recombinante e célula hospedeira microbiana |
JP2012524530A (ja) | 2009-04-22 | 2012-10-18 | ディーエスエム アイピー アセッツ ビー.ブイ. | 対象組換えポリペプチドの産生方法 |
US8889394B2 (en) | 2009-09-07 | 2014-11-18 | Empire Technology Development Llc | Multiple domain proteins |
WO2013066438A2 (en) * | 2011-07-22 | 2013-05-10 | President And Fellows Of Harvard College | Evaluation and improvement of nuclease cleavage specificity |
CN110669758A (zh) | 2012-10-23 | 2020-01-10 | 基因工具股份有限公司 | 用于切割靶dna 的组合物及其用途 |
WO2014089348A1 (en) | 2012-12-07 | 2014-06-12 | Synthetic Genomics, Inc. | Nannochloropsis spliced leader sequences and uses therefor |
WO2014191521A2 (en) * | 2013-05-29 | 2014-12-04 | Cellectis | New compact scaffold of cas9 in the type ii crispr system |
RU2016104064A (ru) * | 2013-07-10 | 2017-08-15 | Новартис Аг | Клетки мицелиальных грибов с множественной недостаточностью протеаз и способы их использования |
EP3375877A1 (en) * | 2013-11-18 | 2018-09-19 | Crispr Therapeutics AG | Crispr-cas system materials and methods |
CA2933134A1 (en) * | 2013-12-13 | 2015-06-18 | Cellectis | Cas9 nuclease platform for microalgae genome engineering |
EP3146059B1 (en) * | 2014-05-22 | 2019-09-18 | Synthetic Genomics, Inc. | Labyrinthulomycete strains for producing docosahexaenoic acid and myristic acid |
KR102424721B1 (ko) * | 2014-11-06 | 2022-07-25 | 이 아이 듀폰 디 네모아 앤드 캄파니 | Rna-유도 엔도뉴클레아제의 세포 내로의 펩티드 매개성 전달 |
CA2977271A1 (en) * | 2015-03-02 | 2016-09-09 | Synthetic Genomics, Inc. | Regulatory elements from labyrinthulomycetes microorganisms |
WO2016197136A2 (en) | 2015-06-04 | 2016-12-08 | Nmc, Inc. | Improved productivity and bioproduct formation in phototropin knock/out mutants in microalgae |
JP6937740B2 (ja) | 2015-07-28 | 2021-09-22 | ダニスコ・ユーエス・インク | ゲノム編集システムおよび使用方法 |
DK3412765T5 (da) | 2016-02-04 | 2024-09-23 | Kao Corp | Fremgangsmåde til fremstilling af mutant filamentøse svampe |
-
2017
- 2017-07-13 EP EP17828470.9A patent/EP3484994A4/en not_active Withdrawn
- 2017-07-13 WO PCT/US2017/041949 patent/WO2018013821A1/en unknown
- 2017-07-13 BR BR112019000430A patent/BR112019000430A2/pt not_active Application Discontinuation
- 2017-07-13 CN CN201780055558.1A patent/CN109689856A/zh active Pending
- 2017-07-13 US US16/309,304 patent/US11466269B2/en active Active
- 2017-07-13 KR KR1020197000858A patent/KR102319845B1/ko active Active
- 2017-07-13 JP JP2018564999A patent/JP2019520069A/ja active Pending
-
2022
- 2022-05-11 JP JP2022077982A patent/JP2022116027A/ja not_active Withdrawn
- 2022-08-05 US US17/817,899 patent/US20220380759A1/en not_active Abandoned
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102648207A (zh) * | 2009-03-16 | 2012-08-22 | 马太克生物科学公司 | 在网粘菌门微生物中产生蛋白质 |
CN104988078A (zh) * | 2009-03-19 | 2015-10-21 | 帝斯曼知识产权资产管理有限公司 | 破囊壶菌、脂肪酸组合物和其制备方法及用途 |
WO2015086798A2 (en) * | 2013-12-13 | 2015-06-18 | Cellectis | New method of selection of algal-transformed cells using nuclease |
WO2016109840A2 (en) * | 2014-12-31 | 2016-07-07 | Synthetic Genomics, Inc. | Compositions and methods for high efficiency in vivo genome editing |
CN105238806A (zh) * | 2015-11-02 | 2016-01-13 | 中国科学院天津工业生物技术研究所 | 一种用于微生物的CRISPR/Cas9基因编辑载体的构建及其应用 |
Non-Patent Citations (2)
Title |
---|
SHENGCHUN GUO 等: "CRISPR/Cas9 Systems: The Next Generation Gene Targeted Editing Tool", 《PROCEEDINGS OF THE NATIONAL ACADEMY OF SCIENCES, INDIA SECTION B: BIOLOGICAL SCIENCES》 * |
李君 等: "CRISPR/Cas系统:RNA靶向的基因组定向编辑新技术", 《遗传》 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110747223A (zh) * | 2019-11-29 | 2020-02-04 | 中国科学院海洋研究所 | 一种紫菜功能基因沉默的方法及其应用 |
Also Published As
Publication number | Publication date |
---|---|
US20200131511A1 (en) | 2020-04-30 |
KR20190025910A (ko) | 2019-03-12 |
US20220380759A1 (en) | 2022-12-01 |
US11466269B2 (en) | 2022-10-11 |
JP2019520069A (ja) | 2019-07-18 |
EP3484994A1 (en) | 2019-05-22 |
JP2022116027A (ja) | 2022-08-09 |
EP3484994A4 (en) | 2020-01-22 |
BR112019000430A2 (pt) | 2019-07-09 |
KR102319845B1 (ko) | 2021-11-01 |
WO2018013821A1 (en) | 2018-01-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102319845B1 (ko) | 조류 숙주 세포에 대한 crispr-cas 시스템 | |
RU2763170C2 (ru) | Производство олигосахаридов человеческого молока в микроорганизмах-хозяевах с модифицированным импортом/экспортом | |
DK2087105T3 (da) | Delta 17-desaturase og anvendelse heraf ved fremstilling af flerumættede fedtsyrer | |
KR102711998B1 (ko) | 조작되고 완전-기능 맞춤 당단백질 | |
KR102494564B1 (ko) | 말라리아 백신 | |
US20030119104A1 (en) | Chromosome-based platforms | |
CN101646766B (zh) | △17去饱和酶及其用于制备多不饱和脂肪酸的用途 | |
KR20070085669A (ko) | 고농도의 아라키돈산을 생성하는 야로위아 리폴리티카 균주 | |
KR20210108423A (ko) | 아데노 관련 바이러스 (aav) 생산자 세포주 및 관련 방법 | |
KR20210105382A (ko) | 단백질을 코딩하는 rna | |
CN109996874A (zh) | 10-甲基硬脂酸的异源性产生 | |
CN109843909B (zh) | 利用替代的葡萄糖转运蛋白产生鼠李糖脂的细胞和方法 | |
CN111094569A (zh) | 光控性病毒蛋白质、其基因及包含该基因的病毒载体 | |
CN115927299A (zh) | 增加双链rna产生的方法和组合物 | |
CN114026242A (zh) | 具有髓鞘蛋白零启动子的aav载体及其用于治疗雪旺细胞相关疾病如charcot-marie-tooth疾病的用途 | |
CN115698297A (zh) | 多模块生物合成酶基因组合文库的制备方法 | |
AU2017252409A1 (en) | Compositions and methods for nucleic acid expression and protein secretion in bacteroides | |
DK2935601T3 (en) | RECOMBINANT MICROBELL CELLS PRODUCING AT LEAST 28% EICOSAPENTAIC ACID AS DRY WEIGHT | |
KR20240022571A (ko) | Rna-가이드된 이펙터 동원을 위한 시스템, 방법 및 성분 | |
CN117881788A (zh) | 表达载体、无细菌序列载体及其制备和使用方法 | |
CN112209883B (zh) | 一种与rna特异性结合的荧光素染料及其应用 | |
KR102721142B1 (ko) | 재배열 레오바이러스과 바이러스를 제조하는 방법 및 이를 위한 벡터 라이브러리 | |
RU2833866C1 (ru) | Трансгенный объект пшеницы ind-∅∅412-7 | |
CN115003815B (zh) | 小麦转基因事件ind-øø412-7 | |
US20240165154A1 (en) | Methods and agents for modulating adoptive immunotherapy |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20190426 |