[go: up one dir, main page]

CN109152808A - 用于核酸序列的特异性靶向的二聚蛋白质 - Google Patents

用于核酸序列的特异性靶向的二聚蛋白质 Download PDF

Info

Publication number
CN109152808A
CN109152808A CN201780026570.XA CN201780026570A CN109152808A CN 109152808 A CN109152808 A CN 109152808A CN 201780026570 A CN201780026570 A CN 201780026570A CN 109152808 A CN109152808 A CN 109152808A
Authority
CN
China
Prior art keywords
lys
leu
glu
sequence
polypeptide
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201780026570.XA
Other languages
English (en)
Inventor
龚小松
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Bio Rad Laboratories Inc
Original Assignee
Bio Rad Laboratories Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Bio Rad Laboratories Inc filed Critical Bio Rad Laboratories Inc
Publication of CN109152808A publication Critical patent/CN109152808A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases [RNase]; Deoxyribonucleases [DNase]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/62DNA sequences coding for fusion proteins
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/80Fusion polypeptide containing a DNA binding domain, e.g. Lacl or Tet-repressor

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Biomedical Technology (AREA)
  • Organic Chemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Molecular Biology (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Medicinal Chemistry (AREA)
  • Peptides Or Proteins (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)

Abstract

提供了多肽构建体,其包含连接至第二序列特异性DNA‑结合蛋白的第一序列特异性DNA‑结合蛋白,和使用所述多肽构建体的方法。

Description

用于核酸序列的特异性靶向的二聚蛋白质
相关专利申请的交叉参考
本申请要求2016年4月29日提交的美国临时专利申请号62/329,740的优先权,该文通过引用方式纳入本文。
背景技术
"Cas9"或"Cas9核酸酶"指含Cas9蛋白的RNA引导的核酸酶。酶促活性Cas9包含Cas9的活性DNA切割结构域和向导RNA(gRNA)结合结构域。Cas9核酸酶有时也称作casn1核酸酶或CRISPR(成簇规律间隔短回文重复序列)相关核酸酶。
CRISPR是适应性免疫系统,其提供针对可动遗传因子(病毒、转座因子和接合型质粒)的保护。CRISPR簇包含间隔子、与前述可动因子互补的序列,和靶入侵核酸。CRISPR簇可被转录并加工成CRISPR RNA(crRNA)。在II型CRISPR系统中,前体crRNA的正确加工需要反式编码小RNA(tracrRNA)、内源性核糖核酸酶3(rnc)和Cas9蛋白。tracrRNA作为向导用于核糖核酸酶3-协助的前体crRNA的加工。随后,Cas9/crRNA/tracrRNA通过内切核苷酸方式切割与间隔子互补的线性或环状dsDNA靶标。不与crRNA互补的靶链首先通过内切核苷酸方式被切割,随后以外切核苷酸方式由3'-5'修整。自然中,DNA结合和切割通常需要蛋白质和两种RNA。然而,单向导RNA可经工程改造,从而将crRNA和tracrRNA两者的方面引入单RNA物质。参见例如,Jinek M.,Chylinski K.,Fonfara I.,Hauer M.,Doudna J.A.,CharpentierE.Science 337:816-821(2012)。Cas9识别CRISPR重复序列中的短基序(PAM或前间区序列邻近基序)以协助区分自身和非自身。Cas9核酸酶序列和结构已见述于(参见例如,Ferretti等,Proc.Natl.Acad.Sci.U.S.A.98:4658-4663(2001);Mojica等,Microbiology155:733–740(2009);Deltcheva E.等.,Nature 471:602-607(2011);和Jinek M.等.Science 337:816-821(2012)。Cas9同源序列已见述于多个物种,包括但不限于,酿脓链球菌(S.pyogenes)和嗜热链球菌(S.thermophilus)。
不论CRISPR是用于基因组编辑、基因组靶向还是其它应用,普遍希望CRISPR系统特异性地靶向感兴趣的核苷酸序列,并避免基因组中的非靶(“脱靶”)序列。例如,Wang等,Nature Biotechnology 33:175–178(2015)显示,脱靶频率可能较高。该文章中,对于WASCR-4靶标的全部整合位点的脱靶整合为88%。中靶整合仅为12%。
阿尔古(Argonaute,“Ago”)蛋白也可用于靶向多核苷酸序列。例如,Ago蛋白普遍表达并结合至siRNA或miRNA,以通过使mRNA去稳化或通过翻译抑制来引导转录后基因沉默。Ago蛋白一般具有至少四个结构域:N末端结构域、PAZ结构域、Mid结构域和C末端PIWI结构域。参见例如,Hutvagner,Nature Reviews Molecular Cell Biology 9(1):22–32(2008)和Meister,Nature ReviewsGenetics 14:447–459(2013)。
定义
除非另有说明,本文所用的所有科技术语具有本发明所属领域普通技术人员通常所理解的含义。通常,本文所用的命名和下述细胞培养、分子遗传学、有机化学和核酸化学以及杂交中的实验室步骤均为本领域熟知和常用的。使用标准技术进行核酸和肽合成。按照本领域和各种通用参考文献所述的常规方法进行这些技术和步骤(通常参见,Sambrook等,《分子克隆:实验室手册》(MOLECULAR CLONING:A LABORATORY MANUAL),第2版(1989)冷泉港实验室出版社(Cold Spring Harbor Laboratory Press),纽约冷泉港(Cold SpringHarbor,N.Y.),其通过引用纳入本文),将它们引入本文全文中。本文所用的命名以及下述分析化学和有机合成中的实验室步骤均为本领域熟知且常用。
本文所用的“核酸”表示DNA、RNA、单链、双链、或更高度聚集的杂交基序及其任意化学修饰。修饰包括但不限于,提供引入其它电荷、极化性、氢键、静电相互作用、与核酸配体碱基或核酸配体整体的连接点和作用点的化学基团的那些修饰。这类修饰包括但不限于,肽核酸(PNA)、磷酸二酯基团修饰(例如,硫代磷酸酯、甲基膦酸酯)、2'-位糖修饰、5-位嘧啶修饰、8-位嘌呤修饰、环外胺处的修饰、4-硫尿核苷的取代、5-溴或5-碘-尿嘧啶的取代、骨架修饰、甲基化、不常见的碱基配对组合如异碱基(isobase)、异胞苷和异胍(isoguanidine)等。核酸也可包含非天然碱基,如硝基吲哚。修饰还可包括3'和5'修饰,例如用荧光团(例如,量子点)或其它部分加帽。
术语“寡核苷酸”或“多核苷酸”或“核酸”可互换使用以表示对应于核糖核酸(RNA)或脱氧核糖核酸(DNA)聚合物的单体聚合物或其类似物。这包括核苷酸的聚合物如RNA和DNA及其经修饰的形式、肽核酸(PNA)、锁核酸(LNATM)等。在某些应用中,该核酸可以是包含多种单体类型的聚合物,例如同时包含RNA和DNA亚基。
术语“多肽”、“肽”和“蛋白质”在本文中互换使用,指氨基酸残基的聚合物。该术语适用于其中一个或多个氨基酸残基是相应天然产生氨基酸的人造化学模拟物的氨基酸聚合物,以及天然产生的氨基酸聚合物和非天然产生的氨基酸聚合物。
术语“氨基酸”指天然产生的和合成的氨基酸,以及作用方式类似于天然产生氨基酸的氨基酸类似物和氨基酸模拟物。天然产生的氨基酸是由遗传密码编码的那些氨基酸,以及随后经修饰的那些氨基酸,例如,羟基脯氨酸、γ-羧基谷氨酸和O-磷酸丝氨酸。氨基酸类似物指与天然产生的氨基酸具有相同基本化学结构的化合物,即碳原子与氢原子、羧基、氨基和R基结合,如高丝氨酸、正亮氨酸、甲硫氨酸亚砜、甲硫氨酸甲基锍。这种类似物具有修饰的R基(如正亮氨酸)或修饰的肽主链,但保留了与天然产生的氨基酸基本相同的化学结构。氨基酸模拟物指结构不同于氨基酸的普通化学结构,但作用方式类似于天然产生氨基酸的化合物。
本文中氨基酸可按IUPAC-IUB生物化学命名委员会推荐的通常已知的三字母符号或单字母符号表述。核苷酸同样可由其普遍接受的单字母代码表述。
“保守修饰变体”可应用于氨基酸和核酸序列。对于特定的核酸序列,保守修饰变体指编码相同或基本相同的氨基酸序列的核酸,或者当核酸不编码氨基酸序列时,指基本相同的序列。由于遗传密码的简并性,大量功能相同的核酸编码任何给定的蛋白质。例如,密码子GCA、GCC、GCG和GCU都编码氨基酸丙氨酸。因此,在密码子指定丙氨酸的每个位置上,可将所述密码子改变成所述的任何相应密码子而不改变编码的多肽。这类核酸变异是“沉默变异”,这是保守修饰变异的一种。本文编码多肽的每种核酸序列也描述该核酸的每种可能的沉默变异。本领域技术人员应认识到,可修饰核酸中的各个密码子(除了AUG和TGG,AUG通常是甲硫氨酸的唯一密码子,TGG通常是色氨酸的唯一密码子),以产生功能相同的分子。因此,在所述的各序列中隐含了编码多肽的各核酸沉默变异。
至于氨基酸序列,本领域技术人员将认识到,在编码序列中改变、加入或删除一个氨基酸或较少百分数氨基酸的某一核酸、肽、多肽或蛋白质序列单独取代、缺失或添加是“保守修饰变体”,其中所述改变导致氨基酸被化学上相似的氨基酸所取代。提供功能上相似氨基酸的保守取代表是本领域熟知的。此类保守修饰的变体是本发明的多态性变体、种间同源物和等位基因的补充且并不排除它们。
术语“编码”指编码一种或多种氨基酸的多核苷酸序列。该术语无需起始或终止密码子。氨基酸序列可编码于多核苷酸序列提供的六种不同的阅读框中任一种中。
术语“启动子”指定位于转录起始上游和/或下游且涉及识别和结合RNA聚合酶和其它蛋白质以起始转录的区域或序列。
“载体”指多核苷酸,其独立于宿主染色体时能够在宿主生物体中复制。优选的载体包括质粒且通常具有复制起始点。载体可包括,例如,转录和翻译终止子、转录和翻译起始序列和用于调控特定核酸表达的启动子。本发明所述的任何多核苷酸都可包含在载体内。
如果采用以下序列比较算法之一或通过手工比对和目测检查测量时,当就比较窗口或指定区域上的最大对应性而言,这些序列有特定百分数的核苷酸或氨基酸残基相同(例如在特定区域上至少60%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同),则序列彼此间“基本相同”。
对于序列比较,一般将一条序列用作与测试序列比较的参比序列。使用序列比较算法时,测试和参比序列均输入计算机,必要时指定子序列坐标,指定序列算法程序参数。可使用默认的程序参数,或者可指定另外的参数。然后,该序列比较算法基于程序参数计算出测试序列相对于参比序列的序列相同性百分数。
本文所用的比较窗口摂包括参考选自20-600,通常约50-200,更常见约100-150的任一数量的毗连位置的区段,其中对两个序列进行最优比对后,可将序列与具有相同数量毗连位置的参比序列作比较。比对序列的比较方法是本领域熟知的。可进行最优序列比对以作比较,例如,通过Smith和Waterman的局部同源性算法,Adv.Appl.Math.2:482(1981);通过Needleman和Wunsch的同源性比对算法,J.Mol.Biol.48:443(1970);通过Pearson和Lipman的相似性搜索法,Proc.Nat’l.Acad.Sci.USA 85:2444(1988);通过计算机执行这些算法(阿克赛勒里公司(Accelrys)的威斯康星遗传学软件包(Wisconsin GeneticsSoftware Package)中的GAP、BESTFIT、FASTA和TFASTA),或通过手工比对和目测。
适合确定序列相同性和序列相似性百分数的算法分别是BLAST和BLAST 2.0算法,分别描述于Altschul等(Nuc.Acids Res.25:3389-402,1977)和Altschul等(J.Mol.Biol.215:403-10,1990)。进行BLAST分析的软件可从国家生物技术信息中心(National Center for Biotechnology Information)公开获得(http://ncbi.nlm.nih.gov/)。此算法包括:首先通过鉴定查询序列中长度为W的短字来鉴定高评分序列对(HSP),与数据库序列中长度相同的字比对时它们能匹配或满足一些正值的阈值评分T。T称为相邻字评分阈值(Altschul等,同上)。这些初始相邻字命中(word hit)用作启动搜索的种子,以便找到含有它们的较长HSP。只要可提高累积比对评分,该字命中在两个方向上沿各序列延伸。出现以下情况时中止字命中在各个方向上的延伸:累积比对评分比其最大获得值降低X;由于一个或多个负评分残基比对的累积,累积评分变为零或零以下;或者达到任一序列的末端。BLAST算法参数W、T和X决定比对的灵敏度和速度。BLAST程序使用的默认值为:字长(W)11,BLOSUM62评分矩阵(参见Henikoff和Henikoff,Proc.Natl.Acad.Sci.USA 89:10915(1989))比对(B)50,期望值(E)10,M=5,N=-4,以及比较两条链。
BLAST算法也对两条序列间的相似性进行统计学分析(参见例如,Karlin和Altschul,Proc.Nat’l.Acad.Sci.USA 90:5873-5787(1993))。BLAST算法提供的一种相似性测量是最小概率和(P(N)),它表明两条核苷酸或氨基酸序列之间偶尔发生匹配的概率。例如,如果测试核酸与参比核酸比较时的最小概率和小于约0.2,更优选小于约0.01,最优选小于约0.001,那么认为该核酸与参比序列相似。
术语“操作性连接”指核酸表达控制序列(如启动子,或转录因子结合位点阵列)和第二核酸序列之间的功能连接,其中所述表达控制序列指导所述核酸响应所述第二序列的转录。
“表达盒”是指当导入宿主细胞时,分别导致RNA或多肽的转录和/或翻译的核酸构建体。
发明内容
本文提供了一种多肽构建体,其包含第一序列特异性DNA结合蛋白,选自Cas9蛋白或Ago蛋白,连接至第二序列特异性DNA结合蛋白。
在一些实施方式中,第一序列特异性DNA结合蛋白是Cas9蛋白。在一些实施方式中,Cas9蛋白是dCas9蛋白。在一些实施方式中,Cas9蛋白是核酸酶活性(即“活性”)Cas9蛋白。在一些实施方式中,第一dCas9多肽连接至第二Cas9多肽。在一些实施方式中,第二Cas9多肽第二dCas9多肽。在一些实施方式中,第二Cas9多肽是核酸酶活性Cas9多肽。Cas9蛋白可以是天然产生的,或其保留至少DNA结合活性的变体。在一些实施方式中,Cas9蛋白基本等同于天然产生的Cas9蛋白。
在一些实施方式中,第一序列特异性DNA结合蛋白共价连接至第二序列特异性DNA结合蛋白。在一些实施方式中,第一序列特异性DNA结合蛋白以翻译性融合蛋白形式共价连接至第二序列特异性DNA结合蛋白。在一些实施方式中,第一序列特异性DNA结合蛋白通过一个或多个二聚化结构域连接至第二序列特异性DNA结合蛋白。
在一些实施方式中,第一dCas9多肽结合至第一向导RNA,且第二Cas9多肽结合至第二向导RNA,且第一dCas9多肽通过第一向导RNA与第二向导RNA的相互作用连接至第二Cas9多肽。在一些实施方式中,第一dCas9多肽和第二Cas9多肽结合至RNA,所述RNA包含第一Cas9引导序列;第一tracr RNA序列;第二Cas9引导序列;和第二tracr RNA序列,其中:第一dCas多肽结合至第一tracr RNA序列,且第二Cas9多肽结合至第二tracr序列;或第一dCas多肽结合至第二tracr RNA序列,且第二Cas9多肽结合至第一tracr序列,从而第一dCas多肽和第二Cas多肽通过该RNA结合在一起。
在一些实施方式中,第二序列特异性DNA结合蛋白包含TALE DNA结合结构域或锌指蛋白。
在一些实施方式中,第一序列特异性DNA结合蛋白是Ago蛋白。在一些实施方式中,第二序列特异性DNA结合蛋白包含Cas9蛋白、TALE DNA-结合结构域,或锌指蛋白。
还提供了包含如上文或本文他处所述的多肽构建体的细胞。在一些实施方式中,所述细胞是真核细胞。在一些实施方式中,细胞是人细胞。
还提供了编码如上文或本文他处所述的翻译性融合蛋白的核酸。还提供了包含所述核酸的细胞。在一些实施方式中,所述细胞是真核细胞。在一些实施方式中,细胞是人细胞。
还提供了将多肽构建体引入真核细胞的方法,所述方法包括,将所述多肽构建体引入该细胞。在一些实施方式中,多肽构建体通过电穿孔被引入该细胞。在一些实施方式中,第一序列特异性DNA结合蛋白以翻译性融合蛋白形式共价连接至第二序列特异性DNA结合蛋白,并且,编码该翻译性融合蛋白的核酸被引入该细胞,其中,所述多肽构建体在该细胞中表达,由此将所述多肽构建体引入该细胞。
还提供从5’到3’包含如下部分的RNA:第一Cas9引导序列;第一tracr RNA序列;第二Cas9引导序列;和第二tracr RNA序列。
还提供从5’到3’包含如下部分的RNA:第一Cas9引导序列;第二Cas9引导序列;和第一tracr RNA序列,后跟第二tracr RNA序列;或第二tracr RNA序列,后跟第一tracr RNA序列。
还提供了一种表达盒,其包含启动子,该启动子操作性地连接至编码如上所述的RNA的多核苷酸。还提供一种细胞,其包含所述表达盒。在一些实施方式中,所述细胞是真核细胞。在一些实施方式中,细胞是人细胞。
还提供一种组合物,其包含:如上所述的RNA;第一dCas9多肽;和第二Cas9多肽。在一些实施方式中,第二Cas9多肽是第二dCas9多肽。在一些实施方式中,第二Cas9多肽是核酸酶活性Cas9多肽。还提供了包含所述组合物的细胞。在一些实施方式中,所述细胞是真核细胞。在一些实施方式中,细胞是人细胞。
还提供了将所述组合物引入细胞的方法。在一些实施方式中,所述方法包括,将所述组合物,或其全部组分(所述RNA、第一dCas9多肽和第二Cas9多肽),引入所述细胞。在一些实施方式中,所述方法包括,将Cas9或dCas9/向导RNA/tracrRNA复合物(其具有对于靶序列的活性结合活性)引入所述细胞。
附图说明
图1示意性地显示将两个Cas9多肽连接在一起的两个实施方式。
图2示意性地显示将两个Cas9多肽连接在一起的两个替代性的实施方式。
发明详述
绪论
本文提供了一种多肽构建体,其包含第一序列特异性DNA结合蛋白(例如,选自Cas9或Ago蛋白),该第一序列特异性DNA结合蛋白连接至第二序列特异性DNA结合蛋白。当述及多肽时,所用术语“第一”和“第二”用于简单且更清楚地区分两种多肽序列,且不意在表明顺序。在一些实施方式中,第二序列特异性DNA结合蛋白选自Cas9多肽、Ago多肽、TALEDNA-结合结构域,或锌指。
在一些实施方式中,第一序列特异性DNA结合蛋白是Cas9蛋白。Cas9蛋白可以是经催化死亡的Cas9(“dCas9”)多肽或活性Cas9多肽。在一些实施方式中,该多肽构建体包含经催化死亡的Cas9(“dCas9”)多肽或活性Cas9多肽,其连接至第二Cas9多肽。第二Cas9多肽可按需为活性的或经催化死亡的。
相较于单独的第二Cas9多肽,所述的多肽构建体预期具有改善的特异性(降低的“脱靶活性)。当相应的向导RNA序列靶向邻近基因组序列从而第一dCas9多肽和第二Cas9多肽两者结合紧密靠近的序列时,将获得提高的特异性。所得的双重结合事件(即,第一dCas9多肽和第二Cas9多肽两者靶向基因组中它们的相应序列)将大幅降低脱靶结合。
所述的多肽构建体可被应用于Cas9或dCas9多肽的任何应用,包括但不限于,基因组编辑(采用活性Cas9)或出于其它目的的基因组区域的靶向(例如,采用dCas9)。参见例如,Maeder等.,Nature Methods 10:977–979(2013);Gilbert等.,Cell 154(2):442–451(2013);Hu等,Nucleic Acids Research 42(7):4375–90(2014)。
第一dCas9多肽可以是缺乏催化活性的任何Cas9多肽。dCas9多肽可来自任何物种,例如但不限于,来自酿脓链球菌。用于产生具有失活DNA切割结构域的Cas9蛋白(或其片段)的方法是已知的。参见例如,Jinek等,Science 337:816-821(2012);Qi等,Cell.28;152(5):1173-83(2013)。例如,已知Cas9的DNA切割结构域包括两个亚结构域,HNH核酸酶亚结构域和RuvC1亚结构域。HNH亚结构域切割与gRNA互补的链,而RuvC1亚结构域切割非互补链。这些亚结构域中的突变可使Cas9的核酸酶活性沉默。在一些实施方式中,dCas9多肽在D10和H840残基中含有突变,例如,D10N或D10A和H840A或H840N或H840Y,以使蛋白质的核酸酶部分酶促失活的Cas9。例如,突变D10A和H840A使酿脓链球菌Cas9的核酸酶活性完全失活。示例性的dCas9序列(D10A和H840A)如下:
(SEQ ID NO:1)MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDAIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD
在一些实施方式中,dCas9等同于或基本(例如,至少70,75,80,85,90,95%)等同于SEQ ID NO:1。
如上所示,第二Cas9多肽可以是经酶促具有活性或死亡(经酶促失活)的Cas9多肽。示例性的dCas9多肽如上所述。示例性的活性Cas9多肽可包含,例如,基本(例如,至少70,75,80,85,90,95%)等同于来自以下物种的Cas9的序列:酿脓链球菌(Streptococcuspyogenes)(NCBI参考序列:NC_017053.1,SEQ ID NO:2);溃疡棒状杆菌(Corynebacteriumulcerans)(NCBI参考号:NC_015683.1,NC_017317.1);白喉棒状杆菌(Corynebacteriumdiphtheria)(NCBI参考号:NC_016782.1,NC_016786.1);栖蚜蝇螺原体(Spiroplasmasyrphidicola)(NCBI参考号:NC_021284.1);中间普氏菌(Prevotella intermedia)(NCBI参考号:NC_017861.1);台湾螺原体(Spiroplasma taiwanense)(NCBI参考号:NC_021846.1);鱼型链球菌(Streptococcus iniae)(NCBI参考号:NC_021314.1);含羞草伯克霍尔德氏菌(Belliella baltica)(NCBI参考号:NC_018010.1);拓奇冷弯菌(Psychroflexus torquisI)(NCBI参考号:NC_018721.1);嗜热链球菌(Streptococcusthermophilus)(NCBI参考号:YP_820832.1),无害利斯特菌(Listeria innocua)(NCBI参考号:NP_472073.1),空肠弯曲杆菌(Campylobacter jejuni)(NCBI参考号:YP_002344900.1)或脑膜炎奈瑟氏菌(Neisseria meningitidis)(NCBI参考号:YP_002342100.1)。
来自酿脓链球菌的示例性的活性Cas9多肽序列为:
(SEQ ID NO:2)
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGA LLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD
所述多肽构建体包含第一序列特异性DNA结合性多肽,其连接至第二序列特异性DNA结合性多肽。这两种多肽可按需连接。在一些实施方式中,这两种多肽通过肽键连接(例如,以翻译性融合体形式),其可直接融合或通过肽接头间接融合。参见例如,图1上部。示例性的肽接头序列含有Gly、Ser、Val和Thr残基。在一些实施方式中,其它的近中性氨基酸(如Ala)也可用于接头序列。可有用地用作接头的氨基酸序列包括以下文献中描述的那些:Maratea等(1985)Gene 40:39-46;Murphy等(1986)Proc.Natl.Acad.Sci.USA 83:8258-8262;美国专利号4,935,233和4,751,180,其各自通过引用全文纳入本文用于所有目的且尤其是所有涉及接头的教导。在一些实施方式中,接头序列的长度通常可以是1至约50个氨基酸,例如长度为3、4、6或10个氨基酸,但在一些实施方式中,长度也可以长达100或200个氨基酸。
融合体中的两种多肽的顺序可变化。因此,在一些实施方式中,第一序列特异性DNA结合性多肽羧基末端直接或间接连接至第二序列特异性DNA结合性多肽。在一些实施方式中,第二序列特异性DNA结合性多肽羧基末端直接或间接连接至第一序列特异性DNA结合性多肽。
在一些实施方式中,第一序列特异性DNA结合蛋白是Cas9(dCas9或活性Cas9,例如如上所述),且第二序列特异性结合蛋白Ago蛋白、转录活化剂样效应物核酸酶(TALE)DNA结合结构域,锌指。
示例性的Ago多肽包括,例如,Mallory,The Plant Cell 22(12):3879-3889(2010)中所述那些。例如,Ago蛋白可以是人、拟南芥、酵母或其它Ago蛋白,或保留作为序列特异性DNA结合蛋白的能力的其基本等同的变体。
来自超嗜热菌(A.aeolicus)(Yuan等.Mol.Cell 2005,19:405–419)的示例性的Ago蛋白以SEQ ID NO:3提供:MGKEALLNLYRIEYRPKDTTFTVFKPTHEIQKEKLNKVRWRVFLQTGLPTFRREDEFWCAGKVEKDTLYLTLSNGEIVELKRVGEEEFRGFQNERECQELFRDFLTKTKVKDKFISDFYKKFRDKITVQGKNRKIALIPEVNEKVLKSEEGYFLLHLDLKFRIQPFETLQTLLERNDFNPKRIRVKPIGIDFVGRVQDVFKAKEKGEEFFRLCXERSTHKSSKKAWEELLKNRELREKAFLVVLEKGYTYPATILKPVLTYENLEDEERNEVADIVRXEPGKRLNLIRYILRRYVKALRDYGWYISPEEERAKGKLNFKDTVLDAKGKNTKVITNLRKFLELCRPFVKKDVLSVEIISVSVYKKLEWRKEEFLKELINFLKNKGIKLKIKGKSLILAQTREEAKEKLIPVINKIKDVDLVIVFLEEYPKVDPYKSFLLYDFVKRELLKKXIPSQVILNRTLKNENLKFVLLNVAEQVLAKTGNIPYKLKEIEGKVDAFVGIDISRITRDGKTVNAVAFTKIFNSKGELVRYYLTSYPAFGEKLTEKAIGDVFSLLEKLGFKKGSKIVVHRDGRLYRDEVAAFKKYGELYGYSLELLEIIKRNNPRFFSNEKFIKGYFYKLSEDSVILATYNQVYEGTHQPIKVRKVYGELPVEVLCSQILSLTLXNYSSFQPIKLPATVHYSDKITKLXLRGIEPIKKEGDIXYWL。
天然产生的转录活化剂样效应物(TALE)是由黄单胞菌(Xanthomonas)细菌分泌的蛋白质。TALE的DNA结合结构域包含高度保守的33-34氨基酸序列,除了第12和第13个氨基酸。这两个位置是高度可变的(重复可变双残基(RVD)),并且显示与特异性核苷酸识别的强相关性。氨基酸序列和DNA识别之间的简单关系允许通过选择含有合适RVD的重复区段的组合来构建特异性DNA结合结构域。参见例如,美国专利公开号2014/0256798,和美国专利号8,450,471;8,440,431和8,440,432。
来自野油菜黄单胞菌致病变种阿莫瑞斯(Xanthomonas campestrispv.Armoraciae)的示例性TALE蛋白以SEQ ID NO:4提供如下:
MQWSGARALEALLTVAGELRGPPLQLDTGQLLKIAKRGGVTAVEAVHAWRNALTGAPLNLTPEQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPQQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPEQVVAIASHDGGKQALETVQALLPVLCQAHGLTPEQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPQQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPQQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPQQVVAIASNNGGKQALETVQRLLPVLCQAHGLTPQQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPQQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPEQVVAIASNGGGKQALETVQRLLPVLCQAHGLTPEQVVAIASHDGGKQALETVQRLLPVLCQAHGLTPQQVVAIASNGGGRPALESIVAQLSRPDPALAALTNDHLVALACLGGRPALDAVKKLE
锌指是基于Zc原子的存在而折叠且以序列特异性方式结合DNA的蛋白质。示例性的锌指可按不同结构分类,包括但不限于,例如,Cys2His2、Gag-节型、高音谱号型(Treble-clef)、锌带型(Zinc ribbon)、Zn2/Cys6锌指蛋白。
示例性的锌指蛋白是Zif268,以SEQ ID NO:5提供如下:MERPYACPVESCDRRFSRSDELTRHIRIHTGQKPFQCRICMRNFSRSDHLTTHIRTHTGEKPFACDICGRKFARSDERKRHTKIHLRQKD
在其它实施方式中,第一序列特异性DNA结合蛋白是Ago蛋白。在这些方面中,第二序列特异性DNA结合蛋白可以是,例如,TALE DNA-结合结构域,锌指,Cas9(dCas9或活性)或第二Ago蛋白。
在一些实施方式中,不同于由肽键连接,第一序列特异性DNA结合蛋白和第二序列特异性DNA结合蛋白通过二聚化结构域连接,即,其中第一序列特异性DNA结合蛋白融合至第一二聚化结构域,而第二序列特异性DNA结合蛋白连接至第二二聚化结构域,从而第一和第二二聚化结构域通过第一和第二二聚化结构域之间的共价或非共价相互作用连接这两种多肽。参见例如,图2下部。可采用任何方便的二聚化结构域组合。第一和第二二聚化结构域可以是同二聚体形式,从而它们由相同氨基酸序列构成,或异二聚体形式,从而它们由不同氨基酸序列构成。二聚化结构域可变化,其中,感兴趣的结构域包括但不限于:靶生物分子的配体,例如,特异性结合至感兴趣的具体蛋白质的配体(例如,蛋白质:蛋白质相互作用结构域),例如SH2结构域,Paz结构域,RING结构域,转录活化剂结构域,DNA结合结构域,酶催化结构域,酶调节结构域,酶亚基等。
示例性的二聚化结构域包括,但不限于,以下的蛋白质结构域:iDimerize诱导型同二聚体(例如,DmrB)和异二聚体系统(例如,DmrA和DmrC)和iDimerize反向二聚化系统(例如,DmrD)(Clackson等(1998)Proc.Natl.Acad.Sci.USA 95(18):10437-10442;Crabtree,G.R.和Schreiber,S.L.(1996)Trends Biochem.Sci.21(11):418-422;Jin等(2000)Nat.Genet.26(1):64-66;Castellano等(1999)Curr.Biol.9(7):351-360;Crabtree等(1997)Embo.J.16(18):5618-5628;Muthuswamy等(1999)Mol.Cell.Biol.19(10):6845-6857)。
在一些实施方式中,二聚化结构域是转录活化结构域。感兴趣的转录活化结构域包括,但不限于:H组核受体成员转录活化结构域、甾族/甲状腺激素核受体转录活化结构域、合成或嵌合转录活化结构域、多聚谷氨酰胺转录活化结构域、碱性或酸性氨基酸转录活化结构域、VP16转录活化结构域、GAL4转录活化结构域、NF-κB转录活化结构域、BP64转录活化结构域、B42酸性转录活化结构域(B42AD)、p65转录活化结构域(p65AD),或其类似物、组合或修饰形式。
而在其它实施方式中,结合向导RNA的第一序列特异性DNA结合蛋白(例如,Cas9或Ago蛋白)和结合向导RNA的第二序列特异性DNA结合蛋白(例如,Cas9或Ago蛋白)通过分开的向导RNA连接,所述分开的向导RNA彼此相互作用(例如,杂交)。参见例如,图2上部。在这些实施方式中,第一序列特异性DNA结合蛋白结合至第一向导RNA,而第二序列特异性DNA结合蛋白结合至第二向导RNA,且第一和第二向导RNA包括彼此充分相互作用(例如,杂交)的区域,从而第一序列特异性DNA结合蛋白多肽和第二序列特异性DNA结合蛋白连接在一起。
而在其它实施方式中,结合向导RNA的第一序列特异性DNA结合蛋白(例如,Cas9或Ago蛋白)和结合向导RNA的第二序列特异性DNA结合蛋白(例如,Cas9或Ago蛋白)通过单个延伸的向导RNA连接,所述单个延伸的向导RNA由第一序列特异性DNA结合蛋白和第二序列特异性DNA结合蛋白两者结合。参见例如,图1下部。在一些实施方式中,第一和/或第二序列特异性DNA结合蛋白是Cas9蛋白(dCas9或活性Cas9)。在这些方面中,向导RNA将包含第一引导序列和第一反式活化cr(tracr)序列,用于第一dCas9多肽,和第二引导序列和第二tracr序列,用于第二Cas9多肽。在一些实施方式中,例如,所述RNA将从5’到3’包含如下部分:第一引导序列,第一tracr序列,第二引导序列和第二tracr序列。在一些实施方式中,例如,所述RNA将从5’到3’包含如下部分:第一引导序列,第二引导序列,第二tracr序列,和第一tracr序列。所述后者实施方式示于图1下部。
一般而言,引导序列是与靶多核苷酸序列有足够互补性以与靶序列杂交并引导CRISPR复合物与靶序列的序列特异性结合的任何多核苷酸序列。在一些实施方式中,当使用合适的比对算法进行最佳比对时,引导序列与其相应靶序列之间的互补程度为约或超过约50%、60%、75%、80%、85%、90%、95%、97.5%、99%或更高。在一些实施方式中,引导序列的长度是约或超过约5、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、35、40、45、50、75或更多个核苷酸。在一些实施方式中,引导序列的长度小于约75、50、45、40、35、30、25、20、15、12或更少个核苷酸。可通过任意合适的试验来评价引导序列指导CRISPR复合物序列特异性结合靶序列的能力。例如,可向具有对应靶序列的宿主细胞提供足以形成CRISPR复合物的CRISPR系统的组分(包括待测试的引导序列),例如通过用编码CRISPR序列的组分的载体进行转染,然后评估靶序列中或靶向靶序列的优先切割。类似地,可通过提供靶序列,CRISPR复合物的组分,包括待测试的引导序列和与测试引导序列不同的对照引导序列,并比较测试和对照引导序列反应之间在靶序列处的切割速率或结合,来体外评价靶多核苷酸序列的切割。
可选择引导序列来靶向任意靶序列。在一些实施方式中,靶序列是细胞基因组内的序列。示例性的靶序列包括在靶基因组中特有的那些。
在一些实施方式中,选择引导序列以降低引导序列内的二级结构的程度。可通过任意合适的多核苷酸折叠算法来确定二级结构。一些方案基于计算最低吉布斯自由能。一种此类算法的实例是mFold,如Zuker和Stiegler所述(NucleicAcids Res.9(1981),133-148)。另一示例性折叠算法是线上网站服务器RNAfold,由维也纳大学的理论化学学院(Institute for Theoretical Chemistry at the University of Vienna)开发,采用心结构预测算法(参见例如A.R.Gruber等,2008,Cell 106(1):23-24;和PA Carr和GMChurch,2009,Nature Biotechnology 27(12):1151-62)。
模拟tracrRNA序列的任何RNA序列(即,即由Cas9多肽识别的茎环)或以tracrRNA形式行使功能的任何RNA序列均为“tracr序列”。用于发夹结构的示例性环形成序列长度为4个核苷酸,并且在一些实施方式中,具有序列GAAA。然而,可使用较长或较短的环序列,替代序列也可以。所述序列可包括核苷酸三连体(例如,AAA),和额外核苷酸(例如,C或G)。环形成序列的示例包括CAAA和AAAG。在一个实施方式中,转录本或转录的多核苷酸序列具有至少两个或更多个发夹。在一些实施方式中,转录本具有2、3、4或5个发夹。在其它实施方式中,转录本具有至多5个发夹。在一些实施方式中,单个转录本还包括转录终止序列,如多聚T序列,例如,具有6个T核苷酸。参见例如,美国专利号8697359。
还提供包含多肽构建体的细胞,所述多肽构建体包含第一序列特异性DNA结合蛋白,其连接至第二序列特异性DNA结合蛋白。在一些实施方式中,所述细胞包含编码多肽构建体的多核苷酸,所述多肽构建体包含,以翻译性融合体形式直接或间接(即,通过接头)连接至第二序列特异性DNA结合蛋白的第一序列特异性DNA结合蛋白。示例性的细胞可包括,但不限于,原核细胞(例如,大肠杆菌),动物细胞,真菌细胞或植物细胞。示例性的动物细胞包括但不限于,哺乳动物细胞,例如,小鼠,大鼠,或人细胞。在一些实施方式中,所述多核苷酸还包括控制该多肽构建体的表达的启动子。示例性的启动子可以是组成型、诱导型,或细胞型或组织特异性启动子。
还提供了编码该多肽构建体的核酸(例如,分离的DNA或RNA)。在一些实施方式中,所述核酸可经密码子优化以供在细胞(包括但不限于上述那些细胞)中表达。在一些实施方式中,所述核酸还包含编码和表达序列,用于一种或多种向导RNA的表达。
在一些实施方式中,所述核酸还包含通过翻译方式融合至蛋白质构建体的一个或多个核定位信号序列(NLS)。NLS的非限制性示例包括源自以下的NLS序列:SV40病毒大T-抗原的NLS,具有氨基酸序列PKKKRKV(SEQ ID NO:6);来自核质蛋白的NLS(例如核质蛋白二分体NLS,具有序列KRPAATKKAGQAKKKK(SEQ ID NO:7));c-myc NLS,具有氨基酸序列PAAKRVKLD(SEQ ID NO:8)或RQRRNELKRSP(SEQ ID NO:9);hRNPAI M9 NLS,具有序列NQSSNFGPMKGGNFGGRSSGPYGGGGQYFAKPRNQGGY(SEQ ID NO:10);来自输入蛋白-α的IBB结构域的序列RMRIZFKNKGKDTAELRRRRVEVSVELRKAKKDEQILKRRNV(SEQ ID NO:11);肌瘤T蛋白的序列VSRKRPRP(SEQ ID NO:12)和PPKKARED(SEQ ID NO:13);人p53的序列PQPKKKPL(SEQ ID NO:14);小鼠c-abl IV的序列SALIKKKKKMAP(SEQ ID NO:15);流感病毒NS1的序列DRLRR(SEQID NO:16)和PKQKKRK(SEQ ID NO:17);丁型肝炎病毒抗原的序列RKLKKKIKKL(SEQ ID NO:18);小鼠Mx蛋白的序列REKKKFLKRR(SEQ ID NO:19);人多聚(ADP-核糖)聚合酶的序列KRKGDEVDGVDEVAKKKSKK(SEQ ID NO:20);和甾族激素受体(人)糖皮质激素的序列RKCLQAGMNLEARKTKK(SEQ ID NO:21)。
可通过在细胞中表达编码蛋白质构建体的核酸而将该蛋白质构建体引入该细胞,或可将蛋白质构建直接引入该细胞。用核酸转化细胞,以及多种表达盒和表达载体是已知的。公开本将核酸引入细胞的一般方法和重组技术的基础课本包括Sambrook和Russell,《分子克隆,实验室手册》(Molecular Cloning,A Laboratory Manual)(第3版,2001);Kriegler,《基因转移和表达:实验室手册》(Gene Transfer and Expression:ALaboratory Manual)(1990);以及《新编分子生物学实验指南》(Current Protocols inMolecular Biology)(Ausubel等编,1994-1999))。
在一些实施方式中,蛋白质构建体,伴随或不伴随对应的向导RNA,可被引入细胞。在这些实施方式的一些中,蛋白质构建体包含NLS,例如,如上所述。蛋白质构建体向细胞的引入可通过如下方式进行,例如,通过注入,电穿孔,脂质递送(例如,美国专利公开号20150071903),或与多聚精氨酸的混合物(例如,Kanwar等.,Anticancer Drugs 23(5):471-82(2012))。
还提供了RNA分子,其包含用于第一dCas多肽的第一引导序列,和用于第二Cas9多肽的第二向导RNA,例如如上所述。此类RNA分子将一般包含两个tracr序列,一个用于第一dCas9多肽以进行结合,和第二tracr序列用于第二Cas9多肽以进行结合。在一些实施方式中,例如,所述RNA将从5’到3’包含如下部分:第一引导序列,第一tracr序列,第二引导序列和第二tracr序列。在一些实施方式中,例如,所述RNA将从5’到3’包含如下部分:第一引导序列,第二引导序列,第二tracr序列,和第一tracr序列。
还提供了编码上述RNA分子的表达盒。在一些实施方式中,核酸将包含所述表达盒以及编码上述多肽构建体的表达盒。
在所附的权利要求书中,术语“一个”或“一种”是用来表示“一个(种)或多个(种)”。当术语“包含”及其各种变体例如“包括”和“含有”位于叙述步骤或要素之前的时候,是用来表示添加其它的步骤或要素是任选的,并且是非排它性的。
提供上述公开内容用于说明而非限制本发明的范围。本发明的变化形式对于本领域普通技术人员将是显而易见的并包括在所附权利要求中。通过引用将本文引用的所有发表物、数据库、网络资源、专利、专利申请和登录号全部纳入本文用于所有目的。对于通过引用纳入的此类文件与本说明书中所含公开内容相矛盾的内容,均意于以本说明书为准和/或本说明书优先于任何相矛盾的材料。
序列表
<110> 生物辐射实验室股份有限公司(Bio-Rad Laboratories, Inc.)
龚小松(Gong, Xiaosong)
<120> 用于核酸序列的特异性靶向的二聚蛋白质
<130> 1047380
<150> US 62/329,740
<151> 2016-04-29
<160> 21
<170> PatentIn version 3.5
<210> 1
<211> 1368
<212> PRT
<213> 酿脓链球菌(Streptococcus pyogenes)
<400> 1
Met Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val
1 5 10 15
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
20 25 30
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
35 40 45
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
50 55 60
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
65 70 75 80
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
85 90 95
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
100 105 110
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
115 120 125
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
130 135 140
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
145 150 155 160
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
165 170 175
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
180 185 190
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
195 200 205
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
210 215 220
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
225 230 235 240
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
245 250 255
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
260 265 270
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
275 280 285
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
290 295 300
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
305 310 315 320
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
325 330 335
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
340 345 350
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
355 360 365
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
370 375 380
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
385 390 395 400
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
405 410 415
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
420 425 430
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
435 440 445
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
450 455 460
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
465 470 475 480
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
485 490 495
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
500 505 510
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
515 520 525
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
530 535 540
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
545 550 555 560
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
565 570 575
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
580 585 590
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
595 600 605
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
610 615 620
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
625 630 635 640
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
645 650 655
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
660 665 670
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
675 680 685
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
690 695 700
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
705 710 715 720
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
725 730 735
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
740 745 750
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
755 760 765
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
770 775 780
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
785 790 795 800
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
805 810 815
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
820 825 830
Leu Ser Asp Tyr Asp Val Asp Ala Ile Val Pro Gln Ser Phe Leu Lys
835 840 845
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg
850 855 860
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
865 870 875 880
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
885 890 895
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
900 905 910
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
915 920 925
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
930 935 940
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
945 950 955 960
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
965 970 975
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
980 985 990
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe
995 1000 1005
Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala
1010 1015 1020
Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe
1025 1030 1035
Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala
1040 1045 1050
Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu
1055 1060 1065
Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val
1070 1075 1080
Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr
1085 1090 1095
Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys
1100 1105 1110
Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro
1115 1120 1125
Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val
1130 1135 1140
Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys
1145 1150 1155
Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser
1160 1165 1170
Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys
1175 1180 1185
Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu
1190 1195 1200
Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly
1205 1210 1215
Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val
1220 1225 1230
Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser
1235 1240 1245
Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys
1250 1255 1260
His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys
1265 1270 1275
Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala
1280 1285 1290
Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn
1295 1300 1305
Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala
1310 1315 1320
Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser
1325 1330 1335
Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr
1340 1345 1350
Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp
1355 1360 1365
<210> 2
<211> 2736
<212> PRT
<213> 酿脓链球菌(Streptococcus pyogenes)
<400> 2
Met Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val
1 5 10 15
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
20 25 30
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
35 40 45
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
50 55 60
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
65 70 75 80
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
85 90 95
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
100 105 110
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
115 120 125
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
130 135 140
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
145 150 155 160
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
165 170 175
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
180 185 190
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
195 200 205
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
210 215 220
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
225 230 235 240
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
245 250 255
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
260 265 270
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
275 280 285
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
290 295 300
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
305 310 315 320
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
325 330 335
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
340 345 350
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
355 360 365
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
370 375 380
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
385 390 395 400
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
405 410 415
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
420 425 430
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
435 440 445
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
450 455 460
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
465 470 475 480
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
485 490 495
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
500 505 510
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
515 520 525
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
530 535 540
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
545 550 555 560
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
565 570 575
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
580 585 590
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
595 600 605
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
610 615 620
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
625 630 635 640
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
645 650 655
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
660 665 670
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
675 680 685
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
690 695 700
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
705 710 715 720
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
725 730 735
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
740 745 750
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
755 760 765
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
770 775 780
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
785 790 795 800
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
805 810 815
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
820 825 830
Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys
835 840 845
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg
850 855 860
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
865 870 875 880
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
885 890 895
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
900 905 910
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
915 920 925
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
930 935 940
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
945 950 955 960
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
965 970 975
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
980 985 990
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe
995 1000 1005
Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala
1010 1015 1020
Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe
1025 1030 1035
Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala
1040 1045 1050
Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu
1055 1060 1065
Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val
1070 1075 1080
Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr
1085 1090 1095
Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys
1100 1105 1110
Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro
1115 1120 1125
Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val
1130 1135 1140
Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys
1145 1150 1155
Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser
1160 1165 1170
Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys
1175 1180 1185
Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu
1190 1195 1200
Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly
1205 1210 1215
Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val
1220 1225 1230
Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser
1235 1240 1245
Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys
1250 1255 1260
His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys
1265 1270 1275
Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala
1280 1285 1290
Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn
1295 1300 1305
Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala
1310 1315 1320
Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser
1325 1330 1335
Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr
1340 1345 1350
Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp
1355 1360 1365
Met Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser
1370 1375 1380
Val Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys
1385 1390 1395
Lys Phe Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys
1400 1405 1410
Asn Leu Ile Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu
1415 1420 1425
Ala Thr Arg Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg
1430 1435 1440
Lys Asn Arg Ile Cys Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met
1445 1450 1455
Ala Lys Val Asp Asp Ser Phe Phe His Arg Leu Glu Glu Ser Phe
1460 1465 1470
Leu Val Glu Glu Asp Lys Lys His Glu Arg His Pro Ile Phe Gly
1475 1480 1485
Asn Ile Val Asp Glu Val Ala Tyr His Glu Lys Tyr Pro Thr Ile
1490 1495 1500
Tyr His Leu Arg Lys Lys Leu Val Asp Ser Thr Asp Lys Ala Asp
1505 1510 1515
Leu Arg Leu Ile Tyr Leu Ala Leu Ala His Met Ile Lys Phe Arg
1520 1525 1530
Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro Asp Asn Ser Asp
1535 1540 1545
Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr Asn Gln Leu
1550 1555 1560
Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala Lys Ala
1565 1570 1575
Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn Leu
1580 1585 1590
Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
1595 1600 1605
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn
1610 1615 1620
Phe Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr
1625 1630 1635
Tyr Asp Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln
1640 1645 1650
Tyr Ala Asp Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile
1655 1660 1665
Leu Leu Ser Asp Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala
1670 1675 1680
Pro Leu Ser Ala Ser Met Ile Lys Arg Tyr Asp Glu His His Gln
1685 1690 1695
Asp Leu Thr Leu Leu Lys Ala Leu Val Arg Gln Gln Leu Pro Glu
1700 1705 1710
Lys Tyr Lys Glu Ile Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala
1715 1720 1725
Gly Tyr Ile Asp Gly Gly Ala Ser Gln Glu Glu Phe Tyr Lys Phe
1730 1735 1740
Ile Lys Pro Ile Leu Glu Lys Met Asp Gly Thr Glu Glu Leu Leu
1745 1750 1755
Val Lys Leu Asn Arg Glu Asp Leu Leu Arg Lys Gln Arg Thr Phe
1760 1765 1770
Asp Asn Gly Ser Ile Pro His Gln Ile His Leu Gly Glu Leu His
1775 1780 1785
Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe Leu Lys Asp
1790 1795 1800
Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile Pro Tyr
1805 1810 1815
Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp Met
1820 1825 1830
Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
1835 1840 1845
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met
1850 1855 1860
Thr Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys
1865 1870 1875
His Ser Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr
1880 1885 1890
Lys Val Lys Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu
1895 1900 1905
Ser Gly Glu Gln Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr
1910 1915 1920
Asn Arg Lys Val Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys
1925 1930 1935
Lys Ile Glu Cys Phe Asp Ser Val Glu Ile Ser Gly Val Glu Asp
1940 1945 1950
Arg Phe Asn Ala Ser Leu Gly Thr Tyr His Asp Leu Leu Lys Ile
1955 1960 1965
Ile Lys Asp Lys Asp Phe Leu Asp Asn Glu Glu Asn Glu Asp Ile
1970 1975 1980
Leu Glu Asp Ile Val Leu Thr Leu Thr Leu Phe Glu Asp Arg Glu
1985 1990 1995
Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala His Leu Phe Asp Asp
2000 2005 2010
Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr Thr Gly Trp Gly
2015 2020 2025
Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp Lys Gln Ser
2030 2035 2040
Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe Ala Asn
2045 2050 2055
Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe Lys
2060 2065 2070
Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
2075 2080 2085
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys
2090 2095 2100
Gly Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val
2105 2110 2115
Met Gly Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg
2120 2125 2130
Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg
2135 2140 2145
Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile
2150 2155 2160
Leu Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln Asn Glu Lys
2165 2170 2175
Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met Tyr Val Asp
2180 2185 2190
Gln Glu Leu Asp Ile Asn Arg Leu Ser Asp Tyr Asp Val Asp His
2195 2200 2205
Ile Val Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile Asp Asn Lys
2210 2215 2220
Val Leu Thr Arg Ser Asp Lys Asn Arg Gly Lys Ser Asp Asn Val
2225 2230 2235
Pro Ser Glu Glu Val Val Lys Lys Met Lys Asn Tyr Trp Arg Gln
2240 2245 2250
Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe Asp Asn Leu
2255 2260 2265
Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp Lys Ala Gly
2270 2275 2280
Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr Lys His
2285 2290 2295
Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp Glu
2300 2305 2310
Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
2315 2320 2325
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val
2330 2335 2340
Arg Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn
2345 2350 2355
Ala Val Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu
2360 2365 2370
Ser Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys
2375 2380 2385
Met Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys
2390 2395 2400
Tyr Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile
2405 2410 2415
Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr
2420 2425 2430
Asn Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe
2435 2440 2445
Ala Thr Val Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val
2450 2455 2460
Lys Lys Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile
2465 2470 2475
Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp
2480 2485 2490
Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala
2495 2500 2505
Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys
2510 2515 2520
Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu
2525 2530 2535
Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys
2540 2545 2550
Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys
2555 2560 2565
Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala
2570 2575 2580
Ser Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser
2585 2590 2595
Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu
2600 2605 2610
Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu
2615 2620 2625
Gln His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu
2630 2635 2640
Phe Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val
2645 2650 2655
Leu Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln
2660 2665 2670
Ala Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala
2675 2680 2685
Pro Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg
2690 2695 2700
Tyr Thr Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln
2705 2710 2715
Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu
2720 2725 2730
Gly Gly Asp
2735
<210> 3
<211> 706
<212> PRT
<213> 嗜火液菌(Aquifex pyrophilus)
<220>
<221> misc_feature
<222> (214)..(214)
<223> Xaa可为任何天然产生的氨基酸
<220>
<221> misc_feature
<222> (278)..(278)
<223> Xaa可为任何天然产生的氨基酸
<220>
<221> misc_feature
<222> (450)..(450)
<223> Xaa可为任何天然产生的氨基酸
<220>
<221> misc_feature
<222> (665)..(665)
<223> Xaa可为任何天然产生的氨基酸
<220>
<221> misc_feature
<222> (689)..(689)
<223> Xaa可为任何天然产生的氨基酸
<220>
<221> misc_feature
<222> (703)..(703)
<223> Xaa可为任何天然产生的氨基酸
<400> 3
Met Gly Lys Glu Ala Leu Leu Asn Leu Tyr Arg Ile Glu Tyr Arg Pro
1 5 10 15
Lys Asp Thr Thr Phe Thr Val Phe Lys Pro Thr His Glu Ile Gln Lys
20 25 30
Glu Lys Leu Asn Lys Val Arg Trp Arg Val Phe Leu Gln Thr Gly Leu
35 40 45
Pro Thr Phe Arg Arg Glu Asp Glu Phe Trp Cys Ala Gly Lys Val Glu
50 55 60
Lys Asp Thr Leu Tyr Leu Thr Leu Ser Asn Gly Glu Ile Val Glu Leu
65 70 75 80
Lys Arg Val Gly Glu Glu Glu Phe Arg Gly Phe Gln Asn Glu Arg Glu
85 90 95
Cys Gln Glu Leu Phe Arg Asp Phe Leu Thr Lys Thr Lys Val Lys Asp
100 105 110
Lys Phe Ile Ser Asp Phe Tyr Lys Lys Phe Arg Asp Lys Ile Thr Val
115 120 125
Gln Gly Lys Asn Arg Lys Ile Ala Leu Ile Pro Glu Val Asn Glu Lys
130 135 140
Val Leu Lys Ser Glu Glu Gly Tyr Phe Leu Leu His Leu Asp Leu Lys
145 150 155 160
Phe Arg Ile Gln Pro Phe Glu Thr Leu Gln Thr Leu Leu Glu Arg Asn
165 170 175
Asp Phe Asn Pro Lys Arg Ile Arg Val Lys Pro Ile Gly Ile Asp Phe
180 185 190
Val Gly Arg Val Gln Asp Val Phe Lys Ala Lys Glu Lys Gly Glu Glu
195 200 205
Phe Phe Arg Leu Cys Xaa Glu Arg Ser Thr His Lys Ser Ser Lys Lys
210 215 220
Ala Trp Glu Glu Leu Leu Lys Asn Arg Glu Leu Arg Glu Lys Ala Phe
225 230 235 240
Leu Val Val Leu Glu Lys Gly Tyr Thr Tyr Pro Ala Thr Ile Leu Lys
245 250 255
Pro Val Leu Thr Tyr Glu Asn Leu Glu Asp Glu Glu Arg Asn Glu Val
260 265 270
Ala Asp Ile Val Arg Xaa Glu Pro Gly Lys Arg Leu Asn Leu Ile Arg
275 280 285
Tyr Ile Leu Arg Arg Tyr Val Lys Ala Leu Arg Asp Tyr Gly Trp Tyr
290 295 300
Ile Ser Pro Glu Glu Glu Arg Ala Lys Gly Lys Leu Asn Phe Lys Asp
305 310 315 320
Thr Val Leu Asp Ala Lys Gly Lys Asn Thr Lys Val Ile Thr Asn Leu
325 330 335
Arg Lys Phe Leu Glu Leu Cys Arg Pro Phe Val Lys Lys Asp Val Leu
340 345 350
Ser Val Glu Ile Ile Ser Val Ser Val Tyr Lys Lys Leu Glu Trp Arg
355 360 365
Lys Glu Glu Phe Leu Lys Glu Leu Ile Asn Phe Leu Lys Asn Lys Gly
370 375 380
Ile Lys Leu Lys Ile Lys Gly Lys Ser Leu Ile Leu Ala Gln Thr Arg
385 390 395 400
Glu Glu Ala Lys Glu Lys Leu Ile Pro Val Ile Asn Lys Ile Lys Asp
405 410 415
Val Asp Leu Val Ile Val Phe Leu Glu Glu Tyr Pro Lys Val Asp Pro
420 425 430
Tyr Lys Ser Phe Leu Leu Tyr Asp Phe Val Lys Arg Glu Leu Leu Lys
435 440 445
Lys Xaa Ile Pro Ser Gln Val Ile Leu Asn Arg Thr Leu Lys Asn Glu
450 455 460
Asn Leu Lys Phe Val Leu Leu Asn Val Ala Glu Gln Val Leu Ala Lys
465 470 475 480
Thr Gly Asn Ile Pro Tyr Lys Leu Lys Glu Ile Glu Gly Lys Val Asp
485 490 495
Ala Phe Val Gly Ile Asp Ile Ser Arg Ile Thr Arg Asp Gly Lys Thr
500 505 510
Val Asn Ala Val Ala Phe Thr Lys Ile Phe Asn Ser Lys Gly Glu Leu
515 520 525
Val Arg Tyr Tyr Leu Thr Ser Tyr Pro Ala Phe Gly Glu Lys Leu Thr
530 535 540
Glu Lys Ala Ile Gly Asp Val Phe Ser Leu Leu Glu Lys Leu Gly Phe
545 550 555 560
Lys Lys Gly Ser Lys Ile Val Val His Arg Asp Gly Arg Leu Tyr Arg
565 570 575
Asp Glu Val Ala Ala Phe Lys Lys Tyr Gly Glu Leu Tyr Gly Tyr Ser
580 585 590
Leu Glu Leu Leu Glu Ile Ile Lys Arg Asn Asn Pro Arg Phe Phe Ser
595 600 605
Asn Glu Lys Phe Ile Lys Gly Tyr Phe Tyr Lys Leu Ser Glu Asp Ser
610 615 620
Val Ile Leu Ala Thr Tyr Asn Gln Val Tyr Glu Gly Thr His Gln Pro
625 630 635 640
Ile Lys Val Arg Lys Val Tyr Gly Glu Leu Pro Val Glu Val Leu Cys
645 650 655
Ser Gln Ile Leu Ser Leu Thr Leu Xaa Asn Tyr Ser Ser Phe Gln Pro
660 665 670
Ile Lys Leu Pro Ala Thr Val His Tyr Ser Asp Lys Ile Thr Lys Leu
675 680 685
Xaa Leu Arg Gly Ile Glu Pro Ile Lys Lys Glu Gly Asp Ile Xaa Tyr
690 695 700
Trp Leu
705
<210> 4
<211> 493
<212> PRT
<213> 野油菜黄单胞菌致病变种阿莫瑞斯(Xanthomonas campestris pv.Armoraciae)
<400> 4
Met Gln Trp Ser Gly Ala Arg Ala Leu Glu Ala Leu Leu Thr Val Ala
1 5 10 15
Gly Glu Leu Arg Gly Pro Pro Leu Gln Leu Asp Thr Gly Gln Leu Leu
20 25 30
Lys Ile Ala Lys Arg Gly Gly Val Thr Ala Val Glu Ala Val His Ala
35 40 45
Trp Arg Asn Ala Leu Thr Gly Ala Pro Leu Asn Leu Thr Pro Glu Gln
50 55 60
Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr
65 70 75 80
Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro
85 90 95
Gln Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu
100 105 110
Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu
115 120 125
Thr Pro Glu Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln
130 135 140
Ala Leu Glu Thr Val Gln Ala Leu Leu Pro Val Leu Cys Gln Ala His
145 150 155 160
Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly
165 170 175
Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln
180 185 190
Ala His Gly Leu Thr Pro Gln Gln Val Val Ala Ile Ala Ser Asn Gly
195 200 205
Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu
210 215 220
Cys Gln Ala His Gly Leu Thr Pro Gln Gln Val Val Ala Ile Ala Ser
225 230 235 240
Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro
245 250 255
Val Leu Cys Gln Ala His Gly Leu Thr Pro Gln Gln Val Val Ala Ile
260 265 270
Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu
275 280 285
Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Gln Gln Val Val
290 295 300
Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln
305 310 315 320
Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Gln Gln
325 330 335
Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr
340 345 350
Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro
355 360 365
Glu Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu
370 375 380
Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu
385 390 395 400
Thr Pro Glu Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln
405 410 415
Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His
420 425 430
Gly Leu Thr Pro Gln Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly
435 440 445
Arg Pro Ala Leu Glu Ser Ile Val Ala Gln Leu Ser Arg Pro Asp Pro
450 455 460
Ala Leu Ala Ala Leu Thr Asn Asp His Leu Val Ala Leu Ala Cys Leu
465 470 475 480
Gly Gly Arg Pro Ala Leu Asp Ala Val Lys Lys Leu Glu
485 490
<210> 5
<211> 90
<212> PRT
<213> 人工序列
<220>
<223> 合成锌指蛋白Zif268
<400> 5
Met Glu Arg Pro Tyr Ala Cys Pro Val Glu Ser Cys Asp Arg Arg Phe
1 5 10 15
Ser Arg Ser Asp Glu Leu Thr Arg His Ile Arg Ile His Thr Gly Gln
20 25 30
Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Arg Ser Asp
35 40 45
His Leu Thr Thr His Ile Arg Thr His Thr Gly Glu Lys Pro Phe Ala
50 55 60
Cys Asp Ile Cys Gly Arg Lys Phe Ala Arg Ser Asp Glu Arg Lys Arg
65 70 75 80
His Thr Lys Ile His Leu Arg Gln Lys Asp
85 90
<210> 6
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 合成的SV40病毒大T抗原的核定位信号序列(NLS)
<400> 6
Pro Lys Lys Lys Arg Lys Val
1 5
<210> 7
<211> 16
<212> PRT
<213> 人工序列
<220>
<223> 合成的来自核质蛋白的核定位信号序列(NLS)
<400> 7
Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys
1 5 10 15
<210> 8
<211> 9
<212> PRT
<213> 人工序列
<220>
<223> 合成的c-myc核定位信号序列(NLS)
<400> 8
Pro Ala Ala Lys Arg Val Lys Leu Asp
1 5
<210> 9
<211> 11
<212> PRT
<213> 人工序列
<220>
<223> 合成的c-myc核定位信号序列(NLS)
<400> 9
Arg Gln Arg Arg Asn Glu Leu Lys Arg Ser Pro
1 5 10
<210> 10
<211> 38
<212> PRT
<213> 人工序列
<220>
<223> 合成的hRNPAI M9核定位信号序列(NLS)
<400> 10
Asn Gln Ser Ser Asn Phe Gly Pro Met Lys Gly Gly Asn Phe Gly Gly
1 5 10 15
Arg Ser Ser Gly Pro Tyr Gly Gly Gly Gly Gln Tyr Phe Ala Lys Pro
20 25 30
Arg Asn Gln Gly Gly Tyr
35
<210> 11
<211> 42
<212> PRT
<213> 人工序列
<220>
<223> 合成的来自输入蛋白-α的IBB结构域的核定位信号序列(NLS)
<400> 11
Arg Met Arg Ile Glx Phe Lys Asn Lys Gly Lys Asp Thr Ala Glu Leu
1 5 10 15
Arg Arg Arg Arg Val Glu Val Ser Val Glu Leu Arg Lys Ala Lys Lys
20 25 30
Asp Glu Gln Ile Leu Lys Arg Arg Asn Val
35 40
<210> 12
<211> 8
<212> PRT
<213> 人工序列
<220>
<223> 合成的肌瘤T蛋白的的核定位信号序列(NLS)
<400> 12
Val Ser Arg Lys Arg Pro Arg Pro
1 5
<210> 13
<211> 8
<212> PRT
<213> 人工序列
<220>
<223> 合成的肌瘤T蛋白的的核定位信号序列(NLS)
<400> 13
Pro Pro Lys Lys Ala Arg Glu Asp
1 5
<210> 14
<211> 8
<212> PRT
<213> 人工序列
<220>
<223> 合成的人p53的核定位信号序列(NLS)
<400> 14
Pro Gln Pro Lys Lys Lys Pro Leu
1 5
<210> 15
<211> 12
<212> PRT
<213> 人工序列
<220>
<223> 合成的小鼠c-abl IV的核定位信号序列(NLS)
<400> 15
Ser Ala Leu Ile Lys Lys Lys Lys Lys Met Ala Pro
1 5 10
<210> 16
<211> 5
<212> PRT
<213> 人工序列
<220>
<223> 合成的流感病毒NS1的核定位信号序列(NLS)
<400> 16
Asp Arg Leu Arg Arg
1 5
<210> 17
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 合成的流感病毒NS1的核定位信号序列(NLS)
<400> 17
Pro Lys Gln Lys Lys Arg Lys
1 5
<210> 18
<211> 10
<212> PRT
<213> 人工序列
<220>
<223> 合成的丁型肝炎病毒抗原的核定位信号序列(NLS)
<400> 18
Arg Lys Leu Lys Lys Lys Ile Lys Lys Leu
1 5 10
<210> 19
<211> 10
<212> PRT
<213> 人工序列
<220>
<223> 合成的小鼠Mx蛋白的核定位信号序列(NLS)
<400> 19
Arg Glu Lys Lys Lys Phe Leu Lys Arg Arg
1 5 10
<210> 20
<211> 20
<212> PRT
<213> 人工序列
<220>
<223> 合成的人多聚(ADP-核糖)聚合酶的核定位信号序列(NLS)
<400> 20
Lys Arg Lys Gly Asp Glu Val Asp Gly Val Asp Glu Val Ala Lys Lys
1 5 10 15
Lys Ser Lys Lys
20
<210> 21
<211> 17
<212> PRT
<213> 人工序列
<220>
<223> 合成的甾族激素受体(人)糖皮质激素的核定位信号序列(NLS)
<400> 21
Arg Lys Cys Leu Gln Ala Gly Met Asn Leu Glu Ala Arg Lys Thr Lys
1 5 10 15
Lys

Claims (38)

1.一种多肽构建体,其包含第一序列特异性DNA结合蛋白,选自Cas9蛋白或Ago蛋白,连接至第二序列特异性DNA结合蛋白。
2.如权利要求1所述的多肽构建体,其中,第一序列特异性DNA结合蛋白是Cas 9蛋白。
3.如权利要求2所述的多肽构建体,其中,Cas9蛋白是dCas9蛋白。
4.如权利要求2所述的多肽构建体,其中,Cas9蛋白是活性Cas9蛋白。
5.如权利要求2所述的多肽构建体,其中,第一dCas9多肽连接至第二Cas9多肽。
6.如权利要求5所述的多肽构建体,其中,第二Cas9多肽是第二dCas9多肽。
7.如权利要求5所述的多肽构建体,其中,第二Cas9多肽是核酸酶活性Cas9多肽。
8.如权利要求1-7中任一项所述的多肽构建体,其中,第一序列特异性DNA结合蛋白共价连接至第二序列特异性DNA结合蛋白。
9.如权利要求1-8中任一项所述的多肽构建体,其中,第一序列特异性DNA结合蛋白以翻译性融合蛋白的形式共价连接至第二序列特异性DNA结合蛋白。
10.如权利要求1-8中任一项所述的多肽构建体,其中,第一序列特异性DNA结合蛋白通过一个或多个二聚化结构域连接至第二序列特异性DNA结合蛋白。
11.如权利要求5所述的多肽构建体,其中,第一dCas9多肽结合至第一向导RNA,且第二Cas9多肽结合至第二向导RNA,并且第一dCas9多肽通过第一向导RNA与第二向导RNA的相互作用连接至第二Cas9多肽。
12.如权利要求5所述的多肽构建体,其中,第一dCas9多肽和第二Cas9多肽结合至RNA,所述RNA包含:
第一Cas9引导序列;第一tracr RNA序列;第二Cas9引导序列;和第二tracr RNA序列,其中:
第一dCas多肽结合至第一tracr RNA序列,且第二Cas9多肽结合至第二tracr序列;或
第一dCas多肽结合至第二tracr RNA序列,且第二Cas9多肽结合至第一tracr序列,
从而第一dCas多肽和第二Cas多肽通过该RNA结合在一起。
13.如权利要求1-4中任一项所述的多肽构建体,其中,第二序列特异性DNA结合蛋白包含TALE DNA结合结构域或锌指蛋白。
14.如权利要求1所述的多肽构建体,其中,第一序列特异性DNA结合蛋白是Ago蛋白。
15.如权利要求14所述的多肽构建体,其中,第二序列特异性DNA结合蛋白包括Cas9蛋白、Ago蛋白、TALE DNA-结合结构域,或锌指蛋白。
16.一种细胞,其包含如权利要求1-15中任一项所述的多肽构建体。
17.如权利要求16所述的细胞,其中,所述细胞是真核细胞。
18.如权利要求17所述的细胞,其中,所述细胞是人细胞。
19.一种核酸,其编码如权利要求9所述的翻译性融合蛋白。
20.一种细胞,其包含如权利要求19所述的核酸。
21.如权利要求20所述的细胞,其中,所述细胞是真核细胞。
22.如权利要求21所述的细胞,其中,所述细胞是人细胞。
23.一种将如权利要求1-15中任一项所述的多肽构建体引入真核细胞的方法,所述方法包括,将所述多肽构建体引入所述细胞。
24.如权利要求23所述的方法,其中,所述多肽构建体通过电穿孔被引入所述细胞。
25.如权利要求23所述的方法,其中,第一序列特异性DNA结合蛋白以翻译性融合蛋白形式共价连接至第二序列特异性DNA结合蛋白,并且,将编码所述翻译性融合蛋白的核酸引入所述细胞,其中,所述多肽构建体在所述细胞中表达,由此将所述多肽构建体引入所述细胞。
26.一种RNA,其从5’到3’包含:
第一Cas9引导序列;
第一tracr RNA序列;
第二Cas9引导序列;和
第二tracr RNA序列。
27.一种RNA,其从5’到3’包含:
第一Cas9引导序列;
第二Cas9引导序列;和
第一tracr RNA序列,后跟第二tracr RNA序列;或
第二tracr RNA序列,后跟第一tracr RNA序列。
28.一种表达盒,其包含操作性地连接至编码如权利要求26或27所述的RNA的多核苷酸的启动子。
29.一种细胞,其包含如权利要求28所述的表达盒。
30.如权利要求29所述的细胞,其中,所述细胞是真核细胞。
31.如权利要求30所述的细胞,其中,所述细胞是人细胞。
32.一种组合物,其包含:
如权利要求26或27所述的RNA;
第一dCas9多肽;和
第二Cas9多肽。
33.如权利要求32所述的组合物,其中,第二Cas9多肽是第二dCas9多肽。
34.如权利要求32所述的组合物,其中,第二Cas9多肽是核酸酶活性Cas9多肽。
35.一种细胞,其包含如权利要求32-34中任一项所述的组合物。
36.如权利要求35所述的细胞,其中,所述细胞是真核细胞。
37.如权利要求36所述的细胞,其中,所述细胞是人细胞。
38.一种将如权利要求32-34中任一项所述的组合物引入细胞的方法,所述方法包括,
将所述组合物,或其全部组分(所述RNA、第一dCas9多肽和第二Cas9多肽),引入所述细胞。
CN201780026570.XA 2016-04-29 2017-04-27 用于核酸序列的特异性靶向的二聚蛋白质 Pending CN109152808A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201662329740P 2016-04-29 2016-04-29
US62/329,740 2016-04-29
PCT/US2017/029794 WO2017189821A1 (en) 2016-04-29 2017-04-27 Dimeric proteins for specific targeting of nucleic acid sequences

Publications (1)

Publication Number Publication Date
CN109152808A true CN109152808A (zh) 2019-01-04

Family

ID=60158105

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201780026570.XA Pending CN109152808A (zh) 2016-04-29 2017-04-27 用于核酸序列的特异性靶向的二聚蛋白质

Country Status (4)

Country Link
US (1) US20170314002A1 (zh)
EP (1) EP3448407A4 (zh)
CN (1) CN109152808A (zh)
WO (1) WO2017189821A1 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020187272A1 (zh) * 2019-03-19 2020-09-24 上海邦耀生物科技有限公司 一种用于基因治疗的融合蛋白及其应用
WO2020187268A1 (zh) * 2019-03-19 2020-09-24 上海邦耀生物科技有限公司 一种增强基因编辑的融合蛋白及其应用

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
LT3604527T (lt) * 2016-06-02 2021-06-25 Sigma-Aldrich Co., Llc Programuojamų, dnr surišančių baltymų panaudojimas tiksliniam genomo modifikavimui pagerinti
EP3652312A1 (en) 2017-07-14 2020-05-20 Editas Medicine, Inc. Systems and methods for targeted integration and genome editing and detection thereof using integrated priming sites
WO2019236982A1 (en) * 2018-06-08 2019-12-12 Locana, Inc. Rna-targeting fusion protein compositions and methods for use
AU2019291918B2 (en) 2018-06-29 2025-06-12 Editas Medicine, Inc. Synthetic guide molecules, compositions and methods relating thereto

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101410411A (zh) * 2006-02-09 2009-04-15 转化技术制药公司 Rage融合蛋白及使用方法
US20150044772A1 (en) * 2013-08-09 2015-02-12 Sage Labs, Inc. Crispr/cas system-based novel fusion protein and its applications in genome editing
WO2015028969A2 (en) * 2013-08-28 2015-03-05 Koninklijke Nederlandse Akademie Van Wetenschappen Transduction buffer
US20150071902A1 (en) * 2013-09-06 2015-03-12 President And Fellows Of Harvard College Extended DNA-Sensing GRNAS
US20150071899A1 (en) * 2013-09-06 2015-03-12 President And Fellows Of Harvard College Cas9-foki fusion proteins and uses thereof

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10190106B2 (en) * 2014-12-22 2019-01-29 Univesity Of Massachusetts Cas9-DNA targeting unit chimeras

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101410411A (zh) * 2006-02-09 2009-04-15 转化技术制药公司 Rage融合蛋白及使用方法
US20150044772A1 (en) * 2013-08-09 2015-02-12 Sage Labs, Inc. Crispr/cas system-based novel fusion protein and its applications in genome editing
WO2015028969A2 (en) * 2013-08-28 2015-03-05 Koninklijke Nederlandse Akademie Van Wetenschappen Transduction buffer
US20150071902A1 (en) * 2013-09-06 2015-03-12 President And Fellows Of Harvard College Extended DNA-Sensing GRNAS
US20150071899A1 (en) * 2013-09-06 2015-03-12 President And Fellows Of Harvard College Cas9-foki fusion proteins and uses thereof
WO2015035162A2 (en) * 2013-09-06 2015-03-12 President And Fellows Of Harvard College Cas9 variants and uses thereof

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
EMINE KAYA ET AL.: ""A bacterial Argonaute with noncanonical guide RNA specificity"", 《PNAS》 *
JOHN P. GUILINGER ET AL.: ""Fusion of catalytically inactive Cas9 to FokI nuclease improves the specificity of genome modification"", 《NAT BIOTECHNOL.》 *
SHENGDAR Q. TSAI ET AL.: ""Dimeric CRISPR RNA-guided FokI nucleases for highly specific genome editing"", 《NAT BIOTECHNOL.》 *
周金伟等: ""CRISPR/Cas9 基因组编辑技术及其在动物基因组定点修饰中的应用"", 《遗传HEREDITAS(BEIJING)》 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020187272A1 (zh) * 2019-03-19 2020-09-24 上海邦耀生物科技有限公司 一种用于基因治疗的融合蛋白及其应用
WO2020187268A1 (zh) * 2019-03-19 2020-09-24 上海邦耀生物科技有限公司 一种增强基因编辑的融合蛋白及其应用
CN111718418A (zh) * 2019-03-19 2020-09-29 华东师范大学 一种增强基因编辑的融合蛋白及其应用
CN111718418B (zh) * 2019-03-19 2021-08-27 华东师范大学 一种增强基因编辑的融合蛋白及其应用
EP3943512A4 (en) * 2019-03-19 2023-01-25 Bioray Laboratories Inc FUSION PROTEIN TO ENHANCE GENE EDITING AND USE

Also Published As

Publication number Publication date
WO2017189821A1 (en) 2017-11-02
US20170314002A1 (en) 2017-11-02
EP3448407A4 (en) 2019-10-16
EP3448407A1 (en) 2019-03-06

Similar Documents

Publication Publication Date Title
CN109152808A (zh) 用于核酸序列的特异性靶向的二聚蛋白质
AU2019204675B2 (en) Using rna-guided foki nucleases (rfns) to increase specificity for rna-guided genome editing
US11946040B2 (en) Adenine DNA base editor variants with reduced off-target RNA editing
KR102606680B1 (ko) S. 피오게네스 cas9 돌연변이 유전자 및 이에 의해 암호화되는 폴리펩티드
US10011850B2 (en) Using RNA-guided FokI Nucleases (RFNs) to increase specificity for RNA-Guided Genome Editing
CN114846146A (zh) 用于增加CRISPR/Cas12f1系统的效率的工程化引导RNA及其用途
EP3633032A2 (en) Novel cas9 proteins and guiding features for dna targeting and genome editing
CN112639089B (zh) 重组型kod聚合酶
WO2020132966A1 (zh) 酶活性提高的逆转录酶及其应用
CN113316636B (zh) 酶活性提高的dna聚合酶及其应用
Park et al. Group II intron-like reverse transcriptases function in double-strand break repair
CN109957557A (zh) Dna聚合酶及其制备方法
Grayburn et al. The mitochondrial genome of Saprolegnia ferax: organization, gene content and nucleotide sequence
KR102151064B1 (ko) 매칭된 5' 뉴클레오타이드를 포함하는 가이드 rna를 포함하는 유전자 교정용 조성물 및 이를 이용한 유전자 교정 방법
CN115109798A (zh) 改进的cg碱基编辑系统
WO2022082482A1 (zh) 重组型kod聚合酶
WO2022060775A1 (en) Recombinant proteins with increased solubility and stability
US20250179445A1 (en) Recombinant kod polymerase
US20240360477A1 (en) Systems and methods for transposing cargo nucleotide sequences
CN104498451A (zh) 兼具核酸外切和单链dna交换活性的重组酶及其应用
BASE Adenine Dna Base Editor Variants With Reduced Off-target Rna Editing
WO2006091813A2 (en) Novel thermophilic proteins and the nucleic acids encoding them

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20190104

WD01 Invention patent application deemed withdrawn after publication