[go: up one dir, main page]

CN113302289A - 末端脱氧核苷酸转移酶变体及其用途 - Google Patents

末端脱氧核苷酸转移酶变体及其用途 Download PDF

Info

Publication number
CN113302289A
CN113302289A CN201980089035.8A CN201980089035A CN113302289A CN 113302289 A CN113302289 A CN 113302289A CN 201980089035 A CN201980089035 A CN 201980089035A CN 113302289 A CN113302289 A CN 113302289A
Authority
CN
China
Prior art keywords
seq
substitution
relative
leu
glu
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201980089035.8A
Other languages
English (en)
Inventor
伊莉斯·钱皮恩
杰罗姆·洛奇
米哈伊尔·索斯金
埃洛迪·苏尼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
DNA Script SAS
Original Assignee
DNA Script SAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by DNA Script SAS filed Critical DNA Script SAS
Publication of CN113302289A publication Critical patent/CN113302289A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/12Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
    • C12N9/1241Nucleotidyltransferases (2.7.7)
    • C12N9/1264DNA nucleotidylexotransferase (2.7.7.31), i.e. terminal nucleotidyl transferase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y207/00Transferases transferring phosphorus-containing groups (2.7)
    • C12Y207/07Nucleotidyltransferases (2.7.7)
    • C12Y207/07031DNA nucleotidylexotransferase (2.7.7.31), i.e. terminal deoxynucleotidyl transferase

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Microbiology (AREA)
  • Biotechnology (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Medicinal Chemistry (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Peptides Or Proteins (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)

Abstract

本发明涉及末端脱氧核苷酸转移酶(TdT)变体,其(i)包含与所示SEQ ID NO至少指定百分比相同,并且在Q455处具有至少一种取代,或具有在Q455处的至少一种取代加上在G186、S248、T331、Q390、K394或H466处的另外至少一种取代(其中位置是相对于SEQ ID NO:1和所示SEQ ID NO中的功能上等同的位置)的氨基酸序列,(ii)能够无模板延伸多核苷酸,和(iii)在将3’‑O‑封闭的核苷三磷酸掺入到多核苷酸中表现出增强的稳定性或增强的效率。本发明还涉及这些TdT变体用于合成任何预定的序列的多核苷酸的用途。

Description

末端脱氧核苷酸转移酶变体及其用途
背景
各种各样长度、高度纯化、低价格的预定序列多核苷酸的使用已经成为许多技术的核心,包括基因组测序和诊断测序、多重核酸扩增、治疗性抗体开发、合成生物学、基于核酸的治疗、DNA折纸术(DNA origami)、基于DNA的数据存储等。最近,人们对使用无模板聚合酶(诸如末端脱氧核苷酸转移酶(TdT))通过基于酶促的方法来补充或替代基于化学的合成方法产生了兴趣,因为这种酶已被证明有效,并且具有反应条件温和无毒的益处,例如Ybert等人等人,国际专利公布WO2015/159023;Hiatt等人,美国专利5763594;Jensen等人,Biochemistry,57:1821-1832(2018);等等。大多数基于酶的合成方法需要使用可逆封闭的核苷三磷酸,以便在多核苷酸产物中获得所需的序列。遗憾地是,天然TdT掺入这种修饰的核苷三磷酸的效率与未修饰的核苷三磷酸相比大大降低。
鉴于上文,如果可获得能够以较高效率掺入可逆封闭的核苷三磷酸的新的无模板聚合酶,诸如变体TdT,则基于无模板酶促的多核苷酸合成领域将会得到发展。
发明概述
本发明涉及在将可逆封闭的核苷三磷酸掺入到多核苷酸中展示出增强的效率的末端脱氧核苷酸转移酶(TdT)变体,以及它们在合成任何预定序列的多核苷酸中的用途。此外,在一些实施方案中,本发明的TdT变体相对于野生型酶表现出增强的稳定性。本发明部分地基于这样的发现,即基于TdT的核苷酸掺入的效率部分地取决于被延伸的多核苷酸3’端的核苷酸序列;因此,本发明部分地是对本发明的TdT变体能够不依赖于多核苷酸3’端核苷酸序列地有效延伸多核苷酸的理解和认识。
在一些实施方案中,本发明涉及末端脱氧核苷酸转移酶(TdT)变体,该末端脱氧核苷酸转移酶变体包含与选自SEQ ID NO:3、4、5、6、7、8、9、10、11、12、13、14、15或16的氨基酸序列至少60%相同的氨基酸序列,具有以下谷氨酰胺取代:在相对于SEQ ID NO:3、8、10和14的位置326处的谷氨酰胺取代,或在相对于SEQ ID NO:4和5的位置325处的谷氨酰胺取代,或在相对于SEQ ID NO:7和9的位置332处的谷氨酰胺取代,或在相对于SEQ ID NO:13和16的位置329处的谷氨酰胺取代,或在相对于SEQ ID NO:6的位置321处的谷氨酰胺取代,或在相对于SEQ ID NO:11的位置327处的谷氨酰胺取代,或在相对于SEQ ID NO:12的位置324处的谷氨酰胺取代,或在相对于SEQ ID NO:15的位置339处的谷氨酰胺取代,或在相对于SEQ ID NO:24和26的位置309处的谷氨酰胺取代,或在相对于SEQ ID NO:25的位置307处的谷氨酰胺取代,其中TdT变体(i)能够在无模板的条件下合成核酸片段,并且(ii)能够将3’-O-修饰的核苷酸掺入核酸片段的游离3’-羟基上。
在一些实施方案中,上述与所示SEQ ID NO的同一性百分比值为至少80%同一性;在一些实施方案中,上述与所示SEQ ID NO的同一性百分比值为至少90%同一性;在一些实施方案中,上述与所示SEQ ID NO的同一性百分比值为至少95%同一性;在一些实施方案中,上述同一性百分比值为至少97%同一性;在一些实施方案中,上述同一性百分比值为至少98%同一性;在一些实施方案中,上述同一性百分比值为至少99%同一性。在一些实施方案中,变体由选自由SEQ ID NO:3、4、5、6、7、8、9、10、11、12、13、14、15、16、24、25或26组成的组的序列组成,具有一种或更多种本公开内容的氨基酸取代。如本文所用,用于将参考序列与变体序列进行比较的同一性百分比值不包括明确指定的包含变体序列取代的氨基酸位置;也就是说,同一性百分比关系是在参考蛋白序列和明确指定的包含变体中的取代的位置之外的变体蛋白序列之间。因此,例如,如果参考序列和变体序列各自包含100个氨基酸,并且变体序列在位置25和81处具有突变,那么序列同一性百分比将是关于序列1-24、26-80和82-100的。
关于(ii),所述3’-O-修饰的核苷酸可以包括3’-O-NH2-核苷三磷酸、3’-O-叠氮甲基-核苷三磷酸、3’-O-烯丙基-核苷三磷酸、3’-O-(2-硝基苄基)-核苷三磷酸或3’-O-炔丙基-核苷三磷酸。
在一些实施方案中,上述谷氨酰胺的取代选自由T、F、L和M组成的组;在其他实施方案中,上述谷氨酰胺的取代选自由T、F、L、M、I、V和Y组成的组。在一些实施方案中,所述取代是F。在一些实施方案中,谷氨酰胺的取代可以与本文所述的其他其他突变组合,诸如下述的在赖氨酸、组氨酸、丙氨酸、色氨酸、甘氨酸或谷氨酰胺处的突变。
在一些实施方案中,本发明涉及末端脱氧核苷酸转移酶(TdT)变体,该脱氧核苷酸转移酶变体包含与选自SEQ ID NO:3、5、6、7、8、9、10、11、12、13、14、15或16的氨基酸序列至少60%相同的氨基酸序列,并且包含以下赖氨酸取代:在相对于SEQ ID NO:3、7、8、9、10、13和14的位置265处的赖氨酸取代,或在相对于SEQ ID NO:6和12的位置263处的赖氨酸取代,或在相对于SEQ ID NO:5的位置264处的赖氨酸取代,或在相对于SEQ ID NO:11的位置266处的赖氨酸取代,或在相对于SEQ ID NO:16的位置268处的赖氨酸取代,或在相对于SEQ IDNO:15的位置272处的赖氨酸取代,其中TdT变体(i)能够在无模板的条件下合成核酸片段,并且(ii)能够将3’-O-修饰的核苷酸掺入到核酸片段的游离3’-羟基上。在一些实施方案中,上述与所示SEQ ID NO的同一性百分比值为至少80%同一性;在一些实施方案中,上述与所示SEQ ID NO的同一性百分比值为至少90%同一性;在一些实施方案中,上述与所示SEQ ID NO的同一性百分比值为至少95%同一性;在一些实施方案中,上述同一性百分比值为至少97%同一性;在一些实施方案中,上述同一性百分比值为至少98%同一性;在一些实施方案中,上述同一性百分比值为至少99%同一性。关于(ii),所述3’-O-修饰的核苷酸可以包括3’-O-NH2-核苷三磷酸、3’-O-叠氮甲基-核苷三磷酸、3’-O-烯丙基-核苷三磷酸、3’-O-(2-硝基苄基)-核苷三磷酸或3’-O-炔丙基-核苷三磷酸。在一些实施方案中,赖氨酸的氨基酸取代选自由E、T、A和R组成的组。在一些实施方案中,所述取代是T。在一些实施方案中,赖氨酸的取代可以与本文所述的其他突变组合,诸如上述的谷氨酰胺处的突变,或下述的组氨酸、丙氨酸、色氨酸、甘氨酸或谷氨酰胺处的突变。
在一些实施方案中,本发明涉及末端脱氧核苷酸转移酶(TdT)变体,该末端脱氧核苷酸转移酶变体包含与选自SEQ ID NO:3、4、5、6、7、8、9、10、11、12、13、14、15或16的氨基酸序列至少60%相同的氨基酸序列,并且包含以下组氨酸取代:在相对于SEQ ID NO:3、8、10和14的位置337处的组氨酸取代,或在相对于SEQ ID NO:4和5的位置336处的组氨酸取代,或在相对于SEQ ID NO:7和9的位置343处的组氨酸取代,或在相对于SEQ ID NO:13和16的位置340处的组氨酸取代,或在相对于SEQ ID NO:6的位置332处的组氨酸取代,或在相对于SEQ ID NO:11的位置338处的组氨酸取代,或在相对于SEQ ID NO:12的位置335处的组氨酸取代,或在相对于SEQ ID NO:15的位置350处的组氨酸取代,其中TdT变体(i)能够在无模板的条件下合成核酸片段,并且(ii)能够将3’-O-修饰的核苷酸掺入到核酸片段的游离3’-羟基上。在一些实施方案中,上述与所示SEQ ID NO的同一性百分比值为至少80%同一性;在一些实施方案中,上述与所示SEQ ID NO的同一性百分比值为至少90%同一性;在一些实施方案中,上述与所示SEQ ID NO的同一性百分比值为至少95%同一性;在一些实施方案中,上述同一性百分比值为至少97%同一性;在一些实施方案中,上述同一性百分比值为至少98%同一性;在一些实施方案中,上述同一性百分比值为至少99%同一性。关于(ii),所述3’-O-修饰的核苷酸可以包括3’-O-NH2-核苷三磷酸、3’-O-叠氮甲基-核苷三磷酸、3’-O-烯丙基-核苷三磷酸、3’-O-(2-硝基苄基)-核苷三磷酸或3’-O-炔丙基-核苷三磷酸。在一些实施方案中,组氨酸的氨基酸取代选自由Y、F、N和D组成的组。在一些实施方案中,组氨酸的取代可以与本文所述的其他突变组合,诸如上述的谷氨酰胺或赖氨酸处的突变,或下述的丙氨酸、色氨酸、甘氨酸或谷氨酰胺处的突变。
在一些实施方案中,本发明涉及末端脱氧核苷酸转移酶(TdT)变体,该末端脱氧核苷酸转移酶变体包含与选自SEQ ID NO:3、4、5、6、8、9、10、11、12、13、14或15的氨基酸序列至少60%相同的氨基酸序列,并且包含在以下色氨酸取代:在相对于SEQ ID NO:3、8、10和14的位置377处的色氨酸取代,或在相对于SEQ ID NO:4和5的位置376处的色氨酸取代,或在相对于SEQ ID NO:6的位置372处的色氨酸取代,或在相对于SEQ ID NO:13的位置380处的色氨酸取代,或在相对于SEQ ID NO:9的位置383处的色氨酸取代,或在相对于SEQ IDNO:11的位置378处的色氨酸取代,或在相对于SEQ ID NO:12的位置375处的色氨酸取代,或在相对于SEQ ID NO:13的位置380处的色氨酸取代,或在相对于SEQ ID NO:15的位置390处的色氨酸取代,其中TdT变体(i)能够在无模板的条件下合成核酸片段,并且(ii)能够将3’-O-修饰的核苷酸掺入核酸片段的游离3’-羟基上。在一些实施方案中,上述与所示SEQ IDNO的同一性百分比值为至少80%同一性;在一些实施方案中,上述与所示SEQ ID NO的同一性百分比值为至少90%同一性;在一些实施方案中,上述与所示SEQ ID NO的同一性百分比值为至少95%同一性;在一些实施方案中,上述同一性百分比值为至少97%同一性;在一些实施方案中,上述同一性百分比值为至少98%同一性;在一些实施方案中,上述同一性百分比值为至少99%同一性。关于(ii),所述3’-O-修饰的核苷酸可以包括3’-O-NH2-核苷三磷酸、3’-O-叠氮甲基-核苷三磷酸、3’-O-烯丙基-核苷三磷酸、3’-O-(2-硝基苄基)-核苷三磷酸或3’-O-炔丙基-核苷三磷酸。在一些实施方案中,色氨酸被R或K取代。在一些实施方案中,色氨酸被R取代。在一些实施方案中,色氨酸的取代可以与本文所述的其他突变组合,诸如上述的谷氨酰胺、赖氨酸或组氨酸处的突变,或下述的丙氨酸、甘氨酸或谷氨酰胺处的突变。
在一些实施方案中,本发明涉及末端脱氧核苷酸转移酶(TdT)变体,该末端脱氧核苷酸转移酶变体包含与选自SEQ ID NO:3、4、5、6、8、10、11、13、14、15或16的氨基酸序列至少60%相同的氨基酸序列,具有在相对于SEQ ID NO:3、4,5,6,8、10,13,14和15的位置17处的丙氨酸取代或在相对于SEQ ID NO:11和16的位置18处的丙氨酸取代,其中TdT变体(i)能够在无模板的条件下合成核酸片段,并且(ii)能够将3’-O-修饰的核苷酸掺入到核酸片段的游离3’-羟基上。在一些实施方案中,上述与所示SEQ ID NO的同一性百分比值为至少80%同一性;在一些实施方案中,上述与所示SEQ ID NO的同一性百分比值为至少90%同一性;在一些实施方案中,上述与所示SEQ ID NO的同一性百分比值为至少95%同一性;在一些实施方案中,上述同一性百分比值为至少97%同一性;在一些实施方案中,上述同一性百分比值为至少98%同一性;在一些实施方案中,上述同一性百分比值为至少99%同一性。关于(ii),所述3’-O-修饰的核苷酸可以包括3’-O-NH2-核苷三磷酸、3’-O-叠氮甲基-核苷三磷酸、3’-O-烯丙基-核苷三磷酸、3’-O-(2-硝基苄基)-核苷三磷酸或3’-O-炔丙基-核苷三磷酸。在一些实施方案中,上述丙氨酸取代是V、I或L。在一些实施方案中,上述丙氨酸取代是V。在一些实施方案中,丙氨酸的取代可以与本文所述的其他突变组合,诸如上述的谷氨酰胺、赖氨酸、组氨酸或色氨酸处的突变,或下述的甘氨酸或谷氨酰胺处的突变。
在一些实施方案中,本发明涉及末端脱氧核苷酸转移酶(TdT)变体,该末端脱氧核苷酸转移酶变体包含与选自SEQ ID NO:3、9、11或15的氨基酸序列至少60%相同的氨基酸序列,具有在相对于SEQ ID NO:3和15的位置57处的甘氨酸取代或在相对于SEQ ID NO:9和11的位置58处的甘氨酸取代,其中TdT变体(i)能够在无模板的条件下合成核酸片段,并且(ii)能够将3’-O-修饰的核苷酸掺入到核酸片段的游离3’-羟基上。在一些实施方案中,上述与所示SEQ ID NO的同一性百分比值为至少80%同一性;在一些实施方案中,上述与所示SEQ ID NO的同一性百分比值为至少90%同一性;在一些实施方案中,上述与所示SEQ IDNO的同一性百分比值为至少95%同一性;在一些实施方案中,上述同一性百分比值为至少97%同一性;在一些实施方案中,上述同一性百分比值为至少98%同一性;在一些实施方案中,上述同一性百分比值为至少99%同一性。关于(ii),所述3’-O-修饰的核苷酸可以包括3’-O-NH2-核苷三磷酸、3’-O-叠氮甲基-核苷三磷酸、3’-O-烯丙基-核苷三磷酸、3’-O-(2-硝基苄基)-核苷三磷酸或3’-O-炔丙基-核苷三磷酸。在一些实施方案中,上述甘氨酸取代是E。在一些实施方案中,甘氨酸的取代可以与本文所述的其他突变组合,诸如上述的谷氨酰胺、赖氨酸、组氨酸、色氨酸或丙氨酸和/或下述的谷氨酰胺处的突变。
在一些实施方案中,本发明涉及末端脱氧核苷酸转移酶(TdT)变体,该末端脱氧核苷酸转移酶变体包含与选自SEQ ID NO:3、4或6的氨基酸序列至少60%相同的氨基酸序列,并且包含在相对于SEQ ID NO:3的位置261处的谷氨酰胺取代或在相对于SEQ ID NO:6的位置262处的谷氨酰胺取代或在相对于SEQ ID NO:4的位置264处的谷氨酰胺取代,其中所述TdT变体(i)能够在无模板的条件下合成核酸片段,并且(ii)能够将3’-O-修饰的核苷酸掺入到核酸片段的游离3’-羟基上。在一些实施方案中,上述与所示SEQ ID NO的同一性百分比值为至少80%同一性;在一些实施方案中,上述与所示SEQ ID NO的同一性百分比值为至少90%同一性;在一些实施方案中,上述与所示SEQ ID NO的同一性百分比值为至少95%同一性;在一些实施方案中,上述同一性百分比值为至少97%同一性;在一些实施方案中,上述同一性百分比值为至少98%同一性;在一些实施方案中,上述同一性百分比值为至少99%同一性。关于(ii),所述3’-O-修饰的核苷酸可以包括3’-O-NH2-核苷三磷酸、3’-O-叠氮甲基-核苷三磷酸、3’-O-烯丙基-核苷三磷酸、3’-O-(2-硝基苄基)-核苷三磷酸或3’-O-炔丙基-核苷三磷酸。在一些实施方案中,谷氨酰胺的氨基酸取代为R。在一些实施方案中,在所述位置处的谷氨酰胺的取代可以与本文所述的其他突变组合,诸如上述的谷氨酰胺、组氨酸、赖氨酸、丙氨酸、色氨酸或甘氨酸处的突变。
在一些实施方案中,本发明涉及末端脱氧核苷酸转移酶(TdT)变体,该末端脱氧核苷酸转移酶变体包含与SEQ ID NO:4中列出的氨基酸序列至少90%相同的氨基酸序列,具有位置M63、R207、R324、E327处的取代。在一些实施方案中,本发明涉及末端脱氧核苷酸转移酶(TdT)变体,该末端脱氧核苷酸转移酶变体包含与SEQ ID NO:24中列出的氨基酸序列至少90%相同的氨基酸序列或由与SEQ ID NO:24中列出的氨基酸序列至少90%相同的氨基酸序列组成,具有位置M47、R190、R308和E311处的取代。在一些实施方案中,本发明涉及末端脱氧核苷酸转移酶(TdT)变体,该末端脱氧核苷酸转移酶变体包含与SEQ ID NO:26中列出的氨基酸序列至少90%相同的氨基酸序列或由与SEQ ID NO:26中列出的氨基酸序列至少90%相同的氨基酸序列组成,具有位置M46、R190和E311处的取代。在特定实施方案中,至少一种氨基酸取代选自由M46R、M47R、M63R、R190L、R207L、E227N和E311N组成的组。在一些实施方案中,本发明涉及末端脱氧核苷酸转移酶(TdT)变体,该末端脱氧核苷酸转移酶变体包含与SEQ ID NO:25中列出的氨基酸序列至少90%相同的氨基酸序列,具有位置R184、R306和E309处的取代。特别地,取代选自由R184L、R306A和E309N组成的组。在实施方案中,变体由与SEQ ID NO:25中列出的氨基酸序列具有至少90%同一性的氨基酸序列组成,具有取代R184L、R306A和E309N。
在一些实施方案中,本发明的TdT变体包括上述指定SEQ ID NO和在所示位置处的谷氨酰胺(上文首次出现)、赖氨酸、组氨酸、色氨酸、丙氨酸、甘氨酸和谷氨酰胺(上文第二次出现)的取代。
在一些实施方案中,本发明的TdT变体包括分离的蛋白。
除了上述在指定SEQ ID NO的所示位置处包含谷氨酰胺、赖氨酸、组氨酸、色氨酸、丙氨酸和/或甘氨酸的一种或更多种取代的TdT变体之外,在一些实施方案中,每个所述的TdT变体还还可以包含选自表1(在图2中列出)的行中所列的指定SEQ ID NO的位置处的1种至11种另外的取代。此类另外的取代在本文中有时被称为“补充性取代”并且有助于增加3’-O-修饰的核苷三磷酸掺入多核苷酸的效率或速率。在一些实施方案中,补充性取代选自表1。例如,在SEQ ID NO:3的位置326处精氨酸取代谷氨酰胺的TdT变体(如上所述)还还可以包含以下取代:L52F、M63R、A108V和L131P(即,表1第2行所列的前四个位置的取代)。因此,在该实例中,TdT变体可以使用下述命名法来表征为如下:相对于SEQ ID NO:3的Q326R+L52F+M63R+A108V+L131P,并且另外包含与SEQ ID NO:3至少90%的序列同一性。
在另一种实例中,在SEQ ID NO:5的位置325处精氨酸取代谷氨酰胺、在SEQ IDNO:5的位置336处天冬氨酸取代组氨酸、在SEQ ID NO:5的位置376处精氨酸取代色氨酸的TdT变体还还可以包含取代M63R、A110V、L131P、C173G、R207N、E294A、R325P、E327N和R353K(选自表1的第4行,在图2中列出)。因此,在该实例中,TdT变体可以被表征为相对于SEQ IDNO:5的Q325R+H336D+W376D+M63R+A110V+L131P+C173G+R 207N+E294A+R325P+E327N+R353K,并且另外包含与SEQ ID NO:5的指定百分比的序列同一性,诸如至少90%的序列同一性。
除了上述在指定SEQ ID NO的所示位置处包含谷氨酰胺、赖氨酸、组氨酸、色氨酸、丙氨酸和/或甘氨酸的一种或更多种取代的TdT变体之外,以及除了上述补充性取代之外,在一些实施方案中,每种此类TdT变体还可以包含选自表2(在图3中列出)的行中所列的指定SEQ ID NO的位置处的1种至12种另外的取代。此类另外的取代在本文中有时被称为“稳定性取代”并且有助于增加TdT变体的稳定性,特别是在无模板酶促多核苷酸掺入的反应条件方面,以及在升高的温度方面。例如,TdT变体可以包含来自表3B的取代A17V、K265E和W377R取代,来自表1的补充性取代M63R、L131P、C173G、R207L、G284L和R325P,以及来自表2的稳定性取代S119A和S146E,其中位置编号是相对于SEQ ID NO:3。此类TdT变体可被表示为A17V+M63R+S119A+L131P+S146E+C173G+R207L+K265E+G284L+R325P+W377R,并且应理解,除了这些特定的取代之外,TdT变体还包含与SEQ ID NO:3的指定百分比的序列同一性,诸如至少90%的序列同一性。
在一些实施方案中,本发明的TdT变体包含与其N末端附接的全部或部分BRCT样区段,例如参见Delarue等人,EMBO J.,21(3):427-439(2002)。
在一些实施方案中,本发明涉及包含与SEQ ID NO:1具有至少90%同一性的氨基酸序列的TdT变体或其功能等同物,其中每种此类TdT变体(i)在选自由相对于SEQ ID NO:1的G186、S248、T331、Q390、K394、Q455或H466组成的组的一个或更多个位置处包含至少一个突变,并且(ii)能够在无模板的条件下延伸多核苷酸,并且(iii)能够以比野生型TdT更高的效率掺入3’-O-修饰的核苷三磷酸。在一些实施方案中,本发明的TdT变体包含G186E。在一些实施方案中,本发明的TdT变体包含K394 E/T/A/R。在一些实施方案中,本发明涉及包含与SEQ ID NO:3具有至少90%同一性的氨基酸序列的TdT变体或其功能等同物,其中每种此类TdT变体(i)在选自由相对于SEQ ID NO:3的G57、S119、T202、Q261、K265、Q326或H337组成的组的一个或更多个位置处包含至少一个突变,并且(ii)能够在无模板的条件下延伸多核苷酸,并且(iii)能够以比野生型TdT更高的效率掺入3’-O-修饰的核苷三磷酸。
在本段的实施方案中,氨基酸位置编号是相对于SEQ ID NO:3的。在一些实施方案中,本发明的TdT变体包含G57E。在一些实施方案中,本发明的TdT变体包含K265E/T/A/R。在一些实施方案中,本发明的TdT变体包含T202A。在一些实施方案中,本发明的TdT变体包含Q326T/F/L/M或Q326T/F/L/M/I/V/Y。在一些实施方案中,本发明的TdT变体包含S119A。在一些实施方案中,本发明的TdT变体包含Q261R。在一些实施方案中,本发明的TdT变体包含H337Y/F/D。在一些实施方案中,本发明的TdT变体包含一种或更多种选自由T202A、Q326T/F/L/M或Q326T/F/L/M/I/V/Y/W、S119A、Q261R、H337Y/F/D、G57E和K265E/T/A/R组成的组的氨基酸改变。在一些实施方案中,本发明的TdT变体包含K265E/T/A;并且在其他实施方案中包含G57E和K265E/T/A两者。在一些实施方案中,本发明的变体TdT与参考或野生型TDT序列SEQ ID NO:3具有至少95%的同一性。在一些实施方案中,本发明的变体TdT与SEQ ID NO:3具有至少98%的同一性。在一些实施方案中,本发明的展示出增加的掺入效率的TdT变体包含一种或更多种选自由T202A、Q326T/F/L/M或Q326T/F/L/M/I/V/Y、Q261R、H337Y/F/D、G57E和K265E/T/A/R组成的组的氨基酸改变。在一些实施方案中,本发明的展示出增强的稳定性的TdT变体包含氨基酸改变S119A。在一些实施方案中,本发明的展示出增加的掺入效率的TdT变体包含,单独或组合的G57E、K265T/E/R/A、Q326T/F/L/M或H337Y/F/D。
本发明还涉及本发明的TdT变体用于通过向核酸片段连续添加一个或更多个3’-O-修饰的核苷酸以在无模板的条件下合成核酸分子的用途。在一些实施方案中,这种方法包括以下步骤:(a)提供包含具有游离3’-羟基的寡核苷酸的起始子;(b)在酶促延伸条件下,在存在3’-O-可逆封闭的核苷三磷酸的条件下,使本发明的TdT变体与起始子或延伸的起始子反应。在一些实施方案中,这种方法还包括以下步骤:(c)使延伸的起始子脱封闭以形成具有游离3’-羟基的延伸的起始子,和(d)重复步骤(b)和步骤(c),直到合成预定序列的核酸分子。
在另外的实施方案中,本发明包括编码上述变体TdT的核酸分子,包含这种核酸分子的表达载体,以及包含上述核酸分子或上述表达载体的宿主细胞。在又另外的实施方案中,本发明包括用于产生本发明的变体TdT的方法,其中宿主细胞在允许编码所述变体TdT的核酸表达的培养条件下被培养,并且其中任选地回收变体TdT。本发明还包括用于进行任何预定序列的无模板多核苷酸延伸的试剂盒,其中所述试剂盒包括本发明的TdT变体。这种试剂盒还包括用于DNA延伸的A、C、G和T的3’-O-封闭的脱氧核糖核苷三磷酸(dNTP)或用于RNA延伸的rA、rC、rG和U的3’-O-封闭的核糖核苷三磷酸(rNTP)。
本发明通过提供新的TdT变体有利地克服了无模板酶促核酸合成领域中与3’-O-修饰的核苷三磷酸的有效掺入相关的问题,所述新的TdT变体具有以比野生型TdT或先前可获得的TdT变体(特别是在将核苷酸掺入本文所述的包含某些3’核苷酸序列的多核苷酸方面)更高的效率或更高的速率掺入3’-O-修饰的核苷酸的能力。在一些实施方案中,本发明还通过提供与野生型TdT相比稳定性增加的新的TdT变体有利地克服了上述领域的问题。
附图简述
图1图解说明了使用本发明的TdT变体的无模板酶促核酸合成方法的步骤。
图2包含列出了各种SEQ ID NO的补充性取代的表1。
图3包含列出了各种SEQ ID NO的稳定性取代的表2。
发明详述
虽然本发明适用于各种修改和替代形式,但其细节已经通过附图中的实例被显示并且将被详细描述。应该理解的是,并非意图将本发明限制于所描述的特定的实施方案。意图涵盖落入本发明的精神和范围内的所有修改、等效物、和替代物。对本发明各方面的指导可见于本领域普通技术人员熟知的许多可获得的参考文献和论文中,包括例如Sambrook等人(1989),Molecular cloning:A Laboratory Manual,Cold Spring Harbor Laboratory,等等。
本发明提供了TdT聚合酶的变体,其可用于合成预定序列的多核苷酸,诸如DNA或RNA,而无需使用模板链。本发明的TdT变体允许修饰的核苷酸,且更特别地3’O-可逆封闭的核苷三磷酸,用于基于酶的多核苷酸合成方法。本发明的变体是根据它们在特定残基处的突变或取代来描述的,所述特定残基的位置是相对于指定SEQ ID NO来表示的
在一些实施方案中,TdT变体可以可操作地连接到包括共价键或非共价键的接头部分、氨基酸标签(例如,多氨基酸标签、多His标签、6His标签)、化学化合物(例如,聚乙二醇)、蛋白-蛋白结合对(例如,生物素-亲和素)、亲和偶联物(affinity coupling)、捕获探针或这些的任何组合。接头部分可以与TdT变体隔开或作为TdT变体的一部分(例如,重组加His标签的聚合酶,诸如通过以下配对例示的:SEQ ID NO:19和SEQ ID NO:20、SEQ ID NO:21和SEQ ID NO:22、SEQ ID NO:23和SEQ ID NO:24以及SEQ ID NO:25和SEQ ID NO:26)。通常,接头部分不干扰突变TdT的核苷酸结合活性或催化活性。
在上述一些实施方案中,TdT变体掺入3’O-修饰的核苷三磷酸的效率至少是先前可获得的TdT野生型或变体的105%;在其他实施方案中,TdT变体掺入3’O-修饰的核苷三磷酸的效率至少是先前可获得的TdT野生型或变体的110%;在其他实施方案中,TdT变体掺入3’O-修饰的核苷三磷酸的效率至少是先前可获得的TdT野生型或变体的150%。
在一些实施方案中,本发明的TdT变体包含与表3A中指定的SEQ ID NO至少60%相同的氨基酸序列,并且包含在第1列中对于指定SEQ ID NO所示的位置处的谷氨酰胺的至少一种取代。在一些实施方案中,本发明的TdT变体包含与表3A中指定的SEQ ID NO至少60%相同的氨基酸序列,并且包含分别在第1列至第7列中对于指定SEQ ID NO所示的位置处的谷氨酰胺、赖氨酸、组氨酸、色氨酸、丙氨酸或甘氨酸的1种至7种取代。在一些实施方案中,本发明的TdT变体包含与表3B中指定的SEQ ID NO至少60%相同的氨基酸序列,并且包含在对于指定SEQ ID NO所示的位置处的谷氨酰胺被T、F、L或M之一取代的至少一种取代。在一些实施方案中,本发明的TdT变体包含与表3B中指定的SEQ ID NO至少60%相同的氨基酸序列,并且包含分别在第1列至第7列中对于指定SEQ ID NO所示的位置处的1种至7种以下取代:谷氨酰胺被T、F、L或M之一取代,赖氨酸被E、T、A或R之一取代,组氨酸被Y、F或D之一取代,色氨酸被R取代,丙氨酸被V取代或甘氨酸被E取代。当表中的单元格在指定SEQ ID NO的列处为空白时,则在指定SEQ ID NO中不存在与该列相关的氨基酸,因此在TdT变体的该位置处没有取代。
先前段落中所述的每种TdT变体还(i)能够在无模板的条件下合成核酸片段,并且(ii)能够将3’-O-修饰的核苷酸掺入到核酸片段的游离3’-羟基上。在一些实施方案中,上述同一性百分比值为与所示SEQ ID NO的至少80%同一性。在一些实施方案中,先前段落的同一性百分比值为至少90%同一性;在一些实方案中,此同一性百分比值为至少95%同一性;在一些实施方案中,此同一性百分比值为至少98%同一性;在一些实施方案中,此同一性百分比值为至少99%同一性。在一些实施方案中,上述3’-O-修饰的核苷酸可以包括3’-O-NH2-核苷三磷酸、3’-O-叠氮甲基-核苷三磷酸、3’-O-烯丙基-核苷三磷酸、3’-O-(2-硝基苄基)-核苷三磷酸或3’-O-炔丙基-核苷三磷酸。
表3A:具有位置Q455、K394、H466、W506、A146、G186和/或Q390(相对于SEQ ID NO:1)或指定SEQ ID NO的功能等同的位置处的取代的TdT变体
Figure BDA0003162220330000131
表3B:具有位置Q455、K394、H466、W506、A146、G186和/或Q390(相对于SEQ ID NO:1)或指定SEQ ID NO的功能等同的位置处的所示取代的TdT变体
Figure BDA0003162220330000141
如上所述,在一些实施方案中,除了表3A和表3B中列出的取代之外,本发明的TdT变体还可以在表1(在图2中列出)中列出的相对于指定SEQ ID NO的位置处包含一种或更多种补充性取代,和/或在表2(在图3中列出)中列出的相对于指定SEQ ID NO的位置处包含一种或更多种增强稳定性的取代。
关于表2的增强稳定性的突变,若干相邻的取代被认为是通过在侧链之间形成盐桥而发挥稳定化作用。因此,取代Q166E和D170R的等效稳定化作用可以通过交换E和R的位置来获得。因此,除了表2所示的取代之外,稳定化取代还包括Q166R与D170E、C188D与L189R和S275R与Q278E的配对。
本发明的特定TdT变体DS1001至DS1018在表4中列出。TdT变体DS1001至DS1018中的每一种都包含与SEQ ID NO:3至少60%相同的氨基酸序列,并且在所示位置处包含取代。在一些实施方案中,TdT变体DS1001至DS1018包含与SEQ ID NO:3至少80%相同的氨基酸序列,并且在所示位置处包含取代;在一些实施方案中,TdT变体DS1001至DS1018包含与SEQID NO:3至少90%相同的氨基酸序列,并且在所示位置处包含取代;在一些实施方案中,TdT变体DS1001至DS1018包含与SEQ ID NO:3至少95%相同的氨基酸序列,并且在所示位置处包含取代;在一些实施方案中,TdT变体DS1001至DS1018包含与SEQ ID NO:3至少97%相同的氨基酸序列,并且在所示位置处包含取代;在一些实施方案中,TdT变体DS1001至DS1018包含与SEQ ID NO:3至少98%相同的氨基酸序列,并且在所示位置处包含取代;在一些实施方案中,TdT变体DS1001至DS1018包含与SEQ ID NO:3至少99%相同的氨基酸序列,并且在所示位置处包含取代。
表4:本发明的特定TdT变体
Figure BDA0003162220330000161
Figure BDA0003162220330000171
如上所述的本发明的TdT变体各自包含与指定SEQ ID NO氨基酸序列具有一定的序列同一性百分比(取决于所示取代的存在)的氨基酸序列。在一些实施方案中,以这种方式描述的本发明的TdT变体和指定SEQ ID NO之间的序列差异的数量和类型可以是由于取代、缺失和/或插入引起,并且取代、缺失和/或插入的氨基酸可以包括任何氨基酸。在一些实施方案中,此种缺失、取代和/或插入仅包括天然存在的氨基酸。在一些实施方案中,取代仅包括如Grantham,Science,185:862-864(1974)中所描述的保守或同义的氨基酸改变。就是说,氨基酸的取代只可以发生在其同义氨基酸集的成员之间。在一些实施方案中,可以使用的同义氨基酸集在表5A中列出。
表5A:氨基酸同义集I
Figure BDA0003162220330000181
在一些实施方案中,可以使用的同义氨基酸集在表5B中列出。
表5B:氨基酸同义集II
Figure BDA0003162220330000182
核苷酸掺入活性的测量
本发明的变体的核苷酸掺入效率可以通过延伸或延长测定来测量,例如在Boule等人(下文引用);Bentolila等人(下文引用);和Hiatt等人,美国专利5808045中描述的,后者通过引用并入本文。简而言之,在这种测定的一种形式中,将荧光标记的具有游离3’-羟基的寡核苷酸与待测试的变体TdT在TdT延伸条件下在存在可逆封闭的核苷三磷酸的条件下一起反应预定的持续时间,之后停止延伸反应,并且延伸产物和未延伸的起始子寡核苷酸在经凝胶电泳分离之后进行定量。通过这种测定,可以容易地将变体TdT的掺入效率与其他变体的效率或与野生型或参考TdT或其他聚合酶的效率进行比较。在一些实施方案中,变体TdT效率的量度可以是在等效测定中使用变体TdT的延伸产物的量与使用野生型TdT的延伸产物的量的比率(以百分比给出)。
在一些实施方案中,以下特定的延伸测定可用于测量TdT的掺入效率:使用的引物如下:
5′-AAAAAAAAAAAAAAGGGG-3′(SEQ ID NO:2)
引物在5’末端上还有ATTO荧光染料。使用的代表性修饰核苷酸(在表5中记为dNTP)包括3'-O-氨基-2',3'-双脱氧核苷酸-5'-三磷酸(ONH2,Firebird Biosciences),诸如3'-O-氨基-2',3'-双脱氧腺苷-5'-三磷酸。对于测试的每种不同变体,一个管用于反应。从水开始,并且然后以表6的顺序将试剂添加入管。在37℃30min后,通过添加甲酰胺(Sigma)停止反应。
表6:延伸活性测定试剂
Figure BDA0003162220330000191
活性缓冲液包含,例如,补充有CoCl2的TdT反应缓冲液(可从New EnglandBiolabs获得)。
测定的产物通过常规的聚丙烯酰胺凝胶电泳进行分析。例如,上述测定的产物可以在16%的聚丙烯酰胺变性凝胶(Bio-Rad)中进行分析。凝胶是在即将分析前将聚丙烯酰胺倾入玻璃板中并使其聚合而制备的。将玻璃板中的凝胶安装在填充了TBE缓冲液(Sigma)的合适的槽中,用于电泳步骤。将待分析的样品加载到凝胶的顶部。在室温,在凝胶的顶部和底部之间施加500V至2,000V的电压3h至6h。分离后,凝胶荧光使用例如Typhoon扫描仪(GE Life Sciences)来扫描。使用Image J软件(imagej.nih.gov/ij/)或其等效软件分析凝胶图像,以计算修饰核苷酸的掺入百分比。
发夹完成测定。在一方面,本发明包括测量聚合酶诸如TdT变体将dNTP掺入到多核苷酸(即“测试多核苷酸”)3’末端上的能力的方法。一种这样的方法包括在反应条件下提供具有游离3’羟基的测试多核苷酸,其中它基本上仅是单链的,但是在用聚合酶诸如TdT变体延伸时,形成包含单链环和双链茎的稳定发夹结构,从而允许通过双链多核苷酸的存在来检测3’末端的延伸。双链结构可以以各种方式检测,包括但不限于,在嵌入双链结构时优先发出荧光的荧光染料,延伸多核苷酸上的受体(或供体)和寡核苷酸上的供体(或受体)之间的荧光共振能量转移(FRET),该寡核苷酸与新形成的发夹茎形成三链体,FRET受体和供体都附接到测试多核苷酸并且在形成发夹时形成FRET接近,等等。在一些实施方案中,测试多核苷酸在被单个核苷酸延伸后的茎部分长度在4个至6个碱基对的范围内;在其他实施方案中,这样的茎部分的长度为4个至5个碱基对;并且在又其他的实施方案中,这样的茎部分的长度为4个碱基对。在一些实施方案中,测试多核苷酸具有在10个至20个核苷酸范围内的长度;在其他实施方案中,测试多核苷酸具有在12个至15个核苷酸范围内的长度。在一些实施方案中,用使未延伸的茎和延伸的茎的熔解温度之间的差异最大化的核苷酸延伸测试多核苷酸是有利的或方便的;因此,在一些实施方案中,测试多核苷酸用dC或dG来延伸(并且因此测试多核苷酸被选择为具有用于茎形成的适当的互补核苷酸)。
用于发夹完成测定的示例性测试多核苷酸包括通过用dGTP延伸来完成的p875(5’-CAGTTAAAAACT)(SEQ ID NO:21);通过用dCTP延伸来完成的p876(5’-GAGTTAAAACT)(SEQ ID NO:22)和通过用dGTP延伸来完成的p877(5’-CAGCAAGGCT)(SEQ ID NO:23)。这种测试多核苷酸的示例性反应条件可以包括:2.5-5μM的测试多核苷酸,1:4000稀释的
Figure BDA0003162220330000211
(来自Biotium,Inc.,Fremont,CA的嵌入性染料),200mM二甲胂酸盐KOH pH 6.8,1mM CoCl2,0-20%的DMSO和所需浓度的3’ONH2 dGTP和TdT。发夹的完成可以通过
Figure BDA0003162220330000212
染料的荧光增加来监测,使用常规荧光计,诸如TECAN读取器,在28-38℃的反应温度,使用设置为360nm的激发滤光器和设置为635nm的发射滤光器。
在本发明这方面的一些实施方案中,可以通过以下步骤测试TdT变体的无模板掺入核苷三磷酸的能力:(a)将具有游离3’-羟基的测试多核苷酸、TdT变体和核苷三磷酸在这样的条件下组合,在所述条件下,测试多核苷酸是单链的,但是在掺入核苷三磷酸时,形成具有双链茎区域的发夹,和(b)检测形成的双链茎区域的量,作为TdT变体掺入核苷三磷酸的能力的量度。在一些实施方案中,核苷三磷酸是3’-O-封闭的核苷三磷酸。
酶稳定性的测量
在一些实施方案中,酶稳定性意指酶(或其变体)在经历一定时间段的去稳定化条件(诸如,升高的温度、降低的温度、低pH、高pH、暴露于离液剂,等等)后保持特定活性的能力。在一些实施方案中,酶稳定性可以通过以下来测量:将酶暴露于升高的温度(例如在50-70℃的范围内)一定时间段(例如在15-30分钟的范围内),然后测试使用3’-修饰的NTP无模板延伸起始子链的活性。在其他实施方案中,酶稳定性可以通过将酶暴露于低pH(例如在1-4的范围内的pH)一定时间段(在15-30分钟的范围内)来测量。在一些实施方案中,本发明的对于升高的温度具有增强的稳定性的TdT变体展示出的使用3’-O-修饰的dNTP的无模板起始子延伸活性等于或大于野生型TdT的活性。在一些实施方案中,本发明的对于pH具有增强的稳定性的TdT变体展示出的使用3’-O-修饰的dNTP的无模板起始子延伸活性等于或大于野生型TdT的活性。在一些实施方案中,这种提高的温度稳定性或pH稳定性是在使用3’-O-胺保护的dNTP的无模板起始子延伸活性方面。
无模板酶促合成
多核苷酸的无模板酶促合成可以通过各种已知的方案使用无模板聚合酶来进行,无模板聚合酶诸如末端脱氧核苷酸转移酶(TdT),包括其被工程化以具有改进特性的变体,改进特性诸如在掺入3’-O-封闭的脱氧核苷三磷酸(3’-O-封闭的dNTP)方面更高的温度稳定性或更高的效率,例如Ybert等人,国际专利公布WO2015/159023;Ybert等人,国际专利公布WO2017/216472;Hyman,美国专利5436143;Hiatt等人,美国专利5763594;Jensen等人,Biochemistry,57:1821-1832(2018);Mathews等人,Organic&Biomolecular Chemistry,DOI:0.1039/c6ob01371f(2016);Schmitz等人,Organic Lett.,1(11):1729-1731(1999)。
在一些实施方案中,酶促DNA合成的方法包括步骤的重复循环,诸如图1所示,其中在每个循环中添加预定的核苷酸。提供例如附接于固体支持物(102)的具有游离3’-羟基基团(103)的起始子多核苷酸(100)。在对3’-O-保护的-dNTP酶促掺入到起始子多核苷酸(100)(或延伸的起始子多核苷酸)的3’末端上有效的条件下,向起始子多核苷酸(100)(或后续循环中延伸的起始子多核苷酸)中添加3’-O-保护的-dNTP和TdT变体(104)。该反应产生3’-羟基受保护的延伸的起始子多核苷酸(106)。如果延伸的起始子多核苷酸包含完成的序列,那么3’-O-保护基团被去除或脱保护,并且所需序列从原始的起始子多核苷酸上被裂解下。这种裂解可以使用各种单链裂解技术中的任何一种来进行,例如,通过在原始起始子多核苷酸内的预定位置处插入可裂解的核苷酸或可裂解的接头。示例性的可裂解的核苷酸或接头包括但不限于,(i)由尿嘧啶DNA糖苷酶裂解的尿嘧啶核苷酸;(ii)可光裂解的基团,诸如美国专利5,739,386中所述的硝基苄基接头;或由内切核酸酶V裂解的肌苷。在一些实施方案中,裂解的多核苷酸可以具有游离5’-羟基;在其他实施方案中,裂解的多核苷酸可以具有5’-磷酸化末端。如果延伸的起始子多核苷酸不包含完成的序列,那么去除3’-O-保护基团以暴露游离3’-羟基(103),并且延伸的起始子多核苷酸经历另一个核苷酸添加和脱保护的循环。
在一些实施方案中,在每个合成步骤中,在存在3’-O-可逆封闭的dNTP的条件下,使用TdT将核苷酸的有序序列偶联至起始子核酸。在一些实施方案中,合成寡核苷酸的方法包括以下步骤:(a)提供具有游离3’-羟基的起始子;(b)使具有游离3’-羟基的起始子或延伸中间体与TdT在延伸条件下、在存在3’-O-封闭的核苷三磷酸的条件下反应,以产生3’-O-封闭的延伸中间体;(c)使延伸中间体脱封闭以产生具有游离3’-羟基的延伸中间体;和(d)重复步骤(b)和步骤(c),直到合成多核苷酸。(有时“延伸中间体”也被称为“延伸片段”)。在一些实施方案中,起始子以附接于固体支持物的寡核苷酸(例如通过其5’末端)的形式提供。上述方法还可以在反应步骤或延伸步骤以及脱封闭步骤之后包括洗涤步骤。例如,反应步骤可以包括去除未掺入的核苷三磷酸的子步骤,例如通过在预定的孵育期或反应时间后的洗涤。这种预定的孵育期或反应时间可以是若干秒钟,例如30sec,至若干分钟,例如30min。
上述方法还可以在反应步骤或延伸步骤以及脱封闭步骤之后包括加帽步骤以及洗涤步骤。如上所述,在一些实施方案中,可以包括加帽步骤,其中未延伸的游离3’-羟基与阻止加帽链的任何的进一步延伸的化合物反应。在一些实施方案中,这种化合物可以是双脱氧核苷三磷酸。在其他实施方案中,具有游离3’-羟基的非延伸链可以通过用3’-核酸外切酶活性(例如Exo I)处理它们来降解。例如,参见Hyman,美国专利5436143。同样,在一些实施方案中,未能脱封闭的链可以被处理以去除该链或使其对进一步的延伸呈惰性。
在一些包括寡核苷酸的系列合成的实施方案中,加帽步骤可能是不期望的,因为加帽可能会阻止多于一种寡核苷酸的等摩尔量的产生。在没有加帽的情况下,序列将具有均匀分布的缺失错误,但是多于一种寡核苷酸中的每一种将以等摩尔量存在。在未延伸片段被加帽的情况下,情况将不会如此。
在一些实施方案中,延伸或延长步骤的反应条件可以包括以下:2.0μM纯化的TdT;125-600μM 3’-O-封闭的dNTP(例如3’-O-NH2-封闭的dNTP);约10mM至约500mM的二甲胂酸钾缓冲液(pH在6.5和7.5之间)和约0.01mM至约10mM的二价阳离子(例如CoCl2或MnCl2),其中延伸反应可在50μL反应体积中,在室温至45℃的范围内的温度进行3分钟。在其中3’-O-封闭的dNTP是3’-O-NH2-封闭的dNTP的实施方案中,脱封闭步骤的反应条件可以包括以下:700mM NaNO2;1M乙酸钠(用乙酸调节至4.8-6.5的范围内的pH),其中脱封闭反应可以在50μL体积中,在室温至45℃的范围内的温度进行30秒至若干分钟。
根据特定的应用,脱封闭和/或裂解的步骤可以包括各种化学或物理条件,例如光、热、pH、特定试剂诸如能够裂解指定化学键的酶的存在。选择3’-O-封闭基团和相应的脱封闭条件的指南可见于以下通过引用并入的参考文献中:美国专利5808045;美国专利8808988;国际专利公布WO91/06678和下文引用的参考文献。在一些实施方案中,裂解剂(有时也称为脱封闭试剂或剂)是化学裂解剂,诸如,例如二硫苏糖醇(DTT)。在可选的实施方案中,裂解剂可以是酶裂解剂,诸如,例如可以裂解3’-磷酸封闭基团的磷酸酶。本领域技术人员应当理解,脱封闭剂的选择取决于所用的3’-核苷酸封闭基团的类型,是否使用一种或多于一种封闭基团,起始子是否附接于必须温和处理的活细胞或生物体或固体支持物等。例如,膦,诸如三(2-羧乙基)膦(TCEP)可用于裂解3’-O-叠氮甲基基团,钯络合物可用于裂解3’-O-烯丙基基团,或亚硝酸钠可用于裂解3’-O-氨基基团。在特定实施方案中,裂解反应包括TCEP、钯络合物或亚硝酸钠。
如上所述,在一些实施方案中,期望使用两种或更多种可以使用正交脱封闭条件去除的封闭基团。以下示例性的封闭基团对可用于平行合成实施方案中,诸如上述那些。应当理解,在本发明的这些实施方案中,可以使用其他封闭基团对或包含多于两个的组。
3’-O-NH<sub>2</sub> 3’-O-叠氮甲基
3’-O-NH<sub>2</sub> 3’-O-烯丙基
3’-O-NH<sub>2</sub> 3’-O-磷酸
3’-O-叠氮甲基 3’-O-烯丙基
3’-O-叠氮甲基 3’-O-磷酸
3’-O-烯丙基 3’-O-磷酸
在活细胞上合成寡核苷酸需要温和的脱封闭或脱保护条件,即不会破坏细胞膜,不会使蛋白变性,不会干扰关键细胞功能等的条件。在一些实施方案中,脱保护条件在与细胞存活相容的生理条件范围内。在这样的实施方案中,酶促脱保护是理想的,因为它可以在生理条件下进行。在一些实施方案中,特定的酶促可去除封闭基团与特定的酶相关联以将其去除。例如,酯基或酰基封闭基团可以用酯酶诸如乙酰酯酶或类似的酶去除,并且磷酸封闭基团可以用3’磷酸酶诸如T4多核苷酸激酶去除。例如,3’-O-磷酸可以通过用100mMTris-HCl(pH 6.5)、10mM MgCl2、5mM 2-巯基乙醇和1单位T4多核苷酸激酶的溶液处理来去除。该反应在37℃的温度进行1分钟。
“3'-磷酸封闭的”或“3'-磷酸保护的”核苷酸是指其中3'-位置处的羟基基团被含磷酸部分的存在封闭的核苷酸。根据本发明,3'-磷酸封闭的核苷酸的实例是核苷酸基-3'-磷酸单酯/核苷酸基-2',3'-环磷酸酯、核苷酸基-2'-磷酸单酯和核苷酸基-2'或3'-烷基磷酸二酯,以及核苷酸基-2'或3'-焦磷酸酯。也可以使用此类化合物的硫代磷酸酯或其他类似物,条件是这种取代不阻止磷酸酶去磷酸化产生游离3’-羟基。
3’-O-酯保护的dNTP或3’-O-磷酸保护的dNTP的合成和酶促脱保护的另外的实例在以下参考文献中描述Canard等人,Proc.Natl.Acad.Sci.,92:10859-10863(1995);Canard等人,Gene,148:1-6(1994);Cameron等人,Biochemistry,16(23):5120-5126(1977);Rasolonjatovo等人,Nucleosides&Nucleotides,18(4&5):1021-1022(1999);Ferrero等人,Monatshefte fur Chemie,131:585-616(2000);Taunton-Rigby等人,J.Org.Chem.,38(5):977-985(1973);Uemura等人,Tetrahedron Lett.,30(29):3819-3820(1989);Becker等人,J.Biol.Chem.,242(5):936-950(1967);Tsien,国际专利公布WO1991/006678。
如本文所用,“起始子”(或等效术语,诸如,“起始片段”、“起始子核酸”、“起始子寡核苷酸”等)是指具有游离3’-末端的短寡核苷酸序列,其可被无模板聚合酶(诸如TdT)进一步延伸。在一种实施方案中,起始片段是DNA起始片段。在可选的实施方案中,起始片段是RNA起始片段。在一种实施方案中,起始片段具有3个和100个之间的核苷酸,特别地,具有3个和20个之间的核苷酸。在一种实施方案中,起始片段是单链的。在可选的实施方案中,起始片段是双链的。在特定的实施方案中,用5’-伯胺合成的起始子寡核苷酸可以使用制造商的方案共价连接至磁珠。同样,用3’-伯胺合成的起始子寡核苷酸可以使用制造商的方案共价连接至磁珠。适用于本发明实施方案的各种其他附接化学是本领域中熟知的,例如Integrated DNA Technologies brochure,“Strategies for AttachingOligonucleotides to Solid Supports,”v.6(2014);Hermanson,BioconjugateTechniques,Second Edition(Academic Press,2008);以及类似的参考文献。
本发明中使用的许多3’-O-封闭的dNTP可以从商业供应商购买,或者使用公布的技术合成,例如美国专利7057026;国际专利公布WO2004/005667、WO91/06678;Canard等人,Gene(上文引用);Metzkeret等人,Nucleic Acids Research,22:4259-4267(1994);Meng等人,J.Org.Chem.,14:3248-3252(3006);美国专利公布2005/037991。在一些实施方案中,修饰的核苷酸包括包含嘌呤碱基或嘧啶碱基和核糖或脱氧核糖糖部分的修饰的核苷酸或核苷分子,所述核糖或脱氧核糖糖部分具有与其共价附接的可去除的3’-OH封闭基团,使得3’碳原子已附接以下结构的基团:
-O-Z
其中-Z是-C(R’)2-O-R”、-C(R’)2-N(R”)2、-C(R’)2-N(H)R”、-C(R’)2-S-R”和-C(R’)2-F中的任何一种,其中每个R”是可去除的保护基团或是可去除的保护基团的一部分;每个R’独立地是氢原子、烷基、被取代的烷基、芳基烷基、烯基、炔基、芳基、杂芳基、杂环基、酰基、氰基、烷氧基、芳氧基、杂芳氧基或酰胺基基团或通过连接基团附接的可检测标记;条件是,在一些实施方案中,这些取代基具有最多10个碳原子和/或最多5个氧或氮杂原子;或(R’)2代表式=C(R”’)2的基团,其中每个R”’可以相同或不同并且选自由氢和卤素原子以及烷基基团组成的组,条件是,在一些实施方案中,每个R”’的烷基具有1个至3个碳原子;并且其中分子可以反应以产生中间体,其中每个R”被交换为H,或其中Z是-(R’)2-F,F被交换为OH、SH或NH2,优选OH,该中间体在含水条件下解离以提供具有游离3’-羟基的分子;条件是,其中Z是-C(R’)2-S-R”,两个R’基团都不是H。在某些实施方案中,修饰的核苷酸或核苷的R’是烷基或被取代的烷基,条件是,这种烷基或被取代的烷基具有1个至10个碳原子和0个至4个氧或氮杂原子。在某些实施方案中,修饰的核苷酸或核苷的-Z是式-C(R’)2-N3。在某些实施方案中,Z是叠氮甲基基团。
在一些实施方案中,Z是可裂解的有机部分,具有或不具有杂原子,具有200或更小的分子量。在其他实施方案中,Z是可裂解的有机部分,具有或不具有杂原子,具有100或更小的分子量。在其他实施方案中,Z是可裂解的有机部分,具有或不具有杂原子,具有50或更小的分子量。在一些实施方案中,Z是酶促可裂解的有机部分,具有或不具有杂原子,具有200或更小的分子量。在其他实施方案中,Z是酶促可裂解的有机部分,具有或不具有杂原子,具有100或更小的分子量。在其他实施方案中,Z是酶促可裂解的有机部分,具有或不具有杂原子,具有50或更小的分子量。在其他实施方案中,Z是具有200或更小的分子量的酶促可裂解的酯基团。在其他实施方案中,Z是可被3’-磷酸酶去除的磷酸酯基团。在一些实施方案中,以下3’-磷酸酶中的一种或更多种可以以制造商推荐的方案使用:T4多核苷酸激酶、小牛肠碱性磷酸酶、重组虾碱性磷酸酶(例如,可从New England Biolabs,Beverly,MA获得)。
在另外的特定实施方案中,3’-封闭的核苷酸三磷酸被3’-O-叠氮甲基、3’-O-NH2或3’-O-烯丙基基团封闭。
在又其他的实施方案中,本发明的3’-O-封闭基团包括3’-O-甲基、3’-O-(2-硝基苄基)、3’-O-烯丙基、3’-O-胺、3’-O-叠氮甲基、3’-O-叔丁氧基乙氧基、3’-O-(2-氰乙基)和3’-O-炔丙基。
变体TdT的产生
本发明的变体可以通过将已知参考或野生型TdT编码的多核苷酸突变、然后使用常规分子生物学技术表达它来产生。例如,小鼠TdT基因(SEQ ID NO:1)可以使用常规的分子生物学技术从合成片段组装,例如使用Stemmer等人,Gene,164:49-53(1995);Kodumal等人,Proc.Natl.Acad.Sci.,101:15573-15578(2004)等描述的方案;或者可以使用Boule等人,Mol.Biotechnology,10:199-208(1998)或Bentolila等人,EMBO J.,14:4221-4229(1995)等描述的方案直接从小鼠细胞克隆。
例如,可以将分离的TdT基因插入表达载体诸如pET32(Novagen)中,以产生载体pCTdT,然后载体pCTdT可以用于使用常规方案制备和表达变体TdT蛋白。可以将具有正确序列的载体转化到大肠杆菌(E.coli)生产菌株中。
使用常规技术培养转化的菌株,从沉淀物(pellet)提取TdT蛋白。例如,将先前制备的沉淀物在30℃至37℃的水浴中解冻。完全解冻后,将沉淀物重悬于包含50mM tris-HCL(Sigma)pH 7.5、150mM NaCl(Sigma)、0.5mM巯基乙醇(Sigma)、5%甘油(Sigma)、20mM咪唑(Sigma)和1片用于100mL的蛋白酶抑制剂混合物(Thermofisher)的裂解缓冲液中。仔细地进行重悬,以便避免过早裂解和残留聚集物。通过若干次弗氏压碎器(French press)循环将重悬的细胞裂解,直到获得完全的颜色均匀性。通常使用的压力是14,000psi。然后将裂解物以10,000rpm离心1h至1h 30min。将离心液通过0.2μm过滤器,以在柱纯化前去除所有残渣。
TdT蛋白可以通过一步亲和程序从离心液中纯化。例如,Ni-NTA亲和柱(GEHealthcare)用于结合聚合酶。最初,将柱用15倍柱体积的50mM tris-HCL(Sigma)pH 7.5、150mM NaCl(Sigma)和20mM咪唑(Sigma)洗涤和平衡。平衡后使聚合酶结合至柱。然后,将15倍柱体积的包含50mM tris-HCL(Sigma)pH 7.5、500mM NaCl(Sigma)和20mM咪唑(Sigma)的洗涤缓冲液施加至柱。洗涤后,用50mM tris-HCL(Sigma)pH 7.5,500mM NaCl(Sigma)和0.5M咪唑(Sigma)洗脱聚合酶。收集对应于最高浓度的感兴趣的聚合酶的级分并汇集成单个样品。将汇集的级分用透析缓冲液(20mM Tris-HCl,pH 6.8,200mM NaCl,50mM MgOAc,100mM[NH4]2SO4)透析。透析液随后在浓缩过滤器(Amicon Ultra-30,Merk Millipore)的帮助下进行浓缩。将浓缩的酶分成小的等分试样,添加最终50%的甘油,并且然后将这些等分试样冷冻于-20℃并长期储存。在SDS-PAGE凝胶中分析5μL的各种纯的化酶的级分。
用于实施本发明的方法的试剂盒
本发明包括各种用于实施本发明的方法的试剂盒。在一方面,本发明的试剂盒包括处于适于进行本文所述的无模板酶促多核苷酸合成的制剂中的本发明的TdT变体。这样的试剂盒还可以包括合成缓冲液,所述合成缓冲液提供用于优化向生长链无模板添加或掺入3’-O-保护的dNTP的反应条件。在一些实施方案中,本发明的试剂盒还包括3’-O-可逆保护的dNTP。在这样的实施方案中,3’-O-可逆保护的dNTP可以包括3’-O-氨基-dNTP或3’-O-叠氮甲基-dNTP。在另外的实施方案中,试剂盒可以包括单独的或与上述试剂一起的以下一项或更多项:(i)用于进行本文所述的脱保护步骤的脱保护试剂,(ii)附接了起始子的固体支持物,(iii)用于从固体支持物释放完成的多核苷酸的裂解试剂,(iv)在酶促添加或偶联步骤结束时用于去除未反应的3’-O-保护的dNTP的洗涤试剂或缓冲液,以及(v)合成后处理试剂,诸如纯化柱、脱盐试剂、洗脱试剂等。
关于上述第(ii)项和第(iii)项,某些起始子和裂解试剂可以一起提供。例如,包含肌苷可裂解核苷酸的起始子可以与核酸内切酶V裂解试剂一起提供;包含硝基苄基可光裂解接头的起始子可以与用于裂解可光裂解接头的合适光源一起提供;包含尿嘧啶的起始子可以与尿嘧啶DNA糖苷酶裂解试剂一起提供;等等。
实施例1:TdT变体的产生、表达和纯化
表达菌株产生.TdT小鼠基因可由[Boulé等人,1998,Mol.Biotechnol.10,199-208]中描述的pET28质粒产生。例如,该基因可以通过使用以下引物通过标准分子生物学技术来扩增:
·T7-pro:TAATACGACTCACTATAGGG(SEQ ID NO:33)
·T7-ter:GCTAGTTATTGCTCAGCGG(SEQ ID NO:34)。
然后将序列克隆到pET32骨架中,以产生新的pCTdT质粒。测序后将pCTdT转化到商业大肠杆菌细胞BL21(DE3,来自Novagen)中。分离在含有卡那霉素的平板上生长的克隆并命名为Ec-CTdT。聚合酶变体的产生.将pCTdT载体用作起始载体。包含一个或若干个点突变的特定引物由Agilent在线软件(http://www.genomics.Agilent.Com:80/PrimerdesignProgram.JSP)生成。商业可得的试剂盒QuickChange II(Agilent)可用于产生包含靶向突变的所需修饰聚合酶。实验程序遵循供应商的方案。生成不同载体后,对每个载体进行测序。将具有正确序列的载体转化到大肠杆菌生产菌株中。分离能够在卡那霉素LB琼脂平板上生长的克隆。
表达.Ec-CTdT和Ec-DSi或Ec-DSi’菌株可用于接种含有50mL补充有适量卡那霉素的LB培养基的250mL锥形瓶(erlen)。在37℃过夜生长后,适当体积的这些预培养物用于接种含有2L含有卡那霉素的LB培养基的5L锥形瓶。5L培养物的初始OD值选择为0.01。将锥形瓶置于37℃强烈搅动的条件下,并且定期检查不同培养物的OD。达到包含0.6和0.9之间的OD后,每个锥形瓶中补充添加1mL的1M IPTG(异丙基β-D-1-硫代吡喃半乳糖苷,Sigma)。将锥形瓶放回37℃的控制温度条件下搅动。过夜表达后,将细胞以若干沉淀物形式收集。表达相同变体的沉淀物被汇集并储存于-20℃,最终储存若干个月。
提取.将先前制备的沉淀物在30℃至37℃的水浴中解冻。完全解冻后,将沉淀物重悬于包含50mM tris-HCL(Sigma)pH 7.5、150mM NaCl(Sigma)、0.5mM巯基乙醇(Sigma)、5%甘油(Sigma)、20mM咪唑(Sigma)和1片用于100mL的蛋白酶抑制剂混合物(Thermofisher)的裂解缓冲液中。仔细地进行重悬,以便避免过早裂解和残留聚集物。通过若干次弗氏压碎器循环将重悬的细胞裂解,直到获得完全的颜色均匀性。通常使用的压力是14,000psi。然后将裂解物以10,000rpm离心1h至1h 30min。将离心液通过0.2μm过滤器,以在柱纯化前去除所有残渣。
纯化.一步亲和程序用于纯化产生的和提取的聚合酶。Ni-NTA亲和柱(GEHealthcare)用于结合聚合酶。最初,将柱用15倍柱体积的50mM tris-HCL(Sigma)pH 7.5、150mM NaCl(Sigma)和20mM咪唑(Sigma)洗涤和平衡。平衡后使聚合酶结合至柱。然后,将15倍柱体积的包含50mM tris-HCL(Sigma)pH 7.5、500mM NaCl(Sigma)和20mM咪唑(Sigma)的洗涤缓冲施加至柱。洗涤后,用50mM tris-HCL(Sigma)pH 7.5,500mM NaCl(Sigma)和0.5M咪唑(Sigma)洗脱聚合酶。收集对应于最高浓度的感兴趣的聚合酶的级分并汇集成单个样品。将汇集的级分用透析缓冲液(20mM Tris-HCl,pH 6.8,200mM NaCl,50mM MgOAc,100mM[NH4]2SO4)透析。透析液随后在浓缩过滤器(Amicon Ultra-30,Merk Millipore)的帮助下进行浓缩。将浓缩的酶分成小的等分试样,添加最终50%的甘油,并且然后将这些等分试样冷冻于-20℃并长期储存。在SDS-PAGE凝胶中分析5μL的各种纯化酶的级分。
实施例2:TdT变体合成困难序列的效率
如上所述,本发明部分地基于本发明人的认识和理解,即对TdT而言,某些核苷酸序列难以延伸。因此,本实验的一个目的是基于与命名为M27(SEQ ID NO:32)的先前的TdT变体进行的比较,发现表现出增强的合成这种困难序列的能力的新的TdT变体。在本实施例中,小鼠TdT(SEQ ID NO:3)的突变文库基于来自小鼠TdT的结构信息、来自先前文库的TdT变体的活性并由常规蛋白工程化技术产生。如上所述地表达和纯化来自文库的TdT变体,并筛选以高于M27的速率合成某些难以合成序列的能力的TdT变体(在表7中示出)。短序列的合成通过重复5个合成循环来进行,其中每个循环包括两个步骤:(i)延伸步骤(典型反应体积为200μL),其中将引物(或起始子)与1mM的3’-O-NH2-dXTP和定义浓度的TdT变体一起在活性缓冲液中在37℃孵育3min(根据待合成的序列,X可以是A、T、C或G;例如,为了合成AACTA,对于第一个循环X=A,对于第二个循环X=A,对于第三个循环X=C,等等);和(ii)脱保护步骤(典型反应体积为200μL),以使延伸的引物脱封闭以去除3’-保护基团并允许第二延伸步骤。脱封闭反应在700mM NaNO2,1M乙酸钠,pH=5.5中进行3min。反应体积通常为200μL(例如,参见Benner,美国专利7544794)。延伸的引物连接到允许在每个步骤之间去除反应缓冲液的固体支持物。如上所述,反应在37℃进行3min,之后将延伸的引物(i)从它们的支持物裂解,(ii)通过电泳分离,和(iii)测量条带的荧光强度以评估每种变体的合成效率。结果在表7中示出,其中条目是反映变体之间相对延伸速率的相对值。
表7:各种TdT变体的合成效率测试起始子的3’序列
变体 -AACTA -AAGCT -CCCCA -GGCAT -GGCTG
DS1017(M27)SEQ ID NO:32 75 96 26 96 56
Lib34-20 72 96 18 96 57
DS1002(M44-1) 74 97 50 97 36
DS1002(M44-2) 78 95 50 96 35
DS1004(M45) 84 97 59 95 58
DS1006(M46) 93 96 28 96 71
DS1007(M47) 92 97 30 96 78
Lib34-16 91 94 7 0 75
对一种或更多种测试起始子的延伸活性超过M27的变体序列的检查显示,每种变体至少在Q326处具有取代,并且通常共有来自相对于SEQ ID NO:3的集合K265、H337、W377、A17和G57中的一种或更多种另外的取代。
变体M27、M44和M45的延伸效率也在不同的反应温度条件下进行了测量。在这些实验中,只进行了一次延伸步骤。反应条件如下:0.5μM的引物(即起始子)浓度,125μM的单一3’-ONH2-dTTP,以及补充有CoCl2的TdT反应缓冲液(例如,可从New England Biolabs获得)。使用具有不同的组成和20个至25个核苷酸范围内的长度的不同引物(未附接至支持物)进行单独的反应。引物在5’末端用ATTO荧光染料标记。反应分别在37℃、45℃、50℃和55℃进行10min。结果在表8中示出,其中表中的值是相对幅度。
表8:各种TdT变体的最佳延伸反应温度
Figure BDA0003162220330000321
数据显示M44和M45在50℃及以上的温度等效地表现出高于M27的产率,这是更高的温度稳定性的证据。
实施例3:不同物种的TdT变体
在本实施例中,非小鼠TdT变体从公众可获得的基因构建,并在如上所述的发夹完成测定中进行测试,以确定它们将3’-O-氨基-dNTP掺入测试多核苷酸(p877)的能力。在表9中鉴定了TdT变体以及它们与小鼠TdT变体M27相比的掺入能力。
表9:非小鼠TdT变体的特征
Figure BDA0003162220330000331
*发夹完成测定
定义
氨基酸由它们的单字母或三字母代码根据以下命名法表示:A:丙氨酸(Ala);C:半胱氨酸(Cys);D:天冬氨酸(Asp);E:谷氨酸(Glu);F:苯丙氨酸(Phe);G:甘氨酸(Gly);H:组氨酸(His);I:异亮氨酸(Ile);K:赖氨酸(Lys);L:亮氨酸(Leu);M:甲硫氨酸(Met);N:天冬酰胺(Asn);P:脯氨酸(Pro);Q:谷氨酰胺(Gln);R:精氨酸(Arg);S:丝氨酸(Ser);T:苏氨酸(Thr);V:缬氨酸(Val);W:色氨酸(Trp)和Y:酪氨酸(Tyr)。
提及取代残基时的“功能等同”意指变体TdT的取代残基与另一个具有与SEQ IDNO:1同源的序列的TdT序列中的残基具有相同的功能作用。功能等同的残基可以通过使用序列比对来鉴定,例如,使用Mutalin line比对软件(http://muLtalin.toulouse.inra.fr/multalin/multalin.html;1988,Nucl.Acids Res.,16(22),25 10881-10890)。比对后,功能等同的残基位于所考虑的不同序列的同源位置处。序列比对和功能等同残基的鉴定可以在任何TdT和它们的天然变体之间(包括物种间)进行确定。
提及蛋白时的“分离的(Isolated)”意指这样的化合物,所述化合物已经被鉴定并与其自然环境的组分分离和/或回收或从非均相反应混合物中分离和/或回收。自然环境或反应混合物中的污染物组分是会干扰蛋白功能的物质,并可以包括酶、激素和其他蛋白质或非蛋白质溶质。在一些实施方案中,本发明的蛋白被纯化(1)至按蛋白重量计大于95%,并且最优选地按重量计大于99%,如通过Lowry法确定的,(2)至通过使用旋转杯测序仪(spinning cup sequenator)足以获得至少15个N末端或内部氨基酸序列的残基的程度,或(3)至使用考马斯蓝或优选地银染的还原或非还原条件下的SDS-PAGE的均一性。当通过重组方法制备时,本发明的分离的蛋白可以包括在重组细胞内原位的本发明的蛋白,因为该蛋白的自然环境中的至少一种组分将不存在。通常,本发明的分离的蛋白通过至少一个纯化步骤来制备。
“试剂盒”是指用于递送用于进行本发明的方法的材料或试剂的任何递送系统。在反应测定的情况下,这种递送系统包括允许反应试剂(例如,在适当的容器中的一种或更多种TdT变体、反应缓冲液、3’-O-保护的-dNTP、脱保护试剂、附接了起始子的固相支持物等)和/或支持材料(例如,缓冲液,用于进行测定的书面说明等)的储存、从一个位置到另一个位置的运输或递送的系统和/或化合物(诸如稀释剂、表面活性剂、载体等)。例如,试剂盒包括容纳相关反应试剂和/或支持材料的一种或更多种包封物(例如,盒子)。这些内含物可以一起或单独地被递送到预期的接收者。例如,第一容器可以容纳一种或更多种用于合成方法的TdT变体,而第二或另外的容器可以容纳脱保护剂、带有起始子的固相支持物、3’-O-保护的dNTP等。
可互换使用的“突变体”或“变体”是指衍生自本文所述的天然或参考TdT多肽并且在一个或更多个位置处包含修饰或改变(即,取代、插入和/或缺失)的多肽。变体可以通过本领域熟知的各种技术获得。特别地,用于改变编码野生型蛋白的DNA序列的技术的实例包括,但不限于,定点诱变、随机诱变、序列混编(sequence shuffling)和合成寡核苷酸构建。诱变活性由蛋白或者在本发明的情况下聚合酶的序列中的缺失、插入或取代一个或若干个氨基酸组成。以下术语用于表示取代:L238A表示参考序列或野生型序列的位置238处的氨基酸残基(亮氨酸,L)变为丙氨酸(A)。A132V/I/M表示亲本序列的位置132处的氨基酸残基(丙氨酸,A)被以下氨基酸之一取代:缬氨酸(V)、异亮氨酸(I)或甲硫氨酸(M)。取代可以是保守取代或非保守取代。保守取代的实例是在以下的组内:碱性氨基酸(精氨酸、赖氨酸和组氨酸)、酸性氨基酸(谷氨酸和天冬氨酸)、极性氨基酸(谷氨酰胺、天冬酰胺和苏氨酸)、疏水性氨基酸(甲硫氨酸、亮氨酸、异亮氨酸、半胱氨酸和缬氨酸)、芳族氨基酸(苯丙氨酸、色氨酸和酪氨酸)和小氨基酸(甘氨酸、丙氨酸和丝氨酸)。
“序列同一性”是指两个序列(诸如两个多肽序列或两个多核苷酸序列)之间匹配(例如,相同的氨基酸残基)的数目(或分数,通常以百分比表示)。序列同一性是在对齐以便使重叠和同一性最大化,同时使序列空位最小化的情况下通过对序列进行比较来确定的。特别地,序列同一性可以使用许多数学的全局或局部比对算法中的任何一种来确定,这取决于两个序列的长度。相似长度的序列优选使用全局比对算法(例如Needleman和Wunsch算法;Needleman和Wunsch,1970)进行比对,其在整个长度上最优地对齐序列,而实质上不同长度的序列优选使用局部比对算法(例如Smith和Waterman算法(Smith和Waterman,1981)或Altschul算法(Altschul等人,1997;Altschul等人,2005)进行比对。以确定氨基酸序列同一性百分比为目的的比对可以以本领域技术内的各种方式实现,例如,使用可在互联网网站诸如http://blast.ncbi.nlm.nih.gov/或http://www.ebi.ac.uk/Tools/emboss/上获得的公开可用的计算机软件。本领域技术人员可以确定用于测量比对的合适参数,包括在被比对序列的全长上实现最大比对所需的任何算法。出于本文的目的,氨基酸序列同一性%值是指使用配对序列比对程序EMBOSS Needle生成的值,该程序使用Needman-Wunsch算法创建两个序列的最佳全局比对,其中所有检索参数被设置为默认值,即评分矩阵(Scoring matrix)=BLOSUM62,空位开放(Gap open)=10,空位扩展=0.5,末端空位罚分=错误(false),末端空位开放(End gap open)=10并且末端空位扩展(End gap extend)=0.5。
“多核苷酸”或“寡核苷酸”可互换地使用并且均意指核苷酸单体或其类似物的线性聚合物。构成多核苷酸和寡核苷酸的单体能够通过单体与单体相互作用的常规模式(诸如沃森-克里克型碱基配对、碱基堆积、Hoogsteen或反向Hoogsteen型碱基配对等)特异性结合至天然多核苷酸。此类单体及其核苷间键可以是天然存在的或者可以是其类似物,例如天然存在的或非天然存在的类似物。非天然存在的类似物可包括PNA、硫代磷酸核苷间连键、含有允许标记物(诸如荧光团或半抗原等)附接的连接基团的碱基。每当寡核苷酸或多核苷酸的使用需要酶促加工,诸如通过聚合酶延伸、通过连接酶连接等时,普通技术人员将理解,在那些情况下,寡核苷酸或多核苷酸在任何或一些位置处将不含核苷间键、糖部分或碱基的某些类似物。多核苷酸的大小范围通常从几个单体单元(例如5-40个,此时多核苷酸通常被称为“寡核苷酸”)到数千个单体单元。除非另有说明或从上下文明显的,否则每当多核苷酸或寡核苷酸以字母(大写或小写)序列表示时,诸如“ATGCCTG”,应该理解的是该核苷酸从左到右是5'→3'的顺序,并且“A”表示脱氧腺苷,“C”表示脱氧胞苷,“G”表示脱氧鸟苷,并且“T”表示胸苷,“I”表示脱氧肌苷,“U”表示尿苷。除非另有说明,否则术语和原子编号惯例将遵循在Strachan和Read,Human Molecular Genetics 2(Wiley-Liss,New York,1999)中公开的那些。通常多核苷酸包含由磷酸二酯键连接的四种天然核苷(例如,对于DNA的脱氧腺苷、脱氧胞苷、脱氧鸟苷、脱氧胸苷或对于RNA的它们的核糖对应物);然而,它们还可包含非天然的核苷酸类似物,例如包含修饰的碱基、糖或核苷间连键。本领域技术人员清楚,在酶的活性具有对特定的寡核苷酸或多核苷酸底物的要求的情况下,例如单链DNA、RNA/DNA双链体等,则寡核苷酸或多核苷酸底物的合适组成的选择完全在普通技术人员的知识范围内,特别是在来自论文的指导下,诸如Sambrook等人,Molecular Cloning,第二版(Cold Spring Harbor Laboratory,New York,1989)以及类似的参考文献。同样,寡核苷酸和多核苷酸可以指单链形式或双链形式(即寡核苷酸或多核苷酸与其各自的互补物的双链体)。根据术语使用的上下文,普通技术人员将清楚哪种形式是意图的或是否两种形式都是意图的。
“引物”意指能够在与多核苷酸模板形成双链体后作为核酸合成的起始点并且从其3'末端沿模板延伸,从而形成延伸的双链体的天然或合成的寡核苷酸。引物的延伸通常用核酸聚合酶诸如DNA或RNA聚合酶来进行。在延伸过程中添加的核苷酸的序列由模板多核苷酸的序列决定。通常通过DNA聚合酶延伸引物。引物通常具有14个核苷酸至40个核苷酸范围内或18个核苷酸至36个核苷酸范围内的长度。引物用于各种核酸扩增反应,例如使用单一引物的线性扩增反应或采用两种或更多种引物的聚合酶链式反应。为特定应用选择引物长度和序列的指南是本领域普通技术人员熟知的,如由以下通过引用并入本文的参考文献证明的:Dieffenbach,编辑,PCR Primer:A Laboratory Manual,第二版(Cold SpringHarbor Press,New York,2003)。
“取代”意指一种氨基酸残基被另一种氨基酸残基替代。优选地,术语“取代”是指氨基酸残基被选自以下的另一种氨基酸残基替换:天然存在的标准的20种氨基酸残基、稀有的天然存在的氨基酸残基(例如羟基脯氨酸、羟基赖氨酸、别羟基赖氨酸、6-N-甲基赖氨酸、N-乙基甘氨酸、N-甲基甘氨酸、N-乙基天冬酰胺、别异亮氨酸、N-甲基异亮氨酸、N-甲基缬氨酸、焦谷氨酰胺、氨基丁酸、鸟氨酸、正亮氨酸、正缬氨酸),和非天然存在的通常合成制备的氨基酸残基(例如环己基-丙氨酸)。优选地,术语“取代”是指一种氨基酸残基被另一种选自天然存在的标准的20种氨基酸残基的残基取代。符号“+”表示取代的组合。
氨基酸在本文中由它们的单字母或三字母代码根据以下命名法表示:A:丙氨酸(Ala);C:半胱氨酸(Cys);D:天冬氨酸(Asp);E:谷氨酸(Glu);F:苯丙氨酸(Phe);G:甘氨酸(Gly);H:组氨酸(His);I:异亮氨酸(Ile);K:赖氨酸(Lys);L:亮氨酸(Leu);M:甲硫氨酸(Met);N:天冬酰胺(Asn);P:脯氨酸(Pro);Q:谷氨酰胺(Gln);R:精氨酸(Arg);S:丝氨酸(Ser);T:苏氨酸(Thr);V:缬氨酸(Val);W:色氨酸(Trp)和Y:酪氨酸(Tyr)。
在本文件中,以下术语用于表示取代:L238A表示亲本序列的位置238处的氨基酸残基(亮氨酸,L)变为丙氨酸(A)。A132V/I/M表示亲本序列的位置132处的氨基酸残基(丙氨酸,A)被以下氨基酸之一取代:缬氨酸(V)、异亮氨酸(I)或甲硫氨酸(M)。取代可以是保守取代或非保守取代。保守取代的实例是在以下的组内:碱性氨基酸(精氨酸、赖氨酸和组氨酸)、酸性氨基酸(谷氨酸和天冬氨酸)、极性氨基酸(谷氨酰胺、天冬酰胺和苏氨酸)、疏水性氨基酸(甲硫氨酸、亮氨酸、异亮氨酸、半胱氨酸和缬氨酸)、芳族氨基酸(苯丙氨酸、色氨酸和酪氨酸)和小氨基酸(甘氨酸、丙氨酸和丝氨酸)。
本公开内容不意图限于所阐述的特定形式的范围,而是意图涵盖本文描述的变化形式的替代、修改和等同物。此外,本公开内容的范围完全包含鉴于本公开内容对本领域技术人员可以变得明显的其他变化形式。本发明的范围仅由所附权利要求书限定。
序列表
<110> DNA斯克瑞普特公司
<120> 末端脱氧核苷酸转移酶变体及其用途
<130> B2881PC
<160> 34
<170> PatentIn version 3.5
<210> 1
<211> 510
<212> PRT
<213> 人工序列(ARTIFICIAL SEQUENCE)
<220>
<223> TdT 蛋白
<400> 1
Met Asp Pro Leu Gln Ala Val His Leu Gly Pro Arg Lys Lys Arg Pro
1 5 10 15
Arg Gln Leu Gly Thr Pro Val Ala Ser Thr Pro Tyr Asp Ile Arg Phe
20 25 30
Arg Asp Leu Val Leu Phe Ile Leu Glu Lys Lys Met Gly Thr Thr Arg
35 40 45
Arg Ala Phe Leu Met Glu Leu Ala Arg Arg Lys Gly Phe Arg Val Glu
50 55 60
Asn Glu Leu Ser Asp Ser Val Thr His Ile Val Ala Glu Asn Asn Ser
65 70 75 80
Gly Ser Asp Val Leu Glu Trp Leu Gln Leu Gln Asn Ile Lys Ala Ser
85 90 95
Ser Glu Leu Glu Leu Leu Asp Ile Ser Trp Leu Ile Glu Cys Met Gly
100 105 110
Ala Gly Lys Pro Val Glu Met Met Gly Arg His Gln Leu Val Val Asn
115 120 125
Arg Asn Ser Ser Pro Ser Pro Val Pro Gly Ser Gln Asn Val Pro Ala
130 135 140
Pro Ala Val Lys Lys Ile Ser Gln Tyr Ala Cys Gln Arg Arg Thr Thr
145 150 155 160
Leu Asn Asn Tyr Asn Gln Leu Phe Thr Asp Ala Leu Asp Ile Leu Ala
165 170 175
Glu Asn Asp Glu Leu Arg Glu Asn Glu Gly Ser Cys Leu Ala Phe Met
180 185 190
Arg Ala Ser Ser Val Leu Lys Ser Leu Pro Phe Pro Ile Thr Ser Met
195 200 205
Lys Asp Thr Glu Gly Ile Pro Cys Leu Gly Asp Lys Val Lys Ser Ile
210 215 220
Ile Glu Gly Ile Ile Glu Asp Gly Glu Ser Ser Glu Ala Lys Ala Val
225 230 235 240
Leu Asn Asp Glu Arg Tyr Lys Ser Phe Lys Leu Phe Thr Ser Val Phe
245 250 255
Gly Val Gly Leu Lys Thr Ala Glu Lys Trp Phe Arg Met Gly Phe Arg
260 265 270
Thr Leu Ser Lys Ile Gln Ser Asp Lys Ser Leu Arg Phe Thr Gln Met
275 280 285
Gln Lys Ala Gly Phe Leu Tyr Tyr Glu Asp Leu Val Ser Cys Val Asn
290 295 300
Arg Pro Glu Ala Glu Ala Val Ser Met Leu Val Lys Glu Ala Val Val
305 310 315 320
Thr Phe Leu Pro Asp Ala Leu Val Thr Met Thr Gly Gly Phe Arg Arg
325 330 335
Gly Lys Met Thr Gly His Asp Val Asp Phe Leu Ile Thr Ser Pro Glu
340 345 350
Ala Thr Glu Asp Glu Glu Gln Gln Leu Leu His Lys Val Thr Asp Phe
355 360 365
Trp Lys Gln Gln Gly Leu Leu Leu Tyr Cys Asp Ile Leu Glu Ser Thr
370 375 380
Phe Glu Lys Phe Lys Gln Pro Ser Arg Lys Val Asp Ala Leu Asp His
385 390 395 400
Phe Gln Lys Cys Phe Leu Ile Leu Lys Leu Asp His Gly Arg Val His
405 410 415
Ser Glu Lys Ser Gly Gln Gln Glu Gly Lys Gly Trp Lys Ala Ile Arg
420 425 430
Val Asp Leu Val Met Cys Pro Tyr Asp Arg Arg Ala Phe Ala Leu Leu
435 440 445
Gly Trp Thr Gly Ser Arg Gln Phe Glu Arg Asp Leu Arg Arg Tyr Ala
450 455 460
Thr His Glu Arg Lys Met Met Leu Asp Asn His Ala Leu Tyr Asp Arg
465 470 475 480
Thr Lys Arg Val Phe Leu Glu Ala Glu Ser Glu Glu Glu Ile Phe Ala
485 490 495
His Leu Gly Leu Asp Tyr Ile Glu Pro Trp Glu Arg Asn Ala
500 505 510
<210> 2
<211> 18
<212> DNA
<213> 人工序列(ARTIFICIAL SEQUENCE)
<220>
<223> 引物
<400> 2
aaaaaaaaaa aaaagggg 18
<210> 3
<211> 381
<212> PRT
<213> 人工序列(ARTIFICIAL SEQUENCE)
<220>
<223> 截短的小鼠序列
<400> 3
Asn Ser Ser Pro Ser Pro Val Pro Gly Ser Gln Asn Val Pro Ala Pro
1 5 10 15
Ala Val Lys Lys Ile Ser Gln Tyr Ala Cys Gln Arg Arg Thr Thr Leu
20 25 30
Asn Asn Tyr Asn Gln Leu Phe Thr Asp Ala Leu Asp Ile Leu Ala Glu
35 40 45
Asn Asp Glu Leu Arg Glu Asn Glu Gly Ser Cys Leu Ala Phe Met Arg
50 55 60
Ala Ser Ser Val Leu Lys Ser Leu Pro Phe Pro Ile Thr Ser Met Lys
65 70 75 80
Asp Thr Glu Gly Ile Pro Cys Leu Gly Asp Lys Val Lys Ser Ile Ile
85 90 95
Glu Gly Ile Ile Glu Asp Gly Glu Ser Ser Glu Ala Lys Ala Val Leu
100 105 110
Asn Asp Glu Arg Tyr Lys Ser Phe Lys Leu Phe Thr Ser Val Phe Gly
115 120 125
Val Gly Leu Lys Thr Ala Glu Lys Trp Phe Arg Met Gly Phe Arg Thr
130 135 140
Leu Ser Lys Ile Gln Ser Asp Lys Ser Leu Arg Phe Thr Gln Met Gln
145 150 155 160
Lys Ala Gly Phe Leu Tyr Tyr Glu Asp Leu Val Ser Cys Val Asn Arg
165 170 175
Pro Glu Ala Glu Ala Val Ser Met Leu Val Lys Glu Ala Val Val Thr
180 185 190
Phe Leu Pro Asp Ala Leu Val Thr Met Thr Gly Gly Phe Arg Arg Gly
195 200 205
Lys Met Thr Gly His Asp Val Asp Phe Leu Ile Thr Ser Pro Glu Ala
210 215 220
Thr Glu Asp Glu Glu Gln Gln Leu Leu His Lys Val Thr Asp Phe Trp
225 230 235 240
Lys Gln Gln Gly Leu Leu Leu Tyr Cys Asp Ile Leu Glu Ser Thr Phe
245 250 255
Glu Lys Phe Lys Gln Pro Ser Arg Lys Val Asp Ala Leu Asp His Phe
260 265 270
Gln Lys Cys Phe Leu Ile Leu Lys Leu Asp His Gly Arg Val His Ser
275 280 285
Glu Lys Ser Gly Gln Gln Glu Gly Lys Gly Trp Lys Ala Ile Arg Val
290 295 300
Asp Leu Val Met Cys Pro Tyr Asp Arg Arg Ala Phe Ala Leu Leu Gly
305 310 315 320
Trp Thr Gly Ser Arg Gln Phe Glu Arg Asp Leu Arg Arg Tyr Ala Thr
325 330 335
His Glu Arg Lys Met Met Leu Asp Asn His Ala Leu Tyr Asp Arg Thr
340 345 350
Lys Arg Val Phe Leu Glu Ala Glu Ser Glu Glu Glu Ile Phe Ala His
355 360 365
Leu Gly Leu Asp Tyr Ile Glu Pro Trp Glu Arg Asn Ala
370 375 380
<210> 4
<211> 380
<212> PRT
<213> 人工序列(ARTIFICIAL SEQUENCE)
<220>
<223> 牛截短的催化结构域
<400> 4
Asp Tyr Ser Ala Thr Pro Asn Pro Gly Phe Gln Lys Thr Pro Pro Leu
1 5 10 15
Ala Val Lys Lys Ile Ser Gln Tyr Ala Cys Gln Arg Lys Thr Thr Leu
20 25 30
Asn Asn Tyr Asn His Ile Phe Thr Asp Ala Phe Glu Ile Leu Ala Glu
35 40 45
Asn Ser Glu Phe Lys Glu Asn Glu Val Ser Tyr Val Thr Phe Met Arg
50 55 60
Ala Ala Ser Val Leu Lys Ser Leu Pro Phe Thr Ile Ile Ser Met Lys
65 70 75 80
Asp Thr Glu Gly Ile Pro Cys Leu Gly Asp Lys Val Lys Cys Ile Ile
85 90 95
Glu Glu Ile Ile Glu Asp Gly Glu Ser Ser Glu Val Lys Ala Val Leu
100 105 110
Asn Asp Glu Arg Tyr Gln Ser Phe Lys Leu Phe Thr Ser Val Phe Gly
115 120 125
Val Gly Leu Lys Thr Ser Glu Lys Trp Phe Arg Met Gly Phe Arg Ser
130 135 140
Leu Ser Lys Ile Met Ser Asp Lys Thr Leu Lys Phe Thr Lys Met Gln
145 150 155 160
Lys Ala Gly Phe Leu Tyr Tyr Glu Asp Leu Val Ser Cys Val Thr Arg
165 170 175
Ala Glu Ala Glu Ala Val Gly Val Leu Val Lys Glu Ala Val Trp Ala
180 185 190
Phe Leu Pro Asp Ala Phe Val Thr Met Thr Gly Gly Phe Arg Arg Gly
195 200 205
Lys Lys Ile Gly His Asp Val Asp Phe Leu Ile Thr Ser Pro Gly Ser
210 215 220
Ala Glu Asp Glu Glu Gln Leu Leu Pro Lys Val Ile Asn Leu Trp Glu
225 230 235 240
Lys Lys Gly Leu Leu Leu Tyr Tyr Asp Leu Val Glu Ser Thr Phe Glu
245 250 255
Lys Phe Lys Leu Pro Ser Arg Gln Val Asp Thr Leu Asp His Phe Gln
260 265 270
Lys Cys Phe Leu Ile Leu Lys Leu His His Gln Arg Val Asp Ser Ser
275 280 285
Lys Ser Asn Gln Gln Glu Gly Lys Thr Trp Lys Ala Ile Arg Val Asp
290 295 300
Leu Val Met Cys Pro Tyr Glu Asn Arg Ala Phe Ala Leu Leu Gly Trp
305 310 315 320
Thr Gly Ser Arg Gln Phe Glu Arg Asp Ile Arg Arg Tyr Ala Thr His
325 330 335
Glu Arg Lys Met Met Leu Asp Asn His Ala Leu Tyr Asp Lys Thr Lys
340 345 350
Arg Val Phe Leu Lys Ala Glu Ser Glu Glu Glu Ile Phe Ala His Leu
355 360 365
Gly Leu Asp Tyr Ile Glu Pro Trp Glu Arg Asn Ala
370 375 380
<210> 5
<211> 380
<212> PRT
<213> 人工序列(ARTIFICIAL SEQUENCE)
<220>
<223> 人类截短的
<400> 5
Asp Tyr Ser Asp Ser Thr Asn Pro Gly Pro Pro Lys Thr Pro Pro Ile
1 5 10 15
Ala Val Gln Lys Ile Ser Gln Tyr Ala Cys Gln Arg Arg Thr Thr Leu
20 25 30
Asn Asn Cys Asn Gln Ile Phe Thr Asp Ala Phe Asp Ile Leu Ala Glu
35 40 45
Asn Cys Glu Phe Arg Glu Asn Glu Asp Ser Cys Val Thr Phe Met Arg
50 55 60
Ala Ala Ser Val Leu Lys Ser Leu Pro Phe Thr Ile Ile Ser Met Lys
65 70 75 80
Asp Thr Glu Gly Ile Pro Cys Leu Gly Ser Lys Val Lys Gly Ile Ile
85 90 95
Glu Glu Ile Ile Glu Asp Gly Glu Ser Ser Glu Val Lys Ala Val Leu
100 105 110
Asn Asp Glu Arg Tyr Gln Ser Phe Lys Leu Phe Thr Ser Val Phe Gly
115 120 125
Val Gly Leu Lys Thr Ser Glu Lys Trp Phe Arg Met Gly Phe Arg Thr
130 135 140
Leu Ser Lys Val Arg Ser Asp Lys Ser Leu Lys Phe Thr Arg Met Gln
145 150 155 160
Lys Ala Gly Phe Leu Tyr Tyr Glu Asp Leu Val Ser Cys Val Thr Arg
165 170 175
Ala Glu Ala Glu Ala Val Ser Val Leu Val Lys Glu Ala Val Trp Ala
180 185 190
Phe Leu Pro Asp Ala Phe Val Thr Met Thr Gly Gly Phe Arg Arg Gly
195 200 205
Lys Lys Met Gly His Asp Val Asp Phe Leu Ile Thr Ser Pro Gly Ser
210 215 220
Thr Glu Asp Glu Glu Gln Leu Leu Gln Lys Val Met Asn Leu Trp Glu
225 230 235 240
Lys Lys Gly Leu Leu Leu Tyr Tyr Asp Leu Val Glu Ser Thr Phe Glu
245 250 255
Lys Leu Arg Leu Pro Ser Arg Lys Val Asp Ala Leu Asp His Phe Gln
260 265 270
Lys Cys Phe Leu Ile Phe Lys Leu Pro Arg Gln Arg Val Asp Ser Asp
275 280 285
Gln Ser Ser Trp Gln Glu Gly Lys Thr Trp Lys Ala Ile Arg Val Asp
290 295 300
Leu Val Leu Cys Pro Tyr Glu Arg Arg Ala Phe Ala Leu Leu Gly Trp
305 310 315 320
Thr Gly Ser Arg Gln Phe Glu Arg Asp Leu Arg Arg Tyr Ala Thr His
325 330 335
Glu Arg Lys Met Ile Leu Asp Asn His Ala Leu Tyr Asp Lys Thr Lys
340 345 350
Arg Ile Phe Leu Lys Ala Glu Ser Glu Glu Glu Ile Phe Ala His Leu
355 360 365
Gly Leu Asp Tyr Ile Glu Pro Trp Glu Arg Asn Ala
370 375 380
<210> 6
<211> 376
<212> PRT
<213> 人工序列(ARTIFICIAL SEQUENCE)
<220>
<223> 鸡1截短的
<400> 6
Gln Tyr Pro Thr Leu Lys Thr Pro Glu Ser Glu Val Ser Ser Phe Thr
1 5 10 15
Ala Ser Lys Val Ser Gln Tyr Ser Cys Gln Arg Lys Thr Thr Leu Asn
20 25 30
Asn Cys Asn Lys Lys Phe Thr Asp Ala Phe Glu Ile Met Ala Glu Asn
35 40 45
Tyr Glu Phe Lys Glu Asn Glu Ile Phe Cys Leu Glu Phe Leu Arg Ala
50 55 60
Ala Ser Val Leu Lys Ser Leu Pro Phe Pro Val Thr Arg Met Lys Asp
65 70 75 80
Ile Gln Gly Leu Pro Cys Met Gly Asp Arg Val Arg Asp Val Ile Glu
85 90 95
Glu Ile Ile Glu Glu Gly Glu Ser Ser Arg Ala Lys Asp Val Leu Asn
100 105 110
Asp Glu Arg Tyr Lys Ser Phe Lys Glu Phe Thr Ser Val Phe Gly Val
115 120 125
Gly Val Lys Thr Ser Glu Lys Trp Phe Arg Met Gly Leu Arg Thr Val
130 135 140
Glu Glu Val Lys Ala Asp Lys Thr Leu Lys Leu Ser Lys Met Gln Arg
145 150 155 160
Ala Gly Phe Leu Tyr Tyr Glu Asp Leu Val Ser Cys Val Ser Lys Ala
165 170 175
Glu Ala Asp Ala Val Ser Ser Ile Val Lys Asn Thr Val Cys Thr Phe
180 185 190
Leu Pro Asp Ala Leu Val Thr Ile Thr Gly Gly Phe Arg Arg Gly Lys
195 200 205
Lys Ile Gly His Asp Ile Asp Phe Leu Ile Thr Ser Pro Gly Gln Arg
210 215 220
Glu Asp Asp Glu Leu Leu His Lys Gly Leu Leu Leu Tyr Cys Asp Ile
225 230 235 240
Ile Glu Ser Thr Phe Val Lys Glu Gln Ile Pro Ser Arg His Val Asp
245 250 255
Ala Met Asp His Phe Gln Lys Cys Phe Ala Ile Leu Lys Leu Tyr Gln
260 265 270
Pro Arg Val Asp Asn Ser Ser Tyr Asn Met Ser Lys Lys Cys Asp Met
275 280 285
Ala Glu Val Lys Asp Trp Lys Ala Ile Arg Val Asp Leu Val Ile Thr
290 295 300
Pro Phe Glu Gln Tyr Ala Tyr Ala Leu Leu Gly Trp Thr Gly Ser Arg
305 310 315 320
Gln Phe Gly Arg Asp Leu Arg Arg Tyr Ala Thr His Glu Arg Lys Met
325 330 335
Met Leu Asp Asn His Ala Leu Tyr Asp Lys Arg Lys Arg Val Phe Leu
340 345 350
Lys Ala Gly Ser Glu Glu Glu Ile Phe Ala His Leu Gly Leu Asp Tyr
355 360 365
Val Glu Pro Trp Glu Arg Asn Ala
370 375
<210> 7
<211> 387
<212> PRT
<213> 人工序列(ARTIFICIAL SEQUENCE)
<220>
<223> 负鼠截短的
<400> 7
Ser Ala Asn Pro Asp Pro Thr Ala Gly Thr Leu Asn Ile Leu Pro Pro
1 5 10 15
Thr Thr Lys Thr Ile Ser Gln Tyr Ala Cys Gln Arg Arg Thr Thr Ile
20 25 30
Asn Asn His Asn Gln Arg Phe Thr Asp Ala Phe Glu Ile Leu Ala Lys
35 40 45
Asn Tyr Glu Phe Lys Glu Asn Asp Asp Thr Cys Leu Thr Phe Met Arg
50 55 60
Ala Ile Ser Val Leu Lys Cys Leu Pro Phe Glu Val Val Ser Leu Lys
65 70 75 80
Asp Thr Glu Gly Leu Pro Trp Ile Gly Asp Glu Val Lys Gly Ile Met
85 90 95
Glu Glu Ile Ile Glu Asp Gly Glu Ser Leu Glu Val Gln Ala Val Leu
100 105 110
Asn Asp Glu Arg Tyr Gln Ser Phe Lys Leu Phe Thr Ser Val Phe Gly
115 120 125
Val Gly Leu Lys Thr Ala Asp Lys Trp Tyr Arg Met Gly Phe Arg Thr
130 135 140
Leu Asn Lys Ile Arg Ser Asp Lys Thr Leu Lys Leu Thr Lys Met Gln
145 150 155 160
Lys Ala Gly Leu Cys Tyr Tyr Glu Asp Leu Ile Asp Cys Val Ser Lys
165 170 175
Ala Glu Ala Asp Ala Val Ser Leu Leu Val Gln Asp Ala Val Trp Thr
180 185 190
Phe Leu Pro Asp Ala Leu Val Thr Ile Thr Gly Gly Phe Arg Arg Gly
195 200 205
Lys Glu Phe Gly His Asp Val Asp Phe Leu Ile Thr Ser Pro Gly Ala
210 215 220
Glu Lys Glu Gln Glu Asp Gln Leu Leu Gln Lys Val Thr Asn Leu Trp
225 230 235 240
Lys Lys Gln Gly Leu Leu Leu Tyr Cys Asp Leu Ile Glu Ser Thr Phe
245 250 255
Glu Asp Leu Lys Leu Pro Ser Arg Lys Ile Asp Ala Leu Asp His Phe
260 265 270
Gln Lys Cys Phe Leu Ile Leu Lys Leu Tyr His His Lys Glu Asp Lys
275 280 285
Arg Lys Trp Glu Met Pro Thr Gly Ser Asn Glu Ser Glu Ala Lys Ser
290 295 300
Trp Lys Ala Ile Arg Val Asp Leu Val Val Cys Pro Tyr Asp Arg Tyr
305 310 315 320
Ala Phe Ala Leu Leu Gly Trp Ser Gly Ser Arg Gln Phe Glu Arg Asp
325 330 335
Leu Arg Arg Tyr Ala Thr His Glu Lys Lys Met Met Leu Asp Asn His
340 345 350
Ala Leu Tyr Asp Lys Thr Lys Lys Ile Phe Leu Lys Ala Lys Ser Glu
355 360 365
Glu Glu Ile Phe Ala His Leu Gly Leu Glu Tyr Ile Gln Pro Ser Glu
370 375 380
Arg Asn Ala
385
<210> 8
<211> 381
<212> PRT
<213> 人工序列(ARTIFICIAL SEQUENCE)
<220>
<223> 新的截短的鼩鼱
<400> 8
Asp Cys Pro Ala Ser His Asp Ser Ser Pro Gln Lys Thr Glu Ser Ala
1 5 10 15
Ala Val Gln Lys Ile Ser Gln Tyr Ala Cys Gln Arg Arg Thr Thr Leu
20 25 30
Asn Asn His Asn His Ile Phe Thr Asp Ala Phe Glu Ile Leu Ala Glu
35 40 45
Asn Cys Glu Phe Arg Glu Asn Glu Gly Ser Tyr Val Thr Tyr Met Arg
50 55 60
Ala Ala Ser Val Leu Lys Ser Leu Pro Phe Ser Ile Ile Ser Met Lys
65 70 75 80
Asp Thr Glu Gly Ile Pro Cys Leu Ala Asp Lys Val Lys Cys Val Ile
85 90 95
Glu Glu Ile Ile Glu Asp Gly Glu Ser Ser Glu Val Lys Ala Val Leu
100 105 110
Asn Asp Glu Arg Tyr Lys Ser Phe Lys Leu Phe Thr Ser Val Phe Gly
115 120 125
Val Gly Leu Lys Thr Ala Glu Lys Trp Phe Arg Leu Gly Phe Arg Thr
130 135 140
Leu Ser Gly Ile Met Asn Asp Lys Thr Leu Lys Leu Thr His Met Gln
145 150 155 160
Lys Ala Gly Phe Leu Tyr Tyr Glu Asp Leu Val Ser Cys Val Thr Arg
165 170 175
Ala Glu Ala Glu Ala Val Gly Val Leu Val Lys Glu Ala Val Trp Ala
180 185 190
Phe Leu Pro Asp Ala Ile Val Thr Met Thr Gly Gly Phe Arg Arg Gly
195 200 205
Lys Lys Val Gly His Asp Val Asp Phe Leu Ile Thr Ser Pro Glu Ala
210 215 220
Thr Glu Glu Gln Glu Gln Gln Leu Leu His Lys Val Ile Thr Phe Trp
225 230 235 240
Glu Lys Glu Gly Leu Leu Leu Tyr Cys Asp Leu Tyr Glu Ser Thr Phe
245 250 255
Glu Lys Leu Lys Met Pro Ser Arg Lys Val Asp Ala Leu Asp His Phe
260 265 270
Gln Lys Cys Phe Leu Ile Leu Lys Leu His Arg Glu Cys Val Asp Asp
275 280 285
Gly Thr Ser Ser Gln Leu Gln Gly Lys Thr Trp Lys Ala Ile Arg Val
290 295 300
Asp Leu Val Val Cys Pro Tyr Glu Cys Arg Ala Phe Ala Leu Leu Gly
305 310 315 320
Trp Thr Gly Ser Pro Gln Phe Glu Arg Asp Leu Arg Arg Tyr Ala Thr
325 330 335
His Glu Arg Lys Met Met Leu Asp Asn His Ala Leu Tyr Asp Lys Thr
340 345 350
Lys Arg Lys Phe Leu Ser Ala Asp Ser Glu Glu Asp Ile Phe Ala His
355 360 365
Leu Gly Leu Asp Tyr Ile Glu Pro Trp Glu Arg Asn Ala
370 375 380
<210> 9
<211> 387
<212> PRT
<213> 人工序列(ARTIFICIAL SEQUENCE)
<220>
<223> 蟒截短的
<400> 9
Glu Lys Tyr Gln Leu Pro Glu Asp Glu Asp Arg Ser Val Thr Ser Asp
1 5 10 15
Leu Asp Arg Asp Ser Ile Ser Glu Tyr Ala Cys Gln Arg Arg Thr Thr
20 25 30
Leu Lys Asn Tyr Asn Gln Lys Phe Thr Asp Ala Phe Glu Ile Leu Ala
35 40 45
Glu Asn Tyr Glu Phe Asn Glu Asn Lys Gly Phe Cys Thr Ala Phe Arg
50 55 60
Arg Ala Ala Ser Val Leu Lys Cys Leu Pro Phe Thr Ile Val Gln Val
65 70 75 80
His Asp Ile Glu Gly Val Pro Trp Met Gly Lys Gln Val Lys Gly Ile
85 90 95
Ile Glu Asp Ile Ile Glu Glu Gly Glu Ser Ser Lys Val Lys Ala Val
100 105 110
Leu Asp Asn Glu Asn Tyr Arg Ser Val Lys Leu Phe Thr Ser Val Phe
115 120 125
Gly Val Gly Leu Lys Thr Ser Asp Lys Trp Tyr Arg Met Gly Leu Arg
130 135 140
Thr Leu Glu Glu Val Lys Arg Asp Lys Asn Leu Lys Leu Thr Arg Met
145 150 155 160
Gln Lys Ala Gly Phe Leu His Tyr Asp Asp Leu Thr Ser Cys Val Ser
165 170 175
Lys Ala Glu Ala Asp Ala Ala Ser Leu Ile Val Gln Asp Val Val Trp
180 185 190
Lys Ile Val Pro Asn Ala Ile Val Thr Ile Ala Gly Gly Phe Arg Arg
195 200 205
Gly Lys Gln Thr Gly His Asp Val Asp Phe Leu Ile Thr Val Pro Gly
210 215 220
Ser Lys Gln Glu Glu Glu Glu Leu Leu His Thr Val Ile Asp Ile Trp
225 230 235 240
Lys Lys Gln Glu Leu Leu Leu Tyr Tyr Asp Leu Ile Glu Ser Thr Phe
245 250 255
Glu Asp Thr Lys Leu Pro Ser Arg Lys Val Asp Ala Leu Asp His Phe
260 265 270
Gln Lys Cys Phe Ala Ile Leu Lys Val His Lys Glu Arg Glu Asp Lys
275 280 285
Gly Asn Ser Ile Arg Ser Lys Ala Phe Ser Glu Glu Glu Ile Lys Asp
290 295 300
Trp Lys Ala Ile Arg Val Asp Leu Val Val Val Pro Phe Glu Gln Tyr
305 310 315 320
Ala Phe Ala Leu Leu Gly Trp Thr Gly Ser Thr Gln Phe Glu Arg Asp
325 330 335
Leu Arg Arg Tyr Ala Thr His Glu Lys Lys Met Met Leu Asp Asn His
340 345 350
Ala Leu Tyr Asp Lys Thr Lys Lys Ile Phe Leu Asn Ala Ala Ser Glu
355 360 365
Glu Glu Ile Phe Ala His Leu Gly Leu Asp Tyr Leu Glu Pro Trp Glu
370 375 380
Arg Asn Ala
385
<210> 10
<211> 381
<212> PRT
<213> 人工序列(ARTIFICIAL SEQUENCE)
<220>
<223> 截短的狗
<400> 10
Asp Tyr Thr Ala Ser Pro Asn Pro Glu Leu Gln Lys Thr Leu Pro Val
1 5 10 15
Ala Val Lys Lys Ile Ser Gln Tyr Ala Cys Gln Arg Arg Thr Thr Leu
20 25 30
Asn Asn Tyr Asn Asn Val Phe Thr Asp Ala Phe Glu Val Leu Ala Glu
35 40 45
Asn Tyr Glu Phe Arg Glu Asn Glu Val Phe Ser Leu Thr Phe Met Arg
50 55 60
Ala Ala Ser Val Leu Lys Ser Leu Pro Phe Thr Ile Ile Ser Met Lys
65 70 75 80
Asp Thr Glu Gly Ile Pro Cys Leu Gly Asp Gln Val Lys Cys Ile Ile
85 90 95
Glu Glu Ile Ile Glu Asp Gly Glu Ser Ser Glu Val Lys Ala Val Leu
100 105 110
Asn Asp Glu Arg Tyr Gln Ser Phe Lys Leu Phe Thr Ser Val Phe Gly
115 120 125
Val Gly Leu Lys Thr Ser Glu Lys Trp Phe Arg Met Gly Phe Arg Thr
130 135 140
Leu Ser Lys Ile Lys Ser Asp Lys Ser Leu Lys Phe Thr Pro Met Gln
145 150 155 160
Lys Ala Gly Phe Leu Tyr Tyr Glu Asp Leu Val Ser Cys Val Thr Arg
165 170 175
Ala Glu Ala Glu Ala Val Gly Val Leu Val Lys Glu Ala Val Gly Ala
180 185 190
Phe Leu Pro Asp Ala Phe Val Thr Met Thr Gly Gly Phe Arg Arg Gly
195 200 205
Lys Lys Met Gly His Asp Val Asp Phe Leu Ile Thr Ser Pro Gly Ser
210 215 220
Thr Asp Glu Asp Glu Glu Gln Leu Leu Pro Lys Val Ile Asn Leu Trp
225 230 235 240
Glu Arg Lys Gly Leu Leu Leu Tyr Cys Asp Leu Val Glu Ser Thr Phe
245 250 255
Glu Lys Leu Lys Leu Pro Ser Arg Lys Val Asp Ala Leu Asp His Phe
260 265 270
Gln Lys Cys Phe Leu Ile Leu Lys Leu His His Gln Arg Val Asp Gly
275 280 285
Gly Lys Cys Ser Gln Gln Glu Gly Lys Thr Trp Lys Ala Ile Arg Val
290 295 300
Asp Leu Val Met Cys Pro Tyr Glu Arg Arg Ala Phe Ala Leu Leu Gly
305 310 315 320
Trp Thr Gly Ser Arg Gln Phe Glu Arg Asp Leu Arg Arg Tyr Ala Ser
325 330 335
His Glu Arg Lys Met Ile Leu Asp Asn His Ala Leu Tyr Asp Lys Thr
340 345 350
Lys Lys Ile Phe Leu Lys Ala Glu Ser Glu Glu Glu Ile Phe Ala His
355 360 365
Leu Gly Leu Asp Tyr Ile Glu Pro Trp Glu Arg Asn Ala
370 375 380
<210> 11
<211> 382
<212> PRT
<213> 人工序列(ARTIFICIAL SEQUENCE)
<220>
<223> 截短的鼹鼠
<400> 11
Gly Asp Cys Pro Ala Ser His Asp Ser Ser Pro Gln Lys Thr Glu Ser
1 5 10 15
Ala Ala Val Gln Lys Ile Ser Gln Tyr Ala Cys Gln Arg Arg Thr Thr
20 25 30
Leu Asn Asn His Asn His Ile Phe Thr Asp Ala Phe Glu Ile Leu Ala
35 40 45
Glu Asn Cys Glu Phe Arg Glu Asn Glu Gly Ser Tyr Val Thr Tyr Met
50 55 60
Arg Ala Ala Ser Val Leu Lys Ser Leu Pro Phe Ser Ile Ile Ser Met
65 70 75 80
Lys Asp Thr Glu Gly Ile Pro Cys Leu Ala Asp Lys Val Lys Cys Val
85 90 95
Ile Glu Glu Ile Ile Glu Asp Gly Glu Ser Ser Glu Val Lys Ala Val
100 105 110
Leu Asn Asp Glu Arg Tyr Lys Ser Phe Lys Leu Phe Thr Ser Val Phe
115 120 125
Gly Val Gly Leu Lys Thr Ala Glu Lys Trp Phe Arg Leu Gly Phe Arg
130 135 140
Thr Leu Ser Gly Ile Met Asn Asp Lys Thr Leu Lys Leu Thr His Met
145 150 155 160
Gln Lys Ala Gly Phe Leu Tyr Tyr Glu Asp Leu Val Ser Cys Val Thr
165 170 175
Arg Ala Glu Ala Glu Ala Val Gly Val Leu Val Lys Glu Ala Val Trp
180 185 190
Ala Phe Leu Pro Asp Ala Ile Val Thr Met Thr Gly Gly Phe Arg Arg
195 200 205
Gly Lys Lys Val Gly His Asp Val Asp Phe Leu Ile Thr Ser Pro Glu
210 215 220
Ala Thr Glu Glu Gln Glu Gln Gln Leu Leu His Lys Val Ile Thr Phe
225 230 235 240
Trp Glu Lys Glu Gly Leu Leu Leu Tyr Cys Asp Leu Tyr Glu Ser Thr
245 250 255
Phe Glu Lys Leu Lys Met Pro Ser Arg Lys Val Asp Ala Leu Asp His
260 265 270
Phe Gln Lys Cys Phe Leu Ile Leu Lys Leu His Arg Glu Cys Val Asp
275 280 285
Asp Gly Thr Ser Ser Gln Leu Gln Gly Lys Thr Trp Lys Ala Ile Arg
290 295 300
Val Asp Leu Val Val Cys Pro Tyr Glu Cys Arg Ala Phe Ala Leu Leu
305 310 315 320
Gly Trp Thr Gly Ser Pro Gln Phe Glu Arg Asp Leu Arg Arg Tyr Ala
325 330 335
Thr His Glu Arg Lys Met Met Leu Asp Asn His Ala Leu Tyr Asp Lys
340 345 350
Thr Lys Arg Lys Phe Leu Ser Ala Asp Ser Glu Glu Asp Ile Phe Ala
355 360 365
His Leu Gly Leu Asp Tyr Ile Glu Pro Trp Glu Arg Asn Ala
370 375 380
<210> 12
<211> 379
<212> PRT
<213> 人工序列(ARTIFICIAL SEQUENCE)
<220>
<223> 鼠兔截短的
<400> 12
Glu Tyr Ser Ala Asn Pro Ser Pro Gly Pro Gln Ala Thr Pro Ala Val
1 5 10 15
Tyr Lys Ile Ser Gln Tyr Ala Cys Gln Arg Arg Thr Thr Leu Asn Asn
20 25 30
His Asn His Ile Phe Thr Asp Ala Phe Glu Ile Leu Ala Glu Asn Tyr
35 40 45
Glu Phe Lys Glu Asn Glu Gly Cys Tyr Val Thr Tyr Met Arg Ala Ala
50 55 60
Ser Val Leu Lys Ser Leu Pro Phe Thr Ile Val Ser Met Lys Asp Thr
65 70 75 80
Glu Gly Ile Pro Cys Leu Glu Asp Lys Val Lys Ser Ile Met Glu Glu
85 90 95
Ile Ile Glu Glu Gly Glu Ser Ser Glu Val Lys Ala Val Leu Ser Asp
100 105 110
Glu Arg Tyr Gln Cys Phe Lys Leu Phe Thr Ser Val Phe Gly Val Gly
115 120 125
Leu Lys Thr Ser Glu Lys Trp Phe Arg Met Gly Phe Arg Ser Leu Ser
130 135 140
Asn Ile Arg Leu Asp Lys Ser Leu Lys Phe Thr Gln Met Gln Lys Ala
145 150 155 160
Gly Phe Arg Tyr Tyr Glu Asp Ile Val Ser Cys Val Thr Arg Ala Glu
165 170 175
Ala Glu Ala Val Asp Val Leu Val Asn Glu Ala Val Arg Ala Phe Leu
180 185 190
Pro Asp Ala Phe Ile Thr Met Thr Gly Gly Phe Arg Arg Gly Lys Lys
195 200 205
Ile Gly His Asp Val Asp Phe Leu Ile Thr Ser Pro Glu Leu Thr Glu
210 215 220
Glu Asp Glu Gln Gln Leu Leu His Lys Val Met Asn Leu Trp Glu Lys
225 230 235 240
Lys Gly Leu Leu Leu Tyr His Asp Leu Val Glu Ser Thr Phe Glu Lys
245 250 255
Leu Lys Gln Pro Ser Arg Lys Val Asp Ala Leu Asp His Phe Gln Lys
260 265 270
Cys Phe Leu Ile Phe Lys Leu Tyr His Glu Arg Val Gly Gly Asp Arg
275 280 285
Cys Arg Gln Pro Glu Gly Lys Asp Trp Lys Ala Ile Arg Val Asp Leu
290 295 300
Val Met Cys Pro Tyr Glu Cys His Ala Phe Ala Leu Leu Gly Trp Thr
305 310 315 320
Gly Ser Arg Gln Phe Glu Arg Asp Leu Arg Arg Tyr Ala Ser His Glu
325 330 335
Arg Lys Met Ile Leu Asp Asn His Ala Leu Tyr Asp Lys Thr Lys Arg
340 345 350
Val Phe Leu Gln Ala Glu Asn Glu Glu Glu Ile Phe Ala His Leu Gly
355 360 365
Leu Asp Tyr Ile Glu Pro Trp Glu Arg Asn Ala
370 375
<210> 13
<211> 384
<212> PRT
<213> 人工序列(ARTIFICIAL SEQUENCE)
<220>
<223> 截短的刺猬
<400> 13
Asp Ala Ser Phe Gly Ser Asn Pro Gly Ser Gln Asn Thr Pro Pro Leu
1 5 10 15
Ala Ile Lys Lys Ile Ser Gln Tyr Ala Cys Gln Arg Arg Thr Ser Leu
20 25 30
Asn Asn Cys Asn His Ile Phe Thr Asp Ala Leu Asp Ile Leu Ala Glu
35 40 45
Asn His Glu Phe Arg Glu Asn Glu Val Ser Cys Val Ala Phe Met Arg
50 55 60
Ala Ala Ser Val Leu Lys Ser Leu Pro Phe Thr Ile Ile Ser Met Lys
65 70 75 80
Asp Thr Lys Gly Ile Pro Cys Leu Gly Asp Lys Ala Lys Cys Val Ile
85 90 95
Glu Glu Ile Ile Glu Asp Gly Glu Ser Ser Glu Val Lys Ala Ile Leu
100 105 110
Asn Asp Glu Arg Tyr Gln Ser Phe Lys Leu Phe Thr Ser Val Phe Gly
115 120 125
Val Gly Leu Lys Thr Ser Glu Lys Trp Phe Arg Met Gly Phe Arg Thr
130 135 140
Leu Asn Lys Ile Met Ser Asp Lys Thr Leu Lys Leu Thr Arg Met Gln
145 150 155 160
Lys Ala Gly Phe Leu Tyr Tyr Glu Asp Leu Val Ser Cys Val Ala Lys
165 170 175
Ala Glu Ala Asp Ala Val Ser Val Leu Val Gln Glu Ala Val Trp Ala
180 185 190
Phe Leu Pro Asp Ala Met Val Thr Met Thr Gly Gly Phe Arg Arg Gly
195 200 205
Lys Lys Leu Gly His Asp Val Asp Phe Leu Ile Thr Ser Pro Gly Ala
210 215 220
Thr Glu Glu Glu Glu Gln Gln Leu Leu Pro Lys Val Ile Asn Phe Trp
225 230 235 240
Glu Arg Lys Gly Leu Leu Leu Tyr His Asp Leu Val Glu Ser Thr Phe
245 250 255
Glu Lys Leu Lys Leu Pro Ser Arg Lys Val Asp Ala Leu Asp His Phe
260 265 270
Gln Lys Cys Phe Leu Ile Leu Lys Leu His Leu Gln His Val Asn Gly
275 280 285
Val Gly Asn Ser Lys Thr Gly Gln Gln Glu Gly Lys Asn Trp Lys Ala
290 295 300
Ile Arg Val Asp Leu Val Met Cys Pro Tyr Glu Arg Arg Ala Phe Ala
305 310 315 320
Leu Leu Gly Trp Thr Gly Ser Arg Gln Phe Glu Arg Asp Leu Arg Arg
325 330 335
Phe Ala Thr His Glu Arg Lys Met Met Leu Asp Asn His Ala Leu Tyr
340 345 350
Asp Lys Thr Lys Arg Ile Phe Leu Lys Ala Glu Ser Glu Glu Glu Ile
355 360 365
Phe Ala His Leu Gly Leu Asp Tyr Ile Asp Pro Trp Glu Arg Asn Ala
370 375 380
<210> 14
<211> 381
<212> PRT
<213> 人工序列(ARTIFICIAL SEQUENCE)
<220>
<223> 截短的树鼩
<400> 14
Asp His Ser Thr Ser Pro Ser Pro Gly Pro Gln Lys Thr Pro Ala Leu
1 5 10 15
Ala Val Gln Lys Ile Ser Gln Tyr Ala Cys Gln Arg Arg Thr Thr Leu
20 25 30
Asn Asn Cys Asn Arg Val Phe Thr Asp Ala Phe Glu Thr Leu Ala Glu
35 40 45
Asn Tyr Glu Phe Arg Glu Asn Glu Asp Ser Ser Val Ile Phe Leu Arg
50 55 60
Ala Ala Ser Val Leu Arg Ser Leu Pro Phe Thr Ile Thr Ser Met Arg
65 70 75 80
Asp Thr Glu Gly Leu Pro Cys Leu Gly Asp Lys Val Lys Cys Val Ile
85 90 95
Glu Glu Ile Ile Glu Asp Gly Glu Ser Ser Glu Val Asn Ala Val Leu
100 105 110
Asn Asp Glu Arg Tyr Lys Ser Phe Lys Leu Phe Thr Ser Val Phe Gly
115 120 125
Val Gly Leu Lys Thr Ser Glu Lys Trp Phe Arg Met Gly Phe Arg Thr
130 135 140
Leu Ser Arg Val Arg Ser Asp Lys Ser Leu His Leu Thr Arg Met Gln
145 150 155 160
Gln Ala Gly Phe Leu Tyr Tyr Glu Asp Leu Ala Ser Cys Val Thr Arg
165 170 175
Ala Glu Ala Glu Ala Val Gly Val Leu Val Lys Glu Ala Val Gly Ala
180 185 190
Phe Leu Pro Asp Ala Leu Val Thr Ile Thr Gly Gly Phe Arg Arg Gly
195 200 205
Lys Lys Thr Gly His Asp Val Asp Phe Leu Ile Thr Ser Pro Gly Ser
210 215 220
Thr Glu Glu Lys Glu Glu Glu Leu Leu Gln Lys Val Leu Asn Leu Trp
225 230 235 240
Glu Lys Lys Gly Leu Leu Leu Tyr Tyr Asp Leu Val Glu Ser Thr Phe
245 250 255
Glu Lys Leu Lys Thr Pro Ser Arg Lys Val Asp Ala Leu Asp His Phe
260 265 270
Pro Lys Cys Phe Leu Ile Leu Lys Leu His His Gln Arg Val Asp Gly
275 280 285
Asp Lys Pro Ser Gln Gln Glu Gly Lys Ser Trp Lys Ala Ile Arg Val
290 295 300
Asp Leu Val Met Cys Pro Tyr Glu Arg His Ala Phe Ala Leu Leu Gly
305 310 315 320
Trp Thr Gly Ser Arg Gln Phe Glu Arg Asp Leu Arg Arg Tyr Ala Thr
325 330 335
His Glu Arg Lys Met Met Leu Asp Asn His Ala Leu Tyr Asp Lys Thr
340 345 350
Lys Arg Val Phe Leu Lys Ala Glu Ser Glu Glu Asp Ile Phe Ala His
355 360 365
Leu Gly Leu Asp Tyr Ile Glu Pro Trp Glu Arg Asn Ala
370 375 380
<210> 15
<211> 394
<212> PRT
<213> 人工序列(ARTIFICIAL SEQUENCE)
<220>
<223> 截短的鸭嘴兽
<400> 15
Leu Thr Asn Ser Ala Pro Ile Asn Cys Met Thr Glu Thr Pro Ser Leu
1 5 10 15
Ala Thr Lys Gln Val Ser Gln Tyr Ala Cys Glu Arg Arg Thr Thr Leu
20 25 30
Asn Asn Cys Asn Gln Lys Phe Thr Asp Ala Phe Glu Ile Leu Ala Lys
35 40 45
Asp Phe Glu Phe Arg Glu Asn Glu Gly Ile Cys Leu Ala Phe Met Arg
50 55 60
Ala Ile Ser Val Leu Lys Cys Leu Pro Phe Thr Ile Val Arg Met Lys
65 70 75 80
Asp Ile Glu Gly Val Pro Trp Leu Gly Asp Gln Val Lys Ser Ile Ile
85 90 95
Glu Glu Ile Ile Glu Asp Gly Glu Ser Ser Ser Val Lys Ala Val Leu
100 105 110
Asn Asp Glu Arg Tyr Arg Ser Phe Gln Leu Phe Asn Ser Val Phe Glu
115 120 125
Val Gly Leu Thr Asp Asn Gly Glu Asn Gly Ile Ala Arg Gly Phe Gln
130 135 140
Thr Leu Asn Glu Val Ile Thr Asp Glu Asn Ile Ser Leu Thr Lys Thr
145 150 155 160
Thr Leu Ser Thr Ser Leu Trp Asn Tyr Leu Pro Gly Phe Leu Tyr Tyr
165 170 175
Glu Asp Leu Val Ser Cys Val Ala Lys Glu Glu Ala Asp Ala Val Tyr
180 185 190
Leu Ile Val Lys Glu Ala Val Arg Ala Phe Leu Pro Glu Ala Leu Val
195 200 205
Thr Leu Thr Gly Gly Phe Arg Arg Gly Lys Lys Ile Gly His Asp Val
210 215 220
Asp Phe Leu Ile Ser Asp Pro Glu Ser Gly Gln Asp Glu Gln Leu Leu
225 230 235 240
Pro Asn Ile Ile Lys Leu Trp Glu Lys Gln Glu Leu Leu Leu Tyr Tyr
245 250 255
Asp Leu Val Glu Ser Thr Phe Glu Lys Thr Lys Ile Pro Ser Arg Lys
260 265 270
Val Asp Ala Met Asp His Phe Gln Lys Cys Phe Leu Ile Leu Lys Leu
275 280 285
His His Gln Lys Val Asp Ser Gly Arg Tyr Lys Pro Pro Pro Glu Ser
290 295 300
Lys Asn His Glu Ala Lys Asn Trp Lys Ala Ile Arg Val Asp Leu Val
305 310 315 320
Met Cys Pro Phe Glu Gln Tyr Ala Tyr Ala Leu Leu Gly Trp Thr Gly
325 330 335
Ser Arg Gln Phe Glu Arg Asp Leu Arg Arg Tyr Ala Thr His Glu Lys
340 345 350
Lys Met Met Leu Asp Asn His Ala Leu Tyr Asp Lys Thr Lys Lys Ile
355 360 365
Phe Leu Lys Ala Glu Ser Glu Glu Asp Ile Phe Thr His Leu Gly Leu
370 375 380
Asp Tyr Ile Glu Pro Trp Glu Arg Asn Ala
385 390
<210> 16
<211> 384
<212> PRT
<213> 人工序列(ARTIFICIAL SEQUENCE)
<220>
<223> 截短的跳鼠
<400> 16
Ser Ser Glu Leu Glu Leu Leu Asp Val Ser Trp Leu Ile Glu Cys Met
1 5 10 15
Gly Ala Gly Lys Pro Val Glu Met Thr Gly Arg His Gln Leu Val Lys
20 25 30
Gln Thr Phe Cys Leu Pro Gly Phe Ile Leu Gln Asp Ala Phe Asp Ile
35 40 45
Leu Ala Glu Asn Cys Glu Phe Arg Glu Asn Glu Ala Ser Cys Val Glu
50 55 60
Phe Met Arg Ala Ala Ser Val Leu Lys Ser Leu Pro Phe Pro Ile Ile
65 70 75 80
Ser Val Lys Asp Thr Glu Gly Ile Pro Trp Leu Gly Gly Lys Val Lys
85 90 95
Cys Val Ile Glu Glu Ile Ile Glu Asp Gly Glu Ser Ser Glu Val Lys
100 105 110
Ala Leu Leu Asn Asp Glu Arg Tyr Lys Ser Phe Lys Leu Phe Thr Ser
115 120 125
Val Phe Gly Val Gly Leu Lys Thr Ala Glu Arg Trp Phe Arg Met Gly
130 135 140
Phe Arg Thr Leu Ser Thr Val Lys Leu Asp Lys Ser Leu Thr Phe Thr
145 150 155 160
Arg Met Gln Lys Ala Gly Phe Leu His Tyr Glu Asp Leu Val Ser Cys
165 170 175
Val Thr Arg Ala Glu Ala Glu Ala Val Ser Val Leu Val Gln Gln Ala
180 185 190
Val Val Ala Phe Leu Pro Asp Ala Leu Val Ser Met Thr Gly Gly Phe
195 200 205
Arg Arg Gly Lys Lys Ile Gly His Asp Val Asp Phe Leu Ile Thr Ser
210 215 220
Pro Glu Ala Thr Glu Glu Glu Glu Gln Gln Leu Leu His Lys Val Thr
225 230 235 240
Asn Phe Trp Glu Gln Lys Gly Leu Leu Leu Tyr Cys Asp His Val Glu
245 250 255
Ser Thr Phe Glu Lys Cys Lys Leu Pro Ser Arg Lys Val Asp Ala Leu
260 265 270
Asp His Phe Gln Lys Cys Phe Leu Ile Leu Lys Leu Tyr Arg Glu Arg
275 280 285
Val Asp Ser Val Lys Ser Ser Gln Gln Glu Gly Lys Gly Trp Lys Ala
290 295 300
Ile Arg Val Asp Leu Val Met Cys Pro Tyr Glu Cys Arg Ala Phe Ala
305 310 315 320
Leu Leu Gly Trp Thr Gly Ser Arg Gln Phe Glu Arg Asp Leu Arg Arg
325 330 335
Tyr Ala Thr His Glu Arg Lys Met Arg Leu Asp Asn His Ala Leu Tyr
340 345 350
Asp Lys Thr Lys Arg Val Phe Leu Lys Ala Glu Ser Glu Glu Glu Ile
355 360 365
Phe Ala His Leu Gly Leu Glu Tyr Ile Glu Pro Leu Glu Arg Asn Ala
370 375 380
<210> 17
<211> 381
<212> PRT
<213> 人工序列(ARTIFICIAL SEQUENCE)
<220>
<223> 小鼠TdT突变体
<400> 17
Ser Gly Ser Pro Ser Pro Val Pro Gly Ser Gln Asn Val Pro Ala Pro
1 5 10 15
Val Val Lys Lys Ile Ser Gln Tyr Ala Cys Gln Arg Arg Thr Thr Leu
20 25 30
Asn Asn Tyr Asn Gln Leu Phe Thr Asp Ala Leu Asp Ile Leu Ala Glu
35 40 45
Asn Asp Glu Phe Arg Glu Asn Glu Glu Ser Cys Leu Ala Phe Arg Arg
50 55 60
Ala Ser Ser Val Leu Lys Ser Leu Pro Phe Pro Ile Thr Ser Met Lys
65 70 75 80
Asp Thr Glu Gly Ile Pro Cys Leu Gly Asp Lys Val Lys Ser Ile Ile
85 90 95
Glu Gly Ile Ile Glu Asp Gly Glu Ser Ser Glu Val Lys Ala Val Leu
100 105 110
Asn Asp Glu Arg Tyr Lys Ser Phe Lys Leu Phe Thr Ser Val Phe Gly
115 120 125
Val Gly Leu Lys Thr Ala Glu Lys Trp Phe Arg Met Gly Phe Arg Thr
130 135 140
Leu Ser Lys Ile Gln Ser Asp Lys Ser Leu Arg Phe Thr Gln Met Gln
145 150 155 160
Lys Ala Gly Phe Leu Tyr Tyr Glu Asp Leu Val Ser Gly Val Asn Arg
165 170 175
Pro Glu Ala Glu Ala Val Ser Met Leu Val Lys Glu Ala Val Val Thr
180 185 190
Phe Leu Pro Asp Ala Leu Val Thr Met Thr Gly Gly Phe Arg Leu Gly
195 200 205
Lys Met Thr Gly His Asp Val Asp Phe Leu Ile Thr Ser Pro Glu Ala
210 215 220
Thr Glu Asp Glu Glu Gln Gln Leu Leu His Lys Val Thr Asp Phe Trp
225 230 235 240
Lys Gln Gln Gly Leu Leu Leu Tyr Cys Asp Ile Leu Glu Ser Thr Phe
245 250 255
Glu Lys Phe Lys Gln Pro Ser Arg Thr Val Asp Ala Leu Asp His Phe
260 265 270
Gln Lys Cys Phe Leu Ile Leu Lys Leu Asp His Pro Arg Val His Ser
275 280 285
Val Lys Ser Gly Gln Gln Glu Gly Lys Gly Trp Lys Ala Ile Arg Val
290 295 300
Asp Leu Val Met Cys Pro Tyr Asp Arg Arg Ala Phe Ala Leu Leu Gly
305 310 315 320
Trp Thr Gly Ser Pro Gln Phe Asn Arg Asp Leu Arg Arg Tyr Ala Thr
325 330 335
His Glu Arg Lys Met Met Leu Asp Asn His Ala Leu Tyr Asp Lys Thr
340 345 350
Lys Arg Val Phe Leu Glu Ala Glu Ser Glu Glu Glu Ile Phe Ala His
355 360 365
Leu Gly Leu Asp Tyr Ile Glu Pro Trp Glu Arg Asn Ala
370 375 380
<210> 18
<211> 381
<212> PRT
<213> 人工序列(ARTIFICIAL SEQUENCE)
<220>
<223> 小鼠TdT突变体
<400> 18
Ser Gly Ser Pro Ser Pro Val Pro Gly Ser Gln Asn Val Pro Ala Pro
1 5 10 15
Val Val Lys Lys Ile Ser Gln Tyr Ala Cys Gln Arg Arg Thr Thr Leu
20 25 30
Asn Asn Tyr Asn Glu Leu Phe Thr Arg Ala Leu Asp Ile Leu Ala Glu
35 40 45
Asn Asp Glu Phe Arg Glu Asn Glu Glu Ser Arg Asp Ala Phe Arg Arg
50 55 60
Ala Ser Ser Val Leu Lys Ser Leu Pro Phe Pro Ile Thr Ser Met Lys
65 70 75 80
Asp Thr Glu Gly Ile Pro Cys Leu Gly Asp Lys Val Lys Arg Ile Ile
85 90 95
Glu Glu Ile Ile Glu Asp Gly Glu Ser Ser Glu Val Lys Ala Val Leu
100 105 110
Asn Asp Glu Arg Tyr Gln Ala Phe Lys Leu Phe Thr Ser Val Phe Gly
115 120 125
Val Gly Arg Lys Thr Ala Glu Lys Trp Phe Arg Met Gly Phe Arg Thr
130 135 140
Leu Glu Lys Ile Arg Ser Asp Lys Ser Leu Arg Phe Thr Gln Met Gln
145 150 155 160
Lys Ala Gly Phe Leu Tyr Tyr Glu Asp Leu Val Ser Gly Val Asn Arg
165 170 175
Pro Glu Ala Glu Ala Val Ser Met Leu Val Lys Glu Ala Val Val Thr
180 185 190
Phe Leu Pro Asp Ala Leu Val Thr Met Thr Gly Gly Phe Arg Leu Gly
195 200 205
Lys Met Thr Gly His Asp Val Asp Phe Leu Ile Thr Ser Pro Glu Ala
210 215 220
Thr Glu Asp Glu Glu Gln Gln Leu Leu His Lys Val Thr Asp Phe Trp
225 230 235 240
Lys Gln Gln Gly Leu Leu Leu Tyr Cys Asp Ile Leu Glu Ser Thr Phe
245 250 255
Glu Lys Phe Lys Gln Pro Ser Arg Thr Val Asp Ala Leu Asp His Phe
260 265 270
Gln Lys Cys Phe Leu Ile Leu Lys Leu Asp His Pro Arg Val His Ser
275 280 285
Val Lys Ser Gly Gln Gln Glu Gly Lys Gly Trp Lys Ala Ile Arg Val
290 295 300
Asp Leu Val Met Cys Pro Tyr Asp Arg Arg Ala Phe Ala Leu Leu Gly
305 310 315 320
Trp Thr Gly Ser Ala Phe Phe Asn Arg Asp Leu Arg Arg Tyr Ala Thr
325 330 335
His Glu Arg Lys Met Met Leu Asp Asn His Ala Leu Tyr Asp Lys Thr
340 345 350
Lys Arg Val Phe Leu Glu Ala Glu Ser Glu Glu Glu Ile Phe Ala His
355 360 365
Leu Gly Leu Asp Tyr Ile Glu Pro Arg Glu Arg Asn Ala
370 375 380
<210> 19
<211> 381
<212> PRT
<213> 人工序列(ARTIFICIAL SEQUENCE)
<220>
<223> 小鼠TdT突变体
<400> 19
Ser Gly Ser Pro Ser Pro Val Pro Gly Ser Gln Asn Val Pro Ala Pro
1 5 10 15
Val Val Lys Lys Ile Ser Gln Tyr Ala Cys Gln Arg Arg Thr Thr Leu
20 25 30
Asn Asn Tyr Asn Glu Leu Phe Thr Arg Ala Leu Asp Ile Leu Ala Glu
35 40 45
Asn Asp Glu Phe Arg Glu Asn Glu Glu Ser Arg Asp Ala Phe Arg Arg
50 55 60
Ala Ser Ser Val Leu Lys Ser Leu Pro Phe Pro Ile Thr Ser Met Lys
65 70 75 80
Asp Thr Glu Gly Ile Pro Cys Leu Gly Asp Lys Val Lys Arg Ile Ile
85 90 95
Glu Glu Ile Ile Glu Asp Gly Glu Ser Ser Glu Val Lys Ala Val Leu
100 105 110
Asn Asp Glu Arg Tyr Lys Ala Phe Lys Leu Phe Thr Ser Val Phe Gly
115 120 125
Val Gly Arg Lys Thr Ala Glu Lys Trp Phe Arg Met Gly Phe Arg Thr
130 135 140
Leu Glu Lys Ile Arg Ser Asp Lys Ser Leu Arg Phe Thr Gln Met Gln
145 150 155 160
Lys Ala Gly Phe Leu Tyr Tyr Glu Asp Leu Val Ser Gly Val Asn Arg
165 170 175
Pro Glu Ala Glu Ala Val Ser Met Leu Val Lys Glu Ala Val Val Thr
180 185 190
Phe Leu Pro Asp Ala Leu Val Thr Met Thr Gly Gly Phe Arg Leu Gly
195 200 205
Lys Met Thr Gly His Asp Val Asp Phe Leu Ile Thr Ser Pro Glu Ala
210 215 220
Thr Glu Asp Glu Glu Gln Gln Leu Leu His Lys Val Thr Asp Phe Trp
225 230 235 240
Lys Gln Gln Gly Leu Leu Leu Tyr Cys Asp Ile Leu Glu Ser Thr Phe
245 250 255
Glu Lys Phe Lys Gln Pro Ser Arg Thr Val Asp Ala Leu Asp His Phe
260 265 270
Gln Lys Cys Phe Leu Ile Leu Lys Leu Asp His Pro Arg Val His Ser
275 280 285
Val Lys Ser Gly Gln Gln Glu Gly Lys Gly Trp Lys Ala Ile Arg Val
290 295 300
Asp Leu Val Met Cys Pro Tyr Asp Arg Arg Ala Phe Ala Leu Leu Gly
305 310 315 320
Trp Thr Gly Ser Ala Phe Phe Asn Arg Asp Leu Arg Arg Tyr Ala Thr
325 330 335
His Glu Arg Lys Met Met Leu Asp Asn His Ala Leu Tyr Asp Lys Thr
340 345 350
Lys Arg Val Phe Leu Glu Ala Glu Ser Glu Glu Glu Ile Phe Ala His
355 360 365
Leu Gly Leu Asp Tyr Ile Glu Pro Trp Glu Arg Asn Ala
370 375 380
<210> 20
<211> 381
<212> PRT
<213> 人工序列(ARTIFICIAL SEQUENCE)
<220>
<223> 小鼠TdT突变体
<400> 20
Ser Gly Ser Pro Ser Pro Val Pro Gly Ser Gln Asn Val Pro Ala Pro
1 5 10 15
Val Val Lys Lys Ile Ser Gln Tyr Ala Cys Gln Arg Arg Thr Thr Leu
20 25 30
Asn Asn Tyr Asn Glu Leu Phe Thr Arg Ala Leu Asp Ile Leu Ala Glu
35 40 45
Asn Asp Glu Phe Arg Glu Asn Glu Glu Ser Cys Leu Ala Phe Arg Arg
50 55 60
Ala Ser Ser Val Leu Lys Ser Leu Pro Phe Pro Ile Thr Ser Met Lys
65 70 75 80
Asp Thr Glu Gly Ile Pro Cys Leu Gly Asp Lys Val Lys Arg Ile Ile
85 90 95
Glu Glu Ile Ile Glu Asp Gly Glu Ser Ser Glu Val Lys Ala Val Leu
100 105 110
Asn Asp Glu Arg Tyr Lys Ser Phe Lys Leu Phe Thr Ser Val Phe Gly
115 120 125
Val Gly Leu Lys Thr Ala Glu Lys Trp Phe Arg Met Gly Phe Arg Thr
130 135 140
Leu Glu Lys Ile Arg Ser Asp Lys Ser Leu Arg Phe Thr Gln Met Gln
145 150 155 160
Lys Ala Gly Phe Leu Tyr Tyr Glu Asp Leu Val Ser Gly Val Asn Arg
165 170 175
Pro Glu Ala Glu Ala Val Ser Thr Leu Val Lys Glu Ala Val Val Thr
180 185 190
Phe Leu Pro Asp Ala Leu Val Thr Met Thr Gly Gly Phe Arg Leu Gly
195 200 205
His Met Thr Gly His Asp Val Asp Phe Leu Ile Thr Ser Pro Glu Ala
210 215 220
Thr Glu Asp Glu Glu Gln Gln Leu Leu His Lys Val Thr Asp Phe Trp
225 230 235 240
Lys Gln Gln Gly Leu Leu Leu Tyr Cys Asp Ile Leu Glu Ser Thr Phe
245 250 255
Glu Lys Phe Lys Gln Pro Ser Arg Lys Val Asp Ala Leu Asp His Phe
260 265 270
Gln Lys Cys Phe Leu Ile Leu Lys Leu Asp His Leu Arg Val His Ser
275 280 285
Ala Lys Ser Gly Gln Gln Glu Gly Lys Gly Trp Lys Ala Ile Arg Val
290 295 300
Asp Leu Val Met Cys Pro Tyr Asp Arg Arg Ala Phe Ala Leu Leu Gly
305 310 315 320
Trp Thr Gly Ser Val Gln Phe Lys Arg Asp Leu Arg Arg Tyr Ala Thr
325 330 335
His Glu Arg Lys Met Met Leu Asp Glu His Ala Leu Tyr Asp Lys Thr
340 345 350
Lys Arg Val Phe Leu Glu Ala Glu Ser Glu Glu Glu Ile Phe Ala His
355 360 365
Leu Gly Leu Asp Tyr Ile Glu Pro Trp Glu Arg Asn Ala
370 375 380
<210> 21
<211> 12
<212> DNA
<213> 人工序列(ARTIFICIAL SEQUENCE)
<220>
<223> 测试多核苷酸p875
<400> 21
cagttaaaaa ct 12
<210> 22
<211> 11
<212> DNA
<213> 人工序列(ARTIFICIAL SEQUENCE)
<220>
<223> 测试多核苷酸p876
<400> 22
gagttaaaac t 11
<210> 23
<211> 10
<212> DNA
<213> 人工序列(ARTIFICIAL SEQUENCE)
<220>
<223> 测试多核苷酸p877
<400> 23
cagcaaggct 10
<210> 24
<211> 364
<212> PRT
<213> 人工序列(ARTIFICIAL SEQUENCE)
<220>
<223> TdT(美洲狮野生型)
<400> 24
Val Val Lys Lys Ile Pro Leu Tyr Ala Cys Gln Arg Arg Thr Thr Leu
1 5 10 15
Asn Asn Phe Asn His Ile Phe Thr Asp Ala Phe Glu Val Leu Ala Glu
20 25 30
Asn Tyr Glu Phe Lys Glu Asn Glu Ile Ser Ser Ala Thr Phe Met Arg
35 40 45
Ala Ala Ser Val Leu Lys Leu Pro Phe Thr Ile Ile Ser Met Lys Asp
50 55 60
Thr Glu Gly Ile Pro Cys Leu Gly Asp Lys Val Lys Cys Val Ile Glu
65 70 75 80
Glu Ile Ile Glu Asp Gly Glu Ser Ser Glu Val Lys Ala Val Leu Asn
85 90 95
Asp Glu Arg Tyr Gln Ser Phe Lys Leu Phe Thr Ser Val Phe Gly Val
100 105 110
Gly Leu Lys Thr Ser Glu Lys Trp Phe Arg Met Gly Phe Arg Thr Leu
115 120 125
Ser Lys Ile Lys Ser Asp Lys Thr Leu Lys Phe Thr Gln Met Gln Lys
130 135 140
Ala Gly Phe Leu Tyr Tyr Glu Asp Leu Val Ser Cys Val Thr Arg Ala
145 150 155 160
Glu Ala Glu Ala Val Gly Val Leu Val Lys Glu Ala Val Trp Ala Phe
165 170 175
Leu Pro Asp Ala Phe Val Thr Met Thr Gly Gly Phe Arg Arg Gly Lys
180 185 190
Lys Ile Gly His Asp Val Asp Phe Leu Ile Thr Ile Pro Gly Ser Thr
195 200 205
Asp Glu Glu Glu Glu Gln Leu Leu Pro Lys Val Ile Asn Leu Trp Gln
210 215 220
Arg Lys Glu Leu Leu Leu Tyr Tyr Asp Leu Val Glu Ser Thr Phe Glu
225 230 235 240
Lys Leu Lys Leu Pro Ser Arg Lys Val Asp Ala Leu Asp His Phe Gln
245 250 255
Lys Cys Phe Leu Ile Leu Lys Leu His His Gln Arg Val Asp Ser Gly
260 265 270
Lys Cys Ser Gln Gln Glu Gly Lys Thr Trp Lys Ala Ile Arg Val Asp
275 280 285
Leu Val Met Cys Pro Tyr Glu Arg Arg Ala Phe Ala Leu Leu Gly Trp
290 295 300
Thr Gly Ser Arg Gln Phe Glu Arg Asp Leu Arg Arg Tyr Ala Thr His
305 310 315 320
Glu Arg Lys Met Ile Leu Asp Asn His Ala Leu Tyr Asp Lys Thr Lys
325 330 335
Lys Ile Phe Leu Lys Ala Glu Ser Glu Glu Glu Ile Phe Ala His Leu
340 345 350
Gly Leu Asp Tyr Ile Glu Pro Trp Glu Arg Asn Ala
355 360
<210> 25
<211> 362
<212> PRT
<213> 人工序列(ARTIFICIAL SEQUENCE)
<220>
<223> 野生型N139爬行动物
<400> 25
Tyr Ala Cys Gln Arg Arg Thr Thr Leu Asn Asn Tyr Asn Lys Lys Tyr
1 5 10 15
Thr Asp Ala Phe Glu Ile Leu Ala Glu Asn Tyr Glu Met Arg Glu Asn
20 25 30
Ala Gly Ala Cys Leu Ala Phe Arg Arg Ala Ala Ser Val Leu Lys Phe
35 40 45
Leu Pro Phe Ala Ile Val Arg Ser Asn Asp Ile Glu Gly Leu Pro Trp
50 55 60
Met Gly Glu Gln Val Lys Gly Ile Ile Glu Asp Ile Leu Glu Glu Gly
65 70 75 80
Gln Ser Pro Lys Val Glu Ala Val Leu Asn Asn Glu Lys Tyr Arg Ser
85 90 95
Phe Lys Leu Phe Thr Ser Val Phe Gly Val Ala Leu Lys Thr Ser Glu
100 105 110
Lys Trp Phe Met Met Gly Leu Arg Asn Leu Glu Asp Val Lys Leu Asn
115 120 125
Gln Asn Leu Gln Leu Thr Arg Met Gln Lys Ala Gly Leu Gln His Tyr
130 135 140
Glu Asp Leu Ile Ser Tyr Val Ser Lys Ala Glu Ala Asp Ser Thr Ser
145 150 155 160
Leu Met Val Lys Asp Thr Val Trp Lys Phe Ser Pro Ser Ala Leu Val
165 170 175
Thr Leu Thr Gly Gly Phe Arg Arg Gly Lys Lys Met Gly His Asp Val
180 185 190
Asp Phe Leu Ile Thr Val Pro Gly Ser Arg Pro Asn Glu Glu Leu Leu
195 200 205
His Leu Val Ile Asp Cys Trp Lys Lys Gln Gly Leu Leu Leu Tyr Tyr
210 215 220
Asp Leu Ile Glu Ser Thr Phe Glu Lys Ser Lys Leu Pro Ser Gln Arg
225 230 235 240
Val Asp Ala Leu Asp His Phe Gln Lys Cys Phe Ala Ile Leu Lys Leu
245 250 255
His Lys Glu Arg Val Asn Gln Gly Thr Ser Leu Pro Pro Val Ala Ser
260 265 270
Thr Val Glu Glu Ile Lys Asp Trp Lys Ala Ile Arg Val Asp Leu Val
275 280 285
Val Ser Pro Phe Glu Gln His Ala Phe Ala Leu Leu Gly Trp Thr Gly
290 295 300
Ser Arg Gln Phe Glu Arg Asp Leu Arg Arg Tyr Ala Thr His Glu Lys
305 310 315 320
Lys Met Met Leu Asp Asn His Ala Leu Tyr Asp Lys Thr Lys Lys Ile
325 330 335
Phe Leu Ser Ala Ser Ser Glu Glu Glu Ile Phe Ala His Leu Gly Leu
340 345 350
Asp Tyr Leu Glu Pro Trp Glu Arg Asn Ala
355 360
<210> 26
<211> 364
<212> PRT
<213> 人工序列(ARTIFICIAL SEQUENCE)
<220>
<223> 截短的鼩鼱
<400> 26
Val Gln Lys Ile Ser Gln Tyr Ala Cys Gln Arg Arg Thr Thr Leu Asn
1 5 10 15
Asn His Asn His Ile Phe Thr Asp Ala Phe Glu Ile Leu Ala Glu Asn
20 25 30
Cys Glu Phe Arg Glu Asn Glu Gly Ser Tyr Val Thr Tyr Met Arg Ala
35 40 45
Ala Ser Val Leu Lys Ser Leu Pro Phe Ser Ile Ile Ser Met Lys Asp
50 55 60
Thr Glu Gly Ile Pro Cys Leu Ala Asp Lys Val Lys Cys Val Ile Glu
65 70 75 80
Glu Ile Ile Glu Asp Gly Glu Ser Ser Glu Val Lys Ala Val Leu Asn
85 90 95
Asp Glu Arg Tyr Lys Ser Phe Lys Leu Phe Thr Ser Val Phe Gly Val
100 105 110
Gly Leu Lys Thr Ala Glu Lys Trp Phe Arg Leu Gly Phe Arg Thr Leu
115 120 125
Ser Gly Ile Met Asn Asp Lys Thr Leu Lys Leu Thr His Met Gln Lys
130 135 140
Ala Gly Phe Leu Tyr Tyr Glu Asp Leu Val Ser Cys Val Thr Arg Ala
145 150 155 160
Glu Ala Glu Ala Val Gly Val Leu Val Lys Glu Ala Val Trp Ala Phe
165 170 175
Leu Pro Asp Ala Ile Val Thr Met Thr Gly Gly Phe Arg Arg Gly Lys
180 185 190
Lys Val Gly His Asp Val Asp Phe Leu Ile Thr Ser Pro Glu Ala Thr
195 200 205
Glu Glu Gln Glu Gln Gln Leu Leu His Lys Val Ile Thr Phe Trp Glu
210 215 220
Lys Glu Gly Leu Leu Leu Tyr Cys Asp Leu Tyr Glu Ser Thr Phe Glu
225 230 235 240
Lys Leu Lys Met Pro Ser Arg Lys Val Asp Ala Leu Asp His Phe Gln
245 250 255
Lys Cys Phe Leu Ile Leu Lys Leu His Arg Glu Cys Val Asp Asp Gly
260 265 270
Thr Ser Ser Gln Leu Gln Gly Lys Thr Trp Lys Ala Ile Arg Val Asp
275 280 285
Leu Val Val Cys Pro Tyr Glu Cys Arg Ala Phe Ala Leu Leu Gly Trp
290 295 300
Thr Gly Ser Pro Gln Phe Glu Arg Asp Leu Arg Arg Tyr Ala Thr His
305 310 315 320
Glu Arg Lys Met Met Leu Asp Asn His Ala Leu Tyr Asp Lys Thr Lys
325 330 335
Arg Lys Phe Leu Ser Ala Asp Ser Glu Glu Asp Ile Phe Ala His Leu
340 345 350
Gly Leu Asp Tyr Ile Glu Pro Trp Glu Arg Asn Ala
355 360
<210> 27
<211> 369
<212> PRT
<213> 人工序列(ARTIFICIAL SEQUENCE)
<220>
<223> 牛
<400> 27
Lys Thr Pro Pro Leu Val Val Lys Lys Ile Ser Gln Tyr Ala Cys Gln
1 5 10 15
Arg Lys Thr Thr Leu Asn Asn Tyr Asn Glu Ile Phe Thr Arg Ala Phe
20 25 30
Glu Ile Leu Ala Glu Asn Ser Glu Phe Lys Glu Asn Glu Glu Ser Tyr
35 40 45
Val Thr Phe Arg Arg Ala Ala Ser Val Leu Lys Ser Leu Pro Phe Thr
50 55 60
Ile Ile Ser Met Lys Asp Thr Glu Gly Ile Pro Cys Leu Gly Asp Lys
65 70 75 80
Val Lys Arg Ile Ile Glu Glu Ile Ile Glu Asp Gly Glu Ser Ser Glu
85 90 95
Val Lys Ala Val Leu Asn Asp Glu Arg Tyr Gln Ala Phe Lys Leu Phe
100 105 110
Thr Ser Val Phe Gly Val Gly Arg Lys Thr Ser Glu Lys Trp Phe Arg
115 120 125
Met Gly Phe Arg Ser Leu Glu Lys Ile Arg Ser Asp Lys Thr Leu Lys
130 135 140
Phe Thr Lys Met Gln Lys Ala Gly Phe Leu Tyr Tyr Glu Asp Leu Val
145 150 155 160
Ser Gly Val Thr Arg Ala Glu Ala Glu Ala Val Gly Val Leu Val Lys
165 170 175
Glu Ala Val Trp Ala Phe Leu Pro Asp Ala Phe Val Thr Met Thr Gly
180 185 190
Gly Phe Arg Leu Gly Lys Lys Ile Gly His Asp Val Asp Phe Leu Ile
195 200 205
Thr Ser Pro Gly Ser Ala Glu Asp Glu Glu Gln Leu Leu Pro Lys Val
210 215 220
Ile Asn Leu Trp Glu Lys Lys Gly Leu Leu Leu Tyr Tyr Asp Leu Val
225 230 235 240
Glu Ser Thr Phe Glu Lys Phe Lys Leu Pro Ser Arg Gln Val Asp Thr
245 250 255
Leu Asp His Phe Gln Lys Cys Phe Leu Ile Leu Lys Leu His His Gln
260 265 270
Arg Val Asp Ser Ser Lys Ser Asn Gln Gln Glu Gly Lys Thr Trp Lys
275 280 285
Ala Ile Arg Val Asp Leu Val Met Cys Pro Tyr Glu Asn Arg Ala Phe
290 295 300
Ala Leu Leu Gly Trp Thr Gly Ser Ala Phe Phe Asn Arg Asp Ile Arg
305 310 315 320
Arg Tyr Ala Thr His Glu Arg Lys Met Met Leu Asp Asn His Ala Leu
325 330 335
Tyr Asp Lys Thr Lys Arg Val Phe Leu Lys Ala Glu Ser Glu Glu Glu
340 345 350
Ile Phe Ala His Leu Gly Leu Asp Tyr Ile Glu Pro Arg Glu Arg Asn
355 360 365
Ala
<210> 28
<211> 374
<212> PRT
<213> 人工序列(ARTIFICIAL SEQUENCE)
<220>
<223> 矛尾鱼属(Latimeria)
<400> 28
Asn Val Pro Ala Pro Ser Val Val Ala Ile Ser Gln Tyr Ala Cys Gln
1 5 10 15
Arg Arg Thr Thr Leu Asn Asn His Asn Lys Ile Phe Thr Asp Ala Phe
20 25 30
Glu Ile Leu Ala Glu Asn Tyr Glu Phe Asn Glu Asn Glu Gly Pro Cys
35 40 45
Leu Ala Phe Arg Arg Ala Ala Ser Leu Leu Lys Ser Leu Pro Tyr Ala
50 55 60
Ile Ser Ser Met Lys Asp Leu Glu Gly Leu Pro Cys Leu Gly Asp Gln
65 70 75 80
Thr Lys Ala Val Ile Glu Glu Ile Leu Glu Glu Gly Gln Ser Ser Lys
85 90 95
Val Gln Asp Val Leu Ser Asp Glu Arg Tyr Lys Ser Ile Lys Leu Phe
100 105 110
Thr Ser Val Phe Gly Val Gly Leu Lys Thr Ala Glu Lys Trp Tyr Arg
115 120 125
Lys Gly Phe Arg Thr Leu Glu Glu Val Gln Ala Asp Lys Glu Ile Lys
130 135 140
Leu Thr Lys Met Gln Lys Ala Gly Phe Leu Tyr Tyr Glu Asp Ile Ser
145 150 155 160
Ser Ala Val Thr Lys Ala Glu Ala Glu Ala Ile Gly Gln Ile Ile Glu
165 170 175
Asp Thr Val Arg Leu Phe Ala Pro Asp Ala Ile Val Thr Leu Thr Gly
180 185 190
Gly Phe Arg Leu Gly Lys Lys Ile Gly His Asp Val Asp Phe Leu Ile
195 200 205
Thr Thr Pro Glu Thr Gly Asn Glu Asn Gly Leu Leu His Lys Val Ile
210 215 220
Asn Val Leu Gln Asn Gln Gly Ile Leu Leu Tyr Tyr Asp Ile Val Glu
225 230 235 240
Ser Thr Phe Asp Lys Thr Arg Leu Pro Ser Arg Lys Val Asp Ala Leu
245 250 255
Asp His Phe Gln Lys Cys Phe Ala Ile Leu Lys Leu His Lys Gln Lys
260 265 270
Val Asn Thr Ser Asn Ser Glu Glu Ala Glu Glu Pro Ser Asn Thr Glu
275 280 285
Thr Lys Asp Trp Lys Ala Ile Arg Val Asp Leu Val Ile Thr Pro Phe
290 295 300
Asp Gln Tyr Ala Phe Ala Leu Leu Gly Trp Thr Gly Ser Ala Phe Phe
305 310 315 320
Asn Arg Asp Leu Arg Arg Phe Ala Thr His Glu Arg Lys Met Met Leu
325 330 335
Asp Asn His Ala Leu Tyr Asp Lys Thr Lys Lys Ile Phe Leu Pro Ala
340 345 350
Lys Thr Glu Glu Asp Ile Phe Ala His Leu Gly Leu Asp Tyr Ile Glu
355 360 365
Pro Trp Glu Arg Asn Ala
370
<210> 29
<211> 370
<212> PRT
<213> 人工序列(ARTIFICIAL SEQUENCE)
<220>
<223> 美洲狮
<400> 29
Lys Thr Glu Ser Ala Val Val Lys Lys Ile Pro Leu Tyr Ala Cys Gln
1 5 10 15
Arg Arg Thr Thr Leu Asn Asn Phe Asn Glu Ile Phe Thr Arg Ala Phe
20 25 30
Glu Val Leu Ala Glu Asn Tyr Glu Phe Lys Glu Asn Glu Ile Ser Ser
35 40 45
Ala Thr Phe Arg Arg Ala Ala Ser Val Leu Lys Ser Leu Pro Phe Thr
50 55 60
Ile Ile Ser Met Lys Asp Thr Glu Gly Ile Pro Cys Leu Gly Asp Lys
65 70 75 80
Val Lys Arg Val Ile Glu Glu Ile Ile Glu Asp Gly Glu Ser Ser Glu
85 90 95
Val Lys Ala Val Leu Asn Asp Glu Arg Tyr Gln Ala Phe Lys Leu Phe
100 105 110
Thr Ser Val Phe Gly Val Gly Leu Lys Thr Ser Glu Lys Trp Phe Arg
115 120 125
Met Gly Phe Arg Thr Leu Glu Lys Ile Lys Ser Asp Lys Thr Leu Lys
130 135 140
Phe Thr Gln Met Gln Lys Ala Gly Phe Leu Tyr Tyr Glu Asp Leu Val
145 150 155 160
Ser Gly Val Thr Arg Ala Glu Ala Glu Ala Val Gly Val Leu Val Lys
165 170 175
Glu Ala Val Trp Ala Phe Leu Pro Asp Ala Phe Val Thr Met Thr Gly
180 185 190
Gly Phe Arg Leu Gly Lys Lys Ile Gly His Asp Val Asp Phe Leu Ile
195 200 205
Thr Ile Pro Gly Ser Thr Asp Glu Glu Glu Glu Gln Leu Leu Pro Lys
210 215 220
Val Ile Asn Leu Trp Gln Arg Lys Glu Leu Leu Leu Tyr Tyr Asp Leu
225 230 235 240
Val Glu Ser Thr Phe Glu Lys Leu Lys Leu Pro Ser Arg Lys Val Asp
245 250 255
Ala Leu Asp His Phe Gln Lys Cys Phe Leu Ile Leu Lys Leu His His
260 265 270
Gln Arg Val Asp Ser Gly Lys Cys Ser Gln Gln Glu Gly Lys Thr Trp
275 280 285
Lys Ala Ile Arg Val Asp Leu Val Met Cys Pro Tyr Glu Arg Arg Ala
290 295 300
Phe Ala Leu Leu Gly Trp Thr Gly Ser Ala Phe Phe Asn Arg Asp Leu
305 310 315 320
Arg Arg Tyr Ala Thr His Glu Arg Lys Met Ile Leu Asp Asn His Ala
325 330 335
Leu Tyr Asp Lys Thr Lys Lys Ile Phe Leu Lys Ala Glu Ser Glu Glu
340 345 350
Glu Ile Phe Ala His Leu Gly Leu Asp Tyr Ile Glu Pro Trp Glu Arg
355 360 365
Asn Ala
370
<210> 30
<211> 370
<212> PRT
<213> 人工序列(ARTIFICIAL SEQUENCE)
<220>
<223> N139
<400> 30
Lys Thr Glu Ser Ala Val Val Lys Lys Ile Pro Leu Tyr Ala Cys Gln
1 5 10 15
Arg Arg Thr Thr Leu Asn Asn Phe Asn Glu Ile Phe Thr Arg Ala Phe
20 25 30
Glu Val Leu Ala Glu Asn Tyr Glu Phe Lys Glu Asn Glu Ile Ser Ser
35 40 45
Ala Thr Phe Arg Arg Ala Ala Ser Val Leu Lys Ser Leu Pro Phe Thr
50 55 60
Ile Ile Ser Met Lys Asp Thr Glu Gly Ile Pro Cys Leu Gly Asp Lys
65 70 75 80
Val Lys Arg Val Ile Glu Glu Ile Ile Glu Asp Gly Glu Ser Ser Glu
85 90 95
Val Lys Ala Val Leu Asn Asp Glu Arg Tyr Gln Ala Phe Lys Leu Phe
100 105 110
Thr Ser Val Phe Gly Val Gly Leu Lys Thr Ser Glu Lys Trp Phe Arg
115 120 125
Met Gly Phe Arg Thr Leu Glu Lys Ile Lys Ser Asp Lys Thr Leu Lys
130 135 140
Phe Thr Gln Met Gln Lys Ala Gly Phe Leu Tyr Tyr Glu Asp Leu Val
145 150 155 160
Ser Gly Val Thr Arg Ala Glu Ala Glu Ala Val Gly Val Leu Val Lys
165 170 175
Glu Ala Val Trp Ala Phe Leu Pro Asp Ala Phe Val Thr Met Thr Gly
180 185 190
Gly Phe Arg Leu Gly Lys Lys Ile Gly His Asp Val Asp Phe Leu Ile
195 200 205
Thr Ile Pro Gly Ser Thr Asp Glu Glu Glu Glu Gln Leu Leu Pro Lys
210 215 220
Val Ile Asn Leu Trp Gln Arg Lys Glu Leu Leu Leu Tyr Tyr Asp Leu
225 230 235 240
Val Glu Ser Thr Phe Glu Lys Leu Lys Leu Pro Ser Arg Lys Val Asp
245 250 255
Ala Leu Asp His Phe Gln Lys Cys Phe Leu Ile Leu Lys Leu His His
260 265 270
Gln Arg Val Asp Ser Gly Lys Cys Ser Gln Gln Glu Gly Lys Thr Trp
275 280 285
Lys Ala Ile Arg Val Asp Leu Val Met Cys Pro Tyr Glu Arg Arg Ala
290 295 300
Phe Ala Leu Leu Gly Trp Thr Gly Ser Ala Phe Phe Asn Arg Asp Leu
305 310 315 320
Arg Arg Tyr Ala Thr His Glu Arg Lys Met Ile Leu Asp Asn His Ala
325 330 335
Leu Tyr Asp Lys Thr Lys Lys Ile Phe Leu Lys Ala Glu Ser Glu Glu
340 345 350
Glu Ile Phe Ala His Leu Gly Leu Asp Tyr Ile Glu Pro Trp Glu Arg
355 360 365
Asn Ala
370
<210> 31
<211> 370
<212> PRT
<213> 人工序列(ARTIFICIAL SEQUENCE)
<220>
<223> 鼩鼱
<400> 31
Asn Val Pro Ala Pro Val Val Gln Lys Ile Ser Gln Tyr Ala Cys Gln
1 5 10 15
Arg Arg Thr Thr Leu Asn Asn His Asn His Ile Phe Thr Asp Ala Phe
20 25 30
Glu Ile Leu Ala Glu Asn Asp Glu Phe Arg Glu Asn Glu Glu Ser Arg
35 40 45
Asp Ala Phe Arg Arg Ala Ala Ser Val Leu Lys Ser Leu Pro Phe Ser
50 55 60
Ile Ile Ser Met Lys Asp Thr Glu Gly Ile Pro Cys Leu Ala Asp Lys
65 70 75 80
Val Lys Arg Val Ile Glu Glu Ile Ile Glu Asp Gly Glu Ser Ser Glu
85 90 95
Val Lys Ala Val Leu Asn Asp Glu Arg Tyr Lys Ala Phe Lys Leu Phe
100 105 110
Thr Ser Val Phe Gly Val Gly Arg Lys Thr Ala Glu Lys Trp Phe Arg
115 120 125
Leu Gly Phe Arg Thr Leu Glu Gly Ile Arg Asn Asp Lys Thr Leu Lys
130 135 140
Leu Thr His Met Gln Lys Ala Gly Phe Leu Tyr Tyr Glu Asp Leu Val
145 150 155 160
Ser Gly Val Thr Arg Ala Glu Ala Glu Ala Val Gly Val Leu Val Lys
165 170 175
Glu Ala Val Trp Ala Phe Leu Pro Asp Ala Ile Val Thr Met Thr Gly
180 185 190
Gly Phe Arg Leu Gly Lys Lys Val Gly His Asp Val Asp Phe Leu Ile
195 200 205
Thr Ser Pro Glu Ala Thr Glu Glu Gln Glu Gln Gln Leu Leu His Lys
210 215 220
Val Ile Thr Phe Trp Glu Lys Glu Gly Leu Leu Leu Tyr Cys Asp Leu
225 230 235 240
Tyr Glu Ser Thr Phe Glu Lys Leu Lys Met Pro Ser Arg Thr Val Asp
245 250 255
Ala Leu Asp His Phe Gln Lys Cys Phe Leu Ile Leu Lys Leu His Arg
260 265 270
Glu Ser Val Asp Asp Gly Thr Ser Ser Gln Leu Gln Gly Lys Thr Trp
275 280 285
Lys Ala Ile Arg Val Asp Leu Val Val Cys Pro Tyr Glu Cys Arg Ala
290 295 300
Phe Ala Leu Leu Gly Trp Thr Gly Ser Pro Phe Phe Asn Arg Asp Leu
305 310 315 320
Arg Arg Tyr Ala Thr His Glu Arg Lys Met Met Leu Asp Asn His Ala
325 330 335
Leu Tyr Asp Lys Thr Lys Arg Lys Phe Leu Ser Ala Asp Ser Glu Glu
340 345 350
Asp Ile Phe Ala His Leu Gly Leu Asp Tyr Ile Glu Pro Arg Glu Arg
355 360 365
Asn Ala
370
<210> 32
<211> 381
<212> PRT
<213> 人工序列(ARTIFICIAL SEQUENCE)
<220>
<223> M27
<400> 32
Asn Ser Ser Pro Ser Pro Val Pro Gly Ser Gln Asn Val Pro Ala Pro
1 5 10 15
Val Val Lys Lys Ile Ser Gln Tyr Ala Cys Gln Arg Arg Thr Thr Leu
20 25 30
Asn Asn Tyr Asn Gln Leu Phe Thr Asp Ala Leu Asp Ile Leu Ala Glu
35 40 45
Asn Asp Glu Phe Arg Glu Asn Glu Glu Ser Cys Leu Ala Phe Arg Arg
50 55 60
Ala Ser Ser Val Leu Lys Ser Leu Pro Phe Pro Ile Thr Ser Met Lys
65 70 75 80
Asp Thr Glu Gly Ile Pro Cys Leu Gly Asp Lys Val Lys Ser Ile Ile
85 90 95
Glu Gly Ile Ile Glu Asp Gly Glu Ser Ser Glu Val Lys Ala Val Leu
100 105 110
Asn Asp Glu Arg Tyr Lys Ser Phe Lys Leu Phe Thr Ser Val Phe Gly
115 120 125
Val Gly Leu Lys Thr Ala Glu Lys Trp Phe Arg Met Gly Phe Arg Thr
130 135 140
Leu Ser Lys Ile Gln Ser Asp Lys Ser Leu Arg Phe Thr Gln Met Gln
145 150 155 160
Lys Ala Gly Phe Leu Tyr Tyr Glu Asp Leu Val Ser Gly Val Asn Arg
165 170 175
Pro Glu Ala Glu Ala Val Ser Met Leu Val Lys Glu Ala Val Val Thr
180 185 190
Phe Leu Pro Asp Ala Leu Val Thr Met Thr Gly Gly Phe Arg Leu Gly
195 200 205
Lys Met Thr Gly His Asp Val Asp Phe Leu Ile Thr Ser Pro Glu Ala
210 215 220
Thr Glu Asp Glu Glu Gln Gln Leu Leu His Lys Val Thr Asp Phe Trp
225 230 235 240
Lys Gln Gln Gly Leu Leu Leu Tyr Cys Asp Ile Leu Glu Ser Thr Phe
245 250 255
Glu Lys Phe Lys Gln Pro Ser Arg Thr Val Asp Ala Leu Asp His Phe
260 265 270
Gln Lys Cys Phe Leu Ile Leu Lys Leu Asp His Pro Arg Val His Ser
275 280 285
Val Lys Ser Gly Gln Gln Glu Gly Lys Gly Trp Lys Ala Ile Arg Val
290 295 300
Asp Leu Val Met Cys Pro Tyr Asp Arg Arg Ala Phe Ala Leu Leu Gly
305 310 315 320
Trp Thr Gly Ser Pro Gln Phe Asn Arg Asp Leu Arg Arg Tyr Ala Thr
325 330 335
His Glu Arg Lys Met Met Leu Asp Asn His Ala Leu Tyr Asp Lys Thr
340 345 350
Lys Arg Val Phe Leu Glu Ala Glu Ser Glu Glu Glu Ile Phe Ala His
355 360 365
Leu Gly Leu Asp Tyr Ile Glu Pro Trp Glu Arg Asn Ala
370 375 380
<210> 33
<211> 20
<212> DNA
<213> 人工序列(ARTIFICIAL SEQUENCE)
<220>
<223> 引物
<400> 33
taatacgact cactataggg 20
<210> 34
<211> 19
<212> DNA
<213> 人工序列(ARTIFICIAL SEQUENCE)
<220>
<223> 引物
<400> 34
gctagttatt gctcagcgg 19

Claims (17)

1.一种末端脱氧核苷酸转移酶(TdT)变体,所述末端脱氧核苷酸转移酶变体包含与选自SEQ ID NO:3、4、5、6、7、8、9、10、11、12、13、14、15、16、24、25或26的氨基酸序列至少90%相同的氨基酸序列,具有在以下位置处的取代:在相对于SEQ ID NO:3、8、10和14的位置Q326处的取代,或在相对于SEQ ID NO:4和5的位置Q325处的取代,或在相对于SEQ ID NO:7和9的位置Q332处的取代,或在相对于SEQ ID NO:13和16的位置Q329处的取代,或在相对于SEQ ID NO:6的位置Q321处的取代,或在相对于SEQ ID NO:11的位置Q327处的取代,或在相对于SEQ ID NO:12的位置Q324处的取代,或在相对于SEQ ID NO:15的位置Q339处的取代,或在相对于SEQ ID NO:24和26的位置Q309处的取代,或在相对于SEQ ID NO:25的位置Q307处的取代,其中所述TdT变体(i)能够在无模板的条件下合成核酸片段,并且(ii)能够将3’-O-修饰的核苷酸掺入到核酸片段上。
2.根据权利要求1所述的TdT变体,所述TdT变体还包含以下一种或更多种:
(i)在相对于SEQ ID NO:3、7、8、9、10、13和14的位置K265处的取代,或在相对于SEQ IDNO:6和12的位置K263处的取代,或在相对于SEQ ID NO:5的位置K264处的取代,或在相对于SEQ ID NO:11的位置K266处的取代,或在相对于SEQ ID NO:16的位置K268处的取代,或在相对于SEQ ID NO:15的位置K272处的取代;
(ii)在相对于SEQ ID NO:3、8、10和14的位置H337处的取代,或在相对于SEQ ID NO:4和5的位置H336处的取代,或在相对于SEQ ID NO:7和9的位置H343处的取代,或在相对于SEQ ID NO:13和16的位置H340处的取代,或在相对于SEQ ID NO:6的位置H332处的取代,或在相对于SEQ ID NO:11的位置H338处的取代,或在相对于SEQ ID NO:12的位置H335处的取代,或在相对于SEQ ID NO:15的位置H350处的取代;
(iii)在相对于SEQ ID NO:3、8、10和14的位置W377处的取代,或在相对于SEQ ID NO:4和5的位置W376处的取代,或在相对于SEQ ID NO:6的位置W372处的取代,或在相对于SEQID NO:13的位置W380处的取代,或在相对于SEQ ID NO:6的位置W372处的取代,或在相对于SEQ ID NO:9的位置W383处的取代,或在相对于SEQ ID NO:11的位置W378处的取代,或在相对于SEQ ID NO:12的位置H375处的取代,或在相对于SEQ ID NO:13的位置W380处的取代,或在相对于SEQ ID NO:15的位置W390处的取代;
(iv)在相对于SEQ ID NO:3、4、5、6、8、10、13、14和15的位置A17处的取代,或在相对于SEQ ID NO:11和16的位置A18处的取代;
(v)在相对于SEQ ID NO:3和15的位置G57处的取代;或
(vi)在相对于SEQ ID NO:3的位置Q261处的取代,或在相对于SEQ ID NO:6的位置Q262处的取代,或在相对于SEQ ID NO:4的位置Q264处的取代。
3.根据权利要求1或2所述的TdT变体,其中:
(i)在相对于SEQ ID NO:3、8、10和14的位置Q326处的所述取代,或在相对于SEQ IDNO:4和5的位置Q325处的所述取代,或在相对于SEQ ID NO:7和9的位置Q332处的所述取代,或在相对于SEQ ID NO:13和16的位置Q329处的所述取代,或在相对于SEQ ID NO:6的位置Q321处的所述取代,或在相对于SEQ ID NO:11的位置Q327处的所述取代,或在相对于SEQID NO:12的位置Q324处的所述取代,或在相对于SEQ ID NO:15的位置Q339处的所述取代选自由T、F、L、M、I、V和Y组成的组;
(ii)在相对于SEQ ID NO:3、7、8、9、10、13和14的位置K265处的所述取代,或在相对于SEQ ID NO:6和12的位置K263处的所述取代,或在相对于SEQ ID NO:5的位置K264处的所述取代,或在相对于SEQ ID NO:11的位置K266处的所述取代,或在相对于SEQ ID NO:16的位置K268处的所述取代,或在相对于SEQ ID NO:15的位置K272处的所述取代选自由E、T、A和R组成的组;
(iii)在相对于SEQ ID NO:3、8、10和14的位置H337处的所述取代,或在相对于SEQ IDNO:4和5的位置H336处的所述取代,或在相对于SEQ ID NO:7和9的位置H343处的所述取代,或在相对于SEQ ID NO:13和16的位置H340处的所述取代,或在相对于SEQ ID NO:6的位置H332处的所述取代,或在相对于SEQ ID NO:11的位置H338处的所述取代,或在相对于SEQID NO:12的位置H335处的所述取代,或在相对于SEQ ID NO:15的位置H350处的所述取代选自由Y、F、N和D组成的组;
(iv)在相对于SEQ ID NO:3、8、10和14的位置W377处的所述取代,或在相对于SEQ IDNO:4和5的位置W376处的所述取代,或在相对于SEQ ID NO:6的位置W372处的所述取代,或在相对于SEQ ID NO:13的位置W380处的所述取代,或SEQ ID NO:9的位置W383处的所述取代,或在相对于SEQ ID NO:11的位置W378处的所述取代,或在相对于SEQ ID NO:12的位置W375处的所述取代,或在相对于SEQ ID NO:13的位置W380处的所述取代,或在相对于SEQID NO:15的位置W390处的所述取代是R;
(v)在相对于SEQ ID NO:3、4、5、6、8、10、13、14和15的位置A17处的所述取代,或在相对于SEQ ID NO:11和16的位置A18处的所述取代是V、I或L;
(vi)在相对于SEQ ID NO:3和15的位置G57处的所述取代,或在相对于SEQ ID NO:9和11的位置G58处的所述取代是E;并且
(vii)在相对于SEQ ID NO:3的位置Q261处的所述取代,或在相对于SEQ ID NO:6的位置Q262处的所述取代,或在相对于SEQ ID NO:4的位置Q264处的所述取代是R。
4.根据权利要求1、2或3所述的TdT变体,所述TdT变体还包含以下一种或更多种:
(i)在相对于SEQ ID NO:3的位置L52处的取代;
(ii)在相对于SEQ ID NO:3、4、5、7、8、13和15的位置M63处的取代,或在相对于SEQ IDNO:10的位置M73处的取代,或在相对于SEQ ID NO:11的位置M64处的取代,或在相对于SEQID NO:12的位置M61处的取代,或在相对于SEQ ID NO:16的位置M66处的取代;
(iii)在相对于SEQ ID NO:3和12的位置A108处的取代,或在相对于SEQ ID NO:4、5、7、8、10、13、14和15的位置A110处的取代,或SEQ ID NO:6的位置A107处的取代,或在相对于SEQ ID NO:9的位置A111处的取代,或在相对于SEQ ID NO:16的位置A113处的取代;
(iv)在相对于SEQ ID NO:3、4、5、7、8、10、13、14和15的位置L131处的取代,或在相对于SEQ ID NO:9和11的位置L132处的取代,或在相对于SEQ ID NO:12的位置L129处的取代,或在相对于SEQ ID NO:16的位置L113处的取代;
(v)在相对于SEQ ID NO:3、4、5、7、8、10、13和14的位置C173处的取代,或在相对于SEQID NO:6的位置C172处的取代,或在相对于SEQ ID NO:9和11的位置C174处的取代,或在相对于SEQ ID NO:12的位置C171处的取代,或在相对于SEQ ID NO:16的位置C176处的取代,或在相对于SEQ ID NO:15的位置C182处的取代;
(vi)在相对于SEQ ID NO:3、4、5、7、8、10、13和14的位置R207处的取代,或在相对于SEQID NO:6的位置R206处的取代,或在相对于SEQ ID NO:9和11的位置R208处的取代,或在相对于SEQ ID NO:12的R205位置处的取代,或在相对于SEQ ID NO:216的位置R216处的取代,或在相对于SEQ ID NO:16的位置R210处的取代;
(vii)在相对于SEQ ID NO:3或12的位置G284处的取代;
(viii)在相对于SEQ ID NO:3的位置E289处的取代,或在相对于SEQ ID NO:5的位置E294处的取代,或在相对于SEQ ID NO:6的位置E290处的取代,或在相对于SEQ ID NO:7的位置E292处的取代,或在相对于SEQ ID NO:10和14的位置E295处的取代,或在相对于SEQID NO:13和16的位置E298处的取代;
(ix)在相对于SEQ ID NO:3、10和14的位置R325处的取代,或在相对于SEQ ID NO:4和5的位置R324处的取代,或在相对于SEQ ID NO:6的位置R320处的取代,或在相对于SEQ IDNO:7和9的位置R331处的取代,或在相对于SEQ ID NO:12的位置R323处的取代,或在相对于SEQ ID NO:13和16的位置R328处的取代,或在相对于SEQ ID NO:15的位置R338处的取代;
(x)在相对于SEQ ID NO:3、8、10和14的位置E328处的取代,或在相对于SEQ ID NO:4和5的位置E327处的取代,或在相对于SEQ ID NO:7和9的位置E334处的取代,或在相对于SEQID NO:11的位置E329处的取代,或在相对于SEQ ID NO:12的位置E326处的取代,或在相对于SEQ ID NO:13和16的位置E331处的取代;或
(xi)在相对于SEQ ID NO:3的位置R351处的取代,或在相对于SEQ ID NO:4和5的位置R353处的取代,或在相对于SEQ ID NO:8和14的位置R354处的取代,或在相对于SEQ ID NO:11的位置R355处的取代,或在相对于SEQ ID NO:13的位置R352处的取代。
5.根据前述权利要求中任一项所述的TdT变体,所述TdT变体还包含以下一种或更多种:
(i)相对于SEQ ID NO:3、5、7、9和15的取代Q37E;
(ii)相对于SEQ ID NO:3、4、5、7、8、10、13、14和15的取代D41R,或相对于SEQ ID NO:6的取代D40R,或SEQ ID NO:9和11的取代D42R,或相对于SEQ ID NO:16的取代D44R,或相对于SEQ ID NO:12的取代D39R取代;
(iii)相对于SEQ ID NO:3、5、7、13和15的取代C59R,或相对于SEQ ID NO:6的取代C58R,或相对于SEQ ID NO:10的取代C60R,或相对于SEQ ID NO:16的取代C62R取代;
(iv)相对于SEQ ID NO:3、7、10和15的取代L60D,或相对于SEQ ID NO:6的取代L59D;
(v)相对于SEQ ID NO:3、12和15的取代S94R;
(vi)相对于SEQ ID NO:3的取代G98E;
(vii)相对于SEQ ID NO:3、4、5、7、8、10、13、14和14的取代S119A,或相对于SEQ ID NO:6的取代S118A,或相对于SEQ ID NO:9和11的取代S120A,或相对于SEQ ID NO:16的取代S122A;
(viii)相对于SEQ ID NO:3、4、5、8、10和14的取代S146E,或相对于SEQ ID NO:11的取代S147E,或相对于SEQ ID NO:12的取代S144E;
(ix)相对于SEQ ID NO:3的取代Q149R;
(x)相对于SEQ ID NO:3、4、5、7、8、10、13和14的取代F193Y,或相对于SEQ ID NO:6的取代F192Y,或相对于SEQ ID NO:11的取代F194Y,或相对于SEQ ID NO:12的取代F191Y,或相对于SEQ ID NO:16的取代F196Y;
(xi)相对于SEQ ID NO:3、4、5、7、8、10、13、14和15的取代V199M,或相对于SEQ ID NO:6的取代V198M,或相对于SEQ ID NO:9和11的取代V200M;或
(xii)相对于SEQ ID NO:3、4、5、8、10和13的取代M201V,或相对于SEQ ID NO:11的取代M202V,或相对于SEQ ID NO:12的取代M199V。
6.根据前述权利要求中任一项所述的TdT变体,所述TdT变体包含以下相对于SEQ IDNO:3的取代的组合:
(i)A17V+Q37E+D41R+L52F+G57E+M63R+S94R+G98E+A108V+S119A+L131R+S146E+Q149R+C173G+R207L+K265T+G284P+E289V+R325P+Q326F+E328N+H337D+R351K+W377R;
(ii)A17V+Q37E+D41R+L52F+G57E+M63R+S94R+G98E+A108V+S146E+Q149R+C173G+F193Y+V199M+M201V+R207L+K265T+G284P+E289V+R325A+Q326F+E328N+R351K;
(iii)L52F+A108V+R351K+A17V+Q37E+D41R+G57E+C59R+L60D+M63R+S94R+G98E+S119A+L131R+S146E+Q149R+C173G+R207L+K265T+G284P+E289V+R325A+Q326F+E328N;
(iv)L52F+A108V+R351K+A17V+Q37E+D41R+G57E+C59R+L60D+M63R+S94R+G98E+K118Q+S119A+L131R+S146E+Q149R+C173G+R207L+K265T+G284P+E289V+R325A+Q326F+E328N+W377R;
(v)A17V+Q37E+D41R+L52F+G57E+C59R+L60D+M63R+S94R+G98E+A108V+S119A+L131R+S146E+Q149R+C173G+R207L+F259S+Q261L,G284P+E289V+R325A+Q326F+E328N+R351K+W377R;
(vi)A17V+Q37E+D41R+L52F+G57E+C59R+L60D+M63R+S94R+G98E+A108V+S119A+L131R+S146E+Q149R+C173G+R207L+E257D+F259S+K260R+Q261L+G284P+E289V+R325A+Q326F+E328N+R351K+W377R;
(vii)A17V+D41R+L53F+G57E+C59R+L60D+M63R+S94R+G98E+K118Q+S119A+L131R+S146E+Q149R+C173G+R207L+K265T+G284P+E289V+R325A+Q326F+R351K+W377R;
(viii)A17V+D41R+L52F+G57E+C59R+L60D+M63R+S94R+G98E+A108V+S119A+L131R+S146E+Q149R+R207L+K265T+G284P+E289V+R325A+Q326F+R351K;
(ix)A17V+L52F+M63R+A108V+C173G+R207L+K265T+G284P+E289V+R325P+E328N+R351K;
(x)A17V+D41R+L52F+G57E+M63R+S94R+G98E+A108V+S146E+Q149R+C173G+M184T+R207L+K209H+G284L+E289A+R325V+E328K+R351K;
(xi)A17V+L52F+G57E+M63R+A108V+C173G+R207L+K265T+G284P+E289V+R325P+E328N+R351K;
(xii)A17V+L32T+Q37R+D41R+L52F+G57E+C59R+L60D+M63R+S67A+S94R+G98E+A108V+S119A+L131R+S146E+Q149R+V171A+S172E+C173R+V182I+S183E+R207L+K209H+M210K+T211I+E223G+A224P+E228D+Q261L+G284P+E289V+R325A+Q326F+E328N+R351K+D372E;或
(xiii)包含SEQ ID NO:27、28、29、30或31。
7.根据权利要求1至6中任一项所述的TdT变体,所述TdT变体具有与SEQ ID NO:4至少90%相同的氨基酸序列,并且还具有位置M63、R207、R324和E327处的取代。
8.根据权利要求7所述的TdT变体,所述TdT变体包含取代M63R+R207L+E227N的组合。
9.根据权利要求1至6中任一项所述的TdT变体,所述TdT变体具有与SEQ ID NO:24至少90%相同的氨基酸序列,并且还具有位置M47、R190、R308和E311处的取代。
10.根据权利要求9所述的TdT变体,所述TdT变体包含取代M47R+R190L+E311N的组合。
11.根据权利要求1至6中任一项所述的TdT变体,所述TdT变体具有与SEQ ID NO:26至少90%相同的氨基酸序列,并且还具有位置M46、R190和E311处的取代。
12.根据权利要求11所述的TdT变体,所述TdT变体包含取代组合M46R+R190 L+E311N。
13.根据权利要求1至6中任一项所述的TdT变体,所述TdT变体具有与SEQ ID NO:25至少90%相同的氨基酸序列,并且还具有位置R184、R306和E309处的取代。
14.根据权利要求13所述的TdT变体,所述TdT变体包含取代组合R184L+R306A+E309N。
15.一种合成具有预定序列的多核苷酸的方法,所述方法包括以下步骤:
a)提供具有3’-末端核苷酸的起始子,所述3’-末端核苷酸具有游离3’-羟基;
b)重复以下循环:(i)在延伸条件下使具有游离3’-O-羟基的起始子或延伸片段与3’-O-封闭的核苷三磷酸和根据权利要求1至14中任一所述的TdT变体接触,使得所述起始子或延伸片段通过掺入3’-O-封闭的核苷三磷酸而延伸,以形成3’-O-封闭的延伸片段,和(ii)使所述延伸片段脱封闭以形成具有游离3’-羟基的延伸片段,直到形成所述多核苷酸。
16.根据权利要求15所述的方法,其中所述3’-O-封闭的核苷三磷酸是3’-O-NH2-核苷三磷酸、3’-O-叠氮甲基-核苷三磷酸、3’-O-烯丙基-核苷三磷酸或3’-O-(2-硝基苄基)-核苷三磷酸。
17.一种用于进行核苷酸掺入反应的试剂盒,所述试剂盒包括:
a)根据权利要求1至14中任一项所述的TdT变体;
b)一种或更多种核苷酸,优选一种或更多种3’O-修饰的核苷酸,和
c)任选至少一种核酸引物。
CN201980089035.8A 2018-11-14 2019-11-13 末端脱氧核苷酸转移酶变体及其用途 Pending CN113302289A (zh)

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
EP18206298 2018-11-14
EP18206298.4 2018-11-14
EP19305677 2019-05-28
EP19305677.7 2019-05-28
EP19195662.2 2019-09-05
EP19195662 2019-09-05
PCT/EP2019/081099 WO2020099451A1 (en) 2018-11-14 2019-11-13 Terminal deoxynucleotidyl transferase variants and uses thereof

Publications (1)

Publication Number Publication Date
CN113302289A true CN113302289A (zh) 2021-08-24

Family

ID=68536875

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201980089035.8A Pending CN113302289A (zh) 2018-11-14 2019-11-13 末端脱氧核苷酸转移酶变体及其用途

Country Status (9)

Country Link
US (2) US11859217B2 (zh)
EP (1) EP3880808A1 (zh)
JP (1) JP2022513031A (zh)
CN (1) CN113302289A (zh)
AU (1) AU2019379287A1 (zh)
CA (1) CA3119845A1 (zh)
IL (1) IL283068A (zh)
SG (1) SG11202104601PA (zh)
WO (1) WO2020099451A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN118995661A (zh) * 2024-09-27 2024-11-22 浙江大学 一种热稳定性高的末端脱氧核苷酸转移酶突变体及其应用

Families Citing this family (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
SG11202107921SA (en) 2019-02-12 2021-08-30 Dna Script Efficient product cleavage in template-free enzymatic synthesis of polynucleotides.
WO2020239737A1 (en) * 2019-05-28 2020-12-03 Dna Script Variants of terminal deoxynucleotidyl transferase and uses thereof.
CA3145912A1 (en) 2019-08-01 2021-02-04 Adrian Horgan Increasing long-sequence yields in template-free enzymatic synthesis of polynucleotides.
US20220403436A1 (en) 2019-09-23 2022-12-22 Dna Script Increasing Long-Sequence Yields in Template-Free Enzymatic Synthesis of Polynucleotides
EP4073240A1 (en) * 2019-12-12 2022-10-19 DNA Script Chimeric terminal deoxynucleotidyl transferases for template-free enzymatic synthesis of polynucleotides
EP4077703A1 (en) * 2019-12-16 2022-10-26 DNA Script Template-free enzymatic polynucleotide synthesis using dismutationless terminal deoxynucleotidyl transferase variants
WO2021213903A1 (en) * 2020-04-20 2021-10-28 Dna Script Terminal deoxynucleotidyl transferase variants and uses thereof
WO2021254934A1 (en) 2020-06-16 2021-12-23 Dna Script Systems, apparatus and kits for enzymatic polynucleotide synthesis
US20230313255A1 (en) 2020-07-15 2023-10-05 Dna Script Massively Parallel Enzymatic Synthesis of Polynucleotides
WO2022063835A1 (en) * 2020-09-22 2022-03-31 Dna Script Stabilized n-terminally truncated terminal deoxynucleotidyl transferase variants and uses thereof
US20230416708A1 (en) 2020-10-26 2023-12-28 Dna Script Novel Variants of Endonuclease V and Uses Thereof
WO2022207934A1 (en) 2021-04-02 2022-10-06 Dna Script Methods and kits for enzymatic synthesis of g4-prone polynucleotides
NL2032097B1 (en) 2021-06-10 2024-03-29 Dna Script Enzymatic synthesis of polynucleotides using 3'-o-amino-2'-deoxyribonucleoside triphosphate monomers
AU2022388772A1 (en) 2021-11-10 2024-05-16 Dna Script Novel terminal deoxynucleotidyl
EP4430176A2 (en) 2021-11-10 2024-09-18 DNA Script Novel terminal deoxynucleotidyl transferase (tdt) variants
WO2024083883A1 (en) 2022-10-19 2024-04-25 Dna Script Methods and products for removal of uracil containing polynucleotides
WO2024141628A1 (en) 2022-12-31 2024-07-04 Dna Script Variable viscosity inks for inkjet delivery of enzyme reagents
WO2024146937A1 (en) 2023-01-06 2024-07-11 Dna Script Methods for obtaining correctly assembled nucleic acids
WO2024153642A1 (en) 2023-01-16 2024-07-25 Dna Script Scarless template-free enzymatic synthesis of polynucleotides
WO2024153643A1 (en) 2023-01-16 2024-07-25 Dna Script Inkjet-assisted enzymatic nucleic acid synthesis
WO2024227846A2 (en) 2023-05-03 2024-11-07 Dna Script Reagent used in deprotection of 3'-o-amino polynucleotides
WO2025003434A1 (en) 2023-06-30 2025-01-02 Dna Script Nucleic acid synthesis on reusable support

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1997031116A2 (en) * 1996-02-21 1997-08-28 THE GOVERNMENT OF THE UNITED STATES OF AMERICA, represented by THE SECRETARY OF THE DEPARTMENT OF H EALTH AND HUMAN SERVICES Recombinant ribonuclease proteins
US6013451A (en) * 1997-04-10 2000-01-11 The National University Of Singapore Bacillus stearothermophilus DNA Polymerase I (klenow) clones including those with reduced 3'- to -5' exonuclease activity
CN105264085A (zh) * 2013-10-15 2016-01-20 分子组装有限责任公司 合成核酸的方法和设备
CA3024184A1 (en) * 2016-06-14 2017-12-21 Dna Script Variants of a dna polymerase of the polx family
CN107567501A (zh) * 2015-02-10 2018-01-09 核酸有限公司 新用途

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1991006678A1 (en) 1989-10-26 1991-05-16 Sri International Dna sequencing
US5436143A (en) 1992-12-23 1995-07-25 Hyman; Edward D. Method for enzymatic synthesis of oligonucleotides
US5739386A (en) 1994-06-23 1998-04-14 Affymax Technologies N.V. Photolabile compounds and methods for their use
US5763594A (en) 1994-09-02 1998-06-09 Andrew C. Hiatt 3' protected nucleotides for enzyme catalyzed template-independent creation of phosphodiester bonds
US5808045A (en) 1994-09-02 1998-09-15 Andrew C. Hiatt Compositions for enzyme catalyzed template-independent creation of phosphodiester bonds using protected nucleotides
US7057026B2 (en) 2001-12-04 2006-06-06 Solexa Limited Labelled nucleotides
CA2491925A1 (en) 2002-07-08 2004-01-15 Shell Canada Limited Choke for controlling the flow of drilling mud
US7947817B2 (en) 2003-06-30 2011-05-24 Roche Molecular Systems, Inc. Synthesis and compositions of 2'-terminator nucleotides
US7544794B1 (en) 2005-03-11 2009-06-09 Steven Albert Benner Method for sequencing DNA and RNA by synthesis
US8399188B2 (en) 2006-09-28 2013-03-19 Illumina, Inc. Compositions and methods for nucleotide sequencing
FR3020071B1 (fr) 2014-04-17 2017-12-22 Dna Script Procede de synthese d'acides nucleiques, notamment d'acides nucleiques de grande longueur, utilisation du procede et kit pour la mise en œuvre du procede
EP3699283A1 (en) * 2014-10-20 2020-08-26 Molecular Assemblies Inc. Modified template-independent enzymes for polydeoxynucleotide systhesis
US11390858B2 (en) * 2014-10-20 2022-07-19 Molecular Assemblies, Inc. Modified template-independent enzymes for polydeoxynucleotide synthesis
US10774316B2 (en) * 2014-10-20 2020-09-15 Molecular Assemblies, Inc. Modified template-independent enzymes for polydeoxynucleotide synthesis

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1997031116A2 (en) * 1996-02-21 1997-08-28 THE GOVERNMENT OF THE UNITED STATES OF AMERICA, represented by THE SECRETARY OF THE DEPARTMENT OF H EALTH AND HUMAN SERVICES Recombinant ribonuclease proteins
US6013451A (en) * 1997-04-10 2000-01-11 The National University Of Singapore Bacillus stearothermophilus DNA Polymerase I (klenow) clones including those with reduced 3'- to -5' exonuclease activity
CN105264085A (zh) * 2013-10-15 2016-01-20 分子组装有限责任公司 合成核酸的方法和设备
CN107567501A (zh) * 2015-02-10 2018-01-09 核酸有限公司 新用途
CA3024184A1 (en) * 2016-06-14 2017-12-21 Dna Script Variants of a dna polymerase of the polx family
CN109477080A (zh) * 2016-06-14 2019-03-15 Dna斯克瑞普特公司 polX家族的DNA聚合酶的变体

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
HAIJUN WANG ET AL: "Protein phosphatase 1 (PP1) and Casein Kinase II (CK2) regulate Ikaros-mediated repression of TdT in thymocytes and T-cell leukemia", 《PEDIATR BLOOD CANCER》, vol. 61, no. 12, pages 2230 - 2235 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN118995661A (zh) * 2024-09-27 2024-11-22 浙江大学 一种热稳定性高的末端脱氧核苷酸转移酶突变体及其应用

Also Published As

Publication number Publication date
CA3119845A1 (en) 2020-05-22
SG11202104601PA (en) 2021-06-29
US11859217B2 (en) 2024-01-02
AU2019379287A1 (en) 2021-06-03
IL283068A (en) 2021-06-30
JP2022513031A (ja) 2022-02-07
US20240093165A1 (en) 2024-03-21
EP3880808A1 (en) 2021-09-22
US20220002687A1 (en) 2022-01-06
WO2020099451A1 (en) 2020-05-22

Similar Documents

Publication Publication Date Title
CN113302289A (zh) 末端脱氧核苷酸转移酶变体及其用途
JP7538807B2 (ja) テンプレートなしの酵素によるポリヌクレオチド合成における効率的生成物切断
US20230062303A1 (en) Chimeric Terminal Deoxynucleotidyl Transferases For Template-Free Enzymatic Synthesis Of Polynucleotides
JP2022543569A (ja) ポリ(a)およびポリ(u)ポリメラーゼを使用するポリヌクレオチドの鋳型なしの酵素による合成
US20240093256A1 (en) Stabilized N-Terminally Truncated Terminal Deoxynucleotidyl Transferase Variants and Uses Thereof
US20230159903A1 (en) Terminal Deoxynucleotidyl Transferase Variants and Uses Thereof
CN115135770A (zh) 使用无歧化作用末端脱氧核苷酸转移酶变体的多核苷酸无模板酶学合成
US20220411840A1 (en) High Efficiency Template-Free Enzymatic Synthesis of Polynucleotides
CN116555216A (zh) 可控合成单链dna的末端转移酶变体及应用

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20210824

WD01 Invention patent application deemed withdrawn after publication