CN114763546A - 一种dU5`衔接子及其应用和构建的cDNA文库 - Google Patents
一种dU5`衔接子及其应用和构建的cDNA文库 Download PDFInfo
- Publication number
- CN114763546A CN114763546A CN202110037475.8A CN202110037475A CN114763546A CN 114763546 A CN114763546 A CN 114763546A CN 202110037475 A CN202110037475 A CN 202110037475A CN 114763546 A CN114763546 A CN 114763546A
- Authority
- CN
- China
- Prior art keywords
- adaptor
- nucleic acid
- seq
- cdna
- sequence
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 239000002299 complementary DNA Substances 0.000 title claims abstract description 51
- 238000010276 construction Methods 0.000 claims abstract description 25
- JTBBWRKSUYCPFY-UHFFFAOYSA-N 2,3-dihydro-1h-pyrimidin-4-one Chemical compound O=C1NCNC=C1 JTBBWRKSUYCPFY-UHFFFAOYSA-N 0.000 claims abstract description 19
- 230000004048 modification Effects 0.000 claims abstract description 18
- 238000012986 modification Methods 0.000 claims abstract description 18
- 230000000295 complement effect Effects 0.000 claims abstract description 12
- 125000006850 spacer group Chemical group 0.000 claims abstract description 9
- 230000026731 phosphorylation Effects 0.000 claims abstract description 8
- 238000006366 phosphorylation reaction Methods 0.000 claims abstract description 8
- 239000012634 fragment Substances 0.000 claims abstract description 4
- 239000000126 substance Substances 0.000 claims abstract description 4
- 101150010487 are gene Proteins 0.000 claims abstract description 3
- 238000003776 cleavage reaction Methods 0.000 claims description 41
- 230000007017 scission Effects 0.000 claims description 41
- 238000000034 method Methods 0.000 claims description 27
- 108020004707 nucleic acids Proteins 0.000 claims description 24
- 102000039446 nucleic acids Human genes 0.000 claims description 24
- 238000006243 chemical reaction Methods 0.000 claims description 23
- 150000007523 nucleic acids Chemical class 0.000 claims description 23
- 238000000746 purification Methods 0.000 claims description 21
- 108090000790 Enzymes Proteins 0.000 claims description 20
- 102000004190 Enzymes Human genes 0.000 claims description 20
- 239000002773 nucleotide Substances 0.000 claims description 16
- 125000003729 nucleotide group Chemical group 0.000 claims description 16
- 238000005336 cracking Methods 0.000 claims description 4
- GUAHPAJOXVYFON-ZETCQYMHSA-N (8S)-8-amino-7-oxononanoic acid zwitterion Chemical compound C[C@H](N)C(=O)CCCCCC(O)=O GUAHPAJOXVYFON-ZETCQYMHSA-N 0.000 claims description 3
- 239000007853 buffer solution Substances 0.000 claims 1
- 230000009089 cytolysis Effects 0.000 claims 1
- -1 nucleic acid compound Chemical class 0.000 claims 1
- 238000012408 PCR amplification Methods 0.000 abstract description 10
- 239000000539 dimer Substances 0.000 abstract description 7
- 230000015572 biosynthetic process Effects 0.000 abstract description 5
- 230000000052 comparative effect Effects 0.000 description 17
- 239000000872 buffer Substances 0.000 description 15
- 108020004414 DNA Proteins 0.000 description 13
- 230000000694 effects Effects 0.000 description 11
- 239000000523 sample Substances 0.000 description 10
- 239000002202 Polyethylene glycol Substances 0.000 description 9
- 229920001223 polyethylene glycol Polymers 0.000 description 9
- 238000011160 research Methods 0.000 description 9
- 238000012163 sequencing technique Methods 0.000 description 8
- 239000008118 PEG 6000 Substances 0.000 description 6
- 229920002584 Polyethylene Glycol 6000 Polymers 0.000 description 6
- 230000002255 enzymatic effect Effects 0.000 description 6
- 230000003321 amplification Effects 0.000 description 5
- 230000027455 binding Effects 0.000 description 5
- 238000003199 nucleic acid amplification method Methods 0.000 description 5
- 238000006254 arylation reaction Methods 0.000 description 4
- 238000013461 design Methods 0.000 description 4
- 238000005457 optimization Methods 0.000 description 4
- 239000011535 reaction buffer Substances 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 3
- 238000002474 experimental method Methods 0.000 description 3
- 230000014509 gene expression Effects 0.000 description 3
- 238000003780 insertion Methods 0.000 description 3
- 230000037431 insertion Effects 0.000 description 3
- 238000007481 next generation sequencing Methods 0.000 description 3
- 230000035484 reaction time Effects 0.000 description 3
- 102000053602 DNA Human genes 0.000 description 2
- 108091081406 G-quadruplex Proteins 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000012165 high-throughput sequencing Methods 0.000 description 2
- 230000003278 mimic effect Effects 0.000 description 2
- 230000009871 nonspecific binding Effects 0.000 description 2
- 238000012803 optimization experiment Methods 0.000 description 2
- 239000000243 solution Substances 0.000 description 2
- 230000009870 specific binding Effects 0.000 description 2
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 1
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 1
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 1
- 239000013614 RNA sample Substances 0.000 description 1
- 239000003153 chemical reaction reagent Substances 0.000 description 1
- 238000010959 commercial synthesis reaction Methods 0.000 description 1
- 238000011109 contamination Methods 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000012938 design process Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- MTHSVFCYNBDYFN-UHFFFAOYSA-N diethylene glycol Chemical compound OCCOCCO MTHSVFCYNBDYFN-UHFFFAOYSA-N 0.000 description 1
- 238000007849 hot-start PCR Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000006384 oligomerization reaction Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000010189 synthetic method Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 229910021642 ultra pure water Inorganic materials 0.000 description 1
- 239000012498 ultrapure water Substances 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
- C12N15/1096—Processes for the isolation, preparation or purification of DNA or RNA cDNA Synthesis; Subtracted cDNA library construction, e.g. RT, RT-PCR
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6806—Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
-
- C—CHEMISTRY; METALLURGY
- C40—COMBINATORIAL TECHNOLOGY
- C40B—COMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
- C40B50/00—Methods of creating libraries, e.g. combinatorial synthesis
- C40B50/06—Biochemical methods, e.g. using enzymes or whole viable microorganisms
-
- C—CHEMISTRY; METALLURGY
- C40—COMBINATORIAL TECHNOLOGY
- C40B—COMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
- C40B80/00—Linkers or spacers specially adapted for combinatorial chemistry or libraries, e.g. traceless linkers or safety-catch linkers
Landscapes
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Organic Chemistry (AREA)
- Health & Medical Sciences (AREA)
- Genetics & Genomics (AREA)
- Biochemistry (AREA)
- Engineering & Computer Science (AREA)
- Molecular Biology (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Microbiology (AREA)
- Biotechnology (AREA)
- Chemical Kinetics & Catalysis (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Physics & Mathematics (AREA)
- Biophysics (AREA)
- Analytical Chemistry (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- General Chemical & Material Sciences (AREA)
- Medicinal Chemistry (AREA)
- Crystallography & Structural Chemistry (AREA)
- Bioinformatics & Computational Biology (AREA)
- Plant Pathology (AREA)
- Immunology (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本发明提供一种dU5’衔接子及其应用和构建的cDNA文库。该dU5’衔接子的结构为5’‑p‑S1‑S2‑S3‑S4‑SpC3‑3’,S1、S2、S3和S4为依次通过化学键相连接的基因片段,p表示5’端进行的磷酸化修饰;S1为第一茎部;S2为环部;S3为第二茎部,其含有1个脱氧尿嘧啶dU;S1的5’→3’序列与S3的3’→5’序列互补;S4为引导部(N)m,其中,N选自A、T、G和C碱基中的任一种,m为10;SpC3表示3’端进行的C3间隔修饰。该dU5’衔接子能够减少接头‑引物二聚体的形成,提高PCR扩增效率,减少PCR周期,提高库质量;为构建广泛生物应用cDNA文库提供一个新的重要平台。
Description
技术领域
本发明属于生物技术领域,涉及一种dU5’衔接子及其应用和构建的cDNA文库。
背景技术
cDNA文库构建对很多高通量测序应用至关重要。近年来由于开发了多种cDNA文库构建方法,达到对RNA新特性的探索和研究目的,例如,RNA结构领域的研究深入。
近年来本研究团队开发了RNA G-四链体结构测序(rG4-seq)技术(Kwok,Marsicoet al.2016),从转录组水平揭示了RNA G-四链体结构存在于人体内,为进一步研究rG4结构和功能的研究提供有效的依据,其中文库构建所用到的5’衔接子可以降低连接cDNA过程中的非特异结合,从而提高连接效率,此项设计已申请专利(No.9,816,120,USA,授权)。但是,rG4-seq测序技术的实验流程需要的RNA起始量较大,文库构建时间长,因此我们对整个cDNA文库构建过程的一些关键实验步骤做了系统性评估与优化,希望提高文库构建的效率与质量,此项研究成果已于2019年发表(Yeung,Zhao et al.2019),并申请了专利(No.15/957,037,USA,审中)。
基于以上研究,我们发现建库过程中PCR效率较低,完成文库的构建所需反应循环数较多,从而影响了文库的质量,导致后续二代测序分析得到的有效数据较少。因此,亟待设计一种全新的5’衔接子,以提高PCR扩增效率,减少PCR周期,提高文库质量,为构建广泛的生物应用cDNA文库提供一个新的重要平台。
发明内容
基于现有技术存在的问题,本发明的第一目的在于提供一种dU5’衔接子,该dU5’衔接子为发明人特殊设计的含脱氧尿嘧啶的结构,其能够减少接头-引物二聚体的形成,提高PCR扩增效率;本发明的第二目的在于提供所述dU5’衔接子在构建cDNA文库中的应用;本发明的第三目的在于提供一种cDNA文库的构建方法,该构建方法中采用了本发明特殊设计的含脱氧尿嘧啶的dU5’衔接子;本发明的第四目的在于提供上述构建方法构建获得的cDNA文库。
本发明的目的通过以下技术手段得以实现:
一方面,本发明提供一种dU5’衔接子,该dU5’衔接子具有如下式(I)所示的结构:
5’-p-S1-S2-S3-S4-SpC3-3’ (I)
其中,S1、S2、S3和S4为依次通过化学键相连接的基因片段,p表示5’端进行的磷酸化修饰;S1为第一茎部;S2为环部;S3为第二茎部,其含有1个脱氧尿嘧啶dU;S1的5’→3’序列与S3的3’→5’序列互补;S4为引导部(N)m,其中,N选自A、T、G和C碱基中的任一种,且(N)m中的N相同或不同,m为10;SpC3表示3’端进行的C3间隔修饰。
本发明dU5’衔接子中3’端的引导部(N)m的设计和C3间隔修饰能够实现dU5’衔接子在与cDNA核酸样品连接过程中能够降低非特异性结合,阻止和避免自齐聚,提高连接效率。3’端的C3间隔修饰及5’端的磷酸化修饰均为本领域常规的修饰方式。
上述的dU5’衔接子中,优选地,所述S1具有如下所示核苷酸序列:
5’-AGATCGGAAGAGC-3’(SEQ ID NO:1)。
上述的dU5’衔接子中,优选地,所述S2具有如下所示核苷酸序列:
5’-GTCGTGTA-3’。
上述的dU5’衔接子中,优选地,所述S3具有如下所示核苷酸序列:
5’-GC/dU/CTTCCGATCT-3’(SEQ ID NO:2)。
本发明的dU5’衔接子具有SEQ ID NO:3所示核苷酸序列。
SEQ ID NO:3如下所示:
5’-/5Phos/-AGATCGGAAGAGCGTCGTGTAGC/dU/CTTCCGATCTNNNNNNNNNN-/3SpC3/-3’。
在dU5’衔接子的设计过程中,申请人分析原有的5’衔接子具有特殊的茎环结构,在后续的PCR扩增过程中可能阻碍了正向引物结合的效率,从而降低了PCR的扩增效率,因此,申请人创造性地在保证正向引物结合最大化的前提下取其临近的位置作了T-dU的置换,使得dU的插入位置为自5’端起的第24位,此插入位更有利于后续PCR正向引物进行配对,且将其互补配对部分保留完整,有利于正向引物与模板的结合,能够有效减少接头-引物二聚体的形成,降低反应所需的循环数,从而提高PCR的扩增效率,从而提高文库的质量。
另一方面,本发明还提供上述dU5’衔接子在构建cDNA文库中的应用。
由于5’衔接子连接步骤广泛存在于其他RNA高通量测序的文库构建过程中,因此,此项研究除了适用于rG4-seq技术,亦可适用于其他基于二代测序的DNA和RNA的研究中,为构建广泛的生物应用cDNA文库提供一个新的重要平台。
再一方面,本发明还提供一种基于RNA-G四链体测序文库构建方法改进的cDNA文库的构建方法,其改进部分包括如下步骤:
将带有3’衔接子的cDNA核酸样品与dU5’衔接子混合后进行连接反应,得到dU5’衔接子-cDNA核酸复合物,并进行柱纯化;
对纯化后的dU5’衔接子-cDNA核酸复合物中的脱氧尿嘧啶进行裂解,形成末端部分互补的衔接子-核酸复合物;通过柱纯化去除裂解后的残余衔接子片段;
以末端部分互补的衔接子-核酸复合物为模板,采用特异性结合的正向引物、反向引物和聚合酶进行PCR反应,扩增产物,构建得到cDNA文库。
上述的构建方法中,优选地,进行连接反应采用的为快速连接试剂盒NEB M2200L。
上述的构建方法中,优选地,进行裂解的具体过程包括:向纯化后的dU5’衔接子-cDNA核酸复合物中加入USER II酶(NEB M5508S)、缓冲液,裂解脱氧尿嘧啶。
其中,缓冲液可以包括CutSmart buffer(CS,NEB B7204S)、Quick ligationbuffer(QL)等;聚乙二醇可以包括聚乙二醇PEG 6000等。
上述的构建方法中,优选地,PCR反应过程中,所述聚合酶包括KAPA HiFi热启动高保真聚合酶(Roche KK2601)。
上述的构建方法中,优选地,所述带有3’衔接子的cDNA核酸样品具有SEQ ID NO:4所示核苷酸序列。
SEQ ID NO:4如下所示:
5’-CAGACGTGTGCTCTTCCGATCT(N)40-3’。
其中,N选自A、T、G和C碱基中的任一种,(N)40中的N相同或不同。
上述的构建方法中,优选地,所述正向引物具有SEQ ID NO:5所示核苷酸序列;所述反向引物具有SEQ ID NO:6所示核苷酸序列。
SEQ ID NO:5如下所示:
5’-AATGATACGGCGACCACCGAGATCTACACTACACGACGCTCTTCCGATCT-3’。
SEQ ID NO:6如下所示:
5’-CAAGCAGAAGACGGCATACGAGAT-(6nt index序列)-GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCT-3’。
SEQ ID NO:6序列为Illumina测序平台Truseq Kit里通用的测序引物序列;其中,“6nt index序列”为通用的特定index,以便于区分测序过程中不同的样本,该特定index序列为本领域公知。
上述的构建方法中,优选地,所述USER II酶进行裂解的时间为15min。
上述的构建方法中,优选地,所述带有3’衔接子的cDNA核酸样品与所述dU5’衔接子的摩尔比为1:10。
再一方面,本发明还提供一种cDNA文库,其是由上述构建方法构建获得。
本发明的dU5’衔接子能够减少接头-引物二聚体的形成,提高PCR扩增效率,减少PCR循环周期数,提高库质量,从而在后续的NGS数据分析过程,提高有效分析数据,降低成本;为构建广泛的生物应用cDNA文库提供一个新的重要平台。由于基因表达差异,对于一些表达量少的RNA样本,无法达到普通的建库样本起始量,而此方法可以降低反应的起始量,从而可以扩大RNA研究范围,尤其对低表达量的rG4测序、转录组结构测序等领域的RNA研究具有重要的意义。
附图说明
图1为本发明实施例2中dU5’衔接子构建cDNA文库的流程图。
图2为本发明实施例3中USER II酶在不同裂解时间下对裂解dU5’衔接子中脱氧尿嘧啶的裂解影响实验结果图。
图3为本发明实施例4中USER II酶在不同反应缓冲液和不同浓度聚乙二醇中对dU5’衔接子中脱氧尿嘧啶裂解效率的影响实验结果图。
图4为本发明实施例4中USER II酶在不同反应缓冲液和特定比例聚乙二醇中对于对比例2和对比例3的dU5’衔接子中脱氧尿嘧啶裂解效率的影响实验结果图。
图5为本发明实施例5中残余dU5’衔接子的去除影响优化实验结果图。
图6为本发明实施例6中模拟的cDNA样品与dU5’衔接子的连接比例的影响优化实验结果图。
图7为本发明实施例7中连接反应后进行柱纯化对USER II酶裂解率的影响实验结果图。
图8为本发明实施例8中USER II酶裂解后的柱纯化实验结果图。
图9为本发明实施例2和对比例1的PCR扩增实验对比结果图。
具体实施方式
为了对本发明的技术特征、目的和有益效果有更加清楚的理解,现对本发明的技术方案进行以下详细说明,但不能理解为对本发明的可实施范围的限定。
实施例1:
本实施例提供一种dU5’衔接子,其具备如下核苷酸序列:5’-/5Phos/-AGATCGGAAGAGCGTCGTGTAGC/dU/CTTCCGATCTNNNNNNNNNN-/3SpC3/-3’(SEQ ID NO:3)。
该dU5’衔接子为发明人特殊设计的含脱氧尿嘧啶的结构,新设计的dU5’衔接子中,dU的插入位置为自5’端起的第24位,此插入位更有利于后续PCR正向引物进行配对,且将其互补配对部分保留完整,有利于正向引物与模板的结合,能够有效减少接头-引物二聚体的形成,降低反应所需的循环数,从而提高PCR的扩增效率,从而提高文库的质量。
本实施例dU5’衔接子按照其核苷酸序列,采用商业合成的方法获得,将商业合成的dU5’衔接子核酸样品溶于超纯水得到浓度为100μM的溶液,于-20℃温度下保存。
实施例2:
本实施例提供一种改进cDNA文库的构建方法,改进部分如图1所示,其包括如下步骤:
将模拟的cDNA核酸样品(其带有3’衔接子,序列参见SEQ ID NO:4)与实施例1的dU5’衔接子混合后采用快速连接试剂盒(NEB,M2200L)进行连接反应,所述核酸样品与所述dU5’衔接子的摩尔比为1:10,反应条件为37℃,2h;得到dU5’衔接子-cDNA核酸复合物并进行柱纯化(Zymo Research,R1016);
向纯化后的dU5’衔接子-cDNA核酸复合物中加入CutSmart缓冲液(1X final)USERII酶(0.1U/μL final),裂解脱氧尿嘧啶,裂解温度为37℃,反应时间为15min,形成末端部分互补的衔接子-核酸复合物;通过柱纯化去除多余衔接子(Zymo Research,R1016);
以末端部分互补的衔接子-核酸复合物为模板,采用特异性结合的正向引物(序列参见SEQ ID NO:5)和反向引物(序列参见SEQ ID NO:6),在KAPA HiFi热启动高保真DNA聚合酶作用下进行PCR反应,扩增产物,构建得到cDNA文库。
对比例1:
本对比例提供一种基于普通的5’衔接子的核苷酸序列如下:5’-/5Phos/-AGATCGGAAGAGCGTCGTGTAGCTCTTCCGATCTNNNNNNNNNN-/SpC3/-3’(SEQ ID NO:7)。其中,将该对比例的5’衔接子与dU5’衔接子对比,对试验条件进行优化,不同之处在于将实施例2中用到的dU5’衔接子替换为该对比例1的普通5’衔接子。
对比例2:
本对比例提供一种插入dU的5’衔接子,dU在5’端第18位(Loop18)。
其中,该插入dU的5’衔接子的核苷酸序列如下:5’-/5Phos/-AGATCGGAAGAGCGTCG/dU/GTAGCTCTTCCGATCTNNNNNNNNNN-/3SpC3/-3’(SEQ ID NO:8)。
对比例3:
本对比例提供一种插入dU的5’衔接子,dU在5’端第20位(Loop20)。
其中,该插入dU的5’衔接子的核苷酸序列如下:5’-/5Phos/-AGATCGGAAGAGCGTCGTG/dU/AGCTCTTCCGATCTNNNNNNNNNN-/3SpC3/-3’(SEQ ID NO:9)。
实施例3:USER II酶裂解dU5’衔接子中脱氧尿嘧啶的裂解时间优化
本实施例考察USER II酶在不同裂解时间下对裂解dU5’衔接子中脱氧尿嘧啶的裂解影响,反应条件设置为37℃。实验结果如图2所示。
由图2可以看出:裂解率随反应时间的增加而增加,为了实现裂解率最大化,优选采用15min的裂解时间。
实施例4:USER II酶裂解dU5’衔接子中脱氧尿嘧啶过程中,反应缓冲液和聚乙二醇对裂解效率的影响优化
本实施例考察了USER II酶在不同浓度的反应缓冲液和聚乙二醇中对dU5’衔接子中脱氧尿嘧啶裂解效率的影响,其中缓冲液采用CutSmart buffer(CS)或Quick ligationbuffer(QL),聚乙二醇采用PEG 6000,质量浓度分别为7.5%、12.5%和17.5%,其中QL本身含有质量浓度为7.5%的PEG 6000。实验结果如图3和图4所示。
由图3可以看出:对于本发明设计的dU5’衔接子(参见SEQ ID NO:3),两种缓冲液的裂解率无明显差异,裂解率均为97%。三种浓度的聚乙二醇裂解率也无明显差异,分别为97%、97%和98%。
由图4可以看出:无论在CS还是QL缓冲液,USER II裂解dU Loop 18(参见SEQ IDNO:8)和dU Loop 20(参见SEQ ID NO:9)的效率为37%~68%不等,dU衔接子裂解不完全,而本发明第24位dU的设计(参见SEQ ID NO:3)的裂解率达到98%,有利于正向引物的结合最大化。实验结果表明本发明设计的dU5’衔接子优于对比例2和3的设计。
实施例5:残余dU5’衔接子的去除影响优化
为了避免转移污染和减少接头-引物二聚体的产生,在进行PCR扩增之前,需要去掉多余的衔接子。本实施例考察采用CS缓冲液和QL缓冲液中不同质量浓度的PEG6000及USER II处理后的柱纯化去除策略,并与未进行柱纯化去除进行比较,判断纯化效率是否受缓冲液种类与PEG 6000浓度的影响。实验结果如图5所示。
由图5可以看出:通过柱纯化能够有效去除残余的dU5’衔接子,反应条件不受两种缓冲液类型和PEG 6000的浓度影响。
实施例6:模拟的cDNA核酸样品与dU5’衔接子的连接比例的影响优化
采用商业合成的方法合成带有3’衔接子模拟的cDNA核酸样品(66nt DNA),包括40个随机核苷酸和22nt的3’衔接子序列(N40+22)来模拟真实文库中的cDNA模板(参见SEQ IDNO:4)。测试了(N40+22)cDNA模版与dU5’衔接子的摩尔比例为1:1、1:2.5、1:5和1:10的ssDNA(dU5’衔接子-cDNA核酸复合物)的连接产率,实验结果如图6所示。
由图6可以看出,当(N40+22)cDNA模版与dU5’衔接子的摩尔比例为1:10时,ssDNA的连接产率高达90%。
实施例7:连接反应后进行柱纯化对USER II酶裂解率的影响
dU5’衔接子与核酸样品进行连接反应后,需进行下一步的USER II酶裂解。为了研究连接过程的反应环境对接下来的USER II酶裂解的影响,在进行USER II酶裂解之前,采用柱纯化去除连接过程中产物之外的物质,比较其与连接反应之后直接进行USER II酶裂解的效率。实验结果如图7所示。
由图7可以看出:连接反应后进行了柱纯化,USER II酶裂解率达到88±1%,而连接反应后未进行柱纯化,USER II酶裂解率仅为24±1%。由此可以看出,连接反应后进行柱纯化有助于提高USER II酶裂解率。基于以上结果,对于纯化后续的USER II裂解过程,我们最终采用CS缓冲液即可,无需添加聚乙二醇,此优选既可以节省试剂,又可以节约成本。
实施例8:USER II酶裂解后的柱纯化
在经过了USER II酶裂解后,由于残留的接头-引物二聚体和非特异性产物的形成会影响PCR扩增,进而降低目标产物的生成。因此,在USER II酶裂解后进行柱纯化,以去除多余的dU5’衔接子裂解产物,实验结果如图8所示。
由图8可以看出:在USER II酶裂解后进行柱纯化可以去除91±1%的dU5’衔接子裂解产物。
实施例9:PCR扩增实验对比
以实施例2所述的分别带有本发明设计的dU5’衔接子(参见SEQ ID NO:3)和对比例1普通5’衔接子(参见SEQ ID NO:7)的末端部分互补的衔接子-核酸复合物为模版,进行PCR扩增构建cDNA文库的实验结果进行对比。实验结果如图9所示。
由图9可以看出:采用本发明的dU5’衔接子,在PCR循环数4、6、8、10、12和14中,所得PCR产物的相对产率分别为1.1、1.1、1.3、1.4、1.1和1.1,其PCR产物的产率均要高于采用普通的5’衔接子。具体为:在PCR循环数为4和6时,由于PCR扩增的初始产物有限,因此,本发明的dU5’衔接子与对比例1的普通5’衔接子的PCR产物的产率相似;而在PCR循环数为8和10时,本发明的PCR产物产率为对比例1的普通5’衔接子的1.3~1.4倍,扩增效率明显高于普通5’衔接子的扩增效率;此外,在PCR循环数为12和14时,PCR产物已经开始出现过度扩增现象,产物长度增加,但产率仍然高于对比例1的普通5’衔接子,是其1.1倍。
由此表明,在同等循环数的扩增前提下,本发明经过特殊设计的含脱氧尿嘧啶的dU5’衔接子相比对比例1的普通5’衔接子而言,PCR效率明显提升。
序列表
<110> 香港城市大学深圳研究院
<120> 一种dU5'衔接子及其应用和构建的cDNA文库
<130> GAI20CN7028
<160> 9
<170> PatentIn version 3.5
<210> 1
<211> 13
<212> DNA
<213> Artificial Sequence
<220>
<223> 第一茎部
<400> 1
agatcggaag agc 13
<210> 2
<211> 13
<212> DNA
<213> Artificial Sequence
<220>
<223> 第二茎部
<220>
<221> misc_feature
<222> (3)..(3)
<223> n=dU
<400> 2
gcncttccga tct 13
<210> 3
<211> 44
<212> DNA
<213> Artificial Sequence
<220>
<223> dU5'衔接子
<220>
<221> misc_feature
<222> (1)..(1)
<223> n=a且磷酸化修饰
<220>
<221> misc_feature
<222> (24)..(24)
<223> n=dU
<220>
<221> misc_feature
<222> (35)..(43)
<223> n=a或g或c或t
<220>
<221> misc_feature
<222> (44)..(44)
<223> n=a或g或c或t且C3间隔修饰
<400> 3
ngatcggaag agcgtcgtgt agcncttccg atctnnnnnn nnnn 44
<210> 4
<211> 62
<212> DNA
<213> Artificial Sequence
<220>
<223> 带有3'衔接子的cDNA核酸
<220>
<221> misc_feature
<222> (23)..(62)
<223> n=a或g或c或t
<400> 4
cagacgtgtg ctcttccgat ctnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 60
nn 62
<210> 5
<211> 50
<212> DNA
<213> Artificial Sequence
<220>
<223> 引物
<400> 5
aatgatacgg cgaccaccga gatctacact acacgacgct cttccgatct 50
<210> 6
<211> 64
<212> DNA
<213> Artificial Sequence
<220>
<223> 人工序列
<220>
<221> misc_feature
<222> (25)..(30)
<223> 25~30的6个n为6nt index序列
<400> 6
caagcagaag acggcatacg agatnnnnnn gtgactggag ttcagacgtg tgctcttccg 60
atct 64
<210> 7
<211> 44
<212> DNA
<213> Artificial Sequence
<220>
<223> 普通的5'衔接子
<220>
<221> misc_feature
<222> (1)..(1)
<223> n=a且磷酸化修饰
<220>
<221> misc_feature
<222> (35)..(43)
<223> n=a或g或c或t
<220>
<221> misc_feature
<222> (44)..(44)
<223> n=a或g或c或t且C3间隔修饰
<400> 7
ngatcggaag agcgtcgtgt agctcttccg atctnnnnnn nnnn 44
<210> 8
<211> 44
<212> DNA
<213> Artificial Sequence
<220>
<223> Loop18的dU5'衔接子
<220>
<221> misc_feature
<222> (1)..(1)
<223> n=a且磷酸化修饰
<220>
<221> misc_feature
<222> (18)..(18)
<223> n=dU
<220>
<221> misc_feature
<222> (35)..(43)
<223> n=a或g或c或t
<220>
<221> misc_feature
<222> (44)..(44)
<223> n=a或g或c或t且C3间隔修饰
<400> 8
ngatcggaag agcgtcgngt agctcttccg atctnnnnnn nnnn 44
<210> 9
<211> 44
<212> DNA
<213> Artificial Sequence
<220>
<223> Loop20的dU5'衔接子
<220>
<221> misc_feature
<222> (1)..(1)
<223> n=a且磷酸化修饰
<220>
<221> misc_feature
<222> (20)..(20)
<223> n=dU
<220>
<221> misc_feature
<222> (35)..(43)
<223> n=a或g或c或t
<220>
<221> misc_feature
<222> (44)..(44)
<223> n=a或g或c或t且C3间隔修饰
<400> 9
ngatcggaag agcgtcgtgn agctcttccg atctnnnnnn nnnn 44
Claims (10)
1.一种dU5’衔接子,该dU5’衔接子具有如下式(I)所示的结构:
5’-p-S1-S2-S3-S4-SpC3-3’ (I)
其中,S1、S2、S3和S4为依次通过化学键相连接的基因片段,p表示5’端进行的磷酸化修饰;S1为第一茎部;S2为环部;S3为第二茎部,其含有1个脱氧尿嘧啶dU;S1的5’→3’序列与S3的3’→5’序列互补;S4为引导部(N)m,其中,N选自A、T、G和C碱基中的任一种,且(N)m中的N相同或不同,m为10;SpC3表示3’端进行的C3间隔修饰。
2.根据权利要求1所述的dU5’衔接子,其中,
所述S1具有如下所示核苷酸序列:
5’-AGATCGGAAGAGC-3’(SEQ ID NO:1);
所述S2具有如下所示核苷酸序列:
5’-GTCGTGTA-3’;
所述S3具有如下所示核苷酸序列:
5’-GC/dU/CTTCCGATCT-3’(SEQ ID NO:2)。
3.根据权利要求1或2所述的dU5’衔接子,其中,所述dU5’衔接子具有SEQ ID NO:3所示核苷酸序列。
4.权利要求1~3任一项所述的dU5’衔接子在构建cDNA文库中的应用。
5.一种cDNA文库的构建方法,其包括如下步骤:
将带有3’衔接子的cDNA核酸样品与权利要求1~3任一项所述dU5’衔接子混合后进行连接反应,得到dU5’衔接子-cDNA核酸复合物,并进行柱纯化;
对纯化后的dU5’衔接子-cDNA核酸复合物中的脱氧尿嘧啶进行裂解,形成末端部分互补的衔接子-核酸复合物;通过柱纯化去除裂解后的残余衔接子片段;
以末端部分互补的衔接子-核酸复合物为模板,采用特异性结合的正向引物、反向引物和聚合酶进行PCR反应,扩增产物,构建得到cDNA文库。
6.根据权利要求5所述的构建方法,其中,进行连接反应采用的为快速连接试剂盒NEBM2200L;
优选地,进行裂解的具体过程包括:向纯化后的dU5’衔接子-cDNA核酸复合物中加入USER II酶、缓冲液,裂解脱氧尿嘧啶;
优选地,PCR反应过程中,所述聚合酶包括KAPA HiFi热启动高保真聚合酶。
7.根据权利要求5所述的构建方法,其中,所述带有3’衔接子的cDNA核酸样品具有SEQID NO:4所示核苷酸序列;
优选地,所述正向引物具有SEQ ID NO:5所示核苷酸序列;所述反向引物具有SEQ IDNO:6所示核苷酸序列。
8.根据权利要求6所述的构建方法,其中,所述USER II酶进行裂解的时间为15min。
9.根据权利要求5所述的构建方法,其中,所述带有3’衔接子的cDNA核酸样品与所述dU5’衔接子的摩尔比为1:10。
10.一种cDNA文库,其是由权利要求5~9任一项所述的构建方法构建获得。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110037475.8A CN114763546B (zh) | 2021-01-12 | 2021-01-12 | 一种dU5`衔接子及其应用和构建的cDNA文库 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110037475.8A CN114763546B (zh) | 2021-01-12 | 2021-01-12 | 一种dU5`衔接子及其应用和构建的cDNA文库 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114763546A true CN114763546A (zh) | 2022-07-19 |
CN114763546B CN114763546B (zh) | 2024-04-12 |
Family
ID=82364031
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110037475.8A Active CN114763546B (zh) | 2021-01-12 | 2021-01-12 | 一种dU5`衔接子及其应用和构建的cDNA文库 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114763546B (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20180041331A (ko) * | 2016-10-14 | 2018-04-24 | 김성천 | 분자결합핵산 선정과 표적분자 동정 방법 및 키드, 그리고 그들의 용도 |
CN108699554A (zh) * | 2016-05-27 | 2018-10-23 | 深圳市海普洛斯生物科技有限公司 | 一种适用于超微量dna测序的接头及其应用 |
CN110734908A (zh) * | 2019-11-15 | 2020-01-31 | 福州福瑞医学检验实验室有限公司 | 高通量测序文库的构建方法以及用于文库构建的试剂盒 |
CN111849965A (zh) * | 2019-04-26 | 2020-10-30 | 新英格兰生物实验室公司 | 用于减少偏向性的多核苷酸衔接子设计 |
CN111936635A (zh) * | 2018-03-02 | 2020-11-13 | 豪夫迈·罗氏有限公司 | 用于单分子测序的单链环状dna模板的产生 |
-
2021
- 2021-01-12 CN CN202110037475.8A patent/CN114763546B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108699554A (zh) * | 2016-05-27 | 2018-10-23 | 深圳市海普洛斯生物科技有限公司 | 一种适用于超微量dna测序的接头及其应用 |
KR20180041331A (ko) * | 2016-10-14 | 2018-04-24 | 김성천 | 분자결합핵산 선정과 표적분자 동정 방법 및 키드, 그리고 그들의 용도 |
CN111936635A (zh) * | 2018-03-02 | 2020-11-13 | 豪夫迈·罗氏有限公司 | 用于单分子测序的单链环状dna模板的产生 |
CN111849965A (zh) * | 2019-04-26 | 2020-10-30 | 新英格兰生物实验室公司 | 用于减少偏向性的多核苷酸衔接子设计 |
CN110734908A (zh) * | 2019-11-15 | 2020-01-31 | 福州福瑞医学检验实验室有限公司 | 高通量测序文库的构建方法以及用于文库构建的试剂盒 |
Non-Patent Citations (2)
Title |
---|
JIEYU ZHAO等: "Enhanced transcriptome-wide RNA G-quardruplex sequencing for low RNA input samples with rG4-seq 2.0", BMC * |
唐彦表: "基于Galaxy平台及miRspring的测序数据分析技术研究", 中国优秀硕士学位论文全文数据库 基础科学辑 * |
Also Published As
Publication number | Publication date |
---|---|
CN114763546B (zh) | 2024-04-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Van Dijk et al. | Library preparation methods for next-generation sequencing: tone down the bias | |
CN110734908B (zh) | 高通量测序文库的构建方法以及用于文库构建的试剂盒 | |
US11248262B2 (en) | Method for generating a RNA-sequencing library | |
EP3388519B1 (en) | Vesicular adaptor and uses thereof in nucleic acid library construction and sequencing | |
EP3215618B1 (en) | Transposase compositions for reduction of insertion bias | |
JP6894501B2 (ja) | 等温核酸自己増幅法 | |
CN115181783A (zh) | 胞嘧啶修饰的免亚硫酸氢盐的碱基分辨率鉴定 | |
EP3907296A1 (en) | Gene target region enrichment method and kit | |
CN112795620A (zh) | 双链核酸环化方法、甲基化测序文库构建方法和试剂盒 | |
US12065684B2 (en) | Demand synthesis of polynucleotide sequences | |
CN105463066B (zh) | 一种dna扩增方法 | |
WO2022156823A1 (zh) | 一种优化的dna线性扩增方法及试剂盒 | |
CN112176031A (zh) | 一种去核糖体rna测序文库的构建方法及试剂盒 | |
CN104531874B (zh) | Egfr基因突变检测方法及试剂盒 | |
CN111549025B (zh) | 链置换引物和细胞转录组文库构建方法 | |
CN108166069A (zh) | 一种新型甲基化建库方法及其应用 | |
Xu et al. | TGIRT-seq protocol for the comprehensive profiling of coding and non-coding RNA biotypes in cellular, extracellular vesicle, and plasma RNAs | |
CN108624666B (zh) | 用于构建测序文库的接头核酸分子 | |
CN107488655A (zh) | 测序文库构建中5’和3’接头连接副产物的去除方法 | |
CN111020711A (zh) | 一种带有分子标签的单链建库方法和接头组合、试剂盒 | |
CN114763546B (zh) | 一种dU5`衔接子及其应用和构建的cDNA文库 | |
CN113201793A (zh) | 一种rna文库的构建方法及试剂盒 | |
CN116254320A (zh) | 平末端双链接头元件、试剂盒及平末端建库方法 | |
JP2020096564A (ja) | Rna検出方法、rna検出用核酸及びrna検出用キット | |
CN112359090A (zh) | 一种核酸片段的连接方法、测序文库的构建方法及其应用 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |