CN114507904A

CN114507904A - 一种制备二代测序文库的方法

Info

Publication number: CN114507904A
Application number: CN202210406974.4A
Authority: CN
Inventors: 彭琼芳; 王亚蕾; 刘敏; 潘伟业; 孙阳
Original assignee: Beijing Xunzhi Biotechnology Co ltd; Zhejiang Xunzhi Biotechnology Co ltd; Beijing Xunzhi Technology Co ltd
Current assignee: Beijing Xunzhi Biotechnology Co ltd; Zhejiang Xunzhi Biotechnology Co ltd; Beijing Xunzhi Technology Co ltd
Priority date: 2022-04-19
Filing date: 2022-04-19
Publication date: 2022-05-17
Anticipated expiration: 2042-04-19
Also published as: CN114507904B

Abstract

本发明公开了一种制备二代测序文库的方法，属于包含酶、核酸或微生物的测定方法领域。本发明所要解决的技术问题是如何提高制备二代测序文库的建库效率。本发明所提供的制备二代测序文库的方法包括将DNA分子进行连接接头的连接反应得到连接产物，获得二代测序文库；所述连接反应在含有小分子PEG的连接缓冲液中进行；所述小分子PEG为PEG200至PEG1000中任一种或几种。本发明的方法使用PEG600对测序文库制备过程中的连接反应效率有超过20%的显著提升，并可缩短测序接头的连接时间，可使连接产物不需要纯化直接进行文库扩增，使包含PCR扩增步骤的整体建库流程时间缩短至60分钟。

Description

一种制备二代测序文库的方法

技术领域

本发明涉及包含酶、核酸或微生物的测定方法领域中一种制备二代测序文库的方法。

背景技术

第二代测序（the Next Generation Sequencing）技术是目前主流的高通量测序技术，其中以使用SBS及其相关技术的Illumina测序平台为代表。与一代测序和三代测序相比，其测序通量高，速度快，单碱基准确性高，应用开发广泛，文库制备高效而易于自动化，已经成为科研及临床诊断中较为常用的序列信息获取手段。高通量测序通量提升的最主要手段在于使DNA分子带上通用测序接头，使序列信号可以同时在测序接头附近起始或扩增，再通过高通量的光或电信号检测手段进行平行检测从而缩短测序时间。而其中，DNA双链双端测序接头文库由于其信号平行扩增的便捷性，在高灵敏度检测中几乎是必不可少的手段。最经典的双链双端接头测序文库制备方法包括转座酶法、PCR法和连接酶法，分别是通过Tn5转座酶、DNA聚合酶或者DNA连接酶，把双链测序接头加到待测序的DNA分子两端，使带上测序接头的文库分子可以顺利在测序芯片上进行进一步的扩增。而以上提及的技术中，连接酶法以其均一性好，转化效率高，通用性强的特点，在科研和诊断中应用最为广泛。连接酶法的反应步骤通常为：a.DNA片段化；b.末端修复；c.加A尾；d.连接接头；e.扩增及加index序列。基于反应前DNA片段的不同形态，如已经片段化过的片段，或者起始投入量已经足够测序使用，步骤a.DNA片段化或e.扩增及加index序列会变得不必要进行而被跳过以免引发过度反应（如DNA碎片化过度或者扩增过度）。在连接酶法建立的初期，各步反应适用的酶不同，各步骤间都是独立进行的，步骤间都需要加入一步纯化，用以避免酶活力和缓冲体系之间的冲突以及各种副产物对酶反应效率的损害，而每加入一次纯化对DNA的得率都有不少的损失，费时费力的同时，导致整体文库质量和产量的下降。后经过其它研究者的不断努力改良，使b至c至d三步得以连续进行而中间不需要纯化操作。本发明的申请人之前的自主研发，已开发出一套通用缓冲体系（中国发明专利申请号CN201711486034.6、CN202011289430.1、CN201911353781.1、CN201910740285.5和CN201911353778.X），能进一步把a至b整合进体系中，同时在d步也能取得高效的文库转化率。

在此前技术中，涉及的组分繁多，以及d至e步骤仍然需要进行纯化操作，核心的问题在于连接体系中的添加剂，过多的PEG、盐离子、接头等对PCR反应的抑制。在市面上，有少量的产品（例Celero EZ™ DNA-Seq）对此作出了针对性改善，但改善了操作友好度的同时，由于去掉了c.加A尾的步骤，带来了文库转化效率的显著牺牲。

在d.连接接头步骤所使用的连接缓冲液中常用到分子拥挤剂，分子拥挤剂作为一种水分子争夺剂，能够通过限制游离水分子的活动来限制核酸和蛋白在溶液中的热运动，影响核酸和蛋白的结构，以提高两个核酸片段之间的碰撞效率，从而提高连接反应的效率。在目前二代测序建库所用到的拥挤剂，由于其对核酸的脱水凝聚作用，常会使得核酸通过碱基堆积力形成更高级的三级结构，导致核酸末端的内吞，影响核酸末端的反应效率。例如，常用在连接缓冲液中的分子拥挤剂PEG8000，PEG6000，PEG4000有研究表明会促进DNA分子形成凝珠状，而在建库过程中则是需要核酸分子充分的线性展开进行双端的连接。聚乙二醇系列衍生物中越大分子量的PEG，越容易使核酸形成凝聚；而越小的分子量的PEG浸润效应越强，过高的浸润作用会破坏核酸双链的结构，使核酸双链在稍微剧烈的物理或化学刺激下迅速解链，对后续反应可能造成不可挽回的影响。

发明内容

本发明所要解决的技术问题是如何提高制备二代测序文库的建库效率和/或如何高效制备二代测序文库和/或如何优化二代测序文库的制备流程和/或如何降低二代测序文库的建库时间和/或建库成本。

为了解决上述技术问题，本发明首先提供了制备二代测序文库的方法。所述方法可包括将待测DNA分子进行连接接头的连接反应，得到连接产物，获得二代测序文库；所述连接反应在含有小分子的PEG的连接缓冲液中进行，所述小分子PEG为PEG200至PEG1000中任一种或几种。所述小分子PEG为平均分子量为200-1000的聚乙二醇。

上述方法中，所述PEG200至PEG1000可为PEG200、PEG300、PEG400、PEG500、PEG600、PEG800和/或PEG1000。所述几种可为两种、三种、四种或五种或六种或七种。所述小分子PEG具体可为PEG600和/或PEG400。所述小分子PEG还可为以PEG200至PEG1000为骨架的衍生物，例如NH₂-基团修饰的PEG等。具体可为NH₂-基团修饰的PEG600和/或PEG400。

上述方法中，所述待测DNA分子可为片段化的DNA片段。

上述方法中，所述连接缓冲液中所述小分子PEG的体积百分含量（v/v）可为7.5%～20%。所述体积百分含量（v/v）具体可为15%。

上述方法中，所述连接反应可为通过连接酶进行连接。所述连接反应的时间可为小于或等于10min。

上述方法中，所述接头包括正向接头和反向接头，所述方法包括对所述连接产物进行PCR扩增的步骤；所述正向接头含有测序平台序列（即所述正向接头可为长接头），所述测序平台序列位于所述正向接头的5'端；所述PCR扩增采用的正向引物也含有所述测序平台序列，所述测序平台序列位于所述正向引物的5'端。所述正向接头与所述正向引物含有相同的所述测序平台序列（即所述正向接头与所述正向引物的5’端具有相同的序列）。

上述方法中，所述测序平台序列可根据测序平台进行选择。

上述方法中，所述接头的序列可含有测序引物序列。所述测序引物可用于在测序过程中结合到待测核苷酸序列上进行测序。所述接头的序列也可含有Index序列或Barcode序列。

上述方法中，所述测序平台序列可含有与测序引物结合的核苷酸序列用于通用扩增。

上述方法中，所述测序平台可为Illumina测序平台。所述测序平台序列可为P5序列。所述接头的正向接头和反向接头可互补配对形成“Y”型结构。

上述方法中，所述测序平台序列也可为P7序列的互补序列。

上述方法中，所述测序平台序列可为序列表中序列3的第1-25位核苷酸，所述测序引物序列可为序列表中序列3的第26-58位核苷酸。

上述方法中，所述连接产物在进行PCR扩增前可不进行纯化。

上述方法中，所述方法可由以下步骤组成。

上述方法中，所述方法可由以下步骤组成：b.将所述待测DNA分子进行末端修复，得到末端修复的DNA；c.对所述末端修复的DNA进行加A尾，得到加A尾的DNA；d.将所述加A尾的DNA在所述连接缓冲液中连接所述接头，得到带接头的DNA；e.将所述带接头的DNA进行所述PCR扩增，得到PCR产物；f.将所述PCR产物进行纯化，得到二代测序文库。

上述方法中，所述b中的所述待测DNA分子可为进行片段化的DNA分子，所述b包括将所述待测DNA分子先进行DNA片段化后再进行末端修复。

上述方法中，所述b的反应时间可为10min，所述c的反应时间可为10min，所述d的反应时间可为10min，所述e的反应时间可为10min，所述f的反应时间可为20min。所述方法的总反应时间可小于或等于60min。

为了解决上述技术问题，本发明还提供了上述小分子PEG的用途。所述用途可为上述小分子PEG在二代测序文库的构建中用于连接接头。

为了解决上述技术问题，本发明还提供了上述小分子PEG在制备用于二代测序文库中连接接头的组合物中的应用。

为了解决上述技术问题，本发明还提供了含有上述小分子PEG的二代测序文库连接缓冲液。

所述连接缓冲液的pH可为8.0，所述连接缓冲液由溶剂和溶质组成，所述溶剂为水，所述溶质为：33mM Tris-HCl（pH 8.0），1.6mM MgCl₂和体积百分含量为7.5%-20%（如7.5%、10%、12.5%、15%或20%）的上述小分子PEG。

上文所述连接缓冲液中，所述小分子PEG（分子拥挤剂）可通过限制缓冲液中游离水分子的活动来影响核酸的结构。为了解决上述技术问题，本发明还提供了用于二代测序文库中连接接头的组合物。所述组合物的溶质可含有上述小分子PEG。所述组合物的溶剂可为水。

本发明主要解决了d.连接接头步骤中用到的PEG、盐离子、接头等添加剂对a.DNA片段化、b.末端修复、c.加A尾和e.扩增这几个步骤的负面干扰和抑制作用，在确保同等甚至更高的转化效率的同时，使反应能更流畅地进行，并能缩减d至e切换所需要的纯化步骤，进一步减少文库的损失和制备所需要的时间。

本发明实施例中筛选的小分子PEG（PEG600或PEG400）能插进DNA分子二级和三级结构内，使DNA分子在溶液中呈棒状展开，在对DNA构象的作用形成的同时，其拥挤效应又能保证蛋白在上面的结合时间，这样的展开有利于蛋白在核酸双链上面进行充分的一维扩散，使聚合酶、连接酶、磷酸激酶等与核酸作用的蛋白无论是在核酸双链内部还是在末端，无论核酸的序列组成如何，都具有相对公平和均一的作用空间，能提高整体反应的均一性、速度和完整性。

本发明的有益效果在于。

1.PEG600对PEG4000或PEG 6000的替代对文库构建中连接反应效率有超过20%的显著提升，并加快了反应速度。

2.PEG600或PEG400的加入对PCR基本没有抑制，通过进一步对接头结构的优化（使用正向接头长接头）和缓冲液整体盐离子浓度的调整，可以做到连接后不需要进行进一步的纯化才能进行文库扩增。缩减了反应步骤的同时，降低了文库构建时间和成本，提高了文库回收率。使包含PCR扩增步骤的整体流程时间缩短至60min。

3.更有利于和微流控芯片体系结合，有可能使基于连接方法的整体流程时间缩短至30min内；加上扩增的时间10min，扩增后一步纯化时间20min；使整个建库流程时间缩短至1h。

附图说明

图1为含不同PEG的连接缓冲液连接效率及文库产量对比图。

图2为PEG600的连接缓冲液加快连接速度。

图3为基于PEG600的连接缓冲液（SynplSeq）建库效率高于基于PEG6000的连接缓冲液（KAPAHyper）。

图4为不同的PEG分子对文库扩增产量的影响。

图5为PEG600不影响文库扩增片段分布。横坐标为DNA长度，单位bp，纵坐标为荧光值RFU。

图6为添加PEG600或PEG400的测序文库建库扩增效率结果。A为添加PEG600的扩增效率结果；B为添加PEG400的扩增效率结果。

图7为添加PEG600后KOD Multi&Epi文库扩增效率结果比较。

图8为短接头连接后直接扩增产物示意图。上图为短接头扩增过程及产物结构示意图；下图为短接头扩增产物的毛细管电泳图，横坐标为DNA长度，单位bp，纵坐标为荧光值RFU。

图9为长接头连接后直接扩增产物示意图。上图为长接头扩增过程及产物结构示意图；下图为长接头扩增产物的毛细管电泳图，横坐标为DNA长度，单位bp，纵坐标为荧光值RFU。

图10为长短接头连接后直接扩增产物示意图。上图为长短接头扩增过程及产物结构示意图；下图为长短接头扩增产物的毛细管电泳图，横坐标为DNA长度，单位bp，纵坐标为荧光值RFU。

图11为不纯化扩增文库制备流程建库效率高于普通的纯化扩增流程。图A为纯化与不纯化扩增文库制备流程所得文库浓度对比；图B为接头纯化扩增文库毛细管电泳图，横坐标为DNA长度，单位bp，纵坐标为荧光值RFU；图C为接头不纯化扩增文库毛细管电泳图，横坐标为DNA长度，单位bp，纵坐标为荧光值RFU。

图12为文库峰图。上图为使用本发明中建立的高效二代测序文库制备方法得到的文库峰图；下图为常规建库方法得到的文库峰图。横坐标为DNA长度，单位bp，纵坐标为荧光值RFU。

图13为连接效率检测毛细管电泳图。上图为实验组连接效率检测毛细管电泳图；下图为不加连接酶对照组连接效率检测毛细管电泳图。横坐标为DNA长度，单位bp，纵坐标为荧光值RFU。

图14为常规建库方法与本发明建立的高效二代测序文库制备方法建库流程对比图。

图15为设计的适用于Illumina测序平台的三种连接接头组的序列。

具体实施方式

下面结合具体实施方式对本发明进行进一步的详细描述，给出的实施例仅为了阐明本发明，而不是为了限制本发明的范围。以下提供的实施例可作为本技术领域普通技术人员进行进一步改进的指南，并不以任何方式构成对本发明的限制。

下述实施例中的实验方法，如无特殊说明，均为常规方法，按照本领域内的文献所描述的技术或条件或者按照产品说明书进行。下述实施例中所用的材料、试剂等，如无特殊说明，均可从商业途径得到。

本发明中连接效率的计算方式如下。

每个测试条件设置实验组和不加连接酶对照组，连接产物纯化回收后Qsep1检测峰图（图13），导出每个条带的摩尔浓度。

底物转换率A = 1 - 实验组底物浓度/对照底物浓度。

双端/单端比例B = 双端连接产物浓度/单端连接产物浓度。

连接效率=A×B/（1+B）。

本发明实施例中试剂来源如下。

Adapter-S：VAHTS Multiplex Oligos Set 4/5 for Illumina，货号：N321。

KAPA HIFI Mix：Roche，KAPA HiFi HotStart ReadyMix PCR Kit（6.25 mL），货号：07958935001。

I5 PCR Primer和I7 PCR Primer：VAHTS Multiplex Oligos Set 4/5 forIllumina，货号：N321。

实施例1、连接缓冲液中使用PEG600提高测序建库中测序接头的连接效率。

将符合建库标准的基因组DNA样本使用塞沃尔（天津）科技有限公司的SynplSeqDNA Library Prep Kit for Illumina（货号：XS-L-002-1）试剂盒进行步骤a.片段化（可选）；b.末端修复、c.加A尾；分别使用添加不同PEG配制的连接缓冲液进行步骤d（连接测序接头），以检测不同PEG对测序接头的连接效率的影响；然后进行步骤e.PCR扩增，得到测序文库。

1.小分子PEG提高测序接头的连接效率。

在制备文库的过程中，4pmol的双链DNA（底物）经过步骤b.末端修复和步骤c.加A尾之后进行步骤d.连接测序接头的步骤。连接测序接头在含有不同PEG分子的连接缓冲液中进行。含有不同PEG分子的连接缓冲液的pH为8.0，溶剂为水，溶质为：33mM Tris-HCl(pH8.0)，1.6mM MgCl₂，不同PEG分子浓度分别为7.5%、10%、12.5%、15%或20%（体积百分含量v/v或质量体积比g/100mL）。其中PEG为7.5%或15%（体积百分含量，v/v）的PEG200，7.5%、15%或20%（v/v）的PEG400，10%、15%或20%（v/v）的PEG600，15%（v/v）的PEG1000，10%或15%（v/v）的PEG2000，或是7.5%（7.5g/100mL）、10%（10g/100mL）或12.5%（12.5g/100mL）的PEG4000或PEG6000。

连接反应体系为末端修复加A产物40μL、DNA Ligase 1μL、上述含有不同PEG分子的连接缓冲液 40μL、Adapter-S 4μL，在20℃孵育10-30min，进行连接反应。得到最优连接浓度（图1）的含有不同PEG分子（PEG200（15%v/v）、PEG400（15%v/v）、PEG600（15%v/v）、PEG1000（15%v/v）、PEG2000（15%v/v）、10%（10g/100mL）PEG4000、10%（10g/100mL）PEG6000）的连接缓冲液。其中，PEG作为分子拥挤剂，通过限制缓冲液中游离水分子的活动来影响DNA的测序接头的结构促进连接反应。

使用配制的含有不同PEG分子的连接缓冲液在加A尾的DNA末端连接Illumina测序平台的测序接头（序列为序列表中序列1和序列2）的反应，于20℃，连接30min得到连接产物；连接产物使用2×磁珠纯化回收得到纯化产物，Qsep全自动毛细管电泳仪（杭州厚泽生物有限公司，卡夹货号C105101）检测纯化产物峰图，计算使用含有不同PEG分子连接缓冲液的连接效率。

使用含有不同PEG分子连接缓冲液连接并纯化后的连接产物进行PCR扩增5个循环得到扩增产物，扩增产物使用1×磁珠（25μL VAHTS DNA Clean Beads，货号N411-02）纯化，25μL体积洗脱液进行洗脱得到不同的测序文库，使用SynplQ NGS™ dsDNA HS AssayKit（北京迅识科技有限公司，货号：XS-L-004）在Qubit_4荧光计（ThermoFisher，货号Q33238）上检测文库浓度。

PCR扩增体系为25μL：接头连接后纯化产物10 μL、I5 PCR Primer 1.25 μL、I7PCR Primer 1.25 μL、KAPA HIFI Mix 12.5 μL。I5 PCR Primer：的序列为：5’-AATGATACGGCGACCACCGAGATCTACACTATAGCCTACACTCTTTCCCTACACGACGCTCTTCCGATCT-3’（序列表中序列5），其中序列5的5’端序列即第1至25位核苷酸为P5序列。I7 PCR Primer的序列为：5’-CAAGCAGAAGACGGCATACGAGATCGAGTAATGTGACTGGAGTTCAGACGTGTGCTCTTCCGATCT-3’（序列表中序列6）。

PCR扩增程序：98℃ 45s；98℃ 10s，60℃ 30s，72℃ 30s，5个循环；72℃，1min。

如图1所示，相比于PEG4000和PEG6000，测序文库制备过程中使用含有PEG400或PEG600的连接缓冲液能显著（P≤0.0075）提高测序接头连接效率和测序文库产量。

PEG600对PEG4000或PEG6000的替代对文库制备过程中连接反应效率有超过20%的显著提升。

2.PEG600缩短测序接头的连接时间。

将符合建库标准的基因组DNA样本；使用如下试剂盒SynplSeq DNA Library PrepKit for Illumina（塞沃尔（天津）科技有限公司，货号：XS-L-002-1）进行步骤a.片段化（可选）、b.末端修复、c.加A尾；使用添加不同PEG配制的连接缓冲液进行步骤d.连接测序接头；然后进行步骤e.PCR扩增，得到测序文库。

在制备文库的过程中，4pmol的双链DNA底物经过末端修复和加A尾之后分别使用步骤1中的配制方法得到的含最优连接浓度的PEG600（15%v/v）、10%（10g/100mL）PEG4000或10%（10g/100mL）PEG6000的连接缓冲液进行20℃连接llumina测序平台的测序接头（序列为序列表中序列1和序列2）的步骤，得到连接产物。其中含PEG600的连接缓冲液分别连接10min、20min、30min，含PEG4000或PEG6000的连接缓冲液连接30min。

连接产物使用2×磁珠纯化回收得到纯化产物，使用Qsep全自动毛细管电泳仪（杭州厚泽生物有限公司，卡夹货号C105101）检测纯化产物峰图，计算使用含有不同PEG分子连接缓冲液的连接效率。

另取使用含有不同PEG分子连接缓冲液连接并纯化后的连接产物进行PCR扩增5个循环（PCR扩增体系和程序同步骤1）得到扩增产物，扩增产物使用1×磁珠纯化，25μL）体积洗脱液进行洗脱得到不同的测序文库，使用SynplQ NGS™ dsDNA HS Assay Kit（北京迅识有限公司，货号：XS-L-004）在Qubit_4荧光计（ThermoFisher，货号Q33238）上检测文库浓度。

结果如图2所示，使用含PEG600的连接缓冲液连接10min（图2中PEG600-10min）的连接效率和测序文库产量与使用含PEG4000的连接缓冲液连接30min（图2中PEG4000-30min）的连接效率和测序文库产量齐平，均高于使用含PEG6000连接缓冲液连接30min（图2中PEG6000-30min）的连接效率和测序文库产量。

因此，使用含PEG600的连接缓冲液连接10min的连接效率高于使用含PEG4000或PEG6000的连接缓冲液连接30min，即使用含PEG600的连接缓冲液相比较于含PEG4000或PEG6000的连接缓冲液可缩短连接时间，提高连接效率。

实施例2、连接缓冲液中使用PEG600提高测序文库的建库效率。

1．PEG600提高测序文库的建库效率。

使用1ng和0.1ng两种浓度的血浆游离DNA样本，分别基于SynplSeq测序文库制备试剂盒（塞沃尔（天津）科技有限公司，SynplSeq DNA Library Prep Kit for Illumina，货号：XS-L-002-1）使用含有PEG 600（15% v/v）的连接缓冲液连接测序接头制备的测序文库，同时基于KAPA测序文库制备试剂盒（KAPA HyperPlus Kit，购至Roche,货号：07962401001）使用含有10%（10g/100mL）PEG6000的连接缓冲液连接测序接头制备的测序文库，比较二者的建库效率。

末端修复加A后使用相同的接头（短接头adapter1和adapter2，图15）及接头连接浓度（0.5μM），20℃反应相同的时间（15min）后进行连接得到连接产物，将连接产物纯化（2×磁珠纯化）后得到的纯化产物使用相同的扩增体系（实施例1步骤1中的PCR扩增体系和扩增程序），扩增相同的循环数（1ng起始扩增改为13个循环，0.1ng起始扩增改为16个循环）后得到扩增产物，使用1×磁珠纯化，相同体积（25μL）洗脱液进行洗脱，Qubit检测获得的测序文库浓度。

如图3所示，结果显示，对于不同起始投入量（1ng或0.1ng，图3中1ng-13C和0.1ng-16C所示）的血浆游离DNA，与使用含PEG6000的连接缓冲液相比（图3中KAPAHyper代表），使用含PEG600连接缓冲液连接制备的测序文库（图3中SynplSeq代表）浓度更高。

2.PEG400和PEG600的加入对PCR基本没有抑制。

将符合建库标准的基因组DNA使用SynplSeq DNA Library Prep Kit forIllumina（塞沃尔（天津）科技有限公司，货号：XS-L-002-1）二代测序文库制备试剂盒，步骤包括：a.片段化、b.末端修复、c.加A尾、d.连接测序接头、e.PCR扩增，得到测序文库。

在制备文库的过程中，双链DNA底物经过末端修复加A之后使用含（15% v/v）PEG600的连接缓冲液进行20℃连接llumina测序平台的测序接头（短接头adapter1和adapter2，图15）的步骤得到连接产物并纯化（2×磁珠纯化），得到2ng接头连接纯化后的产物，分别添加不同浓度的PEG（10%（v/v）PEG200，10%（v/v）和15%（v/v）PEG400，10%（v/v）、15%（v/v）和20%（v/v）PEG600，10%（v/v）PEG1000，10%（v/v）PEG2000，10%（10g/100mL）PEG4000和10%（10g/100mL）PEG6000）进行PCR扩增，分别命名为PEG200（10%）组、PEG400（10%）组，PEG400（15%）组、PEG600（10%）组，PEG600（15%）组，PEG600（20%）组、PEG1000（10%）组、PEG2000（10%）组、PEG4000（10%）组、PEG6000（10%）组，同时设置对照组文库制备的PCR扩增不添加任何PEG，使用下述PCR扩增体系和扩增程序，PCR扩增10个循环后得到扩增产物，使用1×磁珠纯化，相同体积（25μL）洗脱液进行洗脱，Qubit检测获得的测序文库浓度。

结果如图4所示，可见PEG400（10%）组和PEG400（15%）组，PEG600（10%）组、PEG600（15%）组和PEG600（20%）组，PEG200（10%）组，PEG1000（10%）组相比较于对照组对PCR扩增得到的文库产量无抑制作用，文库片段分布无差异（图5）。

PCR扩增体系如下（KAPA HiFi HotStart ReadyMix PCR Kit 来源于Roche）：接头连接产物（1ng/μL) 2 μL，实施例1中的I5 PCR Primer 2 μL，实施例1中的I7 PCR Primer2 μL，KAPA HIFI Mix 20 μL，PEG（加入不同的PEG分子得到不同体积百分含量的PEG溶液，对照不加），加超纯水补齐至40μL。

PCR扩增程序为：98℃ 45s；98℃ 15s，60℃ 30s，72℃ 30s，10个循环；72℃，1min。

进一步将PEG400组和PEG600组以及对照组分别在PCR 扩增的第6、8、9或10个循环取样的Qubit检测扩增文库的浓度，绘制曲线如图6所示，可见PEG400（10%）组和PEG400（15%）组（图6中B的10% PEG400和15% PEG400），PEG600（10%）组、PEG600（15%）组和PEG600（20%）组（图6中A的10% PEG600、15% PEG600和20% PEG600）相比较于对照组（图6中Control）没有明显差异，因此，0%-20%的PEG400或PEG600的添加不影响文库扩增产量。

同时，本发明又选了另外一种PCR扩增体系（KOD-Multi & Epi-®,来源于TOYOBO）进行测试。具体为使用SynplSeq DNA Library Prep Kit for Illumina二代测序文库制备试剂盒，制备测序文库。结果显示不同的扩增体系下添加不同浓度的PEG600（图7中5%PEG600、7.5% PEG600和10% PEG600）相比较于对照（不添加PEG）也不影响文库的PCR扩增产量（图7）。

扩增体系为50μL：接头连接产物（1ng/μL）2 μL、实施例1中的I5 PCR Primer 2.5μL、实施例1中的I7 PCR Primer 2.5 μL、KOD -Multi & Epi 1 μL、2× PCR Buffer 25 μL、PEG600（加入不同浓度的PEG600得到不同体积比的PEG600，对照组不加PEG）、加超纯水补齐至50μL。

扩增程序为：94℃ 2min；98℃ 15s，60℃ 30s，72℃ 30s，10个循环；72℃，1min。

实施例3、高效的制备二代测序文库的方法。

1.高效制备二代测序文库的方法的建立。

1.1接头结构的筛选优化。

设计3种适用于Illumina测序平台的接头组（图15）：短接头组反向接头adapter1和正向接头adapter2（序列表中序列1和序列2）互补配对形成的“Y”型结构、长短接头组反向接头adapter1和正向接头长接头adapter2L（序列表中序列1和序列3）互补配对形成的“Y”型结构、以及长接头组adapter1L和adapter2L（序列表中序列4和序列3）互补配对形成的“Y”型结构。其中反向接头长接头adapter1L含有Illumina测序平台的P7序列的互补序列（序列表中序列4的第42至65位核苷酸），正向接头长接头adapter2L含有Illumina测序平台的P5序列（序列表中序列3的第1至25位核苷酸）。

将符合建库标准的基因组DNA样本使用SynplSeq DNA Library Prep Kit forIllumina二代测序文库制备试剂盒进行建库得到测序文库，步骤包括：b.片段化DNA末端修复、c.加A尾、d.连接测序接头、e.PCR扩增。其中，d.连接测序接头步骤分别使用设计的3种接头进行连接，连接产物不进行纯化进行步骤e.PCR扩增得到三种测序文库。

结果显示，使用短接头组进行连接后，剩余的短接头adapter2在d.连接测序接头步骤后不进行纯化去掉，会作为PCR引物参与后续的PCR扩增，导致有一端P5序列缺失的副产物出现（如图8所示），目标产物的两端需要分别携带P5序列和P7序列；而如果正向接头adapter2序列采用全长的序列结构（将adapter2替换为adapter2L）即长短接头组进行连接（图10的上图），其参与PCR扩增的产物也是含有完整P5和P7序列的目标产物，而不含有副产物（图9的下图和图10）。

所以适用于连接后不纯化而是直接扩增的连接体系其连接接头的正向接头adapter2序列应是含有Illumina测序平台序列的完整序列：即adapter2L，含有P5序列（序列表中序列3的第1至25位核苷酸），且P5序列位于正向接头adapter2L的5’端。正向接头中还含有测序引物序列（序列表中序列3的第26-58位核苷酸）。

1.2连接长接头后不进行纯化的文库回收效率高于纯化。

使用优化后的长接头组（adapter1L和adapter2L）按照步骤1.1的方法制备测序文库，d.连接测序接头步骤的条件为20℃连接30min，连接后产物分别进行纯化和不纯化操作，最后进行7个循环的扩增得到扩增产物，1×磁珠纯化扩增产物得到两种测序文库。

Qubit检测文库浓度，结果如图11所示接头连接不纯化直接扩增得到的文库浓度（图11中“不纯化+扩增”所示）显著（P=0.0016）高于接头连接后纯化得到的文库浓度（图11中“纯化+扩增”所示），且文库峰图一致，说明接头后不纯化的建库方式可行且建库效率高于接头后纯化方式，而且该接头结构下的产物没有不期待的副产物产生。

接头结构优化（即使用长接头组接头进行连接）后，连接产物直接带着连接体系进行扩增不需要纯化的一步法建库方式不仅缩减了反应步骤，同时降低了文库制备的时间和成本，提高了文库回收率。

1.3高效制备二代测序文库的方法的流程。

将符合建库标准的人基因组DNA样本使用SynplSeq DNA Library Prep Kit forIllumina二代测序文库制备试剂盒制备测序文库，步骤包括：b.片段化DNA及末端修复、c.加A尾、d.连接接头、e.PCR扩增，f.将所述PCR产物进行纯化，得到测序文库。

在制备文库的过程中，150ng人基因组DNA经过b.片段化及DNA末端修复和c.加A尾之后进行d.连接接头的步骤，于20℃连接10min得到连接产物。其中连接的接头为长接头组接头（adapter1L和adapter2L），连接缓冲液由溶剂和溶质组成，连接缓冲液的pH为8.0，溶剂为水，溶质为：33mM Tris-HCl，1.6mM MgCl₂和15%（v/v）的PEG600。

连接缓冲液中含有15%（v/v）的PEG600（作为分子拥挤剂，通过限制缓冲液中游离水分子的活动来影响DNA和接头的结构促进连接反应）。

高效二代测序文库构建的流程如下。

1.3.1片段化、末端修复、加A尾反应。

（1）在冰盒上配制15μL的反应体系如下：DNA 1 μL，片段化酶Fragmentase 0.75 μL，End Prep Mix 1.5 μL，End Prep Buffer 1 0.75 μL，用超纯水补齐15μL。

（2）吹打混匀并短暂离心，将PCR管放入PCR仪进行孵育，程序：37℃，进行步骤b.片段化及DNA末端修复10min；65℃，进行步骤c.加A尾10min；4℃，∞；（热盖设置105℃）。

（3）立即继续进行接头连接反应。

1.3.2接头连接反应。

（1）在冰盒上配制连接反应体系如下：步骤1.3.1反应产物15μL，DNA连接酶（DNALigase）0.3μL，PEG600连接缓冲液15μL，长接头组接头（adapter1L和adapter2L）0.3μL。

其中，PEG600连接缓冲液由溶剂和溶质组成，连接缓冲液的pH为8.0，溶剂为水，溶质为：33mM Tris-HCl（pH 8.0），1.6mM MgCl₂和15%（v/v）的PEG600。

PEG600连接缓冲液的配制方法如下（1mL）：1M Tris-HCl（pH 8.0）66μL，1M MgCl₂3.2μL，PEG600 300μL，加水补齐至1mL。

（2）移液器吹打15次或涡旋振荡10s充分混匀并短暂离心。

（3）PCR仪中反应20℃进行步骤d.连接接头反应，10min。

1.3.3扩增反应。

（1）配制100μL的反应体系如下：步骤1.3.2反应产物 30μL，Illumina PCR PrimerMix 5μL，KAPA HIFI Mix 50μL，超纯水 15μL。

（2）涡旋振荡5s或移液器吹打5次混匀并短暂离心。

（3）使用如下扩增程序进行步骤e.PCR扩增10min：98℃ 45s；98℃ 15s，60℃ 30s，72℃ 30s，5个循环；72℃，1min。

1.3.4扩增后纯化。

使用0.8×磁珠进行步骤f.PCR产物纯化，纯化流程参考SynplSeq DNA LibraryPrep Kit for Illumina说明书。

2.与常规测序文库制备方法的结果比较。

使用步骤1中的文库制备方法，本发明进行了快速建库法的尝试，使用150ng人基因组DNA经过如下步骤：b.将DNA进行片段化及末端修复10min得到末端修复的DNA；c.将末端修复的DNA进行加A尾10min，得到加A尾的DNA；然后进行d.连接接头反应，20℃，10min，将加A尾的DNA在连接缓冲液中连接接头（长接头组接头：adapter1L和adapter2L），得到带接头的DNA；e.将带接头的DNA（连接产物不纯化直接加入扩增酶）进行PCR扩增10min（5个循环），得到PCR产物；f.将PCR产物进行纯化，0.8×磁珠进行纯化20min，得到二代测序文库。单个文库建库总时间等于60min（图14中快速建库方法）。

相对于对照常规建库方法（参考《SynplSeq DNA Library Prep Kit forIllumina说明书》）步骤：b.片段化及末端修复10min；c.加A尾20min；d.连接接头反应30min，e.连接后纯化20min，PCR扩增10-25min；f.扩增后纯化20min得到二代测序文库，总计建库时间110min左右（图14中常规建库方法），本发明所建立的高效的制备二代测序文库的方法与常规建库方法的建库产量相当（其中本发明建立的测序文库制备方法的建库文库浓度为33.8ng/μL，常规方法建库文库浓度为30.2ng/μL），且峰图一致（图12）。

本发明建立的制备二代测序文库的方法选择PEG600作为连接缓冲液中分子拥挤剂，通过使用长接头（adapter1L和adapter2L，图15）连接后不需要进一步的纯化而是直接带着连接体系进行扩增。这种减少一步纯化的建库步骤更有利于和微流控芯片体系结合，有可能使基于连接方法的整体流程时间缩短至60min内（图14中快速建库方法）。该方法与常用文库制备方法相比，不仅缩减了反应步骤，同时降低了文库制备的时间和成本，提高了文库回收率。

以上对本发明进行了详述。对于本领域技术人员来说，在不脱离本发明的宗旨和范围，以及无需进行不必要的实验情况下，可在等同参数、浓度和条件下，在较宽范围内实施本发明。虽然本发明给出了特殊的实施例，应该理解为，可以对本发明作进一步的改进。总之，按本发明的原理，本申请欲包括任何变更、用途或对本发明的改进，包括脱离了本申请中已公开范围，而用本领域已知的常规技术进行的改变。按以下附带的权利要求的范围，可以进行一些基本特征的应用。

序列表

<110> 北京迅识科技有限公司；北京迅识生物科技有限公司；浙江迅识生物科技有限公司

<120> 一种制备二代测序文库的方法

<130> GNCSQ220115

<160> 6

<170> SIPOSequenceListing 1.0

<210> 1

<211> 33

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 1

gatcggaaga gcacacgtct gaactccagt cac 33

<210> 2

<211> 33

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 2

acactctttc cctacacgac gctcttccga tct 33

<210> 3

<211> 58

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 3

aatgatacgg cgaccaccga gatctacact ctttccctac acgacgctct tccgatct 58

<210> 4

<211> 65

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 4

gatcggaaga gcacacgtct gaactccagt cacagatcgc aatctcgtat gccgtcttct 60

gcttg 65

<210> 5

<211> 70

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 5

aatgatacgg cgaccaccga gatctacact atagcctaca ctctttccct acacgacgct 60

cttccgatct 70

<210> 6

<211> 66

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 6

caagcagaag acggcatacg agatcgagta atgtgactgg agttcagacg tgtgctcttc 60

cgatct 66

Claims

1.制备二代测序文库的方法，其特征在于：所述方法包括将待测DNA分子进行连接接头的连接反应，得到连接产物，获得二代测序文库；所述连接反应在含有小分子PEG的连接缓冲液中进行；

所述小分子PEG为PEG200至PEG1000中任一种或几种。

2.根据权利要求1所述的方法，其特征在于：所述连接缓冲液中所述小分子PEG的体积百分含量为7.5%～20%。

3.根据权利要求1或2所述的方法，其特征在于：所述连接反应通过连接酶进行连接；所述连接反应的时间小于或等于10min。

4.根据权利要求1或2所述的方法，其特征在于：所述接头包括正向接头和反向接头，所述方法包括对所述连接产物进行PCR扩增的步骤；所述正向接头含有测序平台序列，所述测序平台序列位于所述正向接头的5'端；所述PCR扩增采用的正向引物也含有所述测序平台序列，所述测序平台序列位于所述正向引物的5'端。

5.根据权利要求4所述的方法，其特征在于：所述测序平台为Illumina测序平台；所述测序平台序列为P5序列。

6.根据权利要求1或2所述的方法，其特征在于：所述连接产物在进行PCR扩增前不进行纯化。

7.根据权利要求4所述的方法，其特征在于：所述方法由以下步骤组成：b.将所述待测DNA分子进行末端修复，得到末端修复的DNA；c.对所述末端修复的DNA进行加A尾，得到加A尾的DNA；d.将所述加A尾的DNA在所述连接缓冲液中连接所述接头，得到带接头的DNA；e.将所述带接头的DNA进行所述PCR扩增，得到PCR产物；f.将所述PCR产物进行纯化，得到二代测序文库。

8.权利要求1或2中所述的小分子PEG的用途，其特征在于：所述用途为所述小分子PEG在二代测序文库的构建中用于连接接头。

9.权利要求1或2中所述的小分子PEG在制备用于二代测序文库中连接接头的组合物中的应用。

10.含有权利要求1或2中所述的小分子PEG的二代测序文库连接缓冲液。