寡核苷酸接头及其在构建核酸测序单链环状文库中的应用
技术领域
本发明属于生物技术领域,具体地说,本发明涉及一种寡核苷酸接头和利用该接头构建核酸测序单链环状文库的方法及其应用。
背景技术
第二代测序技术,又称新一代测序技术,是相应于以Sanger测序法为代表的第一代测序技术而得名。第二代测序中3种主流测序技术分别为依次出现的Roche/454焦磷酸测序、Illumina/Solexa聚合酶合成测序和ABI/SOLiD连接酶测序技术。与这些主流测序平台相比较,Complete Genomics(简称CG)测序平台通量最高,每次运行可产生9.9TB的数据量,且每小时的产量可以达到50Gb,是目前主流测序平台的10-25倍。CG测序技术可以实现单倍体读长大于99kb,而目前只有Illumina公司可以实现8-10kb的单倍体读长,其他主流的测序公司还不能实现该技术。此外CG测序仪的准确度可达到99.999%,优于目前其他商业化的测序仪。
随着第二代高通量测序技术的应用和发展,RNA测序技术也日趋成熟。以Solexa测序平台为代表的Illumina公司提供的RNA-seq测序技术效果不错,但是由于其构建的是双链线性测序文库,此类文库并不适合于CG测序平台,同时也存在一些影响实验效率的繁琐之处,比如在打断后需要用乙醇沉淀回收样品,才能进行后续的逆转录反应,该步骤不仅影响实验速度,而且增加了操作的复杂度。
目前,本领域中尚没有令人满意的用于RNA测序的单链环状文库的构建方法,因此,本领域迫切需要开发可高效地制备高质量的、可适用于CG测序平台的RNA测序的单链环状文库的方法。
发明内容
本发明的目的是提供一种高效地制备高质量的、单链环状文库的方法以及用该方法制备的高质量的单链环状文库。
在本发明的第一方面,提供了一种用于构建文库的寡核苷酸接头,该接头包括:第一接头和第二接头,
其中,第一接头具有式I所示的从5'至3'的结构:
Z0-Z1-Z2-Z3 (I)
式中,
Z0为位于正义链的单链形式的AGACAAGCTC(SEQ.ID.NO.:1),并且所述Z0的5'端是经硫代修饰的;
Z1为位于正义链的单链形式的标签序列;
Z2为双链形式的GATCGGGCTTCGACTGGAGAC(SEQ.ID.NO.:2);
Z3为位于正义链的单链形式的核苷酸T。
在另一优选例中,所述的标签序列是长度为6-12个碱基的核苷酸序列。
在另一优选例中,所述的标签序列是长度为6-10个碱基的核苷酸序列。
在另一优选例中,所述的标签序列的核苷酸序列与Z0的序列不同。
在另一优选例中,所述的寡核苷酸接头的所述的第二接头具有式II所示的从5'至3'的结构:
Z4-Z5 (II)
式中,
Z4为位于反义链(即互补链)的单链形式的核苷酸T;
Z5为双链形式的AGTCGGAGGCCAAGCGGTCTTAGGA(SEQ.ID.NO.:3)。
在本发明的第二方面,提供了一种试剂盒,所述试剂盒中含有容器以及位于所述容器中的本发明的第一方面中所述的用于构建文库的寡核苷酸接头。
在另一优选例中,所述的第一接头和第二接头位于相同或不同的容器中。
在本发明的第三方面,提供了一种构建测序文库的方法,所述的方法包括步骤:
(a)对双链DNA片段进行末端修复,从而获得平末端的DNA片段;
(b)对所述平末端的DNA片段的3'端添加碱基A,从而获得3'端加A的DNA片段;
(c)对所述3'端加A的DNA片段,用本发明第一方面所述的接头进行连接反应,从而获得两端加接头的DNA片段;
(d)将所述两端加接头的DNA片段作为模板,用特异性引物对进行PCR扩增,从而获得DNA扩增产物,其中所述引物对中的一条引物标记有生物素;
(e)对上一步骤中得到的所述DNA扩增产物,用包被有亲和素的珠子通过“亲和素-生物素”的结合进行分离,从而捕获有生物素标记的PCR扩增产物;
(f)对上一步骤中被捕获的带有生物素标记的PCR扩增产物,进行单链化处理,从而获得单链DNA;
(g)对上一步骤中得到的所述单链DNA,在单链环化分子的存在下,进行单链环化反应,从而获得含环化产物的混合物,即为测序文库。
在另一优选例中,步骤(c)中,所述的两端加接头的DNA片段具有式III所示的结构:
K1-K2-K3 (III)
式中
K1为具有式I所示的从5'至3'的结构的第一接头:
Z0-Z1-Z2-Z3 (I)
K3为具有式II所示的从5'至3'的结构的第二接头:
Z4-Z5 (II)
K2具有式IV所示的从5'至3'的结构;
Z3a-Z6-Z4a (IV)
上述各式中,
Z3a为位于反义链的单链形式的核苷酸A;
Z4a为位于正义链的单链形式的核苷酸A;
Z6为待测序片段的序列;
Z0、Z1、Z2、Z3、Z4、Z5具有如上所述的定义。
在另一优选列中,所述方法具有选自下组的一个或多个特征:
(i)所述亲和素为链霉亲和素;
(ii)步骤(d)中,所述的引物对包括:
正向引物:5-/phos/AGACAAGCTCNNNNNNNNNNGATCGGGCTTCGACTGGAGAC(SEQ IDNO.:4)和
反向引物:5-/bio/TCCTAAGACCGCTTGGCCTCCGACT(SEQ ID NO.:5);
其中,5-/phos/表示5'末端核苷酸经过磷酸化修饰,5-/bio/表示5'末端核苷酸经过生物素标记;
(iii)步骤(g)中,所述的单链环化分子的序列为TCGAGCTTGTCTTCCTAAGACCGC(SEQID NO.:6);
(iv)步骤(h)中,所述的核酸酶为外切酶;
(v)步骤(h)中,所述的核酸酶为特异性切割单链和双链线性DNA的外切酶;
(vi)所述的外切酶包括Exo I和Exo III的混合酶。
在另一优选例中,步骤(a)中的所述的双链DNA片段是通过如下步骤制备的:
(a0)对mRNA样本进行片段化处理,从而获得片段化的mRNA;
(a1)对所述片段化的mRNA进行反转录,从而获得cDNA扩增产物,作为双链DNA片段。
在另一优选例中,所述双链DNA片段直接由DNA样本进行片段化处理后而获得。
在另一优选例中,所述方法还包括步骤:
(h)对上一步骤中所述的混合物,用特异性切割线性DNA的核酸酶进行消化处理,从而获得未环化的DNA片段被消化的混合物,其中上一步骤所述混合物中含有未消化的环化产物;和
(i)任选地将上一步骤中所述未环化的DNA片段被消化的混合物进行纯化,从而获得纯化的RNA测序单链环状文库。
在另一优选例中,步骤(e)中,所述亲和素为链霉亲和素。
在另一优选例中,步骤(d)中,所述的引物对包括:
正向引物:5-/phos/AGACAAGCTCNNNNNNNNNNGATCGGGCTTCGACTGGAGAC(SEQ IDNO.:4)和
反向引物:5-/bio/TCCTAAGACCGCTTGGCCTCCGACT(SEQ ID NO.:5),
其中,5-/phos/表示5'末端核苷酸经过磷酸化修饰,5-/bio/表示5'末端核苷酸经过生物素标记。
在另一优选例中,步骤(g)中,所述的单链环化分子的序列为TCGAGCTTGTCTTCCTAAGACCGC(SEQ ID NO.:6)。
在另一优选例中,步骤(h)中,所述的核酸酶为外切酶。
在另一优选例中,步骤(h)中,所述的核酸酶为特异性切割单链和双链线性DNA的外切酶。
在另一优选例中,所述的外切酶包括Exo I和Exo III的混合酶。
在本发明的第四方面,提供了一种测序文库,所述的测序文库中的待测序分子具有式III所示的结构:
K1-K2-K3 (III)
式中,
K1为具有式I所示的从5'至3'的结构的第一接头:
Z0-Z1-Z2-Z3 (I)
K3为具有式II所示的从5'至3'的结构的第二接头:
Z4-Z5 (II)
K2具有式IV所示的从5'至3'的结构;
Z3a-Z6-Z4a (IV)
上述各式中,
Z3a为位于反义链的单链形式的核苷酸A;
Z4a为位于正义链的单链形式的核苷酸A;
Z6为待测序片段的序列;
Z0、Z1、Z2、Z3、Z4、Z5具有如上所述的定义;
并且待测序分子是环化的,并且所述待测序分子仅具有正义链或仅具有反义链。
在另一优选例中,所述的测序文库中,所有的待测序分子为环化形式,并且所有的待测序分子仅具有正义链。
在另一优选例中,所述的测序文库中,所有的待测序分子为环化形式,并且所有的待测序分子仅具有反义链。
在另一优选例中,上述的Z6的长度为150-250bp。
在另一优选例中,所述的待测序分子中,Z3与Z3a形成互补配对;且Z4与Z4a形成互补配对。
在另一优选例中,所述的待测序分子的结构如式V所示:
5'-AG*ACAAGCTCXXXXXXXXXXGATCGGGCTTCGACTGGAGAC T~~~AAGTCGGAGGCCAAGCGGTCTTAGGA-3' 正义链
3'-CTAGCCCGAAGCTGACCTCTG A~~~T TCAGCCTCCGGTTCGCCAGAATCCT-5' 反义链
(V)
式中,
“~~~”为待测序片段的序列;
*硫逐磷酸酯修饰。
在本发明的第五方面,提供了一种用于测序的文库,所述的文库是用本发明第三方面中所述的构建方法制备的。
在本发明的第六方面,提供了一种本发明的第四方面或本发明的第五方面所述的测序文库的用途,该用途用作高通量测序平台的文库。
在另一优选例中,所述的高通量测序平台为需要单链环状文库的测序平台。
在另一优选例中,所述的高通量测序平台为Complete Genomics测序平台。
应理解,在本发明范围内中,本发明的上述各技术特征和在下文(如实施例)中具体描述的各技术特征之间都可以互相组合,从而构成新的或优选的技术方案。限于篇幅,在此不再一一累述。
附图说明
图1显示了核酸测序单链环状文库构建方法流程图。
图2显示了用标准品universal human reference RNA建立文库后用6%的TBE变性胶检测电泳图。泳道1和2是单链环状文库,泳道3是low range ssRNA ladder。
图3显示了用标准品universal human reference RNA建立文库样本覆盖度分析结果图,从图上可以看出样本覆盖度均一。
图4显示了两次平行实验的结果相关性分析结果图。从图中可以看出相关性均大于0.85,符合标准,而且得到的绝对定量的基因表达相关性非常接近,对同一样品的重复性良好。
图5显示了用炎黄细胞(YH cell)总RNA建立文库后用6%的TBE变性胶检测电泳图。泳道1是low range ssRNA ladder,泳道2是单链环状文库。
图6显示了用炎黄细胞(YH cell)总RNA建立文库样本覆盖度分析结果图,从图上可以看出样本覆盖度均一。
图7显示了用Hela肿瘤细胞的DNA建立文库后用6%的TBE变性胶检测电泳图。泳道1是low range ssRNA ladder,泳道2是单链环状文库。
具体实施方式
本发明人通过广泛而深入的研究,通过对大量筛选,首次开发了一种可用于构建核酸测序文库的接头,用该接头来高效制备高质量的、可用于RNA测序的单链环状文库的新技术。实验结果证明,用本发明所述建库方法所构建的RNA测序单链环状文库,其文库质量非常高,配合CG测序平台,所得到的数据真实度高、可信度佳,且对信息分析没有影响。在此基础上完成了本发明。
CG测序平台
CG测序平台采用了高密度DNA纳米芯片技术,在芯片上嵌入DNA纳米球,然后用复合探针-锚定分子连接(Combinatorial probe anchor ligation,cPAL)技术来读取碱基序列。
文库构建后可获得单链环状DNA分子,通过滚环复制,可形成一个包含200多个拷贝的DNA纳米球(DNB),然后采用高密度DNA纳米芯片技术,将DNA纳米球加到芯片上的网状小孔内,每个小孔只能容纳一个DNA纳米球(当一个DNB结合到芯片上的小孔后,会排斥其他DNB的结合),DNA纳米芯片的占用量超过90%,每一个制备好的芯片可容纳1800亿个碱基用于成像。
cPAL技术利用四种不同颜色标记的探针去读取接头附近的碱基,每次最多读取10个连续碱基且每次测序是相互独立的,即测序结果不受前一个碱基测序结果的影响,因此不会发生错误累积的现象,测序结果精准性高,碱基错误率可低至十万分之一。在测序时,加入锚定分子与接头互补配对,然后DNA连接酶将四种不同颜色标记的探针结合到模板的相应碱基上,通过对荧光基团的成像来判断碱基类型。cPAL技术的另一个优势是采用了非连续、非连锁联合探针锚定连接技术来读取碱基可大大减少探针和酶的浓度;与边合成边测序不同,cPAL每个cycle(循环)可一次性读取数个碱基,这样消耗的测序试剂和成像时间都大大减少。与目前流行的第二代测序技术相比,此建库和测序方法能在消耗更少试剂的前提下获得更多的数据。
构建文库的方法
在本发明中,通过了一种特殊设计的接头,该接头包括第一接头和第二接头。第一接头的第一链5'端经硫代修饰(优选地硫逐磷酸酯修饰),可防止外切酶切除。此外,第一链还可含有标签序列。第一链与第四链的3'末端碱基均为T,硫逐磷酸酯修饰的链(第一链)长度比第二链长。第一链与第二链可形成双链结构成为第一接头,第三链与第四链可形成双链结构成为第二接头,第二链和第三链的5'端有A碱基。
在本发明的构建文库的方法中,第一接头和第二接头分别连接于目标片段序列的两端。将获得两端加接头的DNA片段作为模板,用特异性引物对进行PCR扩增,从而获得DNA扩增产物,其中所述引物对中的一条引物标记有生物素,通过用包被有亲和素的珠子通过“亲和素-生物素”的结合进行分离,从而捕获有生物素标记的PCR扩增产物,再对被捕获的带有生物素标记的PCR扩增产物,进行单链化处理,从而获得单链DNA,继而进行单链环化反应得到含有单链环化分子的混合物,即为测序文库。
单链环状文库
在本发明中,还提供了用本发明上述文库构建方法所制备的适用于测序的单链环状文库。
在本发明的优选例中,本发明人通过最佳建库条件的摸索,最佳条件所得结果与其他技术所得结果的比较,充分验证该本发明方法的稳定性和可重复性,并充分验证本发明方法的真实可靠性。此外,选用不同样品,进行多次实验后,证明利用本发明的单链环状文库所获得的测序数据真实可信。
本发明主要优点在于:
(1)首次发明了一种可用于构建核酸测序文库的接头;
(2)本发明的接头序列上带有硫代修饰,能避免内切酶消化,完成后续反应。
(3)本发明的接头具有粘性末端,连接效率高,能够有效降低接头自连问题。
(4)本发明的接头可以通过引入标签来降低后续测序成本。
(5)本发明的RNA单链环状文库可用于需要单链环状文库的测序平台。
(6)本发明提供的方法可以实现一步加接头,操作简便。
(7)本发明提供的方法具有测序通量高,准确度高和操作简便。
(8)本发明提供的方法具有稳定性,可重复性和可靠性高的特点。
下面结合具体实施例,进一步阐述本发明。应理解,这些实施例仅用于说明本发明而不用于限制本发明的范围。下列实施例中未注明具体条件的实验方法,通常按照常规条件如Sambrook等人,分子克隆:实验室手册(New York:Cold Spring Harbor LaboratoryPress,1989)中所述的条件,或按照制造厂商所建议的条件。除非另外说明,否则百分比和份数按重量计算。
材料和方法
下列实施例中试剂来源为:5×第一链缓冲液(First strand buffer)含有:80-400mM氯化钠,10-80mM氯化镁,200mM-300mM Tris-HCl、磷酸盐,pH值为8.0-8.5,溶剂为水。标准品universal human reference RNA(购自安捷伦),该RNA是10种人细胞株的混合物(乳腺细胞、肝癌细胞、宫颈细胞、胚胎细胞、恶性胶质瘤细胞、黑色素瘤细胞、脂肪肉瘤细胞、淋巴瘤细胞、白血病T淋巴细胞、骨髓B淋巴细胞)。
纯化DNA片段均采用市售的Ampure XP磁珠。
本实施例中所用的实验材料如无特殊说明,均可从市售渠道获得
实施例1RNA单链环状文库的构建
具体实验步骤(见图1中所示流程步骤):
1、mRNA提取与纯化
1)取标准品universal human reference RNA 3ug至一个RNase-free的管中,用DEPC水稀释至50μl。混匀,65℃变性5分钟以打开二级结构,然后立即将样品置于冰上。
2)吸取15μl Dynalbeads Oligo(dT)25磁珠于1.5ml的不黏EP管中,用100μl结合缓冲液(binding buffer)将磁珠洗两次,将磁珠重新悬浮于50μl binding buffer,将第一步中制得的总RNA加入管中,室温放置5min。
3)将non-stick-EP管置于MPC(磁分离器)上2min,去除上清,再用200μl洗涤缓冲液(washing buffer)清洗磁珠两次。取一新的不粘的EP管,加入50μl的结合缓冲液(binding buffer)。
4)向含磁珠的EP管(即3)中的non-stick-EP管)中加入50μl 10mM Tris-HCl,80℃加热2min将mRNA从磁珠上洗脱下来,迅速将EP管转至MPC上,转移mRNA至3)中新的EP管,将混合溶液在65℃变性5min,打开二级结构,然后立即将样品置于冰上。另外,立即将200μl洗涤缓冲液(washing buffer)加入到含有磁珠管中,将磁珠洗两次。
5)将100μl mRNA样品(即4)中洗脱下来的mRNA)加入洗过两次的磁珠中,室温放置5min,将EP管置于MPC上2min,小心吸除上清,再用200μl洗涤缓冲液(washing buffer)清洗磁珠两次。
6)向含磁珠的EP管(即5)中的EP管)中加入17μl 10mM Tris-HCl,80℃加热2min,从而将mRNA从磁珠上洗脱下来。迅速地将EP管转至MPC上,转移mRNA洗脱液至一新的200μlPCR管中,大约能回收16μl mRNA。
2、打断mRNA及合成一链
向上一步中的洗脱液中加入3μL 5×第一链缓冲液(First strand buffer),94℃,10min,立即置于冰上。加入随机引物1μl,65℃5min打开单链二级结构,置于冰上。配置反应mix,包括100mM DTT(2μl)、25mM dNTP混合液(0.4μl)、RNase抑制剂(0.5μl)将混合物加入含RNA的管中,混匀后室温放置2min,然后加入1μl SuperscriptⅡ(200U/μl)混匀,加水补齐到总体积25μl。在PCR仪上按照以下程序进行反应:
3、合成二链
向一链反应体系中补水至82.8μl,依次加入10μl GEX 5×第二链缓冲液(SecondStrand Buffer)、1.2μl 25mM dNTP Mix,混匀,冰上放置5min,再加入1μl RNaseH、5μl DNAPol I,混匀,将反应管置于16℃反应2.5小时。
反应完成后,用Ampure XP磁珠纯化二链产物,溶于50μl EB缓冲液。
4、末端修复
上述步骤得到50μl DNA,向反应体系中依次加入27.4μl水、10μl 10X末端修复缓冲液(End Repair Buffer)、1.6μl 25mM dNTP混合液、5μl T4DNA聚合酶、1μl Klenow DNA聚合酶、5μl T4PNK,总反应体系为100μl,将反应管置于20℃反应30min。
反应完成后,用Ampure XP磁珠纯化末端修复产物,溶于32μl EB缓冲液。
5、加A,加接头
上述步骤得到32μl DNA,向反应体系中依次加入5μl碱基A突出尾部缓冲液(A-Tailing Buffer)、10μl 1mM dATP、3μl Klenow exo(去除3'to 5'外切酶活性),总反应体系为50μl,将反应管置于37℃反应30min。
反应完成后,用Ampure XP磁珠纯化加A产物,溶于23μl EB缓冲液。
上述步骤得到23μl加A产物,向反应体系中依次加入25μl 2X快速T4DNA连接酶缓冲液(Rapid T4DNA Ligase Buffer)、1μl PE Adapter Oligo Mix(寡核苷酸混合物),1μlT4DNA连接酶,
其中所述寡核苷酸混合物包括:
5端上游序列:AGACAAGCTC TGTCATAAAT GATCGGGCTTCGACTGGAGACT(SEQ ID NO.:7)
5端下游序列:GTCTCCAGTCGAAGCCCGATC(SEQ ID NO.:8)
3端上游序列:AAGTCGGAGGCCAAGCGGTCTTAGGA(SEQ ID NO.:9)
3端下游序列:TTCCTAAGACCGCTTGGCCTCCGACTT(SEQ ID NO.:10)。
总反应体系为50μl,将反应管置于室温反应15min。
反应完成后,用Ampure XP磁珠纯化连接产物,溶于10μl EB缓冲液。
6.PCR扩增及纯化
上述步骤得到30μl连接产物,向反应体系中依次加入10μl 5X Phusion缓冲液、1μl PCR引物F(序列:5-/phos/AGACAAGCTCNNNNNNNNNNGATCGGGCTTCGACTGGAGAC,SEQ ID NO.:4)、1μl PCR引物R(序列:5-/bio/TCCTAAGACCGCTTGGCCTCCGACT,SEQ ID NO.:5)、0.5μl25mM dNTP混合液、0.5μl Phusion DNA聚合酶、7μl水,总反应体系50μl。在PCR仪上按照以下程序进行反应:
a.30sec at 98℃
b.15个循环:
10sec,98℃
30sec,65℃
30sec,72℃
c.5min,72℃
d.4℃保温
反应完成后,用Ampure XP磁珠纯化PCR产物,溶于32μl EB缓冲液。
7.单链分离
7.1连霉亲和素磁珠洗涤方法如下:
每个样品取30ul MyOne Streptavidin C1磁珠:加入3-5倍体积的1X磁珠结合缓冲液,混匀后置于磁力架上静止吸附,调整不粘管的方向,使得磁珠在1X磁珠结合缓冲液中前后游动,弃上清液后,重复上述操作一次,取出不黏管加入1倍体积(30ul)1X磁珠结合缓冲液悬浮,混匀后室温静置。
7.2.向60ul(加水补齐到60ul)样品中加入20ul 4X磁珠结合缓冲液混匀,然后转移到上步骤含有30ul 1X磁珠结合缓冲液溶解的磁珠的不粘管中混匀,此110ul混合物室温下结合15-20min,中间轻轻弹匀一次。
7.3.将上述不粘管磁力架放置3-5min,弃去上清液,用1ml的1X磁珠洗涤缓冲液洗涤2次,方法同MyOne Streptavidin C1磁珠的洗涤方法。
7.4.向上述磁珠中加入78ul 0.1M NaOH,吹打混匀后放置10min,再置于磁力架上3-5min,取上清74.5ul到新的1.5ml EP管中。
7.5.向上述1.5mlEP管中加入37.5ul 0.3M MOPS,混匀备用。
7.6.此步骤产物可以冻存于-20℃。
8、单链环化
8.1提前5分钟左右准备引物反应混合液,配制如下:
ON1587(序列:TCGAGCTTGTCTTCCTAAGACCGC,SEQ ID NO.:11)
水 43ul
20uM ON1587 20ul
总量 63ul
8.2将上述混合液震荡充分混匀,离心后,向上一步得到的112ul的样品中加入63ul的引物反应混合液;
8.3提前5分钟准备连接酶反应混合液,配制如下:
8.4将连接酶反应混合液震荡充分混匀,离心后,向已经加入引物反应混合液的EP管中加入连接酶反应混合液175ul,震荡10s混匀,离心。
8.5置于孵育箱中37℃孵育1.5h。
8.6反应完成后,取出10ul样品,待6%变性胶电泳检测,剩余的约350ul,进入下一步酶反应。
9.酶切消化(Exo I and III)
9.1提前5分钟左右准备酶切消化反应液,配制如下:
9.2将上述混合液震荡充分混匀,离心后,向上一步得到的350ul的样品中分别加入20ul的酶切消化反应液。
9.3震荡10s混匀离心,置于孵育箱中37℃孵育30min。
9.4酶切30min完成后,向样品中加入15.4ul 500mM EDTA终止酶反应。
9.5上述样品用1.3X PEG32磁珠/tween20纯化,方法如下:
将上步骤样品转移到1.5ml不粘管中,加入500ul的PEG32磁珠,室温结合15min,期间吹打混匀一次;
9.6不粘管置于磁力架3-5min后弃去上清,用700ul 75%乙醇洗涤两次,洗涤时将不粘管前后方向反转,使得磁珠在乙醇中游动,每次洗涤游动2-3次;
9.7室温下晾干后用40ul 1XTE回溶,溶解时间共计15min,中间混匀一次;
9.8上清转移到新的1.5mlEP管中,将最终得到产物用市售的QubitTM ssDNA AssayKit定量。
9.9取5ul样品至PCR管中与5ul 2x RNA loading buffer混匀,同时取2ul lowRange RNA ladder到PCR管,将样品与ladder置于PCR仪中95℃变性2min,迅速转移至冰上冷却2min,再进行6%的TBE变性胶检测。结果见图2。
9.10浓度标准化
按照单链分子定量测定的浓度调整DNB制备使用的样本起始量统一调整为7.5fmol/ul。
10.文库上机测序。对步骤1-9中制备的单链环状文库,采用Complete Genomics测序平台(型号:BB-SEQ)进行测序。
11.对测序所产生的数据,进行生v物信息分析,主要包含以下步骤:
(1)过滤测序序列;
过滤不合格序列包括:测序质量低于阀值(阈值为Q20)的碱基个数超过整条序列碱基个数的50%则认为是不合格序列;序列中测序结果不确定的碱基(如测序结果中的N)个数超过整条序列碱基个数的10%则认为是不合格序列;除样本接头序列外,与其它实验引入的外源序列比对,如各种接头序列,若序列中存在外源序列则认为是不合格序列。原始的序列数据经过去除不合格序列处理后得到的序列数据,称为干净的序列片段(cleanreads),作为后续分析的基础。
(2)干净的序列片段与参考序列比对;
将得到的干净的序列片段分别比对到参考基因hg19序列上。参考基因序列可取于公共数据库,如NCBI数据库。
(3)比对后,对比对结果进行一系列的生物信息分析,其中包括:
1)高通量测序的质量评估:包括高通量测序数据产出统计,统计高通量测序数据的质量和数据类型;高通量测序饱和度分析,分析在合同要求的高通量测序数据量范围内测序是否达到饱和;高通量测序随机性的统计分析,该项分析旨在评估先前的实验流程中对RNA样品的片段化随机性是否理想;干净的序列片段在参考基因组上的分布分析,分析干净的序列片段在参考基因组上分布是否均匀。
2)基因表达量的统计:统计基因表达量以及画基因覆盖度图;结果见图3。
3)实验重复性分析,对两次平行实验的结果相关性分析可获得对实验结果可靠性和操作稳定性的评估,结果见图4。
部分测序分析结果如图3和图4所示。所示结果表明:
(a)本实施例方法制备的文库,样本覆盖度均一,同一样本的重复性良好。
(b)测序所得到的数据真实、可信,且对信息分析没有影响。
实施例2
重复实施例1中文库的制备步骤1-10,不同点在于,采用常规的人淋巴细胞(炎黄细胞,YH cell)替换实施例1中的标准品universal human reference RNA作为总RNA的来源。用QIAGEN RNA提取试剂盒提取炎黄细胞的总RNA,在进行mRNA的提取与纯化之前,对总RNA进行预处理,预处理步骤如下:
1、DNA酶消化总RNA
取总RNA样品,于RNase-free的EP管中,按照如下体系进行DNA消化。
37℃,10min消化。
加入2μl 1mM EDTA溶液,再于75℃变性10min,放冰上冷却。
2、纯化消化后的RNA
将上述步骤的产物(22μl)加入1.8倍体积(40μl)的RNA clean磁珠(需要提前室温平衡30min)。室温放置5min,磁力架放置2min。使用80%乙醇(DEPC水配)洗两次,晾干,加入10μl RNase-free水洗脱,室温放置3min,上磁力架2min,收集上清液至一新的RNase-free的EP管中。
文库构建过程及测序同实施例1的步骤1-10。其中步骤9进行6%TBE变性胶检测。其结果见下图5。覆盖度分析结果见图6:
以上结果说明,使用本发明的方法制备的RNA测序文库,样本覆盖度均一,测序所得到的数据真实、可信。
对比例1
样本:标准品universal human reference RNA(安捷伦)
使用两种接头,序列一样,修饰不同。其中一种接头经过硫代修饰(即实施例1的接头),另一种对照接头没有硫代修饰。
步骤与实施例1中的步骤1至6相同。完成步骤6PCR扩增与纯化后,使用QubitdsDNA Assay Kit检测PCR回收产物浓度。
计算PCR效率,PCR效率=(PCR总产量/模板起始量)×(1/循环数)
结果见表1:
接头名称 |
没有硫代修饰接头 |
硫代修饰接头 |
PCR模板量(ng) |
10 |
10 |
回收浓度(ng/ul) |
6.5 |
50 |
回收总量(ng) |
260 |
2000 |
从表1结果可以看出,硫代修饰接头PCR效率明显比没有硫代修饰接头高。
实施例3
用QIAGEN高品质DNA提取试剂盒提取Hela肿瘤细胞的DNA。之后重复实施例1中步骤4至9,6%的TBE变性胶检测。
结果见图7,结果说明,使用本发明的方法制备DNA测序文库是切实可行的。
在本发明提及的所有文献都在本申请中引用作为参考,就如同每一篇文献被单独引用作为参考那样。此外应理解,在阅读了本发明的上述讲授内容之后,本领域技术人员可以对本发明作各种改动或修改,这些等价形式同样落于本申请所附权利要求书所限定的范围。