CN115961001A - Dna甲基转移酶结合胞嘧啶脱氨酶介导的dna中5-甲基胞嘧啶的单碱基定位分析方法 - Google Patents
Dna甲基转移酶结合胞嘧啶脱氨酶介导的dna中5-甲基胞嘧啶的单碱基定位分析方法 Download PDFInfo
- Publication number
- CN115961001A CN115961001A CN202211266818.9A CN202211266818A CN115961001A CN 115961001 A CN115961001 A CN 115961001A CN 202211266818 A CN202211266818 A CN 202211266818A CN 115961001 A CN115961001 A CN 115961001A
- Authority
- CN
- China
- Prior art keywords
- dna
- reaction
- methylcytosine
- cytosine deaminase
- methyltransferase
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 108020004414 DNA Proteins 0.000 title claims abstract description 175
- 102000016397 Methyltransferase Human genes 0.000 title claims abstract description 39
- 108060004795 Methyltransferase Proteins 0.000 title claims abstract description 39
- 102000000311 Cytosine Deaminase Human genes 0.000 title claims abstract description 33
- 108010080611 Cytosine Deaminase Proteins 0.000 title claims abstract description 33
- LRSASMSXMSNRBT-UHFFFAOYSA-N 5-methylcytosine Chemical compound CC1=CNC(=O)N=C1N LRSASMSXMSNRBT-UHFFFAOYSA-N 0.000 title claims abstract description 30
- 238000004458 analytical method Methods 0.000 title claims abstract description 28
- 230000001404 mediated effect Effects 0.000 title claims abstract description 12
- 238000000034 method Methods 0.000 claims abstract description 64
- 238000006243 chemical reaction Methods 0.000 claims abstract description 54
- 238000006481 deamination reaction Methods 0.000 claims abstract description 43
- 230000009615 deamination Effects 0.000 claims abstract description 33
- 238000012163 sequencing technique Methods 0.000 claims abstract description 20
- 238000002372 labelling Methods 0.000 claims abstract description 19
- 238000004925 denaturation Methods 0.000 claims abstract description 12
- 230000036425 denaturation Effects 0.000 claims abstract description 12
- 230000003321 amplification Effects 0.000 claims abstract description 11
- 238000003199 nucleic acid amplification method Methods 0.000 claims abstract description 10
- 230000002779 inactivation Effects 0.000 claims abstract description 8
- 102100040263 DNA dC->dU-editing enzyme APOBEC-3A Human genes 0.000 claims description 39
- 101000964378 Homo sapiens DNA dC->dU-editing enzyme APOBEC-3A Proteins 0.000 claims description 39
- 108090000623 proteins and genes Proteins 0.000 claims description 20
- 102000004169 proteins and genes Human genes 0.000 claims description 20
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 claims description 18
- VFFTYSZNZJBRBG-DYXDMYNLSA-N S-adenosyl-S-carboxymethyl-L-homocysteine dizwitterion Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](C[S+](CC[C@H]([NH3+])C([O-])=O)CC([O-])=O)[C@@H](O)[C@H]1O VFFTYSZNZJBRBG-DYXDMYNLSA-N 0.000 claims description 17
- IAZDPXIOMUYVGZ-UHFFFAOYSA-N Dimethylsulphoxide Chemical compound CS(C)=O IAZDPXIOMUYVGZ-UHFFFAOYSA-N 0.000 claims description 15
- 102000053602 DNA Human genes 0.000 claims description 10
- 125000002057 carboxymethyl group Chemical group [H]OC(=O)C([H])([H])[*] 0.000 claims description 10
- QKNYBSVHEMOAJP-UHFFFAOYSA-N 2-amino-2-(hydroxymethyl)propane-1,3-diol;hydron;chloride Chemical compound Cl.OCC(N)(CO)CO QKNYBSVHEMOAJP-UHFFFAOYSA-N 0.000 claims description 9
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 claims description 9
- VHJLVAABSRFDPM-QWWZWVQMSA-N dithiothreitol Chemical compound SC[C@@H](O)[C@H](O)CS VHJLVAABSRFDPM-QWWZWVQMSA-N 0.000 claims description 9
- 239000011780 sodium chloride Substances 0.000 claims description 9
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 claims description 9
- 229920004890 Triton X-100 Polymers 0.000 claims description 7
- 239000013504 Triton X-100 Substances 0.000 claims description 7
- CCIVGXIOQKPBKL-UHFFFAOYSA-M ethanesulfonate Chemical compound CCS([O-])(=O)=O CCIVGXIOQKPBKL-UHFFFAOYSA-M 0.000 claims description 7
- FFEARJCKVFRZRR-UHFFFAOYSA-N L-Methionine Natural products CSCCC(N)C(O)=O FFEARJCKVFRZRR-UHFFFAOYSA-N 0.000 claims 1
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 claims 1
- 229930195722 L-methionine Natural products 0.000 claims 1
- 229960004452 methionine Drugs 0.000 claims 1
- LSNNMFCWUKXFEE-UHFFFAOYSA-M Bisulfite Chemical compound OS([O-])=O LSNNMFCWUKXFEE-UHFFFAOYSA-M 0.000 abstract description 10
- 102000055027 Protein Methyltransferases Human genes 0.000 abstract 1
- 108700040121 Protein Methyltransferases Proteins 0.000 abstract 1
- CZPWVGJYEJSRLH-UHFFFAOYSA-N Pyrimidine Chemical compound C1=CN=CN=C1 CZPWVGJYEJSRLH-UHFFFAOYSA-N 0.000 abstract 1
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 16
- 239000000047 product Substances 0.000 description 16
- 238000001369 bisulfite sequencing Methods 0.000 description 14
- 238000003752 polymerase chain reaction Methods 0.000 description 14
- 230000004048 modification Effects 0.000 description 12
- 238000012986 modification Methods 0.000 description 12
- 239000000523 sample Substances 0.000 description 12
- 238000007480 sanger sequencing Methods 0.000 description 12
- 239000011535 reaction buffer Substances 0.000 description 9
- 101150010097 RARB gene Proteins 0.000 description 8
- 229940104302 cytosine Drugs 0.000 description 8
- 230000000694 effects Effects 0.000 description 8
- 208000020816 lung neoplasm Diseases 0.000 description 8
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 8
- 206010058467 Lung neoplasm malignant Diseases 0.000 description 7
- 201000005202 lung cancer Diseases 0.000 description 7
- 210000001519 tissue Anatomy 0.000 description 7
- MMIFUTMTWUWRCI-UHFFFAOYSA-N 4-amino-1-methyl-2-oxopyrimidine-5-carboxylic acid Chemical compound CN1C=C(C(O)=O)C(N)=NC1=O MMIFUTMTWUWRCI-UHFFFAOYSA-N 0.000 description 6
- OKKJLVBELUTLKV-UHFFFAOYSA-N Methanol Chemical compound OC OKKJLVBELUTLKV-UHFFFAOYSA-N 0.000 description 6
- 238000001514 detection method Methods 0.000 description 6
- 239000000243 solution Substances 0.000 description 6
- 108091029430 CpG site Proteins 0.000 description 5
- 238000012408 PCR amplification Methods 0.000 description 5
- 238000001294 liquid chromatography-tandem mass spectrometry Methods 0.000 description 5
- 238000002156 mixing Methods 0.000 description 5
- 238000012546 transfer Methods 0.000 description 5
- OIVLITBTBDPEFK-UHFFFAOYSA-N 5,6-dihydrouracil Chemical compound O=C1CCNC(=O)N1 OIVLITBTBDPEFK-UHFFFAOYSA-N 0.000 description 4
- 108700039691 Genetic Promoter Regions Proteins 0.000 description 4
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 4
- 230000015556 catabolic process Effects 0.000 description 4
- 238000006731 degradation reaction Methods 0.000 description 4
- 238000010438 heat treatment Methods 0.000 description 4
- 230000004807 localization Effects 0.000 description 4
- 229940113082 thymine Drugs 0.000 description 4
- 102000004190 Enzymes Human genes 0.000 description 3
- 108090000790 Enzymes Proteins 0.000 description 3
- MEFKEPWMEQBLKI-AIRLBKTGSA-N S-adenosyl-L-methioninate Chemical compound O[C@@H]1[C@H](O)[C@@H](C[S+](CC[C@H](N)C([O-])=O)C)O[C@H]1N1C2=NC=NC(N)=C2N=C1 MEFKEPWMEQBLKI-AIRLBKTGSA-N 0.000 description 3
- 230000015572 biosynthetic process Effects 0.000 description 3
- 208000002154 non-small cell lung carcinoma Diseases 0.000 description 3
- 238000002264 polyacrylamide gel electrophoresis Methods 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 108091008146 restriction endonucleases Proteins 0.000 description 3
- 238000003786 synthesis reaction Methods 0.000 description 3
- 208000029729 tumor suppressor gene on chromosome 11 Diseases 0.000 description 3
- 230000007067 DNA methylation Effects 0.000 description 2
- 206010028980 Neoplasm Diseases 0.000 description 2
- 102100033909 Retinoic acid receptor beta Human genes 0.000 description 2
- 150000001413 amino acids Chemical group 0.000 description 2
- 238000000137 annealing Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 230000031018 biological processes and functions Effects 0.000 description 2
- 238000010219 correlation analysis Methods 0.000 description 2
- CTMZLDSMFCVUNX-VMIOUTBZSA-N cytidylyl-(3'->5')-guanosine Chemical group O=C1N=C(N)C=CN1[C@H]1[C@H](O)[C@H](OP(O)(=O)OC[C@@H]2[C@H]([C@@H](O)[C@@H](O2)N2C3=C(C(N=C(N)N3)=O)N=C2)O)[C@@H](CO)O1 CTMZLDSMFCVUNX-VMIOUTBZSA-N 0.000 description 2
- RGWHQCVHVJXOKC-SHYZEUOFSA-J dCTP(4-) Chemical compound O=C1N=C(N)C=CN1[C@@H]1O[C@H](COP([O-])(=O)OP([O-])(=O)OP([O-])([O-])=O)[C@@H](O)C1 RGWHQCVHVJXOKC-SHYZEUOFSA-J 0.000 description 2
- 230000029087 digestion Effects 0.000 description 2
- 238000001976 enzyme digestion Methods 0.000 description 2
- 239000012634 fragment Substances 0.000 description 2
- 238000013467 fragmentation Methods 0.000 description 2
- 238000006062 fragmentation reaction Methods 0.000 description 2
- 239000005457 ice water Substances 0.000 description 2
- 238000001114 immunoprecipitation Methods 0.000 description 2
- 238000004811 liquid chromatography Methods 0.000 description 2
- 238000004949 mass spectrometry Methods 0.000 description 2
- 230000003647 oxidation Effects 0.000 description 2
- 238000007254 oxidation reaction Methods 0.000 description 2
- 238000010791 quenching Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 108091008761 retinoic acid receptors β Proteins 0.000 description 2
- 238000003860 storage Methods 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 238000004809 thin layer chromatography Methods 0.000 description 2
- 229940035893 uracil Drugs 0.000 description 2
- 238000012795 verification Methods 0.000 description 2
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 1
- BLQMCTXZEMGOJM-UHFFFAOYSA-N 5-carboxycytosine Chemical compound NC=1NC(=O)N=CC=1C(O)=O BLQMCTXZEMGOJM-UHFFFAOYSA-N 0.000 description 1
- HRPVXLWXLXDGHG-UHFFFAOYSA-N Acrylamide Chemical compound NC(=O)C=C HRPVXLWXLXDGHG-UHFFFAOYSA-N 0.000 description 1
- 229930024421 Adenine Natural products 0.000 description 1
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 1
- ATRRKUHOCOJYRX-UHFFFAOYSA-N Ammonium bicarbonate Chemical compound [NH4+].OC([O-])=O ATRRKUHOCOJYRX-UHFFFAOYSA-N 0.000 description 1
- 229910000013 Ammonium bicarbonate Inorganic materials 0.000 description 1
- 101100240528 Caenorhabditis elegans nhr-23 gene Proteins 0.000 description 1
- 208000005623 Carcinogenesis Diseases 0.000 description 1
- 108091062167 DNA cytosine Proteins 0.000 description 1
- 101000889953 Homo sapiens Apolipoprotein B-100 Proteins 0.000 description 1
- 241000124008 Mammalia Species 0.000 description 1
- 241001135743 Mycoplasma penetrans Species 0.000 description 1
- 108091028043 Nucleic acid sequence Proteins 0.000 description 1
- 208000037273 Pathologic Processes Diseases 0.000 description 1
- ZJUKTBDSGOFHSH-WFMPWKQPSA-N S-Adenosylhomocysteine Chemical compound O[C@@H]1[C@H](O)[C@@H](CSCC[C@H](N)C(O)=O)O[C@H]1N1C2=NC=NC(N)=C2N=C1 ZJUKTBDSGOFHSH-WFMPWKQPSA-N 0.000 description 1
- RZCIEJXAILMSQK-JXOAFFINSA-N TTP Chemical compound O=C1NC(=O)C(C)=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 RZCIEJXAILMSQK-JXOAFFINSA-N 0.000 description 1
- 108010006785 Taq Polymerase Proteins 0.000 description 1
- 102000004357 Transferases Human genes 0.000 description 1
- 108090000992 Transferases Proteins 0.000 description 1
- 102000044209 Tumor Suppressor Genes Human genes 0.000 description 1
- 108700025716 Tumor Suppressor Genes Proteins 0.000 description 1
- 229960000643 adenine Drugs 0.000 description 1
- 239000011543 agarose gel Substances 0.000 description 1
- 238000000246 agarose gel electrophoresis Methods 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 235000012538 ammonium bicarbonate Nutrition 0.000 description 1
- 239000001099 ammonium carbonate Substances 0.000 description 1
- 239000012491 analyte Substances 0.000 description 1
- 239000007864 aqueous solution Substances 0.000 description 1
- 230000008827 biological function Effects 0.000 description 1
- 239000012472 biological sample Substances 0.000 description 1
- NNTOJPXOCKCMKR-UHFFFAOYSA-N boron;pyridine Chemical compound [B].C1=CC=NC=C1 NNTOJPXOCKCMKR-UHFFFAOYSA-N 0.000 description 1
- 239000000872 buffer Substances 0.000 description 1
- 230000036952 cancer formation Effects 0.000 description 1
- 231100000504 carcinogenesis Toxicity 0.000 description 1
- 230000003197 catalytic effect Effects 0.000 description 1
- 239000007795 chemical reaction product Substances 0.000 description 1
- 239000003153 chemical reaction reagent Substances 0.000 description 1
- 238000003776 cleavage reaction Methods 0.000 description 1
- 238000005520 cutting process Methods 0.000 description 1
- SUYVUBYJARFZHO-RRKCRQDMSA-N dATP Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@H]1C[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 SUYVUBYJARFZHO-RRKCRQDMSA-N 0.000 description 1
- SUYVUBYJARFZHO-UHFFFAOYSA-N dATP Natural products C1=NC=2C(N)=NC=NC=2N1C1CC(O)C(COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 SUYVUBYJARFZHO-UHFFFAOYSA-N 0.000 description 1
- HAAZLUGHYHWQIW-KVQBGUIXSA-N dGTP Chemical compound C1=NC=2C(=O)NC(N)=NC=2N1[C@H]1C[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 HAAZLUGHYHWQIW-KVQBGUIXSA-N 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 230000019975 dosage compensation by inactivation of X chromosome Effects 0.000 description 1
- 238000000835 electrochemical detection Methods 0.000 description 1
- 230000013020 embryo development Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000002255 enzymatic effect Effects 0.000 description 1
- 230000007071 enzymatic hydrolysis Effects 0.000 description 1
- 238000006047 enzymatic hydrolysis reaction Methods 0.000 description 1
- 230000004049 epigenetic modification Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 239000000499 gel Substances 0.000 description 1
- 238000001502 gel electrophoresis Methods 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 238000012165 high-throughput sequencing Methods 0.000 description 1
- 102000052249 human APOB Human genes 0.000 description 1
- 230000003301 hydrolyzing effect Effects 0.000 description 1
- 230000006607 hypermethylation Effects 0.000 description 1
- JDNTWHVOXJZDSN-UHFFFAOYSA-N iodoacetic acid Chemical compound OC(=O)CI JDNTWHVOXJZDSN-UHFFFAOYSA-N 0.000 description 1
- 238000004895 liquid chromatography mass spectrometry Methods 0.000 description 1
- 210000004072 lung Anatomy 0.000 description 1
- 208000037841 lung tumor Diseases 0.000 description 1
- 230000017156 mRNA modification Effects 0.000 description 1
- -1 methyl CpG Chemical compound 0.000 description 1
- 125000002496 methyl group Chemical group [H]C([H])([H])* 0.000 description 1
- 230000011987 methylation Effects 0.000 description 1
- 238000007069 methylation reaction Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 239000013642 negative control Substances 0.000 description 1
- 102000039446 nucleic acids Human genes 0.000 description 1
- 108020004707 nucleic acids Proteins 0.000 description 1
- 150000007523 nucleic acids Chemical class 0.000 description 1
- 239000002777 nucleoside Substances 0.000 description 1
- 125000003835 nucleoside group Chemical group 0.000 description 1
- 230000009054 pathological process Effects 0.000 description 1
- 239000013612 plasmid Substances 0.000 description 1
- 229920000642 polymer Polymers 0.000 description 1
- 239000002244 precipitate Substances 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000006318 protein oxidation Effects 0.000 description 1
- 238000000746 purification Methods 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- 238000004445 quantitative analysis Methods 0.000 description 1
- 239000002994 raw material Substances 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 238000003202 restriction enzyme-based method Methods 0.000 description 1
- 230000007017 scission Effects 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 238000001308 synthesis method Methods 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
- GPRLSGONYQIRFK-MNYXATJNSA-N triton Chemical compound [3H+] GPRLSGONYQIRFK-MNYXATJNSA-N 0.000 description 1
- 108700026220 vif Genes Proteins 0.000 description 1
- 238000012070 whole genome sequencing analysis Methods 0.000 description 1
Images
Landscapes
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本发明提供了一种DNA甲基转移酶结合胞嘧啶脱氨酶介导的DNA中5‑甲基胞嘧啶的单碱基定位分析方法和试剂盒,所述方法包括:采用DNA甲基转移酶对待检DNA进行羧甲基化标记反应,后变性处理以使DNA甲基转移酶灭活而终止反应,获得羧甲基化标记的DNA;采用胞嘧啶脱氨酶对所述羧甲基化标记DNA进行脱氨基反应,后进行高温灭活处理以使胞嘧啶脱氨酶灭活而终止反应,获得脱氨基DNA样品;将所述脱氨基DNA样品进行PCR反应,获得扩增产物;将所述扩增产物测序,获得5‑甲基胞嘧啶的位点信息。该方法不依赖于亚硫酸氢盐处理,且具有高选择性,操作简单,可直接获得DNA中5‑甲基胞嘧啶的单碱基分辨率定位信息。
Description
技术领域
本发明属于生物技术领域,涉及一种DNA甲基转移酶结合胞嘧啶脱氨酶介导的DNA中5-甲基胞嘧啶的单碱基定位分析方法和试剂盒。
背景技术
5-甲基胞嘧啶(5mC)是哺乳动物中最普遍的表观遗传学修饰。5mC在调控基因表达方面发挥着重要的作用。局部或整体水平下DNA甲基化图谱的改变与多种生物进程和病理过程有关,如胚胎发育、X染色体失活和肿瘤发生。在哺乳动物的基因组中,5mC主要存在于CG二核苷酸序列中,由DNA甲基转移酶(DNMTs)利用S-腺苷-L-甲硫氨酸(SAM)作为甲基供体催化形成。
在哺乳动物基因组中,大约70-80%的CG二核苷酸中的胞嘧啶是甲基化修饰的,准确检测5mC对疾病的诊断有着十分深远的意义。目前,5mC的检测分为两类,包括5mC的整体含量检测和测序分析。已有的检测DNA中5mC整体含量的方法主要包括液相色谱/质谱法(LC/MS)、薄层色谱法(TLC)和电化学检测法。这些方法一般都需要对DNA进行水解消化,不能提供5mC在DNA序列中的位置信息。5mC的测序方法中,基于免疫沉淀的测序方法已被用于DNA中5mC的定位分析,如甲基化DNA免疫沉淀测序(MeDIP-seq)和甲基CpG结合域测序(MBD-seq)等。然而,这些基于免疫亲和富集的方法无法以单碱基分辨率检测5mC,且更偏向于富集高甲基化区域。基于限制性内切酶的方法(如MRE-seq和Methyl-MAPS)能够对5mC进行单碱基分辨率的分析,但其对序列特异性内切酶的依赖限制了CG的覆盖率,并且不完全酶切可能导致高假阳性结果。
亚硫酸氢盐测序(BS-seq)目前已被广泛用于5mC的定位分析,在BS-seq中,胞嘧啶在亚硫酸氢盐处理后被脱氨为尿嘧啶,但5mC抵抗脱氨,不会发生转化。通过测序可以区分C和5mC,因为它们分别被读作胸腺嘧啶和胞嘧啶。然而,BS-seq需要苛刻的化学脱氨条件,从而导致高达99.9%的DNA被降解。随后,有人开发了TET辅助的吡啶硼烷测序(TAPS)法用于5mC的测序。在TAPS中,5mC被TET蛋白氧化为5-羧基胞嘧啶(5caC),然后5caC被吡啶硼烷还原为二氢尿嘧啶。二氢尿嘧啶在随后的PCR扩增中与腺嘌呤配对,因此实现5mC到胸腺嘧啶的转变,从而实现5mC的测序。最近有人开发了一种EM-seq的方法来绘制5mC。在EM-seq中,人载脂蛋白B mRNA编辑催化亚基3A(APOBEC3A,A3A)脱氨酶被用来将胞嘧啶脱氨形成尿嘧啶;而5mC被TET蛋白氧化成5caC,转化后的5caC对A3A脱氨有抵抗作用。这种技术依赖于DNA的酶促脱氨,因此不需要进行亚硫酸氢盐处理。然而,EM-seq涉及三种酶和两个不同的测序库的制备,方法复杂。此外,TAPS测序法和EM-seq测序法均涉及TET蛋白氧化5mC为5caC,然而,TET蛋白不能完全将5-mC氧化为5caC,导致假阴性结果的产生。
因此,如何一种有必要开发一种无需亚硫酸氢盐处理、单碱基分辨率和定量检测5mC的方法。
发明内容
为了解决所述技术问题,本发明提供了一种DNA甲基转移酶结合胞嘧啶脱氨酶介导的DNA中5-甲基胞嘧啶的单碱基定位分析方法,不依赖于亚硫酸氢盐处理,且具有高选择性,操作简单。
为了实现上述目的,本发明采用如下技术方案:
在本发明的第一方面,提供了一种DNA甲基转移酶结合胞嘧啶脱氨酶介导的DNA中5-甲基胞嘧啶的单碱基定位分析方法,所述方法包括:
采用DNA甲基转移酶对待检DNA进行羧甲基化标记反应,后变性处理以使DNA甲基转移酶灭活而终止反应,获得羧甲基化标记的DNA;
采用胞嘧啶脱氨酶对所述羧甲基化标记DNA进行脱氨基反应,后进行高温灭活处理以使胞嘧啶脱氨酶灭活而终止反应,获得脱氨基DNA样品;
将所述脱氨基DNA样品进行PCR反应,获得扩增产物;
将所述扩增产物测序,获得5-甲基胞嘧啶的位点信息。
进一步地,所述羧甲基化标记反应的条件为:双链DNA在含Tris-HCl 5~20mM、pH7.0~8.5、NaCl 20~100mM、二硫苏糖醇0.2~2mM、EDTA 0.2~2mM、羧基-S-腺苷-L-甲硫氨酸80~640mM、M.MpeI-N374K蛋白1~10μM的反应体系中,于30~45℃反应0.5~6小时。
进一步地,所述变性处理的方法为:在0~60% DMSO存在下,将DNA在90~98℃高温下孵育2~30分钟。
进一步地,所述脱氨基反应的条件为:DNA在含2-(N-吗啉)乙磺酸10~30mM、Triton X-100 0.05~0.5%、pH 5.5~7.5、A3A蛋白1~10μM的反应体系中,于30~45℃反应0.5~4小时。
进一步地,所述高温灭活处理的条件包括:于92~98℃水浴中孵育5~20min。
在本发明的第二方面,提供了一种DNA甲基转移酶和胞嘧啶脱氨酶的组合在对DNA中5-甲基胞嘧啶进行单碱基分辨率定位的分析方法中的应用。
在本发明的第三方面,提供了一种用于对DNA中5-甲基胞嘧啶进行单碱基分辨率定位的试剂盒,所述试剂盒包括DNA甲基转移酶和胞嘧啶脱氨酶。
进一步地,所述试剂盒还包括:
采用DNA甲基转移酶进行羧甲基化的反应体系:Tris-HCl 5~20mM、pH 7.0~8.5、NaCl 20~100mM、二硫苏糖醇0.2~2mM、EDTA0.2~2mM、羧基-S-腺苷-L-甲硫氨酸80~640mM、M.MpeI-N374K蛋白1~10μM;
采用胞嘧啶脱氨酶进行脱氨基的反应体系:DNA在含2-(N-吗啉)乙磺酸10~30mM、Triton X-100 0.05~0.5%、pH 5.5~7.5、A3A蛋白1~10μM的反应体系中,于30~45℃反应0.5~4小时。
本发明实施例中的一个或多个技术方案,至少具有如下技术效果或优点:
本发明提供的DNA甲基转移酶结合胞嘧啶脱氨酶介导的DNA中5-甲基胞嘧啶的单碱基定位分析方法,原理见图1,DNA甲基转移酶的突变体M.MpeI-N374K,以羧基-S-腺苷-L-甲硫氨酸为辅助因子,选择性地将羧甲基转移到CG二核苷酸中胞嘧啶的C5位,形成5-羧甲基胞嘧啶。在胞嘧啶脱氨酶A3A蛋白处理后,5-羧甲基胞嘧啶能够抵抗脱氨,因此在随后的聚合酶链式反应扩增中扩增为胞嘧啶,而目标分析物5mC无法被DNA甲基转移酶标记,且能够被A3A完全脱氨,在随后的聚合酶链式反应中扩增为胸腺嘧啶。因此,只有5-甲基胞嘧啶才能在最终的测序中被读为胸腺嘧啶。具备如下优点:
(1)本发明的方法方法操作简便,无需复杂的样品前处理;
(2)无需对DNA样品进行亚硫酸氢盐处理,反应条件温和,不会造成DNA的大量降解,可直接获得DNA中5-甲基胞嘧啶的单碱基分辨率定位信息;
(3)本发明DNA用量小,仅需100ng的基因组DNA即可对5mC进行定位分析。
(4)本发明无需TET蛋白氧化5mC,避免了TET氧化不完全造成假阴性结果的问题。
(5)本发明涉及的DNA甲基转移酶对转移羧甲基效率高(>90%),有利于5mC的准确分析。
(6)本发明涉及的胞嘧啶脱氨酶5mC具有高效的脱氨效率(97%),而对5camC的脱氨基效率很低(<0.1%),有利于5mC的定位分析,定位分析准确率高。
(7)本发明涉及的方法能够广泛应用于DNA中5mC修饰定位与定量的研究,并有助于对5mC的生物学功能进行更加深入的研究。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
图1为本发明示意图。本发明中,C被M.MpeI-N374K标记上羧甲基,生成5camC,后者能够抵抗A3A蛋白的脱氨作用,而5mC不被标记且能够被A3A转化为T。因此,在测序时,只有5mC能够被读成T。
图2为本发明中利用变性聚丙烯酰胺凝胶电泳检测人工合成的DNA链(49-CG-FAM)被DNA甲基转移酶M.MpeI野生型(WT)与突变型(N374K)标记的效率。
图3A为本发明中利用LC-MS/MS检测人工合成的DNA链经羧甲基化标记后进行脱氨基处理前后5camC含量对比图。
图3B为本发明中利用LC-MS/MS检测人工合成的含有5mC修饰的DNA链经羧甲基化标记后进行脱氨基处理前后5mC含量对比图。
图4A为本发明中人工合成的不含5mC修饰的DNA链(DNA-C)和5mC修饰的DNA链(DNA-5mC)经M.MpeI-N374K羧甲基化标记与A3A蛋白处理后,Sanger测序的读出结果,其中DNA-C中的C经羧甲基化标记与A3A蛋白处理后均未突变,仍读作C;DNA-5mC中的5mC经羧甲基化标记与A3A脱氨后均突变为T。
图4B为不同比例的人工合成的不含5mC修饰的DNA链(DNA-C)和5mC修饰的DNA链(DNA-5mC)混合后,采用本发明中的方法测得的TCG位点处T/(C+T)峰高比值与理论5mC含量的相关性。
图4C为不同比例的人工合成的不含5mC修饰的DNA链(DNA-C)和5mC修饰的DNA链(DNA-5mC)混合后,采用本发明中的方法测得的CCG位点处T/(C+T)峰高比值与理论5mC含量的相关性。
图4D为不同比例的人工合成的不含5mC修饰的DNA链(DNA-C)和5mC修饰的DNA链(DNA-5mC)混合后,采用本发明中的方法测得的GCG位点处T/(C+T)峰高比值与理论5mC含量的相关性。
图4E为不同比例的人工合成的不含5mC修饰的DNA链(DNA-C)和5mC修饰的DNA链(DNA-5mC)混合后,采用本发明中的方法测得的ACG位点处T/(C+T)峰高比值与理论5mC含量的相关性。
图5A为通过本发明方法对人肺癌及癌旁组织DNA中RARB基因启动子的5mC进行单碱基分辨率检测。阴性对照是通过A3A蛋白对基因组DNA直接进行脱氨的结果。
图5B为通过本发明方法对肺癌旁和肺癌组织DNA的RARB基因启动子区域9个CG位点的5mC含量的定量结果。um,未甲基化。n.s.,无显著差异;*p<0.05(n=3);**p<0.01(n=3);***p<0.001(n=3)。
图5C为通过本发明方法和亚硫酸氢盐测序法对肺癌旁组织DNA的RARB基因启动子区域5mC含量的相关性分析。结果表明二者相关性良好,皮尔逊相关系数为0.937。
图5D为为通过本发明方法和亚硫酸氢盐测序法对肺癌组织DNA的RARB基因启动子区域5mC含量的相关性分析。结果表明二者相关性良好,皮尔逊相关系数为0.916。
图6为评价本发明方法和亚硫酸氢盐测序法中DNA的降解情况。将不同起始用量的DNA进行本发明方法和商品化亚硫酸氢盐方法(QIAGEN)处理后,进行PCR扩增,扩增产物在1.5%琼脂糖凝胶分离并检测。
具体实施方式
下文将结合具体实施方式和实施例,具体阐述本发明,本发明的优点和各种效果将由此更加清楚地呈现。本领域技术人员应理解,这些具体实施方式和实施例是用于说明本发明,而非限制本发明。
在整个说明书中,除非另有特别说明,本文使用的术语应理解为如本领域中通常所使用的含义。因此,除非另有定义,本文使用的所有技术和科学术语具有与本发明所属领域技术人员的一般理解相同的含义。若存在矛盾,本说明书优先。
除非另有特别说明,本发明中用到的各种原材料、试剂、仪器和设备等,均可通过市场购买得到或者可通过现有方法制备得到。
本发明实施例提供的技术方案为解决上述技术问题,总体思路如下:
根据本发明实施例一种典型的实施方式,提供一种DNA甲基转移酶结合胞嘧啶脱氨酶介导的DNA中5-甲基胞嘧啶的单碱基定位分析方法,所述方法包括:
S1、采用DNA甲基转移酶对待检DNA进行羧甲基化标记反应,后变性处理以使DNA甲基转移酶灭活而终止反应,获得羧甲基化标记的DNA;
所述步骤S1中,
所述羧甲基化标记反应的条件为:双链DNA在含Tris-HCl 5~20mM、pH 7.0~8.5、NaCl 20~100mM、二硫苏糖醇0.2~2mM、EDTA 0.2~2mM、羧基-S-腺苷-L-甲硫氨酸80~640mM、DNA甲基转移酶(M.MpeI-N374K蛋白)1~10μM的反应体系中,于30~45℃反应0.5~6小时。在具体的实施方式中,M.MpeI-N374K蛋白的浓度具体根据实际蛋白的活性来确定。所述羧甲基化标记反应的条件有利于保证DNA甲基转移酶的活性和羧甲基化标记反应的效率
所述变性处理的方法为:在0~60% DMSO存在下,将DNA在90~98℃高温下孵育2~30分钟。所述变性处理有利于后续的脱氨基反应。
作为优选地,所述DNA甲基转移酶为氨基酸序列如SEQ ID NO.1所示的M.MpeI-N374K蛋白。
在Mycoplasma penetrans中发现了一种CG特异性甲基转移酶M.MpeI。研究发现,M.MpeI的突变体(M.MpeI-N374K蛋白)可以将羧甲基从羧基-S-腺苷-L-甲硫氨酸(caSAM)转移到CG处的胞嘧啶,形成5-羧甲基胞嘧啶(5camC)。凭借5camC的独特性质,我们提出了一种无需亚硫酸氢盐处理、单碱基分辨率和定量检测5mC的方法,通过甲基转移酶标记结合A3A脱氨对DNA中的5mC进行测序。
S2、采用胞嘧啶脱氨酶对所述羧甲基化标记DNA进行脱氨基反应,后进行高温灭活处理以使胞嘧啶脱氨酶灭活而终止反应,获得脱氨基DNA样品;
所述步骤S2中,
所述脱氨基反应的条件为:DNA在含2-(N-吗啉)乙磺酸10~30mM、Triton X-1000.05~0.5%、pH 5.5~7.5、A3A蛋白1~10μM的反应体系中,于30~45℃反应0.5~4小时。选择上述成分组成的缓冲液的原因可以保证脱氨酶的活性和脱氨反应的效率。
所述高温灭活处理的条件包括:于92~98℃水浴中孵育5~20min。该反应条件有利于胞嘧啶脱氨酶灭活,从而有利于后续的PCR扩增过程。
作为优选的实施方式,所述的胞嘧啶脱氨酶为氨基酸序列如SEQ ID NO.2所示的A3A蛋白。
S3、将所述脱氨基DNA样品进行PCR反应,获得扩增产物;
所述PCR反应中需要使用与特异性引物对羧甲基保护及脱氨后的DNA进行扩增。扩增产物进行琼脂糖凝胶电泳,切胶纯化,进行Sanger测序。针对不同的待测DNA需要设计相对应的引物。
S4、将所述扩增产物测序,获得5-甲基胞嘧啶的位点信息。
若PCR扩增得到的是特定序列的DNA片段,扩增产物可以直接进行Sanger测序;若PCR扩增形成DNA文库,则将扩增产物进行高通量测序。
作为一种具体的实施方式,所述方法的具体操作步骤为:
(1)合成羧基-S-腺苷-L-甲硫氨酸。
(2)配制高浓度的M.MpeI-N374K反应缓冲液的储存液:Tris-HCl 100mM、pH 7.0~8.5、NaCl 500mM、二硫苏糖醇10mM、EDTA 10mM。
(3)配制高浓度的A3A反应缓冲液的储存液:200mM 2-(N-吗啉)乙磺酸(MES),1%的triton X-100,pH为5.5-7.5。
(4)表达并纯化M.MpeI-N374K蛋白。
(5)表达并纯化A3A蛋白。
(6)从生物样品中提取DNA,用RNaseA酶将DNA中的RNA去除。
(7)取100ng提取的DNA,超声进行片段化处理,片段化大小为300-500bp。
(8)将步骤(7)片段化后的DNA冷冻旋干,加入2μL水、0.5μL步骤(1)合成的羧基-S-腺苷-L-甲硫氨酸(终浓度80~640mM)、0.5μL步骤2配制的M.MpeI-N374K反应缓冲液和2μLM.MpeI-N374K蛋白,30~45℃下反应0.5~6小时。反应结束后,将样品加热至75~98℃变性2~30分钟使蛋白失活。
(9)在步骤(8)的DNA中加入2~12μL的DMSO,加水至16μL,在90~98℃水浴中孵育2~30分钟,随后立即转移至冰水浴中猝火。加入2μL步骤(1)配制的A3A反应缓冲液,加入2μL的A3A蛋白(终浓度1~10μM),30~45℃下反应0.5~4小时。反应结束后,将样品加热至75~98℃变性2~30分钟使蛋白失活。
(8)PCR反应,获得扩增产物,后测序并分析。
根据本发明实施例另一种典型的实施方式,提供了一种DNA甲基转移酶和胞嘧啶脱氨酶的组合在对DNA中5-甲基胞嘧啶进行单碱基分辨率定位的分析方法中的应用。
根据本发明实施例另一种典型的实施方式,提供了一种用于对DNA中5-甲基胞嘧啶进行单碱基分辨率定位的试剂盒,所述试剂盒包括:DNA甲基转移酶和胞嘧啶脱氨酶。
所述试剂盒还包括:
采用DNA甲基转移酶进行羧甲基化的反应体系:Tris-HCl 5~20mM、pH 7.0~8.5、NaCl 20~100mM、二硫苏糖醇0.2~2mM、EDTA 0.2~2mM、羧基-S-腺苷-L-甲硫氨酸80~640mM、M.MpeI-N374K蛋白1~10μM;
采用胞嘧啶脱氨酶进行脱氨基的反应体系:DNA在含2-(N-吗啉)乙磺酸10~30mM、Triton X-100 0.05~0.5%、pH 5.5~7.5、A3A蛋白1~10μM的反应体系中,于30~45℃反应0.5~4小时。
下面将结合实施例及实验数据对本申请的效果进行详细说明。若未特别指明,实施例中所用的技术手段包括核酸的提取、酶解以及聚合酶链式反应为本领域技术人员所熟知的常规手段。
实施例1.利用人工合成的DNA链区分胞嘧啶和5-甲基胞嘧啶
A.羧基-S-腺苷-L-甲硫氨酸的合成
为了利用DNA甲基转移酶M.MpeI-N374K进行羧甲基化标记,首先合成了羧甲基供体羧基-S-腺苷-L-甲硫氨酸(carboxy-S-adenosyl-L-methionine,caSAM)。合成方法为:将10mg S-腺苷-L-高半胱氨酸溶解于1.7mL 150mM碳酸氢铵水溶液中,混合后加入340mg碘乙酸,37℃下反应24小时。然后,加入12mL冰甲醇,-80℃中静置12小时,在4℃下以2000rpm离心30分钟,用冰甲醇洗涤两次,离心分离出沉淀物。最后再用液相色谱纯化,得到纯净的caSAM。
B.羧甲基化标记验证
为了验证本发明中DNA甲基转移酶M.MpeI-N374K的羧甲基化效率,选择了一条FAM标记的49bp DNA链与M.MpeI-N374K蛋白和caSAM反应,通过限制性酶酶切结合聚丙烯酰胺凝胶电泳验证反应效率。
(1)49bp DNA链序列
5′-AATTATTAAAAATATATAAAACCGGATTAAATATAATATAAATATAATT-FAM-3′
3′-TTAATAATTTTTATATATTTTGGCCTAATTTATATTATATTTATATTAA-5′
(2)49bp DNA链进行羧甲基标记
反应总体积5μL,包含2μL 1μM的49bp DNA链、0.5μL步骤(1)合成的caSAM(终浓度320mM)、0.5μL M.MpeI-N374K反应缓冲液(Tris-HCl 100mM、pH 8.0、NaCl 500mM、二硫苏糖醇10mM、EDTA 10mM)和2μL M.MpeI-N374K蛋白(终浓度3.2μM),37℃下反应4小时。反应结束后,将样品加热至95℃变性5分钟使蛋白失活。
(3)限制性酶酶切结合聚丙烯酰胺凝胶电泳验证羧甲基化效率
HpaII(NEB)是一种对5mC敏感的限制性内切酶,能够特异性识别并切割CCGG序列,当CCGG中第二个C被5mC取代后,HpaII不能切割。同样地,当CCGG中第二个C被5-羧甲基胞嘧啶(5camC)取代后,HpaII也不能切割。因此,能够通过检测DNA链是否被保护不被HpaII切割来评估羧甲基化效率(图2)。
上述步骤(2)中反应后的DNA经缓慢退火恢复双链后,加入2μL HpaII反应缓冲液(NEB)和1μL HpaII(NEB),补加水至20μL,37℃反应1小时。反应结束后,将样品加热至95℃变性5分钟使蛋白失活。反应产物于20%变性聚丙烯酰胺凝胶电泳分离并检测。结果如图2所示,当以caSAM为羧甲基供体时,野生型M.MpeI没有羧甲基转移活性,而其突变体M.MpeI-N374K的所甲基化效率很高(>91%)。
C.液相色谱串联质谱分析5-羧甲基胞嘧啶和5-甲基胞嘧啶的脱氨效率
根据之前的研究,胞嘧啶脱氨酶A3A能够高效对C和5mC脱氨,而5mC的氧化产物,如5caC,能够强烈抑制脱氨。基于此,本发明验证了5-羧甲基胞嘧啶(5camC)的脱氨基活性。
(1)羧甲基化标记
反应所需DNA模板为未修饰和含5mC修饰的49bp DNA。
未修饰49bp DNA:
5′-AATTATTAAAAATATATAAAACCGGATTAAATATAATATAAATATAATT-3′/3′-TTAATAATTTTTATATATTTTGGCCTAATTTATATTATATTTATATTAA-5′。
5mC修饰49bp DNA:
5′-AATTATTAAAAATATATAAAAC5mCGGATTAAATATAATATAAATATAATT-3′/3′-TTAATAATTTTTATATATTTTGG5mCCTAATTTATATTATATTTATATTAA-5′。
反应总体积5μL,包含1μL 1μM的未修饰49bp DNA、1μL 1μM的5mC修饰49bp DNA、0.5μL caSAM(终浓度320mM)、0.5μL M.MpeI-N374K反应缓冲液(Tris-HCl 100mM、pH 8.0、NaCl 500mM、二硫苏糖醇10mM、EDTA 10mM)和2μL M.MpeI-N374K蛋白(终浓度3.2μM),37℃反应4小时。反应结束后,将样品加热至95℃变性5分钟使蛋白失活。
(2)DNA链进行脱氨反应
DNA链中加入2μL的DMSO,加水至16μL,在95℃水浴中孵育10分钟,随后立即转移至冰水浴中猝火。加入2μL A3A反应缓冲液(200mM MES,1% Triton X-100,pH 6.5),加入2μLA3A蛋白(终浓度6μM),37℃反应2小时。反应结束后,将样品加热至95℃变性5分钟使蛋白失活。
(3)液相色谱串联质谱分析5camC和5mC的脱氨效率
将A3A处理后的DNA酶解为核苷,利用液相色谱串联质谱分析A3A处理前后5camC和5mC含量的变化情况。如图3A-3B所示,A3A处理后5camC含量没有显著降低,仍保留99.9%的5camC;而A3A处理后5mC含量显著降低,脱氨效率达到97%。该结果表明,A3A蛋白可以对5mC高效脱氨,但不能使5camC脱氨。
D.Sanger测序验证本发明方法用于区分C和5mC
A3A蛋白对5mC和5camC的差异性脱氨作用为我们提供了机会,为了对DNA中5mC进行单碱基分辨率分析,我们利用Sanger测序对本发明方法进行了考察。
(1)216bp DNA链的合成
为了进行Sanger测序,首先合成了一段216bp不含修饰及含5mC修饰的DNA链(分别命名为DNA-C和DNA-5mC),与A3A蛋白反应,通过质谱和Sanger测序验证脱氨率。
在50μL的反应体系中,加入0.5ng pUC19质粒DNA(包含目标扩增序列,购自擎科公司),5μL 10×反应缓冲液,2.5U Taq DNA聚合酶(Takara),2μL 10μM正向引物(序列为5′-AGTGACGCTGAGCTTGACGTCGCGC-3′),2μL 10μM反向引物(序列为5′-CCAACATTCCACTAACAATTACTCTCT-3′),1μL dATP、dGTP、TTP和dCTP(浓度均为2.5mM)。当合成5mC修饰的DNA链时,以5mdCTP取代dCTP即可。
聚合酶链式反应(PCR)程序为:(1)95℃变性2min;(2)95℃变性15s;(3)52℃退火20s;(4)72℃延伸30s;(2)-(4)步重复35次;72℃延伸5min。对PCR产物利用试剂盒进行回收纯化(Omega Bio-Tek Inc.,Norcross,GA,USA)。利用微量分光光度计对合成的DNA浓度进行定量。
合成的216bp DNA-C序列如SEQ ID NO.3所示;合成的216bp DNA-5mC序列如SEQID NO.4所示。
AGTGACGCTGAGCTTGACGTCGCGCGATGAGAGGTGATTATGAGTATGTATAGTGTTAGGAAGAGTGTAGTAATAGGATGAAGATGATTATATGATCGATGGTCCGTATGCGTAGAATACGTTGTTGTAGTGATTATAATGGAGTGAGAATGTAGATGAGTGGAGTAGGTAGTAAGATGTAGTGGTGACAGAGAGTAATTGTTAGTGGAATGTTGG(SEQID NO.3);
AGTGACGCTGAGCTTGACGTCGCGCGATGAGAGGTGATTATGAGTATGTATAGTGTTAGGAAGAGTGTAGTAATAGGATGAAGATGATTATATGAT 5mCGATGGT5mC 5mCGTATG 5mCGTAGAATA 5mCGTTGTTGTAGTGATTATAATGGAGTGAGAATGTAGATGAGTGGAGTAGGTAGTAAGATGTAGTGGTGA5mCAGAGAGTAATTGTTAGTGGAATGTTGG(SEQ ID NO.4)。
(2)人工合成的DNA链进行羧甲基化标记及脱氨反应
取10ng DNA-C或DNA-5mC进行羧甲基化反应,反应条件同步骤B(2)。随后进行A3A脱氨,脱氨条件同步骤C(2)。
(3)Sanger测序分析
在对2种人工合成的DNA链进行羧甲基化标记和A3A处理后,利用特异性引物(正向引物:5’-AGTGACGTTGAGTTTGACGTC-3’;反向引物:5’-CCAACATTCCACTAACAATTACTCTCTA-3’)进行PCR扩增。扩增程序为:95℃变性30s;35次循环包含95℃变性30s,52℃退火30s,68℃延伸1min;68℃延伸5min。扩增产物直接进行Sanger测序。
图4A的结果表明,在M.MpeI-N374K和A3A处理后,DNA-5mC中的所有5mC都被读作T。相反,DNA-C中CG位点的所有C在M.MpeI-N374K和A3A处理后被读作C。由于只有CG位点的C被M.MpeI-N374K羧甲基化,非CG位点的C(CCGG位点的第一个胞嘧啶)也被脱氨并读作T。这些结果表明,在本发明方法中,CG位点的C和5mC分别被读作C和T,表明本发明方法可以很好地区分DNA中CG位点的C和5mC。
接下来我们用本发明方法定量评估了单个CG位点的5mC水平。我们制备了各种DNA-C和DNA-5mC不同比例的混合物,DNA-5mC/(DNA-C+DNA-5mC)的摩尔百分比为0%、33%、66%和100%。在本发明中,序列中产生的C和T代表原始的C和5mC。因此,测量的T/(C+T)的比率可以表现出个别CG位点的5mC水平。如图4B-4E所示,Sanger测序结果显示,从原始TCG、CCG、GCG和ACG序列中测得的5mC水平与理论上的5mC百分比成正比(TCG:斜率=0.85,R2=0.96;CCG:斜率=0.95,R2=0.95;GCG:斜率=0.77,R2=0.98;ACG:斜率=0.88,R2=0.95),表明本发明方法能够对单个CG位点的5mC进行定量检测。
实施例2.人类基因组DNA特定位点中5mC的定量分析
我们接下来应用本发明方法对基因组DNA中特定位点的5mC水平进行量化。我们分析了视黄酸受体β(RARB)基因启动子区域的5mC水平,RARB是一种肿瘤抑制基因,已知可调节许多的生物过程。RARB基因启动子的高甲基化被认为是预测非小细胞肺癌(NSCLC)早期复发的重要因素。应用本发明方法进行基因组中5mC定位分析具体包括如下步骤:
A.收集一对NSCLC肺癌旁及肺癌组织,根据制造商的推荐程序,使用组织DNA试剂盒(Omega)提取基因组DNA。
B.使用超声波均质器(Scientz)将基因组DNA分割成平均大小为300-500bp的片段。
C.然后实施例1中的方法,用M.MpeI-N374K对100ng的片段化DNA进行羧甲基化标记和A3A脱氨。作为对照,直接对100ng的片段化DNA进行A3A脱氨。
D.脱氨后的DNA通过PCR进行扩增,扩增体系包含:
表1
RARB-F:5’-GGTTAGGAGGGTTTATTTTTTGTTAA-3’;
RARB-R:5’-AATCATTTACCATTTTCCAAACTTACT-3’。
扩增程序为:
表2
E.扩增产物直接进行Sanger测序。
F.为了对比亚硫酸氢盐测序法,采用商品化试剂盒(QIAGEN)进行亚硫酸氢盐脱氨处理,然后利用引物RARB-F和RARB-R进行PCR扩增,扩增产物进行Sanger测序。
我们采用本发明方法分析了RARB基因启动子Chr3:25,428,373-25,428,436区域CG位点的5mC水平(图5A)。本发明采用M.MpeI-N374K和caSAM作为辅助因子对来自肿瘤或肿瘤邻近的肺组织的基因组DNA进行羧甲基化,然后进行A3A处理和Sanger测序。为了排除其他DNA胞嘧啶修饰(如5caC)的干扰,采用未经M.MpeI-N374K处理的基因组DNA作为对照。结果显示,在A3A处理后,所有CG位点的C/5mC都被读作T(图5A)。接下来,我们采用本发明方法来定量CG位点的5mC水平(图5B)。定量结果表明,在RARB基因启动子的9个CG位点中,有7个位点的5mC水平在肺部肿瘤DNA中显著升高(P<0.05,图5B)。这些结果通过传统的亚硫酸盐测序得到进一步证实(图5C-5D)。利用本发明方法得到的5mC水平与亚硫酸氢盐测序得到的水平相当(Pearson's r=0.94和0.92,图5C-5D)。
由于常规的亚硫酸氢盐处理可能导致基因组DNA的严重降解,因此本应用例比较了使用本发明方法或亚硫酸氢盐测序的基因组DNA的降解情况。将片段化后的基因组DNA(300-500bp)进行本发明方法或亚硫酸氢盐测序分析。脱氨后,RARB基因启动子的247bp区域被PCR扩增。如图6,在亚硫酸氢盐测序法中,至少需要10ng的起始基因组DNA可以检测到247bp的扩增产物。然而,利用本发明方法,只需0.1ng的起始基因组DNA就能清楚地检测到扩增产物。这一结果表明,在只有有限的DNA样本的情况下,本发明方法优于亚硫酸氢盐测序法。
综上,本发明方法能够在有限的DNA样本中对区域DNA中CG位点的上5mC进行定量和单碱基分辨率检测,结合高通量测序,本发明方法应该能够实现CG位点5mC的全基因组测序。
最后,还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。
尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。
Claims (8)
1.一种DNA甲基转移酶结合胞嘧啶脱氨酶介导的DNA中5-甲基胞嘧啶的单碱基定位分析方法,其特征在于,所述方法包括:
采用DNA甲基转移酶对待检DNA进行羧甲基化标记反应,后变性处理以使DNA甲基转移酶灭活而终止反应,获得羧甲基化标记的DNA;
采用胞嘧啶脱氨酶对所述羧甲基化标记DNA进行脱氨基反应,后进行高温灭活处理以使胞嘧啶脱氨酶灭活而终止反应,获得脱氨基DNA样品;
将所述脱氨基DNA样品进行PCR反应,获得扩增产物;
将所述扩增产物测序,获得5-甲基胞嘧啶的位点信息。
2.根据权利要求1所述的一种DNA甲基转移酶结合胞嘧啶脱氨酶介导的DNA中5-甲基胞嘧啶的单碱基定位分析方法,其特征在于,所述羧甲基化标记反应的条件为:双链DNA在含Tris-HCl 5~20mM、pH 7.0~8.5、NaCl 20~100mM、二硫苏糖醇0.2~2mM、EDTA 0.2~2mM、羧基-S-腺苷-L-甲硫氨酸80~640mM、M.MpeI-N374K蛋白1~10μM的反应体系中,于30~45℃反应0.5~6小时。
3.根据权利要求1所述的一种DNA甲基转移酶结合胞嘧啶脱氨酶介导的DNA中5-甲基胞嘧啶的单碱基定位分析方法,其特征在于,所述变性处理的方法为:在0~60%DMSO存在下,将DNA在90~98℃高温下孵育2~30分钟。
4.根据权利要求1所述的一种DNA甲基转移酶结合胞嘧啶脱氨酶介导的DNA中5-甲基胞嘧啶的单碱基定位分析方法,其特征在于,所述脱氨基反应的条件为:DNA在含2-(N-吗啉)乙磺酸10~30mM、Triton X-100 0.05~0.5%、pH 5.5~7.5、A3A蛋白1~10μM的反应体系中,于30~45℃反应0.5~4小时。
5.根据权利要求1所述的一种DNA甲基转移酶结合胞嘧啶脱氨酶介导的DNA中5-甲基胞嘧啶的单碱基定位分析方法,其特征在于,所述高温灭活处理的条件包括:于92~98℃水浴中孵育5~20min。
6.DNA甲基转移酶和胞嘧啶脱氨酶的组合在对DNA中5-甲基胞嘧啶进行单碱基分辨率定位的分析方法中的应用。
7.一种用于对DNA中5-甲基胞嘧啶进行单碱基分辨率定位的试剂盒,其特征在于,所述试剂盒包括:DNA甲基转移酶和胞嘧啶脱氨酶。
8.根据权利要求7所述的一种用于对DNA中5-甲基胞嘧啶进行单碱基分辨率定位测序分析的试剂盒,其特征在于,所述试剂盒还包括:
采用DNA甲基转移酶进行羧甲基化的反应组分:Tris-HCl pH 7.0~8.5、NaCl、二硫苏糖醇、EDTA、羧基-S-腺苷-L-甲硫氨酸;
采用胞嘧啶脱氨酶进行脱氨基的反应组分:2-(N-吗啉)乙磺酸、Triton X-100。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211266818.9A CN115961001A (zh) | 2022-10-17 | 2022-10-17 | Dna甲基转移酶结合胞嘧啶脱氨酶介导的dna中5-甲基胞嘧啶的单碱基定位分析方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211266818.9A CN115961001A (zh) | 2022-10-17 | 2022-10-17 | Dna甲基转移酶结合胞嘧啶脱氨酶介导的dna中5-甲基胞嘧啶的单碱基定位分析方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115961001A true CN115961001A (zh) | 2023-04-14 |
Family
ID=87351836
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211266818.9A Pending CN115961001A (zh) | 2022-10-17 | 2022-10-17 | Dna甲基转移酶结合胞嘧啶脱氨酶介导的dna中5-甲基胞嘧啶的单碱基定位分析方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115961001A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117004717A (zh) * | 2023-05-10 | 2023-11-07 | 上海鲸舟基因科技有限公司 | 一种特异性检测5hmC的方法 |
CN118581073A (zh) * | 2024-08-07 | 2024-09-03 | 翌圣生物科技(上海)股份有限公司 | 胞嘧啶脱氨酶突变体及其在甲基化检测中的应用 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110358817A (zh) * | 2019-06-25 | 2019-10-22 | 武汉大学 | 脱氨酶辅助的dna中5-羧基胞嘧啶修饰单碱基分辨率定位分析方法 |
CN114134205A (zh) * | 2021-11-25 | 2022-03-04 | 武汉大学 | 脱氨酶介导的dna中n4-甲基胞嘧啶的单碱基分辨率定位分析方法 |
-
2022
- 2022-10-17 CN CN202211266818.9A patent/CN115961001A/zh active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110358817A (zh) * | 2019-06-25 | 2019-10-22 | 武汉大学 | 脱氨酶辅助的dna中5-羧基胞嘧啶修饰单碱基分辨率定位分析方法 |
CN114134205A (zh) * | 2021-11-25 | 2022-03-04 | 武汉大学 | 脱氨酶介导的dna中n4-甲基胞嘧啶的单碱基分辨率定位分析方法 |
Non-Patent Citations (1)
Title |
---|
谢能彬等: "脱氨酶介导的DNA中5-羟甲基胞嘧啶的定位分析及5-羟甲基胞嘧啶在肺癌发生与发展过程中的变化规律研究", 《第十一届全国化学生物学学术会议》, 18 November 2019 (2019-11-18), pages 197 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117004717A (zh) * | 2023-05-10 | 2023-11-07 | 上海鲸舟基因科技有限公司 | 一种特异性检测5hmC的方法 |
CN118581073A (zh) * | 2024-08-07 | 2024-09-03 | 翌圣生物科技(上海)股份有限公司 | 胞嘧啶脱氨酶突变体及其在甲基化检测中的应用 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11939628B2 (en) | Compositions and methods for analyzing modified nucleotides | |
US20230392191A1 (en) | Selective degradation of wild-type dna and enrichment of mutant alleles using nuclease | |
US12264364B2 (en) | Methods of preparing dual-indexed DNA libraries for bisulfite conversion sequencing | |
WO2017075436A1 (en) | Compositions and methods for determining modified cytosines by sequencing | |
JP2002512044A (ja) | アベーシック部位での核酸切断から得られる伸長可能な上流dnaフラグメントの生成を含む、核酸分子を特徴付ける方法。 | |
WO2018069450A1 (en) | Methylation biomarkers for lung cancer | |
CN115961001A (zh) | Dna甲基转移酶结合胞嘧啶脱氨酶介导的dna中5-甲基胞嘧啶的单碱基定位分析方法 | |
WO2014020124A1 (en) | Means and methods for the detection of dna methylation | |
CN114134205B (zh) | 脱氨酶介导的dna中n4-甲基胞嘧啶的单碱基分辨率定位分析方法 | |
WO2024056008A1 (zh) | 鉴别癌症的甲基化标志物及应用 | |
CN102016067A (zh) | 前列腺癌中gstp1高甲基化的检测 | |
CN114787385A (zh) | 用于检测核酸修饰的方法和系统 | |
US20080213781A1 (en) | Methods of detecting methylation patterns within a CpG island | |
WO2001044504A2 (en) | Method for detecting methylated cpg-containing nucleic acid | |
US20220307077A1 (en) | Conservative concurrent evaluation of dna modifications | |
WO2009079208A2 (en) | Methylation markers for cancer | |
WO2023122744A1 (en) | Methyltransferase application for evaluating the methylation status of a polynucleotide | |
WO2024064369A1 (en) | Methods for amplifying nucleic acids | |
KR20240150780A (ko) | 표적 핵산 포획 및 바코딩을 위한 시스템 및 방법 | |
CN117187221A (zh) | 人工改造脱氨酶辅助的dna中5-羟甲基胞嘧啶修饰单碱基分辨率定位分析方法 | |
Fernandez et al. | Methods for DNA Methylation Analysis | |
CA3107052A1 (en) | Methods and composition for targeted genomic analysis | |
EP1704255A1 (en) | Method for investigating cytosine methylation in dna by means of dna repair enzymes |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |