CN114093401B - 一种基于寡核苷酸芯片杂交的信息存储方法 - Google Patents
一种基于寡核苷酸芯片杂交的信息存储方法 Download PDFInfo
- Publication number
- CN114093401B CN114093401B CN202111336447.2A CN202111336447A CN114093401B CN 114093401 B CN114093401 B CN 114093401B CN 202111336447 A CN202111336447 A CN 202111336447A CN 114093401 B CN114093401 B CN 114093401B
- Authority
- CN
- China
- Prior art keywords
- oligonucleotide
- hybridization
- chip
- fluorescent
- oligonucleotide chip
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 108091034117 Oligonucleotide Proteins 0.000 title claims abstract description 152
- 238000009396 hybridization Methods 0.000 title claims abstract description 67
- 238000003860 storage Methods 0.000 title claims abstract description 65
- 238000000034 method Methods 0.000 title claims abstract description 29
- 238000013507 mapping Methods 0.000 claims abstract description 4
- 239000007850 fluorescent dye Substances 0.000 claims description 25
- 230000000295 complement effect Effects 0.000 claims description 24
- 108091033380 Coding strand Proteins 0.000 claims description 19
- 238000006243 chemical reaction Methods 0.000 claims description 10
- 230000015572 biosynthetic process Effects 0.000 claims description 9
- 238000003786 synthesis reaction Methods 0.000 claims description 9
- 239000000463 material Substances 0.000 claims description 8
- 238000001917 fluorescence detection Methods 0.000 claims description 7
- 238000011065 in-situ storage Methods 0.000 claims description 7
- 238000005406 washing Methods 0.000 claims description 7
- 125000003636 chemical group Chemical group 0.000 claims description 6
- 125000003396 thiol group Chemical group [H]S* 0.000 claims description 6
- 238000000018 DNA microarray Methods 0.000 claims description 5
- XUIMIQQOPSSXEZ-UHFFFAOYSA-N Silicon Chemical compound [Si] XUIMIQQOPSSXEZ-UHFFFAOYSA-N 0.000 claims description 5
- 229910052710 silicon Inorganic materials 0.000 claims description 5
- 239000010703 silicon Substances 0.000 claims description 5
- 238000007641 inkjet printing Methods 0.000 claims description 4
- 238000012986 modification Methods 0.000 claims description 4
- 230000004048 modification Effects 0.000 claims description 4
- 238000001514 detection method Methods 0.000 claims description 3
- 230000005284 excitation Effects 0.000 claims description 3
- 239000011521 glass Substances 0.000 claims description 3
- 125000002887 hydroxy group Chemical group [H]O* 0.000 claims description 3
- 238000003384 imaging method Methods 0.000 claims description 3
- 150000008300 phosphoramidites Chemical class 0.000 claims description 3
- 239000000758 substrate Substances 0.000 claims description 3
- 125000003172 aldehyde group Chemical group 0.000 claims 2
- 125000003277 amino group Chemical group 0.000 claims 2
- 108020004414 DNA Proteins 0.000 description 26
- 102000053602 DNA Human genes 0.000 description 26
- 238000005516 engineering process Methods 0.000 description 15
- 230000008901 benefit Effects 0.000 description 8
- 239000007853 buffer solution Substances 0.000 description 4
- 238000013500 data storage Methods 0.000 description 4
- 238000009826 distribution Methods 0.000 description 4
- 125000002485 formyl group Chemical class [H]C(*)=O 0.000 description 4
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 239000000523 sample Substances 0.000 description 4
- 239000000243 solution Substances 0.000 description 4
- 238000011161 development Methods 0.000 description 3
- 238000012163 sequencing technique Methods 0.000 description 3
- 230000006820 DNA synthesis Effects 0.000 description 2
- 229920001213 Polysorbate 20 Polymers 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 230000007547 defect Effects 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 239000003599 detergent Substances 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000007865 diluting Methods 0.000 description 2
- 238000001035 drying Methods 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 238000002493 microarray Methods 0.000 description 2
- 238000004377 microelectronic Methods 0.000 description 2
- 235000010486 polyoxyethylene sorbitan monolaurate Nutrition 0.000 description 2
- 239000000256 polyoxyethylene sorbitan monolaurate Substances 0.000 description 2
- 230000035484 reaction time Effects 0.000 description 2
- 238000001712 DNA sequencing Methods 0.000 description 1
- 108091028043 Nucleic acid sequence Proteins 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000002950 deficient Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 102000004169 proteins and genes Human genes 0.000 description 1
- 108090000623 proteins and genes Proteins 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11C—STATIC STORES
- G11C11/00—Digital stores characterised by the use of particular electric or magnetic storage elements; Storage elements therefor
- G11C11/54—Digital stores characterised by the use of particular electric or magnetic storage elements; Storage elements therefor using elements simulating biological cells, e.g. neuron
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/12—Computing arrangements based on biological models using genetic models
- G06N3/123—DNA computing
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biophysics (AREA)
- Health & Medical Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Theoretical Computer Science (AREA)
- Molecular Biology (AREA)
- Biomedical Technology (AREA)
- General Health & Medical Sciences (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Computational Linguistics (AREA)
- Artificial Intelligence (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Genetics & Genomics (AREA)
- Neurology (AREA)
- Computer Hardware Design (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本发明公开了一种基于寡核苷酸芯片杂交的信息存储方法,包括如下目标信息写入的步骤:(1)将目标信息转换为二进制代码,然后将二进制代码分割为若干字段,每个所述字段对应寡核苷酸芯片上的一个位点,每个位点包含N个二进制数位;(2)将每个位点的N个二进制数位上的1/0值映射为N种寡核苷酸编码链的有/无组合,得到寡核苷酸芯片上所有所述位点需要添加的寡核苷酸编码链组合列表;(3)根据寡核苷酸编码链组合列表将寡核苷酸编码链以共价键方式固定在所述寡核苷酸芯片表面的所述位点中,完成目标信息在寡核苷酸芯片上的写入。本申请实现了多种复杂文件格式的存取,并行性好,信噪比高,存取速度快,准确性好。
Description
技术领域
本发明属于信息存储技术领域,特别涉及一种基于寡核苷酸芯片杂交的信息存储方法。
背景技术
随着互联网、云计算、5G通信、人工智能等领域快速发展,人类社会产生的各类数字化信息呈指数增加,以硅基微电子为主流的存储介质供应越来越难以满足需求,大规模信息存储问题日益凸显。此外,硅基微电子存储系统不仅存储容量有限,而且保存时间短,易损坏,抗干扰性差。因此,现有数据信息储存技术面临严重瓶颈,急需寻求新型存储介质。
脱氧核糖核酸(DNA)是生物界经亿万年演化而选择的遗传物质。作为天然信息分子,DNA具有存储密度极大、保存时间极长等优点,是一种理想的存储替代介质。用DNA编码数据信息,可使数据储存技术的信息密度和稳定性有数量级的提升。
目前,主流DNA存储技术是依靠DNA序列本身进行信息编码,需要合成DNA长链或复杂序列组合进行信息写入,并通过DNA测序进行信息读取;其合成写入与测序读取过程均包含沿线性分子链的逐次读写步骤,严重影响了读写的并行性,使得整个过程极为耗时,难以实用化。此外,该技术还存在合成成本高、测序拼接错误率高、硬加密手段匮乏等不足,这些不足阻碍了该技术在数据存储领域的发展和应用。因此,开发实用化的DNA杂交存储技术,充分发挥DNA杂交并行存储的优势,就成为本领域亟待解决的问题。
发明内容
为解决目前技术存在的缺陷,针对现有DNA杂交存储技术存储密度低、信息读写准确率差、读写速度慢和存储成本高等问题,本发明的目的在于提供一种基于寡核苷酸芯片杂交的信息存储方法。该信息存储方法存储密度高,信息读写准确率高,读写速度快,存储成本较低,可以很好的促进DNA杂交存储技术的实际应用。
本发明的目的通过下述技术方案实现:
一种基于寡核苷酸芯片杂交的信息存储方法,包括如下目标信息写入的步骤:
(1)将目标信息转换为二进制代码,然后将所述二进制代码分割为若干字段,每个所述字段对应寡核苷酸芯片上的一个位点,每个所述位点包含N个二进制数位(bit);
(2)将每个所述位点的N个二进制数位上的1/0值映射为N种寡核苷酸编码链的有/无组合,得到寡核苷酸芯片上所有所述位点需要添加的寡核苷酸编码链组合列表;
(3)根据所述寡核苷酸编码链组合列表将所述寡核苷酸编码链以共价键方式固定在所述寡核苷酸芯片表面的所述位点中,完成所述目标信息在所述寡核苷酸芯片上的写入。
本发明所用的寡核苷酸芯片为寡核苷酸微阵列芯片。
进一步地,步骤(1)中,所述N为≤8的正整数。
进一步地,步骤(2)中,所述寡核苷酸编码链为含有8~60个碱基的寡核苷酸编码链,各种所述寡核苷酸编码链互相之间的序列差异度大于50%。
进一步地,步骤(3)中,
所述以共价键方式固定在所述寡核苷酸芯片表面的所述位点的方法,优选为机械点样、喷墨打印、有掩膜原位合成和虚拟掩膜(即无掩膜)原位合成中的一种。
所述寡核苷酸编码链的修饰基团优选为亚磷酰胺、氨基、醛基和巯基中的一种。
所述寡核苷酸芯片的基质优选为表面附着有化学基团的硬质材料。
所述化学基团优选为羟基、氨基、醛基和巯基中的一种;所述硬质材料优选为玻璃、硅片和塑料中的一种。
进一步地,所述基于寡核苷酸芯片杂交的信息存储方法,还包括如下读取存储信息的步骤:
(4.1)将固定于所述寡核苷酸芯片上的所述寡核苷酸编码链与互补荧光探针进行杂交反应;
(4.2)在杂交反应完成后进行多次洗涤以去除多余的互补荧光探针,然后通过杂交荧光信号读取设备进行荧光检测,以所述寡核苷酸芯片各位点中各色荧光的有无来判断对应的所述寡核苷酸编码链的有无,进而得到所述寡核苷酸芯片上所有位点中的寡核苷酸编码链组合列表;
(4.3)将把所述寡核苷酸编码链组合列表还原为二进制代码,然后通过所述二进制代码还原得到所述目标信息。
进一步地,所述互补荧光探针优选为带有荧光基团修饰的寡核苷酸链;所述互补荧光探针与对应的所述寡核苷酸编码链在碱基配对上互补,所述互补荧光探针的种数与所述寡核苷酸编码链的种数相等,且各种所述互补荧光探针所带的荧光基团互不相同。
进一步地,所述荧光基团优选为Alexa488荧光基团、Cy3荧光基团、Cy5荧光基团和Cy7荧光基团中的一种。这些荧光基团相互间的发射波长差异较大,且能够在荧光检测仪器中被有效区分。
进一步地,所述杂交反应的温度优选为20~60℃。杂交反应的温度与所述寡核苷酸编码链的长度和所述寡核苷酸编码链的碱基GC含量相适应。也即,杂交反应的温度可以根据寡核苷酸编码链的长度和碱基GC含量而进行相应的调整。
进一步地,所述杂交反应的时间优选为0.5~1小时。
进一步地,所述杂交荧光信号读取设备优选为具备特定波长荧光激发和检测功能的生物芯片扫描仪或者带有成像系统的荧光显微镜。
本发明相对于现有技术具有如下的优点及效果:
(1)本发明可以根据目标信息转换的寡核苷酸组合列表,从预制寡核苷酸编码链库中选取特定组合,以共价键方式固定在寡核苷酸芯片的相应位点,完成目标信息在芯片上的写入。使用预制寡核苷酸编码链库,无需在存储过程中进行DNA合成,极大地提高了写入效率。
(2)本发明通过寡核苷酸芯片杂交和荧光检测进行信息读取,杂交过程是在寡核苷酸芯片表面所有数据存储位点同时进行,并行性极好,无需对DNA链上线性排列的碱基进行逐次读取,极大地提高了信息读取效率。
(3)本发明以寡核苷酸芯片为存储介质,信息存储密度高,单张芯片存储容量比前期使用多孔板为材料的DNA杂交存储提高了千倍以上,且在准确性、读写速度、成本等指标上均有数十倍至数百倍的改善,充分发挥了DNA杂交存储的优势,可极大促进DNA存储技术的实用化。
附图说明
图1为本发明实施例基于寡核苷酸芯片杂交的信息存储方法的基本流程示意图;
图2为本发明实施例基于寡核苷酸芯片杂交的信息存储方法的基本原理示意图。
具体实施方式
下面结合实施例对本发明作进一步详细的描述,但本发明的实施方式不限于此。
除非另有定义,否则本文中所用的全部技术术语和科学术语均具有如本发明所属领域普通技术人员通常理解的相同含义。
如本文所用,术语“含有”或“包括(包含)”可以是开放式、半封闭式和封闭式的。换言之,所述术语也包括“基本上由…构成”、或“由…构成”。
现有的DNA存储技术仅能编码48字节的多板孔实验对原理进行了验证,在存储密度、信息读写准确率、写入速度、读取速度和存储成本等指标上均距实用化相去甚远,无法体现出DNA杂交的并行优势。
实施例
本申请中的目标信息写入方式,是将原始信息转换得到的二进制码映射为数条寡核苷酸编码链在芯片上的顺序排布,并以此制成存有信息的寡核苷酸芯片实物;信息读取方式,是将互补荧光探针与芯片上的编码链进行杂交,通过芯片扫描仪检测杂交荧光信号,得出芯片各位点的编码链组合,再运用解码软件还原出原始信息。本申请通过寡核苷酸芯片杂交实现了多种复杂文件格式的存取,并行性好,信噪比高,在存取速度和准确性上比基于DNA长链合成与测序的存储技术具有明显优势。
本发明所用的寡核苷酸芯片为寡核苷酸微阵列芯片。
表1本发明相对于现有以多孔板为载体的DNA杂交存储技术指标的比较结果
1.序号 | 参数与指标名称 | 前期水平 | 本次实验水平 | 改善倍数 |
1 | 写入速度 | 24Bytes/h | 1800Bytes/h | 75倍 |
2 | 读取速度 | 1Bytes/min | 240Bytes/min | 240倍 |
3 | 读写成本 | 13.5元/Bytes | 0.25元/Bytes | 54倍 |
4 | 错误率(文本) | 9.1% | 0.063% | 144倍 |
5 | 存储密度 | 0.44Bytes/cm2 | 758Bytes/cm2 | 1723倍 |
上表1是本发明相对于现有以多孔板为载体的DNA杂交存储技术指标的比较结果。从表1可以看出,本申请在所有重要指标上均有大幅改善,可极大促进DNA杂交存储技术的实用化。
具体的,如图1和图2所示,本发明实施例提供一种基于寡核苷酸芯片杂交的信息存储方法,包括如下目标信息写入的步骤:
(1)将目标信息转换为二进制代码,然后将所述二进制代码分割为若干字段,每个所述字段对应寡核苷酸芯片上的一个位点,每个所述位点包含N个二进制数位(bit);
(2)将每个所述位点的N个二进制数位上的1/0值映射为N种寡核苷酸编码链的有/无组合,得到寡核苷酸芯片(即寡核苷酸芯片)上所有所述位点需要添加的寡核苷酸编码链组合列表;
(3)根据所述寡核苷酸编码链组合列表将所述寡核苷酸编码链以共价键方式固定在所述寡核苷酸芯片表面的所述位点中,完成所述目标信息在所述寡核苷酸芯片上的写入。
进一步地,步骤(1)中,所述N为≤8的正整数。
进一步地,步骤(2)中,所述寡核苷酸编码链为含有8~60个碱基的寡核苷酸编码链,各种所述寡核苷酸编码链互相之间的序列差异度大于50%。
进一步地,步骤(3)中,
所述以共价键方式固定优选为机械点样、喷墨打印、有掩膜原位合成和虚拟掩膜(即无掩膜)原位合成中的一种。
所述寡核苷酸编码链的修饰基团优选为亚磷酰胺、氨基、醛基和巯基中的一种。
所述寡核苷酸芯片的基质优选为表面附着有化学基团的硬质材料。
所述化学基团优选为羟基、氨基、醛基和巯基中的一种;所述硬质材料优选为玻璃、硅片和塑料中的一种。
进一步地,所述基于寡核苷酸芯片杂交的信息存储方法,还包括如下读取存储信息的步骤:
(4.1)将固定于所述寡核苷酸芯片上的所述寡核苷酸编码链与互补荧光探针进行杂交反应;
(4.2)在杂交反应完成后进行多次洗涤以去除多余的互补荧光探针,然后通过杂交荧光信号读取设备进行荧光检测,以所述寡核苷酸芯片各位点中各色荧光的有无来判断对应的所述寡核苷酸编码链的有无,进而得到所述寡核苷酸芯片上所有位点中的寡核苷酸编码链组合列表;
(4.3)将把所述寡核苷酸编码链组合列表还原为二进制代码,然后通过所述二进制代码还原得到所述目标信息。
进一步地,所述互补荧光探针优选为带有荧光基团修饰的寡核苷酸链;所述互补荧光探针与对应的所述寡核苷酸编码链在碱基配对上互补,所述互补荧光探针的种数与所述寡核苷酸编码链的种数相等,且各种所述互补荧光探针所带的荧光基团互不相同。
进一步地,所述荧光基团优选为Alexa488荧光基团、Cy3荧光基团、Cy5荧光基团和Cy7荧光基团中的一种。这些荧光基团相互间的发射波长差异较大,且能够在荧光检测仪器中被有效区分。
进一步地,所述杂交反应的温度优选为20~60℃。杂交反应的温度与所述寡核苷酸编码链的长度和所述寡核苷酸编码链的碱基GC含量相适应。也即,杂交反应的温度可以根据寡核苷酸编码链的长度和碱基GC含量而进行相应的调整。
进一步地,所述杂交反应的时间优选为0.5~1小时。
进一步地,所述杂交荧光信号读取设备优选为具备特定波长荧光激发和检测功能的生物芯片扫描仪或者带有成像系统的荧光显微镜。
具体的,在其中一个实施例中,以存储文本《唐诗三百首》为例:
在本实施例中,采用一块容量为60k个位点的寡核苷酸芯片为存储载体,使用A、B两种长度均为12个碱基的寡核苷酸编码链。每个位点按A、B编码链的有无可区分出四种状态,即A、B皆无(以字母O表示,对应二进制码00)、有A无B(以字母A表示,对应二进制码01)、有B无A(以字母B表示,对应二进制码10)、A、B皆有(以字母C表示,对应二进制码11),可编码2个二进制数位,该60k芯片共可编码120k数位(即15k字节)信息。本实施例所用《唐诗三百首》文本的汉字及符号共计6348个,占用字节数不超过12.7k,因此单张芯片即可存入全部文本,单位面积存储密度比前期基于多孔板杂交的DNA存储技术提高了1700多倍。
在本实施例中,所述基于寡核苷酸芯片杂交的信息存储方法,包括如下步骤:
(一)信息写入步骤:
步骤1、在本实施例中,选用存储文本《唐诗三百首》(共6348个汉字及符号);使用所述编解码软件将目标信息转换为二进制码序列(共103688个数位);
步骤2、使用所述编解码软件,将所述二进制码序列转换为芯片上各位点的寡核苷酸编码链组合列表(共51844个位点);
步骤3、根据所述芯片上各位点的寡核苷酸编码链组合列表,从预制寡核苷酸编码链库中选取相应编码链,以喷墨打印方式将编码链固定到寡核苷酸芯片的相应位点中,完成目标信息的写入;
(二)信息读取步骤:
步骤4、从预制荧光探针库中选取与所述寡核苷酸芯片上编码链A、B互补的一组荧光探针A’、B’,分别带有Cy3、Cy5荧光基团,用5xSSC缓冲液稀释成每种探针1uM浓度的杂交液;
步骤5、将所述寡核苷酸芯片浸入所述杂交液中,于27℃环境中低速(小于100rpm)振荡1小时进行杂交;
步骤6、杂交完成后用含有0.1%吐温-20去污剂的1xSSC缓冲液对所述寡核苷酸芯片进行3次洗涤,每次5分钟,去除多余探针,洗涤完后干燥芯片;
步骤7、将所述寡核苷酸芯片放入生物芯片扫描仪中进行红绿荧光扫描,得到Cy3和Cy5两个通道的荧光信号分布图像;
步骤8、将所述两个通道的荧光信号分布图像分别导入AGScan软件进行分析,在将荧光信号位点与芯片设计格栅对齐后,由软件自动判断格栅各位点荧光信号的有/无,并导出判断结果;
步骤9、将所述各位点两个通道荧光信号有/无的判断结果导入Excel软件,并以此还原出各位点寡核苷酸编码链组合列表(共51844个位点,正确率99.99%);
步骤10、将所述寡核苷酸编码链组合列表导入编解码软件,以此还原出列表对应的二进制码序列(共103688个数位),再以此进一步还原出目标信息《唐诗三百首》(共6348个汉字及符号,正确率99.94%)。
具体的,在另一实施例中,以存储声音《我和我的祖国》第一句歌词的歌声为例:在本实施例中,采用一块容量为60k个位点的寡核苷酸芯片为存储载体,使用A、B两种长度均为12个碱基的寡核苷酸编码链。每个位点按A、B编码链的有无可区分出四种状态,即A、B皆无(以字母O表示,对应二进制码00)、有A无B(以字母A表示,对应二进制码01)、有B无A(以字母B表示,对应二进制码10)、A、B皆有(以字母C表示,对应二进制码11),可编码2个二进制数位,该60k芯片共可编码120k数位(即15k字节)信息。本实施例所用歌声占用字节数约14.6k,因此单张芯片即可存入该歌声,单位面积存储密度比前期基于多孔板杂交的DNA存储技术提高了1700多倍。
在本实施例中,所述基于寡核苷酸芯片杂交的信息存储方法,包括如下步骤:
(三)信息写入步骤:
步骤1、在本实施例中,选用《我和我的祖国》第一句歌词歌声(14.6KB);使用所述编解码软件将目标信息转换为二进制码序列(共120377个数位);
步骤2、使用所述编解码软件,将所述二进制码序列转换为芯片上各位点的寡核苷酸编码链组合列表(共60188个位点);
步骤3、根据所述芯片上各位点的寡核苷酸编码链组合列表,从预制寡核苷酸编码链库中选取相应编码链,以原位固定方式将编码链固定到寡核苷酸芯片的相应位点中,完成目标信息的写入;
(四)信息读取步骤:
步骤4、从预制荧光探针库中选取与所述寡核苷酸芯片上编码链A、B互补的一组荧光探针A’、B’,分别带有Cy3、Cy5荧光基团,用5xSSC缓冲液稀释成每种探针1uM浓度的杂交液;
步骤5、将所述寡核苷酸芯片浸入所述杂交液中,于27℃环境中低速(小于100rpm)振荡1小时进行杂交;
步骤6、杂交完成后用含有0.1%吐温-20去污剂的1xSSC缓冲液对所述寡核苷酸芯片进行3次洗涤,每次5分钟,去除多余探针,洗涤完后干燥芯片;
步骤7、将所述寡核苷酸芯片放入生物芯片扫描仪中进行红绿荧光扫描,得到Cy3和Cy5两个通道的荧光信号分布图像;
步骤8、将所述两个通道的荧光信号分布图像分别导入AGScan软件进行分析,在将荧光信号位点与芯片设计格栅对齐后,由软件自动判断格栅各位点荧光信号的有/无,并导出判断结果;
步骤9、将所述各位点两个通道荧光信号有/无的判断结果导入Excel软件,并以此还原出各位点寡核苷酸编码链组合列表(共60188个位点,发现5个错误,正确率超99.99%);
步骤10、将所述寡核苷酸编码链组合列表导入编解码软件,以此还原出列表对应的二进制码序列(共120377个数位),再以此进一步还原出目标信息《我和我的祖国》第一句歌词歌声(约14.6KB)。
本发明可以根据目标信息转换的寡核苷酸组合列表,从预制寡核苷酸编码链库中选取特定组合,以共价键方式固定在寡核苷酸芯片的相应位点,完成目标信息在芯片上的写入。使用预制寡核苷酸编码链库,无需在存储过程中进行DNA合成,极大地提高了写入效率。
本发明通过寡核苷酸芯片杂交和荧光检测进行信息读取,杂交过程是在寡核苷酸芯片表面所有数据存储位点同时进行,并行性极好,无需对DNA链上线性排列的碱基进行逐次读取,极大地提高了信息读取效率。
本发明以寡核苷酸芯片为存储介质,信息存储密度高,单张芯片存储容量比前期使用多孔板为材料的DNA杂交存储提高了千倍以上,且在准确性、读写速度、成本等指标上均有数十倍至数百倍的改善,充分发挥了DNA杂交存储的优势,可极大促进DNA存储技术的实用化。
上述实施例为本发明较佳的实施方式,但本发明的实施方式并不受上述实施例的限制,其他的任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化,均应为等效的置换方式,都包含在本发明的保护范围之内。
Claims (10)
1.一种基于寡核苷酸芯片杂交的信息存储方法,其特征在于,包括如下目标信息写入的步骤:
(1)将目标信息转换为二进制代码,然后将所述二进制代码分割为若干字段,每个所述字段对应寡核苷酸芯片上的一个位点,每个所述位点包含N个二进制数位;
(2)将每个所述位点的N个二进制数位上的1/0值映射为N种寡核苷酸编码链的有/无组合,得到寡核苷酸芯片上所有所述位点需要添加的寡核苷酸编码链组合列表;
(3)根据所述寡核苷酸编码链组合列表将所述寡核苷酸编码链以共价键方式固定在所述寡核苷酸芯片表面的所述位点中,完成所述目标信息在所述寡核苷酸芯片上的写入。
2.根据权利要求1所述的基于寡核苷酸芯片杂交的信息存储方法,其特征在于,步骤(1)中,所述N为≤8的正整数。
3.根据权利要求1所述的基于寡核苷酸芯片杂交的信息存储方法,其特征在于,步骤(2)中,所述寡核苷酸编码链为含有8~60个碱基的寡核苷酸编码链,各种所述寡核苷酸编码链互相之间的序列差异度大于50%。
4.根据权利要求1所述的基于寡核苷酸芯片杂交的信息存储方法,其特征在于,步骤(3)中,所述以共价键方式固定为机械点样、喷墨打印、有掩膜原位合成和虚拟掩膜原位合成中的一种。
5.根据权利要求1所述的基于寡核苷酸芯片杂交的信息存储方法,其特征在于,步骤(3)中,所述寡核苷酸编码链的修饰基团为亚磷酰胺、氨基、醛基和巯基中的一种;所述寡核苷酸芯片的基质为表面附着有化学基团的硬质材料。
6.根据权利要求5所述的基于寡核苷酸芯片杂交的信息存储方法,其特征在于,所述化学基团为羟基、氨基、醛基和巯基中的一种;所述硬质材料为玻璃、硅片和塑料中的一种。
7.根据权利要求1至6任一项所述的基于寡核苷酸芯片杂交的信息存储方法,其特征在于,还包括如下读取存储信息的步骤:
(4.1)将固定于所述寡核苷酸芯片上的所述寡核苷酸编码链与互补荧光探针进行杂交反应;
(4.2)在杂交反应完成后进行多次洗涤以去除多余的互补荧光探针,然后通过杂交荧光信号读取设备进行荧光检测,以所述寡核苷酸芯片各位点中各色荧光的有无来判断对应的所述寡核苷酸编码链的有无,进而得到所述寡核苷酸芯片上所有位点中的寡核苷酸编码链组合列表;
(4.3)将把所述寡核苷酸编码链组合列表还原为二进制代码,然后通过所述二进制代码还原得到所述目标信息。
8.根据权利要求7所述的基于寡核苷酸芯片杂交的信息存储方法,其特征在于,所述互补荧光探针为带有荧光基团修饰的寡核苷酸链;所述互补荧光探针与对应的所述寡核苷酸编码链在碱基配对上互补,所述互补荧光探针的种数与所述寡核苷酸编码链的种数相等,且各种所述互补荧光探针所带的荧光基团互不相同。
9.根据权利要求8所述的基于寡核苷酸芯片杂交的信息存储方法,其特征在于,所述荧光基团为Alexa488荧光基团、Cy3荧光基团、Cy5荧光基团和Cy7荧光基团中的一种;所述杂交反应的温度为20~60℃。
10.根据权利要求7所述的基于寡核苷酸芯片杂交的信息存储方法,其特征在于,所述杂交荧光信号读取设备为具备特定波长荧光激发和检测功能的生物芯片扫描仪或者带有成像系统的荧光显微镜。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111336447.2A CN114093401B (zh) | 2021-11-11 | 2021-11-11 | 一种基于寡核苷酸芯片杂交的信息存储方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111336447.2A CN114093401B (zh) | 2021-11-11 | 2021-11-11 | 一种基于寡核苷酸芯片杂交的信息存储方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114093401A CN114093401A (zh) | 2022-02-25 |
CN114093401B true CN114093401B (zh) | 2024-11-29 |
Family
ID=80300155
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111336447.2A Active CN114093401B (zh) | 2021-11-11 | 2021-11-11 | 一种基于寡核苷酸芯片杂交的信息存储方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114093401B (zh) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112768003A (zh) * | 2021-01-22 | 2021-05-07 | 湖南科技大学 | 一种基于dna短链杂交的信息存储方法 |
CN113539363A (zh) * | 2021-07-06 | 2021-10-22 | 湖南科技大学 | 一种基于探针封闭与解封的dna杂交信息存储加密方法 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100346953B1 (ko) * | 1993-09-27 | 2003-01-06 | 아치 디벨럼먼트 코포레이션 | 효율적인핵산서열화(sequencing)를위한조성물및방법 |
CN113096742B (zh) * | 2021-04-14 | 2022-06-14 | 湖南科技大学 | 一种dna信息存储并行寻址写入方法及系统 |
CN113539379B (zh) * | 2021-07-17 | 2022-07-08 | 湖南科技大学 | 一种基于编码链发卡结构添加与移除的dna杂交信息存储加密方法 |
-
2021
- 2021-11-11 CN CN202111336447.2A patent/CN114093401B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112768003A (zh) * | 2021-01-22 | 2021-05-07 | 湖南科技大学 | 一种基于dna短链杂交的信息存储方法 |
CN113539363A (zh) * | 2021-07-06 | 2021-10-22 | 湖南科技大学 | 一种基于探针封闭与解封的dna杂交信息存储加密方法 |
Also Published As
Publication number | Publication date |
---|---|
CN114093401A (zh) | 2022-02-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Dickinson et al. | An alternative approach to nucleic acid memory | |
KR102717872B1 (ko) | 무증폭 dna 데이터 저장을 위한 방법, 장치 및 시스템 | |
CN112768003B (zh) | 一种基于dna短链杂交的信息存储方法 | |
Gunderson et al. | Decoding randomly ordered DNA arrays | |
US20240055075A1 (en) | Data structures and operations for searching, computing, and indexing in dna-based data storage | |
KR20210053292A (ko) | 오류 방지 기능을 갖춘 핵산 기반 데이터 저장 및 판독 시스템 및 방법 | |
Reif et al. | Experimental construction of very large scale DNA databases with associative search capability | |
US20050049796A1 (en) | Methods for encoding non-biological information on microarrays | |
US20230317164A1 (en) | Systems and methods for writing by sequencing of nucleic acids | |
JP2005058238A (ja) | 核酸配列のハイブリダイゼーションと配列決定 | |
CN113066534A (zh) | 一种利用dna序列进行信息写入和读取的方法 | |
US20220382480A1 (en) | Method, system, apparatus for data storage, decoding method, and storage medium | |
Yan et al. | Scaling logical density of DNA storage with enzymatically-ligated composite motifs | |
US20220025428A1 (en) | Nucleic acid memory (nam) / digital nucleic acid memory (dnam) | |
CN114093401B (zh) | 一种基于寡核苷酸芯片杂交的信息存储方法 | |
Błazewicz et al. | A heuristic managing errors for DNA sequencing | |
CN113539379B (zh) | 一种基于编码链发卡结构添加与移除的dna杂交信息存储加密方法 | |
CN116227589A (zh) | 一类dna纳米计算元件及其制备方法和应用 | |
CN112961902B (zh) | 一种对大量样本进行标记的dna条形码标记方法 | |
US20230332140A1 (en) | Layered coding architectures for nucleic acid memory | |
Piotr | DNA sequencing by hybridization with additional information available | |
CN112280842B (zh) | 一种3’端羟基可逆封闭核苷酸合成测序法 | |
CN116959573A (zh) | 一种基于高通量引物设计的dna存储系统文件选择性访问方法 | |
CN119475378A (zh) | 基于非天然dna的信息加密方法及信息解码方法 | |
US20230235383A1 (en) | Dna nanoarrays |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |