CN111368023A - 一种安全的矩阵式文本数据存储表达方法 - Google Patents
一种安全的矩阵式文本数据存储表达方法 Download PDFInfo
- Publication number
- CN111368023A CN111368023A CN202010233470.8A CN202010233470A CN111368023A CN 111368023 A CN111368023 A CN 111368023A CN 202010233470 A CN202010233470 A CN 202010233470A CN 111368023 A CN111368023 A CN 111368023A
- Authority
- CN
- China
- Prior art keywords
- matrix
- data
- channel
- binary
- binary byte
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 239000011159 matrix material Substances 0.000 title claims abstract description 66
- 238000000034 method Methods 0.000 title claims description 24
- 238000013500 data storage Methods 0.000 title description 2
- 230000010365 information processing Effects 0.000 claims abstract description 4
- 238000003672 processing method Methods 0.000 claims abstract description 3
- 238000012800 visualization Methods 0.000 claims description 4
- 230000009191 jumping Effects 0.000 claims 1
- 230000000007 visual effect Effects 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000007794 visualization technique Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/31—Indexing; Data structures therefor; Storage structures
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Software Systems (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明是一种使用多通道矩阵存储和表达文本数据的信息处理方法,生成一个[X,Y]大小的、N个通道的矩阵,其中X是行数,Y是列数,N是通道数,该矩阵形状是{X,Y,N},二进制字节数据容量是X*Y*N,其中X*Y*N≥原数据二进制字节序列长度,将原数据二进制字节序列按照特定规则存储到特定位置、特定通道上,存储规则可以灵活设置,具有安全、便捷的特点。
Description
技术领域
本发明是一种安全的、使用多通道矩阵存储和表达文本数据的信息处理方法,属于计算机信息处理领域。
背景技术
目前现有的计算机文本数据的存储和表达方法,是使用特定字符集,编码成一定的二进制字节序列,然后存储到计算机文本文件中,本发明与当前现有技术文本数据存储和表达方法不同,是首先生成一个{X,Y}大小的、N个通道的矩阵,其中X是行数,Y是列数,N是通道数,该矩阵形状是{X,Y,N},二进制字节数据容量是X*Y*N,在矩阵的每个(x,y)位置上,都可以存储N个字节,其中0≤x<X且0≤y <Y,将二进制字节数据按照特定算法存储到该矩阵中,这样的存储是安全的,方便互联网传递的,而且,当N为3时,还可以把文本数据表达为RGB图像,这样的存储和表达方法,与现有技术显著不同。
发明内容
按照如下步骤,将文本数据表达为矩阵并存储成文件,S1:将文本数据使用特定字符集编码成二进制字节序列,并计算该二进制字节序列的长度为L;S2:生成一个{X,Y}大小的、N个通道的矩阵,该矩阵要求X*Y*N≥L;S3:设置数据存储到矩阵特定位置的规则,也就是二进制字节序列位置p对应到矩阵特定位置(x,y)的规则;S4:设置数据存储到矩阵中特定位置的特定通道的规则,也就是二进制序列位置p对应到矩阵特定位置(x,y)的某个通道内规则,因为该矩阵有N个通道,所以每个(x,y)位置上能存储N个二进制字节数据,所以在这N个通道上能设置不同的规则;S5:按照S3、S4的规则,把二进制字节序列存储到矩阵内;S6:设置矩阵数据存储为磁盘文件的规则,该规则要能清晰表达矩阵行数、列数、通道数量以及矩阵和磁盘文件二级制序列之间的对应关系;S7:按照S6的规则将数据存储到磁盘文件。
作为【0003】的改进,【0003】的S2可以生成为一个生成一个{X,Y}大小的、N个通道的矩阵,该矩阵要求X*Y*N≥(L+3),其中L为原始数据二进制字节序列的长度,矩阵中多出的这3个位置,期中2个用于存储原始数据编码时所用的字符集类型,另1个用于标记该字符集是否存储在了矩阵中;作为进一步扩展改进,【0003】的S2可以生成一个 {X,Y}大小的、N个通道的矩阵,该矩阵要求X*Y*N≥(L+z) ,其中L为原始数据二进制字节序列的长度,矩阵中多出z个位置,用以做各种标记。
按照如下步骤,将【0003】矩阵文件数据进行还原,S1:读取【0003】S7所存储的文件为二进制字节序列;S2:按照【0003】S6的文件存储规则,反向还原为{X,Y}大小的、N个通道的矩阵;S3:按照【0003】S4、S3的规则,从矩阵内读出二进制字节数据并还原为原始的二进制字节序列;S4:按照【0004】规则读取出已存储的字符集类型和其他标记,如果未存储字符集或其他标记标记,则在下一步S5中用默认值进行处理;S5:如果S4读取出字符集类型,则将S3的二进制序列按照该字符集解码为文本数据,如果S4未读取出字符集类型,则按照默认字符集将S3的二进制序列解码为文本数据,如果S4中还读取出了其他标记,则按照标记的规则进行处理。
可以通过以下方式之一或多种对数据进行加密,以下步骤没有严格顺序,S1:【0003】的S3规则不同,则存储的结果不同,可以设置一定算法跳跃式存储到矩阵特定位置,不了解该规则时,数据就无法还原;S2:【0003】的S4规则不同,则存储的结果不同,可以设置一定算法跳跃式存储到矩阵特定通道上,不按照索引号顺序存储,这样不了解该规则时,数据就无法还原;S3:【0003】的S6的规则不同,则存储的结果不同,可以设置特定规则存储成公众不了解的文件格式,这里的文件格式是指文件内容格式,不仅仅指文件扩展名,不了解该规则时,数据就无法还原。
特别介绍一种3通道文本数据彩色可视化存储方法:将【0003】的S2的通道N设置为3;将【0003】的S6的规则设置为图像格式,其他参照【0003】、【0004】、【0005】、【0006】对数据进行存储和读取,这样就能将文本数据表达为一种安全的彩色图像格式。
特别介绍一种1通道文本数据灰度可视化存储方法:将【0003】的S2的通道N设置为1;将【0003】的S6的规则设置为图像格式,其他参照【0003】、【0004】、【0005】、【0006】对数据进行存储和读取,这样就能将文本数据表达为一种安全的灰度图像格式。
非文本数据,也可以按照本发明规则存储和还原,存储时在【0003】S1中把原始非文本源数据转成二进制序列即可,其他步骤不变;还原时在【0005】的S5步骤中不是把二进制数据还原成文本数据,而是还原成原始的非文本数据即可。
附图说明
为便于理解,本发明附属了以下附图,附图说明如下:图1是文本数据3通道不同规则可视化表达的示例图。
具体实施方式
在本实施例中,以3通道可视化方式为示例说明本发明的具体实施方法之一。
开发框架使用OpenCV,开发语言使用C++。
准备一段文本数据,在本实施例中,文本数据为"Hello China.You'll be bettertomorrow! You will become stronger!Let us go!",该字符串长度为75,将该字符串重复连接100次,长度变成7500。
按照如下步骤,将文本数据表达为3通道矩阵,S1:将【0013】文本数据使用ASCII字符集编码成二进制字节序列,并计算该二进制字节序列的长度为7500;S2:生成一个[50,50]大小的、3个通道的矩阵;S3:设置数据存储到矩阵特定位置的规则,此处规则是按行、列索引号自然顺序存储;S4:设置数据存储到矩阵特定位置的各通道的规则,此处是按照通道号0、1、2自然顺序存储;S5:按照S3、S4的规则,把二进制字节序列存储到矩阵内;S6:设置矩阵数据存储为磁盘文件的规则,此处规则为JPEG图像格式;S7:按照S6的规则将数据存储到磁盘文件,此时【0013】中的文本数据表达为附图1的图像(1)。
改变【0014】S4的通道规则,此处是按照通道号0、2、1顺序存储,其他不变,此时【0013】中的文本数据表达为附图1的图像(2);改变【0014】S4的通道规则,此处是按照通道号1、0、2顺序存储,其他不变,此时【0013】中的文本数据表达为附图1的图像(3);改变【0014】S4的通道规则,此处是按照通道号1、2、0顺序存储,其他不变,此时【0013】中的文本数据表达为附图1的图像(4);改变【0014】S4的通道规则,此处是按照通道号2、0、1顺序存储,其他不变,此时【0013】中的文本数据表达为附图1的图像(5);改变【0014】S4的通道规则,此处是按照通道号2、1、0顺序存储,其他不变,此时【0013】中的文本数据表达为附图1的图像(6);以上图像(1)-(6)均为3通道彩色图像,各不相同,这样就将文本数据表达为安全的多通道可视化矩阵数据,并且很安全,不知道规则无法还原成原始数据。
按照如下步骤,将【0014】矩阵文件数据进行还原,S1:读取【0014】S7所存储的文件为二进制字节序列;S2:按照【0014】S6的文件存储规则,反向还原为{50,50}大小的、3个通道的矩阵;S3:按照【0014】S4、S3的规则,从矩阵内读出二进制字节数据并还原为原始的二进制字节序列;S4:因【0014】中未存储特定字符集格式,使用默认格式ASCII字符集将二进制数据欢迎为原始文本数据。
Claims (8)
1.一种多通道矩阵存储和表达文本数据的信息处理方法,其特征是:生成一个{X,Y}大小的、N个通道的矩阵,其中X是行数,Y是列数,N是通道数,该矩阵形状是{X,Y,N},二进制字节数据容量是X*Y*N,在矩阵的每个(x,y)位置上,都可以存储N个字节,其中0≤x<X且0≤y<Y,将文本数据转码成二进制字节数据按照特定算法存储到该矩阵中。
2.根据权利要求1所述方法,其特征在于,提出了一种将文本数据表达为矩阵并存储成文件的新方法:S1:将文本数据使用特定字符集编码成二进制字节序列,并计算该二进制字节序列的长度为L;S2:生成一个{X,Y}大小的、N个通道的矩阵,该矩阵要求X*Y*N≥L;S3:设置数据存储到矩阵特定位置的规则;S4:设置数据存储到矩阵中特定位置的特定通道的规则;S5:按照S3、S4的规则,把二进制字节序列存储到矩阵内;S6:设置矩阵数据存储为磁盘文件的规则;S7:按照S6的规则将数据存储到磁盘文件。
3.根据权利要求2所述方法,其特征在于,提出了一种在矩阵中记录字符集和其他标记的新方法,权利要求2的S2可以生成为一个生成一个{X,Y}大小的、N个通道的矩阵,该矩阵要求X*Y*N≥(L+3),其中L为原始数据二进制字节序列的长度,矩阵中多出的这3个位置,期中2个用于存储原始数据编码时所用的字符集类型,另1个位置用于标记该字符集是否存储在了矩阵中;作为进一步扩展改进,权利要求2的S2可以生成为一个生成一个{X,Y}大小的、N个通道的矩阵,该矩阵要求X*Y*N≥(L+z) ,其中L为原始数据二进制字节序列的长度,矩阵中多出z个位置,用以做各种标记。
4.根据权利要求2所述方法,其特征在于,提出了一种数据还原的方法,具体步骤如下,S1:读取权利要求2中S7步骤所存储的文件为二进制字节序列;S2:按照权利要求2的S6的文件存储规则,反向还原为{X,Y}大小的、N个通道的矩阵;S3:根据权利要求2的S4、S3的规则,从矩阵内读出二进制字节数据并还原为原始的二进制字节序列;S4:从矩阵中读取字符集配置和其他标记,如果无则使用默认值;S5:将S3的二进制序列还原成原始文本数据。
5.根据权利要求2所述方法,其特征在于,提出了一种数据加密的新方法,以下步骤无严格顺序,S1:设置一定算法将二进制字节数据跳跃式存储到矩阵特定位置;S2:设置一定算法将二进制字节数据跳跃式存储到矩阵特定通道上;S3:设置一定算法将矩阵数据存储成公众不了解的文件格式。
6.根据权利要求2所述方法,其特征在于,提出了一种3通道文本数据彩色可视化存储方法:将权利要求2的S2的通道N设置为3,将权利要求2的S6的规则设置为图像格式。
7.根据权利要求2所述方法,其特征在于,提出了一种1通道文本数据灰度可视化存储方法:将权利要求2的S2的通道N设置为1,将权利要求2的S6的规则设置为图像格式。
8.根据权利要求2或权利要求4所述方法,其特征在于,提出了一种非文本数据的矩阵式存储和还原方法:存储时在权利要求2的S1中把非文本源数据转成二进制序列即可,其他步骤不变;还原时将权利要求4中的S5的二进制序列还原成原始数据即可,其他步骤不变。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010233470.8A CN111368023A (zh) | 2020-03-29 | 2020-03-29 | 一种安全的矩阵式文本数据存储表达方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010233470.8A CN111368023A (zh) | 2020-03-29 | 2020-03-29 | 一种安全的矩阵式文本数据存储表达方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111368023A true CN111368023A (zh) | 2020-07-03 |
Family
ID=71209248
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010233470.8A Pending CN111368023A (zh) | 2020-03-29 | 2020-03-29 | 一种安全的矩阵式文本数据存储表达方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111368023A (zh) |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1971537A (zh) * | 2005-11-25 | 2007-05-30 | 杭州中天微系统有限公司 | 一种矩阵数据存取方法及其矩阵数据存储装置 |
US20170147674A1 (en) * | 2015-11-23 | 2017-05-25 | Ab Initio Technology Llc | Storing and retrieving data of a data cube |
CN108710702A (zh) * | 2018-05-25 | 2018-10-26 | 吴卓航 | 一种基于分片重组技术实现数据安全存储的方法 |
CN109885572A (zh) * | 2019-02-20 | 2019-06-14 | 哈尔滨工程大学 | 一种用于海量海洋环境数据管理的三维数据编码及存储方法 |
CN110019865A (zh) * | 2017-09-08 | 2019-07-16 | 北京京东尚科信息技术有限公司 | 海量图片处理方法、装置、电子设备及存储介质 |
CN110377561A (zh) * | 2019-07-19 | 2019-10-25 | 深圳前海微众银行股份有限公司 | 一种文件管理方法及装置 |
CN110674324A (zh) * | 2019-09-25 | 2020-01-10 | 上海眼控科技股份有限公司 | 雷达数据存储方法、装置、计算机设备和存储介质 |
-
2020
- 2020-03-29 CN CN202010233470.8A patent/CN111368023A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1971537A (zh) * | 2005-11-25 | 2007-05-30 | 杭州中天微系统有限公司 | 一种矩阵数据存取方法及其矩阵数据存储装置 |
US20170147674A1 (en) * | 2015-11-23 | 2017-05-25 | Ab Initio Technology Llc | Storing and retrieving data of a data cube |
CN110019865A (zh) * | 2017-09-08 | 2019-07-16 | 北京京东尚科信息技术有限公司 | 海量图片处理方法、装置、电子设备及存储介质 |
CN108710702A (zh) * | 2018-05-25 | 2018-10-26 | 吴卓航 | 一种基于分片重组技术实现数据安全存储的方法 |
CN109885572A (zh) * | 2019-02-20 | 2019-06-14 | 哈尔滨工程大学 | 一种用于海量海洋环境数据管理的三维数据编码及存储方法 |
CN110377561A (zh) * | 2019-07-19 | 2019-10-25 | 深圳前海微众银行股份有限公司 | 一种文件管理方法及装置 |
CN110674324A (zh) * | 2019-09-25 | 2020-01-10 | 上海眼控科技股份有限公司 | 雷达数据存储方法、装置、计算机设备和存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107301244B (zh) | 一种商标分卡处理的方法、装置、系统及商标存储器 | |
JP4608221B2 (ja) | Dna配列符号化装置及び方法 | |
CN107578452B (zh) | 一种具有兼容格式和不变尺寸的jpeg图像加密方法 | |
CN114567331B (zh) | 一种基于lz77的压缩方法、装置及其介质 | |
CN112088378A (zh) | 图像隐藏信息检测器 | |
CN112948776A (zh) | 一种数字水印添加方法、装置、电子设备及存储介质 | |
CN110704813A (zh) | 一种基于字符重新编码的文字防盗版系统 | |
CN102194081A (zh) | 自然语言信息隐藏方法 | |
CN106651972B (zh) | 一种二值图像编码、解码方法及装置 | |
CN118364917B (zh) | 大模型的数据token化方法、装置及大模型训练方法 | |
CN111368023A (zh) | 一种安全的矩阵式文本数据存储表达方法 | |
CN114741712A (zh) | 一种基于分层置乱的汉字加密方法 | |
CN118711197A (zh) | 图文信息的多模态识别方法及装置 | |
CN110111852A (zh) | 一种海量dna测序数据无损快速压缩平台 | |
CN118506385A (zh) | 一种基于Transformer的端到端古筝简谱识别方法及系统 | |
RU2346332C2 (ru) | Способ и формат записи для сжатия изображений | |
CN117113268A (zh) | 多尺度数据融合方法、装置、介质及电子设备 | |
CN115549979A (zh) | 一种数据加密、解密的方法、装置、电子设备和存储介质 | |
CN110086955A (zh) | 一种大容量图像隐写方法 | |
CN113806294A (zh) | Sdk文件格式转换和解密打印方法、装置、设备及存储介质 | |
JP4124366B2 (ja) | 電子透かしの埋め込み方法および抽出方法 | |
CN103491414B (zh) | 一种字符的处理方法、装置及机顶盒 | |
CN115828902A (zh) | 一种基于神经语言模型的保护文档版权的数字水印方法 | |
JP4953145B2 (ja) | 文字列データ圧縮装置及びその方法並びに文字列データ復元装置及びその方法 | |
CN120378552A (zh) | 面向训练科目的柔性配置方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |