发明内容
为此,本发明提供一种云平台数据加密传输系统及其方法,用以克服现有技术中未对待加密数据进行识别,无法实现网络信息加密数据的自动识别传输导致的网络信息加密传输效率低的问题。
为实现上述目的,一方面,本发明提供一种云平台数据加密传输系统,包括:
加密数据识别模块,用以对数据进行静态识别,得到A标数据,还用以根据大语言模型对数据进行动态识别,并根据动态识别结果对A标数据进行补充,还用以获取手动标记的A标数据,并根据手动标记的A标数据对动态识别结果进行优化,并生成模型优化数据库对大语言模型进行优化;
数据加密模块,用以生成A标数据传输密钥,还用以对A标数据进行数据划分并生成A标数据向量,还用以对划分后的A标数据进行数据加密,并对加密后的A标数据进行数据校验,对校验成功的A标数据进行数据封装;
数据传输模块,用以对数据封装后的A标数据进行数据传输;
数据解密模块,用以对加密后的A标数据进行数据完整性验证,并在加密后的A标数据完整时进行解密;
传输反馈模块,用以根据传输失败数据量对加密传输效率进行判断,根据判断结果对大语言模型优化过程和数据校验过程进行调整。
进一步地,所述加密数据识别模块获取预设位置的字符数据,并采集字符数据在预设位置的停留时长T,将停留时长T与预设停留时长T0进行比对,根据比对结果对数据进行静态识别,其中:
当T>T0时,所述加密数据识别模块判定所述字符数据静态识别成功,并将其标记为A标数据;
当T≤T0时,所述加密数据识别模块判定所述字符数据静态识别失败。
进一步地,所述加密数据识别模块根据加密数据词库建立大语言模型,并对数据进行预处理,并将预处理后的数据输入至大语言模型,得到包含加密数据的文本片段,将其补充为A标数据。
进一步地,所述加密数据识别模块获取手动标记的A标数据,将新增的A标数据设定为包含加密数据的文本片段,将删除的A标数据从包含加密数据的文本片段中删除。
进一步地,所述加密数据识别模块获取手动标记次数u,将手动标记次数u与预设手动标记次数u0进行比对,根据比对结果对大语言模型进行优化,其中:
当u≤u0时,所述加密数据识别模块不对大语言模型进行优化;
当u>u0时,所述加密数据识别模块对大语言模型进行优化,将手动标记的A标数据作为模型优化数据库,加入至加密数据词库中对大语言模型进行优化。
进一步地,所述数据加密模块使用gpg命令生成A标数据传输密钥,并将其存储于HSM硬件安全模块中;
所述数据加密模块使用预设填充字符将A标数据填充为128字节的整数倍,对填充后的A标数据进行数据划分,使用Po l y1305为数据划分后得到的每个数据块生成一个MAC,并使用强随机数生成器生成A标数据向量;
所述数据加密模块使用A标数据传输密钥和A标数据向量,通过ChaCha20算法对划分后的A标数据进行数据加密,并将每个数据块生成的MAC附加到数据加密后的数据块上,得到数据块附加的MAC。
进一步地,所述数据加密模块每间隔预设抽样数据量p0,使用A标数据传输密钥,通过Po l y1305算法计算加密后A标数据的MAC,并将计算得到的加密后A标数据的MAC与数据块附加的MAC进行比对,并根据比对结果对加密后的A标数据进行数据校验,其中:
当计算得到的加密后A标数据的MAC与数据块附加的MAC一致时,所述数据加密模块判定加密后的A标数据校验成功;
当计算得到的加密后A标数据的MAC与数据块附加的MAC不一致时,所述数据加密模块判定加密后的A标数据校验失败;
所述数据加密模块将校验成功的A标数据的加密后A标数据、数据块附加的MAC和A标数据向量进行数据封装,得到封装后的A标数据;
所述数据传输模块使用传输层安全性协议TLS对数据封装后的A标数据进行数据传输。
进一步地,所述数据解密模块使用A标数据传输密钥,通过Po l y1305算法计算加密后A标数据的MAC,并将计算得到的加密后A标数据的MAC与数据块附加的MAC进行比对,并根据比对结果对加密后的A标数据进行数据完整性验证,其中:
当计算得到的加密后A标数据的MAC与数据块附加的MAC一致时,所述数据解密模块判定加密后的A标数据完整,并使用A标数据传输密钥和A标数据向量通过ChaCha20算法对加密后的A标数据进行解密;
当计算得到的加密后A标数据的MAC与数据块附加的MAC不一致时,所述数据解密模块判定加密后的A标数据不完整。
进一步地,所述传输反馈模块将反馈周期内传输失败数据量n与预设传输失败数据量n0进行比对,并根据比对结果对加密传输效率进行判断,其中:
当n≤n0时,所述传输反馈模块判定加密传输效率正常;
当n>n0时,所述传输反馈模块判定加密传输效率异常;
所述传输反馈模块在加密传输效率异常时,对大语言模型优化过程中的预设手动标记次数u0进行调整,设定调整后的预设手动标记次数为un0,设定un0=n i×u0;
所述传输反馈模块在加密传输效率异常时,对数据校验过程中的预设抽样数据量p0进行调整,调整后的预设抽样数据量为pn0,设定pn0=n i×p0。
另一方面,本发明还提供一种云平台数据加密传输方法,包括:
步骤S1,通过加密数据识别模块对数据进行静态识别,得到A标数据;
步骤S2,通过加密数据识别模块根据大语言模型对数据进行动态识别,并根据动态识别结果对A标数据进行补充;
步骤S3,通过加密数据识别模块获取手动标记的A标数据,并根据手动标记的A标数据对动态识别结果进行优化,并生成模型优化数据库对大语言模型进行优化;
步骤S4,通过数据加密模块生成A标数据传输密钥;
步骤S5,通过数据加密模块对A标数据进行数据划分并生成A标数据向量;
步骤S6,通过数据加密模块对划分后的A标数据进行数据加密,并对加密后的A标数据进行数据校验,对校验成功的A标数据进行数据封装;
步骤S7,通过数据传输模块对数据封装后的A标数据进行数据传输;
步骤S8,通过数据解密模块对加密后的A标数据进行数据完整性验证,并在加密后的A标数据完整时进行解密;
步骤S9,通过传输反馈模块根据传输失败数据量对加密传输效率进行判断,根据判断结果对大语言模型优化过程和数据校验过程进行调整。
与现有技术相比,本发明的有益效果在于,所述系统通过加密数据识别模块对数据进行静态识别,得到A标数据,以提高加密数据识别效率,所述系统通过加密数据识别模块根据大语言模型对数据进行动态识别,并根据动态识别结果对A标数据进行补充,以便于进一步提高对A标数据识别的准确性,所述系统通过加密数据识别模块获取手动标记的A标数据,并根据手动标记的A标数据对动态识别结果进行优化,并生成模型优化数据库对大语言模型进行优化,进一步提高对A标数据识别的准确性,所述系统通过数据加密模块生成A标数据传输密钥,所述系统通过数据加密模块对A标数据进行数据划分并生成A标数据向量,以防止重放攻击,提高加密传输的安全性,所述系统通过数据加密模块对划分后的A标数据进行数据加密,并对加密后的A标数据进行数据校验,对校验成功的A标数据进行数据封装,以验证A标数据的完整性,确保A标数据在传输过程中没有被篡改,所述系统通过数据传输模块对数据封装后的A标数据进行数据传输,所述系统通过数据解密模块对加密后的A标数据进行数据完整性验证,并在加密后的A标数据完整时进行解密,以保证加密传输过程中数据的完整性,提高加密传输效率,所述系统通过传输反馈模块根据传输失败数据量对加密传输效率进行判断,根据判断结果对大语言模型优化过程和数据校验过程进行调整,进一步提高加密传输效率。
具体实施方式
为了使本发明的目的和优点更加清楚明白,下面结合实施例对本发明作进一步描述;应当理解,此处所描述的具体实施例仅仅用于解释本发明,并不用于限定本发明。
下面参照附图来描述本发明的优选实施方式。本领域技术人员应当理解的是,这些实施方式仅仅用于解释本发明的技术原理,并非在限制本发明的保护范围。
需要说明的是,在本发明的描述中,术语“上”、“下”、“左”、“右”、“内”、“外”等指示的方向或位置关系的术语是基于附图所示的方向或位置关系,这仅仅是为了便于描述,而不是指示或暗示所述装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。
此外,还需要说明的是,在本发明的描述中,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域技术人员而言,可根据具体情况理解上述术语在本发明中的具体含义。
请参阅图1所示,其为本实施例云平台数据加密传输系统的结构示意图,所述系统包括:
加密数据识别模块,用以对数据进行静态识别,得到A标数据,还用以根据大语言模型对数据进行动态识别,并根据动态识别结果对A标数据进行补充,还用以获取手动标记的A标数据,并根据手动标记的A标数据对动态识别结果进行优化,并生成模型优化数据库对大语言模型进行优化;
数据加密模块,用以生成A标数据传输密钥,还用以对A标数据进行数据划分并生成A标数据向量,还用以对划分后的A标数据进行数据加密,并对加密后的A标数据进行数据校验,对校验成功的A标数据进行数据封装;
数据传输模块,用以对数据封装后的A标数据进行数据传输;
数据解密模块,用以对加密后的A标数据进行数据完整性验证,并在加密后的A标数据完整时进行解密;
传输反馈模块,用以根据传输失败数据量对加密传输效率进行判断,根据判断结果对大语言模型优化过程和数据校验过程进行调整。
具体而言,所述系统应用于数据共享云平台中,在用户通过终端将数据上传至云平台进行共享时,对数据中的加密数据进行识别,并进行安全传输,以实现数据共享协作的同时保障加密数据安全,从而提高网络信息加密传输效率,其中,所述系统通过加密数据识别模块对数据进行静态识别,得到A标数据,以提高加密数据识别效率,所述系统通过加密数据识别模块根据大语言模型对数据进行动态识别,并根据动态识别结果对A标数据进行补充,以便于进一步提高对A标数据识别的准确性,所述系统通过加密数据识别模块获取手动标记的A标数据,并根据手动标记的A标数据对动态识别结果进行优化,并生成模型优化数据库对大语言模型进行优化,进一步提高对A标数据识别的准确性,所述系统通过数据加密模块生成A标数据传输密钥,所述系统通过数据加密模块对A标数据进行数据划分并生成A标数据向量,以防止重放攻击,提高加密传输的安全性,所述系统通过数据加密模块对划分后的A标数据进行数据加密,并对加密后的A标数据进行数据校验,对校验成功的A标数据进行数据封装,以验证A标数据的完整性,确保A标数据在传输过程中没有被篡改,所述系统通过数据传输模块对数据封装后的A标数据进行数据传输,所述系统通过数据解密模块对加密后的A标数据进行数据完整性验证,并在加密后的A标数据完整时进行解密,以保证加密传输过程中数据的完整性,提高加密传输效率,所述系统通过传输反馈模块根据传输失败数据量对加密传输效率进行判断,根据判断结果对大语言模型优化过程和数据校验过程进行调整,进一步提高加密传输效率。
具体而言,所述加密数据识别模块获取预设位置的字符数据,并采集字符数据在预设位置的停留时长T,将停留时长T与预设停留时长T0进行比对,根据比对结果对数据进行静态识别,其中:
当T>T0时,所述加密数据识别模块判定所述字符数据静态识别成功,并将其标记为A标数据;
当T≤T0时,所述加密数据识别模块判定所述字符数据静态识别失败。
具体而言,所述预设位置是指可获取加密数据的特定存储桶、数据库、文件或云服务某个部分的预设位置,本实施例不对预设位置的设定方式进行限定,本领域技术人员可以根据实际情况自由设置,如可通过人工标记,还可通过大数据分析对预设位置进行设定,以通过大数据分析为例,所述加密数据识别模块可根据A标数据的高频出现位置,并将其作为预设位置,所述字符数据是指包含数字或文字内容的数据,本实施例不对字符数据的读取方式进行限定,本领域技术人员可以根据实际情况自由设置,只需满足对字符数据的读取需求即可,如可设置通过SDK软件开发工具包和API应用程序接口来读取字符数据,所述停留时长是指字符数据在预设位置的保持不变的持续时长,本实施例不对停留时长的获取方式进行限定,本领域技术人员可以根据实际需求自由设置,只需满足对字符数据在预设位置的停留时长的获取需求即可,如可设置通过内置时钟对停留时长进行获取,所述预设停留时长是指反映字符数据静态识别成功的时长预设值,如可设置预设停留时长T0=5s,所述静态识别是指根据预设位置对A标数据进行识别的方式。
具体而言,所述加密数据识别模块对数据进行静态识别,以对预设位置的字符数据进行加密数据识别,从而提高识别效率。
具体而言,所述加密数据识别模块根据加密数据词库建立大语言模型,并对数据进行预处理,并将预处理后的数据输入至大语言模型,得到包含加密数据的文本片段,将其补充为A标数据。
具体而言,所述加密数据词库是指包括个人信息、健康数据、财务信息、密码等用于后续的数据匹配和筛选的私密数据词典,本实施例不对大语言模型与加密数据词库的匹配过程进行限定,本领域技术人员可以根据实际情况进行设置,只需满足大语言模型对加密数据的文本片段识别需求即可,如可设置将文本验证数据集输入至已匹配加密数据词库的大语言模型中,并获取文本验证成功的数据量,计算准确率,对准确率大于预设准确率的大语言模型进行输出,对准确率小于等于预设准确率的大语言模型的加密数据库进行校正,对文本验证失败的文本验证数据集进行加密数据词段划分,并将划分后的文本验证数据集的加密数据词段加入加密数据库中,直至准确率大于预设准确率后对大语言模型进行输出,本实施例不对数据预处理方式进行限定,本领域技术人员可以根据实际情况自由设置,只需满足对数据的预处理需求即可,如可设置对数据进行清洗和格式化。
具体而言,所述加密数据识别模块对数据进行预处理,以便于去除无关字符和噪声,所述加密数据识别模块将预处理后的数据输入至大语言模型,得到包含加密数据的文本片段,将其补充为A标数据,以便于进一步提高对A标数据识别的准确性。
具体而言,所述加密数据识别模块获取手动标记的A标数据,将新增的A标数据设定为包含加密数据的文本片段,将删除的A标数据从包含加密数据的文本片段中删除。
具体而言,所述手动标记的A标数据是指由用户手动进行标记的加密数据,包括新增的A标数据和删除的A标数据。
具体而言,所述加密数据识别模块根据手动标记的A标数据对包含加密数据的文本片段进行新增和删除,以对A标数据识别进行优化,进一步提高对A标数据识别的准确性。
具体而言,所述加密数据识别模块获取手动标记次数u,将手动标记次数u与预设手动标记次数u0进行比对,根据比对结果对大语言模型进行优化,其中:
当u≤u0时,所述加密数据识别模块不对大语言模型进行优化;
当u>u0时,所述加密数据识别模块对大语言模型进行优化,将手动标记的A标数据作为模型优化数据库,加入至加密数据词库中对大语言模型进行优化。
具体而言,所述加密数据识别模块对大语言模型进行优化,将手动标记的A标数据作为模型优化数据库,加入至加密数据词库中对大语言模型进行优化,以提高大语言模型识别的准确性,从而提高识别效率。
具体而言,所述数据加密模块使用gpg命令生成A标数据传输密钥,并将其存储于HSM硬件安全模块中。
具体而言,所述gpg是GNU Pr i vacy Guard的缩写,是一种用于数据加密、解密、签名和验证的加密软件,所述A标数据传输密钥是指用于数据加密和数据校验的密钥,所述HSM硬件安全模块是指用于对密钥进行安全管理和存储的硬件设备。
具体而言,所述数据加密模块使用gpg命令生成A标数据传输密钥,以便于生成随机强密码,所述数据加密模块将A标数据传输密钥存储于HSM硬件安全模块中,以便于进行安全存储。
具体而言,所述数据加密模块使用预设填充字符将A标数据填充为128字节的整数倍,对填充后的A标数据进行数据划分,使用Po l y1305为数据划分后得到的每个数据块生成一个MAC,并使用强随机数生成器生成A标数据向量。
具体而言,所述预设填充字符是指用来填充A标数据块的剩余部分的特定填充字符,如0x00,所述Po l y1305是指与ChaCha20加密算法结合使用,可以提供数据的完整性和真实性验证的消息认证码算法,MAC是指用于确保信息传输完整一致性的安全机制的消息认证码,所述生成A标数据向量是指随机的或非重复的初始化向量,本实施例不对强随机数生成器的类型进行限定,本领域技术人员可以根据实际情况自由设置,如可设置其为CryptGenRandom。
具体而言,所述数据加密模块对A标数据进行数据划分,将其划分为合适大小的块或包,以便于后续进行加密处理,所述数据加密模块生成A标数据向量,以防止重放攻击。
具体而言,所述数据加密模块使用A标数据传输密钥和A标数据向量,通过ChaCha20算法对划分后的A标数据进行数据加密,并将每个数据块生成的MAC附加到数据加密后的数据块上,得到数据块附加的MAC。
具体而言,所述ChaCha20算法是指使用一次性计数器或初始化向量IV的流密码算法。
具体而言,所述数据加密模块通过ChaCha20算法对划分后的A标数据进行数据加密,以通过ChaCha20的轮函数和置换操作确保A标数据的安全性。
具体而言,所述数据加密模块每间隔预设抽样数据量p0,使用A标数据传输密钥,通过Po l y1305算法计算加密后A标数据的MAC,并将计算得到的加密后A标数据的MAC与数据块附加的MAC进行比对,并根据比对结果对加密后的A标数据进行数据校验,其中:
当计算得到的加密后A标数据的MAC与数据块附加的MAC一致时,所述数据加密模块判定加密后的A标数据校验成功;
当计算得到的加密后A标数据的MAC与数据块附加的MAC不一致时,所述数据加密模块判定加密后的A标数据校验失败。
具体而言,所述预设抽样数据量是指对加密后的A标数据进行数据校验的预设抽样间隔,预设抽样数据量根据A标数据总量进行设置,当A标数据总量小时,减小预设抽样数据量,当A标数据总量大时,增大预设抽样数据量。
具体而言,所述数据加密模块对加密后的A标数据进行数据校验,以验证A标数据的完整性,确保A标数据在传输过程中没有被篡改。
具体而言,所述数据加密模块将校验成功的A标数据的加密后A标数据、数据块附加的MAC和A标数据向量进行数据封装,得到封装后的A标数据。
具体而言,所述数据传输模块使用传输层安全性协议TLS对数据封装后的A标数据进行数据传输。
具体而言,所述传输层安全性协议TLS是指在互联网通信中提供隐私和数据完整性的通信安全协议。
具体而言,所述数据解密模块使用A标数据传输密钥,通过Po l y1305算法计算加密后A标数据的MAC,并将计算得到的加密后A标数据的MAC与数据块附加的MAC进行比对,并根据比对结果对加密后的A标数据进行数据完整性验证,其中:
当计算得到的加密后A标数据的MAC与数据块附加的MAC一致时,所述数据解密模块判定加密后的A标数据完整,并使用A标数据传输密钥和A标数据向量通过ChaCha20算法对加密后的A标数据进行解密;
当计算得到的加密后A标数据的MAC与数据块附加的MAC不一致时,所述数据解密模块判定加密后的A标数据不完整。
具体而言,所述传输反馈模块将反馈周期内传输失败数据量n与预设传输失败数据量n0进行比对,并根据比对结果对加密传输效率进行判断,其中:
当n≤n0时,所述传输反馈模块判定加密传输效率正常;
当n>n0时,所述传输反馈模块判定加密传输效率异常。
具体而言,所述传输反馈模块根据传输失败数据量与预设传输失败数据量的比对结果对加密传输效率进行判断,以便于进行优化调整,从而不断提高加密传输效率。
具体而言,所述反馈周期是指对加密传输效率进行反馈的时长预设值,如可设置反馈周期为7天,所述传输失败数据量是指反馈周期内无效数据、缺失数据和丢失数据的数据量的总和,所述无效数据是指解密后不是加密数据内容的A标数据,所述缺失数据是指数据解密模块判定的加密后的A标数据不完整的数据,所述丢失数据是指根据A标数据传输密钥无法进行解密的数据。
具体而言,所述传输反馈模块在加密传输效率异常时,对大语言模型优化过程中的预设手动标记次数u0进行调整,设定调整后的预设手动标记次数为un0,设定un0=n i×u0,0.85<np<1,本实施例中n i优选取值为n i=0.93。
具体而言,所述传输反馈模块对大语言模型优化过程中的预设手动标记次数u0进行调整,以提高大模型优化力度,从而提高A标数据识别准确性。
具体而言,所述传输反馈模块在加密传输效率异常时,对数据校验过程中的预设抽样数据量p0进行调整,调整后的预设抽样数据量为pn0,设定pn0=n i×p0。
具体而言,所述传输反馈模块对数据校验过程中的预设抽样数据量p0进行调整,以加大抽样力度,进一步提高数据校验效率。
请参阅图2所示,其为本实施例云平台数据加密传输方法的流程示意图,所述方法包括:
步骤S1,通过加密数据识别模块对数据进行静态识别,得到A标数据;
步骤S2,通过加密数据识别模块根据大语言模型对数据进行动态识别,并根据动态识别结果对A标数据进行补充;
步骤S3,通过加密数据识别模块获取手动标记的A标数据,并根据手动标记的A标数据对动态识别结果进行优化,并生成模型优化数据库对大语言模型进行优化;
步骤S4,通过数据加密模块生成A标数据传输密钥;
步骤S5,通过数据加密模块对A标数据进行数据划分并生成A标数据向量;
步骤S6,通过数据加密模块对划分后的A标数据进行数据加密,并对加密后的A标数据进行数据校验,对校验成功的A标数据进行数据封装;
步骤S7,通过数据传输模块对数据封装后的A标数据进行数据传输;
步骤S8,通过数据解密模块对加密后的A标数据进行数据完整性验证,并在加密后的A标数据完整时进行解密;
步骤S9,通过传输反馈模块根据传输失败数据量对加密传输效率进行判断,根据判断结果对大语言模型优化过程和数据校验过程进行调整。
至此,已经结合附图所示的优选实施方式描述了本发明的技术方案,但是,本领域技术人员容易理解的是,本发明的保护范围显然不局限于这些具体实施方式。在不偏离本发明的原理的前提下,本领域技术人员可以对相关技术特征做出等同的更改或替换,这些更改或替换之后的技术方案都将落入本发明的保护范围之内。