[go: up one dir, main page]

CN116433953A - 图节点分类模型训练方法、装置、电子设备及存储介质 - Google Patents

图节点分类模型训练方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN116433953A
CN116433953A CN202111682730.0A CN202111682730A CN116433953A CN 116433953 A CN116433953 A CN 116433953A CN 202111682730 A CN202111682730 A CN 202111682730A CN 116433953 A CN116433953 A CN 116433953A
Authority
CN
China
Prior art keywords
model
initial
training
graph node
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111682730.0A
Other languages
English (en)
Inventor
余晓填
王孝宇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Intellifusion Technologies Co Ltd
Original Assignee
Shenzhen Intellifusion Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Intellifusion Technologies Co Ltd filed Critical Shenzhen Intellifusion Technologies Co Ltd
Priority to CN202111682730.0A priority Critical patent/CN116433953A/zh
Publication of CN116433953A publication Critical patent/CN116433953A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明揭示了一种图节点分类模型训练方法、装置、电子设备及存储介质,本发明涉及模型训练领域,该方法包括:获取样本数据;基于样本数据构建图节点特征和图结构特征;依次利用图结构特征以及图节点特征交替迭代训练初始图节点分类网络,以确定目标图节点分类模型。上述方法,通过依次利用图结构特征以及图节点特征交替迭代训练初始图节点分类网络,使得目标图节点分类模型训练过程中既充分学习了图节点特征也充分学习了图结构特征,提高了目标图节点分类模型的精准度。使得上述方法中的目标图节点分类模型不仅可以完成图的节点分类,还可以保证分类结果的准确性。

Description

图节点分类模型训练方法、装置、电子设备及存储介质
技术领域
本发明涉及模型训练领域,具体涉及一种图节点分类模型训练方法、装置、电子设备及存储介质。
背景技术
图节点分类问题是很多机器学习任务的基础问题。比如,在社交网络中,要识别异常的人员;在采集视频构成的摄像头网络中,要识别异常的摄像头;在商场场景中,根据采集的客流和轨迹等数据,对不同的消费者进行分类。这些问题中,都可以把研究对象形成图节点,并建立图关系,最终在图中进行节点分类。在将数据转化为图节点分类模型过程中,往往得到两种类型的特征:一种是图结构特征,另一种是图节点特征。如何结合两类类型的特征进行图节点分类是一个重要的问题。
在传统的算法中,有的是只考虑图结构特征,有的是只考虑图节点特征,显而易见,单独只考虑图结构特征或者图节点特征,算法模型的精准度会被削弱。
发明内容
有鉴于此,本发明实施例提供了一种图节点分类模型训练方法、装置、电子设备及存储介质,旨在解决单独只考虑图结构特征或者图节点特征,算法模型的精准度会被削弱。
根据第一方面,本发明实施例提供了一种图节点分类模型训练方法,该方法包括:
获取样本数据;
基于样本数据构建图节点特征和图结构特征;
依次利用图结构特征以及图节点特征交替迭代训练初始图节点分类网络,以确定目标图节点分类模型。
本发明实施例提供的图节点分类模型训练方法,根据样本数据构建图节点特征和图结构特征,然后依次利用图结构特征以及图节点特征交替迭代训练初始图节点分类网络,以确定目标图节点分类模型。上述方法,通过依次利用图结构特征以及图节点特征交替迭代训练初始图节点分类网络,使得目标图节点分类模型训练过程中既充分学习了图节点特征也充分学习了图结构特征,提高了目标图节点分类模型的精准度,且不需要同时训练图结构特征以及图节点特征,从而简化了目标图节点分类模型的训练过程,保证了目标图节点分类模型的复杂性以及精准度。使得上述方法中的目标图节点分类模型不仅可以完成图的节点分类,还可以保证分类结果的准确性。
结合第一方面,在第一方面第一实施方式中,依次利用图结构特征以及图节点特征交替迭代训练初始图节点分类网络,以确定目标图节点分类模型,包括:
获取样本数据中的初始训练集和初始测试集;初始训练集带有标签;
将初始训练集以及初始测试集输入至图结构对应的第一网络,根据初始训练集的标签对第一网络进行训练,得到第一候选模型;
基于第一候选模型对初始测试集进行预测,得到第一预测集;
基于第一预测集以及初始训练集对图节点对应的第二网络进行训练,得到第二候选模型;
根据第一候选模型和第二候选模型,生成目标图节点分类模型。
本发明实施例提供的图节点分类模型训练方法,将初始训练集以及初始测试集输入至图结构对应的第一网络,根据初始训练集的标签对第一网络进行训练,得到第一候选模型。从而使得第一候选模型可以学习到图结构特征。然后,基于第一候选模型对初始测试集进行预测,得到第一预测集。其中,第一预测集即为第一候选模型对图结构特征进行学习后的结果,然后基于第一预测集以及初始训练集对图节点对应的第二网络进行训练,得到第二候选模型,从而使得第二候选模型可以基于对图结构特征学习后的结果,再次学习图节点特征,使得第二候选模型既学习到图结构特征又学习到图节点特征。进而使得根据第一候选模型和第二候选模型,生成的目标图节点分类模型既充分学习了图节点特征也充分学习了图结构特征,提高了目标图节点分类模型的精准度,且不需要同时训练图结构特征以及图节点特征,从而简化了目标图节点分类模型的训练过程,保证了目标图节点分类模型的复杂性以及精准度。使得上述方法中的目标图节点分类模型不仅可以完成图的节点分类,还可以保证分类结果的准确性。
结合第一方面第一实施方式,在第一方面第二实施方式中,根据第一候选模型和第二候选模型,生成目标图节点分类模型,包括:
获取验证集;
基于验证集验证第二候选模型的第一误差率,以确定第二候选模型是否训练完成;
当第二候选模型训练完成时,将第一候选模型和第二候选模型进行组合,生成目标图节点分类模型。
本发明实施例提供的图节点分类模型训练方法,获取验证集,然后基于基于验证集验证第二候选模型的第一误差率,以确定第二候选模型是否训练完成。从而可以保证训练得到的第二候选模型的精准度。当第二候选模型训练完成时,将第一候选模型和第二候选模型进行组合,生成目标图节点分类模型。进而提高了目标图节点分类模型的精准度。
结合第一方面第二实施方式,在第一方面第三实施方式中,基于验证集验证第二候选模型的第一误差率,以确定第二候选模型是否训练完成,包括:
将验证集输入第二候选模型,确定第一误差率;
获取第一误差率之前的预设数量的第一历史误差率,以及各第一历史误差率对应的第一历史平均值;
计算第一误差率与各第一历史误差率对应的平均值;
当计算出的平均值与各第一历史平均值相同时,确定第二候选模型训练完成。
本发明实施例提供的图节点分类模型训练方法,将验证集输入第二候选模型,确定第一误差率。根据第一误差率可以确定当前第二候选模型对应的精准度。然后,获取第一误差率之前的预设数量的第一历史误差率,以及各第一历史误差率对应的第一历史平均值;计算第一误差率与各第一历史误差率对应的平均值,并将当计算出的平均值与各第一历史平均值进行对比。当计算出的平均值与各第一历史平均值相同时,说明第二候选模型的精准度已经趋于平稳,从而确定第二候选模型训练完成。保证了第二候选模型的精准度。此外,上述图节点分类模型训练方法,将计算出的平均值与各第一历史平均值进行对比,当计算出的平均值与各第一历史平均值相同时,确定第二候选模型训练完成。而不是直接根据第二候选模型确定的第一误差率,确定第二候选模型训练完成。从而可以避免在第二候选模型没有训练完成时,因此偶然情况发生使得训练后的第二候选模型的第一误差率较低,从而认为第二候选模型已经训练完成,导致第二候选模型精准度较低。
结合第一方面第三实施方式,在第一方面第四实施方式中,基于验证集验证第二候选模型的第一误差率,以确定第二候选模型是否训练完成,还包括:
当计算出的平均值与各第一历史平均值不同时,获取第二候选模型对初始测试集进行预测得到的第二预测集;
根据第二预测集和初始训练集,对第一候选模型进行训练,得到第一目标模型;
获取第一目标模型对初始测试集进行预测得到的第三预测集;
根据第三预测集和初始训练集,对第二候选模型进行训练,得到第二目标模型;
基于验证集验证第二目标模型的第二误差率,以确定第二目标模型是否训练完成;
当第二目标模型训练完成时,将第一目标模型和第二目标模型进行组合,生成目标图节点分类模型。
本发明实施例提供的图节点分类模型训练方法,当计算出的平均值与各第一历史平均值不同时,说明第二候选模型还未训练完成。电子设备获取第二候选模型对初始测试集进行预测得到的第二预测集。然后根据第二预测集和初始训练集,对第一候选模型进行训练,得到第一目标模型,从而使得第一目标模型既充分学习了图节点特征也充分学习了图结构特征,提高了第一目标模型的精准度。然后获取第一目标模型对初始测试集进行预测得到的第三预测集,并根据第三预测集和初始训练集,对第二候选模型进行训练,得到第二目标模型,使得第二目标模型既充分学习了图节点特征也充分学习了图结构特征,提高了第二目标模型的精准度。然后,基于验证集验证第二目标模型的第二误差率,以确定第二目标模型是否训练完成;当第二目标模型训练完成时,将第一目标模型和第二目标模型进行组合,生成目标图节点分类模型。上述图节点分类模型训练方法中组成目标图节点分类模型的第一目标模型和第二目标模型均经过了多次迭代交替训练,也就是说第一目标模型和第二目标模型均经过了多次迭代交替学习图结构特征和图节点特征,因此,可以保证目标图节点分类模型的精准度更高。
结合第一方面第二实施方式或者第四实施方式,在第一方面第五实施方式中,生成目标图节点分类模型之后,方法还包括:
基于目标节点分类模型中图节点对应的模型,对初始测试集进行预测,得到第四预测集;
根据第四预测集和初始训练集输入至目标节点分类模型中图结构对应的模型,输出初始测试集对应的预测结果。
本发明实施例提供的图节点分类模型训练方法,基于目标节点分类模型中图节点对应的模型,对初始测试集进行预测,得到第四预测集。然后,将第四预测集和初始训练集输入至目标节点分类模型中图结构对应的模型,输出初始测试集对应的预测结果。上述方法,在得到第四预测集之后,将第四预测集和初始训练集输入至目标节点分类模型中图结构对应的模型,从而使得图结构对应的模型可以对第四训练集进行微调,使得输出初始测试集对应的预测结果更加准确。
结合第一方面第一实施方式,在第一方面第六实施方式中,基于第一预测集以及初始训练集对图节点对应的第二网络进行训练,得到第二候选模型,包括:
将第一预测集以及初始训练集输入至图节点对应的第二网络,对第二网络中的初始模型参数进行训练,得到第二初始模型;
获取第二初始模型对应的损失函数,并确定损失函数对应的损失值;损失函数由第二初始模型的输出结果与初始训练集对应的标签以及第一预测集对应的预测结果构成;
当损失值大于预设损失阈值时,基于第二初始模型对初始测试集进行预测,得到第五测试集;
基于第五测试集以及初始训练集,训练第二初始模型,以确定第二候选模型。
本发明实施例提供的图节点分类模型训练方法,将第一预测集以及初始训练集输入至图节点对应的第二网络,对第二网络中的初始模型参数进行训练,得到第二初始模型。然后获取第二初始模型的损失函数,并确定损失函数对应的损失值。当损失值大于预设损失阈值时,说明第二初始模型还未训练完成,需要继续训练。然后,基于第二初始模型对初始测试集进行预测,得到第五测试集;基于第五测试集以及初始训练集,训练第二初始模型,以确定第二候选模型。计算每次训练结果对应的损失值,直至损失值小于预设损失阈值,确定当前第二初始模型训练完成,根据第二初始模型确定第二候选模型。经过对第二初始模型进行无数次训练,从而可以保证训练得到的第二候选模型的精准度,进一步保证最后得到的目标图节点分类模型的精准度。
根据第二方面,本发明实施例还提供了一种图节点分类模型训练装置,包括:
获取模块,用于获取样本数据;
构建模块,用于基于样本数据构建图节点特征和图结构特征;
训练模块,用于依次利用图结构特征以及图节点特征交替迭代训练初始图节点分类网络,以确定目标图节点分类模型。
本发明实施例提供的图节点分类模型训练装置,根据样本数据构建图节点特征和图结构特征,然后依次利用图结构特征以及图节点特征交替迭代训练初始图节点分类网络,以确定目标图节点分类模型。上述方法,通过依次利用图结构特征以及图节点特征交替迭代训练初始图节点分类网络,使得目标图节点分类模型训练过程中既充分学习了图节点特征也充分学习了图结构特征,提高了目标图节点分类模型的精准度,且不需要同时训练图结构特征以及图节点特征,从而简化了目标图节点分类模型的训练过程,保证了目标图节点分类模型的复杂性以及精准度。使得上述方法中的目标图节点分类模型不仅可以完成图的节点分类,还可以保证分类结果的准确性。
根据第三方面,本发明实施例提供了一种电子设备,包括存储器和处理器,存储器和处理器之间互相通信连接,存储器中存储有计算机指令,处理器通过执行计算机指令,从而执行第一方面或者第一方面的任意一种实施方式中的图节点分类模型训练方法。
根据第四方面,本发明实施例提供了一种计算机可读存储介质,计算机可读存储介质存储计算机指令,计算机指令用于使计算机执行第一方面或者第一方面的任意一种实施方式中的图节点分类模型训练方法。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是应用本发明实施例提供的图节点分类模型训练方法的流程图;
图2是应用本发明另一实施例提供的图节点分类模型训练方法的流程图;
图3是应用本发明另一实施例提供的图节点分类模型训练方法的流程图;
图4是应用本发明另一实施例提供的图节点分类模型训练方法的流程图;
图5是应用本发明另一实施例提供的图节点分类模型训练方法的流程图;
图6是应用本发明另一实施例提供的图节点分类模型训练方法的流程图;
图7是应用本发明实施例提供的图节点分类模型训练装置的功能模块图;
图8是应用本发明实施例提供的电子设备的硬件结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
图节点分类问题是很多机器学习任务的基础问题。比如,在社交网络中,要识别异常的人员;在采集视频构成的摄像头网络中,要识别异常的摄像头;在商场场景中,根据采集的客流和轨迹等数据,对不同的消费者进行分类。这些问题中,都可以把研究对象形成图节点,并建立图关系,最终在图中进行节点分类。
在视频数据或者多维的数据转化为图模型过程中,我们往往得到两种类型的特征。一种是图的结构特征,另一种是图的节点特征。图的结构在节点分类中,可以发挥重要作者。比如,在商场的消费者中,如果识别到了两个一起逛商场的人,并构建了两个人之间的图连接信息,其中一个人为高消费人员,那么从两个人的连接关系中,我们可以推断另一个人也为高消费人员。这是图的结构发挥的作用。第二个维度是图的节点特征,是节点本身的特征。比如,在游逛商场的人中,识别到了某个人背着名牌手袋,那么从一定程度上也可以推断这个背着名牌手袋的消费者属于高消费人员。
如何结合两类类型的特征进行图节点分类是一个重要的问题。在传统的算法中,有的是只考虑图结构特征,有的是只考虑图节点特征,有的是同时考虑图结构特征和图节点特征。显而易见,单独只考虑图结构特征或者图节点特征,算法模型的精准度会被削弱。
基于上述内容,本发明公开了一种图节点分类模型训练方法通过依次利用图结构特征以及图节点特征交替迭代训练初始图节点分类网络,使得目标图节点分类模型训练过程中既充分学习了图节点特征也充分学习了图结构特征,提高了目标图节点分类模型的精准度,且不需要同时训练图结构特征以及图节点特征,从而简化了目标图节点分类模型的训练过程,保证了目标图节点分类模型的复杂性以及精准度。
需要说明的是,本申请实施例提供的图节点分类模型训练的方法,其执行主体可以是图节点分类模型训练的装置,该图节点分类模型训练的装置可以通过软件、硬件或者软硬件结合的方式实现成为电子设备的部分或者全部,其中,该电子设备可以是服务器或者终端,其中,本申请实施例中的服务器可以为一台服务器,也可以为由多台服务器组成的服务器集群,本申请实施例中的终端可以是智能手机、个人电脑、平板电脑、可穿戴设备以及智能机器人等其他智能硬件设备。下述方法实施例中,均以执行主体是电子设备为例来进行说明。
在本申请一个实施例中,如图1所示,提供了一种图节点分类模型训练方法,以该方法应用与电子设备为例进行说明,包括以下步骤:
S101、获取样本数据。
具体地,电子设备可以接收用户输入的样本数据,也可以接收其他设备发送的样本数据,本申请实施例对电子设备获取样本数据的方式不做具体限定。
其中,样本数据可以是图像数据,也可以是表格文字或者数值数据。
当样本数据为图像数据时,电子设备需要对各个图像数据进行图像检测获取到各个图像中目标物体,并根据图像检测结果获取到各个目标物体之间的联系,然后根据各个目标物体以及各个目标物体之间的联系,对各个目标物体进行分类。
当样本数据为表格文字或者数值数据时,电子设备需要对表格文字或者数值数据进行文字或者数值识别,根据识别结果,确定表格文字或者数值数据中的各个目标物体以及各个目标物体之间的联系。然后,根据各个目标物体以及各个目标物体之间的联系,对各个目标物体进行分类。
示例性的,以商场场景中,根据采集的客流和轨迹等数据,对不同的消费者进行分类为例进行说明,其中样本数据可以是商场摄像头采集的各个顾客的图像数据,也可以是商场中收费台采集的各个顾客购买商品的记录表单。因此本申请实施例对样本数据的格式不做具体限定。
当样本数据为商场摄像头采集的各个顾客的图像数据时,电子设备需要对各个图像数据进行图像检测获取到各个图像中顾客,并确定各个顾客的轨迹,然后根据各个顾客的轨迹以及各个顾客对应的同行者,确定各顾客之间的联系,然后根据各个顾客本身以及各个顾客之间的联系,对各个顾客进行分类处理。
当样本数据为顾客购买商品的记录表单时,电子设备可以对记录表单进行文字识别,确定各个顾客购买的商品,购买时间等信息,然后根据各个顾客购买的商品,购买时间确定各个顾客之间的联系,然后根据各个顾客本身以及各个顾客之间的联系,对各个顾客进行分类处理。
S102、基于样本数据构建图节点特征和图结构特征。
具体地,电子设备对样本数据中的各个个体进行识别,并获取各个个体之间的联系,然后根据各个个体以及各个个体之间的联系,构建分类图,根据分类图获取到图节点特征和图结构特征。
具体地,电子设备对样本数据进行分析研究,获取样本数据中的各个个体,即x1,x2,…,xN,其中xi∈Rd。然后,根据各个个体之间的关联关系,可以构建图G(V,E),其中|V|=N,|E|=M,Vi=xi,Ej=xk→xl,其中,|V|表示样本数据中各个个体组成的群里,Vj为则表示单个的个体。|E|=M表示各个个体之间的关联关系,Ej=xk→xl表示xk与xl之间的关联关系。在本申请实施例中,不涉及有向图的计算。因此,如果样本数据中的给定数据为有向图,可以直接把方向信息去掉,成为无向图。基于图结构,我们构建A∈RN×N作为图的连接矩阵。考虑到连接矩阵的性质,可以令A(i,i)=1。计算图的归一化连接矩阵,因此,有
Figure BDA0003445707530000111
其中Dii=∑jAij。基于样本数据中的各个个体构建图节点特征矩阵X∈RN ×d
S103、依次利用图结构特征以及图节点特征交替迭代训练初始图节点分类网络,以确定目标图节点分类模型。
具体地,电子设备可以首先可以利用图结构特征对初始图节点分类网络进行训练,使得初始图节点分类网络可以学习到图结构特征,然后再利用图节点特征对初始图节点分类网络进行训练,使得初始图节点分类网络也可以学习到图节点特征,然后对初始图节点分类网络的模型参数进行修改,以确定目标图节点分类模型。
关于该步骤具体将在下文中进行详细描述。
本发明实施例提供的图节点分类模型训练方法,根据样本数据构建图节点特征和图结构特征,然后依次利用图结构特征以及图节点特征交替迭代训练初始图节点分类网络,以确定目标图节点分类模型。上述方法,通过依次利用图结构特征以及图节点特征交替迭代训练初始图节点分类网络,使得目标图节点分类模型训练过程中既充分学习了图节点特征也充分学习了图结构特征,提高了目标图节点分类模型的精准度,且不需要同时训练图结构特征以及图节点特征,从而简化了目标图节点分类模型的训练过程,保证了目标图节点分类模型的复杂性以及精准度。使得上述方法中的目标图节点分类模型不仅可以完成图的节点分类,还可以保证分类结果的准确性。
在本申请一个可选的实施例中,如图2所示,上述S11中的“依次利用图结构特征以及图节点特征交替迭代训练初始图节点分类网络,以确定目标图节点分类模型”,可以包括以下步骤:
S201、获取样本数据中的初始训练集和初始测试集。
其中,初始训练集带有标签。
具体地,电子设备可以将样本数据分类两类,分别为初始训练集和初始测试集。其中,初始训练集中各个数据带有分类的标签。而初始测试集中的各个数据没有标签。
可选的,初始训练集可以占样本数据的80%,初始测试集可以占样本数据的20%;可选的,初始训练集也可以占样本数据的70%,初始测试集可以占样本数据的30%;本申请实施例对初始训练集和初始测试集占样本数据的比例不做具体限定。
S202、将初始训练集以及初始测试集输入至图结构对应的第一网络,根据初始训练集的标签对第一网络进行训练,得到第一候选模型。
具体地,电子设备可以将初始训练集以及初始测试集输入至图结构对应的第一网络,首先根据初始训练集的标签对第一网络进行训练,然后得到第一候选模型。
S203、基于第一候选模型对初始测试集进行预测,得到第一预测集。
具体地,电子设备可以基于第一候选模型对输入的初始测试集进行预测,并输出初始测试对应的第一测试结果。其中,初始测试集对应的第一测试结果和初始测试集共同组成第一预测集。也即是,第一预测集中包括初始测试集和初始测试集对应的第一测试结果。
示例性的,图结构对应的第一网络可以根据如下迭代函数进行标签计算:
Figure BDA0003445707530000131
式中,Yt表示输入的初始训练集和初始测试集,
Figure BDA0003445707530000132
表示图结构特征。α∈(0,1)为可调参数。实际上,上式的最优解等价于/>
Figure BDA0003445707530000133
Y为初始训练集和初始测试集的标签信息。其中,初始训练集的标签信息为初始训练集对应的标签类别,初始测试集的标签信息为0。
示例性的,若对商场中的顾客进行分类,则初始训练集的标签信息为各个顾客对应的标签类别,而初始测试集的标签信息为0。
具体地,电子设备同时将初始训练集和初始测试集以及初始训练集和初始测试集对应的标签信息输入至图结构对应的第一网络,然后输出初始训练集和初始测试集对应的第一测试标签。
然后再次同时将初始训练集和初始测试集以及初始训练集和初始测试集对应的第一测试标签输入至图结构对应的第一网络,再次输出初始训练集和初始测试集对应的第二测试标签。
直至若干次训练之后,再次同时将初始训练集和初始测试集以及初始训练集和初始测试集对应的目标测试标签输入至图结构对应的第一网络,再次输出初始训练集和初始测试集对应的目标测试标签。也就是说,输入至图结构对应的第一网络的目标测试标签与第一网络输出的目标测试标签相同。电子设备确定得到第一候选模型,并基于第一候选模型对初始测试集进行预测,得到第一预测集。
S204、基于第一预测集以及初始训练集对图节点对应的第二网络进行训练,得到第二候选模型。
具体地,电子设备可以获取第一预测集中预设数量的第一预测集,然后将预设数量的第一预测集和初始训练集同时输入至图节点对应的第二网络,对第二网络进行训练,并调整第二网络中的模型参数,得到第二候选模型。其中,预设数量可以是50%,也可以是60%,本申请实施例对预设数量不做具体限定。
其中,在基于图节点对第二网络进行训练时,可以构建如下的优化函数:
minW||XTW-Y||2+γ||W||1 (2)
式中,γ∈(0,1),X表示图节点特征,W为模型参数,Y为输入的训练数据,在本申请实施例中,训练数据为第一预测集以及初始训练集。上述公式(2)挖掘了基于图节点的信息,即相似的图节点特征更倾向于成为同一类别。
关于该步骤具体将在下文中进行详细描述。
S205、根据第一候选模型和第二候选模型,生成目标图节点分类模型。
在一种可选的实施方式中,第一候选模型和第二候选模型训练完毕之后,可以将第一候选模型和第二候选模型进行组合生成目标图节点分类模型。
在另一种可选的实施方式中,第一候选模型和第二候选模型未训练完,因此,需要继续对第一候选模型和第二候选模型进行训练,然后根据训练后的模型生成目标图节点分类模型。
关于该步骤具体将在下文中进行详细描述。
本发明实施例提供的图节点分类模型训练方法,将初始训练集以及初始测试集输入至图结构对应的第一网络,根据初始训练集的标签对第一网络进行训练,得到第一候选模型。从而使得第一候选模型可以学习到图结构特征。然后,基于第一候选模型对初始测试集进行预测,得到第一预测集。其中,第一预测集即为第一候选模型对图结构特征进行学习后的结果,然后基于第一预测集以及初始训练集对图节点对应的第二网络进行训练,得到第二候选模型,从而使得第二候选模型可以基于对图结构特征学习后的结果,再次学习图节点特征,使得第二候选模型既学习到图结构特征又学习到图节点特征。进而使得根据第一候选模型和第二候选模型,生成的目标图节点分类模型既充分学习了图节点特征也充分学习了图结构特征,提高了目标图节点分类模型的精准度,且不需要同时训练图结构特征以及图节点特征,从而简化了目标图节点分类模型的训练过程,保证了目标图节点分类模型的复杂性以及精准度。使得上述方法中的目标图节点分类模型不仅可以完成图的节点分类,还可以保证分类结果的准确性。
在本申请一个可选的实施例中,如图3所示,上述S205中的“根据第一候选模型和第二候选模型,生成目标图节点分类模型”,可以包括以下步骤:
S301、获取验证集。
具体地,电子设备可以接收用户输入的验证集,也可以接收其他设备发送的验证集,本申请实施例对电子设备获取验证集的方式不做具体限定。
其中,验证集带有标签。
S302、基于验证集验证第二候选模型的第一误差率,以确定第二候选模型是否训练完成。
具体地,电子设备可以将验证集输入至第二候选模型中,将第二候选模型的输出的验证集中各数据对应的测试类别与验证集中各数据对应的标签信息进行对比,从而确定第二候选模型的第一误差率,然后根据第二候选模型的第一误差率确定第二候选模型是否训练完成。
关于该步骤具体将在下文中进行详细描述。
S303、当第二候选模型训练完成时,将第一候选模型和第二候选模型进行组合,生成目标图节点分类模型。
具体地,当第二候选模型训练完成时,将第一候选模型和第二候选模型进行组合,生成目标图节点分类模型。
本发明实施例提供的图节点分类模型训练方法,获取验证集,然后基于基于验证集验证第二候选模型的第一误差率,以确定第二候选模型是否训练完成。从而可以保证训练得到的第二候选模型的精准度。当第二候选模型训练完成时,将第一候选模型和第二候选模型进行组合,生成目标图节点分类模型。进而提高了目标图节点分类模型的精准度。
在本申请一个可选的实施方式中,电子设备可以将验证集输入至第一候选模型中,将第一候选模型的输出类别与验证集中标签信息进行对比,从而确定第一候选模型的第二误差率。然后,电子设备可以将验证集输入至第二候选模型中,将第二候选模型的输出类别与验证集中标签信息进行对比,从而确定第二候选模型的第一误差率,然后电子设备可以计算第一候选模型的第二误差率与第二候选模型的第一误差率之间的平均值,然后根据第一候选模型的第二误差率与第二候选模型的第一误差率之间的平均值确定第二候选模型是否训练完成。
在本申请一个可选的实施例中,如图4所示,上述S302中的“基于验证集验证第二候选模型的第一误差率,以确定第二候选模型是否训练完成”,可以包括以下步骤:
S401、将验证集输入第二候选模型,确定第一误差率。
具体地,电子设备可以将验证集输入至第二候选模型中,将第二候选模型的输出的验证集中各数据对应的测试类别与验证集中各数据对应的标签信息进行对比,从而确定第二候选模型的第一误差率。
S402、获取第一误差率之前的预设数量的第一历史误差率,以及各第一历史误差率对应的第一历史平均值。
具体地,电子设备可以获取第一误差率之前的预设数量的第一历史误差率。其中,预设数量可以是3,也可以是4,还可以是5。
然后,电子设备可以获取各第一历史误差率对应的第一历史平均值。其中,各第一历史平均值根据各第一历史误差率以及各第一历史误差率之前的预设数量的历史误差率计算得到。
示例性的,第一误差率前一个第一历史误差率对应的第一历史平均值可以是第一误差率前一个第一历史误差率与其之前的4个第一历史误差率的平均值。
S403、计算第一误差率与各第一历史误差率对应的平均值。
具体地,电子设备将第一误差率与各第一历史误差率进行相加,计算第一误差率与各第一历史误差率对应的平均值。
示例性地,电子设备可以获取第一误差率之前的4个第一历史误差率,然后将第一误差率与4个第一历史误差率进行相加,计算第一误差率与4个第一历史误差率对应的平均值。
S404、当计算出的平均值与各第一历史平均值相同时,确定第二候选模型训练完成。
电子设备可以将计算出的平均值与各个第一历史平均值进行对比,如计算出的平均值相对于预设数量的第一历史平均值不再减少,也就是说计算出的平均值与各第一历史平均值相同,则电子设备确定第二候选模型训练完成。
示例性的,电子设备可以将计算出的平均值与前4轮的第一历史平均值进行对比。若连续5轮计算出的平均值相对于之前的第一历史平均值不再减少,也就是说计算出的平均值与前4轮的第一历史平均值相同,则电子设备确定第二候选模型训练完成。
S405、当计算出的平均值与各第一历史平均值不同时,获取第二候选模型对初始测试集进行预测得到的第二预测集。
具体地,当计算出的平均值与各第一历史平均值不同时,也就是说计算出的平均值相对与各第一历史平均值存在减小降或者增大的情况,则确定第二候选模型并不稳定,也就是说第二候选模型并未训练完成。
电子设备获取第二候选模型对初始测试集进行预测得到的第二预测集,然后基于第二预测集进行下一轮第一候选模型和第二候选模型的训练。
S406、根据第二预测集和初始训练集,对第一候选模型进行训练,得到第一目标模型。
具体地,电子设备可以获取第二预测集中预设数量的第二预测集,然后将预设数量的第二预测集和初始训练集同时输入至第一候选模型,对第一候选模型进行训练,得到第一目标模型。其中,预设数量可以是50%,也可以是60%,本申请实施例对预设数量不做具体限定。
其中,对第一候选模型进行训练的过程可以参考上述对第一网络进行训练的过程,此处不再进行赘述。
S407、获取第一目标模型对初始测试集进行预测得到的第三预测集。
具体地,电子设备可以基于第一目标模型对输入的初始测试集进行预测,并输出初始测试对应的第三测试结果。其中,初始测试集对应的第三测试结果和初始测试集共同组成第三预测集。也即是,第三预测集中包括初始测试集和初始测试集对应的第三测试结果。
S408、根据第三预测集和初始训练集,对第二候选模型进行训练,得到第二目标模型。
具体地,电子设备可以获取第三预测集中预设数量的第三预测集,然后将预设数量的第三预测集和初始训练集同时输入至第二候选模型,对第二候选模型进行训练,并调整第二候选模型中的模型参数,得到第二目标模型。其中,预设数量可以是50%,也可以是60%,本申请实施例对预设数量不做具体限定。
其中,对第二候选模型进行训练的过程可以参考上述对第二网络进行训练的过程,此处不再进行赘述。
S409、基于验证集验证第二目标模型的第二误差率,以确定第二目标模型是否训练完成。
具体地,电子设备可以将验证集输入至第二目标模型中,将第二目标模型的输出的验证集中各数据对应的测试类别与验证集中各数据对应的标签信息进行对比,,从而确定第二目标模型的第二误差率,然后根据第二目标模型的第二误差率确定第二目标模型是否训练完成。
其中,确定第二目标模型是否训练完成的过程可以参数上述确定第二候选模型是否训练完成的过程,在此不在进行赘述。
S410、当第二目标模型训练完成时,将第一目标模型和第二目标模型进行组合,生成目标图节点分类模型。
具体地,当第二目标模型训练完成时,将第一目标模型和第二目标模型进行组合,生成目标图节点分类模型。
本发明实施例提供的图节点分类模型训练方法,将验证集输入第二候选模型,确定第一误差率。根据第一误差率可以确定当前第二候选模型对应的精准度。然后,获取第一误差率之前的预设数量的第一历史误差率,以及各第一历史误差率对应的第一历史平均值;计算第一误差率与各第一历史误差率对应的平均值,并将当计算出的平均值与各第一历史平均值进行对比。当计算出的平均值与各第一历史平均值相同时,说明第二候选模型的精准度已经趋于平稳,从而确定第二候选模型训练完成。保证了第二候选模型的精准度。此外,上述图节点分类模型训练方法,将计算出的平均值与各第一历史平均值进行对比,当计算出的平均值与各第一历史平均值相同时,确定第二候选模型训练完成。而不是直接根据第二候选模型确定的第一误差率,确定第二候选模型训练完成。从而可以避免在第二候选模型没有训练完成时,因此偶然情况发生使得训练后的第二候选模型的第一误差率较低,从而认为第二候选模型已经训练完成,导致第二候选模型精准度较低。
此外,本发明实施例提供的图节点分类模型训练方法,当计算出的平均值与各第一历史平均值不同时,说明第二候选模型还未训练完成。电子设备获取第二候选模型对初始测试集进行预测得到的第二预测集。然后根据第二预测集和初始训练集,对第一候选模型进行训练,得到第一目标模型,从而使得第一目标模型既充分学习了图节点特征也充分学习了图结构特征,提高了第一目标模型的精准度。然后获取第一目标模型对初始测试集进行预测得到的第三预测集,并根据第三预测集和初始训练集,对第二候选模型进行训练,得到第二目标模型,使得第二目标模型既充分学习了图节点特征也充分学习了图结构特征,提高了第二目标模型的精准度。然后,基于验证集验证第二目标模型的第二误差率,以确定第二目标模型是否训练完成;当第二目标模型训练完成时,将第一目标模型和第二目标模型进行组合,生成目标图节点分类模型。上述图节点分类模型训练方法中组成目标图节点分类模型的第一目标模型和第二目标模型均经过了多次迭代交替训练,也就是说第一目标模型和第二目标模型均经过了多次迭代交替学习图结构特征和图节点特征,因此,可以保证目标图节点分类模型的精准度更高。
在本申请一个可选的实施例中,如图5所示,生成目标图节点分类模型之后,可以包括以下步骤:
S501、基于目标节点分类模型中图节点对应的模型,对初始测试集进行预测,得到第四预测集。
具体地,电子设备将初始测试集输入至目标节点分类模型中图节点对应的模型,基于目标节点分类模型中图节点对应的模型,再次对初始测试集进行预测,得到第四预测集。
S502、根据第四预测集和初始训练集输入至目标节点分类模型中图结构对应的模型,输出初始测试集对应的预测结果。
具体地,电子设备可以获取第四预测集中预设数量的第四预测集,然后将预设数量的第四预测集和初始训练集同时输入至目标节点分类模型中图结构对应的模型,对目标节点分类模型中图结构对应的模型进行训练。其中,预设数量可以是50%,也可以是60%,本申请实施例对预设数量不做具体限定。
然后,基于训练后的目标节点分类模型中图结构对应的模型对初始测试集进行预测,输出初始测试集对应的预测结果。
本发明实施例提供的图节点分类模型训练方法,基于目标节点分类模型中图节点对应的模型,对初始测试集进行预测,得到第四预测集。然后,将第四预测集和初始训练集输入至目标节点分类模型中图结构对应的模型,输出初始测试集对应的预测结果。上述方法,在得到第四预测集之后,将第四预测集和初始训练集输入至目标节点分类模型中图结构对应的模型,从而使得图结构对应的模型可以对第四训练集进行微调,使得输出初始测试集对应的预测结果更加准确。
在本申请一个可选的实施例中,如图6所示,上述S204中的“基于第一预测集以及初始训练集对图节点对应的第二网络进行训练,得到第二候选模型”可以包括以下步骤:
S601、将第一预测集以及初始训练集输入至图节点对应的第二网络,对第二网络中的初始模型参数进行训练,得到第二初始模型。
具体地,电子设备可以获取第一预测集中预设数量的第一预测集,然后将预设数量的第一预测集和初始训练集同时输入至图节点对应的第二网络,对第二网络进行训练,并调整第二网络中的模型参数,得到第二初始模型。其中,预设数量可以是50%,也可以是60%,本申请实施例对预设数量不做具体限定。
S602、获取第二初始模型对应的损失函数,并确定损失函数对应的损失值。
其中,损失函数由第二初始模型的输出结果与初始训练集对应的标签以及第一预测集对应的预测结果构成。
具体地,电子设备获取第二初始模型对应的损失函数,并将第二初始模型输出的结果和第一预测集对应的预测结果以及初始训练集对应的标签输入至损失函数,计算损失值。
S603、当损失值大于预设损失阈值时,基于第二初始模型对初始测试集进行预测,得到第五测试集。
具体地,当损失值大于预设损失阈值时,电子设备确定第二初始模型还未训练完成,需要继续对第二初始模型进行训练。因此,电子设备基于第二初始模型对初始测试集进行预测,得到第五测试集。
S604、基于第五测试集以及初始训练集,训练第二初始模型,以确定第二候选模型。
具体地,电子设备可以获取第五预测集中预设数量的第五预测集,然后将预设数量的第五预测集和初始训练集同时输入至第二初始模型,对第二初始模型进行训练,并调整第二初始模型中的模型参数,直至第二初始模型对应的损失值小于预设损失阈值,得到第二候选模型。其中,预设数量可以是50%,也可以是60%,本申请实施例对预设数量不做具体限定。
本发明实施例提供的图节点分类模型训练方法,将第一预测集以及初始训练集输入至图节点对应的第二网络,对第二网络中的初始模型参数进行训练,得到第二初始模型。然后获取第二初始模型的损失函数,并确定损失函数对应的损失值。当损失值大于预设损失阈值时,说明第二初始模型还未训练完成,需要继续训练。然后,基于第二初始模型对初始测试集进行预测,得到第五测试集;基于第五测试集以及初始训练集,训练第二初始模型,以确定第二候选模型。计算每次训练结果对应的损失值,直至损失值小于预设损失阈值,确定当前第二初始模型训练完成,根据第二初始模型确定第二候选模型。经过对第二初始模型进行无数次训练,从而可以保证训练得到的第二候选模型的精准度,进一步保证最后得到的目标图节点分类模型的精准度。
应该理解的是,虽然图1-6的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图1-6中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
如图7所示,本实施例提供一种图节点分类模型训练装置,包括:
获取模块71,用于获取样本数据。
构建模块72,用于基于样本数据构建图节点特征和图结构特征。
训练模块73,用于依次利用图结构特征以及图节点特征交替迭代训练初始图节点分类网络,以确定目标图节点分类模型。
在本申请一个实施例中,上述训练模块73,具体用于获取样本数据中的初始训练集和初始测试集;初始训练集带有标签;将初始训练集以及初始测试集输入至图结构对应的第一网络,根据初始训练集的标签对第一网络进行训练,得到第一候选模型;基于第一候选模型对初始测试集进行预测,得到第一预测集;基于第一预测集以及初始训练集对图节点对应的第二网络进行训练,得到第二候选模型;根据第一候选模型和第二候选模型,生成目标图节点分类模型。
在本申请一个实施例中,上述训练模块73,具体用于获取验证集;基于验证集验证第二候选模型的第一误差率,以确定第二候选模型是否训练完成;当第二候选模型训练完成时,将第一候选模型和第二候选模型进行组合,生成目标图节点分类模型。
在本申请一个实施例中,上述训练模块73,具体用于将验证集输入第二候选模型,确定第一误差率;获取第一误差率之前的预设数量的第一历史误差率,以及各第一历史误差率对应的第一历史平均值;计算第一误差率与各第一历史误差率对应的平均值;当计算出的平均值与各第一历史平均值相同时,确定第二候选模型训练完成。
在本申请一个实施例中,上述训练模块73,具体用于当计算出的平均值与各第一历史平均值不同时,获取第二候选模型对初始测试集进行预测得到的第二预测集;根据第二预测集和初始训练集,对第一候选模型进行训练,得到第一目标模型;获取第一目标模型对初始测试集进行预测得到的第三预测集;根据第三预测集和初始训练集,对第二候选模型进行训练,得到第二目标模型;基于验证集验证第二目标模型的第二误差率,以确定第二目标模型是否训练完成;当第二目标模型训练完成时,将第一目标模型和第二目标模型进行组合,生成目标图节点分类模型。
在本申请一个实施例中,上述训练模块73,具体用于基于目标节点分类模型中图节点对应的模型,对初始测试集进行预测,得到第四预测集;根据第四预测集和初始训练集输入至目标节点分类模型中图结构对应的模型,输出初始测试集对应的预测结果。
在本申请一个实施例中,上述训练模块73,具体用于将第一预测集以及初始训练集输入至图节点对应的第二网络,对第二网络中的初始模型参数进行训练,得到第二初始模型;获取第二初始模型对应的损失函数,并确定损失函数对应的损失值;损失函数由第二初始模型的输出结果与初始训练集对应的标签以及第一预测集对应的预测结果构成;当损失值大于预设损失阈值时,基于第二初始模型对初始测试集进行预测,得到第五测试集;基于第五测试集以及初始训练集,训练第二初始模型,以确定第二候选模型。
关于图节点分类模型训练装置的具体限定以及有益效果可以参见上文中对于图节点分类模型训练方法的限定,在此不再赘述。上述图节点分类模型训练装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于电子设备中的处理器中,也可以以软件形式存储于电子设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
本发明实施例还提供一种电子设备,具有上述图7所示的图节点分类模型训练装置。
如图8所示,图8是本发明可选实施例提供的一种电子设备的结构示意图,如图8所示,该电子设备可以包括:至少一个处理器81,例如CPU(Central Processing Unit,中央处理器),至少一个通信接口83,存储器84,至少一个通信总线82。其中,通信总线82用于实现这些组件之间的连接通信。其中,通信接口83可以包括显示屏(Display)、键盘(Keyboard),可选通信接口83还可以包括标准的有线接口、无线接口。存储器84可以是高速RAM存储器(Random Access Memory,易挥发性随机存取存储器),也可以是非不稳定的存储器(non-volatile memory),例如至少一个磁盘存储器。存储器84可选的还可以是至少一个位于远离前述处理器81的存储装置。其中处理器81可以结合图7装置,存储器84中存储应用程序,且处理器81调用存储器84中存储的程序代码,以用于执行上述任一方法步骤。
其中,通信总线82可以是外设部件互连标准(peripheral componentinterconnect,简称PCI)总线或扩展工业标准结构(extended industry standardarchitecture,简称EISA)总线等。通信总线82可以分为地址总线、数据总线、控制总线等。为便于表示,图8中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
其中,存储器84可以包括易失性存储器(英文:volatile memory),例如随机存取存储器(英文:random-access memory,缩写:RAM);存储器也可以包括非易失性存储器(英文:non-volatile memory),例如快闪存储器(英文:flash memory),硬盘(英文:hard diskdrive,缩写:HDD)或固态硬盘(英文:solid-state drive,缩写:SSD);存储器84还可以包括上述种类的存储器的组合。
其中,处理器81可以是中央处理器(英文:central processing unit,缩写:CPU),网络处理器(英文:network processor,缩写:NP)或者CPU和NP的组合。
其中,处理器81还可以进一步包括硬件芯片。上述硬件芯片可以是专用集成电路(英文:application-specific integrated circuit,缩写:ASIC),可编程逻辑器件(英文:programmable logic device,缩写:PLD)或其组合。上述PLD可以是复杂可编程逻辑器件(英文:complex programmable logic device,缩写:CPLD),现场可编程逻辑门阵列(英文:field-programmable gate array,缩写:FPGA),通用阵列逻辑(英文:generic arraylogic,缩写:GAL)或其任意组合。
可选地,存储器84还用于存储程序指令。处理器81可以调用程序指令,实现如本申请图1至6实施例中所示的图节点分类模型训练方法。
本发明实施例还提供了一种非暂态计算机存储介质,所述计算机存储介质存储有计算机可执行指令,该计算机可执行指令可执行上述任意方法实施例中的图节点分类模型训练方法。其中,所述存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)、随机存储记忆体(Random Access Memory,RAM)、快闪存储器(Flash Memory)、硬盘(HardDisk Drive,缩写:HDD)或固态硬盘(Solid-State Drive,SSD)等;所述存储介质还可以包括上述种类的存储器的组合。
虽然结合附图描述了本发明的实施例,但是本领域技术人员可以在不脱离本发明的精神和范围的情况下做出各种修改和变型,这样的修改和变型均落入由所附权利要求所限定的范围之内。

Claims (10)

1.一种图节点分类模型训练方法,其特征在于,所述方法包括:
获取样本数据;
基于所述样本数据构建图节点特征和图结构特征;
依次利用所述图结构特征以及所述图节点特征交替迭代训练初始图节点分类网络,以确定目标图节点分类模型。
2.根据权利要求1所述的方法,其特征在于,所述依次利用所述图结构特征以及所述图节点特征交替迭代训练初始图节点分类网络,以确定目标图节点分类模型,包括:
获取所述样本数据中的初始训练集和初始测试集;所述初始训练集带有标签;
将所述初始训练集以及所述初始测试集输入至图结构对应的第一网络,根据所述初始训练集的标签对所述第一网络进行训练,得到第一候选模型;
基于所述第一候选模型对所述初始测试集进行预测,得到第一预测集;
基于所述第一预测集以及所述初始训练集对图节点对应的第二网络进行训练,得到第二候选模型;
根据所述第一候选模型和所述第二候选模型,生成所述目标图节点分类模型。
3.根据权利要求2所述的方法,其特征在于,所述根据所述第一候选模型和所述第二候选模型,生成所述目标图节点分类模型,包括:
获取验证集;
基于所述验证集验证所述第二候选模型的第一误差率,以确定所述第二候选模型是否训练完成;
当所述第二候选模型训练完成时,将所述第一候选模型和所述第二候选模型进行组合,生成所述目标图节点分类模型。
4.根据权利要求3所述的方法,其特征在于,所述基于所述验证集验证所述第二候选模型的第一误差率,以确定所述第二候选模型是否训练完成,包括:
将所述验证集输入所述第二候选模型,确定所述第一误差率;
获取所述第一误差率之前的预设数量的第一历史误差率,以及各所述第一历史误差率对应的第一历史平均值;
计算所述第一误差率与各所述第一历史误差率对应的平均值;
当计算出的平均值与各所述第一历史平均值相同时,确定所述第二候选模型训练完成。
5.根据权利要求4所述的方法,其特征在于,所述基于所述验证集验证所述第二候选模型的第一误差率,以确定所述第二候选模型是否训练完成,还包括:
当计算出的平均值与各所述第一历史平均值不同时,获取所述第二候选模型对所述初始测试集进行预测得到的第二预测集;
根据所述第二预测集和所述初始训练集,对所述第一候选模型进行训练,得到第一目标模型;
获取所述第一目标模型对所述初始测试集进行预测得到的第三预测集;
根据所述第三预测集和所述初始训练集,对所述第二候选模型进行训练,得到第二目标模型;
基于所述验证集验证所述第二目标模型的第二误差率,以确定所述第二目标模型是否训练完成;
当所述第二目标模型训练完成时,将所述第一目标模型和所述第二目标模型进行组合,生成所述目标图节点分类模型。
6.根据权利要求3或5任一所述的方法,其特征在于,所述生成所述目标图节点分类模型之后,所述方法还包括:
基于所述目标节点分类模型中图节点对应的模型,对所述初始测试集进行预测,得到第四预测集;
根据所述第四预测集和所述初始训练集输入至所述目标节点分类模型中图结构对应的模型,输出所述初始测试集对应的预测结果。
7.根据权利要求2所述的方法,其特征在于,所述基于所述第一预测集以及所述初始训练集对图节点对应的第二网络进行训练,得到第二候选模型,包括:
将所述第一预测集以及所述初始训练集输入至所述图节点对应的第二网络,对所述第二网络中的初始模型参数进行训练,得到第二初始模型;
获取所述第二初始模型对应的损失函数,并确定所述损失函数对应的损失值;所述损失函数由所述第二初始模型的输出结果与所述初始训练集对应的标签以及所述第一预测集对应的预测结果构成;
当所述损失值大于预设损失阈值时,基于所述第二初始模型对所述初始测试集进行预测,得到第五测试集;
基于所述第五测试集以及所述初始训练集,训练所述第二初始模型,以确定所述第二候选模型。
8.一种图节点分类模型训练装置,其特征在于,所述装置法包括:
获取模块,用于获取样本数据;
构建模块,用于基于所述样本数据构建图节点特征和图结构特征;
训练模块,用于依次利用所述图结构特征以及所述图节点特征交替迭代训练初始图节点分类网络,以确定目标图节点分类模型。
9.一种电子设备,其特征在于,包括存储器和处理器,所述存储器中存储有计算机指令,所述处理器通过执行所述计算机指令,从而执行权利要求1-7中任一项所述的图节点分类模型训练方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使计算机执行权利要求1-7中任一项所述的图节点分类模型训练方法。
CN202111682730.0A 2021-12-30 2021-12-30 图节点分类模型训练方法、装置、电子设备及存储介质 Pending CN116433953A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111682730.0A CN116433953A (zh) 2021-12-30 2021-12-30 图节点分类模型训练方法、装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111682730.0A CN116433953A (zh) 2021-12-30 2021-12-30 图节点分类模型训练方法、装置、电子设备及存储介质

Publications (1)

Publication Number Publication Date
CN116433953A true CN116433953A (zh) 2023-07-14

Family

ID=87091285

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111682730.0A Pending CN116433953A (zh) 2021-12-30 2021-12-30 图节点分类模型训练方法、装置、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN116433953A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN118570560A (zh) * 2024-07-31 2024-08-30 之江实验室 一种训练图像分类模型的系统、方法、装置、介质及设备

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN118570560A (zh) * 2024-07-31 2024-08-30 之江实验室 一种训练图像分类模型的系统、方法、装置、介质及设备

Similar Documents

Publication Publication Date Title
CN110377740B (zh) 情感极性分析方法、装置、电子设备及存储介质
WO2019114344A1 (zh) 一种基于图结构模型的异常账号防控方法、装置以及设备
US20160140408A1 (en) Neural Network Patch Aggregation and Statistics
CN111639687B (zh) 一种模型训练以及异常账号识别方法及装置
CN113989476B (zh) 对象识别方法及电子设备
CN111931859B (zh) 一种多标签图像识别方法和装置
WO2022105297A1 (zh) 表格结构的还原方法、系统、计算机设备及存储介质
US20230021338A1 (en) Conditionally independent data generation for training machine learning systems
CN114663952A (zh) 对象分类方法、深度学习模型的训练方法、装置和设备
WO2021068613A1 (zh) 面部识别方法、装置、设备及计算机可读存储介质
CN110163095B (zh) 回环检测方法、回环检测装置及终端设备
CN115034379A (zh) 一种因果关系确定方法及相关设备
CN114595352A (zh) 一种图像识别方法、装置、电子设备及可读存储介质
CN116433953A (zh) 图节点分类模型训练方法、装置、电子设备及存储介质
CN115618008A (zh) 账户状态模型构建方法、装置、计算机设备和存储介质
CN110619602B (zh) 一种图像生成方法、装置、电子设备及存储介质
CN112036418A (zh) 用于提取用户特征的方法和装置
CN117786087A (zh) 信息抽取方法、装置、设备及存储介质
CN115758271A (zh) 数据处理方法、装置、计算机设备和存储介质
CN117251723A (zh) 基于大数据的异常分析方法及系统
CN111797863A (zh) 模型训练方法、数据处理方法、装置、存储介质及设备
CN115048996A (zh) 质量评估模型训练和使用方法、设备及存储介质
CN113806541A (zh) 情感分类的方法和情感分类模型的训练方法、装置
CN112749707A (zh) 利用神经网络进行目标分割的方法、设备和介质
CN112561778B (zh) 图像风格化处理方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination