发明内容
本申请旨在至少解决现有技术中存在的技术问题之一。为此,本申请提出一种基于深度学习的测井曲线补全模型训练方法及装置,以提高缺失测井曲线的补全效率。
第一方面,一种基于深度学习的测井曲线补全模型训练方法,包括:
将样本曲线集中的测井曲线输入预设的初始模型中,得到由所述初始模型的异构图神经网络输出的缺失测井曲线对应的归一化特征,和由所述初始模型的全连接神经网络输出的缺失测井曲线上采样点的统计信息;
根据所述统计信息将所述归一化特征进行反归一化操作,以转换为对应的缺失测井曲线;
基于所述缺失测井曲线对所述初始模型进行训练,以更新所述异构图神经网络和所述全连接神经网络的参数,得到测井曲线补全模型。
根据本申请的基于深度学习的测井曲线补全模型训练方法,通过将样本曲线集中的测井曲线输入预设的初始模型中,得到由所述初始模型的异构图神经网络输出的缺失测井曲线对应的归一化特征,和由所述初始模型的全连接神经网络输出的缺失测井曲线上采样点的统计信息;根据所述统计信息将所述归一化特征进行反归一化操作,以转换为对应的缺失测井曲线;基于所述缺失测井曲线对所述初始模型进行训练,以更新所述异构图神经网络和所述全连接神经网络的参数,得到测井曲线补全模型。本申请实施例通过异构图神经网络用来推断多井测井曲线之间的相互关系进而预测归一化的测井曲线,全连接神经网络用以将预测出的归一化的测井曲线反归一化,以异构图神经网络和全连接神经网络结合的混合式深度学习的方式对模型进行训练,确保网络输出的一致性,自适应实现不同测井曲线的补全,自适应提高了缺失测井曲线的补全效率。
根据本申请的一个实施例,所述方法还包括:
获取目标钻井对应的一组测井曲线;所述一组测井曲线包括多条测井曲线;所述测井曲线对应有表示测井曲线形状的标签;
对至少一个标签进行随机掩码,得到掩码后的一组测井曲线;
将掩码后的一组测井曲线和对应的标签组合形成一对训练样本对;
根据多个目标钻井对应的训练样本对构建所述样本曲线集。
该实施例中,通过对测井曲线进行随机掩码的方式构建样本曲线集,使得在模型训练过程中,通过对随机掩码的测井曲线进行预测,进而比较预测值与标签对应的真实值来计算损失函数。进一步的,由于完整未缺失的测井曲线的数量是比较少的,而为了获取足够量的训练数据,该实施例中,通过对测井曲线进行随机掩码的方式,能够对于同一组测井曲线,进行多次随机掩码,从而生成多对训练样本对,从而增加了训练数据的量。
根据本申请的一个实施例,所述一组测井曲线中还包括缺失的测井曲线;
所述对至少一个标签进行随机掩码,得到掩码后的一组测井曲线,包括:
对缺失的测井曲线对应的标签进行原始掩码,对至少一个未缺失的测井曲线对应的标签进行随机掩码,得到掩码后的一组测井曲线。
在该实施例中,还通过原始掩码的方式对缺失测井曲线进行掩码,对于未缺失的测井曲线进行随机掩码,使得模型训练过程中,仍然能够对随机掩码的测井曲线进行预测,进而比较预测值与标签对应的真实值来计算损失函数。而缺失的测井曲线的数量是很大的,因而通过上述方式来自适应构建训练样本对,能够进一步增加训练数据的量。
根据本申请的一个实施例,所述将掩码后的一组测井曲线和对应的标签组合形成一对训练样本对,包括:
对随机掩码后的测井曲线和对应的标签进行点乘获得掩码处的采样点值;
基于所述采样点值对掩码后的一组测井曲线进行不同倍率的采样,得到一组不同采样率的测井曲线;
将所述一组不同采样率的测井曲线和对应的标签组合形成一对训练样本对。
在该实施例中,通过对测井曲线进行多尺度采样,能够更高精度地捕捉不同测井曲线的信息,从而有利于提高对于测井曲线特征提取的精确度。
根据本申请的一个实施例,所述异构图神经网络根据以下方式输出的缺失测井曲线对应的归一化特征:
基于不同的编码器和不同的解码器提取不同类别测井曲线对应的第一节点特征;
根据所述第一节点特征计算不同类别之间的测井曲线的特征关系;
根据所述特征关系预测缺失测井曲线对应的第二节点特征;
输出所述第二节点特征,所述第二节点特征表示缺失测井曲线对应的归一化特征。
在该实施例中,若采用常规单编码器固定测井曲线输入提取特征的方式会大幅削弱不同井曲线特征的独特性,该实施例通过采用不同的编码器和不同的解码器对不同类别测井曲线进行特征提取的方式,可以避免不同测井曲线特征之间的干扰。
根据本申请的一个实施例,所述根据所述第一节点特征计算不同类别之间的测井曲线的特征关系,包括:
基于聚合模块计算不同类别之间的测井曲线的特征关系,所述聚合模块通过下式表示:
其中,公式右边表示不同类别之间的测井曲线的特征关系,Wc表示卷积运算的学习权重,N(i)表示节点i的临近节点集合,xj表示临近节点的第一节点特征,αi,j表示节点i和节点j之间的注意力系数,x′i表示节点i的新特征,即缺失测井曲线对应的第二节点特征。
根据本申请的一个实施例,所述根据所述第一节点特征计算不同类别之间的测井曲线的特征关系,包括:
基于聚合模块计算不同类别之间的测井曲线的特征关系,所述聚合模块通过下式表示:
其中,Wi,j表示可学习矩阵,用于强化注意力。
根据本申请的一个实施例,所述基于所述缺失测井曲线对所述初始模型进行训练,以更新所述异构图神经网络和所述全连接神经网络的参数,得到测井曲线补全模型,包括:
根据预测得到的所述缺失测井曲线与标签值对应的真实值之间的差异计算异构图神经网络和所述全连接神经网络的总体损失函数;
基于所述总体损失函数更新所述异构图神经网络和所述全连接神经网络的参数,得到测井曲线补全模型。
根据本申请的一个实施例,通过以下公式计算所述总体损失函数:
L=wGLG+wFLF
其中,L表示总体损失函数,LF表示全连接神经网络的损失函数,wF表示LF的权重,LG表示异构图神经网络的损失函数,wG表示LG的权重,LMSE和LSSIM分别代表均方误差和结构相似指标,w1和w2为权重系数,mi 0和mi d代表原始掩码和随机掩码(i=0,1,2,3…),yi(i=0,1,2,3…)和分别代表标签和预测测井曲线值。
第二方面,本申请提供了一种基于深度学习的测井曲线补全方法,包括:
获取目标钻井已知的测井曲线;
选择缺失测井曲线的类型,并将所述已知的测井曲线输入至预设的测井曲线补全模型,获得所述测井曲线补全模型输出的缺失测井曲线;
其中,所述测井曲线补全模型是采用如第一方面所述的方法训练的。
根据本申请的基于深度学习的测井曲线补全方法,本申请所使用的测井曲线补全模型,通过异构图神经网络用来推断多井测井曲线之间的相互关系进而预测归一化的测井曲线,全连接神经网络用以将预测出的归一化的测井曲线反归一化,以异构图神经网络和全连接神经网络结合的混合式深度学习的方式对模型进行训练,确保网络输出的一致性,自适应实现不同测井曲线的补全,提高了缺失测井曲线的补全效率。
第三方面,本申请提供了一种基于深度学习的测井曲线补全模型训练装置,该装置包括:
输入模块,用于将样本曲线集中的测井曲线输入预设的初始模型中,得到由所述初始模型的异构图神经网络输出的缺失测井曲线对应的归一化特征,和由所述初始模型的全连接神经网络输出的缺失测井曲线上采样点的统计信息;
转换模块,用于根据所述统计信息将所述归一化特征进行反归一化操作,以转换为对应的缺失测井曲线;
训练模块,用于基于所述缺失测井曲线对所述初始模型进行训练,以更新所述异构图神经网络和所述全连接神经网络的参数,得到测井曲线补全模型。
根据本申请的基于深度学习的测井曲线补全模型训练装置,本申请通过异构图神经网络用来推断多井测井曲线之间的相互关系进而预测归一化的测井曲线,全连接神经网络用以将预测出的归一化的测井曲线反归一化,以异构图神经网络和全连接神经网络结合的混合式深度学习的方式对模型进行训练,确保网络输出的一致性,自适应实现不同测井曲线的补全,提高了缺失测井曲线的补全效率。
第四方面,本申请提供了一种基于深度学习的测井曲线补全装置,包括:
获取模块,用于获取目标钻井已知的测井曲线;
预测模块,用于选择缺失测井曲线的类型,并将所述已知的测井曲线输入至预设的测井曲线补全模型,获得所述测井曲线补全模型预测的缺失测井曲线;
其中,所述测井曲线补全模型是采用如第一方面所述的方法训练的。
根据本申请的基于深度学习的测井曲线补全装置,本申请所使用的测井曲线补全模型,通过异构图神经网络用来推断多井测井曲线之间的相互关系进而预测归一化的测井曲线,全连接神经网络用以将预测出的归一化的测井曲线反归一化,以异构图神经网络和全连接神经网络结合的混合式深度学习的方式对模型进行训练,确保网络输出的一致性,自适应实现不同测井曲线的补全,提高了缺失测井曲线的补全效率。
第五方面,本申请提供了一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上述第一方面或第二方面所述的方法。
第六方面,本申请提供了一种非暂态计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如上述第一方面或第二方面所述的方法。
第七方面,本申请提供了一种芯片,所述芯片包括处理器和通信接口,所述通信接口和所述处理器耦合,所述处理器用于运行程序或指令,实现如上述第一方面或第二方面所述的方法。
第八方面,本申请提供了一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上述第一方面或第二方面所述的方法。
本申请实施例中的上述一个或多个技术方案,至少具有如下技术效果之一:
根据本申请的基于深度学习的测井曲线补全模型训练方法,通过将样本曲线集中的测井曲线输入预设的初始模型中,得到由所述初始模型的异构图神经网络输出的缺失测井曲线对应的归一化特征,和由所述初始模型的全连接神经网络输出的缺失测井曲线上采样点的统计信息;根据所述统计信息将所述归一化特征进行反归一化操作,以转换为对应的缺失测井曲线;基于所述缺失测井曲线对所述初始模型进行训练,以更新所述异构图神经网络和所述全连接神经网络的参数,得到测井曲线补全模型。本申请实施例通过异构图神经网络用来推断多井测井曲线之间的相互关系进而预测归一化的测井曲线,全连接神经网络用以将预测出的归一化的测井曲线反归一化,以异构图神经网络和全连接神经网络结合的混合式深度学习的方式对模型进行训练,确保网络输出的一致性,自适应实现不同测井曲线的补全,提高了缺失测井曲线的补全效率。
进一步的,在一些实施例中,通过对测井曲线进行随机掩码的方式构建样本曲线集,使得在模型训练过程中,通过对随机掩码的测井曲线进行预测,进而比较预测值与标签对应的真实值来计算损失函数。进一步的,由于完整未缺失的测井曲线的数量是比较少的,而为了获取足够量的训练数据,该实施例中,通过对测井曲线进行随机掩码的方式,能够对于同一组测井曲线,进行多次随机掩码,从而生成多对训练样本对,从而增加了训练数据的量。
更进一步的,在一些实施例中,还通过原始掩码的方式对缺失测井曲线进行掩码,对于未缺失的测井曲线进行随机掩码,使得模型训练过程中,仍然能够对随机掩码的测井曲线进行预测,进而比较预测值与标签对应的真实值来计算损失函数。而缺失的测井曲线的数量是很大的,因而通过上述方式来自适应构建训练样本对,能够进一步增加训练数据的量。
更进一步的,在一些实施例中,通过对测井曲线进行多尺度采样,能够更高精度地捕捉不同测井曲线的信息,从而有利于提高对于测井曲线特征提取的精确度。
再进一步的,在一些实施例中,在该实施例中,若采用常规单编码器固定测井曲线输入提取特征的方式会大幅削弱不同井曲线特征的独特性,该实施例通过采用不同的编码器和不同的解码器对不同类别测井曲线进行特征提取的方式,可以避免不同测井曲线特征之间的干扰。
本申请的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本申请的实践了解到。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员获得的所有其他实施例,都属于本申请保护的范围。
本申请的说明书和权利要求书中的术语“第一”、“第二”等是用于区别类似的对象,而不用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施,且“第一”、“第二”等所区分的对象通常为一类,并不限定对象的个数,例如第一对象可以是一个,也可以是多个。此外,说明书以及权利要求中“和/或”表示所连接对象的至少其中之一,字符“/”,一般表示前后关联对象是一种“或”的关系。
对于部分井由于采集成本或仪器设备的原因存在测井曲线缺失的问题,目前解决的方法主要包括通过临井或其他深度井曲线替换来补全缺失井段、通过岩石物理模型补全缺失井段、通过基于深度学习的测井缺失段补全。通过曲线替换的方法补全测井曲线对地质构造信息要求极高。通过岩石物理模型补全的方式由于不同岩石具有不同的物理模型,因此需要专家知识去识别岩性及选择合适的模型。通过深度学习的测井曲线补全目前对网络的输入输出较为固定,因此无法同时实现不同测井曲线的补全,制约不全方法在实际数据中的应用。
由上述现有技术可知,无论是传统的物理模型还是经验模型,其针对测井曲线的补全效率都是比较低的。本申请考虑到如果通过异构图神经网络和全连接神经网络结合的混合式深度学习的方式来提取不同测井曲线之间的映射关系,从而能够确保网络输出的一致性,提高缺失测井曲线的补全效率。
下面结合附图,通过具体的实施例及其应用场景对本申请实施例提供的基于深度学习的测井曲线补全模型训练方法及装置进行详细地说明。
其中,基于深度学习的测井曲线补全模型训练方法可应用于终端,具体可由,终端中的硬件或软件执行。
该终端包括但不限于具有触摸敏感表面(例如,触摸屏显示器和/或触摸板)的移动电话或平板电脑等便携式通信设备。还应当理解的是,在某些实施例中,该终端可以不是便携式通信设备,而是具有触摸敏感表面(例如,触摸屏显示器和/或触摸板)的台式计算机。
以下各个实施例中,描述了包括显示器和触摸敏感表面的终端。然而,应当理解的是,终端可以包括诸如物理键盘、鼠标和控制杆的一个或多个其它物理用户接口设备。
本申请实施例提供的基于深度学习的测井曲线补全模型训练方法,该基于深度学习的测井曲线补全模型训练方法的执行主体可以为电子设备或者电子设备中能够实现该基于深度学习的测井曲线补全模型训练方法的功能模块或功能实体,本申请实施例提及的电子设备包括但不限于手机、平板电脑、电脑、相机和可穿戴设备等,下面以电子设备作为执行主体为例对本申请实施例提供的基于深度学习的测井曲线补全模型训练方法进行说明。
如图1所示,该基于深度学习的测井曲线补全模型训练方法包括:步骤110、步骤120和步骤130。
步骤110、将样本曲线集中的测井曲线输入预设的初始模型中,得到由初始模型的异构图神经网络输出的缺失测井曲线对应的归一化特征,和由初始模型的全连接神经网络输出的缺失测井曲线上采样点的统计信息。
在本申请实施例中,测井数据是指通过测井工具获取的地下岩石和地层的物理性质数据,包括地层压力、渗透率、孔隙度、密度、电阻率等信息。测井曲线是根据测井数据绘制的曲线图,用于反映地层不同物理性质的变化。常见的测井曲线包括:电阻率曲线、自然伽马曲线、声波时差曲线、密度曲线、中子孔隙度曲线等。测井曲线与测井数据密切相关,通过分析测井曲线可以获取地层的物理性质信息,指导油气勘探和生产。
在本申请实施例中,可以通过获取真实的测井数据来构建样本曲线集。例如,获取某一工区内多口钻井的真实测井曲线,其中每口钻井可以包括多种不同类别的测井曲线,将同一钻井的测井曲线分为一组,构建由多口钻井对应的多组测井曲线组成的样本曲线集,其中,测井曲线还可以带有标签,用于标注测井曲线的形状。
在本申请实施例中,初始模型是根据异构图神经网络和全连接神经网络构建得到,初始模型所采用的网络结构如图2所示。异构图神经网络可以用来推断多井测井曲线之间的相互关系进而预测归一化的测井曲线,全连接层用来估计预测测井曲线的统计信息,例如平均值和方差等,用以将预测出的归一化的测井曲线反归一化。
具体的,异构图神经网络以图神经网络为核心网络,首先可以对输入的每条测井曲线进行均值-方差归一化处理,通过归一化处理可以使网络获取空间特征的同时降低不同测井曲线采样点之间的排他性。进而,对归一化后的测井曲线进行上采样和下采样以强化测井曲线的变化特征。随后,多尺度采样点被喂到图神经网络中用于训练。通过以上步骤,异构图神经网络头可以自适应通过所有已知的测井曲线来预测缺失的归一化的测井曲线,即异构图神经网络可以输出的缺失测井曲线对应的归一化特征。
由于异构图神经网络头输出为归一化的测井曲线,因此需要对预测的缺失测井曲线进行反归一化操作。对于缺失测井曲线的采样点,均值和方差等统计信息是未知量。本申请为了解决这一问题采用了全连接神经网络头来估计缺失测井曲线反归一化所需的统计信息。具体方式可以包括:将异构图神经网络头输入的未归一化的采样点进行多尺度采样并输入到一个四层全连接网络,通过该全连接神经网络进行精确的预测均值及方差,以得到缺失测井曲线上采样点的统计信息。
步骤120、根据统计信息将归一化特征进行反归一化操作,以转换为对应的缺失测井曲线。
具体的,反归一化是将归一化处理的数据还原为原始数据的过程,反归一化所采用的方法取决于归一化所采用的方法。在得到缺失测井曲线上采样点的统计信息后,可以基于该统计信息对归一化特征进行反归一化操作,从而转换得到对应的缺失测井曲线。
步骤130、基于缺失测井曲线对初始模型进行训练,以更新异构图神经网络和全连接神经网络的参数,得到测井曲线补全模型。
具体的,在预测到缺失测井曲线之后,可以结合样本中测井曲线的标签,对初始模型进行训练,基于预测结果与标签对应的真实值进行比较,计算损失函数,为反向传播提供输入依据,以迭代更新异构图神经网络的参数以及全连接神经网络的参数,训练完成,得到测井曲线补全模型。
根据本申请的基于深度学习的测井曲线补全模型训练方法,通过将样本曲线集中的测井曲线输入预设的初始模型中,得到由初始模型的异构图神经网络输出的缺失测井曲线对应的归一化特征,和由初始模型的全连接神经网络输出的缺失测井曲线上采样点的统计信息;根据统计信息将归一化特征进行反归一化操作,以转换为对应的缺失测井曲线;基于缺失测井曲线对初始模型进行训练,以更新异构图神经网络和全连接神经网络的参数,得到测井曲线补全模型。本申请实施例通过异构图神经网络用来推断多井测井曲线之间的相互关系进而预测归一化的测井曲线,全连接神经网络用以将预测出的归一化的测井曲线反归一化,以异构图神经网络和全连接神经网络结合的混合式深度学习的方式对模型进行训练,确保网络输出的一致性,自适应实现不同测井曲线的补全,提高了缺失测井曲线的补全效率。
在一些实施例中,可以根据以下方式构建样本曲线集:
获取目标钻井对应的一组测井曲线;一组测井曲线包括多条测井曲线;测井曲线对应有表示测井曲线形状的标签;
对至少一个标签进行随机掩码,得到掩码后的一组测井曲线;
将掩码后的一组测井曲线和对应的标签组合形成一对训练样本对;
根据多个目标钻井对应的训练样本对构建样本曲线集。
通常对于每口井,都可以获得多条不同的测井曲线,测井曲线本身的形状即可作为标签。如图3所示,以基于四种测井曲线构建训练样本对为例,图3中y0,y1,y2,y3分别代表自然伽马曲线、密度曲线、中子孔隙度曲线以及声波时差曲线。对至少一个标签进行随机掩码(Md)得到掩码后的测井曲线,然后将该组测井曲线和对应的标签组合形成一对训练样本对。
该实施例中,通过对测井曲线进行随机掩码的方式构建样本曲线集,使得在模型训练过程中,通过对随机掩码的测井曲线进行预测,进而比较预测值与标签对应的真实值来计算损失函数。进一步的,由于完整未缺失的测井曲线的数量是比较少的,而为了获取足够量的训练数据,该实施例中,通过对测井曲线进行随机掩码的方式,能够对于同一组测井曲线,进行多次随机掩码,从而生成多对训练样本对,从而增加了训练数据的量。
在实际情况中,由于完整未缺失的测井曲线的数量是比较少的,缺失的测井曲线数量多但是不能作为训练数据,上述随机掩码的方式可以增加训练数据的量,为了进一步增加训练样本的量,本申请通过自适应构建训练样本对的方式来构建样本曲线集。
在一些实施例中,一组测井曲线中还包括缺失的测井曲线;
对至少一个标签进行随机掩码,得到掩码后的一组测井曲线,包括:
对缺失的测井曲线对应的标签进行原始掩码,对至少一个未缺失的测井曲线对应的标签进行进行随机掩码,得到掩码后的一组测井曲线。
由于缺失部分测井曲线(M0),在正常情况下,该井的测井曲线无法作为训练数据。通过本申请实施例对该井的测井曲线进行处理后,即可作为训练数据集。具体的,首先,对至少一个标签进行随机掩码(Md)得到掩码后的样本,以及对缺失的测井曲线对应的标签进行原始掩码。随机掩码和原始掩码的值取0或者1,如果取0代表训练数据掩码处缺失数据。
在该实施例中,还通过原始掩码的方式对缺失测井曲线进行掩码,对于未缺失的测井曲线进行随机掩码,使得模型训练过程中,仍然能够对随机掩码的测井曲线进行预测,进而比较预测值与标签对应的真实值来计算损失函数。而缺失的测井曲线的数量是很大的,因而通过上述方式来自适应构建训练样本对,能够进一步增加训练数据的量。
在一些实施例中,将掩码后的一组测井曲线和对应的标签组合形成一对训练样本对,包括:
对随机掩码后的测井曲线和对应的标签进行点乘获得掩码处的采样点值;
基于采样点值对掩码后的一组测井曲线进行不同倍率的采样,得到一组不同采样率的测井曲线;
将一组不同采样率的测井曲线和对应的标签组合形成一对训练样本对。
具体的,如图3所示,可以对m0 0,m1 0,m2 0,m3 0(分别对应于原始测井曲线y0,y1,y2,y3)进行4、8、16倍下采样,得到xi 0,xi 4,xi 8,xi 16(i=0,1,2,3)。最终,多通道输入的不同采样率的测井曲线和相应的标签组合形成一对训练样本对。
在该实施例中,通过对测井曲线进行多尺度采样,能够更高精度地捕捉不同测井曲线的信息,从而有利于提高对于测井曲线特征提取的精确度。
在一些实施例中,异构图神经网络根据以下方式输出的缺失测井曲线对应的归一化特征:
基于不同的编码器和不同的解码器提取不同类别测井曲线对应的第一节点特征;
根据第一节点特征计算不同类别之间的测井曲线的特征关系;
根据特征关系预测缺失测井曲线对应的第二节点特征;
输出第二节点特征,第二节点特征表示缺失测井曲线对应的归一化特征。
具体的,在该实施例中,如图4所示,异构图神经网络头的核心网络为图神经网络,其基本结构是具有本申请改进的聚合模块的U-Net。该网络可以自适应地构建单独的对应于缺失测井曲线每个采样点的图结构,同时该图网络将每种类型的测井曲线定义为一个单独的节点。以该种方式,图网络可以应用聚合模块聚合所有已知的测井曲线节点的特征,进而预测缺失的节点特征(测井曲线)。
在本申请实施例中,异构图神经网络中的图网络通过采用多个独立的卷积编码器来提取每种测井曲线的空间特征,例如图4中编码器G提取自然伽马曲线特征,编码器N提取中子孔隙度曲线特征,编码器R和编码器D提取其他测井曲线特征。
解码器端上采样过程中,采用同样的多个独立的解码器对每条测井曲线进行上采样和解码,得到不同类别测井曲线对应的第一节点特征。其中,图网络结构中的跳连可以整合不同阶段的下采样和上采样信息,确保不同频段范围内的测井曲线信息可以完整的保留。
经过编码器和解码器提取不同类别测井曲线对应的第一节点特征后,可以根据这些特征计算不同类别之间的测井曲线的特征关系,从而根据特征关系预测缺失测井曲线对应的第二节点特征,其中,第二节点特征即为缺失测井曲线对应的归一化特征。
在该实施例中,若采用常规单编码器固定测井曲线输入提取特征的方式会大幅削弱不同井曲线特征的独特性,该实施例通过采用不同的编码器和不同的解码器对不同类别测井曲线进行特征提取的方式,可以避免不同测井曲线特征之间的干扰。
在一些实施例中,根据第一节点特征计算不同类别之间的测井曲线的特征关系,包括:
基于聚合模块计算不同类别之间的测井曲线的特征关系,聚合模块通过下式表示:
其中,公式右边表示不同类别之间的测井曲线的特征关系,Wc表示卷积运算的学习权重,N(i)表示节点i的临近节点集合,xj表示临近节点的第一节点特征,αi,j表示节点i和节点j之间的注意力系数,x′i表示节点i的新特征,即缺失测井曲线对应的第二节点特征。
在该实施例中,通过上述改进的聚合模块,能够灵活的应用已有的测井曲线来预测其他缺失的测井曲线。
在一些实施例中,根据第一节点特征计算不同类别之间的测井曲线的特征关系,包括:
基于聚合模块计算不同类别之间的测井曲线的特征关系,聚合模块通过下式表示:
其中,Wi,j表示可学习矩阵,用于强化注意力。
在该实施例中,通过在公式(1)中引入可学习矩阵Wi,j,能够进一步捕捉不同井曲线之间关联性的权重分布。
在一些实施例中,基于缺失测井曲线对初始模型进行训练,以更新异构图神经网络和全连接神经网络的参数,得到测井曲线补全模型,包括:
根据预测得到的缺失测井曲线与标签值对应的真实值之间的差异计算异构图神经网络和全连接神经网络的总体损失函数;
基于总体损失函数更新异构图神经网络和全连接神经网络的参数,得到测井曲线补全模型。
在该实施例中,通过将异构图神经网络和全连接神经结合进行训练,通过混合的总体损失函数确保网络输出的一致性。
在一些实施例中,通过以下公式计算总体损失函数:
L=wGLG+wFLF (3)
其中,L表示总体损失函数,LF表示全连接神经网络的损失函数,wF表示LF的权重,LG表示异构图神经网络的损失函数,wG表示LG的权重,LMSE和LSSIM分别代表均方误差和结构相似指标,w1和w2为权重系数,mi 0和mi d代表原始掩码和随机掩码(i=0,1,2,3…),yi(i=0,1,2,3…)和分别代表标签和预测测井曲线值。
在该实施例中,总体损失函数由全连接神经网络的损失函数和异构图神经网络的损失函数两部分组成;异构图神经网络的损失函数由均方误差MSE和结构相似指标SSIM构成;全连接神经网络的损失函数可以由平均绝对误差MAE构成,用以计算缺失测井曲线的全局均值和方差。
为验证本申请的基于深度学习的测井曲线补全模型训练方法的效果,发明人利用某一工区公开的测井数据进行了效果验证。该工区内包含117口钻井。117口井中包含测井曲线类别有:自然伽马,声波时差,中子孔隙度,密度,电阻率测井曲线等。该示例选择自然伽马曲线、密度曲线、中子孔隙度曲线及声波时差曲线进行方法测试。117口井中,选择102口井作为训练集,其余15口井中10口井作为验证集,另外5口井作为盲井测试。在训练过程中,采用自适应学习率,网络训练1500轮。验证集损失函数在第1000轮训练时达到收敛。
通过对比本申请的方法(FlexLogNet)与其他方法(双向长短时记忆(BiLSTM)和经验公式法(Garnder))在5口盲井的预测准确率来验证本申请方法的有效性。双向长短时记忆法需要固定网络输入测井曲线的类型并且只能预测固定的缺失测井曲线。因此,方便对比,分别训练了自然伽马(GR),密度(RHOB),中子孔隙度(NPHI)以及声波时差(DTC)预测模型。对于本申请的方法,网络输入由自然伽马曲线以及其他任意两条测井曲线,另外一条选择作为预测曲线。在预测结果的定量分析上,本申请的模型在皮尔逊相关系数上表现最好(相关系数最大),在均方根误差方面最小(表1和表2)表明本专利方法在预测缺失井数据上精度远超其它方法。
表1测试井皮尔逊相关系数对比
表2测试井均方根误差对比
在盲井测试中,本申请的方法在声波时差预测上,皮尔逊相关系数达到0.926,均方根误差为4.6614。相较之下,双向长短时记忆方法两项指标分别为0.916和5.0022,经验公式法的两项指标为0.755和21.4728。以A3井为例,本申请的方法预测结果在皮尔逊相关系数上达到0.903,在均方根误差上为3.8774。在整个井段曲线结果预测上,如图5所示,本申请的方法预测结果与真实的测井数据更加接近,与真实测井曲线偏差更小,在薄层上(曲线尖峰处)预测精度更高。
本申请的方法在密度曲线预测上,皮尔逊相关系数达到0.845,均方根误差为0.0504。相较之下,双向长短时记忆方法两项指标分别为0.726和0.0725,经验公式法的两项指标为0.821和0.1084。以A0井为例,本申请的方法预测结果在皮尔逊相关系数上达到0.954,在均方根误差上为0.0619。在整个井段曲线结果预测上,如图6所示,本申请的方法预测结果与真实的测井数据更加接近,与真实测井曲线偏差更小。
本申请的方法在中子孔隙度曲线预测上,皮尔逊相关系数达到0.885,均方根误差为0.0267。相较之下,双向长短时记忆方法两项指标分别为0.864和0.0286。本申请的方法除去A0井在指标上略低于双向长短时记忆法之外,其他4口盲井均优于长短时记忆法。以A2井为例,尽管本专利方法与长短时记忆法均能够捕捉到曲线垂向的变化特征,但是在薄层较为发育层段,如图7所示的箭头处,本申请的方法能够很好的匹配真实测井数据。
因此,通过上述对比可知,本申请在预测缺失测井曲线上表现优异,并且可以不受缺失测井曲线类型的影响。
本申请实施例还提供一种基于深度学习的测井曲线补全方法,如图8所示,基于深度学习的测井曲线补全方法包括:步骤810和步骤820。
步骤810、获取目标钻井已知的测井曲线;
步骤820、选择缺失测井曲线的类型,并将已知的测井曲线输入至预设的测井曲线补全模型,获得测井曲线补全模型输出的缺失测井曲线;
其中,测井曲线补全模型是采用如本申请的基于深度学习的测井曲线补全模型训练方法训练的。
根据本申请的基于深度学习的测井曲线补全方法,本申请实施例所使用的测井曲线补全模型,通过异构图神经网络用来推断多井测井曲线之间的相互关系进而预测归一化的测井曲线,全连接神经网络用以将预测出的归一化的测井曲线反归一化,以异构图神经网络和全连接神经网络结合的混合式深度学习的方式对模型进行训练,确保网络输出的一致性,自适应实现不同测井曲线的补全,提高了缺失测井曲线的补全效率。
本申请实施例提供的基于深度学习的测井曲线补全模型训练方法,执行主体可以为基于深度学习的测井曲线补全模型训练装置。本申请实施例中以基于深度学习的测井曲线补全模型训练装置执行基于深度学习的测井曲线补全模型训练方法为例,说明本申请实施例提供的基于深度学习的测井曲线补全模型训练装置。
本申请实施例还提供一种基于深度学习的测井曲线补全模型训练装置。
如图9所示,该基于深度学习的测井曲线补全模型训练装置包括:
输入模块910,用于将样本曲线集中的测井曲线输入预设的初始模型中,得到由初始模型的异构图神经网络输出的缺失测井曲线对应的归一化特征,和由初始模型的全连接神经网络输出的缺失测井曲线上采样点的统计信息;
转换模块920,用于根据统计信息将归一化特征进行反归一化操作,以转换为对应的缺失测井曲线;
训练模块930,用于基于缺失测井曲线对初始模型进行训练,以更新异构图神经网络和全连接神经网络的参数,得到测井曲线补全模型。
根据本申请的基于深度学习的测井曲线补全模型训练装置,本申请通过异构图神经网络用来推断多井测井曲线之间的相互关系进而预测归一化的测井曲线,全连接神经网络用以将预测出的归一化的测井曲线反归一化,以异构图神经网络和全连接神经网络结合的混合式深度学习的方式对模型进行训练,确保网络输出的一致性,自适应实现不同测井曲线的补全,提高了缺失测井曲线的补全效率。
在一些实施例中,输入模块910,还用于:
获取目标钻井对应的一组测井曲线;一组测井曲线包括多条测井曲线;测井曲线对应有表示测井曲线形状的标签;
对至少一个标签进行随机掩码,得到掩码后的一组测井曲线;
将掩码后的一组测井曲线和对应的标签组合形成一对训练样本对;
根据多个目标钻井对应的训练样本对构建样本曲线集。
在该实施例中,通过对测井曲线进行随机掩码的方式构建样本曲线集,使得在模型训练过程中,通过对随机掩码的测井曲线进行预测,进而比较预测值与标签对应的真实值来计算损失函数。进一步的,由于完整未缺失的测井曲线的数量是比较少的,而为了获取足够量的训练数据,该实施例中,通过对测井曲线进行随机掩码的方式,能够对于同一组测井曲线,进行多次随机掩码,从而生成多对训练样本对,从而增加了训练数据的量。
在一些实施例中,一组测井曲线中还包括缺失的测井曲线;输入模块810,还用于:
对至少一个标签进行随机掩码,得到掩码后的一组测井曲线,包括:
对缺失的测井曲线对应的标签进行原始掩码,对至少一个未缺失的测井曲线对应的标签进行随机掩码,得到掩码后的一组测井曲线。
在一些实施例中,输入模块910,还用于:
对随机掩码后的测井曲线和对应的标签进行点乘获得掩码处的采样点值;
基于采样点值对掩码后的一组测井曲线进行不同倍率的采样,得到一组不同采样率的测井曲线;
将一组不同采样率的测井曲线和对应的标签组合形成一对训练样本对。
在一些实施例中,输入模块910,还用于:
基于不同的编码器和不同的解码器提取不同类别测井曲线对应的第一节点特征;
根据第一节点特征计算不同类别之间的测井曲线的特征关系;
根据特征关系预测缺失测井曲线对应的第二节点特征;
输出第二节点特征,第二节点特征表示缺失测井曲线对应的归一化特征。
在一些实施例中,输入模块910,还用于:
基于聚合模块计算不同类别之间的测井曲线的特征关系,聚合模块通过下式表示:
其中,公式右边表示不同类别之间的测井曲线的特征关系,Wc表示卷积运算的学习权重,N(i)表示节点i的临近节点集合,xj表示临近节点的第一节点特征,αi,j表示节点i和节点j之间的注意力系数,x′i表示节点i的新特征,即缺失测井曲线对应的第二节点特征。
在一些实施例中,输入模块910,还用于:
基于聚合模块计算不同类别之间的测井曲线的特征关系,聚合模块通过下式表示:
其中,Wi,j表示可学习矩阵,用于强化注意力。
在一些实施例中,训练模块930,还用于:
根据预测得到的缺失测井曲线与标签值对应的真实值之间的差异计算异构图神经网络和全连接神经网络的总体损失函数;
基于总体损失函数更新异构图神经网络和全连接神经网络的参数,得到测井曲线补全模型。
在一些实施例中,训练模块930,还用于:
通过以下公式计算总体损失函数:
L=wGLG+wFLF
其中,L表示总体损失函数,LF表示全连接神经网络的损失函数,wF表示LF的权重,LG表示异构图神经网络的损失函数,wG表示LG的权重,LMSE和LSSIM分别代表均方误差和结构相似指标,w1和w2为权重系数,mi 0和mi d代表原始掩码和随机掩码(i=0,1,2,3…),yi(i=0,1,2,3…)和分别代表标签和预测测井曲线值。
本申请实施例提供的基于深度学习的测井曲线补全方法,执行主体可以为基于深度学习的测井曲线补全装置。本申请实施例中以基于深度学习的测井曲线补全装置执行基于深度学习的测井曲线补全方法为例,说明本申请实施例提供的基于深度学习的测井曲线补全装置。
本申请实施例还提供一种基于深度学习的测井曲线补全装置。
如图10所示,该基于深度学习的测井曲线补全装置包括:
获取模块1010,用于获取目标钻井已知的测井曲线;
预测模块1020,用于选择缺失测井曲线的类型,并将已知的测井曲线输入至预设的测井曲线补全模型,获得测井曲线补全模型预测的缺失测井曲线;
其中,测井曲线补全模型是采用如本申请的基于深度学习的测井曲线补全模型训练方法训练的。
根据本申请的基于深度学习的测井曲线补全装置,本申请所使用的测井曲线补全模型,通过异构图神经网络用来推断多井测井曲线之间的相互关系进而预测归一化的测井曲线,全连接神经网络用以将预测出的归一化的测井曲线反归一化,以异构图神经网络和全连接神经网络结合的混合式深度学习的方式对模型进行训练,确保网络输出的一致性,自适应实现不同测井曲线的补全,提高了缺失测井曲线的补全效率。
本申请实施例中的基于深度学习的测井曲线补全模型训练装置或基于深度学习的测井曲线补全装置可以是电子设备,也可以是电子设备中的部件,例如集成电路或芯片。该电子设备可以是终端,也可以为除终端之外的其他设备。示例性的,电子设备可以为手机、平板电脑、笔记本电脑、掌上电脑、车载电子设备、移动上网装置(Mobile InternetDevice,MID)、增强现实(augmented reality,AR)/虚拟现实(virtual reality,VR)设备、机器人、可穿戴设备、超级移动个人计算机(ultra-mobile personal computer,UMPC)、上网本或者个人数字助理(personal digital assistant,PDA)等,还可以为服务器、网络附属存储器(Network Attached Storage,NAS)、个人计算机(personal computer,PC)、电视机(television,TV)、柜员机或者自助机等,本申请实施例不作具体限定。
本申请实施例中的基于深度学习的测井曲线补全模型训练装置或基于深度学习的测井曲线补全装置可以为具有操作系统的装置。该操作系统可以为微软(Windows)操作系统,可以为安卓(Android)操作系统,可以为IOS操作系统,还可以为其他可能的操作系统,本申请实施例不作具体限定。
在一些实施例中,如图11所示,本申请实施例还提供一种电子设备1100,包括处理器1101、存储器1102及存储在存储器1102上并可在处理器1101上运行的计算机程序,该程序被处理器1101执行时实现上述基于深度学习的测井曲线补全模型训练方法或基于深度学习的测井曲线补全方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
需要说明的是,本申请实施例中的电子设备包括上述的移动电子设备和非移动电子设备。
本申请实施例还提供一种非暂态计算机可读存储介质,该非暂态计算机可读存储介质上存储有计算机程序,该计算机程序被处理器执行时实现上述基于深度学习的测井曲线补全模型训练方法或基于深度学习的测井曲线补全方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
其中,处理器为上述实施例中的电子设备中的处理器。可读存储介质,包括计算机可读存储介质,如计算机只读存储器ROM、随机存取存储器RAM、磁碟或者光盘等。
本申请实施例还提供一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述基于深度学习的测井曲线补全模型训练方法或基于深度学习的测井曲线补全方法。
其中,处理器为上述实施例中的电子设备中的处理器。可读存储介质,包括计算机可读存储介质,如计算机只读存储器ROM、随机存取存储器RAM、磁碟或者光盘等。
本申请实施例另提供了一种芯片,芯片包括处理器和通信接口,通信接口和处理器耦合,处理器用于运行程序或指令,实现上述基于深度学习的测井曲线补全模型训练方法或基于深度学习的测井曲线补全方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
应理解,本申请实施例提到的芯片还可以称为系统级芯片、系统芯片、芯片系统或片上系统芯片等。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。此外,需要指出的是,本申请实施方式中的方法和装置的范围不限按示出或讨论的顺序来执行功能,还可包括根据所涉及的功能按基本同时的方式或按相反的顺序来执行功能,例如,可以按不同于所描述的次序来执行所描述的方法,并且还可以添加、省去、或组合各种步骤。另外,参照某些示例所描述的特征可在其他示例中被组合。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以计算机软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端(可以是手机,计算机,服务器,或者网络设备等)执行本申请各个实施例所述的方法。
上面结合附图对本申请的实施例进行了描述,但是本申请并不局限于上述的具体实施方式,上述的具体实施方式仅仅是示意性的,而不是限制性的,本领域的普通技术人员在本申请的启示下,在不脱离本申请宗旨和权利要求所保护的范围情况下,还可做出很多形式,均属于本申请的保护之内。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示意性实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本申请的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
尽管已经示出和描述了本申请的实施例,本领域的普通技术人员可以理解:在不脱离本申请的原理和宗旨的情况下可以对这些实施例进行多种变化、修改、替换和变型,本申请的范围由权利要求及其等同物限定。