CN116051885A - 用于海洋中尺度涡样本数据的处理及中尺度涡识别方法 - Google Patents
用于海洋中尺度涡样本数据的处理及中尺度涡识别方法 Download PDFInfo
- Publication number
- CN116051885A CN116051885A CN202211634183.3A CN202211634183A CN116051885A CN 116051885 A CN116051885 A CN 116051885A CN 202211634183 A CN202211634183 A CN 202211634183A CN 116051885 A CN116051885 A CN 116051885A
- Authority
- CN
- China
- Prior art keywords
- sample data
- data
- vortex
- closed contour
- sample
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 49
- 238000012545 processing Methods 0.000 title claims abstract description 42
- 238000007781 pre-processing Methods 0.000 claims abstract description 23
- 238000002372 labelling Methods 0.000 claims abstract description 16
- 230000002159 abnormal effect Effects 0.000 claims abstract description 8
- 238000012549 training Methods 0.000 claims description 25
- 238000013145 classification model Methods 0.000 claims description 22
- 238000003672 processing method Methods 0.000 claims description 12
- 238000004590 computer program Methods 0.000 claims description 10
- 238000001914 filtration Methods 0.000 claims description 5
- 230000009286 beneficial effect Effects 0.000 description 7
- 238000001514 detection method Methods 0.000 description 4
- 230000000007 visual effect Effects 0.000 description 4
- 238000013135 deep learning Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 238000012795 verification Methods 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 238000013136 deep learning model Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 239000000126 substance Substances 0.000 description 2
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000009795 derivation Methods 0.000 description 1
- 230000007786 learning performance Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 230000000149 penetrating effect Effects 0.000 description 1
- 239000002279 physical standard Substances 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/764—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
- G06V10/765—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects using rules for classification or partitioning the feature space
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/44—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/10—Terrestrial scenes
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Computing Systems (AREA)
- Health & Medical Sciences (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Databases & Information Systems (AREA)
- Medical Informatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Molecular Biology (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种用于海洋中尺度涡样本数据的处理及中尺度涡识别方法,涉及中尺度涡数据处理技术领域,其中,样本数据的处理方法包括:获取原始样本数据,原始样本数据为海平面高度异常数据,对原始样本数据进行预处理,得到预处理数据;通过SLA闭合等值线阈值分割预处理数据中包含的旋涡数据,得到多个闭合轮廓,旋涡数据包括气旋涡和反气旋涡;根据多个闭合轮廓和约束条件,得到满足约束条件的多个目标轮廓;对多个目标轮廓进行类型标注,得到第一样本数据集,第一样本数据集包括多个第一样本数据;对第一样本数据集进行样本扩充,得到第二样本数据集,第二样本数据集包含的第二样本数据的数量大于第一样本数据集包含的第一样本数据的数量。
Description
技术领域
本发明涉及中尺度涡数据处理技术领域,具体涉及一种用于海洋中尺度涡样本数据的处理及中尺度涡识别方法。
背景技术
中尺度涡是海洋中的一种涡流,各大洋中到处都有这种涡流的存在。中尺度涡在海洋中十分普遍,它们携带着巨大的能量,对海洋中能量和物质运输发挥着关键作用。其中,南海是环流结构复杂、旋涡多发的海域,开展南海中尺度涡识别与跟踪对于全面深入南海生态环境、动力及气候改变等领域的研究具有重要意义。
研究人员对海洋中尺度涡已开展了多年的研究,开发了许多自动检测旋涡的方法,按照采用的数据的类型将检测方法分为两类:欧拉方法和拉格朗日方法。其中,欧拉方法基于一个时刻的快照数据或空间场数据,拉格朗日方法基于水团或物质粒子的轨迹数据。由于当前遥感技术的高速发展,遥感影像具有的大尺度、高时间分辨率的特点,使其在海洋中尺度涡识别中被广泛运用,使得基于欧拉方法的海洋中尺度涡识别方法被广大学者所使用。欧拉方法可划分为以下三种:
一是基于物理参数的方法,Okubo-Weiss参数法(简称OW参数法)是最具有代表性的基于物理参数的方法,OW参数法将旋涡定义为OW参数低于特定的负阈值的连接区域,该方法量化了流场中变形相对于旋转的重要性。但该方法存在OW最佳阈值的选取难以确定、物理参数的推导过程会产生噪声项而导致误检率的增加、物理标准可能导致检测失败或低估旋涡的大小等缺陷。
二是基于瞬时流场的形状或曲率特征来检测旋涡的几何方法,不同于基于物理参数的方法,几何准则识别旋涡的方法是直接去寻找映射到垂直于旋涡核心的平面上的瞬时流线,最具代表性的SLA闭合等值线法是直接基于围绕单个局部极值的海面高度的闭合轮廓,该方法需要确定海面偏差的阈值来界定旋涡边界,而阈值的微小变化将对所识别结构的数量和位置产生重大影响。
三是物理参数与几何特征混合方法,通过同时使用物理参数和与流场的几何特性,以获得比单一方法给出的统计结果更可靠的统计结果,混合方法可能会得到较好的识别效果,但其复杂性较高,计算效率偏低。
在深度学习领域,训练样本的质量和数量直接决定了模型的性能,尤其是在图像处理领域,样本的数量尤为重要,这是模型的机制决定的。而现阶段,对于旋涡的自动检测,训练样本的数量较少,且训练样本的制作主要通过人工进行标注,费时费力,严重影响了对旋涡的识别速率和识别准确率。
发明内容
本发明所要解决的技术问题为:现有的用于海洋中尺度涡识别的训练样本较少,降低了对中尺度涡的识别速率和识别准确率。为解决该技术问题,本发明提供了一种用于海洋中尺度涡样本数据的处理及中尺度涡识别方法。
本发明解决上述技术问题的技术方案如下:
一种用于海洋中尺度涡样本数据的处理方法,包括:
步骤S1,获取原始样本数据,所述原始样本数据为海平面高度异常数据,对所述原始样本数据进行预处理,得到预处理数据;
步骤S2,通过预设的SLA闭合等值线阈值分割所述预处理数据中包含的旋涡数据,得到多个闭合轮廓,所述旋涡数据包括气旋涡和反气旋涡;
步骤S3,根据多个所述闭合轮廓和预设的约束条件,得到满足所述约束条件的多个目标轮廓;
步骤S4,对多个所述目标轮廓进行类型标注,得到第一样本数据集,所述第一样本数据集包括多个第一样本数据;
步骤S5,对所述第一样本数据集进行样本扩充,得到第二样本数据集,所述第二样本数据集包括多个第二样本数据,所述第二样本数据集包含的第二样本数据的数量大于所述第一样本数据集包含的第一样本数据的数量。
本发明的有益效果是:首先通过SLA闭合等值线阈值检测出旋涡数据,然后对旋涡数据进行分割,得到目标轮廓,再对目标轮廓进行类型标注,得到第一样本数据集,最后根据第一样本数据集进行样本扩充,既减少了人为标注训练数据(即所述目标轮廓)的时间,又解决了深度学习训练样本数量少的问题;以类型标注的方式确定提取到的有效旋涡和无效旋涡,将每个被标注的目标轮廓作为第一样本数据集的组成部分,再对第一样本数据集进行样本扩充,提高了后续深度学习在海洋中尺度涡识别中的泛化能力。
在上述技术方案的基础上,本发明还可以做如下改进。
进一步,所述步骤S1中,对所述原始样本数据进行预处理,得到预处理数据,包括:
对所述原始样本数据进行空间高通滤波处理,得到预处理数据。
采用上述进一步方案的有益效果是:通过对所述原始样本数据进行预处理,以删除大尺度涡,并突出中尺度涡,便于后续获取用于训练模型的样本数据。
进一步,所述步骤S2中,通过预设的SLA闭合等值线阈值分割所述预处理数据中包含的旋涡数据,得到多个闭合轮廓,包括:
以预设大小的切片对所述旋涡数据进行分割处理,得到多个闭合轮廓,通过所述切片对所述旋涡数据进行分割处理后得到的每个所述闭合轮廓对应所述旋涡数据的一个横截面。
采用上述进一步方案的有益效果是:通过对旋涡数据进行分割处理,根据预设的约束条件确定目标轮廓,可以获得更加紧凑的中尺度的旋涡数据。
进一步,所述约束条件包括:
所述闭合轮廓对应的形状误差小于等于65%,所述形状误差根据所述闭合轮廓的面积、所述闭合轮廓对应的拟合圆的面积、所述闭合轮廓与所述闭合轮廓对应的拟合圆之间的重合面积确定;
所述闭合轮廓包含的像元数I满足8≤I≤1500;
若所述闭合轮廓仅包含气旋涡,所述闭合轮廓包含的每个气旋涡的SLA值均小于所述闭合轮廓的SLA值;若所述闭合轮廓仅包含反气旋涡,所述闭合轮廓包含的每个反气旋涡的SLA值均大于所述闭合轮廓的SLA值;
若所述闭合轮廓包含至少两个气旋涡,所述闭合轮廓包含的每个气旋涡的SLA值中仅包含一个最小值;若所述闭合轮廓包含至少两个反气旋涡,所述闭合轮廓包含的每个反气旋涡的SLA值中仅包含一个最大值;
所述闭合轮廓对应的振幅A满足1cm≤A,所述振幅表征所述闭合轮廓包含的所述旋涡数据对应的SLA值中的最大值与所述闭合轮廓的SLA值之间的差值的绝对值。
采用上述进一步方案的有益效果是:通过SLA闭合等值线阈值检测出的旋涡数据中包含有效旋涡和无效旋涡,通过约束条件确定目标轮廓,便于减少后续对目标轮廓进行类型标注的工作量。
进一步,所述步骤S5中,对所述第一样本数据集进行样本扩充,得到第二样本数据集,包括:
对于每个所述第一样本数据,对所述第一样本数据进行水平翻转处理,得到所述第一样本数据对应的第一处理数据;
对于每个所述第一样本数据,对所述第一样本数据进行旋转处理,得到所述第一样本数据对应的第二处理数据;
对于每个所述第一样本数据,对所述第一样本数据添加高斯噪声,得到所述第一样本数据对应的第三处理数据;
所述第二样本数据集包括各个所述第一样本数据、各个所述第一处理数据、各个所述第二处理数据和各个所述第三处理数据。
采用上述进一步方案的有益效果是:根据第一样本数据集进行样本扩充,减少了人工标注的工作量,可进一步减少因为人工漏判或者误判导致丢失第一样本数据,提高了用于训练识别中尺度涡的分类模型的训练样本数量,进而提高了分类模型的学习效果和泛化能力,为进一步提高对中尺度涡的识别速率和识别准确率奠定了基础。
为进一步解决现有的用于进行海洋中尺度涡识别的分类模型的学习能力和泛化能力较差的问题,本发明还提供了一种用于海洋中尺度涡识别的分类模型的训练方法,包括:
获取待处理数据,将所述待处理数据作为原始样本数据,执行如前所述的用于海洋中尺度涡样本数据的处理方法,得到所述待处理数据对应的第二样本数据集;
根据所述第二样本数据集,对预先构建的原始分类模型进行模型训练,得到目标分类模型。
本发明的有益效果是:在人工标注的基础上获得第二样本数据集,第二样本数据集中包含大量的第二样本数据,通过第二样本数据集对预先构建的原始分类模型进行模型训练,使得训练得到的目标分类模型具有较好的学习能力和泛化能力。
为进一步解决现有的用于海洋中尺度涡识别的方法的识别速率和识别准确率低的问题,本发明还提供了一种海洋中尺度涡识别方法,包括:
将待识别数据输入所述目标分类模型中,得到所述待识别数据的分类结果。
本发明的有益效果是:通过联合本发明提供的用于海洋中尺度涡样本数据的处理方法和深度学习模型,可实现快速检测中尺度涡,解决了当前在庞大海面高度异常数据中识别海洋中尺度涡识别速率低和识别效率低的问题。
为解决现有技术中存在的技术问题,本发明还提供了一种用于海洋中尺度涡样本数据的处理系统,包括:
数据获取模块,用于获取原始样本数据,所述原始样本数据为海平面高度异常数据,对所述原始样本数据进行预处理,得到预处理数据;
闭合轮廓确定模块,用于通过预设的SLA闭合等值线阈值分割所述预处理数据中包含的旋涡数据,得到多个闭合轮廓,所述旋涡数据包括气旋涡和反气旋涡;
目标轮廓确定模块,用于根据多个所述闭合轮廓和预设的约束条件,得到满足所述约束条件的多个目标轮廓;
数据标注模块,用于对多个所述目标轮廓进行类型标注,得到第一样本数据集,所述第一样本数据集包括多个第一样本数据;
数据扩充模块,用于对所述第一样本数据集进行样本扩充,得到第二样本数据集,所述第二样本数据集包括多个第二样本数据,所述第二样本数据集包含的第二样本数据的数量大于所述第一样本数据集包含的第一样本数据的数量。
为解决现有技术中存在的技术问题,本发明还提供了一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如前所述的用于海洋中尺度涡样本数据的处理方法。
为解决现有技术中存在的技术问题,本发明还提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如前所述的用于海洋中尺度涡样本数据的处理方法。
附图说明
图1为本发明中用于海洋中尺度涡样本数据的处理方法的流程示意图;
图2为本发明实施例二中以不同参数值进行模型训练的训练效果示意图;
图3为本发明中用于海洋中尺度涡样本数据的处理系统的结构示意图。
具体实施方式
以下对本发明的原理和特征进行描述,所举实例只用于解释本发明,并非用于限定本发明的范围。
实施例一
如图1所示,本实施例提供了一种用于海洋中尺度涡样本数据的处理方法,包括:
步骤S1,获取原始样本数据,所述原始样本数据为海平面高度异常数据,对所述原始样本数据进行预处理,得到预处理数据;
步骤S2,通过预设的SLA闭合等值线阈值分割所述预处理数据中包含的旋涡数据,得到多个闭合轮廓,所述旋涡数据包括气旋涡和反气旋涡;
步骤S3,根据多个所述闭合轮廓和预设的约束条件,得到满足所述约束条件的多个目标轮廓;
步骤S4,对多个所述目标轮廓进行类型标注,得到第一样本数据集,所述第一样本数据集包括多个第一样本数据;
步骤S5,对所述第一样本数据集进行样本扩充,得到第二样本数据集,所述第二样本数据集包括多个第二样本数据,所述第二样本数据集包含的第二样本数据的数量大于所述第一样本数据集包含的第一样本数据的数量。
本实施例中,所述步骤S1中,所述原始样本数据的获取方式为:获取多颗卫星高度计数据,通过最佳插值算法对多颗所述卫星高度计数据进行处理得到;比如,所述原始样本数据为2018年6月1日至2021年6月1日、时间分辨率为1月的全球海平面高度异常数据,所述原始样本数据的空间分辨率为0.25°×0.25°。
其中,所述步骤S1中,对所述原始样本数据进行预处理,得到预处理数据,包括:
对所述原始样本数据进行空间高通滤波处理,得到预处理数据。
本实施例中,对于空间分辨率为0.25°×0.25°的原始样本数据,通过进行半径为5°的空间高通滤波处理,以剔除大尺度涡(≥500km)、突出中尺度涡,得到预处理数据。
其中,所述步骤S2中,所述SLA闭合等值线阈值的设定需满足可检测出所述预处理数据中包含的所有旋涡数据。
其中,所述步骤S2中,通过预设的SLA闭合等值线阈值分割所述预处理数据中包含的旋涡数据,得到多个闭合轮廓,包括:
以预设大小的切片对所述旋涡数据进行分割处理,得到多个闭合轮廓,通过所述切片对所述旋涡数据进行分割处理后得到的每个所述闭合轮廓对应所述旋涡数据的一个横截面。
本实施例中,在海平面高度为150cm至-150cm之间进行迭代搜索闭合的轮廓,以大小为2mm的切片对迭代搜索结果进行分割,得到多个闭合轮廓;对于每个所述闭合轮廓,确定所述闭合轮廓的最大经度、最大纬度、最小经度和最小纬度,并保存所述闭合轮廓所在区域的矩形图以及为所述矩形图赋予编号,以便后续训练深度学习模型(即后文所述的原始分类模型)。通过将所述切片的大小设置为2mm,以检测出尺度偏小的旋涡。
其中,所述步骤S3中,所述约束条件包括:
所述闭合轮廓对应的形状误差小于等于65%,所述形状误差根据所述闭合轮廓的面积、所述闭合轮廓对应的拟合圆的面积、所述闭合轮廓与所述闭合轮廓对应的拟合圆之间的重合面积确定;
所述闭合轮廓包含的像元数I满足8≤I≤1500;
若所述闭合轮廓仅包含气旋涡,所述闭合轮廓包含的每个气旋涡的SLA值均小于所述闭合轮廓的SLA值;若所述闭合轮廓仅包含反气旋涡,所述闭合轮廓包含的每个反气旋涡的SLA值均大于所述闭合轮廓的SLA值;
若所述闭合轮廓包含至少两个气旋涡,所述闭合轮廓包含的每个气旋涡的SLA值中仅包含一个最小值;若所述闭合轮廓包含至少两个反气旋涡,所述闭合轮廓包含的每个反气旋涡的SLA值中仅包含一个最大值;
所述闭合轮廓对应的振幅A满足1cm≤A,所述振幅表征所述闭合轮廓包含的所述旋涡数据对应的SLA值中的最大值与所述闭合轮廓的SLA值之间的差值的绝对值。
本实施例中,所述形状误差的计算公式为:
其中,Err表示所述形状误差,Parea表示所述闭合轮廓的面积,Carea表示所述闭合轮廓对应的拟合圆的面积,Iarea表示所述闭合轮廓与所述闭合轮廓对应的拟合圆之间的重合面积。
本实施例中,将满足所述约束条件的所述闭合轮廓作为目标轮廓;在确定的多个所述目标轮廓中,包含了所有有效旋涡(即所述旋涡数据),同时也存在无效旋涡(即仅包含类似旋涡),为此,通过人工解译的方法对每个所述目标轮廓进行类型标注。
其中,所述步骤S4中,对多个所述目标轮廓进行类型标注,包括:
对于每个所述目标轮廓,若所述目标轮廓对应的形状误差小于等于55%,将所述目标轮廓作为第一轮廓,所述第一轮廓中包含大量的有效样本和少量的无效样本;
对于每个所述目标轮廓,若所述目标轮廓对应的形状误差大于55%,将所述目标轮廓作为第二轮廓,所述第二轮廓中包含大量的无效样本和少量的有效样本;
对于每个所述第一轮廓,通过目视解译方法将所述第一轮廓中的每个无效样本进行类型标注;
对于每个所述第二轮廓,通过目视解译方法将所述第二轮廓中的每个有效样本进行类型标注;
对每个所述第一轮廓各自包含的每个有效样本和每个所述第二轮廓各自包含的每个无效样本进行自动标注。
每个被标注的所述第一轮廓和每个被标注的所述第二轮廓各自对应一个第一样本数据;其中,所述有效样本和所述无效样本为闭合轮廓。本实施例中,通过目视解译方法将所述第一轮廓中的每个无效样本的类型标注为0,通过目视解译方法将所述第二轮廓中的每个有效样本的类型标注为0,将所述第一轮廓中的有效样本的类型自动标注为0,将所述第二轮廓中的无效样本的类型自动标注为1。
其中,所述步骤S5中,对所述第一样本数据集进行样本扩充,得到第二样本数据集,包括:
对于每个所述第一样本数据,对所述第一样本数据进行水平翻转处理,得到所述第一样本数据对应的第一处理数据;
对于每个所述第一样本数据,对所述第一样本数据进行旋转处理,得到所述第一样本数据对应的第二处理数据;
对于每个所述第一样本数据,对所述第一样本数据添加高斯噪声,得到所述第一样本数据对应的第三处理数据;
所述第二样本数据集包括各个所述第一样本数据、各个所述第一处理数据、各个所述第二处理数据和各个所述第三处理数据。
本实施例中,对于每个所述第一样本数据,对所述第一样本数据添加方差为0.2或0.3的高斯噪声;所述第一样本数据集中包含2248个第一样本数据,通过执行所述步骤S4,得到的第二样本数据集包含8992个第二样本数据,对于每个第二样本数据,通过reshape函数调整将其调整为像素大小为572×572的图像数据。
实施例二
本实施例提供了一种用于海洋中尺度涡识别的分类模型的训练方法,包括:
获取待处理数据,将所述待处理数据作为原始样本数据,执行如实施例一所述的用于海洋中尺度涡样本数据的处理方法,得到所述待处理数据对应的第二样本数据集;
根据所述第二样本数据集,对预先构建的原始分类模型进行模型训练,得到目标分类模型。
本实施例中,所述原始分类模型采用U-Net网络模型,对所述原始分类模型进行训练的总轮次epochs设置为100,初始学习率设置为1×10-3,batch_size设置为32,优化器选用Adam优化器,损失函数选用交叉熵损失函数。
通过图2可以看出,当epochs的值小于5时,模型的训练精度和验证精度快速增加,数值达到接近于0.8;当epochs的值大于5时,模型的训练精度和验证精度增长速度开始变缓;在epochs的值达到17时,训练精度与测试精度比较接近,说明此时模型的泛化能力较强,最终的训练精度和验证精度值接近于0.9,损失值下降到小于0.2。
本实施例通过搭建所述原始分类模型,利用人工标注的有效旋涡和无效旋涡进行模型训练,可提高模型的学习性能和泛化能力,进而提高得到的所述目标分类模型的识别准确率。
实施例三
本实施例提供了一种海洋中尺度涡识别方法,包括:
将待识别数据输入实施例二中的所述目标分类模型中,得到所述待识别数据的分类结果。
通过本实施例提供的海洋中尺度涡识别方法可对全球范围内的中尺度涡进行有效识别,对全球范围内的中尺度涡的识别准确率可达到91%以上。
实施例四
基于与上述实施例一所述的用于海洋中尺度涡样本数据的处理方法相同的原理,本实施例提供了一种用于海洋中尺度涡样本数据的处理系统,如图3所示,包括:
数据获取模块,用于获取原始样本数据,所述原始样本数据为海平面高度异常数据,对所述原始样本数据进行预处理,得到预处理数据;
闭合轮廓确定模块,用于通过预设的SLA闭合等值线阈值分割所述预处理数据中包含的旋涡数据,得到多个闭合轮廓,所述旋涡数据包括气旋涡和反气旋涡;
目标轮廓确定模块,用于根据多个所述闭合轮廓和预设的约束条件,得到满足所述约束条件的多个目标轮廓;
数据标注模块,用于对多个所述目标轮廓进行类型标注,得到第一样本数据集,所述第一样本数据集包括多个第一样本数据;
数据扩充模块,用于对所述第一样本数据集进行样本扩充,得到第二样本数据集,所述第二样本数据集包括多个第二样本数据,所述第二样本数据集包含的第二样本数据的数量大于所述第一样本数据集包含的第一样本数据的数量。
其中,所述数据获取模块用于对所述原始样本数据进行预处理,得到预处理数据时,具体用于:
对所述原始样本数据进行空间高通滤波处理,得到预处理数据。
其中,所述闭合轮廓确定模块用于通过预设的SLA闭合等值线阈值分割所述预处理数据中包含的旋涡数据,得到多个闭合轮廓时,具体用于:
以预设大小的切片对所述旋涡数据进行分割处理,得到多个闭合轮廓,通过所述切片对所述旋涡数据进行分割处理后得到的每个所述闭合轮廓对应所述旋涡数据的一个横截面。
其中,所述约束条件包括:
所述闭合轮廓对应的形状误差小于等于65%,所述形状误差根据所述闭合轮廓的面积、所述闭合轮廓对应的拟合圆的面积、所述闭合轮廓与所述闭合轮廓对应的拟合圆之间的重合面积确定;
所述闭合轮廓包含的像元数I满足8≤I≤1500;
若所述闭合轮廓仅包含气旋涡,所述闭合轮廓包含的每个气旋涡的SLA值均小于所述闭合轮廓的SLA值;若所述闭合轮廓仅包含反气旋涡,所述闭合轮廓包含的每个反气旋涡的SLA值均大于所述闭合轮廓的SLA值;
若所述闭合轮廓包含至少两个气旋涡,所述闭合轮廓包含的每个气旋涡的SLA值中仅包含一个最小值;若所述闭合轮廓包含至少两个反气旋涡,所述闭合轮廓包含的每个反气旋涡的SLA值中仅包含一个最大值;
所述闭合轮廓对应的振幅A满足1cm≤A,所述振幅表征所述闭合轮廓包含的所述旋涡数据对应的SLA值中的最大值与所述闭合轮廓的SLA值之间的差值的绝对值。
其中,所述数据扩充模块包括:
第一数据扩充单元,用于对于每个所述第一样本数据,对所述第一样本数据进行水平翻转处理,得到所述第一样本数据对应的第一处理数据;
第二数据扩充单元,用于对于每个所述第一样本数据,对所述第一样本数据进行旋转处理,得到所述第一样本数据对应的第二处理数据;
第三数据扩充单元,用于对于每个所述第一样本数据,对所述第一样本数据添加高斯噪声,得到所述第一样本数据对应的第三处理数据;
所述第二样本数据集包括各个所述第一样本数据、各个所述第一处理数据、各个所述第二处理数据和各个所述第三处理数据。
实施例五
本实施例提供了一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如实施例一所述的用于海洋中尺度涡样本数据的处理方法。
实施例六
本实施例提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如实施例一所述的用于海洋中尺度涡样本数据的处理方法。
在本发明的描述中,需要理解的是,术语“中心”、“纵向”、“横向”、“长度”、“宽度”、“厚度”、“上”、“下”、“前”、“后”、“左”、“右”、“竖直”、“水平”、“顶”、“底”“内”、“外”、“顺时针”、“逆时针”、“轴向”、“径向”、“周向”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本发明的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。
Claims (10)
1.一种用于海洋中尺度涡样本数据的处理方法,其特征在于,包括:
步骤S1,获取原始样本数据,所述原始样本数据为海平面高度异常数据,对所述原始样本数据进行预处理,得到预处理数据;
步骤S2,通过预设的SLA闭合等值线阈值分割所述预处理数据中包含的旋涡数据,得到多个闭合轮廓,所述旋涡数据包括气旋涡和反气旋涡;
步骤S3,根据多个所述闭合轮廓和预设的约束条件,得到满足所述约束条件的多个目标轮廓;
步骤S4,对多个所述目标轮廓进行类型标注,得到第一样本数据集,所述第一样本数据集包括多个第一样本数据;
步骤S5,对所述第一样本数据集进行样本扩充,得到第二样本数据集,所述第二样本数据集包括多个第二样本数据,所述第二样本数据集包含的第二样本数据的数量大于所述第一样本数据集包含的第一样本数据的数量。
2.根据权利要求1所述的方法,其特征在于,所述步骤S1中,对所述原始样本数据进行预处理,得到预处理数据,包括:
对所述原始样本数据进行空间高通滤波处理,得到预处理数据。
3.根据权利要求1所述的方法,其特征在于,所述步骤S2中,通过预设的SLA闭合等值线阈值分割所述预处理数据中包含的旋涡数据,得到多个闭合轮廓,包括:
以预设大小的切片对所述旋涡数据进行分割处理,得到多个闭合轮廓,通过所述切片对所述旋涡数据进行分割处理后得到的每个所述闭合轮廓对应所述旋涡数据的一个横截面。
4.根据权利要求1所述的方法,其特征在于,所述约束条件包括:
所述闭合轮廓对应的形状误差小于等于65%,所述形状误差根据所述闭合轮廓的面积、所述闭合轮廓对应的拟合圆的面积、所述闭合轮廓与所述闭合轮廓对应的拟合圆之间的重合面积确定;
所述闭合轮廓包含的像元数I满足8≤I≤1500;
若所述闭合轮廓仅包含气旋涡,所述闭合轮廓包含的每个气旋涡的SLA值均小于所述闭合轮廓的SLA值;若所述闭合轮廓仅包含反气旋涡,所述闭合轮廓包含的每个反气旋涡的SLA值均大于所述闭合轮廓的SLA值;
若所述闭合轮廓包含至少两个气旋涡,所述闭合轮廓包含的每个气旋涡的SLA值中仅包含一个最小值;若所述闭合轮廓包含至少两个反气旋涡,所述闭合轮廓包含的每个反气旋涡的SLA值中仅包含一个最大值;
所述闭合轮廓对应的振幅A满足1cm≤A,所述振幅表征所述闭合轮廓包含的所述旋涡数据对应的SLA值中的最大值与所述闭合轮廓的SLA值之间的差值的绝对值。
5.根据权利要求1所述的方法,其特征在于,所述步骤S5中,对所述第一样本数据集进行样本扩充,得到第二样本数据集,包括:
对于每个所述第一样本数据,对所述第一样本数据进行水平翻转处理,得到所述第一样本数据对应的第一处理数据;
对于每个所述第一样本数据,对所述第一样本数据进行旋转处理,得到所述第一样本数据对应的第二处理数据;
对于每个所述第一样本数据,对所述第一样本数据添加高斯噪声,得到所述第一样本数据对应的第三处理数据;
所述第二样本数据集包括各个所述第一样本数据、各个所述第一处理数据、各个所述第二处理数据和各个所述第三处理数据。
6.一种用于海洋中尺度涡识别的分类模型的训练方法,其特征在于,包括:
获取待处理数据,将所述待处理数据作为原始样本数据,执行权利要求1至5中任一项所述的用于海洋中尺度涡样本数据的处理方法,得到所述待处理数据对应的第二样本数据集;
根据所述第二样本数据集,对预先构建的原始分类模型进行模型训练,得到目标分类模型。
7.一种海洋中尺度涡识别方法,其特征在于,包括:
将待识别数据输入权利要求6得到的所述目标分类模型中,得到所述待识别数据的分类结果。
8.一种用于海洋中尺度涡样本数据的处理系统,其特征在于,包括:
数据获取模块,用于获取原始样本数据,所述原始样本数据为海平面高度异常数据,对所述原始样本数据进行预处理,得到预处理数据;
闭合轮廓确定模块,用于通过预设的SLA闭合等值线阈值分割所述预处理数据中包含的旋涡数据,得到多个闭合轮廓,所述旋涡数据包括气旋涡和反气旋涡;
目标轮廓确定模块,用于根据多个所述闭合轮廓和预设的约束条件,得到满足所述约束条件的多个目标轮廓;
数据标注模块,用于对多个所述目标轮廓进行类型标注,得到第一样本数据集,所述第一样本数据集包括多个第一样本数据;
数据扩充模块,用于对所述第一样本数据集进行样本扩充,得到第二样本数据集,所述第二样本数据集包括多个第二样本数据,所述第二样本数据集包含的第二样本数据的数量大于所述第一样本数据集包含的第一样本数据的数量。
9.一种电子设备,其特征在于,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如权利要求1至5中任一项所述的用于海洋中尺度涡样本数据的处理方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至5中任一项所述的用于海洋中尺度涡样本数据的处理方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211634183.3A CN116051885A (zh) | 2022-12-19 | 2022-12-19 | 用于海洋中尺度涡样本数据的处理及中尺度涡识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211634183.3A CN116051885A (zh) | 2022-12-19 | 2022-12-19 | 用于海洋中尺度涡样本数据的处理及中尺度涡识别方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116051885A true CN116051885A (zh) | 2023-05-02 |
Family
ID=86123190
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211634183.3A Pending CN116051885A (zh) | 2022-12-19 | 2022-12-19 | 用于海洋中尺度涡样本数据的处理及中尺度涡识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116051885A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116895023A (zh) * | 2023-09-11 | 2023-10-17 | 中国石油大学(华东) | 一种基于多任务学习的中尺度涡识别方法及系统 |
-
2022
- 2022-12-19 CN CN202211634183.3A patent/CN116051885A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116895023A (zh) * | 2023-09-11 | 2023-10-17 | 中国石油大学(华东) | 一种基于多任务学习的中尺度涡识别方法及系统 |
CN116895023B (zh) * | 2023-09-11 | 2024-02-09 | 中国石油大学(华东) | 一种基于多任务学习的中尺度涡识别方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110223302B (zh) | 一种基于旋转区域提取的舰船多目标检测方法 | |
CN104036239A (zh) | 基于特征融合和聚类的高分辨sar图像快速舰船检测方法 | |
CN109886218B (zh) | 基于超像素统计相异性的sar图像舰船目标检测方法 | |
CN110866934B (zh) | 基于规范性编码的复杂点云分割方法及系统 | |
CN107992818B (zh) | 一种光学遥感图像海面船只目标的检测方法 | |
CN105930852B (zh) | 一种气泡图像识别方法 | |
CN108460418B (zh) | 一种基于文字识别与语义分析的发票分类方法 | |
CN112613551A (zh) | 汽车零部件识别方法、存储介质及系统 | |
CN101533466B (zh) | 一种眼睛定位图像处理方法 | |
CN118314157B (zh) | 基于人工智能的遥感影像智能分割方法 | |
CN102542293A (zh) | 一种针对高分辨率sar图像场景解译的一类提取分类方法 | |
WO2023273337A1 (zh) | 一种基于代表特征的遥感图像中的密集目标检测方法 | |
CN112101250A (zh) | 一种基于上下文语义感知的近岸舰船目标检测方法 | |
CN103020592A (zh) | 一种基于局部上下文的遥感图像舰船检测虚警剔除方法 | |
CN117036993A (zh) | 一种基于无人机的船舶水尺远程测量方法 | |
CN116051885A (zh) | 用于海洋中尺度涡样本数据的处理及中尺度涡识别方法 | |
Chen et al. | Wall Cracks Detection in Aerial Images Using Improved Mask R-CNN. | |
CN114581440B (zh) | 一种基于图像识别快速定位泄漏点的方法 | |
CN115457130A (zh) | 一种基于深度关键点回归的电动汽车充电口检测定位方法 | |
CN114140698A (zh) | 一种基于FasterR-CNN的水系信息提取算法 | |
Song et al. | Fast detection of multi-direction remote sensing ship object based on scale space pyramid | |
Xie et al. | GSPSO‐LRF‐ELM: Grid Search and Particle Swarm Optimization‐Based Local Receptive Field‐Enabled Extreme Learning Machine for Surface Defects Detection and Classification on the Magnetic Tiles | |
CN117152490A (zh) | 一种海冰海水分类方法、系统、存储介质及电子设备 | |
CN115829996A (zh) | 基于深度特征图的无监督合成孔径雷达图像变化检测方法 | |
CN113240026A (zh) | 一种矢栅结合的内陆水面漂浮物批量识别提取方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |