CN113704276A - 地图更新方法、装置、电子设备及计算机可读存储介质 - Google Patents
地图更新方法、装置、电子设备及计算机可读存储介质 Download PDFInfo
- Publication number
- CN113704276A CN113704276A CN202110287331.8A CN202110287331A CN113704276A CN 113704276 A CN113704276 A CN 113704276A CN 202110287331 A CN202110287331 A CN 202110287331A CN 113704276 A CN113704276 A CN 113704276A
- Authority
- CN
- China
- Prior art keywords
- map
- determining
- image
- change
- feature
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/23—Updating
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/29—Geographical information databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
- G06F18/253—Fusion techniques of extracted features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Databases & Information Systems (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Health & Medical Sciences (AREA)
- Bioinformatics & Computational Biology (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Evolutionary Biology (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Remote Sensing (AREA)
- Image Analysis (AREA)
Abstract
本申请实施例提供了一种地图更新方法、装置、电子设备及计算机可读存储介质,涉及计算机视觉技术领域。该方法包括:获取待检测区域对应的地图的当前图像和历史图像;基于训练后的孪生网络确定当前图像和历史图像之间的区别特征信息;基于区别特征信息确定历史图像相对于当前图像的至少一个变化定位框;基于至少一个变化定位框更新地图。本申请实施例实现了高效、准确地地图更新。
Description
技术领域
本申请涉及计算机视觉技术领域,具体而言,本申请涉及一种地图更新方法、装置、电子设备及计算机可读存储介质。
背景技术
地图在资源勘测、工程建设、国防建设及日常民生等领域有着广泛的应用。随着互联网技术的发展,以计算机为主体的电子设备在制图中广泛应用,地图可以数字的形式呈现于多种终端上,具有更丰富的信息含量和更广阔的应用范围。
随着时间的推移,地理事物也在发生阶段性的变化,例如建筑物的新增或拆迁等。因此,地图需要及时做出相应的更新,为用户提供更为准确的数据信息和服务。
目前,通常基于语义分割算法检测地图的变化并以此更新地图数据,但是语义分割算法预测基于像素级别的细小变化,对颜色光线都较为敏感,导致大量变化的误检错检,降低了地图更新的准确率。
发明内容
本申请提供了一种地图更新方法、装置、电子设备及计算机可读存储介质,可以解决地图更新准确率低的问题。
本申请的第一方面,提供了一种地图更新方法,该方法包括:
获取待检测区域对应的地图的当前图像和历史图像;
基于训练后的孪生网络确定当前图像和历史图像之间的区别特征信息;
基于区别特征信息确定历史图像相对于当前图像的至少一个变化定位框;
基于至少一个变化定位框更新地图。
在一个可能的实现方式中,上述确定当前图像和历史图像之间的区别特征信息,包括:
对当前图像进行特征提取,得到第一特征点集合;
对历史图像进行特征提取,得到第二特征点集合;
确定第一特征点集合和第二特征点集合之间的区别点集合;
基于区别点集合,生成区别特征信息。
在一个可能的实现方式中,上述基于区别特征信息确定历史图像相对于当前图像的至少一个变化定位框,包括:
基于区别特征信息确定至少一个目标特征点;
基于目标特征点确定至少一个预设形状的变化定位框。
在另一个可能的实现方式中,上述基于区别特征信息确定至少一个目标特征点,包括:
对区别特征信息进行上采样,得到融合特征信息;
基于融合特征信息,获取至少一个目标特征点。
在另一个可能的实现方式中,上述变化定位框的形状为矩形;基于目标特征点确定至少一个预设形状的变化定位框,包括:
分别确定每一个目标特征点对应的类别和边距数据;
基于类别和边距数据,分别确定每一个目标特征点对应的矩形变化定位框。
在又一个可能的实现方式中,上述基于至少一个变化定位框更新地图,包括:
基于每一个变化定位框确定变化轮廓;
接收修正信息,基于修正信息对变化轮廓进行修正,生成地物轮廓数据;
根据地物轮廓数据,更新地图。
在又一个可能的实现方式中,上述孪生网络是通过如下方式训练得到的:
获取同一样本区域不同时期的样本图像;样本图像设置有对应的样本定位框;
将样本图像输入到初始孪生网络,得到初始孪生网络输出的实时定位框标签;
基于样本定位框和定位框标签确定多分支损失函数;
基于多分支损失函数对初始孪生网络的参数进行调节,得到孪生网络。
本申请的第二方面,提供了一种地图更新装置,该装置包括:
获取模块,用于获取待检测区域对应的地图的当前图像和历史图像;
提取模块,用于基于训练后的孪生网络确定当前图像和历史图像之间的区别特征信息;
确定模块,用于基于区别特征信息确定历史图像相对于当前图像的至少一个变化定位框;
更新模块,用于基于至少一个变化定位框更新地图。
在一个可能的实现方式中,上述提取模块具体用于:
对当前图像进行特征提取,得到第一特征点集合;
对历史图像进行特征提取,得到第二特征点集合;
确定第一特征点集合和第二特征点集合之间的区别点集合;
基于区别点集合,生成区别特征信息。
在一个可能的实现方式中,上述确定模块具体包括:
第一确定单元,用于基于区别特征信息确定至少一个目标特征点;
第二确定单元,用于基于目标特征点确定至少一个预设形状的变化定位框。
在另一个可能的实现方式中,上述第一确定单元还用于:
对区别特征信息进行上采样,得到融合特征信息;
基于融合特征信息,获取至少一个目标特征点。
在另一个可能的实现方式中,上述变化定位框的形状可以为矩形,第二确定单元还用于:
分别确定每一个目标特征点对应的类别和边距数据;
基于类别和边距数据,分别确定每一个目标特征点对应的矩形变化定位框。
在又一个可能的实现方式中,上述更新模块还用于:
基于每一个变化定位框确定变化轮廓;
接收修正信息,基于修正信息对变化轮廓进行修正,生成地物轮廓数据;
根据地物轮廓数据,更新地图。
在又一个可能的实现方式中,该装置还包括训练模块,具体用于:
获取同一样本区域不同时期的样本图像;样本图像设置有对应的样本定位框;
将样本图像输入到初始孪生网络,得到初始孪生网络输出的实时定位框标签;
基于样本定位框和定位框标签确定多分支损失函数;
基于多分支损失函数对初始孪生网络的参数进行调节,得到孪生网络。
本申请的第三个方面,提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行程序时实现本申请第一方面所示的地图更新方法。
本申请的第四方面,提供了一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,该程序被处理器执行时实现本申请第一方面所示的地图更新方法。
本申请提供的技术方案带来的有益效果是:
本申请通过孪生网络确定当前图像和历史图像之间的区别特征信息,孪生网络抗干扰能力强,以使得到的区别特征信息具有更优的特征表征能力,基于区别特征信息确定变化定位框,从而更新地图,可以有效减少地图变更的误检错检,提高地图更新的准确率。
此外,基于变化定位框实现片区变化识别,能够快速锁定地图变化区域,相比于现有技术中语义分割的像素级别的变化识别,大幅提升了地图数据的更新效率,降低了网络模型对图像分辨率与图像质量的要求,保证了地图数据变化定位的准确性。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对本申请实施例描述中所需要使用的附图作简单地介绍。
图1为本申请实施例提供的一种地图更新方法的应用场景图;
图2为本申请实施例提供的一种地图更新方法的流程示意图;
图3为本申请一个示例提供的一种基于FCOS算法的孪生网络架构示意图;
图4为本申请一个示例提供的一种确定区别特征信息方案的示意图;
图5为本申请一个示例提供的融合特征输出方案的流程示意图
图6为本申请实施例提供的一种孪生网络训练的流程示意图;
图7为本申请一个示例提供的一种地图更新方法的流程示意图;
图8为本申请实施例提供的一种地图更新装置的结构示意图;
图9为本申请一个示例提供的一种地图更新装置的结构示意图;
图10为本申请实施例提供的一种地图更新的电子设备的结构示意图。
具体实施方式
下面详细描述本申请的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本申请,而不能解释为对本申请的限制。
本技术领域技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是,本申请的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作、元件和/或组件,但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。应该理解,当我们称元件被“连接”或“耦接”到另一元件时,它可以直接连接或耦接到其他元件,或者也可以存在中间元件。此外,这里使用的“连接”或“耦接”可以包括无线连接或无线耦接。这里使用的措辞“和/或”包括一个或更多个相关联的列出项的全部或任一单元和全部组合。
为使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请实施方式作进一步地详细描述。
地图是按照一定的法则,有选择地以二维或多维形式与手段在平面或球面上表示地球(或其它星球)若干现象的图形或图像,它具有严格的数学基础、符号系统、文字注记,并能用地图概括原则,科学地反映出自然和社会经济现象的分布特征及其相互关系。
地图更新是依据地图所示区域变化的现实状态,修正地图内容以提高其精度和保持地图现势性的工作。更新周期愈短,地图的现势性越强,价值越高,更新方法有全面重测(编)和局部修测(编)两种。
本申请提供的地图更新方法,可以实现高效、准确的地图更新,从而保证了地图数据的鲜度。
人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。
人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
计算机视觉技术(Computer Vision,CV)是一门研究如何使机器“看”的科学,更进一步的说,就是指用摄影机和电脑代替人眼对目标进行识别、跟踪和测量等机器视觉,并进一步做图形处理,使电脑处理成为更适合人眼观察或传送给仪器检测的图像。作为一个科学学科,计算机视觉研究相关的理论和技术,试图建立能够从图像或者多维数据中获取信息的人工智能系统。计算机视觉技术通常包括图像处理、图像识别、图像语义理解、图像检索、OCR、视频处理、视频语义理解、视频内容/行为识别、三维物体重建、3D技术、虚拟现实、增强现实、同步定位与地图构建等技术,还包括常见的人脸识别、指纹识别等生物特征识别技术。
本申请实施例提供的方案涉及人工智能的地图更新技术,具体通过如下实施例进行说明。
地图更新的关键是要对同一区域对应地图的不同时期的图像进行变化检测,现有基于深度学习的变化检测算法多是利用不同图像深度学习特征生成差分图像,或采用像素块间学习变化关系的策略完成变化检测;上述变化检测都是典型的基于语义分割的算法,对于变化像素与未变化像素给予不同类别;以现有技术中语义分割方案惯用的U-net+FPN+基础模型模式为例,针对变化建筑物检测存在以下问题:
(1)像素级别分类的误检太多,缺少整体性,人工工作量暴增。这种端到端的语义分割算法可以较准确的预测像素级别的细小变化,对颜色光线都较为敏感,导致大量变化的误检错检,虽然保证了召回率,但大大降低了准确率。
(2)无法过滤个别非重点的微小建筑变化,导致检测过程中出现很多无用信息。如在很多大型村庄中经常发生个别房屋整修,这种级别的变化是不需要检测出来的,其对背景数据没有任何帮助。
(3)语义分割方案是基于像素级别的检测,无法完成实例级别建筑检测。像素块只能提取局部特征不能直接应用于数据融合;同时针对像素级别的分类没有充分利用到图像的上下文,图像不同区域的特征无法共享,分类性能受限。
(4)数据标注成本过高。语义分割方案需要基高质量的卫星影像作为训练数据,基于像素标注每一个变化的建筑物,观察与作业成本过高。
本申请提供的地图更新方法,以深度学习目标检测的模型为基础,结合孪生网络结构提取变化特征,采用端到端完成地图变化区域检测,以实现高效、准确地地图更新。
本申请提供的地图更新方法、装置、电子设备和计算机可读存储介质,旨在解决现有技术的如上技术问题。
下面以具体地实施例对本申请的技术方案以及本申请的技术方案如何解决上述技术问题进行详细说明。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例中不再赘述。下面将结合附图,对本申请的实施例进行描述。
如图1所示,本申请的地图更新方法,可以应用于图1所示的场景中,具体的,服务器103接收到终端发送的待检测区域对应的地图的当前图像101和历史图像102之后,基于孪生网络104对当前图像101和历史图像102之间的区别特征信息进行识别,确定历史图像102相对于当前图像101的至少一个变化定位框105,以便基于至少一个变化定位框105更新地图,得到更新后地图106。
图1所示的场景中,上述地图更新方法可以在服务器中进行,在其他的场景中,也可以在终端中进行。
本技术领域技术人员可以理解,这里所使用的“终端”可以是手机、平板电脑、PDA(Personal Digital Assistant,个人数字助理)、MID(Mobile Internet Device,移动互联网设备)等;“服务器”可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
本申请实施例中提供了一种地图更新的方法,如图2所示,该方法可以包括以下步骤:
S201,获取待检测区域对应的地图的当前图像和历史图像。
在本申请实施例中,确定了需要地图更新的待检测区域之后,提取待检测区域对应的地图数据,以便获取相同区域不同时期的地图数据,即待检测区域对应的地图的当前图像和历史图像。
其中,当前图像或历史图像可以通过已有的GIS(Geographic InformationSystem,地理信息系统)数据得出,也可以基于航天航空遥感数据直接获取。
S202,基于训练后的孪生网络确定当前图像和历史图像之间的区别特征信息。
其中,孪生网络是基于孪生神经网络架构的检测网络;孪生神经网络(Siameseneural network),又名双生神经网络,是基于两个人工神经网络建立的耦合构架,以两个样本为输入,输出其嵌入高维度空间的表征,以比较两个样本的相似程度。
具体的,检测网络可以基于FCOS(Fully Convolutional One-Stage ObjectDetection,全卷积单阶段检测)或SSD(Single Shot MultiBox Detector,单阶段多框目标检测)或Faster R-CNN(Faster Region-CNN,快速基于卷积神经网络的区域检测)等目标检测算法。
S203,基于区别特征信息确定历史图像相对于当前图像的至少一个变化定位框。
其中,变化定位框表征了历史图像相对于当前图像的片区变化区域,即在地图中同一区域位置上的变化情况,该变化可以包括:建筑物的修建、道路的改造或者桥梁的搭建等。
其中,变化定位框的形状可以是矩形,也可以是圆形,还可以是基于变化对象轮廓生成的多边形,在本实施例中不作具体限制。
S204,基于至少一个变化定位框更新地图。
上述实施例中,通过孪生网络确定当前图像和历史图像之间的区别特征信息,孪生网络抗干扰能力强,以使得到的区别特征信息具有更优的特征表征能力,基于区别特征信息确定变化定位框,从而更新地图,可以有效减少地图变更的误检错检,提高地图更新的准确率。
接下来,以基于FCOS算法的孪生网络为例对本实施例提供的地图更新方法进行具体说明。如图3所示,基于FCOS算法的孪生网络的模型架构可以包括Backbone(主干网络)模块、FPN(Feature Pyramid Network,特征金字塔网络)模块和多分支损失函数模块。
其中,Backbone模块用于前端提取图像信息,生成特征图(feature map),供后面的网络使用;Backbone通常可以采用Resnet101或VGGNet结构。FPN模块用于特征融合上采样,可以针对图像中目标的多尺度特点进行特征处理。多分支损失函数模块用于变化定位框的预测,能够准确锁定地图的变化区域。
本申请实施例中提供了一种可能的实现方式,如图4所示,步骤S202的确定当前图像和历史图像之间的区别特征信息,可以包括:
(1)对当前图像进行特征提取,得到第一特征点集合;
(2)对历史图像进行特征提取,得到第二特征点集合;
(3)确定第一特征点集合和第二特征点集合之间的区别点集合;
(4)基于区别点集合,生成区别特征信息。
在本实施例中,将当前图像和对比图象共同作为孪生网络的输入,基于Backbone模块分别进行特征参数的提取,其中Backbone模块可以采用Resnet101结构。
具体的,当前图像和对比图像共享Resnet101结构分别提取对应的特征,基于resnet101结构网络的下采样分为5个阶段,分别为C1、C2、C3、C4和C5,每个阶段输出的特征图尺度各不同。由于C1和C2阶段的语义信息太少,故分别选取C3、C4和C5阶段的特征输出feature map,表征当前图像或历史图像的特征图,并对同一阶段内的feature map进行减法操作,基于删减后的C3、C4和C5阶段的特征输出feature map,确定区别特征信息。
其中,5个阶段分别由多个残差单元组成,每个残差单元均由卷积层、归一化层(Batch Normalization)、激活层(relu)、恒等映射组成:
底层卷积层负责提取图片边缘纹理等基本特征,高层卷积层负责把底层的纹理特征结合抽象。归一化层会对特征进行归一化正态分布处理。激活层对提取特征进行非线性映射,加强模型的泛化能力。恒等映射中为shortcut链接,不会产生额外的参数,也不会增加计算复杂度,保证后续孪生网络训练时梯度的有效回传。
为了获取当前图像和对比图象之间的区别特征信息,本申请引入孪生网络特征提取策略,相比于基于通道维度做图片拼接或二张图片做减法操作生成残差图的常规技术手段,通过孪生网络架构提升了所提取特征的表达能力,且孪生网络的抗干扰能力强。
本申请实施例中提供了一种可能的实现方式,步骤S203的基于区别特征信息确定历史图像相对于当前图像的至少一个变化定位框,可以包括:
(1)基于区别特征信息确定至少一个目标特征点。
本申请实施例中提供了又一种可能的实现方式,上述基于区别特征信息确定至少一个目标特征点,可以包括:
a,对区别特征信息进行上采样,得到融合特征信息;
b,基于融合特征信息,获取至少一个目标特征点。
具体的,FPN模块采用特征金字塔策略,对Backbone模块提取的区别特征信息进行多尺度、分层级的上采样操作,实现特征图尺度放大和特征信息的融合,基于Resnet101网络C3、C4和C5阶段的特征输出,确定FPN模块P3、P4、P5、P6和P7共5个层级的融合特征输出。
如图5所示,先提取resnet101网络C3、C4和C5阶段的特征输出,分别经过1*1的卷积操作,得到特征图如M3、M4、M5所示;在P5层的基础上进行步长为2的卷积操作,分别生成P6和P7层级的特征图;
然后,进行自上而下的融合上采样,可以采用最近邻插值法,初始P5层级的特征经过上采样与初始P4层级特征图相加,最后经过3*3卷积得到最终的P4层级的特征输出;最终P4层级的特征经过上采样与M3相加,最后经过3*3卷积得到最终的P3层级的特征输出;根据同样的方法,P3层级也经过上采样模块进行上采样操作,实现尺度放大的作用,通过上采样融合必要特征信息。其中,P7层级的特征输出对应单像素感受野最大,负责预测大片区域,例如整个工业园区。P3层级的特征输出对应单像素感受野比P7小32倍,负责预测小型物体对象,例如单个建筑物或桥梁。
最后,计算出所有层级上每个像素点对应的回归目标,并根据回归目标筛选出满足预设条件的像素点做为目标特征点;上述预设条件可以针对像素点所在的不同层级来分别设置。
通过基于特征金字塔策略的融合上采样,每个层级上采样模块的输入不仅来自于前一个层级上采样的输出,还在来自于Backbone特征提取环节对应的同尺寸的共享特征层,并采用卷积操作实现信息融合,实现了分层级的特征信息的更好的融合。同时,不同层级的特征图输出分别负责检测不同大小的目标对象,增强了后续目标检测的准确性。
(2)基于目标特征点确定至少一个预设形状的变化定位框。
本申请实施例中提供了一种可能的实现方式,上述变化定位框的形状可以为矩形;基于目标特征点确定至少一个预设形状的变化定位框,可以包括:
a,分别确定每一个目标特征点对应的类别和边距数据;
b,基于类别和边距数据,分别确定每一个目标特征点对应的矩形变化定位框。
其中,孪生网络对所有层级上的目标特征点进行分类预测和回归,确定每个点所属对象类别和每个点到对象四个边界的距离,从而就可以确定此对象的类别和对应的一个矩形变化定位框。
本申请实施例中提供了一种可能的实现方式,步骤S204的基于至少一个变化定位框更新地图,可以包括:
基于每一个变化定位框确定变化轮廓;
接收修正信息,基于修正信息对变化轮廓进行修正,生成地物轮廓数据;
根据地物轮廓数据,更新地图。
具体的,以建筑物变化更新为例,可以基于建筑实例分割算法,根据变化定位框生成精准的建筑轮廓;然后根据人工手动操作,对建筑轮廓进行二次编辑修正,最后将修正后的建筑轮廓数据作为地图更新数据,以便对地图上的建筑物进行更新。
本申请实施例中提供了一种可能的实现方式,如图6所示,孪生网络可以通过如下步骤训练得到:
S601,获取同一样本区域不同时期的样本图像;样本图像设置有对应的样本定位框;
S602,将样本图像输入到初始孪生网络,得到初始孪生网络输出的实时定位框标签;
S603,基于样本定位框和定位框标签确定多分支损失函数;
S604,基于多分支损失函数对初始孪生网络的参数进行调节,得到孪生网络。
具体的,本申请实施例使用anchor-free的策略,对每个像素点进行直接预测目标,衡量变化定位框的上、下、左、右边的距离,以及目标的类别,得到实时定位框标签,然后基于多分支损失函数对孪生网络进行训练,其中,多分支损失函数包括分类损失、回归损失和中心度损失:
(1)分类损失可以计算出目标特征点对应的类别分数,该类别分数表征目标特征点是否落入对应样本定位框内;
(2)回归损失可以表征实时定位框标签和样本定位框的差异;
(3)中心度损失为了对定位框标签进行有效筛选,先计算每一个目标特征点的中心度,该中心度数据可以表示当前点离目标中心的偏离程度,然后直接将中心度数据与上述分类损失中的类别分数相乘,作为最终的分类分数。
本申请实施例通过anchor-free的策略,完全避免了与anchor相关的复杂计算,通过多层级的数据处理,使得孪生网络的训练样本更加丰富,且可以检测各种折叠、极大、极小或不规则的目标对象;同时引入了中心度损失,有效限制了那些由离目标中心(样本定位框中心)较远的点产生的定位框标签,从而减少这些比较低质量的点,运用多分支的损失函数增强了孪生网络预测的准确性。
为了更好地理解上述地图更新方法,如图7所示,以下详细阐述一个本申请的地图更新方法的示例:
如图7所示,在一个示例中,本申请提供的地图更新方法,可以包括如下步骤:
S701,获取待检测区域对应的地图的当前图像和历史图像;
S702,基于训练后的孪生网络对当前图像进行特征提取,得到第一特征点集合;对历史图像进行特征提取,得到第二特征点集合;孪生网络可以是基于孪生神经网络架构的FCOS或SSD网络;
S703,通过特征信息的下采样,确定第一特征点集合和第二特征点集合之间的区别点集合,基于区别点集合,生成区别特征信息;具体的,可以基于Resnet101网络结构进行特征信息的下采样;
S704,采用特征金字塔策略对区别特征信息进行上采样,得到融合特征信息;
S705,基于融合特征信息,获取至少一个目标特征点;
S706,分别确定每一个目标特征点对应的类别和边距数据;
S707,基于类别和边距数据,分别确定每一个目标特征点对应的矩形变化定位框;其中,变化定位框表征了历史图像相对于当前图像的片区变化区域,即在地图中同一区域位置上的变化情况,该变化可以包括:建筑物的修建、道路的改造或者桥梁的搭建等。
S708,基于至少一个变化定位框更新地图。
本申请的地图更新方法,通过孪生网络确定当前图像和历史图像之间的区别特征信息,孪生网络抗干扰能力强,以使得到的区别特征信息具有更优的特征表征能力,基于区别特征信息确定变化定位框,从而更新地图,可以有效减少地图变更的误检错检,提高地图更新的准确率。
此外,基于变化定位框实现片区变化识别,能够快速锁定地图变化区域,相比于现有技术中语义分割的像素级别的变化识别,大幅提升了地图数据的更新效率,降低了网络模型对图像分辨率与图像质量的要求,保证了地图数据变化定位的准确性。
本申请实施例提供了一种地图更新装置,如图8所示,该地图更新装置80可以包括:获取模块801、提取模块802、确定模块803以及更新模块804,其中,
获取模块801,用于获取待检测区域对应的地图的当前图像和历史图像;
提取模块802,用于基于训练后的孪生网络确定当前图像和历史图像之间的区别特征信息;
确定模块803,用于基于区别特征信息确定历史图像相对于当前图像的至少一个变化定位框;
更新模块804,用于基于至少一个变化定位框更新地图。
本申请实施例中提供了一种可能的实现方式,提取模块802具体可以用于:
对当前图像进行特征提取,得到第一特征点集合;
对历史图像进行特征提取,得到第二特征点集合;
确定第一特征点集合和第二特征点集合之间的区别点集合;
基于区别点集合,生成区别特征信息。
本申请实施例中提供了一种可能的实现方式,确定模块803具体可以包括:
第一确定单元,用于基于区别特征信息确定至少一个目标特征点;
第二确定单元,用于基于目标特征点确定至少一个预设形状的变化定位框。
本申请实施例中提供了一种可能的实现方式,第一确定单元还可以用于:
对区别特征信息进行上采样,得到融合特征信息;
基于融合特征信息,获取至少一个目标特征点。
本申请实施例中提供了一种可能的实现方式,变化定位框的形状可以为矩形,第二确定单元还可以用于:
分别确定每一个目标特征点对应的类别和边距数据;
基于类别和边距数据,分别确定每一个目标特征点对应的矩形变化定位框。
本申请实施例中提供了一种可能的实现方式,上述更新模块804还可以用于:
基于每一个变化定位框确定变化轮廓;
接收修正信息,基于修正信息对变化轮廓进行修正,生成地物轮廓数据;
根据地物轮廓数据,更新地图。
本申请实施例中提供了一种可能的实现方式,该装置还包括训练模块,具体可以用于:
获取同一样本区域不同时期的样本图像;样本图像设置有对应的样本定位框;
将样本图像输入到初始孪生网络,得到初始孪生网络输出的实时定位框标签;
基于样本定位框和定位框标签确定多分支损失函数;
基于多分支损失函数对初始孪生网络的参数进行调节,得到孪生网络。
为了更好地理解上述地图更新装置,以下详细阐述一个本申请的地图更新装置的示例,如图9所示,本实施例的装置90可以包括:
获取模块901,用于获取待检测区域对应的地图的当前图像和历史图像;
提取模块902,用于基于训练后的孪生网络确定当前图像和历史图像之间的区别特征信息;
确定模块903,用于基于区别特征信息确定历史图像相对于当前图像的至少一个变化定位框;
更新模块904,用于基于至少一个变化定位框更新地图;
训练模块905,用于获取同一样本区域不同时期的样本图像;样本图像设置有对应的样本定位框;将样本图像输入到初始孪生网络,得到初始孪生网络输出的实时定位框标签;基于样本定位框和定位框标签确定多分支损失函数;基于多分支损失函数对初始孪生网络的参数进行调节,得到孪生网络。
本实施例的地图更新装置可执行本申请上述实施例所示的地图更新方法,其实现原理相类似,此处不再赘述。
本申请通过孪生网络确定当前图像和历史图像之间的区别特征信息,孪生网络抗干扰能力强,以使得到的区别特征信息具有更优的特征表征能力,基于区别特征信息确定变化定位框,从而更新地图,可以有效减少地图变更的误检错检,提高地图更新的准确率。
此外,基于变化定位框实现片区变化识别,能够快速锁定地图变化区域,相比于现有技术中语义分割的像素级别的变化识别,大幅提升了地图数据的更新效率,降低了网络模型对图像分辨率与图像质量的要求,保证了地图数据变化定位的准确性。
本申请实施例中提供了一种电子设备,该电子设备包括:存储器和处理器;至少一个程序,存储于存储器中,用于被处理器执行时,与现有技术相比可实现:通过孪生网络确定当前图像和历史图像之间的区别特征信息,孪生网络抗干扰能力强,以使得到的区别特征信息具有更优的特征表征能力;同时,基于变化定位框实现片区变化识别,能够快速锁定地图变化区域,相比于现有技术中语义分割的像素级别的变化识别,大幅提升了地图数据的更新效率,降低了网络模型对图像分辨率与图像质量的要求,保证了地图数据变化定位的准确性;本申请实施例可以有效减少地图变更的误检错检,提高地图更新的准确率。
在一个可选实施例中提供了一种电子设备,如图10所示,图10所示的电子设备4000包括:处理器4001和存储器4003。其中,处理器4001和存储器4003相连,如通过总线4002相连。可选地,电子设备4000还可以包括收发器4004,收发器4004可以用于该电子设备与其他电子设备之间的数据交互,如数据的发送和/或数据的接收等。需要说明的是,实际应用中收发器4004不限于一个,该电子设备4000的结构并不构成对本申请实施例的限定。
处理器4001可以是CPU(Central Processing Unit,中央处理器),通用处理器,DSP(Digital Signal Processor,数据信号处理器),ASIC(Application SpecificIntegrated Circuit,专用集成电路),FPGA(Field Programmable Gate Array,现场可编程门阵列)或者其他可编程逻辑器件、晶体管逻辑器件、硬件部件或者其任意组合。其可以实现或执行结合本申请公开内容所描述的各种示例性的逻辑方框,模块和电路。处理器4001也可以是实现计算功能的组合,例如包含一个或多个微处理器组合,DSP和微处理器的组合等。
总线4002可包括一通路,在上述组件之间传送信息。总线4002可以是PCI(Peripheral Component Interconnect,外设部件互连标准)总线或EISA(ExtendedIndustry Standard Architecture,扩展工业标准结构)总线等。总线4002可以分为地址总线、数据总线、控制总线等。为便于表示,图10中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
存储器4003可以是ROM(Read Only Memory,只读存储器)或可存储静态信息和指令的其他类型的静态存储设备,RAM(Random Access Memory,随机存取存储器)或者可存储信息和指令的其他类型的动态存储设备,也可以是EEPROM(Electrically ErasableProgrammable Read Only Memory,电可擦可编程只读存储器)、CD-ROM(Compact DiscRead Only Memory,只读光盘)或其他光盘存储、光碟存储(包括压缩光碟、激光碟、光碟、数字通用光碟、蓝光光碟等)、磁盘存储介质或者其他磁存储设备、或者能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质,但不限于此。
存储器4003用于存储执行本申请方案的应用程序代码(计算机程序),并由处理器4001来控制执行。处理器4001用于执行存储器4003中存储的应用程序代码,以实现前述方法实施例所示的内容。
其中,电子设备包括但不限于:移动电话、笔记本电脑、数字广播接收器、PDA(个人数字助理)、PAD(平板电脑)、PMP(便携式多媒体播放器)、车载终端(例如车载导航终端)等等的移动终端以及诸如数字TV、台式计算机等等的固定终端。图10示出的电子设备仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
本申请实施例提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,当其在计算机上运行时,使得计算机可以执行前述方法实施例中相应内容。
应该理解的是,虽然附图的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,其可以以其他的顺序执行。而且,附图的流程图中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,其执行顺序也不必然是依次进行,而是可以与其他步骤或者其他步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
以上所述仅是本发明的部分实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
Claims (10)
1.一种地图更新方法,其特征在于,包括:
获取待检测区域对应的地图的当前图像和历史图像;
基于训练后的孪生网络确定所述当前图像和所述历史图像之间的区别特征信息;
基于所述区别特征信息确定所述历史图像相对于所述当前图像的至少一个变化定位框;
基于所述至少一个变化定位框更新所述地图。
2.根据权利要求1所述的地图更新方法,其特征在于,所述确定所述当前图像和所述历史图像之间的区别特征信息,包括:
对所述当前图像进行特征提取,得到第一特征点集合;
对所述历史图像进行特征提取,得到第二特征点集合;
确定所述第一特征点集合和所述第二特征点集合之间的区别点集合;
基于所述区别点集合,生成区别特征信息。
3.根据权利要求1或2所述的地图更新方法,其特征在于,所述基于所述区别特征信息确定所述历史图像相对于所述当前图像的至少一个变化定位框,包括:
基于所述区别特征信息确定至少一个目标特征点;
基于所述目标特征点确定至少一个预设形状的变化定位框。
4.根据权利要求3所述的地图更新方法,其特征在于,所述基于所述区别特征信息确定至少一个目标特征点,包括:
对所述区别特征信息进行上采样,得到融合特征信息;
基于所述融合特征信息,获取至少一个目标特征点。
5.根据权利要求3所述的地图更新方法,其特征在于,所述变化定位框的形状为矩形;所述基于所述目标特征点确定至少一个预设形状的变化定位框,包括:
分别确定每一个所述目标特征点对应的类别和边距数据;
基于所述类别和所述边距数据,分别确定每一个所述目标特征点对应的矩形变化定位框。
6.根据权利要求1所述的地图更新方法,其特征在于,所述基于所述至少一个变化定位框更新所述地图,包括:
基于每一个所述变化定位框确定变化轮廓;
接收修正信息,基于所述修正信息对所述变化轮廓进行修正,生成地物轮廓数据;
根据所述地物轮廓数据,更新所述地图。
7.根据权利要求1所述的地图更新方法,其特征在于,所述孪生网络是通过如下方式训练得到的:
获取同一样本区域不同时期的样本图像;所述样本图像设置有对应的样本定位框;
将所述样本图像输入到初始孪生网络,得到所述初始孪生网络输出的实时定位框标签;
基于所述样本定位框和所述定位框标签确定多分支损失函数;
基于所述多分支损失函数对所述初始孪生网络的参数进行调节,得到所述孪生网络。
8.一种地图更新装置,其特征在于,包括:
获取模块,用于获取待检测区域对应的地图的当前图像和历史图像;
提取模块,用于基于训练后的孪生网络确定所述当前图像和所述历史图像之间的区别特征信息;
确定模块,用于基于所述区别特征信息确定所述历史图像相对于所述当前图像的至少一个变化定位框;
更新模块,用于基于所述至少一个变化定位框更新所述地图。
9.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现权利要求1-7任一项所述的地图更新方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,该程序被处理器执行时实现权利要求1-7任一项所述的地图更新方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110287331.8A CN113704276A (zh) | 2021-03-17 | 2021-03-17 | 地图更新方法、装置、电子设备及计算机可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110287331.8A CN113704276A (zh) | 2021-03-17 | 2021-03-17 | 地图更新方法、装置、电子设备及计算机可读存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113704276A true CN113704276A (zh) | 2021-11-26 |
Family
ID=78647831
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110287331.8A Pending CN113704276A (zh) | 2021-03-17 | 2021-03-17 | 地图更新方法、装置、电子设备及计算机可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113704276A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114581667A (zh) * | 2022-03-04 | 2022-06-03 | 北京百度网讯科技有限公司 | 地图数据处理方法、装置、电子设备和存储介质 |
WO2023165332A1 (zh) * | 2022-03-04 | 2023-09-07 | 北京字节跳动网络技术有限公司 | 组织腔体的定位方法、装置、可读介质和电子设备 |
-
2021
- 2021-03-17 CN CN202110287331.8A patent/CN113704276A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114581667A (zh) * | 2022-03-04 | 2022-06-03 | 北京百度网讯科技有限公司 | 地图数据处理方法、装置、电子设备和存储介质 |
WO2023165332A1 (zh) * | 2022-03-04 | 2023-09-07 | 北京字节跳动网络技术有限公司 | 组织腔体的定位方法、装置、可读介质和电子设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112766244B (zh) | 目标对象检测方法、装置、计算机设备和存储介质 | |
Xie et al. | Multilevel cloud detection in remote sensing images based on deep learning | |
CN109658445A (zh) | 网络训练方法、增量建图方法、定位方法、装置及设备 | |
CN108734210B (zh) | 一种基于跨模态多尺度特征融合的对象检测方法 | |
CN112801047B (zh) | 缺陷检测方法、装置、电子设备及可读存储介质 | |
CN117132649A (zh) | 人工智能融合北斗卫星导航的船舶视频定位方法及装置 | |
CN112215205B (zh) | 目标识别方法、装置、计算机设备和存储介质 | |
CN111767839B (zh) | 一种车辆行驶轨迹确定方法、装置、设备及介质 | |
CN113704276A (zh) | 地图更新方法、装置、电子设备及计算机可读存储介质 | |
CN116958027A (zh) | 三维工业异常检测方法、装置、存储介质及电子设备 | |
CN107452003A (zh) | 一种含有深度信息的图像分割的方法及装置 | |
CN113705304B (zh) | 一种图像处理方法、装置、存储介质及计算机设备 | |
CN113298871A (zh) | 地图生成方法、定位方法及其系统、计算机可读存储介质 | |
CN118015576A (zh) | 车道线检测方法、装置、计算机设备、存储介质 | |
CN114708321B (zh) | 一种基于语义的相机位姿估计方法及系统 | |
CN117541824A (zh) | 标识的识别方法和装置、存储介质及电子设备 | |
CN116977255A (zh) | 缺陷检测方法、装置、设备以及存储介质装置 | |
CN116050498A (zh) | 网络训练方法、装置、电子设备及存储介质 | |
CN117011481A (zh) | 构建三维地图的方法、装置、电子设备及存储介质 | |
Xiao et al. | Confidence map based 3D cost aggregation with multiple minimum spanning trees for stereo matching | |
CN112396593B (zh) | 一种基于关键帧选择和局部特征的闭环检测方法 | |
CN116958176B (zh) | 图像分割方法、装置、计算机设备及介质 | |
CN111680722B (zh) | 内容识别方法、装置、设备及可读存储介质 | |
CN116503624A (zh) | 图像匹配方法、装置、设备、存储介质及计算机程序产品 | |
US10657415B2 (en) | Image correspondence determining method and apparatus |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |