CN114897746A - 图像处理方法、设备及存储介质 - Google Patents
图像处理方法、设备及存储介质 Download PDFInfo
- Publication number
- CN114897746A CN114897746A CN202210623389.XA CN202210623389A CN114897746A CN 114897746 A CN114897746 A CN 114897746A CN 202210623389 A CN202210623389 A CN 202210623389A CN 114897746 A CN114897746 A CN 114897746A
- Authority
- CN
- China
- Prior art keywords
- image
- frequency domain
- filtering
- neural network
- images
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000003672 processing method Methods 0.000 title claims abstract description 16
- 238000001914 filtration Methods 0.000 claims abstract description 233
- 238000003062 neural network model Methods 0.000 claims abstract description 162
- 238000012545 processing Methods 0.000 claims abstract description 128
- 238000000034 method Methods 0.000 claims abstract description 54
- 238000006243 chemical reaction Methods 0.000 claims description 23
- 230000004927 fusion Effects 0.000 claims description 19
- 230000008569 process Effects 0.000 claims description 16
- 238000004590 computer program Methods 0.000 claims description 12
- 230000009466 transformation Effects 0.000 claims description 10
- 230000004044 response Effects 0.000 claims description 4
- 238000013528 artificial neural network Methods 0.000 description 22
- 238000010586 diagram Methods 0.000 description 20
- 230000006870 function Effects 0.000 description 11
- 238000004891 communication Methods 0.000 description 8
- 230000011218 segmentation Effects 0.000 description 6
- 238000012986 modification Methods 0.000 description 5
- 230000004048 modification Effects 0.000 description 5
- 230000003287 optical effect Effects 0.000 description 5
- 238000012549 training Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 3
- 239000013307 optical fiber Substances 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 230000004075 alteration Effects 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 230000002860 competitive effect Effects 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/10—Image enhancement or restoration using non-spatial domain filtering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/20—Image enhancement or restoration using local operators
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/50—Image enhancement or restoration using two or more images, e.g. averaging or subtraction
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/11—Region-based segmentation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10016—Video; Image sequence
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20084—Artificial neural networks [ANN]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20088—Trinocular vision calculations; trifocal tensor
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20212—Image combination
- G06T2207/20221—Image fusion; Image merging
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Image Processing (AREA)
Abstract
本申请公开图像处理方法、设备及存储介质,属于图像处理技术领域,该方法包括:按照N个频域段将待处理图像进行划分,得到所述N个频域段中每个频域段包含的子频域图像,N为大于1的正整数;根据频域段与滤波神经网络模型的对应关系,将所述每个频域段包含的子频域图像输入对应的滤波神经网络模型;根据所述N个频域段分别对应的滤波神经网络模型输出的滤波图像,得到目标图像。从而针对不同频域段特征进行针对性滤波,有效提升滤波后的图像质量。
Description
技术领域
本申请涉及图像处理技术领域,尤其涉及一种图像处理方法、设备及存储介质。
背景技术
在进行视频编解码过程中,经常需要对部分或全部视频帧对应的图像进行滤波处理,使图像看起来更加自然,有效提升视频质量。其中,目前相关技术中,为了提升视频质量,对视频帧对应的图像进行滤波的方式主要是将需要进行滤波处理的视频帧的空域图像输入神经网络,得到滤波后的图像,然而,该种图像处理方式经常会由于神经网络倾向于优先学习低频信息,导致训练的效率较低,进行滤波处理得到的图像质量较差。
综上,亟需一种高效且优质的图像处理方案。
发明内容
本申请实施例提供一种图像处理方法、设备及存储介质,用以有效提升图像质量。
第一方面,本申请实施例提供一种图像处理方法,包括:
按照N个频域段将待处理图像进行划分,得到所述N个频域段中每个频域段包含的子频域图像,N为大于1的正整数;根据频域段与滤波神经网络模型的对应关系,将所述每个频域段包含的子频域图像输入对应的滤波神经网络模型;根据所述N个频域段分别对应的滤波神经网络模型输出的滤波图像,得到目标图像。
在一些实施例中,所述待处理图像为空域图像,所述按照N个频域段将待处理图像进行划分,得到所述N个频域段中每个频域段包含的子频域图像,包括:
将所述空域图像进行频域转换,得到对应的频域图像;
按照所述N个频域段将进行频域转换后的空域图像进行划分,得到所述N个频域段中每个频域段包含的子频域图像。
在一些实施例中,所述按照N个频域段将待处理图像进行划分之前,还包括:
将针对所述待处理图像进行多个频域段划分的预设频域段数量确定为所述N;或,
基于所述待处理图像的像素,确定所述N。
在一些实施例中,所述将所述每个频域段包含的子频域图像输入对应的滤波神经网络模型,包括:
当一个频域段包括多个子频域图像时,将所述多个子频域图像分别输入对应的滤波神经网络模型,得到所述滤波神经网络模型输出的所述多个子频域图像分别对应的滤波图像。
在一些实施例中,所述将所述每个频域段包含的子频域图像输入对应的滤波神经网络模型,包括:
当一个频域段包括多个子频域图像时,将所述多个子频域图像拼接成一个三维的张量,将所述张量输入对应的滤波神经网络模型,得到所述滤波神经网络模型输出的所述张量对应的滤波图像。
在一些实施例中,所述根据所述N个频域段分别对应的滤波神经网络模型输出的滤波图像,得到目标图像,包括:
将所述N个频域段分别对应的滤波神经网络模型输出的滤波图像进行融合,以及进行频域到空域的转换,得到所述目标图像。
在一些实施例中,所述将所述N个频域段分别对应的滤波神经网络模型输出的滤波图像进行融合,以及进行频域到空域的转换,得到所述目标图像,包括:
将所述N个频域段分别对应的滤波神经网络模型输出的滤波图像进行融合,得到融合图像;将所述融合图像输入用于进行频域到空域转换的神经网络模型,得到所述目标图像;或,
将所述N个频域段分别对应的滤波神经网络模型输出的滤波图像进行融合,得到融合图像;将所述融合图像通过频域到空域的反变换,得到所述目标图像。
在一些实施例中,所述将所述N个频域段分别对应的滤波神经网络模型输出的滤波图像进行融合,以及进行频域到空域的转换,得到所述目标图像,包括:
将所述N个频域段分别对应的滤波神经网络模型输出的滤波图像按照分配的权重值,进行加权融合得到融合图像,以及将所述融合图像进行频域到空域的转换,得到所述目标图像;或者,
将所述N个频域段分别对应的滤波神经网络模型输出的滤波图像进行频域到空域的转换,得到对应的空域图片,按照分配的权重值,对所述空域图片进行加权融合,得到所述目标图像;或者,
将所述N个频域段分别对应的滤波神经网络模型输出的滤波图像,输入用于进行频域到空域的转换以及融合的神经网络模型,得到所述目标图像。
在一些实施例中,所述根据所述N个频域段分别对应的滤波神经网络模型输出的滤波图像,得到目标图像之后,所述方法还包括:
根据所述目标图像和所述待处理图像确定第一失真代价;
在所述第一失真代价满足失真代价条件时,将所述目标图像作为所述待处理图像进行图像处理的最终结果。
在一些实施例中,所述方法还包括:
基于预设图像处理方式对所述待处理图像进行图像处理,得到参考目标图像;并基于所述参考目标图像和所述待处理图像确定第二失真代价;
所述在所述第一失真代价满足失真代价条件时,将所述目标图像作为所述待处理图像进行图像处理的最终结果,包括:
响应于所述第一失真代价小于所述第二失真代价,将所述目标图像作为所述待处理图像进行图像处理的最终结果。
在一些实施例中,所述待处理图像为视频进行编码或者解码过程中的一个视频帧对应的图像。
第二方面,本申请实施例提供一种图像处理装置,包括:
划分模块,用于按照N个频域段将待处理图像进行划分,得到所述N个频域段中每个频域段包含的子频域图像,N为大于1的正整数;
处理模块,用于根据频域段与滤波神经网络模型的对应关系,将所述每个频域段包含的子频域图像输入对应的滤波神经网络模型;根据所述N个频域段分别对应的滤波神经网络模型输出的滤波图像,得到目标图像。
在一些实施例中,所述处理模块还用于:
将所述空域图像进行频域转换,得到对应的频域图像;
按照所述N个频域段将进行频域转换后的空域图像进行划分,得到所述N个频域段中每个频域段包含的子频域图像。
在一些实施例中,所述处理模块还用于:
将针对所述待处理图像进行多个频域段划分的预设频域段数量确定为所述N;或,
基于所述待处理图像的像素,确定所述N。
在一些实施例中,所述处理模块还用于:
当一个频域段包括多个子频域图像时,将所述多个子频域图像分别输入对应的滤波神经网络模型,得到所述滤波神经网络模型输出的所述多个子频域图像分别对应的滤波图像。
在一些实施例中,所述处理模块还用于:
当一个频域段包括多个子频域图像时,将所述多个子频域图像拼接成一个三维的张量,将所述张量输入对应的滤波神经网络模型,得到所述滤波神经网络模型输出的所述张量对应的滤波图像。
在一些实施例中,所述处理模块还用于:
将所述N个频域段分别对应的滤波神经网络模型输出的滤波图像进行融合,以及进行频域到空域的转换,得到所述目标图像。
在一些实施例中,所述处理模块还用于:
将所述N个频域段分别对应的滤波神经网络模型输出的滤波图像进行融合,得到融合图像;将所述融合图像输入用于进行频域到空域转换的神经网络模型,得到所述目标图像;或,
将所述N个频域段分别对应的滤波神经网络模型输出的滤波图像进行融合,得到融合图像;将所述融合图像通过频域到空域的反变换,得到所述目标图像。
在一些实施例中,所述处理模块还用于:
将所述N个频域段分别对应的滤波神经网络模型输出的滤波图像按照分配的权重值,进行加权融合得到融合图像,以及将所述融合图像进行频域到空域的转换,得到所述目标图像;或者,
将所述N个频域段分别对应的滤波神经网络模型输出的滤波图像进行频域到空域的转换,得到对应的空域图片,按照分配的权重值,对所述空域图片进行加权融合,得到所述目标图像;或者,
将所述N个频域段分别对应的滤波神经网络模型输出的滤波图像,输入用于进行频域到空域的转换以及融合的神经网络模型,得到所述目标图像。
在一些实施例中,所述处理模块还用于:
根据所述目标图像和所述待处理图像确定第一失真代价;
在所述第一失真代价满足失真代价条件时,将所述目标图像作为所述待处理图像进行图像处理的最终结果。
在一些实施例中,所述处理模块还用于:
基于预设图像处理方式对所述待处理图像进行图像处理,得到参考目标图像;并基于所述参考目标图像和所述待处理图像确定第二失真代价;
所述处理模块具体用于:
响应于所述第一失真代价小于所述第二失真代价,将所述目标图像作为所述待处理图像进行图像处理的最终结果。
在一些实施例中,所述处理模块还用于:
所述待处理图像为视频进行编码或者解码过程中的一个视频帧对应的图像。
第三方面,本申请实施例提供一种视频编码装置,包括:
处理模块,用于将编码过程中待处理的视频帧对应的图像发送给图像处理装置,以使所述图像处理装置按照N个频域段将所述图像进行划分,得到所述N个频域段中每个频域段包含的子频域图像;
收发模块,用于接收来自所述图像处理装置发送的所述目标图像。
第四方面,本申请实施例提供一种视频解码装置,包括:
处理模块,用于将解码过程中待处理的视频帧对应的图像发送给图像处理装置,以使所述图像处理装置按照N个频域段将所述图像进行划分,得到所述N个频域段中每个频域段包含的子频域图像;
收发模块,用于接收来自所述图像处理装置发送的所述目标图像。
第五方面,本申请实施例提供一种电子设备,包括:至少一个处理器,以及与所述至少一个处理器通信连接的存储器,其中:
存储器存储有可被至少一个处理器执行的指令,该指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行上述视频编码方法或视频解码方法。
第六方面,本申请实施例提供一种存储介质,当所述存储介质中的指令由电子设备的处理器执行时,所述电子设备能够执行上述图像处理方法。
本申请实施例中,在进行图像处理时,能够将待处理的空域图像进行频域段划分,基于不同频域段的图像,分别采用对应的滤波神经网络模型进行处理,从而能够对图像不同频域段特征进行针对性滤波,有效避免了由于现有滤波神经网络倾向于优先学习低频信息,当把低频高频混合在一起的空域图像输入网络时,造成训练效率较低,图像质量较差的问题。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1为本申请实施例提供的一种图像处理系统架构示意图;
图2为本申请实施例提供的另一种图像处理系统架构示意图;
图3为本申请实施例提供的一种图像处理的方法流程示意图;
图4为本申请实施例提供的一种图像频域段划分示意图;
图5为本申请实施例提供的一种频域段包含图像示意图;
图6为本申请实施例提供的第一种神经网络模型处理方式示意图;
图7为本申请实施例提供的第二种神经网络模型处理方式示意图;
图8为本申请实施例提供的第三种神经网络模型处理方式示意图;
图9为本申请实施例提供的融合转换示意图;
图10为本申请实施例提供的一种图像处理设备结构示意图;
图11为本申请实施例提供的另一种图像处理设备的硬件结构示意图。
具体实施方式
为了使本领域普通人员更好地理解本公开的技术方案,下面将结合附图,对本公开实施例中的技术方案进行清楚、完整地描述。
需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。以下示例性实施例中所描述的实施方式并不代表与本发明相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本申请的一些方面相一致的装置和方法的例子。另外,本申请实施例中,“至少一个”是指一个或者多个,“多个”是指两个或两个以上。“和/或”,描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B的情况,其中A,B可以是单数或者复数。字符“/”一般表示前后关联对象是一种“或”的关系。“以下至少一项(个)”或其类似表达,是指的这些项中的任意组合,包括单项(个)或复数项(个)的任意组合。
在进行视频编解码过程中,经常需要对部分或全部视频帧对应的图像进行滤波处理,使图像看起来更加自然,有效提升视频质量。其中,目前相关技术中,为了提升视频质量,对视频帧对应的图像进行滤波的方式主要是将需要进行滤波处理的视频帧的空域图像输入神经网络,得到滤波后的图像,然而,该种图像处理方式经常会由于神经网络倾向于优先学习低频信息,导致训练的效率较低,进行滤波处理得到的图像质量较差。
基于上述问题,本申请实施例提供了一种图像处理方法和设备。该图像处理方法可以应用于终端,例如,计算机;也可应用于服务器等,在此并不进行限定。
本申请实施例中,在进行图像处理时,能够将待处理的空域图像进行频域段划分,基于不同频域段的图像,分别采用对应的滤波神经网络模型进行处理,从而能够对图像不同频域段特征进行针对性滤波,有效避免了由于现有滤波神经网络倾向于优先学习低频信息,当把低频高频混合在一起的空域图像输入网络时,造成训练效率较低,图像质量较差的问题。
请参考图1,为本申请实施例提供的图像处理系统架构示意图。该系统架构包括图像划分模块101、至少一个用于进行图像滤波的神经网络模型102(后续简称为滤波神经网络模型)和融合转换模块103。图像划分模块101、用于进行图像滤波的神经网络模型102和融合转换模块103之间可以通信。其中,各个设备之间的通信方式可以是有线通信方式,例如通过连接网线或串口线进行通信;也可以是无线通信方式,例如通过蓝牙或无线保真(wireless fidelity,WIFI)等技术进行通信,具体不做限制。
其中,所述图像划分模块101,用于按照N个频域段将待处理图像进行划分,得到所述N个频域段中每个频域段包含的子频域图像,N为大于1的正整数。
作为一种示例,本申请实施例中当所述待处理图像为空域图像时,在进行频域段划分之前,可以先将所述待处理图像进行频域转换,得到对应的频域图像,然后,将所述频域图像划分为N个频域段。
其中,由于视频是由许多静止的图像连续播放而形成的,因此,本申请实施例中所述待处理图像可以看作为一个视频帧,例如,在进行视频编解码时,为了能够使解码后的视频画面清晰度更好,可以对视频中的视频帧采用本申请所述的图像处理方案进行处理。
所述滤波神经网络模型102,用于对输入的图像进行滤波处理。
其中,本申请实施例中频域段与滤波神经网络模型之间存在对应关系,例如,每一个频域段都至少设计一个滤波神经网络模型,用于对该频域段的图像进行滤波。本申请实施例中,以每一个频域段对应一个滤波神经网络模型为例进行介绍。
所述融合转换模块103,用于根据所述N个频域段分别对应的滤波神经网络模型输出的滤波图像,得到目标图像。
作为一种示例,本申请实施例中的目标图像可以为频域图像,也可以为空域图像。当所述目标图像为频域图像时,进行图像显示时,还需要将所述目标图像进行频域到空域的转换,得到对应的空域图像,从而进行显示。
作为一种实施例,图像划分模块和融合转换模块还可以如图2所示,集成为同一个处理设备,即所述处理设备同时具有图像划分和图像融合转换等功能。本申请实施例中,以图像划分模块和融合转换模块为不同的设备为例进行介绍。
如图3所示,本申请实施例提供一种图像处理方法,包括以下步骤:
步骤S301,按照N个频域段将待处理图像进行划分,得到所述N个频域段中每个频域段包含的子频域图像,N为大于1的正整数。
作为一种示例,所述待处理图像可以为空域图像,在对所述待处理图像进行频域段划分时,可以先将所述待处理图像转换为频域图像,然后基于得到的频域图像进行频域段划分。
进一步地,本申请实施例中的N的数值的确定方式有多种,具体并不限于下述几种:
确定方式1:将针对所述待处理图像进行多个频域段划分的预设频域段数量确定为所述N,即所述N的数值是预先设定的。
例如,假设预先设定N值为3时,则对每个待处理图像都划分为3个频域段。
确定方式2:基于所述待处理图像的像素,确定所述N。
作为一种示例,可以通过用于进行频域段划分的神经网络根据待处理图像的具体情况确定对应的N值。
例如,将待处理图像2输入用于进行频域段划分的神经网络后,如图4中的(a)所示,所述待处理的图像2被划分为高频域段、中频域段和低频域段3个频域段,如图4中的(b)所示,将待处理图像3输入用于进行频域段划分的神经网络后,所述待处理图像3被划分为高频域段、次高频域段、中频域段、次低频域段和低频域段5个频域段。
步骤S302,根据频域段与滤波神经网络模型的对应关系,将所述每个频域段包含的子频域图像输入对应的滤波神经网络模型。
作为一种示例,本申请实施例中,每个频域段可以分别对应至少一个滤波神经网络模型。
示例性的,假设待处理图像被划分为高频域段和低频域段两个频域段,其中,高频域段对应的滤波神经网络模型可以为滤波神经网络模型1与滤波神经网络模型2,低频域段对应的滤波神经网络模型可以为滤波神经网络模型3。
其中,当一个频域段对应多个滤波神经网络模型时,在对所述频域段包括的子图像进行滤波处理时,可以有多种处理方式,具体并不限于下述几种:
处理方式1:当所述频域段包括1个子图像,以及所述频域段对应滤波神经网络模型1与滤波神经网络模型2两个模型时,可以从所述频域段对应的滤波神经网络模型1与滤波神经网络模型2中随机选取滤波神经网络模型1,对所述子图像进行滤波处理。
处理方式2:当所述频域段包括1个子图像,以及所述频域段对应滤波神经网络模型1与滤波神经网络模型2两个模型时,可以分别应用滤波神经网络模型1对所述子图像进行处理,得到子图像处理结果1,以及应用滤波神经网络模型2对所述子图像进行处理,得到子图像处理结果2,然后,将所述子图像处理结果1与所述子图像处理结果2进行融合,得到所述子图像最终的滤波处理结果。
处理方式3:当所述频域段包括子图像1与子图像2两个子图像,以及所述频域段对应滤波神经网络模型1与滤波神经网络模型2两个模型时,可以从所述频域段对应的滤波神经网络模型1与滤波神经网络模型2中选取滤波神经网络模型1对所述子图像1进行滤波处理,选取滤波神经网络模型2对所述子图像2进行滤波处理。
处理方式4:当所述频域段包括子图像1与子图像2两个子图像,以及所述频域段对应滤波神经网络模型1与滤波神经网络模型2两个模型时,可以从所述频域段对应的滤波神经网络模型1与滤波神经网络模型2中选取滤波神经网络模型1对所述子图像1以及所述子图像2进行滤波处理。
进一步地,当频域段中包括的多个子图像采用一个滤波神经网络模型进行滤波时,可以有多种输入方式,具体并不限于下述几种:
输入方式1:将频域段包括的多个子图像作为多个分支,分别输入所述滤波神经网络模型。
输入方式2:将频域段包括的多个子图像拼接成一个三维的张量,将所述张量输入所述滤波神经网络模型。
步骤S303,根据所述N个频域段分别对应的滤波神经网络模型输出的滤波图像,得到目标图像。
进一步地,当一个神经网络模型有多个子频域图像输入时,可以有多种输出方式,具体并不限于下述几种:
输出方式1:所述滤波神经网络模型输出所述多个子频域图像分别对应的滤波图像。
具体地,基于所述输出方式1得到的多个滤波图像,确定所述目标图像时,将所述多个滤波图像进行融合,以及进行频域到空域的转换,从而得到所述目标图像。
其中,本申请实施例将所述多个滤波图像进行融合,以及进行频域到空域的转换,从而得到所述目标图像的方式有多种,具体并不限于下述几种:
方式1:将所述N个频域段分别对应的滤波神经网络模型输出的滤波图像进行融合,得到融合图像,然后,将所述融合图像输入用于进行频域到空域转换的神经网络模型,得到所述目标图像。
方式2:将所述N个频域段分别对应的滤波神经网络模型输出的滤波图像进行融合,得到融合图像,然后,将所述融合图像通过频域到空域的反变换,得到所述目标图像。
方式3:将所述N个频域段分别对应的滤波神经网络模型输出的滤波图像,输入用于进行频域到空域的转换以及融合的神经网络模型,得到所述目标图像。
输出方式2:所述滤波神经网络模型基于所述多个子频域图像输出一个滤波图像。
具体地,基于所述输出方式2得到的一个滤波图像,确定所述目标图像时,将所述滤波图像进行频域到空域的转换,从而得到所述目标图像。
其中,本申请实施例将所述滤波图像进行频域到空域的转换,从而得到所述目标图像的方式有多种,具体并不限于下述几种:
方式1:将所述滤波图像输入用于进行频域到空域转换的神经网络模型,得到所述目标图像。
方式2:将所述滤波图像通过频域到空域的反变换,得到所述目标图像。
进一步地,本申请实施例在得到所述目标图像之后,还可以通过下列方式确定所述目标图像是否作为所述待处理图像进行图像处理后的最终结果输出:
例如,本申请实施例可以根据所述目标图像和所述待处理图像确定第一失真代价,然后,在所述第一失真代价满足失真代价条件时,将所述目标图像作为所述待处理图像进行图像处理的最终结果。
作为一种示例,本申请实施例所述的失真代价条件包括且并不限于下述几种:
条件1:所述第一失真代价小于预设失真代价。
条件2:用本申请提供的滤波神经网络处理当前待处理图像的失真代价小于已有技术处理当前待处理图像的失真代价。
例如,本申请实施例还可以采用已有技术对所述待处理图像进行图像处理,得到参考目标图像,然后,并基于所述参考目标图像和所述待处理图像确定第二失真代价,当所述第一失真代价小于所述第二失真代价时,将所述目标图像作为所述待处理图像进行图像处理的最终结果。
下面,为了更好的对本申请实施例进行介绍,基于上述图3所述的步骤,进一步对本申请所述的图像处理方法进行详细介绍,具体可分为下述三个阶段:
阶段一:频域段划分。
具体地,本申请实施例可以将待处理图像输入用于进行频域段划分的神经网络模型中进行处理,从而得到所述待处理图像基于不同频域段划分后的子频域图像。
作为一种示例,本申请中若所述待处理图像为空域图像时,可以先将空域图像转换成频域图像,然后将转换得到的频域图像输入所述用于进行频域段划分的神经网络模型中进行进一步划分;或者,若所述待处理图像为空域图像时,可以直接将所述空域图像输入所述用于进行频域段划分的神经网络模型中进行划分处理,可以理解的,此时所述用于进行频域段划分的神经网络模型具有将空域图像转换为频域图像的功能;或,若所述待处理图像已经为转换好的频域图像,则直接将所述频域图像输入所述用于进行频域段划分的神经网络模型中进行划分处理。
示例性的,如图5所示,假设待处理图像为空域图像A,将所述空域图像A输入用于进行频域段划分的神经网络模型,通过所述用于进行频域段划分的神经网络模型的一系列处理操作,所述用于进行频域段划分的神经网络模型输出高频图像2个,低频图像2个,即所述空域图像A被分成了高频和低频2个频域段,其中,高频域段包括高频图像1与高频图像2,低频域段包括低频图像1与低频图像2。
阶段二:图像滤波处理。
具体地,根据频域段与滤波神经网络模型的对应关系,将每个频域段包括的子频域图像输入对应的滤波神经网络模型,进行图像滤波处理。
示例性的,基于上述图5所示的频域段划分情况,假设高频域段对应的滤波神经网络模型为滤波神经网络模型1,低频域段对应的滤波神经网络模型为滤波神经网络模型2,则本申请在执行图像滤波处理时,可以将高频域段的图像输入滤波神经网络模型1进行滤波处理,将低频域段的图像输入滤波神经网络模型2进行滤波处理。
例如,如图6所示,本申请实施例中在进行图像滤波处理时,可以将高频图像1与高频图像2作为两个分支,分别输入滤波神经网络模型1,然后,所述滤波神经网络模型1分别输出高频图像1对应的滤波图像1,以及高频图像2对应的滤波图像2。
本申请实施例中在进行图像滤波处理时,可以先将低频图像1与低频图像2拼接成一个三维的张量1,将所述张量1输入所述滤波神经网络模型2,然后,所述滤波神经网络模型2输出所述张量1对应的滤波图像3。
再例如,如图7所示,本申请实施例中在进行图像滤波处理时,可以先将高频图像1与高频图像2拼接成一个三维的张量2,将所述张量2输入所述滤波神经网络模型1,然后,所述滤波神经网络模型1输出所述张量2对应的滤波图像4。
本申请实施例中在进行图像滤波处理时,可以将低频图像1与低频图像2作为两个分支,分别输入滤波神经网络模型2,然后,所述滤波神经网络模型2分别输出低频图像1对应的滤波图像5,以及低频图像2对应的滤波图像6。
再例如,如图8所示,本申请实施例中在进行图像滤波处理时,可以先将高频图像1与高频图像2作为两个分支,分别输入滤波神经网络模型1,然后,所述滤波神经网络模型1输出所述高频图像1与高频图像2融合后的滤波图像7。
本申请实施例中在进行图像滤波处理时,可以将低频图像1与低频图像2作为两个分支,分别输入滤波神经网络模型2,然后,所述滤波神经网络模型2输出低频图像1与低频图像2融合后的滤波图像8。
阶段三:融合转换。
具体地,将多个滤波神经网络模型输出的滤波图像进行融合,以及频域到空域的转换,得到所述目标图像。
示例性的,基于上述图6所示的获得的滤波图像的情况进行融合转换。其中,所述目标图像通过上述阶段一与阶段二的操作,得到了如图5所示的滤波图像1~3。
此时,本申请可以分别对滤波图像1~3进行反变换,得到滤波图像1对应的子空域图像1,滤波图像2对应的子空域图像2以及滤波图像3对应的子空域图像3,然后,将所述子空域图像1~3进行融合,得到完整的空域图像,即所述目标图像。
进一步地,为了更好的进行图像融合,提升融合后的图像质量,本申请实施例还可以为按照分配的权重值,对得到的子空域图片进行加权融合,得到所述目标图像。
例如,假设为滤波图像1对应的子空域图像1,滤波图像2对应的子空域图像2以及滤波图像3对应的子空域图像3分配的权重分别为2/8,3/8,5/8,则最终输出图像情况可以如图9所示。
其中,上文所涉及的图像处理的部分步骤可以是可选的,步骤顺序也不代表实际的执行顺序,因此本申请不限定完全按照上文的步骤和顺序执行。
进一步地,本申请实施例提供的用于进行图像滤波的神经网络可以具有多个应用策略,具体并不限于下述几种:
应用策略1:用本申请实施例提供的滤波神经网络模块替换现有的一个或若干个滤波模块。
应用策略2:将本申请实施例提供的滤波神经网络模块作为一个额外的滤波模块插入到整个滤波流程中。
应用策略3:将本申请实施例提供的滤波神经网络模块加入到现有滤波过程中,且和现有技术的某个或某些传统滤波模块进行竞争,通过比较率失真代价,选择代价小的滤波方式,例如,可以通过编码传输一个flag表明是否采用某一方案的滤波神经网络模块。
示例性的,假设将本申请实施提供的滤波神经网络模块和现有技术中的ALF滤波模块竞争,其中,两种滤波方式只能取一种。
在具体实施过程在,例如,可以设置一个帧级的句法标识开关enable_cnn_filter,对当前帧,将enable_cnn_filter设置为1,表明当前帧可以开启本申请实施例提供的滤波神经网络模块。
开启本申请实施例提供的滤波神经网络模块后,本申请实施例提供的滤波神经网络模块和现有传统ALF滤波模块进行竞争,其中,设神经网络滤波的率失真代价为RDcost1,传统ALF滤波的率失真代价为RDcost2,且RDcost1<RDcost2。设置一个句法apply_cnn_filter_mode,传输apply_cnn_filter_mode=1,则代表使用本申请实施例提供的滤波神经网络模块。
进一步地,本申请实施里可以给每一帧或每一个最大编码单元提供一个开关,用于手动控制当前帧或当前最大编码单元是否能使用本申请实施例提供的滤波神经网络模块。该开关需要作为一个句法元素进行传输。
基于相同的技术构思,本申请实施例还提供一种图像处理装置,图像处理装置解决问题的原理与上述图像处理方法相似,因此图像处理的实施可参见图像处理方法的实施,重复之处不再赘述。图10为本申请实施例提供的一种图像处理装置的结构示意图,包括划分模块1001、处理模块1002。
划分模块1001,用于按照N个频域段将待处理图像进行划分,得到所述N个频域段中每个频域段包含的子频域图像,N为大于1的正整数;
处理模块1002,用于根据频域段与滤波神经网络模型的对应关系,将所述每个频域段包含的子频域图像输入对应的滤波神经网络模型;根据所述N个频域段分别对应的滤波神经网络模型输出的滤波图像,得到目标图像。
在一些实施例中,所述处理模块1002还用于:
将所述空域图像进行频域转换,得到对应的频域图像;
按照所述N个频域段将进行频域转换后的空域图像进行划分,得到所述N个频域段中每个频域段包含的子频域图像。
在一些实施例中,所述处理模块1002还用于:
将针对所述待处理图像进行多个频域段划分的预设频域段数量确定为所述N;或,
基于所述待处理图像的像素,确定所述N。
在一些实施例中,所述处理模块1002还用于:
当一个频域段包括多个子频域图像时,将所述多个子频域图像分别输入对应的滤波神经网络模型,得到所述滤波神经网络模型输出的所述多个子频域图像分别对应的滤波图像。
在一些实施例中,所述处理模块1002还用于:
当一个频域段包括多个子频域图像时,将所述多个子频域图像拼接成一个三维的张量,将所述张量输入对应的滤波神经网络模型,得到所述滤波神经网络模型输出的所述张量对应的滤波图像。
在一些实施例中,所述处理模块1002还用于:
将所述N个频域段分别对应的滤波神经网络模型输出的滤波图像进行融合,以及进行频域到空域的转换,得到所述目标图像。
在一些实施例中,所述处理模块1002还用于:
将所述N个频域段分别对应的滤波神经网络模型输出的滤波图像进行融合,得到融合图像;将所述融合图像输入用于进行频域到空域转换的神经网络模型,得到所述目标图像;或,
将所述N个频域段分别对应的滤波神经网络模型输出的滤波图像进行融合,得到融合图像;将所述融合图像通过频域到空域的反变换,得到所述目标图像。
在一些实施例中,所述处理模块1002还用于:
将所述N个频域段分别对应的滤波神经网络模型输出的滤波图像按照分配的权重值,进行加权融合得到融合图像,以及将所述融合图像进行频域到空域的转换,得到所述目标图像;或者,
将所述N个频域段分别对应的滤波神经网络模型输出的滤波图像进行频域到空域的转换,得到对应的空域图片,按照分配的权重值,对所述空域图片进行加权融合,得到所述目标图像;或者,
将所述N个频域段分别对应的滤波神经网络模型输出的滤波图像,输入用于进行频域到空域的转换以及融合的神经网络模型,得到所述目标图像。
在一些实施例中,所述处理模块1002还用于:
根据所述目标图像和所述待处理图像确定第一失真代价;
在所述第一失真代价满足失真代价条件时,将所述目标图像作为所述待处理图像进行图像处理的最终结果。
在一些实施例中,所述处理模块1002还用于:
基于预设图像处理方式对所述待处理图像进行图像处理,得到参考目标图像;并基于所述参考目标图像和所述待处理图像确定第二失真代价;
所述处理模块1002具体用于:
响应于所述第一失真代价小于所述第二失真代价,将所述目标图像作为所述待处理图像进行图像处理的最终结果。
在一些实施例中,所述处理模块1002还用于:
所述待处理图像为视频进行编码或者解码过程中的一个视频帧对应的图像。
本申请实施例中对模块的划分是示意性的,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,另外,本申请各实施例中的各功能模块可以集成在一个处理器中,也可以是单独物理存在,也可以两个或两个以上模块集成在一个模块中。各个模块相互之间的耦合可以是通过一些接口实现,这些接口通常是电性通信接口,但是也不排除可能是机械接口或其它的形式接口。因此,作为分离部件说明的模块可以是或者也可以不是物理上分开的,既可以位于一个地方,也可以分布到同一个或不同设备的不同位置上。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。
在介绍了本申请示例性实施方式的对比学习方法和装置之后,接下来,介绍根据本申请的另一示例性实施方式的电子设备。
所属技术领域的技术人员能够理解,本申请的各个方面可以实现为系统、方法或程序产品。因此,本申请的各个方面可以具体实现为以下形式,即:完全的硬件实施方式、完全的软件实施方式(包括固件、微代码等),或硬件和软件方面结合的实施方式,这里可以统称为“电路”、“模块”或“系统”。
在一些可能的实施方式中,根据本申请的电子设备可以至少包括至少一个处理器、以及至少一个存储器。其中,存储器存储有程序代码,当程序代码被处理器执行时,使得处理器执行本说明书上述描述的根据本申请各种示例性实施方式的方法。
下面参照图11来描述根据本申请的这种实施方式实现的电子设备110。图11显示的电子设备110仅仅是一个示例,不应对本申请实施例的功能和使用范围带来任何限制。
如图11所示,电子设备110以通用电子设备的形式表现。电子设备110的组件可以包括但不限于:上述至少一个处理器111、上述至少一个存储器112、连接不同系统组件(包括存储器112和处理器111)的总线113。
总线113表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器、外围总线、处理器或者使用多种总线结构中的任意总线结构的局域总线。
存储器112可以包括易失性存储器形式的可读介质,例如随机存取存储器(RAM)1121和/或高速缓存存储器1122,还可以进一步包括只读存储器(ROM)1123。
存储器112还可以包括具有一组(至少一个)程序模块1124的程序/实用工具1125,这样的程序模块1124包括但不限于:操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。
电子设备110也可以与一个或多个外部设备114(例如键盘、指向设备等)通信,还可与一个或者多个使得用户能与电子设备110交互的设备通信,和/或与使得该电子设备110能与一个或多个其它电子设备进行通信的任何设备(例如路由器、调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口115进行。并且,电子设备110还可以通过网络适配器116与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器116通过总线113与用于电子设备110的其它模块通信。应当理解,尽管图中未示出,可以结合电子设备110使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理器、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
在示例性实施例中,还提供了一种包括指令的计算机可读存储介质,例如包括指令的存储器112,上述指令可由处理器111执行以完成上述对比学习方法。可选地,存储介质可以是非临时性计算机可读存储介质,例如,所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
在示例性实施例中,还提供一种计算机程序产品,当计算机程序产品被电子设备执行时,电子设备能够实现本申请提供的任一示例性方法。
并且,计算机程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以是但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、RAM、ROM、可擦式可编程只读存储器(Erasable Programmable Read-Only Memory,EPROM)、闪存、光纤、光盘只读存储器(Compact Disk Read Only Memory,CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
本申请实施例中用于图像处理的方法的程序产品可以采用CD-ROM并包括程序代码,并可以在计算设备上运行。然而,本申请的程序产品不限于此,在本文件中,可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。可读信号介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、有线、光缆、射频(Radio Frequency,RF)等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言的任意组合来编写用于执行本申请操作的程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、C++等,还包括常规的过程式程序设计语言诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络如局域网(Local AreaNetwork,LAN)或广域网(Wide Area Network,WAN)连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。
应当注意,尽管在上文详细描述中提及了装置的若干单元或子单元,但是这种划分仅仅是示例性的并非强制性的。实际上,根据本申请的实施方式,上文描述的两个或更多单元的特征和功能可以在一个单元中具体化。反之,上文描述的一个单元的特征和功能可以进一步划分为由多个单元来具体化。
此外,尽管在附图中以特定顺序描述了本申请方法的操作,但是,这并非要求或者暗示必须按照该特定顺序来执行这些操作,或是必须执行全部所示的操作才能实现期望的结果。附加地或备选地,可以省略某些步骤,将多个步骤合并为一个步骤执行,和/或将一个步骤分解为多个步骤执行。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、装置(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本申请的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本申请范围的所有变更和修改。
显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样,倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。
Claims (16)
1.一种图像处理方法,其特征在于,包括:
按照N个频域段将待处理图像进行划分,得到所述N个频域段中每个频域段包含的子频域图像,N为大于1的正整数;
根据频域段与滤波神经网络模型的对应关系,将所述每个频域段包含的子频域图像输入对应的滤波神经网络模型;
根据所述N个频域段分别对应的滤波神经网络模型输出的滤波图像,得到目标图像。
2.如权利要求1所述的方法,其特征在于,所述待处理图像为空域图像,所述按照N个频域段将待处理图像进行划分,得到所述N个频域段中每个频域段包含的子频域图像,包括:
将所述空域图像进行频域转换,得到对应的频域图像;
按照所述N个频域段将进行频域转换后的空域图像进行划分,得到所述N个频域段中每个频域段包含的子频域图像。
3.如权利要求2所述的方法,其特征在于,所述按照N个频域段将待处理图像进行划分之前,还包括:
将针对所述待处理图像进行多个频域段划分的预设频域段数量确定为所述N;或,
基于所述待处理图像的像素,确定所述N。
4.如权利要求1所述的方法,其特征在于,所述将所述每个频域段包含的子频域图像输入对应的滤波神经网络模型,包括:
当一个频域段包括多个子频域图像时,将所述多个子频域图像分别输入对应的滤波神经网络模型,得到所述滤波神经网络模型输出的所述多个子频域图像分别对应的滤波图像。
5.如权利要求1所述的方法,其特征在于,所述将所述每个频域段包含的子频域图像输入对应的滤波神经网络模型,包括:
当一个频域段包括多个子频域图像时,将所述多个子频域图像拼接成一个三维的张量,将所述张量输入对应的滤波神经网络模型,得到所述滤波神经网络模型输出的所述张量对应的滤波图像。
6.如权利要求4或5所述的方法,其特征在于,所述根据所述N个频域段分别对应的滤波神经网络模型输出的滤波图像,得到目标图像,包括:
将所述N个频域段分别对应的滤波神经网络模型输出的滤波图像进行融合,以及进行频域到空域的转换,得到所述目标图像。
7.如权利要求6所述的方法,其特征在于,所述将所述N个频域段分别对应的滤波神经网络模型输出的滤波图像进行融合,以及进行频域到空域的转换,得到所述目标图像,包括:
将所述N个频域段分别对应的滤波神经网络模型输出的滤波图像进行融合,得到融合图像;将所述融合图像输入用于进行频域到空域转换的神经网络模型,得到所述目标图像;或,
将所述N个频域段分别对应的滤波神经网络模型输出的滤波图像进行融合,得到融合图像;将所述融合图像通过频域到空域的反变换,得到所述目标图像。
8.如权利要求6所述的方法,其特征在于,所述将所述N个频域段分别对应的滤波神经网络模型输出的滤波图像进行融合,以及进行频域到空域的转换,得到所述目标图像,包括:
将所述N个频域段分别对应的滤波神经网络模型输出的滤波图像按照分配的权重值,进行加权融合得到融合图像,以及将所述融合图像进行频域到空域的转换,得到所述目标图像;或者,
将所述N个频域段分别对应的滤波神经网络模型输出的滤波图像进行频域到空域的转换,得到对应的空域图片,按照分配的权重值,对所述空域图片进行加权融合,得到所述目标图像;或者,
将所述N个频域段分别对应的滤波神经网络模型输出的滤波图像,输入用于进行频域到空域的转换以及融合的神经网络模型,得到所述目标图像。
9.如权利要求1所述的方法,其特征在于,所述根据所述N个频域段分别对应的滤波神经网络模型输出的滤波图像,得到目标图像之后,所述方法还包括:
根据所述目标图像和所述待处理图像确定第一失真代价;
在所述第一失真代价满足失真代价条件时,将所述目标图像作为所述待处理图像进行图像处理的最终结果。
10.如权利要求9所述的方法,其特征在于,所述方法还包括:
基于预设图像处理方式对所述待处理图像进行图像处理,得到参考目标图像;并基于所述参考目标图像和所述待处理图像确定第二失真代价;
所述在所述第一失真代价满足失真代价条件时,将所述目标图像作为所述待处理图像进行图像处理的最终结果,包括:
响应于所述第一失真代价小于所述第二失真代价,将所述目标图像作为所述待处理图像进行图像处理的最终结果。
11.如权利要求1所述的方法,其特征在于,所述待处理图像为视频进行编码或者解码过程中的一个视频帧对应的图像。
12.一种图像处理装置,其特征在于,包括:
划分模块,用于按照N个频域段将待处理图像进行划分,得到所述N个频域段中每个频域段包含的子频域图像,N为大于1的正整数;
处理模块,用于根据频域段与滤波神经网络模型的对应关系,将所述每个频域段包含的子频域图像输入对应的滤波神经网络模型;根据所述N个频域段分别对应的滤波神经网络模型输出的滤波图像,得到目标图像。
13.一种视频编码装置,其特征在于,包括:
处理模块,用于将编码过程中待处理的视频帧对应的图像发送给图像处理装置,以使所述图像处理装置按照N个频域段将所述图像进行划分,得到所述N个频域段中每个频域段包含的子频域图像;
收发模块,用于接收来自所述图像处理装置发送的所述目标图像。
14.一种视频解码装置,其特征在于,包括:
处理模块,用于将解码过程中待处理的视频帧对应的图像发送给图像处理装置,以使所述图像处理装置按照N个频域段将所述图像进行划分,得到所述N个频域段中每个频域段包含的子频域图像;
收发模块,用于接收来自所述图像处理装置发送的所述目标图像。
15.一种电子设备,其特征在于,包括:至少一个处理器,以及与所述至少一个处理器通信连接的存储器,其中:
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如权利要求1-11中任一项所述的方法。
16.一种计算机可读存储介质,所述计算机可读存储介质内存储有计算机程序,其特征在于:所述计算机程序被处理器执行时,实现权利要求1~11中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210623389.XA CN114897746A (zh) | 2022-06-01 | 2022-06-01 | 图像处理方法、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210623389.XA CN114897746A (zh) | 2022-06-01 | 2022-06-01 | 图像处理方法、设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114897746A true CN114897746A (zh) | 2022-08-12 |
Family
ID=82725672
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210623389.XA Pending CN114897746A (zh) | 2022-06-01 | 2022-06-01 | 图像处理方法、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114897746A (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20130156345A1 (en) * | 2010-08-06 | 2013-06-20 | Dmitry Valerievich Shmunk | Method for producing super-resolution images and nonlinear digital filter for implementing same |
CN110363763A (zh) * | 2019-07-23 | 2019-10-22 | 上饶师范学院 | 图像质量评价方法、装置、电子设备及可读存储介质 |
CN110443775A (zh) * | 2019-06-20 | 2019-11-12 | 吉林大学 | 基于卷积神经网络的离散小波变换域多聚焦图像融合方法 |
CN113256536A (zh) * | 2021-06-18 | 2021-08-13 | 之江实验室 | 一种基于小波分析的超高维数据重建深度学习方法 |
CN114418879A (zh) * | 2022-01-13 | 2022-04-29 | 上海闻泰信息技术有限公司 | 图像处理方法、装置、电子设备及存储介质 |
-
2022
- 2022-06-01 CN CN202210623389.XA patent/CN114897746A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20130156345A1 (en) * | 2010-08-06 | 2013-06-20 | Dmitry Valerievich Shmunk | Method for producing super-resolution images and nonlinear digital filter for implementing same |
CN110443775A (zh) * | 2019-06-20 | 2019-11-12 | 吉林大学 | 基于卷积神经网络的离散小波变换域多聚焦图像融合方法 |
CN110363763A (zh) * | 2019-07-23 | 2019-10-22 | 上饶师范学院 | 图像质量评价方法、装置、电子设备及可读存储介质 |
CN113256536A (zh) * | 2021-06-18 | 2021-08-13 | 之江实验室 | 一种基于小波分析的超高维数据重建深度学习方法 |
CN114418879A (zh) * | 2022-01-13 | 2022-04-29 | 上海闻泰信息技术有限公司 | 图像处理方法、装置、电子设备及存储介质 |
Non-Patent Citations (3)
Title |
---|
SANGWOOK BAEK等: ""Single Image Super-Resolution Using Frequency-Dependent Convolutional Neural Networks"", 《2020 IEEE INTERNATIONAL CONFERENCE ON INDUSTRIAL TECHNOLOGY (ICIT)》, 28 February 2020 (2020-02-28) * |
杨勇;万伟国;黄淑英;姚丽;: "稀疏表示和非下采样Shearlet变换相结合的多聚焦图像融合", 小型微型计算机系统, no. 02, 15 February 2017 (2017-02-15) * |
程正达: ""多聚焦图像的增强学习融合方法研究"", 《硕士电子期刊-信息科技》, 15 September 2018 (2018-09-15) * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11645735B2 (en) | Method and apparatus for processing image, device and computer readable storage medium | |
US20200260117A1 (en) | Methods and Apparatuses for Coding and Decoding Depth Map | |
US11212540B2 (en) | Video data processing system | |
CN111105375A (zh) | 图像生成方法及其模型训练方法、装置及电子设备 | |
CN103260021A (zh) | 一种视频解码方法和装置 | |
CN116506622B (zh) | 模型训练方法及视频编码参数优化方法和装置 | |
CN110489193A (zh) | 智能设备的界面控制方法、装置和存储介质 | |
CN110830808A (zh) | 一种视频帧重构方法、装置及终端设备 | |
CN1819624B (zh) | 进行数据处理的设备和方法 | |
CN113344214B (zh) | 数据处理模型的训练方法、装置、电子设备及存储介质 | |
CN114897746A (zh) | 图像处理方法、设备及存储介质 | |
US20240283930A1 (en) | Systems and methods for video encoding using image segmentation | |
CN112399177B (zh) | 一种视频编码方法、装置、计算机设备及存储介质 | |
CN114143540A (zh) | 视频编码方法及装置、视频解码方法及装置、电子设备 | |
CN116366852B (zh) | 面向机器视觉任务的视频编解码方法、装置、设备及介质 | |
CN113744744B (zh) | 一种音频编码方法、装置、电子设备及存储介质 | |
CN117459719A (zh) | 一种参考帧选择方法、装置、电子设备和存储介质 | |
CN112699812B (zh) | 人体模型运动特征提取方法、装置、电子设备及存储介质 | |
CN116385267B (zh) | 图像处理方法、装置、程序产品、计算机设备和存储介质 | |
CN115190295B (zh) | 视频帧处理方法、装置、设备及存储介质 | |
CN116996695B (zh) | 一种全景图像压缩方法、装置、设备及介质 | |
CN104363452B (zh) | 一种视频块划分方法及系统 | |
WO2025059287A1 (en) | Systems and methods for content adaptive multi-scale feature layer filtering | |
CN110930292B (zh) | 一种图像处理的方法、装置、计算机存储介质及终端 | |
CN112183754A (zh) | 稀少内容的分级深度学习模型检测方法、装置、计算机设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |