CN112053285B - 图像处理方法、装置、计算机设备及存储介质 - Google Patents
图像处理方法、装置、计算机设备及存储介质 Download PDFInfo
- Publication number
- CN112053285B CN112053285B CN202010905635.1A CN202010905635A CN112053285B CN 112053285 B CN112053285 B CN 112053285B CN 202010905635 A CN202010905635 A CN 202010905635A CN 112053285 B CN112053285 B CN 112053285B
- Authority
- CN
- China
- Prior art keywords
- image
- residual
- processed
- information
- convolution
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000003672 processing method Methods 0.000 title claims abstract description 20
- 238000012545 processing Methods 0.000 claims abstract description 61
- 238000000034 method Methods 0.000 claims description 41
- 230000008569 process Effects 0.000 claims description 22
- 208000037170 Delayed Emergence from Anesthesia Diseases 0.000 claims description 21
- 238000004422 calculation algorithm Methods 0.000 claims description 16
- 238000011176 pooling Methods 0.000 claims description 15
- 230000009467 reduction Effects 0.000 claims description 14
- 238000004590 computer program Methods 0.000 claims description 10
- 238000010586 diagram Methods 0.000 claims description 9
- 238000001914 filtration Methods 0.000 claims description 8
- 230000017105 transposition Effects 0.000 claims description 8
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 claims description 7
- 230000002146 bilateral effect Effects 0.000 claims description 7
- 238000000605 extraction Methods 0.000 claims description 7
- 230000005540 biological transmission Effects 0.000 claims description 6
- 238000013507 mapping Methods 0.000 claims description 6
- 238000013473 artificial intelligence Methods 0.000 abstract 1
- 230000006870 function Effects 0.000 description 7
- 238000004364 calculation method Methods 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 5
- 238000013139 quantization Methods 0.000 description 4
- 230000004913 activation Effects 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 2
- 230000004927 fusion Effects 0.000 description 2
- 230000010365 information processing Effects 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 238000012544 monitoring process Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000011218 segmentation Effects 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 238000012549 training Methods 0.000 description 2
- 230000000007 visual effect Effects 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 230000003213 activating effect Effects 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 239000006185 dispersion Substances 0.000 description 1
- 238000003709 image segmentation Methods 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 230000005055 memory storage Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/40—Scaling of whole images or parts thereof, e.g. expanding or contracting
- G06T3/4053—Scaling of whole images or parts thereof, e.g. expanding or contracting based on super-resolution, i.e. the output image resolution being higher than the sensor resolution
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/70—Denoising; Smoothing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T9/00—Image coding
- G06T9/002—Image coding using neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20084—Artificial neural networks [ANN]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20112—Image segmentation details
- G06T2207/20132—Image cropping
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20172—Image enhancement details
- G06T2207/20192—Edge enhancement; Edge preservation
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Multimedia (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Image Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
本发明涉及人工智能领域,提供一种图像处理方法、装置、计算机设备及存储介质,包括获取待处理图像,采用残差编码器对待处理图像进行处理,获取残差图像信息,采用图像编码器将待处理图像转换为编码图像信息,采用图像解码器根据残差图像信息和编码图像信息进行解码,获取目标图像。本发明提供的图像处理方法、装置、计算机设备及存储介质在获取待处理图像后,将待处理图像分别由残差编码器处理和图像编码器处理,生成残差图像信息和编码图像信息,通过残差编码器处理能够保留待处理图像更多的纹理特征,从而丰富图像的特征,在图像解码器解码后生成更高分辨率的目标图像,提高了目标图像质量。
Description
技术领域
本发明涉及数据处理技术领域,尤其涉及一种图像处理方法、装置、计算机设备及存储介质。
背景技术
随着数字化的发展,对于图像分辨率的要求也在提高,如现有的超分辨率技术(Super-Resolution,SR)能够从观测到的低分辨率图像重建出相应的高分辨率图像,在监控设备、卫星图像和医学影像等领域都有重要的应用价值。其中基于深度学习的超分辨率技术主要是基于单张低分辨率图像的重建方法,即(Single Image Super-Resolution,SISR),现在的超分辨率技术往往在图像处理过程中存在误差等,低分辨率图像转换成高分辨率图像时容易出现质量不高的问题。因此如何更高质量的高分辨率图像成为本领域技术人员亟待解决的问题。
发明内容
本发明的目的在于提供一种图像处理方法、装置、计算机设备及存储介质,以解决上述现有技术中的低分辨率图像转换成高分辨率图像时质量差的问题。
为了实现上述目的,本发明提供一种图像处理方法,包括:
获取待处理图像;
采用残差编码器对所述待处理图像进行处理,获取残差图像信息;
采用图像编码器将所述待处理图像转换为编码图像信息;
采用图像解码器根据所述残差图像信息和所述编码图像信息进行解码,获取目标图像。
进一步的,所述采用残差编码器对所述待处理图像进行处理,获取残差图像信息,包括:
获取所述待处理图像的像素值,将预设图像的像素值与所述待处理图像的像素值相减,以获取所述残差图像数据;
采用所述残差编码器对所述残差图像数据进行编码,以得到所述残差图像信息。
进一步的,所述采用图像编码器将所述待处理图像转换为编码图像信息,包括;
所述图像编码器对所述待处理图像进行特征提取,以得到图像特征,将所述图像特征转换成编码图像信息。
进一步的,执行所述采用图像解码器根据所述残差图像信息和所述编码图像信息进行解码,获取目标图像之前,还可包括:
采用双边滤波算法对所述编码图像信息进行降噪处理。
进一步的,所述采用图像解码器根据所述残差图像信息和所述编码图像信息进行解码,获取目标图像,包括:
所述图像解码器将所述残差图像信息和所述编码图像信息中相应的信息进行合并,依次进行熵解码和反量化处理以获取所述目标图像。
进一步的,所述获取待处理图像之后还包括:
对所述待处理图像进行裁剪,将裁剪的所述待处理图像采用Adam算法进行降噪处理,得到经降噪后的所述待处理图像。
为了实现上述目的,本发明提供一种图像处理装置,包括获取模块、残差编码模块、图像编码模块和解码模块,所述获取模块用于获取待处理图像,所述残差编码模块用于采用残差编码器对所述待处理图像进行处理,获取残差图像信息,图像编码模块用于采用图像编码器将所述待处理图像转换为编码图像信息,解码模块用于采用图像解码器根据所述残差图像信息和所述编码图像信息进行解码,获取目标图像。
进一步的,所述残差编码模块获取所述待处理图像的像素值,将预设图像的像素值与所述待处理图像的像素值相减,以获取所述残差图像数据,采用所述残差编码器对所述残差图像数据进行编码,以得到所述残差图像信息。
为了实现上述目的,本发明还提供一种计算机设备,所述计算机设备包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现前述方法的步骤。
为了实现上述目的,本发明还提供一种计算机可读存储介质,存储介质上存储有计算机程序,所述存储介质存储的所述计算机程序被处理器执行时实现前述方法的步骤。
本发明提供的图像处理方法、装置、计算机设备及存储介质在获取待处理图像后,将待处理图像分别由残差编码器处理和图像编码器处理,生成残差图像信息和编码图像信息,通过残差编码器处理能够保留待处理图像更多的纹理特征,从而丰富图像的特征,在图像解码器解码后生成更高分辨率的目标图像,由于通过残差编码器处理对图像特征保留,提高了输出的目标图像的质量。
附图说明
图1为本发明的图像处理方法一个实施例的流程框图;
图2为本发明的图像处理方法一个实施例的示意图;
图3为本发明的图像处理装置一个实施例的结构框图;
图4为本发明计算机设备的一个实施例的硬件架构图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明提供的图像处理方法、装置、计算机设备及存储介质,适用于智慧医疗领域。本发明在获取待处理图像后对其由残差编码器处理获取残差图像信息,通过残差图像信息可更好的留图像处理后的纹理特征,并对该待处理图像由图像编码器转换为编码图像数据,通过两个不同的编码分别对待处理图像进行处理,丰富图像信息的特征,由于具有更多的特征,从而能更佳的生成高分辨率的目标图像,提高了图像处理的质量。
实施例一
参阅图1和图2,示出了本实施例的一种图像处理方法,包括如下步骤:
步骤S1.获取待处理图像;
待处理图像可为较低分辨率的图像,待处理图像可为三通道RGB图像,可采用三通道RGB提取待处理图像的图像数据,如采用640×480分辨率的图像作为待处理图像,可选取现有的任意图像作为待处理图像,待处理图像中的每个像素点可以用三个值表示,因此待处理图像也可称为三通道图片,RGB色彩模式是工业界的一种颜色标准,是通过对红(R)、绿(G)、蓝(B)三个颜色通道的变化以及它们相互之间的叠加来得到各式各样的颜色的,RGB即是代表红、绿、蓝三个通道的颜色。
步骤S2.采用残差编码器对所述待处理图像进行处理,获取残差图像信息;
通过残差编码器在计算中添加残差细节,具体的,包括:获取待处理图像的像素值,每个像素值为表示对应像素点的数据参数,一张图像可由其所有的像素值组成,将预设图像的像素值与待处理图像的像素值相减,预设图像通常指期望或理想的图像数据,以获取残差图像数据,残差图像数据中包含有残差细节,采用残差编码器对残差图像数据进行编码,以得到残差图像信息。通过残差编码器处理能够保留待处理图像更多的纹理特征,从而丰富图像的特征,在图像解码器解码后生成更高分辨率的目标图像。
在本实施例中,残差编码器进行残差编码可包括:将待处理图像进行多次卷积处理,采用3×3卷积核;在每次卷积处理时,添加待处理图像的残差值。通过多次卷积对待处理图像进行图像特征的提取,残差编码器进行残差编码时,对每两层(数据处理)的数据之间增加一个捷径,每一层表示为某个层级或梯度上的多个数据处理过程,构成一个残差块,残差编码通过加入shortcut connections(短连接),从而更加容易被优化,对于包含一个shortcut connection的几层网络(数据处理)被称为一个残差块(residual block),如用x表示输入,F(x)表示残差块在第二层激活函数之前的输出,F(x)=W2σ(W1x),其中,W1表示第一层的权重,W2表示第二层(即每次卷积处理前后)的权重,σ表示ReLU激活函数。最后残差块的输出是σ(F(x)+x)。当没有shortcut connection时,残差块就是一个普通的两层网络。残差块中的网络可以是全连接层,也可以是卷积层。
假设第二层网络在激活函数之前的输出H(x)。如果在该两层网络中,最优的输出就是输入x,那么对于没有shortcut connection的网络,就需要将其优化成H(x)=x;对于有shortcut connection的网络,即残差块结构,如果最优输出是x,则只需要将F(x)=H(x)-x优化为0即可。多个残差块连接在一起构成一个残差网络,每次卷积处理的下采样之前的输出特征图都会拼接到对应通道的解码器的输入特征图上,实现多个层级的信息传递。
可对残差块做计算优化,将高维的卷积层结构替换为低维的卷积层结构,可将两个3×3的卷积层替换为(1×1,3×3,1×1)的卷积层,然后在另一个1×1的卷积层下做还原,同理可应用于其它维度的降维处理,既保持了精度又减少了计算量,降低了计算的成本。残差网络可经过一串的训练,分成了一个个的残差块去训练,让每一个残差块的误差最小,最终达到整体误差最小的目的,从而就不会出现梯度弥散现象了。
为了对特征进行压缩,简化计算的复杂程度,在进行卷积处理后对待处理图像进行池化处理,池化处理包括平均池化和最大池化。池化能够进行一步提取出更高价的特征,通过池化处理忽略掉一些细节信息达到降采样,从而压缩了图像处理的计算量,平均池化能够更好的保留突出的背景特征,最大池化能够更好的保留突出的纹理特征。最大池化是在一个象限内提取到某个特征,它都会保留在最大化的池化输出里,保留其最大值;平均池化是在一个象限内将提取的值求取平均值,这样就保证池化前后的梯度之和保持不变。
步骤S3.采用图像编码器将所述待处理图像转换为编码图像信息;
在本实施例中,将待处理图像转换为编码图像信息包括:将待处理图像进行特征提取,可以采用卷积处理方式,以得到图像特征,通过卷积实现特征提取,然后将所述图像特征转换为编码图像信息。
在具体的实施过程中,卷积处理包括多个卷积层,也就是进行多次卷积计算,采用3×3卷积核,通过卷积逐渐提取待处理图像的特征。如输入图像是572×572×1的图像,经过(3×3卷积核)卷积后,转变为570×570×64。每次卷积处理生成很多小块的特征图或特征,这些图像特征会保留了输入图像中像素之间的关系。
步骤S4.采用图像解码器根据所述残差图像信息和所述编码图像信息进行解码,获取目标图像。
为了提高图像质量,在获取目标图像之前还包括:采用双边滤波算法对所述编码图像信息进行降噪处理,双边滤波(Bilateral filter)算法对低质量全分辨率图像进行增强处理,以便达到去除图像颗粒噪声,保持图像边缘、细节纹理的目的,而人眼视觉注意机制对于这些边缘纹理等信息比较敏感,采用双边滤波算法增强后可提高图像的主观视觉质量。双边滤波算法是经典的滤波增强算法,是一种非线性的滤波方法,是结合图像的空间邻近度和像素值相似度的一种折衷处理,同时考虑空域信息和灰度相似性,达到保边去噪的目的,具有简单、非迭代、局部的特点。
具体的,获取目标图像时,图像解码器将残差图像信息与编码图像信息中相应的信息进行合并,相应的信息包括对应的图像特征,图像特征可包括颜色特征、纹理特征、形状特征、空间关系特征等,合并包括使图像数据在图像特征上的整合(融合),生成合并信息,然后将合并信息可通过转置卷积(反卷积),将同一特征的图像数据在对应通道上进行解码。在合并后信息数据依次进行熵解码和反量化以获取所述目标图像,进一步的对信息数据进行优化,提高信息处理的质量。熵编码就是根据图像信息中不同图像数据出现的概率,用不同长度的编码来表示不同字符,对于出现概率越高的图像数据,则用越短的编码表示,对于出现概率低的图像数据,可以用比较长的编码表示,从而提高编码的效率以及减少存储需要,具体的可采用如哈夫曼编码来实现。反量化基于离散余弦变换(DCT,DiscreteCosine Transform)变换后的临时结果,除以各自量化步长并四舍五入后取整,可得到量化系数,通过形成的量化矩阵进行整数的离散余弦变换变换,使得数据信息处理高效且准确,而且减少了相应的矩阵运算。
通过转置卷积解码生成目标图像,可利用连续的卷积池化层提取图像中的特征信息,并逐步将图像特征信息映射至高维,在整个网络的最高维是整个图像中丰富的特征信息,映射的过程中为了增强分割的精度,会将同维度下收缩网络中与其维度相同的图像进行合并,由于在合并的过程中维度会变成原维度的倍数,此时需要再次卷积进行降维,保证处理过后的维度与合并操作之前的维度相同,以便于进行再一次的转置卷积后能够和同维度下的图像进行二次合并,抓取不同层次的特征,将它们通过特征合并的方式整合,直到最终能够与原图像的维度相同时输出图像,如将3通道RGB的低分辨率的待处理图像输出成3通道RGB的高分辨率的目标图像。
本实施例在进行编码时采用收缩路径,可以采用卷积网络结构组成,包括重复多次的3×3卷积的使用,每次采样可使特征通道数加倍,分别采用残差编码器和图像编码器这两种方式分别进行编码;在解码时采用扩展路径,可采用转置卷积进行扩展,特征通道数减少,最后将每个像素对应的分量特征向量映射到期望数量的类,生成目标图像。
编码时残差编码器和图像编码器的通道数可分别是32、64、128、256、512,解码时图像解码器的通道数可分别是256、128、64、32、12,编码和解码均可采用3×3卷积,编码的下采样使用2×2最大池化,解码的上采样使用2×2转置卷积。残差编码器和图像编码器这两部分的卷积会根据对应的图像特征合并在一起,输入解码器。并且残差编码器的每次下采样之前的输出特征信息,都会合并在对应通道的图像解码器的输入特征信息上,实现多个层级的信息传递,解码的过程都与对应的图像特征提取部分进行合并,合并前可根据需要进行剪切。
为了进一步的优化图像,在执行完步骤S1以后还可包括:对所述待处理图像进行裁剪,将裁剪的所述待处理图像采用Adam算法进行降噪处理,以得到经降噪后的所述待处理图像。
采用Adam算法对待处理图像进行优化降噪,作为举例而非限定,参数配置为:β1=0.9、β2=0.999、E=1e-8,学习速率为1e-4,200epoch后衰减,衰减系数为0.5,其中β1为指数衰减率,称之为一阶矩,β2用来计算平方数的指数加权平均数,称之为二阶矩,E为自然常数。通过计算梯度的一阶矩估计和二阶矩估计而为不同的参数设计独立的自适应性学习率,在具体的方案中可在第400个epoch停止训练。训练图像可使用高分辨率-低分辨率图像对,如现在图像的分辨率为1024×2048,可裁剪成256×256的补丁进行训练,从而对原始图像进行增强。Adam算法是一种对随机目标函数执行一阶梯度优化的算法,该算法基于适应性低阶矩估计,具有很高的计算效率和较低的内存需求,该算法适用于解决大噪声和稀疏梯度的非稳态(non-stationary)问题。
通过上述图像处理能够降低显存和计算量,使得占内存也变小,运算量也少了,使同样3*3的卷积能在更大的图像范围上进行特征提取,同时有利于图像的分割拼接处理,通过不同的编码方式,可以很方便进行多尺度特征的融合。本实施例能够增大特征提取并实现多尺度特征融合,保证各尺度信息变换充分。
本实施例可在UNet架构的基础上将编码处理分成两部分,通过残差编码器计算要添加的残差细节,通过图像编码器对图像内容进行编码处理,通过残差编码增强了原始图像,从而可将低分辨率的待处理图像生成高分辨率的目标图像,通过拆分编码过程,实现多个层级的信息传递,在同一层级时会具有更少的参数设置,提高图像处理的能力与效率。本实施例通过将原始编码器分成两个子编码器来增加参数大小,因此性能也得到了提高,增量参数的大小和推断时间远不及UNet架构每层宽度的两倍,但是性能的提高更多,并实现高质量图像的生成。
实施例二
参阅图3,示出了本发明一种图像处理装置10,包括获取模块11、残差编码模块12、图像编码模块13和解码模块14,所述获取模块11用于获取待处理图像,所述残差编码模块12用于采用残差编码器对所述待处理图像进行处理,获取残差图像信息,所述图像编码模块13用于采用图像编码器将所述待处理图像转换为编码图像信息,所述解码模块14用于采用图像解码器根据所述残差图像信息和所述编码图像信息进行解码,获取目标图像。
在本实施例中,获取模块11进行图像获取,在图像采集后得到待处理图像,待处理图像包含其所具有图像数据信息,残差编码模块12中由残差编码器进行残差编码,在残差编码器中实现残差细节的添加,获取残差图像信息,并由图像编码模块13将待处理图像转换为编码图像信息,在解码模块14中采用图像解码器根据所述残差图像信息和所述编码图像信息进行解码,解码生成目标图像。
在残差编码模块12通过残差编码器在计算中添加残差细节,具体的,包括:获取待处理图像的像素值,每个像素值为表示对应像素点的数据参数,一张图像可由其所有的像素值组成,将预设图像的像素值与待处理图像的像素值相减,预设图像通常指期望或理想的图像数据,以获取残差图像数据,残差图像数据中包含有残差细节,采用残差编码器对残差图像数据进行编码,以得到残差图像信息。
进行编码时,可将待处理图像进行多次卷积处理,采用3×3卷积核,通过卷积处理可提取出图像特征,编码模块12包括进行残差编码的残差编码器在残差编码时添加残差细节,通过残差函数F(x)=H(x)–x实现残差细节的添加,能更好的保留图像处理后的纹理特征。假定某个图像数据的输入是x,期望输出是H(x),即H(x)是期望的映射,在残差编码中,通过shortcut connections的方式,直接把输入x传到输出作为初始结果,输出结果为H(x)=F(x)+x,当F(x)=0时,那么H(x)=x,也就是恒等映射。残差编码是目标值H(X)和x的差值,也就是所谓的残差F(x)=H(x)-x,就是要将残差结果逼近于0,保证准确率不下降。
解码模块14将残差图像信息与编码图像信息中相应的信息进行合并,如根据对应的图像特征,图像特征可包括颜色特征、纹理特征、形状特征、空间关系特征等,合并是指图像数据在图像特征上的整合(融合),生成合并信息,然后将合并信息通过转置卷积(反卷积)获取目标图像,将同一特征的图像数据在对应通道上进行解码,最终还原成目标图像。
解码模块14的解码生成目标图像通过转置卷积,可利用连续的卷积池化层提取图像中的特征信息,并逐步将图像特征信息映射至高维,在整个网络的最高维是整个图像中丰富的特征信息,映射的过程中为了增强分割的精度,会将同维度下收缩网络中与其维度相同的图像进行合并,由于在合并的过程中维度会变成原维度的倍数,此时需要再次卷积进行降维,保证处理过后的维度与合并操作之前的维度相同,以便于进行再一次的转置卷积后能够和同维度下的图像进行二次合并,抓取不同层次的特征,将它们通过特征合并的方式整合,直到最终能够与原图像的维度相同时输出图像,如将3通道RGB的低分辨率的待处理图像输出成3通道RGB的高分辨率的目标图像。
为了进一步的优化图像,本实施例还可包括降噪模块,降噪模块对所述待处理图像进行裁剪,将裁剪的所述待处理图像采用Adam算法进行降噪处理,以得到经降噪后的所述待处理图像。采用Adam算法对待处理图像进行优化降噪,参数配置为:β1=0.9、β2=0.999、E=1e-8,学习速率为1e-4,200epoch后衰减,衰减系数为0.5。本方案可应用于智慧医疗的场景中,可将医疗设备拍摄的图像进行图像处理,还可应用于监控设备、卫星图像以及医疗影像等场景中以解决由于各种局限因素而无法得到高分辨率的图像,以便于得到更清楚的图像,从而推动智慧城市的建设。
实施例三
本实施例还提供一种计算机设备20,实施例二的图像处理装置10的组成部分可设置在计算机设备20中,计算机设备20可以是执行程序的智能手机、平板电脑、笔记本电脑、台式计算机、机架式服务器、刀片式服务器、塔式服务器或机柜式服务器(包括独立的服务器,或者多个服务器所组成的服务器集群)等。本实施例的计算机设备20至少包括但不限于:可通过系统总线相互通信连接的存储器21、处理器22以及存储在存储器21上并可在处理器22上运行的计算机程序,如图4所示。需要指出的是,图4仅示出了具有组件21-22的计算机设备20,但是应理解的是,并不要求实施所有示出的组件,可以替代的实施更多或者更少的组件。
本实施例中,存储器21(即可读存储介质)包括闪存、硬盘、多媒体卡、卡型存储器(例如,SD或DX存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘等。在一些实施例中,存储器21可以是计算机设备20的内部存储单元,例如该计算机设备20的硬盘或内存。在另一些实施例中,存储器21也可以是计算机设备20的外部存储设备,例如该计算机设备20上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。当然,存储器21还可以既包括计算机设备20的内部存储单元也包括其外部存储设备。本实施例中,存储器21通常用于存储安装于计算机设备的操作系统和各类应用代码。此外,存储器21还可以用于暂时地存储已经输出或者将要输出的各类数据。
处理器22在一些实施例中可以是中央处理器(Central Processing Unit,CPU)、控制器、微控制器、微处理器、或其他数据处理芯片。该处理器22通常用于控制计算机设备20的总体操作。本实施例中,处理器22用于运行存储器21中存储的程序代码或者处理数据。本实施例中计算机设备20的处理器22执行计算机程序时实现实施例一的图像处理方法。
实施例四
本实施例还提供一种计算机可读存储介质,如闪存、硬盘、多媒体卡、卡型存储器(例如,SD或DX存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘、服务器、App应用商城等等,其上存储有计算机程序,程序被处理器执行时实现相应功能。本实施例计算机可读存储介质存储实施例二的图像处理装置10,被处理器执行时实现实施例一的图像处理方法。
本实施例的计算机可读存储介质用于图像处理装置,该计算机可读存储介质被处理器执行时实现实施例一的图像处理方法。
进一步地,所述计算机可读存储介质可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序等;图像处理方法中的图像数据(如预设图像)可存储于区块链节点中。
本发明所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
本发明可用于众多通用或专用的计算机系统环境或配置中。例如:个人计算机、服务器计算机、手持设备或便携式设备、平板型设备、多处理器系统、基于微处理器的系统、置顶盒、可编程的消费电子设备、网络PC、小型计算机、大型计算机、包括以上任何系统或设备的分布式计算环境等等。本发明可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本发明,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
Claims (10)
1.一种图像处理方法,其特征在于,包括:
获取待处理图像;
采用残差编码器对所述待处理图像进行处理,获取残差图像信息;
采用图像编码器将所述待处理图像转换为编码图像信息;
采用图像解码器根据所述残差图像信息和所述编码图像信息进行解码,获取目标图像;
其中,采用残差编码器进行残差编码包括:将待处理图像进行多次卷积处理,在每次卷积处理时,添加待处理图像的残差值;残差编码通过加入短连接,从而更加容易被优化;包含一个的短连接的几层网络被称为一个残差块,残差块中的网络为全连接层或者卷积层;多个残差块连接在一起构成一个残差网络,每次卷积处理的下采样之前的输出特征图都会拼接到对应通道的解码器的输入特征图上,实现多个层级的信息传递;对残差块做计算优化,将高维的卷积层结构替换为低维的卷积层结构;
获取目标图像时,图像解码器将残差图像信息与编码图像信息中相应的信息进行合并,相应的信息包括对应的图像特征;对于生成的合并信息,通过转置卷积将同一特征的图像数据在对应通道上进行解码;通过转置卷积解码生成目标图像时,利用连续的卷积池化层提取图像中的特征信息,并逐步将射图像特征信息映射至高维;映射的过程会将同维度下收缩网络中与其维度相同的图像进行合并,需要再次卷积进行降维,保证处理过后的维度与合并操作之前的维度相同,以便于进行再一次的转置卷积后能够和同维度下的图像进行二次合并,抓取不同层次的特征,将它们通过特征合并的方式整合,直到最终能够与原图像的维度相同时输出图像。
2.根据权利要求1所述的图像处理方法,其特征在于,所述采用残差编码器对所述待处理图像进行处理,获取残差图像信息,包括:
获取所述待处理图像的像素值,将预设图像的像素值与所述待处理图像的像素值相减,以获取残差图像数据;
采用所述残差编码器对所述残差图像数据进行编码,以得到所述残差图像信息。
3.根据权利要求1所述的图像处理方法,其特征在于,所述采用图像编码器将所述待处理图像转换为编码图像信息,包括:
所述图像编码器对所述待处理图像进行特征提取,以得到图像特征,将所述图像特征转换为编码图像信息。
4.根据权利要求1所述的图像处理方法,其特征在于,执行所述采用图像解码器根据所述残差图像信息和所述编码图像信息进行解码,获取目标图像之前,还包括:
采用双边滤波算法对所述编码图像信息进行降噪处理。
5.根据权利要求1所述的图像处理方法,其特征在于,所述采用图像解码器根据所述残差图像信息和所述编码图像信息进行解码,获取目标图像,包括:
所述图像解码器将所述残差图像信息和所述编码图像信息中相应的信息进行合并,依次进行熵解码和反量化处理以获取所述目标图像。
6.根据权利要求1所述的图像处理方法,其特征在于,所述获取待处理图像之后还包括:
对所述待处理图像进行裁剪,将裁剪的所述待处理图像采用Adam算法进行降噪处理,得到经降噪后的所述待处理图像。
7.一种图像处理装置,其特征在于,包括:
获取模块,用于获取待处理图像;
残差编码模块,用于采用残差编码器对所述待处理图像进行处理,获取残差图像信息;
图像编码模块,用于采用图像编码器将所述待处理图像转换为编码图像信息;
解码模块,用于采用图像解码器根据所述残差图像信息和所述编码图像信息进行解码,获取目标图像;
其中,采用残差编码器进行残差编码包括:将待处理图像进行多次卷积处理,在每次卷积处理时,添加待处理图像的残差值;残差编码通过加入短连接,从而更加容易被优化;包含一个的短连接的几层网络被称为一个残差块,残差块中的网络为全连接层或者卷积层;多个残差块连接在一起构成一个残差网络,每次卷积处理的下采样之前的输出特征图都会拼接到对应通道的解码器的输入特征图上,实现多个层级的信息传递;对残差块做计算优化,将高维的卷积层结构替换为低维的卷积层结构;
获取目标图像时,图像解码器将残差图像信息与编码图像信息中相应的信息进行合并,相应的信息包括对应的图像特征;对于生成的合并信息,通过转置卷积将同一特征的图像数据在对应通道上进行解码;通过转置卷积解码生成目标图像时,利用连续的卷积池化层提取图像中的特征信息,并逐步将射图像特征信息映射至高维;映射的过程会将同维度下收缩网络中与其维度相同的图像进行合并,需要再次卷积进行降维,保证处理过后的维度与合并操作之前的维度相同,以便于进行再一次的转置卷积后能够和同维度下的图像进行二次合并,抓取不同层次的特征,将它们通过特征合并的方式整合,直到最终能够与原图像的维度相同时输出图像。
8.根据权利要求7所述的图像处理装置,其特征在于,所述残差编码模块获取所述待处理图像的像素值,将预设图像的像素值与所述待处理图像的像素值相减,以获取残差图像数据,采用所述残差编码器对所述残差图像数据进行编码,以得到所述残差图像信息。
9.一种计算机设备,所述计算机设备包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至6任一项所述方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述存储介质存储的所述计算机程序被处理器执行时实现权利要求1至6任一项所述方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010905635.1A CN112053285B (zh) | 2020-09-01 | 2020-09-01 | 图像处理方法、装置、计算机设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010905635.1A CN112053285B (zh) | 2020-09-01 | 2020-09-01 | 图像处理方法、装置、计算机设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112053285A CN112053285A (zh) | 2020-12-08 |
CN112053285B true CN112053285B (zh) | 2024-05-31 |
Family
ID=73607692
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010905635.1A Active CN112053285B (zh) | 2020-09-01 | 2020-09-01 | 图像处理方法、装置、计算机设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112053285B (zh) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112686900B (zh) * | 2020-12-31 | 2024-06-18 | 北京医智影科技有限公司 | 用于图像自动处理的方法、装置、电子设备和存储介质 |
CN115379219B (zh) * | 2022-08-18 | 2025-02-18 | 视梵微电子(深圳)有限公司 | 一种图像压缩的方法和装置 |
CN117853345B (zh) * | 2024-03-07 | 2024-05-24 | 吉林大学 | 一种用于中医舌诊舌像成像的图像优化方法及系统 |
CN118509196B (zh) * | 2024-04-30 | 2024-12-03 | 宁夏大学 | 一种基于联盟链的再保险数据安全共享平台及方法 |
CN119445029A (zh) * | 2025-01-08 | 2025-02-14 | 启元实验室 | 重建机器人抓取场景的方法和装置、电子设备 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2013001013A1 (en) * | 2011-06-30 | 2013-01-03 | Canon Kabushiki Kaisha | Method for decoding a scalable video bit-stream, and corresponding decoding device |
KR20170136127A (ko) * | 2016-05-31 | 2017-12-11 | 삼성디스플레이 주식회사 | 영상 부호화 방법 및 영상 복호화 방법 |
CN109547784A (zh) * | 2017-09-21 | 2019-03-29 | 华为技术有限公司 | 一种编码、解码方法及装置 |
CN109767386A (zh) * | 2018-12-22 | 2019-05-17 | 昆明理工大学 | 一种基于深度学习的快速图像超分辨率重建方法 |
CN110335217A (zh) * | 2019-07-10 | 2019-10-15 | 东北大学 | 一种基于3d残差编码解码的医学图像降噪方法 |
WO2020093042A1 (en) * | 2018-11-02 | 2020-05-07 | Deep Lens, Inc. | Neural networks for biomedical image analysis |
CN111343458A (zh) * | 2020-01-15 | 2020-06-26 | 浙江工业大学 | 一种基于重建残差的稀疏灰度图像编解码方法及系统 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7106101B2 (en) * | 2001-05-21 | 2006-09-12 | Microchip Technology Inc. | Functional pathway configuration at a system/IC interface |
WO2019009449A1 (ko) * | 2017-07-06 | 2019-01-10 | 삼성전자 주식회사 | 영상을 부호화/복호화 하는 방법 및 그 장치 |
-
2020
- 2020-09-01 CN CN202010905635.1A patent/CN112053285B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2013001013A1 (en) * | 2011-06-30 | 2013-01-03 | Canon Kabushiki Kaisha | Method for decoding a scalable video bit-stream, and corresponding decoding device |
KR20170136127A (ko) * | 2016-05-31 | 2017-12-11 | 삼성디스플레이 주식회사 | 영상 부호화 방법 및 영상 복호화 방법 |
CN109547784A (zh) * | 2017-09-21 | 2019-03-29 | 华为技术有限公司 | 一种编码、解码方法及装置 |
WO2020093042A1 (en) * | 2018-11-02 | 2020-05-07 | Deep Lens, Inc. | Neural networks for biomedical image analysis |
CN109767386A (zh) * | 2018-12-22 | 2019-05-17 | 昆明理工大学 | 一种基于深度学习的快速图像超分辨率重建方法 |
CN110335217A (zh) * | 2019-07-10 | 2019-10-15 | 东北大学 | 一种基于3d残差编码解码的医学图像降噪方法 |
CN111343458A (zh) * | 2020-01-15 | 2020-06-26 | 浙江工业大学 | 一种基于重建残差的稀疏灰度图像编解码方法及系统 |
Non-Patent Citations (2)
Title |
---|
Learning to Denoise and Decode: A Novel Residual Neural Network Decoder for Polar Codes;Hongfei Zhu等;IEEE Transactions on Vehicular Technology;20200605;第8725 -8738页 * |
基于残差神经网络的图像超分辨率改进算法;王一宁等;计算机应用;20180110;第246-254页 * |
Also Published As
Publication number | Publication date |
---|---|
CN112053285A (zh) | 2020-12-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112053285B (zh) | 图像处理方法、装置、计算机设备及存储介质 | |
Cheng et al. | Energy compaction-based image compression using convolutional autoencoder | |
US10909728B1 (en) | Learned lossy image compression codec | |
CN111868753A (zh) | 使用条件熵模型的数据压缩 | |
US8731315B2 (en) | Image compression and decompression for image matting | |
US11538197B2 (en) | Channel-wise autoregressive entropy models for image compression | |
CN111630570A (zh) | 图像处理方法、设备及计算机可读存储介质 | |
CN114581544A (zh) | 图像压缩方法、计算机设备及计算机存储介质 | |
CN110024391B (zh) | 用于编码和解码数字图像或视频流的方法和装置 | |
CN111696026B (zh) | 基于l0正则项的可逆灰度图算法、计算设备 | |
KR20200050284A (ko) | 영상 적응적 양자화 테이블을 이용한 영상의 부호화 장치 및 방법 | |
US20130129197A1 (en) | Image restoration by vector quantization utilizing visual patterns | |
CN111355965B (zh) | 一种基于深度学习的图像压缩还原方法及装置 | |
US11212527B2 (en) | Entropy-inspired directional filtering for image coding | |
CN113949867B (zh) | 一种图像处理的方法及装置 | |
WO2024250829A1 (zh) | 图像处理方法、装置、设备、存储介质及程序产品 | |
CN113256744B (zh) | 一种图像编码、解码方法及系统 | |
CN113038134B (zh) | 一种图片处理方法、智能终端及存储介质 | |
CN112714313A (zh) | 图像处理方法、装置、设备和存储介质 | |
CN110730347A (zh) | 图像压缩方法、装置及电子设备 | |
CN110944212A (zh) | 一种视频帧重构方法、装置及终端设备 | |
CN113554719B (zh) | 一种图像编码方法、解码方法、存储介质及终端设备 | |
CN114004743A (zh) | 图像重建、编码解码方法、重建模型训练方法、相关装置 | |
Lv et al. | A novel auxiliary data construction scheme for reversible data hiding in JPEG images | |
CN111083500A (zh) | 一种视频帧重构方法、装置及终端设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |