CN118864329B

CN118864329B - 一种基于小波变换的多尺度Transformer-Unet低光图像的增强方法

Info

Publication number: CN118864329B
Application number: CN202410820404.9A
Authority: CN
Inventors: 余小兵; 陆晨阳; 詹天明; 王晨云; 吴华朋; 戴然臣
Original assignee: NANJING AUDIT UNIVERSITY
Current assignee: NANJING AUDIT UNIVERSITY
Priority date: 2024-06-24
Filing date: 2024-06-24
Publication date: 2025-02-18
Anticipated expiration: 2044-06-24
Also published as: CN118864329A

Abstract

本发明公开了一种基于小波变换的多尺度Transformer‑Unet低光图像的增强方法，包括以下步骤：步骤1、给定一个低光图像，使用卷积神经网络对其进行增强处理，提取出低光图像的光照特征F_light、浅层特征F₀、以及梯度特征F_gradient，步骤2、将浅层特征F₀和梯度特征F_gradient作为Transformer‑Unet网络的输入，得到中级增强图像I_PE，步骤3、使用光照特征F_lighe作为光照微调的指导，对中级增强图像I_PE进行光照微调，得到目标曝光图像。本发明克服了卷积神经网络计算的局限性，弥补了Transformer块对低光图像中局部信息的忽视，最终得到正常曝光、细节完善的目标曝光图像，不仅保证了低光图像的细节信息，还实现了低光图像的光照增强，能够适应目标追踪等高层视觉任务的执行。

Description

一种基于小波变换的多尺度Transformer-Unet低光图像的增强方法

技术领域

本发明涉及图像处理技术领域，具体涉及一种基于小波变换的多尺度Transformer-Unet低光图像的增强方法。

背景技术

近年来，科技发展迅速，人工智能技术在各行各业逐步普及，自动驾驶、安防等领域具有广阔的前景，但是在夜间或其他光照不足情况下，所拍摄到的图像往往遭受损害，具有亮度低、对比度差等问题，大大影响目标检测、目标追踪等高层视觉任务的执行性能，因此，需要对低光图像进行光照的矫正；

通常传统的低光图像增强是采用直方图均衡化来调整图像整体的对比度，但是这种方法所能获得提升较少，且由于均衡化后的灰度级减少，部分信息会消失，也会导致图像出现不自然的增强，而基于学习的低光图像增强方法，往往采用卷积神经网络，但是卷积神经网络注重局部特征的提取，对于全局特征的提取效果并不好；

鉴于此，是否能够保证图像细节的同时实现对低光图像的增强以适应高层视觉任务，是亟待解决的问题；

因此，发明一种基于小波变换的多尺度Transformer-Unet低光图像的增强方法来解决上述问题很有必要。

发明内容

本发明的目的是提供一种基于小波变换的多尺度Transformer-Unet低光图像的增强方法，通过充分利用Transformer的全局建模能力和Unet网络所构造的多尺度交互框架，并采用小波变换实现跨特征域的信息交互，克服了卷积神经网络计算的局限性，弥补了Transformer块对低光图像中局部信息的忽视，最终得到正常曝光、细节完善的目标曝光图像，不仅保证了低光图像的细节信息，还实现了低光图像的光照增强，能够适应目标追踪等高层视觉任务的执行，以解决技术中的上述不足之处。

为了实现上述目的，本发明提供如下技术方案：一种基于小波变换的多尺度Transformer-Unet低光图像的增强方法，包括以下步骤：

步骤1、给定一个低光图像，使用卷积神经网络对其进行增强处理，提取出低光图像的光照特征F_light、浅层特征F₀、以及梯度特征F_gradient；

步骤2、将浅层特征F₀和梯度特征F_gradient作为Transformer-Unet网络的输入，得到中级增强图像I_PE；

步骤3、使用光照特征F_light作为光照微调的指导，对中级增强图像I_PE进行光照微调，得到目标曝光图像。

前述的基于小波变换的多尺度Transformer-Unet低光图像的增强方法，在步骤1中，给定一个低光图像，使用卷积神经网络对其进行增强处理，提取出低光图像的光照特征F_light、浅层特征F₀、以及梯度特征F_gradient的具体步骤如下：

1.1、设I_L表示低光图像，利用边缘检测算子提取低光图像I_L的梯度特征F_gradient；

1.2、将低光图像I_L和均值图像I_mean级联，利用卷积神经网络做增强处理，得到初级增强图像I_PL；

1.3、从卷积神经网络中间层提取初级增强图像I_PL的光照特征F_light；

其中，I_L∈I^H×W×3，H为图像I的高度，W为图像I的宽度，C为图像I的通道数；

且I_mean∈I^H×W×1，为I_L三通道求均值获得；

1.4、采用3×3卷积层提取初级增强图像I_PL的浅层特征F₀。

前述的基于小波变换的多尺度Transformer-Unet低光图像的增强方法，在步骤2中，将浅层特征F₀和梯度特征F_gradient作为Transformer-Unet网络的输入，得到中级增强图像I_PE的具体步骤如下：

2.1、对浅层特征F₀使用Transformer块进行RGB域的特征学习，得到中间层特征F₁；

2.2、将中间层特征F₁使用Haar小波分解后转换到小波域，使用梯度特征F_gradient作为指导并与梯度特征F_gradient融合，采用堆叠的多个Transformer块进行特征学习，得到中间层特征F₂；

2.3、使用卷积进行2倍下采样，使用梯度特征F_gradient作为指导与下采样结果进行融合，并采用堆叠的多个Transformer块进行特征学习，得到中间层特征F₃；

2.4、使用卷积进行2倍下采样，使用梯度特征F_gradient作为指导与与下采样结果进行融合，并采用级联的多个Transformer块进行特征学习，得到中间层特征F₄，用作瓶颈层；

2.5、在跳跃连接部分，将中间层特征F₁、中间层特征F₂、中间层特征F₃、中间层特征F₄统一输入到CDSF模块中，获取不同尺度不同域下的特征权重并融合，与解码器阶段输出进行权重相加，得到中级增强图像I_PE。

前述的基于小波变换的多尺度Transformer-Unet低光图像的增强方法，在步骤2.1中，对浅层特征F₀使用Transformer块进行RGB域的特征学习，得到中间层特征F₁，具体公式为：

F′＝LayerNorm(F₀)

F_A＝WSA(F′)+AbSA(F′)

F₀′＝F₀+F_A

F″＝LayerNorm(F′₀)

F₁＝DGFN(F″)+F₀′

其中，LayerNorm(·)为层归一化处理，

WSA(·)为窗口注意力，

AbSA(·)为轴向注意力，

DGFN(·)为带有双门控机制的前馈网络。

前述的基于小波变换的多尺度Transformer-Unet低光图像的增强方法，在步骤2.2中，将中间层特征F₁使用Haar小波分解后转换到小波域，使用梯度特征F_gradient作为指导并与梯度特征F_gradient融合，采用堆叠的多个Transformer块进行特征学习，得到中间层特征F₂，具体公式为：

F_LL,F_LH,F_HL,F_HH＝DWT(F₁)

F₁′＝[F_LL,F_LH,F_HL,F_HH]

F₁″＝DOF(F₁′,F_gradient)

F₂＝WAT(F₁″)

其中，DWT(·)为小波变换，

DOF(·)为利用深度过参数卷积进行特征融合，

WAT(·)为步骤2.1中的计算过程；

F_LL为低频分量，

F_LH为水平方向高频分量，

F_HL为垂直方向高频分量，

F_HH为对角线方向高频分量。

前述的基于小波变换的多尺度Transformer-Unet低光图像的增强方法，在步骤2.3中，使用卷积进行2倍下采样，使用梯度特征F_gradient作为指导与下采样结果进行融合，并采用堆叠的多个Transformer块进行特征学习，得到中间层特征F₃，具体公式为：

F₂′＝Downsampling(F₂)

F₂″＝DOF(F₂′,F_gradient)

F₃＝WAT(F₂″)

其中，Downsampling(·)为卷积进行2倍下采样。

前述的基于小波变换的多尺度Transformer-Unet低光图像的增强方法，在步骤2.4中，使用卷积进行2倍下采样，使用梯度特征F_gradient作为指导与与下采样结果进行融合，并采用级联的多个Transformer块进行特征学习，得到中间层特征F₄，的具体公式为：

F₃′＝Downsampling(F₃)

F₃″＝DOF(F₃′,F_gradient)

F₄＝WAT(F₃″)。

前述的基于小波变换的多尺度Transformer-Unet低光图像的增强方法，在步骤3中，使用光照特征F_light作为光照微调的指导，对中级增强图像I_PE进行光照微调，得到目标曝光图像，具体过程下：

将光照特征F_light和中级增强图像I_PE一并输入到光照调整模块LAM执行对光照的调整，即可得到目标曝光图像。

与现有技术相比，本发明的有益效果是：

本发明通过使用卷积神经网络提取出低光图像的浅层特征、以及梯度特征，进而输入到Transformer-Unet网络中，并以光照特征、作为指导，得到目标曝光图像，充分利用Transformer的全局建模能力和Unet网络所构造的多尺度交互框架，并采用小波变换实现跨特征域的信息交互，克服了卷积神经网络计算的局限性，弥补了Transformer块对低光图像中局部信息的忽视，最终得到正常曝光、细节完善的目标曝光图像，不仅保证了低光图像的细节信息，还实现了低光图像的光照增强，能够适应目标追踪等高层视觉任务的执行。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明中记载的一些实施例，对于本领域普通技术人员来讲，还可以根据这些附图获得其他的附图。

图1是本发明的流程图；

图2是本发明实施例中给定的低光图像；

图3是本发明得到的目标曝光图像；

图4是给定的低光图像的实际曝光图像。

具体实施方式

为了使本领域的技术人员更好地理解本发明的技术方案，下面将结合附图对本发明作进一步的详细介绍。

本发明提供了如图1-4所示的一种基于小波变换的多尺度Transformer-Unet低光图像的增强方法，包括以下步骤：

步骤1、给定一个低光图像，提取出低光图像的光照特征和梯度特征，并使用卷积神经网络对其进行增强处理，得到初级增强图像，提取出初级增强图像的浅层特征，具体步骤如下：

I_mean∈I^H×W×1，为I_L三通道求均值获得；

1.4、采用3×3卷积层提取初级增强图像I_PL的浅层特征F₀；

在本步骤中，通过引入均值图像I_mean，可以将低光图像进行初步增强，实现一定程度上的点亮，方便后序操作。

步骤2、将浅层特征F₀和梯度特征F_gradient作为Transformer-Unet网络的输入，得到中级增强图像I_PE，具体步骤如下：

2.1、对浅层特征F₀使用Transformer块进行RGB域的特征学习，得到中间层特征F₁，具体公式为：

F′＝LayerNorm(F₀)

F_A＝WSA(F′)+AbSA(F′)

F₀′＝F₀+F_A

F″＝LayerNorm(F′₀)

F₁＝DGFN(F″)+F₀′

其中，LayerNorm(·)为层归一化处理，

WSA(·)为窗口注意力，

AbSA(·)为轴向注意力，

DGFN(·)为带有双门控机制的前馈网络；

2.2、将中间层特征F₁使用Haar小波分解后转换到小波域，使用梯度特征F_gradient作为指导并与梯度特征F_gradient融合，采用堆叠的多个Transformer块进行特征学习，得到中间层特征F₂，具体公式为：

F_LL,F_LH,F_HL,F_HH＝DWT(F₁)

F₁′＝[F_LL,F_LH,F_HL,F_HH]

F₁″＝DOF(F₁′,F_gradient)

F₂＝WAT(F₁″)

其中，DWT(·)为小波变换，

DOF(·)为利用深度过参数卷积进行特征融合，

WAT(·)为步骤2.1中的计算过程；

F_LL为低频分量，

F_LH为水平方向高频分量，

F_HL为垂直方向高频分量，

F_HH为对角线方向高频分量；

2.3、使用卷积进行2倍下采样，使用梯度特征F_gradient作为指导与下采样结果进行融合，并采用堆叠的多个Transformer块进行特征学习，得到中间层特征F₃，具体公式为：

F₂′＝Downsampling(F₂)

F₂″＝DOF(F₂′,F_gradient)

F₃＝WAT(F₂″)

其中，Downsampling(·)为卷积进行2倍下采样；

2.4、使用卷积进行2倍下采样，使用梯度特征F_gradient作为指导与与下采样结果进行融合，并采用级联的多个Transformer块进行特征学习，得到中间层特征F₄，用作瓶颈层，且得到中间层特征F₄的具体公式为：

F₃′＝Downsampling(F₃)

F₃″＝DOF(F₃′,F_gradient)

F₄＝WAT(F₃″)

2.5、在跳跃连接部分，将中间层特征F₁、中间层特征F₂、中间层特征F₃、中间层特征F₄统一输入到CDSF模块中，获取不同尺度不同域下的特征权重并融合，与解码器阶段输出进行权重相加，即可得到中级增强图像I_PE；

在本步骤中，DOF模块在编码器阶段有助于增强分解的效果，结合WAT模块中的窗口注意力和轴向注意力，可以更好的学习局部特征和全局相关性，双门控机制的前馈网络能够帮助模型提取更有利的信息，同时，传统的跳跃连接采用简单的相加，而本步骤中的CDSF模块更有助于整合跨域多尺度特征，能够实现高分辨率图像语义信息不足、低分辨率图像细节不足的相互弥补，可以更好的提取有用的特征，DSF跨域多尺度的融合效果好，Transformer特征学习效果好，且通过梯度特征的引入，在Transformer-Unet网络部分完成浅层特征F₀细节的恢复，并且可以抑制对低光图像作初步增强的被放大的噪声。

步骤3、使用光照特征F_light作为光照微调的指导，对中级增强图像I_PE进行光照微调，得到目标曝光图像，具体过程下：

在本步骤中，通过以提取的光照特征为指导，能够对中级增强图像的结果进行局部光照的微调，避免最终增强图像出现局部过度曝光的问题，从而得到曝光良好，细节完善的目标曝光图像。

验证实验

如图2所示，其为一个低光图像，在经过本发明处理后，得到目标曝光图像，也即图3所示，此时，从视觉上可以看出，图3获得了很好的光照增强效果，不仅恢复了暗部的信息，对于纹理等细节也做了很好的增强，与实际的曝光图像，也即图4，并没明显差异，本发明可以用来获得可靠的目标曝光图像。

综上所述，本发明通过使用卷积神经网络提取出低光图像的浅层特征、以及梯度特征，进而输入到Transformer-Unet网络中，并以光照特征、作为指导，得到目标曝光图像，充分利用Transformer的全局建模能力和Unet网络所构造的多尺度交互框架，并采用小波变换实现跨特征域的信息交互，克服了卷积神经网络计算的局限性，弥补了Transformer块对低光图像中局部信息的忽视，最终得到正常曝光、细节完善的目标曝光图像，不仅保证了低光图像的细节信息，还实现了低光图像的光照增强，能够适应目标追踪等高层视觉任务的执行。

以上只通过说明的方式描述了本发明的某些示范性实施例，毋庸置疑，对于本领域的普通技术人员，在不偏离本发明的精神和范围的情况下，可以用各种不同的方式对所描述的实施例进行修正。因此，上述附图和描述在本质上是说明性的，不应理解为对本发明权利要求保护范围的限制。

Claims

1.一种基于小波变换的多尺度Transformer-Unet低光图像的增强方法，其特征在于：包括以下步骤：

2.5、在跳跃连接部分，将中间层特征F₁、中间层特征F₂、中间层特征F₃、中间层特征F₄统一输入到CDSF模块中，获取不同尺度不同域下的特征权重并融合，与解码器阶段输出进行权重相加，得到中级增强图像I_PE；

2.根据权利要求1所述的一种基于小波变换的多尺度Transformer-Unet低光图像的增强方法，其特征在于：在步骤1中，给定一个低光图像，使用卷积神经网络对其进行增强处理，提取出低光图像的光照特征F_light、浅层特征F₀、以及梯度特征F_gradient的具体步骤如下：

且I_mean∈I^H×W×1，为I_L三通道求均值获得；

1.4、采用3×3卷积层提取初级增强图像I_PL的浅层特征F₀。

3.根据权利要求1所述的一种基于小波变换的多尺度Transformer-Unet低光图像的增强方法，其特征在于：在步骤2.1中，对浅层特征F₀使用Transformer块进行RGB域的特征学习，得到中间层特征F₁，具体公式为：

F′＝LayerNorm(F₀)

F_A＝WSA(F′)+AbSA(F′)

F′₀＝F₀+F_A

F″＝LayerNorm(F′₀)

F₁＝DGFN(F″)+F₀′

其中，LayerNorm(·)为层归一化处理，

WSA(·)为窗口注意力，

AbSA(·)为轴向注意力，

DGFN(·)为带有双门控机制的前馈网络。

4.根据权利要求1所述的一种基于小波变换的多尺度Transformer-Unet低光图像的增强方法，其特征在于：在步骤2.2中，将中间层特征F₁使用Haar小波分解后转换到小波域，使用梯度特征F_gradient作为指导并与梯度特征F_gradient融合，采用堆叠的多个Transformer块进行特征学习，得到中间层特征F₂，具体公式为：

F_LL,F_LH,F_HL,F_HH＝DWT(F₁)

F₁′＝[F_LL,F_LH,F_HL,F_HH]

F₁″＝DOF(F₁′,F_gradient)

F₂＝WAT(F₁″)

其中，DWT(·)为小波变换，

DOF(·)为利用深度过参数卷积进行特征融合，

WAT(·)为步骤2.1中的计算过程；

F_LL为低频分量，

F_LH为水平方向高频分量，

F_HL为垂直方向高频分量，

F_HH为对角线方向高频分量。

5.根据权利要求1所述的一种基于小波变换的多尺度Transformer-Unet低光图像的增强方法，其特征在于：在步骤2.3中，使用卷积进行2倍下采样，使用梯度特征F_gradient作为指导与下采样结果进行融合，并采用堆叠的多个Transformer块进行特征学习，得到中间层特征F₃，具体公式为：

F₂′＝Downsampling(F₂)

F₂″＝DOF(F₂′,F_gradient)

F₃＝WAT(F₂″)

其中，Downsampling(·)为卷积进行2倍下采样。

6.根据权利要求1所述的一种基于小波变换的多尺度Transformer-Unet低光图像的增强方法，其特征在于：在步骤2.4中，使用卷积进行2倍下采样，使用梯度特征F_gradient作为指导与与下采样结果进行融合，并采用级联的多个Transformer块进行特征学习，得到中间层特征F₄，的具体公式为：

F₃′＝Downsampling(F₃)

F₃″＝DOF(F₃′,F_gradient)

F₄＝WAT(F₃″)。

7.根据权利要求1所述的一种基于小波变换的多尺度Transformer-Unet低光图像的增强方法，其特征在于：在步骤3中，使用光照特征F_light作为光照微调的指导，对中级增强图像I_PE进行光照微调，得到目标曝光图像，具体过程下：