CN116721142B

CN116721142B - 基于区域匹配正则化的由光场数据估计视差的方法及应用

Info

Publication number: CN116721142B
Application number: CN202311000568.9A
Authority: CN
Inventors: 王安东; 岳修鹏; 路峰; 吴立新; 刘畅; 邱钧
Original assignee: Shandong Yellow River Delta National Nature Reserve Management Committee; Beijing Information Science and Technology University
Current assignee: Shandong Yellow River Delta National Nature Reserve Management Committee; Beijing Information Science and Technology University
Priority date: 2023-08-10
Filing date: 2023-08-10
Publication date: 2023-10-20
Anticipated expiration: 2043-08-10
Also published as: CN116721142A

Abstract

本发明公开了一种基于区域匹配正则化的由光场数据估计视差的方法及应用。基于区域匹配正则化的由光场数据估计视差的方法包括：步骤1，建立用于衡量区域匹配窗口区域匹配窗口准确性和稳定性的窗口适应性度量函数；步骤2，建立场景视差估计优化模型；步骤3，利用搜索法实现区域匹配正则化，得到最优区域匹配窗口；步骤4，利用最优区域匹配窗口，求解最优视差函数。本发明用于对四维光场数据进行高精度和高鲁棒性的视差估计，以及用于场景三维重建、虚拟现实和三维显示等。本发明属于计算成像和计算机视觉技术领域。

Description

基于区域匹配正则化的由光场数据估计视差的方法及应用

技术领域

本发明涉及计算成像和计算机视觉技术领域，特别是关于一种基于区域匹配正则化的由光场数据估计视差的方法及应用。

背景技术

光场包含光线的空间和角度信息，广泛应用于场景渲染、视差估计与三维重构。由光场数据估计场景视差以光场双平面参数化模型为基础，主要有如下四类方法。

第一类方法是根据亚光圈图像进行匹配，再通过逐像素匹配获取场景视差信息。该类方法是多目视觉匹配方法的扩展，可以降低光场频谱混叠和视角串扰的影响，但在弱纹理区域、平滑区域和遮挡区域难以匹配。

第二类方法是根据EPI（Epipolar Plane Images）的几何结构，通过求得EPI中物点的斜率来获取出场景的视差。该类方法在遮挡区域能得到较好的结果，但计算量大、对噪声敏感。

第三类方法是基于数字重聚焦，利用聚焦堆栈中像素点的聚焦测度来得到相应物点的视差信息。该类方法的估计精度取决于场景中纹理结构的精细程度。

第四类方法是基于视差学习，通过构建神经网络取代复杂的视差估计模型。该类方法依赖于大量的数据样本，且泛化能力不足。

发明内容

本发明的目的在于提供一种基于区域匹配正则化的由光场数据估计视差的方法及应用来克服或至少减轻现有技术的上述缺陷中的至少一个。

为实现上述目的，本发明提供一种基于区域匹配正则化的由光场数据估计视差的方法，其包括：

步骤1，建立下式（1）所描述的用于衡量区域匹配窗口区域匹配窗口准确性和稳定性的窗口适应性度量函数；

（1）

式中，为中心视图中像素/>的区域匹配窗口，/>为区域匹配窗口内像素值LBP编码的均值，/>为区域匹配窗口/>内视差值LBP编码的均值；

步骤2，建立下式（2）所描述的场景视差估计优化模型;

（2）

式中，和/>分别表示场景视差估计优化模型的匹配数据保真项、区域匹配窗口正则项，/>为正则化参数，/>表示光场数据相邻视点间的视差，表示中心视图的像素坐标；

步骤3，利用搜索法实现区域匹配正则化，得到最优区域匹配窗口；

步骤4，利用最优区域匹配窗口，求解下式（5）的最优视差函数/>：

（5）

式中，表示最优视差函数。

进一步地，根据区域匹配窗口/>的像素值LBP编码集合/>计算获得，而/>的获取方法具体包括：

步骤11，获取像素点的预设方向和个数邻域像素点的灰度/>，将像素点的灰度值/>与邻域像素点的灰度值进行比较，如果邻域像素点的灰度值大于等于/>，则对应二进制位为1；如果邻域像素点的灰度值小于/>，则对应二进制位为0，由此获得一个二进制编码；

步骤12，将步骤11得到的二进制编码转换为十进制数，由此得到像素点的像素值LBP编码/>，从而得到区域匹配窗口/>的像素值LBP编码集合，记为/>，。

进一步地，匹配数据保真项描述为下式（3）：

（3）

式中，表示区域匹配窗口/>的视点/>的集合，/>表示中心视点，/>表示中心视点/>对应的视图，/>表示视点/>对应的视图，/>表示/>是区域匹配窗口/>内的像素。

进一步地，步骤3具体包括：

根据窗口适应性度量的变化情况，动态搜索不同窗口的大小和形状的区域匹配窗口，极大化窗口适应性度量，得到最优区域匹配窗口/>，同时采用下式（4）描述的高斯分布函数，作为区域匹配窗口/>的对应的权重系数：（4）

式中，为像素/>的区域匹配加权系数，/>表示标准差。

本发明还提供一种如上所述的基于区域匹配正则化的由光场数据估计视差的方法的应用，其包括：

采用下式表示的模型对平滑区域/>进行修正：

式中，为利用/>模型计算出的视差图，/>为修正后的/>，/>为计算视差图，/>为视差图/>的梯度，/>为正则化参数。

本发明由于采取以上技术方案，其具有以下优点：

由于本发明能够通过区域匹配正则化减少统一窗口区域匹配的误匹配和冗余计算，有效提升遮挡区域、平滑区域估计结果的精度，能够对四维光场数据进行高精度和高鲁棒性的视差估计，还能够实现由光场相机采集到的光场数据重建场景深度，从而用于场景三维重建、虚拟现实和三维显示等。

附图说明

图1为本发明实施例提供的基于区域匹配正则化的由光场数据估计视差的方法和装置的流程示意图。

具体实施方式

下面结合附图和实施例对本发明进行详细的描述。

如图1所示，本实施例提供的基于区域匹配正则化的由光场数据估计视差的方法包括：

（1）

式中，为中心视图中像素/>的区域匹配窗口，/>为区域匹配窗口内像素值LBP（英文全称为Local Binary Pattern，中文全称为局部二值模式）编码的均值，/>为区域匹配窗口/>内视差值LBP编码的均值。LBP是一种用来描述图像局部特征的算子，具有灰度不变性和旋转不变性等显著优点。

其中，计算区域匹配窗口内每个像素点/>的LBP编码/>，具体包括：步骤11，获取像素点/>的预设方向和个数的邻域像素点的灰度值/>，将像素点/>的灰度值与每一个邻域像素点的灰度值分别进行比较，如果邻域像素点的灰度值大于等于/>，则对应二进制位为1；如果邻域像素点的灰度值小于/>，则对应二进制位为0，由此获得一个二进制编码。其中，预设方向可以理解为选择但不限于像素点/>的上、下、左、右、左上、左下、右上、右下这8个方向，预设个数可以但不限于预设方向一个。

可以根据区域匹配窗口/>的像素值LBP编码集合/>计算获得。也可以根据区域匹配窗口/>的视差值LBP编码集合/>计算获得，而/>的获取方法可以采用与步骤11和步骤12类似的方法实现。除了采用上述实施例提供的获取和/>，本领域技术人员还可以采用本领域公知的其他现有方法实现，在此不一一列举。

对于区域匹配窗口来说，窗口适应性度量函数的值越大，窗口对待匹配区域的特征值变化更加敏感，匹配过程具有更好的准确性和稳定性。

步骤2，建立下式（2）所描述的场景视差估计优化模型；

（2）

式中，和/>分别表示场景视差估计优化模型的匹配数据保真项、区域匹配窗口正则项（为窗口适应性度量函数），/>为正则化参数，/>表示光场数据相邻视点间的视差，/>表示中心视图的像素坐标。

在一个实施例中，匹配数据保真项可以描述为下式（3）：

（3）

上述实施例中，本领域技术人员还可以在式（3）的基础上进行改进，从而获得匹配数据保真项。

步骤3，利用搜索法实现区域匹配正则化，即搜索窗口适应性度量的最大值，得到最优区域匹配窗口。

根据窗口适应性度量的变化情况，动态调搜索不同窗口的大小和形状的区域匹配窗口，极大化窗口适应性度量，得到最优区域匹配窗口/>。同时采用下式（4）描述的高斯分布函数，作为区域匹配窗口/>的对应的权重系数：

（4）

式中，为像素/>的区域匹配加权系数，/>表示标准差（方差的算数平方根）。

（5）

式中，表示最优视差函数。

本发明实施例还提供一种如上实施例所述的基于区域匹配正则化的由光场数据估计视差的方法的应用，包括：

采用下式表示的（英文全称为total variation）模型对平滑区域/>进行修正：

式中，为利用/>模型计算出的视差图，/>为修正后的/>，/>为计算视差图，/>为视差图/>的梯度，/>为正则化参数，通常取0.001到0.1之间。

本发明使用的区域匹配正则化方法能够用于提高由光场数据估计视差中区域匹配过程正确匹配的信息量，保证区域匹配的准确性和稳定性，同样在光场数据估计视差方法中，能够实现高精度和高鲁棒性的视差重建。

最后需要指出的是：以上实施例仅用以说明本发明的技术方案，而非对其限制。本领域的普通技术人员应当理解：可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims

1.一种基于区域匹配正则化的由光场数据估计视差的方法，其特征在于，包括：

步骤1，建立下式(1)所描述的用于衡量区域匹配窗口区域匹配窗口准确性和稳定性的窗口适应性度量函数m[w(x，y)]；

m[w(x，y)]＝μ_pix(S_w(x，y))+μ_disp(S_w(x，y)) (1)

式中，w(x，y)为中心视图中像素(x，y)的区域匹配窗口，μ_pix(S_w(x，y))为区域匹配窗口w(x，y)内像素值LBP编码的均值，μ_disp(S_w(x，y))为区域匹配窗口w(x，y)内视差值LBP编码的均值；

步骤2，建立下式(2)所描述的场景视差估计优化模型E[disp(x，y)，w(x，y)]；

E[disp(x，y)，w(x，y)]＝E^AE[disp(x，y)，w(x，y)]+λm[w(x，y)] (2)

式中，E^AE[disp(x，y)，w(x，y)]和m[w(x，y)]分别表示场景视差估计优化模型的匹配数据保真项、区域匹配窗口正则项，λ为正则化参数，disp(x，y)表示光场数据相邻视点间的视差，(x，y)表示中心视图的像素坐标；

步骤3，利用搜索法实现区域匹配正则化，得到最优区域匹配窗口w^*(x，y)；

步骤4，利用最优区域匹配窗口w^*(x，y)，求解下式(5)的最优视差函数s^*(x，y)：

式中，s^*(x，y)表示最优视差函数；

其中，步骤3具体包括：

根据窗口适应性度量的变化情况，动态搜索不同窗口的大小和形状的区域匹配窗口，极大化窗口适应性度量m[w(x，y)]，得到最优区域匹配窗口w^*(x，y)，同时采用下式(4)描述的高斯分布函数，作为区域匹配窗口w^*(x，y)的对应的权重系数：

式中，α(m，n)为像素(m，n)的区域匹配加权系数，σ表示标准差。

2.如权利要求1所述的基于区域匹配正则化的由光场数据估计视差的方法，其特征在于，μ_pix(S_w(x，y))根据区域匹配窗口w(x，y)的像素值LBP编码集合计算获得，而/>的获取方法具体包括：

步骤11，获取像素点i的预设方向和个数邻域像素点的灰度值将像素点i的灰度值g_i与邻域像素点的灰度值进行比较，如果邻域像素点的灰度值大于等于g_i，则对应二进制位为1；如果邻域像素点的灰度值小于g_i，则对应二进制位为0，由此获得一个二进制编码；

步骤12，将步骤11得到的二进制编码转换为十进制数，由此得到像素点i的像素值LBP编码LBP_i，从而得到区域匹配窗口w(x，y)的像素值LBP编码集合，记为i∈w(x，y)。

3.如权利要求1所述的基于区域匹配正则化的由光场数据估计视差的方法，其特征在于，匹配数据保真项E^AE[disp(x，y)，w(x，y)]描述为下式(3)：

式中，Φ表示区域匹配窗口w(x，y)的视点(u，v)的集合，(u₀，v₀)表示中心视点，表示中心视点(u₀，v₀)对应的视图，L_u，v表示视点(u，v)对应的视图，(m，n)∈w(x，y)表示(m，n)是区域匹配窗口w(x，y)内的像素。

4.一种如权利要求1-3中任一项所述的基于区域匹配正则化的由光场数据估计视差的方法的应用，其特征在于，包括：

采用下式表示的TV模型对平滑区域Ω_smooth进行修正：

式中，μ(x，y)为利用TV模型计算出的视差图，μ^*(x，y)为修正后的μ(x，y)，s^*(x，y)为计算视差图，为视差图μ(x，y)的梯度，γ为正则化参数。