当前位置：首页 > news >正文

光流法与直接法在SLAM中的应用

news 2025/4/27 1:34:34

本文总结视觉SLAM中常用的光流法与直接法

1、Lucas-Kanade光流法

相机所拍摄到的图像随相机视角的变化而变化，这种变化也可以理解为图像中像素的反向移动。“光流”（Optical Flow）是指通过分析连续图像帧来估计场景中像素或特征点的运动的技术，即根据连续的两张图片和已知某个固定的空间点在 $t$ 时刻对应的的像素坐标 $\mathbf{q}$ ，估计其他时刻该空间点对应的像素坐标 $\mathbf{p}$ 光流法常用算法为LK光流法

在这里插入图片描述

LK光流法常用算法为常用的光流法，在LK光流法中，认为图像中每个像素坐标 $u,v]^{T}$ 处的灰度都是随时间 $t$ 变化的函数，且做如下两条假设：

灰度不变假设：同一空间点对应的像素坐标的灰度值，在各个图像中是不变的
局部运动一致假设：相邻区域内的像素具有相同的运动

1.1、解析解法

设对应于同一空间点的像素随时间变化的函数为 $(u (t), v (t))$ ，根据灰度不变假设，存在固定灰度值 $C$ ，有
$I(u(t),v(t),t)=C\tag{1}$
在上式中，对 $t$ 求导得到
$\frac{\partial{I}}{\partial{u}}\frac{\partial{u}}{\partial{t}}+\frac{\partial{I}}{\partial{v}}\frac{\partial{v}}{\partial{t}}+\frac{\partial{I}}{\partial{t}}=0\tag{2}$
$\nabla_{t}u=\frac{\partial{u}}{\partial{t}},\nabla_{t}v=\frac{\partial{v}}{\partial{t}}$ 为 $x$ 轴， $y$ 轴方向上的像素移动速度，这两个量也是LK光流法的求解目标， $\nabla_{u}I=\frac{\partial{I}}{\partial{u}},\nabla_{v}I=\frac{\partial{I}}{\partial{v}}$ 为灰度在 $x, y$ 方向上的梯度，也可称为像素梯度， $\nabla_{t}I=\frac{\partial{I}}{\partial{t}}$ 为固定点处灰度对时间的导数

$(2)$ 可以化简为
$[\nabla_{u}I,\nabla_{v}I]\begin{bmatrix}\nabla_{t}u\\\nabla_{t}v\end{bmatrix}=-\nabla_{t}I\tag{3}$
令 $\mathbf{w}=\begin{bmatrix}\nabla_{t}u\\\nabla_{t}v\end{bmatrix}$ ，上式是一个二元一次方程，仅靠该方程无法计算 $\mathbf{w}$ ，还需引入其他约束。

根据局部运动一致假设，可以认为像素 $\mathbf{q}_{i}$ 附近的某邻域内全部像素 $\mathbf{q}_{j},j=1,\cdots,w$ 再 $\Delta{t}$ 时间段内具有相同的运动，因此 $(3)$ 可以写成
$\begin{bmatrix}\nabla_{u} I_{1}(\mathbf{q}_{1}),\nabla_{v} I_{1}(\mathbf{q}_{1})\\\vdots\\ \nabla_{u} I_{1}(\mathbf{q}_{w}),\nabla_{v} I_{1}(\mathbf{q}_{w})\end{bmatrix}\mathbf{w}=\begin{bmatrix}-\nabla_{t}I(\mathbf{q}_{1})\\\vdots\\-\nabla_{t}I(\mathbf{q}_{w})\end{bmatrix}\tag{4}$
其中
$KaTeX parse error: No such environment: align* at position 8: \begin{̲a̲l̲i̲g̲n̲*̲}̲ \nabla_{u} I_{…$
记 $(4)$ 中系数矩阵为 $\mathbf{A}$ ，等号右侧矩阵为 $\mathbf{b}$ ，则方程变为
$\mathbf{A}\mathbf{w}=\mathbf{b}$
上式是关于 $\mathbf{w}$ 的超定方程组，可以通过最小二乘的方式求解，即令
$\mathbf{w}^{\ast}=\underset{\mathbf{w}}{\arg\min}\,\|\mathbf{A}\mathbf{w}-\mathbf{b}\|^{2}\tag{6}$
根据§1，容易求出 $\mathbf{w}^{\ast}$ ，根据 $\mathbf{q}_{i}+\mathbf{w}^{\ast}\Delta{t}$ 即可计算新像素位置

1.2、优化解法

通过最小化两张图像对应像素邻域内的灰度差也可以求出给定点 $\mathbf{q}$ 在第二张图像中的对应像素 $\mathbf{p}$ ，即
$KaTeX parse error: No such environment: align* at position 8: \begin{̲a̲l̲i̲g̲n̲*̲}̲ \mathbf{p}^{\a…$
$\mathbf{e}_{j}$ 对 $\mathbf{p}$ 的雅可比矩阵为
$\mathbf{J}_{j}=\frac{\partial\mathbf{e}_{j}}{\partial\mathbf{p}}=\begin{bmatrix}-\nabla_{u}I_{2}(\mathbf{p}_{j})\\ -\nabla_{v}I_{2}(\mathbf{p}_{j})\end{bmatrix}\tag{8}$
再求出
$\mathbf{H}_{k}=\sum_{j=1}^{w}\mathbf{J}_{j}\mathbf{J}_{j}^{T}\quad\quad \mathbf{b}_{k}=\sum_{j=1}^{w}\mathbf{J}^{T}_{j}\mathbf{e}_{j}$
增量方程为如下式，可以通过增量方程计算更新量
$\mathbf{H}_{k}\Delta\mathbf{p}_{k}=-\mathbf{b}_{k}$
得到更新量后，第二张图片中像素坐标可以更新为
$\mathbf{p}_{k+1}=\mathbf{p}_{k}+\Delta\mathbf{p}_{k}$

2、直接法

在这里插入图片描述

直接法并不单独估计第二张图片中的像素点位置，而是对第一张图片中的像素点，根据相机位姿估计值寻找其在第二张图片中对应的像素位置，并通过图片中对应像素的灰度差不断优化相机位姿变换，得到最优位姿变换，同时使两张图片的灰度差最小。下面进行详细说明。

已知像素 $\mathbf{q}_{i},i=1,\cdots,n$ 和其对应的深度，及摄像机内参矩阵
$\mathbf{K}=\left[\begin{array}{ccc} f_{x}&0&c_{x}\\ 0&f_{y}&c_{y}\\ 0&0&1 \end{array}\right]$
可以还原出三维空间位置 $\mathbf{x}_{i}$ ，令 $\mathbf{X}_{i}=\begin{bmatrix}\mathbf{x}_{i}\\1\end{bmatrix}\in\mathbb{R}^{4}$ ，并记从第一张图片到第二张图片对应的相机位姿变换为 $\mathbf{T}\in SE(3)$ ，则 $\mathbf{x}_{i}$ 在第二个相机坐标系下的空间坐标为
$\mathbf{y}_{i}=(\mathbf{T}\mathbf{X}_{i})_{1:3}=[X,Y,Z]^{T}$
对应的像素坐标为
$\mathbf{p}_{i}=\frac{1}{Z}(\mathbf{K}\mathbf{y}_{i})_{1:2}$
直接法求解优化问题
$KaTeX parse error: No such environment: align* at position 8: \begin{̲a̲l̲i̲g̲n̲*̲}̲ \mathbf{T}^{\a…$
暂时省略下标，根据链式求导法则得到
$KaTeX parse error: No such environment: align* at position 8: \begin{̲a̲l̲i̲g̲n̲*̲}̲ \frac{\partial…$
容易得到
$\frac{\partial{\mathbf{p}}}{\partial\mathbf{y}}=\begin{bmatrix} \frac{f_{x}}{Z}&0&-\frac{f_{x}X}{Z^{2}}\\ 0&\frac{f_{y}}{Z}&-\frac{f_{x}Y}{Z^{2}} \end{bmatrix}\quad\quad\frac{\partial\mathbf{y}}{\partial\mathbf{T}}=[\mathbf{I},-\mathbf{y}^{\wedge}]$
因此 $(10)$ 后两项可以写成
$\frac{\partial\mathbf{p}}{\partial\mathbf{T}}=\frac{\partial\mathbf{p}}{\partial\mathbf{y}}\frac{\partial\mathbf{y}}{\partial\mathbf{T}}=\begin{bmatrix} \frac{f_{x}}{Z}&0&-\frac{f_{x}X}{Z^{2}}&-\frac{f_{x}XY}{Z^{2}}&f_{x}+\frac{f_{x}X^{2}}{Z^{2}}&-\frac{f_{x}Y}{Z}\\ 0&-\frac{f_{y}}{Z}&-\frac{f_{x}Y}{Z^{2}}&-f_{y}-\frac{f_{y}Y^{2}}{Z^{2}}&\frac{f_{x}XY}{Z^{2}}&\frac{f_{x}X}{Z} \end{bmatrix}\tag{11}$
故 $(10)$ 又可以写成
$KaTeX parse error: No such environment: align* at position 8: \begin{̲a̲l̲i̲g̲n̲*̲}̲ \frac{\partial…$
问题 $(9)$ 的雅可比矩阵为
$\mathbf{J}_{i}=\frac{\partial\mathbf{e}_{i}}{\partial\mathbf{T}}$
由此得到
$KaTeX parse error: No such environment: align* at position 8: \begin{̲a̲l̲i̲g̲n̲*̲}̲\mathbf{H}_{k}=…$
则更新量可以通过下式计算
$\mathbf{H}_{k}\Delta\mathbf{T}_{k}=-\mathbf{b}_{k}$

并通过下式更新
$\mathbf{T}_{k+1}=\mathrm{Exp}(\Delta\mathbf{T}_{k})\mathbf{T}_{k}$
最终得到最优的位姿变换

实验

直接法在kitti数据集上的效果如下图，可以看到追踪效果良好
在这里插入图片描述

附录

§1、标准最小二乘问题

标准最小二乘问题对给定 $\mathbf{A}\in\mathbb{R}^{M\times{N}}$ ，计算 $\mathbf{x}^{\ast}\in\mathbb{R}^{N}$ ，使得
$KaTeX parse error: No such environment: align* at position 8: \begin{̲a̲l̲i̲g̲n̲*̲}̲ \mathbf{x}^{\a…$
首先对 $\mathbf{A}$ 进行SVD分解
$\mathbf{A}=\mathbf{U} \begin{bmatrix} \boldsymbol\Sigma_{r\times{r}}&\mathbf{O}\\ \mathbf{O}&\mathbf{O} \end{bmatrix}\mathbf{V}^{T}$
则 $\mathbf{A}$ 的伪逆为
$\mathbf{A}^{\dagger}=\mathbf{V} \begin{bmatrix} \boldsymbol\Sigma_{r\times{r}}^{-1}&\mathbf{O}\\ \mathbf{O}&\mathbf{O} \end{bmatrix}\mathbf{U}^{T}\tag{A2}$
可以证明，满足 $\mathrm{(A1)}$ 的模长最小的解为
$\mathbf{x}^{\ast}=\mathbf{A}^{\dagger}\mathbf{b}\tag{A3}$
特别地，当 $\mathrm{rank}(\mathbf{A})=N$ 时， $\mathbf{A}^{\dagger}=(\mathbf{A}^{T}\mathbf{A})^{-1}\mathbf{A}$ ， $\mathrm{(A1)}$ 仅有如下一个解
$\mathbf{x}^{\ast}=(\mathbf{A}^{T}\mathbf{A})^{-1}\mathbf{A}\mathbf{b}\tag{A4}$