立体视觉深度估计

立体视觉是从场景的多个2D视图中提取三维信息的过程。立体视觉用于诸如高级驾驶员辅助系统(ADAS)和机器人导航等应用,其中立体视觉用于估计感兴趣的物体与摄像机的实际距离或范围。

通过估计场景中点的相对深度,可以从一对图像(也称为立体对)中获得三维信息。这些估计用立体视差图表示,立体视差图是通过匹配立体对中的相应点来构造的。

用一对立体图像(左上和右上)重建一个场景。为了可视化视差,将右通道与左通道结合起来创建一个复合通道(中间左侧)。图中还显示了场景的视差图(右中)和场景的3D渲染图(中下)。参见MATLAB代码和说明示例

对立体图像进行校正,简化匹配,使一幅图像中的对应点可以在另一幅图像的同一行中找到。这将二维立体对应问题简化为一维问题。立体图像校正有两种方法:标定校正和未标定校正。通过确定一组匹配的兴趣点,估计基本矩阵,然后推导出两个射影变换来实现非标定立体图像校正。标定后的立体校正使用了来自立体摄像机标定过程的信息。

矫正立体图像对。注意,匹配点位于同一行。参见MATLAB代码和说明示例

显示经过校准的立体图像校正的立体立体浮雕。参见MATLAB代码和说明示例。

立体相机标定用来确定立体对中摄像机的固有参数和相对位置,这些信息用于立体校正和三维重建。

立体视觉还应用于3D电影记录和制作、目标跟踪、机器视觉和距离传感。有关立体视觉的更多信息,请参见计算机视觉工具箱™

参见:对象检测图像和视频图像处理RANSAC特征匹配特征提取RANSAC点云同时定位和绘图