3D视觉[一]3D计算机视觉
3D视觉[一]3D计算机视觉
3D计算机视觉概述
像机标定
文章目录
- 3D视觉[一]3D计算机视觉
- 前言
- 一、人类视觉
- 二、计算机视觉
- 2.1 计算机视觉的研究目的
- 2.2 计算机视觉的研究任务
- 2.3 计算机视觉的研究方法
- 2.4 视觉计算理论
- 2.5 马尔框架中计算机视觉表达的四个层次
- 2.5.1 图像(像素表达)
- 2.5.2 要素图(基素表达)
- 2.5.3 2.5维图(2.5D表达)
- 2.5.4 3维模型表象(3D表达)
- 三、3D视觉
- 3.1 3D视觉系统流程
- 3.1.1 图像采集
- 3.1.2 场景解释
- 3.2 图像技术类别
前言
目前转到手术机器人方向,所以要重新研究3D视觉和SLAM。
一、人类视觉
视觉是一种处理过程,能从外部世界中得到一个对于观察者来说有用又不受无关信息干扰的描述。而人类视觉的精华在于:从图像中建立物体的形状和位置的一个描述。
二、计算机视觉
2.1 计算机视觉的研究目的
理解和把握场景。
2.2 计算机视觉的研究任务
建成计算机视觉系统以完成各种视觉任务,以及探索人类视觉工作的机理。
2.3 计算机视觉的研究方法
主要有两种:一种是仿生学的方法,另一种是工程学的方法,从分析人类视觉过程的功能入手,并不刻意模拟人类视觉系统内部结构,而仅考虑系统的输入和输出,并采用现有的可行手段实现系统功能。
2.4 视觉计算理论
马尔提出了视觉计算理论和计算机视觉表达的四个层次。
视觉是一个复杂的信息加工过程,视觉信息加工三要素分别是计算理论、表达和算法、硬件实现。
2.5 马尔框架中计算机视觉表达的四个层次
2.5.1 图像(像素表达)
以像素为基础,描述光的强度。
2.5.2 要素图(基素表达)
从原属图像中提取出的关键的信息。
2.5.3 2.5维图(2.5D表达)
以观察者为中心的图像,描述物体在三维上的朝向、深度和轮廓。
2.5.4 3维模型表象(3D表达)
以物体为中心,类似于图形学建立的三维模型,达到真正的三维化。
三、3D视觉
马尔提出的视觉计算理论是一种被动无反馈机制的计算,与现实环境的约束条件和目标有所出入,如缺少深度信息、视角单一、噪声、畸变等,3D视觉系统能够有效解决这部分问题。
3.1 3D视觉系统流程
3.1.1 图像采集
直接采集/间接采集3D图像,获取3D空间信息。
3.1.2 场景解释
通过学习、推理、与模型的匹配等解释场景的内容、特性、变化、态势或趋向等在感知基础上,对实际的目标和场景做出有意义的解释和判断,从而做出决策和采取行动。