茉莉花新闻网

中華青年思想與行動的聚合地

为什么人会觉得二维东西是立体的?

v2 05fbfdc31d4f96d7cfb251698dd1595d l
fly qq,如本科技 CTO,个人微信公众号 qRobotics
查看知乎原文

人的立体视觉是由多种效应共同作用行成的。现在机器视觉中的各种立体视觉算法主要也就是参考人类的方法实现的。

1)透视变换

简单地说就是近大远小效应,人类对真实世界物体的尺寸有一定先验知识。如果视野中原本应该相同尺寸的物体表现出不同的大小,那么小的物体在远处,大的在近处。如下图所示,单就一张普通的图片,我们就能判断哪些物体是离我们较远的。

v2 ecbae37f48b4accb9f0318db5cecdb75 720w

但这个方法 Bug 太多,很多视错觉就是因为这个效应产生的,如下图就是通过不同尺寸的网格来误导人的视觉系统。

v2 48454b836182bd491104bb7ab0c9dd86 720w

在机器视觉领域,这个三维定位方法被广泛应用。最常见的就是二维码定位算法。

v2 b98763c758a59b33ec22861b3450c810 720w

如果已知二维码尺寸,仅适用一个普通摄像头就可以算出二维码与摄像头的相对位置(3D)。

2)双目视觉

这个是比透视变换更可靠的方法之一,如下图所示,同个物体在视网膜上的投影位置会随着物体离观察者的远近而发生变化。大脑通过处理这一微小区别能得到比较准确的距离信息。

v2 2ef4783236d394175d12ca0a3f02cc4c 720w

当然,在机器视觉中,这也是非常常用的方法。首先,通过 SIFT 等特征点方法可以提取到两幅图片的相同点。

v2 6a976be313a9d7d82c0b19bb1a3fb343 720w

之后,通过简单的三角关系便可以求取得到深度图片。

v2 17a28d347ca19709b63090526675a984 720w

3)运动视觉(structure from motion)

但是,人两眼之间的距离有限,当物体距离较远时,双目系统对距离的敏感度就大大降低了。而且,双目视觉的算法很复杂,有相当一部分人的大脑并未掌握通过双目视觉生成立体图像的功能。因此,人类还有另外一个更厉害的技能,就是通过运动来构建立体视觉。原理与双目视觉类似,但是由于移动的距离远大于两眼的瞳距,所以立体效果更好。

如所谓的裸眼 3D,就是让你分别看到不同角度的图片,大脑自动会脑补成立体图片。

v2 741a01f814029c69d6918cf3561574e2 720w

机器视觉中这样的技术一般称为 Structure From Motion.

v2 5a149a2f86b3e956d7f5a1fd4423c558 720w

同类信息

查看全部

茉莉花论坛作为一个开放社区,允许您发表任何符合社区规定的文章和评论。

茉莉花新闻网

        中国茉莉花革命网始创于2011年2月20日,受阿拉伯之春的感召,大家共同组织、发起了中国茉莉花革命。后由数名义工无偿坚持至今,并发展成为广受翻墙网民欢迎的新闻聚合网站并提供论坛服务。

新闻汇总

邮件订阅

输入您的邮件地址:

linkedin facebook pinterest youtube rss twitter instagram facebook-blank rss-blank linkedin-blank pinterest youtube twitter instagram