您的位置:首页 >行业动态 >

视觉搜索中的大小问题

导读 在继续阅读之前,请在上面的照片中寻找牙刷。找到他们?两个都?如果您像绝大多数人一样,则在一个靠近水槽的地方进行磨练,但可能要花一两分

在继续阅读之前,请在上面的照片中寻找牙刷。找到他们?两个都?如果您像绝大多数人一样,则在一个靠近水槽的地方进行磨练,但可能要花一两分钟才能看到另一个更大的人挂在墙上。尽管从技术上讲它更为可见,并且没有上下文,但是至少在一段时间内,您的大脑在视觉搜索中排除了那把巨大的蓝色牙刷。

事实证明,大小很重要。当我们在场景中搜索特定对象时,即使巨型目标的大小与场景其余部分不一致,我们也经常会错过它们。根据加州大学圣塔芭芭拉分校的科学家所说,正在研究这种奇怪现象,以更好地了解人类如何进行视觉搜索。

这些新发现心理与脑科学系的研究人员发表在《当代生物学》杂志上。

UCSB教授米格尔·埃克斯坦(Miguel Eckstein)表示:“当某些事物以错误的比例出现时,您会经常错过它,因为您的大脑会自动忽略它。”研究人员使用普通物体的场景,在计算机生成的图像中以14个目标为特征,这些图像的颜色,视角和大小各不相同,并与“无目标”场景混合在一起,研究人员让60位观看者搜索这些物体(例如牙刷,停车收费表) (计算机鼠标),而眼动追踪软件则监视着他们的视线。他们发现,即使缩放比例不正确,人们也往往会错过目标,即使他们的目光对准了尺寸不正确的物体。

科学家报告,相比之下,计算机视觉没有这个问题。

“想法是,当您第一次看到一个场景时,您的大脑会在几百毫秒或更短的时间内快速处理它,然后您使用该信息将搜索引导到通常出现该对象的可能位置,” Eckstein说。“而且,您将注意力集中在实际上与您要寻找的对象大小一致的对象上。”最先进的计算机视觉-深度神经网络-搜索整个场景并使用对象本身的视觉特性,而人类也使用对象及其在场景中的上下文之间的关系来引导他们的眼睛。

对于人类而言,这种趋势似乎是一种缺陷,但是当要求人类对象和一个深度神经网络来验证现实世界场景中是否存在不同目标对象时,表就被翻转了。在那轮中,深度神经网络报告的误报百分比更高。也就是说,他们确认了由于形状相似而在存在计算机键盘的场景中存在手机-尽管键盘的大小比手机大几倍,并且照片中的键盘大得多而不是附近握住他们的手。

“没有人会那样做。”现任职于Riot Games的前毕业生凯蒂·科勒补充说。“仅根据您的大脑的大小就会自动丢弃它。”研究人员认为,这种机制实际上是人脑实施的一种有用策略,可以快速处理场景,消除干扰物并减少误报。尽管大小不一致导致的失明可能是人脑搜索策略的不良副产品,但这种情况在现实世界中很少见。随着反复暴露于异常情况,人类观察者最终将调整其视觉搜索以适应这种情况。

免责声明:本文由用户上传,如有侵权请联系删除!