儿童的视觉经验可能是更好的计算机视觉训练的关键

导读宾夕法尼亚州立大学跨学科团队的研究表明，一种新颖的、受人类启发的训练人工智能 (AI) 系统识别物体和导航周围环境的方法可以为开发更先...

宾夕法尼亚州立大学跨学科团队的研究表明，一种新颖的、受人类启发的训练人工智能 (AI) 系统识别物体和导航周围环境的方法可以为开发更先进的 AI 系统以探索极端环境或遥远世界奠定基础。

在生命的最初两年里，儿童接触到的物体和面孔相对较少，但视角和光照条件各不相同。受这一发展洞察的启发，研究人员引入了一种新的机器学习方法，利用有关空间位置的信息更有效地训练人工智能视觉系统。

他们发现，用新方法训练的人工智能模型比基础模型高出 14.99%。他们在《Patterns》杂志 5 月刊上发表了他们的研究成果。

“目前，人工智能的方法是使用来自互联网的大量随机照片集进行训练。相比之下，我们的策略则受到发展心理学的影响，该心理学研究儿童如何看待世界，”本文第一作者、宾夕法尼亚州立大学信息科学与技术学院博士生朱丽珍说道。

研究人员开发了一种新的对比学习算法，这是一种自我监督学习方法，其中人工智能系统学习检测视觉模式，以识别两幅图像是否是同一基础图像的衍生品，从而产生正对。然而，这些算法通常将从不同角度拍摄的同一物体的图像视为单独的实体，而不是正对。

研究人员表示，考虑到位置等环境数据，人工智能系统可以克服这些挑战，并且无论相机位置或旋转、光照角度或条件以及焦距或变焦如何变化，都能检测到正对。

“我们假设婴儿的视觉学习取决于位置感知。为了生成具有时空信息的自我中心数据集，我们在 ThreeDWorld 平台中设置了虚拟环境，这是一个高保真、交互式的 3D 物理模拟环境。这使我们能够操纵和测量观察摄像头的位置，就像孩子在房子里走路一样，”朱补充道。

免责声明：本文由用户上传，如有侵权请联系删除！

标签：