机器人的眼睛和人类修复了不同的东西以解码场景

2025-06-18 12:34来源:本站

带有埃菲尔铁塔的人眼反射ntext="Article" data-image-id="2095617" data-caption="" data-credit="Getty" />

盖蒂

机器思维通常被描述为黑匣子,他们的决策过程几乎无法理解。但是在机器智能的情况下,研究人员正在破解黑匣子在里面打开并凝视。他们发现的是,当人类看图片时,人类和机器根本不关注相同的东西。

布莱克斯堡的Facebook和弗吉尼亚理工大学的研究人员吸引了人类和机器来查看图片并回答简单的问题 - 基于神经网络的人工智能可以处理这项任务。但是研究人员对答案不感兴趣。他们想绘制人类和人工智能的关注,以阐明我们与他们之间的差异。

劳伦斯·齐特尼克(Lawrence Zitnick)在Facebook AI Research上说:“这些关注图是我们可以在人类和机器中衡量的东西,这是很少见的。”比较两者可以提供洞察力“计算机是否在正确的位置看”。

首先,Zitnick和他的同事要求在亚马逊机械土耳其人上的人工工人回答有关一组图片的简单问题,例如“男人在做什么?”或“床上有多少猫?”每张图片都模糊了,工人必须单击以使其锐化。这些点击的地图是指他们关注的图片的哪一部分的指南。

然后,研究人员提出了两个训练图像的神经网络的相同问题。他们绘制了每个网络选择锐化和探索的图片部分。

该小组发现,来自两个人的注意力图在1个总重叠的规模上得分为0.63,而0则没有。AI和人类注意力图的重叠得分为0.26(请参见下图)。尽管如此,神经网络还是很擅长确定图像显示的内容,因此他们的技能有一个神秘的元素。

ntext="Article" data-image-id="2095618" data-caption="" data-credit="" />

弗吉尼亚理工大学的德鲁夫·巴特拉(Dhruv Batra)说:“机器似乎并没有像人类那样看着同一地区,这表明我们不了解他们的决定。”

对于希望调整神经网的研究人员来说,人类和机器之间的差距可能是一个有用的灵感来源。“我们能否使它们更像人性化,这会转化为更高的准确性吗?”巴特拉问。

瑞士曼诺的达勒·莫尔人工智能研究所的尤尔根·施密堡(JürgenSchmidhuber)的结果很有趣,尽管他警告说,研究人员不一定要急于建立恰好模仿人类的系统。

Schmidhuber说:“选择性关注是积极地填补细心观察者知识的空白。”人类比神经网具有更广泛的经验和知识,因此更好地专注于重要的事情。“一个系统有趣的东西可能对已经知道它的另一个系统感到无聊。”

参考:arxiv.org/abs/1606.03556

更正,2016年7月1日:首次发布时,此故事包括重叠评分系统描述中的错误。现在已经修改了。

左文资讯声明:未经许可,不得转载。