Google DeepMind的AI学会玩耍物理对象

2025-06-20 05:26来源:本站

一个小女孩玩木块,将它们堆放到窗台上的塔中ntext="Article" data-image-id="2112462" data-caption="She could teach AI a thing or two" data-credit="" />

她可以教一两件事

推动它,拉它,打破它,甚至可以让它舔。孩子们以这种方式进行实验,以从很小的时候就了解物理世界。现在,由Google DeepMind和加利福尼亚大学伯克利分校的研究人员培训的人工智能正在该领域采取自己的婴儿措施。

DeepMind的Misha Denil说:“世界的许多方面,例如'我可以坐在这里吗?'或'它是闷闷不乐吗?'最好通过实验来理解。”在目前正在审查的论文中,Denil和他的同事通过在两个不同的虚拟环境中与它们进行交互,培训了AI,以了解对象的物理特性。

首先,AI面对五个块,大小相同,但每次运行实验时都会随机分配的质量。如果AI正确地确定了最重的块,则会获得奖励,但如果错误的话,则会给予负面反馈。通过重复实验,AI确定确定最重的块的唯一方法是在做出选择之前与所有块互动。

第二个实验也最多列出了五个街区,但这次它们被安排在塔中。其中一些块被困在一起以使一个更大的块,而另一些则没有。AI必须弄清楚有多少个不同的块,再次根据其答案获得奖励或负面反馈。随着时间的流逝,AI得知它必须与塔楼进行互动(本质上是将其拉开)以确定正确的答案。

这不是AI首次与AI一起玩。今年早些时候,Facebook使用堆叠块的模拟教授神经网络如何预测塔会是否掉落。

使用奖励和惩罚的训练计算机的技术称为“深度加强学习”,这是一种众所周知的方法。在2014年,它使用该方法训练AI比人类更好地玩Atari视频游戏。该公司随后被Google购买。

英国谢菲尔德大学的Eleni Vasilaki说:“强化学习允许在没有特定指示的情况下解决任务,类似于动物或人类如何解决问题。”“因此,它可能导致发现巧妙的新方法来处理已知问题,或者在没有明确说明时找到解决方案。”

研究中的虚拟世界只是非常基本的。AI具有一小部分可能的互动,不必处理现实世界中的干扰或缺陷。但是,它仍然能够解决问题,而无需任何对物体的物理特性或物理定律的知识。

马萨诸塞州理工学院的Jijun Wu说,最终,这项工作将在机器人技术中有用。例如,它可以帮助机器人弄清楚如何驾驶不稳定的地形。

Denil说:“我认为现在具体的应用程序仍然很长一段路,但是从理论上讲,机器需要了解超越被动看法的世界的任何应用都可以从这项工作中受益。”

左文资讯声明:未经许可,不得转载。