2025-06-18 13:54来源:本站
观看对象互动的视频有助于AI学习物理学 音频和werbung/shutterstockntext="Article" data-image-id="2327978" data-caption="Watching videos of objects interact helped an AI learn physics" data-credit="Audio und werbung/Shutterstock" />
DeepMind的研究人员说,教授人工智能了解简单的物理概念,例如一个固体对象不能占据与另一个固体相同的空间,这可能会导致更有能力的软件,这些软件要训练更少的计算资源。
这家总部位于英国的公司以前创建了AI,可以击败国际象棋和GO,写计算机软件并解决蛋白质折叠问题的专家。但是这些模型是高度专业化的,缺乏对世界的一般理解。正如DeepMind的研究人员在最新论文中所说的那样,“基本的东西仍然缺失”。
现在,DeepMind及其同事的路易斯Piloto通过自动编码和跟踪对象(PLATO)创建了一个名为物理学的AI,旨在理解物理世界是由遵循基本物理定律的对象组成的。
研究人员训练了柏拉图,通过使用我们预期的对象的模拟视频来识别对象及其相互作用,例如球落在地面上,彼此滚动并互相弹跳。他们还提供了柏拉图数据,确切地显示了每个帧中哪个像素属于每个对象。
为了测试柏拉图理解五个物理概念的能力,例如持久性(物体往往不会消失),坚固和不变(该物体倾向于保留形状和颜色等功能),研究人员使用了另一个模拟视频。一些人显示了遵守物理定律的物体,而另一些人则描绘了荒谬的动作,例如在支柱后面滚动的球,而不是从另一侧浮出水面,而是从另一侧重新出现。
他们任务柏拉图要预测每个视频中接下来会发生什么,并发现其预测对于荒谬的视频是可靠的错误,但通常对逻辑视频是正确的,这表明AI具有对物理学的直觉知识。
Piloto说,结果表明,以对象为中心的观点可以使AI具有更普遍和适应能力的能力。他说:“例如,如果您考虑苹果可能会出现的所有不同场景。”“您不必在树上了解苹果,而不是厨房中的苹果,而不是垃圾中的苹果。当您将苹果隔离为自己的东西时,您可以更好地将其在新系统,新环境中的行为推广。它提供了学习效率。”
英国南安普敦大学的马克·尼克松(Mark Nixon)说,这项工作可能导致AI研究的新途径,甚至可能揭示有关人类视力和发展的线索。但是他对可重复性表示关注,因为本文说“我们对柏拉图的实施不可行”。
他说:“这意味着他们正在使用其他人可能无法使用的建筑。”“在科学方面,可以重现是一件好事,以便其他人能够获得相同的结果,然后将它们取得进一步。”
纽约大学的陈冯说,这些发现可能有助于降低培训和运行AI模型的计算要求。
他说:“这有点像教孩子,首先要教他们车轮和座椅是什么。”“使用以对象为中心表示的好处,而不是原始的视觉输入,使AI以更好的数据效率学习直观的物理概念。”