Deep Mind最新重磅研究——把AI训练得“像婴儿一样思考”
导读:
人工智能会下棋,甚至打败过世界围棋冠军,这已经是老生常谈。
别看AI这么厉害,它只是借助了深度学习的方式,通过无数次的训练,让它能够在面对实际问题时,从训练数据库中计算寻得最优解,这并不代表机器人能够像人一样进行自主思考。
7月11日,Deep Mind公司最新的一项关于AI的文章有了突破性进展,研究者运用发展心理学领域的知识可以让AI能像人类婴儿一样“学会思考”。而此前,最先进的AI系统仍然难以捕捉到日常人类场景中的“常识性”知识,比如指导预测、推理和行动。
可以说,Deep Mind的这项研究,大大推进了人工智能在直觉感知方面的发展。此后,人工智能真的更像“人”了。
撰文 | 徐诗露
图片来自Deep Mind
早在机器人问世之时,就有许多人想象过:如果机器人能够像人一样思考,世界将会变成什么样子?(相信你脑海中已经浮现出相应的电影场景了)
这个问题已经尘封多年,但是近期的一项发表在《自然·人类行为》上的研究显示,人工智能或许拥有了“像婴儿一样思考”的能力:能像婴儿一样理解直观物理学。值得一提的是,这是知名人工智能公司Deep Mind科研人员发表的成果。
论文通讯作者Luis Piloto,此前他在普林斯顿大学学习
Luis Piloto和他的同事做了一个能学习直观物理学的深度学习系统,名为PLATO。PLATO包含的系统受到了婴儿学习方法相关研究的启发。并且,PLATO遵循认为物体在我们周围物理世界的表示和预测中扮演核心作用的理论。
具体来说,研究者通过给PLATO观看许多描绘简单场景的视频来训练它,比如球落到地上,球滚到其他物体后面又再次出现,很多球之间弹来弹去。训练之后,PLATO在看到没有意义的场景(如物体互相穿过却没有发生相互作用)时表现出了像人类婴儿那样“惊讶”。
令人惊讶的是,PLATO只观看了28小时的视频就获得了以上学习效果。
我们不禁发问,直观物理学是什么,婴儿是如何理解它的?AI又是如何学到这一点的呢?01
婴儿眼里的直观物理学是什么?
首先我们来明确一个概念,直观物理学是什么?我们可以简单地把它理解为“直觉”或者“常识”。
比如我们在桌子上方丢下一串钥匙,所有人都知道,钥匙不会漂浮在半空中,也不会穿过桌面掉到地上,而是会掉落在桌面上。
这就是“直观物理学”,它是我们了解世界的基础物理概念,也是思维中“常识”的关键组成部分。
在发展心理学领域中,直观物理学被分为5个方面的概念:
1. 连续性:物体不会从一个地方传送到另一个地方,而是在时间和空间中有一定的连续路径;
2. 对象持久性:物体在看不见时不会消失;
3. 固体性:物体不会相互渗透;
4. 不变性:对象的属性(如形状)不会更改;
5. 定向惯性:物体运动的路径与惯性原理一致。
是不是每一个都很好理解?没错,这些都是我们容易理解和接受的“常识性”概念。
如果钥匙的掉落过程违背了我们的常识,比如悬浮在了半空中、或者穿过了桌子、或者是从桌面上duang的一下弹起来老高,甚至是化成了液体,那么事情就会超出我们的预期,变得诡异起来。
面对这种怪异事件,每个人都会感到惊讶。即使是三个月大的婴儿也是一样,他们也会对这样违背直观物理学的现象表现出惊讶,这种惊讶反应被称为违反期望(VoE)效应。
至于婴儿对世界的认识是否和成人一样,这一点存在一个关于“先天”和“后天”的争议,许多发展科学家认为这是“先天”的,也有一些学者更支持从无到有的“后天”理论。
那我们能否设计一个模拟婴儿思维的程序,通过适当的训练,使AI能够像婴儿一样思考呢?
02
如何把AI训练得像婴儿一样思考?
为了探究这个争论不休的“先天”和“后天”问题,Piloto等人利用PLATO仿真系统,来测试深度学习系统是否能够通过学习视觉动画,来获得对直观物理学的理解。
如果“后天”的理论是正确的,那么智力发展的关键就在于通过处理大量经验和大量数据来进行锻炼。
PLATO仿真系统由两个模块组成:前馈感知模块(左)和循环动态预测器模块(右)组成。前馈感知模块中,通过编码器将图像转换为一组对象代码,通过解码器模块将对象代码解码成对象的图像。利用重建和原始图像之间的差异来训练编码器和解码器的参数。循环动态模块中,动态模块通过预先训练好的解码器对下一时刻的对象状态进行预测。
而这项研究使用的训练数据少到惊人,就让AI拥有了稳定的违反期望效应。在面对超出5个直观物理学概念的情况时,PLATO仿真系统会显示出鲁棒(即具有稳定性)的VoE效应。这可以解释一些直观物理学的概念,但是这种效应与婴儿身上看到的现象并不完全一致。
研究发现,虽然视觉动画的经验对智力发展有很重要的贡献,但不足以解释我们在婴儿身上看到的现象。
也就是说,智力发展并非全部依靠于“后天”的经验和数据。要形成完整的智力,还需要一些先天的认知,这项研究在“先天”派和“后天”派之间建立了一个有趣的中间立场。
当视频在直观物理学上变得不可能时,AI表现出的惊讶会显著增加。
此外,PLATO仿真系统可以将符合直观物理学的期望,归纳为一组与训练中不相同的对象和事件。其次,尽管只是接受了相对较少的视觉动画训练,这个仿真系统也能够成功地演示学习,在针对婴儿研究中也有相似的特征。
可以看到,将仿真建模的工作和发展心理学中的关键问题融合起来,研究人员得到了意想不到的效果和结论。
目前,研究团队正在将违反期望效应的研究扩展到神经生理学领域,这可能为后续的研究开辟新的可能性,也为AI的发展提供了更多的可能。
参考资料
1. Can a computer think like a baby? Nature News.
2. Intuitive physics learning in a deep-learning model inspired by developmental psychology. https://doi.org/10.1038/s41562-022-01394-8.
科普中国-创作培训计划
来源: 深究科学