为了让AI像人一样思考,DeepMind这次又干了什么?
道阻且长,AGI的黎明不会很快到来。但正因为这样的AI研究机构的努力,才能让暗夜中探索的人们始终心怀火种。
通向AGI(通用人工智能)的道路上,始终有一道巨大的鸿沟横亘在研究者的面前,那就是人工智能对于因果关系的理解。因果关系的推断,首先对于人类本身就是一个极为复杂的问题。
无论是必然性推理还是或然性推理,人类总能在复杂的事物关系中建立精妙地因果推论。且无论对错,这种能力都让人类能力超群,成为站在生物链顶端的那颗孤星。
想象一下,假如你带着女儿去参加一个夏令营,在那里你遇到一个成年女人带着一个小女孩。你很可能会断定那个女人是小女孩的母亲。过了几个星期,你又在你住的附近的一家咖啡店里,你再次看到这个小女孩,但这次她是由一个成年男人带着。
基于这两段观察到的事实,你基本可以推断,这个男人和女人有一定的关系。但是否是夫妻关系或者别的关系,就会涉及到更多信息,诸如男人和女人的年龄、衣着品味和小孩子的亲密程度等等信息。
在这一场景中,我们可以基于在较大跨度的时间、地点中的发生的事实关系进行相关的因果推论。我们把这种在复杂的事物关系中的这种推论称为“长距离推理”。
AI能否掌握这一能力?
对于目前熟知的一些AI技术,通过数据库对他们进行人脸识别很容易;如果再给定他们相关身份的知识图谱,AI也可以认出他们。但如果仅给出以上事实场景(对于AI来说是单独的图像),而不提供任何其他信息,AI能否从图像描述的事实中建立起因果推理么?
这一次,DeepMind的最新研究中为AI进行 “长距离推理”提出了一种解决方案。
近日,DeepMind公开发表了一篇为ICLR 2020会议提交的论文《MEMO:一种用于情景记忆灵活组合的深度网络》。论文主要提出了一种可以增强现有深度神经网络架构的推理能力的新架构——MEMO。
MEMO具有长距离推理的能力,即能够发现在记忆中的多个事实之间的长距离的关系。
那么MEMO的实际表现如何?MEMO这一新的深度神经网络对于AI发展的意义是什么?这些问题仍然需要我们思考和解答。
为什么长距离推理如此重要?
为了讨论长距离推理的重要性,首先我们需要知道感知、记忆、命名、事实、判断以及推理、行动的内涵和关系。
历史学家尤瓦尔·赫拉利在《人类简史》中提到的“人的虚构能力”也就是“人可以想象不存在事物的能力”成为智人战胜其他物种的决定因素。但他仍然把复杂问题的解释简单化了。只要你认真审视自己的日活生活,我们几乎都在按照上述认知能力在思考和行动。
我们通过感官认知外界形成感知,这时只是一些时空中的感性要素;然后由我们大脑区分后对其中特别注意的要素(其他大量信息沦为认识的背景)进行命名,从而形成一个事实;再通过大脑的联接能力,把命名通过逻辑词连接起来形成判断;然后,通过过去经验的总结和对未来的想象,我们形成相应的推理,最后据此形成计划和实施步骤,最后形成行动。
当然,这一系列过程都几乎发生在认知的短暂瞬间,以致于很多人忽视认知的复杂性。
我们可以举一个形象的例子。就在写作此文的同时,笔者的二岁半的女儿已经在客厅拿着塑料的喷壶和铲子对着空气做出舀水、喷水的动作,同时还喊出“水、湿了、擦擦”的单词。
两岁半的女儿就如同人类的童年时代,她学会观察和区分了身边的物品,然后又学会给不同的事物命名(杯子、鞋、壶),然后又能理解事物之间的关系做出因果推断(壶可以用来盛水、铲子可以用来搬运东西)。
并且最厉害的是,她还能虚构眼前不存在的事物,就如同孩子在想象用铲子给喷壶舀“水”,又把“水”从喷壶里倒了出来,弄“湿了”地面或者她的鞋子。甚至于她还能“条件反射”地想起大人们曾反复强调“弄湿了东西要擦干净”的训诫,试图去找东西来擦拭根本不存在的“水”。
如果说许多动物能够制作和使用工具,而且使用起来比二岁小孩还熟练,但他们仍然无法完成人类小孩对于并未实际发生事情的想象的推理和计划能力。这份独属于人类的天赋怎能不令我们惊奇和骄傲。
借用图灵奖得主朱迪亚·珀尔在《为什么:关于因果关系的新科学》对于人的三种不同层级的认知能力的区分:观察、行动和想象(seeing、doing、imagining),我们再深入探讨下当前人工智能可以做哪些或者说还不能做哪些?
第一层是观察能力,即观察到事实A与事实B,随后建立起事实A与事实B的判断X,基于判断X,会影响我们得出另外一个结论Y。