您当前的位置: 首页 > 无限物联

目前的人工智能缺失了一个关键环节

2017-03-14 19:33:04

2012年,谷歌神秘机构X实验室里的1项使人惊奇的项目被世界所知晓。这些具有3百万个神经元的摹拟神经网络在没有人工帮助的情况下,只依托从YouTube里取得的图片就辨认出了图片中的猫和人物。

项目的成员组建了1个新的研究小组,这就是公司搜索部门下面的“谷歌大脑”( Google Brain)。他们和其他的研究者1起很快向世界证明了1个具有几10年历史的发明——人工神经网络将图象辨认和语音辨认的精确度提升到了1个史无前例的新高度。深度学习的成功促使谷歌和其他公司开始大举投资人工智能,乃至使1些专家开始宣称“我们应当为出现比人类更加聪明的软件做好准备。”

但是,谷歌这个“猫检测器”在某种程度上是1条死胡同。近期深度学习的成功是建立在那些需要人工帮助其学习的软件之上的,这极大限制了人工智能的上升空间。

253b78b9-b633-4325-b79e-0d5fde7ebcb7

谷歌的实验使用了1种非监督式学习的方法,软件被输入未经加工的原始数据,然后必须在没有人工帮助的情况下计算出结果。虽然它可以学会辨认猫、人脸和其他物体,但它的精确度还没有到达可使用的水平。深度学习研究和基于此的产品开发的爆发都是基于监督式学习,数据需要人工打好标签以后再提供给软件——例如,我们要给图片中的各个物体都标上名称。

事实证明,这对解决1些问题非常有效,比如说辨认图片中的物体、过滤垃圾邮件,乃至是为用户回复短信提供建议(这是谷歌去年上线的1项功能)。但如果需要软件更好地去理解世界,那可能就需要非监督式学习了,Jeff Dean如是说,他现在领导着谷歌大脑项目,也曾在Google X 的“猫检测器”项目中工作过。

“我非常确信我们需要它,”Dean 说,“当你有正确的数据集时,监督式学习会表现得很好,但终极的非监督式学习会成为构建真实的智能系统中重要的1环——如果你视察人类的学习方式,你就会发现全部都是非监督式的。”

1个绝好的例子就是,婴儿的学习方式为成年时期的智能打下了基础。比如说我们知道,当1个物体移到视野以外时仍然存在,或没有支持就会掉到地上,这些事情是我们通过视察世界而学习到的,其实不需要明确的指引。和动物1样,如果机器人想要探索真实世界,那它们就需要这类常识。这也能巩固更加抽象的任务,例如对语言的理解。

Facebook人工智能研究组主管Yann LeCun说,如果人工智能要满足人们更大的野心,就必须弄清楚软件如何才能完成那些对人类婴儿来讲10分容易的事情。他说:“我们都知道,终究的答案就是非监督式学习。解决了非监督式学习的问题,将把我们带向更高的级别。”

虽然他们还没有得到终究的答案,但Facebook、Google等公司和学术界的研究者正在对某些有限的非监督式学习进行实验。

其中1个研究分支的目的是创造出1个人工神经网络,让它消化吸收视频和图象,并用它们取得的关于世界的知识产生出新的图象——这意味着它们已构成了关于世界是如何运行的内部表征。对世界作出精准的预测是人类智能中1个非常重要的基本特点。

Facebook的研究者建造了1个称为 EyeScream的软件。这个软件可以根据提示(例如“教堂”或“飞机”)生成可辨认的图象。他们也在研究对视频做出预测的软件。Google旗下DeepMind的研究者已开发了1种软件,给它1些部份遮掩的图片,它能用10分真实的图象来进行弥补。

DeepMind还在研究1种完全的非监督式学习,叫做强化学习(reinforcement learning)。在强化学习中,软件被训练来接收关于自我表现的自动反馈——比如说,这些反馈会来自电脑游戏的得分系统。还有1些不使用深度学习的研究者则证明,软件可以从单个例子中学会辨认手写字体(见《人工智能终究能像人类1样学习》)。

但是迄今为止,这些尝试都还没有揭露出1条能让非监督式学习到达人类水平的路径,或说,软件尚不能仅通过经历或实验就学会与真实世界有关的复杂东西。百度硅谷AI实验室主任Adam Coates说:“目前,我们仿佛缺失了某个关键的思想。”

Coates说,随着搜索的继续,监督式学习仍然还能带给我们很多东西:互联网公司可以取得大量数据,包括人们做了甚么事和关心甚么事,可以用这些原料来建造比今天的产品更加有用的语音交互和个人助理等产品。他说:“在不远的未来,你还可以用标记数据来做很多事。”大公司在这方面花了许多金钱,让合约商为他们的机器学习系统标记数据。

Facebook的LeCun相信,研究者不会永久依托标记数据。但是,他谢绝评价软件还需要多久才能到达人类智能的水平。他说:“我们知道原材料,但却不知道菜谱。这可能还需要花费1些时间。”

TAG:
推荐阅读
图文聚焦