当前位置: 首页 > 在线访谈

AI大神Yann LeCun:最聪明的AI在常识方面也不如猫

时间:2018-07-24     来源:      作者:

  目前,Yann LeCun是Facebook人工智能研究院院长,纽约大学的 Silver 教授,隶属于纽约大学数据科学中心、Courant 数学科学研究所、神经科学中心和电气与计算机工程系。

   加盟Facebook之前,Lecun已在贝尔实验室工作超过20年,期间他开发了一套能够识别手写数字的系统,叫作LeNet,用到了卷积神经网络,已开源。他在 1983 年在巴黎 ESIEE 获得电子工程学位,1987 年在 Université PM Curie 获得计算机科学博士学位。在完成了多伦多大学的博士后研究之后,他在 1988 年加入了 ATT 贝尔实验室(ATT Bell Laboratories /Holmdel, NJ),在 1996 年成为 ATT Labs-Research 的图像处理研究部门主管。2003 年,他加入纽约大学获得教授任职,并在 NEC 研究所呆过短暂一段时间。2012 年他成为纽约大学数据科学中心的创办主任。2013 年末,他成为 Facebook 的人工智能研究中心(FAIR)负责人,并仍保持在 NYU 中兼职教学。

  作为一个研究人工智能历史的学生,LeCun可以一个不漏地说出该领域的里程碑事件:始于1956年夏天在达特茅斯举行的一次头脑风暴会议,“人工智能”一词就是在那次会议上被创造出来的。仅仅一年之后,弗兰克·罗森布拉特(Frank Rosenblatt)在康奈尔航空实验室发明了感知器。第一个实现版本是Mark 1 Perceptron感知器,那是一个巨大的矩形机器,包含400个随机地连接到简单的图形检测器的光电池,以及一个可训练分类器。

  “它是第一个能够学会以一种不平凡的方式识别简单模式的神经网络。”LeCun说,“你可以用它们来进行简单的图像识别,但不能识别照片中的物体,也不能进行任何推理或规划。”

  十年以前,模式识别系统一直都需要人类完成大量繁重的工作才能够识别自然图像中的物体。“你需要做很多的工作来构建一个工程模块,将图像转化成一种代表性的东西——通常是一个长长的数字列表,它们能够被简单的学习算法处理。所以基本上你必须亲手完成这项工作。”他补充道,早期的语音识别和由计算机驱动的翻译也是如此:手动工程意味着付出巨大的努力,却没有得到多少回报。

  那么是什么改变了计算机科学呢?“在所有的那些应用中,深度学习和神经网络已经在性能上带来了显著的改善——同时也大大减少了必要的体力劳动。”LeCun说道,“这使得人们可以将这些应用扩展到很多不同的领域。”

  这就提出了这样一个问题:计算机首先是如何“学习”的。神经网络相当于对大脑的一种软件模拟;它们处理诸如视觉图像的信息,并试图得到一个正确的答案。但如果答案不是那么正确呢?输入“反向传播”(backpropagation),这是一种促使神经网络学习的反馈流算法。

  1985年,LeCun写了一篇论文来描述反向传播的一种形式。论文是用法语写的,基本上没有被很多人读过——但至少被一个重要的人读到了。那就是辛顿。在开始在ATT贝尔实验室(晶体管的诞生地)工作之前,LeCun在多伦多大学在Hinton手下工作,担任博士后研究员。

  “所有的机器学习都是关于纠错的。”LeCun解释道。想象一下,给计算机展示”成千上万张汽车和飞机的图片,每一次参数都自行调整一点,输出结果随之距离正确的参数近一点——如果你足够幸运的话,最终会达成一个让机器能够准确识别出每一辆汽车和每一架飞机的配置。”

  描述最终结果的时候,他激动地说:“机器学习的神奇之处在于,即使是系统从未见过的图像,也会被正确地分类。”

  不过,他还是忍不住有点爱开玩笑。“有各种各样的技巧可以让反向传播发挥作用,而且它还是有点黑色艺术——但现在我们有了一个秘方。如果你按照秘方来做,它每次都会奏效。”

  LeCun概述了构成当今人工智能基础的两种不同类型的学习方式:监督式学习和非监督式学习。在监督式学习中——适用于超过95%的机器学习应用——人类操作员训练机器来逐渐提升对图像或其他形式的输入的识别能力。打个比方,把它看作你可以无意识地调整的旋钮,越是调整,机器就会越接近产生你想要的那个输出结果。

  非监督式学习(或者说“自我监督式学习”)拥有着巨大的潜力,尽管它在今天的机器学习中所占的比例要小得多。“它本质上是根据我们从世界上的其他事物中感知到的东西来预测一切。”LeCun说。他以“视频预测”为例:“给机器播放一小段视频,然后让它预测接下来会发生什么。”

  现在的情况有点像是在预测接下来会发生什么,从而实现这种特殊的突破。但可以肯定的是,对于科学家、学者和高科技巨头来说,追求非监督式学习有着十分巨大的吸引力。非监督式学习的好处在于,能够完成我们目前无法完成的所有应用。”LeCun说道,“我们想要拥有智能的虚拟助手,你可以和它们交谈,它们可以理解你所说的一切。它们会有足够的背景知识来在日常生活中给你提供帮助。”

  他停顿了一下。“这有点像电影《她》(Her)。你看过那部电影吗?”简单介绍一下:在斯派克·琼斯(Spike Jonze)2013年执导的这部电影里,华金·菲尼克斯(Joaquin Phoenix)饰演一个孤独的作家,爱上了他的虚拟助手,该助手由斯嘉丽·约翰逊(Scarlett Johansson)配音。原来LeCun很喜欢这部电影。

  “它对人们和变得智能的虚拟助手之间可能会发生的互动刻画得不差。”LeCun表示,“我们还远没有那样的人工智能技术能让我们制造出那样的机器。这主要是因为现在的机器不具备常识。”

  常识?但机器不是很多时候都比人类更善于做决定吗?机器必须要有常识——它们有吗?LeCun解释了它们为什么没有常识:“我们没有能力让机器去学习庞大的背景知识:我们在出生以后的最初几周和几个月里所获得的关于这个世界的庞大背景知识——很多动物也获得了这种背景知识。”

  正因为如此,我们对机器人的一些最简单的假设就站不住脚。“我们不可能有灵巧的机器人。”LeCun说道,“我们不可能有能够把我们的洗碗机装满然后清空的家用机器人。这超出了当今机器人技术的水平,这并不是因为我们不能制造机器人。而是因为我们不知道如何给它们制造大脑。我们不知道如何训练它们,让它们知道该如何握住东西,如何绕过障碍物,如何装载东西。”他补充说:“家猫都比最聪明的机器有常识得多。”

  “对于医学图像分析,我们能够训练卷积神经网络来从CT扫描图或MRI(核磁共振成像)图像检测肿瘤,或者从皮肤图像检测黑色素瘤。”他称,“我认为这将会对放射学产生深远的影响。”

  不管持有什么样的观点,LeCun都一直充满着乐趣,一如当初第一天到贝尔实验室工作的的那个二十来岁小伙。

  7月8日是LeCun 58岁生日那天,他发布推文说:“深度神经网络既漂亮,又光亮透明。”

  QQ图片20180712091402.gif

  

  

政讯通•全国交通运输资讯发布中心 政讯通•全国交通运输调研中心 政讯通•全国交通运输舆情监测中心