自动驾驶、深度学习、语音识别技术为何近年才突破?
7月23日,阿里巴巴大数据科学家金榕在造物节“科技大咖说”上进行了演讲,和现场的观众谈论关于数据和人工智能等问题,以下为现场演讲。
数据是自动驾驶、深度学习、语音识别技术突破的根源
今天我想说的话题,是数据和智能之间的关系。
我们首先来看一个汽车自动驾驶的例子。现在自动驾驶这个名词已经炒得很火热,但实际上这是一个非常老的话题。
美国卡内基梅隆大学有一个项目-Alvin Project,目的是做一个自动驾驶的车,1994年已经成功地把车从东海岸开到西海岸,全程120公里每小时的速度,基本上是自动驾驶。
大家也许会觉得疑惑,为什么一个20年就已经成型的技术直到现在才开始商业化?实际上一个重要的原因就在于数据的问题。
早期做自动驾驶,收集的数据非常少,大概只有几十个小时的驾驶数据,对复杂路况的处理能力比现在低很多,安全性不够。今天的厂商可以收集几十万小时的驾驶数据,而且数据处理能力很强,能让车在非常复杂的情况下具有良好的处理能力。从这个意义上来讲,大数据很重要。
另外的例子是Google的AlphaGo。很多年前IBM的Deep Blue(深蓝)是非常成功的例子,他制作了一套系统能够跟国际最好的象棋大师做对弈。而AlphaGo系统里的深度学习、强化学习等,实际上在20年前已在游戏中应用。
1996年有一个系统叫TD(λ)的算法,有几位科学家把这个算法应用在一个在美国挺流行的游戏上,很快成为了世界冠军。
更神奇的地方在于,AlphaGo需要读人类棋手的棋谱,从中吸取经验成长成为世界顶级的选手,但是对于TD(λ)的算法来讲,当时做了两个不同版本的算法,这两个版本自己跟自己下了150万盘,就成了世界冠军。某种意义上讲,是自学成才的算法。
那么为什么AlphaGo系统大部分的核心技术点,实际上在20年前都已经很成熟,直到今天面纱才被揭开?关键还是数据问题。20年前的计算机不足以处理这么多的数据,而现在可以。
还有一个比较重要的点是语音识别技术。近几年这项技术有了突飞猛进的发展,智能手机普遍应用语音交互。但实际上语音识别技术是从60年代开始的。很多技术很早就有人尝试,而近两年获得成功,归结于数据处理能力和计算能力,使得它能够变成更加智能化的工具。
数据有一个非常厉害的能力就是挖掘价值。以花呗为例,花呗的背后实际上是个人的信用分,这个信用分基于个人以前的整体行为,把所有的交易行为都形成数据,数据会告诉系统个人有多大的可能还钱或者有多大的还付能力。这个跟美国以前的信用体系有非常大的差别,完全从数据上挖掘行为,测量信用。
另外一方面,很多顾客会关注如何把花呗分数提高?这就需要学习智能的机器人从模型里提取有用的信息,并告诉个人达到目的的途径。
压缩感知技术将会非常重要
在过去的十年间,我认为在统计数学产生了一个非常有力量的技术,它的中文名是压缩感知。这个技术是非常有趣的技术,可以重现历史。
大家设想一下,如果你有一个非常老的、破损严重的照片,你肯定想要有一个机器可以把很破损的照片恢复的没有瑕疵。有了压缩感知技术之后,这些破损的照片,可以重现成很完美完整的照片。这是非常顶尖的几个科学家在最近几年做的杰出的工作带来的成果。
有了这个技术,大家会想是不是相机运用这个技术可以做一些改变?现在的数码相机很便宜,其中一个非常重要的原因,在于数码相机的感光材料是硅,人的感光区间和硅的感光区间差不多,所以硅可以成为非常好的传感器来形成图像。
但硅做不到红外的感光区,而红外感光材料非常昂贵,所有红外或紫外相机通常都很昂贵。想要获得高清照片很昂贵。
所以现在很多公司想要用比较简陋的相机拍摄,运用压缩感知技术把它重现成很好看的照片。美国的莱斯大学正在做单光子相机,希望能做到只测量一个光子就可以把整个图片完完整整的呈现出来。
我个人觉得压缩感知这样的技术,会在以后的时间内成为非常重要的技术。
人工智能和人的智能有什么差别?
接下来我想再谈谈智能。对于智能,每个人都有不同的定义。从机器学习或者是人工智能角度来看,所谓的智能是一个决策函数,这个决策函数有一个输入,比如说一个照片会给出一个决策,它告诉你照片的人是什么。
现在几乎所有的机器学习、人工智能的方法,不管是AlphaGo,还是语音识别、自动驾驶几乎都是用这个方法为基础的。这个智能是我们经常说的人工智能,实际上它跟人的智能还有一个很大的差别,最大的差别就在于他们对数据的依赖。
小孩在学习各种技能时的一个学校过程最多几十遍,人的学习可以依赖于相当少的样本学到知识、技能。但是机器智能基于决策函数的学习方式,需要巨大的数据支持。这就是为什么说只有有了巨大的数据,人工智能才会普遍运用起来。如果数据低于一定的程度,这样的函数是不可能被学习下来的。
最后总结一下,我们正处于一个激动人心的时代,在这个时代能够利用非常大的数据、计算能力,让那些十年前、二十年前研发出来的算法,发挥出巨大的价值。
但同时也要认识到现在这样一个基于函数技术的机器学习或者说是人工智能的方法,也有一个巨大的局限性,对样本的数量有很大的依赖。
到底我们应该怎么去看待人在学习过程中的能力?为什么说人只要需要几个样本就能把一个技能学好,而机器学不好?
从这个角度来讲,我认为现在的数据巨大成功同时也是给在座每一位年轻人的一个巨大的机会,去探究人到底是怎么学习的。