物联传媒 旗下网站
登录 注册
RFID世界网 >  新闻中心  >  物联网新闻  >  正文

科技公司的"军备竞赛":人工智能迎来大爆发

作者:本站采编
来源:科技派
日期:2015-07-06 09:38:27
摘要:提起“人工智能”,人类似乎总会陷入某种过分的恐慌之中。去年10月,特斯拉公司CEO埃隆·马斯克在美国麻省理工大学的一次演讲中,将人工智能技术描述为“对魔鬼的召唤”。他说,研发出和人类智能势均力敌的“人工智能”,可能是人类面临的最大威胁。

  提起“人工智能”,人类似乎总会陷入某种过分的恐慌之中。去年10月,特斯拉公司CEO埃隆·马斯克在美国麻省理工大学的一次演讲中,将人工智能技术描述为“对魔鬼的召唤”。他说,研发出和人类智能势均力敌的“人工智能”,可能是人类面临的最大威胁。对于这点,马斯克绝非在单打独斗。哈佛大学的一位哲学家尼克·博斯特罗姆也把人工智能与全面核战、巨型流星撞击地球等一起列为巨型灾难,而他本人正是“生存风险”这个概念的创始人之一。同时,剑桥大学“生存风险”研究中心的创始人里斯勋爵也认为,人工智能给人类带来的生存威胁非常严重,而他曾经执掌英国最先进的科学团体—英国皇家学会。

   提起“人工智能”,人类似乎总会陷入某种过分的恐慌之中。去年10月,特斯拉公司CEO埃隆·马斯克在美国麻省理工大学的一次演讲中,将人工智能技术描述为“对魔鬼的召唤”。他说,研发出和人类智能势均力敌的“人工智能”,可能是人类面临的最大威胁

  人工智能的“军备竞赛”

  不过,这些来自资深科技专家的深深忧虑,与人工智能这个领域内部充斥的乐观态度以及迅猛发展,形成了鲜明的反差。一些世界知名大公司,如谷歌、Facebook、亚马逊、百度,甚至开始了一场关于人工智能的“军备竞赛”,他们争先恐后地挖角科学家、建立实验室、购买启动设备。总体看来,人工智能业内人士并不担心被自己的造物所超越。其实他们也并没有创造什么新的“思维模式”,只是让原本只能由人来做的事情能够被机器所完成而已。

  近年来,从计算机、平板电脑和手机上产生的图文数据浩如烟海,但计算机还是可以运用强大的计算能力将这些数据摆平。这多少说明了一件事:现在的智能终端,处理语言和图像是越来越在行了。在商家雇主留意到这一点的同时,很多担心自己饭碗的人也注意到了这一点。如果计算机能够辨认图像或翻译语言,那么会引发两种情况——要么促使智能计算机(或程序)的广泛应用,要么使得一小部分会用这些计算机程序的人类工作效率大大提高。无论哪种情况发生,结果都会使不少从事图像或语言工作的白领们站到等待失业救济的队伍中去。

  现在,人工智能大爆发的迹象仍然比比皆是。去年,业内相传谷歌为一个叫作“深思”的伦敦人工智能创业项目投入了4亿美元,在Facebook的眼皮底下攫取了这个公司。而后者也在积极建立自己的人工智能实验室。目前Facebook的实验室由纽约大学的明星研究者雅恩·乐存领导。而谷歌曾经雇佣的人工智能大师级科学家——来自斯坦福的安德鲁则又被挖角到了百度在硅谷建立的人工智能公司。同时位于芝加哥的叙事科学公司、位于英国剑桥和美国麻省的肯硕公司也都沐浴在投资人的“钱雨”之中。叙事科学公司致力于用人工智能撰写财经报道(《福布斯》杂志现在已经开始应用这个发明),而肯硕公司则努力在开发一种能够进行数据投资分析的人工智能。今年4月,IBM公司也宣布他们要在一款智能计算机的基础上,研发一种能够分析健康报告并提出医疗建议的人工智能,而这个作为基础的Watson智能计算机,曾经在2011年一场美国智力竞赛中完败两名人类冠军。

  人工智能的关键:能够深层思维

  其实,对人工智能的研究几乎是与对计算机的研究同时开始的。其中最令人兴奋的部分被叫作“深层学习”,以前也称“机器学习”,它指的是计算机通过大量运算教会自己学习的一种能力。这个问题困扰人工智能研究者也不是一年两年了。通常,对人类来说很困难的东西对计算机来说却很简单,比如一秒钟进行多次复杂运算;而对人类来说很简单的东西对计算机而言却很难,比如听懂一种语言或是辨认图像中的各种物体或人脸。

  各种运算、计算机只需要建立公式和方程规则,然后开始按照它们解方程就好。而对于语言或者图像,计算机就没有那么多清晰的规律可循了。举个例子,正常的成年人很容易从一堆电影里分辨出色情片和艺术片(即使它们同样都有裸露镜头),而这其中大脑是怎么运转的却没人说得清楚——这个事实是由美国高等法院大法官波特·斯图亚特发现。这位可敬的法官在试图对色情片进行清晰定义时惨遭失败,只好无奈地写道:“我一看就知道这是个色情片!”

  “机器学习”指的就是让计算机学会这种它们不能给出清晰定义和规则的事情。做到这点也并非毫无可能,不过实在是需要非常非常巨量的数据运算。

  为了解决这个问题,目前很多人工智能运用的是一种叫作“神经网络”的技术。这种用来进行分析统计的技术虽然很有些年头了,但其实非常有价值。早在1950年,研究者们就发明出了神经网络结构,那时他们还不知道“智能”为何物,不过能够确定的是,人类的大脑也有这样的结构——人脑不是通过晶体管,而是通过神经元进行信息处理的。而神经元是一种多触手、高联结的细胞,他们通过彼此来传递生物化学信号刺激——这可能就是某种智能活动的形成。

   智能终端

  神经联网系统

  然而,人类的神经元细胞极其复杂,要想模仿谈何容易。至今能用在人工智能中的信号刺激与人类神经元之间传递的生物化学信号相比,简直就是拙劣的卡通和真实世界的差距。但即使是最笨拙的模拟神经网络系统,对某些任务来说也是相当有益的。微软的人工智能专家克里斯·毕晓普指出,早在1960年,电话公司就曾经运用神经网络结构来消除电话里的回音。不过,它需要的计算实在太多了,那时的计算能力限制了接受刺激信号的网络范围,从而限制了这种技术的发展。

  最近几年,由于要绘制电子视频游戏中的图像,电子芯片的计算能力被大大提高了,因此人们对神经网络系统的兴趣得以回升。以前那种几十个或几百个神经网络系统被看作一个单层结构,而谷歌最新的研究成果中,能接受刺激的“神经元”高达10亿个左右。正因为有了大量仿制神经元可供研究使用,科学家们可以将它们按照人类大脑的结构联结起来,造出多层、分层结构,而正是这样的结构,带来了计算机“深层学习”的能力。

  这种神经联网的每一层都担负着不同的任务。以人脸图像处理的过程为例——

  第一层主要处理原始图像,它会注意到图像中每个像素的亮度、颜色和它们在图像中的分布情况;

  第二层则会把第一层观察到的东西用更抽象的方法归类,分辨出图像的边缘、阴影等;

  最后一层对图像边缘、阴影进行逐一分析,识别出眼睛、鼻子、嘴唇等特征。——这样就可以完成对任何一张面孔的识别了。

  要想让这种机制真正起作用,需要对计算机进行训练。训练的方法是让计算机处理大量的图像,这些图像中有的是人脸,有的不是。计算机的任务是将其中的人脸图像分辨出来,这就需要它自己来给自己设定一定的程序,在统计规则中找出人脸的抽象共性。如果它处理真实世界的人脸图像没有什么问题,就说明训练成功了。人声识别系统的训练也是同理。

  要做到这一点,“深层学习”的算法需要努力去学习这些人类的技能,但是这其间还是需要人类帮助的介入。例如,在输入图像初期,人类要注明哪些是人脸,哪些不是,好让计算机能有个大概的印象。早期的计算机的“教材”会受到数据量的限制,但互联网的存在使得这个限制消失了——百度、谷歌和Facebook上面有着无穷无尽的图像资源,而且上传者还会对这些照片和图像加标签、作评论。“聪明”的计算机会从这些海量的“教材”和“注释”中总结出模式、规律和范畴。

  因此,计算机交出的答卷相当令人惊叹。2014年,Facebook公布了一款名为“深度面孔”的算法,这个算法可以成功辨认出网络上97%的真实人脸图像,即使有些照片中人脸被遮住了一半或是光线很暗。这基本上已经达到了人类对面部的辨识能力水平。而微软也在炫耀自己为科塔娜(一款数码个人协助软件)开发的高精度识别算法——这个算法能够分辨出极其相似的彭布洛克威尔士科基犬和卡迪根威尔士柯基犬。所以,目前这种技术已经相当成熟,包括英国在内的一些国家已经在应用人脸识别系统处理边境事务了。另外,除了图像,从视频和音频中识别出人类迹象的技术,对警察和间谍来说也有着无法抗拒的吸引力。今年5月5日的一份官方报告中显示,美国警察已经可以应用某种程序把电话录音转成文字,使得其中的某些信息更易在网上搜寻。

  图像识别是最基本最重要的能力

  然而,互联网上带着标签的照片尽管数量浩大,但也是有限的,人工智能的下一步是让计算机掌握“无人监控和帮助”的学习。谷歌团队的安德鲁博士已经开发出了这种成果:它的计算机可以在数以亿计youtube视频中分辨出人脸和猫脸,而这些视频并没有任何的标签或名称。经过一段时间的分析,计算机也能自己找出规律并完美地完成这个任务。

  更进一步的尝试,是在一幅复杂的图像中分辨出不同的组成部分。斯坦福大学的一篇论文中已经表明,某种计算机程序已经可以把一张早餐桌的照片中每种东西都分辨出来并用英语标注,如红色的花、香蕉片或是一杯水等。

  大型互联网公司热衷于人工智能的开发,主要是因为这项技术对他们来说利益攸关。短期来看,计算机算法对图像、声音的分辨能力越高,客户查找搜索的时候就会越方便;从长远来看,这项技术对智能机器人的发明意义十分重大,从自动驾驶汽车到战场作战机器人,在纷繁的真实世界识别图像都是最重要也是最基本的能力。

  图像分辨技术也可以应用到现实的领域中去,谷歌眼镜和微软全息眼镜已经开始使用这种技术了。美国旧金山的Enlitic公司也在尝试用计算机图像识别技术来支持X光和核磁共振图像,这样有可能发现一些医生肉眼错过的异常情况。

  其实,深层学习能力不仅仅体现在图像识别方面,任何一种需要大量接触数据的领域都有它的用武之地,不管是运营保险公司还是从事遗传学研究。在世界上最大的粒子实验室CERN实验室中,人们还真发现了人工智能深层学习的妙处——一个能够深层学习的计算机自己写了一套程序来识别亚原子粒子,它的程序居然比物理学家们自己编写的程序更加有效。另外,一些研究者做了个会玩电子游戏的程序,这个程序玩起“太空入侵者”来居然超过了这些人类玩家。

  并非机械中的鬼魂

  更好的智能手机、更精密的机器人和更方便的网络,对世界来说无疑是一种福音,但这些已经学会了图像语言识别和自编程序的机器人,是否会让文章开头中马斯克的担心成为现实呢?这些聪明能干的计算机,是否超越了它的创造者的智商而迈出了重要、危险的一步呢?

  这些“机器人末世论者”其实有一个很有力的论据握在手中——近年来对人类大脑的研究表明,人脑就是一架由正常细胞、正常原子构成的机器而已,它也遵循着一切科学自然原理,也就是说,并没有一种叫作“精神”的东西来推动大脑的运行。创造出一个人造机械大脑,也许只是外观上有所不同而已,原则上是完全可能也完全可行的。

  不过,原则上可行和现实中的应用远不是一回事。波士顿的Rethink Robotics公司的一个人工智能科学家罗德尼·布鲁克斯指出,最令人纠结的是人们怎样理解“智能”这个词。是的,现在的计算机对某些目标的识别能力极其精确,让人感觉毛骨悚然。但它们没有目标、没有动机,对自己的所作所为也没有任何思考。在这些方面,人工智能并不比一张纸或一个天气建模更加智能到哪里去。

  其实,人工智能在运行中运用了很多非理性的方法,只不过产生的结果使得它们看起来像是有些“理性”而已。就像另一位人工智能先驱者埃德加·迪克斯特拉所说,人工智能只是看起来很厉害很复杂,“就像潜水艇看起来也很厉害很复杂,但它会思考吗?”

  另外还有一些例子可以轻易打消人们的疑虑。有研究者已经发表论文来论证这些所谓高智能的图像分辨计算机是多么容易被人们愚弄,在没有任何提示和任何背景提供信息时,这些智能软件的答案往往令人啼笑皆非。研究者甚至可以制造出在人看来就是一团随便涂鸦的图像,但这些图像有某种误导智能软件的能力,所以智能软件往往把它们错误地识别成一种具体的东西。

  不过,新技术的诞生总会影响到工作机会。也许在将来,人们的智能手机的计算能力就可以顶得上现在一座城中所有电脑的总和,那时人们不需要翻译也不需要体检医生,一切相关服务都在他们的口袋里。而人们为此所付出的,只是一块手机电池的费用而已。

  总之,更加智能的计算机绝对是一种革命性的技术,但绝不是马斯克先生和里斯勋爵所担心的那一种。当然,也许在遥远的未来,会有机器合成带有人类性格的仿真大脑,但是在那一天到来之前,还是先担心一下自己的工作会不会被眼前的人工智能抢走来得比较现实。