对话吴恩达:离开百度后,聚焦AI+制造业
近期,吴恩达做客播客节目 Greymatter 探讨了自动化、智能化将会在各个领域如何发展,以及机器学习和人工智能的未来。
当然,作为前百度首席科学家,吴恩达还提到了他曾做出的功绩。离开百度后,吴恩达选择了自己创业,陆续创立了三个人工智能项目:Deeplearning.ai,Landing.ai 以及 AI Fund。
同样作为人工智能领域最权威的学者之一,吴恩达依然在为促进机器学习研究的发展而努力。通过网络课程,他目前已向数百万学生讲授了 AI 内容。
以下为对话内容:
机器学习分类及其经济价值
Greymatter:回顾您的工作,特别是机器学习技术的应用方面的,这些技术可以大概划分为监督式学习、无监督式学习、强化学习和迁移学习。您能谈谈这些现在技术以及如何使用它们吗?
吴恩达:人工智能目前具有巨大的经济价值,事实上,它是我们在处理不同情景的大型工具集合,主要有两类不同的问题:
随着现代人工智能的兴起,我认为它带来的绝大部分经济价值是通过监督式学习技术而来的,也就是学习从输入到输出的映射关系。比如,将电子邮件作为输入,判断这封电子邮件是否是垃圾邮件作为输出;或将广告作为输入,判断用户是否会点击这个广告作为输出;再或者在自动驾驶汽车中,输入一张汽车正前方的图片,输出能够告诉我其他汽车的位置等诸如此类的应用场景。通过去探索合适的业务环境,并从中挖掘从输入到输出的映射关系和讨论监督式学习,事实证明这是非常有价值的。
另一个技术大类是迁移学习、无监督式学习和强化学习。
什么是迁移学习呢?假设你想要读取用于放射学问题的 x 射线图片,但没有足够的 x 射线图片,那么这时想要获得一种适用的监督式学习算法也许是很有难度的。迁移学习是一种能让你从海量数据集中学习的技术,例如猫、人、行人和标准陆地目标的海量图像数据集。
因为你能轻松获取大量包含这种目标的图像,迁移学习技术将从这个图像环境中学到的知识迁移到新的图像环境中,用来帮助完成新环境中的学习任务。所以最终当你的人工智能系统读取一些额外的图像时,即使是更小的数据集,它也能够从 x 射线图像中进行识别和诊断。
无监督学习是另一种让人们为之兴奋的技术。假使计算机本地加载数据,并且能告诉我们,“本计算机通过看这个数据,能够弄明白数据关系”,这对于少数应用程序而言是非常有用的。
举例来说,目前很多网络搜索算法或实际操作文本的算法,比如网页搜索,或聊天机器人使用的一种无监督算法。在没有人真正意义上告诉你应该学什么的情况下,这种无监督算法通过在互联网上阅读大量的文本进行学习。关于词汇意思,这涉及到很多东西,无监督学习能从互联网上学会理解词汇的意思。事实证明,这些人工智能算法能使聊天机器人在网页搜索方面变得更好。
强化学习是这样一种技术类型,在生产产品的实例中,我认为能够切实运用这种技术的实例数量远比公关报道中的少。其实,强化学习就像你训练猫或狗的方式,无论你会让狗去做什么,只要是好的行为,你就会告诉它,你做的很棒;反之,只要是不好的行为,你就会告诉它,你这条坏狗。一段时间之后,你的狗将会知道如何做更多正确的事。
事实证明,强化学习对学习玩象棋和跳棋等游戏非常有用,因为,无论何时当电脑赢得比赛的时候,你都会告诉它做得好;反之在当电脑输掉比赛时,你都会告诉它,这次做得不好。经过一段时间之后,电脑将擅长玩这些游戏。
因此,根据当前技术所创造的经济价值而言,我会将监督学习排在首位,其算法通过学习从输入到输出的映射关系实现。其次是迁移学习,从一个对应关系推广到另一个对应关系,接着是无监督学习。然后是强化学习,就目前创造的经济价值而言,强化学习的运用与实际经济价值相比有很大的差距。但人工智能领域正在高速发展,谁知道这个排名会不会被打破呢,谁知道接下来两年可能会迎来怎样的彻底的变化呢?
Greymatter:那么就对世界的影响而言,或就解决新问题的有效性而言,您认为目前机器学习研究在哪些其他领域也很有发展前景?
吴恩达:在深度学习中,最近取得的最新进展是通过 GAN (生成对抗网络)来进行数据合成。令人惊讶的是,在全新的场景下,我们能重新准确地合成人们的照片;或者,根据你对人们特征的模糊描述,我们能够合成这些人的图片,也许你并不认识这些人。而且,我认为技术对娱乐产业造成的影响也可能带动影响别的行业,但在云学习方面的影响还有待观察。
我在哈佛大学时的团队 Brain Team 在这方面做了很多研究,从真正意义上采用机器学习技术来加速其他机器学习算法,这其实是一个很酷的想法和实验策略。我不知道机器学习是否会从根本上改变一切,但这是一个很好的有待持续努力的项目。
人工智能社区具有很大创新性和创造性,这是一个激动人心的时刻,我们既要在人工智能领域做基础研究,又要在这个领域寻找好的技术,并探索如何才能用这些技术去帮助他人。
百度的 AI 转型
Greymatter:离开 Google 之后,你去了百度任职,领导大约 1300 人,您当时是如何决定哪些问题是要重点关注的?
吴恩达:在百度的时候,很幸运我能够与一支出色的团队共事,包括李彦宏,这位 CEO 不仅仅是一位出色的管理人员,他在人工智能研究领域也非常有天赋,并且在公司的技术研发和研发新产品方面也非常出色。
在发展人工智能时,我同时也让百度致力于发展现有业务,所以我们拥有许多项目能支持现有业务,从网页搜索广告到百度地图等等,使用人工智能技术来改进这些不同的产品。我认为百度最擅长的事情是使用 AI 去创造全新种类的产品。
举例来说,针对多数有着小型扬声器的消费电子设备等,我们的操作系统团队为其提供了语音控制操作平台。目前,该团队在中国处于非常领先的地位。我猜想,该团队可能就是中国版的亚马逊 Alexa 团队。
一段人们并不熟知的历史是百度公开发布的智能扬声器,这实际上早于亚马逊宣布 Alexa 的时期。所以这很有趣,这些都属于同一时代的想法,有时在美国出现得早些,有时则在中国出现得早些。
但我认为,百度的人工智能团队主要工作还是支持发展现有业务。并且,我认为支持现有业务能带动很多其他业务,同时结合人工智能技术开启新的业务流水线,例如做操作系统,小型扬声器语音控制平台,或组成无人驾驶团队,他们也出自我的团队。
当你以更开阔的事业看待社会、行业时,我认为,人工智能的机遇实际上反应在两类情况中,一是利用人工智能技术进行转型,这里实际上指的是我们需要关注人工智能落技术落地。二是针对初创公司而言,技术人才有很多新的发展机会,人工智能新技术的浪潮会创造崭新的产业。
Greymatter:我相信美国的一些科技公司也受到了百度转型的启发。曾经在你的带领下,你们的哪些成绩在你看来是成功的拥抱了变化?
吴恩达:在 Google 向优秀的人工智能公司过渡时,我认为 Google 大脑团队在转型中扮演了非常重要的角色。在人工智能战略和技术平台方面,百度的人工智能团队也促进了百度的转型。为了激发人工智能的全部潜能,我认为不仅仅大型互联网公司需要转型,各个国家的不同行业也需要转型。
在人工智能技术时代,我与多个行业的 CEO 保持着交流,并为大型公司转型提供建议。我倾向于去组建人工智能团队,这个团队能够将六种人工智能基本功能集成到多个业务中。假如你是一个大型企业的 CEO,并且有五到十个业务部门要向你汇报,要知道对你而言清楚掌握这五个或十个业务是十分困难的,因此需要建立你们自己的人工智能团队。从 CEO 的视角来看,我认为这样会有更高的成功率。
如果你能够组建人工智能团队,这种内部的影响力能够做到你想要达到的目标。但更重要的是,我们还需要外部的力量。无论如何,不要购买那些将会成为行业内标准的东西,非标准的外部团队能够更有效地开发产品,然后能将他们开发的功能集成到所有不同的业务中。我认为这是帮助许多公司借助人工智能技术转型的准则。
科技世界更新换代的速度很快,相比于过去十年,发生的另一个变化是现在能够以更便捷、更低成本的方式进行学习和教育。十年前,如果你想要对员工培训人工智能理论,你很清楚你能做的并不多。大家一起看书,根据内容讲解,或你给我工资,我来讲课。但是这并不是帮助公司转型的可变通方式。但随着网络数字内容公司的崛起,像 Coursera 能够对大量员工进行培训,这也在很大程度上降低了成本。
Greymatter:在计算机辅助教学方面,你觉得中国和美国的高管会有怎样的文化差异?
吴恩达:无论是行政级别还是公司的其他所有级别,文化都有很大的差异。在美国和中国之间,我认为很多中国公司还比较年轻,它们通常是创始人领导公司。中国公司会普遍很快做出决策,但对一些有比较成熟的董事会控制的上市公司,我们很难说 CEO 能够快速改变公司,并组织去开扩一个新方向。
在中国,很多你所熟知的人,他们见证了过去十年间财富如何积累和消散。很多 CEO 都知道,当下一个科技浪潮来临的时候,如果你转型得不够快,也许下一次就轮到你的公司以这样的方式倒下了。因此,亚洲的公司总是主动尝试新的技术。话虽如此,相比中国,我认为,美国有着更强的基础理论研究能力和技术能力,美国目前还有显著的优势。
谈创业、人工智能落地
Greymatter:让我们来谈谈 AI Fund 和一些你目前正在把握的机会,比如人工智能落地,是什么原因让你决定开始创建公司并筹集资金?
吴恩达:人工智能技术的兴起,让我们能用计算机去做两三年前我们做不到的事情。现在的高中生,他们能下载源码来学习,这在三年前,即使是世界上最优秀的研究团队也做不到。这是多么让人兴奋的时刻,现在低收入水平的国家有机会翻身并且创造全新的企业。事实上,这也许是技术转型中最后一个能够进行提升的主要途径。
我认为苹果、微软在从非互联网公司转型到互联网公司方面做了很大的贡献。所以,实际上我所做的很多工作旨在让人工智能落地着重于帮助初创公司转型,增强初创公司的人工智能技术。
机器学习和人工智能在新事物方面做得很好,AI Fund 就是关注这些方面,它的主要业务与大多数风险投资有所不同。很过人都想知道我们是不是创业孵化基地,答案是否定的,我们自己也是创业者。
我们经常与企业家、人工智能工程师、各种领域的工程师交流,有时是在他们建立孵化公司之前与他们合作,有时是在团队加入之前与他们合作,甚至有时是在他们有具体的想法之前,与他们一起去探索、挖掘不同的想法,然后去建立初创公司。
Greymatter:所以作为一家公司的CEO,关于人工智能技术落地,你主要做了哪些工作?
吴恩达:我们决定从制造业入手,也对多个不同的行业进行了详细调查,包括医疗、教育以及其他一些行业。我们认为制造业是较容易实现人工智能技术落地的行业,并希望制造业成为第一个聚焦转型的行业。
硅谷在数字领域的转型中做了很大贡献,但我们身边绝大多数你能看到的事物是由制造行业生产的。对于我们身边的物质世界,我很荣幸能够参与这次数字化改造,用人工智能技术去实现生产。
也许在国内某些地方,居民消费趋于饱和,但我们是不是能降低实物商品的成本?这是更好的方式,能让世界上每个人得到大约超出百分之十的收入,或者我们让大多数的商品价格便宜百分之十。制造业的模式改进将涉及各行各业,我花了很多时间去工厂参观,这让我感到很激动,我认为我承担着制造业和制造业服务人员发展前景的责任。
Greymatter:这是一个远景,但目前对于人工智能技术的突破,或现代数字技术的突破,我觉得很多制造业事实上是服务不足的行业。许多投资者和企业家会说,公司无法完全掌握自己的数据,举例来说,如果你是一家互联网企业,想要分析公司的广告数据,这些你需要在市场上与客户交谈找到有趣的数据集。
吴恩达:我认为,实际上还没有遇到过一个垂直行业,能做到完全满足于它自己已有的数据。这些伟大的人工智能公司会面临这种情况,尽管他们确实比很多其他公司拥有更好的数据基础设施。
从很多行业中,我观察到一种模式,这种模式是通常会首先出现信息技术革命或数字化革命,然后创建数据,在 IT 信息技术革命之后,人工智能技术革命到来,因为人工智能技术将会运用这些数据来创造价值。
例如,在过去二十年中,社会的大部分正经历着数字化革命。假设你拍摄一张 x 射线图,当前的 x 射线图很有可能是一张数字图像,我们能够对这张 x 图像的像素进行计算,而不是对 x 射线的胶片进行计算。所以,这就是人工智能能否使用的数据,这样处理数据的方式,让人工智能技术融入到各行各业。
Greymatter:您确信在人工智能技术真正落地之前,必须完成数据化变革。
吴恩达:是的,在手机生产方面,我已经做了很长时间,但总无法做到令所有人都对数据满意。一些人希望手机能通过 WiFi 加载数据进行运行,一些人希望手机能通过网络连接,采用 USB 驱动的方式连接到电脑传输数据。