没资金、缺工具、怕 BAT,谁来拯救中国的 AI 开发者们?
尽管在年初被区块链短暂抢占过头条,但人工智能依然是 2018 年最令科技行业关注的领域之一。
当然,这种关注已经不再局限于人工智能所能代表的未来远景,而聚焦当下的具体考量,比如围绕人工智能落地能力的质疑就成为今年诸多创业公司所面临的巨大挑战,更进一步,尽管过去几年诸多科技巨头,如 Google、FB,相继开放了自己的深度学习框架,业内也有不少开源的训练数据集,但人工智能开发者依然处在一个非常尴尬的阶段,当企业老板们不断督促开发者们加快研发速度的时候,这些开发者却发现,他们成了一群看似风光却有苦难言的人。
国外的月亮到底有多圆?
作为当下人工智能领域最具代表的女性科学家,李飞飞常常将「人工智能没有国界」这句话挂在嘴边,这句话当然没错,但如果考虑到李飞飞是在推广 Google 深度学习开源框架 Tonsorflow 语境下去说这句话,或许我们还应该多一点疑问:难道国外的月亮真的那么圆?
我们不可否认 Tensorflow、Cafe 等国外开源框架给整个机器学习行业所带来的意义,它不仅直接降低了机器学习的门槛,也给了全球人工智能从业者们几乎平等接触新技术的机会。
国外常见的深度学习框架
但人工智能远不是技术那么简单。与过往软件开发相比,人工智能开发首先需要海量的数据支撑,这一点行业内的多个开源数据集或许可以解决问题。
其次,有了数据之后开始训练模型,这需要强大但必须廉价的计算能力,以 Google 力推的 Tensorflow 为例,你当然可以在本地进行数据计算,但选择价格高昂的英伟达 GPU 并非每个开发者都能承担。那剩下的选择就只能依靠云端,Google Cloud Plateform 的确拥有强大、灵活、低价的计算能力,但考虑 Google Cloud 没有在国内落地,当要部署产品时,时延始终是一个无解的问题。
再次,即便上述难题都可以解决,Google 、FB 这些等巨头几乎无法触及到中国人工智能开发者生态体系,这意味着,除了技术红利外,中国的人工智能开发者们根本得不到资金、接口、测试环境、解决方案等层面支持,尤其是中美两国人工智能开发、创业的大环境有很大差异。因此,中国开发者们可以利用 Tensorflow 等国外优秀的开源的框架快速了解技术发展态势,但要真正依靠这些框架实现人工智能开发的全流程甚至创业拿融资,几乎是不可能的事情。
可以信任 BAT 吗?
历史上,在美国西部淘金热中,纵然只有一部分人淘到金,更多淘金者死于人性的贪婪,但却成就了一批为淘金者提供服务——如衣服、工具——的公司。
在中国人工智能这场淘金热中,这些提供服务的公司也无处不在,比如 BAT。
这些国内巨头天然比 Google、FB 更懂中国市场,他们也能提供更多的资金、资源支撑,但摆在人工智能开发者以及人工智能创业公司面前的,却有两个不可回避的矛盾。
其一,与互联网领域的创业类似,如何站队以及站在哪一队可能是一个比技术选项还要困难的选择题 。特别是腾讯、阿里所信奉的「买赛道」投资逻辑,同时投资某特定领域的两家甚至多家公司,这从投资角度来看当然是一种最理性的选择,但对创业公司而言,却是一个巨大的不确定性。
而在国内,人工智能创业几乎拜托不了 BAT 的阴影,你的人工智能电商产品要么会被阿里巴巴灭掉,要么归于腾讯旗下;你的人工智能社交应用也需要在阿里和腾讯之间左右逢源才能拥有流量支撑。
其二,对于广大中小人工智能开发者们而言,BAT 看似提供了一系列资金、资源的赋能计划,却也是一种对于自身产品的营销宣传 。比如当下基于云端机器学习的产品,BAT 依托自己的公有云平台都提供了非常诱人(就是低价)的入门选择,但就像上文所言,人工智能开发的链条非常长,从模型训练到部署需要不少计算资源,目前这些云平台的计算资源费用依然高举不下,最终也是转嫁到开发者们身上。
正因为此,很多开发者们为了节约成本智能减少相关测试,并快速将产品投入市场,而由于产品功能没有得到足够测试,导致产品体验无法真正得以保证。
人工智能开发者们到底需要什么?
站在开发者的角度去看人工智能,首先,能否提供一个更灵活的硬件环境,比如芯片的选择,Google TPU 固然是一个非常好的产品,但该产品只支持云端训练,而英伟达 GPU 显然也不是面向最普通的人工智能开发者群体。
其次,能否提供从模型训练到模型部署的一体化框架。目前的开源框架更多围绕的是模型训练,而从训练到部署,却是两个完全不同的问题。比如,由数据科学家和机器学习研究人员完成模型构建和训练,而部署则由软件工程师、机器学习工程师和数据工程师来完成,再比如,模型训练通常由多人在多台虚拟服务器上完成,而部署模型需要具备扩展的能力,能够处理海量的 API 请求。
第三,可能也是最重要的一点,在国内,除了 BAT 之外,还有谁能提供面向人工智能开发者的服务?这不仅需要技术过硬,还需要拥有强大的品牌效应,从而快速形成人工智能生态。
一个可能的候选者:华为。
长期以来,华为作为一家 IT 硬件厂商,使得其积累了不少硬件研发经验,从而具备了在人工智能芯片领域的研发能力。而如果考虑到这几年智能手机上海思麒麟芯片的表现,或许我们也可以期待华为在云端人工智能芯片的布局。
另一方面,如上文所言,人工智能开发链条非常长,使得面向开发者的服务必须投入巨大的人力、财力和物力,从这个角度去看,BAT 之外,也只有华为才能支撑起这样的巨大投入。
事实上,上述猜测也可以从最近华为的一些对外表态中得以佐证。在本月初的一次公共活动上,华为公司轮值董事长胡厚崑强调,人工智能面向企业是华为下一步发展的重点。而再联系到今年 4 月时任华为轮值董事长徐直军对今年华为全联接大会的表态,也可以进一步证实一件事:华为的确要在人工智能领域发力,时间可能就在 10 月份的全联接大会上!
现在去搜索华为 2018 全联接大会官网可以发现,AI、云俨然是大会的关键词,同时在日程里也可以看到「华为将首发AI战略,以全应变,敬请期待!」的表述,种种迹象都表明了华为在人工智能领域的布局,以这家公司的体量和行业号召力,的确有实力给人工智能开发者,尤其是中国人工智能开发者带来惊喜。
在不久前举行的[2018中国国际大数据产业博览会] 上,华为云 BU 总裁郑叶来提出了{华为云 普惠AI}的概念,提倡要让 AI 高而不贵,让所有企业用户用得起、用得好、用得放心。而这大概也是华为发力全栈AI战略的初衷吧。但到底如何解决困扰人工智能开发过程中的难题和痛点,我们只能拭目以待了。
写在最后:开发者的黄金时代正在到来
表面看起来,历次技术革命所带来是工具革新,但背后的真正驱动力却是人,或者准确地说,是掌握新工具的人,这个规律在人工智能时代也适用。
我们看到了Google、微软在开源项目上的巨大投入,我们也目睹了 BAT 为争夺开发者们关注的激烈角逐,但一场场以「开发者」名义的大会背后,却并没有给人工智能开发者们带来可以真正解决问题的工具,他们依然缺乏资金、依然在不同工具之间切换、依然担心巨头们诱人项目背后的套路,这远不是人工智能发展的理想状态。
可喜的是,上述这些障碍和困境也正在被解决。上月的 Google Cloud Next 大会上,Google 发布了面向终端机器学习的芯片 TPU Edge,意图也是打通云到端的机器学习。以当下这个时间节点去看,2018 年接下来的日子里,包括 NIPS、IEEE ICDM 等重磅人工智能学术会议还将悉数登场,而华为 10 月份的全联接大会,在一系列预热之后,也势必成为人工智能开发者、研究者们需要重点关注的会议,属于人工智能开发者的黄金时代正在到来。