射向人工智能的20颗子弹
数据科学和人工智能将如何吞噬世界?
1、之前二十多年的工作,主要涉及到数字化大数据集,建设基础设施来管理大数据集,以及进行大数据集计算的范式。这些都是主要的驱动诱因,也可以解释说,我们这个时代,首先强调的其实还是“数据科学”,然后才是“人工智能”。
2、一旦我们实现数字化数据,并获得可编程的数据,那么明眼人就能看出,下一步就是利用这些数据在未来实现自动化和预测功能。当我们的预测能力变得越来越好,越来越“智能”,此时所谓的“数据科学”这个词,才能逐渐的变成现在人们口中的“人工智能”。但事实上,两者之间并没有很很明显的区别,“唯二的”区别,可能是在对新颖和难度的感知上有所不同。实际上,所谓新颖和难度,其实都会随着时间而发生改变,今天的“人工智能”,就是明天的“数据科学”。
3、对数据进行学习的人工智能,被称之为机器学习。传统的机器学习使用的均是原始数据,然后提取出可以被人识别的语义(也被人认为是功能),接着,机器学习会从这些功能中再学习,继而得出一个最终的机器学习模型。
4、过去的十年,神经网络开始复苏,它是基于在哺乳类动物的大脑中那些松散的突触链接,形成的一种机器学习架构。神经网络提取语义,让人类进行处理。当然啦,在学习算法中导入的都是原始数据,这些数据都是没有经过人类编辑的,于是,人们看似很随意地就把它称之为“机器学习”。
5、深度学习技术和学习模型已经存在了数十年,我们现在看到的,是一波理论创新的大潮,加上现在基础设施和数据可用性愈发成熟,深度学习在经验上也获得了突破。2006年,NVIDIA推出了针对GPU的CUDA计算平台,这是一个真正的分水岭。
6、主要是因为人类构建的功能具有一定独立性,深度学习是学习的自然工具。在数学推理上,人类技能的开发优先于人类自身能力,比如有一些我们过去学到的技能,比如理解负载的数学和语义构建的能力。有一些人类天生就拥有的技能集合,其实很难以一种高水准功能的形式,来准确地表达出来。
高纬度数据问题,数据的维度越高,那么它对人类来说,依靠传统的机器学习技术来靠直觉感知就会变得更加困难,同时构建合适的功能也会变得难度更大。
7、对于那些在我们有能力构建复杂语义之前,已经开发的技能,我们已经在计算机视觉行业里中看到了令人印象深刻的结果,自然语言处理,甚至是玩儿视频游戏。值得注意的是:这里我们所学习的所有技能都不需要数学推理,因此他们是能满足独立意识的高层次语义需要的。
8、在广义的高纬度深度学习问题上,深度学习已经展示了突破性的成绩,举例包括基因组学,石油和天然气,数字病理学,甚至是公开市场股市。
9、最近,媒体在大肆宣传人工智能,因此人工一般只能也引起了人们的关注,它是一种假想的计算机模拟人类智能代理。
10、在很大程度上,人工一般智能是由那些基本拟人技能的深度学习成果尾风所驱动的,到目前为止,我们似乎还没有什么有意义的进展,当然也没有什么竞争力可言。从零到一,就像是在计算机视觉和自然语言处理上所作的努力一样,也更好地说明了这个问题。
11、在不久的将来,这些努力似乎只能在筒仓(silos)上存在,在一些特殊的领域里,一群人会孤立地进行工作。
12、我们开发人工一般智能(AGI)的速度将不会受到任何一个筒仓的约束,但是我们有能力让这些筒仓相互操作,并且通过合适的输入和输出渠道与外部世界联系。首个人工一般智能可能不会是一个有人体表现的机器人,而是以一种实时在线的形式出现,它可以访问全世界的知识,并且有能力通过网络来进行交流。
13、人工一般智能将会模拟人类级别的智能,但是不会表现的“像人类”,知道我们了解、学习自己内部更多的“目标函数”。目前,计算机正在被训练,它们会有专门的域来指定目标函数,这样能把错误减少到最小。直到我们能够知道如何将我们自己内部的目标函数校准,实现标准化,人工一般智能才会变得智能,甚至还会显示出一些意识,但不会变得“像人类一样”。
14、2025年以后出生的孩子,他们会觉得软件能有意识,这种现象可能会忽然出现,速度也会比我们想象的要快得多。
15、人工一般智能对好坏区分的能力将会受到一定比例的限制,因为只有人类才能控制输入和输出渠道。未来,可能会出现很多有趣的争论,话题就是人工一般智能可能存在的潜在恶意行为。最早出现,同时也是一个非常有力的实例就是,我们争论过自动驾驶汽车。
16、对于人工智能初创公司来说,我们正处在一个上升的创新周期,同时也能有资金支持。
17、算法和人工智能学习技术商品化的速度,可能比我们预想的还要快。如果说这一领域里的初创公司想要获得成功,那么就必须要不断的用自己的人工智能模型和用户、企业进行交互,然后寻找一些独一无二的数据,并且不断巩固自己的初期优势。最著名的就要数谷歌公司了,他们可以获取点击流数据,随着时间,用户(特别是企业用户)可以利用这个数据作为私人数据源,也可以进行学习交互,来提升自己的排名。
18、虽然我们身处在人工智能的春天,但仍然是在早春阶段。一旦有某个小团队在人工智能领域里有所建树,那么大型科技公司便会砸下重金,进行收购和兼并。这些人工智能领域里的新奇成就,如果说允许外部成熟一些,即便存在一定风险,对于大型科技公司来说也是可控的,因此我们到目前为止,已经看到了在人工智能领域里有较大规模的收购或兼并交易出现。
19、人工智能工具公司将会需要构建更具粘性的平台,这样才能在商品化相关产品的时候具有竞争力,同时也能让风投看到一些有价值的产出。
20、最后,在未来五年,硅谷将会出现转型过渡。如果那知名投资人Marc AndreeSSEn当初的一句话“软件正在吞噬世界”来类比形容,那么就是“数据科学和人工智能正在吞噬世界”。