刷脸支付将会成为人脸识别下一个引爆点
4月22日-23日,2015中国移动支付产业论坛在北京召开,与会并发表《刷脸支付助力移动生活》演讲,他表示人脸识别技术由于大数据的时代,由于等等算法的提升,有了很大的进步。因此在跨场景人脸确认这一步已经做的比较成熟。所以,他提到在人脸识别支付上就会成为人脸识别下一个引爆点。
演讲速记:
非常荣幸有机会在这儿跟各位朋友交流一下人脸识别在移动支付上的应用。来了很多老总和朋友,对这个行业分析非常清晰。作为中科院的科学家,他觉得有这个机会给大家从技术的角度讲一下现在比较热,比较火的生物识别技术在支付领域的应用,他觉得很荣幸。
他跟大家报告的有四个方面。首先,简单介绍一下他们中科院,他们这个部门研究这个事情的背景。他自己在UIUC博士毕业,他的到导师是Thomas Huang教授,他是美国的工程院院士,全球IT业界誉为计算机视觉之父。他们在美国期间,从2007年开始,到2011年参加了一系列图像和视频的国际比赛,基本上都能够获得世界冠军。
因此,在2011年,中科院是跟UICC还有新加坡国立大学联合成立了智能多媒体研究中心,就落户在重庆研究院。所以,他们就一起来联合研究人脸识别技术。2015年中科院重庆研究院又联合加州科技,是A股的上市公司和杰翱资本一起成立了云从科技。这个公司专注于人脸识别方面的应用,主要在安防和金融两个领域来展开,这是他们自己背景的一个介绍。
第二、跟大家分享一下关于人脸识别在金融上面的应用。他们之所以现在提出要用生物识别技术作为一个传统的移动支付的一个辅助,主要是因为传统意义上的支付由于是人工操作比较多。因为以前人民银行,包括证监会也没有开放可远程做这个事情,所以他们基本要在柜台做柜面操作,肯定就存在排队、各种响应的问题。另外,他们上班时间也很忙,所以要做到7×24小时服务,用人工也是很困难。第二、实际人工操作也并不是很安全。他们国家要求按照人民银行和银监会的要求,必须要强识别认证。也就是说,必须跟本人身份证,所有的金融行为要求是在本人真实意愿下面的行为。但是,实际上身份证照片跟本人是不是同一个人,用人眼来看是非常不靠谱的,后面有具体的数据来说明这一点。这是一方面。另一方面由人工操作实际上是经常犯错的,315的时候也曝光,包含像工行、农行这样的大行,因为人工操作造成的错误,造成的冒认很大经济上的损失是很常见的。第三、他们用人工的操作,实际上很麻烦。他在去年就跑银行很多趟,基本上都是一些很小的事儿,比如打印一个流水单,或者改密码,一系列的事都必须到银行,还面临漫长的排队,这些事情他们都是有办法通过高科技的手段来简化的。
因此,他们采用人脸识别技术作为它未来高科技的一个技术,它实际上具有几方面的优势。第一方面,人脸识别技术它实际上比人工的识别要更安全。他们目前人脸识别的水平已经远远的超过人眼的水平。这个可能各位在媒体上也经常能看得到。实际上人脸识别很多对人来说,觉得很难的,包含像双胞胎一类。因为电脑可以很精确的识别一些人在尺度上觉得很接近的东西,但是可以识别的很清楚。第二、当然采用人脸识别,包含他们今天讨论的要有移动支付,它的方便性远远超过在柜台人工的操作。第三、它当然也是很高效的,因为这个本身也是他们为什么今天在这儿讨论的一个原因。
但是,他这个跟大家科普一下,事实上大家都说人脸识别,大家讲人脸识别概念的时候,实际上站在专业的角度来说,它实际上还有很多的区分。他今天跟大家讲几个概念:
第一、人脸确认和人脸识别,这是两个不同的概念。人连确认是他给你一张图,或者一个视频,告诉你这是张三,机器学定这是不是张三。人脸识别的问题,他现在给你一张图,也不知道是谁,你帮他识别。所以,人脸确认的难度要远远低于人脸识别,这是两个不同的概念。
第二、他们称为相同场景和跨场景。相同场景是指他们所有做人脸识别存在一个注册的过程和测试的过程。如果注册的图片和测试的图片是在一个同样的基本相似的环境下,或者采集设备相似,或者时间跨度不是很大。上面的两张图就是相同场景的情况,这种情况下,识别难度相对来说比较低。比如他们经常看到一些人脸识别考勤,他们先去注册,接下来在相同行业再去使用,这个比较简单。跨场景,就是指注册的图片,不管时间还是采集的环境,和测试的环境不一样的情况,叫跨场景。比如他们经常使用到的,他们注册的是一张身份证照片,测试图片是一个现场的手机拍摄,或者视频中的照片。这个时候因为它本身的采集条件,年长日久,大家觉得长的不太像,这种情况下,跨场景的难度高很多。
第三、配合和非配合。所谓配合就是指纹识别对象本身是想通过这个识别的。这种情况下,它会很认真的跟这个混淆配合。这种配合的情况下,首先能够稍微长一点时间,各种条件都会比较简单。非配合的环境是指识别对象不配合这件事情,比如公安、反恐应用中。通常他们追查逃犯的时候,逃犯意愿上不希望被识别。
这三个大的条件,定义出来人脸识别完全不同的应用。他简单的举了几个例子,画了一个圈看这个事情。如果在相同场景下做人脸识别,这就是他们以前大家看到的因为是相同场景,所以难度比较小。第二、跨场景,但是是人脸确认,就是右边这种场景,就是他们在今天这个论坛上,他要用到的人脸的移动支付,这就属于跨场景,他们经常的注册跟实际测的完全不一样。但是,大是一个确认问题。因为他希望通过他的钱包付钱,基本上看是还是不是。同时,这也是一个配合的情况。如果是跨场景的人脸识别,基本在公安、追逃的时候要做的,场景不一样,同时不知道这是一个谁,只是在一个很广泛的黑名单库希望把他搜索出来。
人脸识别有时候觉得好像做的挺好,有些时候又不能用。这跟他们这些大的分类有很大关系,跟今天技术走到哪一步有很大关系。所以,过去一些年他们可以看到门禁考勤可以用,其他场景基本上都是不能用的。但是,到现在在过去的这两年,他们的人脸识别技术由于大数据的时代,由于等等算法的提升,有了很大的进步。因此在跨场景人脸确认这一步已经做的比较成熟。所以,他们提到在人脸识别支付上就会成为人脸识别下一个引爆点。再往后面,才是跨场景的人脸识别,所以公安广泛追逃上才是下一个场景的应用。
他提出两个移动支付人脸识别的场景,他们只要证明是他本人,他们会把这个照片与公安联网的库,或者之前注册的人脸相比对,如果通过,它就可以付钱。这是跨场景配合的人脸确认问题。
移动支付的另外一个场景,比如在实体店,他们在出去逛街的时候看到好的东西,但是他是会员,没有带卡,也没有带钱包,他们怎么办?这个时候他们可以在柜面上,如果刷脸支付,你告诉他们柜员,他是VIP,一认证就可以付钱。这是跨场景配合的人脸识别问题,因为这个人脸识别范围比较有限,而且是配合场景。因此,这个难度比前面一个难度略高。
实际上在金融业非常关心的一个问题是刷脸支付安全性到底有多高?首先他们看看这个难度有多高?这个地方现在ABCD每一组,一张是身份证读卡器读出来的图片,一张是实际实拍的现场照片。实际要判断他是不是本人?他相信你肉眼看也是很难的。这张答案是前面两组不是同一个人,下面两组是同一个人。他们通过2000对身份证的照片发现一个问题,人眼识别率其实只有72%,但是目前机器的识别率能到96%。其实现在机器的识别率已经远高于人了,但是它也做不到百分之百的准确,还有4%的错误率,但是人眼更不靠谱,大家已经习惯了,也就这么过去了。但是,他们仍然应该可以采用机器提升这个效率。
第二、如果他们有自动的识别,还要考虑到攻击的问题。比如假如说他们觉得马云很有钱,他们想伪造他花他的钱,你有两个办法,一个是事先在网上下一些他的照片,用照片对着手机,伪装他来攻击。这种情况他们要用活体检测,你只是一张照片,他判断你这个不是活体,就不能够通过。你说他们下一段马云的演讲视频,对着手机伪装他,这个就叫视频攻击。事实上他们应对视频攻击,现在已经有全系列的动作识别、语音识别和语义识别,三位一体的活体检验的方法。也就是他们可以自动的提示你做一些随机的动作,或者让你读一个数字串,通过识别你的唇型判断你是不是按照他的要求做的。
所以,为什么说人脸识别相对比指纹识别等等其他的一些生物识别手段,对于防攻击有一个安全的问题。因为活体安全问题,在手机上是做不了的。总结起来,人脸识别在准确性上面做不到百分之百,但是能比人眼准很多,它对人眼是一个很好的补充。从安全上来说,各种工具手段是有一个很好的防范。
第三、核心技术。实际上人脸识别这个技术是需要用数据和系统这两块来支撑这个理论体系。过去实际上规模比较小,2010年以前,人脸识别效果很不怎么样。到2010年以后,有大规模的数据以后,人脸识别有很显著的提高。但是,光是有大规模数据是不够的,这个数据你只是在外面胡乱采的数据是不够的,他们需要有所谓结构化的数据。就是他们实际上任何一张照片,一张人脸照片有很多属性,不光是指他是谁,他的ID是一个属性。同样,这张照片是在什么光线,有没有遮挡,有没有角度,有没有表情等等一系列的标签,联合定义了这个照片。他们实际上平时如果只是在网上随机下载照片,或者装一个摄象头在路上随便拍,是缺乏规范的照片。这种照片对他们识别来说是不够的。
因此,他们中科院在重庆自己花了很大的力气做了全球首创的可移动、可拆卸的这么一个采集阵列。有上百个摄象头,他们把这套设备可以完全同步获得所有决却的你的表情、角度、光线、遮挡等等一系列都定义好的照片,而且他们在通道、在银行,还有在其他任何地方可以做这个事情,这个叫做超大规模的结构化的数据,通过这样的数据,才能有对应的更精确的算法,把这个识别率做到很高。
第二、人脸识别其实有超过20个模块来辅助,成为一个算法的系统,它才能在实践中非常好用。因为真正如果在支付中用人脸识别,要应对各种情况。比如现在光线不行,要给用户很好的提示,他对焦不准,要给他提示,大小不够,要给他提示,等等一系列,你要生成他的证件照等等。只有这样才能真正做到又安全,又方便,实现他前面讲的真正比人更方便。因此,这需要有一个很大的算法平台,这需要有很多科学家做这个技术积累,而不是简单在数据库上面做比对实验。因此,这个也是他们基于整个一大套理论在过去很多年集成研究这个事情,提出一套理论把它做到实践化。
实际上人脸识别以前更多用在安防上面。他们本身做的人脸识别产品已经形成一系列的自动通关,智能摄像机等等一系列产品,这也产品本身已经在国家很多安防领域产生了重要的应用。
他只举一个例子,他们在新疆边防所有的总队使用他们人脸识别的通关,为新疆的安全他认为做是蛮大的贡献,这是最开始在喀什边防站做人脸识别的通关系统,当时一线官兵对他们感谢,再推广到全疆所有的边防站,现在所有人脸识别的系统在新疆的小区、加油站,在公安局各个地方都已经发挥了很重要的效率。应该说在公安的应用中,它实际上比在金融的应用更难一些,因为很多情况存在非配合的情况。
实际上金融中使用的时候,如果用来做远程的开户,或者远程的支付,它基本上是一个云身份认证系统。他们会在这个金融机构服务器所在的这一端有一个云的系统,可能是私有云上面。同时,前端他们可以在它的柜面上使用人脸识别,它就是柜员的一个辅助。人眼看到的实际上是不准的,它实际上是一个安全的加强。也可以在手机,或者Pad等等上面使用,把柜台服务变成远程的。
那么,整个的使用流程,它主要的目的有这么多流程,对用户的提示,反复的角度遮挡等等的一个计算,对于这个唇语识别,人体的检验,整个是保证做到既安全,又方便。
最后这个地方他列举了一下,实际上在云认证系统里面,人脸识别可以使用的范围是非常多的。目前他们公司,中科院他们云从公司已经跟一系列的证券公司以及银行开始合作,大家很快会看到在一些大的证券公司银行开始上线使用的人脸识别技术。他相信,人民银行也会很快出台细则,支持整个生物识别技术在金融领域的广泛应用。谢谢大家!