物联传媒 旗下网站
登录 注册
RFID世界网 >  新闻中心  >  物联网新闻  >  正文

亚马逊Alexa连锁效应:AI语音平台风口,谁能成为赢家?

作者:本站收录
来源:杨剑勇
日期:2017-09-22 15:00:16
摘要:在智能语音语义领域,除了百度、阿里、腾讯等巨头纷纷进入,讯飞、思必驰等专业语音技术企业也占据很多优势资源,巨头企业已经开始通过上下游延伸来创造价值,实现更好的实现商业化。

  2017年,从一开年,开发者成为众多AI巨头的争抢对象。

  年初二月,在美国CES上,到处都是Alexa,亚马逊无疑成为最大赢家,自2015年6月25日宣布开放AI助手Alexa的语音技术以来,一度迎来开发者们高涨的热情,据悉,目前搭载Alexa的硬件种类已经超过7000种,产品品类覆盖智能家居、移动设备、机器人、智能车载等领域。

  开发者成为争夺的重要据点

  巨头们也没有放慢追击的步伐,苹果公司在WWDC 2016上发布了新的SiriKit,把Siri开放给开发者。IBM的Waston认知技术平台也逐渐更加受到关注。2017年,接踵而来的开发者大会着实吸引眼球,4月底,Facebook率先拉开了本年度的开发者大会,5月,微软在西雅图举行了Build 2017开发者大会,随即,谷歌也召开I/O 2017开发者大会。平台成为巨头争夺的新战场。

  伴随着国内AI市场日益火爆,智能产品层出不穷,多样化需求成为痛点,国内的众多AI企业也开始探索平台之路。Alexa代表着一种AI进阶方向,以语音交互为主要方式,但中英文语音技术的差异为Alexa进击中文领域带来冲击,国内市场稍显空白,为更多AI企业留下了竞争成长的空间。

  国内AI的发展,以语音技术的应用最为成熟,语音交互也成为智能产品的必备方式。AI语音平台也成为了典型代表,国内已诞生了近50家AI语音平台,既有巨头的侵入,也有新秀崛起。但不可否认,国内的AI语音平台目前还是处于初期的发展阶段,无论是技术研发还是应用都非常的青涩。

  巨头布局,创业公司垂直进击

  (一)亚马逊Alexa

  不同于苹果Siri有限的语音辅助作用,亚马逊Alexa是一个具备强大语音技术的“机器人”,对语音识别、语义分析等方面逻辑要求严格。亚马逊的优势在于技术包袱较小,通过与Echo类产品的紧密结合,探索更多的语音应用可能,产品思维十分灵活。更重要的是Amazon Echo切中远场交互的市场痛点,Alexa更懂用户对于远场语音交互的需求。

  同时Alexa拥有亚马逊电商先天优势、AWS的云服务扩展、上万个Skills的技能库、Kindle的独家阅读资源等等,优势因素的碰撞产生的了化学效应。

  但是,Alexa的应用具备相应的门槛,它是面向企业和专业/半专业级的开发者的语音开放平台, 尤其是作为个人开发者而言,需要具备一定的代码能力,专业性较强。在应用上必须通过aws云端部署等等,这些对中小型企业而言,存在困难。降低开发及应用门槛,成为Alexa要解决的一大问题。

  (二)百度DuerOS

  DuerOS的开放之路始于去年,去年12月末,度秘联合中信国安广视推出可以提供语音交互功能的智能高清机顶盒。在今年1月CES上,度秘正式发布DuerOS。在7月5日的百度AI开发者大会上,景鲲明确定义了DuerOS的发展路径,表示DuerOS是AI时代的安卓系统。为此,它会向外界开放一系列能力。在当前AI热的背景下,百度AI开发者大会的传播效应超出景鲲的预期,他坦言“会后至少有几十家厂商主动找来谈合作。

  自陆奇加盟百度以来,百度更加明确了其人工智能大方向,依托百度的技术基因、搜索、大数据等,诞生了DuerOS、无人驾驶、百度大脑等项目,百度基于优秀的搜索引擎基础,已经开始大刀阔斧的布局人工智能。百度副总裁王海峰在7月5日的AI开发者大会上表示,百度多年打造的完整AI技术平台将全面开放。百度的AI能力分为4层:在基础层,是AI算法、大数据、大计算能力;感知层,包括语音、图像、视频、AR/VR等技术;认知层,有自然语言处理、知识图谱及用户画像等;在平台层,基础层、感知层、认知层的技术会平台化。

  景鲲表示”百度DuerOS的开发套件数量在最开始预估的时候稍微有点少了,从整个市场环境来看,这种需求特别大,有很多人在新鲜的设备上都想做语音交互,包括跑步机或是按摩椅。对度秘团队来说,怎样满足不同合作伙伴的需求,是当前的工作重点。”

  (三)讯飞AIUI

  科大讯飞无疑是人工智能风潮以来的极大受益者,面向消费者业务,目前也在不断从To B向To C转变。2015年,科大讯飞推出了AIUI,它是以语音识别为主,结合图像、视觉及手势识别的人机交互产品,自上线以来,在人机交互方面的应用涉及教育、政府、交通等领域。

  今年6月上旬,讯飞举办了AIUI开放平台发布会,相较之前针对智能硬件方向的AIUI,此次AIUI开放平台,为软硬件都提供支持,功能亮点主要是多轮对话、个性化语音语义、方言识别、声纹信息识别等功能,并提供通用技能资源,主要是应用级工具。目前开放的有智能硬件解决方案、移动端,但微信解决方案和WebAPI解决方案仍未开放。讯飞AIUI开放平台的出现,让讯飞体系不断壮大,但正因如此,目前,讯飞开放平台的服务支持略显薄弱,为开发者们带来苦恼,造成流失,如何解决这一问题,对讯飞而言也是一个考验。

  (四)腾讯云小微

  腾讯云小微硬件开放平台,通过一个SDK接入硬件,包含腾讯自有音乐及各种有声读物、新闻、天气等内容,开发者也可以自己创建。腾讯旗下的小微服务机器人平台,是家庭中的陪伴机器人,可以不断学习和做决策。

  腾讯云小微得益于腾讯自身的数据库和产品线,可以在各类产品中打通账号,打破了内容门槛限制。其中,微信数据库为小微提供了语音语义的学习和完善。技术与产品的结合让小微的功能十分接地气,小微的翻译能力、物体识别能力等等,都得到了腾讯产品最完善功能的加持。

  尽管腾讯云小微在针对语音、语义理解方面做了不错的优化,但在赋能硬件技术方面仍然不够。这个局限也会影响腾讯云小微在AI领域的深度发展,毕竟未来的AI是覆盖生活中全方位的,小到手机、PC里的语音交互,大至车载、家居中的多轮对话,这些都有待于腾讯云小微去摸索进步。

  (五)思必驰DUI开放平台

  近期,思必驰的一场发布会,让行业聚焦到了这个语音新秀的身上,据了解,思必驰自2014年转型物联网领域以来表现稳步上升,而近期搭载其语音技术的天猫精灵X1、小米AI音箱小爱同学、联想智能音箱等产品的发布,将其推上风口浪尖。9月7日,思必驰DUI的这场发布会成为行业关注的焦点。

  思必驰DUI平台分为四个系统,分别为玲珑系统、天机系统、青囊系统、紫微系统,功能特点主推的是全链路定制,以Dialog为核心,结合GUI和VUI,从识别到合成,从语义领域到对话逻辑,从技术模块到内容资源、交互界面等均可全方位均支持定制。DUI平台的综合性、完整性和服务性,是其核心竞争力。思必驰推出了开发者计划,设立2亿元的扶持基金,用以扶持平台上优秀的开发者、优秀应用案例和创业项目。

  据了解,目前DUI平台的应用主要在智能车载、智能家居、智能机器人、手机助手领域,从内容端逐渐切入金融、教育、电商、医疗等方向。在这个发展目标里面,不断扩大应用领域是思必驰DUI要走的很长的一段路。

  平台占据了绝对的风口位置

  通过以上分析对比,我们不难发现,无论是国内还是国外的公司,都想牢牢的抓住未来互联网的下一个交互入口。

  截至目前,在智能语音语义领域,除了百度、阿里、腾讯等巨头纷纷进入,讯飞、思必驰等专业语音技术企业也占据很多优势资源,巨头企业已经开始通过上下游延伸来创造价值,实现更好的实现商业化。与此同时,创业公司通过深耕垂直领域和细分赛道,实现自我造血和快速成长,并在AI风口逐渐做大。

  在未来的物联网时代,智能语音交互作为最为符合应用场景的交互方式,也许会成为每个智能硬件的“标配”。未来的互联网发展仍是开放的,任何一种技能都有可能被载入硬件的发展,我们也更应该以一种开放的眼光去看待未来的发展方向。

人物访谈