王易见:语音将开启人机交互的革命吗?
谈及人机交互,对很多朋友来说,这似乎是个陌生的概念,不过,从我们日常使用的电器,大到电冰箱、洗衣机、电脑,小到手机、相机甚至于计算器,都离不开人机交互。正是由于人机交互的存在,我们才可能自如的掌控这些电器。
从专业的角度来解释,所谓人机交互,又名人机互动,它是一门研究系统与用户之间交互关系的学问,这里的系统可以是各种各样的机器,也可以是计算机化的系统和软件。人机交互的任务,就是要通过合适的办法和工具,让这些系统完成用户交予的任务。
以日常使用的PC为例,我们操控PC使用的工具大多是鼠标和键盘,它可以帮助我们完成任务,满足我们的需求。在手机上,我们同样可以看到与PC上相似的键盘,我们通过按键完成某些操作,实现与手机的交互。近年来,平板电脑和智能手机的兴起,让用户可以摆脱键盘的束缚,通过触摸的方式操作电脑和手机,这也属于人机交互的范畴,只不过在方式方法上要显得简便许多,因此,这也算是人机交互的一大进步。
通过这些介绍,你对人机交互应该有了一定的了解,如果没有人机交互,任何先进、强大的电器或设备,都不可能被人类所掌控,更不可能为人类服务。
同时,从刚才的介绍我们也不难看出,不同的产品有着不同的人机交互方式,而常见的人机交互方式,大多离不开双手,像刚才提到的鼠标和键盘,以及手机的触摸屏等等,你几乎只能通过手指的操作去下达指令。
这种传统人机交互的方式固然有些繁琐,随着模式识别,如语音识别、汉字识别等技术的发展,依托更为简单的自然语言进行人机交互已经成为可能,尤其是在今年苹果推出了iPhone4S,这款产品的一大亮点,就是推出了基于语音技术的Siri功能。Siri是苹果公司在其产品iphone 4S上应用的一项语音控制功能,它可以令iPhone4S变身为一台智能化机器人,利用Siri用户可以通过手机读短信、介绍餐厅、询问天气、语音设置闹钟等。Siri支持自然语言输入,并且可以调用系统自带的天气预报、日程安排、搜索资料等应用。还能够不断学习新的声音和语调,提供对话式的应答。
实际上,苹果的Siri功能推动了人机交互向语音领域发展的趋势,随着语音技术的成熟,未来可能给人机交互带来又一次革命。因为对人类而言,使用语音进行人机交互是最方便、最高效的方式,语音技术甚至代表了人工智能的发展方向。
而在语音技术方面进行深入探索的又何止苹果呢?在国内,以科大讯飞为代表的企业对于语音技术的探索不仅在理论上取得了丰硕的成功,而且,也有优秀的产品出炉,例如讯飞语点、讯飞口讯。
在讯飞语点的官网上,用户很容易看到这样一个简短的介绍------“新一代智能语音手机软件,20项语音功能/全程语音交互/智能语音聊天”,按照这个逻辑,用户只需对着手机讲话,手机就能响应用户的各项需求,那么实际是否如此呢?
通过下载试用以后,我们注意到,讯飞语点基本实现了语音式的人机交互方式,并且有以下几个亮点值得一提:
一,覆盖功能比较全面
智能手机的功能已经进一步拓宽,而语音技术必须满足用户多个层面的需求。在讯飞语点的“功能介绍”里面,我们可以看到讯飞语点所能覆盖的手机功能,包括语音拨号、语音发短信、上网搜索、音乐搜索、地图导航、火车航班等多达十几项应用。换句话说,讯飞语点基本上能满足用户的各类需求,覆盖功能已经十分全面。
二,语音指令通俗易懂
虽然采用了先进的语音技术,但这并不代表任何语言都能被软件接受,要使用相关的功能,必须发出与之对应的语音指令。在讯飞语点里,如果你想打电话给某人,这一条语音指令是“打电话给XXX”,或者“拨通XXX”,如果你想使用语音发短信,那么这一条语音指令是“发短信给XXX”或者“告诉XXX”,再加你想发的内容。应该说,语音指令通俗易懂,既能被手机接受,也能被用户掌握。
虽然讯飞在语音技术方面已经小有所成,但并没有奉行个人英雄主义,讯飞希望能带动更多的开发者参与进来,共同促进语音技术的发展,以及在其他各领域的应用。为此,2010年讯飞在业界率先发布了提供高质量中文语音合成、搜索、听写等能力的智能交互平台—讯飞“语音云”,经过一年多的发展,目前讯飞语音云的开发伙伴已经达到了2500多家,终端用户数已达2500万,每天在线用户数已超过120万、总请求量超过700万次;除了手机上不断丰富的应用创新,智能语音交互在车载、互联网电视上的新应用也不断涌现,语音云的服务不断深入到了更多百姓的日常生活中。
我们有足够的理由相信,未来语音技术将彻底颠覆人机交互的传统模式,由于它更方便、更高效,适用范围更广,因此,它必将会开启人机交互的又一场革命。