灵云-让人机交流随心所“语”
(联合电讯社/北京)--随着智能操作系统占据主流市场和硬件性能的不断提升,智能人机交互(HCI)技术又被提升到一个新的高度。它根据设备特点、用户需求从操作方式、信息架构和内容呈现等各个方面挖掘交互设计的可能性,为用户带来新颖的交互体验。
捷通华声于2011年12月推出的“灵云”(hcicloud.com)正是一个可以提供给用户多种人机交互(HCI)方式的平台,人们可以用语音、手写、拍照、手势等方式被终端感知,将来甚至还可使用脑波识别等智能手段来操作,感知手机、计算机等数字设备去访问网络云服务。
语音交互
Siri引发了语音技术应用普及的热潮,然而,除了语音识别控制等智能人机交互(HCI)技术,Siri对语义理解的结果并不如人意。捷通华声的“灵云”已能够提供成熟的语音播报、语音识别、语义理解、语音搜索、语音校对等多种技术应用,在此基础上,捷通华声于2012年4月相继推出的“自由说”语音识别技术、语音合成技术,已显著展现出机器对语义理解的正确率,实现人机自由对话。
机器、设备不仅能够准确识别出并理解人说话的内容,还能进一步与人自由交谈,并听从人的指令去播放音乐、新闻,为人们导航、查讯天气信息等。由捷通华声“灵云”平台支撑的手机智能助手“小唐龙”,你就可以对他说:“我想听听新闻”,“小唐龙”会准确识别你的话语意思,然后将手机的应用转到新闻直播间为你播报各种新闻,且播报的声音自然、流畅、富有感染力。人机对话“自由说”技术应用已从电影银屏中的神奇场景逐步变为现实,语音发短信、发微博、客服咨询等应用正在渗入人们的生活。不久的将来,或许你也可以像领导一样,指挥各种电器设备为你完成你想要做的工作。
手写交互
随着触摸屏逐渐成为引领市场的潮流,手写交互也被很多人推崇。在市场上的各种手写输入法中,捷通华声的录易输入法以其高品质手写识别核心技术一直走在市场前端,深受广大用户的喜爱。基于捷通华声“灵云”平台的手写交互不仅包括手写输入,还包括手写搜索、表单输入、笔迹鉴定等功能。如:现在物流业发展快速,传统的各种表单会堆积得成百上千,常常会出现丢单、丢货或登记信息不清晰等问题,而且十分浪费纸张。如果应用“灵云”中的手写交互方案,可节省因用户书写不清晰所带来的投递误工时间;再如:用手机上网时,应用手写交互,可进行连续写、叠写输入,让用户随心随欲的进行手写搜索;领导外出,遇到需要领导签字的文件,通过手写交互方案,领导只需在设备中签字,即可快速完成文件审批。当然,这些只是手写交互的简单举例,它还可以广泛应用在企业机构的办公、以及金融、医疗、电信等诸多领域中。
文字、图像交互
文字、图像交互,每天我们都能看到;扫描仪、数码相机、智能手机等设备大家更是耳熟能详。“灵云”平台里的文字、图像交互包括:拍照识别、扫描识别、机器翻译、中英文互译及词典等功能。如:要在手机中录入客户的名片信息,手动录入效率十分低,应用了“灵云”的文字、图像交互,用户只需用手机拍下名片,图像被发送到“灵云”后台服务端,服务端对图像进行扫描、识别、翻译等处理后,将图像内容自动转换为文字返回给用户。在日常的办公中,如果想将一份中文文件翻译成英文,已经不需要人工一句句去翻译了,只要把文件扫描后的图像经过“灵云”后台服务端的识别、翻译等处理后,中文文件将被自动翻译成英文文件显示到电脑上,工作人员只需要进行校对即可,大大的提高了工作效率。这样的功能是不是十分吸引人呢?
展望人机交互
语音交互,手写交互,文字、图像交互等智能人机交互(HCI)只是“灵云”应用下的典型举例,也许某一天,我们将生活在如电影《阿凡达》的场景中,信息的互动与传输将变得简单而轻松,人机交互与人密不可分,捷通华声“灵云”愿携手产业内广大设计厂商、生产厂商、合作伙伴一起推动产业发展,共同已经迎接HCI新时代的到来。