语音识别看似神通广大 但它真的听得懂方言么
不管是智能家居还是车载系统,语音识别几乎已经成为标配。今年拜亚马逊Alexa所赐,大部分智能家居设备都可以进行最基本的语音控制,可它的普适性真的有如此之高么?一位来自美国的消费者最近就在投诉亚马逊Alexa:它并不能识别自己老妈的口音。
面对母亲的抱怨,这位美国的消费者决定向亚马逊反应这一问题。这样的体验似乎会让人想起和Siri一些不愉快的回忆,尽管苹果在每次发布会上都似有似无的提到一句“我们又提升了Siri的识别率”,但实际效果正如大家想的那样,亚马逊Alexa也面临这样尴尬的问题。
究竟语音助手的革命什么时候到来?可能最先必须解决的就是口音问题。先不论英语语种国家究竟有多少口音问题,身为中国人对口音真的不能再熟悉。即便现在在大力推广普通话,但对于上了年纪的人而言想要改变他们的口音真的是一件很难的事情,可往往最需要语音助手的人群正是他们,无形中成为一对难以克服的矛盾。
正因为如此,国内厂商在搭载语音助手时会考虑到方言的搭载,沪语,广东话,川普等等都可以说,识别率也有一定的保证,但对于全国,甚至全世界不同地区的口音而言还是小巫见大巫。
那么到底人类什么时候才能攻克语音助手的难关?根据专家的意见,最早也要到2020年,才会有一半的普及率。届时包括互联网搜索在内,可能一半的搜索类需求都会通过语音执行。Google Home和亚马逊Alexa就是要解决这方面的难题。Echo被称为亚马逊的王牌是有原因的,在中国市场以外它真的卖得非常好。
实际上造成目前语音助手遭遇瓶颈的重要原因还是各家公司的音频数据并不共享,亚马逊想要弄到苹果Siri的识别音频,除非苹果开通商业购买,否则根本不可能。其中,音频采样又是一个复杂且费时费力的过程,即便有数据库的支持也无法承载大量人口/人种造成的差异。
“就像和一个小孩子说话。”
在语音助手搜索错误时,用户要不厌其烦的反复重复刚刚自己说的话,就像是对着一个还没学会语音的小孩子说话一样。也正因为如此,才给了研究人员一个启发:或许深度学习能够成为语音助手下一个突破口?