畅想音视频新技术对现代生活的影响
数字信号处理器(DSP)
数字信号处理器已经发展成为功能强大、具有成本效益的音频处理工具,极大地增强了消费者的音频产品的功能。将来的DSP的能力容许甚至更多的通道并采用更强计算能力的音频处理算法,与麦克风和扬声器阵列组合后,这些日益增强的算法就能够与收听环境自动匹配或改变其声学特性。
声学特性差的大房子将被制成声效宏大的影院,小居室将被设计装点成了隐密的家庭影院,舒适而无失真的音效还不会让你的邻居受到骚扰。或许,你还可以独自用耳机收听并享受与宏大家庭影院一样的体验。只要选择音响环境和扬声器或耳机,DSP算法就会相应地调节播放的声效。对于商业应用,该系统将根据房间大小的变化自动调节声效(如采用可移动分割器)。
将来,DSP容许自动调节背景噪声、回声、反馈和物理扬声器/换能器的不规则性。可变声环境将增强计算机游戏、音乐系统和视频娱乐系统的体验。利用强大的DSP技术,用一个平板多扬声器阵列就可以取代传统的前、后和重低音扬声器,去除了几个音箱和大多数电缆。
音频编码和解码
MP3格式可能是最流行的数字音频编码和播放格式,其它音频编码器(MP3Pro、AAC、ePAC、AC-3、Ogg-Vorbis和WMA)采用类似的感知子带技术(perceptual sub-band technology)。与MP3相比,这些编码器不同程度地改善了数据压缩率和声音品质,但是,需要更快处理器和更复杂的编码技术。
在许多编码器中,现在常见的文件大小压缩率就是用于CD和FM收音机品质的的12:1到24:1。用户将这些编码器/解码器的品质与音乐CD的品质比较。感觉编码器制造商将“听众无法辨别与CD声音的差异”定义为“CD品质”。
结构化音频(SA, Structured Audio)本质上就是MIDI与压缩数字音频及采用结构音频记分语言(SASL)指令的组合。SA弦乐综合引擎可以被用于播放大多数--如果不是全部的话--乐器声。语音内容被独立地压缩,然后经综合与合成弦乐一起播放出来以实现歌曲的播放。
因为大多数音频数据都是合成的(对SA弦乐的指令与对MIDI文件的指令类似),SA文件大小和压缩率大概为100:1。因为歌曲再次与播放设备混音,设备也可以选择一种用于收听环境的优化混音方式,如用于家庭的5.1杜比数字或DTS、用于私人收听的耳机混音或用于汽车的四通道混音。
新的杜比编码器、Dolby Digital Plus和MLP Lossless提供了增强的性能,可以被用于消费音频、汽车、PC和游戏市场。
Dolby Digital Plus具有非常有效的广播数据率(对于5.1通道音频< 320kbps),可以承载8个以上的多通道音频节目频道,它还在单一编码位流中支持在现有杜比系统上实现多语言播放。
Dolby MLP Lossless是多通道和立体声DVD的核心技术。MLP Lossless最多能将6个通道96kHz/24位音频或两个通道192 kHz/24位音频编码到一张DVD音频光碟上,播放效果与演播室一样。
数字内容存储和联网技术
通过在你的MP3播放机上放置喜爱的歌曲,存储数字内容(如个人视频刻录机和MP3播放机)将让你制成自己的非商业性“广播站”。
越来越多的数字内容经由网络传递给需要的用户,并且所提交的数字音频/视频流的性能与现有广播媒体一样。
区分IP包的优先次序有助于消除恼人的节目干扰,数据包可以被发送到多台计算机以减少每一数据流的网络流的数量并供给更多的用户。
经改善的数字内容编码算法,与网络的新型用户模型一起,为消费者实现广播和CD/DVD出租提供了新的内容传输手段。随着合法的数字音乐下载服务的普及,电视节目、音频书、记录片和电影也将采取用户买得起的每次下载付费模式。
网状网络像鱼网一样覆盖一个区域,每一个节就代表一个向中心往返传递数据的WiFi节点。对于小城镇、田园社区、工业园和教育园或车间,网状网络是理想的组网方式,它具有鲁棒性,容许数据包沿着小山、建筑或稠密的植被等不同路径传播。
具有标准CD/DVD性能的汽车娱乐系统将具备IP网状网络连接,汽车在网状网络区域行驶时,可以获得连续的移动互联网接入,从而让司乘人员观看实时或存储的网络广播和流媒体娱乐节目。
在社群内部,基本IP网络接入将是免费的。IP服务和网络公司发现,从商业模式上看,分布广泛的接入比单个订户的付费接入更有利可图。
将来,多功能的个人WiFi设备可能有助于你在不熟悉的区域获得服务,这些功能可能会在进入一个网状网络时被激活,例如,便携式、语音提示GPS将把你带到想去的地方。网状网络还可以告知你的位置而不必借助于全功能GPS系统。
无线技术——蓝牙、ZigBee、RFID
无线技术--包括蓝牙、ZigBee、RFID短距离射频和超短距离磁感应--将对未来的音频产业产生巨大影响。所有这些技术将使消费者拥有高度便携的个人信息娱乐平台。
称为通用媒体控制规范(Generic Media Control Profile,GMCP)的开放式标准容许流媒体内容经由蓝牙传输,最初GMCP将应用在车载娱乐系统,但是,可能被方便地扩展到其它应用,如博物馆游览讲解(walking tour)。
磁感应设备容许用户不用手接听蜂窝电话,磁场弱小,局限在车内私人空间之中。这些场合基于蓝牙或ZigBee的方案不一定管用。
当驾驶员起动发动机的时候,内建在蜂窝电话内部的RFID可以触发车内安装的免提装置。当引擎关闭的时候,蜂窝电话恢复常态。
车内安装的免提装置采用麦克风阵列自动聚焦到扬声器上,减少了包括风声、振动声和娱乐声在内的背景声,从而大幅度提高呼叫的清晰度和(对方来电)语音的可理解性。
具有无线网状网络的建筑可以安装IP麦克风阵列,以提供具有识别声音并查明其位置能力的声音安全系统。如果建筑在地震或其它灾害中倒塌,它还可以帮助救助人员定位被掩埋和受伤的居民。无线IP扬声器将容许创建智能公众寻址或紧急通知系统。
在医院及建筑中,相同的无线网状网络将让医生和安全人员携带一块短距离RF翻领徽章(lapel badge),用它可以跟中央调度室进行简单的语音激励的双向通信并提供自动定位信息。在整个建筑内,可以用IP扬声器或特定徽章携带者的IP地址实现基本的消息传递(basic paging)。
在具有无线互联网接入点的家庭,也可以采用类似技术为年迈者或意外医疗急救的弱者呼叫帮助。采用小型化封装,还可以把这种能力内建于基本上所有个人的珠宝用品之中以防丢失。
在公众无线接入区域,在你的安全翻领徽章上扣击一下,就能让警察和其他应急服务人员找到你并与你对话。如果你有医疗识别信息,该翻领徽章还可以发送那些信息。安全版要借助于用户语音识别模式才能工作。
当人们不在链路上发送数据的时候,通过收集网络周围环境的RF能量,个人设备的电池寿命就可以延长,或对电池缓慢充电。
消费音频市场的变革
在大多数人心目中,高品质音响就是CD品质的同义词。将来,对音响品质和更高的数字采样率的需求将持续稳定增长,因而也对原材料中的位分辨率、DA转换器或其它转换方法提出了要求(例如D类放大器),以便还原耳朵能够听到的高品质模拟信号。耳朵不能听数字位信号。
不依赖于商业媒体提供商,消费者将能够方便地创建独特的个人音乐娱乐(新歌曲、业余音乐、Podcast和音乐博客)。商业媒体的影响将减弱而基于商业的节目将更难以出售给消费者。
新型的音响产品将出现并接入有线和无线网络,这些设备的显示屏幕也将充当非常小的视频邮件、电话和会议电视设备的音响扬声器和麦克风。
在多通道视听娱乐系统上的扬声器阵列将让家庭中的电缆销声匿迹。在采用扬声器阵列的分屏电视中,房间左边的人将听到左边屏幕发出的声音,而房间右边的人将听到右边屏幕发出的声音。
数字HDTV将与家庭视频会议及远程呈现放映功能(tele-presence features)结合在一起,通过采用波前麦克风及扬声器阵列,可以为房间中的一个或一个以上的人提供卓越的语音清晰度。
在改善语音可理解性和屏蔽背景噪声方面,具有两到八个或更多麦克风的阵列将在蜂窝电话、个人电脑到家庭视听系统等产品中获得广泛应用。
扬声器阵列将被用于创建小范围内的高度本地化的“声场”,如广告亭、博物馆显示、表演和广告业。它们还可被用于创建“静音场”以减少本地噪声。
语音激励的生物识别ID系统将被用于个人安全、医疗应用、家庭门禁、汽车、办公室和电子商务安全。电视、计算机、灯光和其它电器都将由语音指令来控制。语音到文本及文本到语音的转换系统将日益普及。
通过利用独立的无线耳机或双向蓝牙链路,每一个乘客可以定制汽车娱乐和信息系统,使自己拥有与其它乘客不同的媒体内容选择。
移动和家庭系统也将与媒体供应商互动。如果你要听广告,你可以立即对音响设备说“买歌曲”或“更多信息”,等效于点击互联网的URL链接,然后,你就可以用语音指令完成购买交易。
在新的语音环境,广告将更为简短,会向消费者发出更多的问题。“产品XYZ对你来说完美无缺,您愿意了解更多信息吗?”广告结尾将检测收音机或视频设备上的语音响应或按键,总的广告时间少于5秒。
不幸的是,将来你会遇到更多的广告,因为内容提供商将向视听节目中编入更多的产品促销信息。
在汽车中,通过网状网络上的无线节点或路边低功率RF天线,交通状况、学校和安全速度区、路况和突发情况等信息将发送到车上并由语音提示给你。双向通信容许乘车者快速报告事故或其它紧急情况,位置信息同时被自动报出。然而,跟踪乘车者的运动位置会引起侵犯个人隐私的担忧,因而可能会遭到限制。
在这个充满挑战的音响世界中,孰强孰弱?先进的技术仅仅是答案的一部分,真正的王者将是既掌握技术又了解社会/经济需要的企业,其中涉及使用便利性、隐私和难以捉摸的“酷”因子。
作者简介:Kenneth Boyce,是美国国家半导体公司音响产品组的在职战略技术专家,加入国半之前,他是Oak Technology公司音响和通信部的总监,他拥有West Virginia 大学的科学学士学位。