公共广播系统的语言清晰度
发布日期:2019-07-23 浏览量:1292次
什么是语言清晰度?
语言清晰度描述的是语音信息经公共广播系统传播后的清晰程度和完整性。早期,人们通过人工测试的方式评估扩声系统的语言清晰度:一位朗读者在讲台上读一些没有意义的字词和音节,而听众要尽可能正确的记录听到的信息。结果以百分比形式给出,100% 是满分。1940 年代,贝尔实验室开发出首个语言清晰度的电子测量方法。ALcons(辅音音节损失)指的是辅音发音的丢失程度,用百分比来表示不能正确理解的词或辅音。ALCons 值为 0.00% 则说明传播过程中的错误为零(未丢失辅音)。
现代测量方法,如 STI(语言传输指数)或 STIPA(公共广播系统语言传输指数)尝试用一个单一值描述结果,将尽可能多的干扰因素考虑在内(追求现实场景)。结果是介于 0.00(无法理解)和 1.00(完美理解)之间的数值(STI)。好的扩声系统即便用在声学条件较差的环境也能达到 0.45 到 0.65 的结果,而在声学环境较好的场所,能达到 0.70 至 0.90。更直观的例子,一间优秀的录音棚内,从麦克风到监听音箱之间典型的 STI 值能达到 0.90 至 0.97(作者测量结果)。
语言清晰度的敌人和朋友
技术上讲,语音的调制深度或测试信号维持不变,总能得到很好的语言清晰度。在频谱和时间轴上,信号传输没有畸变和振幅遮蔽。
好的语言清晰度敌人众多,但也有强大的盟友。下面就是一些最常见的陷阱,从中我们也能看出潜在的解决方案。
房间声学是最重要的影响因素。较长的混响时间(RT60)和漫长的反射(80 至 150 毫秒)掩盖了语音信号,就像“堵塞物”一样阻碍信号的调制深度,让信息识别更加困难。
位置糟糕的扬声器,加上不合适的指向性则会将声音传给对面的墙壁或玻璃等,而不是直接传达给听众。这时,从扬声器直达观众的声音将比噪声(反射声,干涉声)还小,语言清晰度自然会降低。
尺寸不达标的广播系统无法盖过观众的呼喊,或者轻易被一列驶过的列车声淹没则是另一个问题。信噪比很低,语言清晰度变差。合格的公共广播系统至少要能发出超过最大背景噪声 10 至 15 dB 的声压级,具有自然极限(听力保护)和考虑干扰掩蔽效应。
心理声学掩蔽效应也会造成语言清晰度的丢失。不仅仅是外来的噪声会掩盖语音,语音本身也会,尤其在语音非常响时。语音中的低频成分会掩盖更安静,频率更高的声音造成它们难以听到。另一个干扰是传输通道中的线性和非线性失真。这些干扰不单由功放截断或差劲的扬声器导致,很多时候常常来自出于好意,却执行不善的信号处理过程。过多的动态压缩,过度驱动的限幅器,某些频率上不必要的推高或抑制,以及过于小气的数据压缩,都让语言清晰度变得很差。
语言清晰度描述的是语音信息经公共广播系统传播后的清晰程度和完整性。早期,人们通过人工测试的方式评估扩声系统的语言清晰度:一位朗读者在讲台上读一些没有意义的字词和音节,而听众要尽可能正确的记录听到的信息。结果以百分比形式给出,100% 是满分。1940 年代,贝尔实验室开发出首个语言清晰度的电子测量方法。ALcons(辅音音节损失)指的是辅音发音的丢失程度,用百分比来表示不能正确理解的词或辅音。ALCons 值为 0.00% 则说明传播过程中的错误为零(未丢失辅音)。
现代测量方法,如 STI(语言传输指数)或 STIPA(公共广播系统语言传输指数)尝试用一个单一值描述结果,将尽可能多的干扰因素考虑在内(追求现实场景)。结果是介于 0.00(无法理解)和 1.00(完美理解)之间的数值(STI)。好的扩声系统即便用在声学条件较差的环境也能达到 0.45 到 0.65 的结果,而在声学环境较好的场所,能达到 0.70 至 0.90。更直观的例子,一间优秀的录音棚内,从麦克风到监听音箱之间典型的 STI 值能达到 0.90 至 0.97(作者测量结果)。
语言清晰度的敌人和朋友
技术上讲,语音的调制深度或测试信号维持不变,总能得到很好的语言清晰度。在频谱和时间轴上,信号传输没有畸变和振幅遮蔽。
好的语言清晰度敌人众多,但也有强大的盟友。下面就是一些最常见的陷阱,从中我们也能看出潜在的解决方案。
房间声学是最重要的影响因素。较长的混响时间(RT60)和漫长的反射(80 至 150 毫秒)掩盖了语音信号,就像“堵塞物”一样阻碍信号的调制深度,让信息识别更加困难。
位置糟糕的扬声器,加上不合适的指向性则会将声音传给对面的墙壁或玻璃等,而不是直接传达给听众。这时,从扬声器直达观众的声音将比噪声(反射声,干涉声)还小,语言清晰度自然会降低。
尺寸不达标的广播系统无法盖过观众的呼喊,或者轻易被一列驶过的列车声淹没则是另一个问题。信噪比很低,语言清晰度变差。合格的公共广播系统至少要能发出超过最大背景噪声 10 至 15 dB 的声压级,具有自然极限(听力保护)和考虑干扰掩蔽效应。
心理声学掩蔽效应也会造成语言清晰度的丢失。不仅仅是外来的噪声会掩盖语音,语音本身也会,尤其在语音非常响时。语音中的低频成分会掩盖更安静,频率更高的声音造成它们难以听到。另一个干扰是传输通道中的线性和非线性失真。这些干扰不单由功放截断或差劲的扬声器导致,很多时候常常来自出于好意,却执行不善的信号处理过程。过多的动态压缩,过度驱动的限幅器,某些频率上不必要的推高或抑制,以及过于小气的数据压缩,都让语言清晰度变得很差。
扫描二维码分享到微信
下载二维码