考虑网络的语音质量


大多数实施者理解在Internet上传送语音和在PSTN上是不同的,他们的理解重点往往是与流量中数据类型相对的语音处理环境,或者是对网络基础设施的IP部分中的语音信令和语音负载流量使用服务质量(QoS)技术的需求 。很少有人在他们的计划中考虑到TDM-IP混合网络的传输环境,并计算传输损耗来评估端到端的语音质量 。仅仅治理抖动和延迟是不够的 从常规的设计观点来看,VoIP网络被传统地看作是一个黑盒子 。一般认为控制抖动到一个一致的包到达时间并减少端到端延迟在150毫秒以下对最终用户来说是足够了 。语音质量是端到端来衡量的,而不管中间或端点是如何构成 。然而,不管呼叫是发生在PSTN、IP网络还是两者的混合网络,服务、清楚度和通话质量都会影响感觉到的质量 。服务质量与业务问题紧密联系在一起 。然而,清楚度和通话质量取决于特定的语音网络设计 。在这方面,清楚度、延迟和回声是要害 。检查引起最令人烦恼的语音损害问题的原因,对理解语音网络设计如何影响语音质量是非常有帮助的 。回声或许是最明显的语音质量受损害现象,并且仅仅在TDM-IP混合的语音网络中上升到干扰的程度 。定性地说,回声是说话者的声音通过电话返回到其耳朵 。技术上,回声是由于网络中的模拟或者尾电路部分的远端发送回路泄漏回去到接收回路而引起的 。在大多数的PSTN环境中,回声是存在的,但是回声的发生在时间上是如此接近正在讲话的人的声音,以至于这只是简单地造成适度的侧音 。当回声衰减到足够被听到并通过网络以过大的延迟往返穿越时,回声就会被说话者察觉,语音质量就变得有问题 。注重回声虽然只能在网络的模拟部分发生,但是IP网络增加的延迟能够导致回声变成可察觉的 。为了消除回声干扰,可以在尽可能靠近回声源的地方部署被称为回声抵消器的装置 。语音网络的IP部分过多的包延迟或包丢失可以引起对话声音不清楚、不连贯或破碎 。不同的丢包模型、用于修复丢失数据包的算法,以及使用的编码/解码(CODEC)类型,都会引起不同的语音质量 。一个明显的丢包模型要素的例子是连续的丢包通常会比随机的丢包对语音质量的削弱程度更大 。语音质量下降的根源是由于包到达的时间不一致或者包发送无序 。这两个因素造成终点的抖动缓存尽管已经接收了包但还是会丢弃,因为包到达太晚或是太快使得抖动缓存无法对其进行修复 。端到端网络延迟过大时会影响语音质量 。例如,当不能及时接收到期望的回复时,说话者可能会重复所说的话,这样会与远端延迟的回复碰撞,导致重复 。大多数用户察觉不到小于100毫秒的延迟,当延迟在100毫秒和300毫秒之间时可以察觉到对方回复的稍微犹豫 。这种犹豫可以影响到每个听者在一定程度上察觉到对话语气的变化 。超过300毫秒,延迟就会很明显,用户开始互相让步以防中断和对话质量难以忍受 。前端削波(clipping)—丢失说话人的第一个音节或单词—可以由延迟和IP网络中的静音抑制机制的使用而引起 。为了更有效地使用带宽,VoIP网络使用静音抑制机制,例如静音检测(VAD)或者舒适噪音生成器(CNG) 。评估方法 给定影响语音质量的操作性因素,如何来评估端到端语音质量呢?有几种标准方法来衡量语音质量 。一个明显的方法,平均评定得分法(Mean Opinion Score,MOS或ITU-T P.800)通过一个受控制的测试来获得,在测试中,很多人互相打电话并评定语音质量 。评价是直接参与到语音呼叫中的个人 。MOS是从这群人的评价中来计算平均分数的(1~5分,5是最好,4被认为是长途电话质量) 。MOS的缺点是耗时、高成本和不方便 。因此,语音质量的衡量通常是使用下列分析算法中的一种:感知话音质量测量法(Perceptual Speech Quality Measure,PSQM,ITU-T P.861,已过时),感知分析测量系统法(Perceptual Analysis Measurement System,PAMS)或感知话音评估法(Perceptual Evaluation of Speech,PESQ,ITU-T P.862) 。这些衡量方法提供了客观评定和定量测量语音清楚度所必需的度量标准 。传输损耗计划 传输损耗计划是指连接近端说话者和远端听者之间并且包括其间各节点上的再损耗的总体信号损耗计划 。按照电信行业协会(TIA)的规定,传输固定损耗计划通过限定10dB的端到端损耗,试图模拟一个隔开1米的说话者和听者之间的正常对话情形 。实际损耗通常是8~21dB之间的一个值,8~12dB范围是长期目标 。固定损耗计划的目的是为了减少回声和噪音来维持语音连接的质量(参见TIA TSB32-A) 。传输计划的基础是E模型(ITU-T G.107),它用于计算和评估端到端连接的语音质量 。

推荐阅读