APP下载

3G手机VoIP话音的QoS实现技术研究

2014-05-22梁鸿斌

通信技术 2014年4期
关键词:话音包率数据包

梁鸿斌

(成都三零瑞通移动通信有限公司,四川成都610005)

0 引言

随着第三代移动通信网络的普及和信号覆盖的逐渐完善,基于3G系统的VoIP话音通信已具备了推广应用的基础。特别是HSPA网络的广泛应用,可以极大地提升VoIP话音通信质量。HSPA技术包括HSDPA(高速下行链路分组接入技术)和HSUPA(高速上行链路分组接入技术),HSPA可以提供最快达14 Mb/s的数据传输速率[1]。目前市面上很多VoIP运营商推出了基于3G系统的VoIP话音通信业务,基于3G系统的VoIP话音通信业务采用SIP协议实现VoIP呼叫控制和话音传送,这种基于SIP服务器和手机客户端的VoIP话音通信业务在信号较好时,VoIP话音的QoS较好,但在信号较差或3G系统的使用高峰期(无线上网的用户量大时),VoIP话音的QoS明显降低。文中就VoIP话音的QoS实现技术进行了探讨并提出了一些实用化的解决思路。

1 3G手机VoIP话音QoS的主要实现技术

在网络中,提供资源保证和服务差异化的能力,通常称为服务质量(QoS),QoS是VoIP话音通信是否能获得成功的关键[2]。通常用户对各种业务和应用体验的满意程度通过服务质量(QoS)来衡量[3]。为了保证3G手机VoIP话音通信的QoS,3G手机中采用的的主要实现技术包括:语音编码技术、静音检测技术、回声处理技术、抖动缓冲技术、丢包补偿技术、舒适噪声技术以及应用层实现的冗余传输技术,综合运用以上实现技术可有效提升VoIP话音的QoS,明显改善VoIP话音质量。VoIP话音QoS的主要实现技术从各个方面保证了VoIP话音的QoS,VoIP话音QoS的实现技术的具体内容包括如下。

(1)语音编码技术

语音编码技术是3G手机VoIP话音通信技术的一个重要组成部分。VoIP话音通信通过3G网络进行话音数据传输,如果编码速率高,对3G网络资源要求就高,因此,VoIP话音通信需要在保证话音质量的前提下,尽可能地降低编码比特率,这主要就依赖语音编码技术来解决[4]。目前,比较主流的编码技术如表1所示。

表1 几种语音编码算法的比较Table 1 Comparison of several speech coding algorithm

音频编码设计受编码质量、应用限制条件、信号特性、实现复杂性和通信误差容错的影响。根据实际需要,表1中的编码技术均可满足不同条件下的3G手机VoIP话音通信要求。

此外,iLBC和SILK是专门为包交换网络通信设计的编解码,无论是在高丢包率条件下还是在没有丢包的条件下,其语音质量都优于目前流行的G.723.1,G.729A 等标准编解码,而且丢包率越大,使用iLBC和SILK的语音质量优势越明显。通常情况下,为了衡量IP网络语音质量,将大于等于5%丢包率的网络情况定义为VoIP的极限网络条件。经过语音质量测试,即使在5%丢包率的情况下,iLBC和SILK仍然能够提供相当于GSM手机的语音质量。鉴于iLBC和SILK良好的网络适应能力,iLBC和SILK编解码算法的应用范围越来越广泛。

(2)静音检测技术

静音检测(VAD-Voice Activity Detection)技术可以有效剔除静默状态信号,只传输有效的语音信号,从而使语音信号的占用带宽可以大于50%。静音检测技术在VoIP话音通信中的运用,在3G网络信道严重拥塞或信道突发误码严重的状态下,对降低VoIP话音的时延,减少话音数据丢失,会有特别明显的作用。

在普通电话通话过程中,通常两个人的会话是采用半双工的方式进行,一方讲话时另一方处于静默状态,并且讲话过程中有大量明显的停顿。平均统计,一方说话的时间只占整个通话时间的一半,即有一半时间是在听对方说话,计算讲话中的停顿时间,任一方真正只占用40%的线路时间。在VoIP话音通信中,利用静音检测技术,可以检测出双方通话过程中的静默时段,通过减少发送的IP话音数据包,从而提高带宽利用率。

采用静音检测技术并不意味着完全不传输静音,如果完全不传输静音,虽然最大限度的节省了信道资源,但对用户体验会造成一定的影响,因此,在采用静音检测技术检测到静音时,适当的传输背景噪声,会一定程度上改善用户体验。

(3)回声抵消技术

在3G手机VoIP话音通信中,由于手机扬声器播放出来的声音被麦克风拾取后发回远端,这就使得远端谈话者能听到自己的声音,由于回声时延较大,说话方感觉非常明显,因此,通过3G网络进行VoIP话音通信,回声抵消技术的采用非常重要。

3G手机VoIP话音通信中的回声为声学回声,一般采用声学回声消除器(AEC-Acoustic Echo Canceller)来消除回声。回声抵消技术可以较好的消除回声,并降低回声对话音质量的影响。

(4)抖动缓冲技术

抖动是不同数据包到达接收端的不同延迟造成的。3G手机VoIP话音通信实际是通过IP网络进行,而IP网络的一个特征就是网络延时和抖动,为了防止网络抖动造成失真,就要在接收端设置缓冲区,将收到的话音数据包缓存在缓冲区中,通过对缓冲区中的话音数据包进行处理,使得这些话音数据包经过处理后尽量保持和发送端一样的波形。对话音数据包的处理和缓存会引入一定的时延,缓冲区队列大小的设计是要考虑的重要因素。过小的缓冲区队列将导致溢出和数据包丢失,从而影响语音质量,过大的缓冲区队列将增加语音的延时。

显然,消除抖动和减小时延是相互矛盾的,根据信道特点,采用动态的策略来平衡以上矛盾。通常采用自适应方法调节缓冲区的长度,时延增加时,减少缓冲区的长度,在抖动加大时增加缓冲区的长度,从而在时延和抖动之间取得平衡。此外,还必须限制缓冲区的最大长度,因为时延超过一定时间,通话双方根本不能进行正常的交流,注意设法提供最低限度的延迟和抖动,尽可能地改善服务质量。

(5)丢包补偿技术

通过3G网络进行IP数据的传输,丢包是常见的问题[5],VoIP话音通过IP网络传输时采用UDP包进行传送,目前网络中对UDP包的传输不提供任何可靠保证,由于网络原因大量频繁的丢包会对话音质量造成严重影响。

数据通信中丢失的数据包可以通过相关的数据通信协议来保证丢失数据包的恢复,包括数据的多次重传,而语音通信由于是实时通信,对于话音数据丢包与数据通信丢包采用的方法不同。数据通信要求传输的数据不允许任何误码或丢包,而语音通信却能容忍一定的语音数据丢包。当丢包率小于5%时,对话音通信影响较小。当网络状况恶化,丢包率过高,会严重影响通话质量。主要的解决方法包括:状态插值法、交织法、增加冗余度等方法对丢包进行补偿,通过丢包补偿技术,可有效减少和掩盖语音分组丢失对语音质量的影响。根据信道条件和终端资源,可以采用一种或多种丢包补偿技术来改善丢包对通话造成的影响。

此外,通过舒适噪声技术、冗余传输技术等,也可一定程度的改善话音质量,提高用户的实际体验。以上3G手机VoIP话音QoS的主要实现技术,在对话音质量造成影响的各个方面分别起到了相应的改善作用,在3G网络信号较好的情况下,VoIP话音的QoS较好,但在信号较差或3G网络的使用高峰期(无线上网的用户量大时),VoIP话音的QoS明显降低。

2 实时反馈的话音传输策略

在3G网络中,影响VoIP话音质量最主要的因素之一是空口传输IP语音数据包的可靠性和稳定性,同时手机用户上网的高峰期,也会对VoIP话音质量造成一定影响。由于无线通信信道的特点(突发误码严重)和手机用户上网的使用习惯(集中在一个时段上网),在成熟的VoIP话音QoS的主要实现技术的基础上,有必要研究一些新的QoS的实现技术,从而提高3G手机VoIP话音的QoS。文中提出一种新的QoS的实现技术:实时反馈的话音传输策略,实时反馈的话音传输策略包括三部分的内容:动态实时的端到端反馈机制、语音编码器的选择和RTP包发送策略。

2.1 动态实时的端到端反馈机制

RTCP实时传输控制协议利用与数据包相同的传输机制向参与者周期性发送控制包,从而对RTP的传输进行监测和控制,各种RTCP包格式都是为了反馈数据传输质量。RTCP其主要功能是为了提供丢包率统计、以及数据包达到的间隔时间抖动等。按RTCP协议RTCP包的发送间隔较长,并且当无线信道突发误码严重或上网高峰期,发送端收到的反馈信息就会严重滞后,严重影响发送端采用相应的话音QoS实现技术的实际效果。

采用带内反馈机制,将丢包率和信道拥塞等关键指标通过每个RTP包实时反馈给发送端,不仅使发送端可根据实时反馈的关键指标对RTP的传输进行控制,而且不明显增加信道带宽。如图1所示为增加反馈数据的RTP包格式。反馈数据包括丢包率和拥塞度,长度为1字节,丢包率和拥塞度各为4比特。

图1 RTP包的格式Fig.1 RTP packet format

每隔一段时间T(1 s或500 ms),计算丢包率和拥塞度。丢包率(PLR)计算如式(1)所示,拥塞度(CODR)计算如式(2)所示。

式中,Nq是时间T内根据实际收到的RTP包的序号计算的应该收到的RTP包总数,Nd是根据RTP包头的序号计算的丢掉的RTP包。

式中,Ne是时间T内期望收到的RTP包,Nr是实际收到的RTP包。

2.2 语音编码器的选择

根据接收端反馈的丢包率和拥塞度,发送端可动态地选择语音编码速率以适配不同的网络情况。根据不同的编码速率,如果动态地选择不同的语音编码器,频繁的在不同的语音编码器之间切换,将会严重影响话音质量。因此,选择一种语音编码器,只需要选择不同的编码速率,将编码速率动态的变化对话音质量的影响降至最低。

SILK是Skype公司研制的语音编码器,其编码速率范围为6~20 b/s,同时,SILK还可以根据预计的信道误码率在编码时进行冗余编码,以便在收端根据冗余编码恢复丢失的话音数据,SILK在不同网络条件下的综合评分优于其他的语音编码器。其大范围的编码速率,特别适用于基于3G手机的VoIP话音通信。

2.3 RTP包发送策略

根据反馈数据发送端制定合理的发送策略,结合丢包率、拥塞度,控制发送端的编码速率、预计的信道误码率 EFR、RTP包在应用层的冗余重发(RSEND)(一个话音包重发次数)等,发送策略如表2所示。

表2 RTP包发送策略Table 2 Strategy of sending RTP packet

发送策略的原则包括:根据反馈数据,丢包率越高,发送端在编码时插入的冗余编码数据越多,以便于收端恢复更多的丢失话音数据;拥塞度越大,说明越拥塞,采取动态降低语音编码速率,同时在应用层不采取冗余传输的方法,以减小占用带宽,缓解拥塞。表2中的具体判定条件是在RTP包发送策略的原则基础上,根据实际测试的情况确定的。

3 测试验证

根据文中提出的3G手机VoIP话音QoS新的实现技术,采用开源的客户端软件Sipdroid(SOLD)和在客户端软件Sipdroid基础上增加了文中提出的新的实现技术的软件(Snew),在基于Android的智能手机上进行了对比测试。由于在3G手机信号较好的情况下,SOLD和Snew没有区别,因此专门选择两个3G手机使用比较典型的场景(信号变化大和信道拥塞)进行测试,SOLD和Snew表现出了明显的差别,具体场景包括:

1)场景1:选择手机信号一直较差的区域,该区域信号显示小于-95 dbm,并且信号变化较大。

2)场景2:在3G网络的使用高峰期(无线上网的用户量大时),选择在晚上8到9点的时间段。

测试结果如表3所示。

表3 话音质量测试Table 3 Voice quality test

通过两个3G手机使用比较典型的场景的直观对比测试,采用实时反馈的话音传输策略时的VoIP话音通信质量明显优于没有采用实时反馈的话音传输策略时的VoIP话音通信质量,该测试说明了实时反馈的话音传输策略增强了VoIP话音对网络环境的快速变化的适应能力,具有较强的实用价值。

发送端的RTP包发送策略还可以根据具体的传输情况,提高相应的发送控制精细度,以便更好的适应不同的环境要求。

4 结语

文中在分析既有3G手机VoIP话音QoS的实现技术的基础上,根据3G网络VoIP话音通信的具体特点,提出了实时反馈的话音传输策略的新思路。基于Android的智能手机,综合利用既有3G手机VoIP话音的实现技术,同时结合文中提出的实时反馈的话音传输策略,实现了VoIP话音QoS的控制。通过在不同的网络环境条件下的对比测试,说明了采用实时反馈的话音传输策略的VoIP客户端软件网络适应能力更强。下一步工作准备通过大量试验提高发送控制精细度,从而进一步提高VoIP话音的QoS。

[1]庞韶敏,李亚波.3G UMTS与4G LTE核心网 -CS,PS,EPC,IMS[M].北京:电子工业出版社,2011:3 -4.PANG Shao-min,LI Ya - bo.3G UMTS and 4G LTE Core Network-CS,PS,EPC,IMS[M].Beijing:Publishing House of Electronics Industry,2011:3 -4.

[2]李刚.3G无线网络中的 QoS研究[J].科技信息,2009(08):541-542.LI Gang.Research on 3G wireless network in QoS [J].Science & Technology Information,2009,(08):541 -542.

[3]文浩,林闯,任丰原,等.无线传感器网络的QoS体系结构[J].计算机学报,2009,32(03):432-440.WEN Hao,LIN Chuang,REN Feng - yuan,et al.QoS Architecture for Wireless Sensor Network[J].Journal of Computer ,2009,32(03):432 -440.

[4]张春红,裘晓峰,弭伟,等.P2P技术全面解析[M].北京:人民邮电出版社,2010:186.ZHANG Chun – hong,QIU Xiao - feng,MI Wei,JI Yang,et al.Comprehensive Analysis of P2P Technology[M].Beijing:Posts& Telecomm Press,2010:186.

[5]何兵,陈键.分组语音传输的丢包应对回顾[J].计算机工程,2002,28(07):44 -46.HE Bin,CHEN Jian.Packet Loss to Cope with Packet Voice Transmission Review[J].Computer Engineering,2002,28(07):44 -46.

猜你喜欢

话音包率数据包
支持向量机的船舶网络丢包率预测数学模型
二维隐蔽时间信道构建的研究*
一种基于喷泉码的异构网络发包算法*
电磁线叠包率控制工艺研究
民用飞机飞行模拟机数据包试飞任务优化结合方法研究
C#串口高效可靠的接收方案设计
话音叠加中实时混音算法的FPGA实现
地空话音组网系统的应用及前景分析研究
分组话音在窄带信道的组播实现方案
温柔的话音已经消逝