APP下载

基于AMR-WB基音周期的带宽节省方法

2015-06-28冯浩楠

铁路计算机应用 2015年1期
关键词:节省解码编码

滕 达,冯浩楠

(1.中国铁道科学研究院 通信信号研究所,北京 100081;2.中国铁道科学研究院 研究生部,北京 100081)

网络技术

基于AMR-WB基音周期的带宽节省方法

滕 达1,2,冯浩楠1

(1.中国铁道科学研究院 通信信号研究所,北京 100081;2.中国铁道科学研究院 研究生部,北京 100081)

移动网络拥塞会影响数据通信的质量和稳定性,为节省网络高峰时段的网络带宽,本文在不改变硬件和协议的条件下,将信息隐藏的思想应用于语音编码,在编码阶段对语音信号进行压缩处理,经计算可以节省约12%的带宽,从而起到缓解网络拥塞的作用。

基音周期;AMR-WB;带宽

随着手机、平板电脑等移动类电子设备的不断推陈出新,移动网络也相应地得到迅速地发展,用户数量随之不断升高[1]。无线通信为广大消费者带来的便利是显而易见的,然而过多的用户为 2G/3G 网络带来庞大的数据量,从而造成了网络通信高峰时段的通信堵塞。另一方面,移动通信技术也存在着一些缺点,例如 :3G 技术缺点如下 :(1)多径衰弱的问题。移动通信系统会由于地貌、海况、天空等因素影响下,导致接收方收到多条电磁波,产生严重的衰弱现象。(2)时延扩展的问题。无线信号传输的过程因为不同的路径导致信号的传播时延各不相同,引起码间干扰。(3)多址干扰的问题[2]。在 3G 通信系统中,在时域和频域上,多个用户的信号是有重叠的,因此一定的同域和领域干扰会产生在频域上,这种干扰就是多址干扰[3]。

上述问题因为数据传输带来误码率高、网络拥塞等问题,从而影响数据通信的质量和稳定性,在不解决硬件和协议本身限制的情况下,需要从信息本身入手。从信息隐藏的思路入手,在编码阶段将信息嵌入到语音信号中进行传输,在解码阶段将信息取出,减少了语音信号的长度,起到节省通信网络带宽的作用。

1 AMR-WB编码简介

在 3GPP TS 26.190 规范中,AMR-WB(Adaptive Multi-Rate-Wideband, 自适应多速率宽带编码)是一种同时被国际标准化组织 ITU-T 和 3GPP 采用的宽带语音编码标准,也称为 G722.2 标准[4]。AMR-WB提供语音带宽范围达到 50 Hz ~ 7 000 Hz,用户可主观感受到话音比以前更加自然、舒适和易于分辨,处理的音频是采样率为 16 kHz 的语音信号,具有 6.60 kbps、8.85 kbps、12.65 kbps、14.25 kbps、15.85 kbps、18.25 kbps、19.85 kbps 和 23.05 kbps 和 23.85 kbps总共 9 种不同的速率,对于这 9 种不同速率的语音,经过 AMR-WB 编码后,每一帧的长度分别为132 bit、177 bit、253 bit、285 bit、317 bit、365 bit、397 bit、461 bit和 477 bit[5]。在网络比较拥堵的情况下,AMR-WB 编码会自动调节码率,减少网络数据包的数量。但是当网络非常差的情况下,如果码率调到最低的 6.60 kbps 速度时,网络拥堵的情况无法缓解,会导致数据包丢失严重,无法正常通话[6]。基于嵌入信息的思想,利用基音周期参数改变较少影响通话质量的特性,提出了一种节省3G网络带宽的方法。本算法的思想是利用基音周期参数的方法进行信息隐藏,将每一秒语音的前 6帧嵌入到后 44帧中,从而节省了带宽。

2 编码算法

编码算法的主要思想是发送端将每一秒语音编码的前 6帧语音信息嵌入到后面的 44帧中,这样可以减少每一秒语音的信息量,从而减少总的信息量。

协调信息:双方通话开始时,发送端将一些调节信息编码到第 i帧语音上,接收方收到调节信息后,开始接收隐藏信息。

编码的开始 :当发送端向接收端发送第 j s 的信号时,先使用 AMR-WB 编码器将第 j s语音信号编码,得到二进制序列 Info1,…,Infok,1 s 的信号总共有50 帧的语音,编码算法的目的就是将该 50 帧的前 6位嵌入到后 44位当中。

信息嵌入过程 :每一秒语音的最后 44帧语音,从第7帧语音开始编号,第7帧的第1个子帧编号为1,第 2 个子帧编号为 2,往后以此类推,第 i帧语音的第 j子帧编号为 (i-7)*4+j。从二进制序列 Info 中取出Infok,Infok+1,Infok+2,Infok+3和 Infok+4总共 5 bit的信息(k 整除 5),将这 5 bit二进制数转换为十进制数,这个数设为“s”。在编号为 k 的子帧编码过程中,在闭环基音周期的搜索中,在候选的基音周期参数集合中,循环测试每一个基音周期参数 ti,若 timod32=s,则选择 ti作为这个子帧的基音周期参数进行编码 ;若候选的基音周期参数均不满足 timod32=s 的条件,则选择一个正整数 tj作为该子帧的基音周期参数进行编码,其中,tj满足 |tj-ti|mod32=s 的条件。

3 解码算法

解码算法的目的是在接收端还原被隐藏的信息。接收端在接收到协调帧后,立即启动隐藏信息的解码,即从第 i秒语音开始,通过解码每秒语音的 44帧的来还原语音编码。接收端在接收到第j秒语音后,将这 44帧语音信号进行解码,将每一个子帧语音的基音周期参数摸除 32,得到十进制数 s,再将 s转化为 5 bit的二进制信息 Infok,…,Infok+4。按照顺序,将 44帧语音中,每一个子帧基音周期参数模除结果的信息缓存在一起,最后将缓存结果使用编码器解码进行声音的重建,得到前6帧的语音信号,将这6帧语音信号和接收到的 44帧语音信号进行组合,最后可以得到完整的 1s的语音。

4 算法分析及实验结果

4.1 网络带宽节省分析

本算法使用基音周期参数的方法进行信息隐藏。每一帧语音的编码比特数取决于嵌入过程中所选择的模数,本算法使用 32作为模除计算的模数,因此每一子帧语音的基音周期参数可以嵌入 5 bit的信息,一帧语音就可以用来嵌入 20 bit的信息。在 6.60kbps 速率模式下,每一帧语音编 码大小为 132 bit,因此 44 帧语音的基音周期参数总共可以嵌入 880 bit的信息,而剩余 6 帧语音总共是 792 bit,因此每一秒语音的 50 帧中的 44 帧的语音正好可以承载剩余6帧语音的编码流,那么每一秒的语音可以减少6帧的编码比特数。因此在网络状况不好的情况下,使用本算法进行信息压缩平均可以节省 6/50=12% 的网络带宽。

4.2 实验结果

本实验使用了 30 个录制音频的片段和 30 个网络音频文件进行对照实验。

对 AMR-WB 编码器源代码进行了修改。在发送端需要进行编码,方法是在每一秒的语音编码中,缓存前6帧语音编码流,将这6帧语音编码的二进制比特流嵌入到后面 44帧语音的基音周期参数中,解码端在接收到协调帧后每解码 44帧语音,就可以得到6帧的语音比特流,编码器将这6帧比特流解码后,对每一秒的语音重组后输出。因为嵌入的信息较多,原始波形图和嵌入信息的波形图差异比较大,在此不一一列举。

表1是使用该算法嵌入信息后MOS值的差异,从中可以看出,在该算法条件下,MOS差值的平均值 约 为 0.42, 会 比较 显 著的 降 低话 音 通话 的 质量,但是经过实验测试,通话双方仍然可以正常的通话。

表1 实验结果

5 结束语

基于基音周期隐藏算法提出了一种利用基音周期嵌入减少语音编码比特数的方案,以应对网络情况恶劣的环境。通信双方只需要压缩编码前进行较少通信量的协商,发送端通过将一部分编码数据嵌入基音周期参数中,从而将编码数据压缩发送;接收端在收到协调帧后,根据相应的算法每 44帧语音数据作为一组解码,最后将数据整合可得到最终的语音信号。实验结果表明,话音的平均MOS值的降低约为 0.42,但是此时通话的双方仍然可以继续通话。经过计算统计,在保证可通话的前提下,平均可以节省的带宽可以达到原来使用带宽的 12%。

[1] Zhang Chun Ling, Zhao Sheng Hui, Xiao Hong Yuan, et al., An Improved Method for AMR-WB Speech Codec [J]. Advanced Materials Research, 2013, 756-759, 1259.

[2] 解廷福,杨 果, 王 晶 . 基于算术编码的 AMR—WB 参数变速率压缩 [J]. 电声技术,2013(7):48-51.

[3] 唐 骏 , 袁江南 .AMR-WB 固定码本快速搜索新方法 [J]. 计算机工程与应用,2012,48(36).

[4] Zhou Ji jun, Yang Zhu, Niu Xin xin, et al., Research on the detecting algorithm of text document information hiding [J]. Journal of China Institute of Communications, 2004, 25(12).

[5]Yu Zhengshan, Huang Liusheng, Chen Zhili, et al., High Embedding Ratio Text Steganography by Ci-Poetry of Song Dynasty. Journal of Chinese Information Processing [J].2009, 23(4).

[6] Feng Dengguo. Status quo and trend of cryptography [J]. Journal of china institute of communications, 2002, 23(5): 18-26.

责任编辑 徐侃春

Bandwidth saving method based on pitch period of AMR-WB

TENG Da1,2, FENG Haonan1
( 1.Signal & Communication Research Institute, China Academy of Railway Sciences, Beijing 100081, China; 2. Postgraduate Department, China Academy of Railway Science, Beijing 100081, China )

Congestion of mobile network in uenced data communication on quality and stability. This paper proposed an information hiding algorithm for speech encoding without any modi cation on hardware or protocol, in order to reduce bandwidth of mobile network. Simulation experiments showed that compression of speech in encoding could save 12% of bandwidth, which alleviated the congestion of mobile network.

pitch period; AMR-WB; bandwidth

U285.4 ∶ TP39

:A

1005-8451(2015)01-0033-03

2014-08-22

滕 达,在读博士研究生;冯浩楠,助理研究员。

猜你喜欢

节省解码编码
《解码万吨站》
节省疲劳症
基于SAR-SIFT和快速稀疏编码的合成孔径雷达图像配准
《全元诗》未编码疑难字考辨十五则
子带编码在图像压缩编码中的应用
解码eUCP2.0
Empa 创新气门总成可节省燃油约20%
NAD C368解码/放大器一体机
Quad(国都)Vena解码/放大器一体机
Genome and healthcare