APP下载

HDTV嵌入数字音频分析软件设计

2012-06-25章文辉

电视技术 2012年2期
关键词:数字音频数据流高清

刘 越,章文辉

(中国传媒大学 信息工程学院,北京 100024)

随着全国高清频道数量的不断增多和相关政策的发布,人们已经完全迎来了高清时代。高清视频无疑带来了更逼真的视觉享受,如何获得更高的听觉享受,也将逐渐成为另一研究课题。

数字音频数据流可以通过电缆线单独传输,也可嵌入在数字视频SDI流每一行的HBI(行逆程)中的辅助数据空间中传输。数字视频嵌入音频,并非单独传输音频数据,而是将音频数据按照一定格式封装成数据包,在视频信号的辅助数据空间内传输。这样不仅解决了视频、音频不同步的问题,也大大节省了传输路线和装配成本。但是,对于电视台、影像公司、电影制作公司等传媒公司,常常需要单独对数字音频进行监控和测量。所以,如何实现嵌入数字音频的解嵌和分析,也得到越来越多的关注。

鉴于上述问题,笔者设计了基于SMPTE299M标准的HDTV嵌入数字音频分析软件。突破传统基于硬件的系统设计,采用软件从HD-SDI抓包文件中提取出一帧音频数据,实现非实时分析和检测,对系统测试、理论研究、实践教学有着重要意义。

1 嵌入音频基本原理

AES/EBU数字音频接口标准规定,音频数据以2的补码进行编码,接口可以对取样频率为48 kHz、44.1 kHz和32 kHz,量化比特数为24,20和16的数字音频信号进行实时传输,并提供辅助信息。

1.1 AES/EBU音频格式

数字声音的数据按照帧划分,每个数据帧(frame)为64 bit,分为两个子帧,即Sub-frame 1和Sub-frame 2。每个子帧中的前4 bit为前置码,用于子帧、帧和块的同步和识别。每个子帧的后4 bit(V,U,C,P)为辅助数据,各比特位所代表的功能如表1所示[1-4]。

表1 辅助数据[5]

每192个音频帧(frame)构成1个音频块(block)。有3种前置码X,Y和Z,Z标志每个音频块的开始。每个音频块中,除了第1个音频帧的Sub-frame 1的前置码用Z标识外,其余各帧的Sub-frame 1的前置码都为X;所有Sub-frame 2的前置码都用Y表示[6]。AES/EBU音频与音频数据包之间的关系如图1所示。

1.2 辅助数据空间

高清隔行扫描行、场定时关系如图2所示。

高清隔行扫描系统,每帧图像共1125 行。有效视频区1080 行,数字场消隐区45行。其中,第21~560行为第1场有效视频区,第584~1123 为第2场有效视频区;第1124 行、1125 行和l~20行为第1场数字场消隐区,第561~583行为第2场数字消隐区。

HD-SDI信号里,除了有效视频信号之外,在视频信号消隐区里还包含其他信息[8],如有效视频的起始点SAV和终止点EAV、行数信息LN、冗余校验码CRC、辅助数据ANC等信息。数字音频信号嵌入在分量数字视频格式有效行的辅助数据区中。行消隐期间的取样708个取样字,在标准中用“SAV”和“EAV”予以界定。音频信号嵌入在辅助数据ANC内[7]。

1.3 HD-SDI数据流结构

HD-SDI即高清串行数字接口,用于传输高清视频。HD-SDI信号由亮度数据流和两个色差数据流复用而成,针对4∶2∶2的样点结构,亮度信号取样频率为13.5 MHz,两个色差信号取样频率为6.75 MHz,以10 bit进行量化,所以基本码率为1485 Mbit/s。其数据流结构如图3所示(T为取样周期)。

1.4 嵌入音频格式

嵌入到视频数据中的音频包有2种:音频控制包(Audio Control Packet,ACP)、音频数据包(Audio Data Packet,ADP)[9]。高清音频数据包支持24位,不存在音频扩展包。音频数据包的长度是固定的,且每个包只包含每个音频组中4个通道的各1个音频数据。高清音频数据包中还包含一些额外的数据和纠错数据。

音频数据包只在色差数据流(Cb/Cr)的行附属数据空间传输。在由源视频格式定义的切换点之后的一行所在的附属数据空间内,不插入音频数据包。音频数据包结构如图4所示,由附属数据标志(ADF)、数据标志符(DID)、数据块序号(DBN)、数据计数(DC)、用户数据字(UDW)及校验和(CS)组成[6]。

每4个音频数据构成1个音频组,每个音频组都对应1个音频控制包。1个给定的音频组中的全部音频通道应具有相同的取样频率、取样相位和同步/异步状态,这些控制信息都包含在音频控制包内。

音频控制包应当每场传输一次,因为隔行扫描2场为一帧,所以每帧HD-SDI传输2次音频控制包。音频控制包在Y并行数据流视频切换点(Video Switching Point)之后第二行的行附属数据空间内传输。音频数据包结构如图5所示,由附属数据标志(ADF)、数据标志符(DID)、数据块序号(DBN)、数据计数(DC)、用户数据字(UDW)、校验和(CS)组成[6]。

2 嵌入音频分析软件设计

2.1 系统框图

软件设计的系统框图如图6所示。大体分为3部分:音频控制包和音频数据包的提取;音频控制包和音频数据包格式的分析;音频数据的提取和取补[9]。

2.2 实验结果

为验证本文所述分析的可行性,按照图6所示的流程,利用C语言编程实现。数据源采用一帧HD-SDI抓包文件,成功实现分析任意行音频数据包和音频控制包的格式,取出音频个数、采样频率和嵌入的音频通道数。实验结果如图7所示。

2.3 实现方法

HD-SDI数据量很大,1帧画面有400多万个数据。限于软件处理速度,该实验采取实时读取、分析的设计思路。每读取一行便分析一行,对需要的数据进行处理、显示、存储,不需要的数据则直接跳过。音频数据包和音频控制包以附属数据标志(ADF)即000,3FF,3FF为标志。音频数据包嵌入在辅助数据空间中,所以编程实现直接跳过有效视频区。音频控制包只嵌入在视频切换点之后的第2行的行附属数据空间。以1125 /50/2∶1系统为例,切换点在第7行及第659行,所以只需在Y并行流的第9行及第571行的行附属数据空间内寻找音频控制包。同时,实验采用多线程技术,以提高效率。

3 小结

本文提出的基于SMPTE299的HD-SDI嵌入音频分析软件实现简单,通用性强。随着高清数字广播电视的逐步发展和高清电视的不断普及,对嵌入音频的分析和研究,也将占据越来越重要的地位。虽然限于软件的处理速度,只能进行静态分析,但其对理论研究、实验教学、系统测试都具有重要意义,对于高清数字电视的发展与变革也有一定推动作用。

[1]王明臣,姜秀华,张永辉.数字电视与高清晰度电视[M].北京:中国广播电视出版社,2003.

[2]姜秀华,张永辉.数字电视广播原理与应用[M].北京:人民邮电出版社,2007.

[3]Society of Motion Picture and Television Engineers.SMPTE292M-1998 Bit-Serial digital interface for high-definition television systems[S].1998.

[4]国家广播电影电视总局.GY/T 162-2000高清晰度电视串行接口中作为附属数据信号的24比特数字音频格式[S].2000.

[5]SMPTE.ANSI/SMPTE 299M-199724 -Bit digital audio format for hdtv bit-serial interface[S].1997.

[6]HARDING P,SHERRATT R,GUY C.Convergence of standard defi⁃nition(SD)and high definition(HD)SDI for audio multiplexing and de-multiplexing by implementing modular design[C]//Proc.2004 IEEE International Symposium on Consumer Electronics.[S.l.]:IEEE Press,2004:541-544.

[7]姜秀华,柴剑平,林正豹,等.现代电视原理[M].北京:高等教育出版社,2008.

[8]李宁.HD-SDI信号的特征及检测方法的提案[J].现代电视技术,2004,(8):35-42.

[9]谢元禄,张春,王志华.基于SMPTE272M标准的音频加解嵌系统设计[J].电视技术,2008,32(7):10-23.

猜你喜欢

数字音频数据流高清
高清大脑皮层发育新图谱绘成
汽车维修数据流基础(上)
汽车维修数据流基础(下)
教你玩转AV设备(一):4K高清播放机使用指南
基于FPGA的多协议数字音频信号发生方法
数字音频及其嵌入技术在广播电视工程的应用
数字音频广播信号接收系统及其软件架构
数字音频广播的特点
数码单反拍摄高清视频时同期声的收录探索
基于数据流聚类的多目标跟踪算法