APP下载

数字音频中合理精度转换的重要性

2018-10-13

乐府新声 2018年3期
关键词:数字音频电平工作站

刘 栋

[内容提要]在数字音频中,数据的准确是很重要的,适当的选用恰当的量化比特数和运用抖动处理是非常必要的,抖动处理不能给原有的声音带来什么好的变化,但是恰当的使用抖动处理可以保持相对良好的音质也是非常重要的。合理的精度转换处理,会使数字音频产生的误差变的更小,并且能保持非常高质量的音质,会让数字音频尽可能的像模拟音频那样的线性和平顺。

音频的制作从创作到成品,过程没有太大的改变,但是声音和格式确实在改变。自20世纪中期,模拟磁带录音机在唱片工业中担负着重大的作用,并广泛的运用于专业录音棚等录音中,当时的录音几乎完全依靠模拟磁性媒体将声音存储在磁带上。因为其价格昂贵损耗严重,模拟磁带录音的使用已经越来越少了,但是也因为模拟录音的特殊声音特点是现在数字录音无法替代的,那种丰满有力自然的声音,使得它仍被高度的关注。但是模拟磁带录音的局限性原因,导致它很有可能在未来行业内逐渐消失。到了大概80年代数字录音的出现,数字录音技术迅速的从模拟格式转变成磁带或硬盘的数字格式,大型多轨数字音频录音系统的出现,建立了当时数字音频的工业标准。多轨录音技术是以整个录音系统为核心,将所有的音频信号,通过模拟数字转换器,转换成数字音频信号,通过数字多轨录音工作站,记录与保存下来的。由于当时各种条件的限制,这种多轨的数字录音系统,价格也是非常昂贵,但是带来的强大的处理能力和便捷优势。多轨录音技术的迅速发展,改变了模拟录音的基本结构和格式。进入21世纪,这样的局面产生了一些变化,多数的数字音频工作放弃了操作复杂笨重的硬件工作站开始依赖电脑和软件,很多的传统硬件上的功能,被转移到了数字音频软件中去。这样既大大降低了工作强度和成本,还把以前只能简单操作和调节的功能变得更加细化和复杂。因为电脑技术的发展和数字化制作技术产生,改变了我们之前在模拟设备上使用的录制编辑和处理技术,使之在制作上更为便捷和准确。数字音频也被推到了史无前例的高度,一些音频厂家开发大量的数字音频接口与电脑构建成数字音频工作站。数字音频的精度迅速的提升,出现了更高的24比特、32比特浮点采样深度和96kHz、192kHz的采样频率。

CD唱片很可能是第一个也是最后一个,专业的数字音频实体唱片。虽然有更好的DVD-A,但是对于其在国内的发展及大多人们的听觉理念和听觉环境及设备,面对高解析和大容量多数人还会选择便捷、高性价比的数据播放格式。CD唱片比起黑胶或模拟的磁带,更容易制作和生产,甚至是可以完全通过一个人完成制作的。人们开始对声音的要求越来越高,在刚有录音的年代,人们可能认为声音已经很好了,还原度已经很高了,和现实中的声音没有什么不一样的,但随着声音制作工艺质量及播放设备的不断提高,人们开始觉得以前的声音是有缺陷的。如果你常使用一些压缩音频设备或者是低采样频率的声音来听音乐,习惯了你不会感觉它有什么问题,但如果使用更高的解析度来听声音,你会发现原来差别是非常明显的。随着互联网的迅速发展,音乐的传播范围也发生了巨大的变化。现在,我们只需要在电脑或者智能手机上安装音乐软件,我们就可以完成从试听到购买新的音乐产品的全部过程,这使得音乐的储存、购买和制作更加便捷。互联网唱片的格式也因为网速的快速提升,从压缩严重的MP3变成高流速MP3或者无损音频格式,甚至是DSD编码的高采样音频格式。CD唱片将会渐渐地过时并消失在历史的舞台,但是它的16比特44.1kHz的工业标准也渐渐成为了数字音频行业的最常用的数字音频标准。

一、数字音频的量化

(一)模拟音频与数字音频

模拟录音的主要原理是将声音的物理振动形态通过电声转换并以模拟信号转换成磁信号记录和保存的,声音是从振动形态及能量完全的转变成电信号,并且是连续不断的,模拟信号是直接而简单的物理形态上的转换个过程。在模拟系统中,信号是连续不断的,声音的物理振动形态通过电信号的转换得以完整的记录。而在PCM数字系统中,数字音频信号则对电信号进行大幅度的简化和筛选。数字采样过程中随时间的连续变化模拟信号被换算成二进制,数字音频信号的振幅会被限制在一定的固定值上,这个过程叫量化。

随着数字时代的到来,音乐制作工作室及录音棚大多以电脑为核心,数字音频技术改变了录音的传统形式。数字音频技术的产生改变了整个声音领域的存在形态,新一代的数字音频及周边设备因为其便捷准确和强大的处理能力很快的替代了传统的音频录制及制作形式。数字音频的产生既给我们带来了诸多的好处,但是处理的复杂性也是比较明显的,在处理上和模拟音频有着极大的区别。数字音频是一门比较复杂的学科,但工作原理实际是相对简单的量值运算关系,如何处理好需要我们理解工作原理才能准确的把握好声音。

(二)数字音频中量化产生的误差

数字音频信号是将模拟音频信号进行人为的筛选和量化,数字音频信号对电信号进行筛选后进行大幅度的简化采样,如果说真实运动的模拟信号是一条连续的光滑运动曲线的话,数字信号是由大量筛选后的点组成和模拟音频信号非常相近的曲线,它不是连续的而是阶梯状的。按照CD唱片的标准16比特44.1kHz实际上是1秒钟采样了44100个采样点,这些点连成了接近于连续的声波曲线让人听起来感觉是连续的声音,但实际上每个采样点之间会有一定的距离,而不是连续不断的。数字录音过程是将模拟音频波形来进行周期的采样,然后计算每一个采样瞬间的数字,瞬间电压的变化用计算机二进制数字形式来表示,那采样周期越短就意味着采样密度越高,声音质量就越高。量化是采样过程中对电平信号幅度进行数字化的过程,将连续模拟信号的幅值电平转化成数字音频信号,量化深度决定着数字音频的动态范围,量化深度越高数字音频的动态范围越大,分辨率越高,记录就会越精确。量化比特深度对于数字音频的质量来说是很重要的,在专业音频领域最普遍使用的比特深度是16比特、20比特或24比特。比特深度决定了数字采样过程中振幅的精度范围,决定了数字声音样本的动态,也就是最低电平到最高电平的范围。每增加1比特深度动态范围就增加6dB,用比特率乘以6得到16比特的动态范围是96dB,而24比特是144dB。但是无论精度如何,数字音频信号和模拟声音之间还是存在着一定程度的误差,但是如果一个信号被量化而不去合理的转换或者处理,就会与原始输入信号的量化产生失真。这样产生了谐波、次谐波、叠加谐波等谐波,这或是一种非常不好的失真类型,它们的滋滋的声音听上去像摩擦声,让声音变得尖锐刺耳,没有了温暖和纵深感。为了防止这种情况的发生,信号是可以通过一些处理几乎完全消除这些谐波或者其他不需要的失真,并可以有一个定量的固定噪声电平来替代它。

二、数字音频工作站中数字量化失真的形成

在90年代初,数字音频工作站(DAW)已经开始大量的进入数字音频领域,人们很快放弃了工作效率慢的硬件编辑器,DAW工作站使用强大的原处理编辑模式,编辑器及更高的数据完整性更让大家喜欢,而且也可以通过使用非常灵活的交叉渐变编辑器来编辑那些音频的淡入淡出。在当时只有少数的几个工作站或软件程序适合后期制作的使用,因为不是每个工作站都有能力做多通道和高采样率的工程。选择适合的DAW数字音频工作站的标准包括软件和硬件的可靠性以及使用的稳定性。在此之前很多一些制作的音频大多使用的是实时调整的方法做处理,但越来越多的数字音频处理器是可以通过信息进行远程控制,这使它们的调制可以被自动化。在工作中,我们大量使用自动化,因为高级音频工作站都会提供自动化的均衡、淡出、动态、甚至自动化的插件。如果需要进行修改,我们也可以直接在DAW工作站中对其参数和时间进行修改。这种技术除了可以自动化插件还可以控制外部数字音频设备,自动化的最大优点是便于修改处理是以非破坏性的方式应用的。

我们在编辑音频或使用软件(DSP)效果器调整均衡、使用压缩或使用其他的算法运算处理后,音频的数值字节长度就会有变化,甚至一个16比特的音频被处理后字节长度可能会超过24比特的字节长度,如果我们简单的去除那些多余的低位字节数值,那么音质一定会有损失会下降。很多较新的数字音频处理器插件或数字音频工作站系统开始使用浮点运算来处理、编辑数字音频,浮点运算能够较容易的改变数据中的低位字节位置,将它变成更小的值,处理器就能够在内部用更大的数值来精准的计算处理结果。如果在32比特浮点或是64比特浮点运算的软件中,要最终生成导出16比特标准的音频文件,我们会损失很多的比特率,损失很多的动态范围。这些动态范围的损失是无法挽救的,就算我们重新导入这个文件数据会再次转换成浮点计算,那么动态范围也不可能恢复到以前一样。这种降低比特率的处理方式还会带来不必要的量化失真和噪声。通常情况下,在数字音频系统中进行任何的处理都会产生失真误差,我们在一些软件里进行效果处理或者是编辑处理计算精度都会达到32比特浮点,甚至更高的64比特浮点。这些处理出现的数字失真一般会非常低的电平上,但是为了让其他系统能够辨认,我们必须在信号输出的时候降低比特率,这种处理无论是否使用了抖动都会产生是新的噪音或失真。一些效果处理器,因为是32比特浮点或64比特浮点运算的,所以很多插件效果器会频繁的使用抖动。随意的加入抖动处理是没有任何好处的,只能为原信号添加更多的噪声而不能真正的纠正产生的误差失真,这些失真不仅在输出16比特标准时产生,甚至在输出24比特时仍然会产生失真。

三、数字音频信号中抖动处理器的运用

在模拟信号转换成数字信号或是数字信号转换到模拟信号的过程中,这一过程总是会存在一定程度的误差,对于这些误差产生的失真,通常会在AD/DA转换器上额外的加入一些干扰噪声,而这些干扰波是为了强行的纠正这些因为量化后产生的误差。这些额外的干扰噪声可能是不会被听见的,并且是可以有效的改变的,因为转换后出现的波形量化失真可以被干扰波补充并消除失真。抖动实际上是扩展的数字系统的分辨率,除了能够记录和再现模拟信号中高电平和中电平的数值外,抖动让我们在低电平的信号中进行编码。如果不使用抖动处理音乐的音质,会丢掉很多的声音,将会变差听起来是冷而粗糙的,每种不同类型的噪声形成的声音听起来都不一样,要比较每一种类型来确定哪一种类型更适合我们的音乐类型。

众所周知,数字音频处理的量化深度越高和更高转换速率声音也会更好,使用高量化深度和采样频率录制,然后采用往下采样的方法转换到44.1 kHz的CD采样频率,进行抖动处理到16比特。为了保证录音质量和精度,我们通常用24比特48kHz或更高的Wav或Aiff文件进行记录,因为这样我们可以保证有足够高的采样密度和动态范围,使声音尽可能的保持原样并减少噪声。但是,因为大多的民用系统分辨率达不到专业设备的精度、CD唱片或常用的数字音频的格式要求,我们通常要把录制后经过缩混的高精度的音频向下转换。转换过程中,采样的量化深度进行向下转换,数字设备大多会把低位字节的数据四舍五入的简单的去除,而产生的误差就是被去除掉的那些信号。实际上声音细节是有较大的损失的,去除的信号再也没有办法恢复,产生量化失真。如果反复的进行,这些误差的信号会积累很明显的量化失真,导致低电平的信号声音色彩偏离。人们通常会对这些去掉的低位字节信号来建立一个空间感,当数字音频的低位字节信号被损失掉后,声音听起来会缺乏空间感和通透感。除非我们要以高精度的文件播放,但是大多数的时候我们要降低采样精度,如果没有精准的处理,运算的结果一定不会让我们满意,也就是会产生很多的失真。

(一)模拟信号的抖动处理

(二)数字信号的抖动处理

我们将最终的音频文件使用高采样率D/A转换器进行数字模拟转换以进行模拟处理,然后让信号通过多个模拟效果器,比如:模拟均衡器、模拟压缩器、模拟限制器等。如果有可能也会把信号发送给高质量的模拟调音台通过调音台的电平、均衡器进行调整,然后将材料记录到高采样率A/D转换器可选进一步数字处理。如果需要,还要把转换过来的数字信号发送给各种数字效果器。因为我们最终要制作的大多是16比特44.1kHz的标准,所以,我们要进行抖动处理(Dither),最后翻录到数字音频工作站(DAW)中。但是,由于大多数数字音频工作站(DAW)只能在一个单一环境下的工作,源材料不能以目标采样率记录,所以可能需要两个步骤(和两个DAW)。首先,将声音在新的DAW文件上以24位/ 44.1 kHz录制,然后在最后一步中将其抖动到16比特。如果使用的是数字效果器,因为大多的数字效果器经过核心运算处理后字长会增加很多,甚至达到32比特浮点,那如果不去进行处理,就会产生一定的误差失真。不仅是数字效果器,一些大型的数字调音台每一个通道、每一次处理都会出现超字符运算的叠加,数值结果也大大的超过了AES/EBU数字音频传送标准的24比特的传送能力,其他多余的信号都会产生错误。在不断进行的数字信号处理过程中,错误不断积累,带来了不必要的失真,所以添加抖动处理器可以尽量的避免这些误差产生的失真。

那么对于处理更高的采样精度的数字音频保留低位字节的信息或者让其计算的更加合理,抖动处理是必要的,这样大多的低位字节信息得以保留,当这些信号转化成模拟大多表现为噪声,我们可以使用高清晰耳机仔细的分辨,但是抖动不是简单的加入了一个噪声。如果音乐越丰富那么所产生的误差频率就会越多,谐波失真和频率倍数产生的关系都是成倍的关系,但是抖动产生的失真不是倍数关系,这样就会出现一些极度不和谐的声音,所以选择合理的整形抖动噪声也是必要的。抖动越大引起的噪音越大越强烈,那有时我们就要选择超低电平抖动了,因为这个抖动会直接影响最后播放声音的质量,抖动大噪音大而频率越丰富质量越差。比如:我们输出一个添加混响的16比特音频可以听到混响尾音产生低电平的失真非常清晰,如果是用了限制器处理来大幅提升信号,低电平的失真变得非常明显。如果加入了抖动,音频中的失真听不到了,但是能够听到加入了抖动噪声,如果我们对抖动噪声整形,这些噪声会因为掩蔽效应而不易听到了。

四、无整形抖动处理和高频整形抖动处理的运用

大部分的数字音频工作站自身都会自带抖动处理器,可能是一个单独的插件,也可能是输出导出中的一个选项,也有很多厂家插件提供抖动处理功能,尤其是那些限制器和音量最大化效果器。在我们熟悉的抖动处理器中,最常见的是软件的抖动处理器,比如:DAW软件自带的Dither或者Waves L2、L3的IDR、POW-r Dither、iZotope等等,又或者硬件的AD/DA转换器中的Dither比如:Apogee的UV22系统等等,Apogee的UV22系统只是在22kHz上添加了一个抖动。噪音在数字音频信号转换时,要用一些抖动信号来填补在精度转换时被去掉损失的部分信号,这样会使声音更平滑饱满。一般的抖动处理器都会有无整形抖动和不同类型整形(Shaping)抖动,一个16比特的无整形抖动的信号电平在-91dBFS,抖动噪声非常明显,而且可能会对一些音色产生掩蔽或衰弱,是一些声音变得模糊,让声像变得更窄降低了声像深度。整形抖动是在无整形抖动电平上的抖动噪声基础上进行整形滤波,使掩蔽效应最小化,把听觉最敏感区域的噪声减弱。不同类型的整形抖动频率曲线不同,对于适合的声音选择不同的频率曲线的抖动噪声来提高部分声音的清晰度,将添加的抖动噪声分不到听觉不容易察觉到的频率上去,既能保证声音的平顺通透,又听不到那么多的噪声。一些原始类型的整形抖动处理是加入一定的抖动噪声,来完全低消低电平信号误差失真,这种类型的抖动处理对信号处理后效果比较明显,可以将低电平的信号变得非常干净并且有较高的解析度。而一些深度的整形抖动噪声可以较大程度的降低信号中噪声,但是也会影响之前的音频信号出现不好的声音。有的时候我们也经常使用无整形的抖动,尤其是在比较激烈或吵杂的音乐风格中,加入一些噪音也是不错的。

图1.

我们以软件抖动处理器为例,我们扩大了最后的抖动噪声,可以在频谱上清晰地看到,Waves L3中IDR 量化选择16比特量化,抖动选择TYPE 1的无整形抖动,可以看到明显的噪声音频曲线(图:1)

同样,我们选择16比特量化,抖动选择TYPE 1的整形Moderate,比较柔和的抖动噪声,就已经明显的避开了中高频频率,把这部分频率噪声移到了更高的频率。

图2.

选择16比特量化,抖动选择TYPE 1的整形Ultra比较极端的抖动噪声,看到了中高频明显下潜,高频率噪声被移到了更高的频率而且很大(图2)。

图3.

使用POW-r Dither的三种不同的整形抖动,噪声在不同频率上的变化。

图4.

图中iZotope 6 的抖动处理器,其中包含采样深度量化、抖动强度、噪声整形类型强度等。

我们必须使用大增益的耳机来做声音的比较,如果监听声音不够理想那必须使用耳机来对声音的质量进行控制,一个耳机的使用会比监听音箱听到更多的噪音或声音的细节变化,如果发现了不能接受的声音和噪音,所有的都必须重新修改。监听耳机的作用主要和监听音箱一样,由于离耳朵更近,不受环境干扰,声音更清晰,并且声场定位更准确,所以能够听到声音的更多细节,可以非常准确的检查音频中的瑕疵。高质量的抖动和低质量的抖动所带来的音质上的差别很大,尤其是在低电平时,能够听出数字信号的截断或者抖动不当带来的音质下降,有的会有明显的噪声,有的可能出现一些颗粒感,这说明选择的抖动类型不太适合或者抖动处理器计算精度不够。在模拟设备上峰值超过0dB表头就会进入红区,但不会失真,模拟设备上通常会在这一限度的基础上再留出一定的动态范围。而在数字设备上凡超过0dB的声音信号会被削平形成削波失真。如果数字音频已经进行过峰值限制了,并且是响度电平很高的数字音频,在最后加入抖动时,峰值电平会增大,一些峰值电平会超过0dB产生削波失真,所以一定要注意最后加入抖动的电平。

结 语

因为在有些时候对于数字音频来说16比特的标准可能是必须的,我们没有办法只能采取降低比特率的方式得到声音质量降低的数字信号。在我们的音频工作站软件中虽然由运算误差所导致的失真是非常弱的,但是这些失真不断的叠加累计之后会产生很大的问题。抖动处理可以在很低的电平上添加一个随意性的噪声,但这个噪声并不是一种很简单的噪声,而是经过概率运算出来的随机噪声。这种处理,会使产生的误差变的很随意,可以去除这些声音与信号之间的关联来消除失真,这些处理会让数字音频变回模拟音频那样线性和平顺,但是代价就是不得不要添加一些噪声进去。在数字音频中,数据的准确是很重要的,适当的选用恰当的量化比特数和运用抖动处理是非常必要的,抖动处理不能给原有的声音带来什么好的变化,但是恰当的使用抖动处理可以保持相对良好的音质也是非常重要的。精度和抖动是数字音频中最小,最微不足道的问题,也是最重要的问题,我们必须了解如何处理利用精度和适当的抖动,但是我们也必须把问题放在正确的角度。如果我们想让所有的都准确,并且能保持非常高质量的音质,那么正确的合理的精度转化是非常重要的。但是,如果缩混的不好,或者音乐声音本身就没有这么好,那么这些处理就可能并不那么重要了。

猜你喜欢

数字音频电平工作站
左权浙理大 共建工作站
二电平和三电平网侧变流器控制及谐波比较*
三电平PWM整流器下的地铁牵引供电系统探讨
戴尔Precision 5750移动工作站
数字音频广播业务和航空无线电导航业务的兼容研究测试
三电平H桥逆变器差模干扰源研究
基于FPGA的多协议数字音频信号发生方法
数字音频及其嵌入技术在广播电视工程的应用
德钧关爱工作站
一种新型的级联型多电平逆变器研究