海浩网论坛

 找回密码
 关闭注册
搜索
热搜: 女囚槛 win7
查看: 265|回复: 0
打印 上一主题 下一主题

高保真音乐格式揭密[转] [复制链接]

UID
25763
注册时间
2003-5-13
帖子
210
精华
0
跳转到指定楼层
1#
发表于 2003-5-21 13:47:08 |只看该作者 |倒序浏览
音乐是从模拟过程到数字化过程,但音乐并非完成了数字化后就大功告成了,因为它还要通过一些编码格式来保存和回放,而编码格式直接影响到音乐的还原度,即保真度。音乐CD、HDCD、XRCD、SACD、DVD-Audio、DTS CD等都可算是高保真的音乐格式。下面,我们就来看看这几种音乐格式。
  
  音乐CD(Compact Disc Digital Audio)
  
  关于音乐CD实在是有太多可以聊的东东了,这个在1982年由索尼(SONY)和飞利浦(PHILIPS)共同制定于红皮书的储存媒体既便于携带,音质又比录音磁带好,流行至今毫无颓势。关于它的规格有许多有趣的故事,如为什么一张标准长度的音乐CD是74分钟呢?传说这是因为设计者想要把贝多芬第九交响曲存进一张音乐CD中,于是开始估计音乐CD的直径。另一种说法是著名指挥家卡拉扬(Herbert von KaraJan)的要求,因为卡拉扬指挥的贝多芬第九交响曲总长度大概在68分钟左右,而一般的版本大概在65~74分钟。还有一种说法是索尼当时的总裁大贺典雄所决定的。
  
  据说,卡拉扬在世时跟大贺的交情不浅,而大贺本身就是声乐家,所以他们之间算亦师亦友的感情,因此当年飞利浦找到索尼制定音乐CD规格时,大贺就一口咬定一张音乐CD一定要能装得下贝多芬第九交响曲,这还因为古典音乐单首曲目的长度比这个长的也寥寥无几了!为了能在欣赏时不影响兴致,所以大贺对此非常坚持,而日后大贺用音乐CD录制卡拉扬预演的曲目,并让卡拉扬听,卡拉扬也非常赞赏这个划时代的数字媒体,甚至后来在说明会之类的活动时,卡拉扬也帮音乐CD说了不少好话。
  
  音乐CD是以螺旋状由内到外储存信息的,在一张标准74分钟的音乐CD中,从里绕到外总共有22188圈,把它全部伸展开来长达5.7km。音乐CD的读取方式是等线速度(CLV),每秒有1.2m长的信息经过激光头,激光在真空中波长为780nm,以检测音乐CD表面的凹凸变化来判断信号。表面的凹凸刻痕宽0.5μm,深度为0.11μm(约为780nm激光在音乐CD塑料材料内波长的1/4),长度为0.8~3.1μm。音乐CD是以由凹变凸和由凸变凹定义为1,平坦的部分为0,所以改变刻痕的长度可以改变信息内容。而读取头就是靠着由凹变凸和由凸变凹时的光反射作用来判断信号的。
  
  音乐CD的规格为什么是44.1KHz呢?关于44.1KHz这个数字的选取有两层意思。首先我们知道人耳的聆听范围是20Hz到20KHz,根据奈奎斯特定律(Nyquist Functions),理论上我们只要用40KHz以上的采样率就可以完整记录20KHz以下的信号。那么为什么要用44.1KHz这个数字呢?
  
  其实这涉及到的环节非常复杂,我们必须从音乐CD的信号储存格式说起。首先要引入的名词是BLOCK(区块),音乐CD每秒钟的信息被分成7350个区块。每个区块内有588Bit信息。可是这588Bit无法全部用来储存有意义的信息,因为过度密集的凹凸变化会增加硬件设计的难度,且音乐CD是以由凹变凸和由凸变凹定义为1,1是无法重复出现的,因此每14个Bit中只有8个Bit是有意义的,这就是EFM(Eight to Fourteen Modulation,8-14调制编码)原理。除去14Bit中6Bit无意义的信息,每个区块剩下336Bit(588×8/14),再除去72Bit的同步(SYNC)与合并(MERGE)信息,还剩下264Bit,换算过来等于33bytes(264/8)。在这33个数据byte中,只有24bytes的音乐信号具有实际意义。这样,每个区块就有192Bit(24×8),由于音乐CD以16Bit记录信息大小,因此每个区块有6个立体声采样点信息(192/2 /16)。记得前面说过每秒钟有7350个区块吗?由此可以得知每秒钟有6×7350=44100个立体声采样点。
  
  音乐CD的每个区块中还有1个sub-code byte。在光盘lead-in(导入)区域内的sub-code记录了这张音乐CD有几个轨道,总长度多少;在音轨部分的sub-code则记录了从这轨开头已经经过了多少时间,从第一轨开头又经历了多少时间,音轨是二声道还是四声道(不过从来没听说过四声道的音乐CD),是否允许复制,以及该音轨是否经过Pre-emphasis(预加重,内容请参看上期相关文章)处理与纠错。另外sub-code也可以用来记录该音乐CD的UPC(Universal Product Code,通用产品编码)与该音轨的ISRC(International Standard Recording Code,国际标准录音编码)。ISRC由IFPI(The International Federation of the Phonographic Industry,国际唱片业协会)统一发放,前两位英文代表国名,接下来三位英文为发行者,最后五位是数字。
  
  我们常在古典音乐CD上看到DDD、ADD、AAD字样,这代表了什么意思呢?这三个英文字母其实是Digital(数字)或Analog(模拟)的缩写,第一个英文字母表示录音时的母带为数字或是模拟格式,第二的英文字母代表混音及剪辑时母带使用数字或是模拟格式,最后一个英文字母代表最终的Master母带是用数字还是模拟格式储存。由于音乐CD的母带一定是数字化的,因此最后一个英文字母都是D。
  
  HDCD(High Definition Compatible Digital)
  
  别给这个产品名称给吓倒了,HDCD本质上还是CD,放到一般的CD播放器中播放完全没有问题。HDCD是Pacific Microsonics的创始人Keith Johnson和Pflash Pflaumer于1995年提出的规格,其技术本身也包含从20Bit的原始母带Dither(抖动,请参看名词解释)至16Bit的技术,但其独特的地方在于比Dither能更有效地利用CD的第16个Bit(LSB,Least Significant Bit),它不但用Dither技术处理LSB,使得音质比一般CD好,甚至将LSB以固定的数字排列,当作是一种指令,这种指令在一般的CD播放器上没有作用,可是在具备HDCD解码芯片的CD播放器上,这些特殊的指令就可以改变声音的特性,例如增加某频段的音量,提升整体动态范围,或是调整音场。这些“佐料”使得声音听起来细节更多,定位更加精准,这正是HDCD的特色。HDCD的技术并非限于音乐CD,在DVD-Audio上也有发挥的空间。目前HDCD的技术属于Microsoft(微软),Windows XP操作系统内部的Windows Media Player 8.0就有识别HDCD的能力。
  
  
  XRCD(eXtended Resolution Compact Disc)
  
  XRCD也是不折不扣的音乐CD,由日本JVC公司研制发展。XRCD的特色是以DIGITAL K2处理。这套技术不光是以20Bit、128倍超采样将模拟信号转为数字信号,还加上另一套20Bit转16Bit的Dither技巧,尽量将CD制作过程的每一个步骤最佳化!不但非常注重各个器材的供电品质、器材的连接线材和配送系统,而且为了降低Jitter(时基误差,请参看名词解释)对音质的影响,所有的数字信号都改用SDIF-2传输,有别于一般使用的AES/EBU工业标准,并对于时钟的运作精度做过特别的校正。经处理最后的CD母带信息储存于索尼PCM9000真24BitMO录音机中,送至位于日本横滨的全世界唯一一条XRCD生产线开工生产。XRCD另外一个特色是以铝作为反射面(与一般CD相同),JVC称使用铝可以达到比较低的Jitter。XRCD碟片价位相当高,通常要数百元以上,但是音质与音场表现的确有其独到之处,因此在发烧音响界仍有其市场。
  
  DVD-Audio
  
  DVD-Audio是以DVD(Digital Versatile Disc,数字多用途光盘)作为储存介质的新音乐媒体,于1999年3月出台。采样方式为LPCM(Linear Pulse Code Modulation,线性脉冲编码调制),可选择采用MLP(Meridian Lossless Packing,无损压缩音频)技术减少庞大的信息容量。DVD-Audio的采样率有44.1KHz、48KHz、88.2KHz、96KHz、176.4KHz和192KHz等,可以16Bit、20Bit、24Bit精度量化,使用立体声录制时最大信息流量可达192KHz、24Bit,当采用5.1声道录制时最大采样率可达96KHz。DVD-Audio如此高的采样率最大的好处在于不需要繁复的超采样运算就可以得到正确的音乐信号波形,另一个好处是减少Jitter对音质的影响。DVD-Audio碟片目前的价位大概也在数百元左右。
  
  
  SACD(Super Audio Compact Disc)
  
  SACD是索尼提出的以DVD为储存媒体的下一代音乐储存规格。SACD的最大特色在于摒弃PCM,改用Delta-Sigma Modulation(△-∑调制,噪声修整技术),它是PWM(Pulse Width Modulation,脉冲宽度调制)的一种。其实Delta-Sigma Modulation是很常见的技术,低价的CD播放器、床头音响、CD随身听、声卡都是先将PCM信号经过Delta-Sigma Modulation然后再转为模拟信号的。Delta-Sigma Modulation可以用较低的成本和比较少的数字滤波器达到较高品质的声音水准,因此大受欢迎,飞利浦的Bitstream(比特流)也属此类技术。索尼将其改良的Delta-Sigma Modulation技术命名为DSD(Direct Stream Digital,直接流数字)。PWM不同于PCM采样,是以信号振幅大小为主,而且改为记录目前信息数值大于或是小于前一个信息,是相当复杂的技术,我们简略地以下图表示。
  
  SACD使用DSD的最大好处是从录音到播放全部都以Delta-Sigma Modulation处理数字信号,不用在录音时先用PWM采样再转回PCM储存,放音时又要把PCM经过PWM处理再经转回模拟信号的层层手续(听起来很笨,可是绝大部分的CD都是这样工作的),因此可以降低失真,以下是工作过程:
  
  SACD同样也有立体声和5.1声道的规格。由于SACD并非PCM编码,不需要多Bit储存振幅,只要1个Bit就够了,且采样率高达2822400Hz。SACD如同DVD-Audio有单面单层和单面双层的规格,比较特殊的是混合光盘(Hybrid Disc),此种格式第一层信息与普通CD相同,可以放到CD播放器中播放,第二层则是存放正宗的DSD信号,供SACD播放器播放。
  
  
  DTS CD
  
  DTS CD的信息格式与一般CD相同,都是16Bit、44.1KHz,可是记录的信息内容不是PCM采样信号,而是经过DTS(Digital Theater Systems)编码后的5.1声道信号。DTS CD欣赏时必须将CD转盘的数字输出接至支持DTS的解码器才能获得5.1声道模拟信号。由于DTS CD格式与普通CD相同,因此与HDCD、XRCD一样都可以用普通的方法复制。
  
  名词解释
  
  Dither:是数字音乐处理上非常神奇的技巧,目的是通过用少数的Bit达到与较多Bit同样的听觉效果,方法是在最后一个Bit(LSB)上动“手脚”。例如用16Bit记录听起来好似20Bit的信息,听到原先16Bit无法记录的微小信息。举例来说,现在我有个20Bit的采样信息,现在想将其存为16Bit的信息格式,最简单的转换方式就是直接把后面4个Bit去掉,但是这样就失去用20Bit录音/混音的意义。比较技巧性的方法是在第17~20Bit中加入一些噪音,这段噪音就叫做Dither。这些噪音加入后,可能会进位而改变第16个Bit的信息,然后我们再把最后4个Bit删掉,这个过程我们称为redithering,用意是让后面4个Bit的数据线性地反映在第16个Bit上。由于人耳具有轻易将噪音与乐音分离的能力,所以虽然我们加入了噪音,实际上我们却听到了更多音乐的细节。
  
  我们通过一个比喻来让大家了解Dither:我们通过手指间的细缝只能看到眼前部分的图像,但是如果前后挥动手掌,就可以通过不同时刻看到的整个图像的各个部份,从而在大脑中建构出完整的图形信息,这就是大脑神奇的地方。Dither与此类似,但不是简单的理论就可以说得清楚的。在众多的Dither技术中,索尼(SONY)公司的SBM(Super Bit Mapping,超级数码映像)、LIVE STUDIO RECORDINGS的ULTRA MATRIX PROCESSING(超级矩阵处理)都是专攻20Bit转16Bit的技术。Dither的数字音讯处理用途非常广泛,凡是两个波形的相加、振幅的缩放、Normalize都会用到。现在的录音室已经发展到24Bit录音,在这个音乐CD还是主流储存媒体的时代,Dither还是非常重要的技术。顺便提一下,在影像处理领域,将24Bit的全彩图像以16Bit的高彩画面显示也会用到Dither的技术。
  
  
  名词解释
  
  Jitter:一般翻译作时基误差,是数字音讯播放音质劣化的原因之一。Jitter会造成声音的改变,成因并非振幅信息本身的错误,而是时间部分出错。在前文数字化的过程中我们知道一个采样点包括振幅和时间这两项信息,而Jitter造成振幅没有在准确的时间呈现出来就使得波形扭曲。在普通的CD唱机中,由于读取机构是由信息流量来判断转速是否合适,而电路的工作时基又是以读出的一连串数字信号的多少来决定,因此当转速不稳定时,每秒读出的信息数量就有误差,而电路工作时基就受到影响,由电路工作时间所决定的各个采样点的出现时间与实际的时间就产生误差,这就是Jitter的成因之一。还有很多影响工作时脉的因素可能造成Jitter,例如音乐CD的重量与厚度是否均匀影响转动稳定性、反射面的材质、石英震荡的品质、CD转盘到DAC解码器之间的连接线都会造成Jitter。避免Jitter发生最直接的方法就是re-clock,将接收的数字信号先存到缓冲存储器中,在精确的时钟工作下重新送出这些数字信号,并且让后续的数字电路以这个时钟为工作基准。有些Hi-End器材使用不同于普通S/PDIF的单线数字传输接口,加入了包含时钟信号的接线。而S/PDIF将工作时基信息藏在信息的变化中,因此信息流量会影响工作时脉。
  
  为了让读者对Jitter有更深刻的认识,笔者在此提出一个相关实验:准备一张音乐CD,通过这张母盘再复制一张音乐CD,然后用抓音轨软件检查确保这两张音乐CD的信息内容相同。可是,放入CD唱机中聆听时却发现两张CD的音质还是有很大差异。开始笔者猜测是因为CD唱机的读取机制不如计算机光驱精确,尝试用Digital Audio Labs公司出品的专业声卡CardDeluxe录制从CD唱机数字输出(SPDIF Out)的数字录音信号,再经过多次对比,我们发现数字录音的结果与直接抓音轨的信息内容相同,也就是说CD唱机读取信息内容并没有问题,而影响音质的主要原因就是Jitter——单位时间信息流量不稳定的变动造成Jitter,但这些信息内容本身并没有出错,因此不能单从数字录音的信息发现错误。
分享到: QQ空间QQ空间 腾讯微博腾讯微博 腾讯朋友腾讯朋友
分享分享0 收藏收藏0 支持支持0 反对反对0
您需要登录后才可以回帖 登录 | 关闭注册

2021 , Hello Everyone ^_^ ^_^ ^_^