2.2 MP3編碼器---編碼器是一種計算機算法,它使用心理聲學模型(即基于感知的模型)將原始的數(shù)字音頻文件壓縮成為MP3文件,如圖4所示。
---壓縮算法使用心理聲學模型以縮小原始聲音文件的大小,同時也使用了均衡量化器和編碼器。通過使用快速傅立葉變換(FFT),時域的原始聲音信號被轉換至頻域,以提供各個頻率元素的振幅。
---人類的耳朵所能聽到的聲音信號的振幅只有確定的一些值,而且頻率在15Hz到20000Hz之間,了解了這一事實,音頻信號的大小就很容易被縮小了。
---例如,同時具有很大聲響(即信號中有許多的頻率元素)和微弱聲音(即信號只有少量的頻率元素)的音頻信號進行壓縮時,壓縮算法去除了微弱聲音的信號,因為這種聲音不可能讓每一個人都聽到。這一技術被稱為聲音掩蔽。如果出現(xiàn)強信號,那么,其后的弱信號是不可知的。MPEG算法移除了較弱的信號,如圖5所示,信號1與信號2都將被掩蔽,信號3將被MPEG算法采用。這種作法是十分有利的,因為被移除的信息不再需要占用硬盤空間和互聯(lián)網(wǎng)帶寬。---壓縮算法可以縮小原始信號的帶寬,因為在大多數(shù)情況下,處于人類聽覺范圍邊界頻率(如15Hz和20kHz)的信號是不會被聽到的,其中的信息會被漏掉。雖然這里例舉的是一些最簡單的例子,但是正是使用了這些例子中所蘊涵的基本概念,才將數(shù)字音頻信號壓縮成為MP3文件格式。
---MP3文件的一個重要特點是在它被編碼后還可以被“流動化”。MP3文件流其實是將MP3文件中的比特段經(jīng)由互聯(lián)網(wǎng)傳送至電腦的過程。MP3文件流的產生使互聯(lián)網(wǎng)上可以擁有CD音質的廣播站。
---WAV、AIFF和AU等這些舊格式的音頻文件容量都較大。如果想通過網(wǎng)絡播放這些格式的文件,首先需要等待整個聲音文件通過互聯(lián)網(wǎng)下載完成之后,才能開始收聽。但是,使用音頻文件流不需要等到整個聲音文件完全下載完畢,就可以開始播放聲音了。當然,只有擁有了高度壓縮的聲音文件以及快速的調制解調器,音頻流體化才可能實現(xiàn)。---過去,大多數(shù)在線廣播的音質與調幅無線電廣播的音質相仿,有較嚴重的失真。因為只有縮小原信號的帶寬,才能將信號傳送至標準的56kbps調制解調器進行處理。而現(xiàn)在,通過使用電纜調制解調器技術,同樣的廣播站可以使用MP3工藝經(jīng)由互聯(lián)網(wǎng)廣播出高質量的聲音信號。
2.3 MP3解碼器
---MP3軟件解碼器是一種計算機算法,它將MP3格式的文件轉換成為可以通過聲卡或其他音頻設備播放的WAV文件。
---如圖6所示,解碼器接收比特流,并對其進行與編碼器相反的處理。首先,比特流被解碼,而后被簡化,最后,使用傅立葉逆變換(IFFT)將頻域中的信號重新轉換至時域,這樣,聲音信號才可以通過聲卡或其他音頻設備播放出來。
---目前,有很多大型軟件商致力于軟件解碼器的開發(fā)和不斷優(yōu)化,其升級速度較快,音頻質量較高,解碼技術也已經(jīng)比較成熟。不過,因為軟件解碼要打開電腦,電腦中聲卡質量的好壞和其他噪音(如交流聲、風扇聲和電磁干擾等)的大小,對MP3的回放影響相當大,因此,還可使用硬件IC解碼技術,也就是我們常用的MP3播放器的解碼技術(包括部分光盤設備的解碼技術)。由于MP3播放器(使用閃存的產品)中沒有機械部件,所以在MP3播放器中不會出現(xiàn)電腦中才會有的其他噪音。硬件IC技術經(jīng)過了幾年的長足發(fā)展,如今也已經(jīng)相當成熟。目前市場上MP3播放器中常用的芯片有Sigmatel、Actions、Sunplus、MosArt、Atmel、Telechip、ST、PHILIPS和CRYSTAL等,其中Actions為中國公司的產品,而市場上最常見的芯片一般是ST和Telechip。
---無論是軟件解碼器還是硬件解碼器,其復雜程度都與需解碼的文件格式類型直接相關。與編碼器相類似,MPEG中層次越高,解碼的復雜度也越高。因此,第一層的解碼器要比第三層的解碼器結構簡單。為了達到MP3解碼器的標準,解碼器必需具有后向兼容性,即如果一個解碼器聲明它應用于MPEG-1的第三層,那么,它也一定可以適用于MPEG-1的第一層和第二層。
---原數(shù)據(jù)被編碼后,解碼器可以將其解釋成各種不同質量的聲音。聲音質量的范圍是從電話音質到CD音質,如表2所示。
---表2顯示出聲音質量和比特率與帶寬具有十分緊密的聯(lián)系。大多數(shù)情況下,帶寬是通信系統(tǒng)中的限制因素,這就是電話系統(tǒng)中聲音質量較差的原因,因為電話系統(tǒng)可容納的帶寬十分有限。
2.4 MP3發(fā)展現(xiàn)狀
---隨著MP3技術的出現(xiàn),對音頻文件的存儲及恢復得到了驚人的發(fā)展。最初,通過互聯(lián)網(wǎng)下載一首60Mb的歌曲需要近4小時10分鐘,而在利用了MP3技術和它12:1的壓縮率之后,現(xiàn)在下載同樣的一首歌曲可能只需要20分鐘。如果再使用電纜調制解調器的話,可以節(jié)省的時間就更多了,只需要1.5分鐘就可以下載這首歌曲。網(wǎng)絡快速下載的能力,使人們越來越熱忠于在互聯(lián)網(wǎng)上下載和交易MP3文件。而MP3強大的壓縮算法使整個CD音樂庫可以被存儲在幾張而不是幾百張CD中。
---除了MP3技術,目前還有一些其他的音頻編碼技術。MP3pro是MP3技術改良而來的,在與MP3格式同樣的音質時,文件的大小卻只需原來的一半,且與MP3技術之間相互兼容。也就是說在MP3上要用128kbps來達到的音質,在MP3pro上僅用64kbps就能夠實現(xiàn),但是由于技術版權等問題,這一項比較有潛力的技術被淹沒了。又如Real Networks公司推出的RealAudio,它最大的特點就是可以實時傳輸音頻信息,尤其是在網(wǎng)速較慢的情況下,仍然可以較為流暢地傳送數(shù)據(jù),因此RealAudio主要適用于網(wǎng)絡上的在線播放。但是,這種聲音格式的音質由于受到自身編碼的影響,只能夠達到廣播收音的質量,所以在隨身聽的市場上也沒有得到廣泛的推廣。
---MP3技術很好的克服了其他編碼技術在發(fā)展中所遇到的阻力,成為目前音頻編碼技術中當之無愧的的霸主。
3 結束語
---經(jīng)過短暫的十幾年發(fā)展,MP3技術已經(jīng)從默默無聞變成了一項應用最廣泛、知名度最高的音頻標準。但未來是什么樣子,沒有人能夠預知。由于技術的不斷發(fā)展,更新的技術還會出現(xiàn),MP3技術的前景也許并非我們想像中那么光明。然而,可以肯定的是MP3技術目前使用廣泛,不可能突然之間徹底消失,其格式可能還會經(jīng)歷一些變化,比如滿足MPEG-1第四層協(xié)議或者其他壓縮率更高算法的格式,我們也許有機會親眼見到下一代更為強大的MP3標準的出現(xiàn)。
參考文獻
1 M. Fattouche. Free and Legal MP3 Music,University of Calgary ENEL 571. Lectures Notes. http://www.mpeg.org/MPEG/mp3.html#faqs. 1999
2 Music and Technology Companies Join to Develop Means to Protect Copyrighted Music. http://www.techlawjournal.com/intelpro/19981216.htm. 1999
3 耿靜. MPEG視頻的發(fā)展趨勢. 數(shù)據(jù)通信. 2002年第4期





