摘要:介紹了小波變換在靜態(tài)圖像壓縮、實(shí)時(shí)連續(xù)媒體流等多媒體業(yè)務(wù)中的應(yīng)用,并結(jié)合ADV611芯片提出一套音視頻數(shù)據(jù)采集和壓縮的方案。為進(jìn)一步提高媒體服務(wù)質(zhì)量,在本方案中根據(jù)實(shí)際情況提出了幀間壓縮和碼率控制兩種解決方案。
關(guān)鍵詞:小波變換 圖像壓縮 實(shí)時(shí)連續(xù)媒體流 碼率控制 幀間編碼
隨著網(wǎng)絡(luò)用戶對(duì)多媒體業(yè)務(wù)需求的大量增加,基于Internet的音視頻數(shù)據(jù)采集、壓縮技術(shù)成為各種多媒體業(yè)務(wù)運(yùn)營的基本要求,國際標(biāo)準(zhǔn)化組織提出了多種國際標(biāo)準(zhǔn)(H.26X、MPEG-4等)來實(shí)現(xiàn)低碼率及甚低碼率下的多媒體數(shù)據(jù)壓縮、傳輸及存儲(chǔ)。而國內(nèi)外各大網(wǎng)絡(luò)軟硬件廠商紛紛出臺(tái)相應(yīng)的解決方案。在這些標(biāo)準(zhǔn)、方案中,小波變換使信號(hào)的低頻長時(shí)特性和高頻短時(shí)特性同時(shí)得到處理,有效地克服了傅氏變換在處理非常平穩(wěn)復(fù)雜圖像信號(hào)時(shí)所存在的局限性,因而各種多媒體業(yè)務(wù)應(yīng)用領(lǐng)域受到了廣泛的重視[1、2]。本文將以此為基礎(chǔ)對(duì)小波變換這一工具應(yīng)用到圖像壓縮、實(shí)時(shí)連續(xù)媒體流等領(lǐng)域做一些有益的嘗試與探討。

1 小波變換在圖像壓縮中的應(yīng)用
小波變換以其特有的變換特性在圖像壓縮領(lǐng)域得到了廣泛的應(yīng)用。如JPEG-2000、MPEG-4靜態(tài)圖像壓縮都采用了小波變換的方式。對(duì)于小波變換在靜態(tài)圖像壓縮中的應(yīng)用已經(jīng)有很多文獻(xiàn)對(duì)此做出了論述,此處不再贅述。以下只討論應(yīng)用價(jià)值更為廣闊的小波算法的硬件實(shí)現(xiàn)。
1.1 小波算法的硬件實(shí)現(xiàn)
美國AD公司的ADV611數(shù)字視頻編解碼芯片是一款低價(jià)、單片、多功能、全數(shù)字的CMOS超大規(guī)模集成電路,片內(nèi)集成了視頻接口、主機(jī)接口和SRAM,可以廣泛應(yīng)用于各個(gè)相關(guān)領(lǐng)域[5]。以下將從內(nèi)部框圖和算法分析兩個(gè)方面介紹該芯片的使用情況。

1.1.1 內(nèi)部框圖
圖1是ADV611的內(nèi)部框圖,大致可以分為六個(gè)模塊,其中較有特色的部分是清晰窗口和量化控制兩部分。清晰窗口(Quality Box)是將用戶感興趣的部分圖像采用壓縮比較小的方式編碼,而對(duì)其余背景區(qū)域則加大壓縮比。這種方式可以認(rèn)為是小波編碼在空間可伸縮性的一種應(yīng)用。量化控制是為了滿足不同的網(wǎng)絡(luò)帶寬,不同的服務(wù)質(zhì)量而設(shè)定的改變編碼碼率的參量。通過設(shè)置不同比特每象素值(Bit Per Pixel)而改變編碼碼流的數(shù)據(jù)量,滿足不同的網(wǎng)絡(luò)帶寬。圖2是采用與ADV611相同壓縮算法的軟件模擬結(jié)構(gòu)。表1是算法效果統(tǒng)計(jì)。
表1 算法效果統(tǒng)計(jì)
| 比特每象素值 | 1 | 0.5 | 0.1 |
| 壓縮后數(shù)據(jù)量 | 50K | 24K | 7K |
| 壓縮倍數(shù) | 20.5 | 42.7 | 146.4 |
| 恢復(fù)圖像與原圖的PSNR | 32.43 | 30.88 | 27.37 |
其中圖2(a)是原始圖像(720×486×24位1025K),(b1)、(b2)、(b3)是比特每象素值分別為1、0.5、0.1時(shí)的恢復(fù)圖像。從數(shù)據(jù)中可以看出隨著比特每象素值的降低,壓縮后數(shù)據(jù)量隨之降低,而恢復(fù)圖像與原圖的PSNR降低并不多。
1.1.2 算法分析
ADV611內(nèi)部的小波變換采用雙正交9-7小波基。經(jīng)過大量的實(shí)驗(yàn)證明雙交9-7小波基在圖像處理中是一種較好的小波基,目前多個(gè)國際標(biāo)準(zhǔn)中有關(guān)小波壓縮的算法,一般都采用這種小波基。ADV611芯片中的小波算法生成的Mallat框圖如圖3所示。
在量化階段ADV611采用可程控的量化方式。在量化順序上采用先低頻后高頻的順序(ADV611沒有采用零樹編碼),如對(duì)圖3量化的順序?yàn)镠、F、G、E、C、D、B、A。在量化系數(shù)的選取上充分考慮人類視覺特性給定了每個(gè)Mallat塊的參考量化系數(shù)如圖4.圖5顯示的編/解碼端相應(yīng)的量化方法,圖中的BW是Mallat塊的參考量化系數(shù)。
對(duì)量化后的數(shù)據(jù)ADV611采用游程編碼與霍夫曼編碼相結(jié)合的方式進(jìn)行熵編碼,以達(dá)到高壓縮比的目的。一般來說游程編碼和霍夫曼編碼屬于無損壓縮,壓縮比都不高,但在小波變換及系數(shù)量化后會(huì)出現(xiàn)大量的連零系數(shù),這時(shí)采用游程編碼與霍夫曼編碼相結(jié)合的方式能達(dá)到很高的壓縮比[3]。
2 小波變換在媒體流壓縮中的應(yīng)用
很多對(duì)小波變換的研究僅停留在靜態(tài)圖像上,沒有就此深入下去。筆者希望小波變換這種方式不僅在靜態(tài)圖像上,還要在連續(xù)媒體流上得到更為廣闊的應(yīng)用。基于小波變換本身的特點(diǎn)以及ADV611芯片的特性,將從以下兩個(gè)方面提出改進(jìn)方案以使系統(tǒng)更加適用于連續(xù)媒體流業(yè)務(wù)。
2.1 基于小波變換系數(shù)的幀間算法
靜態(tài)圖像小波壓縮是通過減少圖像本身的空間冗余性,達(dá)到壓縮效果的編碼方法,屬于幀內(nèi)壓縮。在處理連續(xù)媒體流時(shí)應(yīng)注意到幀間相似性是很大的,即幀與幀之間有著很大的時(shí)間冗余性,減少這種冗余可以達(dá)到更高壓縮比,使碼流適合于更低比特的信道傳輸。在處理這一部分上國際標(biāo)準(zhǔn)一般采用運(yùn)動(dòng)估計(jì)運(yùn)動(dòng)補(bǔ)償?shù)姆绞?
實(shí)現(xiàn)幀間壓縮[4]。在綜合考慮ADV611硬件實(shí)現(xiàn)的基礎(chǔ)上,提出一種對(duì)小波變換后系數(shù)估計(jì)補(bǔ)償?shù)乃惴ā>唧w的原理圖如圖6所示。其中小波變換與熵編碼是由ADV611硬件實(shí)現(xiàn)的。編碼后的數(shù)據(jù)延時(shí)一幀后進(jìn)行存儲(chǔ)器,與后一幀系數(shù)數(shù)據(jù)相減,求殘差數(shù)據(jù),并對(duì)殘差數(shù)據(jù)重編碼,包括二次量化、霍夫曼編碼等。解碼端反操作即可。
實(shí)現(xiàn)這種算法要求具有兩個(gè)先題條件:(1)小波變換的穩(wěn)定性。對(duì)同一幀圖像兩次小波變換后生成的碼流是相同的,那么當(dāng)其中一幀圖像發(fā)生輕微變化時(shí),編碼生成后的碼流也只是發(fā)生少量變化,從而殘差數(shù)據(jù)將會(huì)有大量的連零數(shù)據(jù)出現(xiàn);(2)編碼后碼流數(shù)據(jù)量較小,考慮到硬件實(shí)現(xiàn)時(shí)要求有存儲(chǔ)器存儲(chǔ)前一幀變換后的系數(shù),如果碼流數(shù)據(jù)量太大將不適合硬件的實(shí)現(xiàn)(此處應(yīng)該注意的是連續(xù)兩幀之間熵編碼后數(shù)據(jù)量不一定相同,對(duì)缺少的數(shù)據(jù)補(bǔ)零處理)。利用news序列的前8幀做測試序列,得到的幀間相關(guān)性結(jié)果如表2所示。
表1 news序列前8幀編碼系統(tǒng)相關(guān)性列表





