日韩床上生活一级视频|能看毛片的操逼网站|色悠悠网站在线观看视频|国产免费观看A淫色免费|国产av久久久久久久|免费A级视频美女网站黄|国产毛片av日韩小黄片|热久久免费国产视频|中文字幕无码色色|成人在线视频99久久久

機(jī)電之家資源網(wǎng)
單片機(jī)首頁|單片機(jī)基礎(chǔ)|單片機(jī)應(yīng)用|單片機(jī)開發(fā)|單片機(jī)文案|軟件資料下載|音響制作|電路圖下載 |嵌入式開發(fā)
培訓(xùn)信息
贊助商
自適應(yīng)計(jì)算為MPEG-4注入新的動力
[1] [2]  下一頁
自適應(yīng)計(jì)算為MPEG-4注入新的動力
 更新時間:2008-8-17 20:00:39  點(diǎn)擊數(shù):14
【字體: 字體顏色

下一代無線和便攜式通信產(chǎn)品將廣泛應(yīng)用MPEG-4標(biāo)準(zhǔn)的流式視頻和音頻。相比基于DSP的設(shè)計(jì),采用自適應(yīng)算法能夠更加有效地實(shí)現(xiàn)高質(zhì)量流式視頻所要求的強(qiáng)大處理能力。

圖:DCT和運(yùn)動估計(jì)算法均需要進(jìn)行特定運(yùn)算

比如,一個由編碼通道和解碼通道(全彩色、分辨率為352×288像素)所組成的雙通道流式30fps MPEG-4視頻信號要求的運(yùn)算速度為1400000000次/秒。MPEG-4編碼包括離散余弦變換(DCT)和運(yùn)動估計(jì)等計(jì)算密集型算法(如圖)。

 

DCT和運(yùn)動估計(jì)

  作為一種廣泛使用的圖像壓縮算法,DCT在H.261 JPEG靜態(tài)圖像壓縮標(biāo)準(zhǔn)、H.263視頻會議標(biāo)準(zhǔn)以及MPEG-1/2/4數(shù)字視頻標(biāo)準(zhǔn)中均得到了運(yùn)用。在這些標(biāo)準(zhǔn)中,二維DCT被用于壓縮圖像中的8×8像素塊。

  由DCT生成的64個系數(shù)隨后被量化以提供實(shí)際壓縮,在典型圖像中,大多數(shù)用于8×8像素塊的DCT系數(shù)都比較小,且在量化后變成零。DCT的這個特點(diǎn)對于壓縮實(shí)際圖像來說是非常重要的。運(yùn)動估計(jì)通過用某一幀的相鄰幀來表示其內(nèi)容的方法來降低該視頻幀的存儲或傳輸開銷。

  一個給定的幀被分解成一些小的圖塊,通過規(guī)定這些小圖塊改變位置和外形的方式來描述一個后繼幀。一般來說,存儲差異比存儲整個塊的開銷要低。

  例如,在一個攝像機(jī)對靜態(tài)場景進(jìn)行搖鏡頭操作的視頻序列中,常常只是簡單地用前一幀來代替當(dāng)前幀,后繼幀的大多數(shù)圖塊也直接使用屏幕上的相應(yīng)圖塊來代替。

  和DCT一樣,運(yùn)動估計(jì)也是上述標(biāo)準(zhǔn)的核心技術(shù)。作為視頻編碼器中計(jì)算強(qiáng)度最大的算法,它占用了MPEG-4標(biāo)準(zhǔn)所需總計(jì)算時間的約60%,導(dǎo)致編碼器的性能受限,甚至影響到編碼速度。

  同樣,運(yùn)動估計(jì)算法對編碼器在某一給定比特率條件下的視頻編碼性能影響很大。而且,用于從視頻素材中提取運(yùn)動矢量的方法尚未標(biāo)準(zhǔn)化,這就為各芯片制造商提供了很大的發(fā)揮空間。

  在視頻編碼中,運(yùn)動矢量被用于校正視頻序列內(nèi)的運(yùn)動,只有剩余的信號或預(yù)測誤差才必須被編碼和傳輸。因此,運(yùn)動矢量的選擇必須能夠最大限度地減少預(yù)測誤差以及所需的比特?cái)?shù)。

 

DCT比DSP更加復(fù)雜

  雖然數(shù)字信號處理技術(shù)已被用于執(zhí)行許多音頻和視頻算法,但是目前的DCT算法比最新一代的DSP芯片—有限脈沖響應(yīng)(FIR)濾波器的算法還要復(fù)雜,所以為FIR濾波而優(yōu)化的典型DSP芯片不能夠有效地進(jìn)行DCT運(yùn)算。

  基于改進(jìn)的哈佛(Harvard)體系結(jié)構(gòu),這些DSP芯片能夠并行處理兩條獨(dú)立指令的讀取、解碼和執(zhí)行操作。使用附加總線對其進(jìn)行訪問,兩個存儲器能夠在每個時鐘周期里同時進(jìn)行兩個數(shù)據(jù)的存取。

  DCT的復(fù)雜性主要來源于數(shù)據(jù)中存在著的大量關(guān)聯(lián)性、大量涉及MAC的操作以及所需的眾多專用ALU運(yùn)算,每個一維DCT大約需要進(jìn)行26次加法和16次乘法運(yùn)算。

  考慮到兩條DSP指令可以在一個時鐘周期里執(zhí)行,因此DCT運(yùn)算可以以兩種不同的方式來進(jìn)行。使用DSP時,對于普通的尋址方式,從雙數(shù)據(jù)存儲器中獲得4個操作數(shù),雙重MAC對該數(shù)據(jù)進(jìn)行運(yùn)算,并由專用的零開銷環(huán)路硬件(Loop Hardware)對循環(huán)過程進(jìn)行全程監(jiān)控。

  然而,DCT所需的尋址方式是非通用型的,被優(yōu)化用于FIR濾波器尋址的DSP硬件并不適用于DCT尋址。這種尋址方式的非通用性迫使程序員不得不為每個MAC運(yùn)算計(jì)算出一個確切的地址。因此DCT所用的數(shù)據(jù)存取方案是一種非通用型的尋址方案。

  DCT尋址不是普通的加n結(jié)構(gòu),8個像素?cái)?shù)據(jù)均以一種非順序的混合方式被多次訪問,直到DCT完成為止,接著再去處理后面的8個像素。

 

自適應(yīng)計(jì)算

  隨著芯片幾何尺寸的不斷縮小,DSP芯片和微處理器的時鐘頻率越來越高,硬性資源也更加豐富,從而可以實(shí)現(xiàn)更為復(fù)雜的功能。增加資源和提高時鐘速度的確提高了計(jì)算性能,但這些處理器的計(jì)算效率并未因此得到提高。

  另一方面,自適應(yīng)計(jì)算機(jī)(Adaptive Computing Machine,ACM)技術(shù)所具有的截然不同的特性卻能夠在增強(qiáng)性能的同時保持較低的功耗。在自適應(yīng)算法中,每個被實(shí)現(xiàn)或“記錄”在ACM硅芯片中的運(yùn)算都有效地利用了其所需的資源,并在下一個運(yùn)算被記錄到硅芯片上時被覆蓋。

  采用這種計(jì)算效率高且功耗低的ACM動態(tài)邏輯實(shí)現(xiàn)的MPEG-4設(shè)計(jì)與DSP實(shí)現(xiàn)相比,功耗可降低50%~90%,并同時將性能提高10倍甚至100倍。

  ACM為系統(tǒng)工程師提供了一條進(jìn)行DCT、運(yùn)動估計(jì)和整體MPEG-4設(shè)計(jì)的有效得多的途徑。由于不同的算法被實(shí)時地下載到ACM芯片上,因而自適應(yīng)計(jì)算芯片的體系結(jié)構(gòu)每秒鐘可改變幾十萬次。這樣,系統(tǒng)工程師就能夠在硅芯片中生成各種計(jì)算單元以及用于實(shí)現(xiàn)并行性的合適互連。

  對DCT或運(yùn)動估計(jì)設(shè)計(jì)而言,采用ACM芯片的效率比DSP的要高得多。因?yàn)锳CM芯片上的資源不像在微處理器、DSP芯片或ASIC中那樣只是用于特定功能,所以這些資源可最大限度地在可用的并行計(jì)算當(dāng)中進(jìn)行分配。

  ACM使得系統(tǒng)工程師可以反復(fù)使用ACM的門電路,因而可以運(yùn)行任何數(shù)量的不同算法。由于這種自適應(yīng)性,基于ACM的實(shí)現(xiàn)只需有限的門電路(比如100000個),而不像極為復(fù)雜的微處理器或DSP芯片那樣需要數(shù)以百萬計(jì)的門電路。

  ACM中只采用了必需的門電路,讓設(shè)計(jì)工程師不僅節(jié)約了額外的開銷,還能夠?qū)崿F(xiàn)其在無線、PDA或移動通信產(chǎn)品中所期望的性能。

自適應(yīng)計(jì)算還為系統(tǒng)工程師提供了摩爾定律所沒有預(yù)見到的高級計(jì)算性能。究其原因是由于ACM采用了芯片上絕大部分的門電路,這些門電路能夠以極快的速度來執(zhí)行不同算法的循環(huán)分類(Endless Assortment)。相比之下,傳統(tǒng)的微處理器和DSP芯片運(yùn)行一種特定的算法只使用了5%的門電路,而其余的95%則白白浪費(fèi)掉了。

  在通常情況下,微處理器或DSP芯片的大部分固定資源都是空閑的。DSP芯片通常以一個字節(jié)的倍數(shù)來對數(shù)據(jù)進(jìn)行運(yùn)算,但是ACM的動態(tài)邏輯電路可處理任何寬度的數(shù)據(jù),而且數(shù)據(jù)寬度可隨時間而變化,以適應(yīng)某一設(shè)計(jì)課題的需要。

  于是,每個DCT和運(yùn)動估計(jì)功能所需的邏輯電路是在任意給定的時間在自適應(yīng)硅芯片上實(shí)現(xiàn)的,不再需要DSP芯片、ASIC以及微控制器,未在ACM門電路中實(shí)現(xiàn)的功能是不消耗功率的。

  基于DSP的應(yīng)用在一組固定的資源上執(zhí)行各種功能,為了簡化程序設(shè)計(jì)和硬件資源而舍棄了效率。較之傳統(tǒng)微處理器和DSP芯片所采用的邏輯電路常駐、但卻在大部分時間里空閑的做法,將邏輯電路實(shí)現(xiàn)于ACM芯片之中所消耗的功率更小。

  但對應(yīng)用于DCT和運(yùn)動估計(jì)的ACM而言,可以把更多的MAC編排在一起以實(shí)現(xiàn)粗粒度并行性,通過采用ACM而使性能得到增強(qiáng)的DCT的運(yùn)算速度將會大大提高。由于ACM芯片能夠在運(yùn)行時對硬件進(jìn)行專門的處理,因此可以處理要求最為苛刻的多媒體應(yīng)用。ACM使得DCT或運(yùn)動估計(jì)算法能夠指定其需要的確切硬件。

  在標(biāo)準(zhǔn)的DCT設(shè)計(jì)中,一種為特定DCT算法定制的專用尋址單元執(zhí)行一對七尋址, 這樣就可以給MAC提供饋送信號。典型的DSP芯片與此不同,其尋址單元不是專門為DCT設(shè)計(jì)的,主ALU被迫執(zhí)行尋址計(jì)算,從而將典型DSP芯片的處理速度減緩了50%之多。

  由于ACM的互連結(jié)構(gòu)不是預(yù)先指定的,因此可通過增加更多的MAC和ALU來提高算法的運(yùn)算速度。在傳統(tǒng)的DSP芯片上增加4個ALU就可將ACM的性能提高近3倍。

  象DCT和運(yùn)動估計(jì)這樣的算法不應(yīng)該受限于兩、三年前為解決某些老問題而設(shè)計(jì)的體系結(jié)構(gòu),而是應(yīng)該用現(xiàn)在的算法來確定新的結(jié)構(gòu)。在因特網(wǎng)不斷展示其巨大推動力的當(dāng)今世界里,為了能夠?qū)?jīng)常變化的標(biāo)準(zhǔn)進(jìn)行跟蹤并做出相應(yīng)調(diào)整,硅芯片的這種自適應(yīng)性是必不可少的。ACM使得硬件體系結(jié)構(gòu)能夠跟上不斷變化標(biāo)準(zhǔn)的要求,而不會繼續(xù)在舊有的機(jī)器上上運(yùn)行當(dāng)前和未來的算法了。

  • 上一篇: 實(shí)現(xiàn)嵌入的基于DSP的VoP系統(tǒng)
  • 下一篇: 可程控交流電源供應(yīng)器簡介及應(yīng)用
  • 發(fā)表評論   告訴好友   打印此文  收藏此頁  關(guān)閉窗口  返回頂部
    熱點(diǎn)文章
     
    推薦文章
     
    相關(guān)文章
    網(wǎng)友評論:(只顯示最新5條。)
    關(guān)于我們 | 聯(lián)系我們 | 廣告合作 | 付款方式 | 使用幫助 | 機(jī)電之家 | 會員助手 | 免費(fèi)鏈接

    點(diǎn)擊這里給我發(fā)消息66821730(技術(shù)支持)點(diǎn)擊這里給我發(fā)消息66821730(廣告投放) 點(diǎn)擊這里給我發(fā)消息41031197(編輯) 點(diǎn)擊這里給我發(fā)消息58733127(審核)
    本站提供的機(jī)電設(shè)備,機(jī)電供求等信息由機(jī)電企業(yè)自行提供,該企業(yè)負(fù)責(zé)信息內(nèi)容的真實(shí)性、準(zhǔn)確性和合法性。
    機(jī)電之家對此不承擔(dān)任何保證責(zé)任,有侵犯您利益的地方請聯(lián)系機(jī)電之家,機(jī)電之家將及時作出處理。
    Copyright 2007 機(jī)電之家 Inc All Rights Reserved.機(jī)電之家-由機(jī)電一體化網(wǎng)更名-聲明
    電話:0571-87774297 傳真:0571-87774298
    杭州濱興科技有限公司提供技術(shù)支持

    主辦:杭州市高新區(qū)(濱江)機(jī)電一體化學(xué)會
    中國行業(yè)電子商務(wù)100強(qiáng)網(wǎng)站

    網(wǎng)站經(jīng)營許可證:浙B2-20080178-1