| 綜述 現(xiàn)在,高性能計(jì)算(High Performance Computing -- HPC)解決了世界上最為復(fù)雜和艱巨的計(jì)算難題,并且能夠輕松處理。氣象建模、模擬撞車(chē)試驗(yàn)、人體基因繪圖以及核爆炸模擬等多種與人類(lèi)生命相關(guān)的重要領(lǐng)域都要用到HPC。突飛猛進(jìn)的性能、急劇下降的成本以及勢(shì)如潮涌的需求等眾多因素,促使HPC迅速走出科學(xué)研究實(shí)驗(yàn)室,步入主流商業(yè)領(lǐng)域。英特爾不但提供了商業(yè)化/即時(shí)可用(Commercial, Off-the-shelf -- COTS)技術(shù)解決方案,而且還在致力于聯(lián)合業(yè)界主要廠(chǎng)商和服務(wù)提供商,共同部署和支持上述要求苛刻的系統(tǒng)。通過(guò)將臺(tái)式機(jī)、集群和大型SMP系統(tǒng)的性能進(jìn)行完美結(jié)合,HPC正在步入網(wǎng)格計(jì)算時(shí)代,它將使任何人都能隨時(shí)隨地、經(jīng)濟(jì)高效地進(jìn)行計(jì)算。 從科研領(lǐng)域到主流產(chǎn)業(yè) 短短幾年時(shí)間里,在大型PC集群上并行運(yùn)行科學(xué)和技術(shù)應(yīng)用的實(shí)踐已經(jīng)從幕后走到臺(tái)前,成為一種主流趨勢(shì)。1994年,NASA*工程師在Goddard飛行中心建造了第一個(gè)由Linux*系統(tǒng)電腦組成的小型集群-“Beowulf”。他們的成功激發(fā)人們的對(duì)此的廣泛興趣,很快,類(lèi)似的集群便在全球各地的大學(xué)和政府實(shí)驗(yàn)室投入運(yùn)行。 1997年,桑地亞(Sandia)國(guó)家實(shí)驗(yàn)室*和英特爾公司合力打造出了ASCI Red-世界上第一臺(tái)TFLOP計(jì)算系統(tǒng)(每秒執(zhí)行一萬(wàn)億次浮點(diǎn)計(jì)算)。作為美國(guó)能源部(DOE)高級(jí)戰(zhàn)略計(jì)算計(jì)劃的一部分,這個(gè)大規(guī)模并行處理系統(tǒng)成了第一批采用COTS組件建造的真正的超級(jí)計(jì)算機(jī)之一。與此同時(shí),康奈爾理論中心*開(kāi)始用Microsoft* Windows*和英特爾架構(gòu)服務(wù)器組成的集群,替換其RISC架構(gòu)超級(jí)計(jì)算機(jī)。這一舉措標(biāo)志著COTS集群從此進(jìn)入了商業(yè)應(yīng)用領(lǐng)域。 今天,幾大領(lǐng)先制造商,尤其是專(zhuān)業(yè)解決方案提供商都在提供英特爾架構(gòu)COTS集群系統(tǒng),并配有完備的商用軟件和全面產(chǎn)品支持。眾多企業(yè)都被其幾乎不可抗拒特性和優(yōu)勢(shì)所打動(dòng),并爭(zhēng)相進(jìn)行部署。除政府、教育和國(guó)家實(shí)驗(yàn)室等公共部門(mén)之外,HPC在制造、金融、能源、生命科學(xué)和數(shù)字媒體等行業(yè)都廣受青睞。 網(wǎng)格:分布式計(jì)算的又一次浪潮 廣受歡迎的網(wǎng)格計(jì)算已被視為下一代分布式計(jì)算的標(biāo)志。網(wǎng)格擴(kuò)展了基于標(biāo)準(zhǔn)的開(kāi)放式集群平臺(tái)的概念,可以支持任何互連的計(jì)算設(shè)備之間進(jìn)行協(xié)作 – 甚至將擴(kuò)展到全球任何一個(gè)角落。網(wǎng)格囊括了臺(tái)式電腦、部門(mén)級(jí)服務(wù)器、大型SMP系統(tǒng)和大型數(shù)據(jù)中心服務(wù)器,能夠以空前的規(guī)模效益提供更為經(jīng)濟(jì)的資源。網(wǎng)格技術(shù)可將計(jì)算資源進(jìn)行“虛擬”組合,并可以不限地點(diǎn)、硬件類(lèi)型和操作系統(tǒng)的差異使它們協(xié)同工作,從而實(shí)現(xiàn)總體性能大于各部分相加的整體優(yōu)勢(shì)。 全世界正在興建一種工作網(wǎng)格平臺(tái),將眾多國(guó)家實(shí)驗(yàn)室、大學(xué)和工業(yè)實(shí)驗(yàn)室連到一起。其中的重要開(kāi)發(fā)資源包括美國(guó)萬(wàn)億次網(wǎng)格計(jì)算(TeraGrid)、歐盟網(wǎng)格計(jì)劃以及新加坡生物信息學(xué)院網(wǎng)格系統(tǒng)。同時(shí),網(wǎng)格技術(shù)已經(jīng)不可避免地與正在開(kāi)發(fā)的互聯(lián)網(wǎng)服務(wù)交付標(biāo)準(zhǔn)(即網(wǎng)絡(luò)服務(wù)標(biāo)準(zhǔn))相融合;ヂ(lián)網(wǎng)分布式計(jì)算這種綜合性技術(shù)即將浮出水面,它將使全球數(shù)以百萬(wàn)計(jì)的系統(tǒng)作為一個(gè)巨大無(wú)比的計(jì)算資源來(lái)運(yùn)行,并允許遍布全球的用戶(hù)靈活地進(jìn)行高性能技術(shù)計(jì)算。 通過(guò)把大量客戶(hù)機(jī)作為網(wǎng)格的入口并開(kāi)發(fā)開(kāi)放的標(biāo)準(zhǔn),任何組織都可以對(duì)臺(tái)式機(jī)、集群或大型SMP系統(tǒng)上的閑置計(jì)算資源加以利用。這將大大提高總體計(jì)算性能,并在實(shí)時(shí)訪(fǎng)問(wèn)信息的基礎(chǔ)上取得更先進(jìn)的成果。 英特爾引領(lǐng)HPC與早期的網(wǎng)格部署 下面介紹一些近期內(nèi)出現(xiàn)的,基于英特爾架構(gòu)或業(yè)界領(lǐng)先技術(shù)的HPC集群和網(wǎng)格部署情況。 Ÿ企業(yè)級(jí)網(wǎng)格:Novartis –挑戰(zhàn):在一年之內(nèi)以低于10倍的成本,將領(lǐng)先優(yōu)勢(shì)及規(guī)模提高10倍。 –試驗(yàn)重點(diǎn):首次用7天時(shí)間完成以前需要3.18年才能完成的處理任務(wù)。對(duì)超過(guò)600臺(tái)windows臺(tái)式機(jī)進(jìn)行無(wú)縫整合,降低累積帶寬消耗量。 Ÿ合作伙伴級(jí)網(wǎng)格:TeraGrid –此類(lèi)網(wǎng)格成員使用擁有13.6 TFLOP處理能力的3300節(jié)點(diǎn)分布式計(jì)算網(wǎng)格,進(jìn)行分子建模、氣候和大氣模擬以及能源研究等領(lǐng)域的研究。 Ÿ公共網(wǎng)格:探索癌癥療法 –與國(guó)家癌癥研究基金會(huì)和牛津大學(xué)的合作項(xiàng)目證明,這種革命性的科學(xué)計(jì)算可用于探索癌癥療法。 –由于無(wú)與倫比的響應(yīng)能力,將可處理的項(xiàng)目規(guī)模擴(kuò)大100倍以上,成為目前最大的計(jì)算化學(xué)研究項(xiàng)目。 Ÿ太平洋西北國(guó)家實(shí)驗(yàn)室 –挑戰(zhàn):在環(huán)境研究、能源、保健和國(guó)家安全等研究領(lǐng)域要想獲得突破性進(jìn)展,必須擁有超凡的處理性能 –解決方案:在716個(gè)惠普*節(jié)點(diǎn)內(nèi)部署1432顆英特爾®安騰®2處理器,將實(shí)現(xiàn)超過(guò)9 TFLOPS的性能。 Ÿ路易斯安那州大學(xué)(LSU) –挑戰(zhàn):氣象學(xué)的研究工作要求超強(qiáng)的處理性能,LSU需要使用世界上最快的超級(jí)計(jì)算機(jī)。 –解決方案:1024顆英特爾至強(qiáng)處理器在A(yíng)tipa Technologies*的512節(jié)點(diǎn)Linux集群上運(yùn)行,以滿(mǎn)意的價(jià)格為該大學(xué)提供提供超過(guò)2.2 Teraflops的性能。 Ÿ戴姆勒克萊斯勒 –挑戰(zhàn):創(chuàng)新的模擬撞車(chē)試驗(yàn)解決方案需要更短的“結(jié)果算出時(shí)間”(計(jì)算出結(jié)果所需的時(shí)間縮短20%),并替代三臺(tái)超級(jí)計(jì)算機(jī)。 –解決方案:采用英特爾®至強(qiáng)™處理器的108節(jié)點(diǎn)IBM*集群保持了極高的分析精確度,而成本卻只是以前系統(tǒng)的60% Ÿ康奈爾理論中心 –挑戰(zhàn):需要頂級(jí)的性能以減輕計(jì)算密集型工程建模方面的計(jì)算瓶頸。 –解決方案:采用英特爾®奔騰®處理器及Microsoft Windows*操作系統(tǒng)的730節(jié)點(diǎn)Dell*集群可提供所需的性能、可靠性和支持。 英特爾在網(wǎng)格和HPC領(lǐng)域的作用 作為業(yè)界HPC解決方案標(biāo)準(zhǔn)構(gòu)建模塊的領(lǐng)先供應(yīng)商,英特爾是全球眾多設(shè)備制造商、軟件開(kāi)發(fā)商、系統(tǒng)集成商和服務(wù)提供商的動(dòng)力核心,這些廠(chǎng)商基于開(kāi)放的標(biāo)準(zhǔn)體系結(jié)構(gòu)全力打造一流的解決方案。在與業(yè)界的通力合作下,基于英特爾的HPC設(shè)備已經(jīng)實(shí)現(xiàn)了優(yōu)異的性能、可擴(kuò)充性、靈活性和升級(jí)能力–而成本只是基于RISC的專(zhuān)有HPC集群和超級(jí)計(jì)算機(jī)的幾分之一。英特爾戰(zhàn)略的核心組成部分包括: 技術(shù)構(gòu)建模塊 英特爾可提供支持HPC集群和網(wǎng)格的全套構(gòu)建模塊:處理器;性能增強(qiáng)的芯片組合服務(wù)器平臺(tái)、互連技術(shù)和廣泛的開(kāi)發(fā)軟件。 英特爾平臺(tái) ·高性能臺(tái)式機(jī)–主頻高達(dá)3.06 GHz并支持超線(xiàn)程技術(shù)的英特爾®奔騰®4處理器可為組建經(jīng)濟(jì)的集群和分布式對(duì)等臺(tái)式機(jī)環(huán)境提供理想的平臺(tái)。英特爾®NetBurst™微體系結(jié)構(gòu)采用32位體系結(jié)構(gòu),支持創(chuàng)新的HPC。 ·高價(jià)值工作站–英特爾Ò至強(qiáng)Ô處理器可為雙處理器集群節(jié)點(diǎn)提供完美平衡的性能、可靠性、靈活性和價(jià)值。英特爾NetBurst體系結(jié)構(gòu)和超線(xiàn)程技術(shù)的完美結(jié)合可為要求苛刻的應(yīng)用提供更短的響應(yīng)時(shí)間、更高的處理速率和更強(qiáng)勁的性能。 ·服務(wù)器–英特爾至強(qiáng)處理器MP專(zhuān)為大型多路SMP應(yīng)用設(shè)計(jì)—是要求每個(gè)節(jié)點(diǎn)都具有更高處理能力的集群應(yīng)用的絕佳選擇。通過(guò)英特爾NetBurst體系結(jié)構(gòu)和超線(xiàn)程技術(shù)與大容量集成式3級(jí)高速緩存相結(jié)合,可為32位處理器提供無(wú)與倫比的性能。 ·高端集群–英特爾Ò安騰Ò 2處理器可提供大規(guī)模浮點(diǎn)執(zhí)行資源,從而能夠支持最繁重的技術(shù)處理工作負(fù)載。64位顯式并行指令計(jì)算(EPIC)體系結(jié)構(gòu)結(jié)合高達(dá)3 MB的集成式三級(jí)高速緩存可提供更高的處理速度和更充足的內(nèi)存訪(fǎng)問(wèn)空間。可靠性特性包括增強(qiáng)錯(cuò)誤探測(cè)和糾錯(cuò)機(jī)制,以及高級(jí)系統(tǒng)檢測(cè)體系結(jié)構(gòu),能夠避免造成數(shù)據(jù)丟失、破壞和停機(jī)。 英特爾系統(tǒng)構(gòu)件模塊 ·英特爾芯片組具有平衡的體系結(jié)構(gòu),支持為完善英特爾處理器而度身定制的系統(tǒng)總線(xiàn)、內(nèi)存和互操作性帶寬。芯片組還具備出色的可靠性、可用性、可擴(kuò)充性和可管理性等諸多高級(jí)特性,可確保實(shí)現(xiàn)獨(dú)立的、無(wú)故障的運(yùn)行。 ·英特爾服務(wù)器平臺(tái)幾乎是一種完全盒裝的服務(wù)器系統(tǒng),由英特爾采用一流的構(gòu)件模塊設(shè)計(jì)而成,可為系統(tǒng)集成商提供極為可靠、可擴(kuò)展和可管理的平臺(tái),并能針對(duì)多種應(yīng)用輕松進(jìn)行現(xiàn)場(chǎng)配置,包括安裝高密度集群。 低延遲互連技術(shù) ·InfiniBand*體系結(jié)構(gòu)是支持信道式交換結(jié)構(gòu)和互操作性互連技術(shù)的業(yè)界標(biāo)準(zhǔn),其最大優(yōu)點(diǎn)在于能夠降低外部存儲(chǔ)訪(fǎng)問(wèn)和進(jìn)程間信息發(fā)送的延遲,從而顯著提高集群性能。 軟件:英特爾開(kāi)發(fā)商工具和服務(wù) ·英特爾編譯器支持OpenMP*標(biāo)準(zhǔn)和自動(dòng)并行性,能夠簡(jiǎn)化和加快線(xiàn)程應(yīng)用的開(kāi)發(fā),并針對(duì)采用英特爾處理器的系統(tǒng)來(lái)優(yōu)化性能。 ·英特爾性能庫(kù)提供了針對(duì)英特爾處理器而優(yōu)化的眾多功能,可加快開(kāi)發(fā)速度,降低成本并提高應(yīng)用性能。 ·英特爾線(xiàn)程工具來(lái)自英特爾KAI軟件實(shí)驗(yàn)室,它可以簡(jiǎn)化多線(xiàn)程應(yīng)用的開(kāi)發(fā),從而充分利用多線(xiàn)程技術(shù)和OpenMP并行編程模式。其主要特性包括自動(dòng)檢測(cè)線(xiàn)程錯(cuò)誤和提供直觀(guān)的性能瓶頸視圖。 ·英特爾®并行應(yīng)用中心(PAC)提供了具有領(lǐng)先水平的實(shí)驗(yàn)環(huán)境,獨(dú)立軟件廠(chǎng)商(ISV)可以利用它來(lái)改進(jìn)基于英特爾的 |