提高ai計(jì)算能力,為企業(yè)提供更好和更多的定制化解決方案是全球人工智能領(lǐng)域關(guān)注熱點(diǎn)。美國拉斯維加斯時(shí)間1月8日2019ces開幕,百度展區(qū)的ai計(jì)算系統(tǒng)展臺(tái)前人氣火爆,這是百度全球領(lǐng)先的ai計(jì)算系統(tǒng)首次亮相國際舞臺(tái),觀眾和全球媒體把目光紛紛聚焦于此,希望透過百度這家中國ai“頭雁”企業(yè),感受中國在ai領(lǐng)域的創(chuàng)新實(shí)力。

百度ai計(jì)算系統(tǒng)展臺(tái)擁有的超強(qiáng)ai實(shí)力系統(tǒng),包括了百度自主研發(fā)的最新超級(jí)ai計(jì)算平臺(tái)x-man3.0和支撐百度ai計(jì)算層面的fast-f ai存儲(chǔ)系統(tǒng)、百度ai計(jì)算訓(xùn)練平臺(tái)kongming、ai推理加速引擎anakin等軟件,服務(wù)于百度搜索、dueros、apollo、百度智能云等核心業(yè)務(wù)。

算法、數(shù)據(jù)和計(jì)算是推動(dòng)ai深度學(xué)習(xí)技術(shù)快速發(fā)展的三大要素。在人工智能應(yīng)用場景和規(guī)??焖侔l(fā)展的背后,為支持更強(qiáng)的泛化能力,更高的預(yù)測精度,算法模型日趨復(fù)雜,越來越多的數(shù)據(jù)需要被及時(shí)標(biāo)注和處理,計(jì)算性能成為關(guān)鍵。圖像分析的樣本量級(jí)大約為百億級(jí),而語音分析也達(dá)到了十萬小時(shí)級(jí)。訓(xùn)練數(shù)據(jù)樣本量越來越大,且主要是小文件,對(duì)存儲(chǔ)系統(tǒng)的成本和性能都提出了很大挑戰(zhàn)。最新的算法發(fā)展比如deep speech、bert對(duì)整個(gè)計(jì)算需求所造成的挑戰(zhàn)變得更大,同時(shí)autodl等技術(shù)在簡化模型研發(fā)設(shè)計(jì)的同時(shí)也對(duì)算力提出了更高的要求,因此針對(duì)ai場景需要一整套計(jì)算系統(tǒng),包括支持海量小文件高速訪問的并行文件系統(tǒng)、ai計(jì)算機(jī)、大規(guī)模分布式訓(xùn)練平臺(tái)以及在線服務(wù)推理框架,這正是百度ai計(jì)算系統(tǒng)要解決的挑戰(zhàn),提升整個(gè)計(jì)算系統(tǒng)的性能與效率提高尤為重要。
在百度ai計(jì)算系統(tǒng)展臺(tái)最受矚目的超級(jí)ai計(jì)算平臺(tái)x-man3.0,就是專為ai深度學(xué)習(xí)場景優(yōu)化設(shè)計(jì),極大加快了ai深度學(xué)習(xí)模型的訓(xùn)練速度。還專門設(shè)計(jì)了兩級(jí)ai加速芯片互聯(lián)交換體系,是目前擴(kuò)展ai加速器數(shù)量最多的ai計(jì)算平臺(tái)之一,單機(jī)性能可達(dá)到2000 tops,可以為百度超大規(guī)模ai訓(xùn)練帶來超出預(yù)期的應(yīng)用價(jià)值。隨著ai人工智能技術(shù)的快速發(fā)展,眾多ai芯片公司應(yīng)運(yùn)而生,ai芯片格局正呈現(xiàn)多元化發(fā)展趨勢(shì)。x-man3.0采用了硬件系統(tǒng)模塊化、互聯(lián)接口標(biāo)準(zhǔn)化、互聯(lián)拓?fù)涓哽`活性的設(shè)計(jì)思路,既提升了多元化ai加速芯片的兼容性,也促進(jìn)了ai加速芯片生態(tài)健康、快速、可持續(xù)的發(fā)展。
憑借著對(duì)ai業(yè)務(wù)模型的深刻理解、扎實(shí)的硬件基礎(chǔ)架構(gòu)技術(shù)和對(duì)行業(yè)趨勢(shì)的準(zhǔn)確預(yù)判,百度設(shè)計(jì)了x-man ai計(jì)算平臺(tái)系列產(chǎn)品,創(chuàng)造了6項(xiàng)業(yè)界第一,包括單機(jī)16卡、支持64卡擴(kuò)展、硬件解耦、資源池化、無損通信、液冷散熱等,同時(shí)期關(guān)鍵技術(shù)&性能保持領(lǐng)先,引領(lǐng)行業(yè)發(fā)展趨勢(shì)。該系列技術(shù)也獲得了2018年中國國家專利技術(shù)優(yōu)秀獎(jiǎng)。
百度x-man的問世與升級(jí)為人工智能領(lǐng)域解決算力提升問題做出了重要貢獻(xiàn),成為人工智能發(fā)展真正的加速器。目前,x-man系列產(chǎn)品已在百度實(shí)現(xiàn)規(guī)?;渴?廣泛應(yīng)用于語音識(shí)別、計(jì)算機(jī)視覺、自然語音處理、無人車等基礎(chǔ)ai技術(shù)的深度學(xué)習(xí)模型訓(xùn)練;x-man與fast-f ai存儲(chǔ)系統(tǒng)、百度ai計(jì)算訓(xùn)練平臺(tái)kongming一起構(gòu)建了端到端的訓(xùn)練方案,將訓(xùn)練時(shí)間從周級(jí)別縮短到天級(jí)別,服務(wù)于百度dueros、apollo、百度智能云等核心業(yè)務(wù),助力百度ai戰(zhàn)略的快速落地。

(超級(jí)ai計(jì)算平臺(tái)x-man3.0)
ai推理加速引擎anakin是另一個(gè)吸引了眾多業(yè)內(nèi)關(guān)注的百度ai產(chǎn)品。它解決的痛點(diǎn)是能夠跨越不同的深度學(xué)習(xí)訓(xùn)練框架。近幾年,為了解決ai計(jì)算力提升問題,業(yè)界涌現(xiàn)出了很多優(yōu)秀的解決方案。但是帶來的問題是,不同訓(xùn)練框架需要的運(yùn)營環(huán)境不同。這意味著每個(gè)訓(xùn)練框架在每個(gè)硬件平臺(tái)下都需要各搭建一套運(yùn)行環(huán)境,甚至還有些框架是不支持某些硬件平臺(tái)的。他們之間的不互通,使得很多ai應(yīng)用落地受到了阻礙。
anakin主要由獨(dú)立的parser、靈活的framework和高效的saber計(jì)算庫三部分組成。獨(dú)立的parser實(shí)現(xiàn)了將不同訓(xùn)練框架生成的model轉(zhuǎn)換為anakin計(jì)算圖的解析功能,它支持任何訓(xùn)練框架生成的model解析,屏蔽了不同訓(xùn)練框架的差異。靈活的framework屏蔽了底層硬件的差異,用于實(shí)現(xiàn)與硬件無關(guān)的所有操作,如網(wǎng)絡(luò)構(gòu)建、圖融合、資源復(fù)用、計(jì)算調(diào)度等操作,方便用戶使用。高效的saber計(jì)算庫是由大量的匯編級(jí)優(yōu)化代碼組成,支持眾多業(yè)內(nèi)產(chǎn)品,如intel-cpu、nv-gpu、amd-gpu和arm等。
anakin不僅同時(shí)支持cpu和gpu base的多種主流計(jì)算架構(gòu)(如x86/arm、以及多種gpu架構(gòu)),還同時(shí)支持兩款最新的npu架構(gòu)(寒武紀(jì)和比特大陸)。 anakin盡可能為開發(fā)者屏蔽異構(gòu)計(jì)算的差異,方便用戶快速部署、享受卓越性能。

目前anakin已在百度搜索、百度地圖、百度無人車、人臉閘機(jī)、全民小視頻等眾多百度明星產(chǎn)品中實(shí)際落地,是真正的經(jīng)歷過大規(guī)模工業(yè)部署考驗(yàn)的ai推理加速引擎。
百度ai計(jì)算系統(tǒng)作為ai計(jì)算基礎(chǔ)技術(shù)解決方案,也同時(shí)應(yīng)用到了百度智能云的ai相關(guān)產(chǎn)品中,比如百度智能云gpu云主機(jī)、百度智能云infinite ai開發(fā)平臺(tái)、百度智能云abc一體機(jī)等,使各行各業(yè)都能享受到百度ai計(jì)算基礎(chǔ)技術(shù)創(chuàng)新帶來的紅利。(作者:陳蕊)
(免責(zé)聲明:中國青年網(wǎng)轉(zhuǎn)載此文目的在于傳遞更多信息,不代表本網(wǎng)的觀點(diǎn)和立場。文章內(nèi)容僅供參考,不構(gòu)成投資建議。投資者據(jù)此操作,風(fēng)險(xiǎn)自擔(dān)。)
責(zé)任編輯:zer
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“機(jī)電號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of JDZJ Hao, which is a social media platform and only provides information storage services.
