顯卡無疑已經(jīng)是當(dāng)下IT圈子最熱門的話題,但對于NVIDIA而言,關(guān)于圖形、視覺乃至大規(guī)模并行運算的征程,已經(jīng)開啟了新的起點。NVIDIA在不久前舉行的GTC大會上連發(fā)三款基于Arm IP打造的處理器,包括全球首款專為TB級加速計算而設(shè)計的CPU NVIDIA Grace、全新BlueField-3 DPU,以及業(yè)界首款1000TOPS算力的自動駕駛汽車SoC等。
“三類芯片,逐年飛躍,一個架構(gòu)?!盢VIDIA數(shù)據(jù)中心路線圖中包括CPU、GPU和DPU這三類芯片,集齊“未來計算的三大支柱”,這也標(biāo)志著NVIDIA異構(gòu)計算布局趨于完善,成為全棧計算平臺。
專用AI計算CPU:NVIDIA GRACE
NVIDIA發(fā)布的首款中央處理器Grace成為本次GTC的焦點,其面向超大型AI模型的和高性能計算?;贕race的系統(tǒng)與NVIDIA GPU緊密結(jié)合,性能將比目前最先進(jìn)的NVIDIA DGX系統(tǒng)(在x86 CPU上運行)高出10倍。
GRACE的重大創(chuàng)新包括:內(nèi)置下一代Arm Neoverse內(nèi)核,單CPU在SPECrate2017_int_base基準(zhǔn)測試超300分;采用第四代NVIDIA NVLink,從CPU到GPU連接速度超過900GB/s,達(dá)到相當(dāng)于目前服務(wù)器14倍的帶寬,從CPU到CPU的速度超過600GB/s;擁有最高的內(nèi)存帶寬,采用的新內(nèi)存LPDDR5x技術(shù),帶寬是LPDDR4的兩倍,能提供更多算力。
數(shù)據(jù)中心處理器DPU:NVIDIA BlueField-3
為了獲得更好的數(shù)據(jù)中心軟件定義網(wǎng)絡(luò)、存儲、網(wǎng)絡(luò)安全加速,NVIDIA還推出了首款為AI加速度BlueField-3 DPU。DPU針對多用戶、云原生環(huán)境優(yōu)化,提供數(shù)據(jù)中心軟件定義和硬件加速的網(wǎng)絡(luò)、存儲、安全、管理內(nèi)容。
NVIDIA BlueField-3 DPU包含220億個晶體管,采用16個Arm A78 CPU核心、18M IOPs彈性塊存儲,加密速度是上一代的4倍,并完全向下兼容BlueField-2。該產(chǎn)品預(yù)計將于2022年第一季度發(fā)布樣品。
BlueField-3 DPU的重大創(chuàng)新包括:是首款支持第五代PCIe總線并提供數(shù)據(jù)中心時間同步加速的DPU;BlueField-3能夠卸載相當(dāng)于300個CPU核的工作負(fù)載,以400Gbps的速率對網(wǎng)絡(luò)流量進(jìn)行保護(hù)、卸載和加速;通過全新發(fā)布的NVIDIA DOCA(集數(shù)據(jù)中心于芯片的架構(gòu))軟件開發(fā)包為開發(fā)者提供一個完整、開放的軟件平臺,開發(fā)在BlueField DPU上開發(fā)軟件定義和硬件加速的網(wǎng)絡(luò)、存儲、安全和管理等應(yīng)用。
GPU賦能推動ARM生態(tài)
NVIDIA Ampere架構(gòu)GPUA100于2020 GTC發(fā)布,今年大會則主要發(fā)布基于新架構(gòu)GPU的產(chǎn)品,并致力于借助GPU賦能推動ARM生態(tài)。
NVIDIA升級并打造了“便攜式AI數(shù)據(jù)中心”——NVIDIA DGX Station,以及NVIDIA專為密集型AI研發(fā)打造的AI數(shù)據(jù)中心產(chǎn)品——NVIDIA DGX SuperPOD。NVIDIA DGX Station 320G連接4個NVIDIA A100 GPU并達(dá)8TB/s的帶寬,性價比獲得很大提升;NVIDIA DGX SuperPOD目前是世界上首臺原生超級計算機(jī),使用全新80GB NVIDIA A100,將其HBM2e 內(nèi)存提升至90TB,實現(xiàn)2.2EB/s的總帶寬。
NVIDIA發(fā)布了用于訓(xùn)練Transformers的超大語言模型的NVIDIA Megatron Triton推理服務(wù)器。Transformers已幫助開發(fā)者在自然語言處理領(lǐng)域取得了突破性進(jìn)展,能夠生成文檔摘要、將電子郵件中的短語補充完整、甚至讓AI根據(jù)用戶的期望自己編寫代碼。通過分布式計算,原本雙CPU服務(wù)器1分鐘只能響應(yīng)1項查詢,使用Megatron Triton的DGX能在1秒內(nèi)實現(xiàn)16項查詢。
NVIDIA還發(fā)布了新一代AI自動駕駛汽車處理器DRIVE Atlan,算力將達(dá)到1000TOPS,約是上一代Orin處理器的4倍,超過了大多數(shù)L5無人駕駛出租車的總計算能力。采用下一代GPU的體系結(jié)構(gòu)、新型Arm CPU內(nèi)核、新深度學(xué)習(xí)和計算機(jī)視覺加速器,內(nèi)置為先進(jìn)的網(wǎng)絡(luò)、存儲和安全服務(wù)的BlueField DPU,網(wǎng)絡(luò)速度可達(dá)400Gbps。
此外,NVIDIA還與亞馬遜云科學(xué)(AWS)、Marvell、聯(lián)發(fā)科、富士通等加強(qiáng)了合作,推動云服務(wù)、科學(xué)及AI應(yīng)用開發(fā)、打造GPU驅(qū)動的新型PC,共同致力于擴(kuò)展Arm生態(tài)系統(tǒng)。
目標(biāo)構(gòu)建AI帝國
NVIDIA基于GPU、CPU、DPU“三項之力”的硬件基礎(chǔ),還在持續(xù)打造介于硬件和軟件之間的底層技術(shù)、計算機(jī)工具乃至實用的應(yīng)用框架。
針對專業(yè)領(lǐng)域的云原生平臺NVIDIA Omniverse平臺能夠在虛擬世界中匯聚全球各地的工程師、科學(xué)家,在多個GPU的共同協(xié)助下實現(xiàn)高物理精度,并充分運用RTX實時光線追蹤、DLSS技術(shù),利用NVIDIA MDL模擬材料、NVIDIA PhysX模擬物理,NVIDIA AI完成人工智能推算的線上平臺。擁有了更強(qiáng)的普適性,已適用于建筑、娛樂、游戲、廣告等行業(yè)。
先進(jìn)的對話式AI平臺NVIDIA Jarvis可達(dá)到90%的識別精度,并支持5種語言:英語、日語、西班牙語、德語、法語和俄語,未來將會有更多語言加入其中,這使得國際會議將會變得更輕松;可糾正目光接觸的會議軟件NVIDIA Maxine會自動糾正視頻會議中與會人的注視位置;NVIDIA自動駕駛汽車計算系統(tǒng)級芯片NVIDIA DRIVE Orin將與2022年投產(chǎn),可處理集群、信息娛樂、乘客交互AI及非常重要的信息視圖或感知世界模型,將實際感知構(gòu)建成一個3D環(huán)繞模型。
NVIDIA已經(jīng)創(chuàng)建了Tensor Core GPU、NVLINK、DGX、cuDNN、RAPIDS、NCCL、GPU Dirext、DOCA等眾多技術(shù),所有的這些底層技術(shù),統(tǒng)稱為NVIDIA AI。NVIDIA AI已集成到所有業(yè)內(nèi)流行的工具和工作流程中,并且可在搭載NVIDIA GPU的任何系統(tǒng)上運行,包括PC、筆記本電腦、工作站、超級計算機(jī)、云平臺等?,F(xiàn)在缺少的是5G技術(shù)的連接,日常所使用的消費級5G技術(shù)只是錦上添花,而未來專用5G技術(shù)將為AI技術(shù)帶來革命性的變化。
注:作者為賽迪顧問集成電路產(chǎn)業(yè)研究中心高級分析師
- QQ:61149512