AMD董事長(zhǎng)兼CEO蘇姿豐在美國(guó)當(dāng)?shù)貢r(shí)間10月10日于舊金山舉行的Advancing AI活動(dòng)上帶來(lái)了一整套AI“殺手锏”,給整個(gè)業(yè)界帶來(lái)了全新的AI震撼。
蘇姿豐展示最新發(fā)布的MI325X GPU
其中,最大的驚喜正是AMD最新發(fā)布的旗艦AI芯片-AMD Instinct MI325X GPU(以下簡(jiǎn)稱:MI325X),蘇媽也是再次信心滿滿地掏出了與老對(duì)手英偉達(dá)當(dāng)下熱銷產(chǎn)品H200的對(duì)比圖,她表示,MI325X的內(nèi)存容量是H200的1.8倍,內(nèi)存帶寬、FP16和FP8峰值理論算力都達(dá)到了H200的1.3倍。
此外,蘇媽還發(fā)布了第五代EPYC服務(wù)器CPU,并稱其為“面向云計(jì)算、企業(yè)級(jí)和AI的全球最好CPU”,與老對(duì)手英特爾的第五代至強(qiáng)鉑金8592+處理器相比,這款CPU的HPC(高性能計(jì)算)性能提高多達(dá)3.9倍,基于CPU的AI加速提高多達(dá)3.8倍。蘇媽此次可謂是將滿滿的壓力給到了英偉達(dá)和英特爾。
HBM3e內(nèi)存容量是GPU提升的關(guān)鍵?
當(dāng)前,英偉達(dá)毫無(wú)疑問(wèn)是數(shù)據(jù)中心GPU領(lǐng)域的霸主,TechInsights公布的數(shù)據(jù)顯示,2023年全球數(shù)據(jù)中心GPU總出貨量達(dá)到了385萬(wàn)顆,其中,英偉達(dá)以98%的市場(chǎng)份額穩(wěn)居第一,AMD雖位居第二,卻仍是相差十分懸殊。但熟悉蘇媽的人都知道,她蘇媽受命于AMD危難之際,最不怕的就是打硬仗,此次帶來(lái)的MI325X就是為了“硬剛”英偉達(dá)的H200而來(lái)。
據(jù)了解,MI325X采用了與上一代MI300X相同的CDNA 3架構(gòu),最大的提升就是首次采用了業(yè)界目前最先進(jìn)的HBM3e,總?cè)萘窟_(dá)256GB,基于16-Hi堆棧制程,內(nèi)存帶寬高達(dá)6TB/s,單顆芯片總共擁有1530億個(gè)晶體管。
MI325X GPU的各項(xiàng)參數(shù)
專家告訴記者,HBM內(nèi)存提高,對(duì)于GPU來(lái)說(shuō),能夠帶來(lái)數(shù)據(jù)傳輸速度的提升、數(shù)據(jù)處理能力的增強(qiáng)、能效比的提高、空間與延遲的節(jié)省、對(duì)更復(fù)雜應(yīng)用場(chǎng)景的支持以及系統(tǒng)穩(wěn)定性與可靠性的提升等多方面的好處。因此,MI325X的FP8性能達(dá)到了2.6PFLOP,F(xiàn)P16性能也達(dá)到了1.3PFLOP。
橫向?qū)Ρ?,英偉達(dá)H200采用的HBM3e容量為141GB,帶寬為4.8TB/sz,總晶體管數(shù)量約為800億個(gè),相比于MI325X肯定是不夠看了,哪怕是英偉達(dá)最新推出的B200,采用的HBM3e內(nèi)存容量也僅為192GB,與MI325X的256GB HBM3e內(nèi)存容量仍存在差距。
雖然,兩家對(duì)于GPU的設(shè)計(jì)各有不同,HBM3e內(nèi)存容量也并不是評(píng)判GPU性能的唯一標(biāo)準(zhǔn),但對(duì)產(chǎn)品性能的上限有明顯提升,這也是AMD直面英偉達(dá)的底氣。蘇媽很自豪地在發(fā)布會(huì)上強(qiáng)調(diào):“MI325服務(wù)器平臺(tái)在運(yùn)行Llama 3.1時(shí),能提供比英偉達(dá)H200 HGX高出多達(dá)40%的性能?!?/p>
根據(jù)AMD官方信息,MI325X加速器目前有望在2024年第四季度投入生產(chǎn),預(yù)計(jì)從2025年第一季度開始發(fā)貨。
AMD最新的GPU技術(shù)路線圖
此外,根據(jù)當(dāng)前“一年一迭代”的節(jié)奏,AMD此次更新了其AI芯片的路線圖,預(yù)計(jì)下一代MI350系列將在明年上市,將采用3nm制程,并把HBM3E內(nèi)存再提升至288GB,新一代CDNA 4架構(gòu)也將安排上,使得其推理性能比基于CDNA 3架構(gòu)的加速器提高了35倍,該系列AMD計(jì)劃在2025年下半年上市。
其中,MI350系列的代表產(chǎn)品MI355X是AMD專門用來(lái)應(yīng)對(duì)英偉達(dá)在三月剛剛發(fā)布的Blackwell B200的。據(jù)了解,MI355X的FP8和FP16性能相比MI325X提升了80%,F(xiàn)P16峰值性能達(dá)到2.3PFLOPS,F(xiàn)P8峰值性能達(dá)到4.6PFLOPS,F(xiàn)P6和FP4峰值性能達(dá)到9.2PFLOPS。
最新CPU性能已經(jīng)趕超英特爾?
CPU業(yè)務(wù)對(duì)于AMD來(lái)說(shuō)是涅槃重生的開始,在2018年,其EPYC服務(wù)器的市占率僅為2%,經(jīng)過(guò)四代的升級(jí),終于在2024年第一季度達(dá)到了34%,從英特爾手里搶走了近30%的CPU服務(wù)器市場(chǎng)份額,也成了AMD的主要營(yíng)收來(lái)源。
EPYC服務(wù)器CPU的市場(chǎng)占比
蘇媽在發(fā)布今年第二季度財(cái)報(bào)時(shí)就表示:“我們?cè)诘诙径葘?shí)現(xiàn)了強(qiáng)勁的營(yíng)業(yè)額與收入增長(zhǎng),這得益于數(shù)據(jù)中心事業(yè)部創(chuàng)紀(jì)錄的營(yíng)業(yè)額。我們的AI業(yè)務(wù)繼續(xù)加速攀升,在Instinct系列、,EPYC和Ryzen處理器的市場(chǎng)需求帶動(dòng)下,AMD為下半年?duì)I業(yè)額的強(qiáng)勁增長(zhǎng)已做好了充分準(zhǔn)備。”
所以,AMD此次的另一大殺手锏就是其第五代EPYC服務(wù)器CPU,代號(hào)“Turin”。
第五代EPYC服務(wù)器CPU的各項(xiàng)參數(shù)
據(jù)介紹,Turin擁有1500億顆晶體管,采用臺(tái)積電3/4nm制程、全新“Zen 5”及“Zen 5c”核心兼容廣泛部署的SP5平臺(tái),最多支持192核、384個(gè)線程。當(dāng)前,英特爾能效核版至強(qiáng)6雖然能在未來(lái)通過(guò)雙芯封裝做到288核心,但無(wú)法支持超線程技術(shù),只有288個(gè)線程。因此,在核心數(shù)和線程數(shù)上,AMD已經(jīng)趕超了英特爾。
在技術(shù)全面升級(jí)的情況下,Turin的性能得到了明顯提升。AMD表示,相比于上一代的英特爾Xeon服務(wù)器,Turin在SPEC CPU測(cè)試中性能提升2.7倍,企業(yè)級(jí)性能最高提升4.0倍,HPC(高性能計(jì)算)性能最高提升3.9倍。
蘇媽打了很形象的比方,她表示,如果用Turin服務(wù)器替代上一代的至強(qiáng)服務(wù)器,只需131臺(tái)服務(wù)器就能達(dá)到原來(lái)1000臺(tái)的性能水平,節(jié)省87%的占地空間。同時(shí),功耗可以節(jié)省最多68%。
AMD還優(yōu)化了Turin在AI工作流程中的關(guān)鍵動(dòng)作,包括數(shù)據(jù)預(yù)處理、內(nèi)存復(fù)制、內(nèi)核啟動(dòng)和任務(wù)協(xié)調(diào)等。這些優(yōu)化使得CPU在處理GPU協(xié)調(diào)任務(wù)時(shí)更高效,比前代產(chǎn)品快28%。
除了GPU和CPU,蘇媽此次還帶了最新的DPU、AI網(wǎng)卡以及ROCm 6.2生態(tài)系統(tǒng),湊齊了一整套“AI全家桶”,給“雙英”帶來(lái)了十足的壓力。但當(dāng)天的AMD股價(jià)并沒(méi)有買賬,反而以大跌收?qǐng)?,日?nèi)跌幅一度擴(kuò)大到約5.3%,最終收跌4%,創(chuàng)9月3日以來(lái)最大盤中和收盤跌幅??梢?,AMD的新品雖然來(lái)勢(shì)兇猛,可只有真正量產(chǎn),經(jīng)過(guò)客戶檢驗(yàn),才能贏得市場(chǎng)的認(rèn)可。
責(zé)任編輯:許子皓
- QQ:61149512