低精度計(jì)算能否實(shí)現(xiàn)智算中心“輕裝上陣”?
低精度計(jì)算應(yīng)用于智算中心說(shuō)到底還是為了突破算力瓶頸,解決算力應(yīng)用難題,其雖然并非最優(yōu)解,但已經(jīng)成為一塊“關(guān)鍵拼圖”。
2025-04-24 10:38:27
來(lái)源:通信世界網(wǎng) 包建羽??

通信世界網(wǎng)消息(CWW)今年初,低成本、高性能的DeepSeek掀起了大模型狂潮,其在預(yù)訓(xùn)練中采用FP8(8位浮點(diǎn)數(shù))與FP32(32位浮點(diǎn)數(shù))混合精度技術(shù)也成為一項(xiàng)重大技術(shù)創(chuàng)新,前者可以大幅減少算力消耗,提高計(jì)算速度;后者則針對(duì)數(shù)據(jù)精度關(guān)鍵環(huán)節(jié)保證了模型的準(zhǔn)確性。兩者相結(jié)合,在不影響模型性能的前提下,實(shí)現(xiàn)了算力資源的高效利用。

類似的思路也被用于智算中心建設(shè),不再像去年卷“萬(wàn)卡集群”那樣,智算中心從建到用更為注重性價(jià)比,低精度計(jì)算應(yīng)勢(shì)而起,正推動(dòng)智算中心從“大力出奇跡”轉(zhuǎn)向“四兩撥千斤”的進(jìn)化路徑。

所謂低精度計(jì)算是指采用FP8、FP6(6位浮點(diǎn)數(shù))甚至FP4(4位浮點(diǎn)數(shù))等低比特?cái)?shù)值格式進(jìn)行運(yùn)算的技術(shù)體系。相較于傳統(tǒng)FP32計(jì)算,其數(shù)據(jù)存儲(chǔ)空間更小、計(jì)算能耗更低,不僅能夠破解大模型訓(xùn)練和推理的算力難題,也有助于化解智算中心的能效比困境。

就行業(yè)發(fā)展來(lái)看,智算需求的爆發(fā)直接促使低精度計(jì)算的崛起。近年來(lái),大模型和生成式人工智能推高算力需求,全球智能算力需求呈指數(shù)級(jí)增長(zhǎng)?!?025年中國(guó)人工智能計(jì)算力發(fā)展評(píng)估報(bào)告》指出,未來(lái)兩年,中國(guó)智能算力規(guī)模將保持高速增長(zhǎng)。2023年至2028年期間,中國(guó)智能算力規(guī)模的五年年復(fù)合增長(zhǎng)率預(yù)計(jì)達(dá)46.2%。然而,傳統(tǒng)通用算力中心難以滿足AI模型訓(xùn)練的高密度、低時(shí)延需求,智算中心作為專用基礎(chǔ)設(shè)施的重要性得以凸顯。

在低精度計(jì)算的作用下,智算中心架構(gòu)層的芯片技術(shù)變革最為明顯。在GTC 2025年大會(huì)上,英偉達(dá)發(fā)布的Blackwell Ultra/Rubin系列芯片展現(xiàn)了算力精度下移的趨勢(shì)。例如Blackwell Ultra在FP4精度下的算力達(dá)到15PetaFlops,在特定推理場(chǎng)景中效率提升40倍。作為同類競(jìng)品的AMD MI350X芯片則創(chuàng)新性引入動(dòng)態(tài)精度切換技術(shù)。通過(guò)支持FP4和FP6,推理性能較前代提升35倍,F(xiàn)P8算力突破4.6 PetaFlops。不僅如此,當(dāng)前Meta、微軟、AWS等巨頭早已將低精度GPU列為采購(gòu)核心指標(biāo)。

低精度計(jì)算應(yīng)用于智算中心說(shuō)到底還是為了突破算力瓶頸,解決算力應(yīng)用難題,其雖然并非最優(yōu)解,但已經(jīng)成為一塊“關(guān)鍵拼圖”。面向智算中心的未來(lái)發(fā)展,業(yè)界探索出了兩條關(guān)鍵路徑。

一是異構(gòu)計(jì)算架構(gòu),不同于傳統(tǒng)方案強(qiáng)調(diào)雙精度浮動(dòng)運(yùn)算性能的超級(jí)計(jì)算,異構(gòu)智算更多使用半精度浮動(dòng)運(yùn)算、整數(shù)運(yùn)算,甚至更低精度的浮點(diǎn)運(yùn)算,動(dòng)態(tài)適配不同精度需求。在傳統(tǒng)算力的局限與旺盛的市場(chǎng)需求共同作用下,通用算力、智算算力、超算算力、邊緣算力等不同類型算力中心的融合發(fā)展將成為大勢(shì)所趨。

二是“超智融合”,作為異構(gòu)智算的一種表現(xiàn)形式,“超智融合”即整合超算的高性能并行計(jì)算能力與智算的低功耗優(yōu)化優(yōu)勢(shì),通過(guò)軟硬件協(xié)同提升算力效率。業(yè)內(nèi)專家認(rèn)為,隨著AI應(yīng)用場(chǎng)景越來(lái)越復(fù)雜,通過(guò)單一芯片平臺(tái)提供全精度和混合精度計(jì)算,已成為“超智融合”背景下的算力基礎(chǔ)設(shè)施發(fā)展趨勢(shì)。

技術(shù)路徑找準(zhǔn)之余,要想讓智算中心“輕裝上陣”,生態(tài)建設(shè)又是另一核心命題。與低精度計(jì)算相適配,國(guó)內(nèi)仍需構(gòu)建自主可控的開源框架,解決編程接口不統(tǒng)一、算子庫(kù)適配難等問(wèn)題。因此,智算中心的未來(lái)不是一道高精度或低精度的選擇題,而是一道如何“恰到好處”協(xié)調(diào)適配各個(gè)環(huán)節(jié)的思考題。

可以預(yù)見,智算中心走向應(yīng)用的“下半場(chǎng)”,一定不再是 單純追求數(shù)值的堆砌,而是如何在有限資源里找到最優(yōu)解。 面向未來(lái),筆者認(rèn)為智算中心有三大趨勢(shì)值得關(guān)注。一是全精度覆蓋,兼顧低精度推理與高精度訓(xùn)練,滿足差異化需求;二是超智算一體化,通過(guò)全國(guó)一體化算力網(wǎng)實(shí)現(xiàn)跨區(qū)域資源共享;三是AI原生設(shè)計(jì),將AI技術(shù)深度融入基礎(chǔ)設(shè)施建設(shè)與管理,實(shí)現(xiàn)自動(dòng)化運(yùn)維與動(dòng)態(tài)優(yōu)化。

原創(chuàng)文章
最新文章
1
聚光同行 共創(chuàng)新生 | 2025 CSPC中國(guó)智能投影產(chǎn)業(yè)高峰論壇在北京成功召開
2
長(zhǎng)安汽車戰(zhàn)略合作快手 以陣地經(jīng)營(yíng)智能營(yíng)銷夯實(shí)市場(chǎng)增量
3
從田間到云端,快手“村晚大舞臺(tái)”助力鄉(xiāng)村文化璀璨綻放
4
神君魔女百年羈絆,快手星芒短劇《與子成說(shuō)》上演萌娃助攻
5
快手快聘開設(shè)“百城千校萬(wàn)企”專場(chǎng)直播 畢業(yè)生搭建就業(yè) “云橋梁”
6
快手電商知產(chǎn)聯(lián)盟啟航 筑夢(mèng)品牌保護(hù)新紀(jì)元
7
京東方CEO馮強(qiáng):發(fā)布ONE品牌,從被動(dòng)履行責(zé)任到主動(dòng)塑造未來(lái)
8
第五屆中國(guó)智能投影產(chǎn)業(yè)高峰論壇召開 京東攜品牌共商智能投影產(chǎn)業(yè)發(fā)展
9
從體育賽事到實(shí)時(shí)娛樂(lè),索尼如何攜手創(chuàng)作者激活創(chuàng)意的無(wú)限可能?
10
蘋果 iPhone 17 系列機(jī)模再曝, 其內(nèi)存大小曝光
11
真我GT7打造3K內(nèi)“性能續(xù)航雙冠王”,起售價(jià)2599元!
12
2025Q1家電渠道總結(jié):從高增長(zhǎng)到穩(wěn)增長(zhǎng),市場(chǎng)趨勢(shì)有哪些變化?
13
第一季度移動(dòng)互聯(lián)網(wǎng)累計(jì)流量同比增長(zhǎng)14.8%
14
1.4nm!臺(tái)積電下一代半導(dǎo)體先進(jìn)制程技術(shù)曝光
15
小米申請(qǐng)注冊(cè)“小米御七”商標(biāo):YU7將于6-7月上市
16
每賣出3臺(tái)就有2臺(tái)是高刷!120Hz+電視成為主流
17
BRAVIA?電視后蓋采用以廢棄電視的后蓋為原材料的再生塑料SORPLAS? 通過(guò)"相同用途的材料循環(huán)再生"推動(dòng)資源高效利用
18
電商平臺(tái)就規(guī)范僅退款征求意見,拼多多淘寶京東抖音快手有啥不同
19
海信、TCL、索尼、三星,電視大廠為啥越來(lái)越喜歡搞音響?
20
海信重磅發(fā)布“云信·通途交通大模型”: 以AI之力,解鎖智能交通無(wú)限可能
關(guān)于我們

微信掃一掃,加關(guān)注

商務(wù)合作
  • QQ:61149512