“天命人”TPU正面挑戰(zhàn)GPU
CPU誕生,讓英特爾在PC時代長期獨占鰲頭;GPU崛起,讓英偉達一躍而起風光無二。xPU時代正在到來,由谷歌TPU衍生而出的未來,誰又將乘勢而起?
2024-09-14 10:58:31
來源:中國電子報、電子信息產(chǎn)業(yè)網(wǎng) 楊鵬岳??

CPU誕生,讓英特爾在PC時代長期獨占鰲頭;GPU崛起,讓英偉達一躍而起風光無二。xPU時代正在到來,由谷歌TPU衍生而出的未來,誰又將乘勢而起?

在全球科技產(chǎn)業(yè)將目光緊緊鎖定人工智能領域之際,TPU(Tensor Processing Unit,張量處理器)正在悄悄成長為AI時代的“弄潮兒”。

GPU用于大模型訓練、推理存在高能耗、高成本等問題,由AI算力需求增長帶來的種種問題,或許可以從TPU身上找到更為理想的答案。

TPU“攻入”AI主流市場

由于入局早、算力強,由英偉達提供的GPU芯片幾乎已成為各大企業(yè)訓練、推理模型,處理AI相關算力需求的標配。但當前,TPU芯片也正在逐步進入AI算力主流芯片市場。

TPU由谷歌率先推出。從初代芯片推出至今,TPU的應用范圍正逐步擴大,谷歌以外的市場也逐漸打開。

最初,TPU是谷歌專為加速機器學習和深度學習任務而設計的專用芯片,特別是針對深度學習模型的訓練和推理。2013年,谷歌開始研發(fā)TPUv1,這是全球首款專為AI打造的加速器。2017年,谷歌推出Cloud TPU,用于處理云端計算任務。

自2022年底生成式人工智能獲得產(chǎn)業(yè)界廣泛關注以來,TPU在生成式人工智能領域的應用范圍也逐步拓寬。例如,2023年12月,谷歌推出多模態(tài)通用大模型Gemini的三個不同版本,該模型的訓練大量使用了Cloud TPU v5p芯片。

谷歌曾表示,TPU是其推出許多服務的最大功臣之一,要是少了它,如即時語音搜尋、相片物件辨識及互動式語言翻譯等無法絲滑運行,還有最先進的Gemini、Gemma、Imagen模型等也無法順利問世。

今年5月,谷歌又發(fā)布了第六代TPU芯片Trillium。據(jù)悉,Trillium能在單個高帶寬、低延遲Pod中擴展為多達256個TPU的集群,相較于前代產(chǎn)品,Trillium在適配模型訓練方面的功能更強。

同時,TPU芯片也逐漸走出谷歌公司,獲得更大范圍的市場青睞。一如,7月30日蘋果公司發(fā)布的一篇研究論文稱,蘋果在訓練Apple Intelligence生態(tài)中的人工智能模型AFM時,選擇了谷歌的兩種張量處理單元(TPU)云集群。

性價比優(yōu)勢成為“焦點”

在以英偉達產(chǎn)品為代表的GPU在算力基礎設施市場“一騎絕塵”的情況下,TPU何以嶄露頭角,又何以贏得蘋果等全球知名企業(yè)的青睞?

市場分析師表示,以GPU為代表的通用計算架構和針對特定領域的DSA(Domain Specific Architecture,面向特定領域)計算架構是目前兩大主流AI芯片設計思路。但在市場容量巨大的應用領域,計算芯片的架構演進總呈現(xiàn)出從通用型向專用型轉變的規(guī)律。

隨著大模型訓練的計算量和復雜度的指數(shù)級增長,傳統(tǒng)GPU成本昂貴、算力利用率低、能耗大的局限日益凸顯。

今年1月,扎克伯格發(fā)帖公布了一組數(shù)字:到2024年底,Meta“大規(guī)模的計算基礎設施”將包括高達35萬張英偉達H100顯卡,為Meta在人工智能領域的突破提供強大支持。如果將其他GPU計算在內,Meta的計算基礎設施將擁有“相當于近60萬張H100的算力”。這將是一筆巨大的開銷。

與此同時,馬斯克表示,2024年特斯拉僅僅在英偉達的人工智能芯片上就將耗費超過5億美元,特斯拉未來還需要價值“數(shù)十億美元”的硬件才能趕上最大規(guī)模的競爭對手。

高昂的算力成本,使一眾全球頂尖的科技企業(yè)望而生畏。在此背景下,作為AI專用芯片之一的TPU被業(yè)界期待能夠從新的技術路線上另辟蹊徑。在這方面,谷歌已經(jīng)提供了成功經(jīng)驗。據(jù)谷歌副總裁兼工程院士Norm Jouppi透露,TPU的出現(xiàn)足足讓谷歌省下了15 個數(shù)據(jù)中心的建設成本。

探索市場新可能

從產(chǎn)品邏輯來看,作為一種專用集成電路(ASIC),TPU專為單一特定目的而設計,用以運行構建AI模型所需的獨特矩陣和基于矢量的數(shù)學運算。而GPU的設計初衷是處理圖像信息。因此,從架構設計的角度來看,相比于適合處理高度并行任務的GPU, TPU更適用于處理矩陣乘法等神經(jīng)網(wǎng)絡算法。

“TPU具有為AI大模型而生的天然優(yōu)勢架構?!盩PU架構AI芯片公司中昊芯英創(chuàng)始人兼CEO楊龔軼凡在接受《中國電子報》記者采訪時表示,TPU專為神經(jīng)網(wǎng)絡結構而設計,在相同制造工藝、能耗和芯片尺寸條件下,性能優(yōu)于GPU 3~5倍。在適用場景上,TPU為已有的算法和框架進行優(yōu)化,性能和功耗表現(xiàn)均優(yōu)于GPU,更適用于深度學習模型的大規(guī)模部署。深度學習無疑仍是AI領域的主導力量,深度學習的某個分支將承載著未來100%的AI應用。從長遠來看,TPU比GPU在AI賽道上更具競爭力。

在TPU芯片領域,產(chǎn)業(yè)界正在進行不同的嘗試。

一方面,“先行者”谷歌探索出了自己的專屬路線。

咨詢公司D2D Advisory首席執(zhí)行官Jay Goldberg直言,今天只有兩家公司有著成熟的芯片研發(fā)體系來訓練人工智能模型,一個是英偉達的GPU,另一個是谷歌的TPU。但區(qū)別于英偉達,谷歌并不會以獨立產(chǎn)品的形態(tài)單獨出售自己的TPU芯片,而是通過谷歌云平臺向外部客戶提供基于TPU的算力服務。

另一方面,更多芯片從業(yè)者仍在探索基于TPU架構的新產(chǎn)品。

今年2月,美國AI芯片初創(chuàng)公司Groq憑借其開發(fā)的新型AI處理器LPU(Language Processing Unit)引發(fā)關注,使用的TSP(張量流處理器)源頭是谷歌研發(fā)的TPU。今年4月,英特爾推出了專攻深度學習神經(jīng)網(wǎng)絡推理的類TPU芯片Gaudi 3。

值得關注的是,國內初創(chuàng)AI芯片企業(yè)中昊芯英歷時近五年,已成功量產(chǎn)全自研的國內首枚TPU AI訓練芯片,并自研AIGC預訓練大模型,正在與行業(yè)伙伴進行金融、教育、醫(yī)療等垂直領域專業(yè)大模型的探索落地。業(yè)界普遍認為,TPU芯片在中國市場的應用,更有助于TPU這一產(chǎn)品門類的成熟。

當然,無論從技術還是生態(tài)角度,TPU和類TPU芯片都處于“嬰兒期”,需要進一步發(fā)展。但是,AI時代已經(jīng)到來,算力需求才露出冰山一角。在龐大需求下,新生事物更有施展拳腳的可能。

最新文章
1
4年前理想李想和特斯拉陶琳說的話,值得所有人深思
2
TCL上新Mini LED電視,T7L為何“最能打”,Q9L為何“最值得買”?
3
八年前用A9帶火屏幕發(fā)聲技術的索尼,今年會有OLED新品嗎?
4
海信視像發(fā)布2024年可持續(xù)發(fā)展報告:以綠色科技推動可持續(xù)發(fā)展
5
都叫“養(yǎng)鮮”冰箱,格力、容聲有啥不一樣?
6
財報觀察:2024全球智能家電銷量第一品牌,講好新故事?
7
續(xù)航滅霸 +倍強大 vivo Y300 Pro+正式發(fā)布
8
BOE(京東方)f-OLED柔性顯示技術策源地論壇舉辦 攜手中關村論壇共筑科技創(chuàng)新高地
9
海信視像2024年營收凈利雙增,高端穩(wěn)步增長,蟬聯(lián)世界第二
10
精裝修熱水系統(tǒng)市場外資占優(yōu),高端住宅需求點燃新增長(2025年1-2月)
11
AI家電:技術狂歡還是實用革命?
12
中國半導體并購潮起
13
小家電市場表現(xiàn)低迷,2025年小家電市場面臨嚴峻挑戰(zhàn)
14
全球首款!新型手機OLED面板問世:可發(fā)聲、會變形
15
空調等家電沖擊傳統(tǒng)廠商!持股近10年 美的徹底清倉了小米:合計套現(xiàn)20億元
16
同期唯一2K直屏超大杯!OPPO Find X8 Ultra外觀正式揭曉
17
添可做飯,追覓洗碗
18
海爾海信洗衣機聽勸玩起“滾筒分身術”,三筒分區(qū)洗哪家強?
19
催更效果拉滿!高對比度屏+萬象分區(qū),TCL T7L&Q9L系列全球首發(fā)
20
健康守護+空間革命+智慧服務,TCL冰洗創(chuàng)新“三重奏”擊中時代剛需
關于我們

微信掃一掃,加關注

商務合作
  • QQ:61149512