天數(shù)智芯首席科學(xué)家 鄭金山
2020年8月4日,國(guó)務(wù)院公布《新時(shí)期促進(jìn)集成電路產(chǎn)業(yè)和軟件產(chǎn)業(yè)高質(zhì)量發(fā)展的若干政策》,開篇指出,集成電路產(chǎn)業(yè)和軟件產(chǎn)業(yè)是信息產(chǎn)業(yè)的核心,是引領(lǐng)新一輪科技革命和產(chǎn)業(yè)變革的關(guān)鍵力量。2020年的國(guó)際環(huán)境,讓全社會(huì)越來(lái)越認(rèn)識(shí)到中國(guó)集成電路和軟件產(chǎn)業(yè)的薄弱,越來(lái)越堅(jiān)定要把集成電路和軟件產(chǎn)業(yè)搞去的決心。
今天,我們來(lái)談一談GPGPU市場(chǎng)。
縱觀整個(gè)IT系統(tǒng),從CPU、操作系統(tǒng)、辦公套件、整機(jī)到服務(wù)器,我們都已經(jīng)初步具有一些商用化的可替代產(chǎn)品。唯獨(dú)在GPGPU領(lǐng)域,目前還是一片空白。如下圖所示:
GPGPU是什么
GPGPU全稱是通用圖形處理器(General-Purpose computing on Graphics Processing Units)。它是用專門處理圖形任務(wù)的處理器,執(zhí)行原本由中央處理器處理(CPU)完成的通用計(jì)算任務(wù)。這些通用計(jì)算常常與圖形處理沒有任何關(guān)系。圖形處理器的特點(diǎn)是,并行處理能力特別強(qiáng),計(jì)算能效比高,并且有很大的存儲(chǔ)帶寬。有些應(yīng)用,例如人工智能(機(jī)器學(xué)習(xí))模型訓(xùn)練與推理、高性能計(jì)算,它們往往是大數(shù)據(jù)流應(yīng)用,這時(shí),用GPGPU解決這類問題就比CPU效率更高。雖然目前機(jī)器學(xué)習(xí)會(huì)有遷移到專用硬件的可能,但在編程模型上GPU是圖靈完備的,且對(duì)于用傳統(tǒng)語(yǔ)言編寫的、軟件形式的計(jì)算有較好的支持,具有高度的靈活性。
因此,GPGPU目前廣泛應(yīng)用于高性能計(jì)算、行業(yè)AI應(yīng)用、安防與政府項(xiàng)目、互聯(lián)網(wǎng)及云數(shù)據(jù)中心等。其主要應(yīng)用場(chǎng)景:一是人工智能模型訓(xùn)練與推理;二是高性能計(jì)算。
根據(jù)有關(guān)數(shù)據(jù)預(yù)測(cè),到2025年,中國(guó)GPGPU芯片板卡的市場(chǎng)規(guī)模將達(dá)到458億元,是2019年86億元的5倍多,2019年到2025年的年復(fù)合增長(zhǎng)率高達(dá)32%。按行業(yè)來(lái)分,互聯(lián)網(wǎng)及云數(shù)據(jù)中心為228億元,安防與政府?dāng)?shù)據(jù)中心為142億元,行業(yè)AI應(yīng)用為37億元,高性能計(jì)算為28億元。按應(yīng)用場(chǎng)景來(lái)分,到2025年的預(yù)測(cè)數(shù)據(jù)是,人工智能推理286億元,人工智能訓(xùn)練144億元,高性能計(jì)算28億元。
可以看出,GPGPU在中國(guó)的未來(lái)需求量很大,對(duì)國(guó)民經(jīng)濟(jì)的發(fā)展至關(guān)重要。
GPGPU國(guó)產(chǎn)替代的市場(chǎng)呼喚
一般人對(duì)GPGPU沒有什么概念。某頭部供應(yīng)商的一塊高端GPGPU板卡,其售價(jià)接近一輛普通轎車的價(jià)格。
當(dāng)前,人工智能應(yīng)用的閘門打開了,很多企業(yè)、研究機(jī)構(gòu)、研究者希望利用人工智能。首先是要做的是人工智能訓(xùn)練,根據(jù)現(xiàn)有數(shù)據(jù),反復(fù)訓(xùn)練,得出一個(gè)模型。將這個(gè)模型部署到業(yè)務(wù)應(yīng)用中,當(dāng)對(duì)這個(gè)模型輸入一個(gè)新的數(shù)據(jù)時(shí),根據(jù)模型計(jì)算出一個(gè)結(jié)果,這一過(guò)程稱為人工智能推理。例如,一個(gè)游戲網(wǎng)站接收到一個(gè)新用戶注冊(cè),它想判斷這個(gè)用戶是正常用戶,還是競(jìng)爭(zhēng)對(duì)手注冊(cè)進(jìn)來(lái)拉人的惡意用戶。它就可以利用過(guò)去大量的用戶行為數(shù)據(jù),訓(xùn)練出一個(gè)人工智能模型。這個(gè)模型能夠計(jì)算出,什么樣的用戶行為就有可能是惡意用戶,從而自動(dòng)地對(duì)這些用戶限制權(quán)限,或者交給人工客服來(lái)處理。類似的應(yīng)用特別多,可以訓(xùn)練機(jī)器做很多以前由人工來(lái)完成的事情,例如,安防領(lǐng)域的視頻分析,媒體領(lǐng)域的內(nèi)容生產(chǎn)、字幕生成、內(nèi)容審核、分類與標(biāo)簽,醫(yī)療健康領(lǐng)域的藥物發(fā)現(xiàn)與探索、醫(yī)學(xué)影像自動(dòng)識(shí)別、輔助醫(yī)療、自動(dòng)診療,電商領(lǐng)域的個(gè)性化推薦、信用評(píng)級(jí),金融交易領(lǐng)域的交易算法、服務(wù)管理與推薦、潛在用戶挖掘,客服領(lǐng)域的語(yǔ)音服務(wù)、聊天機(jī)器人、呼叫中心優(yōu)化,等等。
高性能計(jì)算則是國(guó)之重器,計(jì)算機(jī)學(xué)科中的明珠,廣泛應(yīng)用于勘探、天氣、海洋、氣候變化、核能、發(fā)動(dòng)機(jī)、航空航天等領(lǐng)域。
面對(duì)日益增長(zhǎng)的需求來(lái)說(shuō),GPGPU的供應(yīng)是沒有很好地滿足的。當(dāng)前,全球GPGPU市場(chǎng)供應(yīng)處于一家獨(dú)大的局面,價(jià)格昂貴,產(chǎn)品種類單一。以中國(guó)的云端AI訓(xùn)練芯片市場(chǎng)為例,最大的供應(yīng)商市場(chǎng)份額達(dá)到90%,其中,某一款產(chǎn)品就占整個(gè)市場(chǎng)的50%,另一款產(chǎn)品占25%。
這樣的局面雖然源自該供應(yīng)商的技術(shù)和實(shí)力,但是客戶還是需要更多的選擇。例如在2017年,因?yàn)槿斯ぶ悄苡?xùn)練和數(shù)字貨幣挖礦的需求猛增,GPGPU供不應(yīng)求,價(jià)格高漲,一部分用戶嘗試將原本用作獨(dú)立顯卡的消費(fèi)級(jí)GPGPU,替代用于數(shù)據(jù)中心,但是被供應(yīng)商在軟件驅(qū)動(dòng)上禁用,當(dāng)時(shí)引起一陣熱議。
從國(guó)家的供應(yīng)鏈安全角度,這兩年,一些重要的企業(yè)和機(jī)構(gòu)陸續(xù)被美國(guó)列入禁售實(shí)體名單。這些用戶除了國(guó)產(chǎn)替代,別無(wú)選擇。
GPGPU國(guó)產(chǎn)替代如何突圍
看到這里,很多人一定會(huì)問。第一位的供應(yīng)商占據(jù)90%的市場(chǎng),這個(gè)市場(chǎng)一定很難攻下,不然全球有那么多芯片公司,早就有別的公司來(lái)制衡了。
一方面,前面分析了目前的國(guó)際環(huán)境下,我們實(shí)現(xiàn)國(guó)產(chǎn)替代的必要性和緊迫性。國(guó)家也出臺(tái)了《若干政策》這樣的鼓勵(lì)措施,從財(cái)稅、投融資、研究開發(fā)、進(jìn)出口、人才培養(yǎng)、知識(shí)產(chǎn)權(quán)、市場(chǎng)應(yīng)用、國(guó)際合作等多個(gè)方面,支持相關(guān)的企業(yè)發(fā)展壯大。另一方面,從技術(shù)難度看,GPGPU也不是可望不可及的。改革開放四十多年來(lái),中國(guó)有一大批芯片人才,在國(guó)際公司積累了深厚的經(jīng)驗(yàn)?,F(xiàn)在恰逢中國(guó)經(jīng)濟(jì)實(shí)力增長(zhǎng)、下決心發(fā)展半導(dǎo)體產(chǎn)業(yè)的良好時(shí)機(jī),他們希望抓住這一機(jī)遇,一顯身手,為中國(guó)半導(dǎo)體產(chǎn)業(yè)發(fā)展做出一份貢獻(xiàn)。
天數(shù)智芯就是這樣一家公司。天數(shù)智芯的芯片研發(fā)團(tuán)隊(duì)于2018年初組建,數(shù)十名創(chuàng)始團(tuán)隊(duì)主要來(lái)自世界知名芯片公司AMD的GPU部門和企業(yè)軟件翹楚Oracle、IBM、英偉達(dá)等公司。完整的芯片設(shè)計(jì)團(tuán)隊(duì)在芯片設(shè)計(jì)領(lǐng)域平均積累了近十年經(jīng)驗(yàn),可以說(shuō),這是一支在世界范圍內(nèi)都不可多得的、完善的高端芯片設(shè)計(jì)隊(duì)伍。
公司正在積極研發(fā)針對(duì)云端算力提升的訓(xùn)練及推理芯片。其中,面向人工智能訓(xùn)練的GPGPU芯片計(jì)劃在今年實(shí)現(xiàn)批量生產(chǎn),2021年初商業(yè)化投向市場(chǎng),這將是國(guó)內(nèi)首款自研的GPGPU芯片;面向人工智能推理的GPGPU芯片也在研發(fā)之中。
天數(shù)智芯在芯片設(shè)計(jì)初始,就與服務(wù)器廠商合作共同對(duì)產(chǎn)品設(shè)計(jì)進(jìn)行定義,以實(shí)現(xiàn)未來(lái)在數(shù)據(jù)中心中的國(guó)產(chǎn)替代。目前,天數(shù)智芯已經(jīng)與浪潮、新華三等服務(wù)器廠商簽署戰(zhàn)略合作,共同推動(dòng)服務(wù)器領(lǐng)域人工智能和HPC的計(jì)算芯片及硬件解決方案發(fā)展。天數(shù)智芯還與國(guó)產(chǎn)CPU龍頭中科龍芯等密切對(duì)接技術(shù)及業(yè)務(wù)合作,打造天數(shù)GPGPU+國(guó)產(chǎn)CPU的自主可控超算解決方案。
展望未來(lái),我們深知任務(wù)艱巨,但我們也有信心、決心和耐力,為國(guó)產(chǎn)GPGPU闖出一片天地。也希望有更多的人才、合作伙伴、行業(yè)應(yīng)用單位加入我們的征程。
作者簡(jiǎn)介:
鄭金山,上海天數(shù)智芯半導(dǎo)體有限公司首席科學(xué)家,擁有21年芯片設(shè)計(jì)工作經(jīng)驗(yàn),曾先后供職于Trident、XGI、ATI Technologies、AMD超微半導(dǎo)體上海有限公司和酷芯微電子(Artosyn),任高級(jí)經(jīng)理、PMTS和架構(gòu)師等職位。專注于GPU IP設(shè)計(jì)多年,對(duì)GPU架構(gòu)與設(shè)計(jì)有深厚的造詣。他建立與帶領(lǐng)上海芯片設(shè)計(jì)團(tuán)隊(duì)參與過(guò)多個(gè)顯卡(從Radeon HD2000到R400)芯片的研發(fā)與產(chǎn)品化。在酷芯微電子參與了機(jī)器視覺芯片9201的研發(fā)并成功量產(chǎn)。鄭金山1999年畢業(yè)于復(fù)旦大學(xué)ASIC與系統(tǒng)國(guó)家重點(diǎn)實(shí)驗(yàn)室,獲微電子與固體電子學(xué)專業(yè)碩士學(xué)位。
- QQ:61149512