GN7是全球首個公有云上基于NVIDIA T4以及vComputeServer的虛擬化實例,能夠加速人工智能、機器學習和數(shù)據(jù)科學的工作負載。
今日,騰訊云正式對外發(fā)布基于 NVIDIA T4 的虛擬GPU(vGPU)計算產(chǎn)品GN7實例,這也是全球首家公有云實現(xiàn)了基于NVIDIA T4 GPU及 NVIDIA vComputeServer 軟件 的vGPU實例。
基于多精度支持,NVIDIA T4擁有可加速深度學習訓練和推理、機器學習以及數(shù)據(jù)科學工作負載的 Tensor Core,以及豐富的平臺堆棧,包括用于深度學習的cuDNN、用于數(shù)據(jù)分析和機器學習的NVIDIA RAPIDS、用于云工作站圖形的NVIDIA Quadro虛擬工作站和用于云游戲的NVIDIA游戲軟件。結(jié)合用于GPU虛擬化的 vComputeServer軟件,騰訊云客戶可以靈活選擇在虛擬環(huán)境中運行GPU加速的工作負載,從而在提高安全性和利用率的同時降低成本。
騰訊云副總裁劉穎表示:“人工智能的迅速發(fā)展對算力需求提出了各種挑戰(zhàn),而我們專注解決這些問題,為客戶提供全方位的產(chǎn)品解決方案。騰訊云GN7實例通過部署NVIDIA T4 GPU,提供豐富多樣的實例規(guī)格,滿足從計算視覺到語音以及NLP等不同層次的算力需求。NVIDIA vComputeServer進一步豐富了算力粒度,為用戶提供了更多選擇的可能,最終為客戶節(jié)省成本?!?/span>
NVIDIA專業(yè)可視化業(yè)務副總裁Bob Pette表示:“企業(yè)正在迅速實施人工智能(AI)策略,AI策略需要依靠現(xiàn)代應用程序才能實現(xiàn),而現(xiàn)代應用程序則需強大算力的支持。如今,在NVIDIA vComputeServer的助力之下,騰訊云可以輕松地幫助客戶實施并擴展數(shù)據(jù)分析、機器學習、AI以及企業(yè)中的其他工作負載?!?/span>
多重特性,廣泛適用不同AI場景
憑借強大的計算能力和彈性能力,GN7實例在海量數(shù)據(jù)處理和人工智能領域都具有廣闊的應用價值。它既可以滿足諸如搜索、大數(shù)據(jù)分析等需要對海量數(shù)據(jù)進行處理的業(yè)務場景,也可以作為深度學習訓練和推理的系統(tǒng)平臺。GN7實例的虛擬化特性也十分適合互聯(lián)網(wǎng)業(yè)務中人工智能業(yè)務的批量部署以及云游戲,AR/VR在云端的應用。目前GN7實例已經(jīng)在騰訊云自有的智能鈦彈性模型服務(TI-EMS)上實現(xiàn)了應用。該平臺通過使用vGPU做小模型推理,幫助用戶解決復雜模型部署和GPU利用成本效益等問題。
進一步降低成本
GN7實例降低了GPU加速的初始投資成本,是初創(chuàng)企業(yè)、大學和企業(yè)在評估AI時的經(jīng)濟選擇。 NVIDIA vComputeServer軟件通過對NVIDIA T4進行虛擬化,使多臺虛擬機(VM)可以同時訪問GPU或者使一臺虛擬機可以訪問多顆 GPU,從而實現(xiàn)性能的最大化。因此,騰訊云用戶可以根據(jù)工作負載的需求靈活選擇對應的GPU加速量。
比如在進行簡單模型推理這一類低算力需求的應用時,用戶無須再像以往必須使用單顆物理GPU,而是可以根據(jù)自身業(yè)務具體類型對GPU算力的需求,靈活選擇匹配的vGPU資源,提升了計算資源的利用率,從而有效降低用戶的使用成本,避免因配置不足或配置過度而產(chǎn)生成本。比如,通過使用1/2 vGPU實例規(guī)格,成本相對單卡實例降低了50%。
更出色的安全性
一直以來,騰訊云都在致力于通過最新虛擬化技術研發(fā)為用戶提供最安全最便利的異構(gòu)計算產(chǎn)品。GN7實例具有更出色的性能與安全性,能夠安全隔離公有云上的實例。 相比過往進程級別的虛擬化GPU,GN7的升級點在于其提供的設備級虛擬化vGPU是完全模擬出來一個GPU設備,在支持GPU硬件的絕大多數(shù)特性的同時,還能夠做到操作系統(tǒng)級別的隔離,而且不同的用戶使用也不用擔心資源爭搶的問題。
下周,在于蘇州舉辦的GTC大會上,騰訊云海將會演示NVIDIA GPU加速的云服務,并介紹如何從云端部署AI工作負載。
- QQ:61149512