9月17日,騰訊云宣布旗下彈性計算產品序列全面升級,全新推出的計算產品實例將以更強的算力性能,滿足產業互聯網時代各行各業不斷提升的計算需求。在異構計算領域,騰訊云發布了包括搭載Xilinx 自適應計算加速平臺 Alveo U200的FPGA實例FX4,以及采用 NVIDIA T4的GPU實例GN7在內的全新一代異構計算產品陣容,可以在未來相當時間內滿足信息化以及人工智能等產業對異構計算指數級的需求增長。
騰訊云異構計算專家產品經理高平
異構計算新實例首發 滿足不同場景需求
由于通用CPU已經無法滿足人工智能各類應用中對高并發和高算力的需求,混合了不同架構計算單元的異構計算已經成為人工智能領域最高效的計算模式。與此同時,隨著人工智能在各個行業的落地加速,不同行業,不同的業務場景對人工智能的要求也產生了分化。例如在電商,文創,教育,金融,游戲以及傳統行業雖然都要大量使用到AI,但對異構計算的算力和部署模式需求都不盡相同。對云計算企業而言也提出了更高的要求。
騰訊云此次發布的兩款異構計算新實例在保持方便快捷部署、計算能力強大、彈性可配置的基礎上,進一步豐富了算力的粒度,能夠充分滿足不同行業用戶和應用場景下對異構計算的不同需求。
Xilinx Alveo自適應計算加速平臺
FPGA新實例云上瑞士軍刀FX4因其可編程的特性,可以讓用戶定制的算法實現硬件加速,大幅提高效率,同時擁有更佳的能源效率。騰訊云是國內首家由 Xilinx 自適應計算加速平臺 Alveo 支持的公有云,Xilinx Alveo U200能夠為重要工作負載提供比CPU高90倍的性能,在不改變硬件的情況下,能加速任何工作負載,并能降低總體擁有成本。此外,FX4提供了創新的開發者模式,安全而且高效,能夠提供類似于本地FPGA的開發體驗。
GPU新實例GN7可以根據計算、渲染/游戲、桌面等場景的不同算力需求衍生出1/2 GPU、1/4 GPU等虛擬化實例規格,進而大幅提升GPU的利用率,幫助用戶降低成本。
助力人工智能行業輕松擁有最強算力
騰訊云異構計算專家產品經理高平透露,經過2年的發展,騰訊云異構計算產品的用戶規模增長超過10倍,亞洲服務器,并且得到了用戶的廣泛認可。
自2017年6月推出基于M40的GPU計算實例以來,目前騰訊云已經構建了完整的GPU計算實例矩陣,包括新發布的GN7以及GN6S、GN10X等,能夠滿足用戶在深度學習訓練/推理、視頻轉碼、圖形渲染、云游戲等多種場景下的不同算力需求。
對比行業,騰訊云的GPU計算實例矩陣在不同算力層次都有明顯的顯存優勢,M40 GPU和P40 GPU標配24G顯存,同時是國內唯一大規模提供V100 32G GPU的主流公有云。據悉,V100 32G是目前為止顯存最大、算力最強的GPU,其已在騰訊云廣泛部署,幫助用戶隨時獲取最強算力。
傳統的異構計算產品部署復雜、缺乏優化、并且需要相關人員有足夠的技術經驗,為此,騰訊云此次發布的兩款異構計算新實例將
簡化軟件的安裝部署過程,提供從簡單到靈活之間的多種安裝部署方式選擇,讓異構計算產品既簡單,又好用。
對人工智能這樣需要高性能計算的復雜應用來說,騰訊云異構計算產品在提供最強算力的同時,擁有更佳彈性的使用模式以及更高的性價比,大大降低了人工智能計算門檻。即便是人工智能初創企業,也能夠輕松搭建屬于自己的超算中心。
從深度學習到基因組學 騰訊云異構計算無處不在
目前,騰訊云異構計算產品擁有極其廣泛的應用前景,適用于深度學習、圖形渲染、云游戲等對計算能力、時延要求極高的場景,同時還能滿足分子建模、基因組學等工程計算領域的高要求。
以曾被蘋果App Store 評選為“年度優秀本土App”的“馬卡龍玩圖”為例,這款單體智能識別AI視覺制作APP對GPU算力有很高要求,在采用GN10X實例后,超大的32G顯存能夠幫助其低延遲處理多個模型,提升了用戶體驗。
目前GN7實例已經應用在騰迅云自有的智能鈦彈性模型服務(TI-EMS)上,TI-EMS在線推理平臺可以使用vGPU做小模型推理,充分提高了GPU的利用率,能夠幫助用戶在解決模型部署復雜、資源浪費、手工擴展資源效率低下等問題的同時,進一步的降低成本。
FPGA方面,騰訊云構建的FPGA云生態,云服務器,可以提供一系列優秀的壓縮、加解密、圖片處理、視頻編解碼、基因算法加速等IP,應用方只需要專注在上層應用和服務開發上,而不需要再關注FPGA編碼、調試等繁瑣細節。以騰訊云此前與東南大學合作的科研項目為例,基于騰訊云提供的FPGA云計算服務,東南大學科研人員能夠在一個開源的系統平臺進行具有高附加值的教學和研究,縮短了使用者的開發時間,助力高效理論研究成果迅速轉化。