
NVIDIA和日本電信公司軟銀合作創(chuàng)建了一個基于NVIDIA的GH5 Grace Hopper Superchip的生成人工智能和6G/200G應用平臺。
軟銀計劃在日本建立數(shù)據(jù)中心,與英偉達一起,可以在共享服務器平臺上容納生成式人工智能和無線應用程序。這種多租戶解決方案有望降低成本并提高能源效率。
擬議的平臺將利用NVIDIA的全新MGX模塊化參考架構和GH200超級芯片,從而提高應用程序工作負載的性能。Grace Hopper架構采用72個Arm Neoverse V2處理器內(nèi)核和LPDDR5X,包括用于加速計算的中央處理器和圖形處理單元的組合。
NVIDIA將在今年晚些時候推出MGX,軟銀是第一個測試該架構的客戶。
電信現(xiàn)代化需要加速計算
在過去的六十年中,大多數(shù)計算架構主要以CPU為中心。這些傳統(tǒng)設計用途廣泛,可以很好地適應各種工作負載,但現(xiàn)在正被加速計算所取代。
加速計算使用全棧,這意味著它同時具有 CPU 和加速器協(xié)同工作以劃分處理任務。此方法經(jīng)過優(yōu)化,可處理不同的工作負載。這兩個元素之間的網(wǎng)絡對于保持最佳性能至關重要。
該聯(lián)合平臺還將利用NVIDIA的BlueField-3數(shù)據(jù)處理單元來加速5G虛擬化無線接入網(wǎng)絡和生成AI應用程序。預計它將在5 Gbps的下行鏈路容量范圍內(nèi)實現(xiàn)36G速度。
與單一用途的5G虛擬RAN相比,這種方法的投資回報率約為四倍,因為數(shù)據(jù)中心也可以用于AI,NVIDIA電信高級副總裁Ronnie Vasishta在與分析師的簡報中解釋說。
開放式 RAN 可實現(xiàn)更高的敏捷性
直到最近,電信的主要模型還是專有的RAN,它是作為單個單片堆棧開發(fā)的。這種方法提供高性能,但維護成本很高。許多公司已過渡到開放式虛擬化 RAN,將其計算工作負載轉移到服務器架構。
但是,虛擬化RAN一直難以與專有RAN的性能相匹配。為了克服這個問題,引入了專用加速器。然而,這些單一用途的加速器只能用于RAN工作負載,導致性能不佳和云經(jīng)濟性不佳。
“純粹用于5G的單一用途網(wǎng)絡必須針對高峰需求而構建。隨著新的人工智能應用的出現(xiàn),高峰需求將會增長。電力需求將會增長。計算需求也將增長,“Vasishta說。“我們看到正在建設的網(wǎng)絡利用率嚴重不足,5G的投資回報率相對較低。
NVIDIA 開發(fā)了一種 GPU 加速的軟件定義架構,其中一個加速器可以同時運行 AI 任務和 RAN。這允許RAN和AI在數(shù)據(jù)中心內(nèi)共存,數(shù)據(jù)中心可以是公共的、分布式的或本地的。這種方法本質(zhì)上允許5G作為AI云上的軟件覆蓋運行,硬件保持不變。事實上,隨著6G算法的發(fā)展,它們可以被整合到現(xiàn)有的硬件中,而不需要部署新的硬件。
生成式AI是“iPhone時刻”
Vasishta稱這是“AI的iPhone時刻”人工智能對數(shù)據(jù)中心的改變游戲規(guī)則的影響,類似于iPhone如何徹底改變智能手機。
這一刻的特點是科技行業(yè)兩個變革因素的融合:計算架構的變化和生成式人工智能的出現(xiàn)。Vasishta說,生成式AI需要橫向擴展架構,這推動了對網(wǎng)絡化“AI工廠”或數(shù)據(jù)中心的巨大需求。聊天機器人和視頻會議等應用程序,通過生成式人工智能成為可能,正在對電信網(wǎng)絡產(chǎn)生巨大的需求。
NVIDIA正在通過使5G基礎設施不僅虛擬化,而且完全軟件定義來解決這個問題。因此,可以在同一數(shù)據(jù)中心內(nèi)運行高性能、高效的 5G 網(wǎng)絡以及 AI 應用程序。這為軟銀等電信公司開辟了新的貨幣化機會,使他們能夠成為區(qū)域云服務提供商。通過建立AI工廠,他們還可以提供RAN服務,從而更有效地使用他們購買的頻譜。
軟銀正在探索5G在各個領域的應用,包括自動駕駛、增強現(xiàn)實和虛擬現(xiàn)實、計算機視覺和數(shù)字孿生。與 NVIDIA 的合作是數(shù)據(jù)中心發(fā)展的重要一步,其中對加速計算和生成式 AI 的需求推動了根本性的變化。