拒絕英偉達壟斷,八大科技巨頭組團推出UALink
英偉達的NVLink讓廠商們心生不安
作為英偉達的核心技術,NVLink在GPU網絡通信系統中占據重要地位,其對于提升數據傳輸效率和處理性能具有顯著作用。
NVLink技術實現了GPU與支持該技術的CPU之間以及多個GPU之間的高帶寬直接連接,從而大幅提升了整體性能。
然而,值得注意的是,NVLink技術并未向行業開放,這在一定程度上影響了其他廠商在相關領域的競爭力。
盡管英偉達的AI系統在市場上表現出色,但人們往往忽視了其背后的眾多關鍵技術。
實際上,英偉達不僅擁有出色的GPU和軟件,還在跨多個GPU和系統橫向擴展工作負載方面擁有豐富的技術積累。
這些技術包括芯片上和封裝上互連、用于服務器或pod中GPU到GPU通信的NVLink、用于超pod擴展的Infiniband以及連接到更龐大基礎設施的以太網等。
IBM指出,NVLink技術使得CPU與GPU之間能夠實現快速數據交換,從而提升了整個計算系統的數據吞吐量,有效克服了加速計算領域的一大瓶頸。
隨著英偉達GPU芯片的更新迭代,NVLink技術也在不斷進化。
從2017年的NVLink 2.0到2020年的NVLink 3.0,再到2022年的NVLink 4.0,每一次更新都帶來了更高的性能和更廣泛的應用場景。
在2024年的GTC大會上,英偉達推出了全新的NVLink 5.0技術,并與最新一代Blackwell芯片一同亮相。
這一技術極大地提升了大型多GPU系統的可擴展性,單個Blackwell Tensor Core GPU支持多達18個NVLink 100GB/s連接,總帶寬達到1.8TB/s,較上一代產品提升了兩倍之多。
此外,NVLink 5.0技術還支持跨節點擴展,通過NVLink Switch實現無縫、高帶寬、多節點GPU集群的構建,從而滿足數據中心級別的大型GPU需求。
利用NVLink技術,多服務器集群能夠平衡GPU通信與增加的計算量,從而實現了更高的性能和效率。
例如,在GB200 NVL72等服務器平臺上,NVLink技術的應用使得這些平臺能夠支持更為復雜的大型模型,并提供了更高的可擴展性。
這些優勢使得英偉達在GPU網絡通信領域繼續保持領先地位,并為其在AI、數據中心等領域的廣泛應用提供了有力支持。
八大科技巨頭組團推出UALink
近日,包括谷歌、Meta、微軟、AMD、英特爾、博通、思科、惠普在內的科技巨頭聯合宣布成立Ultra Accelerator Link(UALink)聯盟,致力于開發人工智能數據中心GPU網絡通信系統的全新行業開放標準。
此舉旨在打破英偉達在市場上的壟斷地位,推動行業內的競爭與創新。
UALink倡議由AMD牽頭提出,得到了英特爾、博通等公司的積極響應與支持。
作為倡導組織的成員,思科、谷歌、惠普、Meta和微軟等公司亦表示大力支持。
該倡議致力于構建一種內存語義結構,在首個版本規范中便支持擴展至1024個端點,以適應不同規模的AI計算需求。
UALink聯盟計劃推出的首個UALink 1.0版本將實現AMD的Instinct GPU和英特爾的Gaudi等專用處理器之間的直接數據傳輸,從而顯著提升AI計算的性能與效率。
UALink的高速I/O通信設計與協議展現出強大的技術實力,彰顯了聯盟成員挑戰市場領導者的決心。
UALink專家組將負責制定管理數據中心中不同GPU之間連接的標準,并預計于2024年第三季度向聯盟成員提供這些標準。
此舉將為其他廠商提供更多參與市場競爭的機會,進一步推動行業的創新與發展。
去年,Ultra Ethernet技術的出現為行業帶來了增強型以太網作為Infiniband的替代方案。
今年,UALink的推出更是劍指NVLink,旨在打破其市場壟斷地位。
UALink的推出為業界其他公司提供了追趕英偉達步伐的契機。
隨著AI計算需求的不斷增長,擁有一個穩健、低延遲且可高效擴展的網絡對于提升計算性能至關重要。
UALink及行業規范的制定將有助于為AI工作負載創建開放的高性能環境,推動行業的持續進步。
UALink工作組將致力于制定規范,以界定AI計算容器組中加速器與交換機之間進行縱向擴展通信所需的高速低延遲互連。
通過標準化接口和實現方式,UALink將為新一代AI數據中心提供更加高效、靈活的AI和機器學習、高性能計算以及云應用程序解決方案。
微軟、谷歌以及Meta等或是最大受益者
對于AMD和英特爾等業界巨頭,UALink的推出為它們提供了一條復制NVLink和NVSwitch功能的路徑,并促進了與其他企業的合作與成果共享。
博通等公司在UALink的助力下,可生產UALink交換機,有效推動其他公司的規模擴張。
AMD數據中心總經理Forrest Norrod明確指出,行業亟需開放標準以推動持續發展,并鼓勵多家公司共同參與價值創造。首批UALink產品預計將在未來幾年內陸續問世。
博通數據中心副總裁Jas Tremblay表示,作為UALink聯盟的創始成員,博通一直致力于將AI技術融入數據中心領域,并支持開放生態系統協作,這對于實現網絡擴展至關重要。
思科通用硬件集團執行副總裁Martin Lund亦強調,隨著AI工作負載的不斷增長,高性能互連技術的重要性日益凸顯。
思科將積極參與UALink的開發,共同打造可擴展且開放的解決方案,以應對構建AI超級計算機所面臨的挑戰。
UALink的最大潛在受益者可能包括微軟、谷歌和Meta等科技巨頭。
這些公司已投入數十億美元購買英偉達GPU以支持云服務和AI模型訓練,并期望通過UALink降低對主導供應商的依賴。
目前,谷歌已擁有TPU和Axion定制芯片,亞馬遜推出了多個AI芯片系列,微軟推出了Maia和Cobalt芯片,而Meta也在不斷完善其加速器陣容。
微軟與OpenAI計劃投入1000億美元建造超級計算機,并將采用Cobalt和Maia芯片。UALink將成為連接這些高性能芯片的關鍵技術。
對于AMD和英特爾等公司而言,UALink不僅提供了一條復制NVLink和NVSwitch功能的途徑,還促進了與其他企業的合作與成果共享。
英特爾今年的AI加速器銷售額已達到數億美元,盡管銷量相對較小,但UALink有望助力其擴大市場份額。
AMD今年也將銷售數十億美元的MI300X產品,盡管與英偉達在AI領域的規模相比仍有差距,但UALink的推出將為其帶來新的發展機遇。
此外,UALink的推廣和應用還將為博通等公司創造新的商機。
這些公司可利用UALink技術生產UALink交換機,協助其他公司擴大規模,并在多家公司的加速器產品上廣泛應用這些交換機,共同推動行業的發展和進步。
結尾:
值得一提的是,UALink聯盟并未將英偉達排除在合作范圍之外,然而,鑒于英偉達的商業利益主要聚焦于推廣和維護其專有技術生態系統,預計其不會主動加入UALink聯盟。
顯而易見,UALink將對英偉達的市場優勢造成一定削弱。
不過,從現實角度來看,要在短時間內取代英偉達的地位并不切實際。
據相關消息透露,首批UALink產品預計將在[幾年]后推向市場。
然而,盡管面臨諸多挑戰,UALink聯盟仍堅定地認為這一步是必須邁出的。
畢竟,沒有任何人愿意看到某一領域長期被壟斷性企業所主導。
