英偉達加入AI PC主戰場,如何變革端側AI?
英偉達在AI PC領域感受到壓力
現如今,英偉達的主要收入依舊來自于個人電腦市場,特別是游戲和專業圖形處理領域。
根據英偉達2024財年第三季度的業績,游戲業務的營收高達285.6億美元,同比增長超過80%。隨著游戲行業不斷壯大和虛擬現實技術逐步提升,個人電腦市場的增長空間仍然龐大。
更為關鍵的是,英偉達擁有豐富的GPU產品線,能在PC市場上長期保持競爭優勢。
這些新產品對生成式AI進行了大量優化,為GPU在未來的AIPC領域發力創造了條件。
雖然PC端GPU在AI的幫助下有很大的發展機會,但在AIPC的大趨勢中,競爭也比高端GPU更殘酷。
自去年底以來,各大市場參與者對端側AI充滿期待,眾多市場玩家試圖在端側AI市場占據一席之地。
例如,英特爾在其新一代面向PC的Meteor Lake處理器中納入了專門的NPU加速單元;
AMD Ryzen處理器設有Ryzen AI品牌以作宣傳;
聯發科的天璣9300手機芯片內部的AI單元集成了所謂的[生成式AI加速引擎]。
相應地,眾多OEM廠商紛紛響應,微軟也期望在此領域發揮標準制定者的作用。
現在,英偉達不僅要面對AMD和Intel的競爭,還要應對蘋果M系列芯片的挑戰。
目前,很多AI大模型開發者開始嘗試使用蘋果電腦來訓練大語言模型。
最新款的Mac Studio頂配版已經可以訓練擁有700億參數的LLaMA2模型。
顯然,強調端側或本地AI推理的原因在于:
一方面,優良技術與熱點不應僅由英偉達獨占;另一方面,本地AI推理具有云計算無法比擬的優勢。
這些優勢已廣為人知,包括數據安全與隱私、延遲需求以及無法確保實時云連接等。
然而,對于AI而言,諸如ChatGPT、Midjourney等面向大眾的云AI相較于本地部署AI模型存在一個巨大劣勢,即無法根據個體需求進行定制。
若將視野拓寬至消費市場以外,邊緣AI成為必然選擇。企業至少需要邊緣AI來提升生產力,這也是我們預測今年生成式AI發展模式的方向。
對個人用戶而言,無論是開展科學研究還是提高具體生產力,端側本地AI具有可定制和更靈活的優勢。
例如,使用Stable Diffusion等復合式模型滿足個性化需求時,云服務或許會受限。
最新AI PC消費級GPU發布
在2024年CES特別活動中,英偉達正式發布了備受玩家期待的RTX40 Super系列產品。
相較于英特爾和AMD的新一代芯片,RTX40 Super系列將在多個方面實現[數量級]的提升。
①GeForce RTX4080 SUPER:支持4K全景光線追蹤游戲,在圖形密集度較高的游戲中,性能相較于不支持DLSS幀生成技術的RTX3080 Ti提升了1.4倍。
憑借836 AI TOPS,DLSS幀生成技術為用戶帶來額外性能提升,使得RTX4080 SUPER的性能達到RTX3080 Ti的兩倍。
②GeForce RTX4070 Ti SUPER:擁有更多核心,顯存容量擴大至16GB,顯存位寬為256 bits。相較于RTX3070 Ti,性能提升1.6倍。
③GeForce RTX4070 SUPER:核心數量比RTX4070增加20%,使得其僅需RTX3090一小部分功耗即可實現超越RTX3090的性能。借助DLSS3的性能優勢,領先幅度將進一步擴大至1.5倍。
據悉,包括華碩、MSI、聯想、惠普、三星等在內的OEM終端廠商將提供基于RTX4080 SUPER的AI PC設備。
英偉達在端側已提前著手儲備
從Turing架構開始,英偉達在GeForce RTX GPU中加入了Tensor Core,這是專為加速AI運算而設計的硬件單元。
在PC端領域,與數據中心顯卡相同,均采用Ampere或Ada Lovelace架構,基于英偉達構建的軟件棧。
因此,運用GeForce RTX顯卡進行AI推理顯得順理成章。
英偉達在AI PC實現方面具備堅實基礎,其生態、軟件棧布局以及社區創新玩法相對較早。
相較之下,英特爾在今年初才開始推廣AI PC概念,實際上已晚于英偉達。
他們計劃在未來幾年推出的H200、B100和X100 GPU,以及每年更新AI GPU的策略。
因為競爭對手如谷歌、亞馬遜、微軟、AMD和英特爾的壓力,英偉達加快了B100和X100的研發。
為了加速研發,AMD甚至可能取消了他們的MI350X計劃。
英偉達的目標可不只是超越英特爾和AMD這些傳統對手,他們還想和谷歌、微軟、亞馬遜、Meta和蘋果這些科技巨頭并駕齊驅。
他們充分利用了HGX板或服務器所需的眾多下游組件,如定時器、DSP、光學器件等。
對于猶豫是否要供應英偉達的供應商,英偉達會采取又哄又壓的策略。
一方面,供應商能從英偉達那接到大單;另一方面,他們也可能面臨被英偉達從現有供應鏈中踢出的風險。
結尾:CUDA生態將在AIPC釋放更大能量
如今,全球有超過1億臺搭載英偉達RTX GPU的Windows PC和工作站。
作為AI大模型時代核心玩家,英偉達通過全棧生態賦能,讓這些[RTX PC]的AI性能實現翻倍增長。
英偉達創始人黃仁勛認為,通過發明CUDA這種新編程工具和GPU處理器,推動加速計算。
英偉達在技術生態,特別是25年CUDA領域耕耘,為其在AI時代占據核心地位奠定基礎,這種生態布局在PC產業中釋放的能量日益顯現。
今年四季度,英偉達發布TensorRT-LLM引擎優化編譯器,旨在提升大語言模型AI推理性能。
據官方數據,TensorRT-LLM助力下,Lambda2大語言模型在H200上的推理能力達到H100的2倍,成本降低,且H200在GPT-3模型上的推理性能比H100提升18倍。
TensorRT-LLM for Windows的推出,使AI大模型在端側RTX PC中應用更佳,滿足用戶各類AIGC需求,提升AI PC體驗。
