生成式AI“風浪”越大,GPU挑戰者越多,未來格局難言成敗
世界已經為生成式人工智能瘋狂,而且會變得更加瘋狂。到 2027 年,每年的 GPU 硬件支出將達到4000億美元。
Gartner 的 IT 市場分析師預計,2024 年的 IT 總支出(包括硬件、軟件、IT 服務和電信服務)將達到 5.13 萬億美元,同比增長 8.8%。其中,只有 2355 億美元預計將用于數據中心系統,即全球銷售的所有服務器、所有存儲設備和所有交換設備。我們認為,這主要得益于用于生成式人工智能的人工智能集群的快速采用,盡管在數據中心的更多通用服務中,基礎設施支出出現了相當嚴重的下滑,但這一數字仍增長了 8.1%。
現在,這只是 AI 加速器業務數據中心部分的 TAM,不包括邊緣和客戶端 AI 硬件加速器的 TAM。AMD 沒有討論更廣泛的芯片市場的 TAM 是多少。幾個月前,IDC 還預測,到 2027 年,整個服務器業務的規模將略低于 2000 億美元。
如果逆向計算,使用人工智能服務器的 GPU 成本約占整體價格的 53% 這一比例,即基于八路 Nvidia HGX GPU 計算復合機的 37.5 萬美元貨款中約有 20 萬美元,那么如果我們對 IDC 預測的服務器市場以及人工智能和非人工智能服務器之間的分工的猜測是正確的,那么人工智能加速器硬件在 2027 年應該只能推動約 500 億美元的 GPU 發展。顯然,有人需要修改他們對這一切將如何發展的估計,以及 AMD 所稱的 "數據中心 AI 加速器 "的確切含義。它肯定是指 GPU 和 NNP,但也可能指 CPU 的部分銷售額。
無論如何,AMD 所說的是,增長速度超過了計劃,加速器的收入增長率將比我們幾個月前估計的高出 9 倍。
我們認為這絕對稱得上瘋狂。假設圖形處理器和其他加速器的價格隨著 HBM 內存的下降而下降,那么如果這一切都按照蘇世民團隊預期的那樣發展,這意味著銷量將真正達到巨大的規模。有了這樣的增長,許多供應商就有了足夠的競爭和利潤空間。
GPU市場規模高速增長
(一)圖形處理市場GPU市場規模穩固增長
目前來看,游戲產業發展已進入存量市場時代。2022年中國游戲市場銷售收入2658.84億元,同比下降10.33%;用戶規模6.64億,同比下降0.33%。但隨著游戲玩家對游戲畫質、圖像幀率等需求的不斷提升,需要高性能 GPU 在特殊渲染算法等方面提供支持,圖形處理器在游戲端仍將占有較大份額。
在專業圖形渲染領域,國內建筑設計、工業設計、影視動畫、虛擬現實等應用專業圖形渲染技術的細分領域正在蓬勃發展。作為專業圖形渲染核心工具,2022 年國內圖形設計/編輯/渲染軟件市場規模達到536.99億元,預計2023-2030年復合增長率為9.62%,據此測算國內 2030年該市場規模將達到1120億元左右。圖形設計/編輯/渲染軟件借助高性能 GPU 提升圖形處理能力,以支撐渲染技術的應用,以及高清晰畫質、多幀率圖像的呈現。
(二)大規模擴展計算能力的高性能計算市場爆發
隨著大數據時代的到來,GPU 在并行計算方面的性能優勢逐步顯現,GPGPU應運而生。GPGPU 作為運算協處理器,針對不同應用領域的需求,增加了專用向量、張量、矩陣運算指令,提升了浮點運算的精度和性能,其產品技術特性已經超過傳統圖形處理的應用范疇,在數據中心、人工智能、自動駕駛等高性能計算領域發揮重要作用。
根據《中國算力發展指數白皮書(2022 年)》,2021 年國內基礎設施算力規模達到 140 EFLOPS,位居全球第二,已經投入運行的人工智能計算中心近 20個,在建設的人工智能計算中心超20個。根據工信部《新型數據中心發展三年行動計劃(2021-2023)》和《“十四五”信息通信行業發展規劃》的目標,2023 年我國數據中心總算力將超過 200 EFLOPS,2025 年進一步提升至300 EFLOPS。GPU 作為實現算力的基礎硬件之一,在數據中心建設和部署過程中具有廣泛的配套需求。
在數據中心領域,作為算力的物理承載,國內數據中心持續建設與擴容,推動數據中心總機架數連年增長。2018-2022年總機架數由 166 萬架增至650萬架,近5年年均增速超過30%。預計2025年大型及以上數據中心機架數量將達到802萬個,相應的算力規模持續擴大。
在人工智能領域,隨著算法發展的突飛猛進,人工智能模型訓練需要巨量算力支撐才能快速有效實施,不斷增加的數據量也要求算力同步進化,使得算力成為人工智能技術突破的關鍵因素:作為生成式 AI 的典型應用,ChatGPT 引領人工智能技術變革,其大模型的特點帶來了陡增的算力需求。作為算力的硬件基礎,當前主流 AI 芯片包括 GPU、FPGA、ASIC 等。
2021年國內 AI 芯片市場規模達到 426.8 億元,受益于算力需求的爆發式增長,預計 2025年市場規模將達到 1,780 億元。Al服務器通常搭載GPU、FPGA、ASIC等加速芯片,利用CPU與加速芯片的組合可以滿足高吞吐量互聯的需求,為自然語言處理、計算機視覺、機器學習等Al應用場景提供強大的算力支持,支撐Al算法訓練和推理過程。根據 IDC 數據,2021年國內服務器市場按加速卡類型劃分市場份額中,GPU 占比為91.9%,系服務器市場按加速卡的主要產品類型,可以預見 GPU市場的巨大市場空間。
在自動駕駛領域, 2022年全球自動駕駛汽車市場規模為241 億美元,預計 2026 年將達到 619 億美元,年復合增長率為 20.75%。高級駕駛輔助系統(ADAS)作為實現自動駕駛的重要技術基礎,利用 GPU 的并行計算能力實時分析來自激光雷達、毫米波雷達和紅外攝像頭的傳感器數據,其大規模推廣將帶動高性能 GPU 的應用需求。
英偉達迎來更多挑戰者
而在英偉達的身后,有許多年輕的初創公司正在奮力奔跑,有的不斷推出號稱超過英偉達GPU的產品,有的則瞄準了英偉達的CUDA編程平臺。
據The Information,2017年至少有十幾家初創公司試圖挑戰英偉達在AI芯片領域的地位,但經歷了市場的一輪洗牌之后,該倒閉的倒閉,該換血的換血。
當時比較受關注的兩家公司,KnuEdge和Reduced Energy Microsystems雙雙倒閉。Wave Computing在2020年申請破產,次年以新名稱MIPS東山再起。據科技網站The Register報道,另一家AI芯片初創公司Mythic的前工程副總裁在領英上寫道,該公司已于去年耗盡現金。今年早些時候,Mythic宣布任命新首席執行官,并獲得了1300萬美元融資。
在現存的早期AI芯片初創企業中,Cerebras生產的大規模AI芯片整合了英偉達GPU的許多處理能力,而SambaNova Systems似乎是早期最有能力挑戰英偉達的公司。上一輪融資熱潮中,這兩家公司和Graphcore一起以數十億美元的估值進行了幾輪大型融資。
這輪市場大清洗告訴后來者,初創企業正面臨著高昂的成本和競爭風險。
更重要的是,盡管最近投資者對AI充滿熱情,但初創公司面臨的融資環境比上一代更為嚴峻。風險投資、私募股權和并購數據庫PitchBook的數據顯示,今年上半年,AI芯片初創公司獲得的風險投資僅略高于10億美元,作為比較,2021年的融資額高達95億美元。
此外,這些初創公司還面臨著進入停滯階段的技術復雜性和高昂成本挑戰,還需要將設計完成并交付給臺積電等制造商盡快投產。盡管如此,創始人和投資者都認為,生成式AI將使計算領域產生翻天覆地的變化,這足以使他們從英偉達身上分一杯羹。
國內GPU企業也在發力
國際大廠競爭的同時,本土GPU廠商也在積極行動。事實上,本輪市場下行對本土GPU廠商來說,既有壓力也是機遇。在“東數西算”工程的支持下,近年來國內涌現出一批GPU企業。2022年12月20日,天數智芯舉行發布通用GPU推理產品“智鎧100”。根據天數智芯產品線總裁鄒翾介紹,智鎧100產品卡,可提供最高384TOPS@int8、96TFlops@FP16、24TFlops@FP32的峰值算力,相較于市場上現有主流產品,智鎧100將提供2-3倍的實際使用性能。而此前,壁仞科技發布的通用GPU BR100,16位浮點算力達到1000T以上、8位定點算力達到2000T以上。芯動科技發布的“風華2號”GPU,像素填充率達48GPixel/秒,FP32浮點算力1.5TFLOPS,性能領跑國產桌面、筆記本電腦和工控機賽道。
對此,芯動科技首席GPU科學家楊喜樂指出,現代GPU的涉及面廣泛開發應用方面有很多技術壁壘,對開發團隊能力要求很高;要拿出一款對標行業先進水平且流暢兼容各種應用的圖形GPU,需要具有跨多領域平臺能力和大量流片交付經驗的復合型技術團隊,要不斷進行GPU底層技術、算法架構和軟硬件創新。GPU行業已經形成穩定的壟斷格局,市場下行對本土GPU廠商來說,必將承受更多壓力,但也將為本土GPU廠商提供新的發展機遇。
