亚洲国产综合精品一区,综合伊人久久在,久久高清内射无套,天堂√在线中文官网在线,亚洲—本道中文字幕东京热,亚洲高清专区日韩精品,超碰免费公开,国内免费久久久久久久久
歡迎訪問深圳市中小企業公共服務平臺電子信息窗口

全球首款 3D 晶圓級封裝處理器 IPU 發布,突破 7nm 制程極限

2022-03-07 來源:互聯網
7368

關鍵詞: 處理器 IPU

上周四,總部位于英國的 AI 芯片公司 Graphcore 發布了新一代 IPU 產品 Bow,這是其第三代 IPU 系統,發布即面向客戶發貨。與上一代 IPU 相比,Bow IPU 性能提升 40% ,能耗比提升了 16%,電源效率也提升 16%。

值得注意的是,這一次 Bow IPU 的性能提升并非主要依賴采用更先進的制程,Bow IPU 采用了和上一代 IPU 相同的臺積電 7nm,通過采用和臺積電共同開發的先進硅晶圓堆疊技術(3D Wafer-on-Wafer)達到性能和能耗比的提升。


Bow 作為世界首款 3D WoW 處理器,證明了芯片性能提升的范式從先進制程向先進封裝轉移的可行性。


 


新一代 IPU 性能提升 40%,價格保持不變


2016 年,Graphcore 成立并開創了全新類型處理器架構 IPU,因其在架構上的創新曾被英國半導體之父 Hermann Hauser 稱之為是計算機歷史上的第三次革命。


經歷 6 年時間的發展,Graphcore 的 IPU 逐漸在在金融、醫療、電信、機器人、云和互聯網等領域取得成效。本周四,Graphcore 又推出了第三代產品 Bow IPU。


據 Graphcore 介紹,第三代 IPU 相對于上一代 M2000,性能提高 40%,每瓦性能提升 16%,即能耗比實現 16% 的提升。不過,AI 芯片的真實性能還需要放在不同的應用領域中討論。為此,Graphcore 也給出了在不同垂直領域中 Bow 的性能表現。


 


在圖像方面,無論是典型的 CNN 網絡,還是近期比較熱門的 Vision Transformer 網絡,以及深層次的文本到圖片的網絡,與上一代產品相比,Bow IPU 都有 30% 到 40% 的性能提升,在 EfficientNet-B4 這一項中,接近理論上限值。


BERT 訓練模型是自然語言方面的經典模型,基于 BERT,OpenAI 提出了 GPT-1、GPT-2、GPT-3 等縱向擴展或橫向擴展,通過更深的網絡層次和更寬的網絡寬度讓模型的性能和精度進一步提高。


“我們可以看到,這些模型在我們最新的硬件形態上都有很大的性能提升。”Graphcore 中國工程副總裁、AI 算法科學家金琛介紹道。


 


不僅如此,轉換到實際模型中的吞吐量,與 IPU POD64 相比,在計算機視覺的 ResNet50 和 EifficientNet-B4 訓練模型中,Bow Pod64 的吞吐量能夠達到 34% 和 39% 的性能提升。自然語言方面,BERT-Large Ph1 預訓練模型和語音識別 Conformer Large 訓練模型,后者都有 36% 的吞吐量提升。


 


作為英偉達的競爭對手,Graphcore 自然不忘將 Bow Pod16 與 DGX-A100 進行對比,實驗數據表明,EfficientNet-B4 的 backbone 的訓練在 DGX-A100 上需要花費 70 個小時的訓練時間,而在 Bow Pod16 上,只需要 14 小時左右。


接近理論極限的性能提升,Graphcore Bow IPU 是如何實現的?


5nm 不再是首選,采用先進封裝性價比更高


從芯片的規格上看,Bow IPU 是世界上第一款基于臺積電的 3D Wafer-On-Wafer 的處理器,單個封裝中擁有超過 600 億個晶體管,具有 350 TeraFLOPS 的人工智能計算的性能,是上一代 MK2 IPU 的 1.4 倍。片內存儲較上一代來看沒有變化,依然保持 0.9GB 的容量,不過吞吐量從 47.5TB 提高到了 65TB。


 


“變化主要體現在,它是一個 3D 封裝的處理器,晶體管的規模有所增加,算力和吞吐量均得到提升。”Graphcore 大中華區總裁兼全球首席營收官盧濤說道。而在大家都關注的工藝制程上,Bow IPU 延續了上一代臺積電 7nm 工藝制程,沒有變化。


理論上,一顆芯片的性能提升很大程度上取決于工藝制程上的進步,但隨著工藝制程越來越逼近物理極限,摩爾定律逐漸失效,業界不得不尋找新的技術方向來延續摩爾定律。其中,3D 封裝就是被業界廣泛看好的技術方向。

中國工程院院士、浙江大學微納電子學院院長吳漢明就曾在一次演講中提到,如果將芯片制造和芯片封裝相結合,也可以做到 65nm 工藝制程實現 40nm 工藝制程的性能功耗要求。


Bow IPU 正好驗證了吳院士的觀點。


盧濤表示,Bow IPU 產品性能的提升主要來源于 3D WoW 和新增的 Die。


至于為何選擇改變封裝方式而不是更先進的工藝,盧濤則表示 MK2 IPU 有 594 億個晶體管,大概 823 平方毫米,已經是 7nm 單個 Die 能夠生產的最精密的芯片。


“我們評估從 7nm、5nm,到 3nm 等不同工藝節點的收益時發現,從 7nm 到 5nm 的生產工藝提升所帶來的收益不像以前從 28nm 到 14nm 一樣,能夠帶來百分之幾十的收益,而是降到了 20%。這時候我們可以通過別的手段和方法獲得同樣的收益。”


通過 3D 堆疊的方式,Bow IPU 的兩個 Die 增加了晶體管的數量,其中一個 Die(Colossus Die)和上一代一樣,另一個 Die 主要用于提高跨 Colossus Die 的電源功率傳輸,優化 Colossus Die 的操作節點,從而轉化為有效的時鐘加速。


在同臺積電的合作方面,盧濤告訴雷峰網,Graphcore 在一年之前就同臺積電合作了一顆測試芯片,與臺積電的關系非常緊密,加上 AI 處理器本身規模較大,需要一些新技術支持落地,而從臺積電的角度而言,新的技術也需要有需求的產品共同推進。


值得一提的是,雖然封裝方式有所變化,但 Bow IPU 開箱即用,與前一代產品百分之百軟件兼容,不用修改任何代碼,老用戶無需做任何軟件適配工作就能獲得性能提升,價格保持不變。


目前,美國國家實驗室 Pacific Northwest 已經基于 Bow IPU 嘗試做一些基于 Transformer 的模型以及圖神經網絡,面向計算化學和網絡安全方面的應用,且給出了比較正面的反饋。


延續 3D 封裝,開發超越人腦的超級智能機器


Bow IPU 使用 3D 封裝只是起點,面向未來,Graphcore 正在開發一款可以用來超越人腦處理的超級智能機器。


Graphcore 將這款正在研發的產品命名為 Good Computer,一方面希望計算機能夠為這個世界帶來正面的影響,另一方面致敬著名計算機科學家 Good。


 


基于 3D WoW,預計未來 Good Computer 將包含 8192 個 IPU,提供超過 10 Exa-Flops 的 AI 算力,實現 4 PB 的存儲,可以助力超過 500 萬億參數規模的人工智能模型的開發。


取決于不同的配置,Good Computer 價格將在 100 萬美元到 1.5 億美元之間。


盧濤表示,開發 Good Computer 還是會沿用 IPU 的體系結構,IPU 的存儲是在處理器里面,雖然不叫類腦、內存計算或存算一體,但從某種程度上而言,IPU 的運作機理接近大腦計算的工作原理,只是把計算和存儲相結合。


另外,Graphcore 也將從軟件方面更有效支持稀疏化以達到類腦的計算量。



主站蜘蛛池模板: 日韩人妻中文无码一区二区三区| 双腿张开被9个男人调教| 亚洲精品久久国产高清| 国产精品a国产精品a手机版 | 高潮毛片无遮挡高清视频播放| 国产成人综合亚洲亚洲国产第一页| 看国产一毛片在线看手机看| 亚洲精品字幕| 国产女精品视频网站免费| 久久午夜夜伦鲁鲁片免费无码影院| 久热这里只精品99国产6-99re视…| 亚洲爆乳精品无码一区二区三区 | 亚洲国产日韩在线人高清| 国产精品一区二区含羞草| 99精品偷自拍| 久久久久77777人人人人人 | 国产精品日日做人人爱| 双腿张开被9个男人调教| 亚洲高清成人aⅴ片777| 欧美人成视频在线视频| 久久天堂av女色优精品| 成年动漫18禁无码3d动漫| 67pao国产成视频永久免费| 免费中文熟妇在线影片| 亚洲欧美另类成人综合图片| 一本大道无码日韩精品影视丶| 夜夜添狠狠添高潮出水| 98国产精品综合一区二区三区 | 欧美牲交videossexeso欧美| 国产极品美女到高潮| 四库影院永久国产精品| 丰满人妻一区二区三区无码av| 亚洲色成人一区二区三区| 久久久噜噜噜久久熟女aa片| 中文字幕日韩精品一区二区三区| 蜜桃视频一区二区三区在线观看| 国产精品自在拍一区二区不卡| 青青草99久久精品国产综合| 熟女人妻高清一区二区三区| 久久香蕉综合色一综合色88 | 成人无码区免费视频网站|