拳打亞馬遜、腳踢谷歌TPU 微軟發布新一代AI加速器Maia 200
來源:財聯社
財聯社1月27日訊(編輯 史正丞)繼去年底谷歌、拳打器亞馬遜先后發布自研算力芯片后,亞馬同為全球云計算“三巨頭”的遜腳新代微軟終于在本周“交卷”——傳聞已久的Maia 200芯片正式面世。
微軟在公告中表示,踢谷這款“為推理而生”的微軟芯片在多項測試中超越亞馬遜的第三代Trainium和谷歌第七代TPU。因此,發布微軟將Maia 200公開稱為“所有超大規模云服務商中性能最強的加速自研芯片”。
(來源:公司官網)據公司介紹,Maia 200采用臺積電3nm工藝制造,亞馬內建原生FP8/FP4張量核。遜腳新代每顆芯片包含超過1400億個晶體管,踢谷專為大規模AI工作負載量身打造,微軟特別是發布采用低精度計算的最新一代AI大模型。
微軟披露,加速單顆Maia 200芯片在4位精度(FP4)可提供超過10 PetaFLOPS的拳打器算力,在8位精度(FP8)下也能超過5 PetaFLOPS,而且整個SoC的熱設計功耗能夠控制在750W以內。科技巨頭強調,在實際運行中,單塊Maia 200就能輕松運行當今最大的AI模型,同時還為未來更大型的模型留有余量。
除了芯片本身的算力外,微軟也在存儲參數上猛“堆料”。公司披露,Maia 200配備216GB、帶寬達7TB/s的HBM3e,以及272MB的片上SRAM。在拓展層面,每塊芯片提供2.8TB/s的雙向專用擴展帶寬,支持在6144個加速器集群中提供可預測的高性能集合操作。
因此,微軟芯片在“跑分”上贏過另外兩家競品也在情理之中。微軟在公告中表示,Maia 200的FP4性能是亞馬遜第三代Trainium的3倍有余,且在FP8性能上超越谷歌第七代TPU。

除了性能外,作為云服務商的自研芯片,省錢也是一項關鍵指標。微軟透露,Maia 200是公司迄今部署過的效率最高推理系統,其“每美元性能”相比當前機群中最新一代硬件提升了30%。
作為云服務商競相推出自研芯片的背景,隨著AI服務日漸成熟,推理成本已經成為整體運營中日益重要的部分,促使云服務供應商關注如何單獨為這塊需求提供更具性價比的方案,特別是要比英偉達GPU更具性價比。本質上,微軟、谷歌和亞馬遜發布的自研芯片,都是在承擔原本需要英偉達GPU處理的計算任務,從而降低整體成本。
非常有趣的是,微軟似乎不止“優化”了英偉達的芯片。公司披露,每臺Maia 200服務器中包含4塊芯片,依靠以太網連接,而不是InfiniBand標準。而InfiniBand交換機正是英偉達在2020年收購Mellanox后所銷售的產品。
微軟透露,目前正在為美國中部地區的數據中心配備最新款芯片,之后會在更多地點部署。目前尚不清楚Azure云服務的用戶何時能使用搭載該芯片的服務器。
微軟此前也表示,已經在設計該芯片的后續產品Maia 300。科技巨頭也與OpenAI達成協議,可以使用初創公司的芯片設計。