RM新时代网站-首页

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

AMD與Nvidia的人工智能芯片之戰(zhàn)

SSDFans ? 來源:hpcwire ? 2024-01-16 11:02 ? 次閱讀

AMD和Nvidia陷入了一場人工智能性能之戰(zhàn)——就像兩家公司幾十年來在游戲GPU性能上的競爭一樣。

AMD聲稱其新的Instinct MI300X GPU是世界上最快的人工智能芯片,擊敗了Nvidia炙手可熱的H100和即將推出的H200 GPU。AMDCEO Lisa Su最近在一個人工智能活動上發(fā)表演講時表示:“這是世界上性能最高的生成式人工智能加速器?!?/p>

這標志著MI300X的正式推出,它是MI300A的一個更強大的版本,將用于Lawrence Livermore國家實驗室建造的代號為El Capitan的200億次超級計算機。

MI300X基于CDNA3架構,可為FP16和BFLoat16等關鍵AI數(shù)據(jù)類型提供三倍以上的性能。該芯片有1530億個晶體管,采用3D封裝;內(nèi)部使用了5納米和6納米工藝制造的芯片模塊。該芯片擁有304個GPU計算單元,192GB HBM3內(nèi)存,5.3 TB/s內(nèi)存帶寬。

MI300X的峰值FP32性能為163.4 teraflops,峰值FP64性能為81.7 teraflops。上一代MI250X的峰值單精度(FP32)矢量和雙精度(FP64)矢量性能為47.9 teraflops。AMD還將其芯片與H100的SXM版本進行了比較,Nvidia H100 SXM可提供68 teraflops的峰值FP32性能和34 teraflops的FP64性能。H100 NVL模型在性能上縮小了差距,可提供134teraflops的FP32性能和68teraflops的FP64性能。

Nvidia即將推出的H200是H100的內(nèi)存升級版本,但內(nèi)存和帶寬仍然比MI300X少。H200的GPU內(nèi)存為141GB,帶寬為4.8TB/s。

“對于MI300X,我們增加了更大的靈活性、更大的內(nèi)存容量和更大的帶寬。這意味著它的內(nèi)存容量是競爭對手的2.4倍,內(nèi)存帶寬是1.6倍?!盨u將MI300X與Nvidia的H100 SXM型號進行了比較,后者具有80GB的HBM內(nèi)存和3.35TB/s的內(nèi)存帶寬。two-pieceH100 NVL型號的HBM3內(nèi)存為188GB,但內(nèi)存帶寬為7.8TB/s,超過了MI300X。

AMD能保持這個頭銜多久還有待觀察。Nvidia正計劃對其芯片進行年度升級,新的B100 GPU將于2024年推出,X100 GPU將于2025年推出。

AMD在短短一年的時間里取得了長足的進步。一年前,當ChatGPT出現(xiàn)時,AMD措手不及。聊天機器人推動Nvidia成長為一家價值數(shù)萬億美元的公司,A100和H100 GPU成為最熱門的科技資產(chǎn)。

GPT-4背后的Nvidia硬件憑借一己之力推動了人工智能的采用,并且仍然是無可爭議的人工智能冠軍。但Nvidia的硬件短缺促使客戶尋找替代品,并為AMD提供了一個展示其最新GPU和系統(tǒng)的機會,成為一個可行的替代品。除了Nvidia,AMD在市場上也有很多機會。

Su表示:“我們現(xiàn)在預計,數(shù)據(jù)中心加速器TAM在未來四年中將以每年超過70%的速度增長,到2027年將超過4000億美元?!?/p>

MI300X芯片有1530億個晶體管,有12個5納米和6納米芯片?!八褂昧耸澜缟献钕冗M的封裝?!盡I300X在基礎層有四個IO芯片。每個IO芯片都有256兆字節(jié)的 Infinity Cache 和下一代IO,如128通道HBM3接口,支持PCIe Gen5,以及連接多個MI300X的第四代Infinity Fabric。該芯片在IO芯片上堆疊了8個CDNA3加速器小芯片。304個計算單元通過密集的TSV連接。支持高達每秒17TB的帶寬。該芯片連接了8層HBM3,總共有192GB的內(nèi)存和5.3 TB/s的帶寬。

云供應商微軟、甲骨文和Meta已經(jīng)在他們的云基礎設施中部署了MI300X GPU,盡管這些公司的人工智能能力主要還是來自Nvidia的芯片。提供人工智能替代方案的云供應商是很普遍的,如亞馬遜提供了各種選擇,包括其新發(fā)布的Trainium2芯片和英特爾的Gaudi處理器。其意圖也很明確:讓客戶有更多的選擇,不必屈服于NvidiaH100芯片的天價。

微軟CEO Kevin Scott在AMD活動臺上表示:“現(xiàn)在看到GPT-4在MI300X上的應用,看到Llama的表現(xiàn),并讓它投入生產(chǎn),令人非常興奮?!奔坠俏脑埔矊I300X放入其云服務中。它還與Naveen Rao等早期采用者合作,后者的人工智能服務公司MosaicML最近被Databricks以13億美元收購。

據(jù)HPCwire報道,一家新的云服務公司TensorWave將在2024年推出一種新的可擴展和適應性強的GPU架構?;贕igaIO FabreX可組合PCIe技術,TensorNODE系統(tǒng)將支持多達5,760個Instinct MI300X GPU,并為所有GPU提供單個FabreX內(nèi)存結(jié)構域。

AMD緊隨Nvidia的腳步,也宣布了自己的服務器架構,展示了一個兼容開放計算項目的服務器設計,其中包含8個MI300X GPU,這些GPU通過Infinity Fabric相互連接。該板可以放入任何兼容OCP的開放藍圖中,客戶可以在其上構建服務器。

“我們這么做是經(jīng)過深思熟慮的。我們想讓客戶盡可能容易地采用它,這樣你就可以把主板拿出來,放入MI300X Instinct平臺。”這樣的系統(tǒng)建造起來會更便宜,讓客戶可以靈活地以最優(yōu)惠的價格購買硬件。與Nvidia相比,這是一種截然不同的方法,Nvidia的HGX系統(tǒng)基于專有架構,成本很高。

AMD讓MI300X兼容OCP的計劃已經(jīng)取得了成效,Meta快速部署了帶有該GPU的服務器。Meta高級工程總監(jiān)Ajit Mathews表示:“MI300X利用了OCP模塊、標準和平臺,這有助于我們極短的時間內(nèi)采用它。事實上,MI300X是Meta歷史上最快的部署解決方案之一?!?/p>

AMD對硬件的關注破壞了該公司的人工智能軟件戰(zhàn)略,該戰(zhàn)略落后于提供CUDA開發(fā)框架的Nvidia。CUDA的支持幫助推動了NvidiaGPU的廣泛采用。

該公司即將發(fā)布下一代ROCm 6,并聲稱具有新的功能和性能優(yōu)勢。開發(fā)者George Hotz曾批評AMD缺乏軟件支持、文檔以及對GPU開發(fā)者的支持回應。AMD總裁彭于平表示,與上一代版本相比,ROCm 6的MI300X性能提高了8倍。

對于具有700億個參數(shù)的大型語言模型,ROCm6比MI300X快8倍,比MI250快8倍。ROCm 6框架將支持新的數(shù)據(jù)類型,包括FP16,這將提高性能并開放內(nèi)存資源和帶寬。該框架還將進行許多低層次優(yōu)化,以獲得更好的AI性能。

審核編輯:黃飛

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • amd
    amd
    +關注

    關注

    25

    文章

    5466

    瀏覽量

    134087
  • NVIDIA
    +關注

    關注

    14

    文章

    4978

    瀏覽量

    102987
  • gpu
    gpu
    +關注

    關注

    28

    文章

    4729

    瀏覽量

    128890
  • 人工智能
    +關注

    關注

    1791

    文章

    47183

    瀏覽量

    238247
  • ChatGPT
    +關注

    關注

    29

    文章

    1558

    瀏覽量

    7595

原文標題:AMD MI300X GPU能否擊敗Nvidia H200?

文章出處:【微信號:SSDFans,微信公眾號:SSDFans】歡迎添加關注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關推薦

    蘋果或與博通攜手研發(fā)人工智能芯片

    據(jù)消息人士透露,蘋果公司正在與博通公司攜手研發(fā)一款人工智能芯片,并計劃于2026年啟動生產(chǎn)。蘋果的高級機器學習和人工智能總監(jiān)Benoit Dupin最近表示,該公司正在考慮使用亞馬遜最新的人工
    的頭像 發(fā)表于 12-12 14:01 ?151次閱讀

    嵌入式和人工智能究竟是什么關系?

    嵌入式和人工智能究竟是什么關系? 嵌入式系統(tǒng)是一種特殊的系統(tǒng),它通常被嵌入到其他設備或機器中,以實現(xiàn)特定功能。嵌入式系統(tǒng)具有非常強的適應性和靈活性,能夠根據(jù)用戶需求進行定制化設計。它廣泛應用于各種
    發(fā)表于 11-14 16:39

    Untether發(fā)布人工智能(AI)芯片

    初創(chuàng)企業(yè)Untether發(fā)布了一款專為汽車、農(nóng)業(yè)裝備及極端環(huán)境AI應用設計的人工智能(AI)芯片。   相較于英偉達和AMD的旗艦AI芯片,它們主要服務于需要數(shù)千乃至數(shù)萬個
    的頭像 發(fā)表于 10-29 13:59 ?326次閱讀

    《AI for Science:人工智能驅(qū)動科學創(chuàng)新》第6章人AI與能源科學讀后感

    幸得一好書,特此來分享。感謝平臺,感謝作者。受益匪淺。 在閱讀《AI for Science:人工智能驅(qū)動科學創(chuàng)新》的第6章后,我深刻感受到人工智能在能源科學領域中的巨大潛力和廣泛應用。這一章詳細
    發(fā)表于 10-14 09:27

    《AI for Science:人工智能驅(qū)動科學創(chuàng)新》第一章人工智能驅(qū)動的科學創(chuàng)新學習心得

    周末收到一本新書,非常高興,也非常感謝平臺提供閱讀機會。 這是一本挺好的書,包裝精美,內(nèi)容詳實,干活滿滿。 《AI for Science:人工智能驅(qū)動科學創(chuàng)新》這本書的第一章,作為整個著作的開篇
    發(fā)表于 10-14 09:12

    risc-v在人工智能圖像處理應用前景分析

    長時間運行或電池供電的設備尤為重要。 高性能 : 盡管RISC-V架構以低功耗著稱,但其高性能也不容忽視。通過優(yōu)化指令集和處理器設計,RISC-V可以在處理復雜的人工智能圖像處理任務時表現(xiàn)出色。 三
    發(fā)表于 09-28 11:00

    名單公布!【書籍評測活動NO.44】AI for Science:人工智能驅(qū)動科學創(chuàng)新

    芯片設計的自動化水平、優(yōu)化半導體制造和封測的工藝和水平、尋找新一代半導體材料等方面提供幫助。 第6章介紹了人工智能在化石能源科學研究、可再生能源科學研究、能源轉(zhuǎn)型三個方面的落地應用。 第7章從環(huán)境監(jiān)測
    發(fā)表于 09-09 13:54

    報名開啟!深圳(國際)通用人工智能大會將啟幕,國內(nèi)外大咖齊聚話AI

    8月28日至30日,2024深圳(國際)通用人工智能大會暨深圳(國際)通用人工智能產(chǎn)業(yè)博覽會將在深圳國際會展中心(寶安)舉辦。大會以“魅力AI·無限未來”為主題,致力于打造全球通用人工智能領域集產(chǎn)品
    發(fā)表于 08-22 15:00

    FPGA在人工智能中的應用有哪些?

    FPGA(現(xiàn)場可編程門陣列)在人工智能領域的應用非常廣泛,主要體現(xiàn)在以下幾個方面: 一、深度學習加速 訓練和推理過程加速:FPGA可以用來加速深度學習的訓練和推理過程。由于其高并行性和低延遲特性
    發(fā)表于 07-29 17:05

    Python中的人工智能框架與實例

    人工智能(AI)領域,Python因其簡潔的語法、豐富的庫和強大的社區(qū)支持,成為了最受歡迎的編程語言之一。本文將詳細介紹Python中的人工智能框架,并通過具體實例展示如何使用這些框架來實現(xiàn)不同的人工智能應用。
    的頭像 發(fā)表于 07-15 14:54 ?1712次閱讀

    5G智能物聯(lián)網(wǎng)課程之Aidlux下人工智能開發(fā)(SC171開發(fā)套件V2)

    人工智能 工業(yè)檢測:芯片模組外觀檢測實訓part1 11分40秒 https://t.elecfans.com/v/25609.html *附件:芯片模組外觀檢測實訓.pdf 人工智能
    發(fā)表于 05-10 16:46

    5G智能物聯(lián)網(wǎng)課程之Aidlux下人工智能開發(fā)(SC171開發(fā)套件V1)

    https://t.elecfans.com/v/27186.html *附件:引體向上測試案例_20240126.pdf 人工智能 工業(yè)檢測:芯片模組外觀檢測實訓part1 11分40秒 https
    發(fā)表于 04-01 10:40

    嵌入式人工智能的就業(yè)方向有哪些?

    嵌入式人工智能的就業(yè)方向有哪些? 在新一輪科技革命與產(chǎn)業(yè)變革的時代背景下,嵌入式人工智能成為國家新型基礎建設與傳統(tǒng)產(chǎn)業(yè)升級的核心驅(qū)動力。同時在此背景驅(qū)動下,眾多名企也紛紛在嵌入式人工智能領域布局
    發(fā)表于 02-26 10:17

    AMD上調(diào)人工智能芯片銷售預期至35億美元以上

    AMD發(fā)布了最新的財報,調(diào)高了人工智能芯片業(yè)務的業(yè)績預期。根據(jù)預測,AMD預計2024年的銷售額將增長75%,達到超過35億美元。
    的頭像 發(fā)表于 01-31 15:40 ?638次閱讀

    NVIDIA 人工智能開講 | 什么是 AI For Science?詳解 AI 助力科學研究領域的新突破

    NVIDIA 中國推出的人工智能類音頻節(jié)目再次開講啦,在這里,你將與 NVIDIA 共同見證人工智能的磅礴力量與無限可能! 如果你也想度過科技相伴的時光,趕快在“ 喜馬拉雅FM ”
    的頭像 發(fā)表于 12-25 18:30 ?997次閱讀
    <b class='flag-5'>NVIDIA</b> <b class='flag-5'>人工智能</b>開講 | 什么是 AI For Science?詳解 AI 助力科學研究領域的新突破
    RM新时代网站-首页