生成式AI火爆全球之后,英偉達(dá)的AI芯片一張難求,就在英偉達(dá)重量級(jí)選手H100 AI芯片目前依然是一貨難求的情況下,英偉達(dá)推出新款A(yù)I芯片H200。
H100目前算是算力市場(chǎng)硬通貨,而H200則更強(qiáng)大,也是H100的升級(jí)版,號(hào)稱性能飆升90%;全球最強(qiáng) AI 芯片。
據(jù)英偉達(dá)的消息,H200擁有141GB的內(nèi)存、4.8TB/秒的帶寬,并將與H100相互兼容,推理速度幾乎達(dá)到H100的兩倍。H200預(yù)計(jì)將于明年二季度開(kāi)始交付。
H200將在深度學(xué)習(xí)和大型語(yǔ)言模型(LLM)方面發(fā)揮更重要的作用,比如 OpenAI 的 GPT-4的訓(xùn)練。H200芯片相比上一代H100有了顯著的飛躍,將被用于數(shù)據(jù)中心和超級(jí)計(jì)算機(jī),處理諸如天氣和氣候預(yù)測(cè)、藥物發(fā)現(xiàn)、量子計(jì)算等任務(wù)。
H200芯片基于英偉達(dá)的“Hopper”架構(gòu)的 HGX H200 GPU,也是英偉達(dá)第一款使用 HBM3e 內(nèi)存的芯片,這種內(nèi)存速度更快,容量更大,因此更適合大型語(yǔ)言模型。英偉達(dá)稱:“借助 HBM3e,英偉達(dá) H200 以每秒 4.8 TB 的速度提供 141GB 的內(nèi)存,與 A100 相比,容量幾乎是其兩倍,帶寬增加了 2.4 倍?!?在人工智能方面,英偉達(dá)表示,HGX H200 在 Llama 2(700 億參數(shù) LLM)上的推理速度比 H100 快了一倍。HGX H200 將以 4 路和 8 路的配置提供,與 H100 系統(tǒng)中的軟件和硬件兼容。
H200在大模型Llama 2、GPT-3.5的輸出速度上分別是H100的1.9倍和1.6倍。而在高性能計(jì)算HPC方面的速度更是達(dá)到了雙核x86 CPU的110倍。
H200的價(jià)格目前可能并不是最關(guān)心的,能不能拿到貨才是關(guān)鍵,當(dāng)然目前英偉達(dá)也沒(méi)有公布價(jià)格。
此外還會(huì)有下一代升級(jí)版的Blackwell B100 GPU也在路上。
有數(shù)據(jù)稱英偉達(dá)的H100的嚴(yán)重缺貨問(wèn)題至少會(huì)持續(xù)到2024年底?,F(xiàn)在推出H200可能會(huì)占用一部分的產(chǎn)能,當(dāng)然有會(huì)有一部分客戶轉(zhuǎn)投H200。這次英偉達(dá)推出新款A(yù)I芯片H200估計(jì)又是要賣(mài)斷貨的節(jié)奏。
但是10月份美國(guó)商務(wù)部工業(yè)和安全局(BIS)發(fā)布了針對(duì)芯片的出口管制新規(guī),對(duì)高算力的AI芯片進(jìn)行了更嚴(yán)格的管控。
所以不出意外的是,估計(jì)英偉達(dá)最強(qiáng)AI 芯片 H200還是會(huì)被美國(guó)限制進(jìn)入我國(guó)市場(chǎng),或者即使進(jìn)入也是閹割版,而英偉達(dá)并不想放棄中國(guó)市場(chǎng) ,所以也會(huì)針對(duì)性的推出滿足法規(guī)的改良版AI芯片,不止是英偉達(dá);英特爾也計(jì)劃推出改良版。
此前,英偉達(dá)A100及H100兩款型號(hào)被限制出口中國(guó)后,為中國(guó)專供的“閹割版”的A800和H800就是為了符合規(guī)定。
有消息報(bào)道稱英偉達(dá)的改良版AI芯片由H100改良而來(lái),HGX H20、L20 PCle和L2 PCle這三款改良版AI芯片很快就會(huì)發(fā)布。但是預(yù)測(cè)理論上整體算力要比英偉達(dá) H100 GPU芯片降80%左右。
-
英偉達(dá)
+關(guān)注
關(guān)注
22文章
3770瀏覽量
90985 -
AI芯片
+關(guān)注
關(guān)注
17文章
1879瀏覽量
34990 -
LLM
+關(guān)注
關(guān)注
0文章
286瀏覽量
327
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論