新时代rm平台入口,RM新时代官方网站|首入球时间

10月17日晚間消息，美國商務(wù)部延長了在2022年10月首次實(shí)行的全面出口管制，將收緊對尖端人工智能芯片的出口管制。

在新規(guī)下，英偉達(dá)旗下先進(jìn)的GPU、顯卡等將被禁止向中國市場出售，其中還包含了A800和H800這樣專門為中國市場定制的芯片。AMD、英特爾等芯片巨頭的高性能芯片也將被限制向中國出口。

此次美國出口管制規(guī)則更新后，還擴(kuò)大了芯片制造工具出口限制清單，中國的兩家國產(chǎn)GPU制造商——摩爾線程、壁仞科技被列入“實(shí)體清單”。

業(yè)內(nèi)認(rèn)為，此次禁售意味著美方試圖對我國算力發(fā)展作進(jìn)一步遏制，同時也對模型端發(fā)展有所限制，因此國產(chǎn)GPU廠商需要加速發(fā)展。

、

AI時代漸近，GPU需求的高速增長幾乎毋庸置疑。在美國屢次禁售高速GPU的背景下，GPU的國產(chǎn)化進(jìn)程如何？

英偉達(dá)高性能

GPU供不應(yīng)求

ChatGPT意外掀起的一波AI革命，帶火了AI芯片市場。而英偉達(dá)旗下A100和H100兩款A(yù)I芯片，正是ChatGPT這樣的大語言模型的核心動力。

目前在GPU領(lǐng)域，大部分國內(nèi)企業(yè)仍然只能仰賴英偉達(dá)一家的技術(shù)。由于美國政府收緊對華出口管制，以及AI大模型帶來的龐大算力需求，英偉達(dá)的高性能GPU處理器“一芯難求”。

從去年開始，英偉達(dá)旗下A100、H100、A800、H800等高性能GPU芯片應(yīng)聲漲價，尤其旗艦級芯片H100，4月中旬在海外電商平臺就已炒到超4萬美元，甚至有賣家標(biāo)價6.5萬美元一片。

同時，英偉達(dá)的中國特供版A800和H800芯片也遭到了哄搶，整個市場需大于求，缺貨非常厲害。有業(yè)內(nèi)人士表示，今年這類GPU芯片從原來的12萬人民幣左右，變成了現(xiàn)在是25萬甚至30萬，甚至有高達(dá)50萬一片。

即便價格不斷暴漲，國內(nèi)大廠也不得不大批量買芯片。

據(jù)媒體報(bào)道稱，百度、字節(jié)跳動、騰訊和阿里巴巴向英偉達(dá)下單訂購50億美元的芯片。其中，字節(jié)跳動今年已向英偉達(dá)訂購了超過10億美元的GPU產(chǎn)品，僅字節(jié)一家公司今年的采購量就已經(jīng)接近英偉達(dá)去年在中國銷售的商用GPU總銷售額。

此次美國出口管制再次收緊，多家國內(nèi)廠商表示已提前接到美國更新出口管制規(guī)定的通知，已提前進(jìn)行囤貨。

據(jù)媒體消息，騰訊、百度等大廠由于“囤貨充足”，受“禁令”影響或有限。也有廠商表示，雖然目前已經(jīng)囤了足夠量，不過未來還是有很大壓力。

這種壓力，一方面來自國內(nèi)對于AI算力需求的暴增，另一方面也源于國產(chǎn)AI芯片的差距。

國產(chǎn)AI芯片與

英偉達(dá)差距幾何

一個不可否認(rèn)的事實(shí)是，國內(nèi)相關(guān)的芯片產(chǎn)品都和英偉達(dá)A100有較大差距。

曾有人坦言，英偉達(dá)與其他芯片廠商的差距，是院士與高中生的差別。就如同黃仁勛所言，英偉達(dá)“一直在奔跑”，想要超越巨人的其它芯片廠商只能奮力狂奔。

據(jù)《電子工程專輯》發(fā)布的《45家國產(chǎn)AI芯片廠商調(diào)研分析報(bào)告》顯示，在調(diào)研分析了瀚博半導(dǎo)體、燧原科技、平頭哥、華為海思、紫光展銳、寒武紀(jì)、地平線等國內(nèi)AI芯片廠商后，得出一個結(jié)論：

“國產(chǎn)AI芯片公司在高性能和先進(jìn)工藝AI芯片的設(shè)計(jì)方面還面臨諸多挑戰(zhàn)，而且在AI芯片價值鏈的EDA和IP環(huán)節(jié)上還有不小的差距。”

目前，國內(nèi)AI芯片廠商格局可大致分為三個梯隊(duì)：

一梯隊(duì)，有成熟產(chǎn)品、批量出貨的企業(yè)，包括寒武紀(jì)、華為昇騰、百度昆侖芯、燧原科技等；

二梯隊(duì)，以AI芯片起家的壁仞科技、天數(shù)智心、摩爾線程、沐曦等；

三梯隊(duì)，如海光、景嘉微等。

那么，這些國產(chǎn)AI芯片和英偉達(dá)芯片相比，處于什么樣的水平？綜合業(yè)界測評和實(shí)際部署的情況，以下是部分國產(chǎn)AI芯片的現(xiàn)狀：

華為昇騰910與英偉達(dá)的差距

2018年，華為推出了昇騰系列（HUAWEI Ascend) 芯片，主要產(chǎn)品有昇騰310與昇騰910。

目前昇騰910是業(yè)界算力最強(qiáng)的AI處理器，芯片基于自研華為達(dá)芬奇架構(gòu)3D Cube技術(shù)，實(shí)現(xiàn)業(yè)界極佳AI性能與能效。測試數(shù)據(jù)顯示，昇騰910算力是英偉達(dá)V100的兩倍，略超 “A100 80GB PCIe”版本。

受到2019年開始的制裁影響，原計(jì)劃在2021年推出用于訓(xùn)練場景的昇騰920研發(fā)進(jìn)度向后延宕，發(fā)展進(jìn)度受到巨大影響。

目前，華為昇騰只能用于華為自身生態(tài)中的大模型業(yè)務(wù)，比如昇騰不能做GPT-3，因?yàn)闀N騰910不支持32位浮點(diǎn)，而目前大模型訓(xùn)練幾乎都要使用32位的浮點(diǎn)，所以華為昇騰芯片只能利用華為開發(fā)的框架（如MindSp ore），在加上優(yōu)化好的大模型，比如盤古CV。

由于任何公開模型都必須經(jīng)過華為的深度優(yōu)化才能在華為的平臺上運(yùn)行，所以可以理解為華為昇騰只能運(yùn)行自己閉環(huán)的大模型產(chǎn)品。

百度昆侖2代與英偉達(dá)的差距

百度已有兩款產(chǎn)品，都在百度云服務(wù)器上部署：

一是，2018年下半年發(fā)布昆侖芯一代產(chǎn)品，基于三星14nm，可以做訓(xùn)練和推理，因此主要用于推理。

二是，2021年發(fā)布昆侖芯二代產(chǎn)品，搭載GDDR6高性顯存，支持256TOPS(INT8)算力，和V100差距縮小，可以做訓(xùn)練和推理。

第三代昆侖芯產(chǎn)品，預(yù)計(jì)明年上半年發(fā)布。

寒武紀(jì)思元590與英偉達(dá)的差距

寒武紀(jì)主要還是ASIC架構(gòu)，劣勢是通用性會比較差，優(yōu)勢是某些特定應(yīng)用場景下，算力可以做到比GPU更高。

百度內(nèi)部的測試結(jié)果顯示，寒武紀(jì)最好的產(chǎn)品思元590，性能接近A100 90%的性能；思元590基本支持主流的模型，綜合性能接近A100 80%的水平。

目前，百度文心一言在訓(xùn)練端主要使用英偉達(dá)產(chǎn)品V100和A100，在推理端主要使用英偉達(dá)A100和百度昆侖芯2代，小規(guī)模部署了寒武紀(jì)思元590。

但實(shí)際上線中并沒有使用思元590，主要原因在于其性能指標(biāo)不如A100，而且架構(gòu)不太兼容、難度大。

壁仞科技與英偉達(dá)的差距

壁仞科技去年發(fā)布的產(chǎn)品規(guī)格很高，但主要還是停留在紙面數(shù)據(jù)，實(shí)測數(shù)據(jù)、實(shí)際性能方面業(yè)界和第三方評測機(jī)構(gòu)評價沒有那么高，它本身的性能是不及A100的。

在軟件層面也還有很多工作要做，目前它只是做了一個軟件的雛形，從使用維度來講離成熟的生態(tài)軟件、規(guī)模化的出貨、客戶端的個適配還有很?的路要走。

現(xiàn)在它也面臨著制裁問題、實(shí)體清單問題，對于這樣的初創(chuàng)企業(yè)是生存層面的問題。

像天數(shù)智芯、摩爾線程、沐曦也都陸續(xù)有產(chǎn)品推出，但技術(shù)能力不及壁仞，只是停留在推理層面，不像第一梯隊(duì)的企業(yè)有更成熟的產(chǎn)品經(jīng)驗(yàn)。

景嘉微JM9與英偉達(dá)的差距

景嘉微最好的JM9系列，可以滿足目標(biāo)識別等部分人工智能領(lǐng)域的需求，但不能滿足AI計(jì)算、ChatGPT等領(lǐng)域的應(yīng)用需求。大概達(dá)到英偉達(dá)GTX 1050的水平，只能算入門級GPU。

海光DCU Z100與英偉達(dá)的差距

海光是做X86CPU起家的，GPU的技術(shù)能力還有待市場的認(rèn)可和檢驗(yàn)。

目前，海光訓(xùn)練產(chǎn)品的算力規(guī)模不足以支持做數(shù)據(jù)中心。海光DCU Z100訓(xùn)練算力較小，不到100TFLOPS，只適合一些推理場景，不足以支持大模型的訓(xùn)練，因此沒有能力去替代英偉達(dá)的產(chǎn)品。

從產(chǎn)品層面來講，海光離傳統(tǒng)做AI芯片的企業(yè)還是有較大的技術(shù)差距。

總體而言，國內(nèi)已經(jīng)批量生產(chǎn)的AI芯片，大多都是A100的上一代。目前能運(yùn)行大模型訓(xùn)練的，還是英偉達(dá)的A100、A800、H100、H800效率最高。

這意味著，想要達(dá)到同樣的算力，需要企業(yè)購置更多的國產(chǎn)AI芯片。對企業(yè)而言，就意味著更多的成本支出。

國產(chǎn)GPU芯片

自研任重道遠(yuǎn)

需要承認(rèn)的是，國產(chǎn)AI芯片產(chǎn)品走向高端還有較遠(yuǎn)的距離。

除了技術(shù)上的差距，國產(chǎn)GPU在生態(tài)建立方面仍不如英偉達(dá)完善，這也使得很多國內(nèi)廠商不敢輕易改用***。

據(jù)一家國產(chǎn)GPU廠商銷售人員透露，目前國內(nèi)第一批大模型廠商使用的基本都是英偉達(dá)A100、A800的芯片，因?yàn)橛ミ_(dá)構(gòu)建了完善的CUDA生態(tài)。

“如果你用慣了這個生態(tài)，”該銷售人員說，“貿(mào)然換一個生態(tài)，意味著你的學(xué)習(xí)成本、試錯成本、調(diào)試成本都會增加，自然沒人會想要換了”。

眾所周知，芯片需要適配硬件系統(tǒng)、工具鏈、編譯器等多個層級，需要很強(qiáng)的適配性，否則會出現(xiàn)這款芯片在某個場景能跑出90%的算力，在另一場景只能跑出80%效能的情景。

早在2006年，英偉達(dá)就推出了計(jì)算平臺CUDA，這是一個并行計(jì)算軟件引擎，CUDA框架里集成了很多調(diào)用GPU算力所需的代碼，工程師可以直接使用這些代碼，無須一一編寫。開發(fā)者可使用CUDA更高效地進(jìn)行AI訓(xùn)練和推理，更好的發(fā)揮GPU算力。

時至今日，CUDA已成為全球AI基礎(chǔ)設(shè)施，主流的AI框架、庫、工具都以CUDA為基礎(chǔ)進(jìn)行開發(fā)。

雖然英偉達(dá)GPU價格貴，但實(shí)際用起來反而是最便宜的。這對有意抓住大模型機(jī)會的企業(yè)來說，錢往往不是問題，時間才是更寶貴的資源，大家都必須盡快獲得足夠多的先進(jìn)算力來確保先發(fā)優(yōu)勢。

因此，對于***供應(yīng)商來講，哪怕能通過堆芯片的方式能堆出一個算力相當(dāng)?shù)漠a(chǎn)品，但軟件適配與兼容讓客戶接受更難。

此外，從服務(wù)器運(yùn)營的角度，它的主板開銷、電費(fèi)、運(yùn)營費(fèi)，以及需要考慮的功耗、散熱等問題，都會大大增加數(shù)據(jù)中心的運(yùn)營成本。

由此可見，國產(chǎn)GPU在與英偉達(dá)的競爭中阻力重重，想實(shí)現(xiàn)突圍并不容易。

但值得注意的是，此次美國限制出口政策的收緊，又一次為國內(nèi)廠商敲響了警鐘。

盡管***在性能和軟件生態(tài)上比不過英偉達(dá)、AMD等行業(yè)巨頭，但在復(fù)雜的國際貿(mào)易關(guān)系及地緣政治因素等驅(qū)動下，“國產(chǎn)替代”成為國內(nèi)半導(dǎo)體行業(yè)發(fā)展的主旋律。

從安全性以及自主可控的角度來說，這也為國內(nèi)AI芯片企業(yè)提供了新的機(jī)遇窗口。

一位業(yè)內(nèi)人士分析稱，在當(dāng)前“缺芯”的形勢下，國內(nèi)大模型廠商可以在不是特別商業(yè)化的場景多給***機(jī)會，支持***廠商技術(shù)迭代，共同營造生態(tài)，共同成長。

不僅如此，目前全國各地的智能算力中心建設(shè)穩(wěn)步推進(jìn)，AI芯片的需求快速增長，國產(chǎn)化替代的需求也隨之提升。

中國巨大的AI市場體量和快速迭代的發(fā)展進(jìn)程，為眾多國產(chǎn)AI芯片廠商提供了豐富的試驗(yàn)基地和應(yīng)用設(shè)計(jì)機(jī)會。接下來的3-5年，將是國產(chǎn)AI芯片廠商加速AI應(yīng)用落地和大規(guī)模部署的快速發(fā)展時期。

“AI算力國產(chǎn)化”的市場大門，或許正在打開。

審核編輯黃宇

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報(bào)投訴

芯片

芯片

+關(guān)注

關(guān)注
455

文章
50714

瀏覽量
423136
gpu

gpu

+關(guān)注

關(guān)注
28

文章
4729

瀏覽量
128890
AI

AI

+關(guān)注

關(guān)注
87

文章
30728

瀏覽量
268886
英偉達(dá)

英偉達(dá)

+關(guān)注

關(guān)注
22

文章
3770

瀏覽量
90984
算力

算力

+關(guān)注

關(guān)注
1

文章
964

瀏覽量
14793

AFE5816在12位ADC的應(yīng)用中，0V輸入對應(yīng)的輸出是12‘h000還是12’h800?

在12位ADC的應(yīng)用中，0V輸入對應(yīng)的輸出是12‘h000還是12’h800? 對AFE5805來說都在對代碼最高位取反才行，但是5816貌似不行，但手冊上也沒找到說明?。?！

發(fā)表于 12-09 08:33

英偉達(dá)H20 AI芯片:中國市場新動向與業(yè)績預(yù)期

在科技行業(yè)的持續(xù)關(guān)注下，英偉達(dá)再次成為焦點(diǎn)。據(jù)英國《金融時報(bào)》7月5日的報(bào)道，英偉達(dá)計(jì)劃在接下來的幾個月內(nèi)向中國市場交付超過100萬顆新款H

發(fā)表于 07-05 16:56 ?1047次閱讀

英偉達(dá)GPU新品規(guī)劃與HBM市場展望

在COMPUTEX 2024主題演講中，英偉達(dá)（NVIDIA）公布了其GPU產(chǎn)品的未來規(guī)劃。據(jù)英偉達(dá)透露，B100、B200和GB200系列

發(fā)表于 06-13 09:44 ?800次閱讀

進(jìn)一步解讀英偉達(dá) Blackwell 架構(gòu)、NVlink及GB200 超級芯片

。 **5.**自動駕駛在自動駕駛領(lǐng)域，Blackwell 架構(gòu)的 GPU 可以用于感知和決策算法的計(jì)算，提高車輛的安全性和自主性。這些只是英偉達(dá) Blackwell 架構(gòu)在人工智能領(lǐng)域的

發(fā)表于 05-13 17:16

英偉達(dá)芯片“倒?fàn)敗憋L(fēng)光不再，市場熱度降溫

中國的大模型業(yè)進(jìn)入了“百模大戰(zhàn)”時間，英偉達(dá)面向中國客戶推出H800，這個版本被俗稱為H100的“閹割版”，英偉

發(fā)表于 04-17 10:07 ?634次閱讀

算力市場掀起價格風(fēng)暴英偉達(dá)A800租賃價跳水

在這場價格風(fēng)暴中，英偉達(dá)A800的租賃價格跳水至僅需2元/時，無疑成為了市場的焦點(diǎn)。

發(fā)表于 04-03 16:43 ?2447次閱讀

美方持續(xù)收緊AI芯片對華出口限制，英偉達(dá)等巨頭面臨挑戰(zhàn)

為了挽回中國市場，英偉達(dá)不得不做出妥協(xié)，推出了符合美方限制政策的A100和A800芯片。

發(fā)表于 04-02 16:28 ?1182次閱讀

英偉達(dá)H200和H800的區(qū)別

英偉達(dá)H200和H800在多個方面存在一些關(guān)鍵性的區(qū)別。

發(fā)表于 03-07 16:30 ?3688次閱讀

英偉達(dá)H200和A100的區(qū)別

英偉達(dá)H200和A100兩款芯片在性能、架構(gòu)、內(nèi)存以及應(yīng)用場景等多個方面存在顯著的區(qū)別。

發(fā)表于 03-07 16:23 ?3597次閱讀

英偉達(dá)H200和A100的差異

英偉達(dá)H200和A100在多個方面存在差異。

發(fā)表于 03-07 16:18 ?2530次閱讀

英偉達(dá)H20芯片在華銷量低迷，訂單量縮減

據(jù)悉，去年11月，由于美國實(shí)施新的出口管制措施，業(yè)界普遍預(yù)測英偉達(dá)將面向中國市場推出三款A(yù)I芯片（即HGX H20、L20 PCIe及L2

發(fā)表于 01-19 09:30 ?1670次閱讀

NVIDIA特供中國的芯片，AI性能大降10%售價依然高

目前NVIDIA最昂貴的A100、H100芯片無法對中國市場出售，此前為中國市場定制的A800、H800芯片也被限制對中國出售，可以對中國出售的為定制化的

發(fā)表于 01-03 16:07 ?1327次閱讀

NVIDIA GPU因出口管制措施推遲發(fā)布

據(jù)之前所披露的詳細(xì)數(shù)據(jù)，英偉達(dá)HGX H20雖屬與H100和H200同系列，共享英偉

發(fā)表于 01-03 09:25 ?737次閱讀

英偉達(dá)和華為/海思主流GPU型號性能參考

一句話總結(jié)，H100 vs. A100：3 倍性能，2 倍價格值得注意的是，HCCS vs. NVLINK的GPU 間帶寬。對于 8 卡

發(fā)表于 12-29 11:43 ?5958次閱讀

英偉達(dá)vs.華為/海思：GPU性能一覽

NVIDIA NVLink采用全網(wǎng)狀拓?fù)?，如下所示，（雙向）GPU-to-GPU 最大帶寬可達(dá)到400GB/s （需要注意的是，下方展示的是8*A100模塊時的600GB/s速率，8*A800也是類似的全網(wǎng)狀拓?fù)洌?/div>
發(fā)表于 12-27 16:49 ?1898次閱讀

RM新时代网站-首页

搜索歷史

英偉達(dá)A800、H800將被出口管制，國產(chǎn)GPU能否頂起一片天？

評論

AFE5816在12位ADC的應(yīng)用中，0V輸入對應(yīng)的輸出是12‘h000還是12’h800?

英偉達(dá)H20 AI芯片:中國市場新動向與業(yè)績預(yù)期

英偉達(dá)GPU新品規(guī)劃與HBM市場展望

進(jìn)一步解讀英偉達(dá) Blackwell 架構(gòu)、NVlink及GB200 超級芯片

英偉達(dá)芯片“倒?fàn)敗憋L(fēng)光不再，市場熱度降溫

算力市場掀起價格風(fēng)暴英偉達(dá)A800租賃價跳水

美方持續(xù)收緊AI芯片對華出口限制，英偉達(dá)等巨頭面臨挑戰(zhàn)

英偉達(dá)H200和H800的區(qū)別

英偉達(dá)H200和A100的區(qū)別

英偉達(dá)H200和A100的差異

英偉達(dá)H20芯片在華銷量低迷，訂單量縮減

NVIDIA特供中國的芯片，AI性能大降10%售價依然高

NVIDIA GPU因出口管制措施推遲發(fā)布

英偉達(dá)和華為/海思主流GPU型號性能參考

英偉達(dá)vs.華為/海思：GPU性能一覽

搜索歷史

英偉達(dá)A800、H800將被出口管制，國產(chǎn)GPU能否頂起一片天？

評論

英偉達(dá)A800、H800將被出口管制，國產(chǎn)GPU能否頂起一片天？