RM新时代网站-首页

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

ChatGPT熱潮席卷全球ChatGPT將帶動哪些芯片的需求?ChatGPT帶來的啟示

英利檢測 ? 2023-02-17 11:34 ? 次閱讀

最近,ChatGPT熱潮席卷全球。
ChatGPT(Chat Generative Pre-trained Transformer)是由OpenAI于2022年12月推出的對話AI模型,僅發(fā)布2個月便實現(xiàn)月活突破1億,成為歷史上用戶增長最快的消費級應用之一。

ChatGPT火出圈背后是“人類反饋強化模型”的應用。在問答模式的基礎上,ChatGPT可以進行推理、編寫代碼、文本創(chuàng)作等等,這樣的特殊優(yōu)勢和用戶體驗使得應用場景流量大幅增加。
隨著ChatGPT用戶數(shù)快速增長,需求量火爆引發(fā)宕機。在龐大用戶群涌入的情況下,ChatGPT服務器2天宕機5次,火爆程度引人注目的同時也催生了對算力基礎設施建設更高的要求,特別是底層芯片。那么,ChatGPT將帶動哪些芯片的需求?
AI服務器需求激增
當前,ChatGPT在問答模式的基礎上進行推理、編寫代碼、文本創(chuàng)作等,用戶人數(shù)及使用次數(shù)均提升,同時在一些新應用場景也產(chǎn)生了較大的流量,比如智能音箱、內容生產(chǎn)、游戲NPC、陪伴機器人等。隨著終端用戶使用頻率提高,數(shù)據(jù)流量暴漲,對服務器的數(shù)據(jù)處理能力、可靠性及安全性等要求相應提升。
從技術原理來看,ChatGPT基于Transformer技術,隨著模型不斷迭代,層數(shù)也越來越多,對算力的需求也就越來越大。從運行條件來看,ChatGPT完美運行的三個條件:訓練數(shù)據(jù)+模型算法+算力,需要在基礎模型上進行大規(guī)模預訓練,存儲知識的能力來源于1750億參數(shù),需要大量算力。
資料顯示,ChatGPT是基于GPT-3.5優(yōu)化的一個模型,GPT-3.5是GPT-3.0的微調版本。OpenAI的GPT-3.0模型存儲知識的能力來源于1750億參數(shù),單次訓練費用約460萬美元,GPT-3.5在微軟AzureAI超算基礎設施上進行訓練,總算力消耗約3640PF-days(即假如每秒計算一千萬億次,需要計算3640天)。
可以說,ChatGPT拉動了芯片產(chǎn)業(yè)量價齊升,即不僅對人工智能底層芯片數(shù)量產(chǎn)生了更大的需求,而且對底層芯片算力也提出了更高的要求,即拉動了高端芯片的需求。據(jù)悉,采購一片英偉達頂級GPU成本為8萬元,GPU服務器成本通常超過40萬元。支撐ChatGPT的算力基礎設施至少需要上萬顆英偉達GPU A100,高端芯片需求的快速增加會進一步拉高芯片均價。
隨著ChatGPT流量激增,作為算力載體的AI服務器將迎來重要發(fā)展機遇。預計,全球AI服務器市場將從2020年的122億美元成長到2025年288億美元,年復合增長率達到18.8%。
這些芯片將受益
從芯片構成來看,AI服務器主要是CPU+加速芯片,通常搭載GPU、FPGAASIC等加速芯片,利用CPU與加速芯片的組合可以滿足高吞吐量互聯(lián)的需求。
1.CPU
作為計算機系統(tǒng)的運算和控制核心,是信息處理、程序運行的最終執(zhí)行單元。其優(yōu)勢在于有大量的緩存和復雜的邏輯控制單元,擅長邏輯控制、串行的運算;劣勢在于計算量較小,且不擅長復雜算法運算和處理并行重復的操作。因此,CPU在深度學習中可用于推理/預測。
目前,服務器CPU向多核心發(fā)展,滿足處理能力和速度提升需要,比如AMD EPYC 9004核心數(shù)量最多可達96個。不過,系統(tǒng)性能優(yōu)劣不能只考慮CPU核心數(shù)量,還要考慮操作系統(tǒng)、調度算法、應用和驅動程序等。
2.GPU
GPU高度適配AI模型構建,由于具備并行計算能力,可兼容訓練和推理,目前GPU被廣泛應用于加速芯片。以英偉達A100為例,在訓練過程中,GPU幫助高速解決問題:2048個A100 GPU可在一分鐘內成規(guī)模地處理 BERT之類的訓練工作負載。在推理過程中,多實例GPU (MIG)技術允許多個網(wǎng)絡同時基于單個A100運行,從而優(yōu)化計算資源的利用率。在A100其他推理性能增益的基礎之上,僅結構稀疏支持一項就能帶來高達兩倍的性能提升。在BERT等先進的對話式AI模型上,A100可將推理吞吐量提升到高達CPU的249倍。
目前,ChatGPT引發(fā)了GPU應用熱潮。其中,百度即將推出文心一言(ERNIE Bot)。蘋果則引入AI加速器設計的M2系列芯片(M2 pro和M2 max)將被搭載于新款電腦。隨著ChatGPT的使用量激增,OpenAI需要更強的計算能力來響應百萬級別的用戶需求,因此增加了對英偉達GPU的需求。
AMD計劃推出與蘋果M2系列芯片競爭的臺積電4nm工藝“Phoenix”系列芯片,以及使用Chiplet工藝設計的“Alveo V70”AI芯片。這兩款芯片均計劃在今年推向市場,分別面向消費電子市場以及AI推理領域。
3.FPGA
FPGA具有可編程靈活性高、開發(fā)周期短、現(xiàn)場可重編功能、低延時、方便并行計算等特點,可通過深度學習+分布集群數(shù)據(jù)傳輸賦能大模型。
4.ASIC
ASIC在批量生產(chǎn)時與通用集成電路相比具有體積更小、功耗更低、可靠性提高、性能提高、保密性增強、成本降低等優(yōu)點,可進一步優(yōu)化性能與功耗。隨著機器學習、邊緣計算、自動駕駛的發(fā)展,大量數(shù)據(jù)處理任務的產(chǎn)生,對于芯片計算效率、計算能力和計能耗比的要求也越來越高,ASIC通過與CPU結合的方式被廣泛關注,國內外龍頭廠商紛紛布局迎戰(zhàn)AI時代的到來。
其中,谷歌最新的TPU v4集群被稱為Pod,包含4096個v4芯片,可提供超過1 exaflops的浮點性能。英偉達GPU+CUDA主要面向大型數(shù)據(jù)密集型HPC和AI應用;基于Grace的系統(tǒng)與NVIDIAGPU緊密結合,性能比NVIDIADGX系統(tǒng)高出10倍。百度昆侖2代AI芯片采用全球領先的7nm 制程,搭載自研的第二代 XPU 架構,相比一代性能提升2-3倍;昆侖芯3代將于2024年初量產(chǎn)。
5.光模塊
當前,AI時代模型算力需求已經(jīng)遠超摩爾定律的速度增長,特別是在深度學習、大模型時代之后,預計5-6個月翻倍。然而,數(shù)據(jù)傳輸速率成為容易被忽略的算力瓶頸。伴隨數(shù)據(jù)傳輸量的增長,光模塊作為數(shù)據(jù)中心內設備互聯(lián)的載體,需求量隨之增長。

poYBAGPu5nmAQnXdAAFQXnGkxo8733.png

來源:Google Scholar
未來算力升級路徑
最近,ChatGPT的興起推動著人工智能在應用端的蓬勃發(fā)展,這也對計算設備的運算能力提出了前所未有的需求。雖然AI芯片、GPU、CPU+FPGA等芯片已經(jīng)對現(xiàn)有模型構成底層算力支撐,但面對未來潛在的算力指數(shù)增長,短期使用Chiplet異構技術加速各類應用算法落地,長期來看打造存算一體芯片(減少芯片內外的數(shù)據(jù)搬運),或將成為未來算力升級的潛在方式。
1. Chiplet
Chiplet是布局先進制程、加速算力升級的關鍵技術。Chiplet異構技術不僅可以突破先進制程的封鎖,并且可以大幅提升大型芯片的良率、降低設計的復雜程度和設計成本、降低芯片制造成本。不過,雖然Chiplet技術加速了算力升級,但需要犧牲一定的體積和功耗,因此將率先在基站、服務器、智能電車等領域廣泛使用。
目前,Chiplet已廣泛應用于服務器芯片。AMD是Chiplet服務器芯片的引領者,其基于Chiplet的第一代AMDEPYC處理器中,裝載8個“Zen”CPU核,2個DDR4內存通道和32個PCIe通道。2022年AMD正式發(fā)布第四代EPYC處理器,擁有高達96顆5nm的Zen4核心,并使用新一代的Chiplet工藝,結合5nm和6nm工藝來降低成本。
英特爾第14代酷睿Meteor Lake首次采用intel 4工藝,首次引入Chiplet小芯片設計,預計將于2023年下半年推出,至少性能功耗比的目標要達到13代 Raptor Lake的1.5倍水平。
2.存算一體
正如上文提到的,AI時代模型算力需求遠超摩爾定律的速度增長,單純靠縮微化制程已經(jīng)無法滿足需求而且成本急速攀升。實際上,從現(xiàn)有芯片架構來看,超過60%時間是花在數(shù)據(jù)搬運上,超過90%的功耗也損失在數(shù)據(jù)搬運上,能效非常低。因此,存儲墻”成為了數(shù)據(jù)計算應用的一大障礙。而存算一體是算力需求上升的主要解決技術路線之一。

pYYBAGPu5nmAKtUiAAJ_TGGKLlU565.png


存內計算的計算原理可以理解成是用存儲器做計算,其計算單元不再是邏輯器件、CPU、GPU或者NPU,與這些架構是完全不一樣的。存內計算直接運算單元是存儲單元本身。存算一體技術通過在存儲器中疊加計算能力,以新的高效運算架構進行二維和三維矩陣運算。

以上信息由英利檢測(Teslab)原創(chuàng)發(fā)布,歡迎一起討論,我們一直在關注這方面的發(fā)展,如有引用也請注明出處。

國家高新技術企業(yè);唯一覆蓋中國和歐美運營商認證服務機構;業(yè)內最為優(yōu)秀第三方認證服務商之一;專業(yè)的人做專業(yè)的事;

入庫:┆移動┆聯(lián)通┆電信┆中國廣電┆

歐美:┆GCF┆PTCRB┆VzW┆ATT┆TMO┆FCC┆

中國:┆CCC┆SRRC┆CTA┆

號碼:┆IMEI┆MAC┆MEID┆EAN┆

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 芯片
    +關注

    關注

    455

    文章

    50714

    瀏覽量

    423137
  • AI
    AI
    +關注

    關注

    87

    文章

    30728

    瀏覽量

    268886
  • ChatGPT
    +關注

    關注

    29

    文章

    1558

    瀏覽量

    7595
收藏 人收藏

    評論

    相關推薦

    ChatGPT新增實時搜索與高級語音功能

    。OpenAI對搜索算法進行了深度優(yōu)化,使得ChatGPT能夠在用戶提出問題后,迅速獲取到分鐘級別的最新信息,包括股票、新聞等。這一功能的加入,極大地滿足了用戶對即時數(shù)據(jù)的需求,使得ChatGPT在各類應用場景中更加得心應手。
    的頭像 發(fā)表于 12-17 14:08 ?130次閱讀

    蘋果iOS 18.2公測版發(fā)布,Siri與ChatGPT深度融合

    11月7日,蘋果公司正式推出了iOS 18.2的公測版,這款新版本為用戶帶來了諸多備受期待的新功能,其中Siri與ChatGPT的深度融合成為了最為引人注目的亮點。   在iOS 18.2中
    的頭像 發(fā)表于 11-07 15:22 ?448次閱讀

    OpenAI推出ChatGPT搜索功能

    近日,OpenAI再次邁出了重要的一步,為其廣受好評的ChatGPT平臺添加了一項全新的搜索功能。 據(jù)悉,這項被命名為“ChatGPT搜索”的新功能,將為用戶帶來前所未有的搜索體驗。以往,當用戶需要
    的頭像 發(fā)表于 11-04 10:34 ?332次閱讀

    ChatGPT:怎樣打造智能客服體驗的重要工具?

    客服任務的需求,對ChatGPT進行微調。例如,教導模型如何處理特定的產(chǎn)品或服務相關問題。4.管理和監(jiān)控模型輸出:確保ChatGPT生成的對話滿足預期的質量和準確性。建立有效的監(jiān)控系統(tǒng),及時檢測和糾正
    的頭像 發(fā)表于 11-01 11:12 ?165次閱讀
    <b class='flag-5'>ChatGPT</b>:怎樣打造智能客服體驗的重要工具?

    怎樣搭建基于 ChatGPT 的聊天系統(tǒng)

    搭建一個基于ChatGPT的聊天系統(tǒng)是一個涉及多個步驟的過程,包括理解ChatGPT的API、設計用戶界面、處理數(shù)據(jù)和集成ChatGPT模型。以下是一個簡化的指南,用于創(chuàng)建一個基本的聊天系統(tǒng)。 1.
    的頭像 發(fā)表于 10-25 16:23 ?496次閱讀

    ChatGPT 適合哪些行業(yè)

    ChatGPT 是一種基于人工智能的自然語言處理技術,它能夠理解和生成人類語言。這種技術在多個行業(yè)中都有廣泛的應用潛力。以下是一些ChatGPT特別適合的行業(yè),以及它在這些行業(yè)中可能的應用方式
    的頭像 發(fā)表于 10-25 16:11 ?435次閱讀

    如何使用 ChatGPT 進行內容創(chuàng)作

    ChatGPT平臺。 選擇模型 : ChatGPT目前支持GPT3.5和GPT4兩個模型。根據(jù)創(chuàng)作需求,選擇合適的模型。一般來說,GPT4在性能和生成質量上可能更優(yōu)。 明確創(chuàng)作目標 : 在開始創(chuàng)作之前,明確您的創(chuàng)作目標,如文章
    的頭像 發(fā)表于 10-25 16:08 ?434次閱讀

    華納云:ChatGPT 登陸 Windows

    ChatGPT 桌面應用,您可以聊聊文件和照片。這款應用為您帶來了 OpenAI 最新的模型改進,包括訪問我們最新、最智能的模型OpenAI o1-preview ?!?Windows 版 ChatGPT 應用可以在大多數(shù) W
    的頭像 發(fā)表于 10-18 15:50 ?230次閱讀

    用launch pad燒錄chatgpt_demo項目會有api key報錯的原因?

    我用launch pad燒錄chatgpt_demo項目問題會有api key報錯;請問用launch pad要如何設置api key和調試?還是只能通過idf?
    發(fā)表于 06-27 07:59

    使用espbox lite進行chatgpt_demo的燒錄報錯是什么原因?

    我使用espbox lite進行chatgpt_demo的燒錄 我的idf是v5.1release版本的,espbox是master版本的 在編譯時似乎沒有什么問題 在燒錄時報錯 請問這是什么原因
    發(fā)表于 06-11 08:45

    OpenAI 深夜拋出王炸 “ChatGPT- 4o”, “她” 來了

    功能和實際應用。 GPT-4 turbo****的增強功能 ChatGPT-4o帶來了幾個值得注意的升級,增強了性能和可用性: · 更快的響應時間和更高的準確性: 是客戶服務和其他快節(jié)奏環(huán)境中所
    發(fā)表于 05-27 15:43

    李開復:中國須獨立研發(fā)ChatGPT?

    李開復援引“ChatGPT 時刻”概念,指出美國在約 17 個月前就已體驗到這一波熱潮(注:ChatGPT 最早于 2022 年 12 月走紅)。然而,他認為中國尚未達到這一階段,目前國內的聊天機器人或工具仍有待改進。
    的頭像 發(fā)表于 05-13 16:05 ?506次閱讀

    在FPGA設計中是否可以應用ChatGPT生成想要的程序呢

    當下AI人工智能崛起,很多開發(fā)領域都可看到ChatGPT的身影,F(xiàn)PGA設計中,是否也可以用ChatGPT輔助設計呢?
    發(fā)表于 03-28 23:41

    如何在測試中使用ChatGPT

    Dimitar Panayotov 在 2023 年 QA Challenge Accepted 大會 上分享了他如何在測試中使用 ChatGPT
    的頭像 發(fā)表于 02-20 13:57 ?745次閱讀

    【國產(chǎn)FPGA+OMAPL138開發(fā)板體驗】(原創(chuàng))6.FPGA連接ChatGPT 4

    OMAP-L138(定點/浮點DSP C674x+ARM9)+ FPGA處理器的開發(fā)板。 編寫一個用于FPGA訪問ChatGPT 4的程序代碼是一個相當復雜的任務,涉及到硬件設計、網(wǎng)絡通信、數(shù)據(jù)處理等多個
    發(fā)表于 02-14 21:58
    RM新时代网站-首页