RM新时代网站-首页

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

芯片或?qū)l(fā)生巨變

旺材芯片 ? 來源:與非網(wǎng)eefocus ? 2024-11-09 10:54 ? 次閱讀

芯片行業(yè)正在朝著特定領(lǐng)域的計算發(fā)展,而人工智能AI)則朝著相反的方向發(fā)展,這種差距可能會迫使未來芯片和系統(tǒng)架構(gòu)發(fā)生重大變化。

這種分裂的背后是設(shè)計硬件和軟件所需的時間。自ChatGPT在全球推出以來的 18 個月里,大量軟件初創(chuàng)公司紛紛探索新架構(gòu)和技術(shù)??紤]到映射到它們身上的任務(wù)變化速度之快,這種趨勢可能會持續(xù)下去。但生產(chǎn)一塊定制芯片通常需要超過 18 個月的時間。

在標(biāo)準(zhǔn)的世界中,軟件不會隨著時間的推移而發(fā)生太大變化,定制硬件以滿足應(yīng)用程序或工作負(fù)載的確切需求是值得的,僅此而已。這是RISC-V背后的主要驅(qū)動因素之一,其中處理器ISA可以專門為給定任務(wù)設(shè)計。但是,隨著 AI 的多種變化,硬件在投入批量生產(chǎn)時可能已經(jīng)過時了。因此,除非規(guī)范不斷更新,否則專門針對應(yīng)用程序優(yōu)化的硬件不太可能足夠快地進(jìn)入市場以供使用。

因此,特定領(lǐng)域 AI 芯片首次運行失敗的風(fēng)險會增加。在修復(fù)該問題的同時,生成式 AI 將繼續(xù)發(fā)展。

但這并不意味著定制硅片的末日。數(shù)據(jù)中心正在部署越來越多的處理架構(gòu),其中每一種架構(gòu)在特定任務(wù)上都比單個通用 CPU 更勝一籌。Quadric 首席營銷官 Steve Roddy 表示:“隨著數(shù)據(jù)中心 AI 工作負(fù)載的激增,隨著數(shù)據(jù)中心芯片和系統(tǒng)被迫適應(yīng)快速發(fā)展的形勢,即使是普通計算能力的最后一道堡壘也已崩潰 ?!?/p>

但它確實指出了超高速、低功耗硅片與更多通用芯片或小芯片之間平衡的架構(gòu)。

“在人工智能領(lǐng)域,人們強烈要求將事物變得盡可能通用和可編程,因為沒人知道下一個 LLM 事物何時會出現(xiàn),并徹底改變他們做事的方式,”Blue Cheetah 首席執(zhí)行官 Elad Alon 說道?!澳阍绞窍萑肜Ь常驮接锌赡苠e過潮流。與此同時,很明顯,幾乎不可能滿足使用完全通用系統(tǒng)所需的計算能力,因此也幾乎不可能滿足功率和能源要求。人們強烈要求定制硬件,使其在當(dāng)今已知的特定事物上更加高效?!?/p>

挑戰(zhàn)在于如何高效地將軟件映射到這種異構(gòu)處理器陣列上,而目前業(yè)界尚未完全掌握這一技術(shù)。共存的處理器架構(gòu)越多,映射問題就越困難?!艾F(xiàn)代芯片中有一個 GPU、一個神經(jīng)處理單元,還有核心處理,”Arteris 解決方案和業(yè)務(wù)開發(fā)副總裁 Frank Schirrmeister 在接受采訪時表示(他目前擔(dān)任 Synopsys 戰(zhàn)略項目和系統(tǒng)解決方案執(zhí)行董事)。“你至少有三個計算選項,你必須決定將東西放在何處,并設(shè)置適當(dāng)?shù)某橄髮?。我們過去稱之為軟件協(xié)同設(shè)計。當(dāng)你將算法或算法的一部分移植到NPU或 GPU 中時,你會重新調(diào)整軟件,將更多的軟件執(zhí)行轉(zhuǎn)移到更高效的實現(xiàn)中。計算中仍有一個通用組件支持不同的元素?!?/p>

追逐領(lǐng)先者

AI 的出現(xiàn)得益于 GPU 的處理能力,圖形處理所需的功能與 AI 核心部分所需的功能非常接近。此外,創(chuàng)建了軟件工具鏈,使非圖形功能能夠映射到架構(gòu)上,這使得 NVIDIA GPU 成為最容易定位的處理器。

“當(dāng)有人成為市場領(lǐng)導(dǎo)者時,他們可能是市場上唯一的競爭者,每個人都會試圖對其做出反應(yīng),”Keysight 新機遇業(yè)務(wù)經(jīng)理 Chris Mueth 表示?!暗@并不意味著它是最優(yōu)架構(gòu)。我們可能暫時還不知道這一點。GPU 適用于某些應(yīng)用,例如執(zhí)行重復(fù)的數(shù)學(xué)運算,在這方面很難被超越。如果你優(yōu)化軟件以與 GPU 配合使用,那么速度會非???。”

成為通用加速器領(lǐng)導(dǎo)者可能會帶來阻力。西門子 EDA高級綜合項目總監(jiān)Russell Klein說:“如果你要構(gòu)建通用加速器,你就需要考慮面向未來的問題。當(dāng) NVIDIA 坐下來構(gòu)建 TPU 時,他們必須確保 TPU 能夠滿足盡可能廣泛的市場,這意味著任何構(gòu)想新神經(jīng)網(wǎng)絡(luò)的人都需要能夠?qū)⑵浞湃脒@個加速器中并運行它。如果你要為某個應(yīng)用程序構(gòu)建某個東西,則幾乎不需要考慮面向未來的問題。我可能希望構(gòu)建一點靈活性,這樣我才有能力解決問題。但如果只是將其固定為一種能夠非常好地執(zhí)行一項工作的特定實現(xiàn),那么再過 18 個月就會有人想出一種全新的算法。好消息是我將領(lǐng)先于其他所有人,使用我的定制實現(xiàn),直到他們能夠趕上他們自己的定制實現(xiàn)。我們利用現(xiàn)成的硬件能做的事情很有限?!?/p>

但特異性也可以分層構(gòu)建?!癐P 交付的一部分是硬件抽象層,它以標(biāo)準(zhǔn)化方式向軟件公開,”Schirrmeister 說?!叭绻麤]有中間件,圖形核心就毫無用處。應(yīng)用程序特異性在抽象中向上移動。如果你看看 CUDA,NVIDIA 核心本身的計算能力相當(dāng)通用。CUDA 是抽象層,然后在其上具有用于生物學(xué)的各種事物的庫。這很棒,因為應(yīng)用程序特異性上升到更高的水平?!?/p>

這些抽象層在過去非常重要。Expedera 首席科學(xué)家兼聯(lián)合創(chuàng)始人 Sharad Chole 表示:“Arm 在應(yīng)用處理器之上整合了軟件生態(tài)系統(tǒng)。此后,異構(gòu)計算使每個人都可以在該軟件堆棧上構(gòu)建自己的附加組件。例如,高通的堆棧完全獨立于蘋果的堆棧。如果你將其延伸,就會有一個接口可用于獲得更好的性能或更好的功率分布。然后就有了協(xié)處理器的空間。這些協(xié)處理器將允許你進(jìn)行更多的差異化,而不僅僅是使用異構(gòu)計算進(jìn)行構(gòu)建,因為你可以添加或刪除它,或者你可以構(gòu)建一個更新的協(xié)處理器,而無需啟動新的應(yīng)用程序流程,而這要昂貴得多?!?/p>

經(jīng)濟因素是一個重要因素?!敖邮?C++ 或其他高級語言的完全可編程設(shè)備以及功能特定的 GPU、GPNPU 和 DSP 的普及減少了新設(shè)計中對專用、固定功能且財務(wù)風(fēng)險較高的硬件加速模塊的需求,”Quadric 的 Roddy 說道。

這既是技術(shù)問題,也是商業(yè)問題。Blue Cheetah 的 Alon 表示:“有人可能會說,我要做這個非常具體的目標(biāo)應(yīng)用,在這種情況下,我知道我將在 AI 或其他堆棧中做以下幾件事,然后你只需讓它們發(fā)揮作用。”“如果這個市場足夠大,那么對一家公司來說,這可能是一個有趣的選擇。但對于 AI 加速器或 AI 芯片初創(chuàng)公司來說,這是一個更棘手的賭注。如果沒有足夠的市場來證明整個投資的合理性,那么你必須預(yù)測尚不存在的市場所需的能力。這實際上是你正在采取什么樣的商業(yè)模式和賭注的混合體,因此可以采取什么樣的技術(shù)策略來盡可能地優(yōu)化它?!?/p>

專用硬件的情況

硬件實現(xiàn)需要選擇。Expedera 的 Chole 說:“如果我們可以標(biāo)準(zhǔn)化神經(jīng)網(wǎng)絡(luò)并說這就是我們要做的全部,那么您仍然必須考慮參數(shù)的數(shù)量、必要的操作數(shù)量以及所需的延遲。但情況從來都不是這樣的,尤其是對于 AI 而言。從一開始,我們就從 224 x 224 的郵票圖像開始,然后轉(zhuǎn)向高清,現(xiàn)在我們要轉(zhuǎn)向 4k。LLM 也是一樣。我們從 300 兆位模型(例如 Bert)開始,現(xiàn)在我們要朝著數(shù)十億、數(shù)十億甚至數(shù)萬億的參數(shù)邁進(jìn)。最初我們只從語言翻譯模型(例如令牌預(yù)測模型)開始?,F(xiàn)在我們有了多模式模型,可以同時支持語言、視覺和音頻。工作量在不斷發(fā)展,這就是正在發(fā)生的追逐游戲。

現(xiàn)有架構(gòu)有許多方面值得質(zhì)疑。Mythic 首席執(zhí)行官兼聯(lián)合創(chuàng)始人 Dave Fick 表示:“設(shè)計一個好的系統(tǒng)的關(guān)鍵部分是找到系統(tǒng)性能的顯著瓶頸并找到加速它們的方法?!薄叭斯ぶ悄苁且豁椓钊伺d奮且影響深遠(yuǎn)的技術(shù)。然而,它需要每秒數(shù)萬億次操作的性能水平和標(biāo)準(zhǔn)緩存和 DRAM 架構(gòu)完全無法支持的內(nèi)存帶寬。這種實用性和挑戰(zhàn)性的結(jié)合使人工智能成為專用硬件單元的首選?!?/p>

通用設(shè)備數(shù)量不足以滿足需求,這可能是迫使行業(yè)開始采用更高效硬件解決方案的因素?!吧墒饺斯ぶ悄茴I(lǐng)域的進(jìn)展非常快,”Chole 說?!澳壳皼]有任何東西可以在成本和功率方面滿足硬件的要求。什么都沒有。甚至 GPU 的出貨量也不夠。有訂單,但出貨量不夠。這是每個人都看到的問題。沒有足夠的計算能力來真正支持生成式人工智能的工作負(fù)載?!?/p>

小芯片可能有助于緩解這個問題。“即將到來的小芯片海嘯將加速數(shù)據(jù)中心的這種轉(zhuǎn)變,”Roddy 說?!半S著小芯片封裝取代單片集成電路,混合和匹配完全可編程 CPU、GPU、GPNPU(通用可編程 NPU)和其他處理引擎以完成特定任務(wù)的能力將首先影響數(shù)據(jù)中心,然后隨著小芯片封裝成本隨著產(chǎn)量的增加而不可避免地降低,慢慢輻射到更大批量、更成本敏感的市場?!?/p>

多個市場,多個權(quán)衡

雖然大多數(shù)注意力都集中在訓(xùn)練新模型的大型數(shù)據(jù)中心上,但最終的收益將歸于使用這些模型進(jìn)行推理的設(shè)備。這些設(shè)備無法承擔(dān)用于訓(xùn)練的巨額電力預(yù)算?!坝糜谟?xùn)練人工智能的硬件有點標(biāo)準(zhǔn)化,”Ansys產(chǎn)品營銷總監(jiān)馬克·斯溫寧 (Marc Swinnen) 說?!澳阗徺I NVIDIA 芯片,這就是你訓(xùn)練人工智能的方式。但是一旦你建立了模型,你如何在最終應(yīng)用程序中(也許是在邊緣)執(zhí)行該模型。這通常是為該人工智能算法的特定實現(xiàn)量身定制的芯片。獲得高速、低功耗人工智能模型的唯一方法是為其構(gòu)建定制芯片。人工智能將成為執(zhí)行這些模型的定制硬件的巨大驅(qū)動力?!?/p>

他們要做一系列類似的決定?!安⒉皇敲總€ AI 加速器都是一樣的,”Mythic 的 Fick 說?!瓣P(guān)于如何解決 AI 帶來的內(nèi)存和性能挑戰(zhàn),有很多很棒的想法。特別是,有新的數(shù)據(jù)類型可以一直到 4 位浮點甚至 1 位精度??梢允褂?a href="http://hljzzgx.com/analog/" target="_blank">模擬計算來獲得極高的內(nèi)存帶寬,從而提高性能和能效。其他人正在考慮將神經(jīng)網(wǎng)絡(luò)精簡到最關(guān)鍵的位,以節(jié)省內(nèi)存和計算。所有這些技術(shù)都將產(chǎn)生在某些領(lǐng)域強大而在其他領(lǐng)域薄弱的硬件。這意味著更大的硬件和軟件協(xié)同優(yōu)化,以及需要建立一個具有各種 AI 處理選項的生態(tài)系統(tǒng)?!?/p>

這正是 AI 和 RISC-V 的利益交匯之處。Sigasi 首席執(zhí)行官 Dieter Therssen 表示:“在 LLM 等軟件任務(wù)方面,它們將占據(jù)主導(dǎo)地位,足以推動新的硬件架構(gòu),但不會完全停止差異化,至少在短期內(nèi)不會?!薄凹词?RISC-V 的定制也是基于進(jìn)行一些 CNN 或 LLM 處理的需求。這里的一個關(guān)鍵因素是如何部署 AI。目前,有太多方法可以做到這一點,因此成像融合仍然遙不可及?!?/p>

結(jié)論

AI 是新興事物,發(fā)展速度如此之快,以至于沒有人能給出明確的答案。對于現(xiàn)有的應(yīng)用程序來說,最佳架構(gòu)是什么?未來的應(yīng)用程序是否看起來足夠相似,以至于現(xiàn)有架構(gòu)只需擴展?這似乎是一個非常幼稚的預(yù)測,但今天它可能是許多公司的最佳選擇。

GPU 和在其之上構(gòu)建的軟件抽象使 AI 的快速崛起成為可能。它為我們看到的擴展提供了足夠的框架,但這并不意味著它是最高效的平臺。模型開發(fā)在一定程度上被迫朝著現(xiàn)有硬件支持的方向發(fā)展,但隨著更多架構(gòu)的出現(xiàn),AI 和模型開發(fā)可能會根據(jù)可用的硬件資源及其對電力的需求而出現(xiàn)分歧。電力很可能成為主導(dǎo)兩者的因素,因為目前的預(yù)測是,AI 將很快消耗掉全球發(fā)電能力的很大一部分。這種情況不能繼續(xù)下去。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 芯片
    +關(guān)注

    關(guān)注

    455

    文章

    50714

    瀏覽量

    423131
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    30728

    瀏覽量

    268880
  • 人工智能
    +關(guān)注

    關(guān)注

    1791

    文章

    47183

    瀏覽量

    238235

原文標(biāo)題:芯片,將發(fā)生巨變?

文章出處:【微信號:wc_ysj,微信公眾號:旺材芯片】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    EDA 市場再迎巨變,新思收購 Ansys?!

    電子發(fā)燒友網(wǎng)報道(文/周凱揚)收購并購整合一向是 EDA 市場恒久不變的周期定律,無論是三巨頭,還是初創(chuàng)企業(yè),幾乎都是這樣過來的。然而,自從2016年西門子收購 Mentor Graphics 以來,我們已經(jīng)很少看到大型 EDA 廠商的收購并購案了。 ? 然而就在近期,路透社報道新思已經(jīng)向知名仿真軟件廠商 Ansys 發(fā)出收購交易談判,或許會以每股 400 美元以上的報價,收購這家市值 300 億美元以上的廠商。消息源稱如果談判順利的話,很可能會在未來幾周公開這一消
    的頭像 發(fā)表于 12-26 00:25 ?3348次閱讀
    EDA 市場再迎<b class='flag-5'>巨變</b>,新思<b class='flag-5'>或</b><b class='flag-5'>將</b>收購 Ansys?!

    DAC81416多通道輸出口連一起,輸出不同電壓,會發(fā)生什么?

    大家好,如果DAC的多個輸出通道連在一起,輸出不同電壓,會發(fā)生什么?
    發(fā)表于 11-20 07:36

    小鵬汽車2024 AI科技日:圖靈AI芯片進(jìn)展公布,預(yù)計AI汽車市場迎來巨變

    在11月6日下午的2024小鵬AI科技日上,小鵬汽車揭曉了其圖靈AI芯片的最新研發(fā)成果。小鵬汽車強調(diào),這款圖靈芯片是專為AI應(yīng)用而生,配備了40核處理器,能夠本地運行參數(shù)高達(dá)30B的大模型,同時集成了2個NPU以及針對神經(jīng)網(wǎng)絡(luò)優(yōu)化的特定領(lǐng)域架構(gòu)。
    的頭像 發(fā)表于 11-07 14:56 ?849次閱讀

    芯片知識:如何語音精確燒錄至語音芯片

    精心錄制的語音內(nèi)容及控制程序,精細(xì)地編織進(jìn)可編程語音芯片的內(nèi)部。每一次燒錄,都是對聲音藝術(shù)的一次雕琢,讓芯片發(fā)生機。而針對不同類型的語音芯片
    的頭像 發(fā)表于 10-19 08:01 ?180次閱讀
    <b class='flag-5'>芯片</b>知識:如何<b class='flag-5'>將</b>語音精確燒錄至語音<b class='flag-5'>芯片</b>

    請問有0-5V電壓轉(zhuǎn)換成4-20mA信號的芯片嗎?

    我想生成一個4-20mA的交流信號模擬壓力傳感器信號,目前想利用芯片信號發(fā)生器生成的電壓信號轉(zhuǎn)換成電流信號,請問有合適的芯片嗎?
    發(fā)表于 08-05 06:22

    WiFi芯片和BT芯片Lora 2.4G Hz芯片放在同一個板上會有問題嗎?

    WiFi 芯片和 BT 芯片 Lora 2.4G Hz 芯片放在同一個板上會有問題嗎?有什么參考設(shè)計
    發(fā)表于 07-08 08:19

    英偉達(dá)推出融合Arm與Blackwell內(nèi)核的AI PC芯片

    近日,業(yè)內(nèi)傳出英偉達(dá)正在研發(fā)一款全新芯片的傳聞。據(jù)悉,這款芯片結(jié)合下一代Arm Cortex CPU內(nèi)核與英偉達(dá)自家的Blackwell GPU內(nèi)核,主要面向Windows on Arm的AI PC設(shè)備市場。
    的頭像 發(fā)表于 05-31 10:31 ?590次閱讀

    函數(shù)發(fā)生器、信號發(fā)生器和波形發(fā)生器的區(qū)別

    在電子測試和測量領(lǐng)域,函數(shù)發(fā)生器、信號發(fā)生器和波形發(fā)生器都是重要的測試儀器,它們各自具有獨特的功能和應(yīng)用場景。本文詳細(xì)介紹這三種發(fā)生器的原
    的頭像 發(fā)表于 05-15 14:49 ?1572次閱讀

    什么是信號發(fā)生

    信號發(fā)生器是一種能提供各種頻率、波形和輸出電平電信號的設(shè)備,也稱為信號源振蕩器。在生產(chǎn)實踐和科技領(lǐng)域中,信號發(fā)生器有著廣泛的應(yīng)用,主要用于測量各種電信系統(tǒng)電信設(shè)備的振幅特性、頻率特
    的頭像 發(fā)表于 05-07 15:26 ?1208次閱讀

    蘋果市值攀升1120億美元,人工智能項目帶來巨變

    此次蘋果股價的大幅攀升主要得益于其在人工智能領(lǐng)域的布局。盡管蘋果在AI領(lǐng)域已有諸多布局,但尚未推出相關(guān)服務(wù)。據(jù)IT之家早前報道,蘋果將于今年底推出M4系列芯片,以提升AI任務(wù)處理能力,此舉無疑對蘋果股價產(chǎn)生積極影響。
    的頭像 發(fā)表于 04-12 10:55 ?504次閱讀

    馬斯克預(yù)測明年2026年AI超越最聰明的人類

    馬斯克認(rèn)為,如果 AGI 界定為超越最聰明的人類智力水平,那么這可能發(fā)生在明年兩年內(nèi)。AGI 研究務(wù)求打造出具備類似人類般的智能決策與自學(xué)能力的軟件,如今已成為了人工智能領(lǐng)域的重要議題。
    的頭像 發(fā)表于 04-09 15:52 ?476次閱讀

    核芯互聯(lián)發(fā)布時鐘發(fā)生芯片CLG0841和CLG0851

    核芯互聯(lián)公司近日發(fā)布了全新的時鐘發(fā)生芯片——CLG0841和CLG0851,這兩款芯片均支持PCIe Gen 6標(biāo)準(zhǔn),展現(xiàn)出了強大的技術(shù)實力和創(chuàng)新精神。CLG08x1系列時鐘發(fā)生
    的頭像 發(fā)表于 03-29 09:56 ?638次閱讀

    Galaxy Z Flip6搭載Exynos芯片

    據(jù)X博主@Kro_Roe透露,Galaxy Z Flip6提供兩款不同的型號選擇,一個搭載自家Exynos芯片,另一個則采用高通驍龍?zhí)幚砥?。若該消息屬實,這將是Exynos 芯片首次應(yīng)用在Galaxy Z系列智能手機上。
    的頭像 發(fā)表于 03-25 10:41 ?977次閱讀

    5分鐘內(nèi)Raspberry Pi Pico變成簡單的示波器+波形發(fā)生

    5 分鐘內(nèi) Raspberry Pi Pico(任何 RP2040 板)變成簡單的示波器+波形發(fā)生器。
    的頭像 發(fā)表于 03-04 09:14 ?2124次閱讀
    5分鐘內(nèi)<b class='flag-5'>將</b>Raspberry Pi Pico變成簡單的示波器+波形<b class='flag-5'>發(fā)生</b>器

    STM芯片鎖定無法發(fā)送ACK的原因是什么?

    我正在嘗試在 STM32F427IGH6芯片上進(jìn)行固件升級,英飛凌XMC4800-F144K2048芯片作為主芯片,STM
    發(fā)表于 01-30 06:55
    RM新时代网站-首页