RM新时代网站-首页

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

存算一體技術(shù)的分類(lèi)

奇普樂(lè)芯片技術(shù) ? 來(lái)源:奇普樂(lè)芯片技術(shù) ? 2024-11-05 09:56 ? 次閱讀

近年間,云計(jì)算人工智能技術(shù)的蓬勃興起,計(jì)算中心面臨著數(shù)據(jù)效率低、能耗大等核心挑戰(zhàn),這促使學(xué)術(shù)界和工業(yè)界重新聚焦。

開(kāi)宗明義,定義先行。

首先,我們先來(lái)了解一下什么是存算一體:

存算一體是通過(guò)在存儲(chǔ)器中嵌入計(jì)算能力,實(shí)現(xiàn)數(shù)據(jù)存儲(chǔ)與計(jì)算的緊密結(jié)合。其技術(shù)不僅能夠顯著提升計(jì)算效率,還能大幅降低能耗。

緊接著,存算一體技術(shù)分為三類(lèi):近存計(jì)算(Processing Near Memory, PNM)、存內(nèi)處理(Processing In Memory, PIM)和存內(nèi)計(jì)算(Computing In Memory, CIM)。

近存計(jì)算:不改變計(jì)算單元和存儲(chǔ)單元本身設(shè)計(jì)功能,采用先進(jìn)的封裝方式及合理的硬件布局和結(jié)構(gòu)優(yōu)化,增強(qiáng)二者間通信寬帶,增大傳輸速率。

存內(nèi)處理:側(cè)重于將計(jì)算過(guò)程盡可能地嵌入到存儲(chǔ)器內(nèi)部,這種方法的能效比通常較高,但計(jì)算精度可能受限。另一種思路是在存儲(chǔ)器內(nèi)部集成額外的計(jì)算單元,以支持高精度計(jì)算。

存內(nèi)計(jì)算:存儲(chǔ)單元與計(jì)算單元完全融合,無(wú)獨(dú)立計(jì)算單元,通過(guò)存儲(chǔ)器顆粒上嵌入算法,由存儲(chǔ)器芯片內(nèi)部的存儲(chǔ)單元完成計(jì)算操作。

341bc874-98c6-11ef-a511-92fbcf53809c.jpg圖源:Google

事實(shí)上,存算一體的概念由來(lái)已久。早在1969年,斯坦福研究所的Kautz等人提出了存算一體計(jì)算機(jī)的概念。其受限于當(dāng)時(shí)的芯片制造技術(shù)和算力需求的匱乏,那時(shí)存算一體僅僅停留在理論研究階段,并未得到實(shí)際應(yīng)用。

因此,后續(xù)研究人員在芯片電路結(jié)構(gòu)、計(jì)算架構(gòu)與系統(tǒng)應(yīng)用等方面開(kāi)展了一系列研究。但受限于電路設(shè)計(jì)復(fù)雜度與工藝難度,后續(xù)的大部分研究本質(zhì)上實(shí)現(xiàn)的是 “近存計(jì)算”,其與存內(nèi)計(jì)算最大的區(qū)別是,近存計(jì)算仍然需把數(shù)據(jù)從內(nèi)存中讀取出來(lái)之后再就近進(jìn)行計(jì)算,計(jì)算的結(jié)果再存儲(chǔ)到內(nèi)存當(dāng)中。

與此同時(shí),存算一體技術(shù)的核心在于將數(shù)據(jù)存儲(chǔ)與計(jì)算融合在同個(gè)芯片的同片區(qū)之中,從而徹底消除馮諾依曼計(jì)算架構(gòu)的瓶頸;將通過(guò)存儲(chǔ)器內(nèi)部進(jìn)行數(shù)據(jù)處理或計(jì)算,此技術(shù)能夠大幅減少數(shù)據(jù)在計(jì)算與存儲(chǔ)之間的傳輸時(shí)間,提升整體性能。

尤其,在馮諾伊曼架構(gòu)中,計(jì)算單元與內(nèi)存是兩個(gè)分離的單元。計(jì)算單元根據(jù)指令從內(nèi)存中讀取數(shù)據(jù),在計(jì)算單元中完成計(jì)算和處理,完成后再將數(shù)據(jù)存回內(nèi)存。

然而,整個(gè)過(guò)程中,存儲(chǔ)器與處理器之間數(shù)據(jù)交換通路窄,以及由此引發(fā)的高能耗形成兩大難題,在存儲(chǔ)與計(jì)算之間筑起一道“存儲(chǔ)墻”。能耗方面,大部分能耗在數(shù)據(jù)搬運(yùn)過(guò)程中產(chǎn)生,數(shù)據(jù)搬運(yùn)功耗是計(jì)算功耗的1000倍。而數(shù)據(jù)搬運(yùn)速度方面,AI運(yùn)算需1PB/s,但DRAM 40GB-1TB/s 都遠(yuǎn)達(dá)不到要求。

342a1690-98c6-11ef-a511-92fbcf53809c.jpg存算一體技術(shù)的分類(lèi)

過(guò)去數(shù)載,處理器性能以每年大約55%的速度提升,而相比之下,內(nèi)存性能的提升則顯著放緩,其年增長(zhǎng)率僅約為10%。這種長(zhǎng)期存在的性能發(fā)展不均衡現(xiàn)象,導(dǎo)致當(dāng)前存儲(chǔ)系統(tǒng)的訪問(wèn)速度相較于處理器的計(jì)算能力出現(xiàn)了顯著的滯后現(xiàn)象。

目前,在傳統(tǒng)計(jì)算機(jī)的設(shè)定里,存儲(chǔ)模塊是為計(jì)算服務(wù)的,因此設(shè)計(jì)上會(huì)考慮存儲(chǔ)與計(jì)算的分離與優(yōu)先級(jí)。但如今,存儲(chǔ)和計(jì)算不得不整體考慮,以最佳的配合方式為數(shù)據(jù)采集、傳輸和處理服務(wù)。

其中,雖然多核(例如CPU)/眾核(例如GPU)并行加速技術(shù)也能提升算力,但在后摩爾時(shí)代,存儲(chǔ)帶寬制約了計(jì)算系統(tǒng)的有效帶寬,芯片算力增長(zhǎng)步履維艱。從處理單元外的存儲(chǔ)器提取數(shù)據(jù),搬運(yùn)時(shí)間往往是運(yùn)算時(shí)間的成百上千倍,整個(gè)過(guò)程的無(wú)用能耗大概在60%-90%之間,能效非常低,“存儲(chǔ)墻”成為了數(shù)據(jù)計(jì)算應(yīng)用的一大障礙。

其次,存內(nèi)計(jì)算和存內(nèi)邏輯,即存算一體技術(shù)直接利用存儲(chǔ)器進(jìn)行數(shù)據(jù)處理或計(jì)算,從而把數(shù)據(jù)存儲(chǔ)與計(jì)算融合在同一個(gè)芯片的同一片區(qū)之中,從而徹底消除馮諾依曼計(jì)算架構(gòu)瓶頸,以便適用于深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)這種大數(shù)據(jù)量大規(guī)模并行的應(yīng)用場(chǎng)景。

34321d0e-98c6-11ef-a511-92fbcf53809c.jpg算力發(fā)展速度遠(yuǎn)超存儲(chǔ)

顯然,存算一體技術(shù)的演進(jìn)軌跡導(dǎo)向了計(jì)算精度的提升、算力輸出的增強(qiáng)及能效比優(yōu)化的高階,以此映射出該技術(shù)內(nèi)進(jìn)步邏輯的必然走向。

前移至感知端,向 “極致低功耗” 邁進(jìn):面向可穿戴設(shè)備、物聯(lián)網(wǎng)設(shè)備等端側(cè)市場(chǎng),打造超低功耗、超低成本的解決方案。當(dāng)前感知芯片采集到的模擬信號(hào)依賴(lài)模數(shù)轉(zhuǎn)換器轉(zhuǎn)換成數(shù)字,信號(hào)再通過(guò)智能處理器進(jìn)行處理,速度慢、功耗高。

后移至邊緣端/云端,向 “極致大算力”邁進(jìn):面向邊緣端/云端服務(wù)器、數(shù)據(jù)中 心與自動(dòng)駕駛等場(chǎng)景,利用存算一體芯片大規(guī)模并行運(yùn)算的特點(diǎn),打造超大算力解決方案。當(dāng)前的邊緣端/云端處理器大多基于 GPU 平臺(tái),而 GPU 仍然受 “存儲(chǔ)墻” 限制,存在巨大的數(shù)據(jù)通信開(kāi)銷(xiāo),導(dǎo)致其實(shí)際算力不到標(biāo)稱(chēng)算力的 10%。據(jù)分析, 以 ChatGPT 為代表的主流大模型的基本組成單元 Transformer 中約有 90% 以上的運(yùn)算為大規(guī)模矩陣運(yùn)算,可以基于存算一體陣列高效完成。

協(xié)同異構(gòu)架構(gòu)與異構(gòu)集成,實(shí)現(xiàn)合力突圍:異構(gòu)架構(gòu)將不同計(jì)算架構(gòu)、不同功能的硬件單元進(jìn)行融合,充分發(fā)揮各自的優(yōu)勢(shì),彌補(bǔ)各自的不足,以實(shí)現(xiàn)系統(tǒng)更高的性能。例如,單一的數(shù)字存算一體架構(gòu)或模擬存算一體架構(gòu)在精度、能效、面積、成本等指標(biāo)上各有優(yōu)劣,采用單一架構(gòu)難以兼具各項(xiàng)性能。

驅(qū)動(dòng) EDA 設(shè)計(jì)工具與應(yīng)用工具鏈開(kāi)發(fā):隨著存算一體芯片 從 0 到 1 的突破,已驗(yàn)證了其在 AI 應(yīng)用中的發(fā)展?jié)摿εc市場(chǎng)前景,進(jìn)而吸引上下游企業(yè)的加入,催生相應(yīng)的自動(dòng)化 EDA 設(shè)計(jì)工具、開(kāi)發(fā)環(huán)境、仿真器、編譯工具與智能算法的協(xié)同發(fā)展,縮短芯片的研發(fā)周期與應(yīng)用開(kāi)發(fā)周期,進(jìn)而推動(dòng)開(kāi)源與標(biāo)準(zhǔn)生態(tài)的建立與繁榮,形成良性循環(huán),加速存算一體芯片的規(guī)?;慨a(chǎn)與應(yīng)用。

綜上所述,當(dāng)前的存算一體芯片研究集中在單點(diǎn)技術(shù),且在器件、電路、架構(gòu)、EDA工具及系統(tǒng)應(yīng)用等方面仍然存在諸多技術(shù)待解決。

另外,從技術(shù)的角度,存算一體芯片未來(lái)的研究將圍 繞新型器件優(yōu)化、低功耗數(shù)?;旌想娐吩O(shè)計(jì)、高性能異構(gòu)芯片架構(gòu)、先進(jìn)集成與封裝、工具鏈開(kāi)發(fā)等。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 處理器
    +關(guān)注

    關(guān)注

    68

    文章

    19259

    瀏覽量

    229647
  • 存儲(chǔ)器
    +關(guān)注

    關(guān)注

    38

    文章

    7484

    瀏覽量

    163759
  • 算力
    +關(guān)注

    關(guān)注

    1

    文章

    964

    瀏覽量

    14793
  • 存算一體
    +關(guān)注

    關(guān)注

    0

    文章

    102

    瀏覽量

    4297

原文標(biāo)題:打破算力極限,存算一體技術(shù)并駕齊驅(qū)

文章出處:【微信號(hào):奇普樂(lè)芯片技術(shù),微信公眾號(hào):奇普樂(lè)芯片技術(shù)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    一體力AI芯片將逐漸走向落地應(yīng)用

    電子發(fā)燒友網(wǎng)報(bào)道(文/李彎彎)前不久,后摩智能宣布,其自主研發(fā)的業(yè)內(nèi)首款一體力AI芯片成功點(diǎn)亮,并成功跑通智能駕駛算法模型。 ? 這是
    的頭像 發(fā)表于 05-31 00:03 ?4975次閱讀

    一體更進(jìn)步,“感一體化”前景如何?

    電子發(fā)燒友網(wǎng)報(bào)道(文/吳子鵬)近段時(shí)間,一體再燃熱潮,成為破除“內(nèi)存墻”,以及打造大力芯片的主要路徑之
    的頭像 發(fā)表于 06-08 00:01 ?5424次閱讀

    探索內(nèi)計(jì)算—基于 SRAM 的內(nèi)計(jì)算與基于 MRAM 的一體的探究

    本文深入探討了基于SRAM和MRAM的一體技術(shù)在計(jì)算領(lǐng)域的應(yīng)用和發(fā)展。首先,介紹了基于SRAM的內(nèi)邏輯計(jì)算
    的頭像 發(fā)表于 05-16 16:10 ?2770次閱讀
    探索<b class='flag-5'>存</b>內(nèi)計(jì)算—基于 SRAM 的<b class='flag-5'>存</b>內(nèi)計(jì)算與基于 MRAM 的<b class='flag-5'>存</b><b class='flag-5'>算</b><b class='flag-5'>一體</b>的探究

    一體技術(shù)路線如何選

    電子發(fā)燒友網(wǎng)報(bào)道(文/李彎彎)過(guò)去幾年,越來(lái)越多企業(yè)加入到一體技術(shù)的研究中,如今,
    的頭像 發(fā)表于 06-21 09:27 ?4294次閱讀

    一體技術(shù)發(fā)展現(xiàn)狀和未來(lái)趨勢(shì)

    一體
    電子發(fā)燒友網(wǎng)官方
    發(fā)布于 :2023年04月25日 17:21:41

    科技數(shù)?;旌?b class='flag-5'>存一體AI芯片專(zhuān)利解析

    科技的該項(xiàng)專(zhuān)利是關(guān)于數(shù)?;旌?b class='flag-5'>存一體芯片技術(shù),除能有效降低設(shè)計(jì)復(fù)雜度和制造成本外,還特別適用于人工智能神經(jīng)網(wǎng)絡(luò)的運(yùn)算。
    的頭像 發(fā)表于 12-24 11:02 ?7200次閱讀
    知<b class='flag-5'>存</b>科技數(shù)?;旌?b class='flag-5'>存</b><b class='flag-5'>算</b><b class='flag-5'>一體</b>AI芯片專(zhuān)利解析

    一體芯片在可穿戴設(shè)備市場(chǎng)有哪些機(jī)會(huì)

    2022年,TWS耳機(jī)廠商在種新型計(jì)算架構(gòu)中找到突破口——一體。與傳統(tǒng)馮諾依曼架構(gòu)相比,基于
    發(fā)表于 10-14 09:38 ?1324次閱讀

    2023年一體是芯片設(shè)計(jì)的技術(shù)趨勢(shì)

    一體旨在計(jì)算單元與存儲(chǔ)單元融合,在實(shí)現(xiàn)數(shù)據(jù)存儲(chǔ)的同時(shí)直接進(jìn)行計(jì)算,以消除數(shù)據(jù)搬移帶來(lái)的開(kāi)銷(xiāo),極大提升運(yùn)算效率,以實(shí)現(xiàn)計(jì)算存儲(chǔ)的高效節(jié)能。
    的頭像 發(fā)表于 01-13 15:26 ?2264次閱讀

    關(guān)于一體,我們和ChatGPT聊了聊

    一體技術(shù)連續(xù)兩年入選了《達(dá)摩院十大科技趨勢(shì)》,被看好在高訪、高并行的人工智能場(chǎng)景的規(guī)?;瘧?yīng)用。主要是因?yàn)?/div>
    的頭像 發(fā)表于 02-09 14:31 ?2025次閱讀

    基于3DIC架構(gòu)的一體芯片仿真解決方案

    數(shù)字經(jīng)濟(jì)已成為繼農(nóng)業(yè)經(jīng)濟(jì)、工業(yè)經(jīng)濟(jì)之后的主要經(jīng)濟(jì)形態(tài)。力作為數(shù)字經(jīng)濟(jì)的核心生產(chǎn)力,將直接影響數(shù)字經(jīng)濟(jì)發(fā)展的速度,決定社會(huì)智能的發(fā)展高度。一體作為
    的頭像 發(fā)表于 02-24 09:34 ?4869次閱讀

    特斯拉的下代AI芯片:一體

    根據(jù)存儲(chǔ)與計(jì)算的距離遠(yuǎn)近,將廣義一體技術(shù)方案分為三大類(lèi),分別是近計(jì)算 (Processing Near Memory,PNM)、
    的頭像 發(fā)表于 03-09 09:22 ?1787次閱讀

    ChatGPT開(kāi)啟大模型“軍備賽”,一體開(kāi)啟力新篇章

    一體需求旺盛,有望推動(dòng)下階段的人工智能發(fā)展,原因是我們認(rèn)為現(xiàn)在
    發(fā)表于 07-06 10:20 ?426次閱讀
    ChatGPT開(kāi)啟大模型“軍備賽”,<b class='flag-5'>存</b><b class='flag-5'>算</b><b class='flag-5'>一體</b>開(kāi)啟<b class='flag-5'>算</b>力新篇章

    一體芯片的技術(shù)壁壘

    作為后摩爾時(shí)代發(fā)展的必然趨勢(shì)之,一體越來(lái)越受到行業(yè)的關(guān)注。在十問(wèn)的前六問(wèn)中,我們梳理了
    的頭像 發(fā)表于 09-22 14:16 ?864次閱讀
    <b class='flag-5'>存</b><b class='flag-5'>算</b><b class='flag-5'>一體</b>芯片的<b class='flag-5'>技術(shù)</b>壁壘

    蘋(píng)芯亮相ESWEEK,探索一體技術(shù)新思路

    蘋(píng)芯科技作為專(zhuān)注一體芯片領(lǐng)域的創(chuàng)新型企業(yè),長(zhǎng)期以來(lái)直關(guān)注國(guó)際前沿技術(shù)動(dòng)向。蘋(píng)芯很榮幸能夠在ESWEEK向廣大專(zhuān)家、學(xué)者和公眾展示我們?cè)?/div>
    的頭像 發(fā)表于 09-23 10:12 ?836次閱讀

    一體芯片新突破!清華大學(xué)研制出首顆一體芯片

    這幾天清華大學(xué)又火出圈了。但這次并不是因?yàn)檎猩鷵屓撕惋執(zhí)?,而是清華大學(xué)的芯片研發(fā)團(tuán)隊(duì)研制出全球首顆全系統(tǒng)集成的一體芯片。這是我國(guó)、乃至全世界對(duì)半導(dǎo)體行業(yè)的又重大突破。 這個(gè)芯片由
    的頭像 發(fā)表于 10-11 14:39 ?1128次閱讀
    RM新时代网站-首页