RM新时代网站-首页

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

不只是智能駕駛!從SRAM到RRAM,存算一體大算力芯片將賦能更多領(lǐng)域!

Carol Li ? 來源:電子發(fā)燒友網(wǎng) ? 作者:李彎彎 ? 2023-09-25 07:00 ? 次閱讀
電子發(fā)燒友網(wǎng)報道(文/李彎彎)近幾年,隨著物聯(lián)網(wǎng)、人工智能等技術(shù)的發(fā)展,算力的需求越來越大。而在馮諾依曼架構(gòu)下,芯片性能的提升遇到瓶頸。業(yè)界開始不斷探索新的技術(shù)形式,因為具備大算力、低功耗的特點(diǎn),存算一體架構(gòu)芯片應(yīng)運(yùn)而生。

后摩智能是一家致力于存算一體大算力芯片研發(fā)的企業(yè),成立于2020年。今年5月,該公司發(fā)布了首款SRAM存算一體智駕芯片后摩鴻途?H30,這也是全球首款面向智能駕駛領(lǐng)域的存算一體芯片。此外,今年8月該公司宣布完成首款RRAM存算芯片的測試,可以說在存算一體大算力方面進(jìn)展迅速。

近日,電子發(fā)燒友采訪到后摩智能公共事務(wù)部負(fù)責(zé)人屈艷格,就其在存儲介質(zhì)及應(yīng)用賽道的選擇,存算一體發(fā)展趨勢及后摩智能未來規(guī)劃方面做了探討。

從SRAM到RRAM,后摩智能是如何選擇存儲介質(zhì)的

后摩智能今年5月推出的首款存算一體智駕芯片H30,最高物理算力256TOPS,典型功耗35W。該芯片基于SRAM存儲介質(zhì),采用數(shù)字存算一體架構(gòu),擁有極低訪存功耗和超高計算密度,僅用12nm工藝制程,在Int8數(shù)據(jù)精度下,其AI核心IPU能效比達(dá)15Tops/W,是傳統(tǒng)架構(gòu)芯片7倍以上。

據(jù)了解,H30已成功運(yùn)行CV類的經(jīng)典網(wǎng)絡(luò),以及自動駕駛領(lǐng)域先進(jìn)的BEV、Pointpillar等模型。為了更好地實(shí)現(xiàn)車規(guī)級,后摩智能基于H30 自主研發(fā)了硬件增強(qiáng)機(jī)制和檢測機(jī)制,在提升芯片可靠性的同時,進(jìn)一步保障了功能安全性。

屈艷格告訴電子發(fā)燒友,雖然相對來說,后摩智能在AI芯片方面算是入局較晚的企業(yè)了,但相對傳統(tǒng)架構(gòu)的AI芯片,后摩智能推出這款存算一體架構(gòu)的H30有它突出的優(yōu)勢。

她總結(jié)了三點(diǎn):1、高計算效率。在相同工藝制程下,它比傳統(tǒng)馮諾依曼架構(gòu)的AI芯片能效比更優(yōu),比如,英偉達(dá)Orin芯片的能效比大概是2TPOS/W,TI TDA4VH芯片的能效比大概是1TPOS/W,特斯拉FSD芯片的能效比也不到2TPOS/W,而H30存算一體芯片物理算力士256TPOS,功耗是35W,它的能效比能夠達(dá)到7.3TPOS/W。

在當(dāng)前業(yè)界,這樣的能效比是相當(dāng)高的。對于客戶來說,這是一款非常有競爭力的產(chǎn)品,因為幾乎所有的計算場景,它對功耗的需求都較為敏感,而這款產(chǎn)品在低功耗的情況下,仍然能夠?qū)崿F(xiàn)很高的算力。

2、低計算時延。因為是存算一體架構(gòu),這款芯片最大的特點(diǎn)是,在數(shù)據(jù)傳傳輸過程中不用來回搬運(yùn)數(shù)據(jù),這樣的好處是:一、極大地減少功耗,二、延時也會大大減少。后摩智能此前對此做過測算,它跟傳統(tǒng)架構(gòu)的芯片相比,大概會有兩倍的延時提升。而這在一些對安全有極高要求的場景,比如智能駕駛,優(yōu)勢會非常明顯。

3、低工藝依賴性。因為是存算一體架構(gòu),它對先進(jìn)工藝制程的依賴性并沒有那么強(qiáng),它可以用傳統(tǒng)的工藝實(shí)現(xiàn)先進(jìn)工藝才能實(shí)現(xiàn)的特點(diǎn)。比如,要實(shí)現(xiàn)100TOPS算力,大部分公司會采用比較先進(jìn)的工藝制程,12nm或者7nm,而后摩智能因為是存算一體架構(gòu)芯片,可以采用28nm,就能夠達(dá)到這樣的算力。

存算一體架構(gòu)對工藝的依賴性不強(qiáng),有其非常大的戰(zhàn)略意義。在當(dāng)前的國際局勢下,對于國內(nèi)的企業(yè)來說,如何保障供應(yīng)鏈安全很重要。如果真的出現(xiàn)先進(jìn)制程供應(yīng)緊張的情況下,存算一體架構(gòu)芯片仍然能夠用一些較成熟的工藝制程生產(chǎn)芯片,同時還能實(shí)現(xiàn)較高的算力。

除了發(fā)布首款基于SRAM存儲介質(zhì)的H30之外,后摩智能也在探索RRAM存儲介質(zhì)的存算一體芯片。RRAM雖然誕生已久,但在近幾年才較多的被關(guān)注。相對于來說,RRAM在技術(shù)成熟度上不及SRAM,為何后摩智能在成功推出SRAM介質(zhì)的存算一體芯片之后,又會著手研究RRAM存儲介質(zhì)的存算一體芯片呢?

在采訪中,屈艷格詳細(xì)介紹了不同存儲介質(zhì)的特點(diǎn),以及后摩智能在存儲介質(zhì)選擇上的考量。據(jù)她介紹,存算一體芯片有兩個很典型的特點(diǎn):一是大算力,二是低功耗。這兩個特點(diǎn)也使得它能實(shí)現(xiàn)比較高的能效比。不過從使用來看,重點(diǎn)還是要看哪個是第一個要關(guān)注的指標(biāo),是大算力,還是低功耗。而后摩智能關(guān)注的第一個指標(biāo)是大算力。

因此在進(jìn)行存儲介質(zhì)選擇的時候,后摩智能會選擇更適合做大算力場景的存儲介質(zhì),比如SRAM、MRAM、RRAM等。因為這些存儲介質(zhì),可以用來做數(shù)字電路,能夠用于智能駕駛、智能工業(yè)、機(jī)器人以及云端大模型推理等場景。而Flash這種存儲介質(zhì),更適合用在小算力,對功耗要求較高的場景,比如藍(lán)牙耳機(jī)、可穿戴手表等。屈艷格介紹說:“因為我們更關(guān)注大算力,所以會選擇在SRAM、MRAM、RRAM這些存儲介質(zhì)上做技術(shù)演進(jìn)。”

據(jù)她介紹,后摩智能當(dāng)前選擇SRAM這個存儲介質(zhì)的主要原因:一是目前SRAM在做大算力方面最為成熟,它可以支持較為先進(jìn)的工藝制程,讀寫速度也比較快。二是雖然它是很成熟的存儲介質(zhì),而在當(dāng)前的產(chǎn)業(yè)界,將它用作存內(nèi)計算,且算力達(dá)到幾十TOPS,同時又是做純數(shù)字電路,并且用在工業(yè)、智能駕駛場景中的幾乎沒有。

后摩智能在2021年通過技術(shù)驗證的流片成功,證明這條技術(shù)路徑可行,于是便進(jìn)一步推進(jìn),在今年5月推出第一代產(chǎn)品H30。這款基于SRAM的存算一體芯片H30,主要可用在智能駕駛和機(jī)器人等領(lǐng)域。屈艷格進(jìn)一步談到:“我們下一代還會基于SRAM做存算一體架構(gòu)優(yōu)化,包括整個電路、架構(gòu)的優(yōu)化,以進(jìn)一步提升產(chǎn)品性能。按照初步規(guī)劃,未來會基于SRAM介質(zhì)研發(fā)幾款產(chǎn)品,逐步將性能做到最佳?!?br />
當(dāng)然她也提到,SRAM有它的缺點(diǎn),比如存儲密度相對較低,這樣它的芯片面積會有點(diǎn)大,其計算密度相對來說不會太高。因此,后摩智能考慮再選擇一些更適合的存儲介質(zhì),比如MRAM、RRAM這些比較新型的存儲器。相對來說,這兩款存儲介質(zhì)的讀寫性能更好,存儲密度更大。

屈艷格說:“我們會在這兩款介質(zhì)上做一些技術(shù)預(yù)研,類似2021年基于SRAM做過的技術(shù)驗證,等確定行得通之后,再進(jìn)行下一步的推進(jìn),今年8月宣布的初步驗證的結(jié)果?!?她表示:“我們會根據(jù)這些存儲介質(zhì)的成熟性,以及它做存算電路的優(yōu)勢。再根據(jù)場景情況,把這個技術(shù)從SRAM切換到RRAM或者M(jìn)RAM上去?!?br />
做透智能駕駛市場,未來希望賦能機(jī)器人、云端推理等更多場景

從2020年成立到現(xiàn)在僅三年時間,后摩智能便已經(jīng)推出第一代SRAM存算一體芯片,同時完成首款RRAM大容量存儲芯片的測試。這在做存算一體大算力芯片領(lǐng)域算是相當(dāng)快了。屈艷格認(rèn)為,公司在技術(shù)和產(chǎn)品推進(jìn)上能夠如此之快,與其完善的團(tuán)隊搭建有關(guān)。

后摩智能的團(tuán)隊包括兩方面的人才:一部分是在存算一體技術(shù)領(lǐng)域有深度研究的人,一部分是在工程落地方面有豐富經(jīng)驗積累的人。在存算方面,后摩智能的團(tuán)隊發(fā)布分來自海外知名院校、研究機(jī)構(gòu)和企業(yè),在存算一體、先進(jìn)存儲器方面大概有15年左右的積累。其中一個核心成員,曾經(jīng)做過六次基于SRAM存算芯片的流片,具有豐富的經(jīng)驗。

這是偏學(xué)術(shù)方面的經(jīng)驗,另外,后摩智能很好的將這些學(xué)術(shù)經(jīng)驗與產(chǎn)業(yè)界的團(tuán)隊做了結(jié)合。后摩智能還組建了一支產(chǎn)業(yè)的工程化落地團(tuán)隊,這個團(tuán)隊大部分員工來自AMD、Intel,還有華為海思等,具有百萬級智駕芯片量產(chǎn)落地經(jīng)驗,學(xué)術(shù)和產(chǎn)業(yè)團(tuán)隊的結(jié)合,加速了公司將產(chǎn)品推向商業(yè)化落地的進(jìn)程。

在應(yīng)用賽道的選擇上,后摩智能也做了仔細(xì)的考量。據(jù)屈艷格介紹,公司成立初期,做了大量的調(diào)研,去思考選擇什么樣的賽道,對數(shù)據(jù)中心、安防、智能駕駛等都進(jìn)行了分析。

比如數(shù)據(jù)中心,這個市場需要大算力,需求量也非常大,尤其是今年大模型迅速發(fā)展,未來市場空間會更大。可是分析下來可以發(fā)現(xiàn),數(shù)據(jù)中心市場90%以上由英偉達(dá)的GPU占據(jù),算法迭代快,對英偉達(dá)CUDA生態(tài)的依賴強(qiáng)。第三方初創(chuàng)企業(yè)想進(jìn)去構(gòu)建自己的生態(tài),很難。

再比如安防市場,相對來說它對算力的要求比較低,生態(tài)依賴度不高,是一個成熟市場??墒?,它對算力要求并不高。而后摩智能的核心特點(diǎn)是,容易做大算力的產(chǎn)品,安防市場并不能凸顯出公司的優(yōu)勢。

后來確定選擇智能駕駛賽道,有兩個方面的原因:1、當(dāng)前智能駕駛是一個發(fā)展比較快的行業(yè),每年增速差不多30%以上。尤其現(xiàn)在,我國智能化全球領(lǐng)先,未來市場極其可觀。智能駕駛對算力要求很大,L1/L2可能需要幾TOPS,到L2++以及未來L4/L5級自動駕駛,它需要的算力會達(dá)到上千TOPS,存算一體跟這個市場的需求匹配度很高。

2、雖然智能駕駛現(xiàn)在發(fā)展很快,但這個市場剛開始沒多長時間。雖然已經(jīng)有幾家巨頭企業(yè),包括英偉達(dá)、高通、TI,以及國內(nèi)幾家頭部企業(yè)開始在做,并且取得了不錯的成績。但是相對來說推進(jìn)的時間還不是很長,整個生態(tài)并沒有那么成熟,還有去沖刺的機(jī)會。

后摩智能推出的首款智能駕駛芯片,是一款通用的產(chǎn)品,它可以像英偉達(dá)Orin芯片一樣,去適配更多車廠的主流算法。目前已經(jīng)與新石器、環(huán)宇智行等無人車企業(yè)達(dá)成合作,另外在乘用車方面,也正在與車企業(yè)推進(jìn)測試中。

談到未來規(guī)劃,屈艷格表示,公司首先還是會基于SRAM存儲介質(zhì)去進(jìn)行不斷產(chǎn)品優(yōu)化,面向智能駕駛領(lǐng)域,將這塊市場打透,建立起足夠高的壁壘。此外還會不斷深耕機(jī)器人、智能工業(yè)、電力、云端推理等領(lǐng)域,去賦能更多的場景。

結(jié)尾

可以看到,經(jīng)過近幾年的發(fā)展,存算一體已經(jīng)逐漸在一些場景中得到應(yīng)用。今年以來,大模型及AIGC迅速發(fā)展,它對算力的需求越來越大,而當(dāng)前傳統(tǒng)架構(gòu)的芯片在性能提升上遇到瓶頸,存算一體在這方面卻優(yōu)勢明顯,未來將會有很大的應(yīng)用空間。

雖然存算一體作為一門新技術(shù),在產(chǎn)品和應(yīng)用的推進(jìn)上存在挑戰(zhàn)。而如今,SRAM已經(jīng)實(shí)現(xiàn)大算力的存算,新型存儲介質(zhì)也在加速推進(jìn)產(chǎn)業(yè)落地??上攵?,未來隨著MRAM、RRAM這些新型存儲介質(zhì)的成熟商業(yè)化,存算一體的可想像空間將會更大。
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • SRAM技術(shù)
    +關(guān)注

    關(guān)注

    0

    文章

    4

    瀏覽量

    1878
收藏 人收藏

    評論

    相關(guān)推薦

    開源芯片系列講座第24期:基于SRAM的高效計算架構(gòu)

    鷺島論壇開源芯片系列講座第24期「基于SRAM的高效計算架構(gòu)」明晚(27日)20:00精彩開播期待與您云相聚,共襄學(xué)術(shù)盛宴!|直播信息報告題目基于
    的頭像 發(fā)表于 11-27 01:05 ?208次閱讀
    開源<b class='flag-5'>芯片</b>系列講座第24期:基于<b class='flag-5'>SRAM</b><b class='flag-5'>存</b><b class='flag-5'>算</b>的高效計算架構(gòu)

    直播預(yù)約 |開源芯片系列講座第24期:SRAM一體高能效RISC-V計算

    鷺島論壇開源芯片系列講座第24期「SRAM一體
    的頭像 發(fā)表于 11-16 01:10 ?177次閱讀
    直播預(yù)約 |開源<b class='flag-5'>芯片</b>系列講座第24期:<b class='flag-5'>SRAM</b><b class='flag-5'>存</b><b class='flag-5'>算</b><b class='flag-5'>一體</b>:<b class='flag-5'>賦</b><b class='flag-5'>能</b>高能效RISC-V計算

    一體化與邊緣計算:重新定義智能計算的未來

    、人工智能(AI)等技術(shù)的發(fā)展,數(shù)據(jù)量的分布性、實(shí)時性需求增加,邊緣計算也逐漸概念走向落地。本文介紹
    的頭像 發(fā)表于 11-12 01:05 ?210次閱讀
    <b class='flag-5'>存</b><b class='flag-5'>算</b><b class='flag-5'>一體</b>化與邊緣計算:重新定義<b class='flag-5'>智能</b>計算的未來

    一體架構(gòu)創(chuàng)新助力國產(chǎn)大AI芯片騰飛

    在灣芯展SEMiBAY2024《AI芯片與高性能計算(HPC)應(yīng)用論壇》上,億鑄科技高級副總裁徐芳發(fā)表了題為《一體架構(gòu)創(chuàng)新助力國產(chǎn)大
    的頭像 發(fā)表于 10-23 14:48 ?278次閱讀

    【「芯片 | 高性能 CPU/GPU/NPU 微架構(gòu)分析」閱讀體驗】--全書概覽

    、GPU、NPU,給我們剖析了芯片的微架構(gòu)。書中有對芯片方案商處理器的講解,理論聯(lián)系實(shí)際,使讀者更好理解
    發(fā)表于 10-15 22:08

    科技新突破:首款支持多模態(tài)一體AI芯片成功問世

    一體介質(zhì),通過存儲單元和計算單元的深度融合,采用22nm成熟工藝制程,有效把控制造成本。與傳統(tǒng)架構(gòu)下的AI芯片相比,該款芯片
    發(fā)表于 09-26 13:51 ?401次閱讀
    科技新突破:首款支持多模態(tài)<b class='flag-5'>存</b><b class='flag-5'>算</b><b class='flag-5'>一體</b>AI<b class='flag-5'>芯片</b>成功問世

    蘋芯科技引領(lǐng)存一體技術(shù)革新 PIMCHIP系列芯片重塑AI計算新格局

    一體NPU和PIMCHIP-S300多模態(tài)智能感知芯片,以前沿技術(shù)加持AI與大模型推理加速等各類計算任務(wù)場景,為高能效應(yīng)用開啟新紀(jì)元。?
    發(fā)表于 08-08 17:21 ?251次閱讀
    蘋芯科技引領(lǐng)存<b class='flag-5'>算</b><b class='flag-5'>一體</b>技術(shù)革新   PIMCHIP系列<b class='flag-5'>芯片</b>重塑AI計算新格局

    后摩智能推出邊端大模型AI芯片M30,展現(xiàn)出一體架構(gòu)優(yōu)勢

    了基于M30芯片的智模組(SoM)和謀??AI加速卡。 ? 后摩智能
    的頭像 發(fā)表于 07-03 00:58 ?4185次閱讀

    科技助力AI應(yīng)用落地:WTMDK2101-ZT1評估板實(shí)地評測與性能揭秘

    為未來計算設(shè)備和系統(tǒng)帶來革命性變革,使其更加智能、高效和可靠。 這些年里,基于不同存儲介質(zhì)的一體芯片研究不斷涌現(xiàn),包括
    發(fā)表于 05-16 16:38

    探索內(nèi)計算—基于 SRAM內(nèi)計算與基于 MRAM 的一體的探究

    本文深入探討了基于SRAM和MRAM的一體技術(shù)在計算領(lǐng)域的應(yīng)用和發(fā)展。首先,介紹了基于SRAM
    的頭像 發(fā)表于 05-16 16:10 ?2775次閱讀
    探索<b class='flag-5'>存</b>內(nèi)計算—基于 <b class='flag-5'>SRAM</b> 的<b class='flag-5'>存</b>內(nèi)計算與基于 MRAM 的<b class='flag-5'>存</b><b class='flag-5'>算</b><b class='flag-5'>一體</b>的探究

    聚焦全國一體體系構(gòu)建,憶聯(lián)以強(qiáng)大“引擎”釋放潛能

    是數(shù)字時代的生產(chǎn),為數(shù)字經(jīng)濟(jì)與實(shí)體經(jīng)濟(jì)深度融合提供了強(qiáng)大支持。在不久前結(jié)束的全國兩會中,“全國一體
    的頭像 發(fā)表于 03-22 18:13 ?523次閱讀
    聚焦全國<b class='flag-5'>一體</b>化<b class='flag-5'>算</b><b class='flag-5'>力</b>體系構(gòu)建,憶聯(lián)以強(qiáng)大<b class='flag-5'>存</b><b class='flag-5'>力</b>“引擎”釋放<b class='flag-5'>算</b><b class='flag-5'>力</b>潛能

    iBeLink KS MAX 10.5T大領(lǐng)跑KAS新領(lǐng)域

    有8G的顯存,可以處理復(fù)雜的算法,提高挖掘穩(wěn)定性。iBeLink ks max10.5T的超大特點(diǎn)是它的高效節(jié)能,它采用了先進(jìn)的“一體”高通量
    發(fā)表于 02-20 16:11

    什么是通感一體化?通感一體化的應(yīng)用場景

    通感一體化可廣泛應(yīng)用于智能家居、智慧城市、智慧交通、醫(yī)療健康等方面。文檔君為大家搜集了些典型的應(yīng)用場景。 智能家居 通感
    發(fā)表于 01-18 16:12 ?1.1w次閱讀
    什么是通感<b class='flag-5'>算</b><b class='flag-5'>一體</b>化?通感<b class='flag-5'>算</b><b class='flag-5'>一體</b>化的應(yīng)用場景

    一體芯片如何支持Transformer等不同模型?

    后摩智能致力于打造通用人工智能芯片,自主研發(fā)的一體芯片
    的頭像 發(fā)表于 01-05 14:14 ?1338次閱讀

    SRAM一體芯片的研究現(xiàn)狀和發(fā)展趨勢

    人工智能時代對計算芯片效都提出了極高要求。
    的頭像 發(fā)表于 01-02 11:02 ?2417次閱讀
    <b class='flag-5'>SRAM</b><b class='flag-5'>存</b><b class='flag-5'>算</b><b class='flag-5'>一體</b><b class='flag-5'>芯片</b>的研究現(xiàn)狀和發(fā)展趨勢
    RM新时代网站-首页