存儲器的歷史始于1984年,彼時(shí) Masuoka 教授發(fā)明了 NAND Flash(NAND 閃存)。1989年,東芝首款 NAND Flash 上市。2001年,許多Flash廠商推出MLC NAND Flash。2007年,東芝推出3D NAND,三星也在2012年發(fā)布其第一代3D NAND。NAND Flash 技術(shù)幾十年發(fā)展保留了相同的概念、堆疊(stack)和架構(gòu),存儲密度隨時(shí)間呈指數(shù)增長。
2010年以后,嵌入式存儲器(embedded memories, 指“集成在片內(nèi)與系統(tǒng)中各個邏輯、混合信號等IP 共同組成單一芯片中的存儲器”)開始達(dá)到28nm節(jié)點(diǎn),但是,存儲器單元(cell)在面積收縮能力、復(fù)雜度進(jìn)展緩慢,技術(shù)迭代的壓力被轉(zhuǎn)移到新興內(nèi)存和更先進(jìn)的工藝節(jié)點(diǎn)上。
2015 年,英特爾和美光公司開發(fā)了基于相變存儲器(PCM)的3D XPoint技術(shù),填補(bǔ) DRAM 和 Flash 之間的延遲差距,使新內(nèi)存架構(gòu)成為可能,也為非易失性內(nèi)存(NVM)領(lǐng)域帶來了創(chuàng)新。自2017年起,這項(xiàng)技術(shù)以 Optane品牌在公開市場上市。峰回路轉(zhuǎn),2021年美光不再認(rèn)為3D Xpoint 的持續(xù)投資是合理的,宣布放棄3D Xpoint;2022年業(yè)界傳出消息,英特爾正在關(guān)閉 Optane 業(yè)務(wù)部門。
3D XPoint 未成氣候,或許表明“方向比努力更重要”,新技術(shù)要有市場,關(guān)鍵在于能否解決應(yīng)用的計(jì)算和內(nèi)存瓶頸。例如,模擬人腦的計(jì)算系統(tǒng)往往要求高能量效率、并行性以及諸如對象識別、聯(lián)想、適應(yīng)和學(xué)習(xí)的認(rèn)知能力,對計(jì)算和內(nèi)存之間的協(xié)同工作提出新要求。
此外,社交網(wǎng)絡(luò)、流媒體和視頻點(diǎn)播等的消費(fèi)電子應(yīng)用,以及智能家居、智慧城市等物聯(lián)網(wǎng)應(yīng)用盛行,連接網(wǎng)絡(luò)的智能設(shè)備大量增加,數(shù)據(jù)量和數(shù)據(jù)中心增長快速,計(jì)算系統(tǒng)的能量消耗更多地受到數(shù)據(jù)傳輸?shù)挠绊?,而不是?jì)算本身。
面對上述問題,業(yè)界需要計(jì)算系統(tǒng)結(jié)構(gòu)的新規(guī)范,導(dǎo)致了以內(nèi)存為中心和“存內(nèi)計(jì)算 In-memory computing”系統(tǒng)的興起。在進(jìn)一步探討這些技術(shù)之前,不得不提一下近期存儲器的行情走向。
需求低迷、上游原廠減產(chǎn)
庫存調(diào)整或貫穿 2023 年
存儲器市場存在較強(qiáng)的周期性,交替出現(xiàn)短缺或者供應(yīng)過剩的時(shí)期,導(dǎo)致價(jià)格變化、收入波動等情況,當(dāng)前存儲器市場有幾個情況。
首先是降價(jià)。綜合媒體和研究機(jī)構(gòu)的消息,存儲器的供需處于失衡狀態(tài)。TrendForce 集邦咨詢報(bào)告顯示,NAND Flash 正處于供過于求的狀態(tài),下半年起,買方著重去化庫存,大幅減少采購量,賣方開出破盤價(jià)以鞏固訂單,使第三季晶圓(Wafer)價(jià)格跌幅達(dá)30~35%。但各類 NAND Flash 終端產(chǎn)品仍疲弱,原廠庫存因此急速上升,導(dǎo)致第四季 NAND Flash 價(jià)格跌幅擴(kuò)大至15~20%。而絕大部分原廠的 NAND Flash 產(chǎn)品銷售也將自今年底前正式步入虧損。原因是在高通脹影響下,消費(fèi)電子產(chǎn)品需求疲軟,第三季存儲器出貨量呈現(xiàn)每個季度遞減的趨勢,終端買方因存儲器需求明顯下滑而延緩采購,導(dǎo)致供應(yīng)商庫存壓力進(jìn)一步升高。
類似的,各 DRAM 供應(yīng)商為求增加市占的策略不變,市場上已有“第三、四季合并議價(jià)”或“先談量再議價(jià)”的情形,皆是導(dǎo)致第四季 DRAM 價(jià)格跌幅擴(kuò)大至13~18% 的原因。
其次是減產(chǎn)。部分供應(yīng)商在運(yùn)營陷入虧損的壓力下,減產(chǎn)以降低虧損是可能的對應(yīng)方式。芯查查 APP 顯示,美光已經(jīng)于9月底宣布削減 DRAM 和NAND Flash 的產(chǎn)量,成為頭家式降低產(chǎn)能利用率的制造商,并強(qiáng)調(diào)其在2023 年大幅下調(diào)資本支出,DRAM 生產(chǎn)比特的年增長率僅為 5% 左右。
NAND Flash 市場形勢比 DRAM更為嚴(yán)峻,主流產(chǎn)能晶圓的平均合同價(jià)格已經(jīng)下降到現(xiàn)金成本,并且正在接近各個制造商虧損銷售的邊緣。Kioxia(鎧俠)在美光之后相繼宣布,將從10月份起將 NAND Flash 產(chǎn)能利用率降低 30%。DRAM 目前的合同價(jià)格仍然高于主流供應(yīng)商的總生產(chǎn)成本,因此與NAND Flash 相比,是否會有進(jìn)一步的減產(chǎn)還有待觀察。
減產(chǎn)對于芯片原廠的產(chǎn)品升級計(jì)劃造成影響。美光原計(jì)劃從四季度開始逐步提高232層 NAND Flash 的比例,減產(chǎn)之后,主流工藝估計(jì)2023年仍以176層產(chǎn)品為主。Kioxia 和 WDC 原計(jì)劃從四季度開始遷移到162層產(chǎn)品,但是 WDC 減少2023年資本支出,加上需求能見度低,無法實(shí)現(xiàn)原定計(jì)劃。
趨勢 1
突破傳統(tǒng)架構(gòu),RRAM(ReRAM)存算一體
有望提升計(jì)算系統(tǒng)能效比
文章開頭提及,開發(fā)新計(jì)算系統(tǒng)源于幾點(diǎn):數(shù)據(jù)指數(shù)增長、功耗增加,當(dāng)前計(jì)算系統(tǒng)的性能限制也是原因之一。對此,業(yè)界提出“近內(nèi)存”或存內(nèi)計(jì)算(In-memory Computing),以解決數(shù)據(jù)中心的幾個問題,包括數(shù)據(jù)傳輸“存儲墻”(Memory barrier)、高功耗和時(shí)間成本。涉及深度學(xué)習(xí)網(wǎng)絡(luò)的數(shù)據(jù)中心需要巨大的計(jì)算能量,要求高可靠性、更出色容量、帶寬和性能的存儲器,從而衍生出關(guān)于新的非馮·諾依曼系統(tǒng)的新興存儲技術(shù)研究。
普遍認(rèn)為,RRAM(也即 ReRAM,阻變式隨機(jī)存取存儲器)、PCM(相變隨機(jī)存取存儲器)和 MRAM(磁隨機(jī)存取存儲器)等是下一代存儲技術(shù)路線,這些也是“存內(nèi)計(jì)算”的基礎(chǔ)技術(shù),從技術(shù)特征來看,這些技術(shù)有哪些獨(dú)特性?
資深電子器件專家 Ray 表示,上述的下一代非易失性存儲器首先是作為存儲級內(nèi)存被提出的,在存儲層級中介于內(nèi)存和硬盤之間,因此,存儲的性能指標(biāo)對這些下一代非易失性存儲器仍然適用,如面積、功耗、讀寫速度、集成性、成本等。此外,下一代非易失性存儲器也非常適用于存內(nèi)計(jì)算,而存內(nèi)計(jì)算又對這些存儲器提出了新的要求,如開關(guān)比、多阻態(tài)、魯棒性等。RRAM、PCM 和 MRAM 等是目前研究較多的下一代非易失性存儲器,它們各有優(yōu)勢和不足。
MRAM 中的磁性材料磁化方向變化的時(shí)候,從磁性材料兩端電極上讀取得到的隧穿電流會發(fā)生變化,從而得到不同電阻,其編寫速度快、重復(fù)編寫周期長,但其材料制備較復(fù)雜、開關(guān)比較低、易受擾動。
PCM 是利用相變材料在焦耳熱作用下,在結(jié)晶態(tài)和非晶態(tài)之間轉(zhuǎn)換,從而呈現(xiàn)出不同阻態(tài),其已經(jīng)在英特爾等公司的產(chǎn)品中使用,大規(guī)模集成性較好,但其寫入速度較慢、寫入能耗較大。
RRAM 主要依靠絕緣層在電場作用下,通過離子的遷移形成導(dǎo)電細(xì)絲,再通過控制導(dǎo)電細(xì)絲的通斷控制阻態(tài),綜合來看在各個指標(biāo)上均具有比較優(yōu)異的性質(zhì),其結(jié)構(gòu)簡單、存儲密度高且支持片上3D 集成、開關(guān)比可達(dá)1000以上、讀寫速度和功耗適中,且其可通過控制導(dǎo)電細(xì)絲的形態(tài)形成多阻態(tài),從而模仿生物大腦中神經(jīng)突觸功能,適合存內(nèi)計(jì)算和類腦計(jì)算。
目前 RRAM 作為新興存儲器,其規(guī)?;苽涞牧悸?、成本、外圍控制電路等還需進(jìn)一步優(yōu)化,同時(shí),我們也很欣喜地看到國內(nèi)和國際的多家制造廠商已經(jīng)布局 RRAM 的制備,并且已完成晶圓級 RRAM 芯片的流片。
在 RRAM 商業(yè)化之前,還需要解決哪些難題?Ray 說道,同其他研究一樣,RRAM 的科研主要解決科學(xué)問題,在進(jìn)行商業(yè)化的時(shí)候還有很多工程問題需要解決,包括大規(guī)模制造、架構(gòu)和軟件的配合、應(yīng)用場景等,但目前來看,其很多科學(xué)問題已經(jīng)經(jīng)過了大量的研究,取得了很多突破,這些技術(shù)問題相信隨著時(shí)間的推移也將逐步解決。
物聯(lián)網(wǎng)和網(wǎng)絡(luò)邊緣的人工智能(AI)和機(jī)器學(xué)習(xí)(ML)快速增長,這些應(yīng)用端的計(jì)算系統(tǒng)的能效比的問題日益突出,而 RRAM 作為一種較佳的解決方案,成為研究的焦點(diǎn)。
Ray 進(jìn)一步說道,目前的計(jì)算架構(gòu)采用馮諾伊曼架構(gòu),其存儲與計(jì)算單元分離,因此,在 AI 等計(jì)算應(yīng)用中,大量數(shù)據(jù)需要不斷在片下的內(nèi)存和片上的計(jì)算單元之間搬運(yùn),然而由于內(nèi)存帶寬不足帶來的“存儲墻”問題,導(dǎo)致計(jì)算延時(shí)和能耗較高,難以滿足 AI 模型的算力和功耗需求。存算一體技術(shù)將存儲單元與計(jì)算單元融合,在存儲器內(nèi)利用物理定律進(jìn)行計(jì)算,避免了“存儲墻”問題,極大地降低了數(shù)據(jù)搬運(yùn)的能耗和延時(shí),并提升了計(jì)算的能效比?;?RRAM 的存算一體目前是國內(nèi)外的研究熱點(diǎn)和前沿,其主要實(shí)現(xiàn)方式分為兩種,即模擬式存算一體和數(shù)字式存算一體。
模擬式存算一體利用了 RRAM 的模擬式阻態(tài)特性,通過電導(dǎo)存儲多比特?cái)?shù)據(jù)。以神經(jīng)網(wǎng)絡(luò)中應(yīng)用較廣泛的矩陣乘積運(yùn)算為例,其電導(dǎo)值存儲神經(jīng)網(wǎng)絡(luò)的權(quán)值,輸入為電壓值,利用歐姆定律完成乘法,得到電流值,然后陣列中同一條數(shù)據(jù)線上的電流根據(jù)基爾霍夫電流定律相加,從而完成乘加運(yùn)算。模擬式存算一體可以達(dá)到較高的存儲密度,但其對環(huán)境噪聲和溫度較敏感,運(yùn)算精度較低,主要適合低精度、小算力的應(yīng)用場景。
而數(shù)字式存算一體中,其每個 RRAM 只存儲一比特?cái)?shù)據(jù),經(jīng)過乘法運(yùn)算得到電流后再經(jīng)過數(shù)字電路進(jìn)行后續(xù)加法等運(yùn)算,此種方法雖然存儲密度低于模擬式存算一體,但其優(yōu)勢是在保證計(jì)算能效比的前提下,支持高精度、大算力的運(yùn)算,提高計(jì)算的魯棒性,從而極大地拓展了存算一體的應(yīng)用場景。
相比于 CMOS 器件,目前 RRAM 的局限性主要體現(xiàn)在編寫周期有限上,因此目前 RRAM 主要適用于 AI 推理等操作,而相信隨著工藝的演進(jìn),得到更高編寫周期的 RRAM 也是非常有希望的。另一個局限性是 RRAM 阻值的波動性,而此問題在數(shù)字式存算一體中可以得到很好的解決。
-
PCM
+關(guān)注
關(guān)注
1文章
195瀏覽量
53203 -
存儲器
+關(guān)注
關(guān)注
38文章
7484瀏覽量
163760 -
MRAM
+關(guān)注
關(guān)注
1文章
236瀏覽量
31717 -
RRAM
+關(guān)注
關(guān)注
0文章
28瀏覽量
21346 -
億鑄科技
+關(guān)注
關(guān)注
0文章
24瀏覽量
1377
原文標(biāo)題:億分享 | 供需混沌,迭代如常,存儲器迎來怎樣的 2023?
文章出處:【微信號:億鑄科技,微信公眾號:億鑄科技】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論