自文明的曙光乍現(xiàn)以來,磁盤驅(qū)動(dòng)器和RAM(隨機(jī)存取存儲(chǔ)器)之間不堪的I/O關(guān)系一直是計(jì)算瓶頸。SSD(固態(tài)硬盤)的出現(xiàn)松緩但卻并沒有改變這一I/O瓶頸。有三項(xiàng)進(jìn)展正在密謀將這個(gè)瓶頸推向CPU(中央處理器)。
首先,近十年,訪問速率和聯(lián)網(wǎng)速率分別登頂25Gb/s和58Gb/s,且在向100Gb/s逼近。計(jì)算機(jī)可以像訪問自己的磁盤一樣快地將數(shù)據(jù)從遠(yuǎn)程系統(tǒng)移動(dòng)到自己的磁盤上。其次,磁盤和RAM之間的I/O屏障即將消失;在這之后,RAM和緩存之間的障礙也就隨之土崩瓦解。
想象一下你所有的內(nèi)容都在RAM硬盤中,但不僅僅在RAM中,還在L1緩存內(nèi)。你可花不到2000美元買一臺(tái)帶64GB RAM的上好電腦,但想象一下艾字節(jié)(EB)大的緩存容量。這是個(gè)很大的數(shù),只需5EB就可裝下人類所說過的所有話。來看下圖1中的圖表。
圖1:HDD(硬盤驅(qū)動(dòng)器)、SSD、新型超高速存儲(chǔ)器、融合以太網(wǎng)上的RDMA(RoCE)、L2緩存和L1緩存的訪問時(shí)間。(圖片來自Infiniband 行業(yè)協(xié)會(huì)。)
硬盤和固態(tài)硬盤的磁盤訪問時(shí)間在左側(cè),RAM和高速緩存訪問時(shí)間在右側(cè)。美光(Micron)公司的3D Xpoint NVM(非易失性存儲(chǔ)器)技術(shù)凸顯了這一趨勢(shì):新的數(shù)據(jù)存儲(chǔ)技術(shù)在朝著RAM存取時(shí)間的方向發(fā)展。
綠色的RoCE(發(fā)音為“Rocky”)列是該難題的第二部分:將網(wǎng)絡(luò)上的許多NVM“磁盤”直接連接到RAM。 (我給“磁盤”加個(gè)引號(hào),是因?yàn)楣虘B(tài)硬盤與旋轉(zhuǎn)磁盤驅(qū)動(dòng)器的差別就像手機(jī)上的按鍵與 “撥號(hào)盤”一樣大。)可以肯定的是,RoCE并不是唯一能夠?qū)崿F(xiàn)這個(gè)的技術(shù),它只是我所了解的一個(gè)。(免責(zé)聲明:我為Infiniband行業(yè)協(xié)會(huì)撰寫過一篇關(guān)于RoCE的白皮書《RoCE Accelerates Data Center Performance, Cost Efficiency, and Scalability(RoCE可加速數(shù)據(jù)中心的性能、成本效率和可擴(kuò)展性)》;還有其他技術(shù)聲稱可以實(shí)現(xiàn)相同的奇跡,其中包括Infiniband本身和iWARP。)
RoCE是個(gè)復(fù)合縮寫詞——RDMA over converged Ethernet(融合以太網(wǎng)上的RDMA),其中RDMA代表遠(yuǎn)程直接存儲(chǔ)器訪問。DMA(直接存儲(chǔ)器訪問)一直內(nèi)置于個(gè)人電腦中。它使內(nèi)部外圍器件(磁盤驅(qū)動(dòng)器控制器、聲卡、圖形卡、網(wǎng)卡等)得以讀寫系統(tǒng)存儲(chǔ)器而不會(huì)麻煩到處理器。RDMA將DMA推廣到了網(wǎng)絡(luò)適配器,以便數(shù)據(jù)可以在不通過CPU或TCP/IP(傳輸控制協(xié)議)的主存儲(chǔ)器路徑的情況下,在不同服務(wù)器上的應(yīng)用之間傳輸。也就是說,RDMA使網(wǎng)絡(luò)接口控制器(NIC)可以直接訪問RAM,從而繞過操作系統(tǒng)并且完全沒有TCP/IP開銷。
這一難題的另一個(gè)關(guān)鍵部分是新的NVM技術(shù),如3D XPoint,它是由英特爾與美光合作開發(fā)的基于相變的固態(tài)NVM,速度會(huì)比閃存快1,000倍。該想法是在具有垂直線連接亞微觀柱體的三維設(shè)計(jì)中創(chuàng)建隨機(jī)存取技術(shù)——這些柱體的密度要比傳統(tǒng)存儲(chǔ)器高10倍。XPoint(crosspoint,交叉點(diǎn))裸片(圖2)具有兩個(gè)層和一個(gè)交叉開關(guān)矩陣設(shè)計(jì)。NAND數(shù)據(jù)是按數(shù)kB的塊尋址的,而3D XPoint NVM可以逐字節(jié)尋址,延遲時(shí)間不超過7μs。由于XPoint芯片可以安裝在DIMM上——就在存儲(chǔ)器總線上,因此可以消除“磁盤”與RAM之間的差異。
圖2:3D Xpoint設(shè)計(jì)使用堆疊裸片來增加密度。
當(dāng)3D XPoint和其他新的持久性存儲(chǔ)器技術(shù)(如3D Super-NOR)將RAM存儲(chǔ)器與我們所認(rèn)為的磁盤存儲(chǔ)技術(shù)結(jié)合在一起時(shí),一切都會(huì)改變。在3D XPoint等技術(shù)實(shí)現(xiàn)其承諾的同時(shí),RoCE將在400Gb/s網(wǎng)絡(luò)上運(yùn)行,到那時(shí),磁盤和RAM之間的區(qū)別將不復(fù)存在。
我們將不再遵循從遠(yuǎn)程磁盤到本地磁盤、到RAM、到緩存、再到數(shù)據(jù)處理的供應(yīng)鏈,而是直接從“磁盤”到數(shù)據(jù)處理。我們不僅會(huì)將“磁盤”視作甚至比“撥號(hào)盤”更過時(shí),而且隨著全球的數(shù)據(jù)都高效存儲(chǔ)在RAM中,數(shù)據(jù)處理將不再受主板和物理位置所限制。本地和云計(jì)算之間的區(qū)別將會(huì)消失,光速將成為設(shè)備可做可為的決定性因素,而CPU本身會(huì)成為處理瓶頸,摩爾定律也將繼續(xù)起支配作用。
-
存儲(chǔ)
+關(guān)注
關(guān)注
13文章
4296瀏覽量
85799 -
RAM
+關(guān)注
關(guān)注
8文章
1368瀏覽量
114641 -
網(wǎng)絡(luò)
+關(guān)注
關(guān)注
14文章
7553瀏覽量
88729 -
緩存
+關(guān)注
關(guān)注
1文章
239瀏覽量
26671
原文標(biāo)題:探討網(wǎng)絡(luò)、存儲(chǔ)、RAM和緩存的融合
文章出處:【微信號(hào):gh_bee81f890fc1,微信公眾號(hào):面包板社區(qū)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論