RM新时代网站-首页

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

影響存儲系統(tǒng)性能的因素

Micron美光科技 ? 來源:Micron美光科技 ? 2024-11-18 10:35 ? 次閱讀

數(shù)據(jù)是各種現(xiàn)代企業(yè)的生命線,而數(shù)據(jù)存儲、訪問與管理策略對企業(yè)的生產(chǎn)力、盈利能力以及競爭力會產(chǎn)生顯著影響。隨著人工智能AI)的興起,各行各業(yè)都在經(jīng)歷變革,企業(yè)不得不重新思考如何利用數(shù)據(jù)來加速創(chuàng)新和增長。然而,AI訓(xùn)練和推理對數(shù)據(jù)管理和存儲提出了獨特的挑戰(zhàn),因為它們需要處理龐大的數(shù)據(jù),同時要求高性能、可擴展性和高可用性。

存儲系統(tǒng)的性能各異,受多種因素影響。在這篇博客文章中,我們將探討影響存儲系統(tǒng)在AI領(lǐng)域的表現(xiàn)的幾大因素,并重點分析所選用的基礎(chǔ)存儲介質(zhì)將如何影響這些性能因素。

AI工作負載的關(guān)鍵屬性

AI工作負載具有數(shù)據(jù)密集和計算密集的雙重特性,這意味著它們需要高速、低延遲地處理大量數(shù)據(jù)。存儲在支持AI工作負載高效且有效地訪問、攝取、處理和存儲數(shù)據(jù)方面發(fā)揮著關(guān)鍵作用。典型AI工作負載對存儲要求產(chǎn)生影響的幾個關(guān)鍵屬性包括:

·數(shù)據(jù)多樣性:AI工作負載需要從多個來源訪問數(shù)據(jù),數(shù)據(jù)格式包括結(jié)構(gòu)化、非結(jié)構(gòu)化和半結(jié)構(gòu)化,同時這些數(shù)據(jù)位于不同的位置(如本地、云端或邊緣設(shè)備)。存儲解決方案需要確保在不同環(huán)境和平臺之間實現(xiàn)快速且可靠的數(shù)據(jù)訪問和傳輸。

·數(shù)據(jù)速度:AI工作負載需要實時或近實時地處理數(shù)據(jù)。存儲解決方案需要確保在數(shù)據(jù)攝取、處理和分析過程中,實現(xiàn)高吞吐量、低延遲,以及穩(wěn)定一致的性能。

·數(shù)據(jù)量:由于AI模型越來越復(fù)雜、準確性越來越高,GPU集群計算能力不斷增長,其存儲解決方案也需要提供靈活且可擴展的容量和性能。

·數(shù)據(jù)可靠性和可用性:AI工作負載必須確保數(shù)據(jù)的完整性、安全性以及非常高的可用性,尤其是在與大型GPU集群相連時,這些集群不能容忍數(shù)據(jù)訪問發(fā)生中斷,因此相應(yīng)的要求也越高。

影響存儲系統(tǒng)性能的因素

存儲系統(tǒng)性能并非單一指標,而是多個因素的組合,取決于數(shù)據(jù)、應(yīng)用程序和數(shù)據(jù)中心基礎(chǔ)設(shè)施的特性和要求。其中包括以下幾大重要因素:

·吞吐量:從存儲系統(tǒng)到網(wǎng)絡(luò)或主機,以及從網(wǎng)絡(luò)或主機到存儲系統(tǒng)的數(shù)據(jù)傳輸速率。提高吞吐量可以改善系統(tǒng)性能,方法是增加帶寬以及減少數(shù)據(jù)流中的擁塞和瓶頸。吞吐量通常受網(wǎng)絡(luò)寬帶或存儲介質(zhì)速度的影響。

·延遲:存儲系統(tǒng)對讀寫請求的響應(yīng)時間。低延遲可以改善性能,方法是減少GPU空閑時間以及提高系統(tǒng)對用戶輸入的響應(yīng)能力。機械設(shè)備(如HDD)的延遲本質(zhì)上要遠高于固態(tài)設(shè)備(SSD)。

·可擴展性:存儲系統(tǒng)對數(shù)據(jù)量、數(shù)據(jù)速度和數(shù)據(jù)多樣性的適應(yīng)能力。高可擴展性是確保存儲系統(tǒng)能夠隨著業(yè)務(wù)需求和目標實現(xiàn)增長和演進的關(guān)鍵。在增加系統(tǒng)能夠存儲和管理的數(shù)據(jù)量方面,面臨的嚴苛挑戰(zhàn)是維持性能擴展,同時不觸及瓶頸或存儲設(shè)備的限制。

·復(fù)原力:存儲系統(tǒng)在遭遇故障、錯誤或災(zāi)難時維護數(shù)據(jù)完整性和可用性的能力。更高的可靠性可以通過降低數(shù)據(jù)損壞、丟失以及恢復(fù)的頻率和影響來提高性能。

其他存儲介質(zhì)

在數(shù)據(jù)中心應(yīng)用中,機械硬盤(HDD)和固態(tài)硬盤(SSD)是兩種主要的持久存儲設(shè)備。HDD是機械設(shè)備,通過旋轉(zhuǎn)的磁盤盤片(表面涂有一層磁性材料)來存儲數(shù)據(jù),而SSD通過固態(tài)閃存芯片來存儲數(shù)據(jù)。幾十年來,HDD一直都是主導(dǎo)的存儲設(shè)備。HDD的每位成本很低,同時具有長期斷電耐用性,但是在速度和可靠性方面不及SSD。SSD具有高吞吐量、低延遲、高可靠性,以及更密集的封裝選項等特點。

隨著技術(shù)的不斷進步和計算需求的日益增加,HDD的機械性質(zhì)確實讓其在性能上無法與SDD比肩。系統(tǒng)設(shè)計可以采用以下幾種方法來提升基于HDD的存儲系統(tǒng)的有效性能,例如將熱數(shù)據(jù)和冷數(shù)據(jù)混合存放(讓熱數(shù)據(jù)從冷數(shù)據(jù)中借用性能),在多個HDD磁盤中并行共享數(shù)據(jù)(提高吞吐量但不降低延遲),在HDD中預(yù)留冗余容量(本質(zhì)上是針對IO進行預(yù)置,而不是增加容量),以及為延遲異常的請求或操作添加SSD緩存層。從成本效益的角度來看,這些系統(tǒng)級解決方案的能力只能在有限的范圍內(nèi)擴展。實際應(yīng)用需要怎樣的性能水平,這些解決方案就需要進行相應(yīng)擴展,才能滿足性能要求。對于目前的許多AI 工作負載而言,基于HDD的系統(tǒng)在性能可擴展性和功率效率方面存在不足。

基于SSD的大容量存儲系統(tǒng)可以提供一種更為簡潔且可擴展性更強的解決方案,并且它們正在迅速發(fā)展,在許多以GPU為中心的大型數(shù)據(jù)中心中,已成為高性能AI數(shù)據(jù)湖的存儲介質(zhì)。單從驅(qū)動器層面來看,SSD(基于每位成本)的成本要高于HDD。而從系統(tǒng)層面整體來看,如果考慮到以下改進,則與HDD相比,使用SSD構(gòu)建的系統(tǒng)運營成本要低一些:

·更高的吞吐量

·延遲降低100倍以上

·每PB字節(jié)所需的服務(wù)器和機架數(shù)量更少

·可靠性更高,使用壽命更長

·在給定的性能水平下,能源效率更高

未來幾年,SSD的容量有望突破120TB。隨著容量的增加以及SSD與HDD之間價格差距的縮小,對于需要高于平均性能或在大數(shù)據(jù)集上需要極低延遲的其他工作負載(比如視頻剪輯和醫(yī)療成像診斷)來說,這些SSD將是具有吸引力的替代方案。

結(jié)論

存儲性能是運行AI工作負載的系統(tǒng)的一個重要設(shè)計標準。該性能會影響系統(tǒng)性能、可擴展性、數(shù)據(jù)可用性以及整體系統(tǒng)成本和功率要求。因此,了解不同存儲方案的特性與優(yōu)勢,并針對AI需求選擇合適的存儲解決方案至關(guān)重要。選擇合適的存儲解決方案,助您優(yōu)化AI工作負載,實現(xiàn)AI目標。

本文作者

Currie Munce

美光存儲部門高級技術(shù)顧問和戰(zhàn)略專家

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    30728

    瀏覽量

    268885
  • 存儲系統(tǒng)
    +關(guān)注

    關(guān)注

    2

    文章

    409

    瀏覽量

    40852
  • 工作負載
    +關(guān)注

    關(guān)注

    0

    文章

    9

    瀏覽量

    1948

原文標題:為什么存儲系統(tǒng)的性能對AI工作負載至關(guān)重要?

文章出處:【微信號:gh_195c6bf0b140,微信公眾號:Micron美光科技】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    PCIe延遲對系統(tǒng)性能的影響

    隨著技術(shù)的發(fā)展,計算機系統(tǒng)性能的要求越來越高。PCIe作為連接處理器、內(nèi)存、存儲和其他外圍設(shè)備的關(guān)鍵接口,其性能直接影響到整個系統(tǒng)的表現(xiàn)。
    的頭像 發(fā)表于 11-26 15:14 ?328次閱讀

    WDS分布式存儲系統(tǒng)軟件助力電信工程海量數(shù)據(jù)存儲項目

    WDS分布式存儲系統(tǒng)軟件助力電信工程海量數(shù)據(jù)存儲項目
    的頭像 發(fā)表于 11-11 09:59 ?180次閱讀
    WDS分布式<b class='flag-5'>存儲系統(tǒng)</b>軟件助力電信工程海量數(shù)據(jù)<b class='flag-5'>存儲</b>項目

    如何優(yōu)化emc存儲性能

    在當(dāng)今的數(shù)據(jù)中心環(huán)境中,存儲性能對于業(yè)務(wù)連續(xù)性和數(shù)據(jù)訪問速度至關(guān)重要。EMC作為領(lǐng)先的存儲解決方案提供商,其產(chǎn)品線涵蓋了從入門級到企業(yè)級的存儲系統(tǒng)。然而,即使是最好的
    的頭像 發(fā)表于 11-01 15:57 ?271次閱讀

    emc企業(yè)級存儲系統(tǒng)的特點

    在當(dāng)今這個數(shù)據(jù)驅(qū)動的時代,企業(yè)對于數(shù)據(jù)存儲的需求日益增長。EMC,作為全球領(lǐng)先的數(shù)據(jù)存儲解決方案提供商,其企業(yè)級存儲系統(tǒng)以其卓越的性能、可靠性和創(chuàng)新技術(shù),為企業(yè)提供了一個強大的數(shù)據(jù)管理
    的頭像 發(fā)表于 11-01 15:24 ?299次閱讀

    計算機存儲系統(tǒng)的工作原理和功能

    計算機存儲系統(tǒng)作為計算機系統(tǒng)中至關(guān)重要的組成部分,其原理和功能對于理解計算機的運行機制具有關(guān)鍵意義。以下將詳細闡述計算機存儲系統(tǒng)的原理和功能。
    的頭像 發(fā)表于 09-26 16:42 ?859次閱讀

    計算機存儲系統(tǒng)的構(gòu)成

    計算機存儲系統(tǒng)是計算機中用于存放程序和數(shù)據(jù)的設(shè)備或部件的集合,它構(gòu)成了計算機信息處理的基礎(chǔ)。一個完整的計算機存儲系統(tǒng)通常包括多個層次的存儲器,從高速緩存(Cache)到主存儲器(Mai
    的頭像 發(fā)表于 09-26 15:25 ?789次閱讀

    基于分布式存儲系統(tǒng)醫(yī)療影像數(shù)據(jù)存儲解決方案

    基于分布式存儲系統(tǒng)醫(yī)療影像數(shù)據(jù)存儲解決方案
    的頭像 發(fā)表于 09-14 09:53 ?303次閱讀
    基于分布式<b class='flag-5'>存儲系統(tǒng)</b>醫(yī)療影像數(shù)據(jù)<b class='flag-5'>存儲</b>解決方案

    基于CSS融合存儲系統(tǒng)的自動化制造服務(wù)平臺存儲解決方案

    基于CSS融合存儲系統(tǒng)的自動化制造服務(wù)平臺存儲解決方案
    的頭像 發(fā)表于 09-10 10:15 ?337次閱讀
    基于CSS融合<b class='flag-5'>存儲系統(tǒng)</b>的自動化制造服務(wù)平臺<b class='flag-5'>存儲</b>解決方案

    內(nèi)存、存儲系統(tǒng)和CPU的區(qū)別

    在計算機系統(tǒng)中,內(nèi)存、存儲系統(tǒng)和CPU是三個至關(guān)重要的組件,它們各自承擔(dān)著不同的職責(zé),共同協(xié)作以完成數(shù)據(jù)處理和運算任務(wù)。以下是對這三者之間區(qū)別的詳細闡述。
    的頭像 發(fā)表于 07-15 18:11 ?2387次閱讀

    黑龍江電力高性能WDS分布式存儲系統(tǒng)解決方案

    黑龍江電力高性能WDS分布式存儲系統(tǒng)解決方案
    的頭像 發(fā)表于 07-01 09:54 ?365次閱讀
    黑龍江電力高<b class='flag-5'>性能</b>WDS分布式<b class='flag-5'>存儲系統(tǒng)</b>解決方案

    數(shù)據(jù)中心存儲系統(tǒng)出現(xiàn)故障的處理方法有哪些?數(shù)據(jù)中心存儲系統(tǒng)出現(xiàn)故障怎么辦?

    互聯(lián)網(wǎng)+時代,大數(shù)據(jù)非常重要,如果保護好如數(shù)據(jù)存儲系統(tǒng)相當(dāng)關(guān)鍵。如今,隨著互聯(lián)網(wǎng)的快速發(fā)展,各種攻擊變得越來越嚴重,數(shù)據(jù)存儲系統(tǒng)也變得越來越不安全了,普遍來說,存儲系統(tǒng)是由主機、交換機及存儲
    的頭像 發(fā)表于 06-19 11:30 ?783次閱讀

    IOPS:存儲芯片的“心跳”性能

    IOPS,即每秒輸入/輸出操作數(shù)(Input/Output Operations Per Second),是一個用于計算機存儲設(shè)備(如硬盤,SD Nand?、eMMC等)性能測試的量測方式,是評估存儲系統(tǒng)性能的一個關(guān)鍵指標。
    的頭像 發(fā)表于 05-27 09:25 ?2244次閱讀
    IOPS:<b class='flag-5'>存儲</b>芯片的“心跳”<b class='flag-5'>性能</b>

    兆芯攜手智云創(chuàng)新推出高性能NVMe企業(yè)級存儲系統(tǒng)

    面向持續(xù)增長的數(shù)字化轉(zhuǎn)型與應(yīng)用創(chuàng)新發(fā)展需求,兆芯攜手智云創(chuàng)新,基于兆芯高性能自主處理器平臺成功推出多款信創(chuàng)存儲產(chǎn)品,包括高性能NVMe企業(yè)級存儲系統(tǒng)、HS6000系列企業(yè)級
    的頭像 發(fā)表于 04-12 14:06 ?548次閱讀

    什么是智能存儲系統(tǒng)?對比傳統(tǒng)存儲柜,智能存儲柜有哪些優(yōu)點?

    智能存儲系統(tǒng)(IntelligentStorageSystem)是一種先進的數(shù)據(jù)存儲解決方案,它結(jié)合了硬件、軟件和自動化管理功能,以實現(xiàn)對數(shù)據(jù)存儲的高度優(yōu)化、高效能、高可用性和可擴展性。是針對現(xiàn)代
    的頭像 發(fā)表于 03-05 13:53 ?491次閱讀
    什么是智能<b class='flag-5'>存儲系統(tǒng)</b>?對比傳統(tǒng)<b class='flag-5'>存儲</b>柜,智能<b class='flag-5'>存儲</b>柜有哪些優(yōu)點?

    得瑞領(lǐng)新參編團體標準《高性能計算 分布式存儲系統(tǒng)技術(shù)要求》正式發(fā)布

    得瑞領(lǐng)新參編的《高性能計算 分布式存儲系統(tǒng)技術(shù)要求》團標由中國電子工業(yè)標準化技術(shù)協(xié)會正式發(fā)布,這標志著得瑞在高性能計算和分布式存儲領(lǐng)域的技術(shù)實力得到認可,同時也展現(xiàn)了公司在行業(yè)標準制定
    的頭像 發(fā)表于 03-01 10:00 ?454次閱讀
    得瑞領(lǐng)新參編團體標準《高<b class='flag-5'>性能</b>計算 分布式<b class='flag-5'>存儲系統(tǒng)</b>技術(shù)要求》正式發(fā)布
    RM新时代网站-首页