RM新时代网站-首页

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

GPU在不同形態(tài)下的擴展性問題

E4Life ? 來源:電子發(fā)燒友網(wǎng) ? 作者:周凱揚 ? 2022-09-28 07:23 ? 次閱讀
AI和大數(shù)據(jù)時代到來之后,GPU單兵作戰(zhàn)就變成了奢望,以現(xiàn)在的數(shù)據(jù)中心和超算為例,動輒就是成千上萬張GPU,龐大的GPU網(wǎng)絡(luò)交換機和光模塊的支持下代表了這個計算時代下最高的算力。但并非只有數(shù)據(jù)中心和超算里的GPU才需要這樣的擴展性,嵌入式GPU和專業(yè)GPU同樣如此。

物理限制的嵌入式GPU

隨著各種傳感器的性能持續(xù)走高,譬如多線激光雷達、高分辨率的圖像傳感器等,我們對邊緣計算單元尤其是GPU的需求也在持續(xù)增加。但在實現(xiàn)的過程中,我們還有一些物理限制沒法消除,像是尺寸、重量和功耗等。

為了解決這一系列問題,美國政府和行業(yè)方案提供商們成立了SOSA聯(lián)盟,以求開發(fā)開放的標(biāo)準(zhǔn)和最好的方案來實現(xiàn)高性價比、互操作性強的傳感器系統(tǒng)。如何克服這些負(fù)載計算工作量提升帶來的挑戰(zhàn),又能不增加寶貴的物理資源呢?答案自然還是將GPU、DPU等技術(shù)集成到嵌入式結(jié)構(gòu)中去。

這類嵌入式GPU并非用來單獨售賣,而是交給合作伙伴整合到不同的邊緣計算系統(tǒng)中,比如研華、凌華、EIZO、Mercury Systems等,然后交付給美國空軍、洛克希德·馬丁這類軍事、航空、工業(yè)客戶。
poYBAGMyz06AQTcGAATW0aCjh0Y676.png
MXM嵌入式GPU模塊 / 凌華科技

即便選擇了嵌入式結(jié)構(gòu),也還有著不少的路線,比如GPU、FPGAASIC等等。SOSA聯(lián)盟主席,來自美國空軍的Ilya Lipkin表示,如果想要更快的運行速度,快速部署軟件,自然是選擇GPU最好。但他們也面臨著空間的問題,因為嵌入式GPU往往會被塞到3U或者6U的服務(wù)器里,他們想要做到更小的體積,甚至是手掌大小,可這樣一來就不得不犧牲帶寬、容量。

所以,雖然嵌入式GPU仍然在這些嵌入式傳感系統(tǒng)中可以保持領(lǐng)先地位,但他們并沒有像獲得數(shù)據(jù)中心那樣不算嚴(yán)格的空間要求。目前的MXM嵌入式GPU可以做到PCIe GPU五分之一的尺寸,但這對于嵌入式GPU的擴展性來說還不算完美。在邊緣計算上,反倒是一些FPGA和ASIC方案在能耗比和擴展性上占優(yōu),如果嵌入式GPU不能做到更強大的擴展性,很有可能會被后來者顛覆。

顯卡交火時代的結(jié)束

不管是最新發(fā)布的RTX4090消費級顯卡,還是RTX 6000這樣的專業(yè)顯卡,都象征了英偉達在新架構(gòu)GPU上的又一次創(chuàng)新。在臺積電4N工藝的加持下,無論是晶體管數(shù)目還是CUDA核心都做到了極致。

然而,原本變成了專屬英偉達高端消費顯卡和專業(yè)顯卡的交火技術(shù)NVLink,在RTX4090和RTX 6000上卻無處可尋,難不成英偉達徹底放棄顯卡交火技術(shù),也就此放棄NVLink了?根據(jù)英偉達CEO黃仁勛的說法,他們省下了NVLink連接器的空間,釋放了更多的空間來處理更多的AI計算。

在上一代顯卡的NVLink中,通過連接兩塊英偉達顯卡,使用高端顯卡和專業(yè)顯卡的專業(yè)系統(tǒng)能夠獲得更高的帶寬和雙倍的顯存容量。這樣的提升對于個人或?qū)I(yè)用戶來說是極大的提升,那么為何英偉達會放棄NVLink呢?筆者也在英偉達GTC的一次分享會議上提出了這一問題。

pYYBAGMyz1mAbmUdABHfZT5_49Y177.png
RTX6000 / 英偉達
英偉達方面表示,就RTX 6000這類專業(yè)顯卡而言,他們?nèi)∠鸑VLink后省下了足夠的空間,塞入了更多的計算單元來提升單卡的性能。與此同時,雖然這些專業(yè)顯卡的NVLink支持被取消,不代表英偉達放棄了這一技術(shù)。英偉達決心將NVLink的重心放在數(shù)據(jù)中心產(chǎn)品上,比如Grace CPU、Hopper GPU,他們通過NVLink Die to Die和Chip to Chip的互聯(lián)可以實現(xiàn)更好的擴展性。

但這確實象征著一個時代的結(jié)束,過去AMD的交火和英偉達的SLI也是兩家競爭最火熱的一項技術(shù),可隨著AMD放棄了交火支持,英偉達的SLI在換成NVLink后如今也迎來了終結(jié)。

但顯卡交火的落幕也情有可原,且不說這種互聯(lián)方式的受眾群體一再變少,要想享受到顯卡交火的性能也需要軟件追加更新支持。或許專業(yè)顯卡的目標(biāo)還是追求單卡性能就好,多卡互聯(lián)的支持還是讓給數(shù)據(jù)中心吧。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    4729

    瀏覽量

    128890
收藏 人收藏

    評論

    相關(guān)推薦

    訓(xùn)練AI大模型需要什么樣的gpu

    訓(xùn)練AI大模型需要選擇具有強大計算能力、足夠顯存、高效帶寬、良好散熱和能效比以及良好兼容性和擴展性GPU選擇時,需要根據(jù)具體需求進行權(quán)衡和選擇。
    的頭像 發(fā)表于 12-03 10:10 ?103次閱讀

    深度評測:云計算平臺的優(yōu)勢和不足

    云計算平臺具有成本效益、靈活性和可擴展性、簡化維護和升級、全球訪問性以及災(zāi)難恢復(fù)等優(yōu)勢,但也面臨安全性問題、依賴性問題、合規(guī)性和隱私問題、性能限制以及遷移復(fù)雜性等挑戰(zhàn)。企業(yè)采用云計算
    的頭像 發(fā)表于 11-22 10:48 ?152次閱讀

    Perforce Helix Core通過ISO 26262認(rèn)證!為汽車軟件開發(fā)團隊提供無限可擴展性、細(xì)粒度安全性、文件快速訪問等

    News!Helix Core通過ISO 26262認(rèn)證,符合汽車系統(tǒng)開發(fā)所需的安全和可靠性標(biāo)準(zhǔn),助力汽車軟件安全合規(guī)!具備無限可擴展性、細(xì)粒度安全性、文件快速訪問...是眾多汽車OEM和供應(yīng)商的首選版本控制工具。
    的頭像 發(fā)表于 11-12 14:41 ?821次閱讀
    Perforce Helix Core通過ISO 26262認(rèn)證!為汽車軟件開發(fā)團隊提供無限可<b class='flag-5'>擴展性</b>、細(xì)粒度安全性、文件快速訪問等

    GPU算力租用平臺怎么樣

    GPU算力租用平臺以其成本效益、靈活性與可擴展性、簡化運維以及即時訪問等優(yōu)勢,深度學(xué)習(xí)、科學(xué)計算、圖形渲染等多個領(lǐng)域發(fā)揮著重要作用。
    的頭像 發(fā)表于 10-17 10:03 ?198次閱讀

    Cincoze高階效能&amp;PCIe擴展型工控機

    應(yīng)用于如機器視覺、AI運算等要求高度運算效能與實時GPU圖像辨識速度的應(yīng)用場景。DS?系列不僅具備強大的處理能力,還支持多種擴展模塊,以及多元的認(rèn)證標(biāo)準(zhǔn),確保苛刻的環(huán)境持續(xù)穩(wěn)定運行
    的頭像 發(fā)表于 10-15 14:49 ?162次閱讀
    Cincoze高階效能&amp;PCIe<b class='flag-5'>擴展</b>型工控機

    Imagination DXS GPU:重塑汽車智能與交互的未來

    增長。在此背景,Imagination公司最新推出的DXS GPU IP產(chǎn)品,以其可擴展性、靈活性和強大的計算能力,為車載智能與交互系統(tǒng)注入了新的活力。
    的頭像 發(fā)表于 09-23 13:06 ?778次閱讀

    使用低成本MSPM0 MCU無線電動工具和園藝工具中實現(xiàn)可擴展性

    電子發(fā)燒友網(wǎng)站提供《使用低成本MSPM0 MCU無線電動工具和園藝工具中實現(xiàn)可擴展性.pdf》資料免費下載
    發(fā)表于 09-02 11:47 ?2次下載
    使用低成本MSPM0 MCU<b class='flag-5'>在</b>無線電動工具和園藝工具中實現(xiàn)可<b class='flag-5'>擴展性</b>

    國產(chǎn)NVMe SSD擴展卡:驅(qū)動存儲新紀(jì)元

    NVMe技術(shù)的標(biāo)準(zhǔn)化接口使得不同廠商的設(shè)備能夠更好地兼容和互操作,提升了存儲系統(tǒng)的靈活性和擴展性
    的頭像 發(fā)表于 08-17 14:59 ?1451次閱讀
    國產(chǎn)NVMe SSD<b class='flag-5'>擴展</b>卡:驅(qū)動存儲新紀(jì)元

    大模型發(fā)展,國產(chǎn)GPU的機會和挑戰(zhàn)

    電子發(fā)燒友網(wǎng)站提供《大模型發(fā)展,國產(chǎn)GPU的機會和挑戰(zhàn).pdf》資料免費下載
    發(fā)表于 07-18 15:44 ?10次下載
    大模型發(fā)展<b class='flag-5'>下</b>,國產(chǎn)<b class='flag-5'>GPU</b>的機會和挑戰(zhàn)

    進一步解讀英偉達 Blackwell 架構(gòu)、NVlink及GB200 超級芯片

    。允許在網(wǎng)絡(luò)結(jié)構(gòu)中直接減少和組合張量,優(yōu)化計算任務(wù)并增強圖形處理器集群的可擴展性。 **5. **安全性和可靠性 引入英偉達機密計算技術(shù),不影響性能的情況,增強了大規(guī)模實時生成式人工智能推理的安全性
    發(fā)表于 05-13 17:16

    FPGA深度學(xué)習(xí)應(yīng)用中或?qū)⑷〈?b class='flag-5'>GPU

    、運動和電力限制等環(huán)境因素。 Larzul 說:“一些關(guān)鍵的應(yīng)用場景中,比如智慧城市的視頻監(jiān)控,要求硬件暴露在對 GPU 有不利影響的環(huán)境因素 (比如太陽) 。“ GPU 受晶體管
    發(fā)表于 03-21 15:19

    Andes RISC-V CON全球巡回展,思爾芯邀您共同探索RISC-V

    當(dāng)前RISC-V技術(shù),以其開源性、簡潔性及高度可擴展性,各個領(lǐng)域中發(fā)揮著日益重要的作用。
    的頭像 發(fā)表于 03-21 14:45 ?473次閱讀

    FPGA與AISC的差異

    擴展性較好,可以通過增加芯片數(shù)量或使用更大容量的芯片來滿足更高的性能需求。而ASIC的可擴展性相對較差,需要重新設(shè)計和制造。 驗證和調(diào)試 :FPGA的驗證和調(diào)試過程相對簡單,可以系統(tǒng)級進行仿真和測試。而
    發(fā)表于 02-22 09:54

    分布式大屏控制系統(tǒng)的可擴展性設(shè)計

    分布式大屏控制系統(tǒng)的可擴展性設(shè)計是確保系統(tǒng)能夠適應(yīng)不斷增長的需求和未來發(fā)展的關(guān)鍵因素。以下是可擴展性設(shè)計的幾個方面: 模塊化設(shè)計:將系統(tǒng)劃分為多個模塊,每個模塊具有獨立的功能和接口。這種設(shè)計方式使得
    的頭像 發(fā)表于 01-29 14:46 ?575次閱讀

    三星攜手紅帽真實用戶環(huán)境驗證CXL內(nèi)存技術(shù)

    CXL憑借其統(tǒng)一的接口標(biāo)準(zhǔn),通過PCIe接口連接各類處理器如CPU、GPU及內(nèi)存設(shè)備,有效解決了當(dāng)前系統(tǒng)速度、延遲和可擴展性上所面臨的瓶頸。
    的頭像 發(fā)表于 12-27 10:45 ?483次閱讀
    RM新时代网站-首页