RM新时代网站-首页

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

算力基礎(chǔ)篇:從零開始了解算力

星融元 ? 來源:jf_55437772 ? 作者:jf_55437772 ? 2024-11-15 14:22 ? 次閱讀

什么是算力

算力即計算能力(Computing Power),狹義上指對數(shù)字問題的運算能力,而廣義上指對輸入信息處理后實現(xiàn)結(jié)果輸出的一種能力。雖然處理的內(nèi)容不同,但處理過程的能力都可抽象為算力。比如人類大腦、手機以及各類服務(wù)器對接收到的信息處理實際都屬于算力的應(yīng)用。

隨著信息技術(shù)的不斷發(fā)展,[《中國算力白皮書(2022)》]中將算力明確定義為數(shù)據(jù)中心的服務(wù)器通過對數(shù)據(jù)進(jìn)行處理后實現(xiàn)結(jié)果輸出的一種能力。當(dāng)前行業(yè)中討論的算力,狹義上可理解為CPU、GPU芯片的計算能力,廣義上可理解為芯片技術(shù)的計算能力,內(nèi)存、硬盤等存儲技術(shù)的存力,以及操作系統(tǒng)、數(shù)據(jù)庫等軟件技術(shù)的算法的三者集合。

算力的分類

隨著數(shù)字經(jīng)濟時代的到來,算力發(fā)展迎來高潮,廣泛應(yīng)用于各個領(lǐng)域,其中包括但不限于日常消費領(lǐng)域、人工智能領(lǐng)域、半導(dǎo)體技術(shù)領(lǐng)域。不同應(yīng)用場景對算力的需求各異,需要不同類型的算力支撐。目前算力主要分為通用算力、智能算力和超算算力。未來還會出現(xiàn)比傳統(tǒng)計算更高效、更快速的新一代算力,例如量子算力等。

通用算力

通用算力主要以CPU為代表,即CPU芯片執(zhí)行計算任務(wù)時所表現(xiàn)出的計算能力。不同架構(gòu)的CPU計算能力不同,因為CPU算力受核心數(shù)量、主頻、緩存大小等多種因素影響。目前可以根據(jù)DMIPS指標(biāo)來衡量CPU性能。該指標(biāo)表示CPU每秒能執(zhí)行多少百萬條Dhrystone指令。

分類特點引領(lǐng)者優(yōu)劣勢
x86復(fù)雜指令集、單核能力強Intel、AMD、海光、兆芯軟件生態(tài)好,占有率高;指令集實現(xiàn)復(fù)雜,功耗高
ARM精簡指令集、追求多核、低功耗安謀、高通、Amazon授權(quán)廠商多,能效比高;軟件生態(tài)劣于x86
MIPS精簡指令集、低功耗龍芯軟件生態(tài)弱、市占率正在下降
Power單核能力強、高可靠性、高成本IBMIBM掌控技術(shù),應(yīng)用于金融領(lǐng)域
RISC-V精簡指令集RISC-V基金會、阿里巴巴、兆易創(chuàng)新完全開放開源、模塊化、可擴展
Alpha精簡指令集、速度快申威軟件生態(tài)弱,市占率小

通用算力計算量小,但能夠提供高效、靈活、通用的計算能力。因為CPU的架構(gòu)屬于少量的高性能核心結(jié)構(gòu),即核心數(shù)量少,但核心頻率高,更加擅長處理復(fù)雜的邏輯判斷和串行計算的單線程任務(wù),如操作系統(tǒng)的管理、應(yīng)用程序的執(zhí)行以及各類后臺服務(wù)等。而這樣的設(shè)計在面對大規(guī)模并行計算任務(wù)時則顯得力不從心。

智能算力

智能算力主要以GPU、FPGA、ASIC芯片為代表。每種類型的芯片具有各自的特點和優(yōu)勢。

  • GPU(Graphics Processing Unit,圖形處理器):GPU在設(shè)計之初用于圖形渲染,即同時處理大量簡單的計算任務(wù)。不同于CPU的少量高性能核心架構(gòu),GPU擁有大量的核心數(shù)但較小的控制單元和緩存,能夠完成高度并行的計算任務(wù)。GPU主要應(yīng)用在機器學(xué)習(xí)的訓(xùn)練階段,因為機器學(xué)習(xí)的操作并不依賴于復(fù)雜指令,而是大規(guī)模的并行計算。

  • FPGA(Field Programmable Gate Array,現(xiàn)場可編程邏輯門陣列):FPGA是在PAL、GAL 等可編程器件的基礎(chǔ)上進(jìn)一步發(fā)展的產(chǎn)物。FPGA是半定制集成電路,具有可重配置的邏輯結(jié)構(gòu)。其內(nèi)部的電路不是硬刻蝕的,而是可以通過HDL(硬件描述語言)編程來重新配置。這種可編程靈活性使其可以完成人工神經(jīng)網(wǎng)絡(luò)的特定計算模式,輕松升級硬件以適應(yīng)AI場景中新的應(yīng)用需求。除此以外,F(xiàn)PGA的每個組件功能在重新配置階段都可以定制,因此在運行時無需指令,可顯著降低功耗并提高整體性能。

  • ASIC(Application-Specific Integrated Circuit,應(yīng)用特定集成電路):ASIC是專為滿足特定需求而設(shè)計的全定制集成電路芯片。ASIC的優(yōu)勢在于其能夠針對特定任務(wù)進(jìn)行深度優(yōu)化,從而實現(xiàn)更高的性能和更低的功耗。一旦量產(chǎn),其單位成本會顯著降低,尤其適合于大規(guī)模生產(chǎn)和應(yīng)用。然而,ASIC設(shè)計周期長、成本高,一旦設(shè)計完成,很難進(jìn)行修改或升級以適應(yīng)新的應(yīng)用需求。因此,在選擇使用ASIC還是FPGA時,需要根據(jù)具體的應(yīng)用場景和需求進(jìn)行權(quán)衡。對于需要高性能、低功耗且應(yīng)用場景相對固定的系統(tǒng),ASIC可能是更好的選擇;而對于需要快速適應(yīng)新技術(shù)和市場需求變化的應(yīng)用場景,F(xiàn)PGA則更具優(yōu)勢。

GPU、FPGA、ASIC能力對比表格:

td {white-space:nowrap;border:1px solid #dee0e3;font-size:10pt;font-style:normal;font-weight:normal;vertical-align:middle;word-break:normal;word-wrap:normal;} | | GPU | FPGA | ASIC |
| -------------- | -------------------------- | -------------------------------- | ----------------------------- |
| 并行計算能力 | 強大 | 靈活配置 | 高效但定制 |
| 靈活性 | 較低(專用于圖形和計算) | 高(可編程) | 低(定制后固定) |
| 功耗 | 高 | 適中 | 低 |
| 成本 | 中等 | 低 | 高(設(shè)計和制造) |
| 整體性能 | 高 | 中等(因可重置而消耗芯片資源) | 非常高(高度定制針對性強 ) |
| 應(yīng)用領(lǐng)域 | 圖形處理、機器學(xué)習(xí)等 | 實時計算、原型設(shè)計等 | 特定應(yīng)用場景(如數(shù)據(jù)中心) |

超算算力

超算即超級計算,又稱高性能計算 (HPC),利用并行工作的多臺計算機系統(tǒng)的集中式計算資源,通過專用的操作系統(tǒng)來處理極端復(fù)雜的或數(shù)據(jù)密集型的問題。超算算力則是由這些超級計算機等高性能計算集群所提供的算力,主要應(yīng)用于尖端科研、國防軍工等大科學(xué)、大工程、大系統(tǒng)中,是衡量一個國家或地區(qū)科技核心競爭力和綜合國力的重要標(biāo)志。目前,美國的Frontier以 1.206 EFlop/s的HPL性能位居全球超級計算機Top500榜第一,達(dá)到了E級計算。

中國信息通信研究院結(jié)合業(yè)內(nèi)實踐和設(shè)想,提出了超算參考架構(gòu),由計算系統(tǒng)、存儲系統(tǒng)、網(wǎng)絡(luò)系統(tǒng)、管理系統(tǒng)、安全系統(tǒng)五部分構(gòu)成。

  • 計算系統(tǒng):由CPU和異構(gòu)加速卡計算節(jié)點共同組成。
  • 存儲系統(tǒng):采用分布式存儲,可提供PB級別以上的容量來進(jìn)行數(shù)據(jù)和算據(jù)存儲。
  • 網(wǎng)絡(luò)系統(tǒng):分為存儲網(wǎng)絡(luò)、業(yè)務(wù)網(wǎng)絡(luò)以及監(jiān)控網(wǎng)絡(luò)等多個網(wǎng)絡(luò)平面,實現(xiàn)超算系統(tǒng)間各個硬件設(shè)備以及子系統(tǒng)間的通信互聯(lián)。
  • 管理系統(tǒng):包括資源與業(yè)務(wù)監(jiān)控、告警監(jiān)控、可視化等功能。
  • 安全系統(tǒng):由防火墻、負(fù)載均衡、堡壘機、抗DDoS、日志審計、漏洞掃描、DNS服務(wù)器等設(shè)備組成。

新一代算力

自人工智能加速應(yīng)用后,算力需求激增,人們很難保證在未來經(jīng)典計算能一直滿足指數(shù)級的算力增長并應(yīng)用于重大計算問題。于是在全球科技競爭加劇、數(shù)字經(jīng)濟快速發(fā)展以及新興技術(shù)的推動下出現(xiàn)了以量子計算為代表的新一代算力。

量子計算運用量子態(tài)的疊加性,使得量子比特?fù)碛懈鼜姷男畔⒕幋a能力,并可實現(xiàn)多個量子比特的量子糾纏,性能上限遠(yuǎn)超經(jīng)典計算。量子計算機使用亞原子粒子的物理學(xué)領(lǐng)域來執(zhí)行復(fù)雜的并行計算,從而取代了當(dāng)今計算機系統(tǒng)中更簡單的晶體管。傳統(tǒng)計算機中的字符,要么打開,要么關(guān)閉,要么是 1,要么是 0。而在量子比特計算中,計算單元是可以打開,關(guān)閉或之間的任何值。量子比特的“疊加態(tài)”能力,為計算方程增加了強大的功能,使量子計算機在某種數(shù)學(xué)運算中更勝一籌。

目前阿里巴巴、Google、Honeywell、IBM 、IonQ 和 Xanadu 等少數(shù)幾家公司都運營著量子計算機,但仍存在退相干、噪聲與誤差、可擴展性等問題,處于硬件開發(fā)的早期階段。根據(jù)專家預(yù)測,想要進(jìn)入量子計算機真正有用的高保真時代,還得需要幾十年。

數(shù)據(jù)中心算力組成

數(shù)據(jù)中心的計算能力主要依賴于服務(wù)器。目前CPU類型的服務(wù)器幾乎部署在所有的數(shù)據(jù)中心中,而高性能算力GPU等更多的使用在AI應(yīng)用場景中,小規(guī)模部署于部分?jǐn)?shù)據(jù)中心中。然而隨著機器學(xué)習(xí)、人工智能、無人駕駛、工業(yè)仿真等新興技術(shù)領(lǐng)域的崛起,傳統(tǒng)數(shù)據(jù)中心遭遇通用CPU在處理海量計算、 海量數(shù)據(jù)時越來越多的性能瓶頸。 在數(shù)據(jù)中心加快步伐部署48核以及64核心等更高核心CPU來應(yīng)對激增的算力需求的同時,為了應(yīng)對計算多元化的需求,越來越多的場景開始引入加速芯片,如前文提到的GPU、 FPGA、 ASIC 等。這些加速硬件承擔(dān)了大部分的新算力需求。

然而實際上的數(shù)據(jù)中心是一個匯集大量服務(wù)器、存儲設(shè)備及網(wǎng)絡(luò)設(shè)備的基礎(chǔ)設(shè)施,數(shù)據(jù)中心算力是服務(wù)器、存儲及網(wǎng)絡(luò)設(shè)備合力作用的結(jié)果,計算、存儲及網(wǎng)絡(luò)傳輸能力相互協(xié)同才能促使數(shù)據(jù)中心算力水平的提升。單獨討論服務(wù)器的算力水平并不能反映數(shù)據(jù)中心的實際算力水平。

總之,數(shù)據(jù)中心是人工智能、物聯(lián)網(wǎng)、區(qū)塊鏈等應(yīng)用服務(wù)的重要載體。數(shù)據(jù)中心算力水平的提升將會在很大程度上推動全社會總體算力供給,滿足各行業(yè)數(shù)字化轉(zhuǎn)型過程中的算力需求。

數(shù)據(jù)中心網(wǎng)絡(luò)設(shè)備

以實際情況來說,數(shù)據(jù)中心的算力水平不僅取決于服務(wù)器的算力,同時還會在很大程度上受到網(wǎng)絡(luò)設(shè)備的影響,如果網(wǎng)絡(luò)設(shè)備算力水平無法滿足要求,很有可能引發(fā)“木桶效應(yīng)”,拉低整個數(shù)據(jù)中心的實際算力水平。

星融元[CX-N系列] 交換機可以幫助用戶構(gòu)建超低時延、 靈活可靠、按需橫向擴展的數(shù)據(jù)中心網(wǎng)絡(luò)。

  • 超低時延:所搭載的交換芯片具備業(yè)界領(lǐng)先的超低時延能力,最低時延達(dá)到400ns左右。
  • 高可靠性:通過MC-LAG、EVPN Multihoming、ECMP構(gòu)建無環(huán)路、高可靠、可獨立升級的數(shù)據(jù)中心網(wǎng)絡(luò)。
  • RoCEv2能力:全系列標(biāo)配RoCEv2能力,提供PFC、ECN等一系列面向生產(chǎn)環(huán)境的增強網(wǎng)絡(luò)特性。
  • RESTful API:支持REST架構(gòu)的第三方平臺和應(yīng)用都能自動化地管理、調(diào)度星融元數(shù)據(jù)中心網(wǎng)絡(luò)。

不論是在[AI智算] 還是[HPC高性能計算] 場景下,CX-N交換機都達(dá)到了媲美InfiniBand專用交換機的性能,以下是場景測試數(shù)據(jù)表:

表一:AIGC場景性能測試結(jié)果

帶寬時延備注
E2E網(wǎng)卡直連392.95Gb/s1.95us
E2E跨交換機392.96Gb/s2.51us交換機時延560ns
NCCL網(wǎng)卡直連371.27GB/s/
NCCL跨交換機368.99GB/s/CX-N交換機端口利用率95%。

表二:HPC應(yīng)用測試(對比IB交換機)

HPC應(yīng)用測試CX-N交換機MSB7000
HPC應(yīng)用Test1[sec]Test2[sec]Test1[sec]avg[sec]Test1[sec]Test2[sec]Test3[sec]avg[sec]
WRF1140.351134.641128.351134.441106.721099.361112.681106.25
LAMMPS341.25347.19342.61343.69330.47335.58332.46332.83

參考文獻(xiàn):

https://13115299.s21i.faiusr.com/61/1/ABUIABA9GAAgqvv2nAYowLyGBA.pdf

https://13115299.s21i.faiusr.com/61/1/ABUIABA9GAAgk4DrjQYo76ziRQ.pdf

審核編輯 黃宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 交換機
    +關(guān)注

    關(guān)注

    21

    文章

    2637

    瀏覽量

    99528
  • 數(shù)據(jù)中心
    +關(guān)注

    關(guān)注

    16

    文章

    4761

    瀏覽量

    72030
  • AI算力
    +關(guān)注

    關(guān)注

    0

    文章

    72

    瀏覽量

    8651
  • 算力
    +關(guān)注

    關(guān)注

    1

    文章

    964

    瀏覽量

    14793
收藏 人收藏

    評論

    相關(guān)推薦

    杰和課堂|帶你認(rèn)識

    杰和課堂|帶你認(rèn)識力人工智能浪潮洶涌的今天,一詞頻繁出現(xiàn)在各類科技新聞、產(chǎn)業(yè)發(fā)展報告中。了解過杰和科技產(chǎn)品的讀者們,也會在杰和各產(chǎn)品參數(shù)中發(fā)現(xiàn)
    的頭像 發(fā)表于 12-06 10:24 ?248次閱讀
    杰和課堂|帶你認(rèn)識<b class='flag-5'>算</b><b class='flag-5'>力</b>

    中金數(shù)據(jù)烏蘭察布基地首批機房驗收交付

    近日,中金數(shù)據(jù)烏蘭察布基地項目首批機房業(yè)務(wù)成功完成各項驗收工作并交付客戶。同步成功承接北京市科委、中關(guān)村管委會科技合作與支援合作
    的頭像 發(fā)表于 11-28 14:40 ?120次閱讀
    中金數(shù)據(jù)烏蘭察布<b class='flag-5'>零</b>碳<b class='flag-5'>算</b><b class='flag-5'>力</b>基地首批<b class='flag-5'>算</b><b class='flag-5'>力</b>機房驗收交付

    調(diào)度的基礎(chǔ)知識

    編者按 “調(diào)度”的概念,這幾年越來越多的被提及。剛聽到這個概念的時候,我腦海里一直拐不過彎。作為底層芯片出身的我,一直認(rèn)為:是硬件的服務(wù)器和集群,他在某個地方,就是固定的;根本
    的頭像 發(fā)表于 11-27 17:13 ?147次閱讀
    <b class='flag-5'>算</b><b class='flag-5'>力</b>調(diào)度的基礎(chǔ)知識

    企業(yè)AI租賃是什么

    企業(yè)AI租賃是指企業(yè)通過互聯(lián)網(wǎng)向?qū)I(yè)的提供商租用所需的計算資源,以滿足其AI應(yīng)用的需求。以下是對企業(yè)AI
    的頭像 發(fā)表于 11-14 09:30 ?468次閱讀

    GPU開發(fā)平臺是什么

    隨著AI技術(shù)的廣泛應(yīng)用,需求呈現(xiàn)出爆發(fā)式增長。AI租賃作為一種新興的服務(wù)模式,正逐漸成為企業(yè)獲取
    的頭像 發(fā)表于 10-31 10:31 ?164次閱讀

    大模型時代的需求

    現(xiàn)在AI已進(jìn)入大模型時代,各企業(yè)都爭相部署大模型,但如何保證大模型的,以及相關(guān)的穩(wěn)定性和性能,是一個極為重要的問題,帶著這個極為重要的問題,我需要在此書中找到答案。
    發(fā)表于 08-20 09:04

    中科曙光入選2024服務(wù)產(chǎn)業(yè)圖譜及服務(wù)產(chǎn)品名錄

    近日,中國信通院公布首個《服務(wù)產(chǎn)業(yè)圖譜(2024年)》及《服務(wù)產(chǎn)品名錄(2024年)》。曙光智構(gòu)建的全國一體化
    的頭像 發(fā)表于 08-06 14:23 ?675次閱讀

    曙光攜手“互聯(lián)公共服務(wù)平臺”提高全國匹配效率

    近日,由中國信息通信研究院開發(fā)的“互聯(lián)公共服務(wù)平臺”在重慶上線。作為該平臺合作方之一,曙光智參與了平臺發(fā)布儀式。 ? ? 曙光將依托在
    的頭像 發(fā)表于 07-16 15:45 ?677次閱讀

    力系列基礎(chǔ)——與計算機性能:解鎖超能力的神秘力量!

    在《力系列基礎(chǔ)——101:從零開始了解
    的頭像 發(fā)表于 07-11 08:04 ?104次閱讀
    <b class='flag-5'>算</b>力系列基礎(chǔ)<b class='flag-5'>篇</b>——<b class='flag-5'>算</b><b class='flag-5'>力</b>與計算機性能:解鎖超能力的神秘力量!

    基礎(chǔ)設(shè)施的風(fēng)險與挑戰(zhàn)

    編者按網(wǎng)絡(luò)有一個美好的愿景,就是希望網(wǎng),能像電力和電網(wǎng)一樣:
    的頭像 發(fā)表于 06-13 08:27 ?540次閱讀
    <b class='flag-5'>算</b><b class='flag-5'>力</b>基礎(chǔ)設(shè)施的風(fēng)險與挑戰(zhàn)

    力系列基礎(chǔ)——101:從零開始了解

    相信大家已經(jīng)感受到,我們正處在一個人工智能時代。如果要問在人工智能時代最重要的是什么?那必須是:!
    的頭像 發(fā)表于 04-24 08:05 ?1002次閱讀
    <b class='flag-5'>算</b>力系列基礎(chǔ)<b class='flag-5'>篇</b>——<b class='flag-5'>算</b><b class='flag-5'>力</b>101:<b class='flag-5'>從零開始</b><b class='flag-5'>了解</b><b class='flag-5'>算</b><b class='flag-5'>力</b>

    廣東:到2025年,規(guī)模38E,智50%,國產(chǎn)70%

    目標(biāo),提出了6大類22項重點任務(wù)。據(jù)了解,近年來,廣東持續(xù)加快建設(shè),電信運營商已完成粵港澳大灣區(qū)超高速400G全光運力網(wǎng)絡(luò)建設(shè),實現(xiàn)韶關(guān)到廣州、深圳單向時延分
    的頭像 發(fā)表于 04-23 08:25 ?457次閱讀
    廣東:到2025年,<b class='flag-5'>算</b><b class='flag-5'>力</b>規(guī)模38E,智<b class='flag-5'>算</b>50%,國產(chǎn)<b class='flag-5'>算</b><b class='flag-5'>力</b>70%

    智能規(guī)模超通用,大模型對智能提出高要求

    電子發(fā)燒友網(wǎng)報道(文/李彎彎)是設(shè)備通過處理數(shù)據(jù),實現(xiàn)特定結(jié)果輸出的計算能力,常用FLOPS作為計量單位。FLOPS是Floating-point Operations Per Second
    的頭像 發(fā)表于 02-06 00:08 ?6308次閱讀

    大茉莉X16-P,5800M大稱王稱霸

    Rykj365
    發(fā)布于 :2024年01月25日 14:54:52

    網(wǎng)絡(luò)面臨三大挑戰(zhàn)

    2024年,以AIGC為代表的人工智能技術(shù)將進(jìn)一步激發(fā)需求,網(wǎng)絡(luò)、智中心、超中心將迎
    的頭像 發(fā)表于 01-12 10:39 ?1092次閱讀
    RM新时代网站-首页