什么是算力
算力即計算能力(Computing Power),狹義上指對數(shù)字問題的運算能力,而廣義上指對輸入信息處理后實現(xiàn)結(jié)果輸出的一種能力。雖然處理的內(nèi)容不同,但處理過程的能力都可抽象為算力。比如人類大腦、手機以及各類服務(wù)器對接收到的信息處理實際都屬于算力的應(yīng)用。
隨著信息技術(shù)的不斷發(fā)展,[《中國算力白皮書(2022)》]中將算力明確定義為數(shù)據(jù)中心的服務(wù)器通過對數(shù)據(jù)進(jìn)行處理后實現(xiàn)結(jié)果輸出的一種能力。當(dāng)前行業(yè)中討論的算力,狹義上可理解為CPU、GPU等芯片的計算能力,廣義上可理解為芯片技術(shù)的計算能力,內(nèi)存、硬盤等存儲技術(shù)的存力,以及操作系統(tǒng)、數(shù)據(jù)庫等軟件技術(shù)的算法的三者集合。
算力的分類
隨著數(shù)字經(jīng)濟時代的到來,算力發(fā)展迎來高潮,廣泛應(yīng)用于各個領(lǐng)域,其中包括但不限于日常消費領(lǐng)域、人工智能領(lǐng)域、半導(dǎo)體技術(shù)領(lǐng)域。不同應(yīng)用場景對算力的需求各異,需要不同類型的算力支撐。目前算力主要分為通用算力、智能算力和超算算力。未來還會出現(xiàn)比傳統(tǒng)計算更高效、更快速的新一代算力,例如量子算力等。
通用算力
通用算力主要以CPU為代表,即CPU芯片執(zhí)行計算任務(wù)時所表現(xiàn)出的計算能力。不同架構(gòu)的CPU計算能力不同,因為CPU算力受核心數(shù)量、主頻、緩存大小等多種因素影響。目前可以根據(jù)DMIPS指標(biāo)來衡量CPU性能。該指標(biāo)表示CPU每秒能執(zhí)行多少百萬條Dhrystone指令。
分類 | 特點 | 引領(lǐng)者 | 優(yōu)劣勢 |
---|---|---|---|
x86 | 復(fù)雜指令集、單核能力強 | Intel、AMD、海光、兆芯 | 軟件生態(tài)好,占有率高;指令集實現(xiàn)復(fù)雜,功耗高 |
ARM | 精簡指令集、追求多核、低功耗 | 安謀、高通、Amazon | 授權(quán)廠商多,能效比高;軟件生態(tài)劣于x86 |
MIPS | 精簡指令集、低功耗 | 龍芯 | 軟件生態(tài)弱、市占率正在下降 |
Power | 單核能力強、高可靠性、高成本 | IBM | IBM掌控技術(shù),應(yīng)用于金融領(lǐng)域 |
RISC-V | 精簡指令集 | RISC-V基金會、阿里巴巴、兆易創(chuàng)新 | 完全開放開源、模塊化、可擴展 |
Alpha | 精簡指令集、速度快 | 申威 | 軟件生態(tài)弱,市占率小 |
通用算力計算量小,但能夠提供高效、靈活、通用的計算能力。因為CPU的架構(gòu)屬于少量的高性能核心結(jié)構(gòu),即核心數(shù)量少,但核心頻率高,更加擅長處理復(fù)雜的邏輯判斷和串行計算的單線程任務(wù),如操作系統(tǒng)的管理、應(yīng)用程序的執(zhí)行以及各類后臺服務(wù)等。而這樣的設(shè)計在面對大規(guī)模并行計算任務(wù)時則顯得力不從心。
智能算力
智能算力主要以GPU、FPGA、ASIC芯片為代表。每種類型的芯片具有各自的特點和優(yōu)勢。
- GPU(Graphics Processing Unit,圖形處理器):GPU在設(shè)計之初用于圖形渲染,即同時處理大量簡單的計算任務(wù)。不同于CPU的少量高性能核心架構(gòu),GPU擁有大量的核心數(shù)但較小的控制單元和緩存,能夠完成高度并行的計算任務(wù)。GPU主要應(yīng)用在機器學(xué)習(xí)的訓(xùn)練階段,因為機器學(xué)習(xí)的操作并不依賴于復(fù)雜指令,而是大規(guī)模的并行計算。
- FPGA(Field Programmable Gate Array,現(xiàn)場可編程邏輯門陣列):FPGA是在PAL、GAL 等可編程器件的基礎(chǔ)上進(jìn)一步發(fā)展的產(chǎn)物。FPGA是半定制集成電路,具有可重配置的邏輯結(jié)構(gòu)。其內(nèi)部的電路不是硬刻蝕的,而是可以通過HDL(硬件描述語言)編程來重新配置。這種可編程靈活性使其可以完成人工神經(jīng)網(wǎng)絡(luò)的特定計算模式,輕松升級硬件以適應(yīng)AI場景中新的應(yīng)用需求。除此以外,F(xiàn)PGA的每個組件功能在重新配置階段都可以定制,因此在運行時無需指令,可顯著降低功耗并提高整體性能。
- ASIC(Application-Specific Integrated Circuit,應(yīng)用特定集成電路):ASIC是專為滿足特定需求而設(shè)計的全定制集成電路芯片。ASIC的優(yōu)勢在于其能夠針對特定任務(wù)進(jìn)行深度優(yōu)化,從而實現(xiàn)更高的性能和更低的功耗。一旦量產(chǎn),其單位成本會顯著降低,尤其適合于大規(guī)模生產(chǎn)和應(yīng)用。然而,ASIC設(shè)計周期長、成本高,一旦設(shè)計完成,很難進(jìn)行修改或升級以適應(yīng)新的應(yīng)用需求。因此,在選擇使用ASIC還是FPGA時,需要根據(jù)具體的應(yīng)用場景和需求進(jìn)行權(quán)衡。對于需要高性能、低功耗且應(yīng)用場景相對固定的系統(tǒng),ASIC可能是更好的選擇;而對于需要快速適應(yīng)新技術(shù)和市場需求變化的應(yīng)用場景,F(xiàn)PGA則更具優(yōu)勢。
GPU、FPGA、ASIC能力對比表格:
td {white-space:nowrap;border:1px solid #dee0e3;font-size:10pt;font-style:normal;font-weight:normal;vertical-align:middle;word-break:normal;word-wrap:normal;} | | GPU | FPGA | ASIC |
| -------------- | -------------------------- | -------------------------------- | ----------------------------- |
| 并行計算能力 | 強大 | 靈活配置 | 高效但定制 |
| 靈活性 | 較低(專用于圖形和計算) | 高(可編程) | 低(定制后固定) |
| 功耗 | 高 | 適中 | 低 |
| 成本 | 中等 | 低 | 高(設(shè)計和制造) |
| 整體性能 | 高 | 中等(因可重置而消耗芯片資源) | 非常高(高度定制針對性強 ) |
| 應(yīng)用領(lǐng)域 | 圖形處理、機器學(xué)習(xí)等 | 實時計算、原型設(shè)計等 | 特定應(yīng)用場景(如數(shù)據(jù)中心) |
超算算力
超算即超級計算,又稱高性能計算 (HPC),利用并行工作的多臺計算機系統(tǒng)的集中式計算資源,通過專用的操作系統(tǒng)來處理極端復(fù)雜的或數(shù)據(jù)密集型的問題。超算算力則是由這些超級計算機等高性能計算集群所提供的算力,主要應(yīng)用于尖端科研、國防軍工等大科學(xué)、大工程、大系統(tǒng)中,是衡量一個國家或地區(qū)科技核心競爭力和綜合國力的重要標(biāo)志。目前,美國的Frontier以 1.206 EFlop/s的HPL性能位居全球超級計算機Top500榜第一,達(dá)到了E級計算。
中國信息通信研究院結(jié)合業(yè)內(nèi)實踐和設(shè)想,提出了超算參考架構(gòu),由計算系統(tǒng)、存儲系統(tǒng)、網(wǎng)絡(luò)系統(tǒng)、管理系統(tǒng)、安全系統(tǒng)五部分構(gòu)成。
- 計算系統(tǒng):由CPU和異構(gòu)加速卡計算節(jié)點共同組成。
- 存儲系統(tǒng):采用分布式存儲,可提供PB級別以上的容量來進(jìn)行數(shù)據(jù)和算據(jù)存儲。
- 網(wǎng)絡(luò)系統(tǒng):分為存儲網(wǎng)絡(luò)、業(yè)務(wù)網(wǎng)絡(luò)以及監(jiān)控網(wǎng)絡(luò)等多個網(wǎng)絡(luò)平面,實現(xiàn)超算系統(tǒng)間各個硬件設(shè)備以及子系統(tǒng)間的通信互聯(lián)。
- 管理系統(tǒng):包括資源與業(yè)務(wù)監(jiān)控、告警監(jiān)控、可視化等功能。
- 安全系統(tǒng):由防火墻、負(fù)載均衡、堡壘機、抗DDoS、日志審計、漏洞掃描、DNS服務(wù)器等設(shè)備組成。
新一代算力
自人工智能加速應(yīng)用后,算力需求激增,人們很難保證在未來經(jīng)典計算能一直滿足指數(shù)級的算力增長并應(yīng)用于重大計算問題。于是在全球科技競爭加劇、數(shù)字經(jīng)濟快速發(fā)展以及新興技術(shù)的推動下出現(xiàn)了以量子計算為代表的新一代算力。
量子計算運用量子態(tài)的疊加性,使得量子比特?fù)碛懈鼜姷男畔⒕幋a能力,并可實現(xiàn)多個量子比特的量子糾纏,性能上限遠(yuǎn)超經(jīng)典計算。量子計算機使用亞原子粒子的物理學(xué)領(lǐng)域來執(zhí)行復(fù)雜的并行計算,從而取代了當(dāng)今計算機系統(tǒng)中更簡單的晶體管。傳統(tǒng)計算機中的字符,要么打開,要么關(guān)閉,要么是 1,要么是 0。而在量子比特計算中,計算單元是可以打開,關(guān)閉或之間的任何值。量子比特的“疊加態(tài)”能力,為計算方程增加了強大的功能,使量子計算機在某種數(shù)學(xué)運算中更勝一籌。
目前阿里巴巴、Google、Honeywell、IBM 、IonQ 和 Xanadu 等少數(shù)幾家公司都運營著量子計算機,但仍存在退相干、噪聲與誤差、可擴展性等問題,處于硬件開發(fā)的早期階段。根據(jù)專家預(yù)測,想要進(jìn)入量子計算機真正有用的高保真時代,還得需要幾十年。
數(shù)據(jù)中心算力組成
數(shù)據(jù)中心的計算能力主要依賴于服務(wù)器。目前CPU類型的服務(wù)器幾乎部署在所有的數(shù)據(jù)中心中,而高性能算力GPU等更多的使用在AI應(yīng)用場景中,小規(guī)模部署于部分?jǐn)?shù)據(jù)中心中。然而隨著機器學(xué)習(xí)、人工智能、無人駕駛、工業(yè)仿真等新興技術(shù)領(lǐng)域的崛起,傳統(tǒng)數(shù)據(jù)中心遭遇通用CPU在處理海量計算、 海量數(shù)據(jù)時越來越多的性能瓶頸。 在數(shù)據(jù)中心加快步伐部署48核以及64核心等更高核心CPU來應(yīng)對激增的算力需求的同時,為了應(yīng)對計算多元化的需求,越來越多的場景開始引入加速芯片,如前文提到的GPU、 FPGA、 ASIC 等。這些加速硬件承擔(dān)了大部分的新算力需求。
然而實際上的數(shù)據(jù)中心是一個匯集大量服務(wù)器、存儲設(shè)備及網(wǎng)絡(luò)設(shè)備的基礎(chǔ)設(shè)施,數(shù)據(jù)中心算力是服務(wù)器、存儲及網(wǎng)絡(luò)設(shè)備合力作用的結(jié)果,計算、存儲及網(wǎng)絡(luò)傳輸能力相互協(xié)同才能促使數(shù)據(jù)中心算力水平的提升。單獨討論服務(wù)器的算力水平并不能反映數(shù)據(jù)中心的實際算力水平。
總之,數(shù)據(jù)中心是人工智能、物聯(lián)網(wǎng)、區(qū)塊鏈等應(yīng)用服務(wù)的重要載體。數(shù)據(jù)中心算力水平的提升將會在很大程度上推動全社會總體算力供給,滿足各行業(yè)數(shù)字化轉(zhuǎn)型過程中的算力需求。
數(shù)據(jù)中心網(wǎng)絡(luò)設(shè)備
以實際情況來說,數(shù)據(jù)中心的算力水平不僅取決于服務(wù)器的算力,同時還會在很大程度上受到網(wǎng)絡(luò)設(shè)備的影響,如果網(wǎng)絡(luò)設(shè)備算力水平無法滿足要求,很有可能引發(fā)“木桶效應(yīng)”,拉低整個數(shù)據(jù)中心的實際算力水平。
星融元[CX-N系列] 交換機可以幫助用戶構(gòu)建超低時延、 靈活可靠、按需橫向擴展的數(shù)據(jù)中心網(wǎng)絡(luò)。
- 超低時延:所搭載的交換芯片具備業(yè)界領(lǐng)先的超低時延能力,最低時延達(dá)到400ns左右。
- 高可靠性:通過MC-LAG、EVPN Multihoming、ECMP構(gòu)建無環(huán)路、高可靠、可獨立升級的數(shù)據(jù)中心網(wǎng)絡(luò)。
- RoCEv2能力:全系列標(biāo)配RoCEv2能力,提供PFC、ECN等一系列面向生產(chǎn)環(huán)境的增強網(wǎng)絡(luò)特性。
- RESTful API:支持REST架構(gòu)的第三方平臺和應(yīng)用都能自動化地管理、調(diào)度星融元數(shù)據(jù)中心網(wǎng)絡(luò)。
不論是在[AI智算] 還是[HPC高性能計算] 場景下,CX-N交換機都達(dá)到了媲美InfiniBand專用交換機的性能,以下是場景測試數(shù)據(jù)表:
表一:AIGC場景性能測試結(jié)果
帶寬 | 時延 | 備注 | |
---|---|---|---|
E2E網(wǎng)卡直連 | 392.95Gb/s | 1.95us | |
E2E跨交換機 | 392.96Gb/s | 2.51us | 交換機時延560ns |
NCCL網(wǎng)卡直連 | 371.27GB/s | / | |
NCCL跨交換機 | 368.99GB/s | / | CX-N交換機端口利用率95%。 |
表二:HPC應(yīng)用測試(對比IB交換機)
HPC應(yīng)用測試 | CX-N交換機 | MSB7000 | ||||||
---|---|---|---|---|---|---|---|---|
HPC應(yīng)用 | Test1[sec] | Test2[sec] | Test1[sec] | avg[sec] | Test1[sec] | Test2[sec] | Test3[sec] | avg[sec] |
WRF | 1140.35 | 1134.64 | 1128.35 | 1134.44 | 1106.72 | 1099.36 | 1112.68 | 1106.25 |
LAMMPS | 341.25 | 347.19 | 342.61 | 343.69 | 330.47 | 335.58 | 332.46 | 332.83 |
參考文獻(xiàn):
https://13115299.s21i.faiusr.com/61/1/ABUIABA9GAAgqvv2nAYowLyGBA.pdf
https://13115299.s21i.faiusr.com/61/1/ABUIABA9GAAgk4DrjQYo76ziRQ.pdf
審核編輯 黃宇
-
交換機
+關(guān)注
關(guān)注
21文章
2637瀏覽量
99528 -
數(shù)據(jù)中心
+關(guān)注
關(guān)注
16文章
4761瀏覽量
72030 -
AI算力
+關(guān)注
關(guān)注
0文章
72瀏覽量
8651 -
算力
+關(guān)注
關(guān)注
1文章
964瀏覽量
14793
發(fā)布評論請先 登錄
相關(guān)推薦
評論