新世代RM官方网站,新时代rm平台入口

融合計算是微觀和宏觀視角算力提升策略的總結(jié)，是三個維度融合（異構(gòu)融合x軟硬件融合x云邊端融合）的統(tǒng)稱，那么融合計算是如何提出來的？為什么融合計算有且僅有三個維度的融合？

性能和算力

1.1 性能的計算公式

定性的分析，一個芯片的性能由三個維度組成：

維度一，指令復(fù)雜度。理論上，指令復(fù)雜度越高，性能越好。但實際上，需要考慮系統(tǒng)的通用性，以及目標(biāo)工作任務(wù)的靈活性特征，來選擇合適的處理器引擎。

維度二，運行頻率。運行頻率提升，主要是先進工藝，以及更復(fù)雜的流水線設(shè)計。

維度三，并行度。提高并行度比較好理解，并行也主要有同構(gòu)并行、（兩個處理器的）異構(gòu)并行和（三個以上）更多異構(gòu)融合的并行。

1.2 算力的計算公式

算力和性能的區(qū)別在哪里？性能是微觀的算力，算力是宏觀的性能。那么算力和性能之間的聯(lián)系是什么？如上圖所示，我們定性分析，可以在性能和算力之間構(gòu)建一個關(guān)聯(lián)的公式。從上述公式可以看到，宏觀的總算力，由三個維度的參數(shù)組成：

維度一，單芯片性能。通過提升單芯片性能的方式，也就是Scale Up的方式提升整體算力。

維度二，芯片的數(shù)量。通過增加計算芯片（計算節(jié)點）的數(shù)量，也就是Scale Out的方式，通過提升規(guī)模來提升整體算力。

維度三，算力利用率。如果僅有標(biāo)稱算力，而無法達到很好的利用率，那也是徒勞。隨著AI的發(fā)展，集群規(guī)模越來越擴大，算力利用率越來越成為評價一個算力系統(tǒng)能力的關(guān)鍵指標(biāo)。

從微觀到宏觀

2.1 微觀視角的算力提升

2.1.1 如何提升單芯片性能融合提升單芯片的性能：

一方面是底層采用更先進的工藝，以及通過Chiplet封裝支撐，從而實現(xiàn)更大的計算規(guī)模；

另一方面，則是系統(tǒng)架構(gòu)和微架構(gòu)方面的創(chuàng)新，來實現(xiàn)單芯片層次更高的性能，這也是算力提升最本質(zhì)的做法。

計算架構(gòu)的創(chuàng)新則最主要的就是：

從第一代基于CPU的同構(gòu)通用計算；

以及第二代基于CPU+GPU的異構(gòu)通用計算；

逐步的走向第三代基于CPUxGPUxDSAs的異構(gòu)融合通用計算。

2.1.2 如何提升芯片的數(shù)量和落地規(guī)模芯片的落地，不是簡單的復(fù)制。國產(chǎn)算力芯片已經(jīng)有好多家了，甚至一些公司的芯片都已經(jīng)有三到四代了，但仍然銷售不是很順利。底層的原因在于：

生態(tài)的問題。國產(chǎn)芯片（相比NVIDIA CUDA）生態(tài)不夠好。但生態(tài)問題如何解決，不在于微觀的一家公司的一個架構(gòu)和相應(yīng)的私有生態(tài)如何構(gòu)建和繁榮，而在于宏觀的很多公司很多架構(gòu)如何整合（將在加下來的宏觀視角部分介紹）。

芯片需要足夠多的通用性，需要能夠覆蓋更多的業(yè)務(wù)場景和更多的業(yè)務(wù)迭代。

此外，芯片需要有非常高的I/O能力，確保在更大的規(guī)模下仍能有非常高的東西向通信效率（不耽誤計算，不影響計算效率），能夠支持更大規(guī)模的集群計算。

2.1.3 如何提升芯片的算力利用率要想提升算力芯片的利用率，那么：

一方面，芯片需要有很好的擴展性能力，支持資源切分、池化、和重組；

另一方面，開放架構(gòu)，減少多元異構(gòu)算力的架構(gòu)數(shù)量，從而使得更多的算力能夠匯集到統(tǒng)一的算力資源池，從而實現(xiàn)更大范圍的算力共享，進而提升整體的算力利用率。

2.2 宏觀視角的算力提升

2.2.1 如何提升單個節(jié)點的性能從宏觀角度，單節(jié)點的性能提升，則主要是如何把更多異構(gòu)融合架構(gòu)的計算能力充分的用起來：

首先，是需要一個更加綜合的異構(gòu)融合計算框架，既包括CPU的工具鏈，也有GPU、AI，以及其他如網(wǎng)絡(luò)、存儲、視頻、安全等領(lǐng)域的加速計算框架，還需要這個異構(gòu)融合計算框架，支持異構(gòu)協(xié)同和跨異構(gòu)應(yīng)用遷移。

第二，則是更復(fù)雜的計算架構(gòu)和算力調(diào)度。在通算時代，一個物理的計算機，通常具有四類資源：CPU、內(nèi)存、網(wǎng)絡(luò)和存儲；在異構(gòu)計算時代，則是CPU、內(nèi)存、網(wǎng)絡(luò)、存儲和加速器。而在異構(gòu)融合時代，則是CPU、內(nèi)存、網(wǎng)絡(luò)、存儲，以及更多種不同領(lǐng)域的加速器。那么，如此復(fù)雜的計算架構(gòu)模型，如何資源切分、池化和重組，以及如何同架構(gòu)調(diào)度，以及實現(xiàn)跨架構(gòu)調(diào)度，都是需要深入考慮的事情。

2.2.2 如何提升芯片的數(shù)量和落地的規(guī)模宏觀視角下，芯片的數(shù)量提升，主要是如下幾個層次：

最基礎(chǔ)的就是集群規(guī)模的擴大，這需要高性能網(wǎng)絡(luò)，更高的帶寬，更低的延遲。

接下來，就是跨集群管理和跨集群調(diào)度，這就需要更復(fù)雜的網(wǎng)絡(luò)和更高層次的算力調(diào)度。

再接下來，就是要實現(xiàn)跨數(shù)據(jù)中心的算力整合，這也就是目前火熱的算力網(wǎng)絡(luò)關(guān)注的范疇，有非常大的技術(shù)挑戰(zhàn)和商業(yè)上的挑戰(zhàn)。

再接下倆，那就是要跨云邊端，實現(xiàn)云邊端融合計算，挑戰(zhàn)會更大。

2.2.3 如何提升算力利用率宏觀視角看算力利用率提升，主要是兩塊，承上啟下：

啟下。承載計算的芯片類型越來越多，多元異構(gòu)問題凸顯，這是目前算力整合不得不面對的現(xiàn)實困難。芯片（或引擎）的類型有很多，每一張類型還有很多不同的架構(gòu)，這些不同類型不同架構(gòu)的芯片是一個個孤島，如何把這些孤島連成一體，是一個非常重要的事情。未來，開放計算架構(gòu)會是一個不得不走的選項，逐漸的從目前各家芯片公司各自為政私有架構(gòu)的模式，過渡到開放架構(gòu)的模式，讓芯片的架構(gòu)逐漸收斂。

承上。相比芯片側(cè)的問題，計算芯片所支撐的上層業(yè)務(wù)軟件側(cè)的問題相對較少。行業(yè)存在開源軟件生態(tài)，這是目前絕大部分業(yè)務(wù)客戶的共識，這也減少了很多底層硬件的適配難度。但這幾年，這個問題有所惡化：隨著AI發(fā)展，NVIDIA GPU和CUDA一家獨大，大家不得不在NVIDIA的封閉體系下工作。這不利于行業(yè)的競爭，也不利于算力成本的下降。理想的情況是：行業(yè)形成開源開放的計算軟硬件生態(tài)，開源軟件定義開放硬件；算力中心，不對任何硬件平臺有依賴，不需要為生態(tài)溢價付費，僅需要為功能和性能付費即可。

需要注意的是，宏觀和微觀，以及算力提升的三個維度，是彼此交叉關(guān)聯(lián)的。這里的很多策略，可能會同時影響兩個甚至三個維度，甚至“按下葫蘆浮起瓢”也是有可能的。實際的算力優(yōu)化工作，需要仔細(xì)分析應(yīng)對。

融合計算

隨著AI大模型以及AI+場景對算力的需求猛增，算力中心建設(shè)成本也水漲船高，算力網(wǎng)絡(luò)（實現(xiàn)算力共享）逐漸流行。同時許多AI+終端的場景，算力需求猛增，從云端和邊緣端“借”算力的云邊端融合計算模式，成為了終端算力提升的一個重要方式。算力系統(tǒng)相當(dāng)復(fù)雜，算力提升成為了一個龐大的系統(tǒng)工程。立足于最核心的芯片硬件和相關(guān)軟件，從微觀到宏觀，基于上面分析的算力提升的背景知識，提出了“融合計算”的概念。希望通過“融合計算”的全方位的整合優(yōu)化，來實現(xiàn)算力最優(yōu)的性能和成本。

融合計算，其實就是微觀和宏觀視角算力提升策略的總結(jié)，是三個維度融合（異構(gòu)融合x軟硬件融合x云邊端融合）的統(tǒng)稱：

X軸，芯片維度，異構(gòu)融合，Scale Up，提升單芯片性能。通過異構(gòu)融合計算，把各類異構(gòu)算力的價值發(fā)揮到極致。

Y軸，計算堆棧維度，軟硬件融合，提升算力利用率。通過核心的算力調(diào)度系統(tǒng)中間件，實現(xiàn)承上啟下，向上對接開源軟件，向下對接多元異構(gòu)算力，實現(xiàn)多元異構(gòu)算力的協(xié)同和融合，從而最大化算力資源的利用率。

Z軸，集群擴展維度，云邊端融合，Scale Out，提升芯片數(shù)量。通過增加集群規(guī)模，同時實現(xiàn)跨算力中心、跨不同云運營商、跨云邊端融合的計算。

融合計算和多算融合的關(guān)系

融合計算，是從宏觀和微觀的角度，實現(xiàn)更底層更本質(zhì)的提升性能和降低成本。而通算、智算和超算，則要更上層一些，是計算面向不同業(yè)務(wù)要求所做的定向性能和成本的調(diào)整。

隨著智算中心的發(fā)展，目前行業(yè)中出現(xiàn)了通算，智算和超算的融合的發(fā)展趨勢。但實際的做法，有待商榷。把CPU通算集群、GPU智算集群，以及存儲集群，以及超算集群，放置到一個算力中心里，就是多算融合嗎？顯然不是。

多算融合，必然是需要一套體系，能夠統(tǒng)一通算、智算和超算，有統(tǒng)一的資源切分重組，有統(tǒng)一的資源池，有統(tǒng)一的算力調(diào)度，有統(tǒng)一的上層算力服務(wù)，才能稱之為多算融合：

首先，是要構(gòu)建統(tǒng)一的計算機模型。通算一般是CPU+標(biāo)準(zhǔn)網(wǎng)卡，而智算是CPU+GPU+高性能網(wǎng)卡，而超算則是CPU+GPU+高性能網(wǎng)卡+內(nèi)存一致性加速，存儲則是CPU+更多的存儲I/O。不管咋樣，可以通過我們前面講到的計算模型來統(tǒng)一，不管是哪種計算，都是CPU+加速卡+內(nèi)存+網(wǎng)絡(luò)+存儲的統(tǒng)一的計算模型。

然后是資源的池化。通過云計算的虛擬化和容器的機制，實現(xiàn)資源的切分、池化和重組，可以組合出符合要求的不同類型的計算實例。

目前，計算集群已經(jīng)成為主流的計算方式。通過VPC，可以在公共算力服務(wù)的多租戶場景為用戶構(gòu)建專屬的通算的、智算的或超算的計算集群。

融合計算，是更底層更本地算力優(yōu)化問題，它存在于軟硬件協(xié)同層次，通過全方位的各種融合，實現(xiàn)算力的最佳效果：同算力條件下，成本更優(yōu)；同成本下，算力更高。

融合計算，是云計算未來發(fā)展最大的創(chuàng)新方向，通過融合計算，夯實算力底座，支撐云計算繼續(xù)往前發(fā)展。再以云計算為基，構(gòu)建出面向通算、智算和超算等不同場景的算力服務(wù)。

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴

芯片

芯片

+關(guān)注

關(guān)注
455

文章
50714

瀏覽量
423132
計算

計算

+關(guān)注

關(guān)注
2

文章
449

瀏覽量
38785
算力

算力

+關(guān)注

關(guān)注
1

文章
964

瀏覽量
14793

原文標(biāo)題：融合計算的概念是如何提出來的？

文章出處：【微信號：bdtdsj，微信公眾號：中科院半導(dǎo)體所】歡迎添加關(guān)注！文章轉(zhuǎn)載請注明出處。

ads1256有效位數(shù)怎么計算？

您好，對于ADS1256有效位數(shù)的計算，數(shù)據(jù)手冊給出的測試公式是怎么推到出來的呢？能夠幫我推到出來嗎？對于第一張圖中rms的計算是怎么出來

發(fā)表于 11-22 07:07

基于FPGA實現(xiàn)OTSU算法

OSTU大津法是一種確定圖像二值化閾值的方法，由日本學(xué)者大津提出來的。

發(fā)表于 10-25 15:23 ?343次閱讀

請問ISO124的共模抑制能力是多少？

ISO124的共模抑制能力是多少？手冊里面怎么沒提出來？

發(fā)表于 09-20 06:05

知合計算完成數(shù)億元A1輪融資

知合計算技術(shù)（深圳）有限公司近日宣布成功完成數(shù)億元規(guī)模的A1輪融資，標(biāo)志著公司在人工智能智算芯片領(lǐng)域的快速發(fā)展獲得資本市場的高度認(rèn)可。

發(fā)表于 09-12 18:09 ?631次閱讀

計算機視覺中的圖像融合

在許多計算機視覺應(yīng)用中（例如機器人運動和醫(yī)學(xué)成像），需要將多個圖像的相關(guān)信息整合到單一圖像中。這種圖像融合可以提供更高的可靠性、準(zhǔn)確性和數(shù)據(jù)質(zhì)量。多視圖融合可以提高圖像分辨率，并恢復(fù)場景的三維表示

發(fā)表于 08-01 08:28 ?629次閱讀

LMV7219電特性表里面的失調(diào)電壓和內(nèi)部滯環(huán)的計算是帶符號計算嗎？

您好，LMV7219電特性表里面的失調(diào)電壓和內(nèi)部滯環(huán)的計算是帶符號計算嗎？按照下圖電特性表（4）的定義：內(nèi)部滯環(huán)的典型值為3.5mV-（-4mV）=7.5mV，而失調(diào)電壓等于（3.5mV+（-4mV））/ 2=0.25mV ?

發(fā)表于 07-31 06:41

【《計算》閱讀體驗】量子計算

經(jīng)典計算機的能力。量子計算的重要性在于三點。首先，量子計算對強丘奇-圖靈論題提出了明確挑戰(zhàn)。強丘奇-圖靈論題斷言，任何可物理實現(xiàn)的計算裝置

發(fā)表于 07-13 22:15

邊緣計算是什么意思？邊緣計算的應(yīng)用

邊緣計算（Edge Computing）是一種分布式計算范式，它將計算任務(wù)從數(shù)據(jù)中心遷移到網(wǎng)絡(luò)邊緣設(shè)備（如智能手機、物聯(lián)網(wǎng)傳感器等）上進行處理。邊緣計算的主要目標(biāo)是降低延遲、提高數(shù)據(jù)安

發(fā)表于 05-31 14:19 ?752次閱讀

存內(nèi)計算WTM2101編譯工具鏈資料

存內(nèi)計算是突破物理極限的下一代算力技術(shù)- AIGC等人工智能新興產(chǎn)業(yè)的快速發(fā)展離不開算力，算力的基礎(chǔ)是人工智能芯片。當(dāng)前CPU/GPU在執(zhí)行計算密集型任務(wù)時需要將海量參數(shù)（ωij）從內(nèi)存中讀取出來

發(fā)表于 05-16 16:33

黑芝麻智能推出基于武當(dāng)C1296芯片多域融合計算平臺方案

多域融合計算是汽車智能化發(fā)展的必然趨勢，它可以簡化整車電子電氣架構(gòu)，提高計算效率，降低成本。

發(fā)表于 04-30 15:56 ?1777次閱讀

Cadence擴充Tensilica IP產(chǎn)品陣容，強化汽車傳感器融合計算能力

全球電子設(shè)計自動化和半導(dǎo)體IP解決方案的領(lǐng)先企業(yè)楷登電子（Cadence）近日宣布，其進一步擴展了Tensilica IP產(chǎn)品系列，以滿足汽車行業(yè)中日益增長的傳感器融合應(yīng)用計算需求。新推出

發(fā)表于 03-14 11:38 ?870次閱讀

邊緣計算網(wǎng)關(guān)與邊緣計算的融合之道

網(wǎng)關(guān)，作為連接邊緣設(shè)備與中心網(wǎng)絡(luò)的橋梁，發(fā)揮著不可或缺的作用。邊緣計算是一種將計算任務(wù)從云端推向網(wǎng)絡(luò)邊緣的處理模式。它通過在數(shù)據(jù)源附近執(zhí)行計算和分析，大幅減少了數(shù)據(jù)傳輸?shù)难舆t，提高了處理效率，并增強了數(shù)據(jù)

發(fā)表于 02-26 16:29 ?456次閱讀

TC377波特率計算是否與幀大小有關(guān)？

brZ 如圖 471 所示，我想知道這個波特率計算是否與幀大小有關(guān)？例如，4 位幀、8 位幀、32 位幀？波特率是指一幀/秒嗎？對于 32 位幀，它是 32 位/秒？

發(fā)表于 01-22 06:29

基于光電計算融合的超構(gòu)透鏡消色差成像方案

近期，國防科技大學(xué)理學(xué)院楊俊波教授團隊和計算機學(xué)院王耀華教授團隊、西南大學(xué)吳加貴教授團隊提出基于光電計算融合的超構(gòu)透鏡消色差成像方案。

發(fā)表于 01-16 10:10 ?717次閱讀

邊緣計算是一種什么運算架構(gòu)

邊緣計算是一種分布式計算架構(gòu)，它將數(shù)據(jù)處理和存儲功能從傳統(tǒng)的云端數(shù)據(jù)中心移至距離數(shù)據(jù)源更近的邊緣設(shè)備或邊緣節(jié)點上進行處理。這一架構(gòu)的目標(biāo)是通過減少數(shù)據(jù)傳輸延遲和帶寬需求，提高計算資源利用率，實現(xiàn)更快

發(fā)表于 12-27 15:02 ?772次閱讀