高性能計(jì)算機(jī)(HPC,High Performance Computer,又稱超級(jí)計(jì)算機(jī))是國之重器。從核爆炸模擬、油藏模擬,到極端天氣預(yù)報(bào)等,高性能計(jì)算都守護(hù)著國家安全和安寧。因此,高性能計(jì)算也成為衡量國家之間綜合實(shí)力的基準(zhǔn)之一,被視為國家實(shí)力的象征。
2020 年以來,十四五和新基建驅(qū)動(dòng)我國高性能計(jì)算中心建設(shè)進(jìn)入高速增長期,多地地方政府和企事業(yè)單位都在積極建設(shè)和籌建高性能計(jì)算中心。
1、被忽視的國之重器:高性能計(jì)算那些事兒
2、高性能計(jì)算:不斷取得新進(jìn)展,國產(chǎn)替代未來可期
想象一下,新藥的研制時(shí)間從數(shù)年縮短至數(shù)天。高性能計(jì)算機(jī) (HPC) 通過模擬、建模和分析,可以輕松解決這類以及更多其他科學(xué)難題。高性能計(jì)算系統(tǒng)幫助人們解決世界上最棘手的難題,引領(lǐng)人類走向“第四次工業(yè)革命”。高性能計(jì)算系統(tǒng)現(xiàn)已廣泛用于:
尋找全新的藥物化合物并測(cè)試已知藥物組合,從而更好地治療不同種類的癌癥和其他疾病
模擬分子動(dòng)力學(xué)以開發(fā)新材料,如防彈纖維織物
提前預(yù)測(cè)重大天氣變化,使受影響的地區(qū)做好準(zhǔn)備
超級(jí)計(jì)算機(jī)代表著高性能計(jì)算系統(tǒng)最尖端的水平。隨著處理能力的不斷演進(jìn),超級(jí)計(jì)算機(jī)的認(rèn)定標(biāo)準(zhǔn)也會(huì)不斷提升。單個(gè)超級(jí)計(jì)算集群可能包含數(shù)萬個(gè)處理器,使用全球最昂貴且最強(qiáng)大的系統(tǒng),成本高達(dá) 1 億美元。
高性能計(jì)算的工作原理
在高性能計(jì)算中,處理信息的兩種主要方式為:
串行處理,由中央處理器 (CPU) 完成。每個(gè) CPU 核心通常每次只能處理一個(gè)任務(wù)。CPU 對(duì)于運(yùn)行各種功能而言至關(guān)重要,如操作系統(tǒng)和基本應(yīng)用程序(如文字處理、辦公生產(chǎn)力工具等)。
并行處理,可利用多個(gè) CPU 或圖形處理器 (GPU) 完成。GPU 最初是專為圖形處理而設(shè)計(jì)的。它可在數(shù)據(jù)矩陣(如屏幕像素)中同時(shí)執(zhí)行多種算術(shù)運(yùn)算。同時(shí)在多個(gè)數(shù)據(jù)平面上工作的能力使 GPU 非常適合在機(jī)器學(xué)習(xí) (ML) 應(yīng)用任務(wù)中進(jìn)行并行處理,如識(shí)別視頻中的物體。
突破超級(jí)計(jì)算的極限需要不同的系統(tǒng)架構(gòu)。大多數(shù)高性能計(jì)算系統(tǒng)通過超高帶寬將多個(gè)處理器和內(nèi)存模塊互連并聚合,從而實(shí)現(xiàn)并行處理。一些高性能計(jì)算系統(tǒng)將 CPU 和 GPU 結(jié)合在一起,被稱為異構(gòu)計(jì)算。
計(jì)算機(jī)計(jì)算能力的度量單位被稱為“FLOPS”(每秒浮點(diǎn)運(yùn)算次數(shù))。截至 2019 年初,現(xiàn)有的高端超級(jí)計(jì)算機(jī)可以執(zhí)行 143.5 千萬億次 FLOPS (143 × 1015)。此類超級(jí)計(jì)算機(jī)被稱為千萬億次級(jí),可以執(zhí)行超過千萬億次 FLOPS。相比之下,高端游戲臺(tái)式機(jī)的速度要慢 1,000,000 倍以上,可執(zhí)行約 200 千兆次 FLOPS (1 × 109)。超級(jí)計(jì)算在處理和吞吐量方面的重大突破很快將會(huì)實(shí)現(xiàn)超級(jí)計(jì)算的下一個(gè)重大級(jí)別——百億億次級(jí),該級(jí)別的速度比千萬億次級(jí)約快 1,000 倍。這意味著百億億次級(jí)超級(jí)計(jì)算機(jī)每秒將能夠執(zhí)行 1018(或者 10 億 x 10 億)次運(yùn)算。
“FLOPS”是對(duì)理論處理速度的描述,實(shí)現(xiàn)該速度需要連續(xù)向處理器傳輸數(shù)據(jù)。因此,系統(tǒng)設(shè)計(jì)必須考慮到數(shù)據(jù)吞吐量這一因素。系統(tǒng)內(nèi)存以及處理節(jié)點(diǎn)之間的互連會(huì)影響數(shù)據(jù)傳輸?shù)教幚砥鞯乃俣取?/p>
為了實(shí)現(xiàn)1百億億次級(jí) FLOPS 的下一級(jí)超級(jí)計(jì)算機(jī)處理性能,大概需要 5,000,000 個(gè)臺(tái)式機(jī)。*假定每個(gè)臺(tái)式機(jī)具備 200 千兆次 FLOPS 的能力。
術(shù)語知識(shí)
高性能計(jì)算 (HPC):一個(gè)廣義上的強(qiáng)大計(jì)算系統(tǒng),其范圍涵蓋簡單計(jì)算機(jī)(如 1 個(gè) CPU + 8 個(gè) GPU),乃至世界一流的超級(jí)計(jì)算機(jī)
超級(jí)計(jì)算機(jī):最先進(jìn)的高性能計(jì)算機(jī),以不斷提高的性能標(biāo)準(zhǔn)為依據(jù)
異構(gòu)計(jì)算:優(yōu)化串行 (CPU) 和并行 (GPU) 處理能力的高性能計(jì)算架構(gòu)
內(nèi)存:在高性能計(jì)算系統(tǒng)中為實(shí)現(xiàn)快速訪問而存儲(chǔ)數(shù)據(jù)的地方
互連:可令處理節(jié)點(diǎn)互相通信的系統(tǒng)層;在超級(jí)計(jì)算機(jī)中存在多個(gè)級(jí)別的互連
千萬億次級(jí):為達(dá)到每秒執(zhí)行千萬億次 (1015) 運(yùn)算而設(shè)計(jì)的超級(jí)計(jì)算機(jī)
百億億次級(jí):為達(dá)到每秒執(zhí)行百億億次 (1018) 運(yùn)算而設(shè)計(jì)的超級(jí)計(jì)算機(jī)
高性能計(jì)算是什么?
高性能計(jì)算是指將多個(gè)計(jì)算節(jié)點(diǎn)組織起來,通過網(wǎng)絡(luò)連接在一起,進(jìn)行協(xié)同工作,組成一臺(tái)性能更強(qiáng)大的計(jì)算機(jī),通常指具有極快運(yùn)算速度、極大存儲(chǔ)容量、極高通信帶寬的一類計(jì)算機(jī)。高性能計(jì)算能夠讓整個(gè)計(jì)算機(jī)集群為同一個(gè)任務(wù)工作,以更快的速度來解決一個(gè)復(fù)雜問題。一臺(tái)高性能計(jì)算上往往執(zhí)行一個(gè)任務(wù)(或者有限的幾個(gè)任務(wù))。全部的計(jì)算機(jī)資源都被傾注到同一個(gè)任務(wù)中。為了解決同一個(gè)問題,集群的不同計(jì)算機(jī)之間要有非常好的溝通能力。
高性能計(jì)算機(jī)是計(jì)算機(jī)和網(wǎng)絡(luò)的結(jié)合。假設(shè)說互聯(lián)網(wǎng)從外部將分立的計(jì)算機(jī)連接在一起,那么集群則是將網(wǎng)絡(luò)內(nèi)部化,讓網(wǎng)絡(luò)成為系統(tǒng)內(nèi)部不同計(jì)算機(jī)的溝通橋梁。首先創(chuàng)造性發(fā)明集群的是有“高性能計(jì)算之父”之稱的 Seymour Cray。在 1960 年代,可以進(jìn)行高性能運(yùn)算的僅僅是經(jīng)過特別設(shè)計(jì)的、昂貴的大型機(jī)。這些大型機(jī)需要復(fù)雜的回路以實(shí)現(xiàn)高運(yùn)算頻率,所以其設(shè)計(jì)和生產(chǎn)周期都非常長。Seymour Cray 提出并行是提高計(jì)算機(jī)性能的有效方式。1964 年,Seymour Cray 研制的 CDC 6600 問世,他將多個(gè)普通的處理器連接起來,并使得這些處理器協(xié)同工作。政府和科研部門開始采購這樣的新型的高性能計(jì)算機(jī),以代替原有的大型機(jī)。高性能計(jì)算機(jī)為登月計(jì)劃等大型科研項(xiàng)目做出了不可磨滅的貢獻(xiàn),開啟了高性能計(jì)算技術(shù)和產(chǎn)業(yè)多年的持續(xù)發(fā)展與繁榮。
高性能計(jì)算近 60 年的演變路線可簡單地分為 2 個(gè)階段:Cray 時(shí)代和多計(jì)算機(jī)時(shí)代。
(1)Cray 時(shí)代。從 20 世紀(jì) 60—90 年代初期的 30 年被稱為“Cray 時(shí)代”,以單一內(nèi)存向量機(jī)的技術(shù)革新為主導(dǎo),Cray 定義和引領(lǐng)了前 30 年的高性能計(jì)算市場(chǎng)。第一個(gè)30 年研制以“頂天”為主,僅服務(wù)于國家戰(zhàn)略部門。
(2)多計(jì)算機(jī)時(shí)代。從 20 世紀(jì) 90年代迄今的后 30 年被稱為“多計(jì)算機(jī)時(shí)代”,由于微處理器的出現(xiàn),以及大量工業(yè)標(biāo)準(zhǔn)硬件的普及,以大規(guī)?;ミB多個(gè)通用乃至商用的計(jì)算部件的可擴(kuò)展系統(tǒng)結(jié)構(gòu)的技術(shù)創(chuàng)新主導(dǎo)了迄今為止的高性能計(jì)算發(fā)展。后 30 年的高性能計(jì)算機(jī)在滿足國家戰(zhàn)略應(yīng)用對(duì)性能巔峰需求的同時(shí),“立地”成為發(fā)展的主要目標(biāo),市場(chǎng)驅(qū)動(dòng)、高性能計(jì)算應(yīng)用普及成為第二階段的顯著特點(diǎn)。
高性能計(jì)算為什么重要?
高性能計(jì)算是計(jì)算機(jī)科學(xué)與工程的“皇冠”。高性能計(jì)算是計(jì)算機(jī)技術(shù)的源頭之一?;ヂ?lián)網(wǎng)產(chǎn)業(yè)依賴的數(shù)據(jù)中心的核心技術(shù),諸如 Hadoop 等并行編程工具和 RDMA 等遠(yuǎn)程通信技術(shù)大多脫胎于此。因此,高性能計(jì)算機(jī)被視為計(jì)算機(jī)科學(xué)與工程的“皇冠”。各國均頻繁從國家層面啟動(dòng)研制計(jì)劃。在中國多次上榜全球高性能計(jì)算 TOP500 后,美國自2015 年起將多所中國高性能計(jì)算相關(guān)機(jī)構(gòu)或企業(yè)列入實(shí)體清單,包括國防科大、無錫江南計(jì)算技術(shù)研究所、曙光、申威等。而我國高性能計(jì)算整體實(shí)力和美國相比仍然有較大差距。因此,發(fā)展自主可控的高性能計(jì)算至關(guān)重要。
高性能計(jì)算的核心能力是 64 位雙精度浮點(diǎn)運(yùn)算能力。高性能計(jì)算是一種通用算力,其設(shè)計(jì)目標(biāo)是提供完備、復(fù)雜的計(jì)算能力,在高精度計(jì)算能力更強(qiáng)。業(yè)界廣泛用于衡量高性能計(jì)算性能的 Linpack 測(cè)試,測(cè)試的是高性能計(jì)算的“雙精度浮點(diǎn)運(yùn)算能力”,即 64位浮點(diǎn)數(shù)字的計(jì)算(FP64),這是一種高精度的數(shù)值計(jì)算。在以二進(jìn)制所表示數(shù)字精度中,還有單精度(32 位,F(xiàn)P32)、半精度(16 位,F(xiàn)P16)以及整數(shù)類型(如 INT8、INT4)等。數(shù)字位數(shù)越高,意味著人們可以在更大范圍內(nèi)的數(shù)值內(nèi)體現(xiàn)兩個(gè)數(shù)值的變化,從而實(shí)現(xiàn)更精確計(jì)算。
高性能計(jì)算在底層芯片性能要求上高于普通的數(shù)據(jù)中心和智算中心。算力中心有多種,大致可分為數(shù)據(jù)中心、高性能計(jì)算中心、智算中心等,而它們都可以用云的形式來提供服務(wù)。以實(shí)現(xiàn)人工智能需求為例,推理、訓(xùn)練和模擬為 AI 的三類主要任務(wù)。在此維度上,芯片的應(yīng)用上限由其底層構(gòu)造所決定,即使采用軟件優(yōu)化也無法再提升。從芯片層面來看,如果底層芯片采用的是 CPU+專用 AI 芯片,那么其只能完成 AI 推理和訓(xùn)練任務(wù),而無法完成模擬。因?yàn)?AI 芯片無法實(shí)現(xiàn)雙精度浮點(diǎn)運(yùn)算,雙精度浮點(diǎn)運(yùn)算大量涉及線性代數(shù)方程求解,而自然界的很多問題,包括科學(xué)問題、社會(huì)問題等,最后都可轉(zhuǎn)化為線性代數(shù)方程求解問題。
高性能計(jì)算的體系結(jié)構(gòu)設(shè)計(jì)和軟件同樣重要。芯片是高性能計(jì)算的重要組成部分,但不是高性能計(jì)算技術(shù)的全部。高性能計(jì)算不是簡單的 CPU 堆砌,體系結(jié)構(gòu)設(shè)計(jì)、高速互聯(lián)網(wǎng)絡(luò)、并行文件系統(tǒng)、儲(chǔ)存列陣等方面如果有所欠缺,即使堆再多的 CPU,高性能計(jì)算性能也無法提高。隨著計(jì)算能力的增強(qiáng)、應(yīng)用課題規(guī)模和復(fù)雜度的增加,高性能計(jì)算機(jī)對(duì)并行文件系統(tǒng)等性能要求越來越高。高性能計(jì)算的技術(shù)溢出效益非常明顯。由于服務(wù)器可以平滑地采用高性能計(jì)算的互聯(lián)技術(shù)、CPU 技術(shù)、操作系統(tǒng)技術(shù)和并行軟件設(shè)計(jì)等技術(shù),在高性能計(jì)算方面的積累能夠自然地溢出到服務(wù)器產(chǎn)業(yè)。
高性能計(jì)算主要應(yīng)用于哪些場(chǎng)景?
高性能計(jì)算適用于需要并行運(yùn)算的任務(wù),應(yīng)用場(chǎng)景持續(xù)拓展。高性能計(jì)算主要應(yīng)用場(chǎng)景分為兩類,一類是飛行器設(shè)計(jì)、核模擬實(shí)驗(yàn)、星云模擬、解密碼等數(shù)值模擬場(chǎng)景,一類是大數(shù)據(jù)分析、統(tǒng)計(jì)和人工智能等數(shù)據(jù)分析場(chǎng)景。由于飛行器等工程設(shè)計(jì)中很多情況無法實(shí)測(cè),只能進(jìn)行計(jì)算模擬,因此美國對(duì)出口高性能計(jì)算十分謹(jǐn)慎。高性能計(jì)算應(yīng)用正在從過去的高精尖向更廣更寬的方向發(fā)展。隨著高性能計(jì)算的發(fā)展,尤其是使用成本的不斷下降,其應(yīng)用領(lǐng)域也從具有國家戰(zhàn)略意義的核武器研制、信息安全、石油勘探等科學(xué)計(jì)算領(lǐng)域向更廣泛的國民經(jīng)濟(jì)主戰(zhàn)場(chǎng)快速擴(kuò)張,比如制藥、基因測(cè)序、動(dòng)漫渲染、數(shù)據(jù)挖掘、金融分析以及互聯(lián)網(wǎng)服務(wù)等等。
從 2021 年 11 月中國高性能計(jì)算機(jī) TOP100中的行業(yè)應(yīng)用領(lǐng)域 Linpack 性能份額來看,算力服務(wù)、高性能計(jì)算中心、人工智能、科學(xué)計(jì)算等領(lǐng)域是高性能計(jì)算的主要用戶,互聯(lián)網(wǎng)大數(shù)據(jù)特別是 AI 領(lǐng)域增長強(qiáng)勁。
高性能計(jì)算的市場(chǎng)空間有多大?
十四五和新基建驅(qū)動(dòng)高性能計(jì)算進(jìn)入快速增長期。2021 年 3 月,我國“十四五規(guī)劃”中明確提出,要“加快構(gòu)建全國一體化大數(shù)據(jù)中心體系,強(qiáng)化算力統(tǒng)籌智能調(diào)度,建設(shè)若干國家樞紐節(jié)點(diǎn)和大數(shù)據(jù)中心集群,建設(shè) E 級(jí)和 10E 級(jí)超級(jí)計(jì)算中心?!备鶕?jù)規(guī)劃,合肥、蘭州、廈門、太原等地多地都將陸續(xù)建立高性能計(jì)算中心。
2022 年中國整體高性能計(jì)算市場(chǎng)規(guī)模將超 400 億元。除政府規(guī)劃外,阿里、騰訊等多家互聯(lián)網(wǎng)巨頭均積極布局高性能計(jì)算建設(shè)。以騰訊為例,其于 2020 年 6 月正式開工的長三角人工智能高性能計(jì)算中心投資超 450 億元,建成后將承擔(dān)各種大規(guī)模 AI 算法計(jì)算、機(jī)器學(xué)習(xí)、圖像處理、科學(xué)計(jì)算和工程計(jì)算任務(wù)。此外,金融機(jī)構(gòu)、運(yùn)營商等均在積極部署自己的高性能計(jì)算。根據(jù)觀研天下預(yù)測(cè),2022 年中國高性能計(jì)算行業(yè)總體市場(chǎng)規(guī)模將超 400 億元,2021-2025 年 CAGR 為 13%左右。
高性能計(jì)算市場(chǎng)競(jìng)爭格局穩(wěn)定
聯(lián)想、曙光、浪潮市占率分列前三。從中國高性能計(jì)算 TOP100 中主要公司系統(tǒng)個(gè)數(shù)統(tǒng)計(jì)來看,2002 年之前,TOP100 主要是國外的 HP、IBM 為主,后期以中國的聯(lián)想、曙光和浪潮為主。中科曙光在 1998 年完成 863 項(xiàng)目“曙光 2000”可擴(kuò)展機(jī)群體系結(jié)構(gòu)的超級(jí)服務(wù)器,2001 年完成“曙光 3000”超級(jí)服務(wù)器后,從 2005 年開始,市場(chǎng)競(jìng)爭開始有突出表現(xiàn),曙光 2010-2019 年連續(xù) 10 年按裝機(jī)臺(tái)數(shù)市場(chǎng)份額第一,2019 年占到接近 40%。浪潮在 2012 年完成“863 計(jì)劃”容錯(cuò)服務(wù)器項(xiàng)目后,2014 年開始有明顯起色。聯(lián)想公司通過 2014 年對(duì) IBM 公司 X86 HPC 產(chǎn)品線的并購,市場(chǎng)份額異軍突起,到 2021年已實(shí)現(xiàn) TOP100 裝機(jī)臺(tái)數(shù)份額第一。而聯(lián)想、浪潮、曙光中,只有曙光擁有從芯片等硬件到軟件系統(tǒng)的國產(chǎn)自主知識(shí)產(chǎn)權(quán)。
“東數(shù)西算”工程落地有望進(jìn)一步促進(jìn)西部地區(qū)發(fā)展高性能計(jì)算中心。2022 年 2月,國家發(fā)改委批復(fù)同意在京津冀、長三角、粵港澳大灣區(qū)、成渝、內(nèi)蒙古、貴州、甘肅、寧夏等 8 地啟動(dòng)建設(shè)國家算力樞紐節(jié)點(diǎn),并規(guī)劃了 10 個(gè)國家數(shù)據(jù)中心集群。至此,全國一體化大數(shù)據(jù)中心體系完成總體布局設(shè)計(jì),代表著“東數(shù)西算”工程正式全面啟動(dòng)。西部有風(fēng)力發(fā)電、光伏發(fā)電,能源豐富,而且年平均氣溫比較低,十分適合計(jì)算中心的生存,而高性能計(jì)算業(yè)務(wù)對(duì)實(shí)時(shí)通訊的需求不高,未來高性能計(jì)算中心有望成為優(yōu)化算力布局的重要載體。
審核編輯:湯梓紅
-
cpu
+關(guān)注
關(guān)注
68文章
10854瀏覽量
211578 -
計(jì)算機(jī)
+關(guān)注
關(guān)注
19文章
7488瀏覽量
87849 -
HPC
+關(guān)注
關(guān)注
0文章
315瀏覽量
23754 -
高性能計(jì)算
+關(guān)注
關(guān)注
0文章
82瀏覽量
13385
原文標(biāo)題:被忽視的國之重器:高性能計(jì)算那些事兒
文章出處:【微信號(hào):AI_Architect,微信公眾號(hào):智能計(jì)算芯世界】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論