RM新时代平台,RM新时代平台靠谱平台入口

摩爾線程重磅宣布其AI旗艦產(chǎn)品夸娥（KUAE）智算集群解決方案實(shí)現(xiàn)重大升級，從當(dāng)前的千卡級別大幅擴(kuò)展至萬卡規(guī)模。摩爾線程夸娥（KUAE）萬卡智算集群，以全功能GPU為底座，旨在打造國內(nèi)領(lǐng)先的、能夠承載萬卡規(guī)模、具備萬P級浮點(diǎn)運(yùn)算能力的國產(chǎn)通用加速計(jì)算平臺，專為萬億參數(shù)級別的復(fù)雜大模型訓(xùn)練而設(shè)計(jì)。這一里程碑式的進(jìn)展，樹立了國產(chǎn)GPU技術(shù)的新標(biāo)桿，有助于實(shí)現(xiàn)國產(chǎn)智算集群計(jì)算能力的全新跨越，將為我國人工智能領(lǐng)域技術(shù)與應(yīng)用創(chuàng)新、科研攻堅(jiān)和產(chǎn)業(yè)升級提供堅(jiān)實(shí)可靠的關(guān)鍵基礎(chǔ)設(shè)施。

此外，摩爾線程聯(lián)合中國移動通訊集團(tuán)青海有限公司、中國聯(lián)通青海公司、北京德道信科集團(tuán)、中國能源建設(shè)股份有限公司總承包公司、桂林華崛大數(shù)據(jù)科技有限公司（排名不分先后）分別就三個萬卡集群項(xiàng)目進(jìn)行了戰(zhàn)略簽約，多方聚力共同構(gòu)建好用的國產(chǎn)GPU集群。

摩爾線程創(chuàng)始人兼CEO張建中表示：“當(dāng)前，我們正處在生成式人工智能的黃金時代，技術(shù)交織催動智能涌現(xiàn)，GPU成為加速新技術(shù)浪潮來臨的創(chuàng)新引擎。摩爾線程矢志投身于這一歷史性的創(chuàng)造進(jìn)程，致力于向全球提供加速計(jì)算的基礎(chǔ)設(shè)施和一站式解決方案，為融合人工智能和數(shù)字孿生的數(shù)智世界打造先進(jìn)的加速計(jì)算平臺?？涠鹑f卡智算集群作為摩爾線程全棧AI戰(zhàn)略的一塊重要拼圖，可為各行各業(yè)數(shù)智化轉(zhuǎn)型提供澎湃算力，不僅有力彰顯了摩爾線程在技術(shù)創(chuàng)新和工程實(shí)踐上的實(shí)力，更將成為推動AI產(chǎn)業(yè)發(fā)展的新起點(diǎn)?！?/p>

AI主戰(zhàn)場，萬卡通用算力是標(biāo)配

大模型自問世以來，關(guān)于其未來的走向和發(fā)展趨勢亟待時間驗(yàn)證，但從當(dāng)前來看，幾種演進(jìn)趨勢值得關(guān)注，使得其對算力的核心需求也愈發(fā)明晰。

首先，Scaling Law將持續(xù)奏效。Scaling Law自2020年提出以來，已揭示了大模型發(fā)展背后的“暴力美學(xué)”，即通過算力、算法、數(shù)據(jù)的深度融合與經(jīng)驗(yàn)積累，實(shí)現(xiàn)模型性能的飛躍，這也成為業(yè)界公認(rèn)的將持續(xù)影響未來大模型的發(fā)展趨勢。Scaling Law將持續(xù)奏效，需要單點(diǎn)規(guī)模夠大并且通用的算力才能快速跟上技術(shù)演進(jìn)。

其次，Transformer架構(gòu)不能實(shí)現(xiàn)大一統(tǒng)，和其他架構(gòu)會持續(xù)演進(jìn)并共存，形成多元化的技術(shù)生態(tài)。生成式AI的進(jìn)化并非僅依賴于規(guī)模的簡單膨脹，技術(shù)架構(gòu)的革新同樣至關(guān)重要。Transformer架構(gòu)雖然是當(dāng)前主流，但新興架構(gòu)如Mamba、RWKV和RetNet等不斷刷新計(jì)算效率，加快創(chuàng)新速度。隨著技術(shù)迭代與演進(jìn)，Transformer架構(gòu)并不能實(shí)現(xiàn)大一統(tǒng)，從稠密到稀疏模型，再到多模態(tài)模型的融合，技術(shù)的進(jìn)步都展現(xiàn)了對更高性能計(jì)算資源的渴望。

與此同時，AI、3D和HPC跨技術(shù)與跨領(lǐng)域融合不斷加速，推動著空間智能、物理AI和AI 4Science、世界模型等領(lǐng)域的邊界拓展，使得大模型的訓(xùn)練和應(yīng)用環(huán)境更加復(fù)雜多元，市場對于能夠支持AI+3D、AI+物理仿真、AI+科學(xué)計(jì)算等多元計(jì)算融合發(fā)展的通用加速計(jì)算平臺的需求日益迫切。

多元趨勢下，AI模型訓(xùn)練的主戰(zhàn)場，萬卡已是標(biāo)配。隨著計(jì)算量不斷攀升，大模型訓(xùn)練亟需超級工廠，即一個“大且通用”的加速計(jì)算平臺，以縮短訓(xùn)練時間，實(shí)現(xiàn)模型能力的快速迭代。當(dāng)前，國際科技巨頭都在通過積極部署千卡乃至超萬卡規(guī)模的計(jì)算集群，以確保大模型產(chǎn)品的競爭力。隨著模型參數(shù)量從千億邁向萬億，模型能力更加泛化，大模型對底層算力的訴求進(jìn)一步升級，萬卡甚至超萬卡集群成為這一輪大模型競賽的入場券。

然而，構(gòu)建萬卡集群并非一萬張GPU卡的簡單堆疊，而是一項(xiàng)高度復(fù)雜的超級系統(tǒng)工程。它涉及到超大規(guī)模的組網(wǎng)互聯(lián)、高效率的集群計(jì)算、長期穩(wěn)定性和高可用性等諸多技術(shù)難題。這是難而正確的事情，摩爾線程希望能夠建設(shè)一個規(guī)模超萬卡、場景夠通用、生態(tài)兼容好的加速計(jì)算平臺，并優(yōu)先解決大模型訓(xùn)練的難題。

夸娥：國產(chǎn)萬卡萬P萬億大模型訓(xùn)練平臺

夸娥（KUAE）是摩爾線程智算中心全棧解決方案，是以全功能GPU為底座，軟硬一體化、完整的系統(tǒng)級算力解決方案，包括以夸娥計(jì)算集群為核心的基礎(chǔ)設(shè)施、夸娥集群管理平臺（KUAE Platform）以及夸娥大模型服務(wù)平臺（KUAE ModelStudio），旨在以一體化交付的方式解決大規(guī)模GPU算力的建設(shè)和運(yùn)營管理問題。

基于對AI算力需求的深刻洞察和前瞻性布局，摩爾線程夸娥智算集群可實(shí)現(xiàn)從千卡至萬卡集群的無縫擴(kuò)展，旨在滿足大模型時代對于算力“規(guī)模夠大+計(jì)算通用+生態(tài)兼容”的核心需求，通過整合超大規(guī)模的GPU萬卡集群、極致的計(jì)算效率優(yōu)化以及高度穩(wěn)定的運(yùn)行環(huán)境，以萬卡智算集群的新超級工程，重新定義國產(chǎn)集群計(jì)算能力的新標(biāo)準(zhǔn)。

夸娥萬卡智算解決方案具備多個核心特性：

超大算力，萬卡萬P：在集群計(jì)算性能方面，全新一代夸娥智算集群實(shí)現(xiàn)單集群規(guī)模超萬卡，浮點(diǎn)運(yùn)算能力達(dá)到10Exa-Flops，大幅提升單集群計(jì)算性能，能夠?yàn)槿f億參數(shù)級別大模型訓(xùn)練提供堅(jiān)實(shí)算力基礎(chǔ)。同時，在GPU顯存和傳輸帶寬方面，夸娥萬卡集群達(dá)到PB級的超大顯存總?cè)萘俊⒚棵隤B級的超高速卡間互聯(lián)總帶寬和每秒PB級超高速節(jié)點(diǎn)互聯(lián)總帶寬，實(shí)現(xiàn)算力、顯存和帶寬的系統(tǒng)性協(xié)同優(yōu)化，全面提升集群計(jì)算性能。

超高穩(wěn)定，月級長穩(wěn)訓(xùn)練：穩(wěn)定性是衡量超萬卡集群性能的關(guān)鍵。在集群穩(wěn)定性方面，摩爾線程夸娥萬卡集群平均無故障運(yùn)行時間超過15天，最長可實(shí)現(xiàn)大模型穩(wěn)定訓(xùn)練30天以上，周均訓(xùn)練有效率在99%以上，遠(yuǎn)超行業(yè)平均水平。這得益于摩爾線程自主研發(fā)的一系列可預(yù)測、可診斷的多級可靠機(jī)制，包括：軟硬件故障的自動定位與診斷預(yù)測實(shí)現(xiàn)分鐘級的故障定位，Checkpoint多級存儲機(jī)制實(shí)現(xiàn)內(nèi)存秒級存儲和訓(xùn)練任務(wù)分鐘級恢復(fù)以及高容錯高效能的萬卡集群管理平臺實(shí)現(xiàn)秒級納管分配與作業(yè)調(diào)度。

極致優(yōu)化，超高M(jìn)FU：MFU是評估大模型訓(xùn)練效率的通用指標(biāo)，可以直接反應(yīng)端到端的集群訓(xùn)練效率?？涠鹑f卡集群在系統(tǒng)軟件、框架、算法等層面一系列優(yōu)化，實(shí)現(xiàn)大模型的高效率訓(xùn)練，MFU最高可達(dá)到60%。其中，在系統(tǒng)軟件層面，基于極致的計(jì)算和通訊效率優(yōu)化等技術(shù)手段，大幅提升集群的執(zhí)行效率和性能表現(xiàn)。在框架和算法層面，夸娥萬卡集群支持多種自適應(yīng)混合并行策略與高效顯存優(yōu)化等，可以根據(jù)應(yīng)用負(fù)載選擇并自動配置最優(yōu)的并行策略，大幅提升訓(xùn)練效率和顯存利用。同時，針對超長序列大模型，夸娥萬卡集群通過CP并行、RingAttention等優(yōu)化技術(shù)，有效縮減計(jì)算時間和顯存占用，大幅提升集群訓(xùn)練效率。

全能通用，生態(tài)友好：夸娥萬卡集群是一個通用加速計(jì)算平臺，計(jì)算能力為通用場景設(shè)計(jì)，可加速LLM、MoE、多模態(tài)、Mamba等不同架構(gòu)、不同模態(tài)的大模型。同時，基于高效易用的MUSA編程語言、完整兼容CUDA能力和自動化遷移工具M(jìn)usify，加速新模型“Day0”級遷移，實(shí)現(xiàn)生態(tài)適配“Instant On”，助力客戶業(yè)務(wù)快速上線。

萬眾一芯，共建大模型應(yīng)用生態(tài)

萬卡集群的建設(shè)需要產(chǎn)業(yè)界的齊心協(xié)力，為實(shí)現(xiàn)大模型創(chuàng)新應(yīng)用的快速落地，讓國產(chǎn)算力“為用而建”。發(fā)布會現(xiàn)場，摩爾線程攜手中國移動通訊集團(tuán)青海有限公司、中國聯(lián)通青海公司、北京德道信科集團(tuán)、中國能源建設(shè)股份有限公司總承包公司、桂林華崛大數(shù)據(jù)科技有限公司（排名不分先后），分別就青海零碳產(chǎn)業(yè)園萬卡集群項(xiàng)目、青海高原夸娥萬卡集群項(xiàng)目、廣西東盟萬卡集群項(xiàng)目進(jìn)行了戰(zhàn)略簽約。

借助摩爾線程先進(jìn)的夸娥全棧智算解決方案，各方將攜手共建強(qiáng)大的全國產(chǎn)智算平臺，以加速產(chǎn)業(yè)數(shù)字化轉(zhuǎn)型和高質(zhì)量發(fā)展?？涠鹑f卡智算集群項(xiàng)目標(biāo)志著國產(chǎn)AI算力基礎(chǔ)設(shè)施的又一重大進(jìn)展，將為各地的數(shù)字經(jīng)濟(jì)發(fā)展注入新活力。

發(fā)布會后，無問芯穹、清程極智、360、京東云、智平方等五家合作伙伴代表紛紛登臺，分享了摩爾線程夸娥智算集群如何助力其在大模型訓(xùn)練、大模型推理、具身智能等不同場景和領(lǐng)域的創(chuàng)新，展現(xiàn)了夸娥智算集群在實(shí)際應(yīng)用中的巨大潛力與廣泛適用性。

摩爾線程愿與廣大行業(yè)伙伴并肩同行，發(fā)揮全棧AI的力量，加速推動一個由萬卡智算集群為強(qiáng)大底座，多領(lǐng)域伙伴共建、廣泛賦能數(shù)字經(jīng)濟(jì)的國產(chǎn)智算生態(tài)，共同開啟一個屬于大模型與生成式人工智能的新時代，為美好世界加速。在WAIC期間，摩爾線程將在上海世博展覽館（H2館D616）開展“全棧AI 為美好世界加速”的主題成果展示，包括加速卡、服務(wù)器、超融合一體機(jī)和AIGC應(yīng)用在內(nèi)的摩爾線程全棧AI產(chǎn)品悉數(shù)亮相，并攜手眾多行業(yè)合作伙伴聯(lián)合展示基于夸娥智算集群的豐富行業(yè)大模型與應(yīng)用方案。

關(guān)于摩爾線程

摩爾線程成立于2020年10月，以全功能GPU為核心，致力于向全球提供加速計(jì)算的基礎(chǔ)設(shè)施和一站式解決方案，為各行各業(yè)的數(shù)智化轉(zhuǎn)型提供強(qiáng)大的AI計(jì)算支持。

我們的目標(biāo)是成為具備國際競爭力的GPU領(lǐng)軍企業(yè)，為融合人工智能和數(shù)字孿生的數(shù)智世界打造先進(jìn)的加速計(jì)算平臺。我們的愿景是為美好世界加速。

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報(bào)投訴

gpu

gpu

+關(guān)注

關(guān)注
28

文章
4729

瀏覽量
128890
AI

AI

+關(guān)注

關(guān)注
87

文章
30728

瀏覽量
268880
人工智能

人工智能

+關(guān)注

關(guān)注
1791

文章
47183

瀏覽量
238237
摩爾線程

摩爾線程

+關(guān)注

關(guān)注
2

文章
200

瀏覽量
4560

原文標(biāo)題：萬卡萬P萬億參數(shù)通用算力！摩爾線程夸娥智算中心解決方案重磅升級

文章出處：【微信號：moorethreads，微信公眾號：摩爾線程】歡迎添加關(guān)注！文章轉(zhuǎn)載請注明出處。

摩爾線程與羽人科技完成大語言模型訓(xùn)練測試

近日，摩爾線程與羽人科技攜手宣布，雙方已成功實(shí)現(xiàn)夸娥（KUAE）千卡智算集群與羽人系列模型解決方案

發(fā)表于 08-27 16:19 ?524次閱讀

摩爾線程和樂創(chuàng)能源簽署戰(zhàn)略合作協(xié)議

近日，摩爾線程和樂創(chuàng)能源簽署了戰(zhàn)略合作協(xié)議，雙方將聚焦能源大模型的創(chuàng)新與應(yīng)用，圍繞新能源領(lǐng)域的電池、新能源發(fā)電、負(fù)荷管理、需求側(cè)響應(yīng)等產(chǎn)品技術(shù)方向，共同研發(fā)能源大模型。依托摩爾線程全功

發(fā)表于 07-11 14:35 ?715次閱讀

摩爾線程全功能GPU加速三維GIS全國產(chǎn)解決方案

的方案與實(shí)踐，摩爾線程受邀參展。此次展覽，摩爾線程展示了基于國產(chǎn)空間智能軟件技術(shù)SuperMap開發(fā)的最新成果——“

發(fā)表于 06-27 18:15 ?994次閱讀

摩爾線程與智譜AI完成大模型性能測試與適配

近日，摩爾線程與智譜AI在人工智能領(lǐng)域開展了一輪深入的合作，共同對GPU大模型進(jìn)行了適配及性能測試。此次測試不僅涵蓋了大模型的推理能力，還涉及了基于摩爾線程

發(fā)表于 06-14 16:40 ?1065次閱讀

摩爾線程與羽人科技攜手完成7B大模型訓(xùn)練測試

近日，摩爾線程與羽人科技聯(lián)合宣布了一項(xiàng)重要成果：雙方已成功實(shí)現(xiàn)夸娥（KUAE）千卡智算集群與羽人系列模型

發(fā)表于 06-14 16:33 ?485次閱讀

摩爾線程與師者AI攜手完成70億參數(shù)教育AI大模型訓(xùn)練測試

近日，國內(nèi)知名的GPU制造商摩爾線程與全學(xué)科教育AI大模型“師者AI”聯(lián)合宣布，雙方已成功完成了一項(xiàng)重要的大模型訓(xùn)練測試。此次測試依托摩爾線程夸

發(fā)表于 06-14 16:31 ?571次閱讀

摩爾線程和滴普科技完成大模型訓(xùn)練與推理適配

近日，摩爾線程與滴普科技宣布了一項(xiàng)重要合作成果。摩爾線程的夸娥（KUAE）千卡智

發(fā)表于 05-30 10:14 ?542次閱讀

摩爾線程千卡智算集群與滴普企業(yè)大模型已完成訓(xùn)練及推理適配

近日，摩爾線程與國內(nèi)領(lǐng)先的數(shù)據(jù)智能服務(wù)商滴普科技共同宣布，摩爾線程夸娥（KUAE）千卡智

發(fā)表于 05-29 10:28 ?463次閱讀

摩爾線程與無問芯穹在國產(chǎn)GPU上首次實(shí)現(xiàn)大模型實(shí)訓(xùn)

近日，摩爾線程與無問芯穹共同宣布，雙方已正式完成基于國產(chǎn)全功能GPU千卡集群的3B規(guī)模大模型實(shí)訓(xùn)。這款名為“MT-infini-3B”的模型，在摩爾線程

發(fā)表于 05-27 10:59 ?657次閱讀

摩爾線程攜手憨猴集團(tuán)，深化AI算力戰(zhàn)略合作，成功實(shí)現(xiàn)大模型分布式訓(xùn)練

摩爾線程與憨猴科技集團(tuán)日前宣布，采用搭載摩爾線程的夸娥（KUAE）千卡智

發(fā)表于 05-17 17:24 ?681次閱讀

摩爾線程攜手憨猴集團(tuán)，共同探索國產(chǎn)AI算力的新應(yīng)用場景與落地實(shí)踐

摩爾線程與憨猴科技集團(tuán)有限公司（簡稱：憨猴集團(tuán)）近日宣布，基于摩爾線程的夸娥（KUAE）千卡智

發(fā)表于 05-17 15:08 ?450次閱讀

摩爾線程張建中：以國產(chǎn)算力助力數(shù)智世界，滿足大模型算力需求

摩爾線程創(chuàng)始人兼CEO張建中在會上透露，為了滿足國內(nèi)對AI算力的迫切需求，他們正在積極尋求與國內(nèi)頂尖科研機(jī)構(gòu)的深度合作，共同推動更大規(guī)模的AI智算集群項(xiàng)目。

發(fā)表于 05-10 16:36 ?950次閱讀

摩爾線程助力AI大模型訓(xùn)練與計(jì)算升級，共建美好數(shù)字化未來

此外，在中關(guān)村國際技術(shù)交易大會高精尖技術(shù)產(chǎn)品首發(fā)會上，摩爾線程與無問芯穹聯(lián)合宣布，雙方正致力于開發(fā)基于夸娥千卡智算集群的“MT-infini

發(fā)表于 04-28 16:42 ?1081次閱讀

摩爾線程榮膺2023北京市數(shù)字經(jīng)濟(jì)標(biāo)桿企業(yè)——數(shù)字基礎(chǔ)技術(shù)類

智算平臺，尤其是GPU，不僅是人工智能和數(shù)字經(jīng)濟(jì)騰飛的堅(jiān)實(shí)基石，更是生成式AI運(yùn)算的核心。摩爾線程的KUAE（夸娥）智

發(fā)表于 03-05 15:34 ?684次閱讀

國產(chǎn)摩爾線程顯卡驅(qū)動重磅升級！

今日，摩爾線程正式發(fā)布版本號為v250.60的Windows驅(qū)動程序，著重對DirectX 11游戲性能進(jìn)行了大幅優(yōu)化。

發(fā)表于 02-21 09:13 ?1070次閱讀

RM新时代网站-首页

搜索歷史

摩爾線程夸娥智算中心解決方案重磅升級

評論

摩爾線程與羽人科技完成大語言模型訓(xùn)練測試

摩爾線程和樂創(chuàng)能源簽署戰(zhàn)略合作協(xié)議

摩爾線程全功能GPU加速三維GIS全國產(chǎn)解決方案

摩爾線程與智譜AI完成大模型性能測試與適配

摩爾線程與羽人科技攜手完成7B大模型訓(xùn)練測試

摩爾線程與師者AI攜手完成70億參數(shù)教育AI大模型訓(xùn)練測試

摩爾線程和滴普科技完成大模型訓(xùn)練與推理適配

摩爾線程千卡智算集群與滴普企業(yè)大模型已完成訓(xùn)練及推理適配

摩爾線程與無問芯穹在國產(chǎn)GPU上首次實(shí)現(xiàn)大模型實(shí)訓(xùn)

摩爾線程攜手憨猴集團(tuán)，深化AI算力戰(zhàn)略合作，成功實(shí)現(xiàn)大模型分布式訓(xùn)練

摩爾線程攜手憨猴集團(tuán)，共同探索國產(chǎn)AI算力的新應(yīng)用場景與落地實(shí)踐

摩爾線程張建中：以國產(chǎn)算力助力數(shù)智世界，滿足大模型算力需求

摩爾線程助力AI大模型訓(xùn)練與計(jì)算升級，共建美好數(shù)字化未來

摩爾線程榮膺2023北京市數(shù)字經(jīng)濟(jì)標(biāo)桿企業(yè)——數(shù)字基礎(chǔ)技術(shù)類

國產(chǎn)摩爾線程顯卡驅(qū)動重磅升級！