RM新时代网站-首页

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

GTC 2023:深度學(xué)習(xí)之張星并行和流水線并行

西西 ? 來源:GTC 2023 ? 作者:GTC 2023 ? 2023-03-23 17:21 ? 次閱讀

除了數(shù)據(jù)并行之外,還有其他的主流并行技術(shù),即張星并行和流水線并行訓(xùn)練。

張星并行和流水線并行技術(shù)通常被描述為模型并行,在開源社區(qū)中,最著名的兩個(gè)系統(tǒng)是NVIDIA的Megatron- M和Microsoft的DeepSpeed。

Megatron- M使用一維張量并行,線算符的權(quán)重被分割,大型矩陣乘法被分解為在不同設(shè)備上執(zhí)行的較小矩陣藏法,這可以是模型大小在集群中擴(kuò)展并提高計(jì)算效率。

微軟的DeepSpeed和NVIDIA的Megatron- M兼容,并通過Zero Redundancy Optimizer改善數(shù)據(jù)并行訓(xùn)練,消除內(nèi)存冗余。

Colossal-AI不僅提供了完整的現(xiàn)有并行方法,還提供了更高級(jí)的辦法,例如2D、2.5D 和3D張星并行,以及序列并行。

與1D張量并行相比,這些并稱為是2.5D 和3D張星并行,不僅切分參數(shù),而且沿更多張量唯獨(dú)切分輸入和輸出,正方形或者立方體的每個(gè)子集,表示可以分配給不同處理器的部分?jǐn)?shù)據(jù)和工作。

2D張量并行基于經(jīng)典SUMMA矩陣?yán)?a target="_blank">算法

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 人工智能
    +關(guān)注

    關(guān)注

    1791

    文章

    47183

    瀏覽量

    238246
  • 英偉達(dá)
    +關(guān)注

    關(guān)注

    22

    文章

    3770

    瀏覽量

    90984
  • 深度學(xué)習(xí)
    +關(guān)注

    關(guān)注

    73

    文章

    5500

    瀏覽量

    121111
  • gtc
    gtc
    +關(guān)注

    關(guān)注

    0

    文章

    73

    瀏覽量

    4425
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    FPGA中的流水線設(shè)計(jì)

    令預(yù)取、 譯碼、 執(zhí)行、 寫回結(jié)果, openrisc采用的是 5 級(jí)整數(shù)流水線。當(dāng)然它們的核心思想都是利用并行執(zhí)行提高效率。總結(jié)一下,流水線就是插入寄存器,以面積換取速度。`
    發(fā)表于 10-26 14:38

    基于流水線負(fù)載平衡模型的并行爬蟲研究

    針對(duì)并行爬蟲系統(tǒng)在多任務(wù)并發(fā)執(zhí)行時(shí)所遇到的模塊間負(fù)載平衡問題,提出流水線負(fù)載平衡模型(PLB),將不同的任務(wù)抽象為獨(dú)立模塊而達(dá)到各模塊的處理速度相等,采用多線程的方式
    發(fā)表于 03-31 10:19 ?19次下載

    基于流水線技術(shù)的并行高效FIR濾波器設(shè)計(jì)

    基于流水線技術(shù)的并行高效FIR濾波器設(shè)計(jì) 基于流水線技術(shù),利用FPGA進(jìn)行并行可重復(fù)配置高精度的FIR濾波器設(shè)計(jì)。使用VHDL可以很方便地改變?yōu)V波器的系數(shù)和階數(shù)。在DSP中采用
    發(fā)表于 03-28 15:12 ?813次閱讀
    基于<b class='flag-5'>流水線</b>技術(shù)的<b class='flag-5'>并行</b>高效FIR濾波器設(shè)計(jì)

    什么是流水線技術(shù)

    什么是流水線技術(shù) 流水線技術(shù)
    發(fā)表于 02-04 10:21 ?3927次閱讀

    流水線中的相關(guān)培訓(xùn)教程[1]

    流水線中的相關(guān)培訓(xùn)教程[1]  學(xué)習(xí)目標(biāo)     理解流水線中相關(guān)的分類及定義;
    發(fā)表于 04-13 15:56 ?1046次閱讀

    基于流水線并行FIR濾波器設(shè)計(jì)

    基于流水線技術(shù),利用FPGA進(jìn)行并行可重復(fù)配置高精度的 FIR濾波器 設(shè)計(jì)。使用VHDL可以很方便地改變?yōu)V波器的系數(shù)和階數(shù)。在DSP中采用這種FIR濾波器的設(shè)計(jì)方法可以充分發(fā)揮FPGA的優(yōu)勢。
    發(fā)表于 07-18 17:09 ?63次下載
    基于<b class='flag-5'>流水線</b>的<b class='flag-5'>并行</b>FIR濾波器設(shè)計(jì)

    CPU流水線的定義

    cpu流水線技術(shù)是一種將指令分解為多步,并讓不同指令的各步操作重疊,從而實(shí)現(xiàn)幾條指令并行處理,以加速程序運(yùn)行過程的技術(shù)。
    發(fā)表于 12-14 15:29 ?4687次閱讀

    電鍍流水線的PLC控制

    電鍍流水線的PLC控制電鍍流水線的PLC控制電鍍流水線的PLC控制
    發(fā)表于 02-17 17:13 ?36次下載

    Verilog基本功流水線設(shè)計(jì)Pipeline Design

    ,并暫存中間數(shù)據(jù)的方法。 目的是將一個(gè)大操作分解成若干的小操作,每一步小操作的時(shí)間較小,所以能提高頻率,各小操作能并行 執(zhí)行,所以能提高數(shù)據(jù)吞吐率(提高處理速度)。 二. 什么時(shí)候用流水線設(shè)計(jì) 使用流水線一般是時(shí)序比較緊張
    發(fā)表于 09-25 17:12 ?6372次閱讀

    EE-383:基于MDMA的雙SHARC+并行流水線音頻直通

    EE-383:基于MDMA的雙SHARC+并行流水線音頻直通
    發(fā)表于 04-29 17:30 ?0次下載
    EE-383:基于MDMA的雙SHARC+<b class='flag-5'>并行</b><b class='flag-5'>流水線</b>音頻直通

    各種流水線特點(diǎn)及常見流水線設(shè)計(jì)方式

    按照流水線的輸送方式大體可以分為:皮帶流水裝配線、板鏈線、倍速鏈、插件線、網(wǎng)帶線、懸掛線及滾筒流水線這七類流水線。
    的頭像 發(fā)表于 07-05 11:12 ?7332次閱讀
    各種<b class='flag-5'>流水線</b>特點(diǎn)及常見<b class='flag-5'>流水線</b>設(shè)計(jì)方式

    嵌入式_流水線

    ,每個(gè)子過程由專門的功能部件來實(shí)現(xiàn)。? 把多個(gè)處理過程在時(shí)間上錯(cuò)開,依次通過各功能段,這樣,每個(gè)子過程就可以與其他的子過程并行進(jìn)行。流水線中的每個(gè)子過程及其功能部件稱為流水線的級(jí)或段,段與段相互連接形成
    發(fā)表于 10-20 20:51 ?6次下載
    嵌入式_<b class='flag-5'>流水線</b>

    什么是流水線 Jenkins的流水線詳解

    jenkins 有 2 種流水線分為聲明式流水線與腳本化流水線,腳本化流水線是 jenkins 舊版本使用的流水線腳本,新版本 Jenkin
    發(fā)表于 05-17 16:57 ?1083次閱讀

    以Gpipe作為流水線并行的范例進(jìn)行介紹

    和充沛優(yōu)質(zhì)的硬件資源 算法的迭代創(chuàng)新 在大模型訓(xùn)練這個(gè)系列里,我們將一起探索學(xué)習(xí)幾種經(jīng)典的分布式并行范式,包括 流水線并行(Pipeline Parallelism),數(shù)據(jù)
    的頭像 發(fā)表于 05-25 11:41 ?1087次閱讀
    以Gpipe作為<b class='flag-5'>流水線</b><b class='flag-5'>并行</b>的范例進(jìn)行介紹

    Google GPipe為代表的流水線并行范式

    但在實(shí)際應(yīng)用中,流水線并行并不特別流行,主要原因是模型能否均勻切割,影響了整體計(jì)算效率,這就需要算法工程師做手調(diào)。因此,今天我們來介紹一種應(yīng)用最廣泛,最易于理解的并行范式:數(shù)據(jù)并行
    的頭像 發(fā)表于 05-26 14:40 ?1024次閱讀
    Google GPipe為代表的<b class='flag-5'>流水線</b><b class='flag-5'>并行</b>范式
    RM新时代网站-首页