資料介紹
并行矩陣乘法是線性代數(shù)中最重要的基本運(yùn)算之一,同時(shí)也是許多科學(xué)應(yīng)用的基石。隨著高性能計(jì)算(HPC)向E級(jí)計(jì)算發(fā)展,并行矩陣乘法的通信開(kāi)銷所占比重越來(lái)越大。如何降低并行矩陣乘法的通信開(kāi)銷,提高并行矩陣乘的可擴(kuò)展性是當(dāng)前研究的熱點(diǎn)之一。本文提出一種新型的分布式并行稠密矩陣乘算法,即2.5D版本的PUMMA( Parallel Universal matrix Multiplication Algorithm)算法,該算法是通過(guò)將初始的進(jìn)程分成c組,利用計(jì)算節(jié)點(diǎn)的額外內(nèi)存,在每個(gè)進(jìn)程組上同時(shí)存儲(chǔ)矩陣A、B和執(zhí)行1/c的 PUMMA算法,最后通過(guò)規(guī)約操作來(lái)得到矩陣乘的最終結(jié)果。本文基于 BLACS( Basic Linear Algebra Communication Subprograms)通信庫(kù)實(shí)現(xiàn)了一種從2D到2.5D的新型數(shù)據(jù)重分配算法,與 PUMMA算法相結(jié)合,最終得到2.5 D PUMMA算法,可直接替換 PDGEM( Parallel double- precision General Matrix-matrix Multiplication),具有良好的可移植性。與國(guó)際標(biāo)準(zhǔn)算法庫(kù) ScalaPACK( Scalable Linear algebra Package)中的 PDGEMM等經(jīng)典D算法相比,本文算法縮減了通信次數(shù),提高了數(shù)據(jù)局部性,具有更好的可擴(kuò)展性。在進(jìn)程數(shù)較多時(shí),例如4096進(jìn)程時(shí),系統(tǒng)測(cè)試表明相對(duì) PDGEMM的加速比可達(dá)到2.20~2.93.進(jìn)一步地,本文將2.5 D PUMMA算法應(yīng)用于加速計(jì)算對(duì)稱三對(duì)角矩陣的特征值分解,其加速比可達(dá)到1.2以上本文通過(guò)大量數(shù)值算例分析了2.5DMMA算法的性能,并給出了實(shí)用性建議和總結(jié)了未來(lái)的工作。
- MapReduce框架下分布式編碼計(jì)算容錯(cuò)算法 2次下載
- 深層轉(zhuǎn)導(dǎo)式非負(fù)矩陣分解并行算法 16次下載
- 輕量級(jí)分布式機(jī)器學(xué)習(xí)系統(tǒng)及算法 16次下載
- 基于分布式編碼的同步隨機(jī)梯度下降算法 2次下載
- 基于分布式數(shù)據(jù)Cache的實(shí)時(shí)動(dòng)態(tài)遷移機(jī)制 20次下載
- 結(jié)合網(wǎng)絡(luò)推演和失效檢測(cè)算法的航電分布式顯控 13次下載
- 增量式約簡(jiǎn)最小二乘孿生攴持向量回歸機(jī)算法 15次下載
- 一種分布式網(wǎng)絡(luò)掃描架構(gòu)和任務(wù)調(diào)度算法 19次下載
- 快速在線分布式對(duì)偶平均優(yōu)化算法 5次下載
- 基于并行遺傳算法的VOD系統(tǒng)負(fù)載均衡研究 0次下載
- FIR數(shù)字濾波器分布式算法的原理及FPGA實(shí)現(xiàn)
- 分布式并行BOD系統(tǒng)資源管理算法研究
- 基于DSP的分布式并行遺傳算法
- 基于ProActive的分布式并行Web Spider設(shè)計(jì)
- 分布式數(shù)據(jù)挖掘計(jì)算過(guò)程-DDCP算法研究
- Java手寫分布式鎖的實(shí)現(xiàn) 424次閱讀
- tldb提供分布式鎖使用方法 761次閱讀
- 基于PyTorch的模型并行分布式訓(xùn)練Megatron解析 2284次閱讀
- 深入理解redis分布式鎖 763次閱讀
- 如何對(duì)spmv算法進(jìn)行優(yōu)化 1064次閱讀
- 鴻蒙分布式相機(jī)“踩坑”分享 1578次閱讀
- 一文讀懂經(jīng)典雙目稠密匹配算法SGM 1227次閱讀
- 利用NI VeriStand 2010實(shí)現(xiàn)分布式同步系統(tǒng)的設(shè)計(jì) 3154次閱讀
- 詳談分布式系統(tǒng)的定義及屬性 3689次閱讀
- 分布式光纖傳感器原理_分布式光纖傳感器的應(yīng)用 8424次閱讀
- Redis 分布式鎖的正確實(shí)現(xiàn)方式 3483次閱讀
- 淺談分布式塊存儲(chǔ)的元數(shù)據(jù)服務(wù)設(shè)計(jì) 4871次閱讀
- 并行計(jì)算和分布式計(jì)算的區(qū)別和聯(lián)系 3.5w次閱讀
- 一種基于分布式算法的低通FIR濾波器 3191次閱讀
- 深度解讀分布式存儲(chǔ)技術(shù)之分布式剪枝系統(tǒng) 1773次閱讀
下載排行
本周
- 1山景DSP芯片AP8248A2數(shù)據(jù)手冊(cè)
- 1.06 MB | 532次下載 | 免費(fèi)
- 2RK3399完整板原理圖(支持平板,盒子VR)
- 3.28 MB | 339次下載 | 免費(fèi)
- 3TC358743XBG評(píng)估板參考手冊(cè)
- 1.36 MB | 330次下載 | 免費(fèi)
- 4DFM軟件使用教程
- 0.84 MB | 295次下載 | 免費(fèi)
- 5元宇宙深度解析—未來(lái)的未來(lái)-風(fēng)口還是泡沫
- 6.40 MB | 227次下載 | 免費(fèi)
- 6迪文DGUS開(kāi)發(fā)指南
- 31.67 MB | 194次下載 | 免費(fèi)
- 7元宇宙底層硬件系列報(bào)告
- 13.42 MB | 182次下載 | 免費(fèi)
- 8FP5207XR-G1中文應(yīng)用手冊(cè)
- 1.09 MB | 178次下載 | 免費(fèi)
本月
- 1OrCAD10.5下載OrCAD10.5中文版軟件
- 0.00 MB | 234315次下載 | 免費(fèi)
- 2555集成電路應(yīng)用800例(新編版)
- 0.00 MB | 33566次下載 | 免費(fèi)
- 3接口電路圖大全
- 未知 | 30323次下載 | 免費(fèi)
- 4開(kāi)關(guān)電源設(shè)計(jì)實(shí)例指南
- 未知 | 21549次下載 | 免費(fèi)
- 5電氣工程師手冊(cè)免費(fèi)下載(新編第二版pdf電子書)
- 0.00 MB | 15349次下載 | 免費(fèi)
- 6數(shù)字電路基礎(chǔ)pdf(下載)
- 未知 | 13750次下載 | 免費(fèi)
- 7電子制作實(shí)例集錦 下載
- 未知 | 8113次下載 | 免費(fèi)
- 8《LED驅(qū)動(dòng)電路設(shè)計(jì)》 溫德?tīng)栔?/a>
- 0.00 MB | 6656次下載 | 免費(fèi)
總榜
- 1matlab軟件下載入口
- 未知 | 935054次下載 | 免費(fèi)
- 2protel99se軟件下載(可英文版轉(zhuǎn)中文版)
- 78.1 MB | 537798次下載 | 免費(fèi)
- 3MATLAB 7.1 下載 (含軟件介紹)
- 未知 | 420027次下載 | 免費(fèi)
- 4OrCAD10.5下載OrCAD10.5中文版軟件
- 0.00 MB | 234315次下載 | 免費(fèi)
- 5Altium DXP2002下載入口
- 未知 | 233046次下載 | 免費(fèi)
- 6電路仿真軟件multisim 10.0免費(fèi)下載
- 340992 | 191187次下載 | 免費(fèi)
- 7十天學(xué)會(huì)AVR單片機(jī)與C語(yǔ)言視頻教程 下載
- 158M | 183279次下載 | 免費(fèi)
- 8proe5.0野火版下載(中文版免費(fèi)下載)
- 未知 | 138040次下載 | 免費(fèi)
評(píng)論
查看更多