RM新时代是骗人的吗,rm新时代公司官网

老話常說，“你付出什么，就得到什么”，這可能是總結(jié)接下來幾段內(nèi)容的最簡單方式，我們將介紹Imagination的新OpenCL計算庫。如果你沒有時間繼續(xù)閱讀，只需記住這一點：我們能夠從GPU中擠壓出更多的計算和AI性能，因為我們在這些新軟件庫的精心設(shè)計上投入了大量工作，這樣我們的客戶就不必再投入這些工作了。對于一些客戶來說，這種開箱即用的體驗正是他們完成工作所需的。而對于其他客戶，特別是那些正在開發(fā)自己的自定義庫/內(nèi)核的客戶，Imagination的計算庫以及相關(guān)的支持材料和工具，是他們在開發(fā)和性能目標(biāo)上取得成功的一個完美起點。

Imagination多年來一直在構(gòu)建支持OpenCL的GPU，用于計算應(yīng)用。我們與許多企業(yè)合作，這些企業(yè)擁有自己的NPU（神經(jīng)處理單元），但需要一個GPU（通用GPU）來提供NPU通常不具備的編程靈活性。我們還看到市場上普遍認(rèn)識到靈活性是必不可少的，尤其是在從“功能到性能再到優(yōu)化”的開發(fā)者旅程中針對自己的計算算法時。我們在之前的文章《擁抱邊緣AI中的靈活性》中討論了通用加速相對于特定領(lǐng)域加速的優(yōu)勢，并強(qiáng)調(diào)開發(fā)者的賦能在于提供適合工作的軟件。

什么是正確的軟件呢？

數(shù)學(xué)庫和神經(jīng)網(wǎng)絡(luò)庫被廣泛認(rèn)為是在可編程平臺上高效執(zhí)行AI應(yīng)用和其他計算密集型工作負(fù)載的基本構(gòu)建塊。車內(nèi)駕駛員監(jiān)控應(yīng)用、激光雷達(dá)、雷達(dá)、視覺預(yù)/后處理算法，甚至是像LLM這樣的基礎(chǔ)模型中的transformer塊的關(guān)鍵處理元素，都依賴于底層優(yōu)化的庫。對這些基本構(gòu)建塊的需求催生了大量的開源項目（如clBLAS、vkFFT、xnnpack等），任何開發(fā)者現(xiàn)在都可以快速訪問并在他們的應(yīng)用中使用這些庫，以實現(xiàn)其功能。

然而，最初的完成工作的熱情往往很快會被失望所取代，因為開發(fā)者發(fā)現(xiàn)，使用開源庫的性能遠(yuǎn)遠(yuǎn)低于他們基于可用硬件 TFLOPS/TOPS的預(yù)期。隨后，這種失望很快會變成持續(xù)的挫敗感，因為用戶面對的現(xiàn)實是，要解決這些問題，需要深入了解硬件微架構(gòu)和開發(fā)者工具。

這是一個新問題嗎？

在我職業(yè)生涯的早期，我花了幾年時間深入優(yōu)化用于音頻和視頻算法的DSP代碼，任何在邊緣計算領(lǐng)域工作過的人都會講述類似的故事：通宵達(dá)旦地吃著披薩，與算法、編譯器和硬件調(diào)試器斗爭，以獲得所需性能。盡管自那時以來，技術(shù)取得了許多進(jìn)步，比如新的并行編程語言和智能編譯技術(shù)，但歸根結(jié)底，情況并沒有太大改變。對最高性能的需求依然存在，而這只能通過手工優(yōu)化的算法和底層庫及內(nèi)核來滿足。如果沒有這些性能庫，最近流行的“加速計算”這一術(shù)語就無法實現(xiàn)其承諾，即充分利用底層硬件的潛力來加速計算任務(wù)。換句話說，如果不投資于軟件，客戶就永遠(yuǎn)無法真正解鎖硬件的潛力。這是一個新問題嗎？顯然不是！從任何系統(tǒng)中獲得最優(yōu)性能的挑戰(zhàn)一直都很困難，并且仍然如此。解決這個問題需要廣泛的專業(yè)知識：1. 對算法及其算法實現(xiàn)選擇的深刻理解（通常問題具有多維度，有許多分解方式可供選擇）。
2. 深入了解硬件微架構(gòu)以及可用于利用上述架構(gòu)選擇的各種選項。3. 了解編程語言的靈活性和功能，以及相關(guān)編譯器的“智能”。4. 在一段時間內(nèi)持續(xù)應(yīng)用上述知識，為用戶可能需要的多種可能性開發(fā)良好的覆蓋范圍。優(yōu)秀的程序員能夠?qū)⑺羞@些要素結(jié)合在一起，并且再加上只有最有經(jīng)驗的編碼人員才能掌握的一點點魔法，從而從硬件中獲得非常好的甚至最優(yōu)性能的。但這樣的程序員是稀缺的。

因此，為了讓加速計算的承諾對每個人來說都可實現(xiàn)，Imagination將其專業(yè)知識應(yīng)用于這個問題。畢竟，我們的工程師是最適合為我們自己的硬件創(chuàng)建優(yōu)化庫的人。

Imagination的解決方案是什么？Imagination的GPU產(chǎn)品的靈活微架構(gòu)為智能映射和并行化工作負(fù)載提供了許多機(jī)會，以最大化計算引擎和內(nèi)存層次帶寬（GPU內(nèi)部和外部）的利用率。為了實現(xiàn)最優(yōu)性能，Imagination的一個跨職能專家團(tuán)隊解決了上述所有問題，并應(yīng)用了我們對運行時系統(tǒng)中動態(tài)元素的深入理解，例如運行時OpenCL編譯器和硬件的動態(tài)調(diào)度。從這項活動中獲得的經(jīng)驗反饋到硬件和編譯器設(shè)計的改進(jìn)中，通過我們的AI產(chǎn)品路線圖，這個良性循環(huán)將持續(xù)進(jìn)行。在發(fā)布時，Imagination的OpenCL計算庫通常能夠?qū)崿F(xiàn)比客戶使用開源解決方案所報告的性能提升3倍到4倍的更好結(jié)果。

在新發(fā)布的DXS GPU中，這些庫與專注于計算的硬件改進(jìn)相結(jié)合，例如額外的SPU（可擴(kuò)展處理單元）和額外的FP16流水線，對于許多計算工作負(fù)載，相比我們上一代的汽車GPU，性能提升了10倍或更多。

還有什么？

我們這些基礎(chǔ)庫的目標(biāo)是專注于我們作為IP公司的核心價值：最大限度地發(fā)揮我們芯片的性能，并使用戶能夠做到同樣的事情。但除此之外，我們還在做什么？我們現(xiàn)在專注于兩個關(guān)鍵領(lǐng)域：1. 提供參考計算和AI工具包，使客戶能夠在實際用例中利用這些計算庫。

2. 構(gòu)建我們的領(lǐng)域?qū)＜液献骰锇樯鷳B(tài)系統(tǒng)，幫助客戶通過解決方案和服務(wù)加速其上市目標(biāo)。

我們最近與MulticoreWare和澎峰科技的合作就是創(chuàng)新合作伙伴基于我們的計算庫構(gòu)建AI解決方案，并利用我們的參考工具包的兩個范例。

“

澎峰科技為希望加速AI的企業(yè)開發(fā)異構(gòu)計算軟件堆棧和基礎(chǔ)設(shè)施解決方案。我們使用Imagination的計算軟件解決方案在Imagination GPU上運行各種AI應(yīng)用，包括我們的LLM推理引擎PerfXLM，迄今為止與CPU相比性能提升高達(dá)100%，而移植所需的時間極少。

——澎峰科技首席執(zhí)行官張先軼

”

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴

AI

AI

+關(guān)注

關(guān)注
87

文章
30728

瀏覽量
268882
計算軟件

計算軟件

+關(guān)注

關(guān)注
0

文章
54

瀏覽量
11025
軟件庫

軟件庫

+關(guān)注

關(guān)注
0

文章
15

瀏覽量
7764

云計算HPC軟件關(guān)鍵技術(shù)

云計算HPC軟件關(guān)鍵技術(shù)涉及系統(tǒng)架構(gòu)、處理器技術(shù)、操作系統(tǒng)、計算加速、網(wǎng)絡(luò)技術(shù)以及軟件優(yōu)化等多個方面。下面，

發(fā)表于 12-18 11:23 ?72次閱讀

開源AI模型庫是干嘛的

開源AI模型庫是指那些公開源代碼、允許自由訪問和使用的AI模型集合。這些模型通常經(jīng)過訓(xùn)練，能夠執(zhí)行特定的任務(wù)。以下，是對開源AI模型庫的詳細(xì)

發(fā)表于 12-14 10:33 ?155次閱讀

Arm成功將Arm KleidiAI軟件庫集成到騰訊自研的Angel 機(jī)器學(xué)習(xí)框架

Arm 與騰訊攜手合作，成功將 Arm KleidiAI 軟件庫集成到騰訊自研的 Angel 機(jī)器學(xué)習(xí)框架。 ? 借助 KleidiAI 解鎖卓越性能、能效和可移植性，騰訊混元大模型能夠?qū)崿F(xiàn)更快

發(fā)表于 11-24 15:33 ?661次閱讀

AI云端計算資源有哪些類型

AI云端計算資源涵蓋了從基礎(chǔ)設(shè)施到軟件服務(wù)的多個層面，為AI模型的訓(xùn)練、推理和部署提供了強(qiáng)大的支持。下面，AI部落小編為您詳細(xì)介紹

發(fā)表于 11-15 09:39 ?157次閱讀

AI高性能計算平臺是什么

AI高性能計算平臺不僅是AI技術(shù)發(fā)展的基石，更是推動AI應(yīng)用落地、加速產(chǎn)業(yè)升級的重要工具。以下，是對AI高性能

發(fā)表于 11-11 09:56 ?180次閱讀

InfiniBand網(wǎng)絡(luò)內(nèi)計算的關(guān)鍵技術(shù)和應(yīng)用

InfiniBand在高性能計算（HPC）和人工智能（AI）應(yīng)用中發(fā)揮著關(guān)鍵作用，體現(xiàn)在它提供了高速、低延遲的網(wǎng)絡(luò)通信能力，以支持大規(guī)模數(shù)據(jù)傳輸和復(fù)雜計算任務(wù)。而InfiniBand的

發(fā)表于 10-23 11:33 ?329次閱讀

RISC-V如何支持不同的AI和機(jī)器學(xué)習(xí)框架和庫？

RISC-V如何支持不同的AI和機(jī)器學(xué)習(xí)框架和庫？還請壇友們多多指教一下。

發(fā)表于 10-10 22:24

線程創(chuàng)建成功了，為啥ai_thread_entry（）函數(shù)不運行呢？

我這個線程創(chuàng)建成功了，為啥ai_thread_entry（）函數(shù)不運行呢？ void airun_thread() { /* 創(chuàng)建 serial 線程 */ rt_thread_t

發(fā)表于 09-27 09:35

中國首個量子計算專項智庫成立

9月11日，記者從安徽省量子計算工程研究中心獲悉，中國首個量子計算專項智庫“量子計算觀察”正式成立，中國量子信息奠基人、中國科學(xué)院院士郭光燦受邀擔(dān)任智

發(fā)表于 09-12 08:07 ?242次閱讀

中國首個量子<b class='flag-5'>計算</b>專項智<b class='flag-5'>庫</b>成立

NVIDIA IGX平臺加速實時邊緣AI應(yīng)用

實時邊緣 AI 對于醫(yī)療、工業(yè)和科學(xué)計算至關(guān)重要，因為這些任務(wù)關(guān)鍵型應(yīng)用需要即時數(shù)據(jù)處理、低延遲和高可靠性，以確保作出及時準(zhǔn)確的決策。這些挑戰(zhàn)不僅涉及硬件平臺上的高帶寬傳感器處理和 AI

發(fā)表于 09-09 10:14 ?515次閱讀

Arm KleidiAI軟件庫的功能解析

在持續(xù)快速發(fā)展的人工智能 (AI) 時代，Arm 堅定地支持全球數(shù)百萬開發(fā)者，確保他們能夠獲得 AI 創(chuàng)新開發(fā)所需的性能、工具和軟件庫，從而順利打造下一波令人驚嘆的

發(fā)表于 09-05 15:41 ?449次閱讀

使用Arm KleidiCV開源庫加速圖像處理性能

針對 Arm CPU 優(yōu)化的性能關(guān)鍵型例程的開源庫。該軟件庫專為集成到各種計算機(jī)視覺框架而設(shè)計，能夠為 Arm 平臺上的

發(fā)表于 09-03 11:32 ?1793次閱讀

怎么在NanoEdge AI Studio設(shè)定交叉編譯器呢？

20231009\", 那么問題來了，怎么在NanoEdge AI Studio設(shè)定交叉編譯器呢，比如設(shè)置為armcc、armclang、iccram，因為我需要將庫加到keil或者iar工程里面。看樣子這個軟件生成的

發(fā)表于 03-07 06:28

什么是AI邊緣計算，AI邊緣計算的特點和優(yōu)勢介紹

隨著人工智能的迅猛發(fā)展，AI邊緣計算成為了熱門話題。那么什么是AI邊緣計算呢？簡單來說，它是將人工智能技術(shù)引入邊緣計算的新興領(lǐng)域，旨在將

發(fā)表于 02-01 11:42 ?880次閱讀

通用Tensilica軟件堆棧提供最佳邊緣AI性能

開發(fā)敏捷的軟件堆棧對 AI 在邊緣側(cè)的成功部署非常重要。

發(fā)表于 01-18 13:39 ?776次閱讀