RM新时代网站-首页

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

如何在 OrangePi 5 Pro?的?NPU?上運行?LLM

香橙派 ? 2024-11-28 14:55 ? 次閱讀

OrangePi5 Pro上訪問NPU需要安裝最新版Ubuntu的定制版本,還需要安裝特殊軟件,讓你能在NPU而不是CPU上運行專門轉(zhuǎn)換的LLM。整個過程肯定要比運行Ollama復雜得多,但如果你愿意迎接挑戰(zhàn),就能獲得不菲的收益。所以,如果你感興趣,就讓我們深入了解一下吧!

wKgZO2dIE12AF7wFAAtHJLEEUFE775.png

安裝操作系統(tǒng)

首先要安裝合適的操作系統(tǒng)。我推薦 GitHub用戶Joshua Riek專門為Rockchip SoC定制的Ubuntu。你需要的是24.04版本,因為它擁有運行LLM所需的最新版NPU驅(qū)動程序。為OrangePiSD卡上刷新操作系統(tǒng)的方法與Raspberry Pi基本相同,以下是簡要介紹:

1.將操作系統(tǒng)鏡像下載到你選擇的電腦上。

2.打開一個可以幫助閃存 SD卡的程序。在本指南中,我們將使用balenaEtcher。

3.選擇 “從文件閃存”,然后選擇之前下載的操作系統(tǒng)映像文件。

wKgZO2dIE1yAR--0AAFCLbXx-WE246.png

4.確保已插入 SD卡,然后單擊 “選擇目標”。

5.從列表中選擇 SD卡,然后單擊 “選擇”。

6.選擇 Flash!

wKgZPGdIE1yAdNDNAAD2_342gpU886.png

這個過程可能需要 10分鐘才能完成,所以在程序運行時請耐心等待。

成功閃存操作系統(tǒng)后,將 SD卡傳輸?shù)侥愕腛rangePi中,然后打開電源。確保你手邊有鍵盤和顯示器,因為我們需要直接訪問我們的 SBC,至少需要足夠長的時間來安裝SSH。

安裝 SSH

在 OPi上完成初始操作系統(tǒng)設(shè)置后,按Ctrl + Alt + T鍵打開終端,在終端中輸入sudo apt install openssh-server。這將允許你從另一臺電腦訪問你的OrangePi。我們之所以要這么麻煩,是因為運行 LLM的程序在桌面上無法運行,但在SSH終端上可以運行。

wKgZPGdIE1yARpoQAAQXdy2TRi0797.png

在離開你的OrangePi之前,記下它的 IP地址,然后通過SSH登錄。如果你不喜歡SSH,也可以在你的設(shè)備上按照本指南操作,但你必須按Ctrl + Alt + F5退出桌面,只在shell中工作。

wKgZO2dIE1yAALHNAAiwjSbBJuw391.png

安裝 RKNN LLM和RKNN工具包2

現(xiàn)在,我們可以開始安裝運行 LLM的軟件了。RKNN LLM是在我們的機器上運行LLM的程序。RKNN Toolkit 2是讓其他軟件與NPU通信的軟件。我們將使用GitHub用戶Pelochus提供的腳本一次性安裝這兩個軟件。在終端中輸入:

sudo curl https://raw.githubusercontent.com/Pelochus/ezrknpu/main/install.sh | sudo bash

運行需要 5到10分鐘,請耐心等待。

安裝 LLM

安裝完 RKNN LLM和RKNN Toolkit 2后,就可以安裝模型了(這還需要5到10分鐘)。為了讓LLM利用OrangePi上Rockchip RK3588S SoC的NPU,需要使用RKNN Toolkit 2對其進行轉(zhuǎn)換(這遠遠超出了本指南的范圍)。

幸運的是,Pelochus維護著一個可與RK3588S配合使用的LLM的Hugging Face資源庫。遺憾的是,并非所有這些模型都與我們剛剛下載的軟件兼容。您需要尋找已使用RKLLM runtime 1.0.1轉(zhuǎn)換的模型。我們要安裝的是微軟的Phi-3 Mini型號,參數(shù)為3.8B。在終端中輸入以下命令:

GIT_LFS_SKIP_SMUDGE=1 git clone https://huggingface.co/Pelochus/phi-3-mini-rk3588

命令第一部分的大寫字母將確保我們只先克隆較小的文件。如果我們試圖一次性克隆整個版本庫,可能會出現(xiàn)一些錯誤。接下來,導航到我們剛剛創(chuàng)建的新目錄(cd ~/phi-3-mini-rk3588),然后運行g(shù)it lfs pull命令。這將下載數(shù)千兆字節(jié)的大型模型文件。

wKgZO2dIE1yAMgVWAAOtXIHgLQg353.png

在OrangePi5 Pro NPU上運行LLM

如果一切按計劃進行,你就可以啟動 LLM了。在終端中輸入rkllm phi-3-mini-4k-rk3588.rkllm即可。

運行情況如何?它比我們在超頻的 Raspberry Pi 5上通過Ollama運行的Phi-3要快得多。它的輸出似乎也有硬性限制,如果達到極限,就會中途自斷。

wKgZPGdIE1yAR05SAAMEz_9AjAc777.png

OrangePi上的NPU驅(qū)動LLM在很大程度上仍處于試驗階段,但沒想到響應(yīng)速度是如此之快。在樹莓派上運行的 Phi-3平均響應(yīng)時間為27秒,中位數(shù)為5秒(范圍為3-295秒)。在OrangePi5 Pro的NPU上運行的Phi-3均響應(yīng)時間約為1秒,中位數(shù)在1-2秒之間。

如果你有一臺配備 RK3588或RK3588S SoC的OrangePi5,如果你喜歡嘗試使用LLM,那么這個項目絕對值得你花時間去做,哪怕只是為了大幅提高LLM的響應(yīng)時間。支持OrangePi上 LLM的社區(qū)規(guī)模雖小,但非?;钴S,我期待看到更多型號不斷涌現(xiàn)。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 單片機
    +關(guān)注

    關(guān)注

    6035

    文章

    44554

    瀏覽量

    634614
  • 開發(fā)板
    +關(guān)注

    關(guān)注

    25

    文章

    5032

    瀏覽量

    97371
  • NPU
    NPU
    +關(guān)注

    關(guān)注

    2

    文章

    279

    瀏覽量

    18582
  • LLM
    LLM
    +關(guān)注

    關(guān)注

    0

    文章

    286

    瀏覽量

    327
收藏 人收藏

    評論

    相關(guān)推薦

    請問vee pro 8.5能夠在vee pro運行時9運行嗎?

    喜。我正在使用vee pro 8.5。該版本的程序能夠在vee pro運行時9運行嗎? 以上來自于谷歌翻譯 以下為原文hi. i am
    發(fā)表于 06-14 09:31

    請問openCL并行計算的程序能運行在RK3399ProNPU

    請問openCL并行計算的程序能運行在RK3399ProNPU嗎? 有哪位大神可以解答一下嗎
    發(fā)表于 08-19 16:49

    npu,vop2

    大家好,我在npu使用上遇到了一些問題,請教一下大家,問題如下: 我把內(nèi)核配置里的vop2驅(qū)動裁剪了以后,深度學習模型就不能在npu運行了。可是我如果不裁剪掉vop2,我的核心板就卡
    發(fā)表于 11-09 13:51

    何在嵌入式設(shè)備運行高性能Java

    何在嵌入式設(shè)備運行高性能Java
    發(fā)表于 03-28 09:43 ?16次下載

    關(guān)于C程序源代碼是如何在硬件運行的?

    C程序源代碼是如何在硬件運行的?
    的頭像 發(fā)表于 02-05 12:37 ?2861次閱讀

    何在xWR1xxx芯片運行mmw demo

    何在xWR1xxx芯片運行mmw demo
    發(fā)表于 11-01 08:27 ?0次下載
    如<b class='flag-5'>何在</b>xWR1xxx芯片<b class='flag-5'>上</b><b class='flag-5'>運行</b>mmw demo

    npu運行需要cpu協(xié)助嗎

    npu運行需要cpu協(xié)助嗎? 為了回答這個問題,我們需要首先了解什么是NPU和CPU以及它們之間的關(guān)系。 NPU是神經(jīng)處理單元(Neural Processing Unit)的縮寫,是
    的頭像 發(fā)表于 08-27 17:03 ?1112次閱讀

    Ambarella展示了在其CV3-AD芯片運行LLM的能力

    Ambarella前不久展示了在其CV3-AD芯片運行LLM的能力。這款芯片是CV3系列中最強大的,專為自動駕駛設(shè)計。
    的頭像 發(fā)表于 11-28 09:05 ?1797次閱讀
    Ambarella展示了在其CV3-AD芯片<b class='flag-5'>上</b><b class='flag-5'>運行</b><b class='flag-5'>LLM</b>的能力

    利用GPU加速在Orange Pi?5跑LLMs:人工智能愛好者High翻了!

    》引起了我們的注意,這篇文章主要展示了GPU加速的LLM在嵌入式設(shè)備以合適的速度順利運行。具體來說,是在OrangePi5(8G),作者
    的頭像 發(fā)表于 01-22 15:29 ?983次閱讀
    利用GPU加速在Orange Pi?<b class='flag-5'>5</b><b class='flag-5'>上</b>跑LLMs:人工智能愛好者High翻了!

    OrangePi?5 Pro正式開售,樹莓派5真正的挑戰(zhàn)者來了

    在剛剛舉行不久的3.24香橙派開發(fā)者大會上,香橙派發(fā)布了一款重磅產(chǎn)品OrangePi5Pro,該產(chǎn)品在OrangePi5系列前代產(chǎn)品的基礎(chǔ)煥然升級,以其性能引領(lǐng)性、價格顛覆性再次改變?nèi)蜷_發(fā)板市場
    的頭像 發(fā)表于 04-08 13:54 ?755次閱讀
    <b class='flag-5'>OrangePi</b>?<b class='flag-5'>5</b> <b class='flag-5'>Pro</b>正式開售,樹莓派<b class='flag-5'>5</b>真正的挑戰(zhàn)者來了

    樹莓派5最大的競爭對手OrangePi 5 Pro?,新增4GB/8GB版本

    OrangePi5Pro被稱為樹莓派5最大的競爭對手。繼OrangePi5Pro(16GB)版本發(fā)布一個月之后,香橙派近日再推出OrangePi5Pro4GB/8GB版本。除了在
    的頭像 發(fā)表于 05-07 10:00 ?735次閱讀
    樹莓派<b class='flag-5'>5</b>最大的競爭對手<b class='flag-5'>OrangePi</b> <b class='flag-5'>5</b> <b class='flag-5'>Pro</b>?,新增4GB/8GB版本

    OrangePi 5 Max:樹莓派5的勁敵,小巧的?RK3588開發(fā)板

    道PCIe3.0,支持Wi-Fi6E。OrangePi5MaxVS樹莓派5乍一看,OrangePi5Max在布局與樹莓派5類似,但對比來看
    的頭像 發(fā)表于 08-02 13:52 ?733次閱讀
    <b class='flag-5'>OrangePi</b> <b class='flag-5'>5</b> Max:樹莓派<b class='flag-5'>5</b>的勁敵,小巧的?RK3588開發(fā)板

    OrangePi 5品牌系列大比拼,哪款更中你的意?

    隨著OrangePi5Max的加入,OrangePi5品牌系列的隊伍隨之壯大。OrangePi5Max是OrangePi5Pro的升級產(chǎn)品,搭載瑞芯微RK35888核64位處理器,4個
    的頭像 發(fā)表于 08-06 17:59 ?989次閱讀
    <b class='flag-5'>OrangePi</b> <b class='flag-5'>5</b>品牌系列大比拼,哪款更中你的意?

    香橙派OrangePi?5 Pro性能全面測試!

    今天我們來看看OrangePi5Pro。這是OrangePi推出的一款基于RockchipRK3588SSoC的全新SBC。RK3588S與RK3588基本相似。從外形、IO和端口布局來看
    的頭像 發(fā)表于 10-08 15:58 ?423次閱讀
    香橙派<b class='flag-5'>OrangePi</b>?<b class='flag-5'>5</b> <b class='flag-5'>Pro</b>性能全面測試!

    OrangePi KunPeng Pro部署AI模型介紹

    OrangePi Kunpeng Pro是一款香橙派聯(lián)合華為精心打造的高性能板卡,搭載了鯤鵬處理器,可提供8TOPS INT8計算能力,板卡設(shè)計很精致,板載資源也非常多:
    的頭像 發(fā)表于 11-16 11:03 ?306次閱讀
    <b class='flag-5'>OrangePi</b> KunPeng <b class='flag-5'>Pro</b>部署AI模型介紹
    RM新时代网站-首页