關(guān)于Banana Pi BPI-M7
Banana Pi BPI-M7 采用Rockchip RK3588,板載8/16/32G RAM內(nèi)存和 64/128G eMMC存儲(chǔ),支持無(wú)線wifi6和藍(lán)牙5.2。2x2.5G網(wǎng)絡(luò)端口,1個(gè)HDMIout標(biāo)準(zhǔn) 輸出口,2x USB3.0,2xTYPE-C,2x MIPI CSI接口和1x MIPI DSI接口,1x M.2 KEY M接口,40 PIN GPIO,迷你尺寸僅92x62mm
香蕉派BPI-M7采用睿芯最新旗艦RK3588八核64位處理器,最高頻率為2.4GHz, 6 TOPS NPU,最高內(nèi)存為32GB。
Banana Pi BPI-M7開(kāi)源硬件開(kāi)發(fā)板
RKLLM 簡(jiǎn)介
RKLLM 軟件堆??梢詭椭脩艨焖賹?AI 模型部署到 Rockchip 芯片上。 整體框架如下:
1.1 RKLLM 工具鏈介紹?
RKLLM-Toolkit 功能介紹?
RKLLM-Toolkit 是為用戶提供在計(jì)算機(jī)上進(jìn)行大語(yǔ)言模型的量化、轉(zhuǎn)換的開(kāi)發(fā)套件。通過(guò)該 工具提供的 Python 接口可以便捷地完成以下功能:
- 模型轉(zhuǎn)換:支持將 Hugging Face 格式的大語(yǔ)言模型(Large Language Model, LLM)轉(zhuǎn)換為 RKLLM 模型,目前支持的模型包括 LLaMA、Qwen/Qwen2、Phi2 等,轉(zhuǎn)換后的 RKLLM 模型能 夠在 Rockchip NPU 平臺(tái)上加載使用。
- 量化功能:支持將浮點(diǎn)模型量化為定點(diǎn)模型,目前支持的量化類型包括 w4a16 和 w8a8。
RKLLM Runtime 功能介紹?
RKLLM Runtime 主 要 負(fù) 責(zé) 加 載 RKLLM-Toolkit 轉(zhuǎn)換得到的 RKLLM 模型,并在 RK3576/RK3588 板端通過(guò)調(diào)用 NPU 驅(qū)動(dòng)在 Rockchip NPU 上實(shí)現(xiàn) RKLLM 模型的推理。在推理 RKLLM 模型時(shí),用戶可以自行定義 RKLLM 模型的推理參數(shù)設(shè)置,定義不同的文本生成方式, 并通過(guò)預(yù)先定義的回調(diào)函數(shù)不斷獲得模型的推理結(jié)果。
1.2 RKLLM 開(kāi)發(fā)流程介紹?
RKLLM 的整體開(kāi)發(fā)步驟主要分為 2 個(gè)部分:模型轉(zhuǎn)換和板端部署運(yùn)行。
- 模型轉(zhuǎn)換: 在這一階段,用戶提供的 Hugging Face 格式的大語(yǔ)言模型將會(huì)被轉(zhuǎn)換為 RKLLM 格式, 以便在 Rockchip NPU 平臺(tái)上進(jìn)行高效的推理。這一步驟包括:
- a. 獲取原始模型:獲取 Hugging Face 格式的大語(yǔ)言模型;或是自行訓(xùn)練得到的大語(yǔ)言模 型,要求模型保存的結(jié)構(gòu)與 Hugging Face 平臺(tái)上的模型結(jié)構(gòu)一致。
- b. 模型加載:通過(guò) rkllm.load_huggingface()函數(shù)加載原始模型。
- c. 模型量化配置:通過(guò) rkllm.build() 函數(shù)構(gòu)建 RKLLM 模型,在構(gòu)建過(guò)程中可選擇是否 進(jìn)行模型量化來(lái)提高模型部署在硬件上的性能,以及選擇不同的優(yōu)化等級(jí)和量化類型。
- d. 模型導(dǎo)出:通過(guò) rkllm.export_rkllm() 函數(shù)將 RKLLM 模型導(dǎo)出為一個(gè).rkllm 格式文件, 用于后續(xù)的部署。
- 板端部署運(yùn)行: 這個(gè)階段涵蓋了模型的實(shí)際部署和運(yùn)行。它通常包括以下步驟:
- a. 模型初始化:加載 RKLLM 模型到 Rockchip NPU 平臺(tái),進(jìn)行相應(yīng)的模型參數(shù)設(shè)置來(lái) 定義所需的文本生成方式,并提前定義用于接受實(shí)時(shí)推理結(jié)果的回調(diào)函數(shù),進(jìn)行推理前準(zhǔn)備。
- b. 模型推理:執(zhí)行推理操作,將輸入數(shù)據(jù)傳遞給模型并運(yùn)行模型推理,用戶可以通過(guò)預(yù) 先定義的回調(diào)函數(shù)不斷獲取推理結(jié)果。
- c. 模型釋放:在完成推理流程后,釋放模型資源,以便其他任務(wù)繼續(xù)使用 NPU 的計(jì)算 資源。 這兩個(gè)步驟構(gòu)成了完整的 RKLLM 開(kāi)發(fā)流程,確保大語(yǔ)言模型能夠成功轉(zhuǎn)換、調(diào)試,并最終 在 Rockchip NPU 上實(shí)現(xiàn)高效部署。
1.3 適用的硬件平臺(tái)?
本文檔適用的硬件平臺(tái)主要包括:RK3576、RK3588
2. 開(kāi)發(fā)環(huán)境準(zhǔn)備?
在發(fā)布的 RKLLM 工具鏈壓縮文件中,包含了 RKLLM-Toolkit 的 whl 安裝包、RKLLM Runtime 庫(kù)的相關(guān)文件以及參考示例代碼,具體的文件夾結(jié)構(gòu)如下:
doc
└──Rockchip_RKLLM_SDK_CN.pdf # RKLLM SDK 說(shuō)明文檔
rkllm-runtime
├──example
│ └── src
│ └── main.cpp
│ └── build-android.sh
│ └── build-linux.sh
│ └── CMakeLists.txt
│ └── Readme.md
├──runtime
│ └── Android
│ └── librkllm_api
│ └──arm64-v8a
│ └── librkllmrt.so # RKLLM Runtime 庫(kù)
│ └──include
│ └── rkllm.h # Runtime 頭文件
│ └── Linux
│ └── librkllm_api
│ └──aarch64
│ └── librkllmrt.so
│ └──include
│ └── rkllm.h
rkllm-toolkit
├──examples
│ └── huggingface
│ └── test.py
├──packages
│ └── md5sum.txt
│ └── rkllm_toolkit-1.0.0-cp38-cp38-linux_x86_64.whl
rknpu-driver
└──rknpu_driver_0.9.6_20240322.tar.bz2
在本章中將會(huì)對(duì) RKLLM-Toolkit 工具及 RKLLM Runtime 的安裝進(jìn)行詳細(xì)的介紹,具體的使 用方法請(qǐng)參考第 3 章中的使用說(shuō)明。
2.1 RKLLM-Toolkit 安裝?
本節(jié)主要說(shuō)明如何通過(guò) pip 方式來(lái)安裝 RKLLM-Toolkit,用戶可以參考以下的具體流程說(shuō)明 完成 RKLLM-Toolkit 工具鏈的安裝。
通過(guò) pip 方式安裝?
安裝 miniforge3 工具?
為防止系統(tǒng)對(duì)多個(gè)不同版本的 Python 環(huán)境的需求,建議使用 miniforge3 管理 Python 環(huán)境。 檢查是否安裝 miniforge3 和 conda 版本信息,若已安裝則可省略此小節(jié)步驟。
conda -V
# 提示 conda: command not found 則表示未安裝 conda
# 提示 例如版本 conda 23.9.0
下載 miniforge3 安裝包
wget -c https://mirrors.bfsu.edu.cn/github-release/condaforge/miniforge/LatestRelease/Miniforge3-Linux-x86_64.sh
安裝 miniforge3
chmod 777 Miniforge3-Linux-x86_64.sh
bash Miniforge3-Linux-x86_64.sh
創(chuàng)建 RKLLM-Toolkit Conda 環(huán)境?
進(jìn)入 Conda base 環(huán)境
source ~/miniforge3/bin/activate # miniforge3 為安裝目錄
# (base) xxx@xxx-pc:~$
創(chuàng)建一個(gè) Python3.8 版本(建議版本)名為 RKLLM-Toolkit 的 Conda 環(huán)境
conda create -n RKLLM-Toolkit python=3.8
進(jìn)入 RKLLM-Toolkit Conda 環(huán)境
conda activate RKLLM-Toolkit
# (RKLLM-Toolkit) xxx@xxx-pc:~$
安裝 RKLLM-Toolkit?
在 RKLLM-Toolkit Conda 環(huán)境下使用 pip 工具直接安裝所提供的工具鏈 whl 包,在安裝過(guò)程 中,安裝工具會(huì)自動(dòng)下載 RKLLM-Toolkit 工具所需要的相關(guān)依賴包。
pip3 install rkllm_toolkit-1.0.0-cp38-cp38-linux_x86_64.whl
若執(zhí)行以下命令沒(méi)有報(bào)錯(cuò),則安裝成功。
python
from rkllm.api import RKLLM
2.2 RKLLM Runtime 庫(kù)的使用?
在所公開(kāi)的的 RKLLM 工具鏈文件中,包括包含 RKLLM Runtime 的全部文件:
- lib/librkllmrt.so: 適用于 RK3576/RK3588 板端調(diào)用進(jìn)行 RKLLM 模型部署推理的 RKLLM Runtime 庫(kù);
- include/rkllm_api.h: 與 librkllmrt.so 函數(shù)庫(kù)相對(duì)應(yīng)的頭文件,其中包含相關(guān)結(jié)構(gòu)體及 函數(shù)定義的說(shuō)明; 在通過(guò) RKLLM 工具鏈構(gòu)建 RK3576/RK3588 板端的部署推理代碼時(shí),需要注意對(duì)以上頭文 件及函數(shù)庫(kù)的鏈接,從而保證編譯的正確性。當(dāng)代碼在 RK3576/RK3588 板端實(shí)際運(yùn)行的過(guò)程中, 同樣需要確保以上函數(shù)庫(kù)文件成功推送至板端,并通過(guò)以下環(huán)境變量設(shè)置完成函數(shù)庫(kù)的聲明:
ulimit -Sn 50000
export LD_LIBRARY_PATH=./lib
./llm_demo qwen.rkllm
2.3 RKLLM Runtime 的編譯要求?
在使用 RKLLM Runtime 的過(guò)程中,需要注意 gcc 編譯器的版本問(wèn)題。推薦使用交叉編譯工具 gcc-arm-10.2-2020.11-x86_64-aarch64-none-linux-gnu;具體的下載路徑為:GCC_10.2 交叉編譯工 具下載地址。
請(qǐng)注意,交叉編譯工具往往向下兼容而無(wú)法向上兼容,因此不要使用 10.2 以下的版本。
若是選擇使用 Android 平臺(tái),需要進(jìn)行 Android 可執(zhí)行文件的編譯,推薦使用 Android NDK 工具進(jìn)行交叉編譯,下載路徑為:Android_NDK 交叉編譯工具下載地址,推薦使用 r18b 版本。
具體的編譯方式也可以參考 RKLLM-Toolkit 工具鏈文件中的 example/build_demo.sh。
2.4 芯片內(nèi)核更新 由于當(dāng)前公開(kāi)的固件內(nèi)核驅(qū)動(dòng)版本不支持 RKLLM 工具,因此需要更新內(nèi)核。rknpu 驅(qū)動(dòng)包支持兩 個(gè)主要內(nèi)核版本:kernel-5.10 和 kernel-6.1。對(duì)于 kernel-5.10,建議使用具體版本號(hào) 5.10.198,repo: GitHub - rockchip-linux/kernel at develop-5.10;對(duì)于 kernel-6.1,建議使用具體版本號(hào) 6.1.57??稍?內(nèi)核根目錄下的 Makefile 中確認(rèn)具體版本號(hào)。 更新步驟如下: a. 下載壓縮包 rknpu_driver_0.9.6_20240322.tar.bz2。 b. 解壓該壓縮包,將其中的 rknpu 驅(qū)動(dòng)代碼覆蓋到當(dāng)前內(nèi)核代碼目錄。 c. 重新編譯內(nèi)核。 d. 將新編譯的內(nèi)核燒錄到設(shè)備中。
Banana P BPI-M7開(kāi)發(fā)板:https://docs.banana-pi.org/zh/BPI-M7/BananaPi_BPI-M7
審核編輯 黃宇
-
人工智能
+關(guān)注
關(guān)注
1791文章
47139瀏覽量
238116 -
開(kāi)發(fā)板
+關(guān)注
關(guān)注
25文章
5024瀏覽量
97353 -
RK3588
+關(guān)注
關(guān)注
6文章
323瀏覽量
4308 -
AI大模型
+關(guān)注
關(guān)注
0文章
314瀏覽量
305
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論