RM新时代网站-首页

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

RT-Thread上部署TinyMaix推理框架,使MCU賦予AI能力

Rice嵌入式開(kāi)發(fā)技術(shù)分享 ? 來(lái)源:Rice嵌入式開(kāi)發(fā)技術(shù)分享 ? 作者:Rice嵌入式開(kāi)發(fā)技術(shù) ? 2023-11-05 08:39 ? 次閱讀


概要

當(dāng)談到微控制器MCU)和人工智能AI)的結(jié)合,我們進(jìn)入了一個(gè)激動(dòng)人心的領(lǐng)域。傳統(tǒng)上,AI應(yīng)用程序需要大型計(jì)算機(jī)或云服務(wù)器的處理能力,但隨著技術(shù)的發(fā)展,現(xiàn)在可以將AI嵌入到微控制器中。這為嵌入式系統(tǒng)物聯(lián)網(wǎng)設(shè)備、機(jī)器人和各種其他應(yīng)用開(kāi)啟了新的可能性。

MCU AI的崛起

MCU AI代表著微控制器上的人工智能。它是將機(jī)器學(xué)習(xí)深度學(xué)習(xí)模型部署到資源有限但功能強(qiáng)大的微控制器中,以實(shí)現(xiàn)智能決策和感知。以下是MCU AI的一些關(guān)鍵方面:

  • 低功耗:微控制器通常以電池供電,因此低功耗是至關(guān)重要的。AI模型需要經(jīng)過(guò)優(yōu)化,以在微控制器上運(yùn)行,同時(shí)盡量減小能耗。
  • 實(shí)時(shí)性:微控制器常常用于實(shí)時(shí)控制系統(tǒng),因此AI模型需要在極短的時(shí)間內(nèi)執(zhí)行,以應(yīng)對(duì)即時(shí)需求。
  • 感知和決策:MCU AI可以使設(shè)備具備感知環(huán)境、分析數(shù)據(jù)并作出決策的能力。這對(duì)于自主機(jī)器人、智能傳感器和自動(dòng)控制系統(tǒng)尤為有用。

MCU AI的應(yīng)用

MCU AI可以應(yīng)用于各種領(lǐng)域,下面是一些示例:

  • 智能物聯(lián)網(wǎng)設(shè)備:微控制器上的AI可以使物聯(lián)網(wǎng)設(shè)備更加智能,例如智能家居設(shè)備、智能燈具和智能門鎖。它們可以學(xué)習(xí)用戶的偏好,并自動(dòng)適應(yīng)不同環(huán)境。
  • 自主機(jī)器人:微控制器上的AI使自主機(jī)器人能夠避障、規(guī)劃路徑和執(zhí)行任務(wù),例如清掃機(jī)器人和無(wú)人機(jī)
  • 醫(yī)療設(shè)備:在醫(yī)療設(shè)備中,MCU AI可以用于監(jiān)測(cè)患者的生命體征,提供早期警報(bào)和更好的病人護(hù)理。
  • 工業(yè)自動(dòng)化:微控制器上的AI可用于工業(yè)機(jī)器人、自動(dòng)化生產(chǎn)線和質(zhì)量控制系統(tǒng),提高效率和質(zhì)量。

作者開(kāi)始深入進(jìn)嵌入式AI這個(gè)領(lǐng)域,不過(guò)學(xué)習(xí)之前先了解如何用起來(lái),跑起來(lái)。本篇文章聊一下如何移植TinyMaix推理框架到RT-THREAD并運(yùn)行起來(lái)。

TinyMaix

TinyMaix:是矽速科技Sipeed)利用兩個(gè)周末的業(yè)余時(shí)間完成的項(xiàng)目,它是一款專為微控制器設(shè)計(jì)的輕量級(jí)開(kāi)源機(jī)器學(xué)習(xí)庫(kù),面向單片機(jī)的超輕量級(jí)的神經(jīng)網(wǎng)絡(luò)推理庫(kù),即TinyML推理庫(kù),可以讓你在任意單片機(jī)上運(yùn)行輕量級(jí)深度學(xué)習(xí)模型。TinyMaix開(kāi)源代碼鏈接:https://github.com/sipeed/tinymaix。

TinyMaix關(guān)鍵特性

  • 核心代碼少于 400行(tm_layers.c+tm_model.c+arch_cpu.h), 代碼段(.text)少于3KB
  • 低內(nèi)存消耗,甚至 Arduino ATmega328 (32KB Flash, 2KB Ram) 都能基于 TinyMaix 跑 mnist(手寫數(shù)字識(shí)別)
  • 支持 INT8/FP32/FP16 模型,實(shí)驗(yàn)性地支持 FP8 模型,支持 keras h5 或 tflite 模型轉(zhuǎn)換
  • 支持多種芯片架構(gòu)的專用指令優(yōu)化: ARM SIMD/NEON/MVEI,RV32P, RV64V
  • 友好的用戶接口,只需要 load/run 模型~
  • 支持全靜態(tài)的內(nèi)存配置(無(wú)需 malloc )
  • 即將支持 MaixHub 在線模型訓(xùn)練

TinyMaix底層依賴

TinyMaix可以簡(jiǎn)單理解為一個(gè)矩陣和向量計(jì)算庫(kù),目前已支持如下幾種計(jì)算硬件

#defineTM_ARCH_CPU(0)//default,purecpucompute
#defineTM_ARCH_ARM_SIMD(1)//ARMCortexM4/M7,etc.
#defineTM_ARCH_ARM_NEON(2)//ARMCortexA7,etc.
#defineTM_ARCH_ARM_MVEI(3)//ARMv8.1:M55,etc.
#defineTM_ARCH_RV32P(4)//T-headE907,etc.
#defineTM_ARCH_RV64V(5)//T-headC906,C910,etc.
#defineTM_ARCH_CSKYV2(6)//cskyv2withdspcore
#defineTM_ARCH_X86_SSE2(7)//x86sse2

對(duì)于ARM-Cortex系列MCU,可以支持純CPU計(jì)算和SIMD計(jì)算。其中CPU計(jì)算部分無(wú)特殊依賴(計(jì)算代碼均使用標(biāo)準(zhǔn)C實(shí)現(xiàn))。SIMD部分,部分計(jì)算代碼使用了C語(yǔ)言內(nèi)嵌匯編實(shí)現(xiàn),需要CPU支持相應(yīng)的匯編指令,才可以正常編譯、運(yùn)行。

TinyMaix等級(jí)選擇

TinyMaix目前支持兩種等級(jí):1. 選擇最少代碼和buf 2. 選擇速度,需要更多代碼和buf

#defineTM_OPT0(0)//default,leastcodeandbuf
#defineTM_OPT1(1)//optforspeed,needmorecodeandbuf
#defineTM_OPT2(2)//TODO

TinyMaix量化

TinyMaix支持不同位寬的量化:

#defineTM_MDL_INT80
#defineTM_MDL_INT161
#defineTM_MDL_FP322
#defineTM_MDL_FP163
#defineTM_MDL_FP8_1434//experimental
#defineTM_MDL_FP8_1525//experimental

TinyMaix核心API

TinyMaix框架對(duì)上層應(yīng)用程序提供的核心API主要位于代碼倉(cāng)的tinymaix.h文件中,其中:

  1. 模型API包含四個(gè):模型加載,模型卸載,預(yù)處理,推理。
/*******************************MODELFUNCTION************************************/
tm_err_ttm_load(tm_mdl_t*mdl,constuint8_t*bin,uint8_t*buf,tm_cb_tcb,tm_mat_t*in);//loadmodel
voidtm_unload(tm_mdl_t*mdl);//removemodel
tm_err_ttm_preprocess(tm_mdl_t*mdl,tm_pp_tpp_type,tm_mat_t*in,tm_mat_t*out);//preprocessinputdata
tm_err_ttm_run(tm_mdl_t*mdl,tm_mat_t*in,tm_mat_t*out);//runmodel
  1. 統(tǒng)計(jì)函數(shù):用于輸出模型中間層信息
/*******************************STATFUNCTION************************************/
#ifTM_ENABLE_STAT
tm_err_ttm_stat(tm_mdlbin_t*mdl);//statmodel
#endif
  1. 工具函數(shù),包含F(xiàn)P32和uint8的互轉(zhuǎn)
/*******************************UTILSFUNCTION************************************/
uint8_tTM_WEAKtm_fp32to8(floatfp32);
floatTM_WEAKtm_fp8to32(uint8_tfp8);

這里的模型,通常是預(yù)訓(xùn)練模型經(jīng)過(guò)腳本轉(zhuǎn)換生成的TinyMaix格式的模型;

TinyMaix移植到RT-Thread

  1. TinyMaix移植到RT-Thread工作量其實(shí)不到,主要適配tm_port.h文件即可。
  2. RT-Thread的配置是通過(guò)Kconfig設(shè)置一些參數(shù)的,所以我把硬件類型,選擇等級(jí),量化類型都修改為Kconfig進(jìn)行配置。
#defineTM_ARCHR_TINYMAIX_USING_ARCK_TYPE
#defineTM_OPT_LEVELR_TINYMAIX_USING_OPTION_LEVEL
#defineTM_MDL_TYPER_TINYMAIX_USING_MODULE_TYPE
  1. TinyMaix需要對(duì)接平臺(tái)內(nèi)聯(lián),內(nèi)存,打印等接口,所以我們修改對(duì)應(yīng)宏定義,將其適配到RT-Thread平臺(tái)的接口上。
#defineTM_INLINErt_inline
#defineTM_WEAKrt_weak

#definetm_malloc(x)rt_malloc(x)
#definetm_free(x)rt_free(x)

#defineTM_PRINTF(...)rt_kprintf(__VA_ARGS__)
  1. TinyMaix調(diào)試依賴于精準(zhǔn)的計(jì)時(shí),我們需要適配其對(duì)應(yīng)的幾個(gè)宏定義,因?yàn)镽T-Thread系統(tǒng)沒(méi)有提供微秒級(jí)的接口,只有毫秒級(jí)的接口,所以我做了簡(jiǎn)單的適配。
#defineTM_GET_US()rt_tick_get_millisecond()/1000;

#defineTM_DBGT_INIT()uint32_t_start,_finish;
float_time;
_start=TM_GET_US();

#defineTM_DBGT_START()_start=TM_GET_US();

#defineTM_DBGT(x){
_finish=TM_GET_US();
_time=(float)(_finish-_start)/1.0;
TM_PRINTF("===%suse%.3fmsn",(x),_time);
_start=TM_GET_US();
}
  1. TinyMaix提供了多個(gè)實(shí)例,如:cifar10,mnist,vww等,RT-Thread支持命令行輸入,為了實(shí)例可以在通過(guò)命令函運(yùn)行,我們需要修改一下文件名和接口名字。
  • 我們將examples下的cifar10,mnist,vww三個(gè)實(shí)例下的main.c修改為對(duì)應(yīng)實(shí)例的名字:cifar10.c,mnist.c,vww.c。
  • 將cifar10.c,mnist.c,vww.c中的main函數(shù)修改為對(duì)應(yīng)實(shí)例名字。
intcifar10(intargc,char**argv)

intmnist(intargc,char**argv)

intvww(intargc,char**argv)
  • 將實(shí)例接口導(dǎo)出到命令行中。
MSH_CMD_EXPORT(cifar10,TinyMaixcifar10example);

MSH_CMD_EXPORT(mnist,TinyMaixmnistexample);

MSH_CMD_EXPORT(vww,TinyMaixvwwexample);

TinyMaix運(yùn)行效果

實(shí)例的運(yùn)行環(huán)境:STM32F401RE,M4內(nèi)核,時(shí)鐘頻率:84MHz,RAM:96 KB,F(xiàn)lash:512 KB

  1. cifar10實(shí)例,分類檢測(cè),識(shí)別圖片是一只鳥:
c22d8754-7b73-11ee-b3e3-92fbcf53809c.jpgc241c2be-7b73-11ee-b3e3-92fbcf53809c.jpg
  1. mnist實(shí)例,數(shù)字識(shí)別,圖片是一個(gè)數(shù)字2:

c2558a9c-7b73-11ee-b3e3-92fbcf53809c.png

c2693f74-7b73-11ee-b3e3-92fbcf53809c.jpg
  1. vww實(shí)例,檢測(cè)有沒(méi)有人,圖片有人:
c27013e4-7b73-11ee-b3e3-92fbcf53809c.jpg

c2758cc0-7b73-11ee-b3e3-92fbcf53809c.png

總結(jié)

  1. TinyMaix作者已經(jīng)做了一個(gè)RT-Thread的軟件包:r-tinymaix。可以在RT-Thread中工程中加入軟件包即可以驗(yàn)證。
  2. r-tinymaix的開(kāi)源鏈接:https://github.com/RiceChen0/r-tinymaix
  3. TinyMaix非常贊,可以讓一個(gè)普普通通的單片機(jī)擁有AI能力,讓嵌入式AI成本減低。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • mcu
    mcu
    +關(guān)注

    關(guān)注

    146

    文章

    17123

    瀏覽量

    350976
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    30728

    瀏覽量

    268882
  • RT-Thread
    +關(guān)注

    關(guān)注

    31

    文章

    1285

    瀏覽量

    40079
  • 深度學(xué)習(xí)
    +關(guān)注

    關(guān)注

    73

    文章

    5500

    瀏覽量

    121111
  • TinyML
    +關(guān)注

    關(guān)注

    0

    文章

    42

    瀏覽量

    1225
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    基于RT-Thread的RoboMaster電控框架設(shè)計(jì)

    由于 RT-Thread 穩(wěn)定高效的內(nèi)核,豐富的文檔教程,積極活躍的社區(qū)氛圍,以及設(shè)備驅(qū)動(dòng)框架、Kconfig、Scons、日志系統(tǒng)、海量的軟件包……很難不選擇 RT-Thread 進(jìn)行項(xiàng)目開(kāi)發(fā)。
    發(fā)表于 09-06 15:21 ?695次閱讀

    RT-Thread AI kit輕松部署 STM32Cube-AIRT-Thread 精選資料推薦

    RT-AK 簡(jiǎn)介RT-AK:RT-Thread AI kit,RT-Thread AI套件
    發(fā)表于 07-20 08:20

    關(guān)于RT-AK開(kāi)源輕松實(shí)現(xiàn)一鍵部署AI模型至RT-Thread解析

    RT-AK 是 RT-Thread 團(tuán)隊(duì)為 RT-Thread 實(shí)時(shí)操作系統(tǒng)所開(kāi)發(fā)的 AI 套件,能夠一鍵將 AI 模型
    的頭像 發(fā)表于 04-26 18:07 ?4251次閱讀
    關(guān)于<b class='flag-5'>RT</b>-AK開(kāi)源輕松實(shí)現(xiàn)一鍵<b class='flag-5'>部署</b><b class='flag-5'>AI</b>模型至<b class='flag-5'>RT-Thread</b>解析

    RT-Thread AI kit開(kāi)源:輕松實(shí)現(xiàn)一鍵部署AI模型至 RT-Thread

    RT-AK 是 RT-Thread 團(tuán)隊(duì)為 RT-Thread 實(shí)時(shí)操作系統(tǒng)所開(kāi)發(fā)的 AI 套件,能夠一鍵將 AI 模型
    發(fā)表于 01-25 18:18 ?3次下載
    <b class='flag-5'>RT-Thread</b> <b class='flag-5'>AI</b> kit開(kāi)源:輕松實(shí)現(xiàn)一鍵<b class='flag-5'>部署</b><b class='flag-5'>AI</b>模型至 <b class='flag-5'>RT-Thread</b>

    RT-Thread大會(huì):瑞薩e- AI成功案例及部署

      RT-Thread IoT OS Global Tech Conference (RT-Thread GTC,RT-Thread全球技術(shù)大會(huì))致力于圍繞RT-Thread IoT
    的頭像 發(fā)表于 05-27 10:18 ?1392次閱讀
    <b class='flag-5'>RT-Thread</b>大會(huì):瑞薩e- <b class='flag-5'>AI</b>成功案例及<b class='flag-5'>部署</b>

    RT-Thread全球技術(shù)大會(huì):RT-Thread上的單元測(cè)試框架與運(yùn)行測(cè)試用例

    RT-Thread全球技術(shù)大會(huì):RT-Thread上的單元測(cè)試框架與運(yùn)行測(cè)試用例 ? ? ? ? ? ? ? ? 審核編輯:彭靜
    的頭像 發(fā)表于 05-27 16:21 ?1623次閱讀
    <b class='flag-5'>RT-Thread</b>全球技術(shù)大會(huì):<b class='flag-5'>RT-Thread</b>上的單元測(cè)試<b class='flag-5'>框架</b>與運(yùn)行測(cè)試用例

    RT-Thread設(shè)備模型框架及創(chuàng)建注冊(cè)設(shè)備的實(shí)現(xiàn)

    RT-Thread設(shè)備模型框架及創(chuàng)建注冊(cè)設(shè)備的實(shí)現(xiàn)方式介紹如下:
    的頭像 發(fā)表于 05-28 10:38 ?2177次閱讀
    <b class='flag-5'>RT-Thread</b>設(shè)備模型<b class='flag-5'>框架</b>及創(chuàng)建注冊(cè)設(shè)備的實(shí)現(xiàn)

    RT-Thread文檔_RT-Thread 簡(jiǎn)介

    RT-Thread文檔_RT-Thread 簡(jiǎn)介
    發(fā)表于 02-22 18:22 ?5次下載
    <b class='flag-5'>RT-Thread</b>文檔_<b class='flag-5'>RT-Thread</b> 簡(jiǎn)介

    RT-Thread文檔_RT-Thread SMP 介紹與移植

    RT-Thread文檔_RT-Thread SMP 介紹與移植
    發(fā)表于 02-22 18:31 ?9次下載
    <b class='flag-5'>RT-Thread</b>文檔_<b class='flag-5'>RT-Thread</b> SMP 介紹與移植

    RT-Thread文檔_utest 測(cè)試框架

    RT-Thread文檔_utest 測(cè)試框架
    發(fā)表于 02-22 18:43 ?2次下載
    <b class='flag-5'>RT-Thread</b>文檔_utest 測(cè)試<b class='flag-5'>框架</b>

    如何在RT-Thread OS環(huán)境下使用ncnn進(jìn)行AI推理

    今天簡(jiǎn)報(bào)較短,主要演示一下如何在RT-Thread OS環(huán)境下使用ncnn進(jìn)行AI推理
    的頭像 發(fā)表于 05-04 16:29 ?1327次閱讀
    如何在<b class='flag-5'>RT-Thread</b> OS環(huán)境下使用ncnn進(jìn)行<b class='flag-5'>AI</b><b class='flag-5'>推理</b>

    測(cè)評(píng)分享 | 如何在先楫HPM6750上運(yùn)行輕量級(jí)AI推理框架TinyMaix

    本期內(nèi)容由先楫開(kāi)發(fā)者社區(qū)大咖@xusiwei1236分享基于先楫HPM6750的輕量級(jí)AI推理框架,趕緊來(lái)瞧瞧~一、TinyMaix是什么?Tiny
    的頭像 發(fā)表于 12-12 17:57 ?1568次閱讀
    測(cè)評(píng)分享 | 如何在先楫HPM6750上運(yùn)行輕量級(jí)<b class='flag-5'>AI</b><b class='flag-5'>推理</b><b class='flag-5'>框架</b><b class='flag-5'>TinyMaix</b>

    淺析RT-Thread設(shè)備驅(qū)動(dòng)框架

    RT-Thread 設(shè)備框架屬于組件和服務(wù)層,是基于 RT-Thread 內(nèi)核之上的上層軟件。設(shè)備框架是針對(duì)某一類外設(shè),抽象出來(lái)的一套統(tǒng)一的操作方法及接入標(biāo)準(zhǔn),可以屏蔽硬件差異,為應(yīng)用
    的頭像 發(fā)表于 08-07 15:39 ?1956次閱讀

    基于 RT-Thread 的 RoboMaster 電控框架(一)

    由于 RT-Thread 穩(wěn)定高效的內(nèi)核,豐富的文檔教程,積極活躍的社區(qū)氛圍,以及設(shè)備驅(qū)動(dòng)框架、Kconfig、Scons、日志系統(tǒng)、海量的軟件包……很難不選擇 RT-Thread 進(jìn)行項(xiàng)目開(kāi)發(fā)
    的頭像 發(fā)表于 09-19 19:55 ?759次閱讀

    基于RT-Thread的RoboMaster電控框架(二)

    由于 RT-Thread 穩(wěn)定高效的內(nèi)核,豐富的文檔教程,積極活躍的社區(qū)氛圍,以及設(shè)備驅(qū)動(dòng)框架、Kconfig、Scons、日志系統(tǒng)、海量的軟件包
    的頭像 發(fā)表于 09-20 15:16 ?747次閱讀
    RM新时代网站-首页