RM新时代网站-首页

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

超星未來(lái)NE100開箱體驗(yàn),15分鐘部署目標(biāo)檢測(cè)模型

超星未來(lái) ? 來(lái)源:超星未來(lái) ? 2023-09-27 17:14 ? 次閱讀

「NE100」是超星未來(lái)基于自研計(jì)算芯片「驚蟄R1」和全流程開發(fā)工具鏈「魯班」打造的智能計(jì)算平臺(tái)開發(fā)套件,包括完備的推理環(huán)境。其中魯班工具鏈以 docker 形式提供,完整包括剪枝、量化、編譯工具以及相應(yīng)實(shí)例。NE100 配套完整,開箱即用,無(wú)需繁瑣的安裝過(guò)程。

下面以目標(biāo)檢測(cè)模型 YOLOv5 為例,展示部署過(guò)程。

注:開發(fā)環(huán)境為Linux 系統(tǒng)的 PC 或服務(wù)器,神經(jīng)網(wǎng)絡(luò)需要導(dǎo)出為 ONNX 格式文件。

可通過(guò)標(biāo)準(zhǔn)命令加載工具鏈 docker 文件:

gunzip -c nova_development_kit.tar.gz | sudo docker load

參考用戶手冊(cè)中示例腳本啟動(dòng)容器,進(jìn)入開發(fā)環(huán)境。

基于原始模型導(dǎo)出 ONNX 文件時(shí),請(qǐng)確保網(wǎng)絡(luò)已經(jīng)處于推理模式,并且計(jì)算圖的輸入節(jié)點(diǎn)為首個(gè) CONV 算子的輸入(格式[1,C,H,W]),輸出節(jié)點(diǎn)為最后一個(gè)(組)CONV 算子的輸出,詳細(xì)信息請(qǐng)參考用戶手冊(cè)。

#1模型量化與編譯

1個(gè)API,5行代碼,輕松完成

量化工具以 ONNX 文件和部分圖片為輸入,將神經(jīng)網(wǎng)絡(luò)從 FP32 量化為 INT8 精度,目前支持 PTQ 與 QAT 功能。僅需在代碼中將量化和編譯工具導(dǎo)入并通過(guò) API 調(diào)用,即可對(duì) ONNX 模型完成量化和編譯,分別只需要1個(gè) API 和5行代碼。詳細(xì)的 API 說(shuō)明請(qǐng)參考用戶手冊(cè)。

1. 導(dǎo)入量化工具

from nquantizer import run_quantizer

2. 調(diào)用量化工具

quant_model = run_quantizer( 
    onnx_model,
    dataloader=val_loader,
    num_batches=200,
    output_dir=work_dir + "/quantizer_output",
    input_vars=input_vars,
) 

3. 導(dǎo)入編譯工具

from ncompiler import run_compiler

4. 調(diào)用編譯工具

run_compiler(
    input_dir=work_dir + "/quantizer_output",
    output_dir=work_dir + "/compiler_output",
    enable_simulator=True,
    enable_profiler=True,
)

編譯后 compiler_output 目錄中的 npu.param(模型結(jié)構(gòu)描述文件)和 npu.bin(模型權(quán)重文件)是 NE100 部署時(shí)所需要的文件。

75dc86de-5d14-11ee-939d-92fbcf53809c.png

#2模型部署

接口簡(jiǎn)潔,功能豐富,快速調(diào)用NPU

為了實(shí)現(xiàn) 驚蟄R1 芯片多核 NPU 的簡(jiǎn)單高效推理與應(yīng)用開發(fā),超星未來(lái)基于 NCNN 推理框架增量開發(fā)運(yùn)行時(shí),并提供高性能加速庫(kù),滿足異構(gòu)推理的端到端優(yōu)化需求。

運(yùn)行時(shí)特別設(shè)計(jì)了 npumat, npunet 和 npuextractor 等組件,功能如下:

npumat:提供NPU使用的數(shù)據(jù)排布格式HWC,提高數(shù)據(jù)存儲(chǔ)讀取性能

npunet:提供模型不變信息的基礎(chǔ)數(shù)據(jù)結(jié)構(gòu),支持核心綁定、優(yōu)先級(jí)調(diào)度、數(shù)據(jù)導(dǎo)出、性能監(jiān)測(cè)等功能

npuextractor:提供NPU推理所需的set_input, get_output, get_time、extract等基本功能

YOLOv5 推理中前后處理部分與主流平臺(tái)上的代碼一致,應(yīng)用遷移時(shí)僅需更換 NPU 的推理代碼,包括:

1. 初始化幀數(shù)據(jù)結(jié)構(gòu)

75ea151a-5d14-11ee-939d-92fbcf53809c.png

2. 加載網(wǎng)絡(luò)結(jié)構(gòu)描述文件與網(wǎng)絡(luò)權(quán)重文件,并且配置核心綁定、數(shù)據(jù)導(dǎo)出及性能監(jiān)測(cè)等功能

7605d4e4-5d14-11ee-939d-92fbcf53809c.png

3. 基于加載的模型文件和前處理后的幀數(shù)據(jù)進(jìn)行推理,提取結(jié)果用于后處理

762af58a-5d14-11ee-939d-92fbcf53809c.jpg

#3模型推理

架構(gòu)高效,能耗出色,助力AI應(yīng)用落地

推理代碼經(jīng)過(guò)編譯后運(yùn)行,即可得到如下推理結(jié)果:

76374f88-5d14-11ee-939d-92fbcf53809c.jpg

得益于超星未來(lái)自研平湖架構(gòu)的高效設(shè)計(jì),YOLOv5 等主流網(wǎng)絡(luò)的算力利用率均超過(guò) 70%,同時(shí)芯片整體功耗可控制在 8W 左右,有效支持各類邊緣端 AI 應(yīng)用部署。


聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴

原文標(biāo)題:超星未來(lái) NE100 開箱體驗(yàn),15分鐘部署目標(biāo)檢測(cè)模型

文章出處:【微信號(hào):NOVAUTO,微信公眾號(hào):超星未來(lái)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    AI模型部署邊緣設(shè)備的奇妙之旅:目標(biāo)檢測(cè)模型

    以及邊緣計(jì)算能力的增強(qiáng),越來(lái)越多的目標(biāo)檢測(cè)應(yīng)用開始直接在靠近數(shù)據(jù)源的邊緣設(shè)備上運(yùn)行。這不僅減少了數(shù)據(jù)傳輸延遲,保護(hù)了用戶隱私,同時(shí)也減輕了云端服務(wù)器的壓力。然而,在邊緣端部署高效且準(zhǔn)確的目標(biāo)
    發(fā)表于 12-19 14:33

    【小e物聯(lián)網(wǎng)試用體驗(yàn)】+ 超清開箱體驗(yàn)

    ` 本帖最后由 真喜洋洋 于 2016-5-31 21:12 編輯 【小e物聯(lián)網(wǎng)試用體驗(yàn)】+ 超清開箱體驗(yàn)很早就收到了小e的開發(fā)板,但是早段時(shí)間生病,一直來(lái)不及開箱體驗(yàn),今天偶感舒適,上些高清五碼圖。。`
    發(fā)表于 05-17 10:30

    【NanoPi NEO試用體驗(yàn)】開箱體驗(yàn)

    `開箱體驗(yàn)這是一篇延時(shí)了很久的報(bào)告,為什么捏,因?yàn)槲沂切率帧瓉?lái)報(bào)告在手機(jī)上發(fā)不了`
    發(fā)表于 10-31 02:10

    【VEML6040環(huán)境顏色檢測(cè)試用體驗(yàn)】一、開箱體驗(yàn),驚喜有余

    `【VEML6040環(huán)境顏色檢測(cè)試用體驗(yàn)】一、開箱體驗(yàn),驚喜有余正常收到VEML6040環(huán)境顏色檢測(cè)開發(fā)板,立即開箱體驗(yàn)。預(yù)先看資料開發(fā)板應(yīng)該不大,但大包裝盒著實(shí)實(shí)在。拆開后可見(jiàn)企業(yè)對(duì)
    發(fā)表于 03-27 15:11

    15分鐘充滿快充移動(dòng)電源---未來(lái)的潛力有多大?

    `深圳市思齊新能源有限公司目前已經(jīng)成功開發(fā)兩款快充移動(dòng)電源6000毫安時(shí) 10000毫安時(shí)充電15分鐘充滿使用循環(huán)壽命是普通鋰電池5倍以上支持TYPC接口 想了解未來(lái)市場(chǎng)潛力?謝謝`
    發(fā)表于 06-16 12:16

    目標(biāo)檢測(cè)模型和Objectness的基礎(chǔ)知識(shí)

    在本文中,我們將討論目標(biāo)檢測(cè)模型和Objectness的基礎(chǔ)知識(shí)。
    發(fā)表于 02-04 07:05

    在Arm虛擬硬件上部署PP-PicoDet模型

    1、在Arm虛擬硬件上部署PP-PicoDet模型  經(jīng)典的深度學(xué)習(xí)工程是從確認(rèn)任務(wù)目標(biāo)開始的,我們首先來(lái)簡(jiǎn)單地介紹一下目標(biāo)檢測(cè)任務(wù)以及本期
    發(fā)表于 09-16 14:42

    在Arm虛擬硬件上部署PP-PicoDet模型的設(shè)計(jì)方案

    1、在Arm虛擬硬件上部署PP-PicoDet模型  經(jīng)典的深度學(xué)習(xí)工程是從確認(rèn)任務(wù)目標(biāo)開始的,我們首先來(lái)簡(jiǎn)單地介紹一下目標(biāo)檢測(cè)任務(wù)以及本期
    發(fā)表于 09-23 15:02

    高通公布新型快速充電技術(shù),15分鐘內(nèi)將4500mAh電池充滿100%

    高通公司昨天宣布了一種新的快速充電技術(shù),稱為快速充電5(QC 5)。高通公司聲稱,新標(biāo)準(zhǔn)將在5分鐘內(nèi)將4500mAh電池的電量從0%提升到50%,在15分鐘內(nèi)達(dá)到100%。
    發(fā)表于 07-28 10:21 ?1116次閱讀

    目標(biāo)檢測(cè)模型和Objectness的知識(shí)

    在本文中,我們將討論目標(biāo)檢測(cè)模型和Objectness的基礎(chǔ)知識(shí)。
    的頭像 發(fā)表于 02-12 17:00 ?1122次閱讀

    如何在移動(dòng)設(shè)備上訓(xùn)練和部署自定義目標(biāo)檢測(cè)模型

    上,目標(biāo)檢測(cè)模型的訓(xùn)練和部署的過(guò)程: 設(shè)備端 ML 學(xué)習(xí)路徑:關(guān)于如何在移動(dòng)設(shè)備上,訓(xùn)練和部署自定義目標(biāo)
    的頭像 發(fā)表于 08-16 17:09 ?3580次閱讀

    YOLOX目標(biāo)檢測(cè)模型的推理部署

    曠視科技開源了內(nèi)部目標(biāo)檢測(cè)模型-YOLOX,性能與速度全面超越Y(jié)OLOv5早期版本!
    的頭像 發(fā)表于 04-16 23:00 ?2999次閱讀

    如何使用TensorRT框架部署ONNX模型

    模型部署作為算法模型落地的最后一步,在人工智能產(chǎn)業(yè)化過(guò)程中是非常關(guān)鍵的步驟,而目標(biāo)檢測(cè)作為計(jì)算機(jī)視覺(jué)三大基礎(chǔ)任務(wù)之一,眾多的業(yè)務(wù)功能都要在
    的頭像 發(fā)表于 10-31 14:27 ?3270次閱讀

    AI愛(ài)克斯開發(fā)板上使用OpenVINO加速YOLOv8目標(biāo)檢測(cè)模型

    《在AI愛(ài)克斯開發(fā)板上用OpenVINO加速YOLOv8模型》介紹了在AI愛(ài)克斯開發(fā)板上使用OpenVINO 開發(fā)套件部署并測(cè)評(píng)YOLOv8的分類模型,本文將介紹在AI愛(ài)克斯開發(fā)板
    的頭像 發(fā)表于 05-26 11:03 ?1240次閱讀
    AI愛(ài)克斯開發(fā)板上使用OpenVINO加速YOLOv8<b class='flag-5'>目標(biāo)</b><b class='flag-5'>檢測(cè)</b><b class='flag-5'>模型</b>

    本周九家企業(yè)獲新融資,超星未來(lái)與縱慧芯光領(lǐng)先

    目前,超星未來(lái)已打造出兩款A(yù)I推理引擎“平湖”和“高峽”,并推出了邊緣側(cè)AI計(jì)算芯片“驚蟄R1”,智能計(jì)算開發(fā)套件“NE100”以及邊緣計(jì)算模組“NM10”。
    的頭像 發(fā)表于 05-13 14:25 ?556次閱讀
    RM新时代网站-首页