RM新时代网站-首页

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

簡單三步在Windows上調(diào)用低功耗NPU部署AI模型

英特爾物聯(lián)網(wǎng) ? 來源:英特爾物聯(lián)網(wǎng) ? 2024-02-22 17:17 ? 次閱讀

相信很多小伙伴都已經(jīng)知道,在最新一代的英特爾 酷睿 Ultra 移動端處理中已經(jīng)集成了被稱為 NPU 的神經(jīng)網(wǎng)絡(luò)加速處理器,以提供低功耗的 AI 算力,特別適合于 PC 端需要長時間穩(wěn)定運(yùn)行的 AI 輔助功能,例如會議聊天軟件中的自動摳像,或是畫面超分辨率等應(yīng)用。而 OpenVINO 工具套件也在第一時間對 NPU 進(jìn)行了適配,接下來就讓我們一起看一下如何在英特爾 酷睿 Ultra 處理器上搭建基礎(chǔ)環(huán)境,并調(diào)用 NPU 進(jìn)行模型推理任務(wù)。

NPU 驅(qū)動安裝

首先我們需要確保是否安裝了最新版的 NPU 驅(qū)動,可以通過 Windows 任務(wù)管理調(diào)出當(dāng)前 NPU 驅(qū)動版本信息

7f01b5f0-d162-11ee-a297-92fbcf53809c.jpg

圖:NPU 在 Windows 任務(wù)管理器中顯示驅(qū)動版本

查詢當(dāng)前最新的 NPU 驅(qū)動版本:

https://www.intel.com/content/www/us/en/download/794734/intel-npu-driver-windows.html

7f1ff6a0-d162-11ee-a297-92fbcf53809c.png

圖:NPU 驅(qū)動下載頁面

如果想更新或是重裝 NPU 驅(qū)動,可以參考以下指引下載并安裝驅(qū)動:

https://docs.openvino.ai/2023.3/openvino_docs_install_guides_configurations_for_intel_npu.html

OpenVINO 的下載和安裝

由于目前 NPU Plugin 還沒有被集成在 OpenVINO 的 PyPI 安裝包中,因此我們需要通過下載 OpenVINO runtime 壓縮包的方式進(jìn)行安裝。

7f35a298-d162-11ee-a297-92fbcf53809c.png

圖:OpenVINO 下載頁面

整個安裝過程非常簡單,只需將壓縮包解壓到在本地路徑下即可。具體方法可以參考上圖標(biāo)紅處的安裝說明。

7f5bbdd4-d162-11ee-a297-92fbcf53809c.png

圖:將壓縮包解壓至本地路徑

Python 環(huán)境配置

通過執(zhí)行壓縮包中的 setupvars.bat 環(huán)境配置腳本,我們便可以直接在 Python 環(huán)境下加載 OpenVINO runtime 和 NPU Plugin 環(huán)境。同時利用 OpenVINO 的 Python API 指令,我們可以快速驗(yàn)證 NPU 是否可以被正常調(diào)用。

7fbe5232-d162-11ee-a297-92fbcf53809c.jpg

圖:Python 環(huán)境中驗(yàn)證 NPU 調(diào)用

C++ 環(huán)境配置

不同于 Python,Windows 上的 C++ 應(yīng)用需要依賴于 CMake 或者是 Visual Studio 的環(huán)境下調(diào)試,因此這里我們需要簡單配置下 OpenVINO 庫的路徑。下面以 Visual Studio 中新建項(xiàng)目的屬性配置頁面為例。

7fd6349c-d162-11ee-a297-92fbcf53809c.png

圖:配置 OpenVINO runtime 頭文件路徑

7ff36080-d162-11ee-a297-92fbcf53809c.png

圖:配置 OpenVINO runtime 動態(tài)庫路徑

800aead4-d162-11ee-a297-92fbcf53809c.png

圖:配置 OpenVINO runtime 及 frontednd 靜態(tài)庫路徑

80332d0a-d162-11ee-a297-92fbcf53809c.png

圖:在 Windows 本地添加 OpenVINO 環(huán)境變量路徑

當(dāng)完成 Visual Studio 項(xiàng)目屬性配置后,我們可以通過調(diào)試以下示例代碼,測試 NPU 是否可以被檢測及調(diào)用。

#include 
#include 


int main(int argc, char* argv[]) {


  // -------- Get OpenVINO runtime version --------
  std::cout << ov::get_openvino_version() << std::endl;


 ? ?// -------- Step 1. Initialize OpenVINO Runtime Core --------
 ? ?ov::Core core;


 ? ?// -------- Step 2. Get list of available devices --------
 ? ?std::vector availableDevices = core.get_available_devices();


  // -------- Step 3. Query and print supported metrics and config keys --------
  std::cout << "available devices: " << std::endl;
 ? ?for (auto&& device : availableDevices) {
 ? ? ? ?std::cout << device << std::endl;
 ? ?}
}

805d6408-d162-11ee-a297-92fbcf53809c.png

圖:VS 環(huán)境中驗(yàn)證 NPU 調(diào)用

測試效果

當(dāng)完成 NPU 安裝后,我們可以通過 OpenVINO notebooks 中提供的示例,簡單測試下 NPU 的性能。這個示例會通過以下 Python 代碼來將模型部署在 NPU 上。

compiled_model = core.compile_model("model.xml", "NPU")

8077ab42-d162-11ee-a297-92fbcf53809c.png

圖:實(shí)時人體關(guān)鍵點(diǎn)演示效果

可以看到 NPU 在運(yùn)行實(shí)時人體關(guān)鍵點(diǎn)檢測模型時的效果和速度還是非常不錯的,達(dá)到了 90FPS 的吞吐量,同時推理任務(wù)幾乎也沒有占用 CPU 額外的資源,真正做到了在提供高算力的同時,減輕 CPU 和 GPU 的任務(wù)負(fù)載。





審核編輯:劉清

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 神經(jīng)網(wǎng)絡(luò)

    關(guān)注

    42

    文章

    4771

    瀏覽量

    100712
  • python
    +關(guān)注

    關(guān)注

    56

    文章

    4792

    瀏覽量

    84627
  • 加速處理器
    +關(guān)注

    關(guān)注

    0

    文章

    8

    瀏覽量

    6444
  • NPU
    NPU
    +關(guān)注

    關(guān)注

    2

    文章

    279

    瀏覽量

    18582

原文標(biāo)題:簡單三步在 Windows 上調(diào)用低功耗 NPU 部署 AI 模型 | 開發(fā)者實(shí)戰(zhàn)

文章出處:【微信號:英特爾物聯(lián)網(wǎng),微信公眾號:英特爾物聯(lián)網(wǎng)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    AI模型部署邊緣設(shè)備的奇妙之旅:目標(biāo)檢測模型

    以及邊緣計(jì)算能力的增強(qiáng),越來越多的目標(biāo)檢測應(yīng)用開始直接在靠近數(shù)據(jù)源的邊緣設(shè)備上運(yùn)行。這不僅減少了數(shù)據(jù)傳輸延遲,保護(hù)了用戶隱私,同時也減輕了云端服務(wù)器的壓力。然而,邊緣端部署高效且準(zhǔn)確的目標(biāo)檢測模型
    發(fā)表于 12-19 14:33

    AI模型部署邊緣設(shè)備的奇妙之旅:如何實(shí)現(xiàn)手寫數(shù)字識別

    更適合生產(chǎn)環(huán)境的框架來部署。此外,許多推理引擎和硬件加速器也支持ONNX格式,從而進(jìn)一加快了模型部署的速度。 凌智視覺模塊中
    發(fā)表于 12-06 17:20

    AI模型部署和管理的關(guān)系

    AI模型部署與管理是AI項(xiàng)目成功的兩大支柱,它們之間既相互獨(dú)立又緊密相連,共同推動著AI技術(shù)從實(shí)驗(yàn)室走向?qū)嶋H應(yīng)用。
    的頭像 發(fā)表于 11-21 10:02 ?141次閱讀

    如何在STM32f4系列開發(fā)板上部署STM32Cube.AI,

    已下載STM32Cube.AI擴(kuò)展包,但是無法使用,感覺像是沒有部署AI模型,我是想要通過攝像頭拍照,上傳圖像后,經(jīng)過開發(fā)板處理器進(jìn)行AI
    發(fā)表于 11-18 09:39

    AI模型托管原理分析

    AI模型托管是指將訓(xùn)練好的AI模型部署云端或邊緣服務(wù)器上,由第
    的頭像 發(fā)表于 11-07 09:33 ?157次閱讀

    企業(yè)AI模型部署怎么做

    AI模型部署作為這一轉(zhuǎn)型過程中的關(guān)鍵環(huán)節(jié),其成功實(shí)施對于企業(yè)的長遠(yuǎn)發(fā)展至關(guān)重要。在此,AI部落小編為您介紹企業(yè)AI
    的頭像 發(fā)表于 11-04 10:15 ?149次閱讀

    使用OpenVINO 2024.4算力魔方上部署Llama-3.2-1B-Instruct模型

    前面我們分享了《三步完成Llama3算力魔方的本地量化和部署》。2024年9月25日,Meta又發(fā)布了Llama3.2:一個多語言大型語言模型(LLMs)的集合。
    的頭像 發(fā)表于 10-12 09:39 ?562次閱讀
    使用OpenVINO 2024.4<b class='flag-5'>在</b>算力魔方上<b class='flag-5'>部署</b>Llama-3.2-1B-Instruct<b class='flag-5'>模型</b>

    NVIDIA NIM助力企業(yè)高效部署生成式AI模型

    Canonical、Nutanix 和 Red Hat 等廠商的開源 Kubernetes 平臺集成了 NVIDIA NIM,將允許用戶通過 API 調(diào)用來大規(guī)模地部署大語言模型
    的頭像 發(fā)表于 10-10 09:49 ?382次閱讀

    利用恩智浦云實(shí)驗(yàn)室部署AI模型

    如今,人工智能(AI)非?;鸨@個風(fēng)口該如何把握?作為一個電子工程師,和AI最主要的交集應(yīng)該就是邊緣計(jì)算了,具體來講,就是一些性能、功耗以及價格相對較低的嵌入式平臺上
    的頭像 發(fā)表于 08-02 11:46 ?2739次閱讀
    利用恩智浦云實(shí)驗(yàn)室<b class='flag-5'>部署</b><b class='flag-5'>AI</b><b class='flag-5'>模型</b>

    基于RK3588的NPU案例分享!6T是真的強(qiáng)!

    ,使用RKNN-Toolkit2將預(yù)訓(xùn)練模型轉(zhuǎn)換為RK3588 NPU可使用的RKNN模型。這通常涉及到將模型中的計(jì)算圖進(jìn)行適當(dāng)?shù)男薷暮蛢?yōu)化,以適應(yīng)
    發(fā)表于 07-17 10:55

    低功耗模型主板:ROC-RK3576-PC

    采用八核64位AIOT處理器RK3576,采用大小核構(gòu)架(4×A72+4×A53),采用先進(jìn)制程工藝,高性能低功耗,內(nèi)置ARMMaliG52MC3GPU,集成6TOPS算力NPU,支持
    的頭像 發(fā)表于 05-30 08:02 ?1002次閱讀
    <b class='flag-5'>低功耗</b>大<b class='flag-5'>模型</b>主板:ROC-RK3576-PC

    實(shí)測NPU“空轉(zhuǎn)”,AI PC首個落地應(yīng)用只調(diào)用GPU?

    AI PC的一大特征是傳統(tǒng)PC的CPU+GPU基礎(chǔ)上,增加NPU加強(qiáng)AI 算力。不過有意思的是,最近某品牌PC機(jī)型上的AI助手率先落地,支
    的頭像 發(fā)表于 05-22 00:16 ?3168次閱讀

    簡單三步使用OpenVINO?搞定ChatGLM3的本地部署

    英特爾 OpenVINO? 工具套件是一款開源 AI 推理優(yōu)化部署的工具套件,可幫助開發(fā)人員和企業(yè)加速生成式人工智能 (AIGC)、大語言模型、計(jì)算機(jī)視覺和自然語言處理等 AI 工作負(fù)
    的頭像 發(fā)表于 04-03 18:18 ?2045次閱讀
    <b class='flag-5'>簡單</b><b class='flag-5'>三步</b>使用OpenVINO?搞定ChatGLM3的本地<b class='flag-5'>部署</b>

    使用CUBEAI部署tflite模型到STM32F0中,模型創(chuàng)建失敗怎么解決?

    看到CUBE_AI已經(jīng)支持到STM32F0系列芯片,就想拿來入門嵌入式AI。 生成的模型很小,是可以部署到F0上的,但是一直無法創(chuàng)建成功。 查閱CUBE
    發(fā)表于 03-15 08:10

    三步完成英特爾獨(dú)立顯卡上量化和部署ChatGLM3-6B模型

    ChatGLM3 是智譜 AI 和清華大學(xué) KEG 實(shí)驗(yàn)室聯(lián)合發(fā)布的新一代對話預(yù)訓(xùn)練模型。ChatGLM3-6B 是 ChatGLM3 系列中的開源模型,填寫問卷進(jìn)行登記后亦允許免費(fèi)
    的頭像 發(fā)表于 01-11 18:04 ?1620次閱讀
    <b class='flag-5'>三步</b>完成<b class='flag-5'>在</b>英特爾獨(dú)立顯卡上量化和<b class='flag-5'>部署</b>ChatGLM3-6B<b class='flag-5'>模型</b>
    RM新时代网站-首页