RM新时代网站-首页

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

基于英特爾開發(fā)套件的AI字幕生成器設(shè)計(jì)

英特爾物聯(lián)網(wǎng) ? 來源:英特爾物聯(lián)網(wǎng) ? 2023-09-27 16:59 ? 次閱讀

作者:周兆靖 英特爾軟件應(yīng)用工程師

一、本文目的

市面上有很多自然語言處理模型,本文旨在幫助開發(fā)者快速將 OpenAI* 的熱門 NLP 模型 Whisper 部署至英特爾開發(fā)套件愛克斯開發(fā)板上,由于開發(fā)板內(nèi)存有限,所以我們選擇較輕量化的 Base Whisper 模型通過 OpenVINO 工具套件進(jìn)行 AI 推理部署。由于聲音處理應(yīng)用的廣泛性,開發(fā)者可以基于本項(xiàng)目繼續(xù)進(jìn)行 AI 應(yīng)用的頂層開發(fā)。

二、項(xiàng)目介紹

語音識(shí)別人工智能中的一個(gè)領(lǐng)域,它允許計(jì)算機(jī)理解人類語音并將其轉(zhuǎn)換為文本。該技術(shù)用于 Alexa*和各種聊天機(jī)器人應(yīng)用程序等設(shè)備。而我們最常見的就是語音轉(zhuǎn)錄,語音轉(zhuǎn)錄可以語音轉(zhuǎn)換為文字記錄或字幕。通過輸入音頻,通過 OpenVINO 優(yōu)化過的Whisper模型,將音頻進(jìn)行 AI 處理,最后輸出音頻處理結(jié)果。此結(jié)果可以根據(jù)開發(fā)者不同的需求,繼續(xù)進(jìn)行再次開發(fā)。

英特爾 開發(fā)套件——愛克斯開發(fā)板簡介

英特爾認(rèn)證的開發(fā)套件 —— AIxBoard(愛克斯板*)開發(fā)板是專為支持入門級(jí)邊緣 AI 應(yīng)用程序所設(shè)計(jì)的嵌入式硬件,它能夠滿足開發(fā)者對(duì)于人工智能學(xué)習(xí)、開發(fā)、實(shí)訓(xùn)等應(yīng)用場景的使用需求。

基于 x86 平臺(tái)所設(shè)計(jì)的開發(fā)板,可支持 Linux* Ubuntu*及完整版 Windows* 操作系統(tǒng),很方便開發(fā)者進(jìn)行軟硬件開發(fā),以及嘗試所有 x86 平臺(tái)能夠應(yīng)用的軟件功能。開發(fā)板搭載一顆英特爾賽揚(yáng)N5105 4 核 4 線程處理器,睿頻可達(dá) 2.9GHz,且內(nèi)置英特爾超核芯顯卡,含有 24 個(gè)執(zhí)行單元,分辨率最大支持 4K 60 幀,同時(shí)支持英特爾 Quick Sync Video 技術(shù)可以快速轉(zhuǎn)換便攜式多媒體播放器的視頻。板載 64GB eMMC 存儲(chǔ)及 LPDDR4x 2933MHz(4GB/6GB/8GB),內(nèi)置藍(lán)牙Wi-Fi 模組,支持 USB 3.0、HDMI 視頻輸出、3.5mm 音頻接口,1000Mbps 以太網(wǎng)口。

此外, 其接口與 Jetson Nano 載板兼容,GPIO 與樹莓派兼容,能夠最大限度地復(fù)用樹莓派、Jetson Nano 等生態(tài)資源,無論是攝像頭物體識(shí)別,3D 打印,還是 CNC 實(shí)時(shí)插補(bǔ)控制都能穩(wěn)定運(yùn)行??勺鳛檫吘売?jì)算引擎用于人工智能產(chǎn)品驗(yàn)證、開發(fā);也可以作為域控核心用于機(jī)器人產(chǎn)品開發(fā)。

OpenVINO 工具套件介紹

OpenVINO 是一個(gè)開源工具包,可優(yōu)化和部署深度學(xué)習(xí)模型。它提供了針對(duì)視覺、音頻和語言模型的深度學(xué)習(xí)性能加速,支持流行框架如 TensorFlow、PyTorch 等。

f96585a6-5d13-11ee-939d-92fbcf53809c.png

圖 3:OpenVINO 工具套件部署架構(gòu)圖

OpenVINO 可以優(yōu)化幾乎任何框架的深度學(xué)習(xí)模型,并在各種英特爾處理器和其他硬件平臺(tái)上以最佳性能進(jìn)行部署。OpenVINO Runtime 可以自動(dòng)使用激進(jìn)的圖形融合、內(nèi)存重用、負(fù)載平衡和跨 CPUGPU、VPU 等進(jìn)行集成并行處理,以優(yōu)化深度學(xué)習(xí)流水線。您可以集成和卸載加速器附加操作,以減少端到端延遲并提高吞吐量。通過 OpenVINO 的后訓(xùn)練優(yōu)化工具和神經(jīng)網(wǎng)絡(luò)壓縮框架中提供的量化和其他最先進(jìn)的壓縮技術(shù),進(jìn)一步提高模型的速度。這些技術(shù)還可以減少模型的大小和內(nèi)存需求,使其能夠部署在資源受限的邊緣硬件上。

Whisper 模型介紹

Whisper 來自于知名 AI 組織 OpenAI*,這個(gè)模型是一種通用的語音識(shí)別模型。它是在各種音頻的大型數(shù)據(jù)集上訓(xùn)練的,也是一個(gè)多任務(wù)模型,可以執(zhí)行多語言語音識(shí)別、語音翻譯和語言識(shí)別。

wav2vec2、Conformer 和 Hubert 等最先進(jìn)模型的最新發(fā)展極大地推動(dòng)了語音識(shí)別領(lǐng)域的發(fā)展。這些模型采用無需人工標(biāo)記數(shù)據(jù)即可從原始音頻中學(xué)習(xí)的技術(shù),從而使它們能夠有效地使用未標(biāo)記語音的大型數(shù)據(jù)集。它們還被擴(kuò)展為使用多達(dá) 1,000,000小時(shí)的訓(xùn)練數(shù)據(jù),遠(yuǎn)遠(yuǎn)超過學(xué)術(shù)監(jiān)督數(shù)據(jù)集中使用的傳統(tǒng) 1,000小時(shí),但是以監(jiān)督方式跨多個(gè)數(shù)據(jù)集和領(lǐng)域預(yù)訓(xùn)練的模型已被發(fā)現(xiàn)表現(xiàn)出更好的魯棒性和對(duì)持有數(shù)據(jù)集的泛化,所以執(zhí)行語音識(shí)別等任務(wù)仍然需要微調(diào),這限制了它們的全部潛力。為了解決這個(gè)問題 OpenAI 開發(fā)了 Whisper,一種利用弱監(jiān)督方法的模型。

f97bcc12-5d13-11ee-939d-92fbcf53809c.png

圖 4:Whisper 模型框圖

主要采用的結(jié)構(gòu)是編碼器 - 解碼器結(jié)構(gòu)。

模型的輸入音頻重采樣設(shè)為 16000 Hz,針對(duì)音頻的特征提取方法是使用 25 毫秒的窗口和 10 毫秒的步幅計(jì)算80通道的 log Mel 譜圖。最后對(duì)輸入特征進(jìn)行歸一化,將輸入在全局內(nèi)縮放到 -1 到 1 之間,并且在預(yù)訓(xùn)練數(shù)據(jù)集上具有近似為零的平均值。

編碼器/解碼器:

該模型的編碼器和解碼器采用 Transformers。

編碼器的過程:

編碼器首先使用一個(gè)包含兩個(gè)卷積層(濾波器寬度為 3)的詞干處理輸入表示,使用 GELU 激活函數(shù)。

第二個(gè)卷積層的步幅為 2,然后將正弦位置嵌入添加到詞干的輸出中,然后應(yīng)用編碼器 Transformer 塊。

Transformers 使用預(yù)激活殘差塊,編碼器的輸出使用歸一化層進(jìn)行歸一化。

解碼的過程:

在解碼器中,使用了學(xué)習(xí)位置嵌入和綁定輸入輸出標(biāo)記表示。

編碼器和解碼器具有相同的寬度和數(shù)量的 Transformers 塊。

訓(xùn)練:

為了改進(jìn)模型的縮放屬性,它在不同的輸入大小上進(jìn)行了訓(xùn)練。

通過 FP16、動(dòng)態(tài)損失縮放,并采用數(shù)據(jù)并行來訓(xùn)練模型。

使用 AdamW 和梯度范數(shù)裁剪,在對(duì)前 2048 次更新進(jìn)行預(yù)熱后,線性學(xué)習(xí)率衰減為零。

使用 256 個(gè)批大小,并訓(xùn)練模型進(jìn)行 220 次更新,這相當(dāng)于對(duì)數(shù)據(jù)集進(jìn)行兩到三次前向傳遞。

Whisper 在不同數(shù)據(jù)集上的對(duì)比結(jié)果,相比 wav2vec 取得了目前最低的詞錯(cuò)誤率,如下表:

f996f49c-5d13-11ee-939d-92fbcf53809c.png

圖 5:Whisper 模型與 wav2vec 詞錯(cuò)誤率對(duì)比表

三、項(xiàng)目流程

f9d2daca-5d13-11ee-939d-92fbcf53809c.png

圖 6:Whisper 模型語音處理流程圖

利用 Whisper 模型進(jìn)行視頻文字識(shí)別的流程如上,首先準(zhǔn)備語音文件,常規(guī)操作是將語音流從視頻流中分離,然后通過 Whisper 模型編碼語音文件的前 30 秒,輸出該語音文件對(duì)于的語言種類的多種可能性,選擇可能性最高的一種語言繼續(xù)進(jìn)行編碼。將整段語音文件分割成多個(gè) 30 秒的小段進(jìn)行編碼,再通過 Beam 搜索算法將音頻特征都轉(zhuǎn) 為token ID, 最后將 token ID 翻譯成 tokens 就可以獲得識(shí)別到的文本了。

使用 OpenVINO 工具套件對(duì) Whisper 模型進(jìn)行推理加速,主要在 Encoder 和 Decoder 上使用 OpenVINO Runtime,對(duì)應(yīng)到流程圖中,我們在不更改主體 pipeline 的前提下,OpenVINO 為流程中的“Positional Encoding”和“Cross attention”賦能,代碼實(shí)現(xiàn)層面就是使用 OpenVINO Runtime API 替換掉原先的 Encoder 和 Decoder,使得 OpenVINO 得以加入到這個(gè)音頻處理流程中,如下圖所示:

f9f1659e-5d13-11ee-939d-92fbcf53809c.png

圖 7:OpenVINO 賦能 Whisper 模型項(xiàng)目示意圖

四、實(shí)驗(yàn)流程

硬件:英特爾開發(fā)套件 —— 愛克斯開發(fā)板

OS:Ubuntu 20.04LTS

軟件:OpenVINO 2023.0,Whisper

由于 Whisper 預(yù)訓(xùn)練模型根據(jù)參數(shù)量分為 Tiny, Base, Small, Medium, Large。本次實(shí)驗(yàn)中選擇參數(shù)量為 74M 的 base 模型進(jìn)行實(shí)驗(yàn),使用預(yù)訓(xùn)練模型直接通過 OpenVINO 的模型優(yōu)化器 API 轉(zhuǎn)換為 IR 格式文件,將 Whisper 的編解碼器構(gòu)建成流水線,便可對(duì)視頻進(jìn)行語音轉(zhuǎn)文字的 AI 處理了。

安裝依賴:

為實(shí)現(xiàn)最快速的部署,我們直接下載 OpenVINO Open Model Zoo 里的現(xiàn)成 Notebook 進(jìn)行實(shí)驗(yàn)。

Git clone https://github.com/openvinotoolkit/ openvino_notebooks.git

左滑查看更多

構(gòu)建虛擬環(huán)境,安裝 OpenVINO,Whisper 以及其他依賴:

python3 -m venv openvino_env
source env/bin/activate

左滑查看更多

命令行中運(yùn)行如下 pip 安裝指令:

pip install openvino
pip install -q "python-ffmpeg<=1.0.16" moviepy transformers onnx
python -m pip install pytube
pip install -q -U gradio
pip install git+https://github.com/openai/whisper.git

左滑查看更多

進(jìn)入 notebooks/227-whisper-subtitles-generation/目錄中,安裝 Jupyter Notebook 并打開 227-whisper-convert.ipynb 文件:

pip install notebook
jupyter notebook

下面進(jìn)入 227-whisper-convert.ipynb 文件中運(yùn)行代碼

首先,下載 Whisper 現(xiàn)成的預(yù)訓(xùn)練模型,代號(hào)為“base”

import whisper


model = whisper.load_model("base")
model.to("cpu")
model.eval()
pass

左滑查看更多

模型主要是編碼器 - 解碼器的結(jié)構(gòu),所以我們先把 Encoder 部分被轉(zhuǎn)成 IR 模型,保存至本地:

import torch
import openvino as ov


mel = torch.zeros((1, 80, 3000))
audio_features = model.encoder(mel)
encoder_model = ov.convert_model(model.encoder, example_input=mel)
ov.save_model(encoder_model, WHISPER_ENCODER_OV)

左滑查看更多

然后把模型的 Decoder 部分也轉(zhuǎn)成 IR 模型,保存至本地:

tokens = torch.ones((5, 3), dtype=torch.int64)
logits, kv_cache = model.decoder(tokens, audio_features, kv_cache=None)


tokens = torch.ones((5, 1), dtype=torch.int64)
decoder_model = ov.convert_model(model.decoder, example_input=(tokens, audio_features, kv_cache))


ov.save_model(decoder_model, WHISPER_DECODER_OV)

左滑查看更多

創(chuàng)建 core 對(duì)象,啟用 OpenVINO Runtime:

core = ov.Core()

推理設(shè)備選擇“AUTO”Plugin,表示自動(dòng)選擇當(dāng)前系統(tǒng)最優(yōu)的推理硬件:

device = widgets.Dropdown(
  options=core.available_devices + ["AUTO"],
  value='AUTO',
  description='Device:',
  disabled=False,
)

左滑查看更多

我們的實(shí)驗(yàn)將復(fù)用原生模型處理音頻的 pipeline,只需要將原來的編碼器和解碼器用 OpenVINO Runtime API 重寫,即可得到 OpenVINO 加速過的 pipeline。

當(dāng)前文件目錄下包含“utils.py”,此腳本中集成了三個(gè)最重要的類,分別是:

patch_whisper_for_ov_inference,

OpenVINOAudioEncoder,

OpenVINOTextDecoder。

patch_whisper_for_ov_inference 主要提供了一些功能函數(shù),比如獲取音頻,增加時(shí)間戳,生成字幕文件等等。另外兩個(gè)類在這里的作用是使用 OpenVINO Runtime API 對(duì)原始模型 Encoder 和 Decoder 進(jìn)行重寫,利用 OpenVINO Runtime 替換掉原始模型中的 Encoder 和 Decoder 以加速優(yōu)化模型運(yùn)行的速度。

from utils import patch_whisper_for_ov_inference, OpenVINOAudioEncoder, OpenVINOTextDecoder


patch_whisper_for_ov_inference(model)


model.encoder = OpenVINOAudioEncoder(core, WHISPER_ENCODER_OV, device=device.value)
model.decoder = OpenVINOTextDecoder(core, WHISPER_DECODER_OV, device=device.value)

左滑查看更多

最終,調(diào)用 model.transcribe 函數(shù),運(yùn)行 AI 推理,并將生成的字幕文件保存為 srt 格式文件:

output_file = Path("downloaded_video.mp4")
from utils import get_audio


audio = get_audio(output_file)
task = widgets.Select(
  options=["transcribe", "translate"],
  value="translate",
  description="Select task:",
  disabled=False
)
task
transcription = model.transcribe(audio, task=task.value)
from utils import prepare_srt


srt_lines = prepare_srt(transcription)
# save transcription
with output_file.with_suffix(".srt").open("w") as f:
  f.writelines(srt_lines)

左滑查看更多

注意,由于 Notebook 提供的視頻是 YTB 的視頻,可能遇到無法下載的情況,這里我們也提供了一小段英文視頻可供讀者自由下載

只需將下載視頻替換 notebook 里的視頻路徑即可體驗(yàn) AI 字幕的功能。

結(jié)果展示:

視頻播放軟件可以直接導(dǎo)入 SRT 字幕文件生成字幕

五、小結(jié)

英特爾認(rèn)證的開發(fā)套件—— 愛克斯開發(fā)板以 Intel Celeron N5105 作為處理核心,在相同的功耗下獲得了優(yōu)秀的計(jì)算性能。在本次實(shí)驗(yàn)中,它在 OpenVINO 工具套件的加持下可以輕松完成語音轉(zhuǎn)文字的任務(wù),通過輕量化 AI 模型(Whisper)實(shí)現(xiàn)字幕實(shí)時(shí)生成的功能?;仡欀按罱髅襟w服務(wù)器的文章,我們可以使用開發(fā)板搭建一個(gè) RTMP 流媒體服務(wù)器,然后可以將它們結(jié)合,將輸入服務(wù)器的視頻流實(shí)時(shí)生成字幕之后進(jìn)行輸出,這樣就可以獲得一個(gè)能給視頻加英文字幕的流媒體服務(wù)器。愛克斯板的 I/O 接口豐富,攝像頭,麥克風(fēng),傳感器都可以進(jìn)行接入,并且開發(fā)板有著不錯(cuò)的 CPU 處理性能,可以在 OpenVINO 工具套件的加持下處理一些常規(guī)的 AI 推理任務(wù),開發(fā)者可以根據(jù)項(xiàng)目需求進(jìn)行巧妙搭配,組合創(chuàng)新。作為英特爾認(rèn)證的 DevKit,這塊小小的開發(fā)板卻蘊(yùn)含著巨大的能量,可以兼容市面上大多數(shù)的擴(kuò)展設(shè)備,也可以應(yīng)用上英特爾提供的軟硬件技術(shù),加上集成顯卡能為編解碼處理與 AI 推理賦能,這塊板子還是能創(chuàng)造出許多有趣的應(yīng)用的。如果你對(duì)這塊開發(fā)板感興趣,那就趕快行動(dòng)起來,開始你的開發(fā)創(chuàng)造之旅吧。

審核編輯:湯梓紅

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 英特爾
    +關(guān)注

    關(guān)注

    61

    文章

    9949

    瀏覽量

    171692
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    30728

    瀏覽量

    268880
  • 人工智能
    +關(guān)注

    關(guān)注

    1791

    文章

    47183

    瀏覽量

    238235
  • 開發(fā)套件
    +關(guān)注

    關(guān)注

    2

    文章

    154

    瀏覽量

    24271
  • OpenVINO
    +關(guān)注

    關(guān)注

    0

    文章

    92

    瀏覽量

    196

原文標(biāo)題:如何使用英特爾開發(fā)套件部署 AI 字幕生成器 | 開發(fā)者實(shí)戰(zhàn)

文章出處:【微信號(hào):英特爾物聯(lián)網(wǎng),微信公眾號(hào):英特爾物聯(lián)網(wǎng)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    英特爾82801HM IO控制器開發(fā)套件

    英特爾 82801HM I/O 控制器開發(fā)套件英特爾 凌動(dòng) 處理器系列包括板載處理器,該處理器采用 45 納米制程技術(shù)的集成優(yōu)化圖形和內(nèi)存控制器,與上一代英特爾 凌動(dòng) 處理器 N2
    發(fā)表于 12-07 14:05 ?29次下載
    <b class='flag-5'>英特爾</b>82801HM IO控制器<b class='flag-5'>開發(fā)套件</b>

    英特爾QM57高速芯片組開發(fā)套件

    英特爾酷睿處理器系列和移動(dòng)式英特爾QM57高速芯片組開發(fā)套件采用行業(yè)標(biāo)準(zhǔn)的x86架構(gòu),擁有智能性能、優(yōu)異能效、集成顯卡和糾錯(cuò)編碼(ECC)內(nèi)存。這些集成的雙芯片平臺(tái)不僅可提供卓越
    發(fā)表于 12-07 14:06 ?50次下載
    <b class='flag-5'>英特爾</b>QM57高速芯片組<b class='flag-5'>開發(fā)套件</b>

    英特爾酷睿2雙核處理器SL9380和英特爾3100芯片組開發(fā)套件

    英特爾 酷睿2 雙核處理器 SL9380 和英特爾 3100 芯片組開發(fā)套件為各種嵌入式和通信基礎(chǔ)設(shè)施應(yīng)用提供優(yōu)越的平臺(tái),特別是要求高性能、高可靠性和低功耗的小型嵌入式平臺(tái)應(yīng)用,例如:
    發(fā)表于 12-07 14:07 ?23次下載
    <b class='flag-5'>英特爾</b>酷睿2雙核處理器SL9380和<b class='flag-5'>英特爾</b>3100芯片組<b class='flag-5'>開發(fā)套件</b>

    英特爾凌動(dòng)N270處理器和移動(dòng)式英特爾945GSE高速芯片組開發(fā)套件

    英特爾 凌動(dòng) N270 處理器 和移動(dòng)式英特爾 945GSE 高速芯片組開發(fā)套件高速芯片組開發(fā)套件為嵌入式市場提供了優(yōu)異的每瓦性能、高能效顯卡, 豐富的 I/O 功能, 并且經(jīng)濟(jì)高效的
    發(fā)表于 12-07 14:08 ?31次下載
    <b class='flag-5'>英特爾</b>凌動(dòng)N270處理器和移動(dòng)式<b class='flag-5'>英特爾</b>945GSE高速芯片組<b class='flag-5'>開發(fā)套件</b>

    英特爾BOOT Loader開發(fā)套件-高級(jí)嵌入式開發(fā)基礎(chǔ)

    從技術(shù)角度概括介紹用于快速開發(fā)和部署啟動(dòng)加載器的英特爾 Boot Loader 開發(fā)套件(英特爾 BLDK),該套件基于
    發(fā)表于 12-07 14:57 ?59次下載
    <b class='flag-5'>英特爾</b>BOOT Loader<b class='flag-5'>開發(fā)套件</b>-高級(jí)嵌入式<b class='flag-5'>開發(fā)</b>基礎(chǔ)

    英特爾945GME高速芯片組開發(fā)套件

    英特爾945GME高速芯片組開發(fā)套件是多種低功耗嵌入式應(yīng)用,如工業(yè)自動(dòng)化,測試和儀表、航空、國防和醫(yī)療成像系統(tǒng)的開發(fā)人員的理想選擇
    發(fā)表于 12-08 10:15 ?47次下載
    <b class='flag-5'>英特爾</b>945GME高速芯片組<b class='flag-5'>開發(fā)套件</b>

    英特爾的945GME高速芯片組開發(fā)套件

    英特爾的945GME高速芯片組開發(fā)套件
    發(fā)表于 10-30 11:57 ?3次下載

    使用英特爾物聯(lián)網(wǎng)商業(yè)開發(fā)套件改變世界

    使用英特爾?物聯(lián)網(wǎng)商業(yè)開發(fā)套件改變世界。
    的頭像 發(fā)表于 05-31 10:06 ?1821次閱讀

    最新版英特爾? SoC FPGA 嵌入式開發(fā)套件(SoC EDS)全面的工具套件

    使用內(nèi)置于英特爾? SoC FPGA 開發(fā)套件(也可以用作外部 JTAG 調(diào)試線纜)的英特爾? FPGA Download Cable II 執(zhí)行裸機(jī)調(diào)試從 Platform Designer
    的頭像 發(fā)表于 11-20 09:34 ?7048次閱讀

    英特爾開源WebRTC開發(fā)套件OWT 帶來巨大的潛在商業(yè)回報(bào)

    為搶占實(shí)時(shí)視頻的巨大市場,英特爾開源了WebRTC開發(fā)套件,并將其命名為Open WebRTC Toolkit (OWT)。由于實(shí)時(shí)視頻編碼、轉(zhuǎn)碼需要大量的計(jì)算資源,Open WebRTC Toolkit將為英特爾帶來巨大的潛在
    的頭像 發(fā)表于 06-05 10:43 ?1.2w次閱讀
    <b class='flag-5'>英特爾</b>開源WebRTC<b class='flag-5'>開發(fā)套件</b>OWT 帶來巨大的潛在商業(yè)回報(bào)

    python生成器是什么

    python生成器 1. 什么是生成器生成器(英文名 Generator ),是一個(gè)可以像迭代器那樣使用for循環(huán)來獲取元素的函數(shù)。 生成器的出現(xiàn)(Python 2.2 +),實(shí)現(xiàn)
    的頭像 發(fā)表于 02-24 15:53 ?3654次閱讀

    英特爾發(fā)布開源AI參考套件

    英特爾正式推出了首套開源AI參考套件,旨在讓企業(yè)能夠在本地、云端和邊緣環(huán)境中都更易于部署AI。這些在英特爾On產(chǎn)業(yè)創(chuàng)新峰會(huì)(Intel Vi
    發(fā)表于 07-15 16:45 ?694次閱讀

    英特爾通過AI參考套件加速AI發(fā)展

    優(yōu)化的AI參考套件 旨在 助力開發(fā)者和數(shù)據(jù)科學(xué)家跑出創(chuàng)新“加速度” 最新動(dòng)態(tài) 得益于英特爾與埃森哲的長期合作,英特爾現(xiàn)推出了一套共計(jì)34個(gè)的
    的頭像 發(fā)表于 07-28 19:45 ?803次閱讀
    <b class='flag-5'>英特爾</b>通過<b class='flag-5'>AI</b>參考<b class='flag-5'>套件</b>加速<b class='flag-5'>AI</b>發(fā)展

    基于OpenVINO在英特爾開發(fā)套件上實(shí)現(xiàn)眼部追蹤

    本文將以訓(xùn)練一個(gè)眼部追蹤 AI 小模型為背景,介紹從 Pytorch 自定義網(wǎng)絡(luò)模型,到使用 OpenVINO NNCF 量化工具優(yōu)化模型,并部署到英特爾開發(fā)套件愛克斯開發(fā)板 AIx
    的頭像 發(fā)表于 09-18 10:11 ?756次閱讀

    英特爾開發(fā)套件『哪吒』在Java環(huán)境實(shí)現(xiàn)ADAS道路識(shí)別演示 | 開發(fā)者實(shí)戰(zhàn)

    本文使用來自O(shè)penModelZoo的預(yù)訓(xùn)練的road-segmentation-adas-0001模型。ADAS代表高級(jí)駕駛輔助服務(wù)。該模型識(shí)別四個(gè)類別:背景、道路、路緣和標(biāo)記。硬件環(huán)境此文使用了英特爾開發(fā)套件家族里的『哪吒』(Nezha)
    的頭像 發(fā)表于 04-29 08:07 ?551次閱讀
    <b class='flag-5'>英特爾</b><b class='flag-5'>開發(fā)套件</b>『哪吒』在Java環(huán)境實(shí)現(xiàn)ADAS道路識(shí)別演示 | <b class='flag-5'>開發(fā)</b>者實(shí)戰(zhàn)
    RM新时代网站-首页