RM新时代网站-首页

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

OpenAI 發(fā)了一個(gè)支持 ESP32 的 Realtime API SDK

KiCad ? 來源:KiCad ? 作者:KiCad ? 2024-12-21 11:36 ? 次閱讀

昨晚 OpenAI 正式發(fā)布了 o3 模型,AI 圈一片沸騰。作為電子工程師的我撓了撓頭,好像和我沒什么直接的關(guān)系倒是 OpenAI 的另一個(gè)小發(fā)布,讓我很感興趣:一個(gè)可以在 LinuxESP32 上使用的 Realtime API SDK。

bb0aa66e-bf4c-11ef-902f-92fbcf53809c.png 對(duì),就是上面這個(gè)項(xiàng)目,剛發(fā)布沒多久,文檔都幾乎沒有。感興趣的小伙伴可以自己去看一下: https://github.com/openai/openai-realtime-embedded-sdk 這個(gè) SDK 能干嘛?

這個(gè) SDK 主要是給嵌入式硬件設(shè)計(jì)的,目前只支持樂鑫的 ESP32s3。以下是經(jīng)過驗(yàn)證的兩個(gè)開發(fā)板:

Freenove ESP32-S3-WROOM

Sonatino - ESP32-S3 Audio Development Board

其它的 ESP32-S3 硬件理論上也能跑,只是沒有經(jīng)過驗(yàn)證。 當(dāng)然如果你只想玩一下,也可以不用任何硬件,直接在 Linux 上運(yùn)行。

SDK 基于 OpenAI 最新的 WebRTC,可以提供低延時(shí)的語音對(duì)話服務(wù)。Altman 在發(fā)布會(huì)上演示的 AI 實(shí)時(shí)語音對(duì)話、打斷等就是基于 WebRTC。感興趣的小伙伴可以看一下 WebRTC 的介紹:

https://platform.openai.com/docs/guides/realtime-webrtc

bb23b7b2-bf4c-11ef-902f-92fbcf53809c.png

配置完成后build一下,然后燒錄到 ESP32S 的固件里即可。接下去就可以直接調(diào)用 API 了。這種方式簡(jiǎn)化了硬件調(diào)用實(shí)時(shí)語音,甚至視覺識(shí)別的方法,典型的應(yīng)用有:

陪伴類的玩具

可穿戴設(shè)備

智能音箱/語音助手

國(guó)內(nèi)有平替嗎?

如果用不了 OpenAI,國(guó)內(nèi)其實(shí)也有類似的服務(wù),比如火山引擎的 RTC:

https://www.volcengine.com/product/veRTC

字節(jié)推出的顯眼包2.0用的就是 RTC 服務(wù):

在上周的“2024火山引擎冬季Force原動(dòng)力大會(huì)”上,已經(jīng)有不少硬件廠商展示了基于 RTC 的產(chǎn)品demo。其中有一個(gè)品牌“Haivivi”做了現(xiàn)場(chǎng)演講,分享了他們的理念和創(chuàng)業(yè)經(jīng)歷。雖然只是一個(gè)“可以對(duì)話”的玩具,卻有別于傳統(tǒng)的智能音箱,得到了很多用戶的認(rèn)可。我在現(xiàn)場(chǎng)也體驗(yàn)了一下RTC的效果,延時(shí)在2~5秒之間,基本可以滿足實(shí)時(shí)對(duì)話的要求。

字節(jié)的產(chǎn)品經(jīng)理也提到了嵌入式的 SDK,但沒有詳細(xì)公布支持的硬件型號(hào),估計(jì)還處于測(cè)試階段。但毫無疑問,ESP肯定是合作伙伴之一。

“端插件”是什么?

專題論壇中還提到了“端”插件的概念。簡(jiǎn)單說就是把硬件的功能(比如調(diào)節(jié)音量、驅(qū)動(dòng)電機(jī)等)以插件的形式注冊(cè)在大模型的平臺(tái),端側(cè)的硬件只要收集用戶的輸入,傳輸?shù)酱竽P秃笥赡P瓦M(jìn)行數(shù)據(jù)處理并根據(jù)解析的結(jié)果調(diào)用“端”插件執(zhí)行硬件端的動(dòng)作。

bb5cb26a-bf4c-11ef-902f-92fbcf53809c.jpg

這種范式有可能降低硬件端的成本(因?yàn)槎藗?cè)不再需要算力,只要做輸入、輸出及信息交互),并有可能降低開發(fā)的時(shí)間(可以很快添加語音識(shí)別、圖像識(shí)別等功能,因?yàn)椴挥没谟布_發(fā),可以直接丟給模型處理)。這里的潛臺(tái)詞是:類似語音交互、圖像識(shí)別的任務(wù),大模型一定比本地的硬件做的好。當(dāng)然前提是要能接受數(shù)據(jù)傳輸和處理的延時(shí),另外數(shù)據(jù)安全也是需要考慮的因素之一。

結(jié)束語 人工智能技術(shù)尤其是大模型和AIGC正以前所未有的速度迅猛發(fā)展,它們的影響力已經(jīng)滲透到各個(gè)行業(yè),包括電子硬件領(lǐng)域。作為電子硬件工程師,我們站在技術(shù)革新的前沿,面臨著前所未有的機(jī)遇與挑戰(zhàn)。我們必須深入思考,如何將AIGC等前沿技術(shù)與硬件設(shè)計(jì)相結(jié)合,以實(shí)現(xiàn)創(chuàng)新突破。打造出更智能、更高效、更符合市場(chǎng)需求的產(chǎn)品,從而在激烈的市場(chǎng)競(jìng)爭(zhēng)中占據(jù)有利地位。

注意:如果想第一時(shí)間收到 KiCad 內(nèi)容推送,請(qǐng)點(diǎn)擊下方的名片,按關(guān)注,再設(shè)為星標(biāo)。

常用合集匯總:

和 Dr Peter 一起學(xué) KiCad

KiCad 8 探秘合集

KiCad 使用經(jīng)驗(yàn)分享

KiCad 設(shè)計(jì)項(xiàng)目(Made with KiCad)

常見問題與解決方法

KiCad 開發(fā)筆記

插件應(yīng)用

發(fā)布記錄

審核編輯 黃宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • API
    API
    +關(guān)注

    關(guān)注

    2

    文章

    1499

    瀏覽量

    61958
  • SDK
    SDK
    +關(guān)注

    關(guān)注

    3

    文章

    1035

    瀏覽量

    45897
  • ESP32
    +關(guān)注

    關(guān)注

    18

    文章

    971

    瀏覽量

    17200
  • OpenAI
    +關(guān)注

    關(guān)注

    9

    文章

    1079

    瀏覽量

    6480
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    【AI技術(shù)支持ESP32無線Wi-Fi常用調(diào)試API

    Wi-Fi常用調(diào)試API在使用esp32調(diào)試Wi-Fi功能時(shí),由于場(chǎng)景和各種因素的影響,難免會(huì)遇到各種連接不上,Wi-Fi斷連等問題。下面介紹API,方便新手調(diào)試Wi-Fi時(shí)更好的
    的頭像 發(fā)表于 10-26 08:00 ?483次閱讀
    【AI技術(shù)<b class='flag-5'>支持</b>】<b class='flag-5'>ESP32</b>無線Wi-Fi常用調(diào)試<b class='flag-5'>API</b>

    esp32上使用chatGPT做些有意思的事情

    ChatGPT獲得響應(yīng),我們需要進(jìn)行以下步驟:1、在OpenAI網(wǎng)站上注冊(cè),并在ESP32上安裝必要的庫。 2、在OpenAI API上創(chuàng)建
    的頭像 發(fā)表于 10-18 10:04 ?360次閱讀

    啟明智顯ESP32系列串口屏全面升級(jí)!支持樂鑫IDF最新版,兼容Arduino開發(fā)環(huán)境

    啟明智顯的ESP32系列串口屏迎來了全面升級(jí),SDK更新至樂鑫IDF的最新版本,并且完美兼容Arduino開發(fā)環(huán)境!
    的頭像 發(fā)表于 09-05 16:48 ?969次閱讀
    啟明智顯<b class='flag-5'>ESP32</b>系列串口屏全面升級(jí)!<b class='flag-5'>支持</b>樂鑫IDF最新版,兼容Arduino開發(fā)環(huán)境

    esp8266和esp32區(qū)別是什么

    以下是關(guān)于ESP8266和ESP32的主要區(qū)別: 處理器和架構(gòu) : ESP8266 :使用個(gè)Tensilica L106 80MHz的處理
    的頭像 發(fā)表于 08-19 18:16 ?5230次閱讀

    esp32用什么軟件編程

    。 概述 ESP32具有豐富的外設(shè)接口和靈活的編程方式,支持多種編程語言和開發(fā)環(huán)境。本文將詳細(xì)介紹ESP32的編程軟件,包括開發(fā)環(huán)境、編程語言、庫函數(shù)、開發(fā)工具等。 開發(fā)環(huán)境 2.1 Arduino IDE Arduino ID
    的頭像 發(fā)表于 08-19 17:24 ?3404次閱讀

    ESP32-WROOM-32E、ESP32-WROOM-32D、ESP32-WROOM-32U 有什么區(qū)別?ESP32-WROOM-32 后綴字母代表的意思是?

    相信很多人心里都有這樣的疑問,今天就教大家怎么區(qū)分它們。 32D和32U是同一個(gè)芯片ESP32-D0WD的模組,主要區(qū)別的天線模式,分別是板載和IPEX外接天線。 32E是用的升級(jí)版的芯片
    的頭像 發(fā)表于 07-17 10:09 ?9351次閱讀
    <b class='flag-5'>ESP32</b>-WROOM-32E、<b class='flag-5'>ESP32</b>-WROOM-32D、<b class='flag-5'>ESP32</b>-WROOM-32U  有什么區(qū)別?<b class='flag-5'>ESP32</b>-WROOM-32 后綴字母代表的意思是?

    ESP8266 NONOS SDK V1.5.4版本的SDK,是否支持upgrade API?

    ESP8266 NONOS SDK V1.5.4版本的SDK,是否支持upgrade API? 打算實(shí)現(xiàn)fota升級(jí)。 include/
    發(fā)表于 07-09 07:58

    ESP32能取代STM32嗎?哪個(gè)更好?

    不能!首先二者不存在哪個(gè)更好的問題,因?yàn)檫@兩個(gè)芯片使用場(chǎng)景各不相同,在嵌入式系統(tǒng)領(lǐng)域,ESP32和STM32都是常見的單片機(jī)系列,它們各自具有定的優(yōu)勢(shì)和適用場(chǎng)景。本文主要探討ESP32
    的頭像 發(fā)表于 07-06 08:04 ?1.1w次閱讀
    <b class='flag-5'>ESP32</b>能取代STM32嗎?哪個(gè)更好?

    ESP32,做了個(gè)siri?!開源了!

    工程名稱:ESP32直接對(duì)話大語言模型人工智能語音助手前言用ESP32做了個(gè)語言模型,就像個(gè)
    的頭像 發(fā)表于 06-29 08:04 ?328次閱讀
    用<b class='flag-5'>ESP32</b>,做了<b class='flag-5'>個(gè)</b>siri?!開源了!

    esp32 sdcard格式化的api沒有找到,為什么?

    esp32 sdcard 格式化的api 沒有找到,可否說明
    發(fā)表于 06-25 07:45

    請(qǐng)問ESP32-C3和ESP32-S2或WROOM系列是否支持單步調(diào)試?

    : 中文版https://docs.espressif.com/projects/esp-idf/zh_CN/latest/esp32c3/api-guides/jtag-debugging
    發(fā)表于 06-21 07:32

    請(qǐng)問esp32-c3不支持pcnt嗎?

    我在esp32-c3開發(fā)板上測(cè)試pcnt,編譯報(bào)錯(cuò)找不到相關(guān)的函數(shù),查看sdk源碼發(fā)現(xiàn)要配置CONFIG_SOC_PCNT_SUPPORTED才會(huì)編譯pcnt.c,查看examples里面的項(xiàng)目也說了只支持
    發(fā)表于 06-18 07:27

    esp32-s3藍(lán)牙僅支持BLE 5.0嗎?

    1. esp32-s3藍(lán)牙僅支持BLE 5.0嗎?經(jīng)典藍(lán)牙是否支持,以及BLE 5.1 5.2 5.3是否支持 2. 如何選擇1M 或2M 的phy?似乎沒看到相應(yīng)的
    發(fā)表于 06-13 06:48

    OpenAI API Key獲取與充值教程:助開發(fā)者解鎖GPT-4.0 API

    OpenAIAPI Key,以及如何使用這個(gè) Key 來調(diào)用 GPT-4.0 API。 第步:獲取 OpenAI
    的頭像 發(fā)表于 04-28 16:35 ?1w次閱讀
    <b class='flag-5'>OpenAI</b> <b class='flag-5'>API</b> Key獲取與充值教程:助開發(fā)者解鎖GPT-4.0 <b class='flag-5'>API</b>

    如何使用ESP32和STC51芯片制作個(gè)小小光立方呢?

    分享個(gè)ESP32和STC51芯片,以及0805貼片燈珠,手工焊接制作的小小光立方。
    的頭像 發(fā)表于 01-09 15:37 ?1905次閱讀
    如何使用<b class='flag-5'>ESP32</b>和STC51芯片制作<b class='flag-5'>一</b><b class='flag-5'>個(gè)</b>小小光立方呢?
    RM新时代网站-首页