AI Conversation Speaker aka Friend Bot:第1部分對(duì)話
資料介紹
描述
Conversational Speaker,非正式地稱為“Friend Bot”,使用 Raspberry Pi 實(shí)現(xiàn)與 OpenAI 大型語(yǔ)言模型的口頭對(duì)話。此實(shí)現(xiàn)收聽語(yǔ)音,通過 OpenAI 服務(wù)處理對(duì)話,并做出回應(yīng)。
有關(guān)用于維護(hù)對(duì)話上下文的提示引擎的更多信息,請(qǐng)轉(zhuǎn)到此處:python 、typescript 、dotnet 。
有關(guān)一般提示設(shè)計(jì)的更多信息,請(qǐng)查看 OpenAI 關(guān)于該主題的文檔:https ://beta.openai.com/docs/guides/completion/prompt-design 。
本項(xiàng)目使用 .NET 6 編寫,支持 Raspberry Pi OS、Linux、macOS 和 Windows。
構(gòu)建時(shí)間:30分鐘
閱讀時(shí)間:15分鐘
硬件:~$50
軟件:
Azure 認(rèn)知語(yǔ)音服務(wù),免費(fèi)層支持每月 5 個(gè)免費(fèi)音頻小時(shí)和 1 個(gè)并發(fā)請(qǐng)求(Azure 認(rèn)知服務(wù)定價(jià))。新的 Azure 帳戶包含 200 美元的免費(fèi)額度,可在前 30 天內(nèi)使用。
- OpenAI、Davinci 模型(最強(qiáng)大):0.02 美元/~750 個(gè)單詞,Curie 模型(仍然相當(dāng)不錯(cuò),響應(yīng)時(shí)間更快):0.002 美元/~750 個(gè)單詞。新的 OpenAI 帳戶包含 18 美元的免費(fèi)信用額度,可在您的前 90 天內(nèi)使用。更多詳情:https ://openai.com/api/pricing/
設(shè)置
您將需要一個(gè)用于語(yǔ)音轉(zhuǎn)文本和文本轉(zhuǎn)語(yǔ)音的 Azure 認(rèn)知服務(wù)實(shí)例,以及一個(gè)用于對(duì)話的 OpenAI 帳戶。您幾乎可以在任何平臺(tái)上運(yùn)行該軟件,但讓我們先從設(shè)置 Raspberry Pi 開始……
樹莓派
如果您是 Raspberry Pis 的新手,現(xiàn)在是查看入門的好時(shí)機(jī)。
1. 將 SD 卡插入您的 PC
2. 轉(zhuǎn)到https://www.raspberrypi.com/software/然后下載并運(yùn)行 Raspberry Pi Imager
3. 單擊“選擇操作系統(tǒng)”并選擇默認(rèn)的樹莓派操作系統(tǒng)(32 位)。
4.點(diǎn)擊`Choose Storage`,選擇SD卡
5. 點(diǎn)擊`Write`,等待鏡像完成。
6. 將 SD 卡插入樹莓派,連接鍵盤、鼠標(biāo)和顯示器。
7. 完成初始設(shè)置,確保配置 Wi-Fi。
USB 揚(yáng)聲器/麥克風(fēng)
1. 如果您還沒有插入 USB 揚(yáng)聲器/麥克風(fēng)
2. 右鍵單擊??屏幕右上角的音量圖標(biāo),確保選擇了 USB 設(shè)備。
3. 右鍵單擊??屏幕右上角的麥克風(fēng)圖標(biāo),確保選擇了 USB 設(shè)備。
蔚藍(lán)
對(duì)話式演講者使用 Azure 認(rèn)知服務(wù)進(jìn)行語(yǔ)音轉(zhuǎn)文本和文本轉(zhuǎn)語(yǔ)音。以下是創(chuàng)建 Azure 帳戶和 Azure 認(rèn)知服務(wù)實(shí)例的步驟。
創(chuàng)建一個(gè) Azure 帳戶(如果您還沒有)
1. 在 Web 瀏覽器中,導(dǎo)航至https://aka.ms/friendbot/azure并單擊Try Azure for Free
。
2. 單擊Start Free
開始創(chuàng)建免費(fèi)的 Azure 帳戶。
3. 使用您的 Microsoft 或 GitHub 帳戶登錄。
4. 登錄后,系統(tǒng)會(huì)提示您輸入一些信息。
5. 即使這是一個(gè)免費(fèi)帳戶,Azure 仍然需要信用卡信息。除非您稍后更改設(shè)置,否則不會(huì)向您收費(fèi)。
6. 帳戶設(shè)置完成后,導(dǎo)航至https://aka.ms/friendbot/azureportal。
創(chuàng)建 Azure 認(rèn)知服務(wù)實(shí)例
1. 在https://aka.ms/friendbot/azureportal登錄你的帳戶。
2. 在頂部的搜索欄中,輸入Cognitive Services
并在下方Marketplace
選擇Cognitive Services
(可能需要一些時(shí)間來填充)。
3. 確認(rèn)選擇了正確的訂閱,然后在Resource Group
選擇下Create New
輸入資源組名稱(例如conv-speak-rg
)
4. 為您的 Azure 認(rèn)知服務(wù)實(shí)例選擇區(qū)域和名稱(例如my-conv-speak-cog-001
)。我建議使用美國(guó)東部、西歐或東南亞,因?yàn)檫@些地區(qū)往往支持最多的功能。
5. 點(diǎn)擊 ,Review + Create
驗(yàn)證通過后點(diǎn)擊Create
。
6. 部署完成后,您可以單擊Go to resource
以查看您的 Azure 認(rèn)知服務(wù)資源。
7. 在左側(cè)導(dǎo)航欄中,選擇Keys and Endpoint
下Resource Management
。復(fù)制兩個(gè)認(rèn)知服務(wù)密鑰中的任意一個(gè)并保存在安全位置以備后用。
Windows 11 用戶:如果應(yīng)用程序在調(diào)用文本到語(yǔ)音 API 時(shí)停滯,請(qǐng)確保您已應(yīng)用所有當(dāng)前安全更新(鏈接)。
開放人工智能
對(duì)話式演講者使用 OpenAI 的模型進(jìn)行友好對(duì)話。以下是創(chuàng)建新帳戶和訪問 AI 模型的步驟。
創(chuàng)建一個(gè) OpenAI 帳戶(如果您還沒有)
1. 在網(wǎng)絡(luò)瀏覽器中,導(dǎo)航至https://openai.com/api并單擊“注冊(cè)”
2. 您可以使用谷歌賬戶、微軟賬戶或郵箱創(chuàng)建新賬戶。
3. 完成注冊(cè)過程(例如,創(chuàng)建密碼、驗(yàn)證您的電子郵件等)。如果您是 OpenAI 的新手,請(qǐng)查看使用指南 ( https://beta.openai.com/docs/usage-guidelines )。
4. 在右上角點(diǎn)擊您的賬戶,然后點(diǎn)擊View API keys
。
5. 單擊+ Create new secret key
,復(fù)制并保存在安全位置以備后用。
- 如果您想直接使用大型語(yǔ)言模型,請(qǐng)查看頁(yè)面頂部的“游樂場(chǎng)”。
代碼
獲取并配置代碼。
1. 在 Raspberry Pi 或您的 PC 上,打開命令行終端
2.安裝.NET 6 SDK
- 對(duì)于樹莓派和 Linux:
curl -sSL https://dot.net/v1/dotnet-install.sh | bash /dev/stdin --channel 6.0
安裝完成后(可能需要幾分鐘),將 dotnet 添加到命令搜索路徑
echo 'export DOTNET_ROOT=$HOME/.dotnet' >> ~/.bashrc
echo 'export PATH=$PATH:$HOME/.dotnet' >> ~/.bashrc
source ~/.bashrc
您可以通過檢查版本來驗(yàn)證是否已成功安裝 dotnet
dotnet --version
- 對(duì)于 Windows,請(qǐng)轉(zhuǎn)到https://dotnet.microsoft.com/download ,單擊“Download.NET SDK x64”,然后運(yùn)行安裝程序。
3. 克隆 repo 并簽出適當(dāng)?shù)姆种А?/font>
git clone --recursive --branch hackster-tutorial-1 https://github.com/microsoft/conversational-speaker.git
4. 設(shè)置您的 API 密鑰,將 {MyCognitiveServicesKey} 替換為您的 Azure 認(rèn)知服務(wù)密鑰,將 {MyCognitiveServiceRegion} 替換為您的 Azure 認(rèn)知服務(wù)區(qū)域(例如,EastUS
),并將 {MyOpenAIKey} 替換為上述部分中的 OpenAI API 密鑰。
cd ~/conversational-speaker/src/ConversationalSpeaker
dotnet user-secrets set "AzureCognitiveServices:Key" "{MyCognitiveServicesKey}"
dotnet user-secrets set "AzureCognitiveServices:Region" "{MyCognitiveServiceRegion}"
dotnet user-secrets set "OpenAI:Key" "{MyOpenAIKey}"
5. 構(gòu)建并運(yùn)行代碼!
cd ~/conversational-speaker/src/ConversationalSpeaker
dotnet build
dotnet run
(可選)將應(yīng)用程序設(shè)置為開機(jī)啟動(dòng)
Raspberry Pi 啟動(dòng)時(shí)有幾種方法可以運(yùn)行程序。下面是我的首選方法,它會(huì)在可見的終端窗口中自動(dòng)運(yùn)行應(yīng)用程序。這使您不僅可以看到輸出,還可以通過單擊終端窗口并按 CTRL+C 來取消應(yīng)用程序。
1.創(chuàng)建文件/etc/xdg/autostart/friendbot.desktop
sudo nano /etc/xdg/autostart/friendbot.desktop
2.將以下內(nèi)容放入文件中
[Desktop Entry]
Exec=lxterminal --command "/bin/bash -c '~/.dotnet/dotnet run --project ~/conversational-speaker/src/ConversationalSpeaker; /bin/bash'"
按 CTRL+O 保存文件,按 CTRL+X 退出。這將在 Raspberry Pi 完成啟動(dòng)后在終端窗口中運(yùn)行應(yīng)用程序。
3. 要測(cè)試更改,您只需運(yùn)行即可重新啟動(dòng)
reboot
怎么運(yùn)行的
有關(guān)如何使用代碼字的更多詳細(xì)信息,請(qǐng)查看README 。
用法
- 建議以“你好,我叫喬丹,住在華盛頓州雷德蒙德”開頭來設(shè)置上下文。
-
看看
~/conversational-speaker/src/ConversationalSpeaker/configuration.json
. -
更改 AI 的名稱 (
PromptEngine:OutputPrefix
), -
改變 AI 的聲音 (
AzureCognitiveServices:SpeechSynthesisVoiceName
) -
改變 AI 的性格 (
PromptEngine:Description
) - 對(duì)于中短對(duì)話,提示引擎的當(dāng)前狀態(tài)通常保持穩(wěn)定。然而,有時(shí)在較長(zhǎng)的對(duì)話中,人工智能可能不僅會(huì)開始回應(yīng)它自己的回應(yīng),還會(huì)回應(yīng)它認(rèn)為你接下來可能會(huì)說的話。
下次...
在下一個(gè)教程中,我們將向我們的會(huì)話揚(yáng)聲器添加喚醒階段(例如“嘿,計(jì)算機(jī)”)。
玩得開心!
- 電源設(shè)計(jì)方法-第1部分
- 使用Zio控制機(jī)械臂(第1部分)
- DIY CD點(diǎn)焊機(jī)-第1部分
- 電氣過應(yīng)力簡(jiǎn)介-第1部分
- 了解你的電池組:第1部分
- 如何進(jìn)行電源設(shè)計(jì) - 第1部分
- LDO基礎(chǔ)知識(shí):噪聲 - 第1部分
- 集成智能第1部分:EMI管理
- 照明電器團(tuán)標(biāo)《多功能路燈技術(shù)規(guī)范 第1-8部分 》
- 用電信息采集系統(tǒng)型式規(guī)范第1部分 1次下載
- 用電信息采集系統(tǒng)技術(shù)規(guī)范第1部分 3次下載
- 用電信息采集系統(tǒng)檢驗(yàn)規(guī)范第1部分 2次下載
- 電壓基準(zhǔn)如何影響ADC性能,第2部分 10次下載
- GB 7000.1-2015 燈具 第1部分:一般要求與試驗(yàn)(備 84次下載
- GB 15579.1-2013 弧焊設(shè)備 第1部分焊接電源 25次下載
- 雙極踏腳車(第二部分):微步和衰減模式 461次閱讀
- ADC數(shù)字下變頻器:抽取濾波器和ADC混疊,第2部分 1455次閱讀
- ADI公司設(shè)計(jì)工具:ADIsimRF第1部分 1387次閱讀
- ADC眼中的虛擬評(píng)估,第2部分 624次閱讀
- 邊緣智能第1部分:邊緣節(jié)點(diǎn) 1046次閱讀
- 邊緣智能第1部分:邊緣節(jié)點(diǎn) 904次閱讀
- 基于知識(shí)的對(duì)話生成任務(wù) 1530次閱讀
- 實(shí)時(shí)控制技術(shù)滿足實(shí)時(shí)工業(yè)通信發(fā)展的需求 —— 第2部分 993次閱讀
- JESD204C入門第2部分:新特性及其內(nèi)容 6242次閱讀
- DC/DC轉(zhuǎn)換器傳導(dǎo)EMI - 第2部分,噪聲傳播和濾波 3150次閱讀
- “導(dǎo)游Bot”在模擬的紐約市中導(dǎo)航定位,使用自然語(yǔ)言跟“游客Bot”交流 2243次閱讀
- 電壓檢測(cè)器、監(jiān)控器和高級(jí)監(jiān)控各種功能介紹:第1部分 4859次閱讀
- 如何成為一名對(duì)話系統(tǒng)工程師 4308次閱讀
- 無源元件并非真的“無源”:第1部分——電容 2433次閱讀
- 混合信號(hào)系統(tǒng)接地揭秘之第二部分 1663次閱讀
下載排行
本周
- 1山景DSP芯片AP8248A2數(shù)據(jù)手冊(cè)
- 1.06 MB | 532次下載 | 免費(fèi)
- 2RK3399完整板原理圖(支持平板,盒子VR)
- 3.28 MB | 339次下載 | 免費(fèi)
- 3TC358743XBG評(píng)估板參考手冊(cè)
- 1.36 MB | 330次下載 | 免費(fèi)
- 4DFM軟件使用教程
- 0.84 MB | 295次下載 | 免費(fèi)
- 5元宇宙深度解析—未來的未來-風(fēng)口還是泡沫
- 6.40 MB | 227次下載 | 免費(fèi)
- 6迪文DGUS開發(fā)指南
- 31.67 MB | 194次下載 | 免費(fèi)
- 7元宇宙底層硬件系列報(bào)告
- 13.42 MB | 182次下載 | 免費(fèi)
- 8FP5207XR-G1中文應(yīng)用手冊(cè)
- 1.09 MB | 178次下載 | 免費(fèi)
本月
- 1OrCAD10.5下載OrCAD10.5中文版軟件
- 0.00 MB | 234315次下載 | 免費(fèi)
- 2555集成電路應(yīng)用800例(新編版)
- 0.00 MB | 33566次下載 | 免費(fèi)
- 3接口電路圖大全
- 未知 | 30323次下載 | 免費(fèi)
- 4開關(guān)電源設(shè)計(jì)實(shí)例指南
- 未知 | 21549次下載 | 免費(fèi)
- 5電氣工程師手冊(cè)免費(fèi)下載(新編第二版pdf電子書)
- 0.00 MB | 15349次下載 | 免費(fèi)
- 6數(shù)字電路基礎(chǔ)pdf(下載)
- 未知 | 13750次下載 | 免費(fèi)
- 7電子制作實(shí)例集錦 下載
- 未知 | 8113次下載 | 免費(fèi)
- 8《LED驅(qū)動(dòng)電路設(shè)計(jì)》 溫德爾著
- 0.00 MB | 6656次下載 | 免費(fèi)
總榜
- 1matlab軟件下載入口
- 未知 | 935054次下載 | 免費(fèi)
- 2protel99se軟件下載(可英文版轉(zhuǎn)中文版)
- 78.1 MB | 537798次下載 | 免費(fèi)
- 3MATLAB 7.1 下載 (含軟件介紹)
- 未知 | 420027次下載 | 免費(fèi)
- 4OrCAD10.5下載OrCAD10.5中文版軟件
- 0.00 MB | 234315次下載 | 免費(fèi)
- 5Altium DXP2002下載入口
- 未知 | 233046次下載 | 免費(fèi)
- 6電路仿真軟件multisim 10.0免費(fèi)下載
- 340992 | 191187次下載 | 免費(fèi)
- 7十天學(xué)會(huì)AVR單片機(jī)與C語(yǔ)言視頻教程 下載
- 158M | 183279次下載 | 免費(fèi)
- 8proe5.0野火版下載(中文版免費(fèi)下載)
- 未知 | 138040次下載 | 免費(fèi)
評(píng)論
查看更多