毋庸置疑,語音控制揚聲器(常稱為智能音箱)是一種熱門的消費類產(chǎn)品。根據(jù)市場調(diào)研公司eMarketer 的數(shù)據(jù)顯示,2017 年,3,560 萬美國消費者每個月至少使用一次聲控設(shè)備,并且該數(shù)字以近 50% 的復合年均增長率增長。
未來的市場預(yù)測也比較樂觀。Juniper Research 預(yù)測,到 2022 年,大多數(shù)美國家庭中都將安裝Amazon Echo、Google Home、Apple HomePod 和Sonos One 等智能設(shè)備。他們還預(yù)測,將會有7,000萬家庭在家中安裝至少其中一種智能音箱,設(shè)備安裝總量將超過 1.75 億臺。對于一個在 2014 年 11 月之前還不存在的產(chǎn)品類別來說,這尤其令人印象深刻。
但相比于與互聯(lián)網(wǎng)接口結(jié)合使用的麥克風和揚聲器, 這些外形看似簡單的設(shè)備往往更復雜。智能音箱包含許多電子功能,這些功能均通過采用數(shù)十種復雜的集成電路(IC) 來實現(xiàn)。原始設(shè)備制造商 (OEM) 憑借差異化產(chǎn)品進入智能揚聲器市場,他們必須決定要提供哪些設(shè)備、如何進行提供以及此類小型低功耗設(shè)備中可采用的折衷方案。
智能音箱的實際作用有哪些?如何在家庭中使用智能音箱?簡而言之,智能音箱首先通過捕獲終端用戶的語音指令并將其數(shù)字化,再將結(jié)果傳輸給基于網(wǎng)絡(luò)連接的云服務(wù)進行解讀,然后通過操作指令或響應(yīng)結(jié)果對終端用戶做出響應(yīng)。智能音箱也可以從具備網(wǎng)絡(luò)或Bluetooth? 連接設(shè)備搜索并播放音頻內(nèi)容。如圖 1 所示,現(xiàn)在許多智能音箱都可以與家中的其他設(shè)備交 互,如燈、門鎖和溫度控制系統(tǒng)等。
圖1 作為一種媒體播放器,智能音箱必須設(shè)計簡單,外形優(yōu)雅,且能提供良好的音質(zhì)。作為一種智能家居集線器,它們必須為家庭中的整套智能設(shè)備提供準確的語言識別和連接。
OEM 廠商不單單只是希望他們的產(chǎn)品在這一過程中能夠脫穎而出;更多的是,它們希望以此獲取房間,甚或是整個住宅的信息訪問和傳輸?shù)目刂茩?quán),從而成為唯一的數(shù)字化媒體和家庭自動化集線器。
讓智能音箱成為現(xiàn)實
智能音箱需要大量電路才能實現(xiàn)其正常并良好地運行。要實現(xiàn)這一目標,我們便需要一系列復雜的模擬、數(shù)字、混合信號和電源管理子系統(tǒng)、接口等,并讓其實現(xiàn)互連(圖 2)。
圖 2.TI 智能音箱系統(tǒng)方框圖
除此之外,我們還有許多設(shè)計問題需要解決,如麥克風、音頻輸出和揚聲器、電源管理、用戶界面以及無線連接應(yīng)采用何種數(shù)量和類型。對于 OEM 廠商來說, 首要問題便是是否使用“黑盒”芯片組,其中包括用于音頻解碼和信號處理的片上系統(tǒng)(SoC)、集成 Wi-Fi?和藍牙無線電的微控制器(MCU)。有的時候,這還包括自定義電源管理IC (PMIC)。然而,這種“罐裝”式解決方案不能為產(chǎn)品差異化提供太多設(shè)計空間?,F(xiàn)在就讓我們一起來看看智能音箱系統(tǒng)中的設(shè)計領(lǐng)域和挑戰(zhàn)。
麥克風
選擇麥克風技術(shù)時,每種技術(shù)的利與弊可能并不明顯。對此,我們可以選擇以下任意一種方案:
? 基于微電子機械系統(tǒng)(MEMS) 的“模擬”麥克風。它帶有集成前置放大器,搭配外部 24 位音頻模數(shù)轉(zhuǎn)換器(ADC),可將格式化數(shù)字代碼輸出到 SoC。
? 基于MEMS 的“數(shù)字”麥克風。它帶有單比特一階Δ-Σ 調(diào)制器ADC,可輸出脈寬調(diào)制 (PDM) 數(shù)字比特流,需要進一步濾波以創(chuàng)建格式化數(shù)字代碼。無論是專用于語音識別的SoC ,還是數(shù)字信號處理器 (DSP) 都必須處理這種濾波。獨立的語音 DSP 可減輕SoC 的大量處理工作,卻也會增加成本。
數(shù)字麥克風的價格比模擬麥克風更昂貴,但模擬麥克風的 SoC 前端也將需要額外配有的 ADC。鑒于傳感器尺寸需適應(yīng)麥克風封裝內(nèi)的 ADC 以及集成 ADC 本身的性能限制,與帶有單獨 ADC 的模擬麥克風比較起來,數(shù)字麥克風還具有較低的信噪比 (SNR) 和較小的動態(tài)范圍。常見的數(shù)字麥克風的 SNR 約為 65dB, 動態(tài)范圍約為 104db。當 ADC 集成后,我們就無法通過濾波和過采樣進一步提高 SNR 或動態(tài)范圍。
另一方面,模擬麥克風與外部 ADC 相結(jié)合,其 SNR 或動態(tài)范圍(兩者在 ADC 中的意義等同)可高達120dB。這種外部 ADC 通常是 24 位多通道高精度音頻ADC,采用具有高過采樣功能的三階或四階 Δ-Σ 調(diào)制器。它們還集成了復雜的可編程數(shù)字抽取濾波 器;具有可配置的自動增益控制功能的 PGA 以及用于額外噪聲過濾和均衡的微型DSP。如果在典型的擁擠房間內(nèi)或正在播放音樂的房間內(nèi),周圍環(huán)境中的聲音級別很容易達到 60dB,除非終端用戶靠近麥克風或者使用更多的麥克風來使其指令遠高于環(huán)境音, 否則,數(shù)字麥克風的較低動態(tài)范圍就可能導致無法正確識別語音指令,動態(tài)范圍從 104dB 提升至 120dB, 將會帶來驚人的效果,這需要我們認真考慮。如果我們將動態(tài)范圍提高 6dB ,那就可以讓語音識別范圍擴大一倍。在某些時候,過多地擴大動態(tài)范圍是不切實際或是無用的,但您也可以憑此獲取更多的設(shè)計空間。額外增加 14dB 的動態(tài)范圍后,您可以通過減少所需的麥克風數(shù)量來節(jié)約成本。增加字麥克風后, 除了會增加成本外,系統(tǒng)還會按照 SoC 自身可用的PDM 輸入數(shù)量將每對麥克風的三條信號跡線(數(shù)據(jù)和時鐘)路由到 SoC,進而增加了布局復雜性,因此 這是不可行的。事實是,每條信號跡線都會接受和/或 輻射噪聲,這會讓電磁干擾成為更大的問題。最后,運行至每個數(shù)字麥克風的時鐘線路會造成路由和抖動方面的難題。目前模擬麥克風具有不同的輸出,支持對信號布線的共模抑制。ADC 還為每個麥克風提供偏置電源,可為陣列降低電源樹的復雜性。
圖 3.圓形麥克風板參考設(shè)計
使用配有精密ADC 的模擬麥克風可以擴大麥克風范圍并提高敏感度,不僅可以降低成本和復雜性,還可以顯著減少在各種噪聲環(huán)境下指令識別錯誤。隨著第二代智能音箱的推出,這一錯誤率將逐漸成為一項重要的市場優(yōu)勢。
在采用多麥克風設(shè)計和語音識別時,我們也無需重新設(shè)計?;赑CM1864 的TI 圓形麥克風板(CMB) 參考設(shè)計(如圖 3 所示)使用兩個 4 通道音頻ADC 與一組模擬麥克風(最多含八個)連接,并且可以在嘈雜的環(huán)境中提取清晰的用戶語音指令。
揚聲器放大器和電源
對于揚聲器放大器,您需要在輸出功率(通常介于5W 和 25W 之間)、功耗、熱性能、尺寸、揚聲器保護以及聲音保真之間進行權(quán)衡。
帶有一個中程高頻揚聲器和低音揚聲器的簡易揚聲器系統(tǒng)可以產(chǎn)生出色的音質(zhì),同時,如果結(jié)合使用最新的音頻處理技術(shù),多個揚聲器可提供 360 度音頻體驗。
您也可以選擇執(zhí)行一次性室內(nèi)校準以調(diào)整并以最佳方式匹配揚聲器的頻譜特性,或者采用更復雜的自適應(yīng)調(diào)節(jié)方法補償聲區(qū)內(nèi)的音效。TI PurePath 控制臺圖形開發(fā)套件可以提供簡單的一次性調(diào)優(yōu)并達到 出色的效果。
在功耗和熱性能方面,降低持續(xù)功耗的一種方法是將放大器脈寬調(diào)制方案與自適應(yīng)電源相結(jié)合來降低揚聲器的電源要求。這種技術(shù)對 D 類輸出使用可變(非固定)開關(guān)頻率,同時基于音頻內(nèi)容更改頻率。也就是說,內(nèi)容越多,開關(guān)頻率就越高;內(nèi)容越少,開關(guān)頻率就越低。
為了提高效率,您也可以根據(jù)內(nèi)容動態(tài)調(diào)整放大器的輸出電源電壓。這種技術(shù)稱為包絡(luò)跟蹤。它僅在音樂 需要提高功率時跟蹤音頻內(nèi)容并提高電壓(輸出功 率),特別是在重低音部分(信號內(nèi)容中有許多峰值)。
數(shù)字輸入、D 類、IV 感應(yīng)音頻放大器的立體聲評估模塊參考設(shè)計(如圖 4 所示)不僅接受多種格式的數(shù)字輸入并提供高質(zhì)量音頻,其 D 類拓撲還包括其他功能, 可以最大程度地降低多個輸出級別的功耗,而不會降低保真度和性能。
圖 4.立體聲評估模塊參考設(shè)計
電源管理
與大部分電子系統(tǒng)一樣,電源管理在系統(tǒng)設(shè)計中發(fā)揮 著重要作用。我們的最終目標是有效地提供電源以減 少熱耗散,從而實現(xiàn)外形更小、成本更低的系統(tǒng),并延 長便攜式系統(tǒng)的電池運行時間。SoC 和Wi-Fi 芯片組有時與專用PMIC 綁定在一起,但您仍可能會更傾向于通過使用單獨的直流/直流轉(zhuǎn)換器、低壓降穩(wěn)壓器和電壓監(jiān)控器來修改功能(如定序)、更改電路板布局 并降低噪聲和/或成本,來增加電路板布局空間并提高分立式實現(xiàn)的供應(yīng)商靈活性。
除了固定的集成解決方案提供的功能(例如以較低的靜態(tài)電流運行或使用較高的開關(guān)頻率(如 1.4MHz 至 4MHz)以外,您可能還希望優(yōu)化設(shè)計來降低占用空 間,以滿足對更小電感器的需求?;蛘吣部梢允褂妹}沖跳躍或ECO 模式以在輕負荷下節(jié)省電力,同時, 請不要將音頻頻帶切換到 20kHz 以下(這可能會導致可聞噪聲)。此外,您還可能需要系統(tǒng)輸入電壓具備靈活性。這些放大器需要 12V 至 24V 電源,該電源可通過內(nèi)部電源或外部電源適配器提供。
內(nèi)部交流/直流電源可以提供主電源,但輸出電壓為12V 或 5V 的外部交流/直流壁式適配器更為常用,具體取決于所需的揚聲器電源。可以通過適用于低功率揚聲器的微型USB 接口或適用于高功率揚聲器的新型的流線型USB Type-C? 來提供主電源,取代笨重的傳統(tǒng)壁式交流/直流適配器和桶形插座。由于這些適配器的功率級別不同,使用 USB Type-C 需要從揚聲器到適配器的某種級別的握手,或者采用輸入USB 電流限位開關(guān)或具有集成式過流和過壓保護的電池充電器。
對于便攜式音箱,一種稱為電源路徑管理的技術(shù)支持使用外部交流/直流壁式適配器為電池充電,同時通過一個集成式調(diào)節(jié)器為揚聲器“實時”充電。如果您需要更高的揚聲器放大器電源軌(如 12V 或 18V),一種選擇是使用兩節(jié) 8V 電池,然后根據(jù)揚聲器放大器的需要提高電壓。電池充電器需要將輸入電壓提升到更高的電池電壓(如果適配器輸出電壓為 5V),并且您需要對揚聲器放大器電源軌使用額外的升壓轉(zhuǎn)換器, 以在峰值功率的條件下實現(xiàn)更高的電壓。此外,便攜式智能音箱系統(tǒng)必須具有低待機功耗等級和有效的降壓轉(zhuǎn)換器,以實現(xiàn)在電池是唯一的電源時,可在充電周期之間提供更長的運行時間。
由于音箱是主要電源消耗設(shè)備,因此與其放大器需求緊密相關(guān)的電源可實現(xiàn)具有成本效益的低功耗設(shè)計。適用于音頻功率放大器的包絡(luò)跟蹤電源參考設(shè)計(如圖 5 所示)就是此類解決方案的一個很好的示例:它以 5.4V 至 8.4V 的輸入電壓軌運行,并向 8Ω 負載提供 2 × 20W 功率(使用 7.2V 電源軌)。此外,它可以按照音頻信號的峰間包絡(luò)更改輸出電壓,從而在輸出電壓范圍內(nèi)保持高效率。因此,它根據(jù)音頻內(nèi)容動態(tài) 調(diào)整功率放大器的電源,從而優(yōu)化其功耗。
圖 5.包絡(luò)跟蹤電源參考設(shè)計
用戶界面
您必須根據(jù)所需的終端用戶體驗決定提供哪種類型的用戶界面,因為人機界面是智能音箱市場差異化的一個主要因素。這種界面可能包括成本較低的簡單按鈕和單指示器LED、旋轉(zhuǎn) LED 陣列、小型 LCD 顯示屏以及具有觸控輸入和觸覺反饋功能的LCD 顯示屏。
LED 基本用于指示狀態(tài),最近也用于通過以各種圖案生成動態(tài)顏色來提高終端用戶體驗。較簡單的系統(tǒng)可能使用單色LED,但大部分系統(tǒng)使用紅、綠、藍 (RGB) LED。如果您選擇多色 LED,則需要確定使用多少個 RGB LED,以及系統(tǒng)處理器、MCU 或裝有集成式LED引擎的新型多LED 驅(qū)動器是否會控制它們。每種選擇均需權(quán)衡成本、電源和系統(tǒng)方面的考量。使用集成式LED 圖形引擎可以在處理器管理圖形生成時減輕其負擔,并在處理器或 MCU 進入低功耗待機模式時驅(qū)動RGB LED 陣列。
如圖 6 所示,各種LED 環(huán)形燈照明圖案參考設(shè)計說明了如何使用裝有集成式LED 引擎的新型多通道RGB LED 驅(qū)動器設(shè)計多色RGB LED 環(huán)形燈圖形子系統(tǒng)。使用環(huán)境光傳感器 IC 可自動控制LED 亮度。
圖 6.各種LED 環(huán)形燈照明圖案參考設(shè)計
相應(yīng)面板按鈕的價格可能很低,但它們更容易出現(xiàn)機械故障且只具備單一功能。這種按鈕需要終端用戶“ 按住”才能執(zhí)行操作(向上、向下、滾動),在智能手機領(lǐng)域,這種操作已經(jīng)過時且與有悖于常規(guī)使用習慣 的。相比之下,電容式觸控的敏感表面可支持更多交互并可以增強用戶界面功能。這種觸控方式的表面無需物理外力即可檢測到終端用戶的接近,并支持背光在黑暗環(huán)境中更易于使用。與簡單的按壓不同的是, 觸控敏感表面可通過支持“輕滑”或“旋轉(zhuǎn)”,讓用戶更易于接觸到熟悉的界面,從而能夠讓智能音箱脫穎而出。設(shè)計合理的電容式觸控控制器可在各種表面,如塑料、玻璃或金屬材質(zhì)上運行,并且可以與音箱外殼表面齊平。
基于手勢的電容式觸控揚聲器界面參考設(shè)計(如圖 7 所示)提供了一種易于使用的評估系統(tǒng),用于使用 TI 電容式觸控MCU 的智能揚聲器的多手勢電容式觸控界面。此設(shè)計支持點擊、輕滑、滑動和旋轉(zhuǎn)手勢。
無線連接
最后,還有一個基本的開箱使用問題。如果未連接到互聯(lián)網(wǎng),智能揚聲器將無法正常工作。考慮到速度要求和功率限制,我們將為您提供有關(guān)最佳連接方式的設(shè)計決策。
最常見的智能音箱可通過Wi-Fi 直接連接到互聯(lián)網(wǎng)。在這里,IEEE 802.11n 的寬帶綽綽有余,它還支持多室無線揚聲器網(wǎng)狀連接。不過,Wi-Fi 功率放大器會消耗大量功率,可能會限制電池供電的智能音箱的運行時間。因此,支持 Wi-Fi 連接的音箱通常直接插入到壁裝電源插座或裝有支持持續(xù)運行的交流適配器。
為了能夠盡可能多的覆蓋到房間或提升立體聲音質(zhì), 用戶往往會希望使用多個智能揚聲器裝置,這就需要IEEE 802.11n/s 的寬帶支持來實現(xiàn)網(wǎng)狀網(wǎng)絡(luò)。在網(wǎng)狀網(wǎng)絡(luò)中,任何一個揚聲器均可以在其他揚聲器用作從屬方時成為主控方(連接到云)。如果作為主控方運行的揚聲器斷電或斷網(wǎng),網(wǎng)狀網(wǎng)絡(luò)將自動分配其他揚聲器作為主控方。而在多揚聲器網(wǎng)狀網(wǎng)絡(luò)中,最大問題是同步。
網(wǎng)狀網(wǎng)絡(luò)中的Wi-Fi 控制器必須具有可靠的同步方案,以避免為用戶帶來麻煩。
電池供電的便攜式音箱可能會將Wi-Fi 云連接轉(zhuǎn)移到附近的移動設(shè)備上。如果要連接到移動設(shè)備以實現(xiàn)間接云連接和/或收聽移動設(shè)備上存儲的內(nèi)容,則需要使用傳統(tǒng)藍牙(或藍牙基本速率)來實現(xiàn)持續(xù)連接, 以對音頻內(nèi)容進行流處理,這是由低功耗藍牙的寬帶限制和電源方案所致。當與傳統(tǒng)藍牙配合使用時,低功耗藍牙可以控制設(shè)備之間的通信。
家庭自動化是目前作為單獨實體存在于許多家庭中的另一個功能。作為一種獨立集線器,它可以通過Wi-Fi 連接到互聯(lián)網(wǎng),也可以通過對家庭自動化(根據(jù)Zigbee?、Thread、Z-wave 等標準實施)設(shè)置無線網(wǎng)狀網(wǎng)絡(luò)與專用燈具和恒溫器實現(xiàn)鏈接。只要具備這一附加獨立集線器,智能音箱就可以合理地宣布通過互聯(lián)網(wǎng)提供家庭自動化。
圖 7.基于手勢的電容式觸控界面參考設(shè)計
但是,為了讓終端用戶無需購買這種額外的無線集線器,智能音箱可以簡單地添加帶有集成式射頻功率放大器的多頻帶無線 MCU,從而成為家庭自動化集線器。無線 MCU 處理協(xié)議棧操作并控制無線電,避免加重現(xiàn)有 SoC 或 Wi-Fi 網(wǎng)絡(luò)處理器的負擔,同時支持通過常用的遠距離家庭自動化協(xié)議(包括 2.4GHz 和低于 1GHz 的頻帶)進行通信。因為 Wi-Fi 和藍牙也使用 2.4GHz 頻帶,所以您需要通過集成式無線 MCU 中內(nèi)置的硬件和軟件的組合來確保兩者共存。
展望未來
未來的智能音箱將不只是僅供音頻使用的獨立設(shè)備。由于平板電視更加輕薄,意味著需要更小的揚聲器,這將會對電視聲音產(chǎn)生負面影響。因此,可增強平板電視音效的條形音箱將日漸普及。添加語音識別功能很顯然是條形音箱發(fā)展的下一步。
要實現(xiàn)這一愿景,智能條形音箱將需要包含一個用于無線視頻流的機頂盒,同時僅有一條 HDMI 電纜連接到電視,電視則被作為巨大的顯示器來使用。由于平板電視更加輕薄,電視控制線路和電源也可以在智能條形音箱中實現(xiàn)。然后,智能音箱和智能條形音箱將爭相成為整個家庭娛樂系統(tǒng)的集線器。添加家庭自動化連接后,這些設(shè)備也將爭相成為智能家居的自動化集線器。
另一個新增功能是智能音箱顯示屏。向智能揚聲器添加顯示屏是對其功能的自然擴展。正如汽車中不斷增加中控臺顯示屏,消費者也要求家庭信息化/娛樂設(shè)備提供額外的視覺體驗。我們還可以看到的是,內(nèi)容的請求和顯示方式將不同于手持智能手機或平板電腦體驗。由于語音指令是請求內(nèi)容和控制的主要模式,因此我們將需要使用簡化的搜索和控制應(yīng)用來幫助快速獲取準確的結(jié)果。此外,我們還可以簡化顯示的圖像,降低對觸摸交互的需求,同時還提供適合遠距離觀看的超大圖像。
這將提供清晰的視覺內(nèi)容,使得消費者在與智能音箱交互時可獲取更愉快的體驗。
憑借這種新增的顯示功能,智能音箱便可以在客廳中讓位于智能條形音箱,從而專注于客廳以外的區(qū)域。智能音箱可提供小型個人顯示屏,從集成式 LCD 屏幕到大型超短距高清投影(使用 TI DLP? 技術(shù)在任意表面上創(chuàng)建大型顯示屏)。在高流量區(qū)域,如廚房或起居室附近的智能設(shè)備則需要更加美觀且不受干擾。增加一個平板電腦大小或更大的平板顯示器并不總是符合這些標準。在用戶通過智能音箱獲取信息,如天氣、烹飪、交通等以及對匿名聲音做出表情時,投影顯示技術(shù)可以提供更具互動性的體驗。由此,智能音箱在家庭中的作用和重要性便將不斷變化和發(fā)展,從而為設(shè)計師帶來了新趨勢和讓其設(shè)計與眾不同機會。
評論
查看更多