本文轉(zhuǎn)自:邊緣計算社區(qū)
19位歐美頂尖學(xué)者聯(lián)合撰寫的重磅論文,由邊緣計算社區(qū)傾力翻譯完成,如有不足之處,敬請指正。本論文首發(fā)于 IEEE Internet Computing:
《Revisiting Edge AI: Opportunities and Challenges》
(重新審視邊緣人工智能:機遇與挑戰(zhàn))
發(fā)表日期:2024年7-8月
期刊卷號:第28卷,第49-59頁
DOI:10.1109/MIC.2024.3383758
本文深度剖析了邊緣人工智能(Edge AI)的最新發(fā)展動態(tài),全面探討了當前的機遇與挑戰(zhàn),為產(chǎn)業(yè)界與學(xué)術(shù)界提供了重要的指導(dǎo)性洞見。
以下是翻譯全文,共計 10280 字。重新審視邊緣人工智能:機遇與挑戰(zhàn)
邊緣人工智能(Edge AI)是一種創(chuàng)新的計算范式,旨在將機器學(xué)習(xí)模型的訓(xùn)練和推理移至網(wǎng)絡(luò)邊緣。該范式帶來了極大的潛力,可以通過諸如自動駕駛、個性化健康護理等新服務(wù)顯著改善我們的日常生活。然而,邊緣智能的實現(xiàn)面臨諸多挑戰(zhàn),比如模型架構(gòu)設(shè)計的約束、已訓(xùn)練模型的安全分發(fā)與執(zhí)行,以及分發(fā)模型和訓(xùn)練數(shù)據(jù)所需的高網(wǎng)絡(luò)負載。本文總結(jié)了邊緣AI的發(fā)展關(guān)鍵節(jié)點,分析當前的挑戰(zhàn),并探討將人工智能與邊緣計算結(jié)合的研究機遇。
邊緣計算的重要轉(zhuǎn)變
邊緣計算是一種重要的范式轉(zhuǎn)變,通過將數(shù)據(jù)處理更靠近數(shù)據(jù)源,正在重塑互聯(lián)網(wǎng)和應(yīng)用的格局。這一戰(zhàn)略性演進有望提升效率、響應(yīng)速度,并更好地保護隱私。從以云為主的解決方案起步,如今越來越多的應(yīng)用正在沿著計算連續(xù)體向邊緣設(shè)備靠近。雖然過去對邊緣設(shè)備的定義有多種不同解釋,從用戶終端設(shè)備到小型本地化數(shù)據(jù)中心,但邊緣設(shè)備的總體特性是相似的:靠近用戶并在本地處理數(shù)據(jù)。
盡管近年來邊緣解決方案的普及度有所提高,但其部署速度仍然相較于云市場的增長顯得相對較慢。這可以歸因于建設(shè)和管理分布式基礎(chǔ)設(shè)施的高成本,以及相比于僅為云構(gòu)建應(yīng)用,開發(fā)邊緣應(yīng)用的相對復(fù)雜性。
人工智能(AI)的興起及其對訓(xùn)練數(shù)據(jù)的巨大需求,使得利用邊緣設(shè)備進行訓(xùn)練和推理成為一個顯而易見的后續(xù)發(fā)展趨勢。機器學(xué)習(xí)(ML)應(yīng)用對大量數(shù)據(jù)的需求,確實使得在邊緣進行數(shù)據(jù)訓(xùn)練和推理相比于云為中心的方式更加高效且合理。此外,在靠近邊緣或直接在邊緣對ML模型進行訓(xùn)練和推理,還為終端用戶帶來了顯著優(yōu)勢,包括更好的數(shù)據(jù)隱私保護和更快的響應(yīng)時間。
然而,將人工智能與邊緣計算相結(jié)合也帶來了更多挑戰(zhàn),尤其是由于邊緣設(shè)備的資源限制和可用性。這些局限性在與穩(wěn)健且無處不在的云基礎(chǔ)設(shè)施相比時顯得尤為明顯。然而,像自動駕駛這樣的應(yīng)用場景,不僅需要低延遲的響應(yīng),還要求以極高的速率處理高維數(shù)據(jù),這鮮明地展示了邊緣智能的必要性。在此類安全關(guān)鍵型應(yīng)用中,哪怕是幾毫秒的延遲都至關(guān)重要,這使得獲取數(shù)據(jù)源和模型決策的最小延遲變得至關(guān)重要。同樣地,將學(xué)習(xí)和推理引入邊緣將催生新的創(chuàng)新型和實用型應(yīng)用,例如機器人技術(shù)、沉浸式多用戶應(yīng)用(增強現(xiàn)實)以及智能醫(yī)療保健,從而徹底變革我們的生活方式。
在探索人工智能(AI)與邊緣計算協(xié)同發(fā)展的過程中,解決邊緣計算與智能融合所帶來的獨特挑戰(zhàn)至關(guān)重要。盡管邊緣智能具有巨大的潛力,但其發(fā)展受到資源限制的影響,特別是在計算和存儲資源方面,這與傳統(tǒng)云基礎(chǔ)設(shè)施的能力形成了顯著對比。由于這些局限性,保護數(shù)據(jù)安全和確??焖夙憫?yīng)時間仍然是重大挑戰(zhàn)。在許多情況下,當前的邊緣計算解決方案在這些方面仍落后于純云計算。
邊緣基礎(chǔ)設(shè)施通常部署在物理可訪問的地點,無法受益于云計算中使用的基于邊界的保護措施。為了使邊緣計算真正成為現(xiàn)有純云解決方案的有力補充,未來的研究需要聚焦于邊緣智能的安全性、可用性和效率。本文不僅回顧了過去十年來邊緣人工智能的發(fā)展歷程,還對不同利益相關(guān)方的觀點進行了批判性分析,并概述了這一領(lǐng)域中的迫切挑戰(zhàn)以及令人興奮的未來研究方向。
邊緣AI的十年歷程
邊緣智能作為邊緣計算范式的演化而出現(xiàn),其根源可以追溯到2000年代,主要是由云計算在處理本地設(shè)備生成的日益增長的數(shù)據(jù)方面的局限性所驅(qū)動。邊緣計算分散了數(shù)據(jù)處理,將其推向網(wǎng)絡(luò)邊緣的數(shù)據(jù)源。這種接近性減少了數(shù)據(jù)必須傳輸?shù)木嚯x,從而減少了延遲并節(jié)省了帶寬。此外,邊緣計算通過本地處理敏感數(shù)據(jù),減輕了中央服務(wù)器的數(shù)據(jù)負載并增強了隱私保護功能。邊緣計算與云計算可以相輔相成,形成所謂的計算連續(xù)體。邊緣計算解決即時的本地化處理需求,而云計算則在大規(guī)模數(shù)據(jù)存儲和復(fù)雜計算任務(wù)中不可或缺。
邊緣AI的興起
邊緣智能是邊緣計算的進一步范式轉(zhuǎn)變,通過整合人工智能(AI)以增強網(wǎng)絡(luò)邊緣的處理能力。這種整合不僅進一步降低了延遲,還減輕了中央服務(wù)器的帶寬需求,同時帶來了額外優(yōu)勢,例如通過聯(lián)邦學(xué)習(xí)等分布式機器學(xué)習(xí)方法提升隱私保護,以及通過本地自治和去中心化控制提高系統(tǒng)韌性。
邊緣智能廣泛應(yīng)用于多個領(lǐng)域,包括智慧城市、醫(yī)療保健、自動駕駛和工業(yè)自動化,這些領(lǐng)域?qū)Φ脱舆t和本地數(shù)據(jù)處理有著關(guān)鍵需求。這一趨勢因5G網(wǎng)絡(luò)的日益普及以及未來6G網(wǎng)絡(luò)所承諾的高帶寬連接能力而進一步加速,這些技術(shù)為邊緣智能應(yīng)用提供了必要的高速連接。圖1展示了人工智能從云端集中式訓(xùn)練和推理模式向邊緣人工智能解決方案轉(zhuǎn)變的過程,并以兩個典型用例(自動駕駛和互聯(lián)健康解決方案)說明了其中的挑戰(zhàn)和機遇。
圖1.展示了從云端集中式人工智能(左)向邊緣人工智能(右)的轉(zhuǎn)變,以及針對兩個典型目標應(yīng)用——自動駕駛車輛和個性化醫(yī)療保健——所面臨的相關(guān)挑戰(zhàn)和機遇。
邊緣AI的現(xiàn)狀
當前的邊緣智能研究可以分為兩個主要子領(lǐng)域:邊緣上的AI(AI on edge)和為邊緣服務(wù)的AI(AI for edge)。前者聚焦于適應(yīng)去中心化、異構(gòu)性以及機會性邊緣環(huán)境的人工智能方法;后者則專注于利用這些方法為計算連續(xù)體帶來益處。
邊緣上的AI(AI on edge)得益于機器學(xué)習(xí)算法(尤其是深度學(xué)習(xí))的進步,以及這些算法在資源受限設(shè)備上執(zhí)行的優(yōu)化。輕量級神經(jīng)網(wǎng)絡(luò)的開發(fā)以及模型剪枝和量化等技術(shù)在使復(fù)雜AI模型能夠高效運行于邊緣設(shè)備上方面起到了關(guān)鍵作用。在圖1中,邊緣上的AI使得模型的訓(xùn)練和推理能夠直接在邊緣進行,這可以通過邊緣設(shè)備之間的直接交互以協(xié)作形式完成,也可以利用靠近這些設(shè)備的本地邊緣服務(wù)器實現(xiàn)。
一個顯著的趨勢是分布式機器學(xué)習(xí)技術(shù)的興起,用于在多個邊緣設(shè)備上訓(xùn)練和推理AI模型,同時保護數(shù)據(jù)隱私。例如,聯(lián)邦學(xué)習(xí)允許在無需集中數(shù)據(jù)的情況下進行協(xié)作模型訓(xùn)練,這與邊緣計算的分布式特性相契合,并回應(yīng)了日益增長的數(shù)據(jù)安全和隱私問題。
為了在邊緣進行大規(guī)模AI模型的推理而無需通過剪枝或量化來壓縮模型,可以將這些模型拆分為多個子模型,從而在多個可能是異構(gòu)的邊緣設(shè)備上分布式協(xié)作執(zhí)行。另一種方法是探索自適應(yīng)計算技術(shù),其中推理成本取決于數(shù)據(jù)的復(fù)雜性。此外,分層推理也被提出,通過利用大規(guī)模與小規(guī)模神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)之間的協(xié)作,以在基于邊緣的推理場景中平衡準確性、能效和延遲。
為邊緣服務(wù)的AI(AI for edge)在將人工智能與邊緣計算架構(gòu)相結(jié)合方面取得了顯著進展,提升了邊緣設(shè)備執(zhí)行復(fù)雜數(shù)據(jù)處理和決策任務(wù)的能力,同時為計算連續(xù)體中資源的智能編排鋪平了道路,如圖1所示。
事實上,除了技術(shù)進步之外,當前邊緣智能的發(fā)展趨勢還受到對能源效率和可持續(xù)性的日益關(guān)注的影響。研究人員和從業(yè)者正在積極探索減少邊緣AI系統(tǒng)能源消耗的方法,這對于邊緣AI的廣泛部署尤為關(guān)鍵,特別是在電力供應(yīng)受限的環(huán)境中。必要的進展包括開發(fā)能源感知算法以及硬件優(yōu)化等,以減少系統(tǒng)的能耗負擔,推動邊緣AI的可持續(xù)發(fā)展。
除了對邊緣上的AI(AI on edge)和為邊緣服務(wù)的AI(AI for edge)的特性描述外,我們還觀察到了不同的提供模式差異。許多邊緣計算的應(yīng)用是多層架構(gòu)的延伸,這些架構(gòu)將處理任務(wù)沿著從傳感器到執(zhí)行器、應(yīng)用領(lǐng)域的協(xié)調(diào)(例如生產(chǎn)車間)以及云服務(wù)的連續(xù)體進行轉(zhuǎn)移。邊緣計算通過在這一連續(xù)體上合理布局處理任務(wù),提供了應(yīng)對通信負載和延遲需求的機會。因此,我們將邊緣AI視為工業(yè)應(yīng)用中的一種重要現(xiàn)象。
誰應(yīng)該關(guān)心?
隨著智能城市和工業(yè)自動化等越來越復(fù)雜和數(shù)據(jù)驅(qū)動的應(yīng)用的出現(xiàn),過去十年中邊緣計算和邊緣人工智能的重要性顯著提高。然而,不同的利益相關(guān)者對這些范式及其相關(guān)技術(shù)有著不同的觀點。在下文中,我們介紹了四個利益相關(guān)者的視角:社會和工業(yè)的需求由開發(fā)者轉(zhuǎn)化為解決方案,而這些解決方案受到政府設(shè)定的政策和法規(guī)的約束。理解這些利益相關(guān)者的個體視角,對于塑造未來的研究方向并促進邊緣AI的穩(wěn)健發(fā)展至關(guān)重要。
圖2 提供了社會、政府、工業(yè)和開發(fā)者對邊緣AI不同挑戰(zhàn)的關(guān)注點概覽。該圖表被視作為一種整體趨勢的解讀。
圖2. 社會、政府、工業(yè)和開發(fā)者視角的需求。符號的深淺程度表示每個需求對相應(yīng)利益相關(guān)方視角的重要性(顏色越深表示需求越高)。
社會視角(人們的日常生活)
從社會角度來看,人們對邊緣 AI 的興趣主要集中在其實際應(yīng)用上,而非底層技術(shù)創(chuàng)新。邊緣人工智能在自動駕駛車輛和智能家居等領(lǐng)域的應(yīng)用更容易引起關(guān)注。盡管普通用戶,特別是沒有技術(shù)背景的用戶,可能無法察覺基于云和基于邊緣執(zhí)行之間的延遲差異,但應(yīng)用的可訪問性及其對日常生活的影響將更加顯著,因為這將實現(xiàn)更豐富的交互和更復(fù)雜的應(yīng)用。尤其在歐洲,隱私是一個非常重要的方面,這與邊緣計算和邊緣AI密切相關(guān)。
工業(yè)視角
從工業(yè)的角度來看,可以將邊緣 AI 的相關(guān)方分為兩類:邊緣AI的消費者和邊緣AI的提供者。
邊緣AI的消費者
對于邊緣AI的消費者而言,可靠性和保障性是決定未來是否使用邊緣智能的關(guān)鍵因素。由于云和邊緣服務(wù)提供商眾多,信任多個系統(tǒng)和服務(wù)的可靠運行變得困難。此外,系統(tǒng)故障的責任歸屬問題變得更加復(fù)雜,難以明確將故障歸因于具體的組件或服務(wù)提供商,從而限制了追責的可能性。
盡管可以通過使用諸如AWS Wavelength這樣的云邊結(jié)合提供商來緩解這一挑戰(zhàn),但使用單一提供商可能會顯著影響邊緣計算的一些優(yōu)勢,尤其是在系統(tǒng)穩(wěn)健性和數(shù)據(jù)保護方面。與社會視角類似,數(shù)據(jù)保護對于工業(yè)視角也至關(guān)重要。這包括保護邊緣處理過程中的數(shù)據(jù)、確保邊緣網(wǎng)絡(luò)提供商的可信性,以及保護知識產(chǎn)權(quán)(即開發(fā)的邊緣應(yīng)用和訓(xùn)練的AI模型)。
邊緣AI的提供者
對于邊緣AI的提供者來說,商業(yè)案例的可行性是決定邊緣AI成功的關(guān)鍵因素。過去,電信行業(yè)已經(jīng)從語音服務(wù)提供商轉(zhuǎn)型為數(shù)據(jù)服務(wù)提供商,如今,他們可能再次轉(zhuǎn)型成為計算服務(wù)提供商。特別是在移動網(wǎng)絡(luò)領(lǐng)域,電信運營商是支持將計算能力靠近用戶并為其提供低延遲AI服務(wù)的自然候選者。然而,如果需要非通用模型,這將導(dǎo)致用戶模型向邊緣的遷移和部署。至今,這是否是一個可行的商業(yè)案例仍不明確。
潛在應(yīng)用的數(shù)量(例如輔助駕駛、老年人支持、實時翻譯服務(wù)等)非??捎^,但需要一個合理的商業(yè)模式來證明對電信基礎(chǔ)設(shè)施進行此類擴展的必要性。此外,眾多云和邊緣提供商及其相互連接性使得確保消費者期望的系統(tǒng)可靠性變得困難。同樣,滿足消費者對數(shù)據(jù)保護和可信性的需求也是一個挑戰(zhàn)。
邊緣AI解決方案的提供者還可以利用邊緣AI來改進其服務(wù),但這可能再次面臨解決方案可靠性的問題。其中一個重要方面是考慮消費者應(yīng)用在邊緣上的運行,確保用于改進操作的功能不會干擾這些應(yīng)用的正常運行。
政府視角
政府對邊緣AI的看法是多方面的,涵蓋了諸如執(zhí)行道德和負責任的使用、保護公民隱私(呼應(yīng)社會關(guān)切)、保護公司知識產(chǎn)權(quán)、建立必要的基礎(chǔ)設(shè)施、通過共同標準促進互操作性以及通過合法攔截監(jiān)控數(shù)據(jù)交換等方面。不同政府的優(yōu)先事項排序各不相同。值得注意的是,歐洲國家已經(jīng)是隱私法規(guī)(如通用數(shù)據(jù)保護條例GDPR)和安全法規(guī)(如《歐盟網(wǎng)絡(luò)韌性法案》)方面走在前列,這些國家可能會更加重視邊緣AI的倫理使用以及隱私和安全的保護。最后,政府部門可以通過資金支持和政策法規(guī)推動邊緣智能的發(fā)展,從而在各自的國家內(nèi)實現(xiàn)新的服務(wù)和應(yīng)用。
開發(fā)者視角
從開發(fā)者的角度來看,編程的便捷性對于采用邊緣人工智能(Edge AI)至關(guān)重要,尤其是在創(chuàng)建分布式應(yīng)用時。理想情況下,開發(fā)者在解決邊緣AI的常見問題(如用戶和數(shù)據(jù)的移動性、分布式協(xié)調(diào)以及同步)時應(yīng)付出最小的努力。因此,為了讓開發(fā)者更容易使用邊緣AI,有必要提供一個編程框架,以簡化邊緣AI應(yīng)用的開發(fā)和配置。這包括管理計算和存儲資源、自動化部署模型的水印處理、處理傳感器數(shù)據(jù)的分發(fā),以及為量子計算和神經(jīng)形態(tài)計算等新范式提供編程抽象。
總結(jié)與研究視角
研究視角結(jié)合了上述所有視角,形成了一個整體性觀點,旨在通過未來研究解決當今邊緣人工智能(Edge AI)面臨的部分問題。諸如Rausch等人和Nastic等人的多項研究已提出了針對邊緣AI的編程模型,使得訓(xùn)練和推理可以以去中心化的方式進行,其中一個例子是聯(lián)邦學(xué)習(xí)范式。
雖然數(shù)據(jù)的本地化和相應(yīng)的去中心化可以被視為對數(shù)據(jù)隱私的積極影響,但對邊緣設(shè)備的信任有時可能會受到限制。因此,圍繞數(shù)據(jù)隱私保護的額外挑戰(zhàn)仍需解決,目前已經(jīng)有多種想法在被研究中。這些研究包括同態(tài)加密的應(yīng)用、在硬件安全執(zhí)行環(huán)境中對任務(wù)相關(guān)數(shù)據(jù)進行設(shè)備端過濾,以及確保對邊緣AI解決方案信任的相關(guān)研究。在這些主題上的研究成果可以為政府在邊緣處理系統(tǒng)的監(jiān)管提供寶貴的參考意見。
當前研究的挑戰(zhàn)與機遇
邊緣人工智能(Edge AI)為在本地設(shè)備中嵌入智能提供了一種變革性的方法。然而,它也面臨著資源限制、安全與隱私、可持續(xù)性以及能源危機等方面的挑戰(zhàn)。同時,邊緣AI在實時數(shù)據(jù)處理、效率提升以及個性化體驗等方面帶來了顯著的機遇。
構(gòu)成人工智能的算法正逐步應(yīng)用于越來越多優(yōu)秀的用戶服務(wù)中。多項已發(fā)表的研究分析了這種應(yīng)用的實現(xiàn)方式及其技術(shù)潛力。這引發(fā)了一系列關(guān)于理解邊緣AI挑戰(zhàn)和機遇的問題,以下將重點探討當前最突出的幾個方面。
資源限制
邊緣設(shè)備的特點在于其計算和存儲資源有限。相比云端應(yīng)用可以利用包括CPU、GPU,甚至現(xiàn)場可編程門陣列(FPGA)在內(nèi)的多種計算設(shè)備,邊緣設(shè)備通常僅配備少量硬件加速器,并且這些加速器往往針對特定的應(yīng)用或使用場景設(shè)計。此外,邊緣設(shè)備的計算能力、內(nèi)存和存儲都受到嚴格限制,這進一步制約了在邊緣設(shè)備上進行模型訓(xùn)練和推理的可能性。
這一問題在邊緣AI解決方案的應(yīng)用中尤為顯著,因為機器學(xué)習(xí)模型通常依賴專用硬件,并需要大量內(nèi)存和存儲支持。此外,數(shù)據(jù)交換通常是關(guān)鍵環(huán)節(jié),但也受限于可用的網(wǎng)絡(luò)帶寬。因此,需要開發(fā)機制來限制交換信息的數(shù)量,不僅是與中央基礎(chǔ)設(shè)施之間的交換,還包括邊緣設(shè)備之間的數(shù)據(jù)交換,例如通過信息驅(qū)動的優(yōu)先級排序來優(yōu)化交換效率。
由于邊緣設(shè)備的推理位置并非總是預(yù)先確定的,從強大的集中式設(shè)備到資源受限的邊緣設(shè)備都有可能,因此需要多個機器學(xué)習(xí)模型來適應(yīng)不同場景的需求。每種部署環(huán)境都有其獨特的限制和要求,無論是邊緣設(shè)備上的實時處理,還是在強大計算平臺上的全面分析。為此,開發(fā)者通常需要根據(jù)不同的部署場景調(diào)整和優(yōu)化模型,以確保整個應(yīng)用場景中的效率和有效性。需要自動化機制來支持這種適配,使得邊緣AI解決方案能夠無縫集成到各種場景中,滿足每個部署環(huán)境的特定需求和限制,同時盡可能保持最佳性能。
隱私與信任
確??煽啃?、安全性、隱私性以及倫理完整性是建立邊緣AI應(yīng)用和連接系統(tǒng)可信度的關(guān)鍵。這一點尤為重要,因為邊緣設(shè)備處理敏感數(shù)據(jù),若發(fā)生數(shù)據(jù)泄露,后果可能十分嚴重。
建立信任的關(guān)鍵在于安全的處理與存儲機制,結(jié)合強大的加密技術(shù)和嚴格的訪問控制。盡管邊緣設(shè)備資源有限,但AI模型必須保持可靠性和準確性,同時具備抵御對抗性攻擊的能力。有時,使用硬件支持的可信執(zhí)行環(huán)境被認為是一種解決方案,但這種方法在性能和集成方面也面臨一系列挑戰(zhàn)。此外,AI決策的透明性和可解釋性在關(guān)鍵應(yīng)用中變得日益重要。遵守如GDPR(通用數(shù)據(jù)保護條例)之類的法規(guī),確保數(shù)據(jù)隱私和安全,也是邊緣AI需要解決的關(guān)鍵問題。
可持續(xù)性與能源效率
日益增長的AI應(yīng)用需求凸顯了創(chuàng)建高能效和可持續(xù)的邊緣AI算法的重要性。高級AI,特別是深度學(xué)習(xí),消耗了大量能源,這對可持續(xù)發(fā)展提出了挑戰(zhàn)。在邊緣AI中,平衡性能與能源效率至關(guān)重要。盡管實現(xiàn)更高的準確性可能看起來是最終目標,但必須認識到,每一次對準確性的微小提升通常都需要顯著增加能源消耗。這種權(quán)衡在某些超高準確性并非關(guān)鍵的場景中尤為明顯。在這些情況下,為了獲取微不足道的準確性提升而分配過多的能源資源可能既低效又對環(huán)境不可持續(xù)。因此,開發(fā)者和研究人員必須謹慎評估提升準確性所需的必要性及其帶來的能源消耗。
另一個重要方面是可再生能源對能源網(wǎng)的重要性不斷提升。由于大多數(shù)可再生能源依賴于環(huán)境條件(例如太陽能電池需要陽光),因此在某些時候,例如在一個陽光充足且風力強勁的炎熱夏日,電力會變得充裕。在這種情況下,盡管節(jié)約能源仍是邊緣AI面臨的一個重要挑戰(zhàn),但另一個關(guān)鍵挑戰(zhàn)是利用能量過剩時段執(zhí)行一些非時間關(guān)鍵的計算(如模型訓(xùn)練)。在能源過剩時進行這些計算有助于平衡能量生產(chǎn)高峰,并彌補大多數(shù)可再生能源波動性帶來的問題。此外,地理分布式的能源需求可以緩解某些地區(qū)(如美國北弗吉尼亞和荷蘭阿姆斯特丹)大型數(shù)據(jù)中心集中的供給問題。由于當前的能源儲存能力有限且效率低下,這種方式可以大大提高電網(wǎng)和邊緣設(shè)備的效率。
在關(guān)注運行期間的能源消耗的同時,部署邊緣設(shè)備的生產(chǎn)和生命周期也同樣是一個重要挑戰(zhàn)。設(shè)計更耐用、可升級和可回收的設(shè)備對改善邊緣AI解決方案的環(huán)境足跡至關(guān)重要。此外,實施鼓勵節(jié)能AI的政策以及對設(shè)備制造和處置的環(huán)境影響進行監(jiān)管也是不可或缺的。
可編程性與互操作性
邊緣AI涉及多種設(shè)備,如智能手機、物聯(lián)網(wǎng)設(shè)備和工業(yè)機械,每種設(shè)備都有獨特的限制。由于需要在各種硬件上高效協(xié)調(diào)服務(wù),為邊緣AI創(chuàng)建可編程框架是一項挑戰(zhàn)。開發(fā)人員需要面對設(shè)備能力的復(fù)雜性,如CPU性能、GPU可用性、內(nèi)存和能耗等方面的差異。這種復(fù)雜性使得在大規(guī)模場景(如智慧城市)中部署服務(wù)成為一項重大且持續(xù)的挑戰(zhàn)。缺乏標準化工具進一步增加了開發(fā)難度,開發(fā)者往往需要使用不兼容的工具和平臺,從而導(dǎo)致開發(fā)時間延長和集成問題。
邊緣AI的可編程性挑戰(zhàn)因互操作性的需求而進一步加劇,即需要在多種設(shè)備和系統(tǒng)(如傳感器、智能手機和工業(yè)機械)上組合操作。這些設(shè)備盡管在操作系統(tǒng)、軟件和硬件上存在差異,也需要無縫協(xié)作。一個關(guān)鍵問題是缺乏標準化的協(xié)議和數(shù)據(jù)格式,因此開發(fā)通用標準以實現(xiàn)高效通信變得至關(guān)重要。將邊緣AI與現(xiàn)有系統(tǒng)集成時,往往會遇到不受支持的軟件和硬件組件帶來的問題。隨著互聯(lián)設(shè)備數(shù)量的增長,設(shè)備的可擴展性以及新設(shè)備的輕松集成變得既重要又困難。在實時處理場景(如環(huán)境監(jiān)測、自動駕駛和工業(yè)4.0)中,減少互操作性造成的延遲至關(guān)重要。然而,在這種互聯(lián)環(huán)境中高效管理資源,同時考慮整個系統(tǒng)中的可用資源,也是需要解決的關(guān)鍵挑戰(zhàn)。
總之,統(tǒng)一的可編程框架對于高效部署邊緣AI算法至關(guān)重要,能夠確保服務(wù)協(xié)調(diào)、資源管理以及設(shè)備間的互操作性在整個系統(tǒng)中的有效運行。
可靠性與彈性
可靠性關(guān)注運行在邊緣計算設(shè)備上的AI系統(tǒng)在進行AI決策時的可靠性、安全性和穩(wěn)健性。這包括確保這些系統(tǒng)即使在充滿挑戰(zhàn)或不可預(yù)測的環(huán)境中,也能始終如一地表現(xiàn)出色且準確。這些系統(tǒng)在醫(yī)療保健和工業(yè)自動化等關(guān)鍵的網(wǎng)絡(luò)領(lǐng)域中尤為重要,必須具備強大的設(shè)計和有效的故障切換策略以確保始終正常運行。開發(fā)的系統(tǒng)必須能夠保護數(shù)據(jù)和AI模型的完整性,抵御各種威脅,具備處理更多數(shù)據(jù)的能力,并能夠容納更多設(shè)備或覆蓋更廣的地理區(qū)域。這些系統(tǒng)需要具備自主檢測和解決故障的能力,并能適應(yīng)不斷變化的條件和新興的威脅,從而實現(xiàn)可靠的運行。
除了可靠性,邊緣AI的彈性對其始終可操作性也至關(guān)重要。彈性指的是在各種條件下,系統(tǒng)對安全攻擊和中斷保持可靠運行的能力。邊緣設(shè)備需要對諸如極端溫度和機械沖擊等物理挑戰(zhàn)保持穩(wěn)健,同時維護數(shù)據(jù)的完整性和安全性。即使在網(wǎng)絡(luò)條件較差的情況下,邊緣系統(tǒng)也應(yīng)能夠通過替代通信技術(shù)或穩(wěn)健的協(xié)議提供可靠的連接,或者在離線狀態(tài)下繼續(xù)運行,直到連接恢復(fù)。此外,這些系統(tǒng)需要具備容錯能力,并可能需要備份解決方案。AI模型應(yīng)能夠適應(yīng)不斷變化的數(shù)據(jù)模式,而無需進行大規(guī)模的重新訓(xùn)練。隨著邊緣AI網(wǎng)絡(luò)的擴展,可擴展性和可管理性變得尤為重要,同時還需高效的資源管理以應(yīng)對整個系統(tǒng)中變化的工作負載。
可測量性
由于云-邊緣連續(xù)體的獨特特性(如分布式的訓(xùn)練和推理、共享資源)和不同邊緣AI應(yīng)用及連接系統(tǒng)的約束條件(如資源限制、實時性需求),定義通用的性能評估指標是一項挑戰(zhàn)。特別是對于前文提到的那些當前難以測量和量化的挑戰(zhàn)而言,定義準確的衡量指標對于相關(guān)領(lǐng)域的研究至關(guān)重要。
此外,邊緣AI的一個重要挑戰(zhàn)是如何在準確性、延遲、資源使用和隱私之間平衡這些權(quán)衡。這種平衡在整個連續(xù)體中尤為復(fù)雜。盡管仿真或模擬可以預(yù)測某些場景下方法的性能,但驗證這些方法在真實環(huán)境中的有效性同樣重要。在真實場景中開發(fā)基準評估框架并結(jié)合實際使用案例,仍然是一項未解決的挑戰(zhàn)。這些基準必須依賴于通用的指標,以精確衡量和評估邊緣AI的獨特特性。
未來研究方向
在本節(jié)中,我們確定了一些最具前景的研究方向:將大型語言模型(LLMs)集成到邊緣AI應(yīng)用中、自主車輛的低延遲推理、聚焦于社會中的能源和隱私問題、增強邊緣互操作性,以及推動邊緣AI系統(tǒng)的信任與安全的進步。接下來,我們將詳細闡述每個研究方向。
將大型語言模型集成到邊緣AI中
將大型語言模型(LLMs)集成到邊緣設(shè)備上的應(yīng)用中代表了未來研究的一個激動人心的方向。傳統(tǒng)上,LLMs因推理計算需求過高而主要局限于基于云的推理。然而,在邊緣設(shè)備上運行LLMs則引入了一種全新的范式。如今,越來越多的邊緣設(shè)備配備了節(jié)能的加速器。例如,蘋果神經(jīng)引擎(ANE)已被集成到iPhone中,谷歌的邊緣張量處理單元(TPU)也作為嵌入設(shè)備的子模塊提供支持。在這些邊緣加速器上運行LLMs,為這些公司提供了推理“零成本”的優(yōu)勢,因為“成本”(主要指能耗)現(xiàn)在發(fā)生在終端用戶的設(shè)備上。這種方法可能有利于對延遲要求較低的應(yīng)用程序,例如社交媒體平臺,在這些場景下即時響應(yīng)并非關(guān)鍵需求。
然而,挑戰(zhàn)在于如何將這些計算密集型模型調(diào)整到邊緣設(shè)備的限制條件下,包括有限的處理能力和能耗效率。傳統(tǒng)的學(xué)習(xí)技術(shù),例如蒸餾、神經(jīng)架構(gòu)搜索,以及系統(tǒng)技術(shù)如量化和稀疏化,都是潛在的解決方案,但它們的有效性尚未被完全驗證。評估LLMs的難度進一步增加了復(fù)雜性。因此,未來研究不僅應(yīng)該專注于優(yōu)化LLMs以適應(yīng)邊緣環(huán)境,還可以推動定制化硬件的創(chuàng)新,開發(fā)滿足邊緣設(shè)備功耗要求的解決方案。邊緣計算在自主代理中的應(yīng)用
自主代理對我們的社會正變得越來越重要,包括智能工廠中的自主機器人和自動駕駛車輛等。盡管首批自動駕駛汽車和自主機器人已被部署,這些代理目前僅能在持續(xù)的網(wǎng)絡(luò)連接、特定區(qū)域或特定條件下運行。然而,即使在今天,大量的傳感器(包括外部和車載傳感器)已經(jīng)生成了海量數(shù)據(jù),這些數(shù)據(jù)可能會壓垮傳統(tǒng)的互聯(lián)網(wǎng)基礎(chǔ)設(shè)施。如果這些數(shù)據(jù)能夠以低延遲共享,可以改善其他代理的行為,從而實現(xiàn)更高水平的自動化。
邊緣計算可以對數(shù)據(jù)進行本地處理,減少需要通過網(wǎng)絡(luò)傳輸?shù)拇罅繑?shù)據(jù)。這不僅提高了響應(yīng)速度和操作效率,還支持在“網(wǎng)絡(luò)盲點”進行實時決策,這對于代理的可靠運行至關(guān)重要。這不僅僅是一個“可有可無”的功能,而是必不可少的。多傳感器輸入、不同時間和環(huán)境下的感知、各種天氣條件以及社會元素等因素不僅支持以邊緣為中心的解決方案,還為邊緣設(shè)備上的訓(xùn)練和推理方面的研究開辟了新的途徑
聚焦社會中的能源效率與隱私
社會對能源消耗和隱私問題日益關(guān)注,這為邊緣AI提供了獨特的機遇。在邊緣設(shè)備上進行本地處理可以通過將敏感信息留在設(shè)備內(nèi)來確保數(shù)據(jù)隱私,從而實現(xiàn)隱私保護。此外,在邊緣使用的線性功耗系統(tǒng)(如深度嵌入式部署中),通信成本(如Wi-Fi、藍牙等)往往高于計算成本。因此,迫切需要開展研究以開發(fā)能夠平衡通信開銷與計算效率的節(jié)能邊緣AI解決方案。這需要探索能量感知算法、可持續(xù)硬件設(shè)計,以及優(yōu)化網(wǎng)絡(luò)協(xié)議以實現(xiàn)能源節(jié)約。
低功耗廣域網(wǎng)絡(luò)(LPWAN)是一種有前景的方向,其通過降低吞吐量來換取功耗的減少。盡管這是一種在廣泛的帕累托曲線中的設(shè)計選擇,但如何開發(fā)既能降低生產(chǎn)成本的通用性解決方案,同時又能針對特定應(yīng)用需求進行定制化,仍然是一個尚未解決的研究問題。
增強邊緣AI的互操作性
隨著邊緣AI系統(tǒng)的普及,確保其可擴展性和互操作性成為一個新的且尚未充分探索的領(lǐng)域。一個懸而未決的問題是,不同的AI支持的邊緣設(shè)備應(yīng)如何進行互相通信。除了長期存在的去中心化與中心化、星型結(jié)構(gòu)與環(huán)形結(jié)構(gòu)的爭論之外,一個令人振奮的研究方向是開發(fā)標準化協(xié)議和框架,以實現(xiàn)多樣化邊緣設(shè)備和系統(tǒng)的無縫集成。這包括創(chuàng)建通用數(shù)據(jù)格式和通信標準,以促進不同類型邊緣設(shè)備(如傳感器、可穿戴設(shè)備、智能手機、工業(yè)設(shè)備、自動駕駛車輛等)之間的高效交互,更重要的是實現(xiàn)設(shè)備間的自動發(fā)現(xiàn)。
邊緣AI的演進還帶來了與新興的非馮·諾依曼架構(gòu)(如量子計算和類腦計算)實現(xiàn)互操作性的需求。開發(fā)能夠與傳統(tǒng)計算系統(tǒng)有效通信和協(xié)作的協(xié)議和標準至關(guān)重要。這不僅涉及數(shù)據(jù)格式和通信協(xié)議的轉(zhuǎn)換,還需要理解和協(xié)調(diào)不同非馮·諾依曼架構(gòu)在處理和解釋數(shù)據(jù)方式上的根本差異。例如,類腦計算系統(tǒng)通過模擬人腦神經(jīng)結(jié)構(gòu)實現(xiàn)極端并行性和能效,但其基于事件驅(qū)動且處理模擬數(shù)據(jù)(脈沖)。彌合這一差距對于創(chuàng)建真正互聯(lián)的邊緣AI生態(tài)系統(tǒng)至關(guān)重要,在該生態(tài)系統(tǒng)中,設(shè)備能夠利用當前和未來計算范式的獨特優(yōu)勢。推進邊緣AI系統(tǒng)的信任與安全確保邊緣AI系統(tǒng)的可信性和安全性至關(guān)重要,尤其是在它們逐漸成為關(guān)鍵基礎(chǔ)設(shè)施和個人設(shè)備的重要組成部分時。未來的研究應(yīng)重點開發(fā)強大的安全協(xié)議和加密方法,以保護邊緣設(shè)備上處理的敏感數(shù)據(jù)。這包括增強邊緣AI系統(tǒng)抵御網(wǎng)絡(luò)威脅的彈性,并確保AI決策過程透明、可解釋且符合GDPR等法規(guī)標準。然而,這帶來了挑戰(zhàn),因為邊緣設(shè)備有時缺乏可信環(huán)境,而可信環(huán)境對于保護隱私敏感數(shù)據(jù)至關(guān)重要。解決這些問題不僅可以提高邊緣AI系統(tǒng)的安全性和可靠性,還能增強公眾對其部署和使用的信任感。
結(jié)論
在本文中,我們回顧了邊緣AI解決方案的歷史和現(xiàn)狀,從其作為邊緣計算與AI相結(jié)合的起源,到其當前在資源受限的邊緣設(shè)備上實現(xiàn)去中心化推理與訓(xùn)練的發(fā)展狀態(tài)。我們重點探討了當今邊緣AI所面臨的各種挑戰(zhàn)和研究機遇,包括相關(guān)利益相關(guān)者在邊緣AI領(lǐng)域的觀點。最后,我們展望了該領(lǐng)域研究者未來的研究方向。
-
人工智能
+關(guān)注
關(guān)注
1791文章
47183瀏覽量
238247 -
機器學(xué)習(xí)
+關(guān)注
關(guān)注
66文章
8406瀏覽量
132561 -
邊緣計算
+關(guān)注
關(guān)注
22文章
3084瀏覽量
48892
發(fā)布評論請先 登錄
相關(guān)推薦
評論