RM新时代网站-首页

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

端側(cè)AI應(yīng)用趨熱:NPU如何解決其關(guān)鍵痛點

要長高 ? 2024-10-31 15:00 ? 次閱讀

當(dāng)前,AI大模型正逐步從云端遷移至邊緣,甚至深入至日常生活中的手機、個人電腦(PC)、汽車等終端。在這場變革中,端側(cè)智能正逐漸嶄露頭角,預(yù)示著未來的智能設(shè)備將能夠更實時、高效地理解和服務(wù)用戶。在E維智庫舉辦的第12屆中國硬科技產(chǎn)業(yè)鏈創(chuàng)新趨勢峰會暨百家媒體論壇上,安謀科技的產(chǎn)品總監(jiān)鮑敏祺深入剖析了端側(cè)AI應(yīng)用的廣闊前景,并強調(diào)了神經(jīng)處理單元(NPU)在這一領(lǐng)域中的關(guān)鍵作用。

關(guān)于端側(cè)大模型,鮑敏祺指出,AIGC大模型帶來的算力提升為端側(cè)AI帶來了新的發(fā)展機遇。這些大模型已經(jīng)在手機上實現(xiàn)了應(yīng)用,如圖片理解、關(guān)鍵信息提取等,顯著提升了用戶體驗。例如,Apple Intelligence等大模型雖然尚未對國內(nèi)用戶開放,但已經(jīng)引起了廣泛的關(guān)注和測評。這些應(yīng)用不僅提高了使用效率,還逐漸融入了人們的日常生活。

然而,鮑敏祺也提到,端側(cè)AI的算力是否會像云端一樣持續(xù)膨脹仍是一個未知數(shù)。由于存儲帶寬的限制以及用戶體驗對實時性的高要求,大模型必須在用戶能接受的時間內(nèi)(通常是2秒以內(nèi))給出反饋。因此,在當(dāng)前帶寬條件下,部署大模型需要權(quán)衡帶寬制約與用戶體驗。

目前,眾多國內(nèi)外廠商已從商業(yè)化角度推出了大模型,并達成共識,認(rèn)為AI NPU是未來消費類產(chǎn)品的重點投入方向。頭部終端廠商如OPPO、VIVO、小米、榮耀、華為等也都有相應(yīng)的解決方案。這些方案并非僅依賴端側(cè)大模型,而是與云端相輔相成,共同提升用戶體驗。端側(cè)的優(yōu)勢在于時效性和數(shù)據(jù)本地安全性,而云端則具備更強的理解和計算能力。

在評估端側(cè)大模型時,語言類模型或文生圖常被用作參考。但鮑敏祺認(rèn)為,語言類模型并非端側(cè)應(yīng)用的終點。隨著技術(shù)的發(fā)展,圖片、音頻視頻等多模態(tài)輸入將成為常態(tài)。這些輸入需要經(jīng)過壓縮和Tokenizer處理,轉(zhuǎn)換成模型能理解的Token。而大型語言模型(LLM)的基本原理并未改變,只是輸入和輸出過程增加了編碼和解碼步驟。

另一個挑戰(zhàn)在于,上下文長度的增長對模型性能提出了更高要求。衡量語言模型的指標(biāo)包括每秒處理的Token數(shù)和首次響應(yīng)時間(TTFT)。隨著上下文長度的增加,首次延遲也會線性增長。因此,在端側(cè)容量和帶寬有限的情況下,需要優(yōu)化算法以提升算力效率。

一個明顯的趨勢是,AI的應(yīng)用將越來越廣泛,涉及多模態(tài)場景。隨著AI的發(fā)展,人們可能會更多地與智能體進行交互。這些智能體不僅能理解和執(zhí)行任務(wù),還能通過強化學(xué)習(xí)不斷優(yōu)化自己的行為。

在多模態(tài)場景下,AI的應(yīng)用將不再局限于傳統(tǒng)設(shè)備。從手持設(shè)備到邊緣計算、PC、汽車,再到云端,AI將無處不在。然而,不同場景對AI算力的需求各不相同。手持設(shè)備由于功耗和芯片面積的限制,通常只能支持較小規(guī)模的模型。而在邊緣計算、PC、汽車等端,模型體量可能更大。在云端,由于有充足的資源和帶寬,模型體量可以更大,從而接受各種知識并進行持續(xù)迭代。

AI的賦能不僅限于傳統(tǒng)設(shè)備,它還能為以前看似市場前景有限的終端設(shè)備帶來新的生命力。例如,通過賦予可穿戴設(shè)備簡單的語音控制和視覺拍照功能,這些設(shè)備可能會變得非常受歡迎。這種多模態(tài)的輸入和直接使用的功能使得這些設(shè)備在競爭激烈的市場中脫穎而出。

然而,端側(cè)AI也面臨著諸多挑戰(zhàn)。首先是成本、功耗和生態(tài)系統(tǒng)的問題。存儲介質(zhì)的帶寬和成本是制約端側(cè)AI發(fā)展的關(guān)鍵因素之一。盡管存儲技術(shù)不斷進步,但端側(cè)設(shè)備仍然無法像云端那樣擁有TB級別的帶寬。此外,端側(cè)設(shè)備的芯片面積和計算資源也非常有限。

第二個挑戰(zhàn)是功耗問題。在AI應(yīng)用中,數(shù)據(jù)的搬運是功耗的主要來源之一。對于大模型來說,由于顯存占用大,無法像卷積神經(jīng)網(wǎng)絡(luò)(CNN)那樣通過高復(fù)用度來提高能效。因此,如何降低數(shù)據(jù)搬運的功耗成為了一個亟待解決的問題。

此外,軟件和工具的優(yōu)化也是一大挑戰(zhàn)。AI模型需要不斷迭代優(yōu)化才能滿足用戶需求。然而,當(dāng)前的軟件和工具在支持大模型優(yōu)化方面還存在不足。

針對這些挑戰(zhàn),安謀科技推出的“周易”NPU采取了一系列應(yīng)對策略。首先,它在保留CNN能力的同時,增強了對Transformer大模型的支持。通過優(yōu)化微架構(gòu)和計算能力,提升了Transformer的運算效率。其次,“周易”NPU注重數(shù)據(jù)本地化,通過混合精度量化和無損壓縮來減少數(shù)據(jù)搬運和提升有效帶寬。此外,它還針對大模型進行了總線帶寬的擴展以滿足解碼等場景對帶寬的高需求。

為了進一步提升能效,“周易”NPU還采用了數(shù)據(jù)并行、模型并行、負載均衡和Tiling等技術(shù)。同時,它也支持異構(gòu)策略,可以獨立執(zhí)行AI任務(wù),并根據(jù)需求自由裁剪。在端側(cè)應(yīng)用中,“周易”NPU還采用了電源門控和低功耗策略以降低不必要的功耗。

通過這些創(chuàng)新技術(shù),“周易”NPU有效應(yīng)對了端側(cè)AI面臨的挑戰(zhàn),為多模態(tài)場景下的AI應(yīng)用提供了強有力的支持。針對不同應(yīng)用場景,如智能汽車、手機PC、AIOT等,安謀科技也制定了差異化的策略。

在智能汽車領(lǐng)域,安謀科技關(guān)注智艙一體等趨勢,提供了全面的IP解決方案。這包括用于渲染顯示的GPU、用于處理攝像頭數(shù)據(jù)的前級處理器以及用于安全相關(guān)功能的安全處理器(SPU)。特別值得一提的是,“周易”NPU具備20到320TOPS的可擴展性,以滿足不同場景下的算力需求。例如,在汽車信息娛樂系統(tǒng)(IVI)場景中,算力要求相對較低;而在高級駕駛輔助系統(tǒng)(ADAS)場景中,由于需要執(zhí)行多任務(wù)特別是CNN場景下的任務(wù),算力需求則顯著提升?!爸芤住盢PU的靈活性使其能夠適應(yīng)各種汽車場景并實現(xiàn)完整端到端的解決方案。

對于AI加速卡場景,安謀科技關(guān)注輸入與輸出的高效處理特別是圖像和視頻數(shù)據(jù)的輸入與AI計算的輸出。加速卡具備HOST AP交互能力并強調(diào)安全性如JPEG解碼能力和根據(jù)實際需求定制的NPU。根據(jù)應(yīng)用場景的不同如NVMe存儲形式、車載或手機等TDP功耗和算力需求也會有所差異。能效比是一個重要考慮因素例如在5瓦TDP功耗下有效算力可達25TOPS左右。整個解決方案多樣不僅針對語言模型還著眼于未來多模態(tài)模型的需求。

在AIOT場景中算力需求相對較低但受到AIOT設(shè)備面積和功耗的限制。然而對安全性的要求卻更高包括固件和安全性的強化。與服務(wù)器或板卡等密封形式不同AIOT場景對安全性的需求進一步提升。安謀科技的“周易”NPU能夠在此類場景中提供20TOPS到320TOPS的算力裁減主要用于聲音和圖象的檢測??紤]到端側(cè)可能放置較低精度的模型以保證量化效果整個解決方案在保障安全的同時也通過一定算力的內(nèi)容對語音類場景進行AI加速。

隨著技術(shù)的不斷進步和創(chuàng)新,未來的智能設(shè)備將更加智能、高效和便捷。NPU也將在這一過程中發(fā)揮更加重要的作用。據(jù)悉安謀科技的下一代“周易”NPU在生態(tài)上已廣泛部署了Wenxin、Llama、GPT等模型,并在端側(cè)覆蓋了平板電腦(PAD)、PC、手機(Mobile)等各類場景。對于智能汽車領(lǐng)域無論是IVI還是ADAS場景都能根據(jù)實際算力需求和模型提供針對性的解決方案最高可達320TOPS的算力。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    30728

    瀏覽量

    268874
  • NPU
    NPU
    +關(guān)注

    關(guān)注

    2

    文章

    279

    瀏覽量

    18582
  • AIGC
    +關(guān)注

    關(guān)注

    1

    文章

    361

    瀏覽量

    1539
收藏 人收藏

    評論

    相關(guān)推薦

    中信建投建議關(guān)注側(cè)AI模組機會

    中信建投近日發(fā)布的研報指出,隨著OpenAI的ChatGPT功能全面接入蘋果設(shè)備,包括iPhone、iPad和Mac,側(cè)AI產(chǎn)業(yè)的發(fā)展正在加速。這一趨勢為AI模組市場帶來了新的機遇。
    的頭像 發(fā)表于 12-17 14:05 ?217次閱讀

    廣和通開啟側(cè)AI新時代

    AI發(fā)展正酣,隨著終端芯片算力越來越高、側(cè)模型能力越來越強、實時響應(yīng)及隱私保護的側(cè)應(yīng)用需求增加,
    的頭像 發(fā)表于 12-12 10:35 ?162次閱讀

    MediaTek天璣移動平臺賦能騰訊會議側(cè)AI人像分割模型

    MediaTek 與騰訊會議聯(lián)合優(yōu)化的側(cè) NPU 虛擬背景功能,已在搭載 MediaTek 天璣旗艦芯的終端正式上線。作為雙方初次開展的軟硬件生態(tài)合作,此次聯(lián)合優(yōu)化旨在充分利用天璣移動平臺的
    的頭像 發(fā)表于 11-29 15:30 ?179次閱讀

    把握關(guān)鍵節(jié)點,美格智能持續(xù)推動側(cè)AI規(guī)模化拓展

    當(dāng)前,AI大模型走向側(cè)已經(jīng)是大勢所,側(cè)AI的發(fā)
    的頭像 發(fā)表于 11-26 01:00 ?131次閱讀
    把握<b class='flag-5'>關(guān)鍵</b>節(jié)點,美格智能持續(xù)推動<b class='flag-5'>端</b><b class='flag-5'>側(cè)</b><b class='flag-5'>AI</b>規(guī)模化拓展

    把握關(guān)鍵節(jié)點,美格智能持續(xù)推動側(cè)AI規(guī)?;卣?/a>

    當(dāng)前,AI大模型走向側(cè)已經(jīng)是大勢所,側(cè)AI的發(fā)
    的頭像 發(fā)表于 11-25 16:45 ?232次閱讀
    把握<b class='flag-5'>關(guān)鍵</b>節(jié)點,美格智能持續(xù)推動<b class='flag-5'>端</b><b class='flag-5'>側(cè)</b><b class='flag-5'>AI</b>規(guī)模化拓展

    側(cè)AI,風(fēng)起移動智能計算

    新一代驍龍旗艦芯片,側(cè)AI的繁榮肇始
    的頭像 發(fā)表于 11-22 09:55 ?2241次閱讀
    <b class='flag-5'>端</b><b class='flag-5'>側(cè)</b><b class='flag-5'>AI</b>,風(fēng)起移動智能計算

    智能無處不在:安謀科技“周易”NPU開啟側(cè)AI新時代

    的需求,將AI的觸角延伸至世界的每一個角落。 近日,在EEVIA主辦的第12屆中國硬科技產(chǎn)業(yè)鏈創(chuàng)新趨勢峰會暨百家媒體論壇上,安謀科技產(chǎn)品總監(jiān)鮑敏祺發(fā)表了精彩的主題演講《側(cè)AI應(yīng)用芯機
    發(fā)表于 11-15 11:42 ?150次閱讀
    智能無處不在:安謀科技“周易”<b class='flag-5'>NPU</b>開啟<b class='flag-5'>端</b><b class='flag-5'>側(cè)</b><b class='flag-5'>AI</b>新時代

    NPU技術(shù)如何提升AI性能

    設(shè)計的處理器,與傳統(tǒng)的CPU和GPU相比,它在執(zhí)行深度學(xué)習(xí)任務(wù)時具有更高的效率和更低的能耗。NPU通過專門優(yōu)化的硬件結(jié)構(gòu)和指令集,能夠更快地處理神經(jīng)網(wǎng)絡(luò)中的大量并行計算任務(wù)。 1. 優(yōu)化硬件架構(gòu) NPU技術(shù)通過優(yōu)化硬件架構(gòu)來提升AI
    的頭像 發(fā)表于 11-15 09:11 ?411次閱讀

    側(cè)AI浪潮已來!炬芯科技發(fā)布新一代側(cè)AI音頻芯片,能效比和AI算力大幅度提升

    電子發(fā)燒友原創(chuàng) 章鷹 ? 11月5日,在深圳會展中心7號館內(nèi),炬芯科技董事長兼CEO周正宇博士帶來了《側(cè)AI芯片的未來》演講,他對側(cè)
    的頭像 發(fā)表于 11-06 09:11 ?2465次閱讀
    <b class='flag-5'>端</b><b class='flag-5'>側(cè)</b><b class='flag-5'>AI</b>浪潮已來!炬芯科技發(fā)布新一代<b class='flag-5'>端</b><b class='flag-5'>側(cè)</b><b class='flag-5'>AI</b>音頻芯片,能效比和<b class='flag-5'>AI</b>算力大幅度提升

    飛凌微CEO邵科:車載視覺處理新品助力智駕視覺系統(tǒng)升級,側(cè)AI應(yīng)用加速落地

    2024年,算力仍然是大模型持續(xù)迭代的根本動力,AI走向側(cè)是大勢所。咨詢機構(gòu)IDC在今年7月發(fā)布最新預(yù)測,2024年全球AI智能手機出貨
    的頭像 發(fā)表于 10-31 01:17 ?5114次閱讀
    飛凌微CEO邵科:車載視覺處理新品助力智駕視覺系統(tǒng)升級,<b class='flag-5'>端</b><b class='flag-5'>側(cè)</b><b class='flag-5'>AI</b>應(yīng)用加速落地

    廣和通側(cè)AI解決方案驅(qū)動性能密集型場景商用型場景商用

    2024世界機器人大會期間,廣和通宣布:基于高通QCS8550平臺的廣和通側(cè)AI解決方案高效使能性能密集型場景。該側(cè)
    的頭像 發(fā)表于 08-23 16:06 ?296次閱讀

    廣和通側(cè)AI解決方案驅(qū)動性能密集型場景商用型場景商用

    2024世界機器人大會期間,廣和通宣布:基于高通QCS8550平臺的廣和通側(cè)AI解決方案高效使能性能密集型場景。該側(cè)
    的頭像 發(fā)表于 08-23 16:05 ?656次閱讀
    廣和通<b class='flag-5'>端</b><b class='flag-5'>側(cè)</b><b class='flag-5'>AI</b>解決方案驅(qū)動性能密集型場景商用型場景商用

    電梯物聯(lián)網(wǎng)技術(shù)如何解決電梯管理的?

    隨著物聯(lián)網(wǎng)技術(shù)的不斷發(fā)展,電梯行業(yè)也迎來了新的變革。電梯物聯(lián)網(wǎng)技術(shù)的應(yīng)用為電梯管理帶來了許多新的機遇和優(yōu)勢,同時也有效地解決了傳統(tǒng)電梯管理中存在的各種。 本文梯云物聯(lián)網(wǎng)將探討電梯物聯(lián)網(wǎng)技術(shù)如何解決電梯管理的
    的頭像 發(fā)表于 03-19 10:09 ?523次閱讀

    NPU是什么?為何它是開啟終端側(cè)生成式AI關(guān)鍵?

    生成式AI變革已經(jīng)到來。隨著生成式AI用例需求在有著多樣化要求和計算需求的垂直領(lǐng)域不斷增加,我們顯然需要專為AI定制設(shè)計的全新計算架構(gòu)。這首先需要一個面向生成式AI全新設(shè)計的神經(jīng)網(wǎng)絡(luò)處
    的頭像 發(fā)表于 03-07 11:25 ?2081次閱讀
    <b class='flag-5'>NPU</b>是什么?為何它是開啟終端<b class='flag-5'>側(cè)</b>生成式<b class='flag-5'>AI</b>的<b class='flag-5'>關(guān)鍵</b>?

    榮耀引領(lǐng)側(cè)AI新時代

    在今年的MWC盛會上,榮耀宣布與高通、Meta攜手,將70億參數(shù)大模型引入側(cè),這一創(chuàng)新舉措預(yù)示著側(cè)AI新時代的到來。榮耀終端CEO趙明在
    的頭像 發(fā)表于 03-01 10:28 ?630次閱讀
    RM新时代网站-首页