RM新时代网站-首页

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

Ambarella展示了在其CV3-AD芯片上運行LLM的能力

Astroys ? 來源:Astroys ? 2023-11-28 09:05 ? 次閱讀

Ambarella前不久展示了在其CV3-AD芯片上運行LLM的能力。這款芯片是CV3系列中最強大的,專為自動駕駛設計。

CV3-AD一年前開始出樣,使用Ambarella現(xiàn)有的AI軟件堆棧,運行Llama2-13B模型時,可以實現(xiàn)每秒推理25個token。

Ambarella的CEO Fermi Wang表示:“當transformer在今年早些時候變得流行時,我們開始問自己,我們擁有一個強大的推理引擎,我們能做到嗎?我們進行了一些快速研究,發(fā)現(xiàn)我們確實可以。我們估計我們的性能可能接近Nvidia A100?!?

Ambarella工程師正在展示Llama2-13B在CV3-AD上的實時演示,CV3-AD是一款50W的自動駕駛芯片。

Ambarella芯片上的CVFlow引擎包括其NVP(Neural Vector Processor)和一個GVP(General Vector Processor),演示中的LLM正在NVP上運行。NVP采用數(shù)據(jù)流架構(gòu),Ambarella已將諸如卷積之類的高級運算符指令組合成圖表,描述數(shù)據(jù)如何通過處理器進行該運算符的處理。所有這些運算符之間的通信都使用片上內(nèi)存完成。CV3系列使用LPDDR5(而非HBM),功耗約為50W。

268a3c3c-8d86-11ee-939d-92fbcf53809c.png

Ambarella的CTO Les Kohn表示,LLM演示確實需要一些新軟件。實現(xiàn)transformer架構(gòu)核心操作的構(gòu)建模塊,目前這些操作針對的是像Llama2這樣的模型。

他說:“隨著時間的推移,我們將擴展這些功能以覆蓋其它模型,但Llama2正在成為開源世界的事實標準。這絕對是一項不小的投資,但與從頭開始開發(fā)軟件相比,還差得遠?!?

Edge LLM發(fā)展路線圖?????

Wang表示:“現(xiàn)在我們知道我們擁有這項技術(shù),我們可以解決一些實際問題。如果你與LLM的研發(fā)人員交談,問他們最頭疼的是什么,一個顯然是價格,另一個是功耗。”

CV3-AD設計用于50W的功率范圍(包括整個芯片的功率,不僅僅是AI加速器)。因此,Wang希望Ambarella能夠以大約四分之一的功耗,為LLM提供與A100相似的性能。

他說:“這意味著對于固定的數(shù)據(jù)中心功率,我可以增加四倍的AI性能。這是巨大的價值。盡管這種想法很簡單,但我們相信我們可以為渴望使用LLM的任何人提供價值。在過去的六個月里,渴望使用LLM的人數(shù)迅速增加?!?

雖然超大規(guī)模計算中心可能是首批跟進LLM趨勢的,但Ambarella在安防攝像頭和汽車領域的現(xiàn)有客戶開始考慮如何在他們的邊緣系統(tǒng)中實施LLM,以及LLM將如何實施他們的發(fā)展路線圖。

Wang說:“我們相信LLM將成為我們需要在路線圖中為當前客戶提供的重要技術(shù)。當前的CV3可以運行LLM,而無需Ambarella進行太多額外的工程投資,所以這對我們來說并非分心之事。我們當前的市場在他們的路線圖中已經(jīng)有了LLM。” 多模態(tài)AI???? Kohn指出,在邊緣計算中,具有生成文本和圖像能力的大型多模態(tài)生成型AI潛力日益增大。

他說:“對于像機器人這樣的應用,transformer網(wǎng)絡已經(jīng)可以用于計算機視覺處理,這比任何傳統(tǒng)計算機視覺模型都要強大,因為這種模型可以處理零樣本學習,這是小模型無法做到的?!?

零樣本學習指的是模型能夠推斷出在其訓練數(shù)據(jù)中未出現(xiàn)的對象類別的信息。這意味著模型可以以更強大的方式預測和處理邊緣情況,這在自動系統(tǒng)中尤其重要。

他補充說:“自動駕駛本質(zhì)上是一種機器人應用:如果你看看L4/L5系統(tǒng)需要什么,很明顯你需要更強大、更通用的AI模型,這些模型能以更類似于人類的方式理解世界,超越我們今天的水平。我們將這看作是為各種邊緣應用獲取更強大的AI處理能力的一種方式。”

LLM發(fā)展路線圖??

問及Ambarella是否會制造專門針對LLM的邊緣芯片時,Wang表示:“這可能是我們需要考慮的事情。我們需要一個具有更多AI性能的LLM路線圖。LLM本身需要大量的DRAM帶寬,這幾乎使得在芯片上集成其他功能變得不可能(因為其他功能也需要DRAM帶寬)?!?/p>

Wang說,盡管在某些人看來,一個大型信息娛樂芯片應該能夠同時處理其他工作負載和LLM,但目前這是不可能的。LLM所需的性能和帶寬或多或少地需要一個單獨的加速器。

Kohn補充說:“這取決于模型的大小。我們可能會看到目前使用的模型比較小的版本應用于像機器人學這樣的領域,因為它們不需要處理大型模型所做的所有通用事務。但與此同時,人們希望有更強大的性能。所以,我認為最終我們將看到未來更優(yōu)化的解決方案,它們將被應用于不同的價格/性能點。”

在邊緣計算之外,CV3系列也有可能在數(shù)據(jù)中心中使用。Kohn說,CV3系列有多個PCIe接口,這在多芯片系統(tǒng)中可能很有用。他還補充說,該公司已經(jīng)有一個可以利用的PCIe卡。

Wang表示:“對我們來說,真正的問題是,‘我們能否將當前產(chǎn)品和未來產(chǎn)品銷售到超大規(guī)模計算中心或基于云的解決方案中?’這是一個我們還沒有回答的問題,但我們已經(jīng)確認了技術(shù)的可行性,并且我們有一些差異化。我們知道我們可以將這種產(chǎn)品銷售到邊緣設備和邊緣服務器。我們正在制定一個計劃,希望如果我們想要進入基于云的解決方案,我們可以證明進一步投資是合理的?!?/p>







審核編輯:劉清

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 處理器
    +關(guān)注

    關(guān)注

    68

    文章

    19259

    瀏覽量

    229651
  • 機器人
    +關(guān)注

    關(guān)注

    211

    文章

    28379

    瀏覽量

    206914
  • LPDDR5
    +關(guān)注

    關(guān)注

    2

    文章

    89

    瀏覽量

    12062
  • 自動駕駛芯片
    +關(guān)注

    關(guān)注

    3

    文章

    47

    瀏覽量

    5088
  • LLM
    LLM
    +關(guān)注

    關(guān)注

    0

    文章

    286

    瀏覽量

    327

原文標題:Ambarella展示在自動駕駛芯片上的LLM推理能力

文章出處:【微信號:Astroys,微信公眾號:Astroys】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    Arm KleidiAI助力提升PyTorchLLM推理性能

    熱門的深度學習框架尤為突出,許多企業(yè)均會選擇其作為開發(fā) AI 應用的庫。通過部署 Arm Kleidi 技術(shù),Arm 正在努力優(yōu)化 PyTorch,以加速在基于 Arm 架構(gòu)的處理器運行 LLM 的性能。Arm 通過將 Kle
    的頭像 發(fā)表于 12-03 17:05 ?735次閱讀
    Arm KleidiAI助力提升PyTorch<b class='flag-5'>上</b><b class='flag-5'>LLM</b>推理性能

    樹莓派跑LLM難上手?也許你可以試試Intel哪吒開發(fā)板

    大型語言模型(LLM)通過其卓越的文本理解與生成能力,為機器智能帶來了革命性的進步。然而,這些模型的運行通常需要消耗大量的計算資源,因此它們主要部署在性能強大的服務器。 隨著技術(shù)的發(fā)
    的頭像 發(fā)表于 12-02 09:43 ?301次閱讀
    樹莓派跑<b class='flag-5'>LLM</b>難上手?也許你可以試試Intel哪吒開發(fā)板

    如何在 OrangePi 5 Pro?的?NPU?運行?LLM

    在OrangePi5Pro上訪問NPU需要安裝最新版Ubuntu的定制版本,還需要安裝特殊軟件,讓你能在NPU而不是CPU運行專門轉(zhuǎn)換的LLM。整個過程肯定要比運行Ollama復雜得
    的頭像 發(fā)表于 11-28 14:55 ?370次閱讀
    如何在 OrangePi 5 Pro?的?NPU?<b class='flag-5'>上</b><b class='flag-5'>運行</b>?<b class='flag-5'>LLM</b>

    NVIDIA TensorRT-LLM Roadmap現(xiàn)已在GitHub公開發(fā)布

    感謝眾多用戶及合作伙伴一直以來對NVIDIA TensorRT-LLM的支持。TensorRT-LLM 的 Roadmap 現(xiàn)已在 GitHub 公開發(fā)布!
    的頭像 發(fā)表于 11-28 10:43 ?255次閱讀
    NVIDIA TensorRT-<b class='flag-5'>LLM</b> Roadmap現(xiàn)已在GitHub<b class='flag-5'>上</b>公開發(fā)布

    什么是LLMLLM在自然語言處理中的應用

    隨著人工智能技術(shù)的飛速發(fā)展,自然語言處理(NLP)領域迎來了革命性的進步。其中,大型語言模型(LLM)的出現(xiàn),標志著我們對語言理解能力的一次飛躍。LLM通過深度學習和海量數(shù)據(jù)訓練,使得機器能夠以前
    的頭像 發(fā)表于 11-19 15:32 ?522次閱讀

    LLM預訓練的基本概念、基本原理和主要優(yōu)勢

    理解和生成自然語言的能力,為各種NLP任務提供強大的支持。本文將詳細介紹LLM預訓練的基本概念、基本原理以及主要優(yōu)勢,并附上相關(guān)的代碼示例。
    的頭像 發(fā)表于 07-10 11:03 ?1063次閱讀

    大模型LLM與ChatGPT的技術(shù)原理

    與機器的交互方式。這些技術(shù)通過深度學習和自然語言生成(Natural Language Generation, NLG)的結(jié)合,實現(xiàn)對復雜語言任務的高效處理。本文將深入探討大模型LLM和ChatGPT的技術(shù)原理,并通過代碼示例展示
    的頭像 發(fā)表于 07-10 10:38 ?809次閱讀

    LLM模型的應用領域

    在本文中,我們將深入探討LLM(Large Language Model,大型語言模型)的應用領域。LLM是一種基于深度學習的人工智能技術(shù),它能夠理解和生成自然語言文本。近年來,隨著計算能力的提高
    的頭像 發(fā)表于 07-09 09:52 ?574次閱讀

    什么是LLMLLM的工作原理和結(jié)構(gòu)

    隨著人工智能技術(shù)的飛速發(fā)展,大型語言模型(Large Language Model,簡稱LLM)逐漸成為自然語言處理(NLP)領域的研究熱點。LLM以其強大的文本生成、理解和推理能力,在文本
    的頭像 發(fā)表于 07-02 11:45 ?7600次閱讀

    Meta發(fā)布基于Code Llama的LLM編譯器

    近日,科技巨頭Meta在其X平臺上正式宣布推出了一款革命性的LLM編譯器,這一模型家族基于Meta Code Llama構(gòu)建,并融合先進的代碼優(yōu)化和編譯器功能。LLM編譯器的推出,標
    的頭像 發(fā)表于 06-29 17:54 ?1489次閱讀

    【算能RADXA微服務器試用體驗】+ GPT語音與視覺交互:1,LLM部署

    。環(huán)境變量的配置,未來在具體項目中我們會再次提到。 下面我們正式開始項目。項目從輸入到輸出分別涉及語音識別,圖像識別,LLM,TTS這幾個與AI相關(guān)的模塊。先從最核心的LLM開始。 由于LLAMA
    發(fā)表于 06-25 15:02

    100%在樹莓派上執(zhí)行的LLM項目

    ChatGPT的人性口語化回復相信許多人已體驗過,也因此掀起一波大型語言模型(Large Language Model, LLM)熱潮,LLM即ChatGPT背后的主運作技術(shù),但LLM運作需要龐大運算力,因此目前多是在云端(Cl
    的頭像 發(fā)表于 02-29 16:29 ?1331次閱讀
    100%在樹莓派上執(zhí)行的<b class='flag-5'>LLM</b>項目

    超級芯片:云時代的潛在顛覆者

    蘋果已經(jīng)開始談論在其芯片中增加更高端計算能力,此前,英特爾和英偉達也做出了類似的努力。這些新功能旨在在設備實現(xiàn)更多的大型語言模型(LLM
    的頭像 發(fā)表于 01-19 11:08 ?651次閱讀

    CV3域控芯片家族又添兩員!各檔規(guī)格完整覆蓋,軟件功能全面兼容

    CV3-AD635 和 CV3-AD655 還集成了一對雙核 Cortex R52 CPU。這些 SoC 符合芯片ASIL-B 功能安全標準,其功能安全島符合 ASIL-D標準。此外,兩款芯片
    的頭像 發(fā)表于 01-11 16:44 ?1001次閱讀
    <b class='flag-5'>CV3</b>域控<b class='flag-5'>芯片</b>家族又添兩員!各檔規(guī)格完整覆蓋,軟件功能全面兼容

    安霸CV3-AD685 AI域控芯片助力Kodiak開發(fā)下一代自動駕駛卡車

    安霸的 CV3-AD685 AI 域控芯片來開發(fā)其新一代自動駕駛卡車使用的嵌入式計算解決方案。通過該芯片,Kodiak 的域控制器支持多個攝像頭、激光雷達和毫米波雷達的同時輸入,并通過 CVflow
    的頭像 發(fā)表于 01-03 10:08 ?1562次閱讀
    RM新时代网站-首页