RM新时代网站-首页

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

Imagination發(fā)布最新一代神經(jīng)網(wǎng)絡加速器IP核

Dbwd_Imgtec ? 來源:芯東西 ? 作者:董溫淑 ? 2020-11-18 16:06 ? 次閱讀

Imagination Technologies發(fā)布了最新一代神經(jīng)網(wǎng)絡加速器IP核IMG Series4 NNA,并將于12月份正式向廠商提供。

芯東西獨家獲悉,已有汽車領域廠商率先獲得IMG Series4 NNA IP授權(quán)。

作為NNA IP系列第四代產(chǎn)品,IMG Series4 NNA具備創(chuàng)新的多核架構(gòu)、高擴展性&高靈活性、超高性能、超低延遲、節(jié)省帶寬、車規(guī)級安全性等功能及特性,可滿足汽車、移動設備、數(shù)據(jù)中心、PC等多種應用場景的AI加速要求。

在這背后,Imagination為IMG Series4 NNA融入了怎樣的設計巧思?在神經(jīng)網(wǎng)絡加速成為各行各業(yè)普遍需求的當下,IMG Series4 NNA將為滿足這一需求拿出怎樣的解決方案?

為回答這些問題,芯東西獨家專訪Imagination人工智能業(yè)務高級總監(jiān)Andrew Grant,以了解IMG Series4 NNA中蘊含的“黑科技”。

01

兩年打磨:成就五大核心性能亮點

我們了解到,Imagination第二代、第三代神經(jīng)網(wǎng)絡加速器IP核Series2NX和Series3NX,分別于2017年和2018年推出,兩款產(chǎn)品的發(fā)布時間相隔一年。

相比之下,最新推出的Series4 IP核與前代產(chǎn)品的推出相隔兩年。Andrew Grant向我們透露,2018年以來,Imagination研發(fā)團隊從軟硬件兩方面出發(fā),對Series4 IP進行了細致的產(chǎn)品設計。

在硬件層面,Imagination團隊在2018年啟動對Series4 IP核的研發(fā)工作,同步開始對多核(multi-core)技術(shù)(IMG 4NX-MC2、MC4、MC6、MC8)進行研發(fā)。

同時,Imagination推出其專利的Imagination Tensor Tiling(ITT)技術(shù),可將工作負載分割以獲得最優(yōu)效率。

實際應用時,昨日最新亮相的Series4 NNA IP可憑借多核多集群組合,提供600 TOPS甚至更高算力,同時可為大型神經(jīng)網(wǎng)絡工作負載節(jié)省帶寬、降低延遲。

其性能優(yōu)勢可概括為五個方面:

1、高度靈活的可擴展方案。

前兩代產(chǎn)品均采用單核架構(gòu),相比之下,最新推出的Series4 NNA采用多核架構(gòu),允許用戶集成2個、4個、6個或8個單核,提供靈活的可擴展方案。

2、超高性能。

基于Series4 NNA IP,一個8核集群可提供100 TOPS算力,那么,6個8核集群的解決方案就可以提供600 TOPS算力。

3、超低延遲。

所有內(nèi)核可以并行處理一個任務,進而相應地降低延遲、縮短響應時間。舉例來說,相比單核獨立執(zhí)行的情況,理想狀態(tài)下8核集群可以把延遲降低至前者的1/8。

4、節(jié)省帶寬。

Imagination Tensor Tiling技術(shù)(ITT),可利用本地數(shù)據(jù)的依賴性將中間數(shù)據(jù)保存在片上存儲器中,從而將帶寬降低多達90%。

5、車規(guī)級安全性。

Series4包含IP級別的安全功能且設計流程符合ISO 26262標準(解決汽車電子產(chǎn)品風險的行業(yè)安全標準)。

此外,IMG Series4 NNA可運行一系列AI框架,包括Caffe、PyTorch、TensorFlow、PaddlePaddle、Chainer、Cognitive Toolkit、mxnet和Open Neural Network Exchange (ONNX)等。

對神經(jīng)網(wǎng)絡的支持方面,IMG Series4可為CNN、LSTM、RNN等多種神經(jīng)網(wǎng)絡加速,同時支持YOLO v3、Kittiseg等。

02

亮劍四大領域:從PC到汽車都能用

在應用場景上,除了延續(xù)前兩代產(chǎn)品對移動設備、PC、數(shù)據(jù)中心等應用場景的支持,Series4 NNA IP特別針對自動駕駛領域、先進駕駛輔助系統(tǒng)(ADAS)等汽車領域應用進行了設計。

在與客戶溝通的過程中,Imagination團隊了解到,現(xiàn)有車載神經(jīng)網(wǎng)絡加速器IP解決方案存在功耗高等方面的痛點,這正給Imagination提供了“用武之地”。 Andrew說:“我們注意到,現(xiàn)有的多數(shù)IP廠商提供的是數(shù)據(jù)中心、桌面級CPU等解決方案,這些方案功耗比較嚴重,對車載場景不友好。但Imagination有做移動應用的基因,我們在控制功耗方面有優(yōu)勢。” 除了降低功耗以外,Imagination研發(fā)團隊還綜合考慮了自動駕駛等車載場景對能效、安全性等方面的需求。“(其中)最重要的是‘安全第一’的原則?!盇ndrew Grant強調(diào)。

Imagination研發(fā)團隊在Series4 NNA獨特的多核架構(gòu)中加入控制器,以最大限度地提升使用效率。在保證功耗低、帶寬低的情況下,把算力擴展到業(yè)界最大水平。

安全性方面,Series4 NNA采用硬件安全機制,可以保護編譯后的網(wǎng)絡、網(wǎng)絡的執(zhí)行和數(shù)據(jù)處理管道。

此外,Andrew Grant補充到,Series4 IP還能與Imagination的車用BXS GPU互補,以實現(xiàn)一個功能更加完善的異構(gòu)計算平臺。Imagination創(chuàng)新的AI協(xié)同(AI Synergy)技術(shù),可充分利用NNA和GPU的資源與優(yōu)勢,使AI計算性能、效率再上新臺階。

03

未來4NX產(chǎn)品有望在更多領域落地

Andrew Grant向芯東西透露,目前已經(jīng)有汽車領域的廠商率先獲得了IMG Series4 NNA IP的授權(quán),并正推動產(chǎn)品落地。

談到Imagination三代NNA IP產(chǎn)品之間的關系,Imagination方面表示,前兩代神經(jīng)網(wǎng)絡加速器IP已經(jīng)達到了Imagination的市場預期,在移動、安防監(jiān)控、IoT等對算力要求相對較低的應用場景中取得了較好成績。

比如,展銳(UNISOC)的虎賁T710芯片搭載了2NX,在諸多AI評測中名列前茅,目前已落地于海信F50 5G智能手機、酷派X10 5G手機等;3NX相比2NX,在架構(gòu)上有很大改良,其功耗、性能、PPA、靈活性均有提升,目前已應用在展銳的T7520芯片里。

相比之下,Series4 NNA IP是一款“Next Level”的產(chǎn)品,適用于更加廣闊的場景。

三代產(chǎn)品形成矩陣,可提供不同層次的算力支持?!八懔π枨蟠蟮目蛻艨蛇x擇多核心的4NX產(chǎn)品,對算力需求在10T以下的客戶可選擇3NX解決方案?!盇ndrew說。

同時,Andrew Grant稱:“我們期待能將其(4NX產(chǎn)品)推廣到云計算中心、移動邊緣計算(MEC)、桌面、安防攝像頭、工業(yè)自動化等應用領域。中國是一個非常大的市場,有許多芯片公司,我們期待能與這些公司一起有所作為,助力車載、數(shù)據(jù)中心等應用場景實現(xiàn)提升?!?/p>

04

結(jié)語:自動駕駛應用藍海下,車載AI芯片IP迎來利好

5G、AI……一波波浪潮奔涌下,自動駕駛、遠程醫(yī)療等應用逐漸從傳說變?yōu)楝F(xiàn)實,這一過程中,Imagination等先進技術(shù)玩家,承擔著助推產(chǎn)業(yè)浪潮奔涌的角色。

今年三月份,工信部網(wǎng)站公示《汽車駕駛自動化分級》推薦性國家標準報批稿。若該標準正式實施,將是我國第一份自動駕駛分級標準。這意味著國內(nèi)自動駕駛發(fā)展將迎來政策性引導與保障。業(yè)內(nèi)人士稱,新的分級標準給行業(yè)帶來利好,車聯(lián)網(wǎng)路網(wǎng)基建有望加速,將帶來十萬億級別的投資機會。

這一十萬億市場藍海中,車載AI芯片IP無疑成為一大重要組成部分。

自動駕駛解決方案中,應對數(shù)以百計的復雜場景、處理大量的傳感器數(shù)據(jù)、實現(xiàn)自動代客泊車等各類復雜功能,對車載AI芯片應用提出更高要求。 對此,Imagination最新發(fā)布的神經(jīng)網(wǎng)絡加速器IP在算力、降低延遲、提升能效等方面具備優(yōu)勢,或能助推自動駕駛應用快速落地。 有關Series4 NNA的更多信息, 請識別下方二維碼觀看 Imagination的主題會議。

原文標題:600 TOPS超高算力,2~8核靈活配置!Imagination新發(fā)布神經(jīng)網(wǎng)絡加速器IP

文章出處:【微信公眾號:Imagination Tech】歡迎添加關注!文章轉(zhuǎn)載請注明出處。

責任編輯:haq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 神經(jīng)網(wǎng)絡

    關注

    42

    文章

    4771

    瀏覽量

    100712
  • AI
    AI
    +關注

    關注

    87

    文章

    30728

    瀏覽量

    268886
  • 自動駕駛
    +關注

    關注

    784

    文章

    13784

    瀏覽量

    166382

原文標題:600 TOPS超高算力,2~8核靈活配置!Imagination新發(fā)布神經(jīng)網(wǎng)絡加速器IP

文章出處:【微信號:Imgtec,微信公眾號:Imagination Tech】歡迎添加關注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關推薦

    什么是神經(jīng)網(wǎng)絡加速器?它有哪些特點?

    神經(jīng)網(wǎng)絡加速器種專門設計用于提高神經(jīng)網(wǎng)絡計算效率的硬件設備。隨著深度學習技術(shù)的快速發(fā)展和廣泛應用,神經(jīng)網(wǎng)絡模型的復雜度和計算量急劇增加,
    的頭像 發(fā)表于 07-11 10:40 ?474次閱讀

    BP神經(jīng)網(wǎng)絡和人工神經(jīng)網(wǎng)絡的區(qū)別

    BP神經(jīng)網(wǎng)絡和人工神經(jīng)網(wǎng)絡(Artificial Neural Networks,簡稱ANNs)之間的關系與區(qū)別,是神經(jīng)網(wǎng)絡領域中個基礎且重要的話題。本文將從定義、結(jié)構(gòu)、算法、應用及
    的頭像 發(fā)表于 07-10 15:20 ?1020次閱讀

    rnn是遞歸神經(jīng)網(wǎng)絡還是循環(huán)神經(jīng)網(wǎng)絡

    RNN(Recurrent Neural Network)是循環(huán)神經(jīng)網(wǎng)絡,而非遞歸神經(jīng)網(wǎng)絡。循環(huán)神經(jīng)網(wǎng)絡種具有時間序列特性的神經(jīng)網(wǎng)絡,能
    的頭像 發(fā)表于 07-05 09:52 ?558次閱讀

    遞歸神經(jīng)網(wǎng)絡與循環(huán)神經(jīng)網(wǎng)絡樣嗎

    神經(jīng)網(wǎng)絡種基于樹結(jié)構(gòu)的神經(jīng)網(wǎng)絡模型,它通過遞歸地將輸入數(shù)據(jù)分解為更小的子問題來處理序列數(shù)據(jù)。RvNN的核心思想是將復雜的序列問題
    的頭像 發(fā)表于 07-05 09:28 ?827次閱讀

    遞歸神經(jīng)網(wǎng)絡是循環(huán)神經(jīng)網(wǎng)絡

    遞歸神經(jīng)網(wǎng)絡(Recurrent Neural Network,簡稱RNN)和循環(huán)神經(jīng)網(wǎng)絡(Recurrent Neural Network,簡稱RNN)實際上是同個概念,只是不同的翻譯方式
    的頭像 發(fā)表于 07-04 14:54 ?729次閱讀

    循環(huán)神經(jīng)網(wǎng)絡和卷積神經(jīng)網(wǎng)絡的區(qū)別

    結(jié)構(gòu)。它們在處理不同類型的數(shù)據(jù)和解決不同問題時具有各自的優(yōu)勢和特點。本文將從多個方面比較循環(huán)神經(jīng)網(wǎng)絡和卷積神經(jīng)網(wǎng)絡的區(qū)別。 基本概念 循環(huán)神經(jīng)網(wǎng)絡種具有循環(huán)連接的
    的頭像 發(fā)表于 07-04 14:24 ?1264次閱讀

    反向傳播神經(jīng)網(wǎng)絡和bp神經(jīng)網(wǎng)絡的區(qū)別

    反向傳播神經(jīng)網(wǎng)絡(Backpropagation Neural Network,簡稱BP神經(jīng)網(wǎng)絡)是種多層前饋神經(jīng)網(wǎng)絡,它通過反向傳播算法來調(diào)整網(wǎng)
    的頭像 發(fā)表于 07-03 11:00 ?789次閱讀

    卷積神經(jīng)網(wǎng)絡的實現(xiàn)原理

    、訓練過程以及應用場景。 卷積神經(jīng)網(wǎng)絡的基本原理 1.1 卷積操作 卷積神經(jīng)網(wǎng)絡的核心是卷積操作。卷積操作是種數(shù)學運算,用于提取輸入數(shù)據(jù)的特征。在圖像處理中,卷積操作通常用于提取圖像的局部特征,如邊緣、紋理等。 假設輸入數(shù)據(jù)為
    的頭像 發(fā)表于 07-03 10:49 ?537次閱讀

    bp神經(jīng)網(wǎng)絡和卷積神經(jīng)網(wǎng)絡區(qū)別是什么

    結(jié)構(gòu)、原理、應用場景等方面都存在定的差異。以下是對這兩種神經(jīng)網(wǎng)絡的比較: 基本結(jié)構(gòu) BP神經(jīng)網(wǎng)絡種多層前饋神經(jīng)網(wǎng)絡,由輸入層、隱藏層和
    的頭像 發(fā)表于 07-03 10:12 ?1152次閱讀

    卷積神經(jīng)網(wǎng)絡的基本原理和應用范圍

    和應用范圍。 、卷積神經(jīng)網(wǎng)絡的基本原理 1. 卷積層(Convolutional Layer) 卷積層是CNN的核心組成部分,其主要功能是提取圖像中的局部特征。卷積層由多個卷積(或濾波
    的頭像 發(fā)表于 07-02 15:30 ?1150次閱讀

    卷積神經(jīng)網(wǎng)絡和bp神經(jīng)網(wǎng)絡的區(qū)別

    不同的神經(jīng)網(wǎng)絡模型,它們在結(jié)構(gòu)、原理、應用等方面都存在定的差異。本文將從多個方面對這兩種神經(jīng)網(wǎng)絡進行詳細的比較和分析。 引言 神經(jīng)網(wǎng)絡
    的頭像 發(fā)表于 07-02 14:24 ?3637次閱讀

    西門子推出Catapult AI NN:重塑神經(jīng)網(wǎng)絡加速器設計的未來

    的需求,西門子數(shù)字化工業(yè)軟件日前推出了款名為Catapult AI NN的創(chuàng)新軟件,旨在幫助神經(jīng)網(wǎng)絡加速器在專用集成電路(ASIC)和芯片級系統(tǒng)(SoC)上實現(xiàn)更高效的高層次綜合(HLS)。
    的頭像 發(fā)表于 06-19 16:40 ?705次閱讀

    西門子推出Catapult AI NN軟件,賦能神經(jīng)網(wǎng)絡加速器設計

    西門子數(shù)字化工業(yè)軟件近日發(fā)布了Catapult AI NN軟件,這款軟件在神經(jīng)網(wǎng)絡加速器設計領域邁出了重要步。Catapult AI NN軟件專注于在專用集成電路(ASIC)和芯片級
    的頭像 發(fā)表于 06-19 11:27 ?849次閱讀

    Arm發(fā)布新一代Ethos-U AI加速器 Arm旨在瞄準國產(chǎn)CPU市場

    Arm發(fā)布新一代Ethos-U AI加速器確實在業(yè)界引起了廣泛關注。
    的頭像 發(fā)表于 04-18 15:59 ?743次閱讀

    NVIDIA將在今年第二季度發(fā)布Blackwell架構(gòu)的新一代GPU加速器“B100”

    根據(jù)各方信息和路線圖,NVIDIA預計會在今年第二季度發(fā)布Blackwell架構(gòu)的新一代GPU加速器“B100”。
    的頭像 發(fā)表于 03-04 09:33 ?1310次閱讀
    NVIDIA將在今年第二季度<b class='flag-5'>發(fā)布</b>Blackwell架構(gòu)的<b class='flag-5'>新一代</b>GPU<b class='flag-5'>加速器</b>“B100”
    RM新时代网站-首页