RM新时代网站-首页

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

R-Car DNN模擬器的介紹

瑞薩電子 ? 來源:瑞薩電子 ? 2023-02-02 11:06 ? 次閱讀

摘要

本篇文章我們將介紹瑞薩為R-Car V4H提供的三種類型的DNN開發(fā)模擬器,以及它們的使用情況和特點(diǎn)。

背景

用于汽車SoC實(shí)時(shí)處理的深度學(xué)習(xí)的模型轉(zhuǎn)換

深度學(xué)習(xí)是使用底層軟件(深度學(xué)習(xí)框架)開發(fā)的,如TensorFlow和PyTorch。

僅僅通過移植在深度學(xué)習(xí)框架中學(xué)習(xí)到的模型,不可能在R-Car這樣的車載SoC上進(jìn)行實(shí)時(shí)處理,因?yàn)樯疃葘W(xué)習(xí)的推斷過程需要大量的計(jì)算和內(nèi)存使用。因此,有必要對所學(xué)模型進(jìn)行非等價(jià)的模型壓縮,如量化和剪枝,以及使用深度學(xué)習(xí)編譯器進(jìn)行性能優(yōu)化。

首先,讓我們討論一下模型壓縮。在量化中,通常以浮點(diǎn)計(jì)算的推斷過程被轉(zhuǎn)換為近似的整數(shù)運(yùn)算,如8位。通過將對識(shí)別結(jié)果貢獻(xiàn)較小的權(quán)重設(shè)置為零并跳過對這些權(quán)重的計(jì)算,修剪減少了計(jì)算和內(nèi)存的使用。這兩種轉(zhuǎn)換都是對原始推斷過程的非等效的算法轉(zhuǎn)換,因此很可能會(huì)降低識(shí)別的準(zhǔn)確性。

在性能優(yōu)化方面,深度學(xué)習(xí)編譯器可以對訓(xùn)練過的模型的推斷過程進(jìn)行程序轉(zhuǎn)換,以便在深度學(xué)習(xí)加速器上進(jìn)行更快的處理,或者應(yīng)用內(nèi)存可以進(jìn)行優(yōu)化,例如將分配給一個(gè)層的輸出數(shù)據(jù)的快速小型SRAM重新用于另一個(gè)層的輸出數(shù)據(jù)。

應(yīng)用這種轉(zhuǎn)換可以在車載SoC上進(jìn)行實(shí)時(shí)處理。

在R-Car中使用瑞薩工具和軟件的推斷流程

瑞薩的R-Car中的H/W加速器CNN-IP,出于計(jì)算效率的考慮,可以使用整數(shù)值進(jìn)行推斷操作。由于這個(gè)原因,用戶必須使用瑞薩公司提供的R-Car CNN工具來進(jìn)行量化,這是上述模型轉(zhuǎn)換中的一種。

首先,在實(shí)際執(zhí)行量化之前,必須進(jìn)行校準(zhǔn),以計(jì)算量化參數(shù)(刻度和零點(diǎn)),用于將浮動(dòng)數(shù)轉(zhuǎn)換為整數(shù)。為此,一個(gè)外部工具(如TFMOT、ONNX runtime),根據(jù)網(wǎng)絡(luò)模型的格式,從大量的輸入圖像中找到每一層的最大/最小輸出值。從這些最大/最小值中,可以計(jì)算出比例/零點(diǎn)等量化參數(shù);R-Car CNN工具使用這些量化參數(shù)來量化每一層的參數(shù)。

R-Car CNN工具然后從網(wǎng)絡(luò)模型和每層的量化參數(shù)中創(chuàng)建一個(gè)命令列表。命令列表是二進(jìn)制數(shù)據(jù),用于指示CNN-IP執(zhí)行哪些命令和設(shè)置哪些參數(shù)(每個(gè)量化層的參數(shù))。通過向CNN-IP提供該命令列表并運(yùn)行它,可以進(jìn)行推斷。

命令列表是由網(wǎng)絡(luò)模型和量化參數(shù)唯一確定的,因此它只需要事先創(chuàng)建一次。上述命令列表可以對每個(gè)圖像執(zhí)行,以便在實(shí)際設(shè)備上進(jìn)行推斷。

使用瑞薩工具和軟件對R-Car V4H進(jìn)行推斷的框圖見圖1。

64b04982-a2a6-11ed-bfe3-dac502259ad0.png

圖1 使用瑞薩工具和軟件進(jìn)行推斷的方框圖

關(guān)于每個(gè)模擬器

每個(gè)模擬器的概述和特點(diǎn)

瑞薩電子準(zhǔn)備了模擬器來解決以下兩個(gè)用戶挑戰(zhàn):

A)在開發(fā)一個(gè)應(yīng)用程序之前,用戶希望檢查由于量化而導(dǎo)致的精度變化

B)想在不使用實(shí)際設(shè)備的情況下使用命令列表檢查和調(diào)試用戶應(yīng)用程序

瑞薩的模擬器有三種類型,每種類型解決不同的任務(wù),具有不同的功能。各自的特點(diǎn)見表1。每一種都在準(zhǔn)確性和處理速度上有所不同。對于每一種情況,都會(huì)參照框圖介紹其特點(diǎn)和使用情況的細(xì)節(jié)。

表1 各模擬器的概述和特點(diǎn)

64e6a432-a2a6-11ed-bfe3-dac502259ad0.png

(*1)命令列表是使用R-Car CNN工具創(chuàng)建的,基于網(wǎng)絡(luò)模型和量化參數(shù),使用與上述實(shí)際機(jī)器上的推斷相同的程序。

(*2)Accurate Simulator在R-Car CNN工具中運(yùn)行。用戶向R-Car CNN工具提供網(wǎng)絡(luò)模型和量化參數(shù),該工具會(huì)自動(dòng)計(jì)算每一層的量化參數(shù),然后將其輸入到Accurate Simulator。

ISS

該模擬器旨在使用與實(shí)際設(shè)備盡可能相同的軟件配置和輸入數(shù)據(jù)(命令列表,主要是寄存器設(shè)置)來調(diào)試輸出結(jié)果。它不能重現(xiàn)計(jì)時(shí),也不打算用于計(jì)時(shí)驗(yàn)證。

結(jié)果與實(shí)際設(shè)備完全相同,速度比Accurate Simulator慢,因?yàn)樗灾噶顬榛A(chǔ)重現(xiàn)輸出。

65151df8-a2a6-11ed-bfe3-dac502259ad0.png

圖2 使用ISS的系統(tǒng)方框圖

精確的模擬器

該模擬器將網(wǎng)絡(luò)模型作為輸入,用于精度驗(yàn)證,無需使用實(shí)際設(shè)備。對于每一層,都要實(shí)現(xiàn)一種算法,使其輸出與設(shè)備的計(jì)算算法完全匹配。由于執(zhí)行速度比ISS快10倍左右,所以在只驗(yàn)證精度的情況下,它是很有用的。

653b8312-a2a6-11ed-bfe3-dac502259ad0.png

圖3 使用Accurate Simulator的系統(tǒng)框圖

快速仿真器

該模擬器用于檢查大量圖像的定量誤差。

Fast Simulator擴(kuò)展了深度學(xué)習(xí)框架(R-Car V4H中的Tensor Flow),在每層推斷操作后都有一個(gè)偽量化功能,并帶有浮點(diǎn)數(shù)字。偽量子化是一種重現(xiàn)浮點(diǎn)數(shù)的偽量子化誤差的方法,在浮點(diǎn)數(shù)仍然是浮點(diǎn)數(shù)的情況下,加入與量子化導(dǎo)致的精度下降相同的誤差。

可以只在Tensor Flow中添加一個(gè)偽量化功能,其運(yùn)行速度與Tensor Flow相似,但速度更快。

另外,由于輸入/輸出接口與深度學(xué)習(xí)框架是通用的,所以用戶在切換到深度學(xué)習(xí)框架時(shí)很容易檢查出量化錯(cuò)誤。

然而,由于每層的推斷操作和偽量化都會(huì)產(chǎn)生一個(gè)小的浮點(diǎn)算術(shù)誤差,所以結(jié)果與實(shí)際的機(jī)器結(jié)果并不完全匹配。

6560bd44-a2a6-11ed-bfe3-dac502259ad0.png

圖4 使用快速仿真器的系統(tǒng)框圖

審核編輯:湯梓紅

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • soc
    soc
    +關(guān)注

    關(guān)注

    38

    文章

    4161

    瀏覽量

    218160
  • 瑞薩
    +關(guān)注

    關(guān)注

    35

    文章

    22308

    瀏覽量

    86238
  • 模擬器
    +關(guān)注

    關(guān)注

    2

    文章

    874

    瀏覽量

    43208
  • 深度學(xué)習(xí)
    +關(guān)注

    關(guān)注

    73

    文章

    5500

    瀏覽量

    121111
  • dnn
    dnn
    +關(guān)注

    關(guān)注

    0

    文章

    60

    瀏覽量

    9051

原文標(biāo)題:工程師說 | R-Car DNN模擬器的介紹

文章出處:【微信號(hào):瑞薩電子,微信公眾號(hào):瑞薩電子】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    Renesas新產(chǎn)品介紹--R-Car V3U 精選資料分享

    ADAS/自動(dòng)駕駛的車載SoC概述最大60TOPS深度學(xué)習(xí)處理性能概述2020年12月,瑞薩電子發(fā)布了用于ADAS(先進(jìn)駕駛輔助系統(tǒng))和自動(dòng)駕駛的車載SoC【R-Car V3U】。目前正在
    發(fā)表于 07-27 06:44

    瑞薩電子發(fā)布R-Car系列汽車系統(tǒng)單芯片產(chǎn)品R-Car E1

    瑞薩電子與Renesas Mobile Corporation發(fā)布R-Car系列汽車用系統(tǒng)單芯片(SoC)新款產(chǎn)品R-Car E1 ,可提供低耗電量及優(yōu)異的系統(tǒng)整合,目標(biāo)市場為重視成本的汽車導(dǎo)航與多媒體系統(tǒng),包括高階車用音
    發(fā)表于 09-01 09:17 ?1455次閱讀

    瑞薩電子推出“R-Car 虛擬化支持包”用于虛擬機(jī)軟件

    在設(shè)計(jì)第三代 R-Car SoC 時(shí),已經(jīng)將虛擬機(jī)軟件的使用列入考慮。 Arm CPU內(nèi)核、圖形內(nèi)核、視頻/音頻 IP 以及其他功能都支持虛擬化。過去,軟件開發(fā)商如果想使用這些功能,必須深入理解 R-Car硬件手冊和 R-Car
    的頭像 發(fā)表于 08-02 14:30 ?3001次閱讀
    瑞薩電子推出“<b class='flag-5'>R-Car</b> 虛擬化支持包”用于虛擬機(jī)軟件

    快速了解R-Car Market Place網(wǎng)絡(luò)服務(wù)

    大家有沒有讀過我去年年底寫的博客“汽車業(yè)務(wù)的客戶價(jià)值(系列17):R-Car聯(lián)盟·合作伙伴計(jì)劃的介紹”?自這篇博客發(fā)布以來,瑞薩收到了大量反饋和在R-Car Market Place上創(chuàng)建賬戶的申請。
    的頭像 發(fā)表于 12-18 10:57 ?1919次閱讀

    采用R-Car S4和PMIC的汽車網(wǎng)關(guān)解決方案

      R-Car S4是瑞薩電子第四代R-Car Gen4 SoC系列產(chǎn)品之一,采用臺(tái)積電12nm制程工藝,反映了我們在基于R-Car Gen3的客戶項(xiàng)目運(yùn)行早期階段就已經(jīng)收集了的客戶具體需求。除了
    的頭像 發(fā)表于 04-26 09:34 ?2137次閱讀
    采用<b class='flag-5'>R-Car</b> S4和PMIC的汽車網(wǎng)關(guān)解決方案

    R-Car Virtual Platform加速下一代車載軟件開發(fā)

      車載SoC產(chǎn)品R-Car系列的第三代產(chǎn)品正在量產(chǎn)。2021年之后,我們將使用R-Car VPF進(jìn)行新產(chǎn)品的開發(fā)。事實(shí)上,我們已將R-Car VPF原型應(yīng)用于內(nèi)部軟件的開發(fā)。過去,雖然軟件開發(fā)也是
    的頭像 發(fā)表于 04-29 14:30 ?1239次閱讀
    <b class='flag-5'>R-Car</b> Virtual Platform加速下一代車載軟件開發(fā)

    用于 Renesas R-Car 平臺(tái)的 Dialog PMIC

    Dialog Semiconductor宣布擴(kuò)大與瑞薩電子公司的合作,推出適用于 R-Car M3 和 R-Car E3 汽車平臺(tái)的電源管理集成電路 (PMIC) 解決方案。 R-Car M3
    發(fā)表于 07-28 11:51 ?1110次閱讀
    用于 Renesas <b class='flag-5'>R-Car</b> 平臺(tái)的 Dialog PMIC

    R-Car CAN擴(kuò)展板用戶手冊

    R-Car CAN擴(kuò)展板用戶手冊
    發(fā)表于 01-30 18:58 ?0次下載
    <b class='flag-5'>R-Car</b> CAN擴(kuò)展板用戶手冊

    R-Car V3M Starter Kit 原理圖s

    R-Car V3M Starter Kit 原理圖s
    發(fā)表于 03-22 19:23 ?0次下載
    <b class='flag-5'>R-Car</b> V3M Starter Kit 原理圖s

    R-Car E2用戶手冊: 硬件

    R-Car E2 用戶手冊: 硬件
    發(fā)表于 03-29 19:04 ?0次下載
    <b class='flag-5'>R-Car</b> E2用戶手冊: 硬件

    R-Car CAN擴(kuò)展板用戶手冊

    R-Car CAN擴(kuò)展板用戶手冊
    發(fā)表于 07-03 20:35 ?0次下載
    <b class='flag-5'>R-Car</b> CAN擴(kuò)展板用戶手冊

    R-Car V3M Starter Kit 原理圖s

    R-Car V3M Starter Kit 原理圖s
    發(fā)表于 07-10 18:43 ?1次下載
    <b class='flag-5'>R-Car</b> V3M Starter Kit 原理圖s

    R-Car E2用戶手冊: 硬件

    R-Car E2 用戶手冊: 硬件
    發(fā)表于 07-11 19:28 ?0次下載
    <b class='flag-5'>R-Car</b> E2用戶手冊: 硬件

    工程師說 | R-Car DNN模擬器介紹 (2)

    摘要 在瑞薩提供的R-Car SoC相關(guān)的一些DNN模擬器中,本文將重點(diǎn)介紹 能夠?qū)崿F(xiàn)與實(shí)際硬件等價(jià)運(yùn)算的Accurate Simulator ,并說明如何應(yīng)用它來 分析和提高神經(jīng)網(wǎng)絡(luò)
    的頭像 發(fā)表于 07-13 18:15 ?458次閱讀
    工程師說 | <b class='flag-5'>R-Car</b> <b class='flag-5'>DNN</b><b class='flag-5'>模擬器</b>的<b class='flag-5'>介紹</b> (2)

    瑞薩R-Car M3的電源設(shè)計(jì)

    電子發(fā)燒友網(wǎng)站提供《瑞薩R-Car M3的電源設(shè)計(jì).pdf》資料免費(fèi)下載
    發(fā)表于 11-27 14:38 ?0次下載
    瑞薩<b class='flag-5'>R-Car</b> M3的電源設(shè)計(jì)
    RM新时代网站-首页