RM新时代网站-首页

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

TMS320C6678存儲(chǔ)器訪問(wèn)性能 (下)

電子工程師 ? 來(lái)源:網(wǎng)絡(luò)整理 ? 2018-02-19 01:11 ? 次閱讀

1. DMA訪問(wèn)存儲(chǔ)器的性能

EDMA3架構(gòu)支持很多功能,可以實(shí)現(xiàn)高效的并行數(shù)據(jù)傳輸。本節(jié)討論影響它性能的很多因素,如存儲(chǔ)器類型,地址偏移等。

1.1 DMA傳輸?shù)念~外開(kāi)銷

一般的傳輸時(shí)延被定義為EDMA被觸發(fā)到真正的數(shù)據(jù)傳輸開(kāi)始的時(shí)間。由于數(shù)據(jù)傳輸開(kāi)始的時(shí)間無(wú)法用簡(jiǎn)單的方法測(cè)量,所以我們用最小數(shù)據(jù)單元的傳輸完成時(shí)間來(lái)代表DMA傳輸?shù)臅r(shí)延或額外開(kāi)銷。根據(jù)不同源/目的地址的組合,這個(gè)值會(huì)有所不同。表4列出了在1GHz C6678 EVM(64-bit 1333MTS DDR)上測(cè)得的從EDMA觸發(fā)(寫(xiě)ESR)最小數(shù)據(jù)傳輸(1 word)到EDMA 傳輸結(jié)束(讀到IPR=1) 的平均的時(shí)鐘周期數(shù)。

表4 EDMA CC0傳輸?shù)念~外開(kāi)銷

表5 EDMA CC1和EDMA CC2傳輸?shù)念~外開(kāi)銷

由于EDMA CC0 連接到離SL2 和DDR 比較近的內(nèi)部總線交換網(wǎng)絡(luò),因此它訪問(wèn)SL2 和DDR 額外開(kāi)銷比較小。而EDMA CC1 和CC2 連接到離DSP 核的L1 和LL2 比較近的內(nèi)部總線交換網(wǎng)絡(luò),所以它們?cè)L問(wèn)L1 和LL2 的額外開(kāi)銷比較小。

IDMA 一般用來(lái)在LL2 內(nèi)部拷貝數(shù)據(jù),測(cè)試得到的IDMA 的平均額外開(kāi)銷是61 個(gè)時(shí)鐘周期。

傳輸?shù)念~外開(kāi)銷是小數(shù)據(jù)量傳輸要考慮的重要因素。單個(gè)數(shù)據(jù)單元的傳輸時(shí)間完全由DMA 的額外開(kāi)銷決定。所以,對(duì)于小數(shù)據(jù)量的拷貝,我們需要在用DMA 和用DSP 核之間做權(quán)衡選擇。

1.2 EDMA 10 個(gè)傳輸引擎的區(qū)別

C6678 上包含10 個(gè)EDMA3 TC (Transfer Controller) 。這10 個(gè)傳輸引擎并不完全相同。Table 6 總結(jié)了它們之間的區(qū)別。

表6 EDMA 傳輸引擎之間的區(qū)別

表7 比較了在1GHz C6678 EVM(64-bit 1333MTS DDR)上測(cè)得的各個(gè)EDMA TC 的最大吞吐量。測(cè)試的參數(shù)ACNT=1024,BCNT=128,AB_Sync(一次傳完ACNTxBCNT)。

表7 1GHz C6678 上EDMA TC 吞吐量比較

對(duì)SL2 和DDR 之間的傳輸,TC0_0 和TC0_1 能達(dá)到的吞吐量是其它TC 的兩倍。在本文其它部分,如果沒(méi)有特殊說(shuō)明,EDMA 性能數(shù)據(jù)都是在TC0_0 上測(cè)得的。

1.3 EDMA 帶寬和傳輸靈活性的權(quán)衡

EDMA3 支持很多靈活的傳輸參數(shù)配置。多數(shù)配置情況下EDMA 可以充分利用存儲(chǔ)器帶寬;但在某些情況下,傳輸性能可能會(huì)有所下降。為了設(shè)計(jì)高效的系統(tǒng),我們需要理解什么樣的配置能夠?qū)崿F(xiàn)高效的傳輸,而某些情況下必須在靈活性和效率之間做權(quán)衡。

1.3.1 第一維大小 (ACNT) 的考慮(突發(fā)數(shù)據(jù)塊大小)

為了充分利用傳輸引擎的帶寬,傳輸盡量大的數(shù)據(jù)塊是非常重要的。

為了充分利用128-bit 或256-bit 的總線,ACNT 應(yīng)該是16 bytes 的整數(shù)倍;為了充分利用EDMA的突發(fā)數(shù)據(jù)塊,ACNT 需要是64 bytes 的整數(shù)倍;為了充分利用EDMA FIFO,ACNT 應(yīng)該至少是512 bytes。

圖7 畫(huà)出了在1GHz C6678 EVM(64-bit 1333MTS DDR)上,從SL2 到DDR 傳輸1~24K bytes 數(shù)據(jù)時(shí)測(cè)得的吞吐量。

圖7 ACNT 對(duì)EDMA 效率的影響

從測(cè)試結(jié)果可以看出,ACNT 越大,帶寬的利用率越高。

1.3.2 二維傳輸?shù)目紤](傳輸優(yōu)化)

如果2D 傳輸 (AB_Sync)是線性的 (BIDX=ACNT),并且ACNT 是2 的冪次方,EDMA 會(huì)把這個(gè)2D 傳輸優(yōu)化為1D 傳輸。我們?cè)?GHz C6678 EVM(64-bit 1333MTS DDR)上測(cè)試了不同的ACNT 和BCNT 的組合;圖 8是線性2D 傳輸?shù)臏y(cè)試結(jié)果,它說(shuō)明,不管BCNT 是多少,帶寬由ACNTxBCNT 的乘積決定。

圖8 線性 2D 傳輸

如果2D 傳輸不是線性的,帶寬的利用率完全有ACNT 決定(參見(jiàn)圖 7)。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 存儲(chǔ)器
    +關(guān)注

    關(guān)注

    38

    文章

    7484

    瀏覽量

    163761
  • TMS320C6678
    +關(guān)注

    關(guān)注

    3

    文章

    38

    瀏覽量

    18141
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    想建立一個(gè)TMS320C6678的工程,但是DEVICE選擇的時(shí)候沒(méi)有TMS320C6678的選項(xiàng),能指點(diǎn)一嗎?

    本帖最后由 一只耳朵怪 于 2018-6-19 14:37 編輯 我想建立一個(gè)TMS320C6678的工程,但是DEVICE選擇的時(shí)候沒(méi)有TMS320C6678的選項(xiàng),能指點(diǎn)一嗎?如下圖:?
    發(fā)表于 06-19 00:31

    請(qǐng)問(wèn)SM320C6678TMS320C6678的區(qū)別有哪些?

    出溫度范圍外,請(qǐng)問(wèn)SM320C6678TMS320C6678的區(qū)別有哪些?謝謝。
    發(fā)表于 07-24 06:42

    TMS320C6678 連接CMOS攝像頭的接口,請(qǐng)問(wèn)是將攝像頭連接到TMS320C6678的哪個(gè)端口?

    您好!我們項(xiàng)目中需要使用TMS320C6678連接攝像頭進(jìn)行圖像數(shù)據(jù)采集,請(qǐng)問(wèn)是將攝像頭連接到TMS320C6678的哪個(gè)端口?是將CMOS攝像頭直接連上嗎?還是中間需要轉(zhuǎn)換
    發(fā)表于 08-03 08:33

    請(qǐng)問(wèn)tms320c6678在CPCI板卡上如何設(shè)計(jì)

    我想用tms320c6678作為處理設(shè)計(jì)一款CPCI的板卡,可是6678上只有PCIE,沒(méi)有PCI,我應(yīng)該怎么做才能實(shí)現(xiàn)6678與上位機(jī)之間通信,謝謝?。?!
    發(fā)表于 12-28 11:05

    TMS320C6678處理性能怎么樣?

    TMS320C6678處理性能怎么樣?怎么探討TMS320C6678處理的VLFFT演示?
    發(fā)表于 04-19 10:53

    TI TMS320C6678是什么?有何功能

    CPU處理TI TMS320C6678是一款TI KeyStone C66x多核定點(diǎn)/浮點(diǎn)DSP處理,集成了8個(gè)C66x核,每核心主頻高
    發(fā)表于 12-30 06:08

    TMS320C6678的相關(guān)資料推薦

    CPU處理TI TMS320C6678是一款TI KeyStone C66x多核定點(diǎn)/浮點(diǎn)DSP處理,集成了8個(gè)C66x核,每核心主頻高
    發(fā)表于 01-03 06:07

    TI推出適合高性能計(jì)算的8核DSP產(chǎn)品TMS320C6678/TMS320TCI6609

    德州儀器 (TI) 宣布推出 TMS320C66x系列最新產(chǎn)品TMS320C6678TMS320TCI6609 數(shù)字信號(hào)處理 (DSP),為開(kāi)發(fā)人員帶來(lái)業(yè)界
    發(fā)表于 11-22 10:40 ?3165次閱讀

    TMS320C6678視頻編解碼實(shí)現(xiàn)

    TI 提供了包含有綜合而全面的視頻、音頻和語(yǔ)音編解碼組合的全新多媒體解決方案。TMS320C6678可以幫助實(shí)現(xiàn)系統(tǒng)級(jí)的低成本、低功耗和高密度媒體解決方案,適用于多媒體網(wǎng)關(guān)、IMS 媒體服務(wù)、視頻會(huì)議服務(wù)以及視頻廣播設(shè)備等應(yīng)
    發(fā)表于 01-20 15:52 ?15次下載

    TMS320C6678的用于多核軟件開(kāi)發(fā)套件 (MCSDK) K的安裝資料

    TMS320C6678的用于多核軟件開(kāi)發(fā)套件 (MCSDK) K的安裝資料
    發(fā)表于 10-19 09:25 ?15次下載
    <b class='flag-5'>TMS320C6678</b>的用于多核軟件開(kāi)發(fā)套件 (MCSDK) K的安裝資料

    TMS320C6678處理的VLFFT演示探討與研究

    1,2,4或8核時(shí)各自的運(yùn)行時(shí)間。演示的結(jié)果證明了C66X DSP內(nèi)核的優(yōu)異性能,以及TMS320C6678處理跨多核平行化執(zhí)行性能與內(nèi)核
    發(fā)表于 01-31 22:58 ?4373次閱讀
    <b class='flag-5'>TMS320C6678</b>處理<b class='flag-5'>器</b>的VLFFT演示探討與研究

    TMS320C6678存儲(chǔ)器訪問(wèn)性能詳細(xì)中文資料

    TMS320C6678 有8 個(gè)C66x 核,典型速度是1GHz,每個(gè)核有 32KB L1D SRAM,32KBL1P SRAM 和512KB LL2 SRAM;所有DSP 核共享4MB SL2 SRAM。一個(gè)64-bit1333MTS DDR3 SDRAM接口可以支持8
    發(fā)表于 04-26 17:46 ?14次下載
    <b class='flag-5'>TMS320C6678</b><b class='flag-5'>存儲(chǔ)器</b><b class='flag-5'>訪問(wèn)</b><b class='flag-5'>性能</b>詳細(xì)中文資料

    TMS320C6678 多核定點(diǎn)和浮點(diǎn)數(shù)字信號(hào)處理

    電子發(fā)燒友網(wǎng)為你提供TI(ti)TMS320C6678相關(guān)產(chǎn)品參數(shù)、數(shù)據(jù)手冊(cè),更有TMS320C6678的引腳圖、接線圖、封裝手冊(cè)、中文資料、英文資料,TMS320C6678真值表,TMS32
    發(fā)表于 11-02 19:35
    <b class='flag-5'>TMS320C6678</b> 多核定點(diǎn)和浮點(diǎn)數(shù)字信號(hào)處理<b class='flag-5'>器</b>

    TI TMS320C6678 DSP多核通信開(kāi)發(fā)說(shuō)明手冊(cè)

    前言本文主要介紹TMS320C6678處理開(kāi)發(fā)中比較常用的兩種多核通信方式:TI-IPC和OpenMP,以及多核編程注意事項(xiàng)。OpenMP依賴于BIOS-MCSDK多核軟件開(kāi)發(fā)包中
    發(fā)表于 01-06 09:37 ?32次下載

    基于TMS320C6678的八核DSP雷達(dá)信號(hào)分選電路

    電子發(fā)燒友網(wǎng)站提供《基于TMS320C6678的八核DSP雷達(dá)信號(hào)分選電路.pdf》資料免費(fèi)下載
    發(fā)表于 11-06 10:28 ?1次下載
    基于<b class='flag-5'>TMS320C6678</b>的八核DSP雷達(dá)信號(hào)分選電路
    RM新时代网站-首页