利用FFT IP Core實現(xiàn)FFT算法
摘要:結(jié)合工程實踐,介紹了一種利用FFT IP Core實現(xiàn)FFT的方法,設(shè)計能同時對兩路實數(shù)序列進行256點FFT運算,并對轉(zhuǎn)換結(jié)果進行求模平方運算,且對數(shù)據(jù)具有連續(xù)處理的能力。設(shè)計采用低成本的FPGA實現(xiàn),具有成本低、性能高、靈活性強、速度快等特點,而且通過工程應(yīng)用證明了設(shè)計是正確可行的。
由于FFT(快速傅里葉變換)的問世,促進了數(shù)字信號處理這門學(xué)科的成熟,它可應(yīng)用于傅里葉變換理論所能涉及的任何領(lǐng)域。FFT傳統(tǒng)實現(xiàn)
方法無非是軟件(軟件編程)和硬件(專用芯片ASIC)兩種,F(xiàn)PGA的出現(xiàn)使人們在FFT的實現(xiàn)方面又多了一種選擇。FPGA同時具有軟件編程的靈活性和ASIC電路的快速性等優(yōu)點,適合高速數(shù)字信號處理。大多數(shù)FPGA廠商都提供了可配置的邏輯核(Core)實現(xiàn)各種算法功能,其中包括FFT IP Core(知識產(chǎn)權(quán)核)。使用這些資源允許設(shè)計師將更多的時間和精力放在改善增加系統(tǒng)功能上,這無疑將大大減少設(shè)計風(fēng)險及縮短開發(fā)周期。
本設(shè)計采用了Altera公司的FFT IP Core實現(xiàn)FFT功能,可同時實現(xiàn)兩路256點實數(shù)數(shù)據(jù)的FFT轉(zhuǎn)換,并對轉(zhuǎn)換結(jié)果進行求模平方運算,設(shè)計對數(shù)據(jù)具有連續(xù)處理的能力。FPGA芯片選用的是有史以來成本最低的Altera公司的Cyclone系列的芯片,F(xiàn)FT內(nèi)核是Altera MegaCore FFT-V2.0.0,整個設(shè)計成本低、性能好,已經(jīng)成功地應(yīng)用到雷達產(chǎn)品中。
2 算法原理和FFT Core介紹
設(shè)計用到的算法包括同時計算兩個實函數(shù)的FFT算法和CORDIC算法。
2.1 同時計算兩個實函數(shù)的FFT算法
DFT(離散傅里葉變換)的定義為:
式(1)中,都假定時間函數(shù)x(n)是一個復(fù)函數(shù)。但是在許多FFT的實際應(yīng)用中,時間函數(shù)往往是實函數(shù)。下面介紹的算法可以有效地減少實數(shù)序列FFT的計算工作量,從而提高計算速度。該方法可歸納為如下幾個步驟:
①函數(shù)h(n)和g(n)是兩個實函數(shù),n=0,1,…,N-1;
②將其中的一個作為實部而另一個作為虛部,構(gòu)成復(fù)函數(shù)z(n)為:
z(n)=h(n)+jg(n), n=0,1,…,N-1;
③計算z(n)的N點DFT得:
式中,Zr(k)和Zi(k)分別是Z(k)的實部和虛部;
④從z(k)中分析出H(k)和G(k):
式中,H(k)和G(k)分別是h(n)和g(n)的DFT。
詳細(xì)的推導(dǎo)過程參見文獻[2]。
2.2 CORDIC算法原理
CORDIC(The Coordinate Rotational Digital Computer)算法是一種循環(huán)迭代算法,其基本思想是用一系列與運算基數(shù)相關(guān)角度的不斷偏擺從而逼近所需旋轉(zhuǎn)的角度。從廣義上講它是一個數(shù)值性計算逼近的方法,由于這些固定的角度與計算基數(shù)有關(guān),運算只有移位和加減??捎迷撍惴▉碛嬎愕暮瘮?shù)包括乘、除、平方根、正弦、余弦正切、向量旋轉(zhuǎn)(即復(fù)數(shù)乘法)以及指數(shù)運算等。CORDIC的基本原理如下。
向量x+jy,旋轉(zhuǎn)角度θ到向量x'+jy',假設(shè)的方向用δ表示,旋轉(zhuǎn)的角度為θi,并且θi滿足關(guān)系:tanθi=2i。則由文獻[3]的推導(dǎo)可知:
假設(shè)x[0]=b,y[0]=a,z[0]=0,則有:
式中, 為畸變因子,對于字長一定的運算,它為一常數(shù),如字長為16位時,K=1.6667。δi表示每一次旋轉(zhuǎn)的方向,當(dāng)y[i]≥0時,其值為1;當(dāng)y[i]≤0時,其值為-1。
2.3 FFT Core簡介
FFT-V2.0.0是Altera公司2004年2月新發(fā)布的FFT知識產(chǎn)權(quán)核,它是一個高性能、高度參數(shù)化的快速傅里葉變換(FFT)處理器,支持Cyclone、
Stratix II、Stratix GX、Stratix系列FPGA器件。該FFT Core功能是執(zhí)行高性能的正向復(fù)數(shù)FFT或反向的FFT(IFFT),采用基2/4頻域抽取(DIF)的FFT算法,其轉(zhuǎn)換長度為2m,這里6≤m≤14。在其內(nèi)部,F(xiàn)FT采用塊浮點結(jié)構(gòu),以在最大信噪比(SNR)和最小資源需求之間獲得最大的收益。FFT Core接收一個長度為N的、二進制補碼格式、順序輸入的復(fù)數(shù)序列作為輸入,輸出轉(zhuǎn)換域的、順序的復(fù)數(shù)數(shù)據(jù)序列。同時,一個累加塊指數(shù)被輸出,表示塊浮點的量化因子。FFT Core的轉(zhuǎn)換方向事先由一個輸入端口為每個數(shù)據(jù)轉(zhuǎn)換塊指定。
FFT Core可以設(shè)置兩種不同的引擎結(jié)構(gòu):四輸出(Quad-output FFT engine)和單輸出(Single-output FFT engine)。對于要求轉(zhuǎn)換時間盡量小的
應(yīng)用,四輸出引擎結(jié)構(gòu)是最佳的選擇;對于要求資源盡量少的應(yīng)用,單輸出引擎結(jié)構(gòu)比較合適。為了增加整個FFT Core的吞吐量,可以采用多并行引擎結(jié)構(gòu)。
FFT Core支持3種I/O數(shù)據(jù)流結(jié)構(gòu):連續(xù)(streaming)、緩沖突發(fā)(Buffered Burst)、突發(fā)(Burst)。連續(xù)I/O數(shù)據(jù)流結(jié)構(gòu)允許處理連續(xù)輸入數(shù)據(jù),輸出連續(xù)復(fù)數(shù)數(shù)據(jù)流,而不中斷輸入和輸出數(shù)據(jù);緩沖突發(fā)I/O數(shù)據(jù)流結(jié)構(gòu)與連續(xù)結(jié)構(gòu)相比,需要更少的存儲資源,但是,這是以減少平均吞吐
量為代價的;突發(fā)數(shù)據(jù)流結(jié)構(gòu)的操作與緩沖突發(fā)方式基本上一致,但突發(fā)方式則需要更少的存儲資源,這也是以降低吞吐量為代價的。
3 硬件設(shè)計
圖1整體原理圖
設(shè)計的整體原理圖如圖1所示。輸入和輸出緩沖器分別存儲預(yù)處理數(shù)據(jù)和FFT轉(zhuǎn)換結(jié)果;FFT運算器負(fù)責(zé)FFT運算;控制器為輸入和輸出緩沖器提供讀寫地址,并控制FFT運算的時序和緩沖器的讀寫操作;后處理單元從單路復(fù)數(shù)輸入頻譜數(shù)據(jù)中分離出兩路實數(shù)輸入頻譜數(shù)據(jù);求模運算器實現(xiàn)CORDIC算法,求取轉(zhuǎn)換結(jié)果的平方根。設(shè)計的輸入為兩路實數(shù)序列,一路作為實部,另一路作為虛部,由連續(xù)的256點的數(shù)據(jù)段組成;輸出是間斷的256點數(shù)據(jù)段,各數(shù)據(jù)段的前128點為第一路的頻譜數(shù)據(jù),后128點是第二路的頻譜數(shù)據(jù)。根據(jù)FFT頻譜關(guān)于中心點對稱的結(jié)果,只截取前半段頻譜數(shù)據(jù)并不會丟失任何信息。
整個系統(tǒng)的工作時序為:
①數(shù)據(jù)以5MHz的速率輸入到輸入緩沖器;
②FFT運算器以40MHz的速率從輸入緩沖器中取數(shù)進行運算;
③FFT運算結(jié)束時,將轉(zhuǎn)換結(jié)果存入到輸出緩沖器中;
④輸出緩沖器數(shù)據(jù)以20MHz的速率被送到后處理單元進行轉(zhuǎn)變;
⑤數(shù)據(jù)被送到求模運算器,進行CORDIC運算,輸出;
⑥當(dāng)③結(jié)束時,F(xiàn)FT運算器又回到起始狀態(tài),等待處理下一組數(shù)據(jù),從而使運算周而復(fù)始地進行。整個設(shè)計由控制器嚴(yán)格控制。
輸入和輸出緩沖器由FPGA內(nèi)部的RAM實現(xiàn),這些都相對簡單。下面重點介紹。FFT運算器、控制器、后處理單元和求模運算器。
3.1 FFT 運算器
FFT運算器采用FFT Core實現(xiàn),其引擎結(jié)構(gòu)為雙Single-output,I/O數(shù)據(jù)流采用突發(fā)(Burst)方式。FFT Core采用Atlantic Interface協(xié)議,輸入
接口視為主接收器,輸出接口視為主發(fā)送器。具體接口定義如表1所示。
信號 | 方向 | 描述 |
clk | 輸入 | FFT系統(tǒng)時鐘信號 |
reset | 輸入 | FFT高有效同步復(fù)位信號 |
master_sink_dav | 輸入 | 主接收器數(shù)據(jù)有效信號 |
master_sink_ena | 輸出 | 主接收器寫使能信號 |
master_sink_sop | 輸入 | 輸入數(shù)據(jù)包起始位指示信號 |
inv_i | 輸入 | 轉(zhuǎn)換方向控制信號 |
date_real_in[M-1...0] | 輸入 | 輸入實部數(shù)據(jù) |
data_imag_in[M-1...0] | 輸入 | 輸入虛部數(shù)據(jù) |
fft_real_out[M-1...0] | 輸出 | 輸出實部數(shù)據(jù) |
fft_imag_out[M-1...0] | 輸出 | 輸出虛部數(shù)據(jù) |
exponent_out[5...0] | 輸出 | 有符號數(shù)據(jù)塊指數(shù) |
master_source_dav | 輸入 | 子接收器接收有效指示信號 |
master_source_cna | 輸出 | 主發(fā)送器使能信號 |
master_source_sop | 輸出 | 輸出數(shù)據(jù)包起始位 |
master_source_eop | 輸出 | 輸出數(shù)據(jù)包結(jié)束位 |
具體的工作流程:系統(tǒng)復(fù)位后,數(shù)據(jù)源將master_sink_dav置位,表示有采樣數(shù)據(jù)等待輸入;作為回應(yīng),F(xiàn)FT Core將master_sink_ena置位,表示可以接收輸入數(shù)據(jù);數(shù)據(jù)源加載第一個復(fù)數(shù)數(shù)據(jù),同時master_sink_sop置位,表示輸入數(shù)據(jù)塊的起始;下一個時鐘,master_sink_sop被清零,輸入數(shù)據(jù)按照自然順序被加入。輸入數(shù)據(jù)達到256點時,系統(tǒng)自然啟動FFT運算。通過inv_i信號的置位/清零可以改變單個數(shù)據(jù)塊的FFT轉(zhuǎn)換方向,inv_i信號必須和master_sink_sop信號嚴(yán)格同步。當(dāng)FFT轉(zhuǎn)換結(jié)束時,子接收器已經(jīng)將master_source_dav信號置位,表示子接收器可以接收FFT的轉(zhuǎn)換結(jié)果;同時,master_source_ena信號置位,F(xiàn)FTCore按照自然順序輸出運算結(jié)果;在輸出過程中,
master_source_sop和master_source_eop信號被置位,表示輸出數(shù)據(jù)塊的起始和結(jié)束。詳細(xì)的描述參見文獻[4]。
3.2 控制器與后處理單元
控制器大體可分為三個部分:輸入緩沖控制(c_i)、FFT運算控制(c_f)、輸出緩沖控制(c_o)。c_i為輸入緩沖器提供讀/寫地址和相應(yīng)的讀/寫
控制信號;c_f為FFT運算器提供控制信號,嚴(yán)格控制FFT Core的工作時序;c_o為輸出緩沖器提供讀/寫地址及讀/寫控制信號??刂破魍ㄟ^VHDL語言編程的狀態(tài)機方式可以輕易實現(xiàn)。
后處理單元其實是式(2)和式(3)的硬件實現(xiàn),具體的原理如圖2所示。
圖2后處理單元原理圖
圖中標(biāo)識“mux”、“+”、“-”、“1/2”分別表示選擇器、加法器、減法器和除法器,dr、di、dnr、dni分別與式(1)和式(2)中的Zr(k)、
Zi(k)、Zr(N-k)、Zi(N-k)相對應(yīng)。當(dāng)sel等于0時,提取第一路實序列的頻譜數(shù)據(jù)G(k),實現(xiàn)式(1)功能;當(dāng)sel等于1時,提取第二路實序列的頻譜數(shù)據(jù),實現(xiàn)式(2)功能。
3.3 求模運算器
由于工程只要求求平方根,不涉及角度的計算,因此,CORDIC的角度計算部分沒有給出,但這并不會影響到幅度的計算。整個CORDIC采用全流水線結(jié)構(gòu),設(shè)計總共有16級流水線單元,各流水線單元結(jié)構(gòu)相似。CORDIC流水線結(jié)構(gòu)如圖3所示。
圖3 CORDIC流水線原理圖
該結(jié)果并不是最終結(jié)果,還要加一級幅度校正,以去除畸變因子的影響。
4 結(jié)束語
設(shè)計的輸入和輸出工作頻率相對較低,因而很容易滿足,關(guān)鍵是FFT Core的性能指標(biāo)。根據(jù)工程需要,輸入數(shù)據(jù)速率采用5MHz,F(xiàn)FT Core工作在40MHz,輸出轉(zhuǎn)換結(jié)果采用20MHz時鐘,在此條件下對設(shè)計進行硬件測試,結(jié)果證明設(shè)計功能正確、工作穩(wěn)定、性能優(yōu)越。另外,經(jīng)軟件時序仿真可知,F(xiàn)FT Core最高工作頻率可達到117.52MHz,通過提高運算時鐘,還可獲得更快的運算能力。
設(shè)計選用Altera公司的FFT Core,成功地在FPGA中實現(xiàn)了兩路連續(xù)256點實數(shù)序列FFT的算法,其設(shè)計成本低、性能好,已經(jīng)成功地應(yīng)用到
雷達產(chǎn)品中。由于FFT Core的可塑性很強,通過改動參數(shù)設(shè)置,就可輕易地使設(shè)計適應(yīng)于不同的產(chǎn)品。
參考文獻
[1]Uwe Meyer-Baese.數(shù)字信號處理的FPGA實現(xiàn)[M].北京:清華大學(xué)出版社,2003.
[2]侯朝煥,閻世尊,蔣銀林.實用FFT信號處理技術(shù)[M].北京:海洋出版社,1990.
[3]談宜育,卞文兵,李元等.一種基于CORDIC算法的R-θ變換ASIC[J].微電子學(xué),2000,30(3):166~167.
[4]李滔,韓月秋.基于流水線CORDIC算法的三角函數(shù)發(fā)生器.系統(tǒng)工程與電子技術(shù)[J],2000,22(4):85-87.
評論
查看更多