1、數(shù)字圖像處理的目的
數(shù)字圖像處理主要完成的任務(wù)有:
(1)提高圖像的視覺質(zhì)量以達(dá)到人眼主觀滿意或較滿意的效果。例如,圖像的增強(qiáng)﹑圖像的復(fù)原﹑圖像的幾何變換,圖像的代數(shù)運算,圖像的濾波處理等有可能使受到污染、干擾等因素影響產(chǎn)生的低清晰度、變形等圖像質(zhì)量問題得到有效的改善。
(2) 提取圖像中目標(biāo)的某些特征,以便于計算機(jī)分析或機(jī)器人識別。這些處理也可以劃歸于“圖像分析”的范疇。例如,邊緣檢測,圖像分割,紋理分析常用作模式識別、計算機(jī)視覺等高級處理的預(yù)處理。
(3)為了存儲和傳輸龐大的圖像和視頻信息,常常對這類數(shù)據(jù)進(jìn)行有效的壓縮。常用的方法有統(tǒng)計編碼預(yù)測編碼和正交變換編碼等。
(4)信息的可視化。如溫度場、流速場、生物組織內(nèi)部等許多信息并非可視,但轉(zhuǎn)化為視覺形式后可以充分利用人們對可視模式快速識別的自然能力,更便于人們觀察,分析、研究、理解大規(guī)模數(shù)據(jù)和許多復(fù)雜現(xiàn)象。信息可視化結(jié)合了科學(xué)可視化,人機(jī)交互,數(shù)據(jù)挖掘、圖像技術(shù),圖形學(xué),認(rèn)知科學(xué)等諸多學(xué)科的理論和方法,是研究人與計算機(jī)表示的信息,以及它們相互影響的技術(shù)。
(5)信息安全的需要,主要反映在數(shù)字圖像水印和圖像信息隱藏。這是圖像工程出現(xiàn)的新熱點之一。數(shù)字水印是利用多媒體數(shù)字產(chǎn)品中普遍存在的冗余數(shù)據(jù)與隨機(jī)性,把水印信息可見或不可見的嵌入到數(shù)字作品中﹐以期達(dá)到保護(hù)數(shù)字產(chǎn)品的版權(quán)或完整性的一種技術(shù)。在計算機(jī)通信﹑密碼學(xué)等學(xué)科也有其用武之地。
在這些目的中,華南理工大學(xué)土木視覺實驗室的工作重點放在提取圖像特征和信息的可視化。其中提取圖像特征用于識別結(jié)構(gòu)的響應(yīng)信息用于結(jié)構(gòu)狀態(tài)識別,信息可視化用于圖像輔助檢測,圖像輔助教學(xué),圖像輔助科研等。具體工作將在后續(xù)公眾號文章中分享。
2 、數(shù)字圖像處理的特點
數(shù)字圖像處理利用數(shù)字計算機(jī)或其他專用的數(shù)字設(shè)備處理圖像,與模擬方式相比具有以下鮮明的特點。
(1)處理精度高
圖像采集設(shè)備可將一幅模擬圖像數(shù)字化為任意大小和精度的二維數(shù)組供處理設(shè)備加工。根據(jù)應(yīng)用的需求,數(shù)字化的像素數(shù)可以從幾十到幾百萬,甚至上千萬,每個像素的等級可以量化為從1位到16位甚至更高,活動圖像的幀率可以從十幾赫茲到六十赫茲,高速攝像達(dá)幾千赫茲到上萬赫茲。
而對處理設(shè)備來說,不同數(shù)據(jù)量的圖像其處理程序大致是一樣的。圖像精度高這一點在現(xiàn)階段土木工程中并不突出,由于現(xiàn)有測量儀器的精度也已經(jīng)足夠高了?;趫D像識別技術(shù)的位移測量精度受限于儀器與被測物距離,測量光線等因素,測量精度并不理想。
(2)重現(xiàn)性能好
理論上,數(shù)字圖像處理不會因圖像的存儲、傳輸?shù)冗^程而導(dǎo)致圖像質(zhì)量的退化。圖像的質(zhì)量主要受數(shù)字化過程時取樣樣本數(shù)﹑量化精度,處理過程中的處理精度等的限制。由于在一定范圍內(nèi),人眼和機(jī)器視覺的分辨率都是有限的,因此只要保持足夠的處理精度,圖像重現(xiàn)性就會很好﹐能保證圖像的原貌。
(3)靈活性高
與模擬圖像處理相比較﹐由于圖像處理軟件功能強(qiáng)大、擴(kuò)展性好﹑用戶界面友好,數(shù)字圖像處理不僅能完成一般的線性和非線性處理,而且一切可以用程序?qū)崿F(xiàn)的智能信息處理方法都可以加以采用。
(4)圖像信息量大
在數(shù)字圖像處理中,一幅圖像可以看成是由圖像矩陣中的像素組成的,通常每個像素用紅﹑綠,藍(lán)三種顏色表示,每種顏色用8bit表示灰度級,一幅1024像素×1024像素不經(jīng)壓縮的真彩色圖像,數(shù)據(jù)量達(dá)3MB。一幅3240像素×2340像素的遙感圖像,采用4bit量化,占用約3.8MB的存儲空間。一幅中等分辨率的VGA640像素×480像素的256色圖像的數(shù)據(jù)量為300KB。
傳送一路PCM彩色電視圖像的速率達(dá)108Mbit/s,則每秒的數(shù)據(jù)量可達(dá)13.5MB。大數(shù)據(jù)量和傳輸速率對計算機(jī)的計算速度,網(wǎng)絡(luò)帶寬﹑媒體存儲容量等提出了很高的要求,如果精度及分辨率再提高,所需處理時間將大幅度增加,因此數(shù)據(jù)壓縮成為不可缺少的處理環(huán)節(jié)。
這段表述中僅僅提到了圖像自身存儲所需信息量大,其實圖像中所含信息本身具有高冗余性、同步性、高相關(guān)性、魯棒性等特點,這些特點才是土木工程中應(yīng)用圖像處理技術(shù)的關(guān)鍵。
(5)數(shù)字圖像信號占用的頻帶較寬
在模擬域,視頻信號的帶寬比音頻信號的帶寬要大幾個數(shù)量級。為了保證圖像的質(zhì)量,根據(jù)采樣定理,數(shù)字化后﹐數(shù)字視頻占用的頻帶進(jìn)一步加寬。所以,在成像﹑傳輸﹑存儲、處理,顯示等各個環(huán)節(jié)的實現(xiàn)上,技術(shù)難度較大,成本較高,寬頻帶對處理和傳輸設(shè)備提出了更高的要求,因此頻帶壓縮技術(shù)也是數(shù)字圖像處理的一個值得注意的問題。這一特點是由信息量大導(dǎo)致的。
(6) 處理費時
由于圖像數(shù)據(jù)量較大,因此處理比較費時。特別是采用區(qū)域處理方法時,由于處理結(jié)果與中心像素鄰域有關(guān)而導(dǎo)致花費的時間更多。要實現(xiàn)快速甚至實時處理圖像,就要對圖像處理系統(tǒng)提出更高的要求,多處理器并行處理器、嵌入式系統(tǒng)等專用處理系統(tǒng)為提高圖像處理速度提供了有效的解決方法。這一特點同樣是由信息量大導(dǎo)致的。
3、數(shù)字圖像處理的主要研究內(nèi)容
數(shù)字圖像處理的研究內(nèi)容大體可分為以下幾個方面。
(1)圖像信息的獲取和存儲
圖像的獲取是將自然界的圖像通過光學(xué)系統(tǒng)成像并由電子器件或系統(tǒng)轉(zhuǎn)化為模擬圖像信號,再由模擬/數(shù)字轉(zhuǎn)換器得到原始的數(shù)字圖像信號,也稱為圖像的采集。圖像信息的突出特點是數(shù)據(jù)量巨大,一般主要采用磁帶,磁盤或光盤進(jìn)行存儲。為解決海量存儲問題,主要研究數(shù)據(jù)壓縮、圖像格式及圖像數(shù)據(jù)庫技術(shù)等。
(2)圖像頻域變換
圖像陣列很大,直觀性強(qiáng),但圖像的頻率,紋理等特性在空間域中難以獲得和處理﹐計算量也很大。各種圖像變換的方法,如離散傅里葉變換﹑離散余弦變換,小波變換等,可以間接地將空間域的處理轉(zhuǎn)換到變換域進(jìn)行更有效的處理。
通過二維離散傅里葉變換(DFT),可以將空間域的圖像變換為圖像頻譜,再在頻率域進(jìn)行各種數(shù)字濾波以獲得圖像質(zhì)量的改善、數(shù)據(jù)量的壓縮或突出某些特征便于后期處理。通過離散傅里葉變換,可以將圖像變換到頻率域,通過不同頻段的不同處理,可以達(dá)到滿意的效果。
(3)圖像幾何變換
圖像幾何變換的目的是改變一幅圖像的大小或形狀。例如,通過平移、旋轉(zhuǎn)、放大、縮小、鏡像等,可以進(jìn)行兩幅以上圖像內(nèi)容的配準(zhǔn)﹐以便于進(jìn)行圖像之間內(nèi)容的對比檢測。在印章的真?zhèn)巫R別以及相似商標(biāo)檢測中,通常都會采用這類的處理。另外,對于圖像中景物的幾何畸變進(jìn)行校正,對圖像中的目標(biāo)物大小測量等,也需要進(jìn)行圖像幾何變換處理。
(4)圖像增強(qiáng)
圖像增強(qiáng)處理主要是突出圖像中感興趣的信息,而減弱或去除不需要的信息,從而使有用的信息得到加強(qiáng),便于區(qū)分或解釋。如強(qiáng)化圖像高頻分量,可使圖像中物體輪廓清晰,細(xì)節(jié)明顯;而強(qiáng)化低頻分量可減少圖像中的噪聲影響,即對高頻噪聲起到平滑作用,其主要方法有直方圖修正,偽彩色增強(qiáng)法﹑圖像平滑,圖像銳化等技術(shù)。
(5)圖像復(fù)原
圖像復(fù)原處理主要是去掉干擾和模糊,恢復(fù)圖像的本來面目,以達(dá)到清晰化的目的。圖像退化的原因是過程有噪聲﹑運動造成的模糊、光學(xué)系統(tǒng)的幾何失真等,如果對其有一定的了解,通過理論推導(dǎo)或?qū)嶒灁?shù)據(jù)甚至可以建立退化的數(shù)學(xué)模型,那么可以采用某種濾波方法在一定程度上從降質(zhì)的圖像恢復(fù)原始圖像。
(6)圖像壓縮編碼
數(shù)據(jù)量龐大是數(shù)字圖像的顯著特點之一。在多媒體技術(shù)中,現(xiàn)有的大容量存儲器和寬帶網(wǎng)絡(luò)技術(shù)仍不能滿足對圖像數(shù)據(jù)處理,存儲和傳輸?shù)男枰?。圖像信息具有較強(qiáng)的相關(guān)特性,存在大量冗余信息,因此通過改變圖像數(shù)據(jù)的表示方法,可對圖像的數(shù)據(jù)冗余進(jìn)行壓縮。另外,利用人類的視覺特性,可對圖像的視覺冗余進(jìn)行壓縮,由此來達(dá)到減小描述圖像數(shù)據(jù)量的目的。
(7)圖像分割
圖像可以看成是由背景和一個或多個目標(biāo)組成的。圖像分割是按一定的規(guī)則將圖像分成若干個有意義或感興趣的區(qū)域的過程,每個區(qū)域可代表一個對象。通過圖像分割,圖像中如邊緣﹑區(qū)域等有意義的特征部分被提取出來,
(8)圖像重建
圖像重建的目的是根據(jù)二維平面圖像數(shù)據(jù)構(gòu)造出三維物體的圖像。例如,在醫(yī)學(xué)影像技術(shù)中的CT成像技術(shù),就是將多幅斷層二維平面數(shù)據(jù)重建成可描述人體組織器官三維結(jié)構(gòu)的圖像。三維重建技術(shù)成為目前虛擬現(xiàn)實技術(shù)以及科學(xué)可視化技術(shù)的重要基礎(chǔ)。
(9)圖像隱藏
圖像隱藏的目的是將一幅圖像或者某些可數(shù)字化的媒體信息隱藏在一幅圖像中。在保密通信中,將需要保密的圖像在不增加數(shù)據(jù)量的前提下﹐隱藏在一幅可公開的圖像之中,同時要求達(dá)到不可見性及抗干擾性。圖像隱藏的重要應(yīng)用之一是數(shù)字水印技術(shù)。數(shù)字水印在維護(hù)數(shù)字媒體版權(quán)方面起著非常重要的作用。
4、數(shù)字圖像處理系統(tǒng)
圖像處理技術(shù)具有不接觸、快速、直觀、準(zhǔn)確的優(yōu)點,同時由于環(huán)境條件等因素的影響,圖像質(zhì)量不可能很高,必須采用數(shù)字圖像處理技術(shù)進(jìn)行幾何校正、恢復(fù)、增強(qiáng)等加工,從而還原圖像的本來面目。
(1)圖像數(shù)字化設(shè)備(攝像單元):掃描儀,數(shù)碼相機(jī),攝像機(jī)與圖像采集卡等。
(2)圖像處理計算機(jī):PC、工作站等,它可以實現(xiàn)通信(通信模塊通過局域網(wǎng)等實現(xiàn)網(wǎng)絡(luò)傳輸圖像數(shù)據(jù)),存儲(存儲模塊采用磁盤,光盤等)和圖像的處理與分析(主要是運算,用算法的形式描述,用軟件實現(xiàn))。
(3)圖像輸出設(shè)備:顯示器,打印機(jī)等。
5 、數(shù)字圖像處理的發(fā)展趨勢
數(shù)字圖像處理技術(shù)是20世紀(jì)60年代初開始發(fā)展起來的,經(jīng)過了初創(chuàng)期﹑發(fā)展期、普及期及廣泛應(yīng)用幾個階段。經(jīng)過幾十年的研究與發(fā)展,數(shù)字圖像處理的理論和方法進(jìn)一步完善,應(yīng)用范圍更加廣闊;已經(jīng)成為一門新興的交叉學(xué)科,現(xiàn)已進(jìn)人實用階段。
近幾年來,隨著計算機(jī)和各個相關(guān)領(lǐng)域研究的迅速發(fā)展,科學(xué)計算可視化、多媒體技術(shù)等研究和應(yīng)用的興起,數(shù)字圖像處理從一個專門領(lǐng)域的學(xué)科,變成了一種新型的科學(xué)研究和人機(jī)界面的工具,其研究和應(yīng)用呈現(xiàn)出蓬勃發(fā)展的嶄新勢頭。數(shù)字圖像處理的發(fā)展趨勢主要反映在以下幾個方面。
(1)從低分辨率向高分辨率方向發(fā)展
隨著圖像傳感器分辨率和計算機(jī)運算速度的不斷提高,圖像存儲器內(nèi)存、計算機(jī)內(nèi)存及外設(shè)存儲容量不斷增大,數(shù)字圖像由低分辨率向高分辨率不斷發(fā)展,數(shù)字圖像處理的運算量也越來越大,對處理和顯示設(shè)備的要求也越來越高。
(2)從二維(2D)向三維(3D)方向發(fā)展
三維圖像獲取及處理技術(shù)主要通過全息攝影實現(xiàn),或通過斷層掃描與圖像重建實現(xiàn)。隨著圖像技術(shù)和計算機(jī)技術(shù)的發(fā)展,三維圖像的展示將極大提升用戶的浸入感。
(3)從靜止圖像向動態(tài)圖像方向發(fā)展
隨著傳感器分辨率和主機(jī)運算速度的提高,計算機(jī)內(nèi)存及外存容量的增大,數(shù)字圖像處理由以靜止圖像處理為主發(fā)展到靜止圖像和動態(tài)圖像并存并相互補(bǔ)充相互促進(jìn)的局面。
(4)從單態(tài)圖像向多態(tài)圖像方向發(fā)展
多態(tài)圖像是指對于同一目標(biāo),景物或場景,采用不同的圖像傳感器或在不同條件下獲取圖像,然后對這些圖像進(jìn)行綜合處理和應(yīng)用。
參考文獻(xiàn)
[1]吳娛。 數(shù)字圖像處理[M]。 北京郵電大學(xué)出版社,2017.10,北京
土木視覺實驗室
—版權(quán)聲明—
僅用于學(xué)術(shù)分享,版權(quán)屬于原作者。
若有侵權(quán),請聯(lián)系刪除或修改!
編輯:jq
-
數(shù)字圖像處理
+關(guān)注
關(guān)注
7文章
103瀏覽量
18917
原文標(biāo)題:數(shù)字圖像處理技術(shù)概述
文章出處:【微信號:gh_f39db674fbfd,微信公眾號:尖刀視】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論