本文旨在讓你快速入門opencv。
OpenCV
OpenCV是計(jì)算機(jī)視覺(jué)中最受歡迎的庫(kù),最初由intel使用C和C ++進(jìn)行開(kāi)發(fā)的,現(xiàn)在也可以在python中使用。該庫(kù)是一個(gè)跨平臺(tái)的開(kāi)源庫(kù),是免費(fèi)使用的。OpenCV庫(kù)是一個(gè)高度優(yōu)化的庫(kù),主要關(guān)注實(shí)時(shí)應(yīng)用程序。 OpenCV庫(kù)是2500多種優(yōu)化算法的組合,可用于檢測(cè)和識(shí)別不同的人臉,實(shí)時(shí)識(shí)別圖像中的對(duì)象,使用視頻和網(wǎng)絡(luò)攝像頭對(duì)不同的人類動(dòng)作進(jìn)行分類,跟蹤攝像機(jī)的運(yùn)動(dòng),跟蹤運(yùn)動(dòng)對(duì)象(例如汽車,人等),實(shí)時(shí)計(jì)數(shù)對(duì)象,縫合圖像來(lái)產(chǎn)生高分辨率圖像,從圖像數(shù)據(jù)庫(kù)中查找相似的圖像,從使用閃光燈拍攝的圖像中消除紅眼并提高圖像質(zhì)量,跟蹤眼睛的運(yùn)動(dòng),跟蹤臉部等。 它擁有大約4.7萬(wàn)活躍用戶社區(qū),下載量超過(guò)1800萬(wàn)。谷歌,亞馬遜,特斯拉,微軟,本田等許多大公司都使用Open cv來(lái)改善他們的產(chǎn)品,它更是驅(qū)動(dòng)了AI的發(fā)展。
先決條件
在開(kāi)始編寫代碼之前,我們需要在設(shè)備上安裝opencv。 如果你是ProIn編程專家,并且熟悉每個(gè)IDE,那么請(qǐng)使用Pycharm并從設(shè)置中的程序包管理器安裝OpenCV-python。 如果你是初學(xué)者或中級(jí)程序員,或者只是想關(guān)注博客,那么我們將使用代碼編輯器而不是IDE。 只需轉(zhuǎn)到Visual Studio Code網(wǎng)站并根據(jù)你的操作系統(tǒng)下載最新版本即可。
https://code.visualstudio.com/download
現(xiàn)在,我們將創(chuàng)建一個(gè)虛擬環(huán)境,并在其中安裝opencv。打開(kāi)終端,然后使用cd定位到桌面,使用mkdir 創(chuàng)建一個(gè)名為opencv的文件夾,然后運(yùn)行以下命令。
python-mvenvenv 現(xiàn)在,使用envscriptsactivate激活環(huán)境,你會(huì)在C:UsersusernameDesktopopencv之前看到小括號(hào)(env)出現(xiàn)。 現(xiàn)在,只需使用pip安裝OpenCV。
pipinstallopencv-python
我們會(huì)在本文中涵蓋7個(gè)主題
1. 讀,寫和顯示圖像 2. 讀取視頻并與網(wǎng)絡(luò)攝像頭集成 3. 調(diào)整大小和裁剪圖像 4. 基本的圖像過(guò)濾器使用的函數(shù) 5. 繪制不同的形狀 6. 在圖像上書(shū)寫文字 7. 檢測(cè)并裁剪臉部
讀,寫和顯示圖像
要使用Opencv讀取圖像,我們有imread()函數(shù); 要顯示圖像,有imshow()函數(shù),而對(duì)于書(shū)寫,我們有imwrite()函數(shù)。讓我們看看它們的語(yǔ)法。 imread():
img=cv2.imread("PATH_TO_IMAGE.jpg/png") Example img=imread("images/dog0.jpg") imshow():
cv2.imshow("WINDOWNAME",IMG_VAR) Example imshow("DogImage",img) imwrite():
cv2.imwrite(FILENAME,IMAGE) filename:Astringrepresentingthefilename.Thefilenamemustincludeimageformatlike.jpg,.png,etc. image:Itistheimagethatistobesaved. Example cv2.imwrite('images/img',img)
讀取視頻并與網(wǎng)絡(luò)攝像頭集成
讀取視頻文件與在OpenCV中讀取圖像文件非常相似,區(qū)別在于我們使用了cv2.videocapture。 句法
video=cv2.VideoCapture("FILEPATH.mp4") Example video=cv2.VideoCapture("video/dog/dog.mp4") 視頻是許多幀結(jié)合在一起的集合,每幀都是一幅圖像。要使用OpenCV觀看視頻,我們只需要使用while循環(huán)顯示視頻的每一幀。
whileTrue: success,img=cap.read() cv2.imshow("Video",img) ifcv2.waitKey(1)&0xff==ord('q'):##key'q'willbreaktheloop break 要與網(wǎng)絡(luò)攝像頭集成,我們需要傳遞網(wǎng)絡(luò)攝像頭的端口值而不是視頻路徑。如果你使用的是筆記本電腦,但沒(méi)有連接任何外部網(wǎng)絡(luò)攝像頭,則只需傳遞參數(shù)0;如果你有外部網(wǎng)絡(luò)攝像頭,則傳遞參數(shù)1。
cap=cv2.VideoCapture(0) cap.set(3,640)##Framewidth cap.set(4,480)##FrameHeight cap.set(10,100)##Brightness whileTrue: success,img=cap.read() cv2.imshow("Video",img) ifcv2.waitKey(1)&0xff==ord('q'): break
調(diào)整大小和裁剪圖像
調(diào)整大小是更改圖像形狀的過(guò)程。在Opencv中,我們可以使用resize函數(shù)調(diào)整圖像形狀的大小。 句法
cv2.resize(IMG,(WIDTH,HEIGHT)) IMG:imagewhichwewanttoresize WIDTH:newwidthoftheresizeimage HEIGHT:newheightoftheresizeimage Example cv2.resize(img,(224,224)) 要首先調(diào)整圖像的大小,我們需要知道圖像的形狀。我們可以使用shape來(lái)找到任何圖像的形狀,然后根據(jù)圖像形狀,可以增加或減小圖像的大小。讓我們看看示例。
importcv2 img=cv2.imread("images/img0.jpg")##Chooseanyimage print(img.shape) imgResize=cv2.resize(img,(224,224))##Decreasesize imgResize2=cv2.resize(img,(1024,1024))##Increasesize cv2.imshow("Image",img) cv2.imshow("ImageResize",imgResize) cv2.imshow("ImageIncreasesize",imgResize2) print(imgResize.shape) cv2.waitKey(0) 如果你不想對(duì)寬度和高度進(jìn)行硬編碼,也可以使用形狀,然后使用索引來(lái)增加寬度和高度。
importcv2 img=cv2.imread("images/img0.jpg")##Chooseanyimage print(img.shape) shape=img.shape imgResize=cv2.resize(img,(shape[0]//2,shape[1]//2))##Decreasesize imgResize2=cv2.resize(img,(shape[0]*2,shape[1]*2))##Increasesize cv2.imshow("Image",img) cv2.imshow("ImageResize",imgResize) cv2.imshow("ImageIncreasesize",imgResize2) print(imgResize.shape) cv2.waitKey(0) 裁剪圖像 裁剪是獲取圖像的一部分過(guò)程。在OpenCV中,我們可以通過(guò)定義裁剪后的矩形坐標(biāo)來(lái)執(zhí)行裁剪。 句法
imgCropped=img[y1:y2,x1:x2] (x1,y1):top-leftvertex (x2,y2):bottom-rightvertex Example imgCropped=img[0:100,200:200] 使用裁剪方法,讓我們嘗試從圖像中獲取蒙娜麗莎的臉。
importcv2 img=cv2.imread("images/img0.jpg") imgCropped=img[50:250,120:330] cv2.imshow("Imagecropped",imgCropped) cv2.imshow("Image",img) cv2.waitKey(0) 你也可以使用paint來(lái)找到(x1,y1),(x2,y2)的正確坐標(biāo)。 右鍵單擊圖像并保存,嘗試從圖像中獲取王卡。 提示:使用paint來(lái)找到正確的坐標(biāo),最后使用調(diào)整大小來(lái)增加裁剪圖像的大小。 “在尋求解決方案之前,請(qǐng)嘗試自己動(dòng)手做?!?解決方案-https://gist.github.com/Abhayparashar31/9b01473431de765c0a73e81271233d91
基本的圖像過(guò)濾器使用的函數(shù)
我們可以在圖像上使用許多基本的濾鏡操作,例如將圖像轉(zhuǎn)換為灰度圖像,模糊圖像等等。讓我們一一看一下比較重要的操作。 將圖像轉(zhuǎn)為灰度圖像 要將圖像轉(zhuǎn)換為灰度,我們可以使用一個(gè)函數(shù)cvtColor,這里我們將cv2.COLOR_BGR2GRAY作為參數(shù)傳遞。
imgGray=cv2.cvtColor(IMG,cv2.CODE) IMG:Originalimage CODE:ConversioncodeforGray(COLOR_BGR2GRAY) Example imgGray=cv2.cvtColor(img,cv2.COLOR_BGR2GRAY) 將圖像轉(zhuǎn)為HSV 要將圖像轉(zhuǎn)換為HSV,我們可以使用函數(shù)cvtColor,這里我們將cv2.COLOR_BGR2HSV作為參數(shù)傳遞。它主要用于對(duì)象跟蹤。
imgGray=cv2.cvtColor(IMG,cv2.CODE) IMG:Originalimage CODE:ConversioncodeforGray(COLOR_BGR2HSV) Example imgHsv=cv2.cvtColor(img,cv2.COLOR_BGR2HSV) 圖像模糊 模糊用于去除圖像中的多余噪聲,也稱為平滑,這是對(duì)圖像應(yīng)用低通濾波器的過(guò)程。要在Opencv中使用模糊,我們有一個(gè)函數(shù)GaussianBlur。
imgBlur=cv2.GaussianBlur(img,(sigmaX,sigmaY),kernalSize) kernalsize?ASizeobjectrepresentingthesizeofthekernel. sigmaX?AvariablerepresentingtheGaussiankernelstandarddeviationinXdirection. sigmaY-sameassigmaX Exmaple imgBlur=cv2.GaussianBlur(img,(3,3),0) 邊緣檢測(cè) 在OpenCV中,我們使用Canny邊緣檢測(cè)器來(lái)檢測(cè)圖像中的邊緣,也有不同的邊緣檢測(cè)器,但最著名的是Canny邊緣檢測(cè)器。Canny邊緣檢測(cè)器是一種邊緣檢測(cè)算子,它使用多階段算法來(lái)檢測(cè)圖像中的大范圍邊緣,它由John F. Canny在1986年開(kāi)發(fā)。
imgCanny=cv2.Canny(img,threshold1,threshold2) threshold1,threshold2:Differentvaluesofthresholddifferentforeveryimages Example imgCanny=cv2.Canny(img,100,150) 膨脹 膨脹是用來(lái)增加圖像中邊緣的大小。首先,我們定義一個(gè)大小為奇數(shù)(5,5)的核矩陣,然后利用核函數(shù)對(duì)圖像進(jìn)行放大。我們對(duì)Canny邊緣檢測(cè)器的輸出圖像進(jìn)行了放大處理。
kernel=np.ones((5,5),np.uint8)##DEFININGKERNELOF5x5 imgDialation=cv2.dilate(imgCanny,kernel,iterations=1)##DIALATION 腐蝕 腐蝕是擴(kuò)張的反面,它用于減小圖像邊緣的尺寸。首先,我們定義一個(gè)奇數(shù)(5,5)的核矩陣大小,然后使用核對(duì)圖像執(zhí)行腐蝕。我們對(duì)Canny邊緣檢測(cè)器的輸出圖像施加腐蝕。
kernel=np.ones((5,5),np.uint8)##DEFININGKERNELOF5x5 imgDialation=cv2.erode(imgCanny,kernel,iterations=1)##EROSION 現(xiàn)在,在同一程序中將所有基礎(chǔ)函數(shù)應(yīng)用于Monalisa映像。
繪制不同的形狀
我們可以使用OpenCV來(lái)繪制矩形,圓形,直線等不同的形狀。 矩形: 要在圖像上繪制矩形,我們使用矩形函數(shù)。在函數(shù)中,我們傳遞寬度,高度,X,Y,RGB中的顏色,厚度作為參數(shù)。
cv2.rectangle(img,(w,h),(x,y),(R,G,B),THICKNESS) w:width h:height x:distancefromxaxis y:distancefromyaxis R,G,B:colorinRGBform(255,255,0) THICKNESS:thicknessofrectangel(integer) Example cv2.rectangle(img,(100,300),(200,300),(255,0,255),2) 圓: 要繪制一個(gè)圓,我們使用cv2.circle。我們傳遞x,y,半徑大小,RGB形式的顏色,厚度作為參數(shù)。
cv2.circle(img,(x,y),radius,(R,G,B),THICKNESS) x:distancefromxaxis y:distancefromyaxis radius:sizeofradius(integer) R,G,B:colorinRGBform(255,255,0) THICKNESS:thicknessofrectangel(integer) Example cv2.circle(img,(200,130),90,(255,255,0),2) 線: 要繪制一條線,我們使用cv2.line,使用起點(diǎn)(x1,y1),終點(diǎn)(x2,y2),RGB形式的顏色,厚度作為參數(shù)。
cv2.line(img,(x1,y1),(x2,y2),(R,G,B),THICKNESS) x1,y1:startpointofline(integer) x2,y2:endpointofline(integer) R,G,B:colorinRGBform(255,255,0) THICKNESS:thicknessofrectangel(integer) Example cv2.line(img,(110,260),(300,260),(0,255,0),3)
在圖像上書(shū)寫文字
在OpenCV中,我們有一個(gè)函數(shù)cv2.puttext, 可以在特定位置的圖像上寫文本。它以圖像,文本,x,y,顏色,字體,字體比例,粗細(xì)為輸入。
cv2.putText(img,text,(x,y),FONT,FONT_SCALE,(R,G,B),THICKNESS) img:imagetoputtexton text:texttoputonimage X:textdistancefromXaxis Y:textdistancefromYaxis FONT:TypeofFONT(ALLFONTTYPES) FONT_SCALE:ScaleofFont(Integer) R,G,B:colorinRGBform(255,255,0) THICKNESS:thicknessofrectangel(integer) Example cv2.putText(img,"HELLO",(120,250),cv2.FONT_HERSHEY_COMPLEX,1,(255,255,255),2) 下載Monalisa圖片。 任務(wù):使用形狀和文本為左側(cè)圖像中所示的Monalisa臉創(chuàng)建框架。 提示:首先是一個(gè)圓形,然后是矩形,然后根據(jù)圓形和矩形放置文本,最后根據(jù)文本放置一行。 解決方案- https://gist.github.com/Abhayparashar31/af36bf25ce61345266db4b54aba33be1
檢測(cè)并裁剪臉部
在創(chuàng)建人臉識(shí)別系統(tǒng)時(shí),人臉檢測(cè)是非常有用的。在OpenCV中,我們提供了許多可用于不同目的的預(yù)訓(xùn)練haar級(jí)聯(lián)分類器。在OpenCV GitHub上查看分類器的完整列表。
https://github.com/opencv/opencv/tree/master/data/haarcascades
為了檢測(cè)OpenCV中的人臉,我們使用了haarcascade_frontalface_default.xml分類器,它會(huì)返回我們圖像的四個(gè)坐標(biāo)(w,h,x,y),使用這些坐標(biāo),我們將在臉部上繪制一個(gè)矩形,然后使用相同的坐標(biāo)來(lái)裁剪臉部?,F(xiàn)在使用imwrite,我們將裁剪的圖像保存在目錄中。
importcv2 #Loadthecascade face_cascade=cv2.CascadeClassifier('haarcascade_frontalface_default.xml') #Readtheinputimage img=cv2.imread('images/img0.jpg') #Convertintograyscale gray=cv2.cvtColor(img,cv2.COLOR_BGR2GRAY) #Detectfaces faces=face_cascade.detectMultiScale(gray,1.3,4) #Drawrectanglearoundthefaces for(x,y,w,h)infaces: cv2.rectangle(img,(x,y),(x+w,y+h),(255,0,0),2) #CroppingFace crop_face=img[y:y+h,x:x+w] #SavingCroppedFace cv2.imwrite(str(w)+str(h)+'_faces.jpg',crop_face) cv2.imshow('img',img) cv2.imshow("imgcropped",crop_face) cv2.waitKey()
-
攝像機(jī)
+關(guān)注
關(guān)注
3文章
1596瀏覽量
60016 -
計(jì)算機(jī)視覺(jué)
+關(guān)注
關(guān)注
8文章
1698瀏覽量
45974 -
OpenCV
+關(guān)注
關(guān)注
31文章
634瀏覽量
41337
原文標(biāo)題:24K純干貨:OpenCV入門教程
文章出處:【微信號(hào):vision263com,微信公眾號(hào):新機(jī)器視覺(jué)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論