rm新时代app打不开,RM新时代入口

這篇文章將教會(huì)你如何運(yùn)用 Go 語(yǔ)言實(shí)現(xiàn)人臉識(shí)別

▌前言

如今，神經(jīng)網(wǎng)絡(luò)已經(jīng)非常流行，人們將它用于各種任務(wù)，特別是人臉識(shí)別應(yīng)用。

最近，我用一個(gè)以 Go 語(yǔ)言為后端的軟件，實(shí)現(xiàn)了一個(gè)人臉識(shí)別項(xiàng)目。它能夠識(shí)別出上傳照片中的人像 (如流行歌手)是誰(shuí)。這聽(tīng)起來(lái)不錯(cuò)，我決定試一下也給你們介紹一下項(xiàng)目的整個(gè)過(guò)程。

需要說(shuō)明的是，我盡可能地將所需的系統(tǒng)配置控制在較低水平，以便更多用戶可以通過(guò)使用便宜的服務(wù)器來(lái)進(jìn)行安裝，而這也是為什么實(shí)現(xiàn)過(guò)程不使用 CUDA 或 GPU 的原因——雖然你現(xiàn)在可以很容易地租用這樣的服務(wù)器，但它需要很高的成本，從而也會(huì)將很多潛在的使用者拒之門(mén)外。如果它只需要 CPU 而不需要外部依賴就能工作，情況會(huì)好很多。

▌選擇合適的語(yǔ)言

如果你詢問(wèn)數(shù)據(jù)科學(xué)家或者那些有神經(jīng)網(wǎng)絡(luò)實(shí)踐經(jīng)驗(yàn)的工作者，幾乎所有人都會(huì)建議你使用 Python 語(yǔ)言來(lái)解決機(jī)器學(xué)習(xí)任務(wù)?？紤]到語(yǔ)言社區(qū)，可用庫(kù)的數(shù)量，語(yǔ)言的簡(jiǎn)單性等，Python 語(yǔ)言確實(shí)是一個(gè)明智的選擇。此外，在 Python 中，你還可以通過(guò)一些精彩的實(shí)例說(shuō)明和文檔來(lái)找到一些受歡迎的人臉識(shí)別庫(kù)。

然而，這一次，我決定選用 Go 語(yǔ)言，主要有幾以下幾個(gè)原因：

我的論壇是用 Go 語(yǔ)言編寫(xiě)的，我個(gè)人也真的很喜歡以 single-binary 為后端所帶來(lái)的便捷性。因此，在后端部署并整合人臉識(shí)別過(guò)程，而不需要 Python 實(shí)現(xiàn)的一些依賴和 IPC，這是很棒的。

Go 語(yǔ)言通常比 Python 更快，消耗的內(nèi)存更少。任何高性能 Python 庫(kù)的關(guān)鍵部分都是用 C / C++ 語(yǔ)言編寫(xiě)的，因此，無(wú)論如何你都會(huì)有 Python VM 的開(kāi)銷。我偏愛(ài)于更快的語(yǔ)言，除非這種語(yǔ)言會(huì)嚴(yán)重影響開(kāi)發(fā)時(shí)間。我不會(huì)用 C或C++ 作為 Web 應(yīng)用程序編寫(xiě)的主要語(yǔ)言，但 Go語(yǔ)言很好，它幾乎和 Python 一樣簡(jiǎn)單。

我沒(méi)有在 Go 語(yǔ)言中找到人臉識(shí)別的有關(guān)庫(kù)，因此用 Go 語(yǔ)言實(shí)現(xiàn)這樣一個(gè)應(yīng)用，對(duì)于整個(gè)社區(qū)而言，都是一件有趣又有幫助的事。

▌選擇合適的框架

如前所述，神經(jīng)網(wǎng)絡(luò)以及相應(yīng)的實(shí)現(xiàn)框架如今正被廣泛地使用。僅在計(jì)算機(jī)視覺(jué)領(lǐng)域，可用的框架就有 Caffe，Torch，TensorFlow 等。

但是，有一個(gè)非?？岬臋C(jī)器學(xué)習(xí)庫(kù) —— dlib 庫(kù)，一下就吸引了我的注意力。首先，它是用 C ++ 語(yǔ)言編寫(xiě)的，因此你可以使用 cgo 輕松地創(chuàng)建 Go 語(yǔ)言綁定。其次，在 Wild benchmarks 基準(zhǔn)的人臉識(shí)別任務(wù)上，據(jù)說(shuō)它能實(shí)現(xiàn) 99.38％的準(zhǔn)確性，這聽(tīng)起來(lái)是很不可思議的。再者，現(xiàn)在一些流行的人臉識(shí)別庫(kù) face_recognition 和 openface 在底層都使用 dlib 庫(kù)，因此它在該任務(wù)上會(huì)是一個(gè)非常好的選擇。

▌安裝依賴項(xiàng)

一旦框架確定下來(lái)，那么我們要如何在機(jī)器上開(kāi)發(fā)并部署這個(gè)項(xiàng)目呢？首先，C++ 依賴項(xiàng)的安裝將會(huì)有很大的困難，因?yàn)槟銦o(wú)法通過(guò)簡(jiǎn)便的“go get”或“pip install”命令來(lái)實(shí)現(xiàn)。要么只能希望你的操作系統(tǒng)存儲(chǔ)庫(kù)中提供這些依賴庫(kù)，要么你只能通過(guò)繁瑣的編譯過(guò)程來(lái)安裝，這樣的話，這個(gè)問(wèn)題就更加令人討厭，因?yàn)橛性S多人都在 dlib 編譯過(guò)程碰到問(wèn)題。

如果你不得不通過(guò)編譯過(guò)程來(lái)安裝，那么可以參考一下下面的教程，也許會(huì)有幫助

https://gist.github.com/ageitgey/629d75c1baac34dfa5ca2a1928a7aeaf

幸運(yùn)的是，我們有更好的選擇：如果用戶的目標(biāo)系統(tǒng)已知，我們可以構(gòu)建 dlib 庫(kù)的二進(jìn)制安裝包來(lái)大大簡(jiǎn)化整個(gè)過(guò)程。說(shuō)到服務(wù)器軟件，Ubuntu 幾乎是系統(tǒng)標(biāo)配，因此首先要保證你能支持這個(gè)系統(tǒng)。

Ubuntu的標(biāo)準(zhǔn)倉(cāng)庫(kù)中自帶有 dlib庫(kù)，但其版本太舊了：人臉識(shí)別僅支持 dlib19.3 版本，所以我們需要構(gòu)建自己的包。我為 Ubuntu 16.04 和 18.04 創(chuàng)建了 PPA (自定義存儲(chǔ)庫(kù))，安裝過(guò)程非常簡(jiǎn)單，如下：

sudoadd-apt-repositoryppa:kagamih/dlibsudoapt-getupdatesudoapt-getinstalllibdlib-dev

以上命令將安裝最新的 dlib19.15 版本及 Intel 的數(shù)學(xué)核心庫(kù)，對(duì)于 Intel 處理器而言，這似乎是標(biāo)準(zhǔn) BLAS 和 LAPACK 接口的最快實(shí)現(xiàn)。

對(duì)于 Debian sid 和 Ubuntu 18.10 (尚未發(fā)布) 而言，標(biāo)準(zhǔn)倉(cāng)庫(kù)中同樣提供了 dlib 的安裝過(guò)程，你只需要如下命令：

sudoapt-getinstalllibdlib-devlibopenblas-dev

這將使用 OpenBLAS 來(lái)代替 MKL，實(shí)現(xiàn)的速度同樣非?？?。或者，你也可以通過(guò) enable non-free package 并安裝 libmkl-dev 來(lái)實(shí)現(xiàn)。

我們還需要 libjpeg 來(lái)加載 JPEG 圖像：在 Ubuntu 上安裝 libjpeg-turbo8-dev 包，或在 Debian 上安裝 libjpeg62-turbo-dev。

到目前為止，我沒(méi)有給出其他系統(tǒng)的安裝說(shuō)明，如果你在安裝 dlib 過(guò)程中碰到問(wèn)題，可以訪問(wèn)我的 github 希望能為你提供合理有效的安裝建議。

GitHub 地址：

https://github.com/Kagami/go-face

此外，我還考慮為 dlib 庫(kù)提供 Docker 鏡像 (其中有少部分內(nèi)容已存在)，許多具有復(fù)雜依賴關(guān)系的項(xiàng)目都傾向于使用這種分布式方法。但在我看來(lái)，一個(gè)本機(jī)包能夠?yàn)橛脩籼峁└玫捏w驗(yàn)，你不需要在控制臺(tái)編寫(xiě)長(zhǎng)命令，也不需要處理 sandbox 環(huán)境中的內(nèi)容。

▌寫(xiě)入依賴庫(kù)

當(dāng)前人臉識(shí)別庫(kù)地工作原理通常是：通過(guò)為照片上的每張人臉?lè)祷匾唤M數(shù)字 (矢量嵌入或描述符) 來(lái)比較區(qū)分它們，并通過(guò)比較這些數(shù)字來(lái)找到圖像中人的名字 (通常是通過(guò)計(jì)算歐幾里德距離向量，得到屬于同一個(gè)人的兩張人臉的最小距離)。這個(gè)概念這次就不在這里贅述了。

創(chuàng)建圖像中人臉的原始代碼并不是個(gè)重要的問(wèn)題，這個(gè)過(guò)程幾乎是遵循官方的例子就可以了。你可以查看 facerec.cc 及其相應(yīng)的頭文件 facerec.h，其中定義了 5 個(gè)函數(shù)和幾個(gè)在 Go 語(yǔ)言和 dlib 庫(kù)之間的交互結(jié)構(gòu)。

在這里，雖然 dlib 庫(kù)支持所有流行的圖像格式，但它只能從文件中加載它們。這將導(dǎo)致混亂，因?yàn)槲覀兺ǔＶ粫?huì)將圖像保存在內(nèi)存中并將其寫(xiě)入臨時(shí)文件。因此，在這里我使用 libjpeg 來(lái)編寫(xiě)自己的圖像加載器。由于大多數(shù)照片都以該格式存儲(chǔ)的，因此這種格式的加載器足以勝任大部分的需要，以后有需要我還會(huì)添加其他格式的圖像加載器。

我把 C++ 和 Go 語(yǔ)言的連接層放在 face.go 中。它提供了 Face 結(jié)構(gòu)，用于保存圖像中人臉的坐標(biāo)及其描述符，并通過(guò) Recognizer 為所有操作提供接口，如初始化和實(shí)際識(shí)別。

一旦我們有了描述符，我們能做什么呢？在最簡(jiǎn)單的情況下，你可以通過(guò)比較未知描述符與所有已知描述符之間的歐幾里德距離。但這并不完美，即使是當(dāng)前最先進(jìn)的人臉識(shí)別技術(shù)也會(huì)得到錯(cuò)誤的答案。如果想稍微改善一下結(jié)果，我們需要使用每個(gè)人的許多圖像，并檢查這些圖像中是否有非常接近于所提供的人臉。

這也正是分類器 classify.cc 所做的工作。首先，計(jì)算距離，然后對(duì)這些距離進(jìn)行排序，計(jì)算同一個(gè)人在前 10 個(gè)最小距離中的點(diǎn)擊數(shù)。）

諸如支持向量機(jī)，將會(huì)在這個(gè)任務(wù)上提供更好的算法性能。 dlib 甚至為訓(xùn)練此類模型提供了便捷的 API。很少有文章會(huì)提到 SVM 在大型數(shù)據(jù)集上的性能，因此我打算先在大型集合上測(cè)試它。

▌使用

下面得到的結(jié)果你可以在 github 中查看：

import"github.com/Kagami/go-face"

GitHub 地址：

https://github.com/Kagami/go-face

相關(guān)的所有結(jié)構(gòu)和方法概述，請(qǐng)參閱 GoDoc 文檔，主要包括以下幾個(gè)內(nèi)容：

初始化識(shí)別器

識(shí)別所有的已知圖像并收集描述符

將具有相應(yīng)類別的已知描述符傳遞給識(shí)別器

獲取未知圖像的描述符

對(duì)其類別進(jìn)行分類

以下是一個(gè)工作示例，來(lái)說(shuō)明了上述的所有步驟：

packagemainimport("fmt""log""path/filepath""github.com/Kagami/go-face")//Pathtodirectorywithmodelsandtestimages.Hereit's//assumeditpointstothe//clone.constdataDir="testdata"http://Thisexampleshowsthebasicusageofthepackage:createan//recognizer,recognizefaces,classifythemusingfewknown//ones.funcmain(){//Inittherecognizer.rec,err:=face.NewRecognizer(dataDir)iferr!=nil{log.Fatalf("Can'tinitfacerecognizer:%v",err)}//Freetheresourceswhenyou'refinished.deferrec.Close()//Testimagewith10faces.testImagePristin:=filepath.Join(dataDir,"pristin.jpg")//Recognizefacesonthatimage.faces,err:=rec.RecognizeFile(testImagePristin)iferr!=nil{log.Fatalf("Can'trecognize:%v",err)}iflen(faces)!=10{log.Fatalf("Wrongnumberoffaces")}//Fillknownsamples.Intherealworldyouwouldusealotof//imagesforeachpersontogetbetterclassificationresults//butinourexamplewejustgetthemfromonebigimage.varsamples[]face.Descriptorvarcats[]int32fori,f:=rangefaces{samples=append(samples,f.Descriptor)//Eachfaceisuniqueonthatimagesogoestoitsown//category.cats=append(cats,int32(i))}//Namethecategories,i.e.peopleontheimage.labels:=[]string{"Sungyeon","Yehana","Roa","Eunwoo","Xiyeon","Kyulkyung","Nayoung","Rena","Kyla","Yuha",}//Passsamplestotherecognizer.rec.SetSamples(samples,cats)//Nowlet'strytoclassifysomenotyetknownimage.testImageNayoung:=filepath.Join(dataDir,"nayoung.jpg")nayoungFace,err:=rec.RecognizeSingleFile(testImageNayoung)iferr!=nil{log.Fatalf("Can'trecognize:%v",err)}ifnayoungFace==nil{log.Fatalf("Notasinglefaceontheimage")}catID:=rec.Classify(nayoungFace.Descriptor)ifcatID

運(yùn)行下面命令：

mkdir-p~/go&&cd~/go#Orcdtoyour$GOPATHmkdir-psrc/go-face-example&&cdsrc/go-face-examplegitclonehttps://github.com/Kagami/go-face-testdatatestdataeditmain.go#Pasteexamplecodegoget.../../bin/go-face-example

由于在 dlib 的代碼中大量使用了 C++ 模板，因此需要一些時(shí)間來(lái)編譯 go-face (在我的 i7 上大約需要運(yùn)行 1 分鐘)。幸運(yùn)的是，Go 語(yǔ)言能夠構(gòu)建輸出緩存，這樣可以在今后構(gòu)建的時(shí)候速度更快。

上面的示例輸出應(yīng)打印“Nayoung”，表示能夠正確識(shí)別出未知圖像。

▌模型

go-face 需要 shape_predictor_5_face_landmarks.dat 和

dlib_face_recognition_resnet_model_v1.dat 模型才能開(kāi)始工作。你可以從 dlib-models 倉(cāng)庫(kù)中下載它們：

mkdirmodels&&cdmodelswgethttps://github.com/davisking/dlib-models/raw/master/shape_predictor_5_face_landmarks.dat.bz2bunzip2shape_predictor_5_face_landmarks.dat.bz2wgethttps://github.com/davisking/dlib-models/raw/master/dlib_face_recognition_resnet_model_v1.dat.bz2bunzip2dlib_face_recognition_resnet_model_v1.dat.bz2

此外，當(dāng)你要運(yùn)行示例代碼時(shí)，還可以通過(guò) go-face-testdata 倉(cāng)庫(kù)來(lái)訪問(wèn)這些模型。

▌未來(lái)的工作

我對(duì)結(jié)果非常滿意，通過(guò)簡(jiǎn)單的 API，得到不錯(cuò)的識(shí)別結(jié)果，還可以輕松嵌入到 Go 的應(yīng)用程序中。當(dāng)然，還有需要改進(jìn)的地方：

為了追求簡(jiǎn)單性和速度，在創(chuàng)建描述符時(shí)，go-face 無(wú)法對(duì)圖像進(jìn)行一些預(yù)處理，如抖動(dòng)。但是，增加圖像預(yù)處理操作是很有必要的，因?yàn)樗赡軙?huì)提高識(shí)別的性能。

Dlib 庫(kù)支持很多圖像格式 (如 JPEG，PNG，GIF，BMP，DNG)，但是 go-face 目前只能實(shí)現(xiàn) JPEG 格式，未來(lái)的工作我們希望可以支持更多的格式。

正如 dlib 的作者 Davis 所建議的，相比于搜索最小距離，采用多類 SVM 可能會(huì)得到更好的分類結(jié)果，因此還需要進(jìn)行額外的測(cè)試驗(yàn)證。

在 go-face 中，除非真的需要，不然我盡量不復(fù)制值，但實(shí)際上它還測(cè)試過(guò)大樣本 (10,000+人臉數(shù)據(jù)集) 的測(cè)試性能，可能存在一些瓶頸，有待日后完善。

從人臉提取特征向量是一個(gè)強(qiáng)大的概念，因?yàn)槟悴恍枰占约旱挠?xùn)練數(shù)據(jù)，這也是一項(xiàng)非常艱巨的任務(wù) (Davis 曾提到創(chuàng)建 dlib 中 ResNet 模型所用到的 300 萬(wàn)張人臉數(shù)據(jù)集)，但為了獲得更高的識(shí)別性能這可能也是無(wú)法避免的，因此值得為自己模型的訓(xùn)練提供相應(yīng)的工具。

聲明：本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴

神經(jīng)網(wǎng)絡(luò)

神經(jīng)網(wǎng)絡(luò)

+關(guān)注

關(guān)注
42

文章
4771

瀏覽量
100713
人臉識(shí)別

人臉識(shí)別

+關(guān)注

關(guān)注
76

文章
4011

瀏覽量
81859
go語(yǔ)言

go語(yǔ)言

+關(guān)注

關(guān)注
1

文章
158

瀏覽量
9047

原文標(biāo)題：這一次，我拒絕了Python，選擇了Go

文章出處：【微信號(hào)：rgznai100，微信公眾號(hào)：rgznai100】歡迎添加關(guān)注！文章轉(zhuǎn)載請(qǐng)注明出處。

評(píng)論

相關(guān)推薦

基于Proteus和C語(yǔ)言實(shí)現(xiàn)

基于Proteus和C語(yǔ)言實(shí)現(xiàn)一共四個(gè)題目，有沒(méi)有人愿意嘗試一下？

發(fā)表于 07-14 06:20

如何使用C語(yǔ)言實(shí)現(xiàn)模糊PID控制？

發(fā)表于 09-24 08:54

C語(yǔ)言實(shí)現(xiàn)常用排序算法是什么？

發(fā)表于 10-19 06:41

DSP算法的c語(yǔ)言實(shí)現(xiàn)

DSP算法的c語(yǔ)言實(shí)現(xiàn)，又需要的朋友下來(lái)看看。

發(fā)表于 05-09 10:59 ?0次下載

PID控制算法的C語(yǔ)言實(shí)現(xiàn)（完整版）

PID控制算法的C語(yǔ)言實(shí)現(xiàn)一 PID算法原理

發(fā)表于 11-05 15:45 ?0次下載

用Go語(yǔ)言實(shí)現(xiàn)人臉識(shí)別，怎么做到的

如果你詢問(wèn)數(shù)據(jù)科學(xué)家或者那些有神經(jīng)網(wǎng)絡(luò)實(shí)踐經(jīng)驗(yàn)的工作者，幾乎所有人都會(huì)建議你使用 Python 語(yǔ)言來(lái)解決機(jī)器學(xué)習(xí)任務(wù)?？紤]到語(yǔ)言社區(qū)，可用庫(kù)的數(shù)量，語(yǔ)言的簡(jiǎn)單性等，Python 語(yǔ)言

發(fā)表于 08-26 09:56 ?7473次閱讀

人臉識(shí)別系統(tǒng)的四大運(yùn)用領(lǐng)域

受益于人工智能的快速發(fā)展，通過(guò)人臉識(shí)別來(lái)進(jìn)行身份驗(yàn)證的生物識(shí)別技術(shù)已經(jīng)開(kāi)始在很多場(chǎng)景當(dāng)中得到運(yùn)用。人臉識(shí)

發(fā)表于 08-26 11:16 ?3740次閱讀

人臉識(shí)別的多功能運(yùn)用

近年來(lái)，隨著科技技術(shù)的進(jìn)一步進(jìn)步，蘋(píng)果手機(jī)推出的人臉識(shí)別功能受到了廣大人群的追捧。人臉識(shí)別的功能的開(kāi)發(fā)運(yùn)用也越來(lái)越多，長(zhǎng)安歐尚X7也搭載上了

發(fā)表于 02-19 14:16 ?2152次閱讀

go語(yǔ)言實(shí)現(xiàn)的簡(jiǎn)單im即時(shí)通信系統(tǒng)

? 本文介紹了一個(gè) go 語(yǔ)言實(shí)現(xiàn)的簡(jiǎn)單 im 即時(shí)通信系統(tǒng)。簡(jiǎn)介純go實(shí)現(xiàn)的im即時(shí)通訊系統(tǒng)，各層可單獨(dú)部署，之間通過(guò)rpc通訊，支持集群，github地址 https

發(fā)表于 10-20 16:02 ?3644次閱讀

go語(yǔ)言實(shí)現(xiàn)的簡(jiǎn)單im即時(shí)通信系統(tǒng)解析

【導(dǎo)讀】本文介紹了一個(gè) go 語(yǔ)言實(shí)現(xiàn)的簡(jiǎn)單 im 即時(shí)通信系統(tǒng)。簡(jiǎn)介純go實(shí)現(xiàn)的im即時(shí)通訊系統(tǒng)，各層可單獨(dú)部署，之間通過(guò)rpc通訊，支持集群，github地址 https

發(fā)表于 10-26 09:22 ?4389次閱讀

Go 語(yǔ)言在極小硬件上的運(yùn)用（三） | Linux 中國(guó)

Go 語(yǔ)言在極小硬件上的運(yùn)用（三） | Linux 中國(guó)

發(fā)表于 11-23 18:21 ?8次下載

累加校驗(yàn)和C語(yǔ)言實(shí)現(xiàn)

累加校驗(yàn)和C語(yǔ)言實(shí)現(xiàn)

發(fā)表于 11-29 18:06 ?10次下載

基于VHDL語(yǔ)言實(shí)現(xiàn)遠(yuǎn)程防盜報(bào)警設(shè)計(jì)

電子發(fā)燒友網(wǎng)站提供《基于VHDL語(yǔ)言實(shí)現(xiàn)遠(yuǎn)程防盜報(bào)警設(shè)計(jì).pdf》資料免費(fèi)下載

發(fā)表于 11-08 14:33 ?0次下載

使用go語(yǔ)言實(shí)現(xiàn)一個(gè)grpc攔截器

在開(kāi)發(fā)grpc服務(wù)時(shí)，我們經(jīng)常會(huì)遇到一些通用的需求，比如：日志、鏈路追蹤、鑒權(quán)等。這些需求可以通過(guò)grpc攔截器來(lái)實(shí)現(xiàn)。本文使用go語(yǔ)言來(lái)實(shí)現(xiàn)一個(gè) grpc一元模式(Unary)攔截器

發(fā)表于 12-18 10:13 ?656次閱讀

使用C語(yǔ)言實(shí)現(xiàn)的CRC計(jì)算單元的例子

使用C語(yǔ)言實(shí)現(xiàn)的CRC計(jì)算單元的例子

發(fā)表于 05-16 16:16 ?959次閱讀