使用Python+OpenCV+Dlib實(shí)現(xiàn)人臉檢測與人臉特征關(guān)鍵點(diǎn)識別
今天,我們將學(xué)習(xí)如何檢測圖像中的人臉并提取面部特征,如眼睛、鼻子、嘴巴等。我們可以將這些信息作為一個預(yù)處理步驟來完成,例如捕捉照片中人物的人臉(手動或通過機(jī)器學(xué)習(xí)),創(chuàng)建效果來“增強(qiáng)”我們的圖像(類似于Snapchat等應(yīng)用程序中的效果),對人臉進(jìn)行情感分析等等。今天我們將通過引入DLib和從圖像中提取面部特征來將其提升到一個新的水平。相關(guān)閱讀:https://towardsdatascience.com/essential-opencv-functions-to-get-you-started-into-computer-vision-743df932e60Dlib是一個高級的機(jī)器學(xué)習(xí)庫,它是為解決復(fù)雜的現(xiàn)實(shí)世界問題而創(chuàng)建的。這個庫是用C++編程語言創(chuàng)建的,它與C/C++、Python和java一起工作。Dlib:http://dlib.net/值得注意的是,本教程可能需要對OpenCV庫有一定的了解,例如如何處理圖像、打開相機(jī)、圖像處理和一些小技巧。它是如何工作的?我們的臉有幾個可以識別的特征,比如眼睛、嘴巴、鼻子等等。當(dāng)我們使用DLib算法檢測這些特征時,我們實(shí)際上得到了每個特征點(diǎn)的映射。該映射由67個點(diǎn)(稱為地標(biāo)點(diǎn))組成,可識別以下特征:
顎點(diǎn)= 0–16右眉點(diǎn)= 17–21左眉點(diǎn)= 22–26鼻點(diǎn)= 27–35右眼點(diǎn)= 36–41左眼點(diǎn)= 42–47口角= 48–60嘴唇分?jǐn)?shù)= 61–67現(xiàn)在讓我們來了解如何提取特征。安裝要求與往常一樣,本文將用代碼演示示例,并將逐步指導(dǎo)你實(shí)現(xiàn)一個完整的人臉特征識別示例。但是在開始之前,你需要啟動一個新的Python項(xiàng)目并安裝3個不同的庫:opencv pythondlib如果像我一樣使用pipenv,可以使用以下命令安裝所有這些文件:pipenv install opencv-python, dlib如果你使用的是Mac和某些版本的Linux,則在安裝dlib時可能會遇到一些問題,如果遇到的是編譯錯誤,請檢查使用的CMake庫版本。在Mac中,確保你有可用的CMake,并且使用正確的版本運(yùn)行:brew install cmake對于其他操作系統(tǒng),請?jiān)诰檢查以獲得特定支持。步驟1:載入并顯示圖片我們將從小處著手并以代碼為基礎(chǔ),直到有一個可以正常工作的示例為止。通常,我喜歡使用繪圖來渲染圖像,但是由于我們在之后的文章中準(zhǔn)備了一些很酷的東西,因此我們將做一些不同的事情,并且將創(chuàng)建一個窗口來展示我們的工作結(jié)果。讓我們一起看看代碼吧!import cv2# read the imageimg = cv2.imread("face.jpg")# show the imagecv2.imshow(winname="Face", mat=img)# Wait for a key press to exitcv2.waitKey(delay=0)# Close all windowscv2.destroyAllWindows()很簡單,對吧?我們只是用imread加載圖像,然后告訴OpenCV在winname中顯示圖像,這將打開窗口并給它一個標(biāo)題。之后,我們需要暫停執(zhí)行,因?yàn)楫?dāng)腳本停止時,窗口會被破壞,所以我們使用cv2.waitKey來保持窗口,直到按下某個鍵,然后銷毀窗口并退出腳本。如果使用代碼并在代碼目錄中添加了一個名為face.jpg的圖像,你應(yīng)該得到如下內(nèi)容:原始圖像:
步驟2:人臉識別到目前為止,我們還沒有對圖像做任何處理,只是把它呈現(xiàn)在一個窗口中,這是非常無聊的,但是現(xiàn)在我們將開始加入其它的內(nèi)容,我們將從識別圖像中選擇一張臉開始。為此,我們將使用名為get_frontial_face_detector()的Dlib函數(shù),非常直觀,但是有一個警告提示這個函數(shù)只適用于灰度圖像,所以我們必須首先使用OpenCV。get_frontial_face_detector()會返回一個檢測器,該檢測器是一個我們可以用來檢索人臉信息的函數(shù),每個面都是一個對象,其中包含可以找到圖像的位置點(diǎn)。但我們最好在代碼上看看:import cv2import dlib# Load the detectordetector = dlib.get_frontal_face_detector()# read the imageimg = cv2.imread("face.jpg")# Convert image into grayscalegray = cv2.cvtColor(src=img, code=cv2.COLOR_BGR2GRAY)# Use detector to find landmarksfaces = detector(gray)for face in faces: x1 = face.left() # left point y1 = face.top() # top point x2 = face.right() # right point y2 = face.bottom() # bottom point # Draw a rectangle cv2.rectangle(img=img, pt1=(x1, y1), pt2=(x2, y2), color=(0, 255, 0), thickness=4)# show the imagecv2.imshow(winname="Face", mat=img)# Wait for a key press to exitcv2.waitKey(delay=0)# Close all windowscv2.destroyAllWindows()上面的代碼將從圖像中檢索所有面部,并在每個面部上渲染一個矩形,從而產(chǎn)生如下圖像:

發(fā)表評論
請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個字
最新活動更多
-
即日-9.16點(diǎn)擊進(jìn)入 >> 【限時福利】TE 2025國際物聯(lián)網(wǎng)展·深圳站
-
10月23日火熱報(bào)名中>> 2025是德科技創(chuàng)新技術(shù)峰會
-
10月23日立即報(bào)名>> Works With 開發(fā)者大會深圳站
-
10月24日立即參評>> 【評選】維科杯·OFweek 2025(第十屆)物聯(lián)網(wǎng)行業(yè)年度評選
-
11月27日立即報(bào)名>> 【工程師系列】汽車電子技術(shù)在線大會
-
12月18日立即報(bào)名>> 【線下會議】OFweek 2025(第十屆)物聯(lián)網(wǎng)產(chǎn)業(yè)大會
推薦專題
- 1 先進(jìn)算力新選擇 | 2025華為算力場景發(fā)布會暨北京xPN伙伴大會成功舉辦
- 2 人形機(jī)器人,正狂奔在批量交付的曠野
- 3 宇樹機(jī)器人撞人事件的深度剖析:六維力傳感器如何成為人機(jī)安全的關(guān)鍵屏障
- 4 解碼特斯拉新AI芯片戰(zhàn)略 :從Dojo到AI5和AI6推理引擎
- 5 AI版“四萬億刺激”計(jì)劃來了
- 6 2025年8月人工智能投融資觀察
- 7 8 a16z最新AI百強(qiáng)榜:硅谷頂級VC帶你讀懂全球生成式AI賽道最新趨勢
- 9 Manus跑路,大廠掉線,只能靠DeepSeek了
- 10 地平線的野心:1000萬套HSD上車