斯坦福學者研究計算機看臉識同性戀:準確率最高為91%

斯坦福大學的邁克爾·科辛斯基(Michal Kosinski)和王軼倫發現,通過從3萬多張人臉圖像中提取出來的特徵,計算機識別出同性戀男性的準確率最高可達到91%,同性戀女性則為83%。論文認為,與產前激素理論一致,同性戀男性的長相更“女性化”,下巴更窄,鼻子更長,額頭更大,同性戀女性則相反。

這篇題為《深度神經網絡基於人臉圖像判斷性取向比人類更準確》的論文於9月7日發表在《人格與社會心理學雜誌》(Journal of Personality and Social Psychology)上後,引發了媒體和社交網絡的熱議。

英國《衛報》擔心,這項技術會導致青少年“自測”,夫妻“互測”,而在對同性戀處以死刑的國家,這項技術更可能淪為殺人工具。

不過,在作者看來,他們的研究是針對人臉識別技術和互聯網隱私問題的警告,是對未來可能成真的技術濫用的演示。作者在文章中呼籲,政府和企業應制定相關法規,發展相關技術,降低同性戀群體的隱私風險。

斯坦福學者研究計算機看臉識同性戀:準確率最高為91%

異性戀(左)、同性戀(中)男女的複合面部圖像,最右為異性戀(綠色)、同性戀(紅色)男女的平均面部標記

論文的摘要寫道:“我們發現人臉中包含的有關性取向的信息遠比人腦能夠感知到的多。我們用深度神經網絡從35326張面部圖像中提取特徵。我們將這些特徵輸入邏輯迴歸算法,對性取向進行分類。給定單張面部圖像,分類器能以81%的概率區別同性戀和異性戀男性,女性則為71%。人類的判斷準確率則要低得多:男性61%,女性54%。給定同一個人的5張面部圖像,算法的準確率可以相應提高到91%和83%。分類器利用的面部特徵,有鼻子形狀等固定特徵,也有打扮風格等臨時特徵。同性戀男性和女性傾向於具備性別非典型的面部形態、表情和打扮風格,這與產前激素暴露影響性取向的理論相符合。而性別分類模型檢測同性戀男性的準確率為 57%,同性戀女性的準確率為 58%。這些發現提高了我們對性取向起源以及人類認知缺陷的理解。此外,公司與政府越來越多地使用計算機視覺算法探測人的內在特徵,我們的研究揭示出同性戀的隱私與安全正在面臨威脅。”

算法準確率:男性91%,女性83%

研究者從美國交友網站上獲取了公開資料,包括36630名男性的130741張照片和38593名女性的170360張照片,年齡在18歲到40歲之間。他們的性取向則是通過意向伴侶性別獲悉的。

隨後,研究者將這些照片中的人臉用Face++軟件進行了處理,剔除了一些照片。接著,他們人工篩選這些照片是否是成年白人,性別與網絡資料是否相符。最後,他們隨即剔除了一些照片,以平衡異性戀和同性戀的人數,留下的樣本包含同性戀和異性戀男性各3947名,同性戀和異性戀女性各3441名。

斯坦福學者研究計算機看臉識同性戀:準確率最高為91%

對美國交友網站上獲取的公開照片進行處理

研究者使用一個名為VGG-Face的深度神經網絡提取圖像的特徵,並以此訓練邏輯迴歸模型。實驗結果顯示,給定單張面部圖像,分類器能以81%的概率區別同性戀和異性戀男性,女性則為71%。給定同一個人的5張面部圖像,算法的準確率可以相應提高到91%和83%。

斯坦福學者研究計算機看臉識同性戀:準確率最高為91%

給定個體男性(藍色)、女性(紅色)1至5張照片,算法的準確率提高

符合產前激素理論:同性戀男性更“女性化”?

在引言部分,作者說明,他們選擇研究性取向的一個重要原因是“廣為接受的性取向的產前激素理論(PHT),預測了外表與性取向的關係”。

論文寫道,根據產前激素理論,男性胚胎過少地暴露在雄性激素中,或女性胚胎過多地暴露在雄性激素中,都可能造成性取向異化。然而,雄性激素同樣與兩性面部分化有關,產前激素理論預測同性戀人群傾向於具備性別上不典型的面部形態。即,同性戀男性面部應該更女性化,同性戀女性面部應該更男性化。

研究者通過分類器識別的位點集合成了計算機認為“最像同性戀”和“最不像同性戀”的人臉。論文認為,計算機識別結果與產前激素理論相符合,同性戀長相在性別上更不典型。平均來講,同性戀男性的下巴更窄,鼻子更長,額頭更大;同性戀女性則相反。

斯坦福學者研究計算機看臉識同性戀:準確率最高為91%

顏色越紅的區域,在算法中越重要

為了進一步檢驗“同性戀長相更不具備性別典型性”這一假設,研究者還通過一個準確率98%的性別分類器試圖區別同性戀和異性戀,發現在男性身上的準確率為 57%,在女性身上的準確率為 58%。論文寫到:“數據顯示,男性面部的女性化程度與同性戀概率呈正相關,女性則相反。”

研究的幾點侷限性

不過,在論文的討論部分,作者強調研究結論不應被讀者誤讀。首先,同性戀長相更不具備性別典型性,不代表所有的同性戀男性長相都女性化,也不代表所有同性戀女性長相都不女性化。

其次,不應誤讀91%這個實驗中的數值。在美國的同性戀比例大約為6%到7%的情況下,分類器需要大幅犧牲準確率,才能覆蓋大量的樣本。

論文也自我指出了研究的幾點限制:樣本限於白人、沒有排除雙性戀,以及無法排除長相“更同性戀”的人更容易“出櫃”這一點。

作者也拋出了其他幾個有趣的問題,比如同性戀男性更少留鬍子,主要是生理原因(毛髮稀少)還是品味原因?分類器識別男性比女性更準確,是否意味著女性的性取向更具流動性?

看臉識罪犯、識貧富、識同性戀:科學相面術?

近年來,計算機視覺識別技術發展迅速。從辦理身份證件、電子支付到機場安檢、辦公門禁,人臉識別技術正在大規模進入人們的日常生活。不過,一些研究者試圖通過計算機視覺識別,尋找外表特徵和內在性格的聯繫,引發了廣泛的爭議。

去年11月,上海交通大學武筱林教授的《基於面部圖像的自動犯罪概率推斷》一文指出,機器可以通過照片分辨出誰是罪犯,誰是守法公民,識別準確率在86%以上。隨後,加拿大多倫多大學一項機器看臉識貧富的研究,同樣引發了一些爭議。

此前,一家以色列初創公司聲稱其開發的人臉識別程序成功識別了參與2015年11月巴黎恐怖襲擊的9名恐怖分子,還能識別戀童癖與白領罪犯。

儘管這些研究倍受倫理爭議,但從論文來看,科辛斯基和王軼倫顯然並不認同將這方面的研究完全劃歸禁區。

在引言部分,論文提到,相面術可回溯至古中國和古希臘,畢達哥拉斯就曾“看臉”收門生。而意大利外科醫生龍勃羅梭在19世紀初開創了“天生犯罪人理論”,指出罪犯可以通過臉部特徵識別。

“如今,相面術被廣泛認定為一種糅合迷信與種族主義的偽科學。由於合法性問題,研究、甚至是討論面部特徵和性格之間的聯繫都成為了禁忌。聯繫不存在,這成了一個普遍的前提。然而,很多機制暗示,情況是相反的。”

“重要的是,人類看臉判斷性格的準確率低,並不一定說明線索不是明明白白地擺在那裡。只是,人類可能缺乏探測或解讀的能力……因此,我們用現代計算機視覺算法檢驗這個假設。”

同性戀群體危險了!

論文的作者試圖通過這一研究警告我們,社交平臺上的公開數據,可以被人利用,製作針對性取向的分類器。文章寫道:“預測性取向可能對同性戀男女和整個社會都造成嚴重威脅,甚至生命威脅。……許多國家的法律認定同性戀是犯罪,8個國家會將同性戀處以死刑。因此,我們讓決策者、科技企業和同性戀群體知道看臉識同性戀的準確率可以有多高,這很關鍵。”

雖然論文所演示的恰恰是論文所反對的,作者強調,他們並非要製造一種入侵的工具,而是為了演示一些常用的入侵路徑。就在眼下,一些政府和企業就在研究人臉識別和內在人格之間的聯繫,風險預警迫在眉睫。作者希望,他們的研究能提醒政府和企業,制定相關法規,發展相關技術,降低同性戀群體的隱私風險。

社交網站信息顯示,科辛斯基是斯坦福商學院的助理教授,2014年在劍橋大學獲得心理學博士學位。他曾供職於微軟研究院和劍橋大學,在公開言論中曾多次談及隱私問題。王軼倫本科畢業於浙江大學,2016年在斯坦福獲碩士學位,目前是IDG資本駐舊金山灣區的投資顧問,投資領域專注於AI、機器人、機器學習、計算機視覺等。

斯坦福學者研究計算機看臉識同性戀:準確率最高為91%

王軼倫(左)、科辛斯基(右)

相關推薦

推薦中...