人臉影像一個接一個地出現在螢幕上,成百上千張。有些人的眼睛睜得大大的,有些人的嘴唇緊閉。有些人的眼睛緊閉,臉頰抬起,嘴巴張開。對於每張臉,你都必須回答這個簡單的問題:這是一張正在經歷性高潮還是突然疼痛的人的臉?
心理學家蕾切爾·傑克和她的同事招募了 80 人參加這項測試,作為 2018 年一項研究的一部分。這個來自英國格拉斯哥大學的團隊招募了來自西方和東亞文化的參與者,以探索一個長期存在且備受爭議的問題:面部表情是否可靠地傳達情緒?
幾十年來,研究人員一直在詢問人們在面孔中感知到的情緒。他們調查了不同國家的成人和兒童,以及世界偏遠地區的土著居民。美國心理學家保羅·埃克曼在 20 世紀 60 年代和 70 年代進行的有影響力的觀察表明,在世界各地,人類可以可靠地從面部表情推斷出情緒狀態——這意味著情緒表達是普遍的。
支援科學新聞報道
如果您喜歡這篇文章,請考慮透過以下方式支援我們屢獲殊榮的新聞報道 訂閱。透過購買訂閱,您正在幫助確保未來能夠繼續講述關於塑造我們當今世界的發現和想法的具有影響力的故事。
這些觀點在很大程度上保持了幾代人的不質疑。但新一代心理學家和認知科學家一直在重新審視這些資料,並質疑這些結論。現在許多研究人員認為,情況要複雜得多,而且面部表情在不同情境和文化之間差異很大。例如,傑克的研究發現,雖然西方人和東亞人在面部如何表現疼痛方面有相似的概念,但他們對快樂的表達方式卻有不同的看法。
對於埃克曼結論的有效性,研究人員的意見分歧越來越大。但這場辯論並未阻止公司和政府接受他的觀點,即面孔是情緒的預言家——並在以影響人們生活的方式使用它。例如,在西方的許多法律體系中,解讀被告的情緒構成了公平審判的一部分。正如美國最高法院大法官安東尼·肯尼迪在 1992 年寫道,這樣做對於“瞭解罪犯的內心和思想”是必要的。
解碼情緒也是埃克曼為美國運輸安全管理局 (TSA) 設計並於 2007 年推出的一項有爭議的培訓計劃的核心。該計劃名為 SPOT(透過觀察技術篩查乘客),旨在教導 TSA 人員如何監測乘客的數十種潛在可疑跡象,這些跡象可能表明壓力、欺騙或恐懼。但它受到了科學家、美國國會議員以及美國公民自由聯盟等組織的廣泛批評,原因是不準確且帶有種族偏見。
這些擔憂並沒有阻止領先的科技公司採納情緒可以輕易被檢測到的想法,一些公司已經建立了軟體來做到這一點。這些系統正在試用或銷售,用於評估求職者的適合性、檢測謊言、使廣告更具吸引力以及診斷從痴呆症到抑鬱症的疾病。據估計,該行業的價值達數百億美元。包括微軟、IBM 和亞馬遜在內的科技巨頭,以及馬薩諸塞州波士頓的 Affectiva 和佛羅里達州邁阿密的 NeuroData Lab 等更專業的公司,都提供旨在從人臉上檢測情緒的演算法。
由於研究人員仍在爭論人們是否能夠忠實地產生或感知情緒表達,該領域的許多人認為,讓計算機自動執行此操作的努力為時過早——尤其是在這項技術可能產生破壞性影響的情況下。紐約大學的研究中心 AI Now Institute 甚至呼籲禁止在招聘或執法等敏感情況下使用情緒識別技術。
俄亥俄州立大學哥倫布分校研究該主題的阿列克斯·馬丁內斯說,即使對人類來說,面部表情也極其難以解讀。他說,考慮到這一點,以及自動化趨勢,“我們應該非常擔憂”。
膚淺的
人臉有 43 塊肌肉,可以伸展、抬起和扭曲成數十種表情。儘管運動範圍如此廣泛,但科學家們長期以來一直認為,某些表情傳達特定的情緒。
查爾斯·達爾文是推動這一觀點的人之一。他 1859 年出版的《物種起源》一書是辛勤實地考察的結果,是觀察方面的傑作。他的第二部最具影響力的著作《人和動物的情緒表達》(1872 年) 則更武斷。
達爾文注意到,靈長類動物會做出看起來像人類情感表達的面部動作,例如厭惡或恐懼,並認為這些表情一定具有某種適應性功能。例如,捲起嘴唇、皺起鼻子和眯起眼睛——與厭惡相關的表情——可能最初是為了保護個體免受有害病原體的侵害。只有當社會行為開始發展時,這些面部表情才開始發揮更具溝通性的作用。
埃克曼在 20 世紀 60 年代進行的首次跨文化實地研究證實了這一假設。他在世界各地(包括新幾內亞的一個偏遠地區)測試了六種主要情緒——快樂、悲傷、憤怒、恐懼、驚訝和厭惡的表達和感知。
埃克曼告訴《自然》雜誌,他選擇這六種表情是出於實際原因。他說,有些情緒,例如羞恥或內疚,沒有明顯的讀數。“我關注的六種情緒確實有表情,這意味著它們適合研究。”
埃克曼說,早期的研究表明,達爾文進化論所預期的普遍性證據。後來的工作也支援了某些面部表情可能帶來適應性優勢的說法。
達爾文關於情緒的論文刊登了大量擺拍的表情,例如這些受試者盡力模仿悲傷。圖片來源:阿拉米
東北大學波士頓分校研究情緒的心理學家莉薩·費爾德曼·巴雷特說:“長期以來的假設是,面部表情是強制性的動作。”換句話說,我們的臉無力隱藏我們的情緒。這種假設的明顯問題是,人們可以偽裝情緒,並且可以在不移動面部的情況下體驗情感。埃克曼陣營的研究人員承認,每種情緒的預期“黃金標準”表情可能存在相當大的差異。
但是,越來越多的研究人員認為,這種差異非常廣泛,以至於將黃金標準的概念拉伸到了崩潰的邊緣。他們的觀點得到了大量文獻綜述的支援。幾年前,《公共利益心理科學》雜誌的編輯們召集了一個意見不一的作者小組,要求他們回顧文獻。
領導該團隊的巴雷特說:“我們盡力拋開先驗觀念。”他們沒有從假設開始,而是深入研究資料。“當出現分歧時,我們就擴大證據搜尋範圍。”他們最終閱讀了大約 1,000 篇論文。經過兩年半的時間,該團隊得出了一個鮮明的結論:幾乎沒有證據表明人們可以可靠地從一組面部動作中推斷出別人的情緒狀態。
僅憑面部表情只能揭示關於情緒的少量資訊。向下滾動以檢視完整畫面。圖片來源:Lance King Getty Images、Hector Vivas Getty Images、Ronaldo Schemidt Getty Images 和 Robyn Beck Getty Images
該小組引用了一些極端的研究,這些研究發現面部動作與內在情緒狀態之間沒有明顯的聯絡。英國萊斯特德蒙福特大學的心理學家卡洛斯·克里維利曾與巴布亞紐幾內亞特羅布裡安群島的居民合作,在他的研究中沒有發現支援埃克曼結論的證據。克里維利總結說,試圖從外部標記評估內在精神狀態就像試圖用米來測量質量。
缺乏普遍表情證據的另一個原因是,面部表情並非全貌。其他事物,包括身體動作、個性、語調和膚色變化,在我們感知和表達情緒方面起著重要作用。例如,情緒狀態的變化會影響血液流動,進而改變皮膚外觀。馬丁內斯和他的同事已經表明,人們能夠將膚色變化與情緒聯絡起來。視覺背景,例如背景場景,也可以提供有關某人情緒狀態的線索。
順時針方向,從左上角開始:籃球運動員錫安·威廉姆森慶祝扣籃;墨西哥球迷慶祝世界盃小組賽獲勝;歌手阿黛爾在 2012 年格萊美獎上贏得年度專輯獎;賈斯汀·比伯的粉絲在墨西哥城的一場演唱會上哭泣。圖片來源:Lance King Getty Images、Hector Vivas Getty Images、Ronaldo Schemidt Getty Images 和 Robyn Beck Getty Images
複雜的情緒
其他研究人員認為,對埃克曼研究結果的反擊有點過分——尤其是埃克曼本人。2014 年,在回應巴雷特的批評時,他指出了一系列他認為支援他之前結論的研究,包括對人們自發做出的面部表情的研究,以及對錶情與潛在的大腦和身體狀態之間聯絡的研究。他寫道,這項工作表明,面部表情不僅可以提供有關個人感受的資訊,還可以提供有關神經生理啟用模式的資訊(參見go.nature.com/2pmrjkh)。他說,他的觀點沒有改變。
加拿大溫哥華不列顛哥倫比亞大學的心理學家傑西卡·特雷西認為,那些根據少數反例得出埃克曼普遍性理論是錯誤的結論的研究人員誇大了他們的案例。她說,一個人口或文化對憤怒面孔的看法略有不同並不能推翻整個理論。她補充說,大多數人在看到憤怒的面孔時都能認出來,她引用了近 100 項研究的分析。“大量其他證據表明,世界各地大多數文化中的大多數人確實認為這種表情是普遍的。”
特雷西和其他三位心理學家認為,巴雷特的文獻綜述將他們的立場漫畫化為六種情緒及其面部動作之間的僵化的一對一對映。“我不認識情感科學領域中有任何研究人員認為情況是這樣的,”阿姆斯特丹大學的迪薩·索特說,她是該回復的合著者。
索特和特雷西認為,要理解面部表情,需要更豐富的情緒分類法。研究人員不應將幸福視為單一情緒,而應將情緒類別分解為各個組成部分;幸福的範疇涵蓋快樂、愉悅、同情、驕傲等等。每種表情可能有所不同或重疊。
辯論的核心是什麼算作重要。在一項研究中,參與者為他們看到的每張面孔選擇六種情緒標籤中的一種,一些研究人員可能認為,被選中超過 20% 的選項顯示出顯著的共性。另一些人可能認為 20% 遠遠不夠。傑克認為,埃克曼的閾值太低了。她在讀博士時閱讀了他的早期論文。她說:“我不斷地給我的導師看 20 世紀 60 年代和 70 年代的這些圖表,每個圖表都顯示出文化識別方面的巨大差異。”“仍然沒有資料表明情緒是普遍被識別的。”
撇開重要性不談,研究人員還必須與主觀性作鬥爭:許多研究依賴於實驗者在測試開始時標記的情緒,以便可以比較最終結果。因此,巴雷特、傑克和其他人正在嘗試尋找更中立的方法來研究情緒。巴雷特正在研究生理測量方法,希望提供憤怒、恐懼或快樂的替代指標。傑克沒有使用擺拍的照片,而是使用計算機隨機生成面部表情,以避免固執於常見的六種表情。其他人則要求參與者將面孔分組為他們認為捕捉情緒所需的儘可能多的類別,或者讓來自不同文化的參與者用他們自己的語言標記圖片。
計算機情感
軟體公司往往不允許他們的演算法有如此自由的關聯範圍。用於情緒檢測的典型人工智慧 (AI) 程式被輸入數百萬張面孔影像和數百小時的影片片段,在這些影像和影片片段中,每種情緒都已被標記,並且它可以從中識別模式。Affectiva 表示,它已使用來自 87 個國家/地區的 700 多萬張面孔訓練了其軟體,這使其準確率達到 90% 的百分位數。該公司拒絕評論其演算法背後的科學原理。Neurodata Lab 承認面部表情的情緒表達方式存在差異,但表示“當一個人處於情緒發作時,某些面部配置的出現頻率高於偶然情況”,並且其演算法考慮到了這種共性。然而,辯論雙方的研究人員都對這類軟體持懷疑態度,他們提到了用於訓練演算法的資料以及科學仍在爭論中的事實。
埃克曼說,他已直接質疑了這些公司的說法。他給幾家公司寫了信——他不會透露是哪幾家,只說“它們是世界上最大的軟體公司之一”——要求檢視證據,證明他們的自動化技術有效。他沒有收到回覆。“據我所知,他們正在為沒有證據支援的事情提出主張,”他說。
馬丁內斯承認,自動化情緒檢測可能能夠說明一個群體的平均情緒反應。例如,Affectiva 向營銷機構和品牌銷售軟體,以幫助預測客戶群可能對產品或營銷活動做出何種反應。
如果該軟體犯了錯誤,風險很低——廣告可能不如預期的那麼有效。但有些演算法正被用於可能對人們的生活產生重大影響的過程中,例如在求職面試和邊境。去年,匈牙利、拉脫維亞和希臘試用了一個用於預先篩選旅客的系統,該系統旨在透過分析面部的微表情來檢測欺騙行為。
解決情緒表達的爭論將需要不同型別的調查。經常被邀請向科技公司介紹其研究成果的巴雷特——本月訪問了微軟——認為研究人員需要做達爾文為《物種起源》所做的事情:“觀察,觀察,觀察。”觀察人們在現實生活中實際如何使用他們的面部表情和身體——而不僅僅是在實驗室中。然後使用機器記錄和分析真實世界的鏡頭。
巴雷特認為,更多的資料和分析技術可以幫助研究人員學習新事物,而不是重新審視疲憊的資料集和實驗。她向渴望利用她和許多其他人越來越認為是不牢靠的科學技術的科技公司發起了挑戰。“我們真的正處於這個懸崖邊,”她說。“人工智慧公司是會繼續使用有缺陷的假設,還是會去做需要做的事情?”
本文經許可轉載,並於 2020 年 2 月 26 日首次發表。
