心理學備受爭議的社會啟動領域何去何從

一個關於社會行為的有前景的研究領域在研究人員無法重複關鍵發現後陷入困境。現在研究人員正試圖確定哪些是有價值的保留

卡羅爾·巴納赫

三年前,一個心理學家團隊用一個空間謎題挑戰了180名學生。如果學生遇到困難,可以請求提示。但在測試之前,研究人員引入了一些微妙的干預措施,以觀察這些措施是否會產生任何影響。

心理學家將志願者分成三組,每組在做謎題之前都必須解開一些單詞。一組是對照組,另一組坐在成堆的遊戲幣旁邊,第三組看到的混亂句子中包含與金錢相關的詞語。

這項研究於今年六月發表,是對一項廣為引用的2006年實驗的仔細重複。最初的研究發現,僅僅給學生們一些關於金錢的微妙暗示,就能讓他們更努力地工作:在這種情況下,他們在請求幫助之前在謎題上花費了更長的時間。這項工作是眾多實驗室研究之一,這些研究認為,微小的潛意識暗示會對我們的行為產生巨大的影響。


支援科學新聞報道

如果您喜歡這篇文章,請考慮支援我們屢獲殊榮的新聞報道,方式是 訂閱。透過購買訂閱,您正在幫助確保有關塑造我們當今世界的發現和想法的有影響力的故事的未來。


這些研究被稱為定義鬆散的術語“社會啟動”或“行為啟動”,包括一些報告,例如,用“金錢”啟動的人更自私;用與教授相關的詞語啟動的人在測驗中表現更好;甚至接觸到字面上帶有魚腥味的東西的人更可能懷疑他人。

然而,最近由南佛羅里達大學坦帕分校的心理學家道格·羅勒領導的重複實驗工作發現,用“金錢”啟動的學生在謎題任務中的行為與對照組沒有區別。這是數十起未能驗證早期社會啟動發現的案例之一。許多研究人員表示,他們現在認為社會啟動與其說是一種影響人們無意識行為的方式,不如說是一個關於搖搖欲墜的統計方法如何欺騙科學家發表不可重複結果的教訓。

這並非唯一一個因科學界的“可重複性危機”而受損的研究領域。失敗的重複實驗嘗試使人們對從癌症生物學經濟學等領域的發現產生了懷疑。但是,社會啟動領域有如此多的發現受到質疑,以至於有些人說該領域幾乎完全被否定了。“我不認識一個可重複的發現。不是說沒有,而是我無法說出一個,”弗吉尼亞大學夏洛茨維爾分校的心理學家布萊恩·諾塞克說,他領導了大型重複實驗研究。“我已經從完全的信徒變成了完全的懷疑論者,”加拿大多倫多大學的心理學家邁克爾·因茲利希特補充道,他也是《心理科學》雜誌的副編輯。

一些心理學家說,鐘擺已經對社會啟動擺動得太遠了。其中包括該領域的資深人士,他們堅持認為他們的發現仍然有效。其他人則承認,早期的許多研究都值得懷疑,但他們表示,社會啟動的核心思想仍然有價值。格拉斯哥大學的心理學家埃絲特·帕皮斯說,值得研究是否有可能使用微妙、低成本的干預措施來影響人們的行為——只要能夠剔除那些更古怪和沒有根據的主張。

帕皮斯說,研究人員配備了更嚴格的統計方法,發現社會啟動效應確實存在,但似乎因人而異,並且比最初認為的要小。她和其他人認為,社會啟動可能會作為一套更適度、但更嚴謹的發現而倖存下來。“我對這個領域相當樂觀,”她說。

興起與衰落

啟動現象的根源可以追溯到20世紀70年代,當時心理學家表明,如果人們被相關的詞語啟動,他們就能更快地識別和處理這些詞語。例如,在看到單詞“醫生”後,他們識別“護士”的速度比識別不相關的單詞更快。這種“語義”啟動現在已被廣泛認可。

但在20世紀80年代和90年代,研究人員認為啟動可能會影響態度和行為。1979年的一項研究發現,用與“敵意”相關的詞語啟動個體,會使他們更有可能將故事中人物的行為判斷為敵對行為。1996年,紐約大學的心理學家約翰·巴赫發現,用美國傳統上與年齡相關的詞語(“賓果遊戲”、“皺紋”、“佛羅里達”)啟動的人,在離開實驗室時比對照組走得更慢,就好像他們年紀大了。

圖片來源:Nature

隨後進行了數十項研究,發現啟動可能會影響人們在常識測驗中的表現、他們的慷慨程度或他們在任務中的努力程度。這些行為例子被稱為社會啟動,儘管這個術語存在爭議,因為其中許多例子顯然與社會無關。其他人更喜歡“行為啟動”或“自動行為啟動”。

在他的2011年暢銷書《思考,快與慢》中,諾貝爾獎得主心理學家丹尼爾·卡尼曼提到了幾項最著名的啟動研究。“不相信不是一種選擇,”他寫道。“結果不是捏造的,也不是統計上的僥倖。你別無選擇,只能接受這些研究的主要結論是真實的。”

但是,擔憂開始浮出水面。同年,康奈爾大學的社會心理學家達里爾·貝姆發表了一項研究,表明學生可以預測未來。貝姆的分析依賴於心理學家經常使用的統計技術。“我記得讀到它時心想‘該死。如果我們能做到這一點,我們就遇到麻煩了’,”格勒諾布林阿爾卑斯大學的社會心理學家漢斯·伊澤曼說。

同樣在那一年,另外三位研究人員發表了一項故意的荒謬發現:聽披頭士樂隊歌曲“當我六十四歲”的人實際上比聽另一首歌的對照組更年輕。他們透過多種不同的方式分析資料來實現這一結果,透過簡單的僥倖在其中一種方式中獲得了具有統計學意義的結果,然後沒有報告其他嘗試。他們說,這種做法在心理學中很常見,並且允許研究人員在給定一些嘈雜的資料和小樣本量的情況下,找到他們想要的任何東西。

這些論文產生了爆炸性的影響。 對關鍵發現產生懷疑的重複實驗工作開始出現,其中包括2012年的一份報告,該報告重複了巴赫的衰老研究,發現除非實驗觀察者被告知預期結果,否則啟動沒有效果。雪上加霜的是,這一切都發生在人們發現荷蘭一位著名的社會心理學家迪德里克·斯塔佩爾多年來一直在偽造資料之時。

2012年,卡尼曼巴赫和其他“社會啟動的學生”寫了一封公開信,警告說“火車失事”即將到來。儘管卡尼曼是該研究的“一般信徒”,但他擔心斯塔佩爾的欺詐行為、重複實驗的失敗以及負面結果往往不被髮表,已經造成了“懷疑的風暴”。

七年後,這場風暴已經摧毀了社會啟動的許多旗艦發現。阿姆斯特丹大學的心理學家埃裡克-簡·瓦根梅克斯說,當他閱讀卡尼曼書中相關部分時,“我就像,‘這些研究中沒有一項能夠重複。’ 到目前為止,還沒有。”

心理學家尤金·卡魯索在2013年報告說,提醒人們金錢的概念會使他們更可能贊同自由市場資本主義。現在在加州大學洛杉磯分校的卡魯索說,在嘗試了更大規模和更系統的效果測試後,“似乎沒有強有力的證據支援它們”。荷蘭奈梅亨拉德堡大學的研究員阿普·戴克斯特胡伊斯說,他關於用“教授”這個詞啟動的學生在測驗中表現更好的論文“沒有經受住時間的考驗”。

卡尼曼告訴《自然》:“我沒有及時瞭解最新的發展,所以不應該評論。”

諾塞克說,早在啟動泡沫開始破裂之前,研究人員就在竊竊私語,說他們無法重複重大發現。之後,在與科學界更廣泛的可重複性危機分享的教訓中,很明顯,許多有問題的發現可能是統計噪聲——從對太小群體的人進行的研究中獲得的僥倖結果——而不是欺詐的結果。似乎許多研究人員沒有意識到在嘈雜的資料中找到看起來顯著但虛假的結果有多麼容易。如果研究人員“HARK”(在已知結果後提出假設)——即在檢視資料後更改他們的假設,則尤其如此。期刊往往不發表無效結果的事實無濟於事,因為這意味著唯一透過的發現是令人驚訝的發現。

帕皮斯說,還有證據表明,潛意識實驗者效應一直是一個問題:一項研究發現,當實驗者意識到他們正在尋找的啟動效應時,他們更有可能找到它,這表明他們在潛意識中會以某種方式影響結果。

從那時起,整個心理學界都廣泛採取行動改進研究方法。這些措施包括在檢視資料之前預先註冊研究方法,這可以防止HARK,並與更大群體的志願者合作。例如,諾塞克領導了“多實驗室專案”,該專案讓數十個實驗室的本科生嘗試重複相同的心理學研究,樣本量達到數千人。平均而言,大約一半的論文 “多實驗室專案”研究的論文可以成功重複。其他合作努力包括“心理科學加速器”,這是一個實驗室網路,共同努力重複有影響力的研究。

新的社會啟動

今天,社會啟動領域正在進行的許多工作都涉及重複早期工作,或對多篇論文進行薈萃分析,以試圖梳理出哪些仍然成立。今年四月報告的一項對數百項關於多種金錢啟動的研究進行的薈萃分析發現,幾乎沒有證據表明早期研究聲稱的巨大影響。它還發現,已發表研究中的效應大於與薈萃分析作者分享的未發表實驗中的效應(參見“逐漸減弱的效應”)。

帕皮斯說,原創工作並沒有完全枯竭,儘管重點正在改變。她說,過去許多備受矚目的社會啟動工作旨在尋找巨大的、普遍的影響。相反,她的小組的研究重點是在已經關心被啟動事物的那部分人中尋找較小的影響。她發現,如果想要變得更瘦的人被選單上諸如“飲食”、“苗條”和“身材苗條”之類的詞語啟動,他們更有可能做出健康的食物選擇。但這隻適用於將健康飲食作為核心目標的人;它不會讓每個人都避免食用發胖的食物。

這與伊利諾伊大學厄巴納-香檳分校的心理學家多洛雷斯·阿爾巴拉辛領導的2015年的一項薈萃分析的結果相符。它考察了352項涉及向人們展示詞語的啟動研究,發現當啟動與參與者關心的目標相關時,存在真實但較小的影響的證據。然而,該分析特意只考察了啟動詞語與聲稱的效果直接相關的實驗,例如與粗魯相關的詞語導致更粗魯的行為或態度。它避免了考察那些具有其所謂的“隱喻”意義的啟動研究——包括巴赫所說的導致行走速度變慢的與衰老相關的詞語,或與金錢相關的啟動工作。

然而,對啟動的研究有所下降,並且被認為是啟動的東西並不總是與20世紀90年代和21世紀初的驚人主張相同。倫敦大學學院的神經科學家安東尼婭·漢密爾頓說:“現在比五年前或十年前少了很多”,她仍在研究啟動。部分原因是重複性問題:她說:“自從一切爆發以來,我們做得更少了。更難讓人相信,而且還有其他更容易研究的主題。” 她說,也可能僅僅是因為這個話題變得不那麼流行了。

漢密爾頓自己的工作包括,除其他外,將人們放入功能性磁共振成像(fMRI)掃描器中,以觀察啟動如何影響大腦活動。在2015年的一項研究中,她使用一項混亂句子任務來啟動“親社會”想法(例如“幫助”)和“反社會”想法(例如“煩人”),觀察它是否使參與者更快地模仿他人的行為,以及大腦掃描中是否存在可檢測到的差異。

使用fMRI僅對少數志願者實用,因此她觀察了同一個人在被啟動和未被啟動時的反應:一種“被試內”設計,與使用對照組的啟動研究的“被試間”設計形成對比。漢密爾頓說,這種設計意味著研究人員不必擔心群體之間預先存在的差異。她的研究發現了啟動效應:用親社會概念啟動的人以更親社會的方式行事,fMRI掃描確實顯示出大腦區域(例如內側前額葉皮層)的活動差異,該區域參與調節社會行為。但是,她說,這些效應比經典的啟動研究發現的效應更適度。

一些研究人員表示,無論測試舊結果的努力結果如何,社會或行為啟動的概念仍然具有價值。“我仍然毫不懷疑,儘管在過去,我們相對於目前的標準而言沒有正確地研究它,但在現實生活中,行為啟動是有效的,”戴克斯特胡伊斯說。

巴赫說,儘管許多研究人員現在不認同它們,但重要的早期進展確實存在——例如他自己2008年的研究,該研究報告稱,拿著熱咖啡會使人們對他人表現得更熱情。直接重複實驗未能支援這一結果,但巴赫說,在其他工作中,包括神經影像學研究,已經證明了身體溫暖和社會溫暖之間的聯絡。“人們說我們應該把2010年之前的所有工作,我這個年齡和更老的人的工作都扔掉,”巴赫說,“我不明白這有什麼道理。” 他和南加州大學的心理學家諾伯特·施瓦茨說,他們的早期社會啟動結果已經得到了重複——儘管批評者反駁說,這些不是直接重複,而是“概念性”重複,研究人員在其中使用相關的實驗設定來測試一個概念。

巴赫說,即使非學術界人士持懷疑態度,政治活動家和商業營銷人員等非學術界人士仍然廣泛相信和使用社會啟動的結果。例如,加拿大多倫多大學的組織心理學家加里·萊瑟姆說:“我非常不喜歡巴赫的發現,並想證明它不起作用。” 儘管如此,他說,十年來,他一直持續發現,用與成功和獲勝概念相關的詞語啟動電話營銷人員,可以增加他們賺到的錢。但加州大學伯克利分校的心理學家萊夫·納爾遜強調,無論社會啟動的想法隨後是否得到證實,該領域的經典研究在統計學上都不足以檢測到他們聲稱要發現的東西。

巴赫看到了心理學研究變化中的積極和消極因素。“如果預註冊阻止人們進行HARK,那麼我想這是好事,”他說,“但這總是讓我覺得是一種侮辱。“我們不相信你會誠實”;感覺我們被當作罪犯對待,戴著腳踝手鐲。”

其他人不同意。大多數心理學家認為,轉向開放、可重複的科學是一項巨大的成功。社會啟動作為一個領域可能會倖存下來,但如果它沒有幸存下來,那麼至少其備受矚目的問題對於迫使心理學清理其行為至關重要。“我不得不說,我對該領域在八年中取得的進展感到驚喜,”瓦根梅克斯說。“這徹底改變了人們做事和解釋事物的方式。”

本文經許可轉載,最初於2019年12月11日首次發表

湯姆·奇弗斯是一位常駐倫敦的科學記者。

更多作者:湯姆·奇弗斯

《自然》於1869年首次出版,是世界領先的多學科科學期刊。《自然》發表最優秀的同行評審研究,這些研究推動了突破性的發現,並被世界各地的思想領袖和決策者閱讀。

更多作者:《自然》雜誌
SA Mind Vol 31 Issue 2本文最初以“心理學備受爭議的社會啟動領域何去何從”為標題發表於SA Mind 第31卷第2期(),第26頁
doi:10.1038/scientificamericanmind0320-26
© .