馬修·利伯曼是加州大學洛杉磯分校的社會神經科學副教授。 近幾周,他還反駁了一篇近期論文的觀點,《社會神經科學中的巫毒相關性》,該論文探討了高相關性,即個體的人格或情緒性測量(例如恐懼的體驗,或信任他人的意願)與在 fMRI 機器中觀察到的特定大腦區域的活動之間的相關性。 《心靈 Matters》編輯喬納·萊勒與利伯曼就為什麼大多數 fMRI 相關性不是虛假的,“強烈悲傷”的“回報”以及為什麼接受不公平的提議似乎會啟用與自我控制有關的大腦區域進行了對話。
萊勒:您的研究領域最近在一篇題為 《社會神經科學中的巫毒相關性》 的論文中受到了抨擊。 作者的論點是什麼?他們是否發現了該領域的一個重大問題?
利伯曼:在他們的論文中,武爾及其同事認為,許多社會神經科學研究中的大腦-人格相關性 依賴於無效的方法,因此“高得令人難以置信”,“很可能是……虛假的”並且“不應被相信”。 這些說法是不正確的。 這些分析使用標準程式進行推斷並防止誤報。 相關性估計值往往會略高於真實值,但沒有證據表明這些相關性是毫無意義的或“巫毒”科學。
關於支援科學新聞報道
如果您喜歡這篇文章,請考慮透過以下方式支援我們屢獲殊榮的新聞報道 訂閱。 透過購買訂閱,您正在幫助確保有關塑造我們今天世界的發現和想法的具有影響力的故事的未來。
武爾及其同事在論文中提出的論點是,社會神經科學論文中觀察到的相關性高得令人難以置信。 有一個指標(兩個變數的可靠性的乘積)決定了兩個變數之間可以觀察到的相關性有多高。 他們認為,因為平均而言,該指標允許的相關性高達 0.74,所以社會神經科學家永遠不應看到高於該值的相關性。
鑑於該主張的重要性,重要的是要弄清楚這個[數字],但他們沒有。 這是他們的錯誤:決定研究中可以觀察到什麼結果的不是該指標的平均值,而是該特定研究的指標,或者至少是從該研究中實際使用的措施的先前使用中估計出的指標。 僅僅因為超市中雜貨的平均價格為 3 美元,並不意味著您找不到 12 美元的商品。 事實上,我作為作者參與的一項研究(也是武爾等人論文的主要目標)就是一個完美的例子。 我們研究中自我報告測量的可靠性遠高於他們報告的平均值,從而允許更高的觀察到的相關性。 他們知道這個[事實],但仍然將我們的研究描述為違反了“理論上限”。
他們的第二個主要概念點是,許多社會神經科學作者犯了非獨立性錯誤。 埃德·武爾在與[麻省理工學院神經科學家]南希·坎維什合作撰寫的一章中給出了一個關於非獨立性錯誤的很好的例子。 他們認為,我們可能對心理學課程或社會學課程哪個更難感興趣,並透過比較同時選修這兩門課程的學生的成績來評估這個[問題]。 在對所有學生的比較中,我們發現分數沒有差異。 但是,如果我們首先只選擇在心理學方面得分高於社會學的學生,然後對他們進行統計比較呢? 如果我們使用該分析的結果來對這兩門課程得出一般性推論,那麼這種[策略]將是一個非獨立性錯誤,因為測試樣本的選擇與正在測試的標準不是獨立的。 這種[做法]會嚴重偏倚結果。
儘管武爾絕對正確,這將會是一個重大錯誤,但他並沒有描述我們實際所做的事情。 武爾的例子假設我們感興趣的問題是整個大腦如何與人格測量相關聯,或者對兩項任務的反應有何不同。 繼續使用成績示例,社會神經科學家真正要做的是更接近於詢問,“在全國所有大學中,是否有大學的心理學成績高於社會學成績?” 換句話說,問題不是所有學校的平均差異是多少,而是哪些學校顯示出差異。 詢問這個問題或描述在出現顯著效果的那些學校中發現的結果,沒有任何不妥之處。
在 fMRI 的全腦分析中,我們也在做同樣的事情。 我們感興趣的是大腦中哪些位置正在發生顯著效應,當我們找到它們時,我們會用均值、相關性等來描述結果。 我們沒有隨意挑選區域,然後聲稱這些區域代表整個大腦的效應。
武爾等人 向大約 50 篇論文的作者傳送了一份調查,以瞭解作者是否犯了非獨立性錯誤,但他們從未告訴作者他們真正感興趣的是什麼,並且他們傳送的問題實際上並未評估有關這些研究中使用的方法的正確資訊。 基於關於研究的錯誤資訊,他們將一半的研究定性為犯了非獨立性錯誤。 我已經與幾乎所有受到批評的研究的作者進行了聯絡,幾乎所有人都說了類似的話。“我當然沒有使用武爾等人描述的方法。 誰會那樣做呢?”
這就是問題所在。 沒有人進行武爾等人指責我們進行的分析。 我們所做的是測試大腦中的數千個點(稱為“體素”),以檢視從一個受試者到另一個受試者的活動差異是否可靠地與人格測量(例如神經質)的差異相關。 此程式完全有效。 然後,在文章的表格(或圖表或文字)中報告一部分被認為足夠可靠以至於可以重複的測試。 我想我們可以包含一個 200 頁的表格,並報告大腦中每個體素的顯著性,但每個人都理解我們報告最顯著的啟用,其餘區域的結果不太顯著(這是科學研究的標準報告程式)。 您必須記住,我們的目標不是找到大腦中的平均效應,而是找到大腦中哪裡發生了顯著效應。 我們使用的程式正是回答該問題的正確程式。
萊勒:他們提供了不同的證據來源(例如,模擬和已發表研究的分析)來闡明他們的觀點。 在您看來,證據有多令人信服?
利伯曼:武爾等人 為他們的論點提供了一些證據,乍一看似乎很有說服力,但在仔細檢查後卻站不住腳。 首先,他們包括一個模擬,以表明即使總體中的真實相關性為零,也可以觀察到 fMRI 資料中高達 0.80 的相關性。 這個[事實]對於行為科學家進行的每一項研究都是如此。 總是存在一定的機率,無論多麼小,觀察到的結果都可能是由於偶然因素造成的。 這就是 p 值 評估的內容。
真正的問題是,當 fMRI 研究中的真實相關性為零時,在現實條件下,這種大的觀察效應會發生多久。 武爾等人 在進行模擬時假設 fMRI 的樣本量為 10 個受試者,但 fMRI 研究很少有這麼小的樣本量。 事實上,在他們對社會神經科學 fMRI 研究的“薈萃分析”中,平均樣本量超過 18 個。 在我們的回覆中,我們模擬了 10、15、18 和 20 個受試者的樣本,並檢查了當沒有真實效應時,多長時間會觀察到 0.80 的相關性。 當樣本為 10 時,至少在一個大型虛假相關性很可能發生在很大一部分模擬研究中。 然而,當樣本量增加到 18 個受試者時,只有一小部分模擬研究中存在虛假相關性。 因此,虛假相關性可能會發生,但在典型的 fMRI 研究中,它們將很少見。
同樣重要的是要記住,如果相關性是虛假的,那麼它在大腦中的空間位置應該是隨機的,但我們的相關性效應不是隨機的。 關於對疼痛的同情、對疼痛的恐懼以及被拒絕的社會痛苦的研究都表明,自我報告的測量與背側前扣帶皮層的活動之間存在相關性。 這個區域與透過手術切除來治療頑固性慢性疼痛的區域相同——絕非隨機。
在您對埃德·武爾的採訪中,我看到他認為,即使這些效應並非完全是虛假的,它們可能只佔相對較小的方差百分比,因此在科學上沒有那麼有趣。 首先,從爭辯說這些是“虛假的和無效的”到承認它們“可能是有效的,但幅度不大”,這本身就是一個重大承認。
其次,如果我們採納武爾關於小效應重要性的觀點,有些人本來會死去的。 檢查阿司匹林對心臟病發作影響的最大研究在中途停止了,因為實驗人員查看了資料,意識到阻止安慰劑對照組的受試者服用阿司匹林是不道德的。 安慰劑組中死於心臟病發作的人數明顯多於阿司匹林組,然而,該研究中的實驗操作(阿司匹林與安慰劑)僅佔結果方差的不到 1%。
那麼,在全腦相關性分析中獲得的 r 值 中是否可能存在一些膨脹? 當然,但我們早就知道這一點,大多數研究都對識別大腦中哪些位置正在發生有意義的關係感興趣,而不是估計它們的精確幅度。 報告的相關性是否被嚴重誇大? 根據武爾等人調查的研究樣本,可能不是。 是否使用了無效的方法來測試有意義的相關性是否存在,因此值得貼上“巫毒”的標籤? 絕不可能。
萊勒:您認為這場爭議對該領域產生了任何積極的好處嗎,即使您強烈反對其發現?
利伯曼:答案是肯定的,但也值得花一點時間討論潛在的危害。 儘管武爾等人的新穎主張(高得令人難以置信的相關性、無效的方法)被證明是錯誤的,但這些主張有可能給該領域帶來巨大的危害。 資助機構和頂級期刊的人們正在懷疑他們是否應該繼續支援這類工作。 而且這種[影響]不僅涉及社會神經科學,因為任何閱讀他們論文的人都可以認識到,武爾等人提出的問題,儘管不正確,但也同樣適用於認知神經科學的所有領域。 因此,即使該領域的人們認識到武爾等人 論證的侷限性,重新獲得我們依賴於支援我們工作的人的信任可能仍然是一個挑戰。 這是一個眾所周知的社會心理學事實,當某人被宣告無罪時,持久的聯想是在該人與犯罪之間,而不是他們被宣告無罪的事實。
關於好訊息。 我認為這正在促使很多人更仔細地思考許多不同型別的分析。 例如,武爾等人 認可的許多“獨立”相關性都存在偏差來源(範圍限制),這會導致他們低估真實的相關值。 有一個統計校正可以解決這個問題,我們已將其包含在我們的回覆中。 此外,我們在回覆中進行的模擬結果對我們來說具有啟發意義。 基於我們和其他社會神經科學家通常分析資料的方式,該模擬表明我們真的應該以至少 18 個受試者的樣本為目標,因為在這個大小下,誤報的數量急劇下降(例如,當不存在真實相關性時,發現相關性 r=0.80)。 當然,我們總是希望執行更大的樣本,但影像學的費用非常高昂。
萊勒:您研究了不同型別悲傷背後的一些大腦差異,並且發現,矛盾的是,極度悲傷實際上以大腦中“獎勵中心”的啟用為特徵。 您能解釋一下資料嗎? 這能教會我們關於悲傷的本質什麼?
利伯曼:在這項由加州大學洛杉磯分校的瑪麗-弗朗西斯·奧康納領導的研究中,我們研究了兩組母親或姐妹在過去幾年中死於乳腺癌的女性。 一組經歷了悲傷過程並相對正常地康復(正常悲傷),另一組被診斷患有“複雜性悲傷”,這意味著她們沒有隨著時間的推移而康復。 兩組人都看到了旨在提醒她們想起逝者的影像和文字(以及不相關的對照影像和文字)。 兩組都在我們先前在社會排斥期間觀察到的疼痛網路中表現出活動。
然而,當我們比較這兩組時,疼痛網路中的活動沒有差異。 相反,我們觀察到複雜性悲傷受試者相對於正常悲傷受試者,獎勵區域(腹側紋狀體)的活動更強。 這是第一個發現這種效應的研究,因此任何解釋都是初步的。 然而,這種啟用可能反映了對與逝者建立聯絡的渴望,就像成癮者對藥物的渴望一樣。 為此,我們發現同一“獎勵”區域的活動與受試者告訴我們的他們對逝者的渴望程度顯著相關。 它還提醒我們,大腦獎勵區域的活動可能並不總是意味著個體擁有更大的幸福感。 事實上,從佛教的角度來看,這些依戀和渴望給我們帶來的麻煩與我們都試圖避免的更明顯的負面事件一樣多。
萊勒:您發現接受不公平提議的能力需要啟用通常與自我控制相關的皮層區域。 這能教會我們關於我們對公平的傾向什麼?
我們不知道接受不公平的提議是否“需要”外側前額葉啟用,但當人們接受某種不公平的提議時,我們確實看到了這些啟用。 [心理學家]艾倫·桑菲 [普林斯頓大學] 及其同事於 2003 年發表了關於最後通牒博弈的第一項 fMRI 研究。 在這個遊戲中,提議者決定如何在自己和回應者之間分配 10 美元,回應者決定是否接受。 遊戲有趣的部分是,如果回應者說不,雙方都將一無所獲。 當提議者提供 5 美元時,這是一個平均分配,回應者幾乎總是接受,但是當提議者提供 1 美元或 2 美元時,回應者經常會拒絕——即使提議者和回應者永遠不會再次玩這個遊戲,從而使聲譽擔憂變得無關緊要。 桑菲發現,收到 10 美元中 1 美元和 2 美元的不公平提議的回應者,其腦島活動更強,腦島是一個與疼痛和內臟痛苦相關的邊緣系統區域。 此外,該區域的更高活動與拒絕“不公平”提議的更大傾向相關。
在我們實驗室中,由戈爾納茲·塔比布尼亞領導,我們進行了一項類似的研究,其中我們研究了兩件事。 首先,是否存在被公平對待的可觀察到的效應,除了與公平相關的更高金錢回報之外? 我們透過比較諸如 10 美元中的 5 美元的提議與諸如 23 美元中的 5 美元的提議來研究這一點。 在這兩種情況下,您都可以賺取 5 美元,但第一個提議比第二個提議公平得多。 我們發現,當我們以這種方式將金錢方面排除在外時,我們仍然看到整個大腦的獎勵網路中的活動,這與被公平對待有關。 這個[發現]與最近的許多研究一致,這些研究表明來自他人的積極社會待遇會啟用獎勵區域。
因為我們包括了諸如 23 美元中的 5 美元的提議,我們還可以研究桑菲無法研究的新事物。 這個提議是不公平的,但對於典型的大學本科生來說,這是一個經濟上可取的命題(5 美元是大多數神經科學最後通牒博弈研究中的最高獎勵)。 拒絕 10 美元中的 1 美元很容易,但 23 美元中的 5 美元則另當別論。 當人們接受這些不公平但可取的提議時,至少可能發生兩件事。 一方面,純粹的獎勵潛力可能具有很強的激勵作用。 在這種情況下,人們會期望在接受 23 美元中的 5 美元時,與拒絕這些提議相比,在獎勵區域(如腹側紋狀體)中看到更多的活動。 我們沒有看到任何證據表明這一點。
另一方面,這可能是一個自我控制的案例,在這種情況下,人們可能會對自己說“這可能是一個侮辱性的提議,但如果我抵制報復的誘惑,我可以帶著更多的錢離開”。 儘管我們的資料無法確定受試者是否真的想到了類似的事情,但資料當然與這種過程相符。 當人們接受這些提議時,我們看到右側下前額葉皮層(一個參與各種形式的自我控制的區域)的活動增加,腦島的活動減少,並且這些區域之間存在反比關係,即更大的前額葉活動與減少的腦島活動相關。 這個[發現]與人們正在調節他們的痛苦以實現長期經濟利益的想法一致。 一個有趣的含義是,它表明我們的衝動是拒絕不公平的待遇,而不是獲得金錢,正是我們的認知能力導致我們接受而不是拒絕不公平的待遇並拿走金錢。
您是科學家嗎? 您最近是否閱讀過一篇您想撰寫的同行評審論文? 那麼請聯絡《心靈 Matters》編輯 喬納·萊勒,他是部落格額葉皮層和書籍普魯斯特是神經科學家背後的科學作家。 他的最新著作是 我們如何決定。