2013年8月13日

心理學是“真正的”科學嗎？這真的重要嗎？

《大眾科學》的博主梅蘭妮·坦南鮑姆對於心理學不是科學的指責感到不安，我理解她的感受。

本文發表於《大眾科學》的前部落格網路，反映了作者的觀點，不一定代表《大眾科學》的觀點

《大眾科學》的博主梅蘭妮·坦南鮑姆對於心理學不是科學的指責感到不安，我理解她的感受。在這種情況下，起因是微生物學家亞歷克斯·貝雷佐夫的一篇文章，他在《洛杉磯時報》上發表了一篇簡短而引人注目的文章，論證了心理學不是真正的科學。我認為他是對的。我也認為他沒有抓住重點。

貝雷佐夫對科學的定義沒有偏差，但它也是不完整和過於狹隘的。對心理學缺乏嚴謹性的批評並不新鮮；人們多年來一直在爭論進化心理學等領域中那些不確定的推測以及功能性磁共振成像掃描的侷限性。任何大量旨在利用進化和其他型別的“心理學”來解釋人類行為的流行的科學書籍只會加劇這個問題。高調的爭議和草率的研究無法被重複，也未能提升該領域的形象。但僅僅因為缺少合適的信使就扼殺資訊是不公平的。同樣的批評也針對其他社會科學，包括經濟學和社會學，然而經濟學中的辯論似乎不像心理學那樣激烈。貝雷佐夫論點的核心是心理學缺乏量化和精確的術語。他指出了幸福等領域的研究，這些領域中的定義既不嚴格也不客觀，而且資料不可量化。

幸福研究是心理學為什麼不是科學的一個很好的例子。究竟應該如何定義“幸福”？這個詞的含義因人而異，尤其是在不同文化之間。讓美國人感到幸福的事不一定讓中國人感到幸福。如何衡量幸福？心理學家不能使用尺子或顯微鏡，所以他們發明了一個任意的量表。今天，我個人感覺是5分中的3.7分。你呢？

關於支援科學新聞報道

如果您喜歡這篇文章，請考慮透過

訂閱來支援我們屢獲殊榮的新聞報道。透過購買訂閱，您正在幫助確保關於當今世界發現和塑造我們世界的有影響力的故事的未來。

這絕對是事實。但是你知道哪些其他領域也缺乏準確的定義嗎？我自己的領域，化學和藥物發現。例如，在我們的領域中，關於如何定義“類藥”分子，即最有可能作為藥物發揮作用的化合物，一直存在爭議。多年來出現的“類藥”定義足以填滿一本電話簿。這場辯論可能會持續很長時間。然而，沒有人會否認關於類藥化合物的工作是一門科學；事實上，化學家一直在使用指導方針來製造類藥分子，而且它們有效。事實上，為什麼談論類藥化合物呢，當所有化學有時都被物理學家認為不夠科學和嚴謹？化學中有幾個概念——芳香性、疏水效應、極化率、化學多樣性——都存在多種定義，並且不能嚴格量化。然而，沒有人（也許除了某些物理學家）否認化學是一門科學。“較軟”的領域不如你自己的領域嚴謹和科學的指責很常見，可以用這個 xkcd 漫畫來概括，但這更多的是一種指責，而不是，嗯，一種可量化的真理。

現在，化學定義仍然比幸福或滿意度的定義更準確和可量化。但關鍵是，並非所有可測量的東西都需要量化到小數點後六位才能稱之為科學。重要的是我們是否可以提出一致且至少半可量化的定義，這些定義足以做出可測試的預測。心理學研究的價值不在於它的可量化性，而在於它是否揭示了普遍和有啟示意義的人性。幾天前，我看了一部關於心理學家和政治思想家漢娜·阿倫特生平的新電影，並思考了阿倫特成名的“平庸之惡”。現在，平庸之惡不像花樣滑冰運動員的角動量那樣可以嚴格量化，但很少有人會否認阿倫特對社會科學做出了巨大貢獻。這一貢獻之所以有效，是因為它是可測試和可重複的（例如在米爾格拉姆式實驗中）和真實的，而不是因為你可以使用功能性磁共振成像機器精確測量它。或者考慮一下丹尼爾·卡尼曼在行為經濟學方面的開創性工作，該工作導致了對決策和偏見的真正見解；很少有人會認為他所做的事情是不科學的。

事實上，有人認為，當社會科學家開始試圖使其學科過於精確時，他們就踏入了危險的境地；華爾街上導致災難的金融數學模型的激增證明了當金融家開始渴望物理學的嚴謹性時會發生什麼。正如粒子物理學家轉為金融建模師的伊曼紐爾·德曼所說：“物理學家試圖發現可以解釋宇宙 99% 的 3 個定律；金融建模師應該滿足於發現可以解釋宇宙 3% 的 99 個定律”。那麼金融是一門科學嗎？關鍵是，我們對生物學和社會系統的瞭解仍然太少，無法實現物理學等科學所做的定量預測（另一方面，物理學——取決於你和哪種物理學家交談——不必經常處理湧現現象）。但這並不意味著我們所說的一切關於人性的東西都是完全不可量化和無用的。

貝雷佐夫所做的一項有價值的貢獻是，指明瞭一個研究領域應該滿足哪些標準才能稱之為科學。我認為這些標準不完整且過於僵硬，但我認為它們為心理學提供了一個有用的標尺，以審視自身的差距和目標。

為什麼我們可以明確地說（心理學不是一門科學）？因為心理學通常不符合一個領域被認為是科學嚴謹的五個基本要求：明確的術語、可量化性、高度控制的實驗條件、可重複性，最後，可預測性和可測試性。

我已經談論了前兩個標準，並指出缺乏明確的術語和可量化性並不會自動將一個領域歸入偽科學的範疇。第三個標準實際上很有趣也很重要，而且並不完全清楚如何解決它。由於人類不是電子，因此很難對他們進行實驗，並且每次都能獲得完全相同的結果。但這正是心理學嚴重依賴統計資料的原因，以精確確定結果的變異是由於偶然性造成的，還是反映了樣本之間的真實差異。誠然，這是心理學將永遠存在的侷限性，但同樣，這並不意味著它將無法發揮作用。這是因為正如梅蘭妮準確指出的那樣，即使像粒子物理學這樣的領域現在也嚴重依賴統計資料。沒有人直接觀察到希格斯玻色子，它只是透過複雜的統計顯著性測試才可見的。然而，即使其他物理學家也一直認為粒子物理學是“最純粹”的科學。或者考慮非線性動力學，其中對初始條件的依賴性非常極端，以至於天氣和生物種群等系統在一段時間後變得完全混亂。然而，你可以將統計資料應用於這些系統，做出或多或少可靠的預測，並稱之為科學。這讓我們談到了貝雷佐夫的最後兩點。可測試性和預測性確實是科學的兩個基石。我已經指出，可測試性通常可以足夠準確以至於有用。至於預測，首先它可以在一個適用範圍內。在我自己的領域，我們經常預測新型藥物分子的活性或缺乏活性。有時我們的預測有 90% 的成功率，有時有 40% 的成功率。即使它們有 40% 的成功率，我們也可以從中獲得有用的資料，儘管也很明顯，它們在完全定量使用之前還有一段路要走。而所有這些仍然是科學。

但更重要的是，預測對於科學的重要性其實並不像貝瑞佐夫認為的那麼高。物理學家大衛·多伊奇指出，如果你看一個魔術師表演魔術十次，你就能預測他接下來會做什麼，但這完全不意味著你真正理解了魔術師在做什麼。與普遍的看法相反，在科學中，理解至少與預測同等重要，甚至更重要。而心理學研究絕對提供了一些關於人類在特定情況下行為方式的理解。它幫助我們理解了一些問題，比如：為什麼聰明人會相信奇怪的事情？為什麼原本正派的人在特定情況下會變成魔鬼（平庸的邪惡）？為什麼具有同情心的人在犯罪發生時不挺身而出（旁觀者效應）？心理學在所有這些領域都提供了引人入勝的線索和解釋，即使這些解釋不是百分之百可重複和量化的。這是科學嗎？嗯，它不是像物理學那樣的科學，但為什麼物理學應該成為衡量各個領域“科學性”的標準呢？

與此同時，我同意貝瑞佐夫的觀點，即科學不能被重新定義到不再遵守諸如可測試性和可重複性等歷史悠久的標準的程度；如果你逐漸開始放寬諸如假設檢驗和觀察等基本要求，你很快就會滑入一個危險的斜坡，斜坡的底部躺著諸如創造論、皮爾當人和占星術之類的東西。但這在現代科學的早期也是如此，那時資料收集占主導地位，解釋很少，沒有人知道假設檢驗意味著什麼。然而，我們稱林奈所做的事情為科學，我們稱第谷·布拉赫所做的事情為科學。天啊，甚至鍊金術士的一些工作也可以歸為科學；畢竟，他們確實改進了諸如蒸餾和昇華之類的工藝。在我看來，心理學正處於我們可能稱之為林奈階段的時期，收集和分類資料，並試圖找到描述其複雜性的正確理論。對我來說，關於進化心理學和積極心理學的激烈辯論反映了每個領域在其早期階段經歷的浴火考驗，以將糟粕與精華分離。如果你採用狹隘的科學定義，那麼確實很難稱心理學為科學。但重要的是它是否有用。對我來說，這個領域肯定有它的用處。