草率的結論

人們能否被指望做出合理的判斷?

一個四歲的孩子看著猴子手偶靠近一個裝有紅色和藍色塑膠花的瓶子。猴子打了個噴嚏。猴子退後,又回來嗅了嗅,又打了個噴嚏。然後,一位成年人取出紅花,換成黃花。猴子走近聞了聞黃花和藍花,每次都打噴嚏。成年人接著把藍花換成紅花。猴子走近聞了聞紅花和黃花,這次沒有打噴嚏。

然後,孩子被問到:“你能把讓猴子打噴嚏的花給我嗎?” 當時在加州大學伯克利分校的心理學家勞拉·E·舒爾茨和艾莉森·戈普尼克做了這個實驗,79%的四歲兒童正確地選擇了藍花。正如她們的研究清楚表明的那樣,即使是非常年幼的孩子也已經開始理解因果關係。這個過程對於他們理解世界並在其中生存至關重要。

既然早在四歲時就具備瞭如此強大的辨別能力,那麼人們到了成年時,應該非常擅長識別因果關係——因果推理,不是嗎? 事實上,大量的當代研究表明情況確實如此,突出了成年人能夠做出的細緻判斷——例如,在不同的情況下,對兩個事件之間存在因果關係的數值機率做出一致的估計。


支援科學新聞業

如果您喜歡這篇文章,請考慮透過以下方式支援我們屢獲殊榮的新聞業 訂閱。 透過購買訂閱,您正在幫助確保有關塑造我們當今世界的發現和想法的具有影響力的故事的未來。


在此,我提出了一些證據,這些證據給出了截然不同的印象:普通成年人對於熟悉話題的日常因果推理似乎非常容易出錯。人們在幾乎沒有證據或根本沒有證據的情況下,就將兩個事件聯絡起來作為因果關係,並且他們會根據這些判斷採取行動——他們會草率地得出結論。透過更多地瞭解他們是如何做到這一點的,研究人員可以開發出改進思維的方法。這些努力可以幫助教育工作者實現其使命,即在年輕人的頭腦中激發紮實、認真的思考。

對於我們的發現與許多相關文獻之間的差異,一種可能的解釋是,研究成年人因果推理能力的研究人員通常將其結論建立在對特定背景下成年人群體的一小部分進行研究的基礎上——在實驗室環境中執行復雜的紙筆任務的大學生。例如,在 2000 年的一項研究中,加州大學洛杉磯分校的心理學家帕特里夏·程和臺北國立臺灣大學的雲文蓮向大學生展示了一組例項,描述了餵食不同形狀和顏色的植物食品的植物的開花頻率。在檢查每個案例後,學生在數字量表上對每個因素的似然性或因果影響程度進行了評分,和/或對新例項的結果進行了預測——並且在這樣做時表現出良好的可靠性。雖然這些研究突出了大學生在這些任務中表現出的技能,但它們是否代表了普通人在思考日常事務時的認知表現?

為了解決這個問題,我的學生喬安娜·薩博和我去年去了紐約市的賓夕法尼亞車站。我們詢問了坐在候車室的 40 人是否願意花 10 分鐘時間完成一項調查,以換取 5 美元。幾乎所有人都接受了。我們解釋說,一個小組正在嘗試在籌款活動中使用不同的娛樂功能組合,以瞭解哪種組合最能賣票,並向每個人展示了一個包含部分結果的圖表。第一個派對的標誌列出了幸運抽獎、喜劇演員、服裝;其銷售額為“中等”。第二個派對列出了幸運抽獎、拍賣、服裝;其銷售額為“高”。第三個派對列出了幸運抽獎、拍賣、喜劇演員、服裝;其銷售額為“高”。

當我們與每位受訪者交談時,我們將圖表留在視野中,我們問道:“根據他們的結果,拍賣是否有助於門票銷售?” 我們還詢問了他們對答案的確定程度。他們可以選擇“非常確定”、“確定”、“認為如此但不確定”或“只是猜測”。我們對剩餘的三個特徵:喜劇演員、幸運抽獎、服裝提出了相同的問題。

正如您自己可以推斷出的那樣[參見對面頁面的方框],如果您檢視第一個和第三個派對,新增拍賣會提高銷售額。透過比較第二個和第三個派對,您可以看到新增喜劇演員對銷售額沒有影響。然而,可用的資訊不足以評估幸運抽獎或服裝的因果狀態(因為它們始終存在)。

賓夕法尼亞車站的這群不同背景的成年人是否表現出與研究人員歸因於大學生的隔離因果關係的能力相當的技能? 甚至與早先描述的四歲兒童的技能程度相同? 簡而言之,沒有。總的來說,他們聲稱存在的因果關係比證據證明的要多。83% 的人判斷兩個或多個特徵導致銷售額增加,45% 的人聲稱三個或所有四個特徵都導致銷售額增加(請記住,現有證據僅支援一個特徵——拍賣——與結果之間的關係)。更引人注目的是,大多數受訪者都非常確信自己是正確的。對於四個特徵中的兩個,報告的平均確定性大於“確定”(並且趨向於“非常確定”),而對於另外兩個特徵,平均值略低於“確定”。性別不是一個因素:男性和女性在他們的判斷或確定程度方面沒有顯著差異。

是什麼讓這些受訪者如此確信哪些特徵影響了結果,哪些特徵沒有影響結果? 我們向他們強調,他們應該根據所示特定人群的結果得出結論(而不是根據他們自己關於這些特徵有效性的先驗信念);在最後的回訪詢問中,所有受訪者都表示他們這樣做了。然而,他們的回答表明,他們的判斷實際上受到了他們自己關於這些特徵應該有多有效的想法的影響。受訪者判斷幸運抽獎會影響結果(83% 的人這樣認為)比他們判斷服裝會影響結果(33% 的人這樣認為)更為普遍,儘管關於這兩個特徵的證據是相同的。

為了獲得更深入的瞭解,我們向受訪者展示了另一項任務[參見對面頁面的方框]。

在第二種情況下,沒有正確答案。鑑於兩個特徵:幸運抽獎和服裝的因果狀態不確定,因此無法做出合理的預測。然而,受訪者對其所做預測的確定性仍然與他們對因果判斷的確定性一樣高。此外,他們的預測提供了資訊。例如,為了推斷受訪者是否判斷拍賣特徵具有因果關係,我們比較了該人對一對特定案例所做的預測——特別是那些涉及幸運抽獎的兩個案例。如果拍賣被視為具有因果關係,則對這兩個案例(一個有拍賣,另一個沒有拍賣)的預測應該有所不同。如果拍賣被視為不具有因果關係,則其存在與否不應產生影響,並且對這兩個案例的預測應相同。同樣,比較涉及服裝的兩個案例的預測使我們能夠推斷受訪者是否判斷喜劇演員具有因果關係。

當被要求明確指出某個因素是否具有因果關係(“有助於門票銷售”)時,受訪者在預測任務中做出的隱含判斷往往與他們在判斷任務中做出的因果判斷不一致。只有 15% 的人在兩項任務中做出了前後一致的判斷。同樣,人們在對有關哪些特徵影響了他們的每個預測的問題做出回應時,他們在隱含的因果歸因方面也不一致。例如,在判斷任務中正確判斷將喜劇演員納入其中沒有因果關係的 63% 的人中,大多數人仍然表示喜劇演員的存在與否影響了他們的預測。尤其困難的是認識到,當移除一個特徵時,其存在對結果產生積極影響的特徵會對結果產生負面影響。

調和不一致之處
我們如何調和在火車站候車的人們做出的不一致且輕率的因果判斷——他們聲稱對此確信無疑——與在大學生甚至四歲兒童身上觀察到的推理能力?答案總是多方面的。我們的受訪者認真對待這項任務,並且有動力盡最大努力回答問題,以證明他們獲得 5 美元的報酬是合理的。但是,他們不太可能像大學生那樣容易地將這項任務視為推理測試,旨在評估他們的心理過程,大學生已經熟悉此類測試。大多數大學生都認識到的目的是,不是要找到解決方案(無論是最大化門票銷售還是設計足以支撐給定重量的橋樑),而是展示他們如何著手解決問題。大學生已經學會了相應地行事,檢視給定的資訊並確定他們應該如何使用它來產生答案。因此,毫不奇怪,我們發現具有大學學歷的受訪者比沒有大學學歷的受訪者做出的判斷更合理。

相比之下,那些不具備這種“學術”思維模式的人傾向於專注於解決問題,而很少關注他們在過程中使用的心理操作。在尋求解決方案時,他們會運用他們所知道的一切可能有用的東西。根據他們自己的先前知識,即幸運抽獎似乎比服裝更有可能成為籌款活動的贏家,他們判斷幸運抽獎是因果關係——即使所提供的證據沒有支援這種差異。跟蹤他們在早期採訪部分中的回答方式,以保持一致性,無助於解決問題,因此不是優先事項。對於這些人來說,目前情況的最佳解讀才是重要的。此外,一旦做出決定,表達信心和確定性比猶豫不決更好。

那麼,誰在使用“更聰明”的方法呢? 為什麼在評估新資訊時擱置舊的信念? 如果人們在得出結論時利用他們所知道的一切,難道不是最有可能得出最佳結論嗎? 在許多情況下,答案是肯定的。然而,能夠評估“給定的資訊”以確定它究竟意味著什麼(以及不意味著什麼)也是一項重要的技能——而不僅僅是在學院的稀薄空氣中。

例如,假設我正在考慮嘗試我的朋友們正在談論的新減肥產品,但他們告訴我他們聽說它可能致癌。當我去醫學圖書館查詢有關該產品的最新研究時,我希望能夠解讀報告的內容,而無需考慮我可能有的先前的想法。在做出決定時,我最終可能會將報告的內容與其他考慮因素結合起來。但是,如果我無法自行解讀該檔案,我就無法做到這一點。

基思·E·斯坦諾維奇在 2004 年出版的《機器人的反叛》一書中,同樣論證了他所謂的“去語境化”推理的重要性,並描述了參與者未能使用它的研究。這種推理的相關性絕不僅限於思考因果關係。例如,在法律審判中做出判決就是一個常見的背景,陪審員需要僅依賴所提供的證據,而不是依賴與該證據相關的一切想到的東西。演繹推理也是如此,它採用了古希臘哲學家亞里士多德的古典三段論。斯坦諾維奇指出,例如,70% 的成年受試者接受了這個三段論是有效的

前提 1:所有生物都需要水。

前提 2:玫瑰需要水。

結論:玫瑰是生物。

因為我們知道結論在現實世界中是正確的,所以很容易接受,即使它在邏輯上並不來自前提。為了確信這一事實,我們只需要將其與形式相同的三段論進行比較

前提 1:所有 hudon 綱的動物都很兇猛。

前提 2:溫佩特很兇猛。

結論:溫佩特是 hudon 綱的動物。

通常只有 20% 的人接受這個結論是正確的。其他 80% 的人正確地拒絕了它,表現的提高大概是因為沒有令人困惑的現實世界知識妨礙了它。

正如我們在火車站進行的研究表明的那樣,去語境化並不是認真推理者的心理工具包中唯一的技能。判斷的一致性和避免過度的確定性也很重要。過度的確定性反映了“知道你知道什麼”(也稱為元認知)的失敗,並且是思維僵化的基礎,而思維僵化是導致人類衝突的主要因素。不一致性同樣可能出於利己的目的,使我們能夠保護我們最喜歡的理論,而無需對它們施加與我們對其他人的理論相同的證據標準。我們堅持認為,卓越的技能是我們團隊獲勝的原因,而另一支球隊的勝利是由於運氣。

作者沒有評估早期研究中描述的四歲兒童的因果判斷的一致性或確定性。但是我們可以理解為什麼這些孩子在評估證據方面可能比我們研究中的成年人更容易。涉及不同顏色花朵的場景幾乎沒有涉及到關於哪種顏色更可能讓猴子打噴嚏的先驗知識。相比之下,成年人在活動策劃、門票銷售和不同活動的樂趣方面擁有豐富的先前經驗。這種豐富的知識使他們更難以自行評估證據。

然而,舒爾茨和戈普尼克的研究中受試者表現出的能力確實表明,多變數因果推理(涉及多種潛在原因)中蘊含的潛在推理過程至少在四歲兒童中已經發展到初級程度。更重要的是,這種能力是我們可以用來設計教育經驗的基礎,這些教育經驗將幫助年齡較大的兒童和青少年,甚至成年人,成為更認真的因果推理者。

我的同事和我所做的其他研究表明,如果兒童和成人都獲得頻繁的機會來練習評估證據並做出因果判斷和預測,他們確實會變得更加批判性地思考因果關係。早期青少年學生最初表現出此處說明的各種錯誤的多變數因果推理。但是,如果他們在幾個月的時間裡參與此類問題,他們的推理能力就會顯著提高。社群大學的年輕成年人也是如此。

向前看
我們可以從我描述的研究中獲得的啟示是雙重的。首先,普通成年人對於日常事務的因果推理實際上非常容易出錯。人們經常在沒有根據的情況下做出推斷,並且具有沒有根據的確定性,而且他們很可能會根據許多這些推斷採取行動。

其次,儘管人們可能會在對因果關係的判斷中草率地得出結論,但我們不應草率地得出結論,認為情況必須如此。思維是可以改進的,並且透過練習,思維會變得更加謹慎和批判。識字和算術“基本技能”的標準化測試成績已成為衡量學校在教授學生他們需要知道的知識方面取得多大成功的中心舞臺。相比之下,學習對人們在日常生活中遇到的問題做出合理的判斷,作為教育目標而言,並不是優先事項。

隨著今天的人們努力解讀關於日益複雜的事務的不斷升級的資訊量,其中一些資訊對其生存具有影響,因此,這種認知方面可能會被認為值得更多關注。透過促進技能的發展,以幫助他們應對這一挑戰,我們可以豐富對學生學習重要內容的理解。如前所述,頻繁地調查各種形式的證據並從中得出結論確實可以加強推理能力。即使養成問自己和他人諸如“我們如何知道?”和“我們能確定嗎?”之類的簡單問題的習慣,對於實現健全、嚴謹的思維目標也大有幫助。

在一個教育工作者面臨越來越大的壓力,要求他們產生“不讓一個孩子掉隊”法案要求的標準化考試成績的時代,讓他們甚至考慮承擔更多工是否明智?當然,年輕人必須變得識字和算術。但歸根結底,對於教育而言,有什麼比幫助學生學會運用他們的思想做出那種將在他們一生中對他們有益的謹慎、周到的判斷更重要的目的呢?

(延伸閱讀)

  • 誰是理性的?推理中個體差異的研究。基思·E·斯坦諾維奇。勞倫斯·厄爾鮑姆聯合出版社,1999 年。

  • 知識的日常生產:認識論理解和陪審員推理技能中的個體差異。M. 韋恩斯托克和 M. A. 克羅寧在 應用認知心理學,第 17 卷,第 2 期,第 161–181 頁;2003 年。

  • 機器人的反叛:在達爾文時代尋找意義。基思·E·斯坦諾維奇。芝加哥大學出版社,2004 年。

  • 思維教育。迪安娜·庫恩。哈佛大學出版社,2005 年。

迪安娜·庫恩是哥倫比亞大學教師學院的心理學和教育學教授,也是《思維教育》(哈佛大學出版社)的作者

更多作者:迪安娜·庫恩
SA Mind Vol 18 Issue 1本文最初以“草率的結論”為標題發表於SA Mind 第 18 卷第 1 期(),第 44 頁
doi:10.1038/scientificamericanmind0207-44
© .