如果要求您描述在墨跡中看到的影像,或為一個模稜兩可的插圖編一個故事——例如,一箇中年男子看向別處,一個女人抓住他的胳膊?為了配合,您將運用自己的情感、經驗、記憶和想象力。簡而言之,您會將自己投射到影像中。一旦您這樣做,許多執業心理學家會斷言,訓練有素的評估人員可以挖掘您的思考,從而得出關於您的個性特徵、無意識需求和整體心理健康的結論。
但他們的結論有多正確呢?答案很重要,因為心理學家經常將此類“投射”工具(向人們展示模稜兩可的影像、文字或物體)作為心理評估的組成部分應用,並且結果可能會深刻影響受訪者的生活。例如,這些工具通常用作診斷精神疾病、預測罪犯假釋後是否可能變得暴力、評估參與監護權爭奪的父母的精神穩定以及辨別兒童是否遭受性虐待的輔助手段。
為了衡量它們的 relevance,我們回顧了大量關於投射方法效果如何的研究,重點關注了三種最廣泛使用和研究最充分的工具。總的來說,我們的發現令人不安。
支援科學新聞報道
如果您喜歡這篇文章,請考慮透過以下方式支援我們屢獲殊榮的新聞報道 訂閱。透過購買訂閱,您正在幫助確保有關塑造我們當今世界的發現和想法的具有影響力的故事的未來。
蝴蝶還是野牛?
著名的羅夏墨跡測驗——要求人們描述他們在 10 張墨跡系列中看到的內容——是迄今為止最流行的投射方法,每年有數十萬甚至數百萬人接受測試。以下討論的研究指的是現代的、經過改進的版本,而不是瑞士精神病學家赫爾曼·羅夏在 20 世紀 20 年代最初提出的版本。
最初的工具在 20 世紀 50 年代和 60 年代受到了嚴厲的抨擊,部分原因是它缺乏標準化的程式和一套常模(來自一般人群的平均結果)。標準化非常重要,因為工具管理方式中看似微不足道的差異會影響一個人對它的反應。常模為確定某人的反應何時超出可接受範圍提供了參考點。
在 20 世紀 70 年代,當時在長島大學的約翰·E·艾克斯納 Jr. 透過引入他稱之為綜合系統的東西,表面上糾正了早期羅夏測驗中的問題。這套指令為墨跡測驗的執行和評分以及對反應的解釋建立了詳細的規則,併為兒童和成人提供了常模。
儘管綜合系統目前很受歡迎,但它通常在兩個關鍵標準上都達不到要求,而這兩個標準對最初的羅夏測驗來說也是有問題的:評分信度和效度。具有評分信度的工具無論誰評分和製表,都會產生相似的結果。有效的技術衡量的是它旨在衡量的東西:其結果與其他可信工具產生的結果一致,或者能夠預測行為,或者兩者兼而有之。
為了理解羅夏測驗的評分信度缺陷,瞭解一些關於墨跡反應如何解釋的知識會有所幫助。首先,心理學家根據 100 多個特徵或變數對收集到的反應進行評分。例如,評估者會記錄被測者是檢視整個墨跡還是僅檢視部分墨跡,記錄檢測到的影像是異常還是大多數受測者的典型影像,並指出墨水漩渦的哪些方面(例如形狀或顏色)最決定了受訪者報告看到的內容。
然後,檢查者將調查結果彙編成個人的心理檔案。作為解釋過程的一部分,心理學家可能會得出結論,關注墨跡中的細微細節(例如散亂的汙點)而不是整個影像,預示著患者的強迫症,並且在較大墨跡的白色空間中看到事物,而不是在墨跡區域中看到事物,則表明存在消極、逆反的傾向。
為了使任何變數的評分被認為是高度可靠的,兩位不同的評估者在檢查任何給定人的反應時,應該非常有可能得出相似的評分。然而,最近的調查表明,臨床醫生嚴重依賴的許多羅夏測驗評分都顯示出不令人滿意的協議。因此,臨床醫生可能經常對人們的反應得出截然不同的解釋。
同樣令人不安的是,對羅夏測驗效度的分析表明,它在識別大多數精神疾病方面裝備不足——除了以思維紊亂為特徵的精神分裂症和其他障礙,例如雙相情感障礙(躁鬱症)。儘管一些羅夏測驗的支持者聲稱,該方法並不能始終如一地檢測出抑鬱症、焦慮症或反社會人格(一種以不誠實、冷酷和缺乏負罪感為特徵的疾病)。
此外,儘管心理學家經常進行羅夏測驗以評估暴力、衝動和犯罪行為的傾向,但大多數研究表明,它對這些目的也無效。同樣,沒有令人信服的證據支援將其用於幫助檢測兒童性虐待。
也出現了一些其他問題。一些證據表明,旨在區分精神健康和精神疾病的羅夏測驗常模不能代表美國人口,並且錯誤地使許多成人和兒童看起來不適應社會。例如,在 1999 年對加利福尼亞州血庫的 123 名成年志願者進行的一項研究中,六分之一的人的得分被認為表明患有精神分裂症。
對於少數族裔來說,墨跡結果可能更具誤導性。幾項調查表明,非裔美國人、美洲原住民、阿拉斯加原住民、西班牙裔以及中美洲和南美洲人的得分與常模存在顯著差異。收集到的研究共同引發了人們對在心理治療診室和法庭中使用羅夏墨跡的嚴重質疑。
對 TAT 的質疑
另一種投射工具——主題統覺測驗 (TAT)——可能與羅夏測驗一樣有問題。這種方法要求受訪者根據卡片上繪畫中模稜兩可的場景來構思故事。心理學家可使用的 31 張卡片中,有些描繪了一個正在沉思小提琴的男孩、一個抓住敞開的門的悲傷女人以及一個抓住一個看向別處的男人手臂的女人。其中一張卡片是完全空白的,是模稜兩可的縮影。
TAT 被稱為“臨床醫生的喜悅和統計學家的噩夢”,部分原因是它的管理通常不標準化:不同的臨床醫生向受訪者展示不同數量和選擇的卡片。此外,大多數臨床醫生憑直覺解釋人們的故事,而不是遵循經過充分測試的評分程式。事實上,最近一項對近 100 名在少年法庭和家庭法庭執業的北美心理學家的調查發現,只有 3% 的人依賴標準化的 TAT 評分系統。不幸的是,一些證據表明,以直覺方式解釋 TAT 的臨床醫生可能會過度診斷心理障礙。
TAT 有許多標準化的評分系統可用,但其中一些更流行的系統顯示出較弱的“重測”信度:它們傾向於在一次圖片觀看會話到下一次會話之間產生不一致的分數。它們的效度也經常受到質疑;發現積極結果的研究經常與其他調查相矛盾。例如,一些評分系統已被證明無法區分正常人和精神病患者或抑鬱症患者。
TAT 的少數標準化評分系統似乎確實在區分個性的某些方面做得很好——特別是成就需求和一個人對他人的看法(一種稱為“客體關係”的屬性)。但是,許多時候,表現出高度成就需求的個人在實際成就的衡量標準上得分不高,因此該變數預測一個人行為的能力可能受到限制。這些評分系統目前缺乏足夠的常模,因此尚不適合在研究環境之外應用,但它們值得進一步研究,以便可能在治療中使用。
人物畫的缺陷
與羅夏測驗和 TAT 激發對現有影像的反應不同,第三種投射方法要求被評估者繪製圖片。許多此類工具,例如經常使用的畫人測驗,讓受測者描繪一個人;其他工具則讓他們也畫房子或樹木。臨床醫生通常透過將特定的“符號”——例如身體或服裝的特徵——與個性的各個方面或特定的心理障礙聯絡起來來解釋草圖。他們可能會將大眼睛與偏執狂聯絡起來,將長領帶與性侵犯聯絡起來,將面部特徵缺失與抑鬱症聯絡起來,等等。
與其他方法一樣,關於繪畫工具的研究也給出了令人嚴重擔憂的理由。在一些研究中,評分者在評分結果上達成良好的一致,但在另一些研究中,一致性很差。更糟糕的是,沒有強有力的證據支援符號方法解釋的有效性;換句話說,臨床醫生顯然沒有理由將特定符號與特定人格特質或精神病學診斷聯絡起來。也沒有一致的證據表明,據稱與兒童性虐待相關的符號(例如舌頭或生殖器)實際上揭示了性虐待的歷史。
反覆發現的唯一積極結果是,作為一個群體,人物畫畫得不好的人患心理障礙的比例略高。另一方面,研究表明,臨床醫生很可能將精神疾病歸因於許多隻是缺乏藝術能力的正常人。
某些支持者認為,符號方法在經驗豐富的專家手中可能是有效的。然而,一組研究人員報告說,使用畫人測驗的專家在區分心理正常和異常方面不如研究生準確。
一些不基於符號解釋的全域性評分系統可能很有用。應用此類方法的心理學家不會假設圖畫的特定特徵與人格特質之間存在一對一的對應關係,而是結合圖畫的許多方面來得出對一個人適應能力的一般印象。在一項對 52 名兒童的研究中,全域性評分方法有助於區分正常人和患有情緒或焦慮症的人。在另一份報告中,全域性解釋正確區分了 54 名正常兒童和青少年與過度 агрессивный 或 крайне непослушный 的兒童和青少年。全域性方法可能比符號方法效果更好,因為聚合資訊的行為可以消除來自提供誤導性或不完整資訊的變數的“噪聲”。
因此,我們的文獻綜述表明,通常情況下,羅夏測驗、TAT 和人物畫僅在非常有限的情況下才有用。許多其他投射技術也是如此[參見第 55 頁的方框]。
我們還發現,即使這些方法評估了它們聲稱要衡量的心理特徵,它們也往往缺乏心理學家所謂的“增量效度”:它們很少能增加可以透過其他更實用的方式獲得的資訊,例如透過進行訪談或進行客觀人格測驗。(客觀測驗旨在尋求對相對明確問題的答案,例如“我經常有傷害自己的想法——是或否?”)投射工具提供的附加見解不足以證明其在金錢和時間上的成本是合理的。
該怎麼辦?
一些心理健康專業人士不同意我們的結論。他們認為,投射工具具有悠久的建設性使用歷史,並且如果使用和解釋得當,可以穿透受訪者自我報告的表象,從而提供一幅關於心靈最深處的圖景。我們的批評者還斷言,我們過分強調了負面發現,而排除了正面發現。
然而,我們對自己的結論仍然充滿信心。事實上,儘管我們的總體調查結果是負面的,但由於所謂的抽屜效應,它們可能過分樂觀地描繪了投射技術。眾所周知,科學期刊更傾向於發表證明某些程式有效的報告,而不是發現失敗的報告。因此,研究人員經常悄悄地將他們的負面資料存檔,這些資料可能永遠不會再見天日。
我們發現令人不安的是,心理學家通常在價值尚未得到多項研究充分證實的情況下使用投射工具;如果錯誤的診斷判斷影響治療計劃、監護權裁決或刑事法庭判決,可能會有太多人受苦。根據我們的研究結果,我們強烈敦促心理學家減少他們對大多數投射技術的使用,並且當他們確實選擇此類工具時,將自己限制在評分和解釋已被證明是可信的少量變數上。
我們的結果也為執業臨床醫生、心理學學生和廣大公眾提供了一個更廣泛的教訓:即使是經驗豐富的專業人士也可能被他們的直覺和對缺乏有效性有力證據的工具的信任所愚弄。當大量研究表明舊的直覺是錯誤的時,就應該採取新的思維方式。
