在1984年11月一個相當沉悶的星期六,我在我的信箱裡發現了一個重磅炸彈。我收到了一位傑出的荷蘭研究人員的資料,並立即看到荷蘭男性在一代人的時間內智商取得了巨大的提升。今天,類似的發現幾乎發生在30個國家——在我們擁有資料的每個國家。智商的提升可能不會持續下去,但它主導了20世紀。這足以引發信任危機。要麼今天的孩子比他們的父母聰明得多,要麼至少在某些情況下,智商測試不是衡量智力的好方法。悖論開始成倍增加。只有現在我們才能解決這些悖論——這樣做既闡明瞭智力的本質,也闡明瞭我們與我們祖先的思想之間的鴻溝。
智力和原子
理解智力就像理解原子:我們不僅需要知道是什麼將它的組成部分結合在一起,還需要知道是什麼將它們分裂開來。將智力成分結合在一起的是一般智力因素,或g;作為原子粉碎機的是隨時間測量的認知趨勢。體現這兩種力量的最佳智商測試是韋克斯勒兒童智力量表,或WISC,它從1947年一直使用至今。
WISC的10個分測驗測量各種認知技能。“相似性”分測驗測量一個人感知事物共同點的能力;“詞彙”分測驗測量你是否積累了日常生活中使用的詞彙;“資訊”分測驗測量你的一般資訊儲備;“算術”分測驗測量你解決數學問題的能力。在某一個分測驗中高於平均水平的人,往往在所有分測驗中都表現出色。因此,我們談論的是一般智力因素。一種稱為因素分析的數學技術衡量了在各種認知任務中表現相互關聯的趨勢,而稱為g的結構是量化的結果。
支援科學新聞事業
如果您喜歡這篇文章,請考慮透過以下方式支援我們屢獲殊榮的新聞事業 訂閱。透過購買訂閱,您正在幫助確保有關塑造我們今天世界的發現和想法的具有影響力的故事的未來。
一個表現良好的人通常在某些認知任務上超過普通人的結果比其他任務更多。這些任務往往是那些認知上更復雜的任務,這加強了g衡量一般智力的說法。WISC分測驗可以根據其g負荷進行排名。這僅僅意味著您將它們從高智商人群在其中勝過普通人最多的分測驗到他們表現最不突出的分測驗進行排名。
各種特徵或任務具有不同的g負荷並不神秘。有音樂天賦的人往往在鋼琴上的水平高於平均水平,而在鼓上的水平則低於平均水平。一位有才華的廚師更有可能在製作蛋奶酥這種精細的任務中勝過普通人,而不是在炒雞蛋這種更簡單的任務中。前者比後者更復雜,因此,是測試烹飪水平的更好方法。
隨時間推移的趨勢
如果一般智力隨時間推移而增加,我們預計10個WISC分測驗中每個分測驗的得分增長都與其g負荷相符。但是,當我們轉向智商增長時,我們發現了一些令人驚訝的事情:分測驗增長的幅度與分測驗g負荷之間存在差異。“相似性”和“資訊”的g負荷非常相似,但前者的增長幅度是後者的12倍。記住烹飪。如果技能隨時間推移而提高,如果g負荷被忽略,例如,如果炒雞蛋的烹飪技能意外提高,但製作蛋奶酥的技能沒有提高,那就太令人驚訝了。
最近的智商增長顯示出一種混亂的模式:“相似性”分測驗增長了24分,而“詞彙”、“算術”和“資訊”分測驗在55年間僅增長了大約3分[參見對頁的方框]。WISC不僅給出分測驗分數,還對智力做出總結性判斷,稱為“全量表智商”。它的增長幅度巨大,約為18分。瑞文推理測驗要求學生找到一系列圖片中的下一步,也是分析智商趨勢的重要測試。由於美國的可用資料很少,我根據比較資料保守估計,每十年增長5分。與我們相比,我們最近的祖先怎麼會如此不聰明呢?更糟糕的是,英國的資料表明,我們必須將這種趨勢追溯到1900年。
現在我已經解釋了智商繁榮背後的基本概念,我可以提出它產生的四個悖論。其中三個悖論源於智商增長的模式和幅度。第四個悖論也涉及到我們自認為對基因和環境的瞭解。
WISC分測驗的智商增長模式與因素負荷幾乎無關。智力怎麼可能既是單一的(如因素分析中所示)又是多重的(根據隨時間推移的趨勢)?這個悖論的關鍵是,因素分析發生在靜態環境中,在該環境中,個體與社會變化保持不變進行比較。然而,隨時間推移的智商趨勢發生在動態環境中,在該環境中,社會變化改變了文化優先事項,包括哪些概念技能得到最大的強調。
例如,在任何給定的時間,因素分析都會顯示短跑和跳高的g負荷很大且相似,也就是說,腿部有彈性的人在這兩方面都表現出色。但是隨著時間的推移,年輕人可能會發現短跑很浪漫,而跳高很無聊。前者的表現會上升,後者的表現會保持不變。這兩個事件之間的相關性掩蓋了它們所要求的技能之間幾乎沒有功能關係的事實。你不會透過以最高速度衝向橫杆來最大化你的跳高表現,因為你會錯過你的跳躍時機。前者隨時間推移的改進與後者沒有改進是完全相容的。
為了解釋智商模式,我們需要對隨時間推移而提高各種認知技能的功能進行分析。科學的興起在兩個方面引發了巨大的變化:它教會我們,使用科學類別對世界進行分類與操縱世界同樣重要;並且它將邏輯從具體事物中解放出來,使我們能夠在沒有具體參照物的情況下處理抽象概念。在20世紀早期,一個典型的三段論是:“巴吉度獵犬擅長獵兔。那是一隻巴吉度獵犬。因此,我將在打獵時使用那隻狗。”今天,我們更可能這樣說:“只有哺乳動物才生育幼崽。兔子和狗都生育幼崽。因此,它們都是哺乳動物。”
如果問1900年的男孩狗和兔子有什麼共同之處,他會說:“你用狗來獵兔。”2007年的男孩會說:“它們都是哺乳動物。”一個世紀前的人們永遠不會想到會提供如此微不足道的東西。誰在乎狗和兔子都是哺乳動物?重要的是事物有什麼用處以及在自己的控制之下。
WISC的“相似性”分測驗在過去一個世紀中表現出令人印象深刻的增長,因為它對於狩獵或功利主義的答案給出零分,而對於哺乳動物或分類的答案給出滿分。“詞彙”和“資訊”等分測驗則完全不同。它們抽樣了日常生活中所需的核心詞彙和一般資訊,因此從具體到抽象的轉變在很大程度上沒有影響到它們。
另一個顯示出顯著增長的智商測試是瑞文推理測驗。這些增長不再神秘。為了做得好,你必須覺得運用邏輯來處理抽象模式是第二天性——也就是說,你必須在一系列形狀中感知邏輯順序,而現代文化更加註重視覺,這有助於做到這一點。
很容易誤解“相似性”和瑞文推理測驗之間的關係。對各種心理測試的因素分析表明,這兩個測試的分數比任何其他一對測試的分數都更相似。現在,這兩個測試都顯示出相同的巨大增長。然而,這兩個測試就像短跑和跳高,幾乎沒有什麼功能上的共同點。它們相關性很高且增長如此相似的原因是,當一個人從用科學的眼光看待世界中受益時,他或她會獲得兩個明顯的優勢。一個是將邏輯從具體事物中解放出來以分析抽象概念,這提高了瑞文推理測驗的分數。另一個是從將世界視為需要分類而不是僅僅需要利用的事物轉變,這提高了“相似性”分測驗的分數。同一個人很可能在很大程度上享受這兩種好處。但它們仍然與兩個完全獨立的認知任務有關。
因素分析還表明,“算術”和瑞文推理測驗對於一個共同因素都具有較高的g負荷。這一事實鼓勵了一種觀念,即數學思維和瑞文推理測驗提出的認知問題在功能上是相關的。畢竟,瑞文推理測驗的問題要求你立即看到形狀之間的邏輯關係(無需事先學習的方法)。數學需要處理非語言材料來掌握新的證明。因此,似乎明智的做法是教幼兒瑞文推理測驗型別的問題,以便他們成為更好的數學問題解決者。自1991年以來,許多美國學校一直在這樣做。
然而,瑞文推理測驗的巨大增長和“算術”分測驗幾乎不存在的增長表明,兩者之間不可能存在強大的功能關係。對於非數學家來說,數學與其說是一項邏輯活動,不如說是一個獨立的現實,它遵循與自然世界規律不同的規律。正如嬰兒探索自然世界一樣,兒童必須探索數學世界,並透過自我發現來熟悉其“物件”。瑞文推理測驗型別的任務對此沒有任何貢獻。
我們的第一個悖論得到了解決。在任何特定時間,因素分析都會提取一個穩健的g因子。智力顯得是單一的,主要的認知技能都高度相關。隨著時間的推移,社會現實揭示了認知技能可以自由地擺脫g,因此智力顯得是多重的。如果你想看到g,請停止電影並提取快照;在電影播放時你將看不到它。社會不進行因素分析;它是一個壓平因素負荷並強加自身優先事項的巨無霸。
全量表智商和瑞文推理測驗的增長表明,我們的父母比我們笨9到15分,而我們的孩子比我們聰明9到15分。幾代人之間的這些差距應該在談話和日常生活中顯而易見。否則,我們難道不應該問問自己,智商增長真的是智力增長嗎?
但這是一個錯誤的問題。它暗示了全有或全無的認知進步,而20世紀已經看到了普遍趨勢的顯著例外。再次檢視第26頁的方框:顯示小幅增長的WISC分測驗是那些與學校教授科目最相關的分測驗。將它們的趨勢與全國教育進步協會(NAEP)測試(通常稱為國家成績單)的趨勢進行比較是有啟發意義的。
從1971年到2002年,四年級和八年級學生的閱讀能力提高了相當於近四個智商點的水平。到12年級時,增長几乎降至為零。如果我們關注1972年至2002年的WISC趨勢,我們會發現小學生在一般資訊儲備方面沒有增長,詞彙量增長也很小。因此,儘管今天的孩子可能在更小的年齡學會掌握青少年文學,但他們並沒有更好地為閱讀更具挑戰性的成人文學做好準備。如果你每隔一段都要查字典或百科全書,你就無法欣賞《戰爭與和平》。
從1973年到2000年,四年級和八年級學生的數學成績提高了相當於近七個智商點的水平。到12年級時,增長降至為零。越來越多的孩子在更小的年齡掌握了計算技能。但是WISC“算術”分測驗既測量計算技能,也測量一些額外的東西。例如,考慮這個問題:“如果四個玩具花費六美元,那麼七個玩具花費多少錢?”許多能夠進行紙上計算的人無法判斷所需的兩個運算:你必須先除後乘。另一些人則無法進行涉及分數的心算。
我的假設是,孩子們在更小的年齡掌握了計算技能,但在獲得數學推理技能方面沒有進步。推理技能對於高等數學至關重要。因此,到12年級時,未能發展增強的數學問題解決策略開始產生影響。
我們現在知道為什麼今天的孩子在談話中不會讓他們的祖父母感到羞愧。假設我們聽到一位最近的高中畢業生與他的祖父(他也高中畢業)談論他們前一週都讀過的小說。我們沒有理由相信其中任何一方必須容忍另一方的遲鈍。如果我們發現他們都在畢業後不久寫了關於時事的文章,我們沒有理由相信其中任何一方在詞彙量或一般資訊供應方面會給我們留下不如另一方的印象。
第三個悖論指的是我們更遙遠的祖先,即1900年的美國人。如果我們將今天的普通美國人的智商定為100,那麼1900年的美國人的平均智商為50到70,這似乎預示著一場精神發育遲滯的瘟疫。我們現在知道為什麼我們不需要得出這樣的推論。我們的祖先並不缺乏智慧;只是他們的智慧紮根於日常現實。而正是無法應對日常生活才是一個真正患有精神發育遲滯的人的特徵。
文蘭適應行為量表告訴我們,在智商快速增長的時期,應對技能保持穩定。將今天的兒童(7至18歲)的表現與1984年隨機抽樣的兒童的表現進行了比較。兒童在“溝通”和“社會化”分測驗中沒有取得進步。他們在“日常生活技能”分測驗中實際上有所退步。(它有一些過時的專案,例如縫紉或縫邊衣服。)
自1900年以來我們沒有變得更聰明這一事實並不意味著隨時間推移的大規模智商增長是微不足道的。我們可以使用抽象概念、邏輯和假設來解決當科學將思想從具體情境中解放出來時出現的正式問題。自1950年以來,我們在超越先前學到的規則來當場解決問題方面變得更加巧妙[參見對頁的方框]。
當同卵雙胞胎在出生時被分開並在不同的地方撫養長大時,他們長大後的智商比隨機選擇的個體更相似。顯而易見的解釋是他們相同的基因,這些研究被認為是基因強大而環境微弱的證據。然而,一代人與另一代人之間巨大的智商差異似乎表明存在巨大的環境因素。我們的第四個悖論是,確鑿的證據如何同時表明環境是微不足道的(親緣關係研究)和強大的(智商增長)?
考慮一下出生時被分開的同卵雙胞胎約翰和喬。他們都生活在一個痴迷於籃球的地區。他們相同的基因使他們都比平均水平更高更敏捷,程度相同。約翰在一座城市上學,在那裡他在操場上打籃球稍微好一點,更喜歡籃球,比大多數人練習得更多,引起了小學教練的注意,在球隊中打球,並繼續參加高中比賽,在那裡他獲得了專業風格的指導。喬在幾百英里外的一座城市上學。由於他的基因與約翰的基因相同,並且由於他比平均水平更高更敏捷,程度相同,他很可能擁有相似的生活經歷。
換句話說,出生時可能相當微小的基因優勢對最終的籃球技能產生了巨大影響,因為它們與更好的環境相匹配——基因因此獲得了“功勞”,因為強大的環境因素(如更多練習、團隊合作和專業指導)發揮了作用。
現在想象一個孩子出生時比另一個孩子稍微更有天賦。他們中的哪一個會更喜歡學校,受到鼓勵,開始經常去圖書館,進入頂尖班級並上大學?如果那個孩子有一個分開的同卵雙胞胎,他也有著非常相似的學業經歷,那麼是什麼解釋了他們相似的成人智商?不僅僅是相同的基因——而是那些相同的基因共同選擇相似質量環境的能力將是謎題中缺失的部分。
基因“受益”於控制了在表現和環境之間運作的強大反饋迴路。基於基因的表現優勢導致了一個更多家庭作業的環境;後者放大了學業表現優勢,這透過導致進入頂尖班級進一步提升了環境;這反過來再次放大了表現優勢,從而促進了進入良好大學環境的機會。這些反饋迴路對個人的命運產生了如此大的影響,以至於我的合作者布魯金斯學會的威廉·T·狄更斯和我稱它們為“個人乘數”。
還有一個“社會乘數”。19世紀末和20世紀初的工業革命需要額外的教育年限。當小學教育成為常態時,每個有中產階級願望的人都想要一張高中文憑。當高中文憑成為常態時,每個人都開始想要學士學位。經濟進步創造了一箇中產階級,他們對智力上刺激孩子、從事高薪專業工作(在這些工作中他們將被期望獨立思考)以及享受更多認知要求高的休閒活動抱有新的期望。沒有人願意顯得自己作為父母是不稱職的,不適合晉升,作為同伴是乏味的。每個人都透過提高自己的表現來應對新的環境,這推動了平均水平的提高;他們對新的平均水平做出反應,這進一步推動了平均水平的提高。結果:一代人在認知技能方面取得了顯著提升。
在一代人內部,基因差異驅動反饋過程;在幾代人之間,環境趨勢驅動反饋過程。看起來強大取決於誰的手握著油門。
一個隱藏的趨勢和未來
智商的提高並沒有使人們免於輕信。抽象的類別和分析可以用來為胡說八道辯護,而不是為道理辯護。看看有多少人相信創造論、飛碟和占星術。
然而,最近的歷史見證了第二個趨勢。受過教育的人的語言被一些詞語豐富了,這些詞語可以大大提高批判性思維能力。這些術語中的每一個都代表一組概念,這些概念描繪了一種適用於社會和道德問題的方法分析。我指的是諸如市場(1776年開始流行)、百分比(1860年)、自然選擇(1864年)、對照組(1875年)、隨機樣本(1877年)、自然主義謬誤(1903年)、魅力效應(1922年)、安慰劑(1938年)和證偽(1959年)等概念。
由於大學劃分為專業,沒有哪個畢業生接受過培訓來使用這些術語中的一部分以上。隨時間推移的智商增長的全部潛力尚未實現。由於大學本可以在過去一個世紀中的任何時候更好地教育他們的學生,因此21世紀的績效改進遠非確定。
