社會科學建模的 Heisenberg 不確定性原理

這被稱為“維度詛咒”,這也是為什麼我們對疾病行為方式的估計總是存在不精確性的原因。

可以說,現代科學探究都始於某種模型。模型採用您正在研究的不同引數,並使用它們來對我們世界的運作方式做出某種宣告。它是對現實的簡化,旨在重建真理的圖景,無論是關於疾病的傳播、蟾蜍物種的數量,還是 2020 年將要搬家的人數。

但是,隨著我們嘗試研究的事物數量的增長,接近目標現實的機會就會下降。這種權衡的原因是“維度詛咒”。這並非經驗法則或因測量誤差造成的限制,而是一個與勾股定理一樣的數學事實——它對經濟學和其他社會科學可以描述的內容施加了根本性的限制。維度詛咒是為什麼我們對疾病行為方式的估計總是存在不精確性的原因。

維度 最常見的是指我們所處的空間和時間,但它也可以指任何一組相互獨立的、可測量的東西。例如,假設我們想要一個模型來描述公共衛生運動將如何影響 COVID-19 的傳播。我們可能會使用諸如在給定條件下疾病的估計潛伏期(稱之為 X)、在公共衛生運動下公眾場合佩戴口罩的人的百分比 (Y)、人與人之間傳播可能性的估計 (Z) 等因素,來估計傳播模式。為了預測我們的廣告活動的效果,我們需要找到 X、Y 和 Z 的數值(即“將模型擬合到資料”)。


支援科學新聞報道

如果您喜歡這篇文章,請考慮透過以下方式支援我們屢獲殊榮的新聞報道: 訂閱。透過購買訂閱,您正在幫助確保未來能夠繼續講述關於塑造我們當今世界的發現和想法的具有影響力的故事。


該模型具有三個獨立的維度,因此模型引數 X、Y 和 Z 可以被視為 3D 空間中的點。如果我們使用現實世界的資料和建模技術,得到 X、Y 和 Z 的最佳擬合值,我們的估計值會接近真值嗎(如果我們是全知的,我們才能直接觀察到真值)?

為了回答這個問題,我們需要思考形狀在不同維度中的行為方式。

如果你有一個實心形狀,周圍有一個薄殼,那麼這個殼佔據了令人驚訝的體積。從超市買一個直徑九釐米的橙子,它的皮只有 0.45 釐米厚。大約 25% 的橙子體積在果皮中。

如果你的橙子裝在一個禮品盒裡,這個盒子的大小正好能讓水果接觸到所有邊,會怎麼樣呢?退回到二維空間片刻,一個圓佔據了最緊密貼合它的正方形體積的 78.5%。在三維空間中,盒子裡的橙子佔盒子體積的 47.6%,其餘是空空氣。隨著維度數量的增加,盒子內部體積中水果本身所佔的百分比進一步縮小。一個四維球體佔盒子體積的 30.8%。到九維時,最緊密貼合的盒子有 99.54% 是空的。或者,如果你是樂觀主義者,盒子有 0.46% 是滿的。

現在,讓我們把 COVID-19 模型想象成它存在於三維空間中的形狀。想象一下盒子的中心是 X、Y 和 Z 的真值,而緊密貼合的盒子是我們對每個引數本身的最佳猜測範圍。將“接近”定義為在殼或緊密貼合盒子中心球體內部。 “接近”這個詞具有明顯的物理意義,但在資訊空間中也很有意義,在資訊空間中,我們需要我們對 X、Y 和 Z 的估計值在離真值很短的距離之內。在高維盒子中隨意選擇的點如此小的機率接近中心,這一事實是維度詛咒的一個例子。

假設我們希望我們的模型更具描述性。一項公共衛生運動可能會導致人們去超市的頻率降低 A%,並誘導 B% 的人居家工作,以及 C% 的人停止乘坐公共交通工具。新增這些引數使我們得到一個六維模型 (A, B, C, X, Y, Z),我們可以很容易地集思廣益再增加三到四個。如果我們可以對每個變數的數值範圍進行良好的界定,我們可以將我們的估計值放在圍繞真實九維引數值的緊密貼合的盒子中——這使我們的完整模型(包含所有九個移動部件)接近真值的可能性為 0.46%。

這就是模型設計的平衡之處。我們希望透過新增更多互動元素來使我們的模型更具描述性,但維度詛咒幾乎可以保證,如果您嘗試將具有大量引數的模型擬合到資料,您的擬合將不會接近。我們可以大致瞭解公共衛生運動在細節較少的廣泛背景下的效果,或者我們可以在關注細節的設定中獲得不精確的估計,但是要獲得高度的細節和所有這些引數的精確估計幾乎是不可能的。

研究人員的解決方案是避免同時估計引數集,接受範圍有限且移動部件較少的模型,構建具有更多假設的模型以減少資訊維度,或者投入大量工作以非常精確地確定每個引數。簡而言之,抵制將最新的資料集擬合到萬能模型的慾望。對於研究的讀者來說,解決方案是接受不試圖成為萬能理論的模型的侷限性,並對似乎無視詛咒的模型保持懷疑態度。

Ben Klemens is a computational social scientist living in Washington, DC, and the co-host of the podcast "Pod Paper Scissors." He holds a Ph.D. in social sciences from Caltech. His publications include papers on the characteristics of within-U.S. movers, theoretical modeling of patent valuation, and measuring poverty from space.

More by Ben Klemens
© .