如何更好地擁抱未知

如何解讀常見資料視覺化形式中的不確定性

傑西卡·赫爾曼和珍·克里斯蒂安森

在追蹤颶風時,預報員經常會展示一張地圖,上面描繪著“不確定性錐體”。它最初是一個點——颶風當前的位置——然後擴充套件成一片風暴未來幾天可能經過的區域。最可能的路徑是沿著錐體的中心線,機率向邊緣遞減。問題是:許多人誤解了錐體是未來風暴的大小。

研究人員發現,如果預報員改為展示許多可能的路徑,就可以防止這種誤解。然而,這種方法也可能引入誤解:許多人認為,每條路徑與陸地相交的地方發生破壞的可能性更大,而線上條之間則可能性較小(地圖)。

圖片來源:蒂芙尼·法蘭特-岡薩雷斯;資料來源:國家颶風中心(不確定性錐體);Le Liu 等人在《IEEE 視覺化與計算機圖形學彙刊》第 25 卷,2018 年 8 月 20 日發表的“視覺化熱帶氣旋預測不確定性的方法:使用來自預測軌跡集合的代表性樣本”(多條風暴路徑


支援科學新聞報道

如果您喜歡這篇文章,請考慮透過以下方式支援我們屢獲殊榮的新聞報道 訂閱。透過購買訂閱,您正在幫助確保有關塑造我們當今世界的發現和想法的具有影響力的故事的未來。


不確定性滲透到科學家和各種組織用來為決策提供資訊的資料中。資訊的視覺呈現可以幫助澄清不確定性,或者加劇混亂。理想情況下,視覺化有助於我們對不同結果的可能性做出分析和情感上的判斷。然而,關於人類推理的大量證據表明,當人們被要求做出涉及機率的判斷時,他們往往會忽視不確定性。隨著社會越來越依賴資料,圖形設計師們正在努力尋找最佳方式來清晰地展示不確定性。

以下是一個展示不確定性的視覺化技術相簿,大致按照從效果較差到效果較好的順序組織。瞭解如何選擇和實施不同的方法可以幫助我們成為更精明的消費者,理解資料及其所涉及的不確定性。

不量化

呈現不確定性的最無效方法是不顯示它。有時,資料設計師試圖透過選擇一種暗示一定程度不精確性但不量化的技術來彌補缺乏明確不確定性的不足。例如,設計師可能會將資料對映到一個人們難以定義的視覺變數,例如漂浮在空間中的圓形(頂部),而不是圖形上具有 x 軸和 y 軸的點。這種方法使讀者的解讀更容易出錯。或者,設計師可能會使用建立手繪或“草圖”感覺的程式(底部)。這兩種方法都存在風險。

圖片來源:傑西卡·赫爾曼和珍·克里斯蒂安森

區間

區間可能是量化不確定性的最常見表示形式。誤差線(頂部)和置信區間(底部)被廣泛認可,但即使它們看起來精確而直接,也很難正確解讀。研究表明,它們經常被誤解,即使是科學家也是如此。

圖片來源:傑西卡·赫爾曼和珍·克里斯蒂安森

機率密度圖

設計師可以將不確定性直接對映到視覺化的視覺屬性。例如,漸變(頂部)圖可以從中心深色(高機率)過渡到邊緣淺色(低機率)。在小提琴圖(底部)中,較寬的點表示較高的機率。與區間方法(誤差線和置信區間)相比,將機率密度對映到視覺變數可以更詳細地顯示不確定性,但其有效性取決於讀者感知陰影、高度或其他視覺屬性差異的能力。

圖片來源:傑西卡·赫爾曼和珍·克里斯蒂安森

圖示陣列

將諸如 30% 這樣的機率重新定義為頻率——十分之三——可以使人們更容易理解不確定性,從而適當地使用此類資訊。人們可能更容易理解離散機率,因為他們在日常生活中會遇到它們。

圖片來源:傑西卡·赫爾曼和珍·克里斯蒂安森

空間中的多個樣本

空間中多個樣本的繪圖可用於以離散格式顯示一個或多個變數數量的機率。這種方法的一個例子是分位數點圖。它顯示了資料分佈分位數的許多不同情況,因此點的數量(例如,在下面的示例中,兩個點高或五個點高)傳達了機率。當引數值(例如初始條件)的不確定性導致估計值不確定時,可以生成變化這些引數的樣本,並在單個視覺化中顯示。

圖片來源:傑西卡·赫爾曼和珍·克里斯蒂安森

時間上的多個樣本

將多個可能的結果繪製為動畫中的幀,使不確定性變得直觀且更難忽視。這種稱為假設結果圖的技術可用於簡單和複雜的視覺化。感知研究表明,人們非常擅長從事件發生的頻率中推斷資料分佈:我們不一定需要計算事件發生的次數來估計其機率。一個重要的因素是事件的速度,它必須足夠快,以便人們可以看到足夠多的樣本,但又足夠慢,以便他們有意識地記錄他們所看到的內容。

圖片來源:蒂芙尼·法蘭特-岡薩雷斯(選舉針),傑西卡·赫爾曼和珍·克里斯蒂安森(圖表

混合方法

設計師可以透過組合不同的技術而不是選擇標準的圖表“型別”來建立有效的不確定性視覺化。一個例子是扇形圖,因英格蘭銀行而聞名(如圖所示)。它描述了截至目前的資料(虛線的左側),然後是未來預測;過去的不確定性是評估未來不確定性的重要組成部分(右側)。扇形圖以多個波段呈現機率,從較高機率(深色陰影)到較低機率(淺色陰影),讀者可以從中選擇不同的置信度級別。讀者可以透過波段邊緣的位置以及明暗程度來感知資訊。一些用於統計圖形和建模的現代軟體包可以輕鬆地組合不確定性視覺化方法。

圖片來源:珍·克里斯蒂安森 資料來源:《通貨膨脹報告》,英格蘭銀行,2010 年 2 月

© .