黑白視覺

為何並非如此涇渭分明

你聽過多少次人們說某事“非黑即白”,意思是它簡單明瞭?而且因為黑色和白色如此明顯地區分,我們自然而然地會認為,理解我們如何看到它們也一定同樣簡單直接。

我們錯了。感知這兩種顏色極端似乎很容易,但這掩蓋了一個艱鉅的挑戰,每次我們看一個表面時,大腦都會面臨這個挑戰。例如,在相同的光照下,白色比黑色向眼睛反射的光線多得多。但是,陰影中的白色表面通常比陽光下的黑色表面向眼睛反射的光線少。然而,不知何故,我們能夠準確地辨別出哪個是哪個。如何做到這一點?顯然,大腦使用周圍的環境來做出這樣的判斷。用於解釋這種環境的具體程式對於像我這樣的神經科學家來說仍然充滿神秘感。

最近關於我們如何看到黑色和白色的研究,為人類視覺系統如何分析傳入的光模式並正確計算物體陰影提供了見解。除了更多地解釋我們自己的大腦如何工作之外,這些研究還可以幫助我們設計用於機器人的視覺系統。計算機在人們看來非常自然的模式識別方面表現得非常糟糕。如果計算機能夠“看得更清楚”,它們可以提供更多服務:它們可以識別我們的面孔用於無鑰匙鎖,為我們開車,為我們取報紙或撿垃圾。


支援科學新聞業

如果您喜歡這篇文章,請考慮透過以下方式支援我們屢獲殊榮的新聞業 訂閱。透過購買訂閱,您正在幫助確保有關塑造我們當今世界的發現和想法的具有影響力的故事的未來。


[分割線] 詢問大腦

視覺科學家使用一種稱為心理物理學的方法,迫使大腦揭示其秘密。當然,大腦不會用清晰的文字與我們交談。它更像是一個“二十問”遊戲。我們只問大腦是或否的問題:你是這樣工作還是那樣工作?為了獲得明確的答案,我們必須從至少兩個相互競爭的假設開始。然後,我們必須仔細構建一個測試影像,其中包含一個關鍵的“目標”表面,根據一個假設,它應該看起來是淺灰色,但對於另一種競爭的解釋,它應該是深灰色。通常,這些測試影像由令人愉悅的錯覺組成,例如您將在本文中看到的那些。

為了理解將表面視為黑色、白色或灰色的複雜性,瞭解一些基本物理學知識會有所幫助。白色表面反射照射到它們的大部分光線——大約 90%。相比之下(此處為雙關語),黑色表面僅反射大約 3% 的光線。當這種反射光進入稱為瞳孔的眼睛開口時,晶狀體將其聚焦到內後表面或視網膜上,就像光線透過鏡頭進入一個簡單的盒式相機,然後照射到膠片上一樣。視網膜中的光感受器可以測量照射到它們身上的入射光量。

到目前為止,一切都很好。但是,從我們注視的物體反射的光線本身,並不包含任何關於它反射的灰色陰影的提示。有趣的事情由此開始。

到達眼睛的光線總量更多地取決於任何場景中的照度水平,而不是任何給定表面反射的光線百分比。雖然白色表面反射的光線大約是同一光照下相鄰黑色形狀的 30 倍,但在明亮的陽光下,同一白色表面反射的光線可能比月光下的光線多數百萬倍。實際上,明亮光線下的黑色表面很容易向眼睛傳送比陰影中的白色表面更多的光線。(這就是為什麼今天沒有機器人能夠識別其視野中物體的灰色陰影。機器人只能測量給定物體反射的光量,稱為亮度。但是,正如現在清楚的那樣,任何亮度都可能來自任何表面。)

認識到物體本身反射的光線包含的資訊不足,心理學家漢斯·瓦拉赫在 1948 年提出,大腦透過比較從相鄰表面接收的光線來確定表面的灰色陰影。瓦拉赫是阿爾伯特·愛因斯坦的表弟,他在斯沃斯莫爾學院長期任職期間進行的研究,為我們對視覺和聽覺感知的認識做出了巨大貢獻。他表明,即使圓盤本身從未改變,僅僅透過改變周圍光線的亮度,一個均勻的圓盤就可以呈現出黑色和白色之間的任何陰影。

在一個經典的錯覺中,一個灰色正方形位於白色背景上,而另一個相同的灰色正方形位於相鄰的黑色背景上[參見對面頁面的頂部插圖]。如果感知到的亮度僅取決於反射光量,則兩個正方形看起來將是相同的。黑色背景上的正方形看起來更亮——這表明大腦會比較相鄰的表面。

最近的證據表明,這種相鄰表面的比較可能比瓦拉赫想象的還要簡單。眼睛似乎不是測量場景中每個點的光強度,而是從僅測量場景中每個邊界處的亮度變化開始。

瓦拉赫的工作表明,兩個表面的相對亮度是謎題的重要組成部分。但是,僅僅知道該屬性仍然會留下很多歧義。換句話說,如果場景中的一塊區域比相鄰的一塊區域亮五倍,那麼這告訴眼睛什麼?這兩塊區域可能分別是中灰色和黑色。或者它們也可能分別是白色和灰色。因此,就其本身而言,相對亮度只能告訴您兩種陰影彼此之間有多麼不同,而不能告訴您任何一種陰影的具體色調。為了計算表面的確切灰色,大腦需要更多東西:一個比較點,大腦可以根據該比較點來衡量各種色調,研究人員現在稱之為錨定規則。

已經提出了兩條錨定規則。瓦拉赫本人,以及後來的即時攝影發明者埃德溫·蘭德,都認為給定場景中的最高亮度會自動顯示為白色。如果這條規則是正確的,那麼它將作為大腦比較所有較低亮度的標準。20 世紀 40 年代心理學家哈里·海爾森建立的適應水平理論暗示,場景中的平均亮度始終顯示為中灰色。然後,透過將其他亮度與此中間值進行比較來識別較淺和較深的灰色陰影。在機器視覺領域工作的研究人員稱之為“灰色世界假設”。

哪個是對的?在我的實驗室裡,我們在 1994 年試圖找出答案。我在羅格斯大學的同事和我設計了一種方法,在最簡單的條件下測試這些規則:兩個灰色表面,它們填充觀察者的整個視野。我們要求志願者將頭部伸入一個大的不透明半球內,該半球的內部左側塗成中灰色,右側塗成黑色。我們將半球懸掛在一個更大的矩形腔室內,腔室內裝有燈,為觀看者創造漫射照明。

請記住,大腦尚不知道這兩種灰色陰影是什麼——它只有相對亮度。如果大腦的錨定規則基於最高亮度,那麼中灰色的一半應該看起來是白色,而黑色的一半應該看起來是中灰色。但是,如果規則基於平均亮度,那麼中灰色的一半應該看起來是淺灰色,而黑色的一半應該看起來是深灰色。觀看者不會將任何一側視為黑色或白色。

結果很明確。中灰色的一半看起來完全是白色;黑色的一半,中灰色。因此,我們感知到的灰度尺度錨定在“頂部”,而不是中間。這一發現告訴我們很多關於大腦如何在簡單場景中計算灰色陰影的資訊。最高亮度顯示為白色,而較暗表面的感知灰色陰影取決於其自身亮度與具有最高亮度的表面亮度之間的差異——或者更準確地說,是比率。

[分割線] 不同的錨點

那麼,日常生活中更復雜的場景呢?這種簡單的演算法有效嗎?此時,讀者可能不會驚訝地得知答案是“不,它更復雜”。如果大腦僅將每個表面的亮度與整個場景中的最高亮度進行比較,那麼明亮光線下的黑色表面將與陰影中的白色表面顯示為相同的陰影,前提是兩者都具有相同的亮度,這種情況經常發生。但事實並非如此:我們可以辨別出它們之間的差異。那麼,視覺系統必須在每個照明區域內應用不同的錨點。

事實上,許多錯覺研究表明,錨點確實會發生變化。如果我將幾個相同的灰色圓盤貼上到一張有很多明亮區域和陰影的照片上,陰影區域中的圓盤將比陽光下的圓盤看起來亮得多[參見對面頁面的插圖]。我稱這些為“探針圓盤”,因為它們使我們能夠探測視覺系統如何在場景中的任何位置計算灰色陰影。在任何給定的照明區域內,圓盤的精確位置幾乎無關緊要;在整個區域中,圓盤看起來大致相同的灰色陰影。

在功能上,每個區域似乎都有自己的錨點——大腦在該亮度下感知到表面看起來是白色。但是,對機器人進行程式設計以這種方式處理影像提出了巨大的挑戰。將圖片分割成具有不同照明的單獨區域,需要視覺系統確定影像中的哪些邊緣表示表面顏料的變化,哪些邊緣表示照明水平的變化,例如陰影輪廓形成的線條。例如,這樣的程式可能會將邊緣分類為不同照明區域之間的邊界,如果邊緣模糊或表示平面斷裂,例如角。

北達科他州立大學的理論家芭芭拉·布萊克斯利和馬克·麥考特認為,人類視覺系統也不需要使用這種邊緣分類。他們主張一種不太複雜的過程,稱為空間濾波。例如,在我們的灰色圓盤圖片中,他們會建議每個圓盤的灰色陰影主要取決於該圓盤邊緣的區域性亮度對比度(很像瓦拉赫早期的提議)。他們可能會注意到,照片中每個圓盤的明顯陰影僅僅取決於每個圓盤與其直接背景之間的亮度對比度的方向和強度。

我們可以透過在陰影落在其上的棋盤上放置一些探針圓盤來測試這個簡單的想法是否有效[參見上面的插圖]。我們發現,具有相同區域性對比度的圓盤將顯示出不同的陰影。另一方面,具有不同區域性對比度的圓盤可能共享相同的灰色陰影。

[分割線] 現在,大家一起

考慮另一個視覺技巧,它可以闡明大腦如何在整理光線模式時決定將哪些元素組合在一起。想象一個黑色的“加號”標誌,帶有兩個灰色三角形[參見下一頁框中的右上角]。其中一個三角形適合由加號的“肘部”形成的白色區域的彎曲處;另一個三角形伸入黑色條的一個黑色區域內。在這裡,兩個灰色三角形是相同的,並且它們的直接環境是相同的。每個三角形沿著其斜邊(最長邊)與白色接壤,而沿著另外兩個等長的邊與黑色接壤。但是,黑色條內部的下三角形“屬於”黑色十字,而上三角形似乎是其白色背景的一部分。注意邊界交叉點。當邊界匯聚在一起形成一種 T 形交叉口時,大腦似乎將 T 形的柄分隔的區域定義為屬於一起,而不是 T 形的頂部分隔的區域。

對 T 形交叉口的這種解釋,即將其作為大腦建立分組的一種方式,也適用於澳大利亞藝術家邁克爾·懷特創作的另一種錯覺。它有一系列水平黑色條,它們之間堆疊著白色空間。在其中,與白色相比,更多地被黑色包圍的灰色條[參見對面頁面的框中的左上角]看起來比主要被白色包圍的灰色條更暗(而不是更亮)。這裡,灰色條角部的 T 形交叉口表明,左側的灰色條與白色背景位於同一平面,而右側的灰色條與黑色條位於同一平面。

義大利帕多瓦大學心理學系的保拉·佈雷桑創造了一個“地牢”錯覺,進一步詳細說明了大腦的分組機制。對面頁面框中右中位置的灰色正方形,被黑色包圍,看起來比左中位置的灰色正方形(被白色包圍)更暗。

這種效果可能是因為右側的灰色元素似乎與白色背景位於同一平面,而不是地牢視窗的黑色條。克里特大學感知研究員埃利亞斯·埃科諾穆的反向對比錯覺也說明了這一點。灰色條[參見對面頁面框中的右下角],即使它完全被黑色包圍,也顯得更暗,顯然是因為它是白色條組的成員。

這些有趣的錯覺有一個嚴肅的方面。它們表明,大腦不能僅僅透過比較兩個相鄰表面的亮度來計算我們感知的灰度級別。相反,周圍環境以非常複雜的方式發揮作用。大多數人沒有意識到問題的困難,這證明了人類視覺系統的卓越成就。

[分割線] 全域性

關於大腦如何計算黑色和白色的科學共識仍有待時日。目前的理論分為三類:低階、中級和高階。基於編碼區域性對比度的神經空間濾波機制的低階理論,無法預測人們看到的灰色陰影。高階理論將表面灰色陰影的計算視為一種無意識的智力過程,其中自動考慮了照射到表面的光強度。這些過程可能在直覺上具有吸引力,但既沒有告訴我們應該在大腦中尋找什麼,也沒有告訴我們如何對機器人進行程式設計。中級理論將每個場景解析為多個參考系,每個參考系都包含自己的錨點。與高階理論相比,這些理論更好地指定了黑色、白色和灰色陰影的計算操作,同時比低階理論更好地解釋了人類對灰色表面的感知。

解碼人類視覺計算可能是構建能夠看到的機器人的最佳方法。但更重要的是,這可能是掌握大腦如何工作的最佳方法。

© .