黑白視覺

為何並非如此涇渭分明

你聽過多少次人們說某件事是“黑白的”，意思是它很簡單或一清二楚？而且因為黑色和白色如此明顯不同，我們自然會認為理解我們如何看到它們也一定同樣直截了當。

我們錯了。感知這兩種顏色極端看似容易，但它隱藏著大腦每次觀察物體表面時都會面臨的艱鉅挑戰。例如，在相同的照明條件下，白色比黑色向眼睛反射的光線多得多。但是，陰影中的白色表面通常比陽光下的黑色表面向眼睛反射的光線少。儘管如此，我們仍然可以準確地辨別出哪個是哪個。如何做到？顯然，大腦使用周圍環境來做出這樣的判斷。用於解釋這種環境的具體程式對於像我這樣的神經科學家來說仍然充滿神秘。

最近關於我們如何看到黑色和白色的研究，為人類視覺系統如何分析傳入的光線模式並正確計算物體陰影提供了見解。除了更多地解釋我們自己的大腦如何工作之外，這類研究還可以幫助我們設計用於機器人的視覺系統。計算機在人們自然而然地進行的模式識別方面非常糟糕。如果計算機能夠“看得更清楚”，它們就能提供更多的服務：它們可以識別我們的面孔以實現無鑰匙鎖，為我們在城鎮周圍駕駛，為我們帶來報紙或撿起垃圾。

支援科學新聞業

如果您喜歡這篇文章，請考慮透過以下方式支援我們屢獲殊榮的新聞業訂閱。透過購買訂閱，您正在幫助確保有關塑造我們當今世界的發現和想法的具有影響力的故事的未來。

詢問大腦
視覺科學家使用一種稱為心理物理學的方法迫使大腦揭示其秘密。當然，大腦不會用清晰的文字與我們交談。相反，它就像一個“二十個問題”的遊戲。我們只問大腦是或否的問題：你是這樣工作還是那樣工作？為了獲得明確的答案，我們必須從至少兩個相互競爭的假設開始。然後我們必須仔細構建一個測試影像，其中包含一個關鍵的“目標”表面，根據一個假設，它應該看起來是淺灰色，但對於另一種競爭的解釋，它應該是深灰色。通常，這些測試影像由令人愉悅的錯覺組成，例如您將在本文中看到的那些。

為了理解將表面視為黑色、白色或灰色的複雜性，從一些基本物理學知識入手會有所幫助。白色表面反射大部分照射到它們的光——大約 90%。相比之下（此處雙關語並非有意），黑色表面僅反射大約 3% 的光。當這種反射光進入稱為瞳孔的眼睛開口時，晶狀體將其聚焦到內後表面，即視網膜上，就像光線透過晶狀體進入一個簡單的盒子相機，然後照射到膠片上一樣。視網膜中的光感受器可以測量照射到它們身上的入射光量。

到目前為止，一切都很好。但是，從我們觀察的物體反射的光本身，並沒有包含它反射的灰色陰影的任何提示。這就是事情變得有趣的地方。

到達眼睛的光線總量更多地取決於任何場景中的照明水平，而不是任何給定表面反射的光線百分比。雖然白色表面反射的光線大約是同一照明條件下相鄰黑色形狀的 30 倍，但在明亮的陽光下，同一白色表面反射的光線可能是月光下的數百萬倍。實際上，明亮光線下的黑色表面很容易比陰影中的白色表面向眼睛傳送更多的光線。（這就是為什麼今天沒有機器人能夠識別其視野中物體的灰色陰影。機器人只能測量給定物體反射的光量，稱為亮度。但是，正如現在清楚的那樣，任何亮度都可能來自任何表面。）

認識到物體本身反射的光線包含的資訊不足，心理學家漢斯·瓦拉赫在 1948 年提出，大腦透過比較來自相鄰表面的光線來確定表面的灰色陰影。瓦拉赫是阿爾伯特·愛因斯坦的表親，在他於斯沃斯莫爾學院長期任職期間進行的研究中，為我們對視覺和聽覺感知的知識做出了巨大貢獻。他表明，僅僅透過改變周圍光線的亮度，即使圓盤本身從未改變，均勻的圓盤也可能呈現黑色和白色之間的任何陰影。

在一個經典的錯覺中，一個灰色正方形位於白色背景上，而一個相同的灰色正方形位於相鄰的黑色背景上[參見對面頁面的頂部插圖]。如果感知的亮度完全取決於反射的光量，則這兩個正方形看起來是相同的。黑色背景上的正方形看起來更亮——這向我們表明，大腦會比較相鄰的表面。

最近的證據表明，這種相鄰表面的比較可能比瓦拉赫想象的還要簡單。眼睛似乎不是測量場景中每個點的光強度，而是首先僅測量場景中每個邊界處亮度的變化。

瓦拉赫的工作表明，兩個表面的相對亮度是謎題的重要組成部分。但是，僅知道該屬性仍然會留下很多歧義。換句話說，如果場景中的一塊區域比相鄰的一塊區域亮五倍，這告訴眼睛什麼？這兩塊區域可能分別是中灰色和黑色。或者它們也可能是白色和灰色。因此，相對亮度本身只能告訴您兩種陰影彼此之間有多大差異，而不能告訴您任何一種陰影的具體色調。為了計算表面的確切灰色，大腦需要更多的東西：一個可以用來衡量各種色調的比較點，研究人員現在稱之為錨定規則。

已經提出了兩個錨定規則。瓦拉赫本人，以及後來的即時攝影發明家埃德溫·蘭德，都提出場景中最高的亮度會自動呈現白色。如果這是真的，那麼這條規則將作為大腦比較所有較低亮度的標準。心理學家哈里·海爾森在 20 世紀 40 年代建立的適應水平理論暗示，場景中的平均亮度始終呈現中灰色。然後，透過將其他亮度與此中間值進行比較來識別更淺和更深的灰色陰影。那些從事機器視覺工作的人稱之為“灰色世界假設”。

哪個是對的？在我的實驗室裡，我們試圖在 1994 年找出答案。我和我在羅格斯大學的同事設計了一種方法，在最簡單的條件下測試這些規則：兩個灰色表面，它們填充了觀察者的整個視野。我們要求志願者將他們的頭部放入一個大的不透明半球內，該半球的內部左側塗成中灰色，右側塗成黑色。我們將半球懸掛在一個更大的矩形腔室內，腔室內的燈光為觀察者創造漫射照明。

請記住，大腦還不知道這兩種灰色陰影是什麼——它只有相對亮度。如果大腦的錨定規則是基於最高亮度，那麼中灰色的一半應該看起來是白色，而黑色的一半應該看起來是中灰色。但如果規則是基於平均亮度，那麼中灰色的一半應該看起來是淺灰色，而黑色的一半應該看起來是深灰色。觀察者不會看到任何一側是黑色或白色。

結果很明確。中灰色的一半看起來完全是白色；黑色的一半，中灰色。因此，我們感知的灰度級錨定在“頂部”，而不是中間。這一發現告訴我們很多關於大腦如何在簡單場景中計算灰色陰影的資訊。最高亮度呈現白色，而較暗表面的感知灰色陰影取決於其自身亮度與具有最高亮度的表面亮度之間的差異——或者更準確地說，是比率。

不同的錨點
那麼日常生活中更復雜的場景呢？這種簡單的演算法有效嗎？此時，讀者可能不會驚訝地得知答案是：“不，它更復雜。”如果大腦僅將每個表面的亮度與整個場景中的最高亮度進行比較，那麼明亮光線下的黑色表面將與陰影中的白色表面呈現相同的陰影，前提是兩者都具有相同的亮度，這種情況經常發生。但事實並非如此：我們可以辨別出它們之間的差異。然後，視覺系統必須在每個照明區域內應用不同的錨點。

事實上，許多錯覺的研究表明，錨點確實會發生變化。如果我在一張有很多明亮區域和陰影的照片上貼上幾個相同的灰色圓盤，陰影區域中的圓盤看起來會比陽光下的圓盤亮得多[參見對面頁面的插圖]。我稱這些為“探針圓盤”，因為它們使我們能夠探究視覺系統如何在場景中的任何位置計算灰色陰影。在任何給定的照明區域內，圓盤的精確位置無關緊要；圓盤在整個區域內呈現大致相同的灰色陰影。

從功能上講，每個區域似乎都有自己的錨點——大腦在該亮度下感知表面呈現白色。但是，為機器人程式設計以這種方式處理影像提出了巨大的挑戰。將圖片分割成具有不同照明的單獨區域需要視覺系統確定影像中的哪些邊緣表示表面顏色的變化，哪些邊緣（例如陰影輪廓形成的線）表示照明水平的變化。例如，這樣的程式可能會將邊緣分類為不同照明區域之間的邊界，如果它是模糊的，或者如果它表示平面斷裂，例如角落。

北達科他州立大學的芭芭拉·布萊克斯利和馬克·麥考特等理論家認為，人類視覺系統無需使用這種邊緣分類。他們主張一種不太複雜的過程，稱為空間濾波。例如，在我們的帶有灰色圓盤的圖片中，他們會建議每個圓盤的灰色陰影主要取決於該圓盤邊緣的區域性亮度對比度（很像瓦拉赫早期的提議）。他們可能會注意到，照片中每個圓盤的明顯陰影僅取決於每個圓盤與其直接背景之間亮度對比度的方向和強度。

我們可以透過將一些探針圓盤放在有陰影落在其上的棋盤上來測試這個簡單的想法是否有效[參見上面的插圖]。我們發現，具有相同區域性對比度的圓盤將呈現不同的陰影。另一方面，具有不同區域性對比度的圓盤可能共享相同的灰色陰影。

現在一起
考慮另一個視覺技巧，它可以揭示當大腦整理光線模式時，如何決定將哪些元素組合在一起。想象一個黑色的“加號”，帶有兩個灰色三角形[參見下一頁方框右上角]。其中一個三角形嵌入到加號“肘部”形成的白色區域的彎曲處；另一個三角形伸入黑色橫條之一的黑色區域內。在這裡，兩個灰色三角形是相同的，它們的直接環境也是相同的。每個三角形沿其斜邊（最長邊）與白色相鄰，而沿另外兩條等長的邊與黑色相鄰。但是，較低的三角形，在黑色橫條內，“屬於”黑色十字，而上面的三角形似乎是其白色背景的一部分。注意邊界交匯處。當邊界匯聚在一起形成一種 T 形連線時，大腦似乎將 T 形莖分隔的區域定義為屬於一起，而不是 T 形頂部區域。

這種將 T 形連線解釋為大腦建立分組方式的方法也適用於澳大利亞藝術家邁克爾·懷特創作的另一種錯覺。它有一系列水平的黑色橫條堆疊在一起，中間有白色空間。在其中，與白色相比，更多地與黑色相鄰的灰色橫條[參見對面頁面的方框左上角]看起來比主要與白色相鄰的灰色橫條更暗（而不是更亮）。這裡，灰色橫條角部的 T 形連線表明，左側的灰色橫條與白色背景位於同一平面，而右側的灰色橫條與黑色橫條位於同一平面。

義大利帕多瓦大學心理學系的保拉·佈雷桑創造了一種“地牢”錯覺，進一步詳細說明了大腦的分組機制。對面頁面方框中右中部的灰色正方形，被黑色包圍，看起來比左中部的灰色正方形（被白色包圍）更暗。

這種效應可能是因為右側的灰色元素看起來與白色背景位於同一平面，而不是地牢視窗的黑色橫條。克里特大學感知研究員埃利亞斯·埃科諾穆的反向對比錯覺也說明了這一點。灰色橫條[參見對面頁面方框右下角]，即使它完全被黑色包圍，也顯得更暗，顯然是因為它是白色橫條組的成員。

這些有趣的錯覺有一個嚴肅的方面。它們表明，大腦不能僅僅透過比較兩個相鄰表面的亮度來計算我們感知的灰度級。相反，周圍環境以非常複雜的方式發揮作用。大多數人沒有意識到這個問題的難度，這證明了人類視覺系統的卓越成就。

大局
關於大腦如何計算黑色和白色的科學共識仍有待時日。目前的理論分為低階、中級和高階三類。基於編碼區域性對比度的神經空間濾波機制的低階理論，無法預測人們看到的灰色陰影。高階理論將表面灰色陰影的計算視為一種無意識的智力過程，其中自動考慮了照射表面光線的強度。這些過程可能在直覺上很吸引人，但既沒有告訴我們在大腦中尋找什麼，也沒有告訴我們如何為機器人程式設計。中級理論將每個場景解析為多個參考框架，每個框架都包含自己的錨點。這些理論比高階理論更好地指定了黑色、白色和灰色陰影的計算操作，同時比低階理論更好地解釋了人類對灰色表面的感知。

但是，在我們能夠真正理解視覺的這一方面——或者為機器人程式設計以實現我們人類系統所做的事情之前——我們將需要更好地理解邊界是如何處理的。人眼和機器人一樣，從場景的二維圖片開始。它如何確定圖片的哪些區域應該組合在一起並分配一個共同的錨點？視覺科學家將繼續提出假設並透過實驗來檢驗它們。我們將逐步迫使視覺系統放棄其秘密。

解碼人類視覺計算可能是構建能夠看清事物的機器人的最佳方式。但更重要的是，它可能是掌握大腦如何工作的最佳方式。