立體視覺:深度的錯覺

雙眼視覺賦予我們深度感知——並使我們能夠玩一些把戲

所有靈長類動物, 包括人類,眼睛都朝向前方。透過這種雙眼視覺,兩隻眼睛看到的景象幾乎相同。相比之下,許多其他動物群體,特別是草食動物,如有蹄類動物(包括牛、羊和鹿等有蹄動物)和兔形目動物(例如兔子),眼睛朝向兩側。這種視角為每隻眼睛提供了很大程度上獨立的視野,並極大地擴大了整體視野。為什麼靈長類動物要犧牲全景視覺?它們獲得了什麼好處?

我們知道雙眼視覺在脊椎動物中獨立進化了幾次。例如,在鳥類中,貓頭鷹和鷹等掠食性物種的眼睛朝向前方。一種理論認為,這種特徵賦予了統計學上的優勢——兩隻眼睛比一隻眼睛更好——在弱光條件下檢測和區分物體,例如獵物。但無論其出現的最初原因是什麼,這種進化上的創新都帶來了一個巨大的優勢:立體(字面意思是“立體的”)視覺。

視角轉換
它是如何工作的?即使你的兩隻眼睛都朝向前方,它們在水平方向上是分開的,因此它們從兩個略有不同的有利位置觀察世界。由此可見,每隻眼睛都會接收到周圍三維場景的略有不同的影像;差異(稱為視網膜視差)與物體與你的相對距離成正比。試試這個快速實驗來理解我們的意思:豎起兩根手指,一根在前,一根在後。現在,在注視較近的手指時,交替睜開和閉上每隻眼睛。你會注意到,較遠的手指離你越遠(不要移動較近的手指),當你睜開和閉上每隻眼睛時,它的位置的橫向偏移就越大。在視網膜上,這種視線偏移的差異表現為左右眼影像之間的視差。


支援科學新聞

如果您喜歡這篇文章,請考慮透過以下方式支援我們屢獲殊榮的新聞報道 訂閱。透過購買訂閱,您正在幫助確保有關塑造我們當今世界的發現和思想的有影響力的故事的未來。


一個簡化的例子清楚地顯示了這種效果。當你看著金字塔時,右眼比左眼看到更多的右側,反之亦然;這是幾何光學的一個簡單結果。請注意,兩隻眼睛中的影像也相應地不同;內部正方形向右或向左移動。這種視網膜視差與金字塔的高度成正比。大腦測量這種差異並將其體驗為立體深度。

儘管這種解釋在今天看來似乎顯而易見,但直到 19 世紀才得到闡明。列奧納多·達·芬奇在幾百年前試圖解釋它,並正確地觀察到,由於眼睛通常會接收到 3D 場景的不同檢視,因此即使在原則上,也不可能在 2D 畫布上充分傳達 3D 感。列奧納多對我們如何看到一個由固體物體組成的單一世界感到困惑,因為眼睛檢視不同(現在被稱為列奧納多的悖論),但他未能理解視網膜視差不是問題,而是立體視覺的基礎這一關鍵點。

這一事實最終在 1838 年由英國物理學家查爾斯·惠斯通澄清,他發表了一系列關於雙眼視覺的優雅實驗。認識到左右眼視角的差異,他首先繪製了每隻眼睛看到的簡單物體的線條圖。然後,他使用自己發明的裝置,稱為映象立體鏡,將這些線條圖一起呈現給觀看者:左眼檢視僅呈現給左眼;右眼檢視僅呈現給右眼。想象一下他的驚訝和喜悅!——當他看到物體的骨骼輪廓躍入 3D 立體效果時,看起來他幾乎可以伸手抓住它。這一定與每個孩子在玩立體觀察器(如熟悉的 View-Master)時體驗到的那種驚奇感相同。這似乎很神奇。

但是,大腦究竟是如何和諧地將兩隻眼睛略有不同的圖片融合到一張融合的圖片中的?它又是如何測量和提取差異以實現立體視覺的?一方面,它需要統一圖片;另一方面,它需要保留和測量它們的差異。

考慮一下當你用雙眼注視影像時會發生什麼,例如本頁上的字母 X。字母的影像投射到每隻視網膜的中央部分(中央凹),大腦將它們融合為一個。你看到一個 X,而不是兩個。英國生理學家查爾斯·謝林頓在 20 世紀初提出,這種融合是一種神秘的心理過程,發生在頭腦中,不需要資訊實際匯聚到單個大腦區域。他敦促我們不要將心理融合與生理融合混淆。

我們現在知道他是錯的:雙眼融合是一個生理過程。X,或你注視的任何點,都會落在功能上和幾何上被稱為對應視網膜點的點上。事實上,來自整個平面(或嚴格來說,來自略微彎曲的表面)的任何點,以注視點為中心,都會刺激對應的視網膜點,並被視為單個物體(本頁上的任何字母,而不僅僅是你注視的字母,都顯示為單個)。正如哈佛大學的神經科學家大衛·休伯爾和托爾斯滕·維厄塞爾在 20 世紀 60 年代進行的一系列開創性實驗中發現的那樣,視覺皮層中的單個細胞,即所謂的雙眼細胞,接收來自雙眼的輸入,特別是來自對應視網膜位置的輸入,從而為知覺融合提供了機制。

然而,如果雙眼神經元僅在來自雙眼的相同輸入到達時才被激發,那麼你將很難感知真實的 3D 物體。約翰·“傑克”·佩蒂格魯,當時是澳大利亞堪培拉的一名年輕醫學生,在 20 世紀 60 年代中期注意到了這一事實,他推斷立體視覺的神經機制必須包含另一組雙眼神經元,這些神經元透過處理非對應的視網膜點來發出視網膜視差訊號。

佩蒂格魯(以及他的同事霍勒斯·B·巴洛、科林·布萊克莫爾和彼得·畢曉普)發現休伯爾和維厄塞爾的描述只是部分正確。當然,來自視網膜的對應點發送的訊號會匯聚到視覺皮層中的單個神經元。就好像大腦中存在每隻眼睛影像的地圖,並且這些地圖是(在解剖學上而言)對齊的;這種安排總體上是有意義的。但是,許多非對應的點也會匯聚並激活雙眼細胞。正是這些神經元發出立體深度訊號,因為它們實際上是在測量左右眼影像之間的水平散射。因此,即使在這個早期階段,你在皮層上擁有的也不是世界的平面 2D 地圖,而是 3D 地圖。自惠斯通的洞察力以來,這可能是關於雙眼視覺的最重要的發現。

當然,自從惠斯通時代以來,我們已經取得了很大的進步。我們可以使用相機來模仿兩隻眼睛的檢視,而不是圖紙。觀看任何 3D 場景,並從左眼的有利位置拍攝一張照片。然後將相機移至右眼的位置,再拍攝第二張照片。列印這兩張照片,放置一個垂直隔板,使每隻眼睛只能看到自己的影像,瞧,影像就變成了 3D 場景。(參見示例 a。)這種立體照片在維多利亞時代的客廳中非常流行(如果它們是色情的,則會被小心地藏起來;如果它們是旅行系列,則會在家庭聚會上自豪地傳閱)。

觀看它們的最佳方式是透過立體鏡,它結合了鏡頭和稜鏡或反射鏡,以實現更自然的調節和會聚。但是你可以嘗試剛剛討論的簡陋隔板方法。透過一些練習,你可以使眼睛對齊以融合影像並看到立體深度。這非常值得付出努力。

擺錘遊戲
你可以構建和體驗的另一種立體錯覺是普爾弗裡希效應,諷刺的是,它是由著名的獨眼科學家卡爾·普爾弗裡希在 1922 年描述的(當然是在其他人身上做實驗)。將重物掛在 18 英寸長的繩索末端,並像擺錘一樣使其運動,在單個平面內水平來回移動(當它接近中心時速度逐漸加快,並在到達另一端的頂部時再次減速)。現在,僅在一隻眼睛前放置一個濾鏡(太陽鏡即可)。令人驚訝的是,你會看到擺錘向你來回做橢圓形的 3D 偏移!使用左眼濾鏡,從上方看運動將是順時針方向;使用右眼濾鏡則為逆時針方向。你的眼鏡顏色越深,你看到的橢圓深度就越大。移除濾鏡,它又回到普通擺錘的 2D 擺動。

這種效應的發生是因為濾鏡降低了一隻視網膜上擺錘的亮度,從而導致傳輸到視覺皮層中的雙眼細胞的時間略有延遲。這種延遲意味著大腦“假設”擺錘的昏暗影像在空間上滯後——就好像非對應的點受到刺激一樣——從而欺騙大腦認為擺錘正在 3D 運動。擺錘的速度越大(例如,在飛行過程中),體驗到的三維性就越大,因此其 3D 路徑呈橢圓形。

從列奧納多、惠斯通和維多利亞時代的客廳玩具到現代生理學和心理物理學,這是一段漫長的旅程,但我們才剛剛開始瞭解雙眼視覺的微妙之處。在下一期中,我們將進一步探討這個主題。

注意:本文最初印刷時的標題為“立體視覺”。

(延伸閱讀)

  • 雙眼深度辨別的神經機制。H. B. Barlow、C. Blakemore 和 J. D. Pettigrew 發表於 Journal of Physiology,第 193 卷,第 327–342 頁;1967 年 11 月 1 日。

  • 輪廓在立體視覺中的作用。V. S. Ramachandran、V. Madhusudhan Rao 和 T. R. Vidyasagar 發表於 Nature,第 242 卷,第 412–414 頁;1973 年 4 月 6 日。

  • Seeing in Depth. Ian P. Howard 和 Brian J. Rogers。牛津大學出版社,2008 年。

維拉亞努爾·S·拉馬錢德蘭是加州大學聖地亞哥分校大腦與認知中心教授兼主任。拉馬錢德蘭的榮譽包括獲得倫敦英國皇家學會的亨利·戴爾獎、為 BBC 講授 2003 年裡斯講座以及參加 2012 年在格拉斯哥舉行的吉福德講座。

更多作者:維拉亞努爾·S·拉馬錢德蘭
SA Mind 第 20 卷第 4 期本文最初以“錯覺:立體視覺”為標題發表於SA Mind 第 20 卷第 4 期(),第 20 頁
doi:10.1038/scientificamericanmind0709-20
© .