新技術追蹤我們的眼睛,並讀取我們的思想

眼動追蹤技術讓我們能夠玩影片遊戲、控制小工具,並透過眼睛單獨診斷疾病。它還可以揭示很多關於我們如何思考和感受的資訊

一天快結束時,你在辦公室裡準備回家。你登入電腦,瀏覽桌面,開啟瀏覽器,登入你的電子郵件帳戶。你閱讀最新的郵件,自己寫了幾封,然後登出。當你開車回家時,隔壁車道上的汽車上的某些東西分散了你的注意力,但一個溫和的警報提醒你注意路況。當你回到客廳時,你打開了影片遊戲機。你扮演一個身份,穿越虛擬景觀,躲避一些角色,炸燬另一些角色。從你坐在辦公室的辦公桌前,直到你做出最後的 Xbox 假動作,你大部分的互動都是在沒有使用你的手甚至聲音的情況下進行的,僅僅是透過移動你的眼睛。

支援我們數字生活和物理生活無縫融合的技術遠非科幻小說,它已經存在。它是新興的眼動追蹤領域的現實世界衍生產品。廣義而言,眼動追蹤指的是任何可以監控我們注視方向和眼睛行為的技術,在這個過程中生成的資料可以提供我們意圖的線索。與配備眼動追蹤感測器和軟體的裝置的互動似乎是直觀而毫不費力的,就好像我們的小工具在讀取我們的思想一樣。

並非巧合的是,隨著技術的進步,研究人員對我們眼睛的工作原理和不可觀察到的思維方面瞭解得越來越多:我們的思想和精神集中以及進入我們意識的途徑。眼動追蹤可以揭示我們是在處理眼前的事物還是精神渙散,我們是否認出了一張臉,或者以前從未見過——或者我們是否見過但後來忘記了。我們對眼球運動的新理解也正在推動遊戲、計算機和醫療保健等眾多行業的發展。營銷人員也渴望利用我們的注視模式,這對隱私產生了影響。


支援科學新聞報道

如果您喜歡這篇文章,請考慮透過以下方式支援我們屢獲殊榮的新聞報道 訂閱。透過購買訂閱,您正在幫助確保未來能夠講述關於塑造我們當今世界的發現和想法的影響深遠的故事。


研究人員開發眼動追蹤主要是為了瞭解基本的視覺處理(例如,我們如何將來自每隻眼睛的獨立流融合成一個單一的心理影像)。臨床醫生也對眼球運動如何與涉及視力問題的疾病(如眩暈)有關感興趣。最初,眼動追蹤只是簡單的觀察。實驗者會坐在一個人對面,並記錄受試者眼睛的行為。

早期的發現令人驚訝。儘管我們對視覺的主觀體驗是平穩地掃過穩定的景觀,但我們眼睛的運動絕非穩定。在大多數情況下,我們的眼睛在極短的時間內(通常約為三分之一秒)保持相對靜止,然後是快速的跳動,直到它們停留在下一個目標上。短暫的靜止期被稱為注視,快速跳動被稱為掃視。

這種不穩定行為的主要原因是我們的視覺最佳點非常小。事實上,提供清晰影像的視野部分大約只有臂長距離處一角硬幣的大小,質量向外圍急劇下降。因此,我們不斷移動眼睛,將新的資訊片段帶入中心焦點。這種斷斷續續的運動給研究人員提出了一個難題:儘管不斷運動,我們如何體驗到穩定的視覺?

因此,人們開始尋求能夠追蹤眼睛每一次運動的硬體,無論多麼快速。20世紀初,賓夕法尼亞州西部大學(現稱為匹茲堡大學)的心理學家埃德蒙·休伊發明了一種裝置,可以關聯眼球運動和閱讀時頁面上的文字。這是一個相當具有侵入性的裝置,包括一個石膏杯,戴在眼球上,上面有一個小孔,受試者可以透過這個小孔看到東西。一個槓桿連線到眼罩,一個筆連線到槓桿,當參與者閱讀時,筆與旋轉的鼓接觸。為了最大限度地減少刺激,用可卡因麻醉眼球,並使用夾子和咬合杆將頭部固定到位。其他早期的裝置使用隱形眼鏡、吸盤、嵌入式鏡子和磁場感測器的組合來三角定位觀看者注意力的焦點。

如今,研究人員依靠角膜反射光線的方式來繪製眼球的旋轉軌跡。在一個典型的實驗中——例如,研究閱讀或注意力——參與者坐在電腦前,頭部放在下巴託上。電腦底座上的一個小攝像頭放大眼睛(或雙眼),二極體發出近紅外光(人們無法感知該波長的光,因此他們不會感到不適)。光線反射回攝像頭,計算機演算法將反射資料轉換為眼睛的即時注視路徑。透過結合關於角膜反射模式、瞳孔位移以及計算機相對於參與者的位置的資訊,追蹤系統可以精確地判斷參與者的目光落在電腦螢幕上的哪個位置。

當研究超出實驗室範圍時,更大的挑戰出現了。空間精度在眼動追蹤中至關重要,因為測量某人注視方向的微小誤差會歪曲對該人所見事物的任何解釋。在外部世界實現這種精度更加困難,因為頭部和身體的運動會干擾注視位置的測量。因此,研究人員開發了將關於注視的資訊疊加到環境中的裝置,例如頂部裝有攝像頭的頭盔,該攝像頭將眼球運動的記錄與受試者視野的即時影片融合在一起。今天的可穿戴追蹤裝置採用輕型護目鏡的形式,但原理仍然相同:一個小感測器追蹤瞳孔的黑點以精確定位注視方向,一個安裝在雙眼之間的小型攝像頭記錄場景。

瞭解我們所見

除了揭示視覺的機制外,眼動追蹤還可以幫助我們理解認知的無形要素:我們記住什麼、我們的感受以及我們正在關注什麼,無論我們是否意識到。例如,眼球運動可以揭示我們何時看到以前見過的東西,即使我們對遇到它沒有記憶。在威斯康星大學密爾沃基分校的心理學家黛博拉·漢努拉於 2012 年領導的一項研究中,受試者被要求記住一張臉的影像。當展示一組包含原始影像的面孔時,受試者花更多時間檢查他們以前見過的影像,而不是那些他們沒有見過的影像。如果影像改為包含原始面孔的稍微修改過的版本,受試者仍然傾向於將更改後的影像識別為真實事物。然而,他們的眼睛並沒有被愚弄。受試者觀看修改後的影像的時間少於原始影像,這表明眼睛將它們識別為假貨。這些發現對於目擊證人證詞的解釋具有重要意義——例如,在衡量檢視一組嫌疑人照片的人是否以前見過其中一張面孔時。

眼球運動模式還可以讓我們深入瞭解思維和情緒。在蘇格蘭阿伯丁大學的蕾切爾·班納曼於 2009 年領導的一項研究中,研究人員使用眼動追蹤來檢查人們如何看待威脅。他們發現,受試者的眼睛比良性的面孔和身體姿勢更快地移向威脅性的面孔和身體姿勢,這表明我們的眼球運動系統已經準備好檢測迫在眉睫的危險。感到害怕或焦慮的個體也表現出對威脅性物體和麵孔的偏見,並且比其他人更難將目光從威脅上移開。為了加強這一發現,德克薩斯大學達拉斯分校的喬納森·沙斯汀及其同事在 2014 年進行的一項研究發現,在快樂的面孔人群中,人們更容易關注憤怒的面孔,而不是在憤怒的面孔人群中關注快樂的面孔,這表明危險比獨特性更能吸引眼球。

我們的眼睛也是精神努力的標誌。20 世紀 60 年代瞳孔測量學(瞳孔大小的測量)的先驅埃克哈德·H·赫斯發現,當參與者進行具有挑戰性的乘法運算時,他們的瞳孔會放大,就像我們進入光線昏暗的房間時瞳孔會放大一樣。瞳孔是研究的理想客觀結構。與我們可以有意識地控制的眼球不同——例如,透過看向一個方向或另一個方向——我們對瞳孔沒有任何自主控制權。研究人員希望,對瞳孔測量的分析將有助於揭示工人何時工作過度,特別是那些從事高風險工作的人,如空中交通管制員、行李安檢員、卡車司機和外科醫生。

類似的研究也可以幫助伏案工作的人員專注於他們正在做的事情。英國南安普頓大學的心理學家埃裡克·D·賴克爾正在開發一種系統,該系統可以讓人們知道他們何時處於“殭屍閱讀”狀態——即我們眼睛在文字上移動一段時間,但沒有吸收我們看到的任何一個單詞的現象。在 2010 年的一項研究中,賴克爾發現,當我們失去精神注意力時,我們眼睛的行為會有所不同。如果我們集中注意力,當我們看熟悉的單詞時,我們的注視時間往往會更短,而當我們看不太常見的單詞時,我們的注視時間會更長。當我們心不在焉地閱讀時,這種變化是不存在的,即使我們的眼睛仍然擊中目標。現在,賴克爾正試圖開發演算法,可以篩選眼動追蹤資料,並在讀者注意力渙散時立即發出警報。

實用追蹤

隨著我們對眼球運動與思維之間關係的瞭解越來越多,眼動追蹤技術正在進入現實世界的應用,尤其是在數字裝置控制、遊戲和醫療保健領域。眼動追蹤器已經可以取代滑鼠來完成諸如點選、縮放和滾動之類的任務。使用者可以透過盯著一個圖示一段時間來點選,透過固定在一個位置並按下控制器鍵來放大或縮小,以及透過向上或向下移動眼睛來滾動。

向計算機或平板電腦新增眼動追蹤系統很簡單。這些裝置包含光源和感測器,體積小巧、時尚,可以粘在顯示器底部或筆記型電腦或平板電腦的框架上,透過 USB 埠連線。它們相對便宜,Eye Tribe 和 Tobii 等公司的型號售價在 99 美元到 139 美元之間。使用者安裝相關軟體並完成快速校準程式(通常是一個培訓程式,教軟體瞭解使用者的眼睛特徵)。當前的裝置需要使用者進行一些程式設計(例如建立驅動程式),因此它們還不是真正的即插即用。預計帶有內建眼動追蹤技術的計算機和平板電腦將很快上市,根據新聞截稿時的傳言,其中包括 Apple iPad Pro。事實上,蘋果公司在 2013 年提交了一項眼動追蹤技術專利,該技術將解決如果我們長時間盯著影像看,影像會從我們的感知中消失的趨勢。

監控眼球運動的移動裝置也正在進入市場。如果你想要一個在 iPhone 上不會誤觸的快門按鈕,一款應用程式已經允許你透過眨眼來拍照。谷歌眼鏡也會做同樣的事情。三星 Galaxy S4 和 S5 手機已經允許使用者透過將目光從螢幕上移開來暫停影片,或者透過傾斜頭部來翻閱電子書上的頁面。

最渴望採用眼動追蹤技術的行業可能是遊戲行業。例如,眼動追蹤版本的射擊遊戲可以讓玩家透過注視他們想要前進的位置來在虛擬世界中移動他們的頭像。按下一個鍵可能會開啟武器選單;玩家可以透過眨眼來選擇物品,並透過注視目標並按下扳機鍵來攻擊。根據喬納森·芬徹在 2014 年 1 月的 Gizmag 線上故事中的報道,測試過早期版本的技術的遊戲玩家表示,使用它起初有點不舒服,尤其是想要伸手去拿滑鼠的衝動很難抵制,但最終他們發現用眼睛瞄準和射擊更快更準確。最終,配備眼動追蹤裝備的玩家可能會比使用標準滑鼠控制元件的玩傢俱有速度優勢,而沒有什麼比軍備競賽更能推動技術發展了。

良藥

眼動追蹤也正在成為醫療保健領域的重要工具。該技術已經簡化了各種具有視覺成分的疾病的篩查和診斷,並且很快將幫助殘疾人暢遊世界。

在診斷前沿,眼動追蹤在檢測帕金森病、精神分裂症和許多兒童疾病(包括自閉症、注意力缺陷多動障礙 (ADHD) 和閱讀障礙)方面特別有用。患有這些疾病的人具有獨特的眼球運動模式,簡單的計算機測試就可以發現。例如,在南加州大學的開創性工作中,神經科學家洛朗·伊蒂的實驗室設計了演算法,這些演算法已幫助以 90% 的準確率識別出帕金森病患者,並以近 80% 的準確率識別出 ADHD 患者。阿伯丁大學的心理學家伊娃·努佐娃及其同事在 2014 年進行的一項研究報告了在使用眼動追蹤診斷重度抑鬱症方面取得的進展。同樣在阿伯丁大學工作的心理學家菲利普·本森及其同事在 2012 年發表的一項研究中開發了可以近乎完美地將精神分裂症患者與健康對照組區分開來的測試。

精神分裂症測試利用了眼球運動中的一個異常現象:當我們追蹤像空中飛行的球這樣的移動物體時,我們會平穩地跟隨物體,而不會發生掃視。這意味著平穩追視使用與閱讀等活動不同的神經迴路。然而,當精神分裂症患者試圖跟隨移動物體時,他們的眼球運動是斷斷續續的。因此,為了篩查精神分裂症,技術人員會要求受試者跟隨螢幕上移動的點,並標記出眼睛顯示出明顯的掃視跡象的任何人。(本森的團隊因其研究而獲獎,並將使用獎金將該程式推向市場。)

除了診斷之外,研究人員還在使用眼動追蹤來幫助身體殘疾的人獨立生活。患有神經系統疾病以及腦部和脊髓損傷的個體通常溝通能力有限。配備註視互動技術的計算機可以讓人們使用眼睛開啟瀏覽器、找到他們的電子郵件收件箱,並透過在螢幕上選擇單詞來“打字”。對於那些不能說話的人,語音輸出系統將透過揚聲器播放文字。對於大多數人來說,這些系統可能會取代所謂的 BCI(腦機介面的縮寫)拼寫器,在這種拼寫器中,一個人在觀察字母網格時佩戴一頂鑲有電極的帽子,該帽子可以識別大腦活動。為了在網格中選擇一個字母,使用者必須將注意力集中在其上幾秒鐘。相比之下,眼動追蹤可以立即檢測到觀看者的注視位置。

你看到我所看到的嗎?

與許多新技術一樣,眼動追蹤引發了一系列倫理和隱私問題。在這個日益資料驅動的時代,我們有理由想知道誰將有權訪問我們的技術收集的資訊型別。當我們使用眼動追蹤 PC 瀏覽網際網路或駕駛安裝了追蹤器的汽車(例如現代的 HDC-14 概念車)時,任何人都可能在窺視我們。廣告商可以獲得這些資訊嗎?保險公司或警察呢?

目前,廣告商使用 Cookie 來追蹤您訪問的網站,以便他們可以為您提供您可能感興趣的產品的廣告。當計算機配備眼動追蹤系統時,這些廣告商可以使用關於您在頁面上檢視位置的資訊來更精細地定製廣告。一些使用者可能會發現這種微調很有幫助,但想象一下,如果彈出式廣告隨著您的目光在頁面上移動,或者 YouTube 上的影片廣告“知道”您何時沒有觀看它們並在您再次觀看它們之前暫停播放。這些技巧都在該技術的範圍內,與消費者的衝突勢必會發生。

例如,在 2012 年,微軟為其 Kinect 遊戲裝置申請了眼動追蹤技術專利,以便讓該公司收集關於使用者在玩遊戲時在螢幕上檢視位置的資訊,這引起了人們的擔憂,即微軟將追蹤遊戲玩家正在檢視哪些廣告以及檢視時長。該公司在第二年因隱私問題陷入困境,有傳言稱該公司將向營銷人員出售 Kinect 資料,並將 Kinect 用於定向廣告。微軟還計劃透過面部表情分析執行眼動追蹤系統捕獲的影像,從而根據使用者的情緒定製廣告。一些 Kinect 使用者表示擔心該裝置會始終處於開啟狀態並始終在監聽,就像老大哥一樣。微軟在 2013 年 10 月釋出了一系列宣告,向用戶保證他們可以關閉裝置和廣告追蹤功能,並且該公司不會收集資料,除非使用者願意。

將眼動追蹤用作身份識別手段引起了更多不安。德克薩斯州立大學計算機科學系的研究人員正在測試生物識別系統,該系統可以根據人們閱讀文字或觀看圖片時獨特的眼球運動模式來識別他們。在最近的研究中,眼動追蹤在識別受試者方面的準確率略高於 70%。該比率遠低於虹膜掃描(90% 至 99%)或指紋(高達 99%)的準確率。然而,隨著計算系統和追蹤技術的發展,差距可能會縮小。即使現在,該技術也為家庭安全和技術保護帶來了明顯的好處。例如,入侵者將被鎖定在您的計算機之外,因為系統會從他們的眼球運動中知道他們不是所有者。該技術也比虹膜掃描更易於受試者接受,虹膜掃描需要使用者保持靜止。然而,令人擔憂的是,眼動追蹤 ID 系統很容易進行秘密和侵入式部署。

沒有任何小工具比谷歌眼鏡(一種可穿戴計算機,透過一系列鏡頭將影像投射到使用者的視網膜上)更具侵入性和普遍的令人毛骨悚然的潛力。像大多數行動式裝置一樣,它也將配備一個攝像頭,也朝外。雖然當前版本的 Glass 沒有內建眼動追蹤功能,但谷歌已提交了一項將該技術整合到頭戴式裝置中的專利。該專利涵蓋了追蹤注視和測量瞳孔大小的能力,這表明谷歌計劃評估人們觀看廣告時的使用者參與度。注視追蹤將告訴谷歌使用者正在看什麼(廣告、物體、人物);瞳孔測量法將測量他們對環境中這些物體和人物的情緒反應。有了這些資料,谷歌可以部署一個“按注視次數付費”系統,廣告商可以為每次觀看他們的廣告向該公司付費。該技術將適用於使用者視野中的任何事物,包括廣告牌、雜誌和其他印刷媒體,以及 Glass 上顯示的影像。

倫理問題顯而易見:該裝置可能會識別出人們佩戴它時所在的位置,以及他們遇到的人和事。谷歌的專利透過使資料收集匿名化並允許使用者選擇退出這種形式的追蹤來解決隱私問題。然而,如果 NSA 監視名單上的某人恰好從你的目光前經過,這些保證是否仍然有效?

最終,即使眼動追蹤技術讓我們能夠控制追蹤我們的裝置,我們的掌控感也可能是虛幻的。如果眼睛是心靈的窗戶,我們需要知道還有誰在透過它們觀看。

延伸閱讀

眼睛的移動平板電腦:現代眼球運動研究的起源。 尼古拉斯·韋德和本傑明·塔特勒。牛津大學出版社,2005 年。

牛津眼球運動手冊。 西蒙·利弗西奇、伊恩·吉爾克里斯特和斯特凡·埃弗林編輯。牛津大學出版社,2011 年。

基於自然觀看眼球運動的臨床人群高通量分類。 Po-He Tseng 等人,《神經病學雜誌》,第 260 卷,第 1 期,第 275–284 頁;2013 年 1 月。

來自我們的檔案

轉移焦點 蘇珊娜·馬丁內斯-康德和斯蒂芬·L·麥克尼克;2011 年 11 月/12 月。

看與不看 邁克爾·C·胡特和斯蒂芬·D·戈爾丁格;2013 年 7 月/8 月。

阿琳·羅賓斯是新墨西哥州立大學心理學系專注於視覺認知的博士生。

更多作者:阿琳·羅賓斯

邁克爾·C·胡特是新墨西哥州立大學心理學系助理教授,也是該校視覺科學和記憶實驗室的首席研究員。

更多作者:邁克爾·C·胡特
SA Mind 第 26 卷第 1 期本文最初以“看我的眼睛”為標題發表於SA Mind 第 26 卷第 1 期 (),第 54 頁
doi:10.1038/scientificamericanmind0115-54
© .