數字生活

新的系統可能允許人們記錄他們看到和聽到的一切——甚至包括他們無法感知的事物——並將所有這些資料儲存在個人數字檔案館中

人類的記憶可能令人惱火地難以捉摸。我們每天都會遇到它的侷限性,例如忘記朋友的電話號碼、業務聯絡人的姓名或喜愛書的書名。人們已經開發出各種策略來對抗健忘——例如,在便利貼上潦草地寫資訊,或在手持裝置中攜帶電子地址簿——但重要的資訊仍然會從指縫中溜走。然而,最近,我們在微軟研究院的團隊已經開始了一項任務,以數字方式記錄一個人生活的方方面面,從我們自己生活中的一個(貝爾的生活)開始。在過去的六年裡,我們一直試圖記錄貝爾與其他人和機器的所有通訊,以及他看到的影像、聽到的聲音和他訪問的網站——將一切都儲存在一個可搜尋且安全的個人數字檔案館中。

數字記憶的功能不僅僅是幫助回憶過去的事件、對話和專案。行動式感測器可以讀取人類甚至無法感知的事物,例如血液中的氧氣水平或空氣中的二氧化碳量。然後,計算機可以掃描這些資料以識別模式:例如,它們可能會確定哪些環境條件會加重兒童的哮喘。感測器還可以記錄一個人一生中大約三十億次的心跳,以及其他生理指標,並警告可能發生的心臟病。這些資訊將使醫生能夠及早發現異常情況,在疾病變得嚴重之前發出警告。您的醫生將可以訪問詳細的、持續的健康記錄,您將不再需要絞盡腦汁來回答諸如“您第一次感覺這樣是什麼時候?”之類的問題。

我們的研究專案名為“MyLifeBits”,它提供了一些編譯終身數字檔案館所需的工具。我們發現,數字記憶可以讓人生動地重溫帶有聲音和影像的事件,以與網際網路幫助科學研究非常相似的方式增強個人反思。一個人曾經讀過的每一個詞,無論是在電子郵件、電子文件還是在網站上,都可以通過幾次擊鍵再次找到。計算機可以分析數字記憶來幫助進行時間管理,指出您何時沒有將足夠的時間花在最重要的優先事項上。您的位置可以定期記錄,生成動畫地圖來追蹤您的漫遊。也許最重要的是,數字記憶可以讓所有人以引人入勝、細緻入微的方式向後代講述他們的人生故事,而這在過去只為富人和名人保留。


關於支援科學新聞

如果您喜歡這篇文章,請考慮透過以下方式支援我們屢獲殊榮的新聞報道 訂閱。透過購買訂閱,您正在幫助確保關於塑造我們當今世界的發現和想法的具有影響力的故事的未來。


軌跡網路
機器擴充套件記憶的願景最早在二戰結束時由時任美國政府戰時研究辦公室主任的範內瓦爾·布什提出。布什提出了一種名為 Memex(“記憶擴充套件器”的縮寫)的裝置——一種基於縮微膠捲的機器,可以儲存個人所有的書籍、記錄和通訊。Memex 將被內建到辦公桌中,並配備鍵盤、麥克風和多個顯示錶面。辦公桌後面的人可以使用相機制作照片和檔案的縮微膠捲副本,或者透過在觸控式螢幕上書寫來建立新文件。Memex 使用者還可以將相機安裝在前額上,以便在離開辦公桌時捕捉影像。布什最具遠見卓識的想法之一是建議 Memex 的設計應該模仿人類思維的聯想思維,他在生動的語言中描述了這種思維:“當大腦掌握一個專案時,它會立即跳到下一個專案,這由思想的聯想暗示,並符合大腦細胞攜帶的複雜軌跡網路。”

在接下來的半個世紀裡,包括泰德·納爾遜和道格拉斯·恩格爾巴特在內的勇敢的計算機科學先驅開發了布什的一些想法,而全球資訊網的發明者借鑑了“軌跡網路”的概念來構建他們的網站連結系統。但是 Memex 本身在技術上仍然遙不可及。然而,近年來,儲存、感測器和處理器技術的快速進步為新的數字記錄和檢索系統鋪平了道路,這些系統最終可能會遠遠超出布什的願景。

數字儲存容量的增長令人震驚:今天,一塊 600 美元的硬碟可以容納一兆位元組(一萬億位元組)的資料,這足以儲存您閱讀的所有內容(包括電子郵件、網頁、論文和書籍)、您購買的所有音樂、八小時的語音以及未來 60 年每天 10 張照片。如果目前的趨勢繼續下去,十年之內,您將能夠在手機的快閃記憶體中攜帶相同數量的資訊,同時無線連線到 PC 上價值 100 美元的 4TB 硬碟。20 年後,600 美元將購買 250TB 的儲存空間——足以容納數萬小時的影片和數百萬張照片。這種容量應該能夠滿足任何人 100 多年的記錄需求。

與此同時,製造商正在生產新一代廉價感測器,這些感測器可能很快就會變得無處不在。其中一些裝置可以記錄有關使用者健康和身體運動的大量資訊。另一些裝置可以測量周圍環境的溫度、溼度、氣壓和光照水平,甚至可以檢測附近溫暖物體的存在。有些監視器旨在佩戴,另一些則旨在放置在房間中或整合到冰箱等電器中。(冰箱感測器可以透過測量門開啟的次數來跟蹤您的零食習慣。)麥克風和攝像頭現在也足夠便宜,幾乎可以安裝在任何地方——尤其是在手機中,攝像頭的普及正在成為常態,語音錄製也將緊隨其後。

最後,過去十年計算能力的顯著提高促使引入了可以有效地檢索、分析和視覺化大量資訊的處理器。一臺普通的筆記型電腦可以執行一個比 1980 年代一家大型銀行的資料庫更強大且幾乎大 100 倍的資料庫。一部廉價的手機可以上網、播放影片,甚至可以理解一些語音。

隨著數字記錄硬體的改進,越來越多的人開始建立他們生活的電子編年史。廉價、高質量的數碼相機(包括那些整合到手機中的相機)的出現引發了攝影熱潮。包含照片的部落格現在比個人網站更常見。年輕人尤其熱衷於部落格和移動裝置的使用。這種數字編年史的激增發生在只有非常簡陋的工具的情況下,這一事實表明這種渴望必定有多麼強烈。一旦數字記錄過程變得更容易和更全面,這種興趣肯定會增長。

一個人的記憶
我們自己對數字記憶的體驗始於 1998 年,當時貝爾決定無紙化,摒棄了成堆的文章、書籍、卡片、信件、備忘錄、海報和照片。為了將這堆記憶轉移到數字記錄中,貝爾痴迷於掃描他個人生活和他漫長的計算機業務生涯中的所有文件和文物。(他甚至掃描了咖啡杯和 T 恤上的徽標。)他還開始數字化家庭電影、錄影講座和錄音。貝爾現在已經無紙化了,但代價很高:一位私人助理花了幾年時間才完成這項任務。(歸檔最近的專案不需要如此費力的努力,因為絕大多數文件、影像和影片現在都是以數字格式建立的,因此捕獲是自動的。)

然而,在掃描了所有這些資訊之後,貝爾對自己無法使用當時可用的軟體真正利用這些資訊感到沮喪。這種挫敗感促成了 MyLifeBits 專案。當我們於 2001 年啟動該專案時,為臺式計算機開發的搜尋工具非常笨拙。我們開始建立一個數據庫,該資料庫不僅使我們能夠對我們的 PC 進行全文搜尋(現在這已成為普遍功能),而且還可以使用稱為元資料的屬性快速檢索數字記憶:例如,照片的日期、地點和主題,或資料庫附加到檔案的書面或口頭評論。元資料通常是回憶的關鍵部分;例如,一個人在尋找特定的電子郵件時,可能會記得它是在一年中的某個時間傳送的。透過將這些元資料(其中大部分是自動獲得的)連結到數字記憶,資料庫允許使用者有效地梳理即使是最大的檔案。

MyLifeBits 還為貝爾提供了一套新的工具,用於捕獲他與其他人和機器的互動。該系統記錄了他的電話以及廣播和電視上播放的節目。當他在 PC 上工作時,MyLifeBits 會自動儲存他訪問的每個網頁的副本以及他傳送或接收的每條即時訊息的記錄。它還會記錄他開啟的檔案、他播放的歌曲以及他執行的搜尋。該系統甚至可以監控他螢幕前臺的視窗以及滑鼠和鍵盤活動的頻率。當貝爾在移動時,MyLifeBits 會從行動式全球定位系統裝置持續上傳他的位置,無線傳輸資訊到他的檔案中。這種地理跟蹤使軟體能夠根據拍攝每張照片的時間自動為貝爾的照片分配位置。

為了獲得他一天的視覺記錄,貝爾佩戴了 SenseCam,這是一款由微軟研究院開發的相機,當其感測器指示使用者可能想要拍照時,它會自動拍照。例如,如果 SenseCam 的被動紅外感測器檢測到附近有溫暖的身體,它就會拍攝該人。如果光照水平發生顯著變化——這表明使用者可能已經進出房間並進入了新的環境——相機就會拍攝另一張快照。英國劍橋 Addenbrooke 醫院的研究人員最近領導的一項研究表明,每晚回顧 SenseCam 影像的記憶障礙患者能夠保留記憶兩個多月。(相比之下,每晚回顧書面日記幾乎沒有改善記憶力。)英國利茲大學的神經心理學家馬丁·康威推測,SenseCam 可能成為“21 世紀第一個真正強大的記憶刺激物”。

六年後,貝爾積累了一個超過 300,000 條記錄的數字檔案,佔用了大約 150GB 的記憶體。這些資訊儲存在貝爾的雙盤筆記型電腦和他助手的臺式電腦上,這些電腦在本地和異地備份。影片檔案佔據了大部分儲存空間——超過 60GB——而影像佔用了 25GB,音訊檔案(主要是音樂)佔用了 18GB。其餘部分由 100,000 個網頁、100,000 封電子郵件、15,000 個文字檔案、2,000 個 PowerPoint 檔案等共享。貝爾發現該系統對於聯絡老熟人和尋找需要與之交流的其他人特別有用。他還使用 MyLifeBits 來檢索他研究論文中引用的網站,為醫生提供 25 年前冠狀動脈搭橋手術的記錄,併為報紙訃告獲取已故朋友的照片。

MyLifeBits 的某些功能(例如全文搜尋)已融入商業產品中。但總的來說,該系統需要更多開發才能提高其易用性和資料管理能力。用於將語音轉換為文字的更好軟體將透過允許使用者搜尋電話對話或其他錄音中的單詞或短語來極大地增強系統。同樣,自動面部識別將解決照片標籤的棘手問題。如果系統自動識別數百種文件型別中每種文件的性質,也許透過分析其形式和內容,則資訊的檢索可能會變得更容易。但是我們的研究專案已經戲劇性地展示了 PC 從文字處理器和數字運算器到事務處理器的演變,事務處理器可以以高保真多媒體記錄使用者生活的方方面面。許多專家預測個人電腦將消亡,但很明顯,“PC”中的“P”不會消失。如果有什麼變化的話,PC 將變得更加個性化。變化的是“C”。我們的機器將演變成計算生態系統,不僅包括計算機,還包括網際網路上的儲存服務、新的訪問裝置(例如手機和娛樂中心)以及無處不在的感測器。最有可能的是,我們的 LifeBits 最終將儲存在連線到各種 Web 服務的家庭伺服器中。

實現願景
為了說明數字記憶的潛在影響,我們想象了不久的將來,一個虛構的家庭充分利用這項技術的一天。家庭數字記憶的各個部分儲存在他們的個人裝置中——他們的手機、筆記型電腦、家用電腦等——但所有這些資訊也透過網際網路安全地傳輸到一家名為 LifeBits, Inc. 的假設公司執行的主機伺服器。該公司管理資料的儲存,執行定期備份(以便恢復任何意外刪除的材料),並將檔案副本放置在不同的位置,以確保其不會在自然或人為災難中被毀壞。

由於他們的大部分資訊都可以透過安全的 Web 訪問獲得,因此家庭成員可以隨時隨地檢索它。可能使某人陷入法律困境的特別敏感的資訊可以儲存在離岸資料儲存帳戶中——如果您願意,可以稱為“瑞士資料銀行”——使其超出美國法院的管轄範圍。家庭中的孩子可以加密他們的錄音,但 LifeBits 服務將允許父母在緊急情況下訪問資料。同樣,父母的一些數字記憶可能受僱傭合同的約束,合同規定與其工作相關的資料屬於其僱主。當此類員工離職時,他們可能必須對自己的記憶副本執行“部分腦葉切除術”,刪除所有被視為公司財產的內容。

我們描述的一些場景並非完全是未來主義的。可穿戴感測器平臺,用於收集健康資料並監測生命體徵,例如心率、呼吸和燃燒的卡路里數量,已經由位於加利福尼亞州文圖拉的 VivoMetrics 和位於匹茲堡的 BodyMedia 等公司商業化。與此同時,位於加利福尼亞州海沃德的 Dust Networks 開發了一種無線集線器,用於在感測器網路中中繼訊號。由麻省理工學院媒體實驗室的 Deb Roy 領導的人類語音組專案正在進行一項工作,記錄一個孩子生命最初三年幾乎所有醒著的時間——這個孩子是 Roy 的兒子,現在一歲——以研究人們如何獲得語言。東京大學的 Kiyoharu Aizawa 和他的同事正在研究可穿戴攝像機系統,該系統可以透過監測使用者大腦中的 α 波來識別有趣的時刻以供後人捕捉。

微軟研究院正在支援 14 所大學開展各種數字記憶領域的專案。其中之一是由匹茲堡大學的 Bambang Parmanto 領導的 MyHealthBits;這項工作正在迎接記錄大量健康資料和管理由此產生的大量記錄的挑戰。華盛頓大學最近的研究表明,持續健康監測對糖尿病患者和睡眠障礙患者有益。

早期的進展令人鼓舞,但數字記憶時代的到來並非一帆風順。一些國家和美國州目前對錄製對話或拍攝人物照片施加了限制。許多個人同樣擔心記錄可能在法庭上被用來對付他們的資訊。數字記憶與我們大腦中的記憶不同,在法律訴訟中是公平的遊戲。理查德·尼克松曾建議他的助手在在大陪審團面前作證時說“我不記得了”,但他自己談話的錄音是他垮臺的原因。對於我們這些將數字記憶視為我們自己思想延伸的人來說,在法庭上使用此類材料會感覺像是自證其罪。然而,新技術可以幫助最大限度地減少潛在的危險。例如,在錄製他人時,可能會模糊他們的影像或語音以避免非法錄製。

保護數字記憶的隱私將至關重要。身份竊賊、饒舌者或專制國家可能獲得此類記錄的前景令人恐懼。然而,大多數人的電腦上已經有相當多的敏感資訊。無論您在數字記憶的概念上走多遠,安全都是一個重要的考慮因素(儘管在單個檔案中儲存一生的個人資料至少會使問題在數量上變得更糟,即使不是在質量上)。此外,即使我們的計算機系統可以像諾克斯堡一樣安全,使用者在共享資訊時也必須非常小心;只需一個錯誤的擊鍵,一個人的醫療記錄就可能無意中分發給全世界。為了防止此類錯誤,數字記憶的使用者介面必須比我們現在擁有的更好,並且我們將需要智慧軟體在共享資料看起來有風險時提供警告。

另一個技術挑戰將是確保使用者能夠在儲存數十年後開啟他們的數字檔案。我們已經遇到過無法訪問文件的情況,因為它們的格式已經過時。數字檔案管理員將不得不不斷地將他們的檔案轉換為最新的格式,在某些情況下,他們可能需要執行舊機器的模擬器來檢索資料。一個小行業可能會興起,專門防止人們因格式演變而丟失資訊。

更大的挑戰將是設計軟體,使計算機能夠透過利用這個巨大的知識庫來執行有用的任務。最終目標是一臺可以像私人助理一樣工作的機器,預測使用者的需求。至少,計算機必須更好地組織資訊。對於幾排書架效果良好的搜尋策略可能根本不適用於國會圖書館大小的館藏。我們大多數人都不想成為我們數字檔案的圖書管理員——我們希望計算機成為圖書管理員!

因此,我們的研究小組對將人工智慧 (AI) 應用於數字記憶非常感興趣。儘管許多專家對人工智慧的努力持懷疑態度,但我們相信,如果這種軟體可以利用個人檔案中海量的資料儲存,那麼它可能會產生實際效果。旨在處理大量資訊的人工智慧系統肯定會比必須基於非常少的資料點提出建議的系統表現更好。我們已經開始在該領域工作,開發可以根據檔案內容組織檔案的軟體,但仍有許多工作要做。

從某種意義上說,數字記憶時代是不可避免的。即使那些對我們的願景感到反感的人,在未來幾年內,他們的計算機也將擁有更多的儲存空間,並期望軟體能夠越來越多地幫助他們利用它。儘管有些人可能會對無處不在的記錄前景感到恐懼,但對我們來說,興奮遠遠超過了恐懼。數字記憶將在廣泛的領域產生益處,提供關於人們如何思考和感受的寶貴資訊。透過不斷監測患者的健康狀況,未來的醫生可能會為心臟病、癌症和其他疾病開發更好的治療方法。科學家將能夠一窺他們前輩的思維過程,未來的歷史學家將能夠以前所未有的細節審視過去。機會僅受我們想象力的限制。

我們可能會這樣想。範內瓦爾·布什,《大西洋月刊》,第 176 卷,第 1 期,第 101-108 頁;1945 年 7 月。

個人數字儲存。G. 貝爾,《ACM 通訊》,第 44 卷,第 1 期,第 86-91 頁;2001 年 1 月。

無處不在的計算和豐富儲存時代中的數字記憶。Mary Czerwinski、Douglas W. Gage、Jim Gemmell、Catherine C. Marshall、Manuel A. Pérez-Quiñones、Meredith M. Skeels 和 Tiziana Catarci,《ACM 通訊》,第 49 卷,第 1 期,第 44-50 頁;2006 年 1 月。

MyLifeBits:萬物個人資料庫。Jim Gemmell、Gordon Bell 和 Roger Lueder,《ACM 通訊》,第 49 卷,第 1 期,第 88-95 頁;2006 年 1 月。

數字生活的一天

儲存容量

大眾科學雜誌第 296 卷第 3 期本文最初以“數字生活”為標題發表於大眾科學雜誌第 296 卷第 3 期(
doi:10.1038/scientificamerican032007-4PQWRprLH6ECawaeMZBsNZ
© .