線上 24/7:“生活記錄”先驅闡明雲計算的未來

微軟研究員戈登·貝爾,十多年無紙化辦公,設想資料中心充斥著資訊,並透過網際網路隨時隨地輕鬆訪問服務


關於支援科學新聞報道

如果您喜歡這篇文章,請考慮透過以下方式支援我們屢獲殊榮的新聞報道 訂閱。透過購買訂閱,您正在幫助確保有關塑造我們當今世界的發現和想法的有影響力的故事的未來。


雲計算的想法是使世界各地資料中心執行的所有資訊和服務都可透過網路訪問。但現實情況令人望而生畏。不同企業、政府實體和研究機構建立的資料中心並非天生就為了共享而設計,而且並非所有資訊都可以(或應該)提供給任何可以使用網路瀏覽器的人。

許多人認為,隨著移動互聯裝置的普及和寬頻接入的擴充套件,雲計算模式將盛行,因為它可以在裝置本身上無需大量儲存或處理能力即可訪問資料和應用程式。

也許這些人中最重要的是 戈登·貝爾,微軟研究院的首席研究員和資深的 “生活記錄者”,他與大眾科學談論了雲計算與其他型別的網路服務的區別,為什麼科學家需要加入雲模式,以及為什麼有人會想將一生的記憶儲存在數字深淵中。

貝爾認為雲計算是同名 貝爾定律 的新篇章,他於 1972 年制定該定律,以描述不同的計算方法如何出現、發展並最終消亡(或至少淡出背景)。這些新方法大約每十年出現一次,並承諾使計算機更便宜、更易於訪問。在 1960 年代,大型機將分散式計算和啞終端引入工作場所。緊隨其後的是小型計算機,它基本上使小型企業也能使用大型機的功能。個人電腦隨後出現,將計算的範圍擴充套件到家庭,並最終使網際網路得以蓬勃發展。最近,無線裝置使我們能夠隨身攜帶計算。貝爾認為,“雲”有望將計算提升到一個新的水平。

儘管貝爾已經在微軟研究院工作了近二十年,但他明確指出,本次採訪中表達的觀點僅代表他個人,不代表其僱主的觀點。

[以下是經過編輯的採訪稿。]


您如何定義“雲計算”?
正如貝爾計算機等級形成定律所描述的那樣,它是下一個計算平臺。像所有新平臺一樣,我們可以從四個功能元件來看待它:儲存、計算能力、網路和使用者介面。對於雲計算,重點在於儲存和網路,以實現對交易所需資料的廣泛、24 小時全天候訪問——無論是科學的、金融的還是其他的。

它與早期的硬體、網路、應用程式和資料託管服務有何區別?
在某些方面,沒有什麼區別。雲是從託管網路內容的大量分散式伺服器發展而來的。不同之處在於這些伺服器的規模——數萬臺計算機消耗 50 兆瓦的電力並託管數千個客戶。託管公司不是讓每個客戶維護自己隔離的伺服器,而是將對其伺服器的訪問許可權作為服務出售。客戶共享計算機系統、電力、資料中心空間和維護服務。

我們正處於雲服務發展的哪個階段?
亞馬遜是第一個在其業務中使用雲計算模型的公司,現在是向其他企業提供雲服務的領導者。企業家們正在利用亞馬遜的 Web 服務、微軟的 Windows Azure 託管平臺和其他雲服務來創辦公司,因為它們無需任何資本裝置投入。付款方式為信用卡,並且按需付費。

今天大多數人都在以某種方式使用雲嗎?
當然。想想 iTunesDropboxSalesforce.comHealthVault——[後者] 讓您儲存和共享您的醫療資訊,而不是,比如說,您當地醫院使用的 Epic 軟體。提供線上遊戲、專案管理工具和其他服務的初創公司是人們使用雲的其他方式。

雲服務如何影響科學?
對於科學而言,雲服務實際上還沒有真正開始到任何可衡量的程度。然而,對於科學而言,雲是不可避免的,這受到幾個因素的驅動。大學和其他研究機構維護自己的高效能計算叢集將開始看到讓其他人管理這些系統的成本效益。高效能叢集中資料的生命週期是可疑的,可能只與學生執行實驗的時間一樣長。他們產生的資料可能沒有或可能沒有任何冗餘或備份。

雲計算為科學家提供了跨多個研究機構訪問資料的途徑。隨著科學發展超越單個實驗室,支援科學界的管理細節和網路成本需要超出單個實驗室或大學計算中心心態的標準和開銷。由研究生管理的、定位為一種迷你雲的本土計算機系統,可提供 24 小時全天候的資料訪問,將讓位於具有地域冗餘和更高可靠性的商業雲服務。科學家們還面臨著永久提供資料的壓力,尤其是在他們的實驗由公共資金資助時。更重要的是,由競爭性研究市場驅動並由無處不在的感測器提供資料的大規模實驗正在產生 TB 級的資訊,這些資訊太昂貴而無法在實驗室伺服器上管理。然後是維護這些系統所需的技能。目標是培訓計算機操作員還是讓研究生從事科學研究?

什麼是“生活記錄”,微軟的 MyLifeBits 與此有何關係? MyLifeBits,我與吉姆·傑梅爾在 2007 年 3 月號的大眾科學 中撰寫過關於它的文章,是微軟研究院的一個專案,旨在為人們提供編譯終身數字檔案或生活記錄所需的工具。它是 瓦內瓦爾·布什 1945 年的 memex [超文字] 願景的實現——一個貫穿一生的資訊數字儲存庫,以補充自己的記憶——包括全文搜尋、文字和音訊註釋以及超連結。

自 2001 年以來,吉姆·傑梅爾和我演示了完整生活記錄的許多方面——將與我生活相關的信件、論文、照片、影片和錄音儲存在帶註釋且可搜尋的資料庫中。數碼相機、生物感測器和 GPS 的出現意味著我們現在可以即時記錄關於個人的所有資訊,從位置到他們的身體狀態的各個方面,例如能量消耗、心率和壓力水平。

烏托邦願景還是反烏托邦噩夢?未來生活記錄的程度將至少取決於我們建立的關於隱私的法律和規範。例如,我們有什麼權利記錄我們與他人的互動?但生活記錄對個人生活和社會整體的潛在益處是巨大的。2009 年,英國的研究人員展示了使用延時相機進行生活記錄如何幫助那些患有失憶症的人重新掌控自己的生活。對於社會科學家來說,廣泛的生活記錄將意味著前所未有的資料洪流,以進一步我們對人類行為的理解。對於我們每個人來說,這可能意味著獲得一點有限的永生的機會。

為了使一個人一生中收集的所有資訊都變得有用,它必須是可搜尋的。不同型別的資料(文件、音訊、影片等)在多大程度上可以輕鬆搜尋?
每年都在變得更好。所有照片都在朝著基於地理位置和時間進行標記的方向發展,這有助於系統識別它們。印刷文件已經可以搜尋十年了,儘管我不相信手寫文件目前正在被研究。影片與圖片相關,並且正在得到解決。

您已經無紙化辦公十多年了。您要從中篩選所有這些資訊以找到您想要的東西有多容易?
我很少放棄查詢某個專案,無論是照片、電子郵件還是文件。這些檔案始終與我同在,我可以隨時隨地工作。

資料洩露已變得司空見慣,企業因網路攻擊或筆記型電腦丟失而洩露個人資訊。隨著世界日益數字化,對於那些擔心安全和隱私的人們,您有什麼要說的?
嗯,我們有兩種情況:資料在本地計算機上或儲存在雲中。任何在本地計算機上擁有公司或機構資料的人都必須加密他們的磁碟,以防有人偷走系統。此功能內置於 Windows 中。人們可以透過物理隔離(包括本地資料伺服器和外部硬碟驅動器)在不同程度上保護他們的個人計算機。我們不斷努力使連線到網路的 PC 更難被滲透,尤其是被攻擊訪問。遠離網路是理想的選擇,基本上是我們都使用的防火牆背後的想法。對於那些將所有內容都儲存在雲中的人來說,我不知道有任何重大攻擊導致每個人的資料都被洩露的例子,但這可能會發生。

亞馬遜最近經歷了長時間的伺服器停機,這使得該公司的許多客戶無法進行雲計算。對於任何考慮將所有資料和軟體外包給服務提供商的人來說,這是否應該作為一種警示?
我不認為這次停機會影響雲計算的採用。亞馬遜的許多客戶可能受到了影響,但這可能與您將所有獨立執行的單獨系統所遭受的停機時間加起來的總和相同。停機無疑將影響[未來]應用程式的設計方式。

雲計算的下一步是什麼?
它將繼續增長,擁有更多的功能和範圍。我希望科學最終能夠加入我們試圖在 2005 年出版的 第四正規化 一書中概述的計劃。科學界不妨開始研究工業界已經開始的事情,建立在伴隨規模經濟而來的大規模投資和不可避免的成本下降之上?下一個階段將看到感測器資料持續不斷地輸入雲端,這與當今移動使用者的互動方式非常相似。

© .