自主計算

程式崩潰,人們犯錯,網路增長和變化。這就是生活,計算機科學家最終正在構建可以應對這種情況的系統

計算機硬體的速度和容量每十年都以數千倍的速度增長;計算機軟體也以幾乎相同的速度堆積新功能和更精美的介面。那麼,為什麼計算機仍然在浪費我們的時間並讓我們發瘋?

在最近一項英國調查中,四分之一的25歲以下受訪者表示他們踢過電腦或看到朋友這樣做。而複雜的網路系統(幾乎所有大型組織都在依賴)的成本現在主要不是由越來越便宜的硬體和軟體決定,而是由能夠保持系統正常執行的專家們不斷上漲的薪水決定。根據加州大學伯克利分校的研究人員在2002年3月發表的一項研究,人工成本超出裝置成本3到18倍,具體取決於系統的型別。總預算的三分之一到一半用於預防或從崩潰中恢復。難怪:經紀公司或信用卡授權中心的系統故障可能會導致每小時數百萬美元的業務損失。


關於支援科學新聞

如果您喜歡這篇文章,請考慮透過以下方式支援我們屢獲殊榮的新聞報道 訂閱。透過購買訂閱,您正在幫助確保關於塑造我們當今世界的發現和想法的有影響力的故事的未來。


計算機危機

“今天在三個領域存在危機:成本、可用性和使用者體驗,”IBM阿爾馬登研究實驗室主任羅伯特·莫里斯說。在上個月在加州阿爾馬登舉行的一次會議上,來自大多數大型計算機公司和幾所大學的研究領導者就IBM去年10月釋出的“宣言”中概述的問題達成了一致。“IT基礎設施日益增長的複雜性威脅著要破壞資訊科技旨在提供的益處,”匿名撰寫的宣言斷言。計算機裝置的數量預計將以每年38%的複合率增長;這些裝置中的大多數將相互連線並連線到網際網路。“到目前為止,我們主要依靠人工干預和管理來應對這種複雜性,”宣言繼續說。“不幸的是,我們開始讓事情變得一團糟。”

對於解決方案,意見分歧較多。IBM在其論文中認為,目標應該是“自主”計算機系統,類似於允許人體應對環境變化、外部攻擊和內部故障的非自願神經系統。“我們的身體具有很高的可用性,”莫里斯觀察到。“我一直都有軟錯誤:我的記憶偶爾會失效,但我不會‘崩潰’。當我割傷手指時,我的整個身體不會關閉。”

莫里斯和IBM自主計算研究工作的其他負責人不僅僅考慮容錯。該宣言列出了自主計算系統的八個定義特徵(右側)。其中一些已經在原型中得到證明。

例如,自主系統必須具有自我意識。它必須跟蹤它的各個部分,其中一些部分可能從其他系統借用或借出給其他系統。它還必須將其公共部分和私有部分分開。在哥倫比亞大學,蓋爾·凱澤和程式設計系統實驗室的同事已經研究出如何向某些型別的現有系統新增軟體探針、儀表和配置控制,以便可以自動監控、調整甚至修復它們,而不是由高薪工程師進行。

自主系統還應該能夠治癒,透過某種非自殺性崩潰的方式從損壞中恢復。斯坦福大學的阿曼多·福克斯及其同事已經演示了一種實現此目的的方法。福克斯重新設計了一個衛星地面站系統,以便每個子系統在被離線時都可以獨立重啟。系統仍然偶爾會宕機,但現在它可以在六秒鐘內恢復執行,而不是30秒。同樣的原理,稱為遞迴可重啟性,可以應用於多種複雜系統,以防止小故障累積並級聯成全面停機。

可能的解決方案


自主系統的特徵

(正如IBM所見)
  • 具有自我意識。
  • 適應其環境的變化。
  • 努力提高其效能。
  • 在損壞時進行修復。
  • 防禦攻擊者。
  • 與不熟悉的系統交換資源。
  • 透過開放標準進行通訊。
  • 預測使用者的行為。

  • 實驗系統

    Oc¿ano是IBM托馬斯·J·沃森研究中心正在構建的一個實驗性自主系統,它包括前兩個特徵以及第三個特徵:它積極地努力提高其效能。Oc¿ano使用最佳化演算法來管理伺服器的複雜結構,以找出分配任務的最佳方式和儲存資料的最便宜的地方。它試圖預測需求,並在需要之前讓其命令下的計算機做好準備。

    惠普實驗室的研究人員正在進行類似的專案,他們將其稱為行星計算。在加州大學伯克利分校,熱門詞是“面向恢復的計算”,或ROC(如“堅如磐石”)。但是,伯克利小組的戴維·帕特森和其他人並不完全認可計算機系統將其所有複雜操作對人類操作員隱藏起來的想法。對於帕特森來說,目標不是構建HAL 9000,其不可預測的行為只能透過拔掉插頭來停止,而是模仿星艦企業號的計算機,其內部仍然可以被工程師訪問和理解。

    作為面向恢復的計算的一個例子,伯克利小組構建了一個具有“撤消”功能的原型電子郵件系統。該程式圍繞著標準的電子郵件伺服器,並記錄其所有活動以及對其配置所做的任何更改。如果管理員不小心刪除了使用者的郵箱,或者設定了一個將好郵件與垃圾郵件一起丟棄的過濾器,或者病毒傳播並開始隨意傳送郵件,則操作員可以透過將系統“回溯”到較早的時間點來還原伺服器及其所有郵件,修復錯誤,然後以快速方式“重播”事件。這種方法會消耗大量磁碟空間。例如,對於帕特森部門的1,270個使用者,該系統一年將使用三個120千兆位元組的磁碟。但是,現在磁碟非常便宜(在伯克利的情況下每個180美元),因此好處很容易證明成本的合理性。

    這或許是計算機科學家們重新認識到大多數計算機系統有多麼不穩定的真正意義。在過去的30年中,該領域的座右銘是更快、更大、更便宜。慢慢地,最終,目標可能會轉變為更簡單、更可靠和更不值得被踢。

    相關連結

    文章

    全球計算機

    語義網

    美麗新作業系統

    計算機,自我修復

    IBM引領整體計算

    專案頁面

    戴維·帕特森的網頁

    IBM的eLiza專案

    IBM關於自主計算的頁面

    加州大學伯克利分校Oceanstore專案

    UMBC eBiquity小組

    斯坦福軟體基礎設施小組

    伯克利/斯坦福面向恢復的計算專案

    © .