近年來,計算機和網際網路的蓬勃發展、功能和普及程度已經超過了早期對技術進步速度及其在日常生活中的實用性的預測。警覺的評論員現在預見到一個充滿強大計算機晶片的世界,這些晶片將越來越多地滲透到我們的裝置、住宅、服裝甚至我們的身體中。
然而,一個密切相關的目標仍然難以實現。與計算機出乎意料地爆炸式進入主流形成鮮明對比的是,整個機器人事業完全未能實現 20 世紀 50 年代的預測。在那些日子裡,專家們被計算機看似奇蹟般的計算能力所震驚,他們認為,如果只編寫正確的軟體,計算機就可以成為複雜自主機器人的“人造大腦”。他們認為,在一二十年內,這樣的機器人將打掃我們的地板、修剪草坪,並且總的來說,將消除我們生活中的苦差事。
顯然,事實並非如此。誠然,工業機器人已經改變了汽車等產品的製造。但這種自動化與許多科學家和工程師所期望的多功能、移動、自主的創造物相去甚遠。為了追求這樣的機器人,一波又一波的研究人員變得灰心喪氣,許多初創公司倒閉。
支援科學新聞報道
如果您喜歡這篇文章,請考慮透過以下方式支援我們屢獲殊榮的新聞報道: 訂閱。透過購買訂閱,您正在幫助確保有關塑造我們當今世界的發現和想法的具有影響力的故事的未來。
並非機械“身體”無法實現;工業機器人證明,足以進行體力勞動的鉸接臂和其他移動機構已經存在。相反,計算機化的人造大腦仍然遠低於構建類人機器人所需的複雜程度。
儘管如此,我深信,人們對有用的通用自主機器人的多年夢想將在不久的將來實現。到 2010 年,我們將看到與人一樣大的移動機器人,但在許多方面,其認知能力與蜥蜴相似。這些機器將能夠執行簡單的家務,例如吸塵、除塵、遞送包裹和倒垃圾。我相信,到 2040 年,我們將最終實現機器人的最初目標以及科幻小說的主題:一種具有人類智力能力的自由移動機器。
[分隔符] 樂觀的理由
鑑於我剛才描述的機器人技術在很大程度上未能實現目標的歷史,為什麼我相信快速進步和驚人的成就即將到來?我的信心基於近期電子和軟體的發展,以及過去 30 年我對機器人、計算機甚至昆蟲、爬行動物和其他生物的觀察。
樂觀的最好理由是近年來大規模生產的計算機的效能飆升。在 20 世紀 70 年代和 80 年代,機器人研究人員 readily 可用的計算機能夠每秒執行約 100 萬條指令 (MIPS)。這些指令中的每一條都代表一項非常基本的任務,例如將兩個 10 位數字相加或將結果儲存在記憶體中的指定位置。
在 20 世紀 90 年代,適用於控制研究機器人的計算機功率突破了 10 MIPS、100 MIPS,最近在一些具有多處理器的**桌面計算機中達到了 50,000 MIPS。蘋果公司的 MacBook 筆記型電腦,在撰寫本文時零售價為 1,099 美元,達到了約 10,000 MIPS。因此,遠遠超出 20 世紀 70 年代和 80 年代機器人能力的功能現在正接近商業可行性。
例如,在 1995 年 10 月,一輛名為 Navlab V 的實驗車輛從華盛頓特區穿越美國到達聖地亞哥,超過 95% 的時間都是自動駕駛。該車輛的自動駕駛和導航系統是圍繞一臺基於 Sun Microsystems 微處理器的 25-MIPS 筆記型電腦構建的。Navlab V 由卡內基梅隆大學機器人研究所建造,我是該研究所的成員。美國和德國其他地方的研究人員建造的類似機器人車輛已經在各種天氣和駕駛條件下行駛了數千公里高速公路。該領域的顯著進展在加利福尼亞州舉行的 DARPA Grand Challenge 競賽中顯而易見。在 2005 年 10 月,幾輛完全自主的汽車成功穿越了佈滿障礙物的 132 英里沙漠賽道,在 2007 年,幾輛汽車成功地在城市交通條件下行駛了半天。
在過去幾年的其他實驗中,移動機器人在不熟悉的辦公室套房中進行了地圖繪製和導航,計算機視覺系統定位了紋理物體,並即時跟蹤和分析了面部。與此同時,個人計算機在識別文字和語音方面變得更加熟練。
儘管如此,在識別和導航等功能方面,今天的計算機仍然無法與人類匹敵。多年來,這讓專家們感到困惑,因為計算機在計算方面遠遠優於我們。這種明顯悖論的解釋源於以下事實:人類大腦作為一個整體,並不是真正的可程式設計通用計算機(計算機科學家稱之為通用機器;如今幾乎所有計算機都是此類機器的例子)。
要理解為什麼會這樣,需要從進化的角度來看。為了生存,我們早期的祖先必須反覆且非常出色地做好幾件事:尋找食物、逃避捕食者、交配和保護後代。這些任務在很大程度上取決於大腦的識別和導航能力。經過數億年的進化磨練,大腦變成了一種超精密但**用途的計算機。
當然,進行數學計算的能力與生存無關。然而,隨著語言改變了人類文化,我們大腦的至少一小部分進化成了一種通用機器。這種機器的標誌之一是它能夠遵循任意一組指令,並且藉助語言,可以傳輸和執行這些指令。但是,因為我們將數字視覺化為複雜的形狀,將它們寫下來並執行其他此類功能,所以我們以一種非常笨拙和低效的方式處理數字。我們使用數千億個神經元在幾分鐘內完成數百個神經元可以專門“重新佈線”和排列用於計算的神經元在毫秒內完成的事情。
極少數人天生就具有進行看似驚人的心算的能力。從絕對意義上講,這並沒有那麼令人驚奇:他們的計算速度可能比普通人快 100 倍。相比之下,計算機的速度快數百萬甚至數十億倍。
[分隔符] 硬體可以模擬生物組織嗎?
機器人專家面臨的挑戰是,使用通用計算機並對其進行程式設計,使其與主要用於**用途的人類大腦相匹配,人類大腦具有超最佳化的感知遺傳和其他獨特的進化特徵。今天控制機器人的計算機太弱了,無法在該角色中成功應用,但這只是時間問題,它們遲早會勝任這項任務。
我的斷言隱含著計算機最終將能夠實現與人類相同型別的感知、認知和思維,即一個足夠先進和複雜的人工系統——例如,一個電子系統——可以被製造和程式設計來做與人類神經系統相同的事情,包括大腦。這個問題目前在某些圈子裡存在爭議,傑出人士有理由持有不同意見。
問題的關鍵在於生物結構和行為是否完全源於物理定律,以及物理定律是否可計算——也就是說,是否適合計算機模擬。我的觀點是,沒有充分的科學證據可以否定這兩個命題中的任何一個。相反,有令人信服的跡象表明兩者都是真的。
分子生物學和神經科學正在穩步揭示生命和意識的物理機制,但到目前為止,主要研究的是更簡單的機制。簡單的功能可以組合起來產生神經系統更高能力的證據來自以下程式:閱讀、識別語音、引導機器人手臂透過感覺組裝緊密的元件、透過人工嗅覺和味覺對化學物質進行分類、推理抽象事物等等。當然,今天的計算機和機器人在廣泛的人類甚至動物能力方面還遠遠不足。但是,根據下一節中總結的分析,這種情況是可以理解的,該分析得出結論,今天的計算機僅具有像昆蟲神經系統一樣強大的功能。而且,根據我的經驗,機器人在簡單的任務中確實像昆蟲一樣執行。
例如,螞蟻可以沿著氣味軌跡前進,但當軌跡中斷時就會迷失方向。飛蛾沿著資訊素軌跡前進,也利用月亮進行導航。同樣,許多商業機器人可以沿著安裝在它們移動的表面下方的引導線前進,有些機器人使用雷射讀取牆壁上的條形碼來定位自己。
如果我的假設,即更強大的計算機功率最終將導致人類水平的智力能力是正確的,那麼我們可以預期,隨著計算機處理速度的不斷提高,機器人將達到並超越各種動物的能力,然後最終達到人類的能力。另一方面,如果該假設是錯誤的,那麼我們總有一天會發現特定的動物或人類技能,即使機器人在擁有足夠的計算機功率來匹敵整個大腦之後,也無法在機器人中實現。這將為一項引人入勝的科學挑戰奠定基礎——以某種方式分離和識別大腦擁有而計算機缺乏的基本能力。但目前還沒有證據表明存在這樣的缺失原則。
第二個命題,即物理定律適合計算機模擬,越來越無可爭議。科學家和工程師已經產生了無數有用的模擬,在不同的抽象和近似水平上,模擬了從汽車碰撞到將夸克和膠子結合在一起構成質子和中子的“顏色”力的一切。
[分隔符] 神經組織和計算
如果我們接受計算機最終將變得足夠強大以模擬思維,那麼自然而然地出現的問題是:需要什麼處理速度才能產生與人腦相當的效能?為了探討這個問題,我考慮了脊椎動物視網膜的能力,人們對視網膜的瞭解足以將其用作粗略地將神經組織與計算聯絡起來的羅塞塔石碑。透過比較視網膜中神經迴路執行影像處理操作的速度與計算機完成類似工作所需的每秒指令數,我認為至少可以粗略估計神經組織的資訊處理能力——並透過外推法,估計整個人類神經系統的資訊處理能力。
人類視網膜是眼球后部的一片神經組織,厚度為半毫米,直徑約為兩釐米。它主要由感光細胞組成,但其厚度的十分之一由影像處理電路構成,該電路能夠檢測約一百萬個微小影像區域的邊緣(明暗邊界)和運動。這些區域中的每一個都與其在視神經中的纖維相關聯,並且每個區域每秒執行約 10 次邊緣或運動檢測。結果沿著相關的纖維流入大腦深處。
從長期從事機器人視覺系統的經驗來看,我知道,如果透過高效軟體執行類似的邊緣或運動檢測,則至少需要執行 100 條計算機指令。因此,要完成視網膜每秒 1000 萬次檢測,至少需要 1,000 MIPS。
整個人類大腦比視網膜中 0.02 克的**電路重約 75,000 倍,這意味著模擬 1,500 克的人腦大約需要 1 億 MIPS(每秒 100 萬億條指令)。2008 年的個人計算機幾乎與 0.1 克重的孔雀魚大腦相匹配,但典型的 PC 至少需要強大 10,000 倍才能像人腦一樣工作。
[分隔符] 腦力和實用性
雖然這對人工智慧專家來說令人沮喪,但巨大的差距並不意味著類人人工智慧大腦的目標是無法實現的。在 20 世紀 90 年代,給定價格的計算機功率每年翻一番,而在 20 世紀 80 年代,每 18 個月翻一番,在 1990 年之前,每兩年翻一番。在 1990 年之前,這種進步使得機器人控制計算機的成本和尺寸大大降低。成本從數百萬美元降至幾千美元,尺寸從佔據房間降至手持式。與此同時,功率保持穩定在約 1 MIPS。自 1990 年以來,成本和尺寸的降低有所減緩,但家用計算機的功率已升至約 10,000 MIPS。按照目前的速度,只需要大約 20 或 30 年就可以彌合差距。更好的是,有用的機器人不需要完全人類規模的腦力。
商業和研究經驗使我確信,孔雀魚的腦力——約 10,000 MIPS——足以可靠地引導移動實用機器人在不熟悉的環境中穿梭,使其適用於數十萬個工業場所和最終數億個家庭的工作。一些具有 10,000 MIPS 的機器已經問世,但大多數工業機器人仍然使用處理器,其 MIPS 低於 1,000。
商業移動機器人很少找到工作。全球只有區區 10,000 個在工作,製造它們的公司要麼苦苦掙扎,要麼已經倒閉。(機器人機械臂製造商的情況也好不到哪裡去。)**的商業移動機器人類別,稱為自動導引車 (AGV),在工廠和倉庫中運輸物料。大多數都遵循埋在地下的訊號發射線,並透過開關檢測終點和碰撞,這項技術是在 20 世紀 60 年代開發的。
在混凝土樓板下安裝引導線需要花費數十萬美元,而且路線是固定的,這使得機器人僅適用於大型、異常穩定的工廠。20 世紀 80 年代微處理器問世後,一些機器人可以跟蹤較軟的提示,例如瓷磚地板中的磁鐵或光學圖案,並使用超聲波和紅外接近感測器來檢測和繞過障礙物。
自 20 世紀 80 年代末以來開發的最先進的工業移動機器人由偶爾的導航標記(例如,雷射感應條形碼)以及牆壁、拐角和門口等現有特徵引導。鋪設引導線的昂貴人工成本被定製軟體所取代,該軟體針對每個路線段進行了精心調整。開發機器人的小公司發現,許多工業客戶渴望實現運輸、地板清潔、安全巡邏和其他日常工作的自動化。唉,大多數買家在意識到安裝和路線更改需要經驗豐富的路執行緒序員耗時且昂貴的工作,而且可用性不穩定後,失去了興趣。從技術上講,機器人是成功的,但在商業上卻失敗了。
然而,在失敗中,他們揭示了成功的要素。首先,各種工作的物理車輛必須價格合理。幸運的是,現有的 AGV、叉車、洗地機和其他為容納人類駕駛員或遵循引導線而設計的工業機器可以適應自主性。其次,客戶不應要求專家來啟動機器人工作或更改其例程;地板清潔和其他平凡的任務無法承受專家安裝的成本、時間和不確定性。第三,機器人在遇到問題或需要停機進行重新程式設計或其他更改的情況之前,必須可靠地工作至少六個月。客戶經常拒絕那些在無故障執行一個月後卡在角落裡、迷路、碾過員工的腳或從樓梯上摔下來的機器人。但是,六個月的執行時間為機器贏得了“病假”。
有些機器人已經存在多年無故障執行,它們透過迭代過程進行完善,該過程修復最常見的故障,揭示依次糾正的越來越罕見的問題。不幸的是,只有預先安排的路線才能實現這種可靠性。昆蟲般的 10 MIPS 剛好足以跟蹤機器人路徑的每個路段上的一些精心挑選的陸標。此類機器人很容易被輕微的意外情況弄糊塗,例如條形碼移位或走廊被堵塞(這與被氣味軌跡弄糊塗的螞蟻或將路燈誤認為是月亮的飛蛾沒什麼不同)。
[分隔符] 空間感
隨著微處理器達到 100 MIPS,從 20 世紀 90 年代中期開始,全球各地的實驗室都出現了自行規劃路線的機器人。大多數機器人從聲納或雷射測距儀掃描中構建二維地圖,以定位和規劃自己的路線,最好的機器人似乎能夠在辦公室走廊中導航數天而不會迷失方向。當然,它們仍然遠未達到六個月的商業標準。粗略地圖中不同的位置太經常彼此相似。相反,同一位置在不同高度掃描時看起來不同,或者小障礙物或笨拙的突出物被忽略。但是感測器、計算機和技術正在改進,成功指日可待。
我的努力也在這場競賽中。在 20 世紀 80 年代,我們在卡內基梅隆大學設計了一種方法,透過累積網格中每個單元格中空或被佔用的統計證據,將大量嘈雜的感測器資料提煉成可靠的地圖,網格代表周圍環境。這種方法在二維中效果很好,並且仍然引導著上面描述的許多機器人。
三維地圖比二維地圖豐富 1,000 倍,前景廣闊,但多年來似乎在計算上遙不可及。1992 年,我們利用規模經濟和其他技巧將三維地圖的計算成本降低了 100 倍。持續的研究使我們成立了一家名為 Seegrid 的公司,該公司在 2007 年底之前售出了第一批十幾臺機器人。這些是負載牽引倉庫和工廠“拖船”機器人,它們可以按照命令自主地遵循在單次人工引導的步行過程中學習的路線。它們透過三維網格對映它們路線來導航,正如透過安裝在“頭部”上的四個廣角立體攝像機所看到的那樣,並且不需要引導線或其他導航標記。
[分隔符] 機器人,1.0 版
在 2008 年,桌面 PC 提供超過 10,000 MIPS。Seegrid 拖船使用稍舊的處理器,大約執行 5,000 MIPS,每秒提煉約一次視覺“瞥見”。在每次瞥見中,都會選擇周圍環境中數千個視覺上獨特的斑塊,並統計估計其 3D 位置。當機器學習新路線時,這些 3D 斑塊會合併成一條 3D 網格地圖鏈,描述路線周圍 30 米的“隧道”。當拖船自動重走一條教過的路徑時,這些斑塊將與儲存的網格地圖進行比較。憑藉由所謂的感測器模型統計加權的數千個 3D 模糊斑塊(該模型使用校準的示例路線離線訓練),該系統對視力不佳、光照變化、物體移動、機械不準確和其他擾動具有顯著的容忍度。
Seegrid 的計算機、感知程式和最終產品正在迅速改進,並將獲得新的功能,例如查詢、拾取和放下負載的能力。物料搬運自動化的潛在市場很大,但其中大部分市場對於涉及埋地引導線或其他路徑標記的舊方法來說是遙不可及的,這些方法需要廣泛的規劃和安裝成本,並建立了不靈活的路線。另一方面,視覺引導的機器人可以輕鬆安裝和重新佈線。
[分隔符] 快速重放
我們計劃改進、擴充套件和小型化我們的技術,以便它們可以用於其他應用。在短期清單上的是家用機器人吸塵器。從外觀上看,這些可能類似於 iRobot 公司的廣泛使用的 Roomba 機器。然而,Roomba 是一種簡單的野獸,它隨機移動,只能感知其直接障礙物,並且可能會被雜物困住。Seegrid 機器人將看到、探索和繪製其場所地圖,並且將在無人值守的情況下執行,清潔計劃**程度地減少了所有者的干擾。它會記住其充電位置,從而可以頻繁充電以執行強大的真空電機,並且還可以頻繁地將其灰塵負載清空到更大的容器中。
商業上的成功將引發競爭並加速對製造、工程和研究的投資。吸塵機器人應該催生更智慧的清潔機器人,配備除塵、擦洗和拾取手臂,然後是更大的多功能實用機器人,配備更強大、更靈巧的手臂和更好的感測器。將編寫程式使此類機器拾取雜物、儲存、檢索和交付物品、盤點庫存、守衛房屋、開門、修剪草坪、玩遊戲等等。當機器人在敏銳度、精度、強度、觸及範圍、靈巧性、技能或處理能力方面不足時,新的應用將擴大市場並刺激進一步的進步。能力、銷量、工程和製造質量以及成本效益將在相互加強的螺旋中增加。也許到 2010 年,該過程將產生第一批廣泛勝任的“通用機器人”,它們與人類一樣大,但具有蜥蜴般的 20,000-MIPS 大腦,可以為幾乎任何簡單的家務程式設計。
與有能力但受本能支配的爬行動物一樣,第一代通用機器人將僅處理其應用程式中明確涵蓋的意外情況。由於無法適應不斷變化的環境,它們通常會效率低下或根本無法執行。儘管如此,企業、街道、田野和家庭中仍有大量的體力勞動等待著它們,機器人技術可能會開始在商業上超越純資訊科技。
第二代通用機器人具有 100,000 MIPS 的鼠類大腦,它將像第一代機器人那樣適應,甚至可以訓練。除了應用程式,此類機器人還將託管一套軟體“條件模組”,這些模組將在預定義的情況下生成正面和負面強化訊號。例如,快速完成工作並保持電池充電將是積極的;撞擊或破壞某物將是消極的。從非常具體的(以下手或上手抓住把手)到廣泛通用的(在室內或室外工作),完成應用程式的每個階段還有其他方法。隨著工作的重複,導致正面強化的替代方案將受到青睞,而具有負面結果的替代方案將被迴避。緩慢但肯定地,第二代機器人將越來越好地工作。
猴子般的 500 萬 MIPS 將使第三代機器人能夠透過模擬中的心理預演非常快速地學習,這些模擬模擬了物理、文化和心理因素。物理特性包括事物的形狀、重量、強度、紋理和外觀,以及處理它們的方式。文化方面包括事物的名稱、價值、適當位置和用途。應用於人類和機器人的心理因素包括目標、信仰、感受和偏好。開發模擬器將是一項巨大的工程,涉及數千名程式設計師和經驗收集機器人。模擬將跟蹤外部事件並調整其模型以使其忠實於現實。它將讓機器人透過模仿來學習技能,並提供一種意識。當被問及為什麼桌子上有蠟燭時,第三代機器人可能會查閱其房屋、所有者和自身的模擬,以回答說它把它們放在那裡是因為它的所有者喜歡燭光晚餐,而它喜歡取悅它的所有者。進一步的詢問將引出更多關於簡單內心精神生活的細節,這種精神生活僅關注其工作區域中的具體情況和人員。
具有 1 億 MIPS 的人腦的第四代通用機器人將能夠抽象和概括。它們將是第三代機器與強大的推理程式融合的結果。這些推理程式將是當今定理證明器和專家系統的更為複雜的後代,它們模仿人類推理來進行醫療診斷、安排路線、做出財務決策、配置計算機系統、分析地震資料以定位油礦等等。
如果受到適當的教育,由此產生的機器人將變得非常強大。事實上,我確信它們將在任何可以想象的智力或體力領域超越我們。不可避免地,這樣的發展將導致我們社會的基本重組。整個公司都將存在,而沒有任何人類員工或投資者。人類將在制定將管理公司行為的複雜法律體系中發揮關鍵作用。但最終,我們的後代很可能會停止我們現在所做的工作。他們可能會將時間用於各種社交、娛樂和藝術追求,這與今天的舒適退休人員或富裕的休閒階層非常相似。
我概述的路徑大致概括了人類智慧的進化——但速度快了 1000 萬倍。這表明機器人智慧將在 2050 年之前超越我們自身。在這種情況下,大規模生產、受過充分教育的機器人科學家勤奮、廉價、快速且越來越有效地工作,將確保 2050 年科學所知道的大部分知識將由我們的人工後代發現!
[分隔符] 作者
漢斯·莫拉維克是卡內基梅隆大學的兼職教授。他在 10 歲時建造了他的第一個移動機器人——用錫罐、電池、燈和電機組裝而成。他目前的工作重點是使機器人能夠透過三維感知周圍環境來確定其位置和導航。自 2004 年以來,莫拉維克一直擔任 Seegrid 公司的首席科學家,該公司成立的目的是將“拖船”和其他用於倉庫和工廠的機器人商業化。