機器人的崛起——人工智慧的未來

到2050年,基於每秒執行100萬億條指令的計算機的機器人“大腦”將開始與人類智慧匹敵

編者按:本文最初發表於2008年《大眾科學》機器人特刊。作為ScientificAmerican.com的機器人深度報告的一部分,本文在網路上釋出。

近年來,計算機和網際網路的爆炸式增長的功率、功能和普及程度已經超過了早期對技術進步速度和在日常生活中的實用性的預測。警覺的評論員現在預見到一個充滿強大計算機晶片的世界,這些晶片將越來越多地滲透到我們的裝置、住宅、服裝甚至我們的身體中。

然而,一個密切相關的目標仍然難以實現。與計算機在主流領域中出乎意料的爆炸式發展形成鮮明對比的是,整個機器人技術的發展完全未能達到 20 世紀 50 年代的預測。在那些日子裡,專家們被計算機看似奇蹟般的計算能力所震撼,他們認為,如果編寫了正確的軟體,計算機就可以成為複雜自主機器人的“人工大腦”。他們相信,在一二十年內,這樣的機器人就會打掃我們的地板、修剪我們的草坪,並總的來說,消除我們生活中的苦差事。


支援科學新聞

如果您喜歡這篇文章,請考慮透過以下方式支援我們屢獲殊榮的新聞報道 訂閱。 透過購買訂閱,您正在幫助確保有關當今塑造我們世界的發現和想法的影響深遠的故事的未來。


顯然,情況並非如此。誠然,工業機器人已經改變了汽車等產品的製造方式。但是,這種自動化與許多科學家和工程師所希望的多功能、移動、自主的創造物相去甚遠。在追求此類機器人的過程中,一波又一波的研究人員感到灰心,許多初創公司倒閉。

不是機械的“身體”無法實現;正如工業機器人所證明的那樣,適合手工操作的鉸接臂和其他移動機構已經存在。相反,仍然遠低於構建類人機器人所需的複雜程度的是基於計算機的人工大腦。

儘管如此,我仍然相信,有用的、通用的自主機器人的古老夢想將在不久的將來實現。到2010年,我們將看到像人一樣大的移動機器人,但在許多方面,其認知能力與蜥蜴相似。這些機器將能夠執行簡單的家務,例如吸塵、除塵、遞送包裹和取出垃圾。我相信,到2040年,我們將最終實現機器人技術的最初目標和科幻小說的主題支柱:一臺具有人類智力能力的自由移動機器。

樂觀的理由
鑑於我剛才描述的機器人技術中大多未實現的目標的歷史,為什麼我相信快速進步和令人驚歎的成就在即?我的信心基於電子和軟體的最新發展,以及我過去 30 年對機器人、計算機甚至昆蟲、爬行動物和其他生物的觀察。

樂觀的最好理由是近年來大規模生產的計算機的效能飆升。在 20 世紀 70 年代和 80 年代,機器人研究人員可以使用的計算機能夠每秒執行約 100 萬條指令 (MIPS)。這些指令中的每一條都代表一個非常基本的任務,例如將兩個 10 位數字相加或將結果儲存在記憶體中的指定位置。

在 20 世紀 90 年代,適用於控制研究機器人的計算機功率突破了 10 MIPS、100 MIPS,最近在一些具有多個處理器的高階臺式計算機中達到了 50,000 MIPS。蘋果公司的 MacBook 筆記型電腦,在撰寫本文時的零售價為 1,099 美元,可實現約 10,000 MIPS。因此,遠遠超出 20 世紀 70 年代和 80 年代機器人能力的各項功能現在已接近商業可行性。

例如,在 1995 年 10 月,一輛名為 Navlab V 的實驗車輛從華盛頓特區穿越美國到達聖地亞哥,其自動駕駛時間超過 95%。該車輛的自動駕駛和導航系統是圍繞一臺基於 Sun Microsystems 微處理器的 25-MIPS 筆記型電腦構建的。Navlab V 是由卡內基梅隆大學機器人研究所建造的,我是該研究所的成員。美國和其他地方的研究人員建造的類似的機器人車輛已經在各種天氣和駕駛條件下行駛了數千公里的高速公路。加利福尼亞州舉行的 DARPA 大挑戰賽中,該領域的巨大進步變得顯而易見。在 2005 年 10 月,幾輛全自動汽車成功地穿越了 132 英里充滿危險的沙漠路段,在 2007 年,幾輛汽車成功地在城市交通條件下行駛了半天。

在過去的幾年裡,在其他實驗中,移動機器人繪製了不熟悉的辦公室套房的地圖並進行了導航,計算機視覺系統即時定位了紋理物體並跟蹤和分析了人臉。同時,個人計算機在識別文字和語音方面變得更加熟練。

儘管如此,在識別和導航等功能方面,今天的計算機仍然無法與人類匹敵。這讓專家們困惑多年,因為計算機在計算方面遠遠優於我們。這種明顯悖論的解釋來自於這樣一個事實,即人類大腦的整體並不是真正的可程式設計的通用計算機(計算機科學家所說的通用機器;現在幾乎所有的計算機都是這種機器的例子)。

要理解為什麼會這樣,需要從進化的角度來看。為了生存,我們早期的祖先必須反覆且非常出色地做幾件事:尋找食物、躲避捕食者、交配和保護後代。這些任務在很大程度上取決於大腦的識別和導航能力。經過數百萬年的進化磨練,大腦變成了一種極其複雜但用途特殊的計算機。

當然,進行數學計算的能力與生存無關。儘管如此,隨著語言改變了人類文化,我們大腦的至少一小部分演變成了一種通用的機器。這種機器的標誌之一是其遵循任意指令集的能力,透過語言,此類指令可以被傳輸和執行。但是,由於我們將數字視覺化為複雜的形狀、將其寫下來並執行其他此類功能,因此我們以一種極其笨拙和低效的方式處理數字。我們使用數千億個神經元在幾分鐘內完成數百個神經元可以專門“重新連線”併為計算排列在幾毫秒內完成的事情。

少數人天生具有進行看似驚人的心算的能力。從絕對意義上講,這並不是那麼令人驚歎:他們的計算速度可能比普通人快 100 倍。相比之下,計算機的速度快了數百萬甚至數十億倍。

硬體可以模擬溼件嗎? 機器人專家面臨的挑戰是採用通用計算機並對其進行程式設計,使其與主要用於特殊用途的人類大腦相匹配,後者具有超最佳化的感知遺傳和其他獨特的進化特徵。今天用於控制機器人的計算機太弱,無法成功地應用於該角色,但它們勝任這項任務只是時間問題。

我斷言計算機最終將能夠像人類一樣進行感知、認知和思考,這意味著可以製造和程式設計一個足夠先進和複雜的人工系統(例如,一個電子系統)來完成與人類神經系統相同的事情,包括大腦。這個問題現在在某些圈子中存在爭議,並且有才華橫溢的人可以持有不同的意見。

問題的核心是生物結構和行為是否完全來自物理定律,此外,物理定律是否是可計算的,也就是說,是否適用於計算機模擬。我的觀點是,沒有好的科學證據可以否定這兩個命題中的任何一個。相反,有令人信服的跡象表明兩者都是正確的。

分子生物學和神經科學正在穩步揭示生命和思想背後的物理機制,但到目前為止,主要研究的是較簡單的機制。簡單的功能可以組合起來產生神經系統更高能力的證據來自閱讀、識別語音、引導機器人手臂透過感覺組裝緊密元件、透過人工嗅覺和味覺對化學物質進行分類、對抽象事項進行推理等程式。當然,今天的計算機和機器人遠遠不能達到廣泛的人類甚至動物的能力。但是,根據下一節中總結的分析結果來看,這種情況是可以理解的,該分析得出的結論是,今天的計算機僅具有像昆蟲神經系統一樣的功能。而且,以我的經驗,機器人在簡單的任務上確實像昆蟲一樣執行。

例如,螞蟻可以沿著氣味蹤跡行走,但當蹤跡中斷時會迷失方向。飛蛾跟隨資訊素蹤跡,還使用月亮進行導航。類似地,許多商用機器人可以沿著安裝在它們移動的表面下方的導線行走,有些機器人使用讀取牆壁上條形碼的雷射器來定向。

如果我的假設,即更大的計算機功率最終將導致人類水平的智力能力是正確的,我們可以預期機器人的能力將與各種動物的能力相匹配並超越它們,然後最終隨著計算機處理速度的足夠提高而超越人類。另一方面,如果該假設是錯誤的,那麼我們總有一天會發現,即使機器人具有足夠的計算機功率來匹配整個大腦,它們也無法實現動物或人類的特定技能。這將為一項引人入勝的科學挑戰奠定基礎——以某種方式分離和識別大腦具有而計算機缺乏的根本能力。但是,目前還沒有證據表明存在這種缺失的原則。

第二個論點,即物理定律可以透過計算機模擬,正日益成為不爭的事實。科學家和工程師已經制作了無數有用的模擬,這些模擬在不同的抽象和近似級別上,涵蓋了從汽車碰撞到將夸克和膠子結合在一起形成質子和中子的“顏色”力等各種事物。

神經組織和計算 如果我們接受計算機最終會變得足夠強大以模擬大腦,那麼自然而然產生的問題是:需要多大的處理速度才能達到與人腦相當的效能?為了探討這個問題,我研究了脊椎動物視網膜的功能,該視網膜已被充分理解,可以作為粗略地將神經組織與計算聯絡起來的羅塞塔石碑。透過比較視網膜中的神經迴路執行影像處理操作的速度與計算機完成類似工作所需的每秒指令數,我相信至少可以粗略地估計神經組織的資訊處理能力,並透過外推,估計整個人體神經系統的處理能力。

人類視網膜是眼球后部的一塊神經組織,厚度為半毫米,直徑約為兩釐米。它主要由感光細胞組成,但其厚度的十分之一毫米由影像處理電路填充,該電路能夠檢測大約一百萬個微小影像區域的邊緣(明暗之間的邊界)和運動。這些區域中的每一個都與視神經中的其自身纖維相關聯,並且每個區域每秒大約執行10次邊緣或運動檢測。結果沿相關的纖維流入大腦深處。

根據長期從事機器人視覺系統的工作經驗,我知道,如果由高效軟體執行類似的邊緣或運動檢測,則至少需要執行100條計算機指令。因此,要完成視網膜每秒1000萬次檢測,至少需要1000 MIPS。

整個人腦的重量大約是視網膜中0.02克處理電路的75,000倍,這意味著模擬1500克人腦需要大約1億MIPS(每秒100萬億條指令)。2008年的個人計算機與孔雀魚0.1克的大腦幾乎相當,但典型的PC至少需要強大10,000倍才能像人腦一樣執行。

腦力和效用 雖然這對人工智慧專家來說令人沮喪,但這巨大的差距並不意味著實現類似人類的人工大腦的目標是遙不可及的。在 1990 年代,給定價格的計算機效能每年翻一番,而在 1980 年代每 18 個月翻一番,在此之前每兩年翻一番。1990 年之前,這種進步使得機器人控制計算機的成本和尺寸大大降低。成本從數百萬美元降至數千美元,尺寸從佔據整個房間變為手持式。同時,效能保持在約 1 MIPS。自 1990 年以來,成本和尺寸的降低有所減緩,但家用計算機的效能已升至約 10,000 MIPS。以目前的速度,只需要大約 20 或 30 年的時間就可以彌合差距。更好的是,有用的機器人不需要完全的人類大腦能力。

商業和研究經驗使我相信,孔雀魚的心理能力(約 10,000 MIPS)足以可靠地引導移動實用機器人在不熟悉的環境中移動,使其適用於數十萬個工業場所,最終適用於數百萬家庭。一些具有 10,000 MIPS 的機器已經出現,但大多數工業機器人仍然使用低於 1,000 MIPS 的處理器。

商業移動機器人很少找到工作。全球只有可憐的 10,000 個工作崗位,而製造這些機器的公司正處於困境或倒閉。(機器人機械手的製造商的情況也好不到哪裡去。)最大的商業移動機器人類別,稱為自動引導車(AGV),在工廠和倉庫中運輸物料。大多數都遵循埋在地下的訊號發射線,並使用開關檢測終點和碰撞,該技術是在 1960 年代開發的。

在混凝土樓板下安裝導向線需要花費數十萬美元,並且路線是固定的,這使得機器人僅適用於大型、異常穩定的工廠。自 1980 年代微處理器問世以來,一些機器人可以跟蹤較柔和的提示,例如瓷磚地板中的磁鐵或光學圖案,並使用超聲波和紅外接近感測器來檢測並繞過障礙物。

自 1980 年代後期以來開發的最先進的工業移動機器人由偶爾的導航標記(例如,雷射感應條形碼)以及牆壁、角落和門口等現有特徵引導。鋪設導向線的高昂成本被為每個路段精心定製的定製軟體所取代。開發機器人的小公司發現許多工業客戶渴望實現運輸、地板清潔、安全巡邏和其他日常工作的自動化。唉,大多數買家意識到安裝和更改路線需要經驗豐富的路執行緒序員耗時且昂貴的工作,而這些程式設計師的供應不穩定,因此失去了興趣。這些機器人在技術上取得了成功,但在商業上卻失敗了。

然而,在失敗中,它們揭示了成功的要素。首先,各種工作的物理車輛必須價格合理。幸運的是,現有的 AGV、叉車、地面洗滌器和其他設計用於容納人類騎手或跟隨導向線的工業機器可以適應自主執行。其次,客戶不應為了讓機器人工作或更改其例行程式而需要請專家;地板清潔和其他日常任務無法承擔專家安裝的成本、時間和不確定性。第三,機器人必須可靠地工作至少六個月,然後才會遇到問題或需要停機進行重新程式設計或其他更改的情況。客戶通常會拒絕那些在執行一個月毫無瑕疵後,把自己卡在角落裡、迷路、撞到員工腳或從樓梯上摔下來的機器人。然而,六個月的工作則使機器獲得了一天的病假。

存在已經完美工作多年的機器人,這些機器人透過反覆迭代的過程進行完善,該過程修復最頻繁的故障,從而依次揭示出較為罕見的問題,這些問題隨後會得到糾正。不幸的是,這種可靠性僅針對預先安排的路線實現。類似昆蟲的 10 MIPS 僅僅足以跟蹤機器人路徑每個路段上的一些精心挑選的地標。此類機器人很容易被輕微的意外情況所迷惑,例如移動的條形碼或被堵塞的走廊(與偏離氣味的螞蟻或將路燈誤認為月亮的蛾子沒有什麼不同)。

空間感 隨著微處理器在 1990 年代中期達到 100 MIPS,可以自行繪製路線的機器人從世界各地的實驗室中湧現出來。大多數機器人從聲納或雷射測距儀掃描中構建二維地圖來定位和導航自己,而最好的機器人似乎能夠在辦公室走廊中導航數天而不會迷失方向。當然,它們仍然遠遠達不到六個月的商業標準。粗糙地圖中不同的位置過於頻繁地相互相似。相反,在不同高度掃描的相同位置看起來不同,或者小的障礙物或笨拙的突出物會被忽略。但是,感測器、計算機和技術正在改進,成功指日可待。

我的努力也參與到這場競賽中。在 1980 年代,我們在卡內基梅隆大學設計了一種方法,透過累積網格中每個單元格中空閒或佔用情況的統計證據,將大量嘈雜的感測器資料提煉成可靠的地圖,該網格代表周圍的環境。該方法在二維中效果很好,並且仍然指導著上面描述的許多機器人。

三維地圖的資訊量是二維地圖的 1,000 倍,有望好得多,但多年來似乎在計算方面遙不可及。1992 年,我們利用規模經濟和其他技巧將三維地圖的計算成本降低了 100 倍。持續的研究使我們成立了一家公司 Seegrid,該公司在 2007 年底之前售出了其首批十幾臺機器人。這些是拉貨用的倉庫和工廠“拖車”機器人,它們可以根據命令自主地遵循在人類引導的單次演練中學習到的路線。它們透過三維網格對映其路線進行導航,這是透過安裝在“頭部”的四個廣角立體攝像機看到的,並且不需要導向線或其他導航標記。

機器人,1.0 版本 在 2008 年,臺式 PC 提供超過 10,000 MIPS 的效能。Seegrid 拖車使用略舊的處理器,效能約為 5,000 MIPS,每秒提取大約一個視覺“瞥視”。每次瞥視中都會選擇周圍環境中一些具有視覺特徵的斑塊,並對其 3D 位置進行統計估計。當機器學習新路線時,這些 3D 斑塊會合併到描述路線周圍 30 米“隧道”的 3D 網格地圖鏈中。當拖車自動重新跟蹤已教導的路徑時,會將斑塊與儲存的網格地圖進行比較。透過所謂的感測器模型對數千個 3D 模糊斑塊進行統計加權(該模型使用校準的示例路線進行離線訓練),該系統對不良視力、照明變化、物體移動、機械不準確和其他擾動具有極高的容忍度。

Seegrid 的計算機、感知程式和最終產品正在快速改進,並將獲得新的功能,例如查詢、拾取和放下負載的能力。物料搬運自動化的潛在市場很大,但大多數市場對舊方法(涉及埋在地下的導向線或其他路徑標記)來說是遙不可及的,這些舊方法需要大量的規劃和安裝成本,並且會建立不靈活的路線。另一方面,視覺引導的機器人可以很容易地安裝和重新佈線。

快速重放 我們正在計劃改進、擴充套件和小型化我們的技術,以便它們可以用於其他應用。短期清單上的是消費機器人吸塵器。在外觀上,這些可能類似於 iRobot 廣泛提供的 Roomba 機器。然而,Roomba 是一種簡單的機器,它隨機移動,只能感知其直接的障礙物,並且可能會被雜物困住。Seegrid 機器人會檢視、探索並繪製其場所地圖,並且會在無人值守的情況下執行,其清潔計劃可最大程度地減少對所有者的干擾。它會記住其充電位置,從而可以頻繁充電以執行強大的真空電機,並且還可以頻繁地將其灰塵負載清空到更大的容器中。

商業上的成功將引發競爭,並加速對製造、工程和研究的投資。吸塵機器人應該會產生更智慧的清潔機器人,這些機器人具有除塵、擦洗和拾取臂,然後是具有更強大、更靈巧的臂和更好感測器的更大功能的多功能實用機器人。將編寫程式來

使此類機器拾起雜物、儲存、檢索和交付物品、盤點庫存、看守房屋、開門、修剪草坪、玩遊戲等等。當機器人在敏銳度、精度、強度、範圍、靈巧度、技能或處理能力方面不足時,新的應用將擴大市場並刺激進一步的進步。能力、銷量、工程和製造質量以及成本效益將在相互加強的螺旋式上升中增加。也許到 2010 年,該過程將產生第一批具有廣泛能力的“通用機器人”,它們像人一樣大,但具有類似蜥蜴的 20,000 MIPS 的大腦,可以針對幾乎任何簡單的雜務進行程式設計。

像能力強但受本能支配的爬行動物一樣,第一代通用機器人將僅處理其應用程式中明確涵蓋的意外情況。由於無法適應不斷變化的環境,它們通常會低效執行甚至根本無法執行。儘管如此,企業、街道、田野和家庭中還有大量體力勞動在等待著它們,因此機器人技術可能會在商業上開始超越純粹的資訊科技。

第二代通用機器人具有類似滑鼠的 10 萬 MIPS 處理能力,它將像第一代機器人一樣進行適應,甚至可以接受訓練。除了應用程式,這些機器人還將配備一套軟體“調節模組”,這些模組會在預先定義的情況下生成積極和消極的強化訊號。例如,快速完成工作並保持電池充電將是積極的;撞擊或破壞物體將是消極的。從微觀的特定(正手或反手抓住把手)到廣泛的通用(在室內或室外工作),完成應用程式的每個階段都有其他方法。隨著工作的重複,導致積極強化的替代方案將受到青睞,而導致消極結果的替代方案將受到迴避。緩慢但肯定的是,第二代機器人將越來越好地工作。

具有 500 萬 MIPS 處理能力的類猴機器人將允許第三代機器人透過模擬中的心理排練,從模擬物理、文化和心理因素中快速學習。物理屬性包括物體的形狀、重量、強度、紋理和外觀,以及處理它們的方式。文化方面包括事物的名稱、價值、適當的位置和用途。應用於人類和機器人的心理因素包括目標、信念、感受和偏好。開發模擬器將是一項龐大的工程,涉及數千名程式設計師和收集經驗的機器人。模擬將跟蹤外部事件並調整其模型,以使其忠實於現實。它將讓機器人透過模仿學習技能,並提供一種意識。當被問及為什麼桌子上有蠟燭時,第三代機器人可能會查詢其對房屋、主人和自身的模擬,以回答說它把蠟燭放在那裡是因為它的主人喜歡燭光晚餐,並且它喜歡取悅它的主人。進一步的詢問會引發更多關於簡單的內心精神生活的細節,這些生活僅與工作區域中的具體情況和人員有關。

具有類似人類的 1 億 MIPS 處理能力的第四代通用機器人將能夠進行抽象和概括。它們將是強大的推理程式與第三代機器融合的結果。這些推理程式將是當今定理證明器和專家系統更復雜的後代,它們模仿人類的推理來進行醫療診斷、安排路線、做出財務決策、配置計算機系統、分析地震資料以定位石油礦藏等等。

經過適當的教育,由此產生的機器人將變得非常強大。事實上,我確信它們將在任何可以想象的努力領域,無論是智力上還是身體上都超越我們。不可避免地,這種發展將導致我們社會的根本重組。整個公司將存在而沒有任何人類僱員或投資者。人類將在制定管理公司行為的複雜法律體系中發揮關鍵作用。然而,最終,我們的後代很可能會停止我們現在意義上的工作。他們可能會將他們的時間用於各種社交、娛樂和藝術活動,這與今天舒適的退休人員或富裕的休閒階層沒有什麼不同。

我概述的路徑大致概括了人類智慧的進化過程——但速度快了 1000 萬倍。這表明,機器人的智慧將在 2050 年之前超越我們自己的智慧。在這種情況下,大量生產、受過全面教育的機器人科學家將勤奮、廉價、快速且越來越有效地工作,從而確保 2050 年科學所知道的大部分知識將是由我們的人工後代發現的!

© .