辨別真偽:人工智慧可以生成栩栩如生的照片

透過讓人工智慧互相競爭,科技公司正在創造逼真的計算機生成影像

英偉達的一個研究團隊使用人工神經網路,基於數十萬張真實名人的照片,創建出越來越逼真的影像。

英偉達

欺詐性影像與攝影術本身一樣古老。 以著名的科廷利仙女或尼斯湖水怪的惡作劇照片為例。 Photoshop 將影像處理技術帶入了數字時代。 現在,由於人工神經網路的演算法可以分析數百萬張真實人物和地點的照片,並使用它們來建立令人信服的虛構照片,人工智慧有望將照片造假提升到一個新的水平。

這些網路由相互連線的計算機組成,這些計算機以類似於人腦結構的系統排列。 谷歌、Facebook 和其他公司多年來一直在使用這種陣列來幫助他們的軟體識別影像中的人物。 一種更新的方法涉及所謂的生成對抗網路(GAN),它由一個建立影像的“生成器”網路和一個評估其真實性的“判別器”網路組成。

西雅圖艾倫人工智慧研究所執行長奧倫·埃齊奧尼表示:“神經網路渴望從數百萬個示例影像中學習。 GAN 是一種[相對]較新的自動生成此類示例的方法。”


支援科學新聞報道

如果您喜歡這篇文章,請考慮透過以下方式支援我們屢獲殊榮的新聞報道 訂閱。 透過購買訂閱,您正在幫助確保有關塑造我們當今世界的發現和想法的具有影響力的故事的未來。


然而,GAN 也可以使人工智慧快速生成逼真的虛假影像。 生成器網路使用機器學習來研究大量的圖片,這實際上教會了它如何製作具有欺騙性的逼真圖片。 它將這些圖片傳送到判別器網路,該網路經過訓練以確定真實人物的影像是什麼樣的。 判別器根據生成器影像的逼真程度對其進行評分。 隨著時間的推移,生成器越來越擅長生成虛假影像,而判別器也越來越擅長檢測它們——因此得名“對抗性”。

GAN 被譽為人工智慧領域的突破,因為在最初的訓練之後,它們可以在無人監督的情況下繼續學習。 Ian Goodfellow 是 Google Brain(該公司的人工智慧專案)的研究科學家,他是 2014 年一項引入這種方法的研究的主要作者。 此後,全球數十名研究人員嘗試將 GAN 用於各種用途,例如機器人控制和語言翻譯。

開發這些無人監督的系統是一項挑戰。 GAN 有時會隨著時間的推移而無法改進; 如果生成器無法生成越來越逼真的影像,那麼判別器也無法變得更好。

晶片製造商英偉達開發了一種訓練對抗網路的方法,該方法有助於避免這種停滯不前的發展。 關鍵是逐步訓練生成器和判別器——首先輸入低解析度影像,然後在訓練過程中新增引入更高解析度細節的新畫素層。 英偉達研究人員計劃在今年春季的國際人工智慧會議上發表的一篇論文稱,這種漸進式機器學習策略還將訓練時間縮短了一半。 該團隊透過使用包含 20 多萬張名人影像的資料庫來訓練其 GAN,從而證明了其方法,然後 GAN 生成了不存在的人的逼真、高解析度面孔。

機器本身並不知道它建立的影像是否逼真。 英偉達參與該專案的研究員 Jaakko Lehtinen 說:“我們選擇面孔作為我們的主要示例,因為我們人類很容易判斷生成式人工智慧模型的成功與否——我們都有內建的神經機制,並且在我們的生活中不斷訓練,用於識別和解釋面孔。” 挑戰在於讓 GAN 模仿人類的那些本能。

Facebook 將對抗網路視為幫助其社交媒體平臺更好地預測使用者希望根據他們之前的行為看到什麼,並最終建立表現出常識的人工智慧的一種方式。 該公司的人工智慧研究主管 Yann LeCun 和研究工程師 Soumith Chintala 將他們理想的系統描述為“不僅能夠進行文字和影像識別,而且還能夠進行推理、預測和計劃等更高階的功能,與人類的思維和行為方式相媲美。” LeCun 和 Chintala 透過向生成器輸入四個影片幀並讓其使用人工智慧生成接下來的兩個幀來測試其生成器的預測能力。 結果是動作的合成延續——無論是人只是走路還是頭部運動。

高度逼真的人工智慧生成影像和影片為需要相對廉價內容的電影製作人和影片遊戲創作者帶來了巨大的希望。 但是,人工智慧研究公司 OpenAI 的研究員兼一項研究(在 2016 年國際人工智慧會議上發表)的主要作者 Alec Radford 說,儘管 GAN 可以生成“乍一看看起來很逼真”的影像,但它們在實現真正的照片級真實感之前還有很長的路要走,Facebook 的工作就是基於這項研究。 Radford 補充說,高質量的人工智慧生成影片甚至還遙遙無期。

線上惡作劇者(已經制作虛假病毒式內容)是否會出於不正當目的使用人工智慧生成的影像或影片,這仍有待觀察。 在人們越來越質疑他們在網上看到的內容的真實性之際,這項技術可能會播下更大的不確定性。

© .