秘密資訊可以隱藏在人工智慧生成的媒體中

在隱寫術中,普通訊息掩蓋了秘密通訊的存在。人類永遠無法完美地做到這一點,但一項新的研究表明,機器有可能做到

Digital generated image of abstract cubic pattern in red, blue and lilac.

2010年6月27日,聯邦調查局逮捕了10名俄羅斯間諜,他們在紐約市附近以美國專業人士的身份生活和工作。該案件揭露了一個由虛假身份和秘密會議組成的複雜系統,曝光了自冷戰結束以來美國最大的間諜網路之一,並啟發了電視劇《美國諜夢》。

這也引起了人們對隱寫術的關注,這是一種在另一條資訊中偽裝秘密資訊的方法。紐約間諜將他們的秘密隱藏在眾目睽睽之下,將通訊編碼在公開發布的看似無害的影像的畫素中。為了閱讀這些資訊,接收者必須下載影像,將其轉換為二進位制程式碼的1和0,並知道哪些被修改的數字,按順序排列,會拼出秘密資訊。

隱寫術既是一門藝術,也是一門科學,它與更為人所知的秘密通訊方法——密碼術不同。密碼術有意隱藏訊息的內容,將其轉換為一團亂麻的文字或數字,而隱寫術則隱藏了秘密存在的事實。“隱寫術隱藏了訊息的存在,”伯爾尼大學計算機科學家和密碼學家克里斯蒂安·卡欽說。“如果對手可以檢測到隱藏的訊息,那麼傳送者就輸了。”


支援科學新聞報道

如果您喜歡這篇文章,請考慮透過以下方式支援我們屢獲殊榮的新聞報道 訂閱。透過購買訂閱,您正在幫助確保有關當今塑造我們世界的發現和想法的具有影響力的故事的未來。


與任何秘密通訊方法一樣,挑戰在於如何使其完全安全,這意味著人類或機器檢測器都不會懷疑一條訊息隱藏著秘密。對於隱寫術來說,長期以來這在理論上是可能的,但人們認為在實際的人類通訊中不可能實現。

ChatGPT等大型語言模型的出現提出了一種不同的前進方向。雖然可能無法保證人類建立的文字的安全性,但一項新的證明首次闡述瞭如何在機器生成的訊息(無論是文字、影像、影片還是任何其他媒體)中實現隱寫術的完美安全性。作者還包括一套生成安全訊息的演算法,並且他們正在研究將它們與流行的應用程式結合使用的方法。

卡內基梅隆大學的計算機科學家塞繆爾·索科塔幫助開發了新的演算法,他說:“隨著我們越來越成為一個與人工智慧模型互動非常普遍的社會,在人們一直使用的媒體中編碼秘密資訊的機會越來越多。”

該結果來自資訊理論領域,資訊理論為理解各種通訊提供了數學框架。這是一個抽象而整潔的領域,與實際隱寫術的複雜混亂形成對比。賓厄姆頓大學的研究員傑西卡·弗里德里希研究在數字媒體中隱藏(和檢測)資料的方法,她說這兩個世界並不經常重疊。但新的演算法將它們結合在一起,既滿足了長期以來對安全性的理論標準,又為在機器生成的內容中隱藏訊息提出了實際應用。新的演算法可以被像紐約俄羅斯人這樣的間諜利用,但它們也可以幫助人們將資訊輸入或輸出禁止加密渠道的國家。

光頭和其他策略

隱寫術,希臘語意為“覆蓋的寫作”,其方案比數字媒體早數千年。

最早的已知例子出現在公元前5世紀希羅多德撰寫的《歷史》中。在一個故事中,一條訊息被寫在木板上,並用一層蠟隱藏起來,以避免在運輸過程中被攔截。在另一個故事中,歸功於埃涅阿斯·塔克提庫斯,一條訊息在某些字母上隱藏了不可見的墨點,這些墨點拼出了真正的訊息。在一個更極端的例子中,暴君希斯提亞烏斯想要在不被發現的情況下向他的侄子傳達一個策略,所以他剃光了一個奴隸的頭,將他的資訊紋在那個人的頭上,並等待頭髮長出來,然後才派遣信使。到達後,侄子剃光了信使的頭,露出了計劃。

這些策略一直存在,技術也催生了新的策略。第一次世界大戰期間,德國間諜找到了透過微點傳輸資訊的方法:他們複製並縮小一份檔案,直到它小到像字母“i”的點一樣,這看起來是無辜的,但可以透過放大鏡顯示出來。

政治家也轉向了這種欺騙性的藝術。在1980年代,在一系列新聞洩露事件之後,據稱英國首相瑪格麗特·撒切爾重新程式設計了她部長的文字處理器,以便每個文字處理器都有自己獨特的、幾乎無法檢測但獨一無二的單詞間距模式。這種細微的修改使得洩露的檔案可以追溯到來源。

這種方法在21世紀繼續蓬勃發展,既有好的方面,也有壞的方面。現代隱寫術策略包括用隱形墨水書寫資訊(紐約的俄羅斯間諜也使用了另一種策略)、在繪畫細節中隱藏藝術家簽名以及設計帶有隱藏或倒放音軌的音訊檔案。弗里德里希說,數字媒體中的隱寫術方法還可以幫助在語音郵件檔案中隱藏影像,或者像俄羅斯間諜的案例一樣,將書面文字放置在經過篡改的照片中。

形式化保密

卡欽說,直到1980年代,數學家和計算機科學家才開始尋求隱寫術的形式化數學規則。他們轉向了資訊理論,這個領域始於克勞德·夏農1948年開創性的論文《通訊的數學理論》,該論文建立了一種分析方法,用於思考透過通道傳送和接收資訊。(夏農模擬了電報線路,但他為今天的數字技術奠定了基礎。)他使用術語“熵”來量化變數中的資訊量——例如,編碼一個字母或訊息所需的位元數——並在1949年,他制定了完全安全的密碼術的規則。但夏農沒有解決隱寫術中的安全性問題。

大約50年後,卡欽做到了。他的方法,本著夏農的精神,是以機率的方式思考語言。假設愛麗絲和鮑勃這兩個特工想要透過隱寫術交流資訊,並對他們的對手伊芙保密。當愛麗絲向鮑勃發送一條無害的訊息時,她從整個英語詞庫中選擇單詞。這些單詞都有與之相關的機率;例如,單詞“the”比方說“lexicon”更有可能被選擇。總而言之,這些單詞可以表示為機率分佈。如果愛麗絲使用隱寫術向鮑勃發送一條編碼訊息,則該訊息將具有自己的機率分佈。

資訊理論學者使用一種稱為相對熵的度量來比較機率分佈。這就像測量一種抽象的距離:牛津大學的計算機科學家克里斯蒂安·施羅德·德維特參與了這篇新論文的研究,他說,如果兩個分佈之間的相對熵為零,“你就不能依賴統計分析”來揭示秘密。換句話說,如果未來的間諜開發出一種完全安全的演算法來走私秘密,那麼任何基於統計的監視都將無法檢測到它。他們的傳輸將是完全隱藏的。

但卡欽的證明依賴於一個關於隱藏秘密的訊息的關鍵假設,即所謂的掩蓋文字。卡欽說,為了提出一條與原始的、無害的訊息無法區分的新訊息,你必須建立掩蓋文字分佈的完美模擬。例如,在書面訊息中,這意味著使用某種工具,可以完美地模擬一個人的語言。但是人類生成的文字太混亂了。有可能接近——ChatGPT和其他大型語言模型可以產生令人信服的模擬——但它們並不完全精確。“對於人類生成的文字,這是不可行的,”卡欽說。出於這個原因,完全安全的隱寫術長期以來似乎遙不可及。

弗里德里希的研究重點是隱藏在人類製作的數字媒體(如照片和簡訊)中的訊息的複雜現實世界的複雜性,她說,完美模擬是一個永遠無法滿足的條件。“數字媒體的問題是,你永遠不會有真正的模型,”她說。“它太複雜了。隱寫術永遠不可能完美。”

實現完美

當然,機器生成的文字不是由人類建立的。最近,專注於語言的生成模型,或其他生成影像或聲音的模型,表明完全安全的隱寫術在現實世界中可能是可能的。畢竟,這些模型使用明確定義的取樣機制作為生成文字的一部分,在許多情況下,這些文字看起來令人信服地像人類。

索科塔和施羅德·德維特之前一直在研究機器學習,而不是隱寫術。他們一直在尋求透過各種渠道傳輸資訊的新方法,並且在某個時候,他們瞭解到資訊理論中一個相對較新的概念,稱為最小熵耦合。

索科塔說:“這是一種看似基本的工具,但尚未得到充分探索。”在最小熵耦合中,研究人員可以將兩個機率分佈組合成一個單一的聯合分佈,該分佈表示兩個系統。在隱寫術的情況下,其中一個分佈表示掩蓋文字,另一個分佈表示包含隱藏訊息的密文。聯合分佈可以確保兩個文字在統計上無法區分,從而生成完全安全的訊息。

索科塔、施羅德·德維特和他們的團隊一直在嘗試尋找利用該工具進行深度學習新方法的方法。但有一天,索科塔回憶說,他們的合作者馬丁·斯特羅邁爾提到,他們關於最小熵耦合的工作讓他想起了圍繞隱寫術的安全問題。

斯特羅邁爾只是隨意評論,但索科塔和施羅德·德維特認真對待了它。該小組很快弄清楚瞭如何使用最小熵耦合來設計一種隱寫術程式,該程式滿足卡欽對現實世界機器學習系統中完美安全性的要求。

普渡大學電氣與計算機工程師穆拉特·科考格魯說:“我很驚訝地看到它在隱寫術中具有如此好的應用。”他不從事隱寫術工作,但他確實幫助設計了團隊在論文中使用的一種演算法。“這項工作確實很好地與最小熵耦合聯絡起來。”

然後,該團隊更進一步,表明為了使隱寫術方案儘可能具有計算效率,它必須基於最小熵耦合。新策略為如何實現安全性和效率都指明瞭明確的方向——並表明兩者是齊頭並進的。

索科塔說:“我們的結果似乎表明,這甚至比那些並非完全安全的方法更有效。”

現實世界

存在侷限性。卡欽指出,找到真正的最小熵耦合是一個NP-hard問題,這基本上意味著完美的解決方案在計算上過於昂貴而無法實際應用,又回到了效率問題。

索科塔和施羅德·德維特承認這個問題:最佳耦合確實會過於複雜而無法計算。但是為了繞過這個瓶頸,作者使用了索科塔和施羅德·德維特開發的近似程式(基於科考格魯引入的方法),該程式仍然保證了安全性和合理的效率。

以下是他們認為它在實踐中如何運作的:假設一位持不同政見者或人權活動家想要從一個被封鎖的國家傳送簡訊。WhatsApp或Signal等應用程式的外掛將完成繁重的演算法工作,施羅德·德維特說。第一步是選擇一個掩蓋文字分佈——即,來自ChatGPT或類似大型語言模型的大量可能的單詞集合——這將隱藏密文。然後,該程式將使用該語言模型來近似掩蓋文字和密文之間的最小熵耦合,並且該耦合將生成將透過文字傳送的字串。對於外部對手來說,新文字將與無害的機器生成的訊息無法區分。它也不必是文字:該演算法可以透過對機器生成的藝術品(而不是ChatGPT)或人工智慧生成的語音郵件音訊進行取樣來工作,例如。

新的演算法在秘密訊息的大小方面受到限制:施羅德·德維特估計,以今天的技術,他們的系統可以在大約30秒的機器生成的語音郵件中隱藏大約225千位元組的影像(或其他訊息)。但它不需要很大才能成功。這足以讓重要資訊透過審查員或當局。

弗里德里希說,她更習慣於對抗現實世界的侷限性,而不是考慮理論。“看到另一面很有趣,”她說。對她來說,這項新的工作開始彌合理論證明與現實世界的混亂之間的差距。如果人們不使用機器生成的內容,那麼新的方案將無法保證安全。但她說,隨著機器生成的內容變得越來越普遍,完美安全性的潛力將會更強。

她說:“一切都取決於什麼將成為典型。”如果一臺機器生成大量看起來自然的無害影像,並且人們習慣了這些影像,那麼就很容易建立一個富含秘密訊息的影像源。“有了生成模型,這種方法為兩種方法會合提供了可能的途徑,”她說。

顯然,這也是一把雙刃劍。“罪犯會使用它,”弗里德里希說,“但它也可以用於好的方面。”

量子雜誌許可轉載,量子雜誌是西蒙斯基金會的編輯獨立出版物,其使命是透過報道數學、物理和生命科學的研究進展和趨勢來增進公眾對科學的理解。閱讀此處的原始文章。

© .