如今隱私很難獲得,尤其是在網際網路上,每次你在谷歌上搜索內容時,你的需求都會被記錄下來以供後人參考——或者至少是為了廣告商。
網際網路搜尋公司表示,他們透過加密個人資訊以及使用數字而非姓名來保護客戶的隱私,從而為使用者提供匿名性。問題是匿名化並非總是有效。AOL 使用者 4417749 號在 2006 年就吃到了苦頭,當時 AOL 決定線上釋出一份包含 2000 萬次網路搜尋的列表,其中包括她和 657,000 名其他使用者的搜尋記錄。記者透過分析她的搜尋內容,追蹤到了這位家住佐治亞州利爾本的 62 歲寡婦。幸運的是,塞爾瑪·阿諾德對她的身份和私密興趣被曝光並不感到尷尬。我們當中有多少人能說同樣的話呢?
然而,物理定律可能會來解救我們。透過特殊的“量子通道”進行通訊已經使銀行和其他機構能夠傳送具有幾乎牢不可破的加密的資料。因此,技術已經存在,可以向可能攔截您查詢的竊聽者隱藏您的搜尋內容。但在未來,新“量子”版本的網際網路可能會使您能夠傳送查詢並接收答案,並確保沒有人——甚至谷歌也不知道您提出了什麼問題。此外,將保證私密搜尋的相同技術也可能保證整個線上體驗過程中的隱私。
關於支援科學新聞報道
如果您喜歡這篇文章,請考慮透過以下方式支援我們屢獲殊榮的新聞報道: 訂閱。透過購買訂閱,您正在幫助確保有關塑造我們當今世界的發現和想法的具有影響力的故事能夠擁有未來。
當然,搜尋引擎會儲存和分析使用者資料,以便他們可以展示有針對性的廣告。這就是他們支付費用並賺取利潤的方式。如果他們決定對使用者資料保密,搜尋引擎將需要一種新的商業模式。使用者可能必須決定他們是否願意付費搜尋,或者他們是否寧願免費搜尋並放棄他們的搜尋資料。
非經典監聽者
在 2004 年春天,我發現自己參加了在加利福尼亞州蒙特雷舉行的一次會議期間的億萬富翁宴會,當時我感到有些錯位。據我所知,我的角色是做那個從蛋糕裡跳出來的人——換句話說,娛樂對量子技術感興趣的客人。出席活動的合法億萬富翁包括谷歌的創始人謝爾蓋·布林和拉里·佩奇。令我驚訝的是,布林和佩奇對量子資訊瞭解很多。在對量子物理學可能如何改變人們與網際網路互動方式進行一番大膽猜測之後,我建議我將與我的同事合作研究“量子網際網路搜尋”,無論這最終證明是什麼。
量子物理學提供完全隱私的能力源於一個簡單的事實:量子領域中的系統(包括從基本粒子到分子的任何事物)可以存在於多種狀態。在任何特定時間,原子可以位於多個不同的位置;光粒子或光子可以同時垂直和水平偏振;電子的磁矩可以指向上和向下,等等。因此,經典(相對於量子)資料位只能記錄值 0 或值 1,而量子位可以同時記錄 0 和 1。此外,每當量子位同時取值 0 和 1 時,您都無法精確複製該量子位,並且任何嘗試這樣做都會改變該位的狀態。這條規則,被稱為不可克隆定理,也適用於量子位的字串,例如,量子位的字串可以表示單詞或句子。因此,竊聽量子通道(通常是光纖,在多個偏振態下攜帶光子)的人將無法“監聽”通訊而不干擾它,從而暴露入侵行為。
由於不可克隆性,存在幾種不同的量子加密技術可以完全私密地交換資料。然而,這些技術假定允許收件人讀取您傳送給他們的資料:僅僅向谷歌傳送加密的搜尋查詢是無濟於事的。然而,去年,我的同事,義大利比薩高等師範學院的維托里奧·喬萬內蒂和義大利帕維亞大學的洛倫佐·馬孔內以及我發現,不可克隆定理也使私密查詢成為可能。在我們設計的協議中,使用者必須能夠向搜尋引擎傳送“量子問題”——一個同時包含真實問題和另一個問題的量子位字串。(第二個問題是什麼並不重要:您的計算機甚至可以自動提供一個隨機問題。)
搜尋引擎在其資料庫中搜索您的多個問題的答案,並將問題和答案組合成一個新的量子包,然後將其傳送回給您。如果搜尋引擎複製問題以供記錄,您將能夠知道您的隱私受到了侵犯,因為您的原始問題的量子態將以您的計算機可以檢測到的方式受到擾動。至關重要的是,搜尋引擎可以提供答案,而無需物理檢測(更不用說克隆)編碼問題的位字串,因此無需知道問題是什麼。
儘管這種魔法在目前的計算機、資料庫和網路硬體上是不可能的,但我們意識到這並非技術上遙不可及。量子私密查詢的第一個要求是基本的量子網際網路。沿專用線路交換量子訊息的技術已經存在,並已用於安全通訊。然而,功能完善的量子網際網路將不僅是兩點之間的一條線路,而是一個網路,其節點路由資料包,以便任何使用者都可以訪問任何其他使用者或任何 Web 伺服器。事實證明,在不製作資料臨時副本的情況下路由資料——從而避免遭受不可克隆定理的後果——是一項非同尋常的任務,需要一種目前處於實驗階段的複雜技術,稱為量子路由器。這種網路的原型可能會在 5 到 10 年內問世。
私密 Web 搜尋的第二個要求是使用者和資料伺服器擁有基本的量子計算機,這意味著能夠儲存和處理量子位的計算機。不幸的是,量子位是出了名的變化無常,並且傾向於在一秒鐘的一小部分時間內自發地失去其多重量子態。例如,將量子位儲存在懸浮在真空中的單離子的磁態中的實驗性量子計算機,到目前為止一次只能儲存大約八個量子位。功能完善的量子計算機將需要數百甚至數千個量子位,即使作為實驗室演示,也可能還需要數十年才能實現。不過,幸運的是,對於量子私密搜尋的目的而言,僅需約 30 個量子位就足夠了:如果編碼得當,一個 30 位查詢可以從包含超過十億條條目的資料庫中提取答案。這種 30 位“量子微處理器”也可能在 5 到 10 年內問世。
並非如此隨機
到目前為止,一切看起來都不錯:量子私密搜尋似乎只需要非常簡單的量子計算機和量子通訊系統。現在困難的部分來了。為了回答使用者的多方面量子問題,搜尋引擎的資料庫必須能夠同時提供問題的每個組成部分的答案。這樣做將需要一種新型的資料儲存,稱為量子隨機存取儲存器,或量子 RAM。
RAM 只是一個用於儲存資料的裝置,以樹狀結構排列。每條資料都是一個八位序列,即一個位元組,並且有一個地址,地址本身也是一個位序列。位元組就像樹上的葉子;地址控制著從樹幹到特定葉子的路徑。地址的第一位指定在樹的最低層要走哪兩個分支中的一個,第二位控制第二層分支,依此類推。分支在每一層都加倍,在具有 30 位地址的傳統 RAM 中,檢索資料需要撥動 230 個(超過 10 億個)開關。
可以設計傳統 RAM 的量子版本。唯一的區別是,現在透過二叉樹路由資訊的開關必須能夠同時透過兩個不同的分支路由資訊,因為量子問題的每個位都可以指定兩條不同的路徑。這種量子開關可以使用現有技術構建,例如半透明反射鏡,它可以“分裂”光子,使其同時沿兩條不同的路徑傳播。問題是量子電路對噪聲和錯誤極其敏感:如果僅僅一個開關出現故障,相應位的隱私就會丟失。由於典型的地址位控制著大量的開關,因此丟失隱私的機會非常高。
喬萬內蒂、馬孔內和我提出了一種不同的 RAM(量子和經典)定址設計,其中每次記憶體呼叫撥動的開關要少得多。秘訣是將地址位沿著與資料要遵循的相同樹分支進行路由,而不是透過單獨的定址線。由於地址位是按順序透過陣列傳遞的,因此我們稱之為“接力式”RAM。
接力式架構在陣列的每一層僅需要撥動一個開關,而傳統 RAM 在每一層的每個開關都撥動。節省非常顯著:具有十億個記憶體槽的接力式 RAM 每次記憶體呼叫撥動 30 個開關,而傳統 RAM 每次記憶體呼叫撥動十億個開關。並且接力式架構在錯誤率和節能方面的優勢隨著位數的增加呈指數增長。
量子的慰藉
起初,我們認為接力式想法有可能徹底改變傳統 RAM 行業,並且對金錢的渴望開始在我們腦海中閃現。但我們很快發現,其他人之前也想到過類似的設計,而且無論如何,該設計對於傳統 RAM 來說速度太慢了(儘管它可能是非易失性儲存器(例如數碼相機中使用的儲存器)的節能解決方案)。
但是,接力式設計對於量子搜尋至關重要,因為它的架構可以容忍三十分之一的錯誤率,而不是十億分之一。量子 RAM 的儲存介質可以由傳統的物理支援組成。例如,資料可以儲存在數十億個微小的反射鏡中,就像構成傳統 CD 表面的反射鏡一樣。量子 RAM 真正具有量子特性的部分是開關陣列,它可以由每個開關都可以在兩個分支上同時分流量子位的開關構成。這種量子開關已經存在,並且達到了足夠低的錯誤率,可以構建具有十億個或更多槽的量子 RAM。
當然,組裝量子開關以製造大型量子 RAM 可能會被證明是困難的,更不用說將量子 RAM 連線到量子通訊通道以實現量子私密查詢的問題了。但是,這些困難似乎都不是無法克服的。順便說一句,我們最近意識到,我們的量子 RAM 設計的資料路由技術可以應用於整個量子網際網路的交換網路。人們可以完全匿名地瀏覽網路,不僅不會洩露他們正在搜尋的內容,也不會洩露他們正在訪問的網站。
在我的同事和我確定瞭如何構建量子 RAM 並進行量子私密查詢的細節幾個月後,我在加利福尼亞州納帕的一次會議上遇到了布林和佩奇。在無花果樹下的熱水浴缸中,當星星在頭頂旋轉時,我描述了量子查詢的工作原理及其可能帶來的好處。他們的第一反應是,谷歌的商業模式是保留有關所有查詢的資訊,並使用它來優先考慮廣告和未來的搜尋結果。他們沒有想到不保留有關查詢的資訊。當我向他們提出新的、基於向客戶收取搜尋結果費用的量子商業模式的明顯優勢時,他們又思考了一會兒。“好吧,”他們說,“讓我們看看你是否能構建它。”
最近,弗朗切斯科·德·馬蒂尼和他在羅馬大學“La Sapienza”的團隊正是這樣做的。他們使用雷射器、偏振器和光子探測器,構建了一個簡單的量子 RAM,並在小型資料庫上演示了我們的搜尋協議。因此,量子私密查詢是真正有可能實現的。如果有一天我們將擁有更大的量子 RAM 或可行的量子網際網路,那麼接下來會發生什麼就只能由大家猜測了。