請留一點隱私

計算機科學家拉坦婭·斯威尼藉助“匿名化”程式、“去識別符號”和其他巧妙的演算法,幫助保護機密性。然而,這些是否足夠是另一個問題

拉坦婭·斯威尼吸引了很多關注。這可能是因為她對深奧而精巧的數學有著深厚的感情。或者可能是因為她穿著黑色皮衣,騎著她的本田VTX 1300摩托車在卡內基梅隆大學寧靜的校園裡穿梭,她在那裡領導著國際資料隱私實驗室。無論如何,斯威尼懷疑這種關注有助於解釋她為什麼如此著迷於保護人們的隱私。因為她工作的核心是一個令人煩惱的問題:在當今以安全為中心、以資料庫為基礎的世界中,身份資訊唾手可得,是否有可能維護隱私、自由和安全?

幾年前,太陽微系統公司董事長斯科特·麥克尼利曾著名地諷刺道:“隱私已死。接受現實吧。”斯威尼對此不敢苟同。“隱私絕對沒有死,”她反駁道;那些認為隱私已死的人“實際上並沒有徹底思考過這個問題,或者他們不願意接受解決方案。”

當然,隱私正受到圍攻,她說,這很糟糕。關於《愛國者法案》和聯邦層面的資料探勘的辯論愈演愈烈,各州也出臺了各種各樣的被動式法律,這些法律在確保隱私和提高安全性之間搖擺不定。儘管身份盜竊在2002年開始緩慢下降,但最近一項研究顯示,2006年仍有840萬美國成年人遭受某種形式的身份欺詐。“隨著技術的爆炸式發展,問題也隨之增長,”斯威尼說,而且每個問題都需要不同的解決方案,這實際上是在說,不可能預測新的侵犯隱私的形式將在哪裡出現。


關於支援科學新聞業

如果您喜歡這篇文章,請考慮透過以下方式支援我們屢獲殊榮的新聞業: 訂閱。透過購買訂閱,您將幫助確保未來繼續刊登關於塑造我們當今世界的發現和想法的具有影響力的報道。


所有這些都讓斯威尼和她的團隊在過去六年裡一直忙於解決當今最棘手的保密問題——身份盜竊、醫療隱私以及攝像頭監控的迅速擴張等等。其他學術實驗室傾向於在理論層面解決問題;47歲的斯威尼表示,她的團隊就像一個數字偵探機構,配備了一支由程式設計師組成的專業隊伍,他們正在設計一些非常巧妙的軟體。研究人員的方法是對系統進行技術分析,然後提出巧妙而務實的解決方案。

例如,斯威尼的“身份天使”程式在網際網路上搜索,並透過將一個數據庫中的姓名與分散在其他資料庫中的地址、年齡和社會安全號碼聯絡起來,快速收集數千個身份資訊。這四項資訊是任何人盜取身份並開設信用卡賬戶所需的全部資訊。實驗室會定期提醒弱勢群體,以便他們解決問題。

另一個程式“匿名化”身份。它最初是為國防部在9/11襲擊後開發的,旨在幫助定位潛在的恐怖分子,同時仍然保護無辜公民的隱私。該程式阻止監控攝像頭洩露身份,除非當局表明他們需要這些影像來起訴犯罪。與其他軟體不同,該程式不會將個人特徵畫素化或塗黑,而是實際上從資料庫中的其他面孔中偽造一個新的面部影像,使人類或機器都無法識別。

斯威尼實驗室核心的巧妙演算法可以追溯到她在納什維爾長大的日子,那時她會夢想著如何建立一個可以與之交談的人工智慧黑匣子。“我花了幾個小時幻想那個盒子,”她回憶道。十年後,她將自己在數學方面的天賦和早期對人工智慧的痴迷轉化為獎學金,這幫助她支付了前往麻省理工學院的學費,麻省理工學院是這兩個領域的堡壘。這裡似乎是實現她小學時創造智慧機器夢想的完美場所。問題是,斯威尼剛剛離開新英格蘭一所嚴謹的女子高中的禮貌世界,突然沉浸在麻省理工學院以男性為主導的極客文化中,這種轉變讓她措手不及。再加上她與一位種族歧視教授的經歷,這位教授似乎永遠無法讓她滿意,這導致斯威尼輟學並創辦了自己的軟體諮詢公司。

在商界工作十年後,斯威尼重返大學,並在哈佛大學完成了本科學位。然後,她在麻省理工學院獲得了計算機科學碩士和博士學位,成為第一位獲得該學位的非裔美國女性。“當我回來時,我告訴他們我不打算再受任何委屈了,”她笑著說。

正是在她重返麻省理工學院後,斯威尼首次涉足隱私和安全領域。她獲得了國家醫學圖書館的獎學金,為了表示感謝,她自願幫助波士頓的幾家醫院改進對其醫療記錄的保護,這是20世紀90年代中期網際網路蓬勃發展時出現的一個問題。斯威尼編寫了一個名為Scrub System的程式,該程式利用她在人工智慧方面的專業知識,巧妙地搜尋患者記錄、治療 notes 和醫生之間的信件。標準的搜尋和替換軟體通常只能找到30%到60%的個人身份資訊。Scrub System“理解”什麼是姓名、地址或電話號碼,並消除99%到100%的洩露資料。

該軟體贏得了醫學協會的讚譽。“她的研究非常有影響力,”國家醫學圖書館副館長貝齊·漢弗萊斯說。“很多人沒有看到[網際網路時代]的生活有多麼不同……拉坦婭的工作提高了他們的意識。”斯威尼羞澀地說,有了Scrub System,“我以為我已經解決了隱私問題。”但事實是,“我真的不瞭解隱私。”

有一天,當她回顧一位年輕女性的病史時,她才意識到這一點。“這個女孩兩歲時遭到性侵犯,三歲時用剪刀刺傷了她的姐姐,四歲時她的父母離婚了,五歲時她放火燒了她的家,”斯威尼回憶道。顯然,“刪除顯式識別符號並不是[隱私]的全部意義所在。”它指的是我們在散落在網際網路各處的記錄中留下的資訊碎片——在醫療表格、信用卡申請、簡歷和其他文件中。報告中沒有任何內容明確指出這個女孩的身份,但這些資訊碎片是獨一無二的,斯威尼非常確定她可以利用它們重新識別她——以及幾乎任何人。

諸如“身份天使”之類的程式已經證明了斯威尼的正確性,她花費了大量時間尋找侵犯隱私的方法,有時先於壞人,有時則不然。她講述了一個在馬里蘭州被起訴的銀行家的故事,他將公開的醫院出院記錄中的資訊與他自己的客戶名單進行交叉引用,以檢視他的客戶中是否有人患有癌症。如果他們患有癌症,他就會催收他們的貸款。在一個使用伊利諾伊州資料的專案中,斯威尼的實驗室找到了一種方法,即使在患者的所有資訊都從記錄中刪除後,也能重新識別亨廷頓病患者。亨廷頓病是由一段短DNA序列的重複引起的。該序列重複次數越多,發病年齡越早。斯威尼的實驗室將這些資料與包含患者年齡的醫院出院記錄相結合,準確地將90%的亨廷頓病患者與存檔的DNA記錄聯絡起來。斯威尼承認,濫用可能很少見,但這兩個案例都表明,如果一個數據庫被用來利用另一個數據庫中的資訊,情況可能會變得多麼糟糕。

斯威尼說,真正的解決方案不在她的實驗室或任何其他實驗室。最終,工程師和計算機科學家將不得不在新技術的的設計和可用性中預先融入隱私保護。如果他們這樣做,“社會[然後]就可以決定如何開啟和關閉這些控制,”斯威尼評論道。否則,我們可能都需要騎摩托車才能獲得片刻隱私。

© .