2015年1月29日

購物習慣在“匿名”資料中洩露個人資訊

關於您使用信用卡的時間和地點的資訊，可能幫助資料竊賊揭露您的身份，即使他們不知道您的姓名、地址和其他個人資訊。

本文發表在《大眾科學》的前部落格網路中，反映了作者的觀點，不一定代表《大眾科學》的觀點

關於您使用信用卡的時間和地點的資訊，可能幫助資料竊賊揭露您的身份，即使他們不知道您的姓名、地址和其他個人資訊。這是最新研究的結果，該研究旨在揭示匿名資料記錄是保護隱私的有效方法這一觀點中的漏洞。

企業、醫療機構和政府機構經常聲稱，對他們儲存的資料進行消毒處理，可以在資訊丟失或被盜的情況下維護客戶、患者或選民的機密性。他們使用一種有時被稱為“去身份化”的方法，清除可能揭示個人身份的資料欄位，例如 IP 地址、使用者名稱和社保號碼。他們透過多種方式做到這一點，包括加密和在共享記錄時排除某些資料。

通常，儲存敏感個人資料的人依賴匿名化作為一種避免在資料庫洩漏或遭到破壞時通知公眾的法律義務的方法。然而，本週發表在《科學》雜誌上的一項研究——該雜誌“資料驅動世界中的隱私”特刊的一部分——聲稱，麻省理工學院 (M.I.T.)、奧胡斯大學（丹麥）和羅格斯大學的研究人員能夠在一個匿名的信用卡記錄資料庫中“重新識別”個人。

關於支援科學新聞

如果您喜歡這篇文章，請考慮透過以下方式支援我們屢獲殊榮的新聞報道訂閱。透過購買訂閱，您正在幫助確保關於當今塑造我們世界的發現和想法的具有影響力的故事的未來。

研究人員分析了三個月的“簡單匿名化”信用卡記錄——沒有姓名、帳號或其他明顯的識別符號——來自一個身份不明的國家/地區的 10,000 家商店的 110 萬人購物資料。這些資訊由該國的一家銀行提供。他們分析的資料集中包括購買發生的商店名稱和位置、購買發生的日期以及購買金額。

研究人員利用信用卡和交易資訊，識別了資料集中 90% 的個人。當他們在其中加入交易的確切價格時，他們重新識別匿名記錄的能力提高了 22%。研究人員發現，即使他們只知道購物者的大概位置或購物時間範圍，他們也可以識別出這些人。

該研究最重要的結論之一是，“我們必須更加努力地思考和改革我們處理資料保護的方式，並超越匿名化，鑑於我們所有人以數字方式留下的資訊足跡，這很難實現，”麻省理工學院媒體實驗室計算隱私方向的高階博士生伊夫-亞歷山大·德·蒙特喬伊說，“即使您有很多關於某人的資料，您也希望對某人的身份存在不確定性。”

根據這項研究，女性比男性更容易被重新識別，收入高的人也比收入低的人更容易被識別。德·蒙特喬伊和他的同事，包括媒體實驗室主任和資料科學家亞歷克斯·“桑迪”·彭特蘭，沒有深入研究造成這種差異的原因。然而，德·蒙特喬伊指出，這可能表明，根據不同人的購買行為，例如他們訪問的商店數量和在那裡花費的時間，可能更容易識別出他們。

比這項研究的結果更令人不安的是，美國有如此多的法律鼓勵將匿名化作為一種隱私保護手段。《1996 年健康保險流通與責任法案》（HIPAA）例如，將 18 個不同的資料類別視為受保護的健康資訊——包括姓名、社會安全號碼和出生日期——必須進行“去身份化”。然而，HIPAA 並未對患者就診資訊（例如就診年份、患者年齡或診斷）提出相同的要求——這種疏忽削弱了患者的匿名性，科羅拉多大學法學院副教授兼學術事務副院長保羅·奧姆在 2009 年為《加州大學洛杉磯分校法律評論》撰寫的一篇文章中指出。

隨著美國國會針對奧巴馬總統呼籲制定聯邦資料洩露通知立法，制定《個人資料通知和保護法》，匿名化的缺陷現在尤其值得關注。該法律將建立一個國家標準，以取代目前使用不同標準來確定企業何時必須公開報告丟失或被盜的客戶資料的 47 項不同的州法律。