去年,當SafeGraph 被抓到出售計劃生育中心訪客的位置資訊時,這家資料經紀人透過移除其計劃生育中心資料來回應公眾的強烈抗議。但執行長奧倫·霍夫曼(Auren Hoffman)試圖扭轉局面,聲稱他的公司收集和分享敏感資料的做法實際上是造福社會的關於墮胎途徑的研究的引擎——用科學作為破壞人們隱私的盾牌。
SafeGraph將隱私掠奪行為掩蓋在科學之下,這只是整個行業推諉塞責的一個例子。其他公司,如Veraset、Cuebiq和X-Mode,也與學者合作開展所謂的“資料為善”專案,並抓住新冠疫情擴大這些專案。這些經紀人向學術研究人員提供位置資料,這些研究人員在諸如《自然》和《美國國家科學院院刊》美國。等刊物上發表了著名的論文。然而,2020年,Veraset還在未經華盛頓特區官員同意的情況下,向他們提供了數十萬人的批次位置資料。並且,今年一份擬議的集體訴訟將Cuebiq、X-Mode和SafeGraph列為從家庭跟蹤應用程式Life360購買位置資料而未經使用者同意的資料經紀人。
資料經紀人正在購買和出售數億人的位置資訊,太多的研究人員在使用科學研究中的資料時,無意中為這種大規模的隱私侵犯提供了公共關係掩護。
關於支援科學新聞報道
如果您喜歡這篇文章,請考慮透過以下方式支援我們屢獲殊榮的新聞報道 訂閱。透過購買訂閱,您正在幫助確保有關塑造我們當今世界的發現和想法的具有影響力的故事的未來。
研究人員必須認真考慮此類資料是否會使他們成為這種可疑行為的幫兇。立法者必須立即採取行動,阻止這種踐踏美國人隱私權的行為。必須拆除阻止對資料經紀人濫用行為進行全面審查的法律障礙。
霍夫曼在2022年5月接受現已倒閉的科技新聞網站Protocol採訪時辯稱,移除診所資料才是真正的問題:“一旦我們決定撤下資料,我們就收到了數百名研究人員的抱怨,”他說。然而,當被追問時,他無法說出任何人的名字——而且事實仍然是,在美國最高法院對多布斯訴傑克遜婦女健康組織案裁決之後,這些資料將實際的墮胎尋求者、提供者和倡導者置於危險之中。
像SafeGraph、Veraset和其他公司這樣的位置資料經紀人根本不符合研究人員被要求的人體受試者標準,首先是他們的商業慣例中始終缺少有意義的“選擇加入”同意。資料經紀人經常辯稱,他們收集的資料是選擇加入的,因為使用者已同意與應用程式共享該資訊——即使絕大多數使用者都不知道這些資訊會被偷偷出售給經紀人,而經紀人又將其出售給企業、政府、地方執法部門和其他機構。
事實上,谷歌認為SafeGraph的做法太過分,以至於它禁止任何使用該公司程式碼的應用程式進入其Google Play應用商店,蘋果和谷歌都禁止X-Mode進入各自的應用商店。
此外,儘管這些公司對匿名化提出了蒼白的辯解,但輸入資料經紀人產品的資料很容易與可識別的人聯絡起來。關於一個人去過哪裡的資訊本身就足夠了:一項2013年廣為引用的研究發現,研究人員僅使用兩個隨機選擇的時間和位置資料點,就可以唯一地識別出50%的人。
由於社交媒體和智慧手機使用的快速增長,如今的資料經紀人從比2013年更廣泛的來源收集敏感的使用者資料,包括移動應用程式後臺的隱藏跟蹤。雖然技術各不相同,並且常常被保密協議(NDA)所掩蓋,但他們收集和處理的原始資料是基於敏感的個人位置軌跡。
聚合位置資料有時可以保護個人隱私,其保障措施考慮了資料集的大小和所包含的資料型別。但是,沒有任何保護隱私的聚合協議可以證明在未經人們同意的情況下最初收集位置資料是合理的。
資料經紀人的產品出了名的容易被重新識別,尤其是當與其他資料集結合使用時——而這正是某些學術研究正在做的事情。研究已經將資料經紀人位置與人口普查資料、即時谷歌地圖交通預估、當地家庭調查和聯邦公路管理局的資料結合起來。雖然研究人員似乎致力於構建最可靠和最全面的資料集,但這種合併也是重新識別資料的第一步。
在層層保密協議的背後,資料經紀人通常對其商業行為以及構建其資料庫的資料聚合器、廣告技術交易所和移動應用程式網路進行隱藏,以逃避審查。這應該對機構審查委員會(IRB)發出警報,機構審查委員會負責監督涉及人體受試者的擬議研究,並且機構審查委員會需要了解資料經紀人及其合作伙伴是否以及如何實際獲得使用者的同意。同樣,學者們自己也有興趣確認他們工作所依賴資料的完整性和來源。
在沒有這種準確性和驗證的情況下,一些研究人員用模仿營銷語言的空話來混淆資料經紀人的資訊。例如,一篇論文將SafeGraph資料描述為“匿名化的人類移動資料”,另一篇論文稱其為“來自選擇加入的智慧手機GPS跟蹤的人流資料”。第三篇論文將資料經紀人Spectus描述為提供“匿名的、符合隱私規定的位置資料”,並具有“堅如磐石的隱私框架”。這些都不接近全部真相。
一篇《自然》論文甚至自相矛盾地將Veraset的位置資料描述為既“精細的”又“匿名的”。它的具體資料點包括“匿名裝置ID”和“裝置停留時間超過五分鐘的居住點的時間戳和精確地理座標”。如此精細的資料不可能是匿名的。
在公司遵守資料隱私和透明度要求之前,學術資料共享計劃仍將是虛偽的公共關係伎倆。經紀人提供的敏感位置資料只能在獲得明確的知情同意後才能收集和使用,並且受試者必須有權隨時撤回該同意。
我們需要全面的聯邦消費者資料隱私立法來執行這些標準——遠比國會迄今為止提出的更為全面。這樣一項法案絕不能搶佔甚至更嚴格的州法律的先機;它應該充當底線而不是上限。它必須包括私人訴訟權,以便普通人可以起訴侵犯其隱私權的資料經紀人,以及強有力的最小化條款,這將禁止公司處理個人資料,除非是嚴格必要地為他們提供他們要求的服務。該法案還必須禁止公司處理個人資料,除非獲得他們知情的、自願的、明確的、選擇加入的同意——而不是現在經常存在的選擇退出情景——並且必須禁止按隱私付費計劃,即公司向那些拒絕放棄隱私權的人收取更多費用或提供較低質量的服務。
我們必須剝離保密協議,以便研究資料經紀人本身:他們的商業行為、他們的合作伙伴、他們的資料可能被濫用的方式,以及可以採取哪些步驟來保護他們置於危險之中的人們。
資料經紀人聲稱他們正在為科技行業帶來透明度或“普及資料訪問”。但他們的科學資料共享計劃只不過是試圖控制圍繞其不受歡迎的和未經同意的商業行為的敘事。關鍵的學術研究絕不能依賴於以利潤為驅動的資料管道,這些管道在沒有獲得有意義的同意的情況下,危及數百萬人的安全、隱私和經濟機會。
這是一篇觀點和分析文章,作者或作者表達的觀點不一定代表《大眾科學》的觀點。
