Facebook 爭議:隱私並非問題的關鍵

真正的危險在於網際網路上的資訊和社交平臺正在被騙子、政治煽動者和小偷利用而腐敗

加入我們的科學愛好者社群!

本文發表於《大眾科學》的前部落格網路,反映了作者的觀點,不一定反映《大眾科學》的觀點


劍橋分析公司大規模抓取 Facebook 使用者資料的事件現在已經廣為人知,我們都對個人資料被大規模共享和交易感到“震驚”。但社交媒體的真正問題不是個人使用者資訊被共享所造成的損害,而是不良行為者利用欺騙、欺詐和謊言的放大效應,透過網際網路在社會討論中輕易傳播,從而對社會和政治行為進行復雜而有時微妙的大規模操縱。

當我們接受谷歌、Facebook、Twitter 和其他公司的免費服務模式時,任何對隱私的偽裝都早已被拋棄。上週聽取馬克·扎克伯格的認錯陳詞的參議員們真的認為 Facebook 向用戶免費提供服務,僅僅是在提供一項公共服務嗎? 如果不是透過向廣告商出售廣告和使用者資料,他們認為其 110 億美元的廣告收入從何而來?

讓我們明確真正的議題。身份盜竊和個人財務資訊丟失造成的實際損害正在成為日益嚴重的問題,但它們通常不是由我們使用社交媒體平臺引起的,我們在社交媒體平臺上分享大量資訊——但很少分享我們的信用卡或社會安全號碼。


關於支援科學新聞

如果您喜歡這篇文章,請考慮透過以下方式支援我們屢獲殊榮的新聞報道 訂閱。透過購買訂閱,您將有助於確保未來能夠繼續講述關於塑造我們今天世界的發現和想法的有影響力的故事。


導致扎克伯格到國會作證的劍橋分析公司爭議實際上在一年前就開始醞釀。 這場爭議不是關於隱私,而是關於劍橋分析公司如何將大量個人資料(主要來自 Facebook)投入其所謂的“心理畫像”引擎,以影響個人層面的行為(參見當彌天大謊遭遇大資料,於 2017 年 3 月在此處釋出)。

劍橋分析公司與劍橋大學的研究人員合作,開發了一個 Facebook 應用程式,該應用程式提供免費性格測試,然後開始收集所有使用者的 Facebook 資料以及他們所有朋友的資料(從而利用實際使用者,他們的數量不到一百萬,來收集超過 8000 萬人的資料)。 使用這些資料,劍橋分析公司隨後根據所謂的“OCEAN”量表(開放性、盡責性、外向性、宜人性和神經質)對每個人的性格進行分類,並製作有針對性的個性化資訊以吸引每個人的性格。

無需傳票或調查記者就能發現這一切——其中大部分是由劍橋分析公司的執行長亞歷山大·尼克斯在 YouTube 上廣泛傳播的營銷演示中公開的。 劍橋分析公司(部分由人工智慧的早期先驅羅伯特·默瑟擁有,他一直是 Breitbart News 和其他右翼事業的資金支持者)已經為特朗普競選團隊工作過,而尼克斯正在尋求更多業務。

劍橋分析公司醜聞揭示的真正危險是,網際網路的資訊和社交平臺(我們越來越多地在上面花費時間,並且我們越來越多的個人和社交關係透過這些平臺流動)正在被騙子、政治煽動者和小偷利用而腐敗。 俄羅斯的水軍工廠“網際網路研究機構”僱傭虛假使用者帳戶釋出煽動性資訊、購買政治廣告、傳播捏造的影像,甚至組織政治集會。

虛假資訊的危險不僅限於政治領域,也存在於商業領域。 網際網路廣告的主要購買者都知道“按點選付費”模式存在缺陷。 競爭對手可以設定機器人(甚至人為活動)來點選他們的廣告,從而抬高他們的成本,並讓人懷疑廣告活動的價值。 Devumi 公司向名人和企業出售 Twitter 粉絲和轉發,以使他們看起來比實際更受歡迎。 這些粉絲是假的,是透過抓取社交媒體網路上的姓名和照片以自動化方式拼湊起來的。

在扎克伯格決定在國會作證之前,幾乎沒有證據表明 Twitter 或 Facebook 對這一切感到不安。 儘管如此,仍有許多機器學習工具可以用來識別虛假帳戶或活動。

本福特定律

2015 年,馬里蘭大學教授 珍妮弗·戈爾貝克 發現了一種巧妙的即時方法來識別虛假社交媒體帳戶。 她發現,使用者的 Twitter 或 Facebook 好友數量遵循一個著名的統計分佈,稱為本福特定律。 該定律指出,在符合條件的資料集中,數字的第一個有效數字大約有 30% 的時間是“1”——比是“9”的情況多六倍。 這種現象非常普遍,以物理學家弗蘭克·本福特的名字命名,他用河流的表面積、街道地址、《讀者文摘》雜誌中出現的數字以及更多例子來說明了這一點。

 

本福特分佈(波蘭語:Rozklad Benforda):前導數字為 1、2 等的百分比。 來源:GKnor Wikimedia 

換句話說,如果你檢視(例如)一千名 Facebook 使用者,並計算他們每個人有多少朋友,那麼大約 300 人的朋友數量將在十幾(1x)、100-199 範圍(1xx)或 1,000-1,999 範圍(1xxx)內。 只有 5% 的人的計數以 9 開頭:9、90-99、900-999、9,000-9,999。

我們可以將每個 Facebook、Twitter 或其他社交媒體使用者表示為連結使用者的網路。 個人使用者的連結到其他使用者的圖表可能如下圖所示

為了測試本福特定律,請統計每個使用者的朋友的“朋友的朋友”。 來源:彼得·布魯斯

為了評估使用者是否真實,我們可以檢視該使用者的每個朋友,並計算他們的朋友或關注者。 具體來說

1. 考慮所討論帳戶的朋友或關注者。

2. 計算其關注者/朋友(“朋友的朋友”);記錄。

3. 對原始帳戶的所有剩餘朋友/關注者重複上述步驟。

4. 計算這些“朋友的朋友”計數的分佈。

俄羅斯機器人已被揭露,但仍然線上

戈爾貝克發現,絕大多數 Facebook、Twitter 和其他社交媒體關注者和朋友的數量都符合本福特定律。 然而,在 Twitter 上,她發現一小部分 170 個帳戶的關注者分佈與該定律明顯不同。 在她2015 年的論文中,她寫道

“有些帳戶是垃圾郵件,但大多數帳戶是俄羅斯機器人網路的一部分,這些機器人釋出文學作品或引言的隨機片段,通常是從句子中間隨意摘取的。 所有俄羅斯帳戶的行為方式都相同:關注其他同類型的帳戶,釋出一張完全相同的庫存照片影像,並使用不同的庫存照片影像作為個人資料圖片。”

戈爾貝克告訴我,她和其他人在三年前釋出了 Twitter 上活躍的俄羅斯機器人列表,截至今年 1 月,這些機器人仍然活躍。 Twitter 似乎並不在意。 更重要的是,徹底清理使用者記錄會對 Twitter 的使用者群產生財務上的不利影響; 在矽谷,商業計劃的起點和終點都是龐大且不斷增長的使用者群。

虛假的俄羅斯(和其他)Twitter 和 Facebook 帳戶及其相關活動持續存在,這重要嗎? 它們會造成什麼危害?

  • 它們可以建立和傳播虛假資訊,這些資訊可以用於劍橋分析公司風格的心理畫像活動。 在亞歷山大·尼克斯對這種方法的演示中,他的一個例子表明,強調對鯊魚的恐懼的危言聳聽但虛假的資訊,比真實但枯燥的法律通知更能有效地阻止人們進入私人海灘。 虛假使用者可以幫助生成服務於特定行為操縱目標所需的虛假內容。

  • 它們可以透過為極端分子提供社群(即使是虛假的社群)來幫助他們; 在網際網路時代之前,這些極端分子將面臨更高的社會負擔。

  • 它們可以放大和提升被選中的評論員和評論員的影響力,以促進他們的目標。

  • 它們可能會造成商業損害和扭曲,例如透過虛假評論來提升產品銷量,以及破壞按點選付費廣告活動。 去年在一次分析會議上,一位演講者估計,廣告商支付的點選活動中,高達 40% 是欺詐性的。

  • 從長遠來看,它們將玷汙社交媒體指標,這對依賴社交媒體來推廣其產品和服務的合法非傳統企業和組織有害。 虛假使用者將自己與合法使用者聯絡起來以提升自己的形象,從而損害合法使用者。 這篇部落格文章講述了音樂界中的這種現象。

未來

很難看出政府監管將如何發揮有益作用。 在當今的數字時代,監管就像在河床中放置岩石。 水會簡單地繞過它們流動,即使是巨大的岩石也是如此。

社交媒體巨頭可能會使用他們可以使用的工具(如本文討論的工具)來大幅降低虛假帳戶和操縱行為的影響。 目前,由於劍橋分析公司的特殊情況,我們引起了 Facebook 的馬克·扎克伯格的關注,這種情況的故事線類似於“Breitbart 和特朗普的資助者從 Facebook 上抓取大量個人資料,並用它來操縱輿論”。 與此同時,Twitter 的創始人傑克·多爾西已經做出了一些承諾來改進身份驗證,但在最近的風頭中得以倖免。

最終的解決方案可能在於更聰明的公眾。 人們可以被教會用更懷疑的態度來對待他們在網際網路上看到的東西嗎? P.T. 巴納姆會說不,但有一個強大的公眾教育例子,它有一個良好而深刻的結局:吸菸。 世界各地吸菸人數的巨大下降主要是由於公眾教育和隨之而來的行為改變,而不是監管,也不是菸草公司承擔更大的公共責任。

 

Peter Bruce founded The Institute for Statistics Education at Statistics.com in 2002. He is a co-author of "Data Mining for Business Analytics" (Wiley), and "Practical Statistics for Data Scientists: 50 Essential Concepts" (O'Reilly,2017), the author of "Introductory Statistics and Analytics: A Resampling Perspective" (Wiley), and the co-developer of Resampling Stats software.

More by Peter Bruce
© .