本文發表於《大眾科學》的前部落格網路,僅反映作者的觀點,不一定反映《大眾科學》的觀點
約瑟夫·戈培爾曾說:“如果你說了一個足夠大的謊言並不斷重複它,人們最終會相信它。” 然而,在大資料時代,在機器學習的引導下,許多較小的謊言可能比少數彌天大謊更有效。 甚至用影射調味的字面真相也行。研究表明,陳述中突出的概念可以持續存在並支配其嵌入的字面真相。 例如,考慮以下陳述:“沒有證據表明希拉里·克林頓在彗星披薩店外經營兒童性奴隸制。” 經常重複它,人們很容易只記住“希拉里·克林頓……兒童性奴隸制”的概念,而不是它的否定。
特朗普總統對真相的漠視通常顯得是衝動的,而不是戰略性的——有點像酒吧裡的吹牛者(如果他不是一個禁酒主義者的話)。 當得知有關他的就職典禮人群不如奧巴馬總統首次上任時的人群,甚至不如婦女大遊行聚集的抗議人群時,特朗普憤怒地回應(並讓他的新聞秘書堅持)他的就職典禮人群是美國曆史上最多的(不是真的)。 在競選期間,他聲稱看到新澤西市的人們在街上跳舞慶祝 9/11 襲擊事件(也不是真的)。 選舉結束後,他聲稱數百萬非法移民的選票使他失去了普選票(沒有證據)。
特朗普總統熱情擁抱隨意撒謊在一定程度上被視為“假新聞”普遍現象的反映和產物。“假新聞”的影響是真實存在的——華盛頓特區的彗星披薩店確實被許多人認為是兒童性交易團伙的所在地,該團伙在希拉里·克林頓的參與下運作。 12 月 4 日,那裡發生了一起離奇的圍攻事件,武裝精良的埃德加·韋爾奇進入餐廳,並宣佈他來此調查此事。 性奴隸的故事純屬虛構,但在網際網路上鋪天蓋地。 埃德加·韋爾奇相信了它,並從北卡羅來納州前往華盛頓特區,準備戰鬥。
關於支援科學新聞業
如果您喜歡這篇文章,請考慮透過以下方式支援我們屢獲殊榮的新聞業 訂閱。 透過購買訂閱,您正在幫助確保未來能夠繼續報道關於發現和塑造我們當今世界的思想的具有影響力的故事。
假新聞從何而來? 事實證明,建立和傳播假新聞是一項有利可圖的家庭手工業。 NPR 追蹤到一位假新聞創作者賈斯汀·科勒,他在洛杉磯郊區。 科勒最初迎合另類右翼,並在最近的總統競選期間找到了迅速擴大的受眾——“一個龐大的 Facebook 群體,由狂熱的特朗普支持者組成,他們正等著吞噬這塊紅肉。”
賈斯汀·科勒是一位民主黨人,他說他想揭露假新聞現象。 但收入很可觀(每年超過 10 萬美元),而且,最終,他希望人們做的是點選他的故事,以便他可以收取廣告收入。
但是,假設您有興趣讓某人做一些比點選更多的事情呢? 一些政治性的事情——比如投票給特定的候選人、參加集會、給你的國會議員寫信等等? 這就是大資料發揮作用的地方。
自 2004 年以來,政治顧問一直使用大資料模型來預測人們將如何投票,並表明是否應該向他們傳送訊息以鼓勵他們這樣做(如果是,則傳送哪些訊息)。 他們使用隨機實驗(A-B 測試)來確定不同訊息在個人層面的效果,並將此與其他變數(如人口統計資料和投票資料)相關聯,以構建預測模型。 所有這些都類似於營銷領域發生的事情(例如,是否應向給定的消費者傳送招攬 A 或 B),奧巴馬總統是使用預測分析來定位個人選民的先驅。
自 2004 年以來,預測建模科學取得了長足的進步。統計學家現在構建“人格”模型,並將它們與其他預測變數聯絡起來。 現在可以根據埃德加·韋爾奇的人格分類(而非僅僅是其人口統計投票行為)來定向傳送訊息,人格分類來自大量可供購買的詳細個人資料。 其中一個模型帶有首字母縮寫詞“OCEAN”,代表開放性、盡責性、外向性、宜人性和神經質的人格特徵(及其對立面)。 在個人層面使用大資料,機器學習方法可能會將一個人分類為,例如,“封閉、內向、神經質、不隨和且盡責”。
劍橋分析公司(由特朗普的主要捐助者麗貝卡·默瑟所有)的執行長亞歷山大·尼克斯表示,他掌握著關於您和每位其他選民的數千個數據點:您購買或借閱什麼、您住在哪裡、您訂閱什麼、您在社交媒體上釋出什麼等等。 在最近的康科迪亞峰會上,尼克斯以槍支權利為例,描述瞭如何根據您的人格概況專門為您定製訊息。 您是否高度神經質且盡責? 尼克斯建議使用一隻險惡的戴著手套的手伸過破窗的影像。
尼克斯在他的演講中指出,目標是誘導行為,而不是交流思想。 那麼真相在哪裡呢? 斯坦福大學管理科學助理教授約翰·烏甘德認為,對於尼克斯和劍橋分析公司來說,真相併不重要。 在指導一位假設的私人海灘所有者如何阻止人們進入他的房產時,尼克斯避開了僅僅是事實的“私人海灘”標誌,而是提倡一個謊言:“發現鯊魚。” 烏甘德在他的評論中,告誡所有資料科學家不要“構建用於肆無忌憚地定位的工具”。
警告是必要的,但可能為時已晚。 尼克斯在他的演講中描述的內容涉及針對他的目標人格精心製作的訊息。 他的資訊巧妙地牽動了各種心理絃索來操縱我們,並且它們不遵守真相的界限,但它們需要人類來創造它們。 下一個階段將是用機器學習演算法逐步取代人類的“工藝”,這些演算法可以為目標選民提供源源不斷的內容(來自任何來源,無論真假),旨在引出期望的行為。 大資料學術期刊意識到資料科學家已經開啟的潘多拉魔盒,已為未來一期專門討論“計算宣傳”的期刊發出徵稿啟事。
希望它將解決更廣泛的倫理和政策問題,而不是一本“操作指南”。
