人工智慧會成為虛假新聞和產品評論的未來嗎?

一項使用計算機演算法建立虛假Yelp評論的實驗取得了令人不安的成功,並且隨著人工智慧的成熟,可能會出現更大的問題

上個月,希拉里·克林頓的新書《發生了什麼》在亞馬遜網站上首次亮相時,反響令人難以置信。如此難以置信,以至於在短短幾個小時內,該書在亞馬遜頁面上釋出的1600條評論中,該公司很快刪除了900條,懷疑這些評論是虛假的:由那些聲稱喜歡或討厭這本書但既沒有購買過,甚至可能沒有讀過這本書的人寫的。虛假產品評論——由付費或更邪惡的動機驅動——並非新鮮事,但隨著騙子找到新的方法來自動化旨在影響公眾輿論的線上虛假資訊活動,它們將成為更大的問題。

根據分析在亞馬遜網站上銷售的產品的消費者反饋的監督網站 ReviewMeta 的說法,自 9 月 12 日首次亮相以來,亞馬遜已經刪除了近 1200 條關於《發生了什麼》的評論。據 ReviewMeta 稱。去年,在評估了亞馬遜上的 700 萬條評估後,ReviewMeta 獲得了一些惡名,它指責這家線上零售商允許由付費撰寫五星級產品認可的人員進行“激勵性”評論。亞馬遜後來修訂了其社群指南,禁止激勵性評論。

亞馬遜刪除如此多關於克林頓的書的評價引起了 ReviewMeta 的注意。該網站收集亞馬遜上的公開可用資料,包括產品收到的星級、撰稿人是否是產品的經過驗證的買家以及該人在網站上的活躍程度。Tommy Noonan,一位在 2016 年 5 月創立 ReviewMeta 的程式設計師,鑑於過去一年“虛假”這個詞所帶有的政治色彩,他避免稱這些評論為“虛假”。Noonan 更喜歡“不自然”這個詞。


支援科學新聞

如果您喜歡這篇文章,請考慮透過以下方式支援我們屢獲殊榮的新聞報道 訂閱。透過購買訂閱,您將有助於確保關於塑造當今世界的發現和想法的具有影響力的故事的未來。


他解釋說:“無法 100% 確定特定評論是虛假的。” 幸運的是,亞馬遜網站上只有少數商品的評論完整性問題與《發生了什麼》相當。這些商品“主要是克林頓的書籍——儘管也存在[唐納德]特朗普聖誕飾品的問題”,該飾品收到了大量異常的負面評論,Noonan 補充道。

人工智慧來救援?

在亞馬遜、Yelp 或任何其他嚴重依賴消費者評價的商業網站上,要大量炮製足以影響產品或服務聲譽的虛假評論,並不像聽起來那麼容易。與某人撰寫然後試圖透過社交媒體病毒式傳播的虛假新聞報道不同,虛假評論只有在大量製造併發布到銷售或宣傳特定商品的網站上時才有效。它們也需要具有一定的可信度——儘管正確的拼寫和標點符號似乎是可選的。

一群芝加哥大學的研究人員正在調查是否可以使用人工智慧來自動生成足夠令人信服的大量評論。他們最新的實驗涉及開發基於人工智慧的方法來生成虛假的 Yelp 餐廳評估。(Yelp 是一個流行的眾包網站,自 2004 年 7 月推出以來,已經發布了超過 1.35 億條評論,涵蓋了大約 280 萬家企業)。研究人員使用了一種稱為深度學習的機器學習技術來分析數百萬現有 Yelp 評論中使用的字母和單詞模式。深度學習需要大量的計算,並且需要將大量資料集饋送到基於人腦神經結構的模擬人工“神經元”的大型網路中。芝加哥團隊的人工神經網路生成了自己的餐廳評論——一些具有複雜的單詞使用模式,使其成為真實的評價,另一些則由於重複的單詞和短語而似乎很容易被發現。

但是,當研究人員測試他們的人工智慧生成的評論時,他們發現 Yelp 的過濾軟體(也依賴於機器學習演算法)很難發現許多假貨。被要求評估真實和自動化評價的人類測試物件無法區分兩者。當被要求評價特定評論是否“有用”時,人類受訪者對人工智慧生成的版本的回應幾乎與真實版本一樣頻繁。

芝加哥大學計算機科學教授 Ben Zhao 表示:“我們已經驗證了某人使用人工智慧建立足以欺騙當前對策的虛假帳戶的危險。”他將於下個月在達拉斯舉行的 ACM 計算機和通訊安全會議上與他的同事一起展示這項研究。與 Yelp 一樣,亞馬遜和其他網站使用過濾軟體來檢測可疑評論。此軟體基於與研究人員開發用於編寫虛假評估的機器學習技術類似的技術。一些過濾軟體會跟蹤和分析有關評論者的資訊,例如其計算機的識別網際網路協議 (IP) 地址或他們的釋出頻率。其他防禦程式會檢查文字中重複出現的單詞以及可能從其他網站抄襲的短語。

趙說,研究人員沒有發現任何證據表明目前正在使用人工智慧來操縱線上評論系統——但如果虛假資訊活動家確實轉向人工智慧,他警告說,“這基本上[變成]攻擊者和防禦者之間的軍備競賽,看看誰能開發出更復雜的演算法和更好的人工神經網路來生成或檢測虛假評論。” 因此,趙的團隊現在正在開發可用於檢測虛假評論的對策演算法——類似於他們建立的演算法。建立有效防禦的能力需要了解神經網路的侷限性。例如,如果它的設計目的是專注於建立具有正確語法和詞彙的內容,那麼它更有可能忽略它一遍又一遍地使用相同的單詞和短語的事實。“但是[搜尋此類缺陷]只是一個短期修復,因為更強大的硬體和更大的訓練資料意味著未來的人工智慧模型將能夠捕獲所有這些屬性,並且真正與人類創作的內容無法區分,”趙說。

“眾包水軍”

隨著人工智慧的成熟,假設它將被用來破壞許多人在開啟錢包前參考的線上評論系統並不為過。但就目前而言,一種更常見且基於人為的方法來生成大量虛假評論(例如克林頓的書籍的評論)被稱為“眾包水軍”。一般來說,眾包水軍市場向願意幫助攻擊評論系統、社交媒體和搜尋引擎的人們提供報酬。趙說,這些努力就像一個“邪惡的 Mechanical Turk”。亞馬遜在 2005 年建立了一個名為 Mechanical Turk 的網站,以透過網際網路實現工作的眾包——無論是為一家公司支付隨機網路衝浪者來對新的標誌設計進行權衡,還是為進行社會科學實驗的研究人員提供服務。

在眾包線上評論中,攻擊者在 Mechanical Turk 網站上建立一個專案,並向大量人員提供報酬,讓他們在亞馬遜、Yelp、TripAdvisor 或其他網站上設定帳戶,然後釋出旨在提高或降低產品或服務賺錢前景的評論。“[一家公司]可以向工人支付少量費用,讓他們為競爭對手撰寫負面的線上評論,通常編造糟糕的經歷或服務的故事,”趙說。眾包水軍在中國、印度和美國已成為一個日益嚴重的問題,但通常受限於一個人用於讓其他人做骯髒工作的資金量,他補充說。

自動化虛假新聞

為了預防自動化虛假資訊科技成熟到可以持續生成令人信服的新聞文章的地步,趙和他的同事正在考慮將虛假新聞檢測作為他們未來研究的方向。已經存在可以自動生成論文和科學論文的程式,但仔細的人工閱讀通常會發現它們毫無意義,Filippo Menczer 說,他是印第安納大學資訊與計算學院的資訊學和計算機科學教授。

旨在傳播謊言和虛假資訊的文章目前由人類撰寫,因為它們需要顯得真實才能在網上病毒式傳播,沒有參與芝加哥研究的 Menczer 說。“這是當今的機器無法做到的事情,”他說。“儘管如此,熟練的人工智慧科學家如果將精力投入到這項不太高尚的任務中,可能會建立可信的文章,傳播半真半假的事實並利用人們的恐懼。”

© .