揭示網路陰暗角落

網路犯罪研究員吉安盧卡·斯特林吉尼解釋了他如何研究地下網路 4chan 上的仇恨言論和虛假新聞

吉安盧卡·斯特林吉尼每天都在網際網路上一些陰暗的角落度過。作為倫敦大學學院的網路犯罪研究員,他研究過勒索軟體、線上約會詐騙和洗錢。今年 5 月,他的團隊發表了兩篇論文,探討仇恨言論和虛假新聞如何在網際網路上傳播,重點關注臭名昭著但受歡迎的 4chan 留言板。

在一篇會議論文集中,研究人員分析了 4chan 的 /pol/(“政治不正確”)版塊上的 800 萬條帖子,並追蹤了其使用者如何透過釋出煽動性評論“攻擊”其他網站1。在一篇釋出在 arXiv 伺服器上的預印本中2,他們追蹤了 4chan 版塊與其他線上社群(如 Twitter 和 Reddit)之間的互動,以檢查網站如何分享來自已知虛假新聞網站或團隊所謂的“另類”新聞來源(如 RT(前身為今日俄羅斯))的連結。斯特林吉尼與《自然》雜誌談論了他的研究。

是什麼讓您決定研究 4chan?


關於支援科學新聞報道

如果您喜歡這篇文章,請考慮透過以下方式支援我們屢獲殊榮的新聞報道 訂閱。透過購買訂閱,您正在幫助確保未來能夠講述關於塑造我們當今世界的發現和思想的具有影響力的故事。


沒有人真正關注這些社群,但有很多傳聞證據表明,它們透過傳播某些型別的新聞對現實世界產生影響。因此,我們想了解這是否屬實,以及它們在多大程度上真正影響了網路的其他部分。

我們首先只關注 4chan。我們選擇了 /pol/,即政治不正確的版塊,這是大多數另類右翼使用者聚集和討論他們世界觀的地方。我們首先嚐試瞭解這些人群和這項服務的動態。4chan 與大多數其他線上網站非常不同,因為它既是匿名的,而且其帖子也是短暫的:它們會在短時間內被刪除。

您是如何開展這項研究的?

我們應用了多種技術。我們使用了一個包含仇恨詞語的資料庫來了解最突出的仇恨詞語是什麼,仇恨言論的發生率等等。

/pol/ 帖子中包含仇恨言論的百分比為 12%,而 Twitter 上為 2%。可以說,它相對較高。這並不完美,因為我們使用了基於關鍵詞的列表,因此我們實際上可能會遺漏一些不屬於這些預編譯類別的仇恨言論。在瞭解了這是如何運作的之後,我們開始研究 4chan,特別是 /pol/,如何影響網路的其他部分。

這就是您的論文1關於從 4chan 到其他網站的“攻擊”的主題嗎?這是您已經認為正在發生的事情嗎?

是的。到目前為止,研究界成員所做工作的侷限性在於他們孤立地看待這些服務。在瞭解攻擊如何在 Twitter、YouTube、Facebook 上發生方面做了很多工作。但是,關於這些攻擊的來源或其原因的工作並不多。

由於 /pol/ 是這樣一個充滿仇恨的平臺,我們憑經驗看到,人們經常會發布指向與他們的世界觀背道而馳的 YouTube 影片的超連結。它們可能是倡導性別平等、女權主義、寬容的影片。然後他們會呼籲成員去攻擊這些人。

因此,我們會在 4chan 上收到一個訊號,表明已釋出此連結,並且人們正在談論它。然後我們可以看看是否可以觀察到對該影片的 YouTube 評論產生影響。我們基本上應用了無線電訊號中使用的訊號處理技術,以瞭解這兩個訊號的同步程度。YouTube 上的評論在 4chan 帖子的生命週期內激增,並且這些評論中的仇恨言論數量之間存在很強的相關性。這為我們提供了證據,證明這些攻擊確實正在發生,這將為未來的工作奠定基礎。現在的問題是,“那又怎樣?”我們該怎麼辦?

可以做些什麼嗎?

這為我們提供了一個機會來識別有被攻擊風險的影片。如果 YouTube 僅使用自己的平臺來識別攻擊,它基本上可以在攻擊發生時識別它們。但是,如果它也關注其他內容——一個指標,表明有人在不同的平臺上以仇恨的方式談論這個影片——也許它應該開始更仔細地監控評論。或者,鑑於 4chan 上的這些帖子壽命很短,YouTube 應該在該影片的生命週期內停用評論。

在您關於 arXiv 的論文中2,您表明 4chan 版塊可以影響其他新聞來源的分享。

在這裡,我們研究了一個事件一旦在一個網際網路平臺(例如,指向一篇新聞的超連結)上發生,同一事件是否會在另一個平臺上發生。這將是在 /pol/ 上釋出的完全相同的新聞連結,然後它會傳播到 Twitter,比方說。我們使用一種稱為“霍克斯過程建模”的數學技術,我們可以合理地確信,特定事件實際上與先前發生的事件有關。

因此,我們進行了這項研究,這是首次追蹤服務之間連結的研究。這裡的想法是,在研究虛假和另類新聞方面已經做了相當多的工作。例如,人們關注另類新聞如何在 Twitter 上傳播;人們如何轉發它。但是這些服務並非生活在真空中——它們是更廣闊網路的一部分。這些另類新聞故事被髮布的地方,他們談論它們,他們編造這些瘋狂的陰謀論以及所有這些:我們想了解這是否真的對更廣泛的網路產生影響。

我們發現 Twitter 對其他服務的影響很大,這很有道理。/pol/ 和 reddit 的使用者會在 Twitter 上看到新聞,然後他們會將這些故事發布到自己的版塊上並談論它們。但我們也發現相反的情況也會發生。舉個例子,我們發現 worldnews(reddit 上的主要新聞版塊之一)上大約 12% 的另類新聞來自 4chan。同一版塊上超過 16% 的另類新聞來自 The_Donald [美國總統支持者使用的 Reddit 的特定部分]。

閱讀所有這些帖子令人不愉快嗎?

這絕對是一個充滿仇恨的地方,而且非常令人不愉快。看到它並不舒服。我和我的同事們有一些最佳實踐:我們建議與我們合作的任何人不要連續在網站上花費太多時間,並且要休息一下。我們有一個內部笑話,時不時地去看一些貓的照片。

本次採訪為了篇幅和清晰度進行了編輯。

本文經許可轉載,並於2017 年 6 月 9 日首次釋出

© .