邪惡墨跡:機器人模仿者開設部落格釋出來自未來的垃圾郵件

垃圾郵件傳送者使用真實網路作者的名字建立虛假部落格的問題日益嚴重


關於支援科學新聞報道

如果您喜歡這篇文章,請考慮透過以下方式支援我們屢獲殊榮的新聞報道 訂閱。透過購買訂閱,您將幫助確保未來能夠繼續看到關於塑造我們當今世界的發現和思想的具有影響力的報道。


我承認我曾在網上搜索過我的名字,這是一次自我搜索之旅,想看看新興搜尋引擎必應與衛冕冠軍谷歌相比如何。那時我發現了我的邪惡雙胞胎。

顯然,一個網際網路機器人竊取了我的身份,並用它建立了一個部落格,以我的名義釋出垃圾郵件——有時,這些條目據說是從未來寄來的。快,當您需要菲利普·K·迪克時,他在哪裡?

這是我據稱來自未來的帖子之一,它於 8 月下旬出現在免費網站託管商 Tripod.com 上(該網站此後已被撤下)

邪惡墨跡 2009年11月23日 作者:查爾斯·Q·崔 如果你不是學徒。很少使用正面或幾乎不使用。維修店是能夠進行檢查的商店。

Technorati,第一個部落格搜尋引擎的出版副總裁大衛·懷特說,像這樣的垃圾郵件部落格從 2005 年底開始成為一個問題,“當時很明顯它們的數量超過了真實部落格的數量”。 Technorati 每小時大約收到 200 萬次 ping——部落格傳送訊息以便搜尋引擎可以瞭解新發布的帖子——其中 90% 以上來自這些垃圾郵件部落格,或“splog”。 (如此高的比率是垃圾郵件部落格更新頻率高於真實部落格的結果。媒體服務公司 Universal McCann 估計,全球目前總共存在 1.84 億個部落格。)

瞄準部落格
Splog 通常由市售軟體自動建立。根據這些部落格之間的某些相似之處判斷,很大一部分可能由少數活躍的垃圾郵件傳送者建立和維護,“可能只有幾十個”,馬里蘭大學巴爾的摩縣分校卡頓斯維爾的計算機科學家 蒂姆·費寧 解釋道。

與大多數垃圾郵件一樣,這些部落格背後的目的是貪婪。垃圾郵件傳送者經常建立這些 splog,並在其中填充廣告,希望一些倒黴的使用者點選它們並將收入傳送給垃圾郵件傳送者。垃圾郵件部落格還可以透過連結到其他頁面來提高它們在搜尋引擎結果中的突出程度,垃圾郵件傳送者可以出售這項服務。

費寧說:“將內容釋出到網路上最快的方式之一是透過部落格,因此垃圾郵件瞄準部落格並不奇怪。“如果我在部落格上釋出帖子,它會在大約五分鐘內被索引到谷歌的部落格搜尋中,然後在 10 分鐘後被推送到谷歌的常規結果中。”

splog 的高昂成本
因此,垃圾郵件部落格會浪費寶貴的磁碟空間和頻寬,並透過降低搜尋引擎的結果來損害搜尋引擎。如果使用者點選這些部落格上的惡意連結,也可能會竊取資料或利用計算機上的漏洞。市場分析公司 Ferris Research of San Francisco 估計,今年垃圾郵件將給全球造成 1300 億美元的生產力損失和反垃圾郵件措施費用,其中 420 億美元來自美國。

至於為什麼垃圾郵件部落格通常充斥著胡言亂語,“如果頁面完全從其他地方複製內容,搜尋引擎會在排名方面對其進行懲罰,”懷特解釋道。“因此,垃圾郵件傳送者可能透過隨機組合單詞和術語來使垃圾郵件部落格文字獨一無二,從而避免這個問題。”

費寧補充說,現在,“垃圾郵件部落格經常從網路上抓取文字。編寫一個程式來抄襲其他部落格真的很容易,這些部落格經常將其內容作為 RSS 源提供。”費寧和懷特都無法解釋為什麼有些帖子似乎來自未來,但費寧猜測:“我認為很多垃圾郵件部落格都是由不太稱職的人設定的。”

所以一個機器人可能只是隨機選擇了我的名字作為部落格?這真是鬆了一口氣。

“實際上,我很確定這是故意的,”懷特解釋說。“我們確實收到博主發現另一個部落格冒充他們的報告。他們從合法網站竊取內容,以使自己的網站與搜尋更相關。”

好吧,我的妄想症到此為止。

“這可能不會威脅到您的職業生涯,”費寧安慰道。“您應該更擔心您的材料被他人濫用以謀取利益,並且可能與您不想關聯的事物相關聯。我們的研究部落格被注入了程式碼而遭到破壞——搜尋引擎看到的版本,但人類沒有看到的版本,都與同性戀性產品和服務相關聯。”

進行防禦
具有諷刺意味的是,當涉及到打擊垃圾郵件機器人時,答案可能在於更多的機器人——更具體地說,是人工智慧機器人。“如今識別這些部落格的主要技術是機器學習,一種人工智慧技術,”費寧解釋說。“訣竅在於識別這些機器人部落格的指紋——它們使用的詞語、它們的更新模式、它們託管的廣告。”

當然,垃圾郵件傳送者不斷改進他們的技術,“因此您的反垃圾郵件程式可能會落後,”費寧補充道。為了確保他們的機器人保持領先地位,費寧和他的同事設計了一種策略,讓多個機器人檢查彼此的結果,以確保它們跟上垃圾郵件的步伐。

“垃圾郵件傳送者和反垃圾郵件者之間可能永遠會有一場軍備競賽,”費寧說。這場戰鬥可能會持續下去。“我只是把垃圾郵件看作是人性,”他指出。“總會有些人為了自私的目的而試圖愚弄他人。”

的確是人性——或者,也許是非人性。

© .