計算機能感知諷刺? 真是這樣嗎

但它們可能很快就能做到。研究人員編寫了一個程式,可以檢測社交媒體和網路上的 “聰明人”

人類本能地就能理解諷刺,通常不需要幫助就能判斷,比如,社交媒體帖子是否帶有嘲諷的語氣。機器在這方面則困難得多,因為它們的程式通常是嚴格地根據看到的內容來閱讀文字和評估影像。那麼,這有什麼大不了的呢?如果計算機科學家能幫助機器更好地理解社交媒體和網際網路上的文字遊戲,那就沒什麼問題了。而且,看起來他們可能正處於即將做到這一點的邊緣。

這正是你所需要的——一個諷刺檢測引擎,可以幫助營銷人員判斷你是在讚揚還是嘲諷他們的產品,並調整他們的資訊以向你推銷更多的東西。然而,推廣者表示,更精明的計算機還可以幫助執法機構區分合法的威脅和那些誇大其詞或拿嚴肅話題開玩笑的威脅,尤其是在使用影像的 Twitter、Instagram 和 Tumblr 帖子中。它甚至可能幫助自動化客戶服務系統弄清楚你感到沮喪,並將你轉接到真人,或者讓政客感知他們的資訊是否引起了選民的共鳴。

都靈大學計算機科學助理教授羅薩諾·斯基法內拉(Rossano Schifanella)和網際網路公司雅虎(Yahoo!)的一組同事正在嘗試教機器理解人類並不總是字面意思。他們研究的新穎之處在於,本月早些時候在科學出版網站 ArXiv 上釋出的這項研究,他們同時檢查影像和文字,以尋找理解含義的線索。“我們觀察到,如果你只看文字,這是不夠的,”斯基法內拉說。“影像提供了至關重要的背景資訊。”


支援科學新聞

如果您喜歡這篇文章,請考慮透過以下方式支援我們屢獲殊榮的新聞報道: 訂閱。透過購買訂閱,您正在幫助確保關於塑造我們當今世界的發現和想法的具有影響力的故事的未來。


斯基法內拉確信諷刺確實很重要,他指出,公司或機構可以使用自動嘲諷檢測來更好地衡量公眾對其產品或形象的看法。例如,如果共和黨總統候選人唐納德·特朗普的競選團隊在正式釋出特朗普-彭斯徽標之前在社交媒體上進行了測試,他們本可以為競選活動省去很多麻煩。《Twitterverse 上一片歡騰》,當競選活動在 7 月份揭示該設計時,一位評論員問我們該如何向我們的孩子解釋具有暗示意味的 T 和 P 的互鎖。

描述我們如何理解諷刺有時很困難,因為它取決於很多共享的知識。例如,一張雪景照片,配上“天氣真好”的標題,可能會被字面理解——除非人們足夠了解發推特或 Instagram 的人,以理解他們更喜歡熱帶海灘度假。

為了解決將這種微妙之處轉換為數字形式的問題,該團隊轉向了人類。斯基法內拉與雅虎(主要資助了這項研究)的研究人員帕洛瑪·德·胡安(Paloma de Juan)喬爾·特特羅(Joel Tetreault)曹亮亮(Liangliang Cao)合作,建立了一個眾包工具,要求來自多個英語國家的人們將社交媒體帖子標記為諷刺或非諷刺。他們首先評估僅限文字的陳述,然後評估帶有影像的陳述。參與者對哪個帖子具有諷刺意味並不總是意見一致,但研究人員發現,在大多數情況下,視覺影像的存在有助於識別反諷的資訊。無論是否存在影像,參與者給出諷刺意味的語言線索包括文字遊戲——使用“我真——的——喜歡這天氣”而不是“我喜歡這天氣”——以及標點符號,尤其是感嘆號(!)。

然後,研究人員編寫了一種計算機演算法,以數學方式表示人類教給他們的內容。這使得機器可以使用該基線資料來檢視新的帖子並判斷它們是否具有諷刺意味。透過組合各種特徵,該機器在 80% 到 89% 的情況下可以識別出諷刺。結果有一些變化,具體取決於平臺(Twitter、Instagram 或 Tumblr)以及用於檢測諷刺的特徵型別。例如,僅使用視覺語義(人類從大型資料庫中對影像進行分類的方式的數學表示)時,準確率降至 61%。

據現在是 Grammarly 研究主管的特特羅說,改進的計算機處理能力和大型社交網路使這種型別的機器學習成為可能,該公司提供線上語法和拼寫檢查程式。更強大的機器可以更好地處理這種基於神經網路的學習,而社交網路則提供資料。特特羅用學習打棒球做類比,他說:“一個孩子看比賽[可能]不知道規則,但最終他看得足夠多,他會發現用力擊球是好事。”

該領域的其他科學家表示,這項工作是幫助計算機理解自然語言的重要一步。“諷刺或反諷需要上下文的概念。它與垃圾郵件甚至[文字]情感分析截然不同,”東北大學計算機與資訊科學學院助理教授 拜倫·華萊士(Byron Wallace) 說,他沒有參與都靈-雅虎專案。“試圖結合一些上下文概念;這就是這件事的酷之處。”

計算機的行為更像人類——這正是我們所需要的。

© .