網際網路情緒年鑑

計算機科學家 Sep Kamvar 探討了研究人員開始利用部落格圈獲取心理學見解的方式

Sep Kamvar 是斯坦福大學計算數學的諮詢教授,也是一位專門從事資料探勘的計算機科學家。他還是與藝術家 Jonathan Harris 共同創立的知名網站 “We Feel Fine” 的聯合創始人,該網站梳理部落格中表達的情緒,然後以鮮豔的色彩群顯示結果。該網站提供了一種探索我們共享虛擬世界的情感輪廓的方式,並吸引了心理學家和其他科學家的興趣。現在,兩人已將該網站最有趣——且視覺上最引人注目——的發現彙編成一本書,《We Feel Fine:人類情感年鑑》。Kamvar 與《Mind Matters》編輯 Gareth Cook 談論了該專案及其對心理學的潛在價值。

COOK:請描述一下 “We Feel Fine” 網站的外觀?

KAMVAR:“We Feel Fine” 網站是一個互動式視覺化工具,展示了一個持續更新的資料庫,其中包含部落格上超過 1300 萬種情緒表達。該網站本身有 6 種不同的動態效果,每種效果都圍繞一系列彩色點構建。 每個彩色點都是一個情感句子的視覺表示。它們根據情感進行著色,當用戶點選一個點時,球會爆炸並顯示句子。


關於支援科學新聞

如果您喜歡這篇文章,請考慮透過以下方式支援我們屢獲殊榮的新聞報道: 訂閱。透過購買訂閱,您正在幫助確保未來能夠繼續釋出關於塑造我們當今世界的發現和思想的具有影響力的報道。


COOK:您能舉個例子嗎?

KAMVAR:開場動態效果是一個有趣的視覺呈現,我們稱之為“瘋狂”。在“瘋狂”中,所有彩色點都在螢幕上瘋狂地湧動,當您點選其中任何一個點時,它會爆炸,顯示其背後的情感句子。另一個動態效果稱為“群體”,其中點會聚在一起形成條形圖,以顯示有關資料集的一些基本統計資訊,例如,最常見的情感是什麼?

COOK:它是如何工作的?

KAMVAR:“We Feel Fine” 的核心是一個爬蟲,它每隔幾分鐘就會掃描部落格圈,並搜尋“I feel”或“I am feeling”這兩個詞。 這些資料來自各種來源,包括 LiveJournal、MySpace、Blogger、Flickr、Twitter 和 Google。

一旦找到 “I feel” 或 “I am feeling” 這兩個詞,系統就會回溯到句子的開頭,並向前延伸到句子的結尾,並將完整的句子儲存在資料庫中。

由於部落格的結構在很大程度上是標準化的,因此爬蟲可以使用部落格的“個人資料”部分來獲取撰寫句子的博主的 demographic 人口統計資訊(年齡、性別、位置),這些資訊與情感一起儲存在資料庫中。

COOK:您什麼時候第一次清楚地意識到這些資料可能具有一定的科學價值?

KAMVAR:一旦我們的資料庫中有了數百萬種情感,我們就意識到這可能是現存最大的情感資料庫。它使我們能夠在幾秒鐘內對數十萬人進行“調查”。我們認為這將是假設生成的一個很好的工具,可以圍繞以下問題提出假設:人們在冬天會感到更悲傷嗎?男人和女人的感受有何不同。

COOK:您能描述一個使用過這些資料的科學專案嗎?

KAMVAR:我們與賓夕法尼亞大學的 Cassie Mogilner 和斯坦福大學的 Jennifer Aaker 進行了一些有趣的合作。Cassie 和 Jennifer 的研究重點是幸福感,在本研究中,我們感興趣的是人們如何定義幸福感。我們使用了 “We Feel Fine” 和其他更傳統的方法來表明,隨著年齡的增長,幸福感的含義會以非常具體的方式發生變化。

COOK:他們發現了什麼?

KAMVAR:在 “We Feel Fine” 資料庫中,與“快樂”這種情感在同一句子中共同出現的情感發生了明顯變化。 對於年輕人來說,與快樂最常共同出現的情感是興奮,而對於老年人來說,與快樂最常共同出現的情感是平靜。

然後,Cassie 領導了許多實驗,我們在這些實驗中使用了不同的方法來以不同的方式研究這種現象。 例如,我們透過為人們播放同一首歌的慢速原聲版本或快速電子版本來影響他們感受興奮或平靜。 然後,我們給他們做了一個調查,其中一個問題要求他們評價自己的幸福感。
受到平靜感影響的老年人比受到興奮感影響的老年人更快樂,而受到興奮感影響的年輕人比受到平靜感影響的年輕人更快樂。

COOK:還有誰聯絡過您,希望使用這些資料進行科學研究?

KAMVAR:Peter Dodds 和 Chris Danforth 是佛蒙特大學應用數學系的兩位教授。 他們在幾年前與我們聯絡,希望使用該資料集,最近在《幸福研究雜誌》上發表了一篇論文,題為《衡量大規模書面表達的幸福感》。

COOK:他們發現了什麼?

KAMVAR:Christopher 和 Peter 從一個名為“英語詞彙情感規範 (ANEW)”的資料庫中提取了單詞的標準化效價得分。 他們使用這些得分來為 “We Feel Fine” 資料庫中的每個句子分配一個幸福感得分。 他們使用這個得分來確定資料中的趨勢,例如,邁克爾·傑克遜的去世是過去幾年部落格圈中最悲傷的日子之一。

COOK:請您簡單介紹一下這本書。您認為書中有什麼內容可能會引起研究人員的興趣並進行跟進嗎?

KAMVAR:這本書講述了我們在資料集中發現的兩種型別的故事,我們稱之為微觀故事和宏觀故事。 微觀故事是關於個人及其情感的個別故事。 宏觀故事是大型統計資料(例如,幸福感的性別構成,或與興奮感共同出現的最常見情感)。

宏觀故事都是進一步研究的非常有趣的種子。 例如,我們發現感恩和幸福之間存在很強的聯絡,另一方面,興奮和焦慮之間也存在很強的聯絡。 或者我們發現,人們隨著年齡的增長會變得更快樂,並且在青少年時期之後,幸福感會大幅上升。

我們記錄了人們在不同天氣條件、圍繞不同主題(如人際關係或家庭)、不同年齡段、不同地理位置等方面的各種情感差異。 所有這些都為進一步研究提供了素材。

COOK:這似乎是一種新的心理學研究方法。您認為這種方法的潛在優勢和劣勢是什麼?

KAMVAR:規模和成本可能是該方法論的兩個最大優勢。使用這樣的資料集,可以在不到一分鐘的時間內對 200 萬人進行實驗。缺點是確實存在人口偏差,並且只能進行某些型別的實驗。例如,我們無法像在實驗室中那樣,進行改變環境條件、測量情緒反應並將其與對照條件進行比較的實驗。可以使用 “We Feel Fine” 進行的實驗型別主要是大規模相關性實驗。

我認為計算心理學的方法將成為傳統心理學方法的有益補充。 它們擅長快速生成假設,而這些假設可以使用實驗心理學中更成熟的方法進行檢驗。

COOK:您是否驚訝地發現自己正在擔任兼職大眾心理學家?

KAMVAR:我是一名受過訓練的計算機科學家,白天我在斯坦福大學教書和做研究。 我之所以涉足這個領域,是因為我認為網路上最有趣的轉變之一不是技術轉變,而是隨之而來的文化轉變,人們現在可以放心地在網上分享自己的整個生活。 這種文化轉變為科學家、藝術家和技術專家帶來了許多機會。

回顧起來,我的工作朝著現在的方向發展確實令人驚訝——但這真是一段非常有趣的旅程!

您是科學家嗎?您最近是否讀過一篇您想撰寫的同行評審論文?那麼請聯絡《Mind Matters》的聯合編輯 Gareth Cook,他是一位在《波士頓環球報》獲得 普利策獎 的記者,他在那裡編輯 週日觀點 版塊。您可以透過 garethideas AT gmail.com 與他聯絡

 

© .