人們通常會與和自己相似的人共度時光,這使得資料科學家很容易透過分析他們的線上和現實世界的社交網路來推斷個人的態度或性格屬性。研究人員將這種尋找志趣相投的人的傾向稱為“同質性”。斯坦福大學管理科學與工程研究員約翰·烏甘德說:“想想那句老話‘物以類聚,人以群分’,他研究的就是這個課題。”
但令人驚訝的是,烏甘德和他的研究生克里斯汀·M·阿爾滕伯格發現,有些人總是被那些具有某些不同屬性的人所吸引。研究人員將這種現象引入的變異稱為“異質性”。科學家們之前認為,異質性會使基於朋友網路得出關於人的結論變得更加困難。但烏甘德和阿爾滕伯格的研究表明,異質性產生了一種效應,即一個人的朋友的朋友在某些方面與他們相似,而直接的朋友可能並非如此。這可能使科學家比預期更容易推斷出可能仍然隱藏的個人特徵——這也是資料探勘者追蹤個人資訊的又一種方式。
在3月份發表在《自然-人類行為》雜誌上的一項線上研究中,烏甘德和阿爾滕伯格分析了三種不同型別的網路:一個線上社交網路、一個政治部落格網路和一個經過充分研究的恐怖分子通訊網路。《大眾科學》與烏甘德談論了這項研究及其對個人隱私的影響。以下是經過編輯的節選。
關於支援科學新聞業
如果您喜歡這篇文章,請考慮透過以下方式支援我們屢獲殊榮的新聞業 訂閱。透過購買訂閱,您正在幫助確保未來能夠繼續報道關於發現和塑造我們當今世界的想法的具有影響力的故事。
“異性相吸”的想法是否引導您研究異質性?
引導我們進行這個專案的是一個基本的令人困惑的事實,即線上社交網路中幾乎不存在性別同質性或持續的性別聚類。存在大量的年齡聚類。幾乎沒有性別同質性這一事實對資訊傳播和資料隱私產生了影響。事實證明,您仍然可以透過利用網路中的變異性,根據朋友的朋友的性別來預測人們的性別——這是我們花費大部分研究時間試圖拆解和解釋的反直覺起點。
在Facebook上擁有政治觀點不同的朋友是異質性的一個例子嗎?
就政治傾向而言,你傾向於與和你相似的人交往。也就是說,在博主網路中,當涉及到政治傾向時,我們確實看到了統計上顯著的朋友差異性。有些人是跨界人士:他們運營自由派部落格,但傾向於連結到保守派部落格,反之亦然。
您是否看到在隱私擔憂的背景下,社交網路的研究方式發生了變化?
我將自己視為一個試圖發出警報並關注所有可能預測個人事物的方式的人。最近,公眾就保護這些線上社交網路中連線所包含的資訊的重要性進行了健康的對話。[披露:烏甘德在2010年至2014年期間隸屬於Facebook資料科學部門。]
另一方面,根據人們在社交網路中的位置更好地瞭解他們是有好處的。許多社會科學研究都集中在識別真實的因果關係並排除混雜因素。我感興趣的是瞭解當我們可能沒有人口統計資料,但確實擁有這種非常豐富的社會關係網路時,我們可以在多大程度上描述個人。
您是否擔心您的研究可能被用於不正當目的?
總是擔心。當一個人構建工具時,他對這些工具的使用方式負有責任。我們研究的主要演算法自2009年以來就已在科學文獻中出現。之前人們認為,如果網路中存在朋友之間的相似性,這種方法可以有效地預測個人的態度或屬性。但我們正在表明,這種方法的有效性不需要同質性或相似性。
