書評:《資料新聞手冊》

加入我們的科學愛好者社群!

本文發表於《大眾科學》的前部落格網路,反映了作者的觀點,不一定反映《大眾科學》的觀點


資料新聞手冊

編輯: JonathanGray, LucyChambers, LilianaBounegru

出版社(紙質版): O'Reilly Media


關於支援科學新聞報道

如果您喜歡這篇文章,請考慮透過以下方式支援我們屢獲殊榮的新聞報道 訂閱。透過購買訂閱,您正在幫助確保有關塑造我們當今世界的發現和想法的具有影響力的故事的未來。


釋出時間: 2012年5月

頁數: 120

或可在以下網址免費下載:http://datajournalismhandbook.org

在這篇部落格文章中,《Significance》雜誌的編輯 Julian Champkin 評論了新發布的《資料新聞手冊》,該雜誌是英國皇家統計學會和美國統計協會的科普出版物。他更進一步,提醒我們新聞界正在經歷一場革命。Champkin 認為,為了參與這場革命,年輕的和職業生涯早期的科學作家不應迴避新的資料密集型來源或新的調查工具。相反,他認為他們應該探索和試驗資料,從而產生強大、相關和卓越的科學新聞。

--

曾幾何時,新聞工作是這樣的。一位記者前往遙遠的現場。他將文字電話告知辦公室。對於頭版頭條新聞,一千字已經很多了——用今天的資訊理論語言來說,稱之為 8000 位元或 1 千位元組的資訊內容。在辦公室裡,一位謄寫員將這些文字打字到壓縮木漿上。一位副編輯會剪下它們,以便它們適合可用空間。然後,鉛銻被熔化,通常在同一棟建築的底層,並擠壓成微小的字母形狀的模具,這些模具由技術非常嫻熟的工匠在鑄鐵機器上操作,這些工匠(在英國)通常在罷工,大約在下午三點,巨大的印刷機開始隆隆作響,震動整棟建築,因為第二天的報紙開始印刷。史前史?那是我在倫敦艦隊街開始工作時的情況,大約 25 年前。

現在,世界比以前更復雜,也比以前更數字化。熱金屬讓位於電子文字處理,沒有人真正哀悼它的逝去。一場同樣巨大的革命正在發生。

過去一年最大的新聞故事之一是維基解密釋出的美國外交電報的內容和影響。單一來源,不幸的布拉德利·曼寧,下載了一個數據庫——稱之為資訊洪流似乎是輕描淡寫——的資訊。涉及 251,287 份檔案,總計 2.61 億字;這是一個驚人的數字。大約是 1 吉位元組的夏農資訊內容。

假設作為一名記者,你面對的是那座虛擬檔案山。你到底要用它做什麼?99.99% 的檔案很可能像溝渠水一樣平淡乏味。你如何找到萬分之一——仍然是一個很大的數字——可以成為新聞的檔案? 誰能理解這一切?讓事情變得有意義是記者的工作。但當然,這是分析師、資訊處理員、資料探勘者、統計學家、IT 專家、程式設計師、程式碼編寫員的工作,對嗎? 實際上,所有這些都是新記者或新聞團隊需要的技能。

新聞業,如果你沒有注意到,正在發生變化。它的一些方面實際上正在變得更好。這些方面與計算能力和數字有關。即使在幾年前,也很少有記者,即使在像 BBC 這樣信譽良好的報紙和廣播公司中,知道如何處理任何涉及基本計算能力的故事,更不用說資料庫了。現在有一小群但不斷壯大的記者可以處理數字。更多的人開始意識到,僅僅因為官員或新聞稿引用了一些數字,這些數字可能並不意味著官員或新聞稿聲稱的意思——它們可能是偽造的或片面的或斷章取義的,它們可能是將不相似的事物進行比較,等等。還有另一小群但不斷壯大的記者——漢斯·羅斯林、大衛·麥坎德萊斯就是其中之一——他們意識到隱藏在龐大的數字資料庫中是關於世界的精彩故事——有趣、重要和令人興奮的人類故事,它們只是在等待從數字中提取出來。這需要分析來揭示這些故事;這需要巧妙的方式來解釋這些故事:新的繪製圖表、視覺化資料的方式,首先是這樣,但這些故事就在那裡,解釋它們的方式也在那裡。

所有這些都稱為資料新聞。

資料新聞是一個如此全新的領域,以至於我沒有聽說過在新聞課程中教授它。一些先驅者自己摸索出瞭如何去做,並滲透到新聞編輯室和廣播辦公室去實踐它;隨著數字化和公眾訪問資料,它一直在悄然穩步增長。最好的報紙和最好的廣播公司正在這樣做,並且將越來越多地這樣做。本書是它的第一本指南。

它源於 2011 年底舉行的一次會議。它由該型別的先驅編輯,並由 70 多位實踐者撰稿,他們來自日本和芬蘭、奈及利亞和美國等不同的地方,並且為《紐約時報》、《Zeit Online》、BBC 和《衛報》等新聞媒體工作。在遊戲的這個階段,這本手冊只不過是對可能性的概述。但這本身就非常有價值。它確實為那些想加入該領域的人提供了實用指南。

那麼什麼是資料新聞?它與另一種新聞有何不同? 這本書給出了幾個定義,來自幾位不同的貢獻者。“也許當您將傳統的‘新聞嗅覺’和講述引人入勝的故事的能力,與現在可用的數字資訊的巨大規模和範圍結合起來時,就會開啟新的可能性”,這是一個定義。

“它關於聯絡”,史蒂夫·多伊格在 1993 年親眼目睹了這一點。他加入了來自安德魯颶風的兩個不同的資料集:一個繪製了颶風造成的破壞程度,另一個顯示了風速。這使他能夠查明建築規範薄弱和不良建築 практики導致災難影響的區域。他因這個故事獲得了普利策獎。例子還在繼續:“今天,新聞報道像潮水般湧來,來自多個來源、目擊者、部落格,發生的事情透過龐大的社交聯絡網路進行過濾,被排名、評論,而且通常被忽略。這就是資料新聞如此重要的原因。收集、過濾和視覺化眼睛看不到的東西具有越來越大的價值。”

在一個受到圍攻的行業(如果新聞業是這樣的話)中,需要新的工作方式來實現新的目標。印刷品的未來存在疑問。數字顯然是前進的方向;但數字新聞不僅僅是為了網路。它的故事出現在——有時主導著——傳統媒體和傳統新聞議程。

他們說,新聞業已經民主化了。在一個任何人都可以寫部落格的世界裡,沒有對準確性或真相的過濾,他們的部落格可以立即被閱讀並被數百萬人視為事實,有人聲稱現在每個人都是記者。

但是資料新聞為這項工作恢復了技能——或者更確切地說是技能。因為它需要技能來分析現在例行可用的大量資料,以找到隱藏在其中的故事。當您完成這項工作後,它需要技巧來向讀者——或觀眾或聽眾講述這個故事:印刷品、音訊、影片、圖表、圖形、視覺化(互動式或非互動式)都可以參與其中。再舉一個書中引用的例子

“2010 年,《拉斯維加斯太陽報》刊登了關於醫院護理的 Do No Harm 系列報道。他們分析了超過 290 萬份醫院賬單記錄,揭示了超過 3,600 起可預防的傷害、感染和手術錯誤。他們透過公共記錄請求獲得了資料,並確定了 300 多起患者因本可以預防的錯誤而死亡的案例。他們的簡報包含,除其他要素外,一個 互動式 圖形,允許讀者按醫院檢視手術傷害發生頻率高於預期的情況;一個 地圖,其中包含一個時間線,顯示感染在醫院之間傳播的情況;以及 另一個 互動式 圖形,允許使用者按可預防的傷害或按醫院對資料進行排序,以檢視人們在哪裡受傷。《內華達州》立法機構對此做出了回應,通過了 六項 關於 醫療保健透明度的立法。”

顯然,單一媒介報道的日子正在消失;正如本網站所見證的那樣。《大眾科學》最初是一本印刷雜誌;這個網站現在是其運營不可或缺的一部分。

因此,報道的媒介正在發生變化。資訊或資料——你可以稱之為任何一個——已經改變了。以前,資訊不多:明星記者是找到額外細節以提供故事的人。現在,問題可以歸結為資訊過載:明星記者是那個可以無視毫無意義的資訊,並將所有其餘的大量資訊聯絡起來以找到故事的人。正如本書所說,新聞業現在是關於處理的。其中包括分析和呈現。

有一件事沒有改變:新聞的定義。它是在及時且清晰地以吸引人的方式找出正在發生的事情,並告訴人們正在發生的事情。過去的老戰地記者;犯罪記者跑到電話亭打電話來發布他的故事(他們真的說過“Hold the Front page”嗎?); 敲門的記者以及近年貶值的手機駭客——他們都在試圖釋出故事。資料記者也有同樣的目標。來源不同,方法不同,但其最佳狀態下的目標是相同的。

本書是第一本。將來會有更多類似的書籍。但請閱讀這本,因為它現在正在發生。

Julian Champkin

編輯

Significance

© .