首位白宮首席資料官探討其首要任務

DJ Patil 談論如何在保護資料免受濫用的同時,更好地利用公共和私人資訊


關於支援科學新聞報道

如果您喜歡這篇文章,請考慮透過以下方式支援我們屢獲殊榮的新聞報道: 訂閱。透過購買訂閱,您正在幫助確保有關塑造我們當今世界的發現和思想的具有影響力的故事的未來。


資料科學對於華盛頓特區來說並非完全新鮮事物,對於最近被任命為美國首位首席資料科學家的 DJ Patil 來說亦是如此。奧巴馬總統政府在近六年前啟動了 Data.gov,並要求所有機構至少在公眾可訪問的網站上釋出三個“高價值”資料集。現在,Patil 的工作至少部分是確保政府繼續在各個領域釋出資料,同時確保資訊不被濫用。
 
Patil 在科技公司和風險投資公司 Greylock Partners 擔任資料專家多年後重返華盛頓的首要任務是白宮的精準醫療計劃。奧巴馬總統於一月份啟動了這項公共衛生計劃,並在其 2016 年預算中投資 2.15 億美元,以幫助根據考慮到個體患者基因、環境和生活方式差異的資訊來預防和治療疾病。該計劃加速開發新的癌症治療方法的能力不僅取決於科學家向該專案貢獻他們最新的研究資料集,還取決於患者自願提供他們自己的個人健康資訊。Patil 將在確定研究人員、醫療機構和患者如何在不犧牲隱私的情況下共享資料方面發揮不可或缺的作用。
 
Patil 還被任命為白宮科學和技術政策辦公室的資料政策副首席技術官,大約二十年前,他作為馬里蘭大學助理研究科學家首次來到環城公路地區。作為該校的博士生和教員,他使用美國國家海洋和大氣管理局釋出的開放資料集來幫助改進數值天氣預報。Patil 還曾在國防部短暫指導社交網路分析工作,以瞭解對美國利益的新興威脅的性質。大眾科學與 Patil 談論了他的新工作。
 
[以下是經過編輯的採訪記錄。]
 
您作為國家首位首席資料科學家的使命是什麼?
[奧巴馬總統]在他的整個執政期間一直倡導資料科學——他實際上是這個國家的首席資料科學家。他是第一位使用分析儀表板來跟蹤 [資訊科技] 專案的總統,並且他在 2013 年簽署了一項行政命令,呼籲使政府資訊公開且機器可讀。Data.gov 網站 [該網站使聯邦、州和地方資料公開可用] 也是在本屆總統的關注下啟動的。
 
您的行動指令與奧巴馬政府已經啟動的資料科學倡議(例如 Data.gov)有何不同?
Data.gov 只是其中一個組成部分。我們看到了我們的三個優先事項。目前我清單的首要任務是精準醫療計劃。科學使我們能夠解鎖人類基因組。現在,我們希望將其與資料科學的力量相結合,資料科學使用機器學習等新技術以及現在關於個體患者的大量可用資料(無論是透過他們的手機還是他們環境中的其他感測器)。挑戰在於將這些結合在一起,從而提出思考醫療保健和醫療治療的新方法。
 
您的第二個優先事項是什麼?
我的第二個優先事項是開放更多資料,並使其可供人們 [政府和公眾] 構建研究、移動應用程式和基於該資訊的視覺化生態系統。構建在開放資料之上的經典示例之一是國家氣象局所做的事情。他們每天建立 21 太位元組的資料,並利用大量的科學和技術,以一種像開啟手機上的應用程式一樣容易訪問的方式向公眾提供這些資料的子集。這極大地影響了您的生活,無論您是計劃日常活動還是檢視航班狀態——世界都圍繞著它運轉。
 
您的前三項優先事項清單的最後一部分是什麼?
[中斷]
第三個主要優先事項是將更多的資料能力注入到政府的各個機構中。我們看到資料科學家和首席資料官在美國國立衛生研究院以及 [衛生與公眾服務部] 衛生與公眾服務部內部不斷湧現。商務部上週宣佈了其首位首席資料官 [伊恩·卡林]。我們必須決定如何利用我們在政府各部門的資料科學和統計小組中看到的最佳實踐來開發新服務。
 
這些新服務是僅供政府使用,還是也向公眾開放?
兩者都有。這些服務對科學家和公民都很有價值,因為我們看到人們開始關注各種因素如何影響他們的健康。例如,人們開始考慮氣候資料及其對當地的影響——對他們的過敏或當地萊姆病的威脅——隨著氣候隨時間推移而變化。這些是來自截然不同的組織的資料集,但當它們結合在一起時,可以提供非常強大的資訊。將資料結合在一起以提供新服務的另一個超級有力的例子是在應對災難時。一個地方政府部門可能能夠繪製出資源的位置,例如燃料站,另一個組織(例如 [聯邦緊急事務管理局])可以將其與有關天氣或洪泛區的資料相結合,以改善其對某種危機的響應。
 
鑑於過去幾年對政府資料收集提出的擔憂,您計劃如何確保政府既保護又尊重公眾的隱私?
我們使命宣言中的關鍵詞是我們如何負責任地為所有人釋放資料的力量。這意味著以合乎道德的方式並考慮到隱私來使用和提供資料。[例如] 最近釋出的白宮大資料報告中提出的關鍵舉措之一是解決我們如何看待學生資料的問題。我們如何確保資料不僅僅被用於營銷目的?另一個說明負責任地使用資料的倡議與去年的 [聯邦貿易委員會] 關於資料經紀人的報告有關,並跟進其關於該行業應更加透明和對消費者友好的呼籲。具體到精準醫療計劃,總統多次宣告這將是一個參與者優先的專案,並且參與者——無論是在學術界、工業界還是政府部門——在確定系統如何運作時都將平等地坐在談判桌旁。
 
您能否更詳細地說明您所說的負責任地使用資料是什麼意思?
負責任地使用資料的一個重要部分是弄清楚適當的透明度級別,以便人們瞭解他們的資料是如何被利用的。以精準醫療為例,我們有一個自願系統。貢獻資料的人應該知道他們的資料被用來做什麼,以及如果他們想將資料從系統中移除意味著什麼。
 
在資料科學領域,到目前為止,您最自豪的成就是什麼?
我最自豪的是我上次在學術界和政府部門所做的工作。在學術界,它是:我們如何以新的方式思考天氣預報,並表明它不像人們想象的那麼混亂?如果有一個數據專案影響到每個人的生活,那就是天氣,有時會造成極其可怕的後果。即使對改進天氣預報產生很小的影響,也能惠及如此多的人。在網際網路規模上,如果我們能夠接觸到一百萬、一千萬、一億人,如果運氣好的話,我們會感覺非常棒。從事天氣系統工作意味著我得以影響數十億人的一生。
 
上次我在政府部門時,我們開始了一個名為 伊拉克虛擬科學圖書館 的專案,該專案成為伊拉克高等教育系統的支柱之一。它在四五年前被交還給伊拉克政府。有機會從事這樣的工作,並親眼目睹它對人們生活產生的直接影響,以及它如何幫助他們構建生活,這種回報甚至超過了我能夠在其他地方建立的最好的東西。我感到非常幸運能夠有機會再次做這樣的事情。有時人們會忘記,最大規模的問題存在於公共服務領域,如果您擁有技術技能和機會將其應用於這個領域的問題,那麼沒有什麼比這更令人欣慰的了。

© .