美國國立衛生研究院於週五(3月30日)宣佈,它將在亞馬遜雲服務上免費託管其“千人基因組計劃”的資料。“千人基因組計劃”是世界上最大的的人類遺傳學資料庫。它的建立目的是作為一個“參考人群”,包括來自世界各地不同種族的人,並且它捕捉了人類在基因上發生變化的所有主要方式。現在它們託管在亞馬遜的伺服器上,科學家們可以更容易、更便宜地獲取和分析“千人基因組計劃”中的資料。
紐約西奈山醫學院基因組學研究所所長埃裡克·沙德特在給 InnovationNewsDaily 的電子郵件中寫道:“[亞馬遜託管] 以更有用的方式向研究人員提供資料,並避免研究人員花費大量資金在本地系統上儲存資料。這絕對很酷。”
儘管名稱如此,該專案實際上擁有來自 1,700 名匿名人士的遺傳資訊,今年還將增加 900 人。該資料庫的主要困難在於它太大了——200 太位元組,這個量可以填滿 30,000 張 DVD。資料庫中的資訊一直可以在 1000genomes.org 上免費獲得,但沙德特解釋說,在亞馬遜託管協議之前,科學家們必須為下載資料的網際網路頻寬和儲存空間付費。無法訪問儲存“千人基因組”資料所需的強大計算機的人根本無法讀取資料。
關於支援科學新聞報道
如果您喜歡這篇文章,請考慮透過以下方式支援我們屢獲殊榮的新聞報道: 訂閱。透過購買訂閱,您將幫助確保未來能夠繼續講述關於塑造我們當今世界的發現和想法的具有影響力的故事。
亞馬遜網路服務還向希望對龐大的遺傳學資料庫進行計算的研究人員提供其超強的計算資源。為此,亞馬遜將收費。《紐約時報》的 Bits 部落格報道稱,該公司向一家制藥客戶收取每小時 1,279 美元來執行非常大的計算。然而,研究人員可能仍然會發現這個價格是值得的。沙德特寫道:“許多人願意承擔這筆費用,因為它遠比購買 500 太位元組的磁碟儲存和一箇中等規模的計算機叢集來在本地分析這些資料便宜得多。”
沙德特寫道,透過使基因組資料對研究人員來說更易於訪問和負擔得起,亞馬遜的交易最終可能有助於科學家根據一個人的基因更可靠地預測疾病。
這項交易是奧巴馬政府一項新計劃的一部分,該計劃將投資 2 億美元,用於研究更好的方法來儲存、分析和查詢“千人基因組”等超大型資料集中的有趣點。
版權所有 2012 InnovationNewsDaily,TechMediaNetwork 公司。保留所有權利。未經授權,不得釋出、廣播、改寫或重新分發此材料。