來自 Nature 雜誌
三位研究人員已將一本書的草稿編碼到 DNA 中。這部 5.27 兆位的鉅著包含 53,246 個單詞、11 個 JPG 影像檔案和一個 JavaScript 程式,使其成為以這種方式儲存的最大的非生物資料。
DNA 具有儲存海量資訊的潛力。理論上,每個核苷酸(DNA 鏈的單個鹼基單元)可以包含兩位資料,因此每克雙鏈分子可以儲存 455 艾位元組的資料(1 艾位元組是 1018 位元組)。這種高密度儲存超過了無機資料儲存裝置,例如快閃記憶體、硬碟,甚至基於量子計算方法的儲存。
關於支援科學新聞報道
如果您喜歡這篇文章,請考慮透過以下方式支援我們屢獲殊榮的新聞報道: 訂閱。透過購買訂閱,您正在幫助確保有關塑造我們當今世界的發現和想法的具有影響力的故事的未來。
這本書恰如其分地是一篇關於合成生物學的論文,由波士頓馬薩諸塞州 Wyss 生物啟發工程研究所的遺傳學家 George Church 和 Sriram Kosuri,以及馬里蘭州巴爾的摩約翰·霍普金斯大學的生物醫學工程師袁杲編碼而成。他們在本週的《科學》1 雜誌上報告了他們的工作。
這標誌著與之前的專案相比取得了重大進展——之前的最大專案編碼的資料量還不到其六百分之一——但有機快閃記憶體驅動器仍需多年才能問世。該方法不適用於日常使用有很多原因。例如,目前儲存和檢索資訊都需要數天的實驗室工作,要麼從頭合成 DNA,要麼對其進行測序以讀取資料。
在加利福尼亞州聖何塞的 IBM-斯坦福自旋電子科學與應用中心開發高密度無機儲存介質的 Stuart Parkin 表示,這項工作說明了非常規方法的潛力。“你可以說物理科學已經耗盡了概念的遊樂場,我們現在需要超越那個世界,”他說。“生物世界與物理世界的這種結合將在未來十年內帶來一些非常有趣的儲存裝置。”
簡明扼要
不列顛哥倫比亞大學溫哥華分校研究 DNA 分子如何在計算中應用的計算機科學家 Anne Condon 解釋說,DNA 書籍的編碼並沒有涉及根本性的新技術,而更多的是對現有技術的創造性應用。
先前將資訊儲存在 DNA 中的嘗試因難以製造完美的長鏈而受阻。較短的分子帶來的挑戰較小,因此 Church 及其同事將他們的儲存鏈保持在僅 159 個核苷酸的長度,並生成每個鏈的多個副本,以使捕獲和糾正突變更容易。
在每個單鏈中,96 個核苷酸表示編碼為數字 1 和 0 的資料;19 個核苷酸顯示這些資料塊應如何排序;44 個核苷酸使測序更容易。研究人員的二進位制程式碼將“零”分配給兩種型別的核苷酸(A 和 C),將“一”分配給另外兩種型別(G 和 T)。
Condon 說:“它以非常優雅的方式使用一些簡單的想法來提高可以儲存的資訊密度。” 她說,這項技術最適合資料需要長期儲存而無需讀取的專門應用。
Kosuri 說,理想的儲存期限可能長達數個世紀。即使其他儲存技術變得像磁帶和軟盤一樣過時,研究人員也將始終致力於改進 DNA 讀取和寫入技術,因為這種分子對生物學至關重要。
這將隨著時間的推移降低成本,使 DNA 資料儲存能夠超越演示專案的範疇。Kosuri 說,測序技術的成本已經降至四年前的千分之一左右,而 DNA 合成在過去八年中也實現了同樣的下降。“我們用於本文的 DNA 晶片包含 55,000 個寡核苷酸,”他補充道。“最新的晶片包含一百萬個。”