“穿孔卡片” DNA 可能意味著更廉價的大容量資料儲存

新方法可能比其他基因儲存嘗試更快、更簡便

活細胞已經將資訊儲存在 DNA 中。

如果每個人都必須依賴快閃記憶體——儲存卡和 U 盤中使用的資料儲存系統——到 2040 年,世界預計產生的資訊量將超過地球微晶片級矽的預期供應量,最多可達 100 倍。為了防止此類危機,研究人員一直在探索一種生命本身賴以生存的 儲存材料:DNA。

從理論上講,這種物質可以儲存大量資訊——高達 每立方毫米 DNA 一艾位元組(十億千兆位元組)——長達數千年。(作為大多數數字檔案基礎的磁帶的最大壽命約為 30 年,但 70 萬年前化石 中的 DNA 仍然可以測序。)然而,使 DNA 資料儲存成為現實 的一個障礙是建立或合成符合所需程式碼的新 DNA 序列的過程緩慢、昂貴且容易出錯。

伊利諾伊大學厄巴納-香檳分校的編碼理論家,也是一項關於該主題的新研究的共同資深作者 奧爾吉卡·米倫科維奇 說:“合成 DNA 是記錄成本、準確性和寫入速度方面的主要瓶頸。”她和她的同事們提出了一種新穎的解決方案:不是從頭開始定製合成 DNA,而是用“切口”模式標記現有的 DNA 分子來編碼資料。這種方法的靈感來自穿孔卡片——一種硬紙條,上面在特定位置衝有孔,用於儲存許多早期計算機的資訊,包括二戰時期的 ENIAC。研究人員於週三在《自然通訊》上 詳細介紹了他們的技術


支援科學新聞報道

如果您喜歡這篇文章,請考慮透過以下方式支援我們屢獲殊榮的新聞報道 訂閱。透過購買訂閱,您正在幫助確保有關塑造我們當今世界的發現和想法的具有影響力的故事的未來。


以前的 DNA 儲存方法將稱為鹼基的四種關鍵 DNA 成分——腺嘌呤、胸腺嘧啶、胞嘧啶和鳥嘌呤——視為電子位,即編碼數字資料的 1 和 0。例如,每個鹼基可能被分配來表示對 00、01、10 或 11。但是,新方法不是將一系列位轉換為 DNA 程式碼併合成相應的鹼基串,而是將現有的遺傳物質視為有點像早期穿孔卡片的紙張。首席研究作者 S·卡斯拉·塔巴塔拜 是厄巴納-香檳分校的合成生物學家,他說它應用酶作為“製造孔的裝置”。在這種情況下,“孔”是構成 DNA 主鏈的分子的斷裂鍵。這種標記的存在意味著 1,而它的缺失象徵著 0。

布朗大學的理論化學家布倫達·魯賓斯坦說,這項研究最有趣的方面是它如何依賴自然,她沒有參與這項研究。她說,研究人員“讓這些酶產生切口——做對它們來說最自然的事情——來儲存資訊”。

為了精確定位切口,該團隊加熱了 雙鏈 DNA 分子——將每個分子想象成一個扭曲的梯子,梯子的橫檔由鹼基對製成,縱軌由糖和磷酸鹽製成——直到它們在中間稍微解開。這個過程基本上形成了氣泡,使鹼基暴露出來。接下來,科學家們部署了單鏈 DNA 分子,每個分子只有 16 個鹼基長,它們附著在這些氣泡內相應的鹼基序列上。這些單鏈分子的末端充當引導,準確地告訴酶要去哪裡。在 DNA 中,每個鹼基與一個糖分子和一個磷酸基團連線,形成一種稱為核苷酸的化合物。新技術中使用的酶切斷一個核苷酸與另一個核苷酸連線的鍵,從而在糖-磷酸鹽縱軌中產生切口。

由於這種方法不需要合成精確的 DNA 序列,研究人員表示,其主要優勢之一是他們可以將幾乎任何 DNA 分子都視為穿孔卡片。例如,他們用從容易獲得的 大腸桿菌 菌株中廉價收穫的遺傳物質進行了實驗,研究人員非常精確地瞭解這些菌株的序列。科學家們使用包含 450 個鹼基對的細菌 DNA 鏈,每個鏈包含 5 到 10 個切口,編碼了 亞伯拉罕·林肯的葛底斯堡演說 的 272 個單詞——以及 林肯紀念堂 的 14 千位元組影像。在將這些資訊放置在 DNA 上後,他們使用商業測序技術以完美的精度讀取了檔案。

魯賓斯坦說:“多年來,人們認為分子計算涉及將我們在矽中做的事情對映到分子上,這導致了這些精巧的魯布·戈德堡裝置。”“相反,這項新工作信任酶在數百萬年的進化過程中變得非常高效。”

科學家們希望他們的工藝可能比那些依賴合成 DNA 的工藝便宜和快速得多。然而,他們表示,過去提出的 DNA 資料儲存策略仍然提供了一些優勢——例如,儲存密度大約是穿孔卡片技術的 12 到 50 倍。米倫科維奇說:“目前 DNA 資料儲存的最大問題不是密度;而是成本。”“而且我們的成本非常低,還可以進一步降低。”此外,她補充說,較舊的 DNA 儲存系統不得不包含冗餘序列,作為針對傳統 DNA 合成容易出錯的性質的保險。這種要求減少了它們實際可以容納的資料量,縮小了它們與新技術之間的儲存密度差距。

© .