DNA 數獨

研究人員藉助古老的數論和流行的益智遊戲來解開遺傳醫學之謎

加入我們的科學愛好者社群!


關於支援科學新聞業

如果您喜歡這篇文章,請考慮透過以下方式支援我們屢獲殊榮的新聞報道: 訂閱。 透過購買訂閱,您將有助於確保未來能夠繼續講述關於塑造我們今天世界的發現和想法的有影響力的故事。


一個有2000年曆史的數學定理,以及數獨,可能很快就能幫助研究人員以驚人的速度解開DNA的謎團。

在成千上萬的樣本中尋找特定的基因突變可能是一個昂貴且耗時的過程。在過去的幾年裡,更快的多重DNA測序儀加快了資料採集的速度,但研究人員仍然受限於必須為每個樣本貼上唯一的分子識別符號(或條形碼)才能進行分析。

紐約長島冷泉港實驗室 (CSHL) 的科學家們正在提出一種關於古老想法的新方法,以同時處理大型資料集。該團隊正在應用中國剩餘定理來精確定位較大樣本池中的單個樣本,這些樣本池按行和列排列。

該定理大約在2000年前被髮明,是一種使用質數互質數對映資訊的方法。在DNA測序和數獨的案例中,該定理用於組織盒子中具有座標的資料點,但它也可以用於找出其他領域中所有型別的缺失資訊,例如用高速雷達感應到的遙遠點、程式碼片段,以及你在遊輪上的七個派對中見過三次的那個有魅力的人是誰。

透過使用這個想法,研究人員可以處理整個基因資訊庫,而不是僅僅“一次檢視一個基因序列”,論文的主要作者 Yaniv Erlich 說,該論文作為本月基因組研究的封面故事發表。

在數獨遊戲中,玩家必須在每一行和每一列中填入所有九個數字,但在將其應用於如此多的基因樣本搜尋時,研究人員求助於最先進的機器人、機器和程式來完成樣本放置和搜尋。“數獨[謎題]中的每個單元格都像一個樣本,每個數字都像一個基因型,”Erlich 說,他是一名博士生,曾在之前的雷達工作中使用了中國剩餘定理。他將這個想法帶給了他的 CSHL 教授 Greg Hannon

該過程允許研究人員彙集數十個樣本,併為樣本池(而不是單個樣本)分配條形碼識別符號。在測序儀返回整個樣本池的結果後,解碼程式可以使用該定理反向推算並定位特定的樣本。例如,為了在囊性纖維化研究中找到突變,解碼程式將使用每個樣本池的結果作為約束條件來精確定位突變樣本的位置。

“將數獨視為一種池化理論,”他說。“你在行和列中都有一個約束,即[要]擁有所有九個數字。我們也有同樣的東西——可能沒有那麼整潔——但我們擁有同一個池中的所有序列。” 他解釋說,從那裡,一個程式可以返回並使用相同的邏輯來找到突變DNA。

研究作者指出,在未來,原本需要數月時間和 1000 萬美元的測序和分析可能只需要幾天的機器時間和 5 萬至 8 萬美元。這一切都歸功於古老的中國數字邏輯和流行的紙筆益智遊戲——Erlich 現在經常玩這款遊戲。

© .