在浩瀚的人類基因組中,遺傳學家最感興趣的是其中極小的一部分——約 1.5%——這部分包含構建蛋白質的指令。蛋白質構建是 DNA 的主要功能,這些複雜的分子對於整個身體的發育、生長和繁殖至關重要。
但我們不清楚這些蛋白質編碼基因中的大多數實際上是做什麼的。只有大約 20% 的人類編碼基因得到了充分研究,其餘 80%(約 16,000 個基因,以及它們產生的蛋白質)的功能在很大程度上仍然是個謎。這是因為遺傳學研究中長期存在的偏見:科學家們更常研究已知具有重要功能的基因和蛋白質。牛津大學細胞生物學家 Matthew Freeman 說,這些備受矚目的專案,例如研究已知與癌症有關的基因,在資助者看來似乎更“性感”。
Freeman 和他的同事們將這片尚未開發的基因潛力領域稱為“未知基因組”,他們已經工作了 10 年,旨在建立一個數據庫,用於彙編和編目這些研究不足的基因。該資料庫按“已知性”對基因進行排名,並追蹤哪些基因出現在其他不同物種的 DNA 中。他們的研究工具和發表在PLOS Biology上的配套論文最近已在網上釋出。
關於支援科學新聞
如果您喜歡這篇文章,請考慮透過以下方式支援我們屢獲殊榮的新聞事業 訂閱。透過購買訂閱,您將有助於確保未來能夠繼續講述關於塑造我們當今世界的發現和想法的具有影響力的故事。
紐約市西奈山伊坎醫學院的生物資訊學家 Avi Ma'ayan 表示,能夠篩選在不同物種中發現的基因,使該專案與其他具有類似目標的專案區分開來,但他並未參與這項新工作。“未知基因組的概念並不新鮮,”Ma'ayan 說,但由於有太多未被發現的東西,研究人員可能不知道應該優先研究哪些基因。這就是為什麼物種間比較會如此有幫助的原因。Ma'ayan 說,當基因在許多物種中都得到保守時,這是一個很好的暗示,表明它們在生物體中發揮著“至關重要的作用”。未知基因組資料庫允許科學家搜尋,例如,僅存在於無脊椎動物中的、在所有活細胞中都發現的或預計僅在細胞膜中發現的研究不足的基因。正如 Freeman 所說,“它非常可調。”
為了測試未知基因組資料庫的實用性,Freeman 和他的團隊分離出了 260 個未知的果蠅基因,這些基因也存在於人類中。敲除果蠅中的許多這些基因要麼使昆蟲無法存活,要麼使它們出現各種缺陷。巴塞羅那超級計算中心的計算生物學家 Eduard Porta Pardo 說,結果表明,“在這些‘未知’基因和蛋白質中,有一些對我們的發育至關重要,並且可能具有重要的臨床意義,”他沒有參與這項工作。研究人員希望,藉助這些資源和技術進步,未知基因組將成為一個只會隨著時間推移而縮小的知識庫。*
*編者注(2023 年 10 月 17 日):本段在釋出後經過編輯,加入了 Eduard Porta Pardo 的評論。
