對冠狀病毒大流行早期階段的研究工作獲得了一個令人驚訝的來源的幫助。一位美國生物學家“挖掘”出了部分 SARS-CoV-2 基因組序列,這些序列來自疫情可能中心武漢的早期,它們曾被上傳到一個美國政府資料庫,但後來被移除。
雖然科學家們強調,這些部分基因組序列並沒有揭示其起源,但它們解決了關於冠狀病毒 SARS-CoV-2 早期遺傳多樣性的進化難題。目前尚不完全清楚武漢大學的研究人員為何要求從序列讀取檔案庫 (SRA) 中刪除這些序列,SRA 是美國國立衛生研究院 (NIH) 下屬的國家生物技術資訊中心 (NCBI) 維護的原始測序資料儲存庫。
“這些序列是有資訊量的,但並非具有變革性,”華盛頓州西雅圖弗雷德·哈欽森癌症研究中心的病毒進化遺傳學家傑西·布魯姆說,他在 6 月 22 日的預印本中描述了他如何恢復這些序列。
支援科學新聞事業
如果您喜歡這篇文章,請考慮透過以下方式支援我們屢獲殊榮的新聞事業 訂閱。透過購買訂閱,您正在幫助確保有關塑造我們當今世界的發現和想法的具有影響力的故事的未來。
布魯姆在搜尋大流行早期的基因組資料後發現了這些序列。2020 年 5 月的一篇研究論文包含一個公開可用的序列資料表,其中包括布魯姆之前沒有見過的條目。這些序列與一篇論文相關聯,該論文中研究人員使用奈米孔測序技術來檢測來自人體樣本中的 SARS-CoV-2 遺傳物質。該研究發表在《Small》雜誌上,於 2020 年 6 月發表,並於當年 3 月釋出在 bioRxiv 上。
當布魯姆使用 2020 年 5 月論文中列出的詳細資訊在 SRA 中查詢這些序列時,資料庫沒有返回任何條目。SRA 將序列儲存在 Google 維護的雲端儲存中,布魯姆想知道他是否可以在雲伺服器上找到這些序列的存檔版本。這種方法奏效了,布魯姆能夠從 50 個樣本中恢復資料,其中 13 個樣本包含足夠的原始資料來生成部分基因組序列。
進化之謎
布魯姆說,這些序列有助於解決關於大流行早期階段的進化之謎。來自武漢的最早病毒序列來自 2019 年 12 月與該市華南海鮮市場有關聯的個體,最初人們認為那裡是冠狀病毒首次從動物傳播到人的地方。但是,與後來的序列(包括在美國採集的一個序列)相比,來自海鮮市場的序列與 SARS-CoV-2 在蝙蝠中最親近的親屬(病毒最可能的最終來源)的關係更遠。
布魯姆說,這令人驚訝,因為人們會期望來自武漢疫情早期的病毒與 SARS-CoV-2 在感染蝙蝠的親屬關係最為密切。恢復的序列可能是 2020 年 1 月和 2 月採集的,結果表明情況確實如此——它們比來自與海鮮市場有關聯的人的序列更接近蝙蝠病毒。
布魯姆和其他科學家說,這增加了一系列越來越多的證據,包括關於可能追溯到 2019 年 11 月的病例的報告,表明首批人類 COVID-19 病例與華南海鮮市場無關。
“對我來說,武漢市場似乎是最早的超級傳播事件之一,”賓夕法尼亞州費城天普大學的進化遺傳學家蘇迪爾·庫馬爾說。他補充說,布魯姆發現的序列表明,SARS-CoV-2 在中國大流行的早期階段(包括在武漢)發展出了廣泛的多樣性。
猶他州鹽湖城猶他大學的病毒學家斯蒂芬·戈德斯坦指出,布魯姆恢復的序列並沒有被隱藏:它們在《Small》論文中被詳細描述,並提供了足夠的序列資訊來了解它們與其他早期 SARS-CoV-2 序列的進化關係。“我不認為這篇預印本告訴我們很多新的東西,但它確實將公眾可用的序列資料帶到了前臺,儘管它們之前並不引人注目,”戈德斯坦說。
布魯姆說,儘管這些序列已經發表,但從 SRA 中移除意味著很少有科學家知道它們。世界衛生組織委託撰寫的一份關於大流行起源的報告,在早期 SARS-CoV-2 資料的進化分析中並未包含這些序列。“沒有人注意到它們的存在,”布魯姆說。
《Small》論文的通訊作者沒有回覆《自然》新聞團隊關於他們為何要求從 SRA 中刪除這些序列的問題,刪除發生在論文發表之前。美國國立衛生研究院在一份宣告中表示,應研究人員的要求刪除了資料,研究人員表示他們計劃將資料提交到另一個數據庫。
布魯姆與他人共同撰寫了一封信,呼籲重新調查大流行的起源,包括病毒可能從實驗室逃逸或洩漏的可能性——他說他的研究沒有揭示大流行的起源,也沒有揭示為何移除這些序列。但他希望他的努力將鼓勵研究人員“跳出固有思維模式”,並尋找其他來源,例如檔案資料,以從大流行的早期階段獲取更多資訊。“可能還有更多資料在那裡,”他說。
本文經許可轉載,並於2021 年 6 月 24 日首次發表。
