SARS-CoV-2,即導致 COVID-19 的病毒,看起來是什麼樣的?
這個簡單的問題沒有簡單的答案。SARS-CoV-2 非常小,觀察它需要專門的科學技術。電子顯微鏡 (EM) 可以揭示它的大概大小和形狀。我們可以看到病毒粒子是球形或橢球形的,表面有“冠狀”突起。對許多病毒粒子的仔細冷凍電子顯微鏡 (cryo-EM) 研究可以揭示更精確的病毒及其較大片段的測量結果。可以使用冷凍電鏡、X 射線晶體學或核磁共振波譜學,將這些單獨的片段與病毒分離進行研究,從而獲得原子或近原子細節的 3-D 模型。
然而,即使是這些技術也可能無法捕捉到柔性和無序的部分,留下灰色區域和歧義。
支援科學新聞報道
如果您喜歡這篇文章,請考慮透過以下方式支援我們屢獲殊榮的新聞報道 訂閱。透過購買訂閱,您正在幫助確保有關塑造我們當今世界的發現和思想的具有影響力的故事的未來。
以分子細節構建像 SARS-CoV-2 這樣的完整病毒的 3-D 模型 需要研究、假設和藝術許可的結合。有些結構是已知的,有些結構是略微已知的,還有一些結構可能是完全未知的。
當我構建 在七月份的《大眾科學》雜誌上展示的模型時,在幾個地方我不得不根據現有證據做出最佳猜測的決定。這個模型並不完美;隨著對 SARS-CoV-2 的科學理解不斷發展,毫無疑問,它的某些部分可能需要更新。
該模型所依據的許多研究都是針對 SARS-CoV 進行的,SARS-CoV 是 2003 年爆發的 SARS 疫情的冠狀病毒。SARS-CoV 與 SARS-CoV-2 密切相關,並且結構非常相似。它們引起的疾病的差異可能是非常小的分子特徵造成的,當觀察整個病毒粒子時,這些特徵幾乎不可見。我一開始就決定根據需要使用 SARS-CoV 資料。關於 SARS-CoV-2 的研究仍在進行中,對 SARS-CoV 進行的非常仔細的超微結構研究尚未在 SARS-CoV-2 上進行。
在這裡,我將逐步介紹病毒粒子的每個組成部分,並回顧我發現的有關其結構的證據,以及我在哪裡不得不使用假設或藝術許可來彌合差距。
總體結構
在電子顯微鏡下,SARS-CoV-2 病毒粒子看起來是球形或橢球形的。科學家測得的直徑範圍從 60 到 140 奈米 (nm)。(這大約是人類頭髮寬度的千分之一)。然而,在構建此模型時可用的測量資料來自負染色電子顯微鏡,其解析度不如冷凍電鏡精細。
為了獲得更精確的測量結果,我參考了一項 2006 年對 SARS-CoV 進行的細緻冷凍電鏡研究。研究人員在其中報告了平均直徑為 82 到 94 奈米,不包括刺突蛋白。我最終將我的病毒粒子模型構建為球形,直徑為 88 奈米。這項研究還報告了表面結構蛋白的相對量;以下描述了每種測量結果,並附有相關蛋白質。
刺突 (S) 蛋白。來源:Veronica Falconieri Hays
刺突 (S) 蛋白
刺突 (S) 蛋白從病毒表面伸出,使其能夠附著並與人類細胞融合。刺突的頂部,包括附著域和部分融合機制,已在 2020 年 3 月之前由兩個研究小組(Veesler 實驗室 和 McClellan 實驗室)透過冷凍電鏡繪製出 3-D 圖。然而,刺突的莖、跨膜域和病毒粒子內部的尾部尚未繪製圖譜。科學家們知道這些區域存在,以及它們包含哪些氨基酸(蛋白質構建塊),但尚未能夠觀察到它們在 3-D 空間中的排列方式。
包含莖是我模型與許多 SARS-CoV-2 視覺化模型之間的關鍵區別。大多數模型,包括 標誌性的 CDC 影像,都使用刺突頂部的 3-D 資料,但不顯示莖,從而導致刺突模型較短。
起初,我在示意圖中建模了一個莖,所以刺突看起來有點像棒棒糖。我將其與 SARS-CoV 測得的刺突高度和間距相匹配,大約 19 奈米高,間距 13–15 奈米。
然而,在科學推特上,我看到了加州大學聖地亞哥分校的 Lorenzo Casalino、Zied Gaieb 和 Rommie Amaro 釋出的帖子,展示了刺突及其附著的糖鏈的 分子動力學影片。他們基於與已知 3-D 結構的氨基酸序列相似性,構建了一個完整的刺突模型,包括莖、跨膜域和尾部。該模型是他們為了更多地瞭解刺突行為的分子動力學研究(現為預印本)所必需的。他們慷慨地與我分享了他們的模型,以便將其納入我的視覺化模型中。
值得注意的是,Amaro 實驗室的模型高 25 奈米,比我根據 SARS-CoV 的測量結果預期的要高 6 奈米。我沒有解決這種差異,但我的假設是,在實際的病毒粒子上,刺突莖會彎曲,在電子顯微鏡下看起來會更短,並且/或者刺突頂部的柔韌性會模糊其邊界,這使得即使透過冷凍電鏡進行高度測量也有些模稜兩可。
還有報告稱,基於 負染色電鏡影像,SARS-CoV-2 刺突的高度為 9–12 奈米。然而,負染色電鏡的解析度不如 冷凍電鏡,而冷凍電鏡被用於進行 19 奈米的測量。SARS-CoV-2 的刺突蛋白的氨基酸數量也與 SARS-CoV 的刺突蛋白相似(分別為 1,273 個和 1,255 個),因此 SARS-CoV-2 的刺突蛋白不太可能像這些基於負染色的測量結果所暗示的那樣小。
膜 (M) 蛋白。來源:Veronica Falconieri Hays
膜 (M) 蛋白
膜 (M) 蛋白是一種小而豐富的蛋白質,嵌入在病毒的包膜中,其內部有一個尾部,據認為可以 與 N 蛋白相互作用(如下所述)。與刺突莖一樣,M 蛋白尚未在 3-D 中繪製圖譜,也沒有任何類似的蛋白質。SARS-CoV 和 SARS-CoV-2 M 蛋白的大小相似(分別為 221 個和 222 個氨基酸),並且 基於氨基酸模式,科學家們假設 M 蛋白的一小部分暴露在病毒膜的外部,一部分嵌入在膜中,一半在病毒內部。基於此資訊,我基於兩種略微相似的蛋白質(蛋白質資料庫條目 4NV4 和 5CTG,由 SwissProt 鑑定)的部分組裝了一個模型。病毒內域的模型有一個長尾,但我無法自信地定向它,並且發現它指向奇怪的方向,所以我將其切掉,以避免視覺干擾或暗示錯誤的結構特徵。
M 蛋白 形成對,據估計,病毒表面每個刺突蛋白上有 16–25 個 M 蛋白。我最終在我的模型中為每個刺突蛋白建模了 10 對 M 蛋白(因此是 20 個 M 蛋白)。一些研究人員假設 M 蛋白在包膜內形成晶格(與 N 蛋白的底層晶格相互作用;見下文)。我決定使用二十面體球體來建立 M 蛋白二聚體的規則分佈,以暗示這一假設。
N 蛋白。來源:Veronica Falconieri Hays
N 蛋白
核蛋白(N 蛋白)與 RNA 基因組一起包裝在病毒粒子內部。據認為它在包膜下方形成類似晶格的結構,病毒刺突只能在 N 蛋白之間容納,防止它們的間距 小於 13–15 奈米。
N 蛋白由兩個相對剛性的球狀 結構域組成,這兩個結構域透過一個長的無序連線區連線。兩個結構域 NTD 和 NTD 和 CTD 的結構分別是針對 SARS-CoV-2 和 SARS-CoV 確定的,但它們彼此之間的確切方向有點神秘。根據連線域的無序性,它可能是高度可變的。
CTD 的結構是透過 X 射線晶體學確定的,這是一種需要結晶蛋白質純化複製的技術。在這個結晶過程中,CTD 形成了一個有趣的八件式結構,如果堆疊起來,會形成一個螺旋核心。這並非最終結論,但高度暗示病毒 RNA 可以包裹在這個核心周圍。N 蛋白的另一半 NTD 可能隨後在 RNA 外部相互作用,或者,在它靠近 M 蛋白和病毒包膜的地方,轉而附著在那裡。這將形成觀察到的包膜下 N 蛋白晶格,並將使整個 RNA-N 蛋白複合物儘可能靠近膜。
在建立此模型時,建模數百個 N 蛋白複製的技術挑戰太大而無法解決,每個 N 蛋白都由無序氨基酸鏈連線的兩個結構域組成。我決定在病毒刺突下方放置一個 NTD 晶格,為 RNA-N 蛋白複合物構建一個螺旋 CTD 核心,並新增與 RNA 相互作用並散佈在整個病毒粒子中的 NTD。我將核心的螺旋延伸到病毒中心;這是我解決包裝極長的 RNA 鏈(如下所述)的方案,但實際上,RNA 和 N 蛋白在病毒中心可能更加無序。最終結果捕獲了一些關於 N 蛋白如何包裝在內部的想法,即使不是其完整和動態的複雜性。
RNA。來源:Veronica Falconieri Hays
RNA
SARS-CoV-2 的基因組有 29,903 個 RNA 鹼基,與類似的病毒相比非常長。我想確保我的 RNA 模型近似於基因組的長度。然而,RNA 結構可能很複雜;某些區域的鹼基可以與其他鹼基相互作用,形成環和“髮夾”,並導致非常複雜的 3-D 形狀。對於此模型,我假設 RNA 是一根拉伸的線,整齊地纏繞在 N 蛋白核心周圍。我找到了一篇 1980 年的研究論文,該論文報告稱,每奈米有 4-4.8 個 RNA 鹼基,對於建模到病毒粒子橫截面中的一半基因組,大約為 3,000 到 3,750 奈米。
起初,當我進行此計算時,我差了一個數量級。將 300 奈米 RNA 放入病毒粒子中是輕而易舉的事!經過審查,加州大學伯克利分校的病毒學家 Britt Glaunsinger(該專案的顧問)指出,應該有更多的 RNA,我重新檢查了我的計算,並發現了我的錯誤。我需要將至少 3,000 奈米擠入病毒粒子橫截面內 80 奈米寬的空間中;這需要更多 3-D 微調。一旦我在外圍附近用完了空間,我就將 RNA 和 N 蛋白的螺旋繼續延伸到病毒粒子的中心。
E 蛋白。來源:Veronica Falconieri Hays
E 蛋白
包膜 (E) 蛋白是一種五重對稱的 分子,在病毒膜中形成孔。在細胞內病毒複製期間會產生許多複製,但只有極少數被納入成熟的病毒粒子中。科學家們尚未在 3-D 中繪製 SARS-CoV-2 E 蛋白的圖譜,但有一個實驗衍生的 SARS-CoV E 蛋白模型,其相似度約為 91%。我在這裡使用了該模型。
包膜。來源:Veronica Falconieri Hays
包膜
SARS-CoV-2 包裹在從宿主細胞內細胞器膜(特別是內質網和高爾基體)衍生的脂質雙層中。我用通用脂質表示這一點:一個頭和兩個尾巴。如果有更多時間,這可以更詳細。脂質有很多不同的型別,其比例特定於起源膜。
彙集在一起
病毒粒子草圖。來源:Veronica Falconieri Hays
病毒粒子草稿,已標記。來源:Veronica Falconieri Hays
粗略草圖和初始 3-D 模型
在獲得病毒粒子的快速手繪草圖的簽字認可,以確保包含所有必要的細節後,我開始同時在 3-D 建模和動畫程式 Cinema4D 中研究和構建 3-D 模型。在 Cinema4D 中,我建立了一個 88 奈米球體作為基礎,然後將分子模型的副本定向到其表面或內部。隨著我的研究進展,我修改了它們的分佈,並根據需要進行了計數、測量和計算。我使用 嵌入式 Python 分子檢視器 (ePMV) 外掛直接匯入可用的 3-D 分子資料。
渲染顏色指南。來源:Veronica Falconieri Hays
初始顏色研究
我使用了所得模型的基本 2-D 影像來試驗顏色,然後將該調色盤用作建立材質和在 3-D 中設定燈光的起點。
顏色研究 1。來源:Veronica Falconieri Hays
顏色研究 2。來源:Veronica Falconieri Hays
3-D 顏色研究
起初,我設想了一個溫暖的粉紅色背景,就好像仔細觀察人體組織中一個不可能光線充足的角落一樣。然而,我在 2-D 中嘗試了較暗、較冷的背景,發現我喜歡它如何使刺突蛋白的冠狀結構突出。藝術總監 Jen Christiansen 也喜歡這個方向,所以我將較暗背景的版本改進為《大眾科學》2020 年 7 月號封面上的插圖。
致謝
我要感謝醫學插畫家協會 (AMI) 的同行們,感謝他們在 Michael Konomos 牽頭的努力中分享他們的研究。還要感謝 Nick Woolridge、David Goodsell、Melanie Connolly、Joel Dubin、Andy Lefton、Gloria Fuentes 和 Jennifer Fairman 的來信和視覺化,這些幫助我進一步理解了 SARS-CoV-2。感謝《大眾科學》的 Jen Christiansen 提供的藝術指導,並感謝她在我製作這件作品期間容忍我傳送的許多深度書呆子式的電子郵件。
