科學家最近揭示了一個隱藏的操作系統,而這個系統並不呈螺旋狀。研究人員首次製作出 DNA 四重螺旋的全面地圖,這些瞬息萬變的結構在控制基因開關方面扮演著重要角色。這一突破改變了研究人員對健康和癌細胞中基因調控的理解。國際團隊的成員包括來自 HSE 大學的研究人員,他們解決了一個長期存在的挑戰:四重螺旋形成迅速,消失同樣迅速,並且逃避了傳統的基因組全基因組映射工具。直到現在,僅能觀察到它們活動的片段。
利用人工智能,研究人員重建了這些不穩定的 DNA 結構在基因組中的出現位置。更重要的是,他們發現了一個驚人的規則,證明四重螺旋並不是孤立存在的。科學家首次顯示,四重螺旋以成對的方式運作,將基因啟動區域與附近的 DNA 元素連接起來,這些元素能增強轉錄。當富含鳥糞嘌呤的 DNA 區域折疊成堆疊的層時,便形成了 DNA 結,配對的四重螺旋便由此而生。這些結構作為調控基因活動的蛋白質的地標,引導它們到達正確的基因地址。
不同的實驗捕捉到不同子集的四重螺旋,因此一個完整的地圖一直難以獲得。為了解決這個問題,研究人員對 DNABERT 進行了重新訓練,這是一個基因組語言模型,並專注於四重螺旋特定數據。在這項研究中,團隊在 EndoQuad 上訓練了 DNABERT,該數據庫是世界上最大經實驗驗證的四重螺旋數據庫,最終形成了 GQ-DNABERT 模型。這個模型評估 DNA 序列,以預測四重螺旋可能形成的位置。
GQ-DNABERT 與簡單的算法不同,還考慮了周圍的 DNA 環境,這決定了一個序列是否實際上會折疊成四重螺旋。這使得團隊能夠預測約 36 萬個四重螺旋,遠超過僅依賴實驗方法所檢測到的數量。該模型確認四重螺旋通常出現在啟動子中,即基因轉錄開始的區域。但它也揭示了一個意外的發現:許多四重螺旋出現在附近的增強子中,這些 DNA 元素能增強基因活性。
研究人員發現,四重螺旋經常在啟動子和增強子中同時形成,創造出成對的結構,共同調控基因表達。為了測試其生物學角色,團隊將四重螺旋地圖疊加到六種組織類型的單細胞測序數據上。在健康組織中,這些啟動子–增強子對與特定組織角色的基因相關聯——例如大腦中的神經功能、血液中的免疫反應和腸道中的上皮活性。
腫瘤細胞則表現出截然不同的情況。雖然四重螺旋對的數量保持相似,但它們控制的基因卻劇烈轉向普遍的生長程序。正常細胞中,這些對與特定組織的程序相關,而在癌細胞中則與細胞分裂和生長的普遍過程相關聯,這驅動腫瘤的增殖,無論其來源組織為何。這一發現表明,在健康細胞中,這些對支持組織專門化,而在癌症中則成為快速細胞分裂的一部分。
通過澄清四重螺旋對在疾病中如何重新調整基因調控,這張地圖有助於指導未來的抗癌療法,特別是針對這些 DNA 結構的選擇性治療。這項研究得到了 HSE 人工智能研究中心的資助,並發佈於《核酸研究》期刊上。




