CRISPR-Cas9最著名的功能是作為編輯DNA的實驗室工具,但它的自然功能是作為免疫系統的一部分,幫助某些微生物對抗病毒。

CRISPR-Cas9系統(如圖)用于發現和切割特定的DNA序列。圖片來源:CarlosClarivan/SciencePhotoLibrary
麻省理工學院生物化學家張鋒團隊聯合美國國家生物技術信息中心研究人員開發出一種名為FLSHclust的新算法,在數十億個蛋白質序列中發現了188個罕見且以前未知的CRISPR連接基因模塊。新發現為利用CRISPR系統和了解微生物蛋白質的功能多樣性提供了新機會。
“我們對CRISPR系統的多樣性感到驚訝。”麻省理工學院生物化學家張鋒,“做這種分析可以讓我們一石二鳥:既研究生物學,也可能找到有用的東西。”
單細胞細菌和古細菌使用CRISPR系統來保護自己免受噬菌體的侵害。CRISPR系統通常由兩部分組成:識別并結合噬菌體DNA或RNA的“引導RNA”分子,以及在引導RNA指示的位點切割或干擾遺傳物質的酶。
到目前為止,研究人員已經確定了六種CRISPR系統,分別從I命名到VI。它們有不同的特性,包括使用酶的類型,以及它們如何識別、結合和切割RNA或DNA。用于基因工程的CRISPR-cas9系統被歸類為II型,其他類型的CRISPR特征可能對其他方面有用。
為了在自然界中找到不同的CRISPR系統,張鋒團隊開發了一種名為FLSHclust的算法,可分析公共數據庫中的基因序列。這些數據庫包含來自細菌和古細菌的數十萬個基因組,數億個未與特定物種相關聯的序列,以及數十億個編碼蛋白質的基因。FLSHclust通過尋找基因序列之間的相似性,并將它們分組成大約5億個簇,發現了CRISPR相關基因。
通過觀察這些簇的預測功能,研究人員發現了大約13萬個基因以某種方式與CRISPR相關,其中188個是以前從未見過的,他們在實驗室測試了幾個基因以了解它們的作用。實驗結果揭示了CRISPR系統用來攻擊噬菌體的各種策略,包括解開DNA雙螺旋結構,以及以允許基因插入或刪除的方式切割DNA。他們還發現了“抗CRISPR”的DNA片段,這可能有助于噬菌體逃避細菌的防御。
在這些新基因中,有一種完全未知的靶向RNA的CRISPR系統的代碼,該團隊將其命名為VII型。研究通訊作者之一、美國國家生物技術信息中心生物學家EugeneKoonin表示,找到新的CRISPR系統越來越難了,VII型和任何其他尚未被識別的CRISPR類型在自然界中一定是極其罕見的,這可能需要付出巨大的努力才能找到下一種類型。
巴黎薩克雷大學微生物學家ChristinePourcel說,很難知道某些類型的CRISPR系統是罕見的,因為它們對微生物通常沒有用處,還是專門適應于生活在特定環境中的生物體。她補充說,由于研究中使用的基因數據庫包括與特定生物體沒有聯系的基因組片段,因此很難研究一些新系統的作用。
新西蘭達尼丁奧塔哥大學生物化學家ChrisBrown表示,該算法本身就是一項重大進步,因為它將使研究人員能夠在不同物種之間尋找其他類型的蛋白質。
“這是生物化學家的寶庫。”德國馬爾堡大學微生物學家LennartRandau對此表示贊同。他說,下一步將是找出酶和系統工作的機制,以及如何將它們用于生物工程。“一些CRISPR蛋白會隨機切割DNA,對工程毫無用處。但它們在檢測DNA或RNA序列方面非常精確,可能會成為很好的診斷或研究工具。”
研究人員認為,現在說VII型CRISPR系統或FLSHclust鑒定的任何其他基因是否對基因工程有幫助還為時過早,但它們有一些可能有用的特性。例如,VII型病毒只涉及很少的基因,這些基因可以很容易地裝入病毒載體并傳遞到細胞中。相比之下,該團隊發現的其他一些系統包含非常長的引導RNA,這可能使它們能夠以前所未有的準確性靶向特定的基因序列。