基因編輯:糾正錯(cuò)誤的“生命魔剪”
作者:馬麗佳(西湖大學(xué)生命科學(xué)學(xué)院功能基因組學(xué)與生物信息學(xué)實(shí)驗(yàn)室負(fù)責(zé)人)
每個(gè)人的基因組都是獨(dú)一無(wú)二的特殊存在,是“我”之所以是“我”,而不是其他任何人的獨(dú)特編碼。如果將每個(gè)人的基因組都看作一本書(shū),書(shū)中的篇章詞句就是大大小小的基因片段,它們講述著生命體從出生、生長(zhǎng)發(fā)育到死亡的所有故事。當(dāng)基因片段出現(xiàn)錯(cuò)誤,人就會(huì)生病。過(guò)去,能夠無(wú)障礙閱讀這本“基因書(shū)”就是很了不起的事情了,但今天的科學(xué)家們已經(jīng)可以運(yùn)用各種技術(shù),去糾正“書(shū)”中出現(xiàn)的錯(cuò)誤。
1、剪除錯(cuò)誤并插入正確基因片段
找到“基因書(shū)”中錯(cuò)誤的片段并將其精準(zhǔn)地恢復(fù)為正確的片段就是基因“編輯”。CRISPR,是基因編輯技術(shù)的一種,相比早前另外兩種基因編輯技術(shù)TALEN和ZFN,它更靈活易用,同時(shí)具有高精度和低成本等優(yōu)點(diǎn)。這些優(yōu)點(diǎn),得益于兩個(gè)關(guān)鍵“人物”——gRNA和Cas9。gRNA,也叫向?qū)NA,顧名思義就像GPS導(dǎo)航。在“基因書(shū)”里,向?qū)NA的職責(zé)就是在浩如煙海的基因組“文字”中找到出錯(cuò)的地方,然后規(guī)劃出前進(jìn)路線;而Cas9,是一種核酸內(nèi)切酶,它就像剪刀,會(huì)沿著向?qū)NA規(guī)劃好的路線抵達(dá)出錯(cuò)地點(diǎn),然后剪開(kāi)錯(cuò)誤的基因片段。這就是為什么很多人稱CRISPR/Cas9基因編輯技術(shù)為“基因魔剪”的原因。
看到這里,大家也許就會(huì)產(chǎn)生一個(gè)疑問(wèn):剪開(kāi)錯(cuò)誤的片段,又怎么把正確的填進(jìn)去呢?
這就有些類似于編輯文章。根據(jù)文字出錯(cuò)方式的不同,使用不同的方法去糾正。如果是有一段錯(cuò)誤的文字被放到了不該出現(xiàn)的地方,或者雖然只有一兩個(gè)錯(cuò)字,但是刪掉這些錯(cuò)字和它附近少量的文字反而使句子恢復(fù)原意,那就可以直接切掉不需要的文字。這也是目前臨床試驗(yàn)中最基礎(chǔ)、采用最多的剪切式方案。
如果是只有一個(gè)字母錯(cuò)了,可以只將這個(gè)字母改回原來(lái)正確的樣子,這要用到堿基編輯器。但如果是一小段文字都不見(jiàn)了,那就需要提供一份新的文稿補(bǔ)回去。補(bǔ)的方式也有不同,有一種方式叫作引導(dǎo)編輯,針對(duì)某個(gè)出錯(cuò)的基因片段,科學(xué)家會(huì)讓向?qū)NA帶一段正確的RNA序列到體內(nèi),作為標(biāo)準(zhǔn)答案或模板,當(dāng)“基因魔剪”把錯(cuò)誤的基因片段去除后,連在“基因魔剪”上面的分子機(jī)器逆轉(zhuǎn)錄酶會(huì)依樣畫(huà)葫蘆,照著答案模板抄一份對(duì)的DNA放回原位。另一種方式,則是由科學(xué)家在體外合成一段正確的DNA,作為正確答案本身,利用細(xì)胞自身的同源重組修復(fù)機(jī)制填入“基因魔剪”切開(kāi)的位置。
因此理論上,只要知道出現(xiàn)錯(cuò)誤的靶點(diǎn)、正確的答案以及擁有一套編輯工具,數(shù)千種由于基因出錯(cuò)導(dǎo)致的疾病都可以找到治愈的辦法。但從科學(xué)理論到臨床實(shí)踐,是一個(gè)復(fù)雜的系統(tǒng)性工程,運(yùn)送編輯工具進(jìn)入細(xì)胞、找到并抵達(dá)發(fā)生錯(cuò)誤的基因片段、切掉和修改錯(cuò)誤的片段,這三個(gè)步驟所涉及的技術(shù)都大有講究。要在每一步上都精益求精,才能高效、精準(zhǔn)地把出錯(cuò)的基因編輯好,完成從基因編輯工具到基因編輯藥物的轉(zhuǎn)變。
2、治療遺傳病和癌癥前景可期
已經(jīng)有極少數(shù)深受遺傳病困擾的人體驗(yàn)過(guò)“基因魔剪”。
例如近期對(duì)β-地中海貧血和鐮刀狀貧血癥的基因治療方案。這兩種病都是因?yàn)榫幋aβ-珠蛋白的基因出現(xiàn)了變異,造成血紅蛋白減少和貧血。由基因編輯技術(shù)發(fā)明人、2020年諾貝爾獎(jiǎng)化學(xué)獎(jiǎng)獲得者埃曼紐爾·卡彭蒂耶(Emmanuelle Charpentier)開(kāi)發(fā)了一種“曲線救國(guó)”的治療方案:通過(guò)使用基因編輯技術(shù)降低另一個(gè)抑制基因的表達(dá),來(lái)恢復(fù)γ-珠蛋白的表達(dá),其通常是在胎兒時(shí)期才表達(dá)的,從而達(dá)到恢復(fù)紅細(xì)胞功能的目的。該方法在臨床上已獲得了初步成效,截至2020年年底已治愈了4名β-地中海貧血和鐮刀狀貧血癥的病患,幫助他們擺脫了長(zhǎng)期輸血的負(fù)擔(dān)和并發(fā)癥的困擾。這種療法需要分離患者的造血干細(xì)胞,在體外通過(guò)電穿孔將基因編輯藥物導(dǎo)入細(xì)胞,然后再將造血干細(xì)胞植入患者體內(nèi)進(jìn)行造血系統(tǒng)重建。類似的方法也可以用于其他造血干細(xì)胞相關(guān)遺傳疾病的治療。
據(jù)英國(guó)《自然》網(wǎng)站報(bào)道,2020年,一名身患萊伯氏先天性黑蒙癥(LCA10)的患者,成為接受CRISPR基因編輯藥物人體直接注射試驗(yàn)的第一人。先天性黑蒙癥是一種遺傳失明癥,是導(dǎo)致兒童先天性失明的主要原因。該療法通過(guò)在視網(wǎng)膜下注射含有基因編輯藥物的腺相關(guān)病毒載體,將突變的基因內(nèi)含子片段切除或使其形成倒位,從而恢復(fù)基因的正常表達(dá)。后續(xù)更多的臨床試驗(yàn)結(jié)果表明該療法對(duì)部分患者有積極的效果。
基因編輯技術(shù)更激動(dòng)人心的廣泛應(yīng)用是癌癥治療領(lǐng)域。嵌合型抗原受體T細(xì)胞免疫療法(CAR-T)是通過(guò)轉(zhuǎn)基因技術(shù)將T細(xì)胞改造成針對(duì)特定腫瘤的一種新型的殺傷細(xì)胞的癌癥治療方法,在白血病、淋巴瘤、骨髓瘤等血液癌癥治療中有良好的療效。傳統(tǒng)CAR-T療法需要分離患者的T細(xì)胞,在體外進(jìn)行轉(zhuǎn)基因,擴(kuò)增至治療需要的數(shù)量后再輸回患者體內(nèi)。這是個(gè)漫長(zhǎng)的過(guò)程,有可能錯(cuò)過(guò)治療時(shí)機(jī)。體弱的幼兒和老年病人也可能沒(méi)有足夠的T細(xì)胞供分離?,F(xiàn)在通過(guò)使用CRISPR技術(shù)將T細(xì)胞中個(gè)體識(shí)別的基因敲除,可以實(shí)現(xiàn)通用型CAR-T細(xì)胞供應(yīng),縮短治療時(shí)間并擴(kuò)大適用人群。
不過(guò)這樣的好消息,在目前階段依然是罕見(jiàn)的。從技術(shù)到臨床,還有很長(zhǎng)的一段路要走?;蚓庉嫾夹g(shù)還有許多值得開(kāi)發(fā)和深化的地方,但是隨著科學(xué)家和創(chuàng)新藥物研發(fā)工程師的努力,相信在不久的將來(lái),“基因魔剪”會(huì)像外科醫(yī)生手中的手術(shù)刀一樣,精準(zhǔn)、快捷和有效地將病灶清除。
3、“導(dǎo)航防護(hù)衣”還需更加優(yōu)化
還記得前文說(shuō)過(guò)基因編輯的幾個(gè)步驟嗎?科學(xué)家和工程師們目前在做的就是“各個(gè)擊破”這件事。
首先,找到更先進(jìn)的導(dǎo)航。假設(shè)已知某一處基因片段出錯(cuò)需要通過(guò)編輯來(lái)修正,實(shí)際操作時(shí)往往需要在一定的坐標(biāo)范圍內(nèi)選擇“一刀切”的下刀位置。如果向?qū)NA足夠優(yōu)秀,它就可以規(guī)劃出一條最優(yōu)路線:比如,選擇哪個(gè)點(diǎn)下刀,既可以準(zhǔn)確切除錯(cuò)誤片段,又不會(huì)誤傷沿途其他的基因;又比如,能夠從極其相似的兩個(gè)或幾個(gè)目的地中,辨認(rèn)出真正需要執(zhí)行編輯任務(wù)的那一個(gè)。
然后,磨出“快刀利刃”,也就是優(yōu)化出準(zhǔn)確度更高、編輯效率更高,體積更小的基因編輯蛋白。這一點(diǎn)比較容易理解:刀鈍,一刀下去拖泥帶水,要么沒(méi)切干凈,要么把不該切的也拉扯下來(lái),既不精準(zhǔn)也不安全。而如果刀快,一刀下去干脆利落,只切該切的地方,才是基因編輯的理想工具。
此時(shí),如果配上一套動(dòng)力和安全性都上乘的“遞送系統(tǒng)”,就完整了。當(dāng)導(dǎo)航、手術(shù)刀和正確答案都準(zhǔn)備就緒,這些執(zhí)行編輯工作的關(guān)鍵“人物”,需要被護(hù)送進(jìn)入人體并直達(dá)目的地。而這看似最平平無(wú)奇的一步,反而是整個(gè)基因編輯系統(tǒng)里相對(duì)較難的一部分。假設(shè)我們想要編輯肝臟細(xì)胞的基因,就需要將向?qū)NA和基因編輯剪刀“打包”在一個(gè)針劑里,然后通過(guò)注射的方式輸進(jìn)人體內(nèi)。
這團(tuán)復(fù)合物從針頭位置開(kāi)始往肝臟“跑”,如果沒(méi)有保護(hù),這些外來(lái)物在路上難免會(huì)遭到免疫系統(tǒng)的攻擊,很多時(shí)候還會(huì)去到不想讓它們?nèi)サ慕M織器官。此時(shí),可以把“遞送系統(tǒng)”,看作給向?qū)NA和“基因魔剪”穿上了一件“導(dǎo)航防護(hù)衣”。只有當(dāng)它們抵達(dá)執(zhí)行基因編輯任務(wù)的目標(biāo)細(xì)胞時(shí),“防護(hù)衣”才會(huì)自動(dòng)脫落,釋放出一整套基因編輯工具。顯然,什么材質(zhì)適合做這件防護(hù)衣,如何避免防護(hù)衣提前脫落,這些都是需要優(yōu)化的技術(shù)要點(diǎn)。
4、人工智能加速開(kāi)發(fā)“基因魔剪”
在已知的6000多種遺傳病中,目前只有大約幾十種被美國(guó)食品藥品管理局批準(zhǔn)的藥物,可以對(duì)其中一部分疾病進(jìn)行治療,絕大部分遺傳疾病連有效的治療方案都沒(méi)有,治愈更是無(wú)從談起。由于CRISPR可以修改DNA序列,因此對(duì)主要由基因突變、缺失等造成的遺傳病來(lái)說(shuō),基因編輯技術(shù)可以為患者們帶來(lái)一線希望。
但僅僅針對(duì)某一個(gè)疾病基因,去開(kāi)發(fā)一套完整的治療方案,是一項(xiàng)非常大的系統(tǒng)性工程。結(jié)合創(chuàng)新研究范式、基因測(cè)序高通量數(shù)據(jù)和人工智能算法,我們團(tuán)隊(duì)正在搭建一個(gè)AI助力的基因編輯工具開(kāi)發(fā)平臺(tái),全方位優(yōu)化CRISPR系統(tǒng),篩選開(kāi)發(fā)出更多的對(duì)癥基因治療方案,同時(shí)使這項(xiàng)技術(shù)可以更精準(zhǔn)、更安全地在人體內(nèi)發(fā)揮作用。
就像用不同的導(dǎo)航會(huì)有不同的推薦路徑,使用不同的向?qū)NA編輯同一個(gè)基因會(huì)有不同的編輯效率和脫靶率,而同樣的CRISPR系統(tǒng)編輯不同的基因,效率有時(shí)候也會(huì)有巨大的差異。這些差異是由目標(biāo)基因序列決定的。而從海量的基因序列—編輯效率所對(duì)應(yīng)的數(shù)據(jù)中,找出潛在規(guī)律并用于預(yù)測(cè)和設(shè)計(jì)新的向?qū)NA,正是人工智能所擅長(zhǎng)的。這些問(wèn)題出現(xiàn)在基因編輯三部曲的每一個(gè)大小環(huán)節(jié)。生物數(shù)據(jù)的產(chǎn)出能力在目前階段是有限的,但是實(shí)驗(yàn)室正在產(chǎn)出龐大的高質(zhì)量體內(nèi)數(shù)據(jù)集合,為構(gòu)建人工智能模型提供了更為真實(shí)可靠的訓(xùn)練集。將人工智能應(yīng)用于基因和細(xì)胞治療領(lǐng)域,我們需要以數(shù)據(jù)為核心,開(kāi)發(fā)適用于此應(yīng)用場(chǎng)景的人工智能算法,對(duì)數(shù)據(jù)深度學(xué)習(xí),建立起一套適合于某種疾病的基因治療模擬平臺(tái)。
依靠現(xiàn)代數(shù)據(jù)連接和人工智能算法所具有的獨(dú)特能力,可以保持生物事件的實(shí)時(shí)和動(dòng)態(tài)性。由此對(duì)非線性功能關(guān)系進(jìn)行建模,可以有效提高模型與過(guò)程的匹配度。例如,美國(guó)博德研究所(Broad研究所)的David Liu團(tuán)隊(duì)及其他研究人員創(chuàng)建了一種機(jī)器學(xué)習(xí)模型,并已于2018年11月7日在《自然》上發(fā)表。該模型可以理解為人工智能,實(shí)現(xiàn)了高精度地預(yù)測(cè)人類和小鼠細(xì)胞如何響應(yīng)CRISPR誘導(dǎo)的DNA斷裂。他們證明即使沒(méi)有模板,Cas9編輯也是可預(yù)測(cè)的,并且能夠精確修復(fù)預(yù)測(cè)的基因型,從而糾正與人類疾病相關(guān)的突變。在這些領(lǐng)域,中國(guó)的科學(xué)家團(tuán)隊(duì)也已經(jīng)逐漸接近世界最好的水平。
這種逐漸興起的科學(xué)研究和藥物開(kāi)發(fā)范式,深度結(jié)合高通量實(shí)驗(yàn)數(shù)據(jù)與人工智能模型,通過(guò)數(shù)據(jù)特征的提取和模型的不斷優(yōu)化,實(shí)現(xiàn)從靶點(diǎn)發(fā)現(xiàn)、新編輯工具開(kāi)發(fā)、新靶點(diǎn)基因治療策略開(kāi)發(fā)到最終成藥的一體化技術(shù)。最終將打通人工智能結(jié)合生物學(xué)數(shù)據(jù)進(jìn)行CRISPR系統(tǒng)開(kāi)發(fā)的全流程,加快遺傳病、癌癥等治療方案的開(kāi)發(fā)速度,讓更多期待被救治的病患,能有機(jī)會(huì)獲得更有質(zhì)量的生活。
版權(quán)聲明:凡注明“來(lái)源:中國(guó)西藏網(wǎng)”或“中國(guó)西藏網(wǎng)文”的所有作品,版權(quán)歸高原(北京)文化傳播有限公司。任何媒體轉(zhuǎn)載、摘編、引用,須注明來(lái)源中國(guó)西藏網(wǎng)和署著作者名,否則將追究相關(guān)法律責(zé)任。