基因編輯:糾正錯誤的“生命魔剪”
作者:馬麗佳(西湖大學(xué)生命科學(xué)學(xué)院功能基因組學(xué)與生物信息學(xué)實驗室負(fù)責(zé)人)
每個人的基因組都是獨一無二的特殊存在,是“我”之所以是“我”,而不是其他任何人的獨特編碼。如果將每個人的基因組都看作一本書,書中的篇章詞句就是大大小小的基因片段,它們講述著生命體從出生、生長發(fā)育到死亡的所有故事。當(dāng)基因片段出現(xiàn)錯誤,人就會生病。過去,能夠無障礙閱讀這本“基因書”就是很了不起的事情了,但今天的科學(xué)家們已經(jīng)可以運用各種技術(shù),去糾正“書”中出現(xiàn)的錯誤。
1、剪除錯誤并插入正確基因片段
找到“基因書”中錯誤的片段并將其精準(zhǔn)地恢復(fù)為正確的片段就是基因“編輯”。CRISPR,是基因編輯技術(shù)的一種,相比早前另外兩種基因編輯技術(shù)TALEN和ZFN,它更靈活易用,同時具有高精度和低成本等優(yōu)點。這些優(yōu)點,得益于兩個關(guān)鍵“人物”——gRNA和Cas9。gRNA,也叫向?qū)NA,顧名思義就像GPS導(dǎo)航。在“基因書”里,向?qū)NA的職責(zé)就是在浩如煙海的基因組“文字”中找到出錯的地方,然后規(guī)劃出前進路線;而Cas9,是一種核酸內(nèi)切酶,它就像剪刀,會沿著向?qū)NA規(guī)劃好的路線抵達出錯地點,然后剪開錯誤的基因片段。這就是為什么很多人稱CRISPR/Cas9基因編輯技術(shù)為“基因魔剪”的原因。
看到這里,大家也許就會產(chǎn)生一個疑問:剪開錯誤的片段,又怎么把正確的填進去呢?
這就有些類似于編輯文章。根據(jù)文字出錯方式的不同,使用不同的方法去糾正。如果是有一段錯誤的文字被放到了不該出現(xiàn)的地方,或者雖然只有一兩個錯字,但是刪掉這些錯字和它附近少量的文字反而使句子恢復(fù)原意,那就可以直接切掉不需要的文字。這也是目前臨床試驗中最基礎(chǔ)、采用最多的剪切式方案。
如果是只有一個字母錯了,可以只將這個字母改回原來正確的樣子,這要用到堿基編輯器。但如果是一小段文字都不見了,那就需要提供一份新的文稿補回去。補的方式也有不同,有一種方式叫作引導(dǎo)編輯,針對某個出錯的基因片段,科學(xué)家會讓向?qū)NA帶一段正確的RNA序列到體內(nèi),作為標(biāo)準(zhǔn)答案或模板,當(dāng)“基因魔剪”把錯誤的基因片段去除后,連在“基因魔剪”上面的分子機器逆轉(zhuǎn)錄酶會依樣畫葫蘆,照著答案模板抄一份對的DNA放回原位。另一種方式,則是由科學(xué)家在體外合成一段正確的DNA,作為正確答案本身,利用細胞自身的同源重組修復(fù)機制填入“基因魔剪”切開的位置。
因此理論上,只要知道出現(xiàn)錯誤的靶點、正確的答案以及擁有一套編輯工具,數(shù)千種由于基因出錯導(dǎo)致的疾病都可以找到治愈的辦法。但從科學(xué)理論到臨床實踐,是一個復(fù)雜的系統(tǒng)性工程,運送編輯工具進入細胞、找到并抵達發(fā)生錯誤的基因片段、切掉和修改錯誤的片段,這三個步驟所涉及的技術(shù)都大有講究。要在每一步上都精益求精,才能高效、精準(zhǔn)地把出錯的基因編輯好,完成從基因編輯工具到基因編輯藥物的轉(zhuǎn)變。
2、治療遺傳病和癌癥前景可期
已經(jīng)有極少數(shù)深受遺傳病困擾的人體驗過“基因魔剪”。
例如近期對β-地中海貧血和鐮刀狀貧血癥的基因治療方案。這兩種病都是因為編碼β-珠蛋白的基因出現(xiàn)了變異,造成血紅蛋白減少和貧血。由基因編輯技術(shù)發(fā)明人、2020年諾貝爾獎化學(xué)獎獲得者埃曼紐爾·卡彭蒂耶(Emmanuelle Charpentier)開發(fā)了一種“曲線救國”的治療方案:通過使用基因編輯技術(shù)降低另一個抑制基因的表達,來恢復(fù)γ-珠蛋白的表達,其通常是在胎兒時期才表達的,從而達到恢復(fù)紅細胞功能的目的。該方法在臨床上已獲得了初步成效,截至2020年年底已治愈了4名β-地中海貧血和鐮刀狀貧血癥的病患,幫助他們擺脫了長期輸血的負(fù)擔(dān)和并發(fā)癥的困擾。這種療法需要分離患者的造血干細胞,在體外通過電穿孔將基因編輯藥物導(dǎo)入細胞,然后再將造血干細胞植入患者體內(nèi)進行造血系統(tǒng)重建。類似的方法也可以用于其他造血干細胞相關(guān)遺傳疾病的治療。
據(jù)英國《自然》網(wǎng)站報道,2020年,一名身患萊伯氏先天性黑蒙癥(LCA10)的患者,成為接受CRISPR基因編輯藥物人體直接注射試驗的第一人。先天性黑蒙癥是一種遺傳失明癥,是導(dǎo)致兒童先天性失明的主要原因。該療法通過在視網(wǎng)膜下注射含有基因編輯藥物的腺相關(guān)病毒載體,將突變的基因內(nèi)含子片段切除或使其形成倒位,從而恢復(fù)基因的正常表達。后續(xù)更多的臨床試驗結(jié)果表明該療法對部分患者有積極的效果。
基因編輯技術(shù)更激動人心的廣泛應(yīng)用是癌癥治療領(lǐng)域。嵌合型抗原受體T細胞免疫療法(CAR-T)是通過轉(zhuǎn)基因技術(shù)將T細胞改造成針對特定腫瘤的一種新型的殺傷細胞的癌癥治療方法,在白血病、淋巴瘤、骨髓瘤等血液癌癥治療中有良好的療效。傳統(tǒng)CAR-T療法需要分離患者的T細胞,在體外進行轉(zhuǎn)基因,擴增至治療需要的數(shù)量后再輸回患者體內(nèi)。這是個漫長的過程,有可能錯過治療時機。體弱的幼兒和老年病人也可能沒有足夠的T細胞供分離。現(xiàn)在通過使用CRISPR技術(shù)將T細胞中個體識別的基因敲除,可以實現(xiàn)通用型CAR-T細胞供應(yīng),縮短治療時間并擴大適用人群。
不過這樣的好消息,在目前階段依然是罕見的。從技術(shù)到臨床,還有很長的一段路要走?;蚓庉嫾夹g(shù)還有許多值得開發(fā)和深化的地方,但是隨著科學(xué)家和創(chuàng)新藥物研發(fā)工程師的努力,相信在不久的將來,“基因魔剪”會像外科醫(yī)生手中的手術(shù)刀一樣,精準(zhǔn)、快捷和有效地將病灶清除。
3、“導(dǎo)航防護衣”還需更加優(yōu)化
還記得前文說過基因編輯的幾個步驟嗎?科學(xué)家和工程師們目前在做的就是“各個擊破”這件事。
首先,找到更先進的導(dǎo)航。假設(shè)已知某一處基因片段出錯需要通過編輯來修正,實際操作時往往需要在一定的坐標(biāo)范圍內(nèi)選擇“一刀切”的下刀位置。如果向?qū)NA足夠優(yōu)秀,它就可以規(guī)劃出一條最優(yōu)路線:比如,選擇哪個點下刀,既可以準(zhǔn)確切除錯誤片段,又不會誤傷沿途其他的基因;又比如,能夠從極其相似的兩個或幾個目的地中,辨認(rèn)出真正需要執(zhí)行編輯任務(wù)的那一個。
然后,磨出“快刀利刃”,也就是優(yōu)化出準(zhǔn)確度更高、編輯效率更高,體積更小的基因編輯蛋白。這一點比較容易理解:刀鈍,一刀下去拖泥帶水,要么沒切干凈,要么把不該切的也拉扯下來,既不精準(zhǔn)也不安全。而如果刀快,一刀下去干脆利落,只切該切的地方,才是基因編輯的理想工具。
此時,如果配上一套動力和安全性都上乘的“遞送系統(tǒng)”,就完整了。當(dāng)導(dǎo)航、手術(shù)刀和正確答案都準(zhǔn)備就緒,這些執(zhí)行編輯工作的關(guān)鍵“人物”,需要被護送進入人體并直達目的地。而這看似最平平無奇的一步,反而是整個基因編輯系統(tǒng)里相對較難的一部分。假設(shè)我們想要編輯肝臟細胞的基因,就需要將向?qū)NA和基因編輯剪刀“打包”在一個針劑里,然后通過注射的方式輸進人體內(nèi)。
這團復(fù)合物從針頭位置開始往肝臟“跑”,如果沒有保護,這些外來物在路上難免會遭到免疫系統(tǒng)的攻擊,很多時候還會去到不想讓它們?nèi)サ慕M織器官。此時,可以把“遞送系統(tǒng)”,看作給向?qū)NA和“基因魔剪”穿上了一件“導(dǎo)航防護衣”。只有當(dāng)它們抵達執(zhí)行基因編輯任務(wù)的目標(biāo)細胞時,“防護衣”才會自動脫落,釋放出一整套基因編輯工具。顯然,什么材質(zhì)適合做這件防護衣,如何避免防護衣提前脫落,這些都是需要優(yōu)化的技術(shù)要點。
4、人工智能加速開發(fā)“基因魔剪”
在已知的6000多種遺傳病中,目前只有大約幾十種被美國食品藥品管理局批準(zhǔn)的藥物,可以對其中一部分疾病進行治療,絕大部分遺傳疾病連有效的治療方案都沒有,治愈更是無從談起。由于CRISPR可以修改DNA序列,因此對主要由基因突變、缺失等造成的遺傳病來說,基因編輯技術(shù)可以為患者們帶來一線希望。
但僅僅針對某一個疾病基因,去開發(fā)一套完整的治療方案,是一項非常大的系統(tǒng)性工程。結(jié)合創(chuàng)新研究范式、基因測序高通量數(shù)據(jù)和人工智能算法,我們團隊正在搭建一個AI助力的基因編輯工具開發(fā)平臺,全方位優(yōu)化CRISPR系統(tǒng),篩選開發(fā)出更多的對癥基因治療方案,同時使這項技術(shù)可以更精準(zhǔn)、更安全地在人體內(nèi)發(fā)揮作用。
就像用不同的導(dǎo)航會有不同的推薦路徑,使用不同的向?qū)NA編輯同一個基因會有不同的編輯效率和脫靶率,而同樣的CRISPR系統(tǒng)編輯不同的基因,效率有時候也會有巨大的差異。這些差異是由目標(biāo)基因序列決定的。而從海量的基因序列—編輯效率所對應(yīng)的數(shù)據(jù)中,找出潛在規(guī)律并用于預(yù)測和設(shè)計新的向?qū)NA,正是人工智能所擅長的。這些問題出現(xiàn)在基因編輯三部曲的每一個大小環(huán)節(jié)。生物數(shù)據(jù)的產(chǎn)出能力在目前階段是有限的,但是實驗室正在產(chǎn)出龐大的高質(zhì)量體內(nèi)數(shù)據(jù)集合,為構(gòu)建人工智能模型提供了更為真實可靠的訓(xùn)練集。將人工智能應(yīng)用于基因和細胞治療領(lǐng)域,我們需要以數(shù)據(jù)為核心,開發(fā)適用于此應(yīng)用場景的人工智能算法,對數(shù)據(jù)深度學(xué)習(xí),建立起一套適合于某種疾病的基因治療模擬平臺。
依靠現(xiàn)代數(shù)據(jù)連接和人工智能算法所具有的獨特能力,可以保持生物事件的實時和動態(tài)性。由此對非線性功能關(guān)系進行建模,可以有效提高模型與過程的匹配度。例如,美國博德研究所(Broad研究所)的David Liu團隊及其他研究人員創(chuàng)建了一種機器學(xué)習(xí)模型,并已于2018年11月7日在《自然》上發(fā)表。該模型可以理解為人工智能,實現(xiàn)了高精度地預(yù)測人類和小鼠細胞如何響應(yīng)CRISPR誘導(dǎo)的DNA斷裂。他們證明即使沒有模板,Cas9編輯也是可預(yù)測的,并且能夠精確修復(fù)預(yù)測的基因型,從而糾正與人類疾病相關(guān)的突變。在這些領(lǐng)域,中國的科學(xué)家團隊也已經(jīng)逐漸接近世界最好的水平。
這種逐漸興起的科學(xué)研究和藥物開發(fā)范式,深度結(jié)合高通量實驗數(shù)據(jù)與人工智能模型,通過數(shù)據(jù)特征的提取和模型的不斷優(yōu)化,實現(xiàn)從靶點發(fā)現(xiàn)、新編輯工具開發(fā)、新靶點基因治療策略開發(fā)到最終成藥的一體化技術(shù)。最終將打通人工智能結(jié)合生物學(xué)數(shù)據(jù)進行CRISPR系統(tǒng)開發(fā)的全流程,加快遺傳病、癌癥等治療方案的開發(fā)速度,讓更多期待被救治的病患,能有機會獲得更有質(zhì)量的生活。
版權(quán)聲明:凡注明“來源:中國西藏網(wǎng)”或“中國西藏網(wǎng)文”的所有作品,版權(quán)歸高原(北京)文化傳播有限公司。任何媒體轉(zhuǎn)載、摘編、引用,須注明來源中國西藏網(wǎng)和署著作者名,否則將追究相關(guān)法律責(zé)任。