新方法實(shí)現(xiàn)DNA信息存儲(chǔ)陰陽(yáng)雙編碼
近日,深圳華大生命科學(xué)研究院研究員沈玥團(tuán)隊(duì)與合作者在《自然計(jì)算科學(xué)》上發(fā)表封面文章,為DNA信息存儲(chǔ)的應(yīng)用提供了一種高密度、高穩(wěn)定性的比特—堿基編解碼方法,并完成體內(nèi)外兩種模式的信息存儲(chǔ)實(shí)驗(yàn)驗(yàn)證。
該論文的通訊作者沈玥告訴《中國(guó)科學(xué)報(bào)》,他們將DNA雙鏈模型與中華文化中“陰陽(yáng)”對(duì)立統(tǒng)一的思想相結(jié)合,巧妙地將其應(yīng)用于DNA編解碼系統(tǒng),以兩套不同的規(guī)則,分別對(duì)兩條二進(jìn)制信息進(jìn)行“一對(duì)一”編譯轉(zhuǎn)換,再取兩者統(tǒng)一交集的部分為最終解,實(shí)現(xiàn)將兩條獨(dú)立的信息組合統(tǒng)一為一串DNA序列。
與此同時(shí),研究人員通過(guò)引入篩選機(jī)制,將與現(xiàn)有合成測(cè)序技術(shù)兼容性不佳的序列通過(guò)預(yù)先設(shè)置的篩選條件進(jìn)行過(guò)濾。根據(jù)不同的組合方法,該系統(tǒng)共能提供1536種不同的編碼規(guī)則組合,大大擴(kuò)展了其應(yīng)用場(chǎng)景范圍。
研究人員還通過(guò)編碼學(xué)的理論推導(dǎo)及不同數(shù)據(jù)類型文件的模擬編碼,證明了該系統(tǒng)在保證信息密度的前提下,在數(shù)據(jù)恢復(fù)穩(wěn)定性方面有顯著的性能提升(存儲(chǔ)數(shù)據(jù)的平均恢復(fù)率較DNA噴泉碼現(xiàn)有水平提升近兩個(gè)數(shù)量級(jí))。
論文共同第一作者、深圳華大生命科學(xué)研究院助理研究員平質(zhì)告訴記者,他們還測(cè)試了該系統(tǒng)在酵母細(xì)胞內(nèi)存儲(chǔ)、傳代后的數(shù)據(jù)恢復(fù)穩(wěn)定性。結(jié)果證明,作為載體的酵母菌株經(jīng)過(guò)1000代以上的傳代,信息仍可以被完整恢復(fù),該存儲(chǔ)方式接近天然DNA分子存儲(chǔ)物理信息密度的理論極限,每克DNA能存儲(chǔ)的信息量約為 432.2EB。
該研究開發(fā)了一種全新的DNA存儲(chǔ)編碼方法,并提出1536種不同編碼規(guī)則組合的方案,為DNA存儲(chǔ)的多類型應(yīng)用提供了重要工具,有望在海量數(shù)據(jù)長(zhǎng)期存儲(chǔ)的新型介質(zhì)研究中起到積極的推動(dòng)作用。
記者田瑞穎
版權(quán)聲明:凡注明“來(lái)源:中國(guó)西藏網(wǎng)”或“中國(guó)西藏網(wǎng)文”的所有作品,版權(quán)歸高原(北京)文化傳播有限公司。任何媒體轉(zhuǎn)載、摘編、引用,須注明來(lái)源中國(guó)西藏網(wǎng)和署著作者名,否則將追究相關(guān)法律責(zé)任。