大肠杆菌可以将电脉冲转化成存储在其基因组中的DNA片段。(图片来源:Sproetniek/iStock)
“Hello World!”是许多程序员的第一行代码,但你见过从活的生物体内读出的“Hello World!”吗?哥伦比亚大学的一个研究小组做到了,他们把数据写入活细菌的DNA,相关研究11日发表在《自然-生物化学》上。
对数据存储而言,DNA在许多方面都很有吸引力。比如,相较于目前结构最紧凑的硬盘,DNA的密度是前者的一千倍以上,在一粒盐大小的面积上能存储10部完整的数字电影。而且,DNA在生物学中的重要性不言而喻,随着时间推移,读取和写入DNA的技术终将迎来实用性更强、成本更低的那一天。
实际上,用DNA存储数据并不是个新点子。据《科学》报道,研究人员通常将二进制语言0和1转换为DNA的4个碱基AGCT(腺嘌呤,鸟嘌呤,胞嘧啶,胸腺嘧啶),再用合成器将代码写入DNA。
但这种方法也有缺点,DNA合成的准确性会随着代码获取时间的延长而降低,研究人员不得不将文件拆成多个部分,然后分别将其写入200-300个碱基长度的DNA片段内。为了标识它们在文件中的位置,研究者给这些片段都加了索引,当测序仪读取时这些片段得以重新组装。按该方法,1兆位信息合成的成本高达3500美元,而装在小瓶子里、存储着信息的DNA还会随时间降解。
一直以来,研究人员都在寻找更持久、更易于编码的方法。此次新发布的研究中,研究人员可将大肠杆菌及其携带的信息添加到正常土壤微生物的混合物中,通过对混合物测序,以获取先前存储的内容。
论文通讯作者、哥伦比亚大学系统生物学系的Harris H. Wang早在2017年就和课题组成员探索将数据写入或生物体DNA的方法,他与合作者曾利用基因编辑CRISPR系统识别生物信号,成功鉴定出果糖的存在。
当果糖被添加进入大肠杆菌细胞中时,基因表达在质粒(一种环状DNA)中增加。接着,CRISPR系统中的成分进化为防御病毒入侵的细菌,将过表达的质粒切成碎片,并将其中一些碎片放入细菌DNA的特定部分,以“记住”先前的病毒入侵者。插入的遗传位代表二进制里的1,如果没有果糖信号,细菌会存储随机的DNA片段以表示二进制中的0。对大肠杆菌DNA测序后,这些信息即可被读取。
之后,为了加大数据存储量,研究团队用电子输入替代了果糖识别系统,他们将一系列基因插入大肠杆菌,让细胞能响应电压、增加质粒表达,表达增加后,这些被数字化的表达物就能存进细菌DNA。为了读取存储内容,研究人员对细菌测序即可。
Harris H. Wang表示,将数据存储在活的生物体中还为时过早,他们也不会与当前的存储系统发生竞争。未来,他和更多研究者还需要想出改进办法,比如防止细菌复制时发生突变导致降解。(来源:中国科学报 袁柳)