化学合成方法|将四字校训变成DNA序列进行存储读取

当摩尔定律逐渐接近极限时 , 寻找新的存储介质就显得迫在眉睫 。 12月5日 , 采访人员从东南大学获悉 , 该校师生将“止于至善”的校训翻译成英文后进行四进制编码 , 并以DNA(脱氧核糖核酸)分子形式存储在电极表面 , 再最终读取出来 , 这引发了未来对高通量自动化DNA存储的无限想象 。 相关成果近日发表于国际学术期刊《科学·进展》上 。
由于生物技术的进步 , 特别是高通量DNA测序和合成技术的进步 , 以前只出现在科幻小说中的DNA数据存储技术正在兴起 。 DNA是大多数生物的最核心遗传物质 , 它记录着一个生命所有的遗传密码 。 在这串密码中 , 有4种关键的碱基 , 即脱氧核苷酸A(腺嘌呤脱氧核苷酸)、T(胸腺嘧啶脱氧核苷酸)、C(胞嘧啶脱氧核苷酸)、G(鸟嘌呤脱氧核苷酸) 。
“DNA本来就是活体生物用来存储生物基因数据的 , 以DNA分子为基础的数据存储系统 , 近年来被认为是解决未来‘数据危机’的一个可行方案 。 ”论文通讯作者、东南大学生物科学与医学工程学院教授刘宏告诉科技日报采访人员 。
“目前的信息都存储在芯片等磁性材料上 , 缺点是存储密度不高 , 很难突破纳米级别 。 而DNA的分子尺度在纳米级以下 , 如果能实现存储 , 那么存储密度将比现在大1000倍 , 存储时间长、耗能小 。 ”刘宏介绍 , 现有DNA存储系统大多基于“编码—合成—储存—测序—解码”的操作流程 , 需要大型仪器和专业技术人员的参与 。
为了实现DNA存储的微型化、集成化和自动化 , 刘宏带领团队研发了一种新的技术路径 。 “通俗地说 , DNA的4种碱基A、T、C、G , 就相当于二进制的0和1 , 通过它们的不同组合 , 就可以编码不同的信息 。 ”刘宏解释 , 在论文提及的实验中 , 他们将东南大学“止于至善”的校训翻译成英文“Rest in the highest excellence” , 而每个字母都可以进行二进制编码 , 研究团队把二进制数据转化为四进制数据 , 存储在电极上合成的一个个DNA分子中 。 读取信息时 , 团队通过算法再将四进制数据转化为二进制数据 , 最终获取结果 。
如何让A、T、C、G按照给定的信息排列组合 , 从而实现信息的传递?刘宏说 , 他们通过电化学脱保护技术改进了传统亚磷酰胺化学合成方法 , 将A、T、C、G放在一种特殊的溶液中 , 通过其与溶液的化学反应 , 让它们按照特定规则串联起来 , 再基于电荷振荡现象对电极表面的DNA分子进行测序 , 以读取存储在DNA中的信息 。
“这项技术的核心是将信息的读、写集成在一起 。 由于分子信号很微弱 , 所以如何在电极上稳定地读取微弱信号 , 就比较有挑战 。 ”刘宏说 。
目前 , 这项技术还处于实验室阶段 。 刘宏坦言 , DNA存储想进入商用 , 还亟须改进溶液的化学合成方法 。

推荐阅读