微软详细介绍了其合成DNA 存储工作的重大突破,特别是在提高数据吞吐量方面。概念验证是微软研究院和华盛顿大学分子信息系统实验室 (MISL) 团队的一项新研究的主题,为未来世界数据存储在实验室制造的 DNA 上铺平了道路,而不是磁带和硬盘驱动器。
旧技术仍占主导地位
微软多年来一直致力于合成 DNA 数据存储,这是一项很有前途的技术,旨在满足不断增长的存储需求。该公司以当前和未来的数据需求为中心描绘了一幅精心设计的图景,即已经存在的大量信息、每天产生的信息量以及未来两年的增长预测。
根据 IDC的数据,假设这些预测是准确的,到 2024 年,全球将有大约 8.9 ZB 的数据存储。这相当于大约 900 万 PB 的数据,这仍然超出了普通人的想象。微软将这个数字转化为一个更相关的上下文:一个 zettabyte 相当于在超过 150 亿台计算机上安装 Windows 11。
通常使用多种类型的数据存储,尽管在这一点上它们似乎过时了,但由于其密度(通过IBM),磁带盒仍然是最具吸引力的商业选择。
磁带已经存在了几十年,为产生大量数据的公司提供了一些明显的好处:它们有助于保护信息免受黑客攻击,并且可以将数百 TB 的数据打包到一个小尺寸中。IBM 表示,一个采用其最新技术的磁带盒容量为 580TB,这将需要超过一百万张 CD 的四分之三来存储。
使用盒式磁带进行数据存档是一种会持续多年的做法,但对现代替代品的强烈需求,它提供更高的密度,同时消除了许多旧技术的问题。微软表示,这就是合成 DNA 数据存储的用武之地。
为什么是 DNA?
磁带最多每三年左右需要重写一次,这对于长期数据归档来说是很短的时间。微软表示,另一方面,合成 DNA 更耐用,有可能将数据保存数千年。最重要的是,合成 DNA 可能会大大减少数据中心对环境的影响,微软引用的证据表明,水和能源的使用量减少,温室气体排放量也减少了。
然而,只有解决了某些大的障碍,合成 DNA 数据存储才能成为一个可行的选择。该技术目前受到低数据吞吐量的限制,特别是数据写入的速率。微软指出,这是大规模合成 DNA 存储的一大绊脚石,更不用说与该技术相关的成本了。
新宣布的突破围绕吞吐量展开,展示了概念验证的分子控制器。研究人员将这一创新描述为“芯片上的微型 DNA 存储写入机制”,它极大地改善了 DNA 合成点的紧密排列。结果证明更高水平的写入吞吐量是可能的。
从本质上讲,合成 DNA 存储涉及将数据从分子到位来回移动。微软解释说,要使 DNA 成为可行的商业规模存储选项,有两点至关重要:
该公司在一篇新的博客文章中详细介绍了合成 DNA 存储所涉及的新发展和更广泛的过程。在 DNA 中存储数据需要将信息(以数字位的形式)嵌入到 DNA 序列的 A/C/T/G 碱基中。然后合成 DNA 链,这通常涉及光化学过程。
Microsoft 继续解释说,电化学 DNA 合成避开了光化学固有的一些限制;它涉及阵列、电极和阴极。新工作详细介绍了一种合成方法,该方法成功地提高了将数据写入合成 DNA 的速度,从而提高了吞吐量,并通过代理降低了与合成 DNA 相关的成本。