分子生物学可以成为数据存储的关键
阿尔伯特爱因斯坦被认为是“让事情变得简单,但从不简单。”对于一个关于技术和科学的专栏作家以及他们与商业和人类的交集,这是一个很高的要求。今天的技术在某些领域已经发生了变化进入幻想领域,解构一些进步的强大概念绝非易事,特别是对于像我这样充其量只是见证的人。
使人工智能成为当今强大工具的主要贡献者之一是我们已经达到的高级计算水平。我们大多数人拥有智能手机,这些智能手机拥有的计算能力超过50年前登陆尼尔阿姆斯特朗登月的能力。正在努力不断提高这种能力,研究人员正在寻求在量子计算中取得的进步就是其中之一。
另一个轴心是我们咳嗽的数据不可避免的增长,其中一些是自愿的,而且很多是非自愿的,为了现在控制着我们世界的大科技公司的利益。这些数据来自我们不断增加的互联网使用。这导致了一种称为“数据泛滥”的现象,即企业正在收集大量关于客户和运营的数据,但还不知道如何处理它。同时,根据咨询公司Ark Invest,这样的数据是预计到明年年底将增长到44个zettabytes,并且可以包含所有这些数据的计算机存储空间的不足将增长到500%,这意味着它的大部分都无法存储并且将变得无用。
分子生物学可能会得到拯救。事实证明,大自然母亲的DNA是击败所有计算机的数据存储机制。据New Scientist称,1克DNA可以容纳455艾字节的数据(1个zettabyte中有1,000艾字节)。这意味着到明年年底生产的所有44个zettabytes数据实际上可以存储在仅97克的DNA上。
有4种类型的分子构成DNA,形成对。为了对DNA信息进行编码,科学家将这些对编程为1和0,即编码数字数据的相同二进制语言。这个概念并不新鲜;哈佛大学的科学家在2012年编写了一本关于DNA的书,但到目前为止,很难找到存储在DNA中的信息。
现在,微软公司和华盛顿大学的研究人员声称已经展示了第一个在制造的“合成”DNA中存储和检索数据的全自动系统 - 这是将技术从研究实验室转移到商业数据中心的关键步骤在有用的条件下,DNA可以持续比目前可以在几年内降解的计算机存储技术更长的时间。正如我们所知,一些DNA在早期的骨骼中已经设法在不太理想的存储条件下持续了数万年。人类,如最近在阿尔卑斯山深处冻结的人。
3月21日在Nature的“科学报告”杂志上发表的一篇新论文中描述了一个简单的概念验证测试,该团队成功编写了“HELLO”这个词,用于制作DNA的片段并使用它将其转换回数字数据。一个完全自动化的端到端系统。使用这个原型系统,团队存储并随后检索5字节“HELLO”(01001000,01000101,01001100,01001100和01001111位)。这需要大约21个小时才能完成。
信息存储在实验室中创建的合成DNA分子中,而不是从生物中获取的DNA,并且可以在发送到系统之前进行加密。虽然合成器和测序仪等复杂的机器已经执行了该过程的关键部分,但到目前为止,许多中间步骤都需要在研究实验室中进行手工操作。这在商业环境中是不可行的,但正在努力使其自动化。
自动化DNA数据存储系统使用由Microsoft和华盛顿大学团队开发的软件将数字数据的1和0转换为DNA的4个分子构建块。在将文件写入DNA之前,必须首先将其数据从1和0转换为所谓的DNA的As,Cs,Ts和Gs。
该团队声称,它随后使用廉价的,基本上现成的实验室设备将必要的液体和化学品流入合成器,该合成器构建制造的DNA片段以将其推入储存容器。当系统需要检索信息时,它添加了其他化学物质以准确地准备DNA并使用微流体泵将液体推入系统的其他部分,“读取”DNA序列并将其转换回计算机可以理解的信息。
研究人员表示,上述项目的目标不是要证明系统能够以多快的速度或低成本运行,而只是为了证明自动化是可行的。虽然21小时内微不足道的5个字节在商业上不可行,但研究人员表示,在此类数据存储方面存在许多数量级改进的先例。此外,与基于硅的计算系统不同,基于DNA的存储和计算系统必须使用液体来移动分子。流体本质上与硅的电子不同,需要全新的工程解决方案。
尽管如此,这项研究在生物学和计算机的交叉点开辟了一个迷人的新侧翼。