前沿!希捷DNA存储芯片技术探索
2022-10-05 00:59:36
  • 0
  • 0
  • 2

来源:半导体产业纵横

本文由半导体产业纵横(ID:ICVIEWS)编译自blocksandfiles

这是非常前沿的纳米级电化学阵列科学,距离制造 NAND 和 DRAM 芯片所涉及的半导体技术还有很长的路要走。

希捷的 DNA 存储芯片实验室技术表示口香糖卡大小的 DNA 存储读取器和写入器可以将 DNA 存储 IO 加速一个、两个或更多因素。

Catalog DNA 存储技术基于将二进制数据编码到四组分核碱基 DNA 双螺旋分子中。Catalog 使用大约 200 个预先合成的 DNA 序列,即寡核苷酸,它们的长度为 30-40 个碱基对,类似于字母表中的字母。它们连接在一起形成数十亿字,IT存储语言中的字节。这些 DNA 序列被干燥并储存在颗粒中,信息密度为 200PB/克或更高,寿命约为 1000 年。

读取数据意味着从颗粒中重新水化一些 DNA 粉末或薄片,然后对其进行测序以找到核碱基含量,然后再从中恢复二进制数据。涉及大量流体传输和处理,并且正在使用现有的微流体研究数据。这设想了飞升大小的液滴,其中飞升为10 -15升。这使得一毫微微升是美国升的万亿分之一(十亿分之一)。

希捷向Blocks & Files简要介绍了其芯片实验室研究以及与 Catalog 合作开发DNA 存储技术的情况。我们有兴趣了解为什么磁盘驱动器制造商希捷会对 DNA 存储感兴趣,因为该技术与磁盘驱动器完全不同并且处于科学研究的最前沿。

研究副总裁 Ed Gage 表示,希捷精心打造了存储世界数字数据的数据领域。数据领域正在增长到 zettabyte 级别,DNA 存储有望在非常少量的液体中存储 TB 级数据,从而提供 EB 级到 zettabytes 信息的存储容量。

微软在 12 月发表的一篇论文指出:“要存储 9 ZB 的信息,需要数百万个磁带盒(目前最密集的商业存储介质),而如果存储在 DNA 中,则需要一个小冰箱的空间。”每立方英寸超过 1 艾字节。

Gage 谈到了最初的愿景:“我认为最初的愿景......看起来就像一个磁带驱动器,带有非常非常小的磁带盒,可能已经干燥,因此它们可能根本没有流动性。它们被晒干并存放在图书馆中。我们还有一些其他存储介质,可能是 HDD,位于它前面,用于跟踪所有元数据。”

片上实验室的大小就像一个 M.2 2280 口香糖 NAND 驱动器,Gage 说:“随着我们扩大规模,它可能会变得更大。但这就是今天的规模。”

它将用于创建用二进制数据编码的 DNA 序列,研究工作正在寻找加快写入(创建 DNA 序列)和读取(对 DNA 测序)过程的方法。

提高写入速度

希捷生化工程师 Gemma Mendonsa 说:“我们基本上是在寻找利用化学方法提高写入速度的方法,缩短将 DNA 片段组合在一起所需的时间,因为现在速度非常慢……超过今天的写入速度,我们需要几个数量级的改进。”

Catalog 寡核苷酸概念提供了这样做的范围。Gage 说:“我们没有写一个核苷酸,而是写了一种几何级数的写法,我们认为这种写法可以大大加快速度。” 他提到了实现这一点的链接器库概念:“使用链接器库进行汇编可以让我们以几何方式构建,而不是一次构建一个。”

Mendonsa 解释说:“在传统的 DNA 合成化学中……亚磷酰胺化学中,将一个核苷酸添加到一条 DNA 链中大约需要两到三分钟……如果你可以制造出一堆核苷酸或寡核苷酸,那么速度会快很多。DNA 片段,它们都是相同的序列,并将这些不同的序列存储在某种库中。然后在需要时将它们拉出,并以正确的顺序将它们拼凑在一起。因此,如果你能做到这一点,你就有了长度为 L 的 DNA 链,你可以一次组装 10 条。所以现在你有一条长度为 10 L 的线,然后你将其中的 10 根线聚集在一起形成一个解决方案。所以你现在有一个 100 L 的字符串。”

如果我们将其中的 10 个加在一起,我们就有 1,000 个 L。Gage 说这还不够:“我们需要超越这个范围。我们可能还得再走一两步。”

微软 DNA 存储论文预计,DNA 电化学阵列技术将使“合成吞吐量在单个写入模块中达到每秒兆字节的水平”。这是在 2 到 3 分钟内写入一位的巨大改进。

液滴流量

这些 DNA 链在芯片实验室飞升大小的液滴中漂浮在液滴中。Gage 说:“我们实际上正在资助工作以帮助我们解决液滴交通问题。当您对所有这些液滴进行路由时,除非您想混合它们,否则它们不会相互碰撞。这确实是一个非常复杂的交通问题,我们正在努力解决。”

这是否意味着实验室芯片包含晶体管?不,Gage 说:“液滴在电极网格上移动并且液滴高速飞行。但是,要达到我们需要的速度,仍有许多挑战需要解决;可以在有限的时间内写入 PB 的东西。”

Mendonsa 说:“任何类型的液体处理设备都可能非常复杂。只需将其放入芯片实验室,而不是配备液体管线和分配喷嘴之类的东西。”

和盒式磁带的类比

让我们试着用盒式磁带的类比来理解读取过程。磁带在数百米长的带有平行数据磁道的磁带上具有起点和终点。

从颗粒中取出几片干燥的 DNA 并将其重新水合。人们看到的是一定量的液体,其中漂浮着 DNA 链,研究者需要对其进行读取以对其进行测序。如果用盒式磁带的术语来说,这就像将一条数百米长的色带剪成数百万条,然后将它们扔进一碗水中。然后研究者走到磁带机前说:“嘿,读这个。如果可以的话,弄清楚它的起点在哪里,以及所有小片段的正确顺序。”

并非如此,门多萨说:“目前有相当多的研究论文,微软对此也有一些论文。其他大学也在研究如何搜索存储在 DNA 中的数据并提取出你需要的部分。

“DNA是由两条杂交在一起的链形成的,它们相互补充。所以你可以想象,如果你想提取一些特定的东西,比如你想用特定的搜索词搜索某个文件,你可以将它编码成一段 DNA。它会与任何与之匹配的东西杂交。然后你就可以把它拉出来。如果您只需要几个文件,则不必对整个事情进行排序。你可以利用 DNA 的特性来提取你想要的文件。”

原型

希捷有一个原型芯片实验室。整个系统架构仍在开发中。例如,干燥应该在实验室芯片上进行还是在单独的过程中进行?然后是判断污染的可能性。一旦组件过程完成,所涉及的流体可能会留下痕迹。

Mendonsa 说:“污染是我们在芯片实验室上必须努力避免的事情之一,特别是因为我们不希望它成为一次性设备。那将是非常昂贵的。我们已经探索了不同种类的净化或清洁解决方案,我们可以使用这些解决方案来防止污染,或者在我们进行反应后进行清理。”

想象一个可机架的 DNA 存储设备,它会有一个有保障的工作寿命。这意味着实验室芯片必须持续这么长时间。他们必须装载足够的化学品才能在这段时间内完成工作。

这是非常前沿的纳米级电化学阵列科学,距离制造 NAND 和 DRAM 芯片所涉及的半导体技术还有很长的路要走。

 
最新文章
相关阅读