ZKX's LAB

世界上一年的存储需求可以通过一个边长约一米的DNA立方体满足

2020-07-26新闻17

据软件公司Domo统计,2018年,平均每分钟,谷歌进行388万次搜索,人们在YouTube上观看了433万段视频,发送了159,362,760封电子邮件,在twitter上发了47.3万次推特,在Instagram上发布了4.9万张照片。据估计,到2020年,全球每人每秒将产生1.7兆字节的数据,也就是说,假设世界人口为78亿,那么一年就会产生418兆字节的数据(相当于4180亿1tb硬盘的信息)。如果是这样的话,目前存储0和1容量的磁性或光学数据存储系统通常不能持续超过一个世纪。此外,运行数据中心需要大量的能量。简而言之,我们即将面临一个严重的数据存储问题,随着时间的推移,这个问题只会变得更加严重。

硬盘驱动器的另一种替代方案正在取得进展:基于DNA的数据存储。dna是由长链的核苷酸A、T、C和g组成的生命信息存储物质。数据可以按照这些字母的顺序存储,将DNA转化为一种新的信息技术形式。它已经很容易地按常规顺序(读)、合成(写)和精确复制。DNA也非常稳定,就像50多万年前的一匹化石马的完整基因组测序所证明的那样。而且储存它不需要太多的能量。

但最引人注目的是存储容量。DNA能够以远远超过电子设备的密度准确地存储大量数据。例如,根据哈佛大学乔治·丘奇及其同事2016年在《自然材料》杂志上发表的计算,简单的大肠杆菌的存储密度约为每立方厘米10^19位。在这样的密度下,世界上目前一年的存储需求可以通过一个边长约一米的DNA立方体很好地满足。

DNA数据存储的前景不仅仅是理论上的。例如,在2017年,哈佛大学丘奇的团队采用CRISPRDNA编辑技术,将人类手的图像记录到大肠杆菌的基因组中,其读取准确率超过90%。华盛顿大学和微软研究院的研究人员开发了一套完全自动化的系统,用于书写、存储和读取DNA编码的数据。包括微软和TwistBioscience在内的许多公司都在致力于推进DNA存储技术。

与此同时,DNA已经被研究人员用来以一种不同的方式管理数据,这些研究人员正在努力弄清海量数据的意义。新一代测序技术的最新进展使得数十亿个DNA序列能够被轻松地同时读取。有了这种能力,研究人员可以使用条形码——利用DNA序列作为分子识别“标签”——来跟踪实验结果。DNA条形码正被用于大大加快化学工程、材料科学和纳米技术等领域的研究步伐。例如,在乔治亚理工学院,詹姆斯·达尔曼的实验室正在迅速确定更安全的基因疗法;其他人正在研究如何对抗耐药性和预防癌症转移。

让DNA数据存储变得普遍面临的挑战之一是读写DNA的成本和速度,如果要与电子存储竞争,读写DNA的成本和速度需要进一步降低。即使DNA没有成为一种无处不在的存储材料,它也几乎肯定会被用于以全新的规模生成信息,并长期保存某些类型的数据。

#数据存储#世界#立方体

随机阅读

qrcode
访问手机版