《Nature》性突破!性DNA科技或将革了中国首富马云的命!DNA将储存天量数据,是时候一下互联网了

  在中国混互联网行当,要是不说出“”两个字,貌似就不好意思说自己是搞互联网的。曾几何时,中国互联网一些从业者竟然到说出“互联网将一切”行业的梦话。

  不过,互联网确实已经深度地改变了这个世界,尤其是我国早已被互联网深度重塑。然而,你互联网光想着别人,就没有想过被别人?

  ▲由大学以及微软研究院的科学家在国际著名期刊《自然-生物技术》发表的文章(图片来自Nature)

  最新一期的国际著名期刊《自然-生物技术》发表一篇重磅文章,由大学(University of Washington)和微软研究院(Microsoft Research)的科学家合作将DNA存储数据的容量提升到人类前所未有的新水平,为解决人类巨量大数据困扰提供了新思【1,2,3】。

  自从人类发明了电之后,貌似人类取得的几乎所有的成就都建立在电力之上,互联网这项伟大的成就亦如是。

  这就是互联网干不过供电所的原因,你不听话,我就断你的电,你互联网任由我拿捏;想当年谷歌自诩为天下第一,但是最终又怎样?在供电所面前只能认怂,断了你的电,看你还能不能上网。

  的确,没有数据的存储便没有互联网的发展壮大,也没有如今已成香饽饽的大数据产业。你以为你发的微信小视频等等都是游走在缥缈的互联网之中吗?你以为“云存储”就真的是一朵漂浮在互联网之中的“云”吗?

  这些数据都是存储在相关公司比如腾讯、阿里巴巴、谷歌等的数据中心。什么是数据中心,说白了,就是一幢幢塞满了硬盘的建筑,互联网上的数据或者手机APP采集的数据等等都会传送到这里存储起来。

  古时候由于存储数据的介质为布、丝绸、纸等等,人们不能想存储数据就能够存储数据,买纸、布等都需要花钱,“洛阳纸贵”在所难免。难怪古时候的人们留下来的文字及图画(相当于现在存储的数据)都是相当精辟的,短小精悍,很少有废话。

  ▲千古名篇《兰亭集序》,王羲之把数据存储在“纸”这种介质上,而互联网则是将数据存储在“硬盘”这种介质上(图片来自网络)

  而进入互联网时代之后呢?绝大多数都是如同垃圾一般的废话,这些没用的废话也竟然存储了起来,想一想微信每天要说多少废话就知道了。

  根据美国这方面的权威IDC以及EMC公司的调查,2017年,全世界的数据总量是16ZB(Zettabyte,十万亿亿字节,泽字节),而到了2020年,全世界的数据总量将达到44ZB。

  要知道全球最大的云存储公司:亚马逊Amazon的数据存储中心的硬盘数量也只够存储到EB(Exabyte,百亿亿字节,艾字节)级别的数据,而1ZB=1024EB,44ZB就等于45056EB,若是按照这个数据量,到了2020年,全球的数据量需要现在的四万五千个亚马逊公司。

  ▲亚马逊老总光头司令杰夫·贝佐斯(左);无人不识、霸气侧漏、身材苗条的马首富(中)以及外星人(右)

  难怪马云要在大数据云存储这一块投入巨资,经过几年的艰苦创业,阿里巴巴已经成为与微软、亚马逊并列的世界大数据云存储三大巨头,由此,不得不惊叹马首富的眼光和嗅觉是多么地超前!堪比外星人!不,惊为外星人!

  你比如曾经多么不可一世的霸主移动、联通等等通信公司,好像没你就不行似的,结果怎样?一家叫做“企鹅”的外行企业就把你轻而易举了!

  人类的数据量达到所说的天量级别,如何存储呢?难道真的要建设几千个亚马逊公司或者几千个阿里巴巴?

  而DNA存储提供了一种可能性,而且,能够解决困扰人类多年的上述问题,为何?那你就可以问一下存储人类的所有数据(digital data)需要多少DNA呢?

  ▲各种存储介质的比较,存储全世界的数据仅需要1公斤DNA,就像一袋子洗衣粉大小(图片来自Nature)

  你说,你是花费巨资建设几千个阿里巴巴来装数据,还是愿意把全世界的数据一次性装在手提袋中,轻而易举地就搬动了天量的数据?恐怕连小学生都能够判断得了。

  众所周知,互联网存储数据都是以0和1来表示的,每个字母和标点符号都有对应的唯一的0和1组成(ASCII码表),比如小写字母“f”的代码是:01100110,因此,一个英文单词或者其他内容均可对应成一连串的0和1。

  ▲其中一种DNA编码存储的原理示意图,首先把英文字母转变成对应的0和1,然后把0和1转变成碱基A、T、C、G,具体而言,0可以用碱基a或者碱基c表示,而1可以用碱基G或者碱基T表示;编码的时候合成序列,解码的时候测序解读(图片来自Science)【4】

  然后,再把0和1转变成碱基A、T、C、G,具体而言,0可以用碱基a或者碱基c表示,而1可以用碱基G或者碱基T表示;编码的时候合成序列,解码的时候测序解读。

  由于1克DNA就有极其庞大的碱基,1克DNA就能够表示4.5乘以10的20次方字节的数据【4】,多么地惊人!而1克DNA有多少呢?就如一小勺盐一样多!

  事实上,这篇由大学(University of Washington)和微软研究院(Microsoft Research)的科学家合作的关于DNA存储的研究早在2016年就已经有出来了。

  只不过,当时并没有发表论文而已,只是公布了他们的存储结果达到了人类这方面前所有未有的高度,能够以DNA存储超过200MB的数据。

  ▲这篇研究和之前的DNA存储研究的主要参数对比,这篇研究取得的最重要突破恐怕就是其存储容量远远超越了以前的存储容量,超过200MB数据存储容量(图片来自Nature)

  尽管200MB目前看起来比起硬盘存储容量简直小的可怜,然而,飞速发展的DNA存储领域恐怕也满足摩尔定律。

  “在这篇文章发表之时,我们实际上已经能够获得能够超过400MB大小的存储容量了,”文章的通讯作者Luis Ceze教授说到。

  “我们正处于一个交叉学科研究取得许多开创性突破的时代,”文章的第一作者Lee Organick说到。

手机正文底部

您可以还会对下面的文章感兴趣:

  • 科学家发明细胞高速识别技术
  • 助人体吸收铁 新研究找到大肠杆菌“益处”
  • 研究称喝酒无论多少都对健康有害
  • 抽血可提前5年预测肾癌
  • 5-HT系统介导肝脏2型糖尿病相关的病理改变
  • 最新评论