把基因组上传到云端

  近日,Google正式推出了Google Genomics,这一产品可以让科学家把基因组数据存储在云端,并对DNA序列进行研究和共享。

  其实从18个月前,Google就开始着手Google Genomics的建立了,包括会见科学家,以及搭建界面和应用程序接口。凭借这些,Google可以将DNA数据存储在自己的服务器集群上,并利用这些数据进行实验。其中用到的数据库技术与Google索引和用户追踪技术相同。

  随着实验室不断引进速度更快的新设备来解码DNA,数据量正在经历一种爆发式的增长。例如州一家研究所在10月份时,每32分钟就能解析出约等于一个人的基因组的数据,相当于200TB的原始数据。不过,这点数据量和这些互联网公司每天处理的数据相比,还是要小得多——YouTube一天的上传量就相当于该研究所2个月的数据量。

  这些超出任何个人的处理能力的海量数据必须要有一个数据中心。美国国家癌症研究所就表示,将斥资1900万美元,把约2.6PB(1PB=1024TB)的癌症基因组图谱上传至Google Genomics和亚马逊的数据中心。这样做的目的在于打造一个“癌症基因组云数据库”,科学家可以借助这一平台,像使用网页搜索一样快捷便利地分享信息和进行模拟实验。

  目前,Google Genomics上已经存储了至少3500个来自公共项目的基因组。在Google Genomics存储一个基因组的价格为25美元/年,如果需要对数据进行计算还将额外收取费用。一个人的基因组原始数据大小约为100GB,而经过压缩后将不到1GB,也就是说只需要25美分。

  这项技术使得今后医学或将依赖于某种“全球DNA网络”,医生将可以在这个网络中搜索他需要的内容。比如对癌症患者,医生就能对他进行基因测序,然后将他正常细胞和肿瘤细胞的基因组与数据库中的5000万个基因组进行匹配,然后给出最合适的药物。

手机正文底部

您可以还会对下面的文章感兴趣:

  • 血液检测优于成像对肺癌的诊断
  • Eml1基因突变导致大脑皮质严重畸形
  • 相关部门的拖延阻碍了埃博拉病毒基因组学的发展
  • 致命遗传风险被忽视 遗忘基因能否终结老年痴呆
  • Mol Cancer Ther:研究人员沉默重要致癌基因
  • 最新评论