Google跟生物信息学最新进展:谷歌宣布加入世界基因组学与卫生联盟

Google和生物信息学最新进展:谷歌宣布加入世界基因组学与卫生联盟

今天看到一个头条新闻: 

谷歌宣布加入世界基因组学与卫生联盟

http://www.cnbeta.com/articles/274245.htm

 

国外行业媒体:

 http://www.fiercebiotechit.com/story/google-joins-genomics-alliance-it-prepares-industry-focused-cloud-services/2014-03-03

 

http://www.genengnews.com/gen-news-highlights/google-launches-genomics-effort-joins-global-alliance/81249571/

 

http://www.slashgear.com/google-joins-global-alliance-for-genomics-and-health-27318785/ 

 

 

那么就继续更新下本人长期关注的Google与生物信息学话题。(参见 Google与基因组那点儿事儿 http://nodex.iteye.com/blog/1117365

 

这次的消息显示,Google很大程度上是针对Amazon 云服务里的Genome项目,以及完善自身的Google cloud service 。

 

我们先来看下Amazon与genome数据相关的服务吧:

1. Amazon AWS上托管有公用数据集,供用户免费访问  http://aws.amazon.com/cn/publicdatasets/

2. 该公用数据集中生命科学类是一个非常重要的分类 ,尤其是其中的基因组测序数据和生物信息学数据,详见  http://aws.amazon.com/cn/lifesciences/  

3. Amamzon AWS上的基因组学数据及其在基因组学中的应用  http://aws.amazon.com/cn/genomics/  

4. AWS上的千人基因组计划的数据 http://aws.amazon.com/cn/1000genomes/  

 

 

Amazon的这些服务几年前就提供了,至于用户多少目前还不清楚。  

 

再来看看Google本次发布的消息所涉及的具体项目吧:

 

1. Google Genomics 作为Google developer家族的一个新成员  https://developers.google.com/genomics/ 

 

2. 三大目标:

  • Focus on science, not servers and file formats
    • Use simple web APIs to access data wherever it lives
    • Let us manage the servers and disks
  • Store genomic data securely
    • Private data remains private, public data is available to the community anywhere
    • Storage space expands to fit your research needs
  • Process as much data as you need, all at once
    • Import data for entire cohorts in parallel
    • Search and slice data from many samples in a single query

3. 作为一个DaaS(数据即服务),我们首先得注册成为Google developer,创建项目,然后才可能访问和使用Google Genomics的数据; 也可以上传自己的序列数据如BAM格式等去做分析。  目前Google Genomic还只接受有限申请者使用,所以你还得去填一个form去申请。 

 

4. Google为此提供了一些开源的code在github上   https://github.com/GoogleCloudPlatform/genomics-tools      主要是java和python语言的。 

 

 

笔者点评:

1.  Amazon AWS提供的服务主要是面向数据,然后针对特定领域推荐自己的AWS相关的服务;同时Amazon强调公用数据,侧重 DaaS 。

 

2. Google Genomics则是根据Google developer的产品线来设计,面向科学领域,以解决问题为目标,而非特定数据或软件;展望下未来,或许以后的生物信息科研人员和数据分析人员等不再需要局限在自己的数据中心里,而是在Google cloud上完成数据分析等工作,这会成为一个全新的工作平台,尤其适合在线协作的科研团队。

 

最后,几年前笔者预测的Google迟早会直接(相对于Google投资23andme等间接参与而言)参与到生物信息领域,并且会有针对性的产品出炉,今天的消息也算是验证了此预测! 

 

 

创业者们,纷纷行动起来吧!!!  这就是全新IDEA诞生的最佳土壤环境,机会转瞬即逝!

 


Google跟生物信息学最新进展:谷歌宣布加入世界基因组学与卫生联盟