ArrayExpress数据库规模翻倍到100000杂交过程
阅读时间:
ArrayExpress,转录组数据的公开可用的数据库欧洲分子生物学实验室的欧洲生物信息学研究所[EMBL-EBI],大小在2007年翻了一番,达到100000 -杂交的里程碑。基因表达数据库现在持有的快照(识别特异表达基因在特定的组织或药物,例如)超过180种下成千上万的实验条件。
最新的加速增长不仅反映了直接提交数字的增加,而且质量导入基因表达数据的综合(GEO)产生的美国国立生物技术信息。
导入的数据从地理数据的定期交流的第一步在转录组数据的公共存储库。类似的生物数据提供者之间的数据交换协议被广泛公认为是最有效的方式维护和质量保证生物信息的公共记录。
地理数据进入ArrayExpress策划和得分遵从MIAME、微阵列社会的最低标准的信息。因此用户可以搜索实验,已经提交到数据库,与常见的术语注释,可以下载在MAGETAB——一个用户友好的格式,简化了荟萃分析一样从不同的实验室的实验。MAGETAB是mg协会的指导下开发的,这对微阵列研究人员致力于简化数据共享。
导入的地理数据,比如在ArrayExpress所有数据,也与其他EBI资源集成。例如,用户现在可以从一个ArrayExpress条目直接运用的相关基因或蛋白质在UniProt,简化数据分析的过程中对生物医学研究人员和下载。
ArrayExpress的增长率在未来将进一步增加,随着新的高通量sequencing-based转录组应用程序已经导致大量数据的生成。处理这接二连三的新数据将是下一个挑战ArrayExpress及其合作者。
广告