植物科学公开数据出版

行业的洞察力

发布日期:2015年8月18日

想要这个行业见解的免费PDF版本?

填写下面的表格，我们会将PDF版本的《植物科学开放数据的出版》

名字*

姓*

电子邮件地址*

国家*

公司类型*

工作职能*

您是否希望收到来自技术网络的进一步电子邮件通信?188金宝搏备用

听与

喋喋不休地说

0:00

注册免费收听这篇文章

谢谢你！用上面的播放器听这篇文章。✖

阅读时间:

基因组分析中心(TGAC)最近举办了第一个合作开放植物组学(COPO)联盟研讨会，旨在理解和管理植物科学数据集的共享和重用。COPO是一个BBSRC资助的项目，于2014年9月启动，目的是改善植物研究中数据的开放获取和管理。

为了讨论COPO成立的原因以及它要解决的问题，我们采访了TGAC的COPO首席研究员Robert Davey博士。

JR:对数据发布方式进行标准化是数据密集型生命科学领域的一个热门话题。为什么这在植物科学中特别重要?

RD:数据生成的成本不断下降，再加上对开放和可重复科学的需求不断增加，这就提出了一个非常紧迫的问题:我们如何从一个数据描述不好、公开存储很少的场景，转变到数据描述和存储变得司空见惯的地步?使用产生数据的所有实验和分析过程(元数据)的信息来丰富数据会带来很高的时间成本，这也是COPO希望通过更简单的用户界面、对公共存储库的统一访问以及指导用元数据注释数据的向导来改进的事情之一。标准化最重要的好处是，数据在其他科学研究中更容易被发现、整合和重用，而对各种实验生物的数据描述进行标准化，将使在不同植物工作的研究人员之间传递知识变得更容易。因此，研究特定作物物种的研究人员如果了解实验是如何进行的，就可能从在不同作物上进行的工作中受益，并且可以访问正确的数据集和工具来复制和扩展在这些不同生物上进行的工作。

这些努力的一个令人兴奋的副产品是在公共领域存储数据的识别方面的改进。在这个数字时代，提供引用和跟踪数据的方法对于理解研究成果的价值和影响至关重要。在当前快节奏的数据密集型植物科学环境下，纸质期刊上的论文并不是评估科学影响的好方法，而且有很多信息(通常被归入补充附录)支撑着一项研究的结果，而其他研究人员无法以一种可用的方式获取这些信息。通过在植物科学领域提供一流的数据和分析，提供一个清晰和开放的相互关联的研究知识库，以改善应对粮食安全和植物健康这一全球重大挑战的努力，有明显的好处。

JR:您希望通过使用一个促进更好的数据共享和分析的系统来克服哪些生物学问题?

RD:获取数据是现代科学的一个关键部分。这种范式涵盖了从实验元数据到原始数据，再到与下游生物学问题相关的处理数据集。“大数据”目前也是一个热门话题，现在每天产生的数据的数量和复杂性使得科学家越来越难以找到正确的数据集来为他们的研究做出贡献，更不用说分析了。COPO旨在解决为数据密集型研究成果的发现、重用和识别准备基础这一核心挑战。

JR:基因组分析中心自2014年成立以来一直是协同开放数据植物组学联盟(COPO)的一部分。这个财团背后的主要驱动力是什么?

RD: COPO项目包括一些合作伙伴:华威大学;TGAC;牛津大学电子研究中心;EMBL-EBI。由生物技术和生物科学研究理事会(BBSRC)授予的赠款允许合作伙伴在这一重要的研究领域正式合作。合作伙伴在基础设施开发、数据管理和处理、元数据规范、实验设计和社区交互方面都有明确的经验。这些都不是一个小的研究领域，因此需要联盟和相关支持者集中和明确的协调。

JR: COPO最近在基因组分析中心举办了他们的第一次研讨会。这次会议将如何帮助项目进入下一阶段?

RD: COPO的成功取决于与主要利益相关者(即将使用该系统的生物学家和生物信息学家)进行频繁而深入的对话。这个最初的研讨会帮助我们了解了当前国家在用户数据需求方面的状况。我们讨论了植物科学的某些领域已经存在的数据存储库和服务，以及那些没有合适的存储库或准备好支持高通量表型等领域的新数据泛滥问题的领域。GARNet社区的一篇博客文章描述了研讨会，如果读者想知道更多:http://blog.garnetcommunity.org.uk/copo-2015-meeting/

欲了解更多关于TGAC主办的第一个COPO联盟研讨会的信息，请点击此链接http://www.tgac.ac.uk/news/213/15/Publishing-open-data-in-the-plant-sciences/

罗伯特·戴维博士接受了科技网络编辑杰克·拉德的采访。188金宝搏备用