基因组学的胶:将科学的无名英雄放弃学术界数据?

文章

发表:2023年5月17日

Ruairi J麦肯齐

信贷:iStock

希望这篇文章的一个免费的PDF版本吗?

完成下面的表格,我们将电子邮件您的PDF版本“基因组学的胶:将科学的无名英雄放弃学术界数据?”

名字*

姓*

电子邮件地址*

国家*

公司类型*

工作职能*

你愿意接受进一步的电子邮件通信技术网络吗?188金宝搏备用

听与

喋喋不休地说

0:00

注册免费听这篇文章

谢谢你！听这篇文章使用上面的球员。✖

阅读时间:

基因组学的进步在过去的二十年有涡轮增压解码核酸DNA和其它的能力。在世纪之交,人类基因组计划完成了13年的旅程产生第一个完成人类基因组一个伟大的财务成本。

2023年,基因组测序是一个常规的过程,扩大了我们对生物学的理解和推动类似的增强在其他组学学科。

这些进步在很大程度上归功于增加原始采样基因组测序能力和更加巧妙的技术数据,从数以百万计的人在genomic-wide协会测序研究(GWAS)或从一个孤独的细胞的核心single-nucleus RNA序列化验。

但所有这些进步是零,如果我们不能够处理和分析数据洪流,倒从这些测序项目。基因组数据分析管道不得不进步也支持这种增长的领域。

一个灵活的领域

艾莉森Meynert博士是一个高级研究员和生物信息学分析核心经理MRC研究所的遗传学和癌症(IGC)爱丁堡大学的。从researcher-clinicians Meynert和她的六人团队过程数据在大学。Meynert的背景是在计算机科学和软件开发中,但她现在已经度过了20年在生物信息学——基本上,她说,“从起步阶段。”

尽管湿实验室人员在个人领域可以高度集中他们的项目,Meynert的团队必须保持灵活。“我们已经有了一些年有大,在全国范围内资助,全基因组测序项目,我们会有成百上千的样品进入今年的在不同的人群不同的研究项目,”她说。现在,新技术如纳米孔和单细胞测序也要考虑。需要深入和广泛的知识基础。“不同的测序仪器具有完全不同的错误配置和输出格式,“Meynert解释道。

一件事,将这些不同的数据源,Meynert和她的团队,目标仍然是采取复杂,原始基因组数据并将其转化为形式的人员产生可以提取相关的见解。说:“这是一个非常合作过程Meynert。

揭示更多准确和可伸缩的读测序

读测序可以准确的识别和表征复杂基因组的功能。下载这个手册来了解更多关于年代所以> 10 kb片段与更大的精度,经济和规模,ful自动化工作流完成一天内和r在不影响数据质量,并计算和存储成本。
查看手册
赞助内容

是什么让生物信息学协作呢?

与湿实验室研究人员协作不仅是核心团队的帮助,但与其他核心实验室在英国、欧洲甚至全球。Meynert和她的团队是bioinformaticians称为社区的一部分nf-core。这个项目开始在国家基因组学基础设施在斯德哥尔摩,瑞典创建一组标准数据分析管道。项目是由陈扎克伯格计划和运行在云Amazon Web服务提供的信用和微软Azure,但是团队在很大程度上是志愿者。

IGC团队举办nf-core的下一个马拉松Meynert告诉我。“我们基本上得到最好的生物信息学社区每个人的贡献。开发这些管道,我们有很多争论如何做事。有时你想出多种方式做事的。”

这些协作事件司空见惯在生物信息学的世界。但这根本精神的共享和协作,而振奋,形成鲜明的对比过程在生物和生物医学科学。项目的巨大影响力公平的指导原则,旨在利用数字数据的大量增加使信息在科学更可发现的,访问,可互操作和可重用的,增加了大量的口头上的数据共享。但最近一研究在临床研究杂志穿好想法,科学大大拥抱开放原则。本文通过查阅3556篇文章来自300多个开放获取期刊,都发表在2019年1月。

只是一半的这些研究表明作者愿意分享他们的数据,和这些令人惊叹的93%的作者没有回应或拒绝请求数据访问。更轻松的态度在生物信息学数据共享圈表明员工在这些领域更宽宏大量的,慈善的人?Meynert说的原因可能更实际。“生物信息学社区一直强烈基于开源软件,我认为在很大程度上是因为如果我们想开发一个新的工具,我们需要数据来测试它。我们需要有人为我们共享他们的数据。”

基因组学和其他生物学科的研究人员担心被竞争对手“挖”科学家一样,他们担心震耳欲聋的沉默的研讨会上说。由此产生的文化的保密和安全的数据已经证明很难纠正。但生物信息学开源方法积累了众多成功案例,基因组数据分析人员每天像Meynert受益。她指出,文件格式二进制对齐地图(BAM),一个压缩的文本版本序列比对地图(SAM)格式。山姆/ BAM(和补习reference-aligned和压缩版本)是最常用的一些格式在基因组学领域。但它们起源于个人研究小组成为沮丧与现有的格式和设计变化。倡议基因组学和全球联盟医疗(GA4GH)帮助这些格式标准化,使他们能够在这个领域被广泛采用。大规模数据存储库和GitHub方便这些创新共享和使用的其他研究小组。GA4GH的基因组分析工具箱与Broad研究所密切合作开发,麻省理工学院和哈佛大学之间的合作,是一种“主力基因组学工具,“Meynert说。

丰富的目标来提高你的门店数据

访问一组独家案例研究展示可定制的解决方案来提高你的门店数据。下载这个纲要来了解更多关于l实验值得信赖的专业知识提高工作流的一个ccurate探针设计工作流由机器学习和国内外从转录组、表观遗传学、病原研究和agrobiotechnology

视图纲要

赞助内容

基因组学的无名英雄

的努力进入创建这些资源可以说是先进的能力理解基因组技术基因测序技术的进步。但研究人员让这些创新仍在学术界工作,接受资助的标准和识别仍然计算在出版物和引用。这些科学家如何为他们的努力得到应有的认可吗?这是一个难题,动机尼尔Chue香港的创始董事兼首席研究员软件可持续性研究所(SSI),一个适用于所有的项目7个英国主要研究委员会”,以改善使用软件的实践的科学。

Chue香港指出,一个明显的障碍阻止学者创建软件和分析工具被认为是缺乏一个正式的科学为他们注册。SSI车间在2012年,一群创造了这个词研究软件工程师(交易所)编纂这个位置。“这是一个角色,一直在研究过去也许4或5年,“Chue香港说。”,因为这一直是研究者的想法——擅长编码的人——你问,“我怎么解决这个软件不工作?我认为是什么引起的问题是没有足够的识别作用,软件的使用越来越普遍,这个角色变得越来越重要。”

但rs的影响力越来越大在学术界尚未反映在承认他们收到的数量。“最后的出版”是至高无上的地位问题的一部分。这让过度的信贷一个神话般的人物,Chue香港称之为“孤独的英雄首席研究员”,从理论上讲,应该是负责的大部分工作,进入一个科学论文。在现实中,研究是一个协作实践,资金系统,识别每个实验室成员的贡献最终出版是一个重要的第一步实现,Chue香港说:“[机构]正在向认识到叙事CVs和研究者的简历表明不仅仅是关于出版物,但关于你传播知识和技能传递给其他的人,”他补充道。

有其他地方所取得的进展对识别的贡献比例基因组学等领域。美国国家标准协会(ANSI)和国家信息标准组织(你)共同宣布的出版物信用因素的角色分类去年,一个框架,将实践的科学划分为14个贡献者的角色,包括概念、融资收购,调查和软件。2022年,美国化学学会宣布飞行员信用分类的期刊。Chue Hong说,他认为这一领域的主要症结在于同行评议的过程。“最后剩下的障碍是完成同行评议者理解科学是非常不同比20年前的2023年,”他说。这可能包括挑战性原则嵌入研究人员的心理。“生存偏差是无益的。仅仅因为某人是成功的,通过一个特定的战斗的做事方式在学术研究中,并不意味着其他人一样战斗,战斗,“Chue香港说。

门店适配器:它们是什么,如何选择他们

独特的分子标识符(umi)现在一个解决方案,可以减少定量偏差,区分PCR副本和识别测序错误。下载该电子书发现更多关于t他的结构、功能和应用程序的适配器的总会在图书馆准备方法SBS方法和f演员时要考虑选择索引方案。
看电子书
赞助内容

基因组学没有胶水

的战斗识别rs是应该关心所有的科学。多基因组的分析工具箱不存在没有他们,和一个不需要期望得太高太远看会发生什么如果rs继续在学术界公认的拒之门外。“越来越多的人会做的就是离开学术界,“Chue香港说。你曾经有过一个选择之间的学术地位和一个行业的作用研究。所不同的是,学术界是为了给你更多的工作保障,更好的养老和更富有成效的工作环境,在那里你有很多很多有趣的人们合作。是工资的权衡。

“现在,行业提供你可能更好的工作条件,可能更好的养老,肯定更好的人一起工作和更好的薪水。你要真的想在学术界工作现在,如果你在一个软件的作用。我认为交易所行业面临的挑战是鼓励人们呆在学术研究的环境中,而不是进入工业研究环境。”

这些斗争将熟悉许多在学术界。但rs扮演着至关重要的角色之间的交叉日益数字化的数据丰富的信息环境和湿实验室工作,推动生物学。Meynert说她白天的工作往往会涉及到其他研究小组创建的工具和配件他们手头的任务,将砂浆应用于做出不同的分析工具在串联工作。“大量的信息,”她说,“是粘合在一起。“如果学术研究开始失去rs和他们的贡献,它可能会开始看到多少是胶的控制依赖。