新平台连接基因组和蛋白质组的世界
在新一代测序技术的发展(门店)方法和质谱(MS)的方法先进的分子生物学研究的景观。科学家现在能够识别和描述各种成分的细胞,组织或器官和分析他们的全部,他们“中耳炎”——整个(基因组)的基因表达,蛋白质(蛋白质组)或代谢物(代谢物),在任何给定的时间。
拼凑这些信息有助于我们理解分子从基因型到表型和可能出错,对于疾病表型。作为一个增加数量的组学研究人员信息变得容易,它已成为明显,使用隔离的数据集可以限制他们的效用。连接组学之间的“世界”是根本,但它一直挑战——直到现在。
今年1月,欧洲分子生物学实验室的欧洲生物信息学研究所(EMBL-EBI)宣布,它已经推出了基因组整合功能和序列,或礼物,平台。这部小说平台使科学家们使用运用和UniProt访问所有的最新的人类和小鼠基因组的基因和蛋白质数据。188金宝搏备用与贝丝燧石,运用应用程序项目负责人在EMBL-EBI,玛丽亚·马丁,组长在EMBL-EBI和丹尼尔Zerbino蛋白质功能的开发,团队领导在EMBL-EBI基因组分析,了解更多关于礼物以及它如何将用于帮助研究团体。
莫莉·坎贝尔(MC):请您能和我们谈谈基因组整合背后的基本原理与功能和序列(礼品)?
丹尼尔Zerbino (DZ):礼物旨在提供一个清晰和明确的两个旗舰数据资源之间的桥梁EMBL的欧洲生物信息学研究所(www.ebi.ac.uk),即运用和UniProt。在一起,他们提供了一个丰富的信息在蛋白质合成:运用描述编码蛋白编码基因的上游的核苷酸序列,转录的转录成下游蛋白亚型,在UniProt记录。每个资源已经指出,因此基因连接到蛋白质,反之亦然,但由于不同的发布周期日历这些链接不一致的100%。现在礼物细节我们共同理解蛋白质的基因地图。
主持人:礼品发展的背后是谁?
贝丝弗林特(BF):礼物已经发达EMBL-EBI之间的合作运用和UniProt。项目汇集了专业知识从这些两组,允许我们建立一个工具,可以让人们轻松地探索数据这些群体产生之间的关系。这种性质的合作项目充分利用知识的广度在EMBL-EBI和各种各样的技能。礼物项目是可能的,由于输入的策展人,注释器,数据库和API专家、用户界面开发人员和管道自动化专家。
主持人:为什么重要连接基因组和蛋白质组世界?
玛丽亚·马丁(毫米):仓库的基因组是一个有机体的遗传物质需要的功能。蛋白质的主要效应物说明我们的基因组中编码和他们和他们的产品最终塑造我们的细胞,组织,器官和身体在回应我们的环境。蛋白质提供必不可少的基因组序列和最终表型之间的联系。基因的功能分析和其他大型生物医学数据集需要集成许多不同类型的生物信息实体,包括单个基因、转录和蛋白质。
主持人:为什么这个很困难之前?
MM:运用重点记录在参考基因组的注释使用可用的cDNA、EST和RNA-seq数据,而UniProt关注注释蛋白质序列利用文献的实验证据,同系物在其他物种和蛋白质组学实验。基因组和蛋白质组的研究需要一个非常专业的科学知识,需要结合有效地将它们映射。
主持人:你希望推出礼物的结果会是什么?
男朋友:礼物管道产生的映射将有助于运用和Uniprot团队更新数据他们通过他们的主要网站。使用礼物将提供一个统一的数据视图的两个域之间的映射,并确保一致的信息。这提供了一个巨大的好处的人使用这些映射。背后面临的公共接口的礼物是工具使用的注释器和策展人在运用和Uniprot组。这些工具使他们审查和改进映射。随着这一过程的继续,希望随着时间的推移,规范UniProt亚型将选择所有人类基因,这些将从运用匹配鬃毛成绩单。
主持人:有什么意图推出类似的平台,其他“组学”数据?
DZ:EMBL-EBI资源努力与对方进行互操作,这新的桥梁仅仅是加强一个非常紧凑的数据资源网络。例如,其他EMBL-EBI资源,如Reactome通路数据库或者是基因表达图谱已经直接联系,明确UniProt蛋白质或运用基因。一个妹妹项目,结构与功能的集成,分类和顺序(本人)现在连接UniProt蛋白质序列的3 d结构,存储在PDBe。所有这些互联使研究人员能够理解所有的资源在EMBL-EBI,以我们的统一搜索工具。
丹尼尔Zerbino,贝丝弗林特和玛丽亚·马丁说莫莉坎贝尔,科普作家技术网络。188金宝搏备用