我们已经更新了隐私政策为了更清楚地说明我们如何使用您的个人资料。

我们使用cookie为您提供更好的体验。你可参阅我们的饼干的政策在这里。

广告

今天的挑战:管理大数据


想要这个行业见解的免费PDF版本?

填写下面的表格,我们会将PDF版本的“今天的挑战:管理大数据”

听与
喋喋不休地说
0:00
免费注册收听这篇文章
谢谢你!用上面的播放器听这篇文章。
阅读时间:

现在我们有了它,我们该怎么做呢?

当今社会在数字革命方面所处的位置与100年前的电子革命之间有一些惊人的相似之处。在20世纪的头十年里,一个全新的全球基础设施——从电话网络到道路到室内管道——正在实施,在如何做事方面发生了一些有史以来最大的变化。在21世纪初的今天,类似的巨变正在发生,数字技术固有的希望正在我们眼前发展成新的应用程序。

2014年2月9日至14日在加州旧金山举行的分子医学三- con 2014会议提供了大量关于推动变革和塑造医学未来的主题的有见地的演讲。Tri-Con提供了诊断、临床、癌症,当然还有信息学问题的渠道和研讨会,并在这些主题中集中关注特定感兴趣的领域。信息学频道专注于大数据生物信息学、集成研发信息学和知识管理、基因组和转录组分析。参加一些重要的演讲是不可能的,但本编辑参加的那些非常出色,提供了案例研究,小组讨论,以及关于如何应对当前与数据管理相关的实验室挑战的深刻评论。

数据管理挑战

简而言之,问题不仅在于产生的数据量,还在于搜索、检索和共享数据的困难。会议报告包括大量案例研究,内容涉及不同公司(从大型制药公司到小型生物技术实验室)如何解决数据管理和流程工作流挑战的各个方面。

有一个明确的认识是,管理大数据最终与实验室的工作流程联系在一起,有必要改变实验室的工作方式,但是……这是一个很大的但是……几位演讲者强调,还需要认识到员工对变化的适应程度,新的系统和程序需要易于使用,合理直观,尽可能不具有破坏性。

一个关于数据集成和共享的小组提出并讨论了整个大数据难题的关键是使大数据有用。他们一致认为这说起来容易做起来难,因为数据需要为不同的发现团队量身定制,因为这些不同的团队有不同的需求。

研究目标正在改变

研究人员非常清楚,我们知道得越多,我们就需要知道得越多。正如一位小组成员指出的那样,“这使得数据背后的真正挑战不是生成数据,而是理解数据。”在研究环境中,这一挑战是由研究的性质已经从大型重磅药物的目标转变为个性化医疗成为焦点的问题所驱动的;这是一个难以捉摸且(到目前为止)利润不那么丰厚的结局。

研究的重点已经从寻找疾病状态的单一标记物转变为用特定的靶向药物来解决它。相反,挑战已经扩大和深化,因此它不仅仅是遗传学研究,而是在许多不同的方向上缩小了路径,如表观遗传学研究。

这一挑战的一部分是过滤信息,以便研究人员可以专注于最重要的属性,这意味着以数字方式捕获数据,并将实体、用户和调查因素自动化,以推动更好的可视化和分析。正在出现的解决方案是以网络为中心的,而不是过去以硬件为中心和以软件为中心的方法。

数字基础设施是复杂的

支持网络、共享和分析数据的数字基础设施的复杂性是目前面临的一大挑战。再加上实验室硬件(仪器)和软件(系统)的不断创新,你就有了一个在过去十年中如雨后春笋般不断移动的目标。特别是,不仅仅是各种各样的数据库需要被更多人访问,而且扩展这些数据库并将这些数据库集成到一个共享的知识网络中是大数据挑战的重要组成部分。

Vinod Kumar博士关于利用大数据加速药物开发的演讲强调了正在进行的数据挑战。他指出,2013年有4.0 zb的信息被创建和复制,相当于4万亿千兆字节,预计到2020年底,这一数字将增长50倍。

管理所有这些复杂、不同、庞大和快速增长的数据所面临的挑战,将带来同样巨大的变化,我们无法预测,但当我们回首往事时,却能感到同样的惊讶和感激。库马尔强调说,目前还没有结束的迹象,储存问题是一个真正的问题。

研究机构也在处理大多数候选人在进入市场之前就失败的问题。重磅药物的时代即将结束。作为一家拥有大量资源的跨国制药公司,已经不再具有竞争优势;作为一家小型的创业型生物技术公司也是如此。理解数据和开发可行的候选数据跨越了所有边界。一种解决方案是药物重新定位,即针对一种疾病或问题开发的药物被发现对另一种疾病或问题有效。例如,伟哥最初是为高血压开发的,但现在是勃起功能障碍的主要解决方案。然而,这是一种临时解决方案,只能在短时间内提振底线,而不是长期的企业财政可持续性。

未来成功的关键

未来的关键将是对活动和工作流程的彻底改革,不仅是在实验室,而且是在整个研究机构。程序需要更有效率和更有效。对谁做什么、何时、何地以及如何做的仔细研究将导致事情的方式重新调整。公司需要更好地保存、捕获和利用他们拥有的数据和相关知识。简化工作流程以提高过程效率将成为专注于六西格玛实践的研究组织的一项持续活动。

在当前的经济形势下,增加新的研究人员及其相关的管理费用仍然很困难。在任何情况下,更多的大脑都不能解决数据管理的挑战。相反,许多组织将任务外包给可信的CRO,并将尽可能多的流程自动化,以便将数据转换为支持快速、可共享检索的数字格式。

当一个研究机构有数千个项目同时发生时,这些项目将需要通过更好地利用资源来确保规模经济和过程效率。这将意味着更多的外包,不仅是研究,还包括在组织外部共享知识,以推动内部更好的知识。这将是一个美丽的新世界。

广告
Baidu