今天的挑战:管理大数据
现在,我们拥有它,我们用它做什么?
有一些惊人的相似之处也就是社会目前关于数字革命,它对电气革命一百年前。在20世纪的第一个十年,一个全新的全球基础设施——从电话网络正在实施道路室内管道,和一些最伟大的改变正在进行关于怎么做。类似今天正在发生巨大变化的开始年21世纪数字技术所固有的承诺是开花到新的应用程序似乎发展在我们眼前。
最近的分子Tri-Con 2014会议在旧金山,从2014年2月9-14,CA提供大量的一系列深刻的演讲主题有关驾驶改变和塑造未来的医学。Tri-Con提供通道和座谈会在诊断、临床癌症当然信息问题,重点跟踪在这些主题将目光锁定在特定的感兴趣的领域。大数据信息频道专注于生物信息学,集成研发信息和知识管理,基因组和转录组分析。不可能参加一些关键的演讲,但是这个编辑器的出席是优秀的,提供案例分析,小组讨论,深刻的评论如何应对目前实验室与数据管理相关的挑战。
数据管理的挑战
简而言之,它不仅仅是产生的数据量,但困难搜索、检索和共享。会议演讲中有很多案例研究如何不同的公司——从大型制药公司小型生物技术实验室,解决各方面的数据管理和流程工作流的挑战。
有一个明确的认识到,管理大数据是最终与实验室工作流程,需要在实验室里改变做事的方式,但是…,这是一个很大的但是…几个主持人强调,也需要有一个识别员工的舒适水平的改变,新系统(s)和程序(s)需要易于使用,合理直观和尽可能无干扰。
面板数据集成和共享提出和讨论了整个大数据难题的关键是使大数据有用。他们一致认为,这是说起来容易做起来难,因为数据需要根据不同的团队发现,因为这些不同的团队有不同的需求。
研究目标是改变
当研究人员很清楚时,我们知道,我们需要知道更多。正如一位专家所指出的,“这使得数据背后的真正的挑战不是一个生成,但理解它。“在研究环境中,这个挑战是由问题的本质研究的目标已经从大重磅药物一个个性化医疗已经成为重点;一个难以捉摸的,少(到目前为止)有利可图的终极。
关注的焦点已经从找到一个标记的疾病状态,解决具体有针对性的药物。相反,挑战不断扩大和加深,这样不仅仅是遗传学研究,但缩小路径的表观遗传学研究等不同的方向。
这一挑战的一部分成为过滤信息,这样的研究人员可以专注于最重要的属性,这意味着捕捉数字化和自动化的数据实体,用户和调查因素驱动更好的可视化和分析。解决方案是新兴的以网络为中心的,而不是以前的以硬件为中心为过去的和以软件为中心的方法。
数字基础设施是复杂的
数字基础设施的复杂性,支持网络,共享和分析数据是一个很大的挑战的一部分。再加上不断创新实验室硬件(乐器)和软件(系统),和你有一个不断移动的目标在过去的十年中迅速膨胀。特别是,它不仅仅是各种数据库需要被更多的人访问,但扩展和将这些数据库集成到一个共享的知识网络是一个大数据挑战的重要组成部分。
Vinod Kumar博士的介绍利用大数据加速药物开发加强了数据的挑战。他指出,4.0 zb的信息创建和复制在2013 - 4万亿gb的- - -这个数字预计将增长50倍到2020年底。
管理所有这些复杂的挑战,不同,大型和快速增长的数据将推动一个同样引人注目的巨大变化,我们无法预测将能够回顾与等量的惊讶和感激。Kumar强调,没有终点的景象和存储问题是一个真正的问题。
研究机构也处理当前的问题,大多数候选人在到达市场之前失败。重磅药物的时代已经接近尾声。跨国制药与巨大的资源并不提供一个竞争优势;作为一个小的,也没有创业的生物科技公司。理解数据的问题和发展可行的候选人跨越所有边界。一个解决方案是重新定位药物,药物创建一种疾病或问题是找到适合另一个。例如,伟哥最初开发高血压,但现在是一个领先的勃起功能障碍的解决方案。然而这是一个临时的解决方案,支持一会的底线,而不是一个长期企业财政可持续性。
未来成功的关键
未来将是一个大修的关键活动和工作流程是如何进行的不仅仅是实验室,但在整个研究机构。过程需要更有效率和更有效。仔细检查谁做什么、何时、何地以及如何将导致的调整方式。公司需要更好的保护,捕捉和利用他们拥有的数据和相关的知识。简化工作流流程效率将成为一种研究机构正在进行的活动,关注六西格玛实践。
在当前经济仍将很难添加新的研究人员和它们相关的开销。在任何情况下,更多的大脑不能解决数据管理的挑战。相反,许多组织都将任务外包给一个值得信赖的CRO和尽可能多的流程自动化他们的数据转换成数字格式,使快速、可共享的检索。
当一个研究组织有成千上万的同时发生的项目,这些项目将需要连接,确保规模经济通过更好地利用资源和处理效率。这将意味着更多的外包不仅研究,但分享组织以外的知识更好的知识。这将是一个勇敢的新世界。