利用大数据对抗小儿癌症
我们最近采访了Samuel L. Volchenboum博士了解他目前在儿科癌症和炎症性肠病领域的研究。他讨论了当前利用数据和信息学的挑战,稳健数据收集和标准化的重要性,以及优化数据以提高研究效率和影响的策略。
您目前的研究主要集中在利用数据和信息学进行儿童癌症研究,您能详细介绍一下这项研究吗?
Samuel L Volchenboum (SV):我的主要学术兴趣是利用大量数据进行研究。对于儿科癌症社区来说,这意味着将国际研究小组聚集在一起,创建共享信息的通用数据模型。最终的目标是使用标准化的数据词典在世界各地收集数据,然后将这些数据以去标识的格式提供给世界范围内的研究团体进行研究。当然,这样做会有无数的问题——从缺乏数据标准,到对安全和隐私的担忧,再到数据封锁和专有声明的问题。但这些问题都是可以克服的,我继续对我们的成功保持高度乐观。
除了我作为信息学中心主任的研究,我还与芝加哥大学和David T. Rubin博士的首席医疗官石蕊健康来研究炎症性肠病.该项目旨在收集有关活动、睡眠、心率和饮食的真实数据,以更好地了解这些因素如何影响克罗恩病或溃疡性结肠炎患者。有效地利用这些数据可能意味着为慢性疾病IBD的个性化医疗奠定基础。
在最近的一篇文章中,您回顾了现代医疗保健中数据公有物的使用。卫生数据在多大程度上从非共享的“竖井”中被抽出来并免费提供?数据共享还需要走多远?
SV:当21圣世纪治愈法案该法案于2016年通过,规定了一项任务,以更有效地将医疗创新推向市场。因此,美国国立卫生研究院(NIH)更加关注数据共享。
有效的数据共享存在许多障碍,但两个主要问题是缺乏互操作性和激励错位。
大多数数据仍然在不考虑任何标准的情况下收集。这意味着临床医生和研究人员经常选择自己的方式来收集和存储数据。因此,当需要共享或合并数据时,这些点不会对齐,数据必须转换为一个共同的标准。这个过程通常会导致数据丢失或泄露。像临床数据交换标准联盟(CDISC)正在与临床医生、制药公司和政府机构合作,制定强制性的数据报告标准。当然,这将有助于确保将数据转换为公共标准,但是在不需要进行一个或多个转换的情况下,以标准化的方式实际收集数据之前,我们还有很长的路要走。
当然,临床医生或研究人员必须有分享他们的数据的动机。必须有适当类型的治理,以确保数据贡献者将保持数据的安全,并仅在适当的条件和适当的归属下共享数据。这是最棘手的领域之一,必须通过数据共享协议来解决。
你的出版物"支持儿科癌症研究的数据共享引用了与儿童癌症相比,成人癌症的数据驱动进展的差异。它强调,儿科癌症病例的罕见可能是癌症儿童未能从推动精准医疗时代的技术革命中受益的原因。我们能做些什么来帮助消除这种差异呢?
SV:儿科癌症很罕见——美国每年只有大约1.5万例新病例,而成人癌症则超过160万例。在研究大量受试者、他们的疾病特征和他们的治疗结果时,人们会有新的发现。当试图将基因组发现与临床结果联系起来时,拥有大量患者和相关的丰富临床数据就更加关键了。由于儿童癌症病例的缺乏,创新一直由联合试验推动。但即便如此,儿童肿瘤小组多年的研究也可能只招募数十或数百名患者,这取决于疾病。这使得大多数儿科癌症的存活率都有了不可思议的提高。但仍有许多癌症无法治愈或只能通过毒性极高的治疗方案来治愈。为了理解和开发更好的治疗方法,需要进行两项重要的创新。首先,世界各地的组织需要团结起来建立标准化的数据模型,这样数据就可以在全球范围内收集和共享。其次,除了基因组信息外,还需要收集更丰富的临床数据。 Right now, genomic sequencing studies are severely limited by the lack of clinical data and could be significantly enriched though linkage to the associated information from the medical record.
为了帮助解决这些棘手的问题,我们正在努力将来自世界各地的小组聚集在一起,建立儿童癌症的通用数据模型。通过创建儿科癌症临床试验数据的公共资源,我们希望为世界提供丰富的表型数据来源,以丰富正在收集的令人难以置信的基因组数据。
你能多给我们介绍一下石蕊健康吗?Litmus平台对临床研究有什么影响?
SV:就目前而言,大多数试验仍然使用过时的数据跟踪方法来监测成功情况。当研究人员使用数字化表格和问卷每月一次与患者联系时,他们牺牲了客户产生的大量数据。直到最近,我们一直缺乏一种可靠的方法,以严格和合规的方式收集关于我们患者的持续、客观的数据,并遵循临床试验数据收集的行业标准。
Litmus是一个专注于健康相关生活质量的临床数据科学平台。我们使用从可穿戴设备、智能设备和家庭传感器收集的现实生活数据来指导管理和通知端点,并描述他们在观察性研究、治疗试验和上市后研究中的工作的全部价值。
大局——我们用这些新设备使试验更有效。可穿戴设备和其他传感器是非常丰富的数据来源,但制造商还没有弄清楚如何将这些数据用于临床分析。
我们的核心价值之一是,我们利用这些现实生活中的数据,让它们为研究做好准备。
这种更智能的方法可以更好地跟踪患者数据,简化药物进入市场的路线,帮助临床医生做出更好的放行/不放行决策,并实现药物的全部价值。
在一个生死攸关的行业中,我们看到的是一打失败中的一次成功,从研究阶段到市场采用,必须让这些成功有意义。
生物医学数据有多种形式,不同的机构将以不同的方式存储和处理数据。当数据分组时,研究人员如何克服这些不一致,以便从这些大数据集中获得最大价值?
SV:如上所述,我们缺乏数据标准化和协调的工具和激励措施。每个利益相关者都开发了他们自己的,有时是专有的收集和存储数据的方法。在学术医疗中心进行临床试验的数据管理人员通常必须将数据复制粘贴或重新输入到特定于供应商的平台中进行临床试验。试验协议通常采用Microsoft Word或PDF等静态格式,要求每个研究站点手动提取研究术语,并创建订单集和数据收集表单新创.研究数据必须转换为通用格式,以便向美国食品和药物管理局(FDA)等联邦机构报告。在临床试验之外,数据协调和共享的激励机制甚至更少。虽然许多大型医院都有强大的数据仓库,但很少有医院遵守公认的数据收集和存储标准,更少的医院使用来自公共来源的可用参考数据来为其数据收集方式提供信息。简而言之,收集数据以便共享和研究并不是大多数医疗中心的首要任务,因为它们正在努力应对支付和服务以及过多的监管。
要解决这些问题,就需要重新调整激励机制,鼓励强有力的数据收集和共享。这将来自联邦机构、特定疾病财团、行业、私人基金会,甚至可能是电子健康记录供应商。我们现在开始看到这些新趋势中的一些,其形式是新的赠款,旨在鼓励数据标准化和私人赠款机构要求收集和管理数据的最佳实践。我们非常希望行业最终能够意识到需要更好的数据收集,我们现在开始利用这些更大、更丰富的数据集。
Samuel L. Volchenboum接受了技术网络科学作家Ruairi MacKenzie和Laura Elizabeth Mason的采访。188金宝搏备用