健康数据管理的未来:建立一个可信的研究环境
增加对卫生研究数据的获取,使科学家和研究人员能够发现他们以前可能无法获得的关于疾病和治疗方法的新发现。这些基于基因组标记的数据是药物制造和患者诊断的关键部分。
在最近的一项研究中,研究人员斯坦福大学在5小时2分钟内就打破了诊断罕见疾病的世界纪录。相比之下,罕见病的典型诊断可能需要4年时间,而儿童通常必须等待6至8年在被诊断之前。
缩短诊断时间显然是过上更长寿、更健康生活的关键因素。
加快诊断速度的障碍在于,健康数据通常由单个团体或组织持有和访问(换句话说,就是“竖井”),而患者机密性使得数据共享存在问题。为了克服这一障碍,研究人员和组织正在通过建立可信的研究环境(TREs),采用一种相对较新的健康数据管理方法。
TRE正在成为科学和研究界常用的首字母缩略词。一般来说,TRE是中心化的
这是一种与研究人员获取数据的传统方式非常不同的方法。从历史上看,研究人员必须将整个数据集下载到他们的计算机上才能研究这些发现。以这种方式传输和发布数据会增加安全问题的风险,即使个人身份已被去识别。此外,这种方法需要相当多的时间——这些时间可以更好地用于分析临床数据集。
为什么会出现这种转变?
COVID-19大流行表明,患者临床数据的可用性和标准化是更多地了解病毒以及如何正面应对病毒的关键。来自世界各地的研究人员都在进行实验,分析他们的发现,收集临床数据集,并报告他们的结果。
在此期间,各组织更加意识到迫切需要一种新的方式来管理健康数据。具体来说,英国卫生安全局早在2020年就开始收集covid - 19感染者的全基因组测序。最近该机构刚刚通过
有限获取的全球影响
在许多研究组织中,tre正在成为卫生数据的架构骨干。虽然这是朝着正确方向迈出的一步,但许多tre仍然无法与来自其他组织的同事交谈,甚至无法与自己组织内的其他部门交谈。
例如,一些大学有自己的研究部门,每个部门都有自己的TRE。不幸的是,经常会出现这样的情况:组织中仅隔着一堵墙的tre无法相互“交谈”。没有这种能力,是不可能的充分利用TRE。
随着基因组领域的不断发展,TREs的能力将
这并不意味着要移动数据。生命科学数据集太大了,无法有效地移动,而且使问题复杂化的是,许多数据安全法规禁止数据离开一个组织、一个州或一个国家。因此,据估计多达80 - 90许多重要的数据集根本无法用于研究。
我们需要的是从竖井中的数据集中转变为允许数据共享的方式原位和最初收集它的组织一起。对于研究而言,没有其他选择像它一样有前景。
什么是值得信赖的研究环境?
当组织开始着手开发一个可信的研究环境时,有几个因素需要考虑。
1.安全的人
用户需要获得批准并拥有适当的凭据才能访问运行状况数据。个人不应试图重新识别个人,因为这将违反患者机密,或通过他们的凭证让另一方访问。研究人员和科学家必须接受使用TRE平台的适当培训。
2.安全项目
尽管trre保存了安全和敏感信息,但所使用的数据必须是相关的,并用于积极造福公共卫生。为了实现这一点,TREs必须进行审计以确保遵从性。
3.安全设置
年代
云技术不应该让数据离开数据库,也不应该把任何发现输出给用户。研究人员应该有能力引入他们自己的算法进行分析,但任何输入系统的工具都必须包含在“气闸”模式中。该特性允许扫描工具,因此TRE的安全性不会受到影响。确保安全设置
4.安全数据
TRE中的数据必须是安全的,这样患者的身份就不会被识别,研究人员也不可能重新识别信息。数据的质量也必须被清理和验证,以便适当的数据可以与批准的项目相关。有价值的安全数据才能开辟新的天地造福大众的研究机会。
5.安全输出
正如在安全设置
当tre满足所有这五项要求时,组织就建立了一个完全可信的研究环境。
结论
由于数据集的规模和其中内容的敏感性,基因组健康数据在存储、管理、分析和协作方面带来了独特的挑战。TREs正在成为弥合卫生数据差距的架构结构,以便能够扩展和保护信息。