数据完整性——误解会杀死你的数据
我相信你们都知道派对游戏的电话,一个信息给一个人一条线的一端,轻声说道,然后下一个,直到到达最终目的地在另一端。小的改变确保最后的消息是完全不同的,它是如何开始的。
第一次世界大战给了我们一个悲剧的例子会发生什么当消息遭受误解。一个消息从战壕里发送到英国总部开始:
•“增兵,我们要推进”
当消息到达总部就成为:
•“把三、四便士,我们会跳舞”
哦…
那么这跟数据完整性?
共享数据集可以遭受同样的结束作为英国的消息,你的数据集传递,微小的变化和错误引入了随着时间的推移可以杀死它的准确性,使其不适合的目的。
这里,我们来看看数据完整性在共享数据的背景下,介绍一些程序,将减轻对误解……
数据完整性是什么?
数据完整性的原则是应完全按预期记录数据,检索后,记录时是一样的。要做到这一点,任何数据处理程序必须确保数据的准确性和一致性对其整个生命周期。
来维护数据完整性标准,FDA使用缩略词美国铝业,数据应该是:
•由于-数据演示观察和记录时,应该由谁,谁或什么
•易读的——数据应该容易理解,记录永久保存和原始条目
•同生——数据应该被记录在同一时间观察
•原始——源数据应该保存在其原来的形式
•准确的-数据应该没有误差
数据完整性为什么重要?
数据完整性的核心原则是应该有一个权威的数据集作为一个真理的源泉。在这里,我们需要思考SMaRRT,有一个定义良好的数据完整性系统增加:
•稳定——执行所有数据完整性操作在一个集中的系统,确保一致性和可重复性
•可维护性——一个集中的系统使所有数据完整性管理简单
•可重用性——所有应用程序从一个集中的数据完整性系统中获益
•可恢复性——一个集中的数据来源可以定期备份
•可追溯性——每一个数据点都应该可追溯它的起源
最后一点——可追溯性尤为重要。当我们想到一个数据集,我们通常考虑静态和不变的,但它不是。当我们收集数据会有错误。的创意原则声明,我们应该维护这些数据在原始状态。但当我们清理这些错误,我们改变其他的数据从原始状态。保持数据集在其原始状态,改变它,而且还可以访问原始意味着拥有多个副本相同的数据集在不同阶段的处理。这就是所谓的版本控制,我们保持所采取的一切措施的序时记录数据在每一个阶段。这是自然备用系统的好处,虽然你还需要一个单独的备份策略。
“版本控制是非常重要的,”博士说院长布坎南、姑息医学顾问和临床领导在NHS泰赛德区。“你需要知道什么是更新,当“。他建议在这种格式命名文件日期前缀:
•“year.month。——名字的文件”
是这样的:
•“控制你的Files.docx 2018.08.28——版本”
主任Steven博士墙SJW Bio-Consulting有限,回声,维护,你应该“版本控制每一个变化,每个变化突出是什么改变了,谁执行up-revision”。他还坚称,“完全透明和开放是建立信任的关键与所有伙伴”,包括报告所有决策和操作是否好或坏。
总之,你每次创建一个新版本的文件你应该马上做一个备份,这样每个文件都有历史和备份,所有按时间顺序列出。
会出现什么问题?
如果你没有一个有效的数据完整性系统,数据可能会遭受误解,随着时间变化,直到相似性很少或没有原始数据集。
简单地说,数据的完整性可能会损害:
•人为错误——无论是恶意或无意的
•传输错误在传输设备之间意想不到的变化
•错误
•妥协的硬件——比如一个磁盘崩溃
•缺少元数据——了解所需的信息数据可能会丢失,呈现无用的数据
“如果你把垃圾
,你把垃圾从“院长说,“但最危险的“他补充道,“是
当你有良好的数据变成了垃圾通过错误——如果你不认识
错误那么你的垃圾——分析的不正确的结果
可能认为”。
如何防止错误和数据损坏
所有数据,无论是部门数据库、一个Excel电子表格,密码,文件,等等,都应该有一个单一的真理,这些是你所需要的最小维护数据完整性:
•一个单一的权威数据源
•版本控制
•备份系统
•一个门房(责任的来源)
•维护程序,包括足够的培训
•文档的数据处理程序
•一个访问政策决定谁可以访问数据
•用户记录策略,详细说明谁、什么、何时、何地和为什么
•报告系统报告错误回权威来源
•一个审计程序,以确保问责不准确输入到系统中
虽然这可能有点麻烦维护数据完整性,这些程序灵活,程序的大小和成本你到位应该与您的数据的价值成正比。
凯瑟琳•帕特森博士护理和助产学院讲师罗伯特戈登大学给出了一些深入了解她的团队收集并共享数据在UK-Australia研究:“我们开发了一个同意编码书为整个研究团队和一个主数据文件完全相同的变量和标签。这是分发给所有那些参与数据录入,并促进英国和澳大利亚容易合并数据集”。虽然他们经历了一些差异,”变量的清晰和透明的编码从一开始就最小化问题和数据失败”。
在数据录入,史蒂文说,“如果可能,实现电子,而不是手动记录”,并确保正确性,他告诉我,你应该“都准确的数据检查和签署一个运营商,然后验证了第二个操作符“。
院长,在苦涩的个人经验,坚持认为你应该“永远只有一个人知道密码”。毕竟,密码需要备份。除非你像失去整个数据集,精心构建和维护好几年了…
结论
最重要的三个外卖信息维护共享数据的完整性:
1。应该有一个单一的事实来源数据
2。所有更改应可追溯回到最初通过版本控制
3所示。每一个版本都应该备份
总结,院长点
,共享智慧本身也是版本控制和备份:
“你必须计划
在前面。寻求建议从那些经验和往常一样
错误。听他们的!然后提交数据录入和共享
基金会的工作”。
明智的话确实…