编辑导语:数据在变动之后有可能留下痕迹,此时这类痕迹就称为“数据留痕” 。而数据留痕在一定程度上可以帮助业务人员寻找易混淆的信息 , 寻找数据可能出错的起点 。本篇文章里 , 作者就对数据留痕的定义和场景做了解读,一起来看一下 。
一、背景医学科研中,原始数据经过解析,完成数据的首次填充 。然后经过多轮校验和修改 , 最终形成高准确度的数据 。但是数据演进的过程越长,出现错误的概率也就越大 。使用错误数据进行科研,科研结果的准确性就会受到影响 。
当数据出现问题时,由于没有记录数据演进过程 , 所以无法了解数据是“何人何时修改了何种信息” , 缺少了寻找错误的起点 。
例如,数据库中记录患者李明的“就诊年龄=61岁”,但是医生通过其他资料查询 , 认为就诊年龄应该是59岁 。由于没有记录中间演进过程,所以不知道是什么原因产生了这种差异 。也不知道是谁因为什么修改的这个数据 。
其实,数据的演进过程是这样的 。其中“61岁”是通过身份证号和当时的就诊日期自动计算出来的 。后面经过数据核查,“李明的身份证年龄比实际年龄小2岁”,于是修改李明的“就诊年龄=59岁” 。
上述案例中 , “就诊年龄=61岁”,“就诊年龄=59岁”是数据的痕迹 。“由身份证号和就诊日期计算所得”“身份证年龄比实际年龄小2岁”是数据修改的原因 。
由于缺乏数据修改记录和数据修改原因,这种情况下可能会产生两个后果 。
医生手动将61岁修改为59岁 。原本正确的数据,被修改错误 。如果筛选年龄介于18-60的患者 。该患者就会被误选进入研究样本中 , 对研究结果产生干扰 。医生无法确定哪个数据准确,为了保证数据的准确性,则不适用该数据 。那么研究的样本中就会少一例 。当可供研究的样本数量较少时,减少一个研究样本就少了一份可用数据 。如果系统记录了数据修改记录和数据修改原因,了解“就诊年龄”字段的演进过程 , 就可以根据科研需求,决定是否使用该患者数据 。
这就是我们今天讨论的话题,数据留痕 。
二、数据留痕指的是记录数据的每一次变动,让每一次数据变化都留下痕迹 。一条留痕记录包括两部分内容,变动信息和变动原因 。
变动信息 , 指的是用户在提交数据时,提交后的数据相较于提交前上一次数据,发生变动的地方 。主要数据有变动变量、变动前的结果(原值)、变动后结果(现值)、变动时间、修改人 。变动信息具备事实性 , 能够准确的反应数据发生变动时的场景 。
变动原因,指的是产生本次数据修改的原因 。该部分信息是由用户手动填写完成,在数据提交时由系统记录的 。数据的信息量大 , 价值高 。主观性较强,准确性无法保证 。
举例:
① 变动时间:2021-2-2 19:04,记录执行提交任务的时刻 。
② 修改人:张三医生,记录执行数据提交任务的人 。
推荐阅读
- 怎么样可以专门钓雅鱼 怎样钓雅鱼最好
- 怎样安装无线宽带路由器
- 怎么找到家里的蚊子窝 怎样快速找到房间里的蚊子
- 紫罗兰翡翠怎样形成的 翡翠紫罗兰是什么元素
- 如何在快手上买东西 怎样在快手买东西呢
- 螨虫为什么会出现 怎样知道有没有螨虫
- 怎样预防火灾发生 如何预防火灾的发生
- 红绿灯待转区怎样行驶?
- 传祺ga8座椅记忆怎么设置 传祺ga8记忆座椅怎样设置
- 怎样用角磨机改成粉碎机 这样改装超厉害