引言
经过多年的持续投入,国内大部分医疗机构已经初步建立了基础的信息化应用体系,满足了日常医疗业务流程数字化处理的需求。有效的数据管理涉及一系列复杂、相互关联的过程,医院可以通过有效的数据管理来实现战略目标。数据管理能力包括为各类应用设计数据模型、安全存储和访问数据、适当地共享数据、从数据中获取知识等。实现数据价值的前提,需要数据本身是可靠和可信的。
然而,现实情况却存在许多低质量数据。每家医院信息化建设都涉及十几个甚至几十个不同软件产品,而每个产品的数据标准、采集存储方式都不尽相同。虽然国际上制定了HL7、DICOM3.0等多种医学信息标准协议,但各机构、各系统之间仍不能做到完全的标准统一和信息共享。据CHIMA发布的《中国医院信息化状况调查2017-2018年度》调研数据显示,医疗机构内部全部采用统一信息编码体系的比例仅占 28.10%,这直接导致了数据标准不统一、数据质量偏低的情况。
在医疗行业,医疗信息化数据质量一直是国际范围内狠抓落实的工作重点,比如欧洲、日本的电子健康档案数据中心均采用ISO 13606-2标准,中国卫健委也设立了 WS 445-2014 电子病历基本数据集 、WS/T 482-2016 卫生信息共享文档编制规范等,并且医院互联互通评级、电子病历评级、公立医院绩效考核等文件及实施细则评价方案先后出台,DRG/DIP支付改革方案全面推广,都对医院数据质量提出了越来越高的要求。
本篇文章从低质量数据影响入手,探讨医院低质量数据产生的原因,并分析如何解决。由于篇幅问题,在解决措施中重点描述关键数据和业务规则、数据全生命周期管理。
低质量数据的影响
具体场景举例:
1.在卫生材料基础字典维护工作上,临床使用了某些材料,由于前期信息维护不全,如费别、记账比例、医保目录匹配等的缺失,在结账时就会发生错误,造成患者无法顺利结账。
2.对于患者的身份证信息,以前部分手工获取的数据没有进行规制判断及质控管理,使得身份证数据有误,导致同一患者在医院信息系统中识别为不同的两个人,严重影响患者唯一性的判读,易造成相关信息的丢失。
3.医院的诊断ICD10诊断和诊断编码,前期很多诊断编码采用的自定义码,数据质量差,无法根据诊断分析疾病及该种疾病所涉及的所有检查、特检资料,也无法将这些数据用于临床科研分析。
4.在对病理报告进行了文本挖掘和数据质控检查后,发现历史数据中CIN细胞学分级数据有一部分是用英文字母“III”代替了罗马数字“Ⅲ”。
成因探讨
苏州大学附属儿童医院质量管理办公室主任朱晨针对医院数据质量问题有如下见解:
1. 数据生产的逻辑问题
(1)业务行为偏差:医院工作人员未严格按照规范流程完成业务工作,造成数据质量问题。例如:体温数据的测量时间和方式不规范、病案首页未按时归档、医疗文件书写缺项漏项等。
(2)业务流程不同:医院对其业务流程的定义有差异,造成数据质量问题。例如:对急诊患者的定义不同,造成急诊人次数据不能正确反映实际急危重症的就诊情况;医嘱出院时间与结账时间不同,造成业务数据与财务数据不匹配等。
(3)数据对标偏差:数据采集后未对照相关标准或对照不全,造成数据质量问题。例如:病案首页诊断与手术操作编码未及时采用国考要求的《疾病分类与代码国家临床版2.0》《手术操作分类代码国家临床版3.0》标准,与医保DRG/DIP编码对应不准或者不全等。
2. 数据采集的方式问题
(1)人工方式采集:部分数据通过人工录入,导致人为偏差。例如:体温数据录入错误、病案首页诊断编码错误、手工挂号录入基础数据错误、门诊住院病历书写错误等。
(2)采集设备故障:数据采集设备(或采集接口)出现故障而未被及时发现,导致数据偏差。例如:RFID设备失灵造成数据缺失或错误,生命体征监测设备未经规范计量校准,数据接口报错等。
(3)系统覆盖不全:信息系统建设不完善,未全面覆盖业务工作。例如:PACS仅覆盖放射科,超声、内镜未覆盖,造成数据采集不全;门诊电子病历系统未建设或使用率较低等。
3. 数据统计的口径问题
(1)业务要求不同:各级医疗管理部门对数据的统计要求不同。例如:不同统计数据中对已办退休手续而仍坚持临床工作的医务人员统计要求不同、检验检查人次数根据申请单数和根据报告数的统计量不同、出院患者数与病案首页归档数的统计不同、“国考”手术人次数与卫生统计报表中的统计口径不同、不同部门对四级手术及手术操作的统计要求不同、不同数据分析场景下对数据的需求不同等。
(2)财务统计口径:财务统计口径与其他业务统计口径不一致。例如:财务与医保的结算时间不一致、部分检验检查项目的统计归类不一致等。
(3)系统表间口径:数据库各表之间的时间点关系导致不一致。例如:数据库中护理用药领药时间与药剂发药时间不同,造成根据不同报表统计的实际用药量不同等。
4. 数据处理的规则问题
各系统产生的原始数据与经过数据清洗、处理后存储到医院数据中心的数据不一致,或者与上报到区域卫生健康数据中心的数据不一致。例如:区域卫生健康数据中心一般采用通用规则进行数据清理,造成不同医院不同系统之间的数据处理有偏差;不同医院系统分别从生产库或者备份库传输数据,造成数据偏差等。
解决措施
解决措施我们可以分院内、院外两个角度看。
1. 院外的解决措施
院外的解决措施我们期待各级卫生健康行政部门逐步统一上报数据的统计口径。指标的细化能最大程度地减少上报数据的歧义,例如《国家三级公立医院绩效考核操作手册》中对于要求上报的每一个数据都有明确的指标定义、计算方法和指标说明;对于填报中出现的疑问,还不定期地专题发布医院绩效考核问题答疑,并不断更新。
2. 院内的解决措施
院内的解决措施可参考国际DAMA的建议:
(1)定义高质量数据
(2)定义数据质量战略
(3)识别关键数据和业务规则
(4)执行改进方向并确定优先排序
(5)定义数据质量改进目标
识别关键数据和业务规则:
鉴于数据质量是一个很庞大的课题,涉及人员、组织、流程的管理,我们从第三点识别关键数据和业务规则切入展开讨论医院信息化过程的质控手段。
通常,医院的数据质量改进工作从患者主数据、电子病历开始,确定关键数据后,数据质量分析人员需要识别能描述或暗示有关数据质量特征要求的业务规则。一般来说,规则本身并没有明确的文档记录,它们需要通过分析现有的业务流程、工作流、规则、政策、标准、系统编辑、软件代码、以及简单的常识来逆向推导,即业务规则的设定可以从数据如何使用入手。例如,如果一家专科医院的目标锁定在特定人群患者,那么数据质量的潜在指标可能是人口统计领域(出生日期、年龄、 性别和病史等)的人口水平和合理性。
经过一系列优秀学者的研究分析和实际应用场景验证,业务规则所描述的数据质量大体是从几个维度出发的。2013年,DAMA UK发布了一份白皮书,描述了数据质量的6个核心维度:
-
完整性
-
唯一性
-
及时性
-
有效性
-
准确性
-
一致性
在字段或列的级别,规则可以比较简单。完整性规则可以反映了字段是必填还是非必填。有效性规则依赖于规定有效值的域以及在某些情况下字段之间的关系。例如, 邮政编码本身必须是有效的,并且与国家代码正确关联。应在数据集级别定义规则,如每个收件患者都必须有一个有效的邮寄地址。除了字段级、列级,也有表级的规则,具体规则举例如下:
事前事中事后全链路管理:
识别好关键数据和业务规则后,就要将具体措施实施到数据的每个关键环节,可以按数据生命周期的前中后划分。
事前,就是预防措施,常见的是建立数据输入控制,比如录入数据的时候,填写性别改成选择性别、检查是否符合值域要求。防止无效或不准确的数据进入系统。其次是培训数据生产者,比如操作的医生护士,确保他们了解这些数据会影响他们的工作量评估,以保证录入的数据是准确的、完整的。金医慧通的门急诊医生工作站在医生开诊支持自动带出ICD,从源头把控好数据,又方便医生操作。
事中,即数据采集汇聚的时候,做好数据标准与核查规则,在数据入仓库前先做好校验,可以应用上述的六大维度结合业务规则校验。
事后,即纠正措施,问题发生并被检测到,要纠正错误数据,并做好根因分析。数据质量问题应系统地从根本上解决,最大限度上降低纠正措施的成本和风险。常见的根因分析可使用帕累托分析(80/20规则)、鱼骨图分析、过程分析以及5 Whys等(McGilvray,2008)。
金医慧通数据质控产品蓝图
金医慧通云·医院信息平台产品集成了标准体系,可以通过数据的统一汇聚实现院内应用系统的互联互通,形成全院级的病人主索引和电子病历,并在此基础上实现对医院信息资源的二次利用,有助于医疗机构解决内部各个应用与数据互联互通的问题。医院信息集成平台已达到国家软件测评五乙要求,并助力医院通过国家互联互通测评。金医慧通的医院信息平台产品可满足文章内描述的大部分场景,如:
-
统一指标体系,解决口径不一致的问题。
-
集成能力,支持服务集成、数据集成、应用集成,支持轻量级部署、满足医院互联互通评级要求。
-
提供字段级、表级校验完整性、唯一性、有效性等能力。
-
提供监控告警能力,数据有质量问题时可及时处理。
-
质量报告分析,为事后整改数据提供依据和方向。
-
数据集成接入数据质控,丰富数据集成能力特性。
-
建立完善的业务数据指标分析模型和运营监控管理模式,对医院运营状态进行实时监控和管理,为医院经营管理和临床医疗提供及时、准确、科学的决策依据,提高医院的运营管理水平。
结语
数据质量是一个庞大的课题,数据质量管理不是简单做一下校验即可,而是一项长期持续的工作。数据质量管理最重要的是组织文化的改变及质量观念的建立,正如《领导者数据宣言》(The Leader's Data Manifesto)一书中所述:持续性的根本变革需要组织内各级人员的坚定领导和参与。
引用资料:
中共中央国务院 《“健康中国 2030”规划纲要》;
国务院办公厅 《关于促进和规范健康医疗大数据应用发展的指导意见(国办发〔2016〕47 号)》;
国家医疗健康信息 《医院信息互联互通标准化成熟度》;
国家卫健委《关于加强卫生健康统计数据质量控制的通知(国卫办规划函〔2021〕337号)》;
国家卫健委 《WS 445-2014(所有部分) 电子病历基本数据集》;
[美]DAMA国际 《DAMA数据管理知识体系指南》;
朱晨 《公立医院数据质量不高的症结何在?》;
e医疗 《如何利用信息化手段做好数据质控?》。