当前位置:首页 > 新闻中心 > 信息快讯 > 内容

上海:医疗卫生数据处理过程中的关键问题研究与实例分析

本研究聚焦医疗卫生数据收集后至数据分析使用前的中间阶段,针对数据的汇聚、清洗、转换、再整理等处理过程的关键问题,研究科学的数据处理方法及设计理念,保证医疗卫生数据处理全过程的数据准确性、完整性和一致性。

一、方法与问题

通过查阅数据处理的相关文献,结合实际工作经验,梳理数据处理过程中存在的关键问题,构建数据处理中各阶段的研究及设计要点。数据处理过程中存在的关键问题:一是数据处理工作流程混乱,二是数据集设计不能满足数据使用需求,三是数据处理过程中数据质量控制不足。

二、应用实例

以一项将实验室日检测量数据作为研究对象的科学研究为例,基于研究及设计要点,围绕该项目的研究目的,在数据处理过程中重点实施了以下几方面的工作。一是明确数据处理过程的不同阶段并留存相应数据集,根据研究目的,将数据处理过程明确划分为个案数据汇聚、个案数据清洗、统计日检测量、数据再整理4个阶段,合理设计各阶段的工作流程与内容,并形成各阶段数据集的变量说明文件。二是在数据处理的全过程中,各阶段数据集间相同含义的变量应保持其名称与格式统一,便于识别与追溯。三是各阶段留存的各版本数据集中,均保留了原始的分类字符型变量和对应的数值型编码变量,并保证两变量值关系一一对应。四是在个案数据汇聚、个案数据清洗、统计日检测量3个阶段,均使用横向数据结构,在数据再整理阶段,使用纵向数据结构。五是对于数据处理的各阶段,应采用独立双遍操作结果比对、逻辑核查等方式进行数据质量控制,保证数据处理全过程的数据质量。

               (摘录:中国卫生信息管理杂志)


////////////////////////////////////专家点评////////////////////////////////////

徐冬,中国科学技术大学附属第一医院(安徽省立医院)科研处, 正高级工程师,现任中国医院协会信息专业委员会委员,安徽省医院协会信息管理专业委员会副主任委员,《中国数字医学》、《医学信息》编委。

本文分析了医疗卫生数据处理过程中存在的关键问题,即处理流程混乱、数据集设计不能满足使用需求、数据质量控制不足,并以实例将数据处理过程划分四个阶段。在前三个阶段,采用传统的横向数据结构,为满足数据分析需要,在数据再整理阶段,使用纵向数据结构(数据以键/值对方式存储),基于统计数据集构建了三个不同层级的分析数据集:全市日检测量数据集、全市各检测机构日检测量数据集、全市各检测机构在不同层级亚组中的日检测量数据集;其另一个特点是保留各阶段数据集,以支持数据可追溯,可实现数据共享权限的精准控制,在保留各阶段数据集基础上,分别对各阶段数据集进行有侧重的数据质量控制,从而保证数据处理全过程的数据质量。


Copyright © 2022 版权所有:安徽省卫生健康委员会信息中心 All rights reserved. 皖ICP备15005701号-3 地址:安徽省合肥市益民街20号 电话:0551-62242803 传真:0551-62242383 邮编:230001