复旦大学附属中山医院:基于自然语言处理的临床医学检查危急值自动识别平台的设计与应用
一、背景
医院危急值管理涵盖放射、病理、心电图、超声、心脏彩超等各类检查检验。检验类结果主要是可度量的数值,而超声、CT、MRI、核医学等检查结果主要以图像形式呈现,并附有规范格式的自然语言描述信息。常规文字处理技术难以快速、准确地处理这类基于自然语言的描述性结果,无法直接精确判断肯定性与否定性语言组合数据的阈值,导致难以作出准确的危急值分析和结果预警。基于NLP技术的危急值自动识别平台支持对检查报告文本的清洗、分词、标注等多项功能,并成功应用于医技系统的检查报告危急值自动识别和危急值监测、预警等业务。
二、设计与应用
在数据采集与预处理方面,筛选出113份危急值报告作为研究样本数据,并对数据进行预处理,构建预训练词库。在分词并构建词库方面,先构建一个自有危急值相关词库,便于后续使用Jieba分词库进行优化,并提高自动识别的准确度。在建立正反向规则库方面,根据临床科室需要,对不同专科制定了不同的危急值指标体系,并构建正向和反向的双向规则库。在人工标注方面,临床医生参与人工优化分词结果及词典,选出危急值关键词,以提高分词的准确性和适应性。在模型训练和评估方面,利用已标注的数据集对Jieba模型进行持续训练和优化。当发现模型误将正常报告结果识别为危急值时,将命中关键字加入忽略词表;误将异常结果识别为非危急值时,对应的关键词将被加入分词词库。随着训练过程的深入,忽略词表和词库将逐渐完善,从而提高自动识别的准确性。
(摘录:中国数字医学)
王真明,安徽省第二人民医院质控处副主任,高级工程师,安徽省医学会医学信息分会常委、安徽省首席信息官协会智慧医疗和大健康产业专委会常委、中国卫生信息与健康医疗大数据学会智慧医院与人工智能应用标准委员会委员、安徽省信息化评审专家库成员。
///////////////////////////////////专家点评////////////////////////////////////
在医疗质量安全的核心制度中,危急值管理扮演着至关重要的角色。它要求对危急值的识别、报告、处理、监控和评估流程进行严格把控,以确保患者得到及时有效的医疗处置。复旦大学附属中山医院研究团队通过选择Jieba中文分词工具,创新性地构建了正反双向规则库,成功应对了自然语言描述性结果中肯定性与否定性语言组合的复杂性问题。这种技术方案不仅提高了危急值识别的准确性,还显著减少了人工干预。该平台的设计充分体现了对实际应用需求的深刻理解。通过大量历史报告数据的采集、预处理和模型训练,确保了系统的稳定性和实用性。同时,结合人工标注和模型优化,进一步提升了系统的识别性能,为医疗信息化建设提供了有益的参考。