资源类型:
文章类型:
机构:
[1]重庆医科大学公共卫生学院,重庆400016
[2]四川省肿瘤医院胸外科(四川省肿瘤临床医学研究中心 四川省癌症防治中心 电子科技大学附属肿瘤医院),四川成都610041
外科中心
肝胆胰外科
胸外科中心
四川省肿瘤医院
[3]成都市武侯区疾病预防控制中心,四川成都610041
[4]四川省肿瘤医院麻醉科(四川省肿瘤临床医学研究中心 四川省癌症防治中心 电子科技大学附属肿瘤医院),四川成都610041
麻醉医学中心
麻醉科
四川省肿瘤医院
[5]重庆医科大学超声医学工程国家重点实验室,重庆400016
出处:
ISSN:
关键词:
麻醉信息系统
预处理
数据清洗
数据结构化
SAS软件
摘要:
目的 准确、规范的数据是得出可靠研究结果的基础.本文以肺部手术为例,分析麻醉信息系统的数据特征,并进行清洗、转换、集成和归约等预处理,构建可用于科研分析的数据集.方法 收集四川省某肿瘤医院2021年4月至2022年11月行肺部手术患者麻醉信息系统的相关数据.分析源数据特征,并基于Python和SAS软件提出数据预处理流程和宏代码.通过Python的SPLIT语句,SAS宏和函数将文本数据转换为易于数据挖掘的数值数据;通过数据清洗和维归约,填补缺失值、纠正异常和不一致的数据,去除冗余数据;通过NOUNIQUEKEY、SQL和LAG语句实现数据集成,扩大数据体量.结果 从麻醉信息系统和医院信息系统中导出2个Excel表,共计1 835条麻醉记录和46 612条医嘱记录.源数据分析发现麻醉信息系统存在医疗术语不规范、语义表达多样性、同一药物多种量纲、部分药物带有后缀"备用"的特点.基于上述数据特点和半结构化的数据结构,编译了 3个宏(macro),清洗核查全部药物名称、规范化医疗术语以及统一量纲,最终提取麻醉前、术中和镇痛泵的药物各12、24、12种;完成缺失数据的二次补充,平滑噪声和清理不一致数据;剔除了 48条(2.62%)非肺手术的麻醉记录,去除与挖掘任务无关的10个字段;经过数据集成,1 748(97.82%)例麻醉数据与医嘱数据相匹配.通过上述数据预处理流程,最终结构化的数据集中共有1 748例患者,99个变量.结论 通过对源数据的分析,制定特异的麻醉数据预处理流程,进而得到了规范、准确的麻醉用药数据.为其他机构麻醉信息的数据科研化提供了方法学参考,同时为需要利用高质量麻醉用药数据的研究提供了可靠的数据基础.
基金:
国家重点研发计划“政府间国际科技创新合作”重点专项项目(2022YFE0133100);希思科-领航肿瘤研究基金项目(Y-2019AZMS-0486)
第一作者:
第一作者机构:
[1]重庆医科大学公共卫生学院,重庆400016
通讯作者:
通讯机构:
[1]重庆医科大学公共卫生学院,重庆400016
[2]四川省肿瘤医院胸外科(四川省肿瘤临床医学研究中心 四川省癌症防治中心 电子科技大学附属肿瘤医院),四川成都610041
[5]重庆医科大学超声医学工程国家重点实验室,重庆400016
推荐引用方式(GB/T 7714):
向茹梅,魏星,戴维,等.医院麻醉信息系统数据科研化预处理方法探索[J].中国医院统计.2024,31(3):219-229.