资源类型:
收录情况:
◇ 统计源期刊
◇ 北大核心
◇ CSCD-C
文章类型:
机构:
[1]四川大学华西公共卫生学院流行病与卫生统计学系,成都610041
[2]四川省肿瘤医院研究所四川省癌症防治中心电子科技大学医学院,成都610O41
四川省人民医院
四川省肿瘤医院
出处:
ISSN:
关键词:
缺失值缺失机制 缺失比例 期望一极大化法 马尔可夫链一蒙特卡洛法
摘要:
目的收集四川省肿瘤医院头颈部肿瘤患者住院病案信息数据,探讨不同缺失场景下数据缺失值通过
完成者数据集法、期望一极大化法(EM)、马尔可夫链一蒙特卡洛法(MCMC)3种方法处理后的标准化住院天数对标准化
住院费用对数值的回归系数估计值r的优劣。方法运用R 3.4.1软件,采用蒙特卡洛模拟,通过设定缺失比例和缺
失机制模拟不同场景的缺失数据集,运用完成者数据集法、期望一极大化法、马尔可夫链一蒙特卡洛法估计不同缺失场
景的模拟数据集中标准化住院天数对标准化住院费用对数值的回归系数估计值r,并与完整数据集的回归系数估计
值 结果进行比较,从准确度(各种方法估计的r与rc比较)和精确度(各种方法的r的变异程度s)两个角度进行评
价。结果3种缺失值处理方法的优劣在不同的缺失场景中均有所差异,完全随机缺失(MCAR)和随机缺失(MAR)
(1:2)机制下,当缺失比例小于3O 时3种方法的估计值r均在可接受范围( ±0.5s );MAR (比例一2:1)机制任
意缺失比例下3种方法的估计值r均在可接受范围内;任意缺失场景下用EM法估计的r的标准误S最小,且与r 的
标准误s 最为接近。结论在选择缺失值处理方法时,应该考虑数据的缺失比例和缺失机制。
基金:
国家自然科学基金青年科学基金项目(No.81602935)和四
川大学青年教师科研启动基金(No.2016SCU11006)资助
基金编号:
No.81602935
第一作者:
第一作者机构:
[1]四川大学华西公共卫生学院流行病与卫生统计学系,成都610041
通讯作者:
推荐引用方式(GB/T 7714):
邱建青,周雨秋,岳廷妍,等.不同缺失场景下各缺失值不同处理方法的结果比较[J].Journal of Sichuan University (Medical Science Edition).2018,49(3):