高级检索
当前位置: 首页 > 详情页

不同缺失场景下各缺失值不同处理方法的结果比较

Missing data replacement methods in different scenarios

| 导出 |

文献详情

资源类型:

收录情况: ◇ 统计源期刊 ◇ 北大核心 ◇ CSCD-C

机构: [1]四川大学华西公共卫生学院流行病与卫生统计学系,成都610041 [2]四川省肿瘤医院研究所四川省癌症防治中心电子科技大学医学院,成都610O41
出处:
ISSN:

关键词: 缺失值缺失机制 缺失比例 期望一极大化法 马尔可夫链一蒙特卡洛法

摘要:
目的收集四川省肿瘤医院头颈部肿瘤患者住院病案信息数据,探讨不同缺失场景下数据缺失值通过 完成者数据集法、期望一极大化法(EM)、马尔可夫链一蒙特卡洛法(MCMC)3种方法处理后的标准化住院天数对标准化 住院费用对数值的回归系数估计值r的优劣。方法运用R 3.4.1软件,采用蒙特卡洛模拟,通过设定缺失比例和缺 失机制模拟不同场景的缺失数据集,运用完成者数据集法、期望一极大化法、马尔可夫链一蒙特卡洛法估计不同缺失场 景的模拟数据集中标准化住院天数对标准化住院费用对数值的回归系数估计值r,并与完整数据集的回归系数估计 值 结果进行比较,从准确度(各种方法估计的r与rc比较)和精确度(各种方法的r的变异程度s)两个角度进行评 价。结果3种缺失值处理方法的优劣在不同的缺失场景中均有所差异,完全随机缺失(MCAR)和随机缺失(MAR) (1:2)机制下,当缺失比例小于3O 时3种方法的估计值r均在可接受范围( ±0.5s );MAR (比例一2:1)机制任 意缺失比例下3种方法的估计值r均在可接受范围内;任意缺失场景下用EM法估计的r的标准误S最小,且与r 的 标准误s 最为接近。结论在选择缺失值处理方法时,应该考虑数据的缺失比例和缺失机制。

基金:

基金编号: No.81602935

语种:
第一作者:
第一作者机构: [1]四川大学华西公共卫生学院流行病与卫生统计学系,成都610041
通讯作者:
推荐引用方式(GB/T 7714):

资源点击量:46666 今日访问量:3 总访问量:3332 更新日期:2024-11-01 建议使用谷歌、火狐浏览器 常见问题

版权所有©2020 四川省肿瘤医院 技术支持:重庆聚合科技有限公司 地址:成都市人民南路四段55号