高级检索
当前位置: 首页 > 详情页

不同缺失场景下各缺失值不同处理方法的结果比较

Missing Data Replacement Methods in Different Scenarios

| 导出 | |

文献详情

资源类型:
Pubmed体系:

收录情况: ◇ 统计源期刊 ◇ 北大核心 ◇ CSCD-C

机构: [1]四川大学华西公共卫生学院流行病与卫生统计学系,成都,610041 [2]四川省肿瘤医院研究所四川省癌症防治中心电子科技大学医学院,成都,610041
出处:
ISSN:

关键词: 缺失值 缺失机制 缺失比例 期望-极大化法 马尔可夫链-蒙特卡洛法

摘要:
目的 收集四川省肿瘤医院头颈部肿瘤患者住院病案信息数据,探讨不同缺失场景下数据缺失值通过完成者数据集法、期望-极大化法(EM)、马尔可夫链-蒙特卡洛法(MCMC)3种方法处理后的标准化住院天数对标准化住院费用对数值的回归系数估计值r的优劣.方法 运用R 3.4.1软件,采用蒙特卡洛模拟,通过设定缺失比例和缺失机制模拟不同场景的缺失数据集,运用完成者数据集法、期望-极大化法、马尔可夫链-蒙特卡洛法估计不同缺失场景的模拟数据集中标准化住院天数对标准化住院费用对数值的回归系数估计值r,并与完整数据集的回归系数估计值rc结果进行比较,从准确度(各种方法估计的r与rc比较)和精确度(各种方法的r的变异程度s)两个角度进行评价.结果 3种缺失值处理方法的优劣在不同的缺失场景中均有所差异,完全随机缺失(MCAR)和随机缺失(MAR)(1∶2)机制下,当缺失比例小于30%时3种方法的估计值r均在可接受范围(rc±0.5sc);MAR(比例=2∶1)机制任意缺失比例下3种方法的估计值r均在可接受范围内;任意缺失场景下用EM法估计的r的标准误s最小,且与rc的标准误sc最为接近.结论 在选择缺失值处理方法时,应该考虑数据的缺失比例和缺失机制.

基金:

基金编号: 81602935

语种:
PubmedID:
第一作者:
第一作者机构: [1]四川大学华西公共卫生学院流行病与卫生统计学系,成都,610041
通讯作者:
推荐引用方式(GB/T 7714):

资源点击量:46861 今日访问量:0 总访问量:3333 更新日期:2024-11-01 建议使用谷歌、火狐浏览器 常见问题

版权所有©2020 四川省肿瘤医院 技术支持:重庆聚合科技有限公司 地址:成都市人民南路四段55号