资源类型:
Pubmed体系:
收录情况:
◇ 统计源期刊
◇ 北大核心
◇ CSCD-C
文章类型:
机构:
[1]四川大学华西公共卫生学院流行病与卫生统计学系,成都,610041
[2]四川省肿瘤医院研究所四川省癌症防治中心电子科技大学医学院,成都,610041
四川省人民医院
四川省肿瘤医院
出处:
ISSN:
关键词:
缺失值
缺失机制
缺失比例
期望-极大化法
马尔可夫链-蒙特卡洛法
摘要:
目的 收集四川省肿瘤医院头颈部肿瘤患者住院病案信息数据,探讨不同缺失场景下数据缺失值通过完成者数据集法、期望-极大化法(EM)、马尔可夫链-蒙特卡洛法(MCMC)3种方法处理后的标准化住院天数对标准化住院费用对数值的回归系数估计值r的优劣.方法 运用R 3.4.1软件,采用蒙特卡洛模拟,通过设定缺失比例和缺失机制模拟不同场景的缺失数据集,运用完成者数据集法、期望-极大化法、马尔可夫链-蒙特卡洛法估计不同缺失场景的模拟数据集中标准化住院天数对标准化住院费用对数值的回归系数估计值r,并与完整数据集的回归系数估计值rc结果进行比较,从准确度(各种方法估计的r与rc比较)和精确度(各种方法的r的变异程度s)两个角度进行评价.结果 3种缺失值处理方法的优劣在不同的缺失场景中均有所差异,完全随机缺失(MCAR)和随机缺失(MAR)(1∶2)机制下,当缺失比例小于30%时3种方法的估计值r均在可接受范围(rc±0.5sc);MAR(比例=2∶1)机制任意缺失比例下3种方法的估计值r均在可接受范围内;任意缺失场景下用EM法估计的r的标准误s最小,且与rc的标准误sc最为接近.结论 在选择缺失值处理方法时,应该考虑数据的缺失比例和缺失机制.
基金:
国家自然科学基金青年科学基金项目(81602935)%四川大学青年教师科研启动基金(2016SCU11006)
基金编号:
81602935
PubmedID:
第一作者:
第一作者机构:
[1]四川大学华西公共卫生学院流行病与卫生统计学系,成都,610041
通讯作者:
推荐引用方式(GB/T 7714):
邱建青,周雨秋,岳廷妍,等.不同缺失场景下各缺失值不同处理方法的结果比较[J].四川大学学报(医学版).2018,49(03):430-435.