资源类型:
Pubmed体系:
收录情况:
◇ 北大核心
◇ 卓越:领军期刊
◇ 中华系列
文章类型:
机构:
[1]厦门大学公共卫生学院 国家传染病诊断试剂与疫苗工程技术研究中心,厦门361102
[2]国家癌症中心 国家肿瘤临床医学研究中心 中国医学科学院北京协和医学院肿瘤医院流行病学研究室,北京100021
[3]首都医科大学附属北京中医医院疾控处,北京100010
[4]绵阳市妇幼保健院妇幼健康管理科,绵阳621000
出处:
ISSN:
关键词:
子宫颈肿瘤
甲基化
甲基化单倍型负荷
机器学习
朴素贝叶斯模型
摘要:
目的 利用人基因的甲基化特征,构建预测宫颈癌及癌前病变的机器学习预测模型。
方法 对2014年4月至2015年3月来自中国医学科学院肿瘤医院、天津市中心妇产科医院、河南省新
密妇幼保健院、四川大学华西第二附属医院和山西长治医学院附属和平医院的224例宫颈脱落细胞
标本进行人DNA甲基化检测,通过CpG高密度、高关联、高甲基化基因片段筛选和LASSO回归算法,
筛选出与宫颈癌病变相关的高甲基化基因片段。以宫颈上皮内瘤变2级(CIN2)及以上病变为研究结
局,以144例门诊患者标本为训练集,构建随机森林(RF)、朴素贝叶斯(NB)和支持向量机(SVM)3种
机器学习预测模型,以80例参与宫颈癌筛查项目女性的宫颈脱落细胞标本为验证集对预测模型进行
验证。以组织学诊断结果为金标准,比较3种机器学习预测模型与HPV检测和细胞学诊断对CIN2及
以上病变的检出效能。结果 训练集144例中,HPV阳性34例,阳性率为23.61%。细胞学诊断为无
上皮内病变或恶性细胞(NILM)37例,不能明确意义的非典型鳞状上皮细胞(ASC-US)及以上病变
107 例。组织学诊断为未见宫颈上皮内病变或宫颈良性病变28 例,CIN1 31 例,CIN2 18 例,CIN3
31例,鳞癌36例。从45个基因中筛选出7个高甲基化基因片段,构建了RF、NB和SVM机器学习预测
模型。验证集80例中,HPV阳性28例,阳性率为35.00%。细胞学诊断为NILM 65例,ASC-US及以上
病变 15例。组织学诊断为未见宫颈上皮内病变或宫颈良性病变39例,CIN1 10例,CIN2 10例,CIN3
11例,鳞癌10例。在验证集中,RF模型、NB模型、SVM模型、HPV检测和细胞学诊断CIN2及以上病
变的受试者工作特征曲线下面积(AUC)分别为0.90、0.88、0.82、0.68和0.45。DeLong检验显示,RF模
型、NB模型和SVM模型的AUC差异无统计学意义(两两比较均P>0.05),RF模型、NB模型的AUC高
于HPV检测(均P<0.01),RF模型、NB模型、SVM模型的AUC高于细胞学诊断(均P<0.01)。RF模型
与NB模型相比,灵敏度相近(分别为80.65%和77.42%),但NB模型的特异度远高于RF模型(分别为
93.88%和73.47%)。结论 基于人DNA甲基化构建的宫颈癌及癌前病变机器学习预测模型中,NB
模型对CIN2及以上病变的预测效能良好,或可用于女性的宫颈癌及癌前病变筛查。
基金:
国家自然科学基金(81973136);中国医学科学院医学与健康科技创新工程
(2021-I2M-1-004);四川省科技计划应用基础研究项目(21YYJC3520)
PubmedID:
第一作者:
第一作者机构:
[1]厦门大学公共卫生学院 国家传染病诊断试剂与疫苗工程技术研究中心,厦门361102
通讯作者:
推荐引用方式(GB/T 7714):
杨源,周航,王亚坤,等.基于人DNA甲基化的宫颈癌及癌前病变机器学习预测模型构建与初步验证[J].Chinese Journal Of Oncology.2025,47(2):193-200.