资源类型:
申请号:
申请日期:
授权年份:
公开号:
公开日:
法律状态:
摘要:
本发明涉及基于免疫相关基因的MSI预测模型构建方法,包括以下步骤:从癌症基因组图谱数据库中收集构建免疫相关MSI预测模型irMSIs的训练集和验证集;从免疫学数据库中选择免疫相关基因,并从中筛选出差异基因;根据筛选出的差异基因,通过LASSO逻辑回归算法构建免疫相关MSI预测模型irMSIs;使用免疫相关MSI预测模型irMSIs对预后风险进行验证。本发明提供了免疫相关基因在MSI状态预测上的应用,结合免疫相关基因,找到了一组可以在消化道肿瘤特别是结肠癌中稳定预测MSI的特征基因,并且能够很好的预测结肠癌预后风险。
主权项:
1.基于免疫相关基因的MSI预测模型构建方法,其特征在于:包括以下步骤:步骤S1:从癌症基因组图谱数据库中收集构建免疫相关MSI预测模型irMSIs的训练集和验证集;步骤S2:从免疫学数据库中选择免疫相关基因,并从中筛选出差异基因;步骤S3:根据筛选出的差异基因,通过LASSO逻辑回归算法构建免疫相关MSI预测模型irMSIs;步骤S4:使用免疫相关MSI预测模型irMSIs对预后风险进行验证;所述从癌症基因组图谱数据库中收集构建免疫相关MSI预测模型irMSIs的训练集和验证集的步骤,包括:从癌症基因组图谱数据库中下载四个癌症队列,四个所述癌症队列包括结肠癌COAD、直肠癌READ、胃癌STAD、食管癌ESCA的mRNA表达谱和临床信息;将结肠癌COAD队列作为差异基因的筛选和免疫相关MSI预测模型irMSIs的训练集,其他队列作为免疫相关MSI预测模型irMSIs的验证集;所述从免疫学数据库中选择免疫相关基因,并从中筛选出差异基因的步骤,包括:从免疫学数据库中下载N个免疫相关基因,从中选取M个配对基因进行分析,N>M;使用edgeR软件包筛选结肠癌COAD队列中微卫星不稳定性高MSI-H的组和微卫星稳定MSS的组之间的差异基因,或微卫星不稳定性高MSI-H的组和微卫星不稳定性低MSI-L的组之间的差异基因,筛选标准为:假发现率FDR<0.05|log2(Fold Change)| ≥ 1其中FDR为假发现率,其值是针对多次检验调整确定的;Fold Change表示两组间某基因的测序数据的counts表达量的差异倍数;从而鉴定出m个差异基因,m<M;m个差异基因中包括a个上调基因和b个下调基因,m=a+b。