基金项目: 国家重点研发计划项目(编号:2020YFE0202200);
作者:冯祎婷1,2任亮亮2娄丽娟2沈玉先1姜颖1,2
关键词:丙烯醛;肺癌;环境污染物;生物信息学;机器学习;预后模型;
DOI:10.19405/j.cnki.issn1000-1492.2025.11.001
〔摘 要〕 通过生物信息学方法构建并验证基于丙烯醛相关基因的肺癌预后预测模型。方法 利用GEO数据库获取肺癌数据集GSE30219和GSE68465,同时从CTD数据库筛选丙烯醛相关基因集。首先,在GSE30219数据集中筛选癌与癌旁的差异表达基因(DEGs),与丙烯醛基因集取交集,获得候选基因。随后,采用基因集变异分析(GSVA)以评估其功能变化特征。基于STRING数据库构建蛋白质互作网络(PPI),筛选核心枢纽基因(Hub Genes)。采用SVM-RFE和LASSO-Cox回归分析构建基于丙烯醛相关基因的肺癌预后预测模型,并使用GSE68465数据集进行独立验证。通过CIBERSORT方法分析高低风险组的免疫细胞浸润特征,同时对高低风险组的DEGs进行功能富集分析,进一步揭示基于丙烯醛相关基因的肺癌预后的潜在分子机制。结果 共筛选出361个丙烯醛相关的肺癌DEGs,进一步确定7个关键基因用于模型构建。Kaplan-Meier生存分析显示,高风险组患者的生存率显著低于低风险组(P<0.000 1)。ROC曲线分析结果表明,该模型具有良好的预测性能。此外,免疫浸润分析显示,风险评分...