基金项目: 国家自然科学基金项目(编号:82074090); 安徽省教育厅重点项目(编号:2024AH052061、 2024AH040154)~~
作者:唐然;蒋格格;孟祥文;蔡政;金莉;项楠;张敏;贾晓益;
关键词:系统性红斑狼疮; 机器学习; 生物信息学; HERC5; 干扰素通路; 生物标志物;
DOI:10.19405/j.cnki.issn1000-1492.2025.12.022
〔摘 要〕 目的 基于机器学习算法和结构生物学预测,筛选系统性红斑狼疮(SLE)的潜在生物标志物,揭示其作用机制,为SLE诊断和治疗提供新靶点。方法 利用随机森林(RF)、极限梯度提升算法(XGBoost)、支持向量机(SVM)、最小绝对收缩和选择算子(LASSO)4种机器学习算法,分析基因表达综合数据库GEO(数据集:GSE121239和GSE11907)中SLE患者基因表达数据,筛选关键标志物。收集SLE患者外周血单个核细胞(PBMCs),采用RT-qPCR法检测差异基因的表达水平。利用GSEA富集分析来确定生物标志物相关通路。应用CIBERSORT免疫浸润分析和蛋白互作网络计算样本免疫细胞浸润丰度。分析单细胞数据在免疫细胞中的基因表达特异性,并结合AlphaFold3(AF3)预测相互作用关系。结果 多种算法一起筛选出独特的标记基因HERC5;多个数据集的表达分析显示,与正常组相比,HERC5在SLE中高表达(P