基金项目: 国家自然科学基金项目(编号:82074090);安徽省教育厅重点项目(编号:2024AH052061、 2024AH040154);
作者:唐然;蒋格格;孟祥文;蔡政;金莉;项楠;张敏;贾晓益
关键词:系统性红斑狼疮;机器学习;生物信息学;HERC5;IFN通路;生物标志物;
DOI:专辑:医药卫生科技
〔摘 要〕 目的 基于机器学习算法和结构生物学预测、筛选系统性红斑狼疮(SLE)的潜在生物标志物,揭示其作用机制,为疾病诊断和治疗提供新靶点。方法 利用随机森林(RF)、极限梯度提升算法(XGBoost)、支持向量机(SVM)、最小绝对收缩和选择算子(LASSO)4种机器学习算法,分析基因表达综合数据库GEO(数据集:GSE121239和GSE11907)中SLE患者基因表达数据,筛选关键标志物。收集SLE患者外周血单个核细胞(PBMCs),采用RT-qPCR法检测差异基因的表达水平。利用GSEA富集分析来确定生物标志物相关通路。应用CIBERSORT免疫浸润分析和蛋白互作网络计算样本免疫细胞浸润丰度。分析单细胞数据在免疫细胞中的基因表达特异性。并结合AlphaFold3(AF3)预测相互作用关系。结果 多种算法一起筛选出独特的标记基因HERC5;多个数据集的表达分析显示,与正常组相比,HERC5在SLE中高表达(P < 0.05),RT-qPCR验证了相同的趋势(P=0.006 2)。功能富集分析确定SLE中HERC5促进的主要途径为IFN受体信号通路(P < 0.05)。免疫浸润分析显示HERC5与免疫细胞密切相关(中性粒细胞:r=0.39,P < 0.05;记忆B细胞:r=0.33,P < 0.05;激活的树突状细胞:r=0.52,P < 0.05)。大多数HERC5相关相互作用蛋白与SLE相关,HERC5及其相关基因的潜在转录因子也与免疫反应显著相关。结论 HERC5基因是SLE重要的生物标志物,其可能通过IFN通路促进SLE进展,为SLE诊断和治疗提供新靶点。