基金项目: 安徽高校自然科学研究项目(编号:KJ2015A337)
作者:王金宇;张可;夏翠萍;王中新;
关键词:基质辅助激光解吸电离飞行时间质谱技术;;机器学习算法;;热带念珠菌;;支持向量机;;随机森林算法
DOI:10.19405/j.cnki.issn1000-1492.2022.05.024
〔摘 要〕 目的 利用基质辅助激光解吸电离飞行时间质谱(MALDI-TOF MS)平台数据分析和机器学习算法快速鉴别三唑(氟康唑、伏立康唑、伊曲康唑)耐药和敏感的热带念珠菌。方法 从临床各类标本中收集191株热带念珠菌,其中71株为三唑耐药热带念珠菌,120株为三唑敏感热带念珠菌。使用MALDI-TOF MS平台进行数据采集,并根据Mann-Whitney U-test及随机森林(RF)算法获得的重要性评分对耐药株及敏感株的质荷比特征进行分类和选择。利用RF算法及径向基函数核非线性支持向量机(RBF-SVM)构建分类模型,计算相同实验数据下RBF-SVM模型和RF模型的准确度、敏感度、特异度、F1值及受试工作者曲线下面积(AUC)以评估模型鉴别性能。结果 所有菌株经过MALDI-TOF MS平台分析后共得到76个独特的质谱峰。其中,通过特征降维处理后选择6个峰3 481、7 549、6 500、3 048、6 892、2 596 m/z作为模型建立的特征峰。RBF-SVM模型和RF模型的准确度均为0.84,AUC分数分别为0.930 5、0.927 3。结论 机器学习算法结合MALDI-TOF MS平台进行数据分析可作为一种快速区分三唑耐药热带念珠菌和三唑敏感菌株的方法。