安徽医科大学学报
2013 07 v.48 725-729
字体:大 中 小
基金项目: 国家自然科学基金项目(编号:61271446);; 上海市科委青年科技启明星计划(A类)(编号:11QA1402900);; 上海市教委科研创新项目(编号:11YZ141)
作者:孔薇;王娟;牟晓阳;
关键词:乳腺癌;;非负矩阵分解;;基因表达谱数据
DOI:10.19405/j.cnki.issn1000-1492.2013.07.002
〔摘 要〕 目的利用改进稀疏非负矩阵分解技术对乳腺癌基因表达谱数据进行双向聚类,挖掘与乳腺癌发病密切相关的基因及其生物过程。方法用小波对22 283个基因的人乳腺癌基因表达数据进行去噪,然后通过T统计初步筛选出5 067个基因作为改进稀疏非负矩阵的输入矩阵,进行双向聚类进一步筛选出81个与乳腺癌密切相关的显著基因,最后通过cytoscape对81个与乳腺癌密切相关的显著基因构建生物过程结构图。结果筛选出与乳腺癌相关的基因、可能相关的基因以及这些基因参与的生物过程之间的关系。结论改进稀疏非负矩阵分解与现存的其他非负矩阵分解算法相比具有聚类效果好、稳定性强且迭代次数少的优点,适合于乳腺癌差异表达基因的提取。