随机生存森林在大规模基因分型肺癌预后关联性研究中的降维作用

目的探索随机生存森林在大规模测序肺癌随访研究资料中的降维效果,为进一步建立预后预测模型提供依据。方法利用随机生存森林法对120位肺癌患者399个单核苷酸多态性(single nucleotide polymorphisms,SNPs)位点进行降维分析,筛选出重要性评分较高且错分率较低的SNPs子集,再对该子集建立多元Cox比例风险模型,并利用交叉验证法评价模型的预测效果。结果随机生存森林法筛选出25个重要的SNPs,控制临床协变量(临床分期、是否手术、组织病理学类型)的多元Cox比例风险模型显示有4个位点有统计学意义。交叉验证结果表明,该模型的平均准确度达83.63%。结论对高维关联性研究数据利用随机生存森林法先去噪降维,再作进一步分析,有助于后续预后预测模型的建立。

国家自然科学基金(30901232,81072389); 江苏省高校自然科学基金重大项目(10KJA33034); 江苏高校优势学科建设工程; 江苏省研究生创新工程(CXZZ11_0733);

多态性,单核苷酸; 数据说明,统计; 肺肿瘤;

R734.2

390621-6244646K
在线咨询 用户反馈