麻省理工学院和其他研究人员开发的机器学习模型可以识别难以诊断的癌症。
麻省理工学院和马萨诸塞州总医院 (MGH) 的科赫综合癌症研究所 (MGH) 实施了深度学习,以非常具体的方式评估基因,从而为患者找到最佳治疗计划。在早期细胞分化和发育中发现的基因表达可能是识别神秘癌症的关键。研究结果发表在《癌症发现》上。
“有时你可以应用病理学家提供的所有工具,但你仍然没有答案。像这样的机器学习工具可以使肿瘤学家选择更有效的治疗方法,并为他们的患者提供更多指导,”该研究的主要作者、MGH 的病理学家和科赫研究所的临床研究员 Salil Garg 博士说。
当患者第一次被诊断出患有癌症时,肿瘤学家会试图查明癌症的起源。如果临床医生无法确定起点,医生会从非靶向治疗开始,这通常会导致患者存活率低。
开发一个机器学习模型来考虑正常细胞和健康细胞之间的差异以及各种癌症的特征可能具有挑战性。具有大量癌症基因表达特征的复杂模型在接收新数据时可能会出错,即使它看起来正在学习新数据。模型的过度简化可能导致癌症类型的诊断不准确。
Garg 博士和他的团队缩小了肿瘤细胞发育途径改变的迹象。他们使用来自两个强大的细胞图谱的数据来确定胚胎细胞和癌细胞之间的相关性。小鼠器官发生细胞图谱研究了 56 种不同的胚胎细胞轨迹。癌症基因组图谱分析了 33 种类型的肿瘤。
然后将相关数据用于他们的机器学习模型,称为发育多层感知器 (D-MLP),该模型分析肿瘤并预测其起源。该算法用于 52 个新样本。该平台能够将癌症类型分为四类,这有助于诊断和患者治疗计划。
未来,科学家们计划使用来自肿瘤成像、显微镜和放射学的额外数据来进一步增强癌症患者个性化医疗治疗的预测模型。