联邦深度学习支持通过蛋白质组学进行癌症亚型
评论:人工智能在生物医学中的应用面临着来自数据隐私要求的重大挑战。为了解决临床注释的组织蛋白质组学数据的这个问题,我们开发了一种联合深度学习 (FDL) 方法 (ProCanFDL),在模拟站点上训练本地模型,其中包含来自泛癌队列 (n=1,260) 和 29 个队列的数据,这些队列保存在私有防火墙后面 (n=6,265),代表 19,930 次重复数据非依赖性采集质谱 (DIA-MS) 运行。聚合局部参数更新以构建全局模型,与本地模型相比,在 14 个癌症亚型任务中,保持测试集 (n=625) 的性能提高了 43%,并与集中式模型性能相匹配。通过使用来自两个外部 DIA-MS 队列 (n=55) 和八个通过串联质量标签 (TMT) 蛋白质组学 (n=832) 获得的数据重新训练全局模型,证明了该方法的通用性。ProCanFDL 为使用蛋白质组学数据的国际协作机器学习计划提供了一种解决方案,例如 |
原文链接:xmolJournal
分类:#xmolJournal #Week242025
评论:人工智能在生物医学中的应用面临着来自数据隐私要求的重大挑战。为了解决临床注释的组织蛋白质组学数据的这个问题,我们开发了一种联合深度学习 (FDL) 方法 (ProCanFDL),在模拟站点上训练本地模型,其中包含来自泛癌队列 (n=1,260) 和 29 个队列的数据,这些队列保存在私有防火墙后面 (n=6,265),代表 19,930 次重复数据非依赖性采集质谱 (DIA-MS) 运行。聚合局部参数更新以构建全局模型,与本地模型相比,在 14 个癌症亚型任务中,保持测试集 (n=625) 的性能提高了 43%,并与集中式模型性能相匹配。通过使用来自两个外部 DIA-MS 队列 (n=55) 和八个通过串联质量标签 (TMT) 蛋白质组学 (n=832) 获得的数据重新训练全局模型,证明了该方法的通用性。ProCanFDL 为使用蛋白质组学数据的国际协作机器学习计划提供了一种解决方案,例如 |
原文链接:xmolJournal
分类:#xmolJournal #Week242025