斯坦福大学医学院的研究团队推出了SleepFM Clinical,这是一个多模态睡眠基础模型,能够从临床多导睡眠图数据中学习,并基于单晚睡眠预测长期疾病风险。该研究成果已发表在《自然医学》期刊,团队在GitHub上以MIT许可证开源了临床代码。SleepFM Clinical基于约58.5万小时的睡眠记录进行训练,这些数据来自约6.5万人,其中最大队列来自斯坦福睡眠医学中心,涵盖1999年至2024年间约3.5万名成人和儿童的夜间研究。该临床队列与电子健康记录相关联,支持对数百种疾病类别进行生存分析。在模型架构方面,SleepFM使用卷积主干从每个通道提取局部特征,然后通过基于注意力的跨通道聚合和时间变换器处理夜间短片段。预训练目标采用留一对比学习,使模型对缺失通道和异构记录配置具有鲁棒性。预训练后,主干被冻结,训练小型任务特定头部。对于标准睡眠任务,轻量级循环或线性头部将嵌入映射到睡眠阶段或呼吸暂停标签;对于临床风险预测,模型将整晚数据聚合成患者级嵌入,结合年龄和性别等基本人口统计学信息,输入Cox比例风险层进行事件时间建模。在疾病预测前,研究团队验证了SleepFM在标准睡眠分析任务上与专业模型竞争的能力。临床研究中,同一预训练主干被重用进行多中心队列的睡眠分期和呼吸暂停严重程度分类,结果显示其匹配或超越传统卷积模型和其他自动化睡眠分期系统。该模型的核心贡献在于从单晚睡眠中预测130多种疾病和死亡率,包括心血管疾病、代谢紊乱和神经退行性疾病等。研究团队还进行了消融实验,显示多模态表示优于单模态,且模型在跨中心验证中保持性能。