NeoBeta - AI 科技资讯

斯坦福大学医学院的研究团队推出了SleepFM Clinical，这是一个多模态睡眠基础模型，能够从临床多导睡眠图数据中学习，并基于单晚睡眠预测长期疾病风险。该研究成果已发表在《自然医学》期刊，团队在GitHub上以MIT许可证开源了临床代码。SleepFM Clinical基于约58.5万小时的睡眠记录进行训练，这些数据来自约6.5万人，其中最大队列来自斯坦福睡眠医学中心，涵盖1999年至2024年间约3.5万名成人和儿童的夜间研究。该临床队列与电子健康记录相关联，支持对数百种疾病类别进行生存分析。在模型架构方面，SleepFM使用卷积主干从每个通道提取局部特征，然后通过基于注意力的跨通道聚合和时间变换器处理夜间短片段。预训练目标采用留一对比学习，使模型对缺失通道和异构记录配置具有鲁棒性。预训练后，主干被冻结，训练小型任务特定头部。对于标准睡眠任务，轻量级循环或线性头部将嵌入映射到睡眠阶段或呼吸暂停标签；对于临床风险预测，模型将整晚数据聚合成患者级嵌入，结合年龄和性别等基本人口统计学信息，输入Cox比例风险层进行事件时间建模。在疾病预测前，研究团队验证了SleepFM在标准睡眠分析任务上与专业模型竞争的能力。临床研究中，同一预训练主干被重用进行多中心队列的睡眠分期和呼吸暂停严重程度分类，结果显示其匹配或超越传统卷积模型和其他自动化睡眠分期系统。该模型的核心贡献在于从单晚睡眠中预测130多种疾病和死亡率，包括心血管疾病、代谢紊乱和神经退行性疾病等。研究团队还进行了消融实验，显示多模态表示优于单模态，且模型在跨中心验证中保持性能。

背景阅读

多导睡眠图是睡眠医学的金标准测试，记录脑活动、眼动、心信号、肌张力、呼吸努力和血氧饱和度等生理时间序列数据，但传统临床工作流仅用于睡眠分期和睡眠呼吸暂停诊断。基础模型是一种预训练模型，能够从大规模未标记数据中学习通用表示，适用于多种下游任务，近年来在AI领域如自然语言处理和计算机视觉中广泛应用。在医疗AI领域，多模态基础模型通过整合不同类型数据（如影像、文本和信号）来提升疾病预测和诊断准确性，SleepFM Clinical是这一趋势在睡眠医学中的具体体现，利用多导睡眠图的多通道信号学习共享表示，扩展了睡眠数据的临床应用范围。此前，斯坦福团队已在早期工作中开发SleepFM用于睡眠分期和睡眠呼吸障碍检测，展示了跨脑活动、心电图和呼吸信号学习联合嵌入的优势。

斯坦福大学发布SleepFM Clinical：多模态睡眠基础模型可预测130多种疾病

背景阅读

相关阅读

OpenAI 推出 ChatGPT Health 服务，支持用户上传医疗记录

Proxima 获 8000 万美元种子轮融资，用于 AI 药物发现

Converge Bio 获 2500 万美元 A 轮融资，Meta 和 OpenAI 高管参投

评论 (0)