谷歌发布MedGemma 1.5,开源医疗AI支持3D CT和MRI分析

6 天前·来源:The Decoder
谷歌MedGemma医疗AI开源模型医学图像分析

谷歌推出了开源医疗AI模型MedGemma 1.5,首次支持三维CT和MRI图像分析。该模型能同时处理扫描的每一层,MRI诊断准确率提升14个百分点至65%。谷歌还发布了专门用于医疗听写的语音识别模型MedASR,错误率比OpenAI的Whisper large-v3低82%。

谷歌更新了其开源医疗AI模型MedGemma 1.5,使其成为首个能解读三维CT和MRI图像的公开可用语言模型。该模型通过同时处理图像的每一层来分析三维医学扫描,如CT和MRI。内部基准测试显示,MRI分类准确率从上一版本的51%提升至65%,CT分类准确率从58%提升至61%。谷歌还推出了MedASR,这是一个专为医疗听写构建的新语音识别模型,在医疗听写中比OpenAI的Whisper large-v3错误率低82%。MedGemma 1.5还能处理组织病理学切片,通过同时分析多个切片来识别相关性。在MedQA医疗推理基准测试中,MedGemma 1.5 4B得分从64%提升至69%,从电子患者记录中提取信息的准确率从68%提升至90%。谷歌表示,该技术仍处于早期阶段,模型尚不完整。

背景阅读

MedGemma是谷歌推出的开源医疗AI模型套件,专注于医学图像解读和文本任务,旨在支持医疗行业应用生成式AI。医疗行业采用生成式AI的速度大约是整体经济的两倍,推动了相关技术的发展。此前版本MedGemma主要处理二维输入,如X光片或皮肤图像,而MedGemma 1.5扩展了能力,支持三维体积数据,包括CT、MRI扫描和组织病理学切片。开源模型在医疗AI领域逐渐增多,例如Hugging Face上已有数百个社区变体,促进了创新和协作。谷歌的更新反映了医疗AI向更复杂数据处理的趋势,有助于提高诊断效率和准确性。

评论 (0)

登录后参与评论

加载评论中...