谷歌发布MedGemma 1.5，开源医疗AI支持3D CT和MRI分析

6 天前·来源：The Decoder

谷歌MedGemma医疗AI开源模型医学图像分析

谷歌推出了开源医疗AI模型MedGemma 1.5，首次支持三维CT和MRI图像分析。该模型能同时处理扫描的每一层，MRI诊断准确率提升14个百分点至65%。谷歌还发布了专门用于医疗听写的语音识别模型MedASR，错误率比OpenAI的Whisper large-v3低82%。

谷歌更新了其开源医疗AI模型MedGemma 1.5，使其成为首个能解读三维CT和MRI图像的公开可用语言模型。该模型通过同时处理图像的每一层来分析三维医学扫描，如CT和MRI。内部基准测试显示，MRI分类准确率从上一版本的51%提升至65%，CT分类准确率从58%提升至61%。谷歌还推出了MedASR，这是一个专为医疗听写构建的新语音识别模型，在医疗听写中比OpenAI的Whisper large-v3错误率低82%。MedGemma 1.5还能处理组织病理学切片，通过同时分析多个切片来识别相关性。在MedQA医疗推理基准测试中，MedGemma 1.5 4B得分从64%提升至69%，从电子患者记录中提取信息的准确率从68%提升至90%。谷歌表示，该技术仍处于早期阶段，模型尚不完整。

阅读原文

背景阅读

MedGemma是谷歌推出的开源医疗AI模型套件，专注于医学图像解读和文本任务，旨在支持医疗行业应用生成式AI。医疗行业采用生成式AI的速度大约是整体经济的两倍，推动了相关技术的发展。此前版本MedGemma主要处理二维输入，如X光片或皮肤图像，而MedGemma 1.5扩展了能力，支持三维体积数据，包括CT、MRI扫描和组织病理学切片。开源模型在医疗AI领域逐渐增多，例如Hugging Face上已有数百个社区变体，促进了创新和协作。谷歌的更新反映了医疗AI向更复杂数据处理的趋势，有助于提高诊断效率和准确性。

谷歌发布MedGemma 1.5，开源医疗AI支持3D CT和MRI分析

背景阅读

相关阅读

谷歌更新Veo模型，支持参考图像生成垂直视频和4K超分

医生认为AI在医疗保健中有用，但可能不适合作为聊天机器人

Tempus AI CEO 谈人工智能在医疗领域的应用

评论 (0)