谷歌更新了其开源医疗AI模型MedGemma 1.5,使其成为首个能解读三维CT和MRI图像的公开可用语言模型。该模型通过同时处理图像的每一层来分析三维医学扫描,如CT和MRI。内部基准测试显示,MRI分类准确率从上一版本的51%提升至65%,CT分类准确率从58%提升至61%。谷歌还推出了MedASR,这是一个专为医疗听写构建的新语音识别模型,在医疗听写中比OpenAI的Whisper large-v3错误率低82%。MedGemma 1.5还能处理组织病理学切片,通过同时分析多个切片来识别相关性。在MedQA医疗推理基准测试中,MedGemma 1.5 4B得分从64%提升至69%,从电子患者记录中提取信息的准确率从68%提升至90%。谷歌表示,该技术仍处于早期阶段,模型尚不完整。