谷歌发布开源AI模型MedGemma：医疗图像与文本分析专家

AI资讯1年前 (2025)发布 ainav

278 0 0

5月21日最新报道显示，科技媒体Marktechpost昨日发布博文称，在2025年谷歌I/O开发者大会上，该公司正式推出了MedGemma开源医疗模型。

作为基于Gemma 3架构的创新之作，MedGemma提供两种不同配置：包含40亿参数的多模态图像分类模型和拥有270亿参数的纯文本处理模型。其中，4B版本尤其擅长医疗影像分析，能够自动生成诊断报告并解答与图像相关的问题；而27B版本则专注于临床文本理解，适用于患者分诊和治疗决策支持等场景。

具体而言，MedGemma 4B型号采用了先进的SigLIP图像编码器，并经过大量胸部X光片、皮肤病学、眼科及组织病理学影像数据的预训练；而27B型号则专注于文本领域，在医疗文档分析和临床推理方面表现卓越。

该模型支持本地部署用于研究实验，同时也可通过Google Cloud Vertex AI平台快速部署为HTTPS服务端点，实现大规模应用。此外，谷歌还提供了Colab笔记本等实用工具，帮助开发者轻松完成模型的微调和集成工作。

为了便于开发者根据实际需求进行定制化开发，谷歌特别设计了多种灵活的微调方案。用户可以通过提示工程、上下文学习以及LoRA（轻量级参数适应）等高效方法进一步优化模型性能。