谷歌发布开源AI模型MedGemma:医疗图像与文本分析专家

AI资讯1周前发布 ainav
12 0

5月21日最新报道显示,科技媒体Marktechpost昨日发布博文称,在2025年谷歌I/O开发者大会上,该公司正式推出了MedGemma开源医疗模型

作为基于Gemma 3架构的创新之作,MedGemma提供两种不同配置:包含40亿参数的多模态图像分类模型和拥有270亿参数的纯文本处理模型。其中,4B版本尤其擅长医疗影像分析,能够自动生成诊断报告并解答与图像相关的问题;而27B版本则专注于临床文本理解,适用于患者分诊和治疗决策支持等场景。

具体而言,MedGemma 4B型号采用了先进的SigLIP图像编码器,并经过大量胸部X光片、皮肤病学、眼科及组织病理学影像数据的预训练;而27B型号则专注于文本领域,在医疗文档分析和临床推理方面表现卓越。

该模型支持本地部署用于研究实验,同时也可通过Google Cloud Vertex AI平台快速部署为HTTPS服务端点,实现大规模应用。此外,谷歌还提供了Colab笔记本等实用工具,帮助开发者轻松完成模型的微调和集成工作。

为了便于开发者根据实际需求进行定制化开发,谷歌特别设计了多种灵活的微调方案。用户可以通过提示工程、上下文学习以及LoRA(轻量级参数适应)等高效方法进一步优化模型性能。

谷歌发布开源AI模型MedGemma:医疗图像与文本分析专家

相关参考链接

  • Hugging Face平台

  • 项目官方页面

2025谷歌I/O开发者大会专题报道

© 版权声明

相关文章