谷歌开源Gem3轻量模型:支持手机、平板及Web环境

AI资讯6个月前发布 ainav
186 0

8月16日,谷歌宣布推出其开源Gemman系列家族中的最新轻量级版本——Gemma 3 270M。这款模型拥有2.7亿参数量,专为端侧部署场景设计,具备强大的指令遵循和文本结构化能力。

谷歌开源Gem3轻量模型:支持手机、平板及Web环境

目前,Gemma 3系列共有五个版本,分别是270M、1B、4B、12B和27B。在Q4_0量化格式下,这些模型的RAM内存需求分别为240MB、892MB、3.4GB、8.7GB和21GB。其中,Gemma 3 270M凭借最低的RAM内存门槛(INT4量化版本的RAM需求仅约240MB),成为该系列中最适合低功耗设备部署的版本。测试显示,在Pixel 9 Pro手机上运行25轮对话仅消耗手机0.75%的电量,展现出卓越的能效比。

谷歌开源Gem3轻量模型:支持手机、平板及Web环境

据谷歌官方介绍,该模型特别适用于处理高频率、任务明确的场景,并且在保护个人隐私信息方面表现出色。其典型应用场景包括情感分析、实体识别和人生规划等任务。此外,Gemma 3 270M还支持开发者快速构建多个专用任务的小型模型。

为方便开发者使用,谷歌同步发布了微调教学资源,提供了基于Hugging Face Transformers的全模型训练完整流程,涵盖分类、信息抽取和情感分析等任务的定制化开发指导。值得注意的是,已有第三方开发者通过transformers.js成功将该模型部署到浏览器端,实测表明Gemma 3 270M在Web环境中同样具备出色性能和良好可控性。

总体来看,Gemma 3 270M凭借其轻量化设计、低功耗特性和多场景适应能力,为端侧AI应用提供了新的选择。其强大的定制化能力和广泛的适用范围,将进一步推动端智能技术的发展与普及。

© 版权声明

相关文章