谷歌FunctionGemma将AI大模型能力压缩进手机,未来玩游戏全靠语音指令

AI资讯2个月前发布 ainav
55 0

12月20日消息,谷歌于12月18日正式发布了全新的AI模型——FunctionGemma。该模型基于Gemma 3 270M微调优化,专为边缘设备设计,旨在将强大的函数调用能力引入智能手机、嵌入式系统等终端设备。

随着人工智能技术的演进,行业正从单一的对话式界面向主动式智能体转变。这种趋势使得开发者对本地执行任务的需求日益增长。FunctionGemma应运而生,它继承了Gemma系列模型轻量化的优势,并通过专项微调优化,使边缘设备能够在无需云端计算支持的情况下,准确理解用户指令并调用相应功能。

与通用型大语言模型不同,FunctionGemma是一款高度定制化的AI工具。它不仅具备与人类进行自然对话的能力,还能生成结构化函数调用代码来控制计算机完成特定任务。在谷歌的”移动操作”测试中,未经微调的基础版本准确率达到58%,而经过针对性优化后,处理复杂指令的准确率提升至85%。

为了适应边缘设备对算力和电池续航的严格要求,FunctionGemma采用了极致轻量化的架构设计。它利用256k词表高效处理JSON数据和多语言输入,显著降低了延迟。目前该模型已成功适配NVIDIA Jetson Nano等开发板以及主流移动设备,并能作为”智能交通指挥官”,将复杂任务路由至更大的Gemma 3 27B模型进行处理。

谷歌还为FunctionGemma构建了完善的生态系统支持。开发者可通过Hugging Face、Kaggle平台获取模型,并利用Unsloth、Keras或NVIDIA NeMo框架进行微调优化。在部署方面,FunctionGemma全面兼容 LiteRT-LM、vLLM、Llama.cpp 和 Ollama 等主流工具。

此外,谷歌还发布了TinyGarden游戏演示和”移动操作”微调指南,展示了如何通过自然语言控制虚拟农场或手机系统设置。以下视频展示了模型的实际应用能力:

无论是创建日历事件、添加联系人,还是打开手电筒等操作,FunctionGemma都能准确解析自然语言指令并调用相应系统功能。以下视频展示了模型在游戏场景中的应用:

在另一款互动游戏中,玩家可以通过语音指令管理虚拟土地。例如,下达”在最上面一排种向日葵并浇水”的指令时,模型会将其分解为具体的应用程序功能,如针对特定网格坐标的”种植作物”或”浇水作物”操作。

最后一款游戏展示了如何通过自然语言解决有趣的物理模拟谜题,整个过程完全在浏览器本地运行,由FunctionGemma和Transformers.js提供技术支持。

© 版权声明

相关文章