谷歌FunctionGemma将AI大模型能力压缩进手机，未来玩游戏全靠语音指令

192 0 0

12月20日消息，谷歌于12月18日正式发布了全新的AI模型——FunctionGemma。该模型基于Gemma 3 270M微调优化，专为边缘设备设计，旨在将强大的函数调用能力引入智能手机、嵌入式系统等终端设备。

随着人工智能技术的演进，行业正从单一的对话式界面向主动式智能体转变。这种趋势使得开发者对本地执行任务的需求日益增长。FunctionGemma应运而生，它继承了Gemma系列模型轻量化的优势，并通过专项微调优化，使边缘设备能够在无需云端计算支持的情况下，准确理解用户指令并调用相应功能。

与通用型大语言模型不同，FunctionGemma是一款高度定制化的AI工具。它不仅具备与人类进行自然对话的能力，还能生成结构化函数调用代码来控制计算机完成特定任务。在谷歌的”移动操作”测试中，未经微调的基础版本准确率达到58%，而经过针对性优化后，处理复杂指令的准确率提升至85%。

为了适应边缘设备对算力和电池续航的严格要求，FunctionGemma采用了极致轻量化的架构设计。它利用256k词表高效处理JSON数据和多语言输入，显著降低了延迟。目前该模型已成功适配NVIDIA Jetson Nano等开发板以及主流移动设备，并能作为”智能交通指挥官”，将复杂任务路由至更大的Gemma 3 27B模型进行处理。

谷歌还为FunctionGemma构建了完善的生态系统支持。开发者可通过Hugging Face、Kaggle平台获取模型，并利用Unsloth、Keras或NVIDIA NeMo框架进行微调优化。在部署方面，FunctionGemma全面兼容 LiteRT-LM、vLLM、Llama.cpp 和 Ollama 等主流工具。

此外，谷歌还发布了TinyGarden游戏演示和”移动操作”微调指南，展示了如何通过自然语言控制虚拟农场或手机系统设置。以下视频展示了模型的实际应用能力：

无论是创建日历事件、添加联系人，还是打开手电筒等操作，FunctionGemma都能准确解析自然语言指令并调用相应系统功能。以下视频展示了模型在游戏场景中的应用：

在另一款互动游戏中，玩家可以通过语音指令管理虚拟土地。例如，下达”在最上面一排种向日葵并浇水”的指令时，模型会将其分解为具体的应用程序功能，如针对特定网格坐标的”种植作物”或”浇水作物”操作。

最后一款游戏展示了如何通过自然语言解决有趣的物理模拟谜题，整个过程完全在浏览器本地运行，由FunctionGemma和Transformers.js提供技术支持。

# AI资讯