Gemma 2 – 源自谷歌DeepMind的最新公开人工智能系统

AI工具2年前 (2025)发布 ainav

493 0 0

Gemma 2指的是什么？

Gemma 2是谷歌DeepMind最新发布的开源人工智能系统，提供了90亿及270亿参数的不同版本。这款模型以其出色的性能、快速的推理能力和对各类硬件的良好适应性而著称，并能与那些拥有更多参数的同类产品（例如Llama 3、Claude 3 Sonnet）相竞争。Gemma 2的设计旨在便于开发者轻松整合到其现有工作流程中，同时兼容多种人工智能框架，并可通过Google Cloud、Kaggle和Hugging Face等渠道免费获取。

Gemma 2的特色特点如下：

模型的参数量当前，Gemma 2推出了两个不同大小的模型版本来满足多样化的应用场景及资源配置要求，这两个版本分别包含90亿(9B)和270亿(27B)个参数。未来还将增加一个较小规模、拥有26亿参数（2.6B）的模型选项。
提升效能Gemma 2 的27B版本展现了卓越的性能效率，即便其参数量不到某些竞品的一半，依然能够匹敌这些更大的模型。在LMSYS Chatbot Arena的评估中，这款拥有270亿参数的Gemma 2指令微调变体超越了包括含有700亿参数的Llama 3在内的多个对手，并且其表现优于如Nemotron 4 340B、Claude 3 Sonnet、Command R+以及Qwen 72B等模型，从而在开源权重类别中独占鳌头。
推理论证的效能Gemma 2对推理流程进行了专门的优化，在单一高性能GPU或TPU上即可实现全精度运算，并且不需要其他硬件支持，显著减少了使用的开销。
设备兼容性Gemma 2具备在各种硬件设备上高效运作的能力，涵盖个人计算机、专业工作台、游戏本及云端服务器等多种平台。
公开授权Gemma 2配备了一种对企业友善的授权条款，该条款支持开发人员及研究者能够无拘束地共享、利用并将其应用程序推向市场。
结构提供支持Gemma 2支持多种流行的AI开发框架，如Hugging Face Transformers、JAX、PyTorch及TensorFlow，让开发者能够依据个人喜好挑选最适宜的平台进行工作。
安装软件谷歌推出了Gemma Cookbook这一资源库，内含丰富的实例与指导手册，旨在协助用户开发应用并优化调整Gemma 2模型的功能。
承担职责的人工智能谷歌推出了包括责任生成式AI工具包及LLM比较器在内的一系列工具与资源，旨在助力开发者与研究者能够更负责任地开发并应用人工智能技术。

关于Gemma 2的运用方法

Gemma 2能够无缝集成到用户的日常工具和工作流程中，它支持主流的AI框架如Hugging Face Transformers、JAX、PyTorch 和 TensorFlow，并可通过原生Keras 3.0、vLLM、Gemma.cpp、Llama.cpp以及Ollama进行实现。此外，该软件还经过NVIDIA TensorRT-LLM优化，能够在NVIDIA加速计算平台上运行或作为NVIDIA NIM推理微服务执行，并将特别针对NVIDIA的NeMo框架进行了性能调优。

现可在Google AI Studio上体验升级版的Gemma 2，用户能够无须担忧硬件限制便以每秒27B的速度全面检验其性能表现。同时，开发人员也能够在Kaggle及Hugging Face Models平台上下载到Gemma 2的模型权重，而Vertex AI Model Garden也将很快推出该服务。

为了促进研究与开发工作，用户现在可以通过 Kaggle 或 Colab 笔记本免费访问 Gemma 2。对于初次接触 Google Cloud 的用户，将有机会获得价值300美元的信用额度。此外，学术领域的研究人员可以申请加入Gemna 2学术项目，以获取Google Cloud提供的信用额度支持其基于Gemma 2的研究工作。此项申请的有效期截止到8月9日。

# AI工具