What is Gemma 3n?

Gemma 3n，作为我们轻量级AI模型的又一次突破性演进，经过精心设计，旨在将强大的多模态能力直接带入边缘设备。Gemma 3n专为开发者打造，突破了设备端处理的局限，使得过去仅限于云端的强大AI应用得以实现。

主要功能特性

凭借创新的架构和优化技术，Gemma 3n赋能您在资源受限的硬件上构建尖端的AI体验：

🧠 专为边缘性能优化： Gemma 3n模型以效率为核心原则进行设计，提供E2B和E4B两种尺寸。尽管它们的原始参数量分别为50亿和80亿，但Per-Layer Embeddings (PLE) 等架构创新使其内存占用可与传统20亿（2GB）和40亿（3GB）模型媲美，完美契合典型设备的内存限制。
👁️👂 原生多模态设计： Gemma 3n原生支持图像、音频、视频和文本输入，并生成文本输出。这种一体化方案，采用专为设备端用例优化设计的全新音频（基于USM）和视觉（MobileNet-V5）编码器，赋能丰富的交互式应用，同时理解多种数据类型。
🪆 灵活架构（MatFormer）： Gemma 3n的核心是其新颖的MatFormer架构。这使得弹性推理成为可能，您可以直接使用预提取的E2B模型以获得更快的推理速度，或者利用Mix-n-Match方法在E2B和E4B之间创建自定义大小的模型，从而根据硬件限制进行精确调优。
✨ 增强的质量与能力： Gemma 3n在多语言能力（支持140种语言的文本和35种语言的多模态理解）、数学、编码和推理方面实现了显著的质量提升。E4B版本在LMArena得分超过1300，展现了100亿参数以下模型的领先性能。
⚡ 加速长上下文处理（KV Cache Sharing）： KV Cache Sharing专为高效处理音频和视频流等长输入而设计，显著提升了time-to-first-token，与以前的模型相比，预填充性能提升高达2倍。

Gemma 3n如何解决您的问题

Gemma 3n为开发者提供了在边缘设备上直接构建高级AI应用所需的工具：

在资源受限的硬件上部署强大的AI： 突破内存和处理限制。Gemma 3n优化的架构和低内存占用让您能够在RAM和处理能力有限的设备上运行功能强大的多模态模型，支持离线功能并大幅降低延迟。
构建实时多模态应用： 创建能够实时理解并响应用户环境的应用。利用集成的高效音频和视觉编码器，处理语音指令、分析实时视频（在Google Pixel等设备上高达60帧/秒），或同时结合文本输入解读图像。
开发灵活且高质量的边缘解决方案： 利用MatFormer架构选择或创建模型尺寸，精准匹配您的硬件与性能需求。在设备上直接获得语言、编码和推理任务方面更高的准确性和通用性。

为何选择Gemma 3n？

Gemma 3n通过提供专为边缘设备量身定制的独特能力组合而脱颖而出：

真正的边缘原生多模态： 与许多为多模态任务改编的模型不同，Gemma 3n从底层构建，其高度优化的音频和视觉编码器专为边缘硬件的效率和性能而设计。
为效率而生的架构创新： MatFormer和Per-Layer Embeddings等创新组件带来了最先进的功能，同时将内存需求显著低于同等规模的传统模型。
广泛的生态系统和工具支持： Gemma 3n专为开发者社区设计，从发布之日起就广泛支持各种流行工具和框架，便于轻松集成到您现有的开发流程中。

总结

Gemma 3n代表着设备端AI领域向前迈出的重要一步，它为开发者提供了所需的性能、效率和多模态能力，以便直接在边缘设备上构建创新应用。凭借其灵活的架构和广泛的工具支持，您将能够打造出在用户身边运行、具有深远影响的AI体验。

准备好开始构建了吗？立即体验Gemma 3n吧。

More information on Gemma 3n

Launched

Pricing Model

Free

Starting Price

Global Rank

Month Visit

<5k

Gemma 3n was manually vetted by our editorial team and was first featured on 2025-06-27.

Gemma 3n 替代

Gemma 3 270M
12

Visit

Gemma 3 270M：小巧轻便、极致高效的人工智能，专精于特定任务。可微调以实现精准指令遵循，并支持低成本的设备端部署。

Gemma 3n VS Gemma 3 270M
Gemma 3
12

Visit

Gemma 3：谷歌开源人工智能，助力打造强大的多模态应用。利用灵活、安全的大模型，轻松构建多语种解决方案。

Gemma 3n VS Gemma 3
Gemma 2
27

Visit

Gemma 2 提供同类最佳性能，在不同硬件上以惊人的速度运行，并能轻松与其他 AI 工具集成，内置了重大的安全改进。

Gemma 3n VS Gemma 2
Google's open Gemma models
12

Visit

Gemma 是一个轻量级开放模型系列，由 Google 用于创建 Gemini 模型的研究和技术构建而成。

Gemma 3n VS Google's open Gemma models
EmbeddingGemma
0

Visit

EmbeddingGemma：专为隐私优先的AI应用打造的设备端多语言文本嵌入技术。即使离线，亦能提供顶尖的性能与效率。

Gemma 3n VS EmbeddingGemma