Saltar a contenido

01 · Estado de modelos Gemma (mayo 2026)

Inventario completo y especificaciones de cada variante de Gemma disponible al momento de redacción.


Gemma 4 — release de referencia (2 abril 2026)

Tamaños disponibles

Variante Parámetros Arquitectura Modalidades Contexto Memoria @ Q4 M4 Pro 24 GB
E2B ~2.3B efectivos Dense + PLE Texto + imagen + audio + video 128K ~4 GB 95 tok/s (Ollama)
E4B ~4.5B efectivos Dense + PLE Texto + imagen + audio + video 128K ~5.5 GB 57 tok/s (Ollama) ← sweet spot
26B-A4B 26B totales, 3.8B activos MoE Texto + imagen + video 256K ~16-18 GB ⚠️ Carga pero ~2 tok/s; OOM en uso sostenido
31B Dense 31B Dense Texto + imagen + video 256K ~17-20 GB ❌ No entra; usar API o cloud

Características técnicas clave

  • 140+ idiomas (incluido español rioplatense, mexicano, español de España con buena cobertura).
  • Modo "thinking" configurable (CoT con presupuesto de tokens controlable).
  • Function calling nativo con JSON schema validado.
  • System prompt nativo (no más hacks de prefijos).
  • Attention híbrida: sliding window local 5:1 con global.
  • p-RoPE (positional rotary embeddings mejoradas).
  • KV cache compartido por capa (reduce memoria en contextos largos).
  • Multimodalidad nativa, no bolt-on: audio se procesa con el mismo encoder que texto/imagen.

Benchmarks oficiales (model card Gemma 4 31B)

Benchmark Resultado
MMLU-Pro 85.2%
AIME 2026 89.2%
LiveCodeBench v6 80.0%
GPQA Diamond 84.3%
τ²-bench (agentic tool use) 86.4%
SWE-Bench Verified 52.0% ⚠️ (notablemente más bajo que DeepSeek V4-Pro 80.6%)

Arena AI text leaderboard (1 abril 2026): - Gemma 4 31B Dense: #3 con ELO 1452 - Gemma 4 26B-A4B: #6 con ELO 1441

⚠️ El leaderboard fluctúa; consulta antes de citar a un cliente.


Familia completa de variantes especializadas

Familia Tamaños Propósito Base Licencia
Gemma 4 E2B, E4B, 26B-A4B, 31B General + multimodal + agentic Nuevo Apache 2.0
Gemma 3 270M, 1B, 4B, 12B, 27B General + visión Gemma ToU
Gemma 3n E2B (~5B), E4B (~8B) Móvil/edge multimodal Gemma 3 Gemma ToU
MedGemma 1.5 4B multimodal, 27B text, 27B multimodal Texto e imágenes médicas Gemma 3 HAI-DEF
MedSigLIP 400M Encoder de imágenes médicas SigLIP HAI-DEF
CodeGemma 2B, 7B Completion y generación de código Gemma 1 Gemma ToU
PaliGemma 2 3B, 10B, 28B Vision-language (VLM) Gemma 2 + SigLIP Gemma ToU
ShieldGemma 2 4B Clasificación de seguridad de imágenes Gemma 3 Gemma ToU
EmbeddingGemma 308M Embeddings multilingües (100+ idiomas), MRL 768→128 dim Gemma 3 + T5Gemma Gemma ToU
VaultGemma 1B Privacidad / Differential Privacy Gemma 3 Gemma ToU
TranslateGemma 4B, 12B, 27B Traducción especializada 55 idiomas Gemma 3 Gemma ToU
T5Gemma v2 270M, 1B, 4B Encoder-decoder Gemma 3 Gemma ToU
FunctionGemma 270M Function calling especializado Gemma 3 Gemma ToU
TxGemma Therapeutics / drug discovery Gemma 2 HAI-DEF
RecurrentGemma 2B, 9B Arquitectura Griffin recurrente (largo contexto eficiente) Gemma 1 Gemma ToU
DataGemma 2B Grounding en datos estadísticos (Data Commons) Gemma 2 Gemma ToU
DolphinGemma ~400M Audio comunicación de delfines (no liberado al público) Gemma
Gemma Scope 2 suite Interpretabilidad mecanística Gemma 3 Open
AlphaGenome Genómica Restricted

¿Qué modelo usar para qué?

Caso de uso Modelo recomendado Por qué
Chat general / QA / RAG Gemma 4 E4B Sweet spot calidad-velocidad en M4 Pro
Tareas simples / autocompletado Gemma 4 E2B 95 tok/s; suficiente para clasificación, NER, extracción simple
Tareas complejas (razonamiento, agentic) Gemma 4 31B vía API M4 Pro no lo corre; usa Google AI Studio gratis
Embeddings multilingües EmbeddingGemma 308M 100+ idiomas, MRL 768/512/256/128 dim, sweet spot precio/perf
Vision-language (imágenes) Gemma 4 E4B o PaliGemma 2 10B E4B integrado; PaliGemma si necesitas VLM dedicado
Audio (ASR + comprensión) Gemma 4 E2B/E4B Único multimodal con audio nativo en edge
Function calling de bajo costo FunctionGemma 270M Optimizado para tool selection rápido
Traducción especializada TranslateGemma 12B/27B 55 idiomas, mejor que LLMs generalistas
Moderación de imágenes ShieldGemma 2 4B Clasificación de seguridad
Generación de código CodeGemma 7B o Gemma 4 E4B E4B compite bien si no es agentic puro
Compliance / DP / privacidad técnica VaultGemma 1B Differential privacy built-in
Salud (con validación regulatoria) MedGemma 4B/27B HAI-DEF; NO clinical grade sin trabajo regulatorio

Recursos canónicos

  • Lista de releases: https://ai.google.dev/gemma/docs/releases
  • Model card Gemma 4: https://ai.google.dev/gemma/docs/core/model_card_4
  • Blog de lanzamiento: https://blog.google/innovation-and-ai/technology/developers-tools/gemma-4/
  • Cookbook oficial: https://github.com/google-gemma/cookbook
  • Hugging Face Gemma 4 collection: https://huggingface.co/collections/google/gemma-4
  • Hugging Face guide oficial: https://huggingface.co/blog/gemma4
  • Repositorio DeepMind: https://github.com/google-deepmind/gemma
  • Gemma Terms of Use: https://ai.google.dev/gemma/terms
  • Prohibited Use Policy: https://ai.google.dev/gemma/prohibited_use_policy
  • HAI-DEF terms (MedGemma): https://developers.google.com/health-ai-developer-foundations