01 · Estado de modelos Gemma (mayo 2026)
Inventario completo y especificaciones de cada variante de Gemma disponible al momento de redacción.
Gemma 4 — release de referencia (2 abril 2026)
Tamaños disponibles
| Variante |
Parámetros |
Arquitectura |
Modalidades |
Contexto |
Memoria @ Q4 |
M4 Pro 24 GB |
| E2B |
~2.3B efectivos |
Dense + PLE |
Texto + imagen + audio + video |
128K |
~4 GB |
✅ 95 tok/s (Ollama) |
| E4B |
~4.5B efectivos |
Dense + PLE |
Texto + imagen + audio + video |
128K |
~5.5 GB |
✅ 57 tok/s (Ollama) ← sweet spot |
| 26B-A4B |
26B totales, 3.8B activos |
MoE |
Texto + imagen + video |
256K |
~16-18 GB |
⚠️ Carga pero ~2 tok/s; OOM en uso sostenido |
| 31B Dense |
31B |
Dense |
Texto + imagen + video |
256K |
~17-20 GB |
❌ No entra; usar API o cloud |
Características técnicas clave
- 140+ idiomas (incluido español rioplatense, mexicano, español de España con buena cobertura).
- Modo "thinking" configurable (CoT con presupuesto de tokens controlable).
- Function calling nativo con JSON schema validado.
- System prompt nativo (no más hacks de prefijos).
- Attention híbrida: sliding window local 5:1 con global.
- p-RoPE (positional rotary embeddings mejoradas).
- KV cache compartido por capa (reduce memoria en contextos largos).
- Multimodalidad nativa, no bolt-on: audio se procesa con el mismo encoder que texto/imagen.
Benchmarks oficiales (model card Gemma 4 31B)
| Benchmark |
Resultado |
| MMLU-Pro |
85.2% |
| AIME 2026 |
89.2% |
| LiveCodeBench v6 |
80.0% |
| GPQA Diamond |
84.3% |
| τ²-bench (agentic tool use) |
86.4% |
| SWE-Bench Verified |
52.0% ⚠️ (notablemente más bajo que DeepSeek V4-Pro 80.6%) |
Arena AI text leaderboard (1 abril 2026):
- Gemma 4 31B Dense: #3 con ELO 1452
- Gemma 4 26B-A4B: #6 con ELO 1441
⚠️ El leaderboard fluctúa; consulta antes de citar a un cliente.
Familia completa de variantes especializadas
| Familia |
Tamaños |
Propósito |
Base |
Licencia |
| Gemma 4 |
E2B, E4B, 26B-A4B, 31B |
General + multimodal + agentic |
Nuevo |
Apache 2.0 |
| Gemma 3 |
270M, 1B, 4B, 12B, 27B |
General + visión |
— |
Gemma ToU |
| Gemma 3n |
E2B (~5B), E4B (~8B) |
Móvil/edge multimodal |
Gemma 3 |
Gemma ToU |
| MedGemma 1.5 |
4B multimodal, 27B text, 27B multimodal |
Texto e imágenes médicas |
Gemma 3 |
HAI-DEF |
| MedSigLIP |
400M |
Encoder de imágenes médicas |
SigLIP |
HAI-DEF |
| CodeGemma |
2B, 7B |
Completion y generación de código |
Gemma 1 |
Gemma ToU |
| PaliGemma 2 |
3B, 10B, 28B |
Vision-language (VLM) |
Gemma 2 + SigLIP |
Gemma ToU |
| ShieldGemma 2 |
4B |
Clasificación de seguridad de imágenes |
Gemma 3 |
Gemma ToU |
| EmbeddingGemma |
308M |
Embeddings multilingües (100+ idiomas), MRL 768→128 dim |
Gemma 3 + T5Gemma |
Gemma ToU |
| VaultGemma |
1B |
Privacidad / Differential Privacy |
Gemma 3 |
Gemma ToU |
| TranslateGemma |
4B, 12B, 27B |
Traducción especializada 55 idiomas |
Gemma 3 |
Gemma ToU |
| T5Gemma v2 |
270M, 1B, 4B |
Encoder-decoder |
Gemma 3 |
Gemma ToU |
| FunctionGemma |
270M |
Function calling especializado |
Gemma 3 |
Gemma ToU |
| TxGemma |
— |
Therapeutics / drug discovery |
Gemma 2 |
HAI-DEF |
| RecurrentGemma |
2B, 9B |
Arquitectura Griffin recurrente (largo contexto eficiente) |
Gemma 1 |
Gemma ToU |
| DataGemma |
2B |
Grounding en datos estadísticos (Data Commons) |
Gemma 2 |
Gemma ToU |
| DolphinGemma |
~400M |
Audio comunicación de delfines (no liberado al público) |
Gemma |
— |
| Gemma Scope 2 |
suite |
Interpretabilidad mecanística |
Gemma 3 |
Open |
| AlphaGenome |
— |
Genómica |
— |
Restricted |
¿Qué modelo usar para qué?
| Caso de uso |
Modelo recomendado |
Por qué |
| Chat general / QA / RAG |
Gemma 4 E4B |
Sweet spot calidad-velocidad en M4 Pro |
| Tareas simples / autocompletado |
Gemma 4 E2B |
95 tok/s; suficiente para clasificación, NER, extracción simple |
| Tareas complejas (razonamiento, agentic) |
Gemma 4 31B vía API |
M4 Pro no lo corre; usa Google AI Studio gratis |
| Embeddings multilingües |
EmbeddingGemma 308M |
100+ idiomas, MRL 768/512/256/128 dim, sweet spot precio/perf |
| Vision-language (imágenes) |
Gemma 4 E4B o PaliGemma 2 10B |
E4B integrado; PaliGemma si necesitas VLM dedicado |
| Audio (ASR + comprensión) |
Gemma 4 E2B/E4B |
Único multimodal con audio nativo en edge |
| Function calling de bajo costo |
FunctionGemma 270M |
Optimizado para tool selection rápido |
| Traducción especializada |
TranslateGemma 12B/27B |
55 idiomas, mejor que LLMs generalistas |
| Moderación de imágenes |
ShieldGemma 2 4B |
Clasificación de seguridad |
| Generación de código |
CodeGemma 7B o Gemma 4 E4B |
E4B compite bien si no es agentic puro |
| Compliance / DP / privacidad técnica |
VaultGemma 1B |
Differential privacy built-in |
| Salud (con validación regulatoria) |
MedGemma 4B/27B |
HAI-DEF; NO clinical grade sin trabajo regulatorio |
Recursos canónicos
- Lista de releases: https://ai.google.dev/gemma/docs/releases
- Model card Gemma 4: https://ai.google.dev/gemma/docs/core/model_card_4
- Blog de lanzamiento: https://blog.google/innovation-and-ai/technology/developers-tools/gemma-4/
- Cookbook oficial: https://github.com/google-gemma/cookbook
- Hugging Face Gemma 4 collection: https://huggingface.co/collections/google/gemma-4
- Hugging Face guide oficial: https://huggingface.co/blog/gemma4
- Repositorio DeepMind: https://github.com/google-deepmind/gemma
- Gemma Terms of Use: https://ai.google.dev/gemma/terms
- Prohibited Use Policy: https://ai.google.dev/gemma/prohibited_use_policy
- HAI-DEF terms (MedGemma): https://developers.google.com/health-ai-developer-foundations