01 · Estado de modelos Gemma (mayo 2026)¶

Inventario completo y especificaciones de cada variante de Gemma disponible al momento de redacción.

Gemma 4 — release de referencia (2 abril 2026)¶

Tamaños disponibles¶

Variante	Parámetros	Arquitectura	Modalidades	Contexto	Memoria @ Q4	M4 Pro 24 GB
E2B	~2.3B efectivos	Dense + PLE	Texto + imagen + audio + video	128K	~4 GB	✅ 95 tok/s (Ollama)
E4B	~4.5B efectivos	Dense + PLE	Texto + imagen + audio + video	128K	~5.5 GB	✅ 57 tok/s (Ollama) ← sweet spot
26B-A4B	26B totales, 3.8B activos	MoE	Texto + imagen + video	256K	~16-18 GB	⚠️ Carga pero ~2 tok/s; OOM en uso sostenido
31B Dense	31B	Dense	Texto + imagen + video	256K	~17-20 GB	❌ No entra; usar API o cloud

140+ idiomas (incluido español rioplatense, mexicano, español de España con buena cobertura).
Modo "thinking" configurable (CoT con presupuesto de tokens controlable).
Function calling nativo con JSON schema validado.
System prompt nativo (no más hacks de prefijos).
Attention híbrida: sliding window local 5:1 con global.
p-RoPE (positional rotary embeddings mejoradas).
KV cache compartido por capa (reduce memoria en contextos largos).
Multimodalidad nativa, no bolt-on: audio se procesa con el mismo encoder que texto/imagen.

Benchmark	Resultado
MMLU-Pro	85.2%
AIME 2026	89.2%
LiveCodeBench v6	80.0%
GPQA Diamond	84.3%
τ²-bench (agentic tool use)	86.4%
SWE-Bench Verified	52.0% ⚠️ (notablemente más bajo que DeepSeek V4-Pro 80.6%)

Arena AI text leaderboard (1 abril 2026): - Gemma 4 31B Dense: #3 con ELO 1452 - Gemma 4 26B-A4B: #6 con ELO 1441

⚠️ El leaderboard fluctúa; consulta antes de citar a un cliente.

Familia	Tamaños	Propósito	Base	Licencia
Gemma 4	E2B, E4B, 26B-A4B, 31B	General + multimodal + agentic	Nuevo	Apache 2.0
Gemma 3	270M, 1B, 4B, 12B, 27B	General + visión	—	Gemma ToU
Gemma 3n	E2B (~5B), E4B (~8B)	Móvil/edge multimodal	Gemma 3	Gemma ToU
MedGemma 1.5	4B multimodal, 27B text, 27B multimodal	Texto e imágenes médicas	Gemma 3	HAI-DEF
MedSigLIP	400M	Encoder de imágenes médicas	SigLIP	HAI-DEF
CodeGemma	2B, 7B	Completion y generación de código	Gemma 1	Gemma ToU
PaliGemma 2	3B, 10B, 28B	Vision-language (VLM)	Gemma 2 + SigLIP	Gemma ToU
ShieldGemma 2	4B	Clasificación de seguridad de imágenes	Gemma 3	Gemma ToU
EmbeddingGemma	308M	Embeddings multilingües (100+ idiomas), MRL 768→128 dim	Gemma 3 + T5Gemma	Gemma ToU
VaultGemma	1B	Privacidad / Differential Privacy	Gemma 3	Gemma ToU
TranslateGemma	4B, 12B, 27B	Traducción especializada 55 idiomas	Gemma 3	Gemma ToU
T5Gemma v2	270M, 1B, 4B	Encoder-decoder	Gemma 3	Gemma ToU
FunctionGemma	270M	Function calling especializado	Gemma 3	Gemma ToU
TxGemma	—	Therapeutics / drug discovery	Gemma 2	HAI-DEF
RecurrentGemma	2B, 9B	Arquitectura Griffin recurrente (largo contexto eficiente)	Gemma 1	Gemma ToU
DataGemma	2B	Grounding en datos estadísticos (Data Commons)	Gemma 2	Gemma ToU
DolphinGemma	~400M	Audio comunicación de delfines (no liberado al público)	Gemma	—
Gemma Scope 2	suite	Interpretabilidad mecanística	Gemma 3	Open
AlphaGenome	—	Genómica	—	Restricted

Caso de uso	Modelo recomendado	Por qué
Chat general / QA / RAG	Gemma 4 E4B	Sweet spot calidad-velocidad en M4 Pro
Tareas simples / autocompletado	Gemma 4 E2B	95 tok/s; suficiente para clasificación, NER, extracción simple
Tareas complejas (razonamiento, agentic)	Gemma 4 31B vía API	M4 Pro no lo corre; usa Google AI Studio gratis
Embeddings multilingües	EmbeddingGemma 308M	100+ idiomas, MRL 768/512/256/128 dim, sweet spot precio/perf
Vision-language (imágenes)	Gemma 4 E4B o PaliGemma 2 10B	E4B integrado; PaliGemma si necesitas VLM dedicado
Audio (ASR + comprensión)	Gemma 4 E2B/E4B	Único multimodal con audio nativo en edge
Function calling de bajo costo	FunctionGemma 270M	Optimizado para tool selection rápido
Traducción especializada	TranslateGemma 12B/27B	55 idiomas, mejor que LLMs generalistas
Moderación de imágenes	ShieldGemma 2 4B	Clasificación de seguridad
Generación de código	CodeGemma 7B o Gemma 4 E4B	E4B compite bien si no es agentic puro
Compliance / DP / privacidad técnica	VaultGemma 1B	Differential privacy built-in
Salud (con validación regulatoria)	MedGemma 4B/27B	HAI-DEF; NO clinical grade sin trabajo regulatorio

Lista de releases: https://ai.google.dev/gemma/docs/releases
Model card Gemma 4: https://ai.google.dev/gemma/docs/core/model_card_4
Blog de lanzamiento: https://blog.google/innovation-and-ai/technology/developers-tools/gemma-4/
Cookbook oficial: https://github.com/google-gemma/cookbook
Hugging Face Gemma 4 collection: https://huggingface.co/collections/google/gemma-4
Hugging Face guide oficial: https://huggingface.co/blog/gemma4
Repositorio DeepMind: https://github.com/google-deepmind/gemma
Gemma Terms of Use: https://ai.google.dev/gemma/terms
Prohibited Use Policy: https://ai.google.dev/gemma/prohibited_use_policy
HAI-DEF terms (MedGemma): https://developers.google.com/health-ai-developer-foundations