00 · Overview & Key Findings¶

Resumen ejecutivo y hallazgos clave de la investigación de mercado y técnica para construir productos comerciales sobre Gemma.

Fecha de la investigación: mayo 2026 Hardware de referencia: Apple M4 Pro, 24 GB unified memory Modelo de referencia: Gemma 4 (release del 2 de abril de 2026)

Key findings — los 5 puntos que cambian la estrategia¶

1. Gemma 4 cambió las reglas de licenciamiento¶

Apache 2.0 elimina el riesgo legal que generaciones anteriores tenían:

No hay Prohibited Use Policy que se transmita a usuarios.
No hay flow-down obligatorio en tu contrato con clientes.
No hay derecho de Google a "restringir remotamente" tu uso.
No hay restricción de marca de scale (a diferencia de Llama 4 con su umbral de 700M MAU).

Aviso: las variantes especializadas (MedGemma, TxGemma, MedSigLIP) siguen bajo licencias HAI-DEF, más estrictas. Atención al deploy en salud — ver 02-legal-commercial.md.

2. El stack de inferencia local maduró¶

Ollama 0.22+ con runner MLX integrado day-0.
llama.cpp con cuantización Q4_K_M y flash attention.
MLX-LM nativo para Apple Silicon.
mlx-vlm 0.4.3 para vision-language nativo.

En M4 Pro 24 GB, Ollama y MLX están empatados para Gemma 4 (a veces Ollama gana por flash attention). Ver 03-hardware-m4pro.md.

3. Existen casos comerciales verificables¶

Caso	Modelo	Escala	Fuente
Ministerio de Economía de Ucrania (ePermit)	Gemma 3 27B	Estado	deepmind.google/models/gemma/gemmaverse/epermit/
INSAIT / BgGPT (Bulgaria)	Gemma 2/3 4-27B	Estado	INSAIT
SK Telecom (vía Adaptive ML)	Gemma 3 4B	23M+ subs	Adaptive ML blog
Nexa AI OmniAudio	Gemma 2 2B	Producto	Nexa SDK
Yale C2S-Scale (oncología)	Gemma 2 27B	Investigación	Google DeepMind
DeepHealth (Massachusetts)	MedSigLIP	Producto clínico	Google Research
Tap Health (India)	MedGemma	Startup (~$2K ARR)	Tracxn

Cuidado: los casos REALMENTE a escala son contratos institucionales (ePermit, SK Telecom, INSAIT), no SaaS B2B clásico. Ver 04-product-ideas.md para oportunidades realistas para un developer solo.

4. Oportunidad de mercado real en vertical SaaS¶

Vertical SaaS está creciendo más rápido que el horizontal (1,4-1,7×).
Vertical SaaS retiene ~3× mejor (cifra de tech-insider.org referida a retención, NO a crecimiento de ingresos).
Herramientas para PYMEs en español están subatendidas.
"Soberanía de datos" es argumento de venta cuantificable en LegalTech, HealthTech, FinTech y sector público.

5. El M4 Pro es una plataforma de desarrollo, no de producción a escala¶

Construye el MVP, valida, fine-tunea en local.
Cuando crezcas: Cloud Run con NIM, Vertex AI Model Garden, o RTX 6000 Ada/L40S on-prem.
Break-even self-hosting vs OpenAI: ~2-5M tokens/día sostenidos.

Estrategia recomendada (en 1 párrafo)¶

Enfócate en un vertical estrecho (legal-PYME español, salud preventiva no clínica, e-commerce hispano, contabilidad de freelancers, real estate local) con un MVP local-first sobre Gemma 4 E4B + EmbeddingGemma + Qdrant/LanceDB, fine-tuneado con Unsloth/MLX-LM, monetizado en SaaS por puestos (€29-99/usuario/mes) o pay-per-document. La privacidad "datos nunca salen del dispositivo/servidor del cliente" es tu ventaja diferencial frente a OpenAI/Anthropic.

Modelo híbrido (decisión por defecto para casi todo)¶

Gemma 4 E4B local → 80% de queries (lo simple, frecuente, sensible).
Gemma 4 31B vía Google AI Studio API (gratis hasta 15 RPM / 1500 TPM) → 15% (queries complejas).
Gemini 3 / Claude / GPT-5.5 vía API → 5% top-end (operaciones agenticas complejas o no-negociables).

Estimación: te queda a 1/10 del costo total vs all-API, manteniendo calidad equivalente o superior en lo importante.

Próximos pasos del documento¶

Estado de modelos → 01-models-gemma4.md
Análisis legal → 02-legal-commercial.md
Hardware → 03-hardware-m4pro.md
Ideas de producto → 04-product-ideas.md
Pricing/negocio → 05-business-model.md
Stack técnico → 06-tech-stack.md
Alternativas (Qwen/DeepSeek/Phi) → 07-alternatives.md
Plan a 90 días → 08-execution-plan.md
Riesgos → 09-risks.md
Referencias → 10-references.md