00 · Overview & Key Findings¶
Resumen ejecutivo y hallazgos clave de la investigación de mercado y técnica para construir productos comerciales sobre Gemma.
Fecha de la investigación: mayo 2026 Hardware de referencia: Apple M4 Pro, 24 GB unified memory Modelo de referencia: Gemma 4 (release del 2 de abril de 2026)
Key findings — los 5 puntos que cambian la estrategia¶
1. Gemma 4 cambió las reglas de licenciamiento¶
Apache 2.0 elimina el riesgo legal que generaciones anteriores tenían:
- No hay Prohibited Use Policy que se transmita a usuarios.
- No hay flow-down obligatorio en tu contrato con clientes.
- No hay derecho de Google a "restringir remotamente" tu uso.
- No hay restricción de marca de scale (a diferencia de Llama 4 con su umbral de 700M MAU).
Aviso: las variantes especializadas (MedGemma, TxGemma, MedSigLIP) siguen bajo licencias HAI-DEF, más estrictas. Atención al deploy en salud — ver 02-legal-commercial.md.
2. El stack de inferencia local maduró¶
- Ollama 0.22+ con runner MLX integrado day-0.
- llama.cpp con cuantización Q4_K_M y flash attention.
- MLX-LM nativo para Apple Silicon.
- mlx-vlm 0.4.3 para vision-language nativo.
En M4 Pro 24 GB, Ollama y MLX están empatados para Gemma 4 (a veces Ollama gana por flash attention). Ver 03-hardware-m4pro.md.
3. Existen casos comerciales verificables¶
| Caso | Modelo | Escala | Fuente |
|---|---|---|---|
| Ministerio de Economía de Ucrania (ePermit) | Gemma 3 27B | Estado | deepmind.google/models/gemma/gemmaverse/epermit/ |
| INSAIT / BgGPT (Bulgaria) | Gemma 2/3 4-27B | Estado | INSAIT |
| SK Telecom (vía Adaptive ML) | Gemma 3 4B | 23M+ subs | Adaptive ML blog |
| Nexa AI OmniAudio | Gemma 2 2B | Producto | Nexa SDK |
| Yale C2S-Scale (oncología) | Gemma 2 27B | Investigación | Google DeepMind |
| DeepHealth (Massachusetts) | MedSigLIP | Producto clínico | Google Research |
| Tap Health (India) | MedGemma | Startup (~$2K ARR) | Tracxn |
Cuidado: los casos REALMENTE a escala son contratos institucionales (ePermit, SK Telecom, INSAIT), no SaaS B2B clásico. Ver 04-product-ideas.md para oportunidades realistas para un developer solo.
4. Oportunidad de mercado real en vertical SaaS¶
- Vertical SaaS está creciendo más rápido que el horizontal (1,4-1,7×).
- Vertical SaaS retiene ~3× mejor (cifra de tech-insider.org referida a retención, NO a crecimiento de ingresos).
- Herramientas para PYMEs en español están subatendidas.
- "Soberanía de datos" es argumento de venta cuantificable en LegalTech, HealthTech, FinTech y sector público.
5. El M4 Pro es una plataforma de desarrollo, no de producción a escala¶
- Construye el MVP, valida, fine-tunea en local.
- Cuando crezcas: Cloud Run con NIM, Vertex AI Model Garden, o RTX 6000 Ada/L40S on-prem.
- Break-even self-hosting vs OpenAI: ~2-5M tokens/día sostenidos.
Estrategia recomendada (en 1 párrafo)¶
Enfócate en un vertical estrecho (legal-PYME español, salud preventiva no clínica, e-commerce hispano, contabilidad de freelancers, real estate local) con un MVP local-first sobre Gemma 4 E4B + EmbeddingGemma + Qdrant/LanceDB, fine-tuneado con Unsloth/MLX-LM, monetizado en SaaS por puestos (€29-99/usuario/mes) o pay-per-document. La privacidad "datos nunca salen del dispositivo/servidor del cliente" es tu ventaja diferencial frente a OpenAI/Anthropic.
Modelo híbrido (decisión por defecto para casi todo)¶
- Gemma 4 E4B local → 80% de queries (lo simple, frecuente, sensible).
- Gemma 4 31B vía Google AI Studio API (gratis hasta 15 RPM / 1500 TPM) → 15% (queries complejas).
- Gemini 3 / Claude / GPT-5.5 vía API → 5% top-end (operaciones agenticas complejas o no-negociables).
Estimación: te queda a 1/10 del costo total vs all-API, manteniendo calidad equivalente o superior en lo importante.
Próximos pasos del documento¶
- Estado de modelos → 01-models-gemma4.md
- Análisis legal → 02-legal-commercial.md
- Hardware → 03-hardware-m4pro.md
- Ideas de producto → 04-product-ideas.md
- Pricing/negocio → 05-business-model.md
- Stack técnico → 06-tech-stack.md
- Alternativas (Qwen/DeepSeek/Phi) → 07-alternatives.md
- Plan a 90 días → 08-execution-plan.md
- Riesgos → 09-risks.md
- Referencias → 10-references.md