Saltar a contenido

09 · Riesgos y consideraciones

Lo que puede salir mal, probabilidad, impacto, y cómo mitigar.


Matriz de riesgos

Riesgo Prob. Impacto Mitigación
Google cambia ToU de Gemma 4 retroactivamente Baja Medio Apache 2.0 es irrevocable para versiones publicadas. Snapshot del modelo y licencia el día que lo descargues. Documenta versión exacta.
Aparece modelo mejor (Gemma 5, Qwen 4) Alta a 6-12 meses Bajo Tu moat es fine-tune sobre datos del cliente + workflow, no el modelo base. LiteLLM permite cambio en horas.
HIPAA/GDPR/AI Act compliance Alta en salud/finanzas Alto Empieza wellness, no clínico. EU: documenta DPIA, DPA con clientes, cifrado at-rest/in-transit. AI Act: clasifica tu sistema (mayoría = riesgo limitado, transparencia básica).
Costo oculto: tiempo de ingeniero ML Alta Medio No te autohostees hasta tener €3K+ MRR. Quema horas en producto, no infra.
Quality regression en fine-tune Media Alto Eval set obligatorio antes/después. Usa Langfuse para A/B testing en producción.
Cliente pide "garantías" como con SaaS de IA cerrada Alta Medio SLA explícito, human-in-the-loop por default; nunca "fully autonomous" en contratos.
GPUs en cloud se vuelven caras/inaccesibles Media Alto Plan B: Mac Studio M5 Ultra 256 GB como servidor (~$8K, depreciación 36 meses); on-prem RTX 6000 Ada.
Bugs específicos Gemma 4 + Apple Silicon (confirmados a mayo 2026) Alto en agentic Medio Issue ollama/ollama#15368. Usa llama.cpp para agentic; espera Ollama 0.22+ con MLX integrado day-0.
Privacy breach / data leak Media Catastrófico Cifrado obligatorio. Audit logs. Pen-test antes de tener clientes enterprise. Seguro de ciberresponsabilidad civil €1-5K/año.
Cliente único representa >30% del MRR Media Alto Concentración de cliente = riesgo existencial. Diversifica activamente.
Modelo alucina en output crítico (legal, médico, financiero) Alta Alto Human-in-the-loop obligatorio. Citas a fuentes. Confidence scores visibles. Disclaimer prominente.
Google cambia disponibilidad de la API gratuita Media Medio Tu producto NO debe depender de la API gratuita en path crítico. Solo para queries fallback.
Llama 4 supera Gemma 4 → cliente pide cambio Baja-Media Medio Tu cliente no sabe ni le importa qué modelo usas, salvo que lo nombres. Mantén abstracción.

Compliance: deep dive por vertical

LegalTech

Norma Aplicabilidad Mitigación
GDPR Sí (datos personales en contratos) DPA con clientes, cifrado, derecho de borrado
EU AI Act Riesgo limitado Transparencia: "este texto fue generado/revisado por IA"
Secreto profesional Sí, en abogados Cliente firma que IA es asistencia, no representación
RGPD (España) Si vendes a EU DPO obligatorio si tratamiento masivo

Estructura recomendada: el cliente abogado es el "controller", tú eres "processor". DPA estándar (template Iubenda o Termly).

HealthTech (wellness, NO clínico)

Norma Aplicabilidad Mitigación
HIPAA (US) Solo si tu cliente es HIPAA-covered BAA + cifrado + audit logs
GDPR Art. 9 (datos sensibles) Consentimiento explícito
EU AI Act Riesgo alto si afecta decisión clínica Limita a wellness/educación
FDA SaMD / CE MDR Si reclamas diagnóstico NO reclames diagnóstico sin certificación

Línea roja: nunca digas "diagnóstico", "tratamiento", "cura". Di "información educativa", "tracking", "recordatorio".

FinTech

Norma Aplicabilidad Mitigación
DORA (EU, 2025+) Sí si vendes a entidades financieras Plan de continuidad, audit interno
PSD2 (pagos) Solo si mueves dinero Generalmente no aplica si solo analizas
MiCA (cripto) Si tocas activos digitales Evita inicialmente
GDPR DPA + cifrado

GovTech

Norma Aplicabilidad Mitigación
GDPR + RGPD nacional DPO obligatorio
EU AI Act Riesgo alto si afecta decisión administrativa Supervisión humana obligatoria
Soberanía digital (Francia, España) Self-hosted on-prem o cloud EU

Riesgos técnicos específicos de Gemma 4

Bugs conocidos (mayo 2026)

GitHub issue ollama/ollama#15368:

  1. Flash Attention hang con prompts >500 tokens en 31B Dense (Ollama 0.20.x).
  2. Mitigación: Ollama 0.22+ o OLLAMA_FLASH_ATTENTION=0.

  3. OpenAI /v1 endpoint envía contenido al campo reasoning en vez de content.

  4. Mitigación: parsea ambos campos y concaténalos.

  5. MLX runner no soporta Gemma4ForConditionalGeneration en algunas builds.

  6. Mitigación: usa backend Metal (default) o llama.cpp.

Limitaciones de cuantización

  • Q4_K_M es 99% de FP16, pero el 1% restante puede ser crítico en:
  • Cálculo numérico exacto (contabilidad).
  • Razonamiento legal con citaciones precisas (alucinación de artículos).
  • Generación de código con paths/imports específicos.

Mitigación: para casos críticos, usa Q5_K_M o Q6_K. Si el cliente lo paga, Q8_0.

Alucinaciones

Gemma 4 alucina menos que Gemma 3, pero más que GPT-5/Claude 4 en: - Citas a fuentes (URLs, autores, fechas). - Cálculos numéricos complejos sin code interpreter. - Conocimiento factual reciente (cutoff del modelo).

Mitigación: - RAG obligatorio para cualquier output con citas. - Code execution para cálculos (FastAPI con sandbox). - Disclaimer + human-in-the-loop para outputs críticos.


Riesgos de negocio

Concentración de cliente

Si un solo cliente representa >30% del MRR, mitiga: - Activamente buscar 3+ clientes adicionales antes de aceptar contratos grandes. - Contratos multi-año con cláusulas de salida controlada.

Burn rate

Como dev solo con M4 Pro, tu burn es bajo (~€500-1000/mes en servicios cloud + dev tools). No aceleres salvo MRR >€5K. La regla: - MRR <€1K: vives de ahorros / day job. - MRR €1K-5K: side hustle serio. - MRR >€5K: posible jump full-time (con 6 meses de runway personal).

Vendor lock-in inverso

No te cases con un cliente que pide tanta customización que se vuelve impossible servir a otros. Cobra setup fee alto (€2K-10K) por customización, no la metas en el SaaS estándar.


Plan de continuidad básico

Documenta en runbooks/:

  1. Recuperación de servicio: cómo restaurar inferencia si tu Mac muere.
  2. Backup: snapshot diario de Qdrant + Postgres a S3/Backblaze.
  3. Migración a cloud: scripts para spinear todo en Cloud Run en <2h.
  4. Contacto a clientes: lista de emails + script de notificación.
  5. Renovación de certificados: Let's Encrypt auto-renewal.
  6. Rotación de secrets: cada 90 días.

Checklist pre-launch

  • [ ] LICENSE de Apache 2.0 incluido en repo.
  • [ ] NOTICE con atribución a Google.
  • [ ] Privacy Policy + Terms of Service (Iubenda o Termly).
  • [ ] DPA template listo para clientes EU.
  • [ ] Cifrado at-rest (Postgres encryption + S3 SSE).
  • [ ] Cifrado in-transit (TLS 1.3, HSTS).
  • [ ] Audit logs en Langfuse + Postgres.
  • [ ] Backup automatizado (test la restauración una vez).
  • [ ] Status page (Better Uptime, gratis).
  • [ ] Sentry para error tracking.
  • [ ] Seguro de ciberresponsabilidad civil (€1-5K/año desde €1M de cobertura).
  • [ ] Customer support email + tiempo de respuesta documentado.
  • [ ] Refund policy clara.