05 · Resumen privado de reuniones (audio 100% on-device)¶
App de escritorio (Tauri) que graba reuniones (Meet, Zoom, Teams) y produce transcripción + resumen + action items 100% en tu Mac. Datos nunca salen del dispositivo. €15/usuario/mes.
Spec del producto¶
Problema¶
- Otter.ai, Fireflies, tl;dv suben audio a USA → bloqueante para legal, salud, finanzas.
- Reuniones de equipos legales/salud/RRHH tienen información que NO puede salir de la empresa.
- Compliance officers vetan herramientas SaaS de transcripción.
Solución¶
App nativa (Mac, Windows próximo) que: 1. Captura audio del sistema (no necesita bot en la llamada). 2. Procesa local con Gemma 4 E4B multimodal (audio nativo). 3. Genera: - Transcripción con timestamps + speaker diarization. - Resumen estructurado (decisiones, próximos pasos, abridores). - Action items con asignado y fecha. - Notas en estilo Notion/Obsidian exportables. 4. NUNCA envía audio o transcripción a la red, salvo si el usuario lo decide explícitamente.
Output ejemplo¶
# Reunión: Lanzamiento producto X
**Duración**: 47 min | **Participantes**: 4 | **Fecha**: 2026-05-22 10:00
## RESUMEN
El equipo decidió posponer el lanzamiento al 15 de junio para resolver bug crítico
en autenticación detectado en QA. Marta propuso comunicar a beta users el viernes.
## DECISIONES
- ✅ Posponer lanzamiento al 15 de junio.
- ✅ Comunicar a beta users por email el viernes 24 de mayo.
- ✅ Hire de QA senior antes del próximo sprint.
## ACTION ITEMS
- [ ] @Carlos: parchea bug auth-401 (deadline: 30 mayo)
- [ ] @Marta: redacta email beta users (deadline: 23 mayo)
- [ ] @Jorge: posting de QA senior en LinkedIn (deadline: 24 mayo)
## TRANSCRIPCIÓN COMPLETA
[Timestamps + speaker diarization]
MVP scope (3 semanas)¶
Semana 1: App Tauri base + captura de audio¶
- [ ] Tauri 2 + Rust backend para captura de audio del sistema (Core Audio en macOS).
- [ ] Buffer en disco (no en RAM para reuniones largas).
- [ ] UI mínima: botón Start/Stop, lista de reuniones grabadas.
Semana 2: Procesamiento¶
- [ ] Whisper (faster-whisper o whisper.cpp) para transcripción local.
- [ ] Speaker diarization con pyannote-audio (local).
- [ ] Gemma 4 E4B para resumen + action items.
- [ ] Storage local (SQLite + filesystem).
Semana 3: Polish + pagos¶
- [ ] Export a Markdown / Notion / Obsidian / Apple Notes.
- [ ] Auth con Clerk + Stripe.
- [ ] License key system (offline activation).
- [ ] Auto-update con Tauri updater.
Pricing¶
| Plan | Precio | Notas |
|---|---|---|
| Personal | €15/usuario/mes | 1 dispositivo |
| Team | €12/usuario/mes (min 5) | Multi-dispositivo |
| Enterprise | €€€ + setup | Self-managed updates, MDM compatible |
Comparación: Otter.ai €17/mes, Fireflies €10-19/mes — pero envían audio a la nube. Tu pitch es "lo mismo pero privado".
Diferenciadores¶
- 100% local — audio nunca sale del Mac.
- No requiere bot en la llamada — captura audio del sistema (no notifica a participantes).
- Funciona offline — perfecto para clientes en avión, sitios remotos.
- Sin rate limits — graba todas las reuniones del día sin coste marginal.
Métricas de éxito¶
| Métrica | Target MVP | Target mes 6 |
|---|---|---|
| Precisión transcripción | >92% (Whisper medium) | >96% (Whisper large-v3) |
| Latencia procesamiento | <2× duración reunión | <0.5× (real-time) |
| Clientes pagando | 50-100 | 500-1000 |
| MRR | €750-1500 | €7.5K-15K |
| Churn | <10% | <5% |
| Reviews App Store / Setapp | 4.5+ ⭐ | 4.7+ ⭐ |
Customer acquisition¶
ICP: profesionales en sectores donde la privacidad importa: - Abogados (despachos pequeños/medianos). - Médicos / psicólogos / terapeutas (con cliente consentimiento). - HR managers en empresas reguladas. - Consultores con NDAs estrictos. - Periodistas con fuentes confidenciales.
Canales:
- Setapp — distribución del producto a $billed at Setapp users (~$8/mes share).
- Product Hunt launch — narrativa "Otter without cloud".
- Targeted ads en LinkedIn a "Lawyer", "Therapist", "HR Manager" + EU geo.
- r/macapps, r/Lawyertalk, comunidades sectoriales.
- Reviews en Mac apps blogs (MacStories, MacRumors, etc.).
Riesgos específicos¶
| Riesgo | Mitigación |
|---|---|
| macOS revoca permisos de captura de audio en update | Tauri auto-handler permission requests |
| Cliente espera transcripción real-time | Procesa en chunks de 30s; muestra progreso |
| Whisper falla con español + audio de mala calidad | Whisper large-v3 multilingual; preprocessing con RNNoise |
| Otter/Fireflies bajan precio para competir | Triple-down en privacy story; B2B compliance angle |
| Apple Silicon no soporta Whisper large-v3 en background | Whisper medium funciona en M-series con 5-10s latencia/min audio |
Compliance¶
Pitch a EU enterprise:
- ✅ GDPR-friendly por diseño (no procesamiento por terceros).
- ✅ HIPAA-compatible si cliente añade BAA + cifrado disco macOS.
- ✅ DPA template incluido.
- ✅ Audit log local de procesamientos.
Próximos pasos¶
- Validar técnicamente que Gemma 4 E4B + Whisper medium corren juntos en M4 Pro 24 GB sin OOM (espera ~6 GB modelo + 5 GB Whisper + KV cache).
- Build prototipo en 1 semana con captura + Whisper + resumen básico.
- Demo a 5 abogados / psicólogos. Validar pricing.
- Lanzamiento beta cerrado 20 usuarios free → feedback loop 2 semanas → public launch.