Saltar a contenido

05 · Resumen privado de reuniones (audio 100% on-device)

App de escritorio (Tauri) que graba reuniones (Meet, Zoom, Teams) y produce transcripción + resumen + action items 100% en tu Mac. Datos nunca salen del dispositivo. €15/usuario/mes.


Spec del producto

Problema

  • Otter.ai, Fireflies, tl;dv suben audio a USA → bloqueante para legal, salud, finanzas.
  • Reuniones de equipos legales/salud/RRHH tienen información que NO puede salir de la empresa.
  • Compliance officers vetan herramientas SaaS de transcripción.

Solución

App nativa (Mac, Windows próximo) que: 1. Captura audio del sistema (no necesita bot en la llamada). 2. Procesa local con Gemma 4 E4B multimodal (audio nativo). 3. Genera: - Transcripción con timestamps + speaker diarization. - Resumen estructurado (decisiones, próximos pasos, abridores). - Action items con asignado y fecha. - Notas en estilo Notion/Obsidian exportables. 4. NUNCA envía audio o transcripción a la red, salvo si el usuario lo decide explícitamente.

Output ejemplo

# Reunión: Lanzamiento producto X
**Duración**: 47 min | **Participantes**: 4 | **Fecha**: 2026-05-22 10:00

## RESUMEN
El equipo decidió posponer el lanzamiento al 15 de junio para resolver bug crítico
en autenticación detectado en QA. Marta propuso comunicar a beta users el viernes.

## DECISIONES
- ✅ Posponer lanzamiento al 15 de junio.
- ✅ Comunicar a beta users por email el viernes 24 de mayo.
- ✅ Hire de QA senior antes del próximo sprint.

## ACTION ITEMS
- [ ] @Carlos: parchea bug auth-401 (deadline: 30 mayo)
- [ ] @Marta: redacta email beta users (deadline: 23 mayo)
- [ ] @Jorge: posting de QA senior en LinkedIn (deadline: 24 mayo)

## TRANSCRIPCIÓN COMPLETA
[Timestamps + speaker diarization]

MVP scope (3 semanas)

Semana 1: App Tauri base + captura de audio

  • [ ] Tauri 2 + Rust backend para captura de audio del sistema (Core Audio en macOS).
  • [ ] Buffer en disco (no en RAM para reuniones largas).
  • [ ] UI mínima: botón Start/Stop, lista de reuniones grabadas.

Semana 2: Procesamiento

  • [ ] Whisper (faster-whisper o whisper.cpp) para transcripción local.
  • [ ] Speaker diarization con pyannote-audio (local).
  • [ ] Gemma 4 E4B para resumen + action items.
  • [ ] Storage local (SQLite + filesystem).

Semana 3: Polish + pagos

  • [ ] Export a Markdown / Notion / Obsidian / Apple Notes.
  • [ ] Auth con Clerk + Stripe.
  • [ ] License key system (offline activation).
  • [ ] Auto-update con Tauri updater.

Pricing

Plan Precio Notas
Personal €15/usuario/mes 1 dispositivo
Team €12/usuario/mes (min 5) Multi-dispositivo
Enterprise €€€ + setup Self-managed updates, MDM compatible

Comparación: Otter.ai €17/mes, Fireflies €10-19/mes — pero envían audio a la nube. Tu pitch es "lo mismo pero privado".


Diferenciadores

  1. 100% local — audio nunca sale del Mac.
  2. No requiere bot en la llamada — captura audio del sistema (no notifica a participantes).
  3. Funciona offline — perfecto para clientes en avión, sitios remotos.
  4. Sin rate limits — graba todas las reuniones del día sin coste marginal.

Métricas de éxito

Métrica Target MVP Target mes 6
Precisión transcripción >92% (Whisper medium) >96% (Whisper large-v3)
Latencia procesamiento <2× duración reunión <0.5× (real-time)
Clientes pagando 50-100 500-1000
MRR €750-1500 €7.5K-15K
Churn <10% <5%
Reviews App Store / Setapp 4.5+ ⭐ 4.7+ ⭐

Customer acquisition

ICP: profesionales en sectores donde la privacidad importa: - Abogados (despachos pequeños/medianos). - Médicos / psicólogos / terapeutas (con cliente consentimiento). - HR managers en empresas reguladas. - Consultores con NDAs estrictos. - Periodistas con fuentes confidenciales.

Canales:

  1. Setapp — distribución del producto a $billed at Setapp users (~$8/mes share).
  2. Product Hunt launch — narrativa "Otter without cloud".
  3. Targeted ads en LinkedIn a "Lawyer", "Therapist", "HR Manager" + EU geo.
  4. r/macapps, r/Lawyertalk, comunidades sectoriales.
  5. Reviews en Mac apps blogs (MacStories, MacRumors, etc.).

Riesgos específicos

Riesgo Mitigación
macOS revoca permisos de captura de audio en update Tauri auto-handler permission requests
Cliente espera transcripción real-time Procesa en chunks de 30s; muestra progreso
Whisper falla con español + audio de mala calidad Whisper large-v3 multilingual; preprocessing con RNNoise
Otter/Fireflies bajan precio para competir Triple-down en privacy story; B2B compliance angle
Apple Silicon no soporta Whisper large-v3 en background Whisper medium funciona en M-series con 5-10s latencia/min audio

Compliance

Pitch a EU enterprise:

  • ✅ GDPR-friendly por diseño (no procesamiento por terceros).
  • ✅ HIPAA-compatible si cliente añade BAA + cifrado disco macOS.
  • ✅ DPA template incluido.
  • ✅ Audit log local de procesamientos.

Próximos pasos

  1. Validar técnicamente que Gemma 4 E4B + Whisper medium corren juntos en M4 Pro 24 GB sin OOM (espera ~6 GB modelo + 5 GB Whisper + KV cache).
  2. Build prototipo en 1 semana con captura + Whisper + resumen básico.
  3. Demo a 5 abogados / psicólogos. Validar pricing.
  4. Lanzamiento beta cerrado 20 usuarios free → feedback loop 2 semanas → public launch.