Hablale a todo.
Tipear era una etapa.
voice es la capa única de voz del ecosistema Puntoindigo. Una sola integración para que todas tus apps —el chat de IA, WhatsApp, los dashboards de gestión, los kioskos del local y las pantallas de sala— entiendan lo que decís y respondan en consecuencia.
No es un asistente más. Es la cañería de audio que faltaba: STT, intents, ejecución y TTS, expuestos como un servicio que cualquier app del ecosistema consume con tres líneas de código.
Dictado en el chat de IA
Botón de micrófono al lado del input. Apretás, hablás, el texto aparece listo para revisar y mandar. Latencia objetivo < 1.2 s.
stt · gemini flashComandos por voz en WhatsApp
Mandás un audio a vorum-wa y se ejecuta como si lo hubieras tipeado: crear tareas, responder bots, consultar estado de pedidos. Sin abrir la app.
vorum-wa · intentsControl de dashboards por voz
"Mostrame ventas de marzo en sucursal Centro." "Filtrá por proveedor X." "Siguiente slide." Modo presentación sin tocar el teclado, ideal para reuniones.
presentación · intentsKioskos y dispositivos
Cliente liviano con wake-word para tablets de mostrador, displays de sala y kioskos de autoservicio. El mismo motor de intents que el resto del ecosistema.
edge · siempre activoRespuestas habladas (TTS)
El bot de WhatsApp puede responder en audio. El dashboard puede leer un resumen en voz alta. El kiosco confirma la operación. Una sola voz, consistente en todo el ecosistema. Proveedor configurable (ElevenLabs / Google TTS) según calidad/costo.
tts · voz unificadaTres minutos en la vida del producto
El dashboard que se maneja como un piloto de F1
La gerenta entra a la sala, conecta el monitor y arranca la presentación sin tocar el mouse. El dashboard escucha y obedece.
"voice, traeme el comparativo trimestral por sucursal… ahora filtrá solo Centro y Norte… mostrá la proyección a junio."WhatsApp como interfaz principal
Vendedor manda un audio de 8 segundos al bot. El intent se resuelve, la tarea queda creada en el sistema, el cliente ya recibió la confirmación automática.
"Pasale al equipo que el pedido de López sale el jueves, y agendame visita el viernes a las once."El kiosco que escucha y responde
Cliente se acerca a la pantalla del mostrador. No toca nada. Habla. El kiosco entiende, consulta stock, responde con voz sintetizada y dispara la operación en el sistema central.
"¿Tienen el modelo 32 en azul?" — "Sí, queda uno. ¿Te lo reservo a tu nombre?"Cuánto sale
Modelo híbrido: una suscripción mensual por organización + costo por uso real de transcripción/síntesis. Sin permanencia, sin setup oculto, sin sorpresas por consumo (alertas automáticas al 80% del cupo).
Solo
Para una sola app o un equipo chico que quiere empezar a dictar.
- Dictado en chat IA
- 1 app conectada
- 500 minutos de STT incluidos
- Logging y métricas básicas
- Soporte por email
Equipo
Para PyMEs que quieren voz en chat IA, WhatsApp y dashboards.
- Todo lo de Solo, más:
- Comandos de voz en WhatsApp (vorum-wa)
- Control de dashboards por voz
- Hasta 5 apps conectadas
- 3.000 min STT + 100k caracteres TTS
- Modo presentación para reuniones
- Soporte prioritario
Ecosistema
Para operaciones con kioskos, sucursales y dispositivos en sala.
- Todo lo de Equipo, más:
- Apps ilimitadas
- Kioskos y dispositivos ilimitados
- Wake-word personalizado
- 15.000 min STT + 500k caracteres TTS
- Voz TTS personalizada (clonado)
- SLA 99.5% y soporte dedicado
¿Necesitás on-premise, integración a medida o instalación de kioskos físicos? Implementación llave en mano desde US$ 1.500 de única vez. White-label disponible bajo acuerdo.
Specs en una página
useVoiceInput()) + REST API /transcribe · /synthesize · /intentrequireAuth que el resto del ecosistema. Audio nunca persistido por defecto. Logs en Supabase.voice.puntoindigo.com · on-premise opcional para clientes EcosistemaTexto listo para copiar
voice es la capa de voz del ecosistema Puntoindigo. Permite que cualquier aplicación del ecosistema —chat de IA, gestión por WhatsApp, dashboards de operaciones, kioskos de autoservicio y dispositivos en sala— entienda comandos hablados y responda con voz, a través de una única integración. Está construida sobre Gemini Flash para transcripción y proveedores TTS configurables, y reutiliza la infraestructura de auth, logging y observabilidad que ya consumen las más de doce aplicaciones del ecosistema.
El proyecto nace en Puntoindigo, estudio argentino de producto y software con foco en herramientas de gestión para PyMEs y operaciones con presencia física. Más información en voice.puntoindigo.com.