voice · puntoindigo
Hoja de prensa · v1.0
Press Kit · Para difusión

Hablale a todo.
Tipear era una etapa.

voice es la capa única de voz del ecosistema Puntoindigo. Una sola integración para que todas tus apps —el chat de IA, WhatsApp, los dashboards de gestión, los kioskos del local y las pantallas de sala— entiendan lo que decís y respondan en consecuencia.

No es un asistente más. Es la cañería de audio que faltaba: STT, intents, ejecución y TTS, expuestos como un servicio que cualquier app del ecosistema consume con tres líneas de código.

El producto · cinco piezas, una plataforma
01

Dictado en el chat de IA

Botón de micrófono al lado del input. Apretás, hablás, el texto aparece listo para revisar y mandar. Latencia objetivo < 1.2 s.

stt · gemini flash
02

Comandos por voz en WhatsApp

Mandás un audio a vorum-wa y se ejecuta como si lo hubieras tipeado: crear tareas, responder bots, consultar estado de pedidos. Sin abrir la app.

vorum-wa · intents
03

Control de dashboards por voz

"Mostrame ventas de marzo en sucursal Centro." "Filtrá por proveedor X." "Siguiente slide." Modo presentación sin tocar el teclado, ideal para reuniones.

presentación · intents
04

Kioskos y dispositivos

Cliente liviano con wake-word para tablets de mostrador, displays de sala y kioskos de autoservicio. El mismo motor de intents que el resto del ecosistema.

edge · siempre activo
05

Respuestas habladas (TTS)

El bot de WhatsApp puede responder en audio. El dashboard puede leer un resumen en voz alta. El kiosco confirma la operación. Una sola voz, consistente en todo el ecosistema. Proveedor configurable (ElevenLabs / Google TTS) según calidad/costo.

tts · voz unificada
Escenas · cómo se usa en la realidad

Tres minutos en la vida del producto

Lunes · 9:14 AM · Reunión gerencial

El dashboard que se maneja como un piloto de F1

La gerenta entra a la sala, conecta el monitor y arranca la presentación sin tocar el mouse. El dashboard escucha y obedece.

"voice, traeme el comparativo trimestral por sucursal… ahora filtrá solo Centro y Norte… mostrá la proyección a junio."
Martes · 14:32 PM · En el auto, volviendo de un cliente

WhatsApp como interfaz principal

Vendedor manda un audio de 8 segundos al bot. El intent se resuelve, la tarea queda creada en el sistema, el cliente ya recibió la confirmación automática.

"Pasale al equipo que el pedido de López sale el jueves, y agendame visita el viernes a las once."
Miércoles · 11:00 AM · Mostrador del local

El kiosco que escucha y responde

Cliente se acerca a la pantalla del mostrador. No toca nada. Habla. El kiosco entiende, consulta stock, responde con voz sintetizada y dispara la operación en el sistema central.

"¿Tienen el modelo 32 en azul?" — "Sí, queda uno. ¿Te lo reservo a tu nombre?"
Precios · plan comercial v1

Cuánto sale

Modelo híbrido: una suscripción mensual por organización + costo por uso real de transcripción/síntesis. Sin permanencia, sin setup oculto, sin sorpresas por consumo (alertas automáticas al 80% del cupo).

Solo

US$19 / mes

Para una sola app o un equipo chico que quiere empezar a dictar.

  • Dictado en chat IA
  • 1 app conectada
  • 500 minutos de STT incluidos
  • Logging y métricas básicas
  • Soporte por email
Empezar

Ecosistema

US$349 / mes

Para operaciones con kioskos, sucursales y dispositivos en sala.

  • Todo lo de Equipo, más:
  • Apps ilimitadas
  • Kioskos y dispositivos ilimitados
  • Wake-word personalizado
  • 15.000 min STT + 500k caracteres TTS
  • Voz TTS personalizada (clonado)
  • SLA 99.5% y soporte dedicado
Hablar con ventas

¿Necesitás on-premise, integración a medida o instalación de kioskos físicos? Implementación llave en mano desde US$ 1.500 de única vez. White-label disponible bajo acuerdo.

Costos por uso (más allá del cupo del plan)
US$ 0.002
por minuto de transcripción
US$ 0.020
por 1.000 caracteres de TTS
US$ 0.005
por intent ejecutado en dashboard
Ficha técnica

Specs en una página

Categoría
Plataforma de voz como servicio (Voice-as-a-Service) para ecosistemas de apps
Idiomas
Español rioplatense (principal), español neutro, inglés, portugués brasileño
STT
Gemini Flash audio nativo, sin ffmpeg, sin conversión (webm/mp4 directos)
TTS
ElevenLabs (calidad) o Google TTS (costo), elegible por organización
Latencia STT
< 1.2 s para audios de hasta 10 segundos (objetivo de producto)
Integración
Cliente JS liviano (hook useVoiceInput()) + REST API /transcribe · /synthesize · /intent
Seguridad
Mismo requireAuth que el resto del ecosistema. Audio nunca persistido por defecto. Logs en Supabase.
Disponibilidad
SaaS multi-tenant en voice.puntoindigo.com · on-premise opcional para clientes Ecosistema
Boilerplate de prensa

Texto listo para copiar

voice es la capa de voz del ecosistema Puntoindigo. Permite que cualquier aplicación del ecosistema —chat de IA, gestión por WhatsApp, dashboards de operaciones, kioskos de autoservicio y dispositivos en sala— entienda comandos hablados y responda con voz, a través de una única integración. Está construida sobre Gemini Flash para transcripción y proveedores TTS configurables, y reutiliza la infraestructura de auth, logging y observabilidad que ya consumen las más de doce aplicaciones del ecosistema.

El proyecto nace en Puntoindigo, estudio argentino de producto y software con foco en herramientas de gestión para PyMEs y operaciones con presencia física. Más información en voice.puntoindigo.com.

Activos descargables

Piezas promocionales

Logo · pack completo
SVG, PNG @1x/@2x, fondo claro y oscuro
/assets/voice-logo.zip
Screenshots de producto
Chat IA, vorum-wa, dashboard, kiosco
/assets/voice-screens.zip
Video demo · 60 s
Las tres escenas en una sola toma
/assets/voice-demo-60s.mp4
One-pager PDF
Esta misma hoja en una página imprimible
/assets/voice-onepager.pdf
Sample audios
Voces TTS de muestra en español rioplatense
/assets/voice-tts-samples.zip
Brand guidelines
Tipografía, colores, do's & don'ts
/assets/voice-brand.pdf
Contacto de prensa

Hablar con un humano

Producto y prensa
Equipo Puntoindigo
prensa@puntoindigo.com
Ventas y partnerships
Equipo Comercial
ventas@puntoindigo.com