Realtime Systems Architect
Role details
Job location
Tech stack
Job description
¿Te apasiona crear experiencias web interactivas en tiempo real?En ABAI buscamos un Realtime Systems Arquitect para definir y liderar la arquitectura de tiempo real de las soluciones IA conversacionales de ABAI, especialmente en escenarios de VoiceBot, avatar conversacional, media streaming y experiencia en tiempo real.Maximice sus posibilidades de que su candidatura sea seleccionada asegurándose de que su CV y sus habilidades se ajustan al perfil.Misión:El rol deberá resolver la capa de audio, STT/TTS, WebRTC/media streaming, turn-taking, barge-in, sincronización audio-visema/blendshapes y control de latenciaResponsabilidades clave:Diseñar la arquitectura realtime target.Definir el pipeline de audio input/output.Evaluar WebRTC, WebSocket, SIP, media servers y proveedores STT/TTS.Establecer métricas de latencia por tramo.Coordinar con Platform, Frontend, Avatar Studio y el equipo externo de plataforma conversacional,Definir patrones de resiliencia, fallback, buffering, streaming, gestión de interrupciones, calidad de audio, sincronización con avatar y escalabilidad para llamadas concurrentes.Requisitos:8+ años de experiencia en ingeniería de software, arquitectura de sistemas o plataformas realtime.3+ años trabajando con voz, streaming, WebRTC, media servers, telefonía, CCaaS, voicebots o sistemas de baja latencia en producción.Imprescindible experiencia real diseñando o escalando sistemas con audio en tiempo real, múltiples proveedores, sesiones concurrentes y requisitos de latencia.Muy valorable experiencia en contact center, BPO, telecomunicaciones, asistentes de voz, avatares conversacionales, IA generativa aplicada a voz, STT/TTS, barge-in y sincronización audiovisual.Nivel nativo o profesional completo de español.Nivel B2 de inglés (documentación técnica, proveedores internacionales, frameworks realtime, cloud/media services y coordinación con equipos técnicos).Conocimientos específicos: WebRTC, WebSocket, SIP/RTP, media servers, streaming de audio, STT/TTS, turn detection, barge-in, VAD, diarización o noise handling, sincronización audio/eventos, pipelines de baja latencia, arquitectura de voicebots, integración con contact center/CCaaS, escalabilidad de sesiones concurrentes, observabilidad realtime, manejo de jitter, buffers, codecs, latencia extremo a extremo y diseño de sistemas resilientes.Herramientas informáticas: WebRTC; WebSocket; SIP/RTP; media servers como LiveKit, Janus, mediasoup, Twilio, Daily o equivalentes; STT/TTS como Deepgram, Azure Speech, Google Speech, ElevenLabs, AWS Polly o similares; Vapi, Pipecat u otros frameworks de voice AI; Node.js, Go, Python o TypeScript; Docker; Kubernetes; observabilidad con OpenTelemetry, Grafana, Prometheus, Datadog, CloudWatch o Azure Monitor; herramientas de profiling de latencia, trazas distribuidas, logs estructurados y pruebas de carga/concurrencia.¿Por qué unirte a ABAI?En ABAI, estamos transformando el futuro con tecnología e innovación.Somos una compañía líder con presencia en España, Colombia, Brasil y Perú, y contamos con un equipo de más de 10,000 profesionales que gestionan más de 100 millones de interacciones anuales en 10 idiomas.Apostamos por la innovación: invertimos en robótica, inteligencia artificial y aprendizaje automático para seguir revolucionando el sector.Si buscas un entorno desafiante, con oportunidades de crecimiento y donde la tecnología sea el motor del cambio, ABAI es tu lugar.En ABAI, promovemos la diversidad y la igualdad de oportunidades.xqysrnh ¡Sé parte de un equipo que vive los valores de inclusión y compromiso!GENTE ABAI#LIBRES#IGUALES#SIN ETIQUETAS
Requirements
avatar y escalabilidad para llamadas concurrentes.Requisitos:8+ años de experiencia en ingeniería de software, arquitectura de sistemas o plataformas realtime.3+ años trabajando con voz, streaming, WebRTC, media servers, telefonía, CCaaS, voicebots o sistemas de baja latencia en producción.Imprescindible experiencia real diseñando o escalando sistemas con audio en tiempo real, múltiples proveedores, sesiones concurrentes y requisitos de latencia. Muy valorable experiencia en contact center, BPO, telecomunicaciones, asistentes de voz, avatares conversacionales, IA generativa aplicada a voz, STT/TTS, barge-in y sincronización audiovisual.Nivel nativo o profesional completo de español.Nivel B2 de inglés (documentación técnica, proveedores internacionales, frameworks realtime, cloud/media services y coordinación con equipos técnicos). Conocimientos específicos: WebRTC, WebSocket, SIP/RTP, media servers, streaming de audio, STT/TTS, turn detection, barge-in, VAD, diarización o noise handling, sincronización audio/eventos, pipelines de baja latencia, arquitectura de voicebots, integración con contact center/CCaaS, escalabilidad de sesiones concurrentes, observabilidad realtime, manejo de jitter, buffers, codecs, latencia extremo a extremo y diseño de sistemas resilientes.Herramientas informáticas: WebRTC; WebSocket; SIP/RTP; media servers como LiveKit, Janus, mediasoup, Twilio, Daily o equivalentes; STT/TTS como Deepgram, Azure Speech, Google Speech, ElevenLabs, AWS Polly o similares; Vapi, Pipecat u otros frameworks de voice AI; Node.js, Go, Python o TypeScript; Docker; Kubernetes; observabilidad con OpenTelemetry, Grafana, Prometheus, Datadog, CloudWatch o Azure Monitor; herramientas de profiling de latencia, trazas distribuidas, logs estructurados y pruebas de carga/concurrencia.