Ingeniero/a de Observabilidad (Monitorización de IA)
Tecnologia y Personas
Municipality of Madrid, Spain
7 days ago
Role details
Contract type
Permanent contract Employment type
Full-time (> 32 hours) Working hours
Regular working hours Languages
Spanish Experience level
IntermediateJob location
Municipality of Madrid, Spain
Tech stack
Distributed Systems
Machine Learning
Prometheus
Grafana
Information Technology
Machine Learning Operations
Job description
Puesto: Ingeniero/a de Observabilidad - Monitorización de Sistemas de IA, Buscamos un/a Ingeniero/a de Observabilidad especializado/a en entornos de IA para diseñar, implementar y mantener sistemas avanzados de monitorización que garanticen la fiabilidad, rendimiento y calidad de aplicaciones basadas en Machine Learning.
La persona seleccionada será clave para asegurar la visibilidad end-to-end de sistemas complejos, desde la infraestructura hasta el comportamiento de los modelos en producción.
Responsabilidades
- Diseñar y mantener soluciones de observabilidad para sistemas distribuidos y aplicaciones de IA.
- Implementar monitorización específica de modelos de Machine Learning (model drift, data drift, degradación de rendimiento).
- Configurar métricas, logs y trazas para garantizar la detección temprana de incidencias.
- Definir y gestionar alertas y protocolos de respuesta ante incidentes.
- Colaborar con equipos de ML, data y plataforma para mejorar la fiabilidad de los modelos en producción.
- Participar en la mejora continua de estándares de telemetría y monitorización.
Requirements
- Mínimo 4 años en observabilidad y monitorización de sistemas
- Al menos 2 años trabajando con aplicaciones de Machine Learning
Formación:
- Titulación MECES 1 en Tecnologías de la Información, Ingeniería, Matemáticas, Estadística, Física o disciplinas afines., * Experiencia sólida con stacks de observabilidad: Prometheus, Grafana, Jaeger, ELK u otros equivalentes.
- Conocimiento de herramientas APM.
- Experiencia en monitorización de modelos ML, incluyendo detección de model drift y data drift.
- Conocimiento de estándares de telemetría y buenas prácticas de observabilidad.
- Experiencia en gestión de alertas y respuesta a incidentes.
Se valorará
- Experiencia en entornos cloud y arquitecturas distribuidas.
- Conocimiento de pipelines de MLOps.
- Capacidad de análisis, enfoque proactivo y orientación a la mejora continua.
Benefits & conditions
- Participación en proyectos avanzados de IA en producción.
- Entorno técnico exigente y colaborativo.
- Crecimiento profesional en un área clave y en plena expansión.
- Condiciones competitivas según experiencia y perfil.