Arquitecto/a Cloud & MLOps de IA

IZERTIS S.A
18 days ago

Role details

Contract type
Apprenticeship
Employment type
Full-time (> 32 hours)
Working hours
Regular working hours
Languages
Spanish

Job location

Tech stack

API
Artificial Intelligence
Airflow
Amazon Web Services (AWS)
Azure
Bash
Google BigQuery
Cloud Computing
Continuous Integration
Data Governance
Dicom
Fiddler (Software)
Github
Supervisory Control and Data Acquisition (SCADA)
Identity and Access Management
Python
Role-Based Access Control
Prometheus
SQL Databases
Data Streaming
Scripting (Bash/Python/Go/Ruby)
Fast Healthcare Interoperability Resources
Large Language Models
Snowflake
Grafana
Gitlab-ci
Kubernetes
Data Lineage
Collibra
Apache Flink
Health Level Seven International
Kafka
Machine Learning Operations
Nim (Programming Language)
Terraform
Databricks

Job description

Buscamos incorporar a un/a Arquitecto/a Cloud & MLOps de IA, para unirse a nuestro equipo interno de IA y data!

Tu principal reto: Diseñar y gobernar la plataforma de datos/IA y el ciclo de vida de modelos (end to end), desde ingesta y features hasta serving y observabilidad / para acelerar el paso de POC a producción con seguridad, cumplimiento y coste óptimo en entornos cloud, on prem y edge., * Data & Feature Platform: data lakehouse/warehouse (Delta/Snowflake/BigQuery), feature store, data contracts y gobierno de datos (calidad, linaje, catálogo).

  • Ciclo ML/LLM: experiment tracking, model registry, model cards, approval gates, CI/CD de datos y modelos (GitOps), blue/green/canary y rollbacks.
  • Serving: real time/batch/stream (Kafka/Flink), edge/gateway (inferencias <50ms donde aplique), inference servers (NVIDIA Triton/TorchServe) y autoscaling (K8s).
  • LLM & RAG: arquitecturas RAG seguras (vectores, metadata filtering, prompt y output guardrails), evaluation harness (groundedness, factualidad, toxicidad) y observability específica para LLM.
  • MLOps: observabilidad de modelos (drift de datos/etiquetas, concept drift, data quality, performance SLO/SLI), alerting y runbooks (SRE/Soporte).
  • Seguridad & Compliance: cifrado en tránsito/reposo, secreto/rotación (Vault/KMS), least privilege, network segmentation, audit logs, AI Act ready (riesgo, documentación, supervisión humana) e ISO 27001/42001.
  • Coste/FinOps: rightsizing, auto shutdown, spot/reserved, chargeback/showback y budgets por entorno/proyecto.
  • Edge & OT: empaquetado y OTA de modelos a gateways/Jetson, sincronización cloud edge, telemetría, y seguridad en entornos industriales.
  • Tooling & estándares: selección y roadmap de herramientas (MLflow/Kubeflow/Databricks/SageMaker/Vertex; Airflow/Prefect/DBT; Argo CD/Flux; Great Expectations/Evidently), normas de repositorios, templates (IaC, pipelines) y guardrails.
  • Preventa y entrega: apoyo en Solution Briefs, estimaciones y arquitectura en propuestas; handover a Delivery/Managed con documentación operativa.
  • Formación: enablement a equipos (ingeniería, datos, preventa) para asegurar adopción homogénea de la plataforma y buenas prácticas.

Requirements

  • Arquitectura de referencia: definir landing zones de datos/IA (redes, IAM, cifrado, backups, DRP) y patrones multi-entorno (cloud/híbrido/on prem/air gapped)., * 4+ años en plataformas de datos/ML y 3+ como arquitecto/a en entornos productivos.
  • Experiencia sólida en al menos un cloud (Azure/AWS/GCP) y entornos híbridos/on-prem.
  • IaC (Terraform), Kubernetes (AKS/EKS/GKE/on-prem), contenedores, redes y service mesh (deseable).Experiment tracking & registry (MLflow/Kubeflow/Databricks/SageMaker/Vertex
  • 1), feature store y model serving.
  • CI/CD & GitOps (GitHub/GitLab CI, Argo CD o Flux), testing de datos/modelos, blue-green/canary.
  • Streaming (Kafka/Flink) y data lakehouse (Delta/Snowflake/BigQuery) + SQL avanzado.
  • Vector DB (pgvector/Milvus/Pinecone) y search hybrid para RAG.
  • Observabilidad: Prometheus/Grafana/ELK + herramientas de calidad/monitor de modelos (Great Expectations/Evidently/Fiddler/WhyLabs…)
  • Seguridad: KMS/Vault, RBAC/ABAC, TLS/MTLS, políticas, secret management; nociones de RGPD y gestión de PII.
  • Python y scripting (Bash), arquitectura de microservicios/API.
  • Habilidades consultivas: trade-offs, storytelling técnico, elaboración de SOW y documentación clara.

Plus (nice-to-have)

  • Air-gapped (defensa/administración), GPU scheduling (NVIDIA, MIG), NIM/Triton, A100/H100.
  • Edge AI (Jetson/Orin), TensorRT/OpenVINO, QoS en enlaces inestables.
  • Gobierno de datos (Collibra/Atlan), data lineage, DBT, DQ at scale.
  • Normativa: AI Act UE, ISO 27001/42001, MDR/Machinery (para soluciones sanitarias/robóticas), ENS (español) y contratación pública.
  • Integraciones verticales: HL7/FHIR/DICOM (salud), SCADA/OPC-UA (industria), core insurance (seguros).

Benefits & conditions

Sé parte de una empresa multinacional en constante crecimiento.

Una cultura de trabajo en equipo, colaboración, innovación y mejora continua.

Vacaciones y días libres especiales:

  • 22 días de vacaciones por año
  • El día de tu cumpleaños libre
  • 24 y 31 de diciembre libres

Plan de compensación flexible, que incluye: Seguro médico, vales de comida, subsidio de transporte y apoyo para el cuidado infantil.

Aprendizaje y desarrollo continuo: Creemos en empoderar a nuestros profesionales para que sigan creciendo y mejorando sus habilidades.

Apply for this position