Ingénieur DevOps OpenShift / Platform Engineering - MLOps F/H
Role details
Job location
Tech stack
Job description
Nous recherchons un Ingénieur DevOps / Platform Engineer passionné pour rejoindre notre équipe et prendre en charge la mise en place, l'exploitation et l'évolution d'une plateforme robuste et scalable dédiée au déploiement, à la supervision et à la gestion de modèles de Machine Learning en production.
Vous évoluerez dans un environnement Kubernetes / OpenShift au cœur de l'innovation IA, où votre expertise technique sera essentielle pour garantir la fiabilité et la performance de nos infrastructures ML., Plateforme & Infrastructure
- Maintenir et exploiter la plateforme AI basée sur Kubernetes/OpenShift : gérer les opérations quotidiennes, appliquer les mises à jour et faire évoluer l'infrastructure
- Personnaliser et sécuriser la plateforme : adapter les composants (images runtime, workbench), intégrer de nouveaux outils et garantir la conformité et la sécurité des environnements
MLOps & Déploiement
- Déployer et superviser les modèles ML : automatiser le déploiement, le scaling et la gestion des modèles dans l'environnement OpenShift Container Platform
- Gérer les pipelines CI/CD : concevoir et maintenir des pipelines automatisés (Tekton, Kubeflow) pour le retraining et l'inférence des modèles
Support & Optimisation
- Assurer le support technique et la résolution d'incidents : diagnostiquer les crashs de pods, résoudre les problèmes d'allocation de ressources et corriger les échecs de pipelines
- Collaborer étroitement avec les équipes Data Science et ML pour répondre à leurs besoins techniques et optimiser leurs workflows
Requirements
Compétences techniques indispensables
- Containerisation & Orchestration : maîtrise avancée de Docker, Kubernetes et OpenShift
- DevOps & Automatisation : solide expérience en CI/CD, Infrastructure as Code (IaC) et GitOps
- MLOps : connaissance des outils MLOps (Kubeflow, Elyra) et de la gestion de modèles, notamment LLM
- Développement : compétences en programmation Python
- Machine Learning : bonne compréhension des frameworks de ML et de leurs contraintes opérationnelles
Expérience & Qualités
- Expérience confirmée en tant qu'Ingénieur DevOps / Platform Engineer dans des environnements cloud et IA
- Capacité à travailler en autonomie sur des sujets critiques et à prendre des décisions techniques
- Excellentes compétences en résolution de problèmes et diagnostic technique
- Esprit d'équipe et aisance relationnelle pour interagir avec les équipes Data/ML