Data Ingénieur IA
Role details
Job location
Tech stack
Job description
Dans le cadre du développement de ses usages d'intelligence artificielle et d'analytics avancée, une organisation de référence renforce son équipe Data. Le ou la Data Ingénieur·e IA intervient au coeur de la plateforme data pour concevoir, industrialiser et opérer les pipelines de données qui alimentent les cas d'usage IA (machine learning, LLM, scoring, prévisions, etc.).
Le poste vise à garantir la disponibilité, la qualité, la traçabilité et la performance des données de bout en bout, depuis les sources jusqu'aux environnements d'entraînement et de production., Concevoir, développer et maintenir des pipelines de données fiables, scalables et automatisés (batch et streaming).
- Collecter et intégrer des données hétérogènes (SI, APIs, fichiers, logs, événements).
- Mettre en place des contrôles de qualité des données : validation, détection d'anomalies, déduplication, gestion des valeurs manquantes.
- Préparer et exposer des jeux de données prêts pour l'IA : datasets d'entraînement/validation, tables de features, embeddings le cas échéant.
- Contribuer à l'industrialisation des flux data en lien avec les équipes Data Science, Produit, DevOps et Sécurité.
- Assurer la robustesse opérationnelle : gestion des incidents, mécanismes de reprise, optimisation des coûts et des performances.
- Participer à la mise en oeuvre des bonnes pratiques de gouvernance, sécurité et conformité (gestion des accès, traçabilité, RGPD).
Requirements
Solides bases en modélisation et architecture data (schémas, normalisation, performance).Maîtrise de SQL et bonnes compétences en Python.Expérience des pipelines de données, de l'orchestration et du monitoring.Compréhension des contraintes liées aux projets IA et MLOps.Connaissance des environnements cloud (stockage, IAM, réseau) et de la conteneurisation., * Solides bases en modélisation et architecture data (schémas, normalisation, performance).
- Maîtrise de SQL et bonnes compétences en Python.
- Expérience des pipelines de données, de l'orchestration et du monitoring.
- Compréhension des contraintes liées aux projets IA et MLOps.
- Connaissance des environnements cloud (stockage, IAM, réseau) et de la conteneurisation.