Data Engineer H/F
Role details
Job location
Tech stack
Job description
L'équipe Innovation Exposition crée et maintient des plateformes d'innovation destinées aux lancements des Proof of Concept (POC) exprimés par les Métiers et les Fonctions.
L'équipe Innovation Factory intervient en support des Métiers et des Fonctions pour accélérer les projets fonctionnels et garantir la bonne gestion et la mutualisation des données.
L'équipe APEX expose les produits autour des solutions collaboratives et assure leur déploiement dans l'ensemble du Groupe.
L'équipe Smart Auto Factory crée et maintient les plateformes nécessaires pour promouvoir et acculturer l'utilisation du RPA, de l'Intelligent Document Processing et du Process Mining tout en maintenant les plates-formes correspondantes.
L'équipe Data Analytics and Management Platforms fournit des plates-formes pour l'analyse, la préparation et la visualisation des données, en soutenant le story-telling et une organisation orientée données.
Le Centre de Compétence en IA est chargé de développer et de maintenir les compétences en Intelligence Artificielle au sein du département 3AI.
En tant que Data Engineer, vous travaillerez en étroite collaboration avec les équipes Data Science, IA et DevOps pour assurer la qualité, la fiabilité et la scalabilité des pipelines de données, essentiels à l'entraînement et au déploiement des modèles d'intelligence artificielle et d'analyse avancée.
Responsabilités
- Architecture Data pour l'IA
Concevoir, développer et maintenir des pipelines de données fiables, automatisés et scalables pour alimenter les modèles IA et les cas d'usage IA (extraction de features, entrainement, fine-tuning, RAG, etc.).
Participer à la mise en place de data lakes / lakehouses conçus pour l'IA (données prêtes à l'emploi, versionnées, labellisées).
Favoriser l'approche Data as a Product pour exposer les assets réutilisables par les équipes IA/produit.
- Accélération de l'AI Readiness
Créer des outils de profiling et de scoring de qualité des données, détecter les goulots d'étranglement à l'adoption IA
Travailler sur la classification des jeux de données par niveau de readiness IA (structure, complétude, fraîcheur, droits d'usage, etc.).
Mettre en place des mécanismes de feature store, versioning de datasets, et suivis de performances des jeux de données.
- Support aux équipes IA
Industrialiser l'alimentation de modèles RAG ou LLM avec des index vectoriels, embeddings, mécanismes de rafraîchissement de corpus
Accompagner la montée en maturité IA des métiers via des outils d'exploration, documentation et gouvernance de la donnée.
Contribuer à l'élaboration et au respect des bonnes pratiques en matière de gouvernance des données (catalogue, versioning, sécurité).
- Veille & Communication
Assurer une veille technologique sur les nouvelles solutions de traitement et d'optimisation des données.
Participer à l'élaboration de la stratégie IA du groupe en collaboration avec le Centre de Compétence en IA.
Communiquer et collaborer avec les autres départements et équipes du groupe pour promouvoir l'utilisation de l'IA.
Vous travaillerez sur le Campus de Montreuil. Le site est accessible par la ligne 1 du métro (arrêt St Mandé), le RER A à Vincennes, la ligne 9 (Porte de Montreuil) et le tramway (Porte de Montreuil Nos immeubles sont équipés en Flex Office et le poste est éligible au télétravail ( 50%)., Un expert en ingénierie des données capable de construire et d'optimiser des pipelines data scalables et performants.
Un collaborateur agile, travaillant étroitement avec les équipes IA et DevOps.
Un profil orienté qualité et gouvernance, garantissant la fiabilité et la conformité des données.
Les étapes du recrutement
Si votre CV est retenu par notre équipe de recrutement, vous serez amené à passer un à trois entretiens au maximum avec des RH et/ou manager opérationnel.
Ces étapes peuvent varier légèrement en fonction des postes.
Si vous êtes dans une situation de handicap et souhaitez un échange facilité, vous pouvez envoyer votre CV et lettre de motivation à [email protected].
Dans un monde qui change, la diversité, l'équité et l'inclusion sont des valeurs clés pour le bien-être et la performance des équipes. Chez BNP Paribas, nous souhaitons accueillir et retenir tous les talents sans distinction : c'est ainsi que nous construirons, ensemble, la finance de demain, innovante, responsable et durable
Enfin, nous attachons une importance particulière à ce que nos futurs collaborateurs et collaboratrices agissent au quotidien avec responsabilité éthique et professionnelle. À tout moment pendant le processus de recrutement, les informations figurant sur votre CV, vos données d'identification et vos antécédents pourront être vérifiés
Requirements
Vous êtes diplomé de l'enseignement supérieur et vous avez une expérience de 5 ans minimum en ingénierie des données et gestion de pipelines.
Vous avez une solide maîtrise d'au moins un langage de développement (Python, Scala…).
Vous avez une très bonne connaissance des systèmes de traitement de données (batch et streaming) - ex : Spark, Kafka, Airflow.
Vous avez des connaissances des bases de données relationnelles, NoSQL et vectorielles
Vous avez la capacité à concevoir et maintenir des APIs et services pour l'accès aux données (FastAPI, etc.) et une bonne compréhension des problématiques data pour l'IA : entraînement, annotation, versioning, accès optimisé.
Vous avez une bonne compréhension des problématiques liées à la qualité des données, la gestion des métadonnées et le monitoring.
Vous avez des compétences en sécurité et gouvernance des données, incluant le chiffrement, l'accès et la conformité réglementaire.
Autonomie, rigueur et esprit analytique, avec une appétence pour l'optimisation et la performance des flux de données.
Vous avez l'esprit d'analyse, une écoute active et une bonne capacité à travailler en équipe. Enfin votre rigueur et votre capacité d'adaptation finiront de nous convaincre.
Benefits & conditions
Un fixe et un variable individuel défini en fonction de votre performance
-
Plan épargne entreprise/retraite, intéressement et participation, couverture santé et prévoyance, activités sociales et culturelles via le comité d'entreprise, …
-
De la flexibilité avec un rythme de travail hybride jusqu'à 50 % de votre temps de travail à définir avec votre manager