Data Engineer H/F
Role details
Job location
Tech stack
Job description
Le Data Engineer conçoit, construit et maintient les infrastructures de données permettant de collecter, traiter et exploiter la donnée à grande échelle. Il garantit la qualité, la disponibilité et la performance des données pour les équipes métiers, Data Analysts et Data Scientists.
Dans un contexte client, il contribue directement à :
-
la valorisation des données métiers
-
l'industrialisation des cas d'usage data / IA
-
la mise en oeuvre de plateformes type Databricks / Cloud, Conception & architecture data
-
Concevoir les architectures de données (Data Lake, Data Warehouse)
-
Définir les flux et modèles de données
-
Choisir les technologies adaptées (cloud, base de données, ETL)
Développement de pipelines data
- Développer des pipelines ETL/ELT (ingestion, transformation, chargement)
- Collecter et intégrer des données issues de sources multiples (API, fichiers, bases...)
- Automatiser les traitements et orchestrer les workflows
Qualité & gouvernance des données
- Nettoyer, structurer et fiabiliser les données
- Mettre en place des contrôles qualité et monitoring
- Garantir la conformité (RGPD, sécurité)
Mise en production & exploitation
- Industrialiser les solutions data (CI/CD, MLOps)
- Assurer la maintenance et le support des pipelines
- Optimiser les performances des traitements
Collaboration & métier
- Recueillir les besoins métiers
- Travailler avec Data Scientists, Data Analysts et équipes IT
- Proposer des solutions data adaptées aux cas d'usage, Au travers de ses recrutements, Klee Group cultive une politique en faveur de la diversité, de l'égalité professionnelle et des travailleurs handicapés.
Déroulement des entretiens
- Un premier échange téléphonique avec Sarah, Tech Recruiter
- Une rencontre avec un membre de ta future équipe
Requirements
Nous recherchons un Data Engineer expérimenté, diplômé d'un Bac +5 en Data, IA, Maths..) capable de concevoir, développer et industrialiser des pipelines de données performants dans des environnements Cloud et Big Data, tout en garantissant la qualité, la fiabilité et la disponibilité des données nécessaires aux usages analytiques et aux projets d'IA., Excellente maîtrise de SQL et bonne maîtrise de Python (ou Scala/Java)
-
Développement et optimisation de pipelines de données (ETL/ELT)
-
Conception et modélisation de données
-
Gestion des flux d'ingestion et de transformation de données
-
Connaissance des technologies Big Data (Spark, Kafka, Hadoop)
-
Expérience des environnements Cloud, notamment AWS
-
Maîtrise des bases de données relationnelles et NoSQL
-
Développement d'API et intégration de sources de données
-
Utilisation des outils DevOps/DataOps (Git, CI/CD, Airflow ou équivalent)
-
Connaissance des bonnes pratiques de qualité, performance et industrialisation des données
-
Rigueur et forte sensibilité à la qualité et à la fiabilité des données
-
Esprit analytique et capacité de résolution de problèmes complexes
-
Autonomie et capacité à prendre des initiatives
-
Capacité à collaborer avec des équipes pluridisciplinaires (Data, IT, métiers)
-
Bonnes compétences en communication et vulgarisation technique
-
Esprit d'équipe et sens du service
-
Adaptabilité dans des environnements techniques en constante évolution
-
Aisance dans les méthodes de travail Agile et DevOps, Python Java Esprit d'analyse