Senior Data Engineer - Énergie - CDI H/F
Role details
Job location
Tech stack
Job description
En tant que Senior Data Engineer, vous jouerez un rôle clé dans la structuration et l'industrialisation de la plateforme Analytics. À ce titre, vous serez notamment amené à :
- Industrialiser les cas d'usage Analytics et Machine Learning développés sous Databricks.
- Concevoir, développer et maintenir des pipelines de données distribués à grande échelle.
- Définir et promouvoir les bonnes pratiques de développement, d'architecture et de qualité logicielle.
- Mettre en place des frameworks, templates et composants réutilisables afin d'accélérer les nouveaux développements.
- Réaliser des revues de code et accompagner les équipes dans l'amélioration continue de la qualité des développements.
- Optimiser les pipelines existants afin d'améliorer leurs performances, leur fiabilité et leur maintenabilité.
- Participer au déploiement en production des produits Analytics et IA.
- Administrer et faire évoluer l'environnement Databricks.
- Renforcer les mécanismes de gouvernance, de sécurité et de gestion des accès.
- Optimiser les coûts d'infrastructure et l'utilisation des ressources Cloud.
- Accompagner les utilisateurs de la plateforme et contribuer aux actions de formation et d'onboarding.
- Participer aux choix d'architecture et aux orientations techniques de la plateforme.
Les atouts du poste
Ce poste dépasse le périmètre traditionnel du Data Engineering. Vous contribuerez directement à l'évolution d'une plateforme Analytics stratégique en participant à :
- l'industrialisation des solutions Data et IA ;
- la définition des standards de développement ;
- l'amélioration continue de la qualité logicielle ;
- la gouvernance de la plateforme ;
- l'accompagnement des équipes dans l'adoption des bonnes pratiques.
Vous interviendrez sur des problématiques à forte dimension technique, mêlant Data Engineering, Cloud, DevOps et architecture, avec un impact direct sur la performance et la pérennité des solutions déployées., * Gouvernance
- Unity Catalog
- Gestion des accès
- Monitoring
- Optimisation des coûts Cloud
- Méthodologie
- Agile Scrum, * Monitoring
- Tests automatisés
- Machine learning
- DevOps
Requirements
-
Apache (7 ans)
-
Docker (7 ans)
-
Databricks (7 ans)
-
TensorFlow (7 ans)
-
GitLab (7 ans)
-
SQL (7 ans)
-
Airflow (7 ans)
-
Fargate (7 ans)
-
Python (7 ans)
-
Spark (7 ans), * Minimum 7 ans d'expérience en Data Engineering
-
Expérience significative sur Databricks (5 ans minimum souhaités)
-
Expérience confirmée dans l'industrialisation de solutions Analytics ou Machine Learning
-
Solide expérience dans la conception et l'exploitation de pipelines distribués basés sur Apache Spark
-
Expérience des environnements Cloud AWS
-
Excellente maîtrise de Python, PySpark et SQL
-
Forte expertise Databricks (administration, gouvernance, optimisation et industrialisation)
-
Bonne maîtrise des architectures Lakehouse et de Delta Lake
-
Expérience des bonnes pratiques de développement logiciel (tests automatisés, revue de code, CI/CD, gestion de versions)
-
Bonne maîtrise de Terraform et de l'Infrastructure as Code
-
Connaissance d'Airflow
-
Compréhension du cycle de vie des modèles de Machine Learning (MLflow)
-
Capacité à concevoir des architectures robustes, évolutives et maintenables
-
Esprit d'analyse et capacité à challenger les solutions existantes
-
Excellentes capacités de communication
-
Goût pour le partage de connaissances et l'accompagnement des équipes
-
Autonomie, rigueur et sens du détail
-
Capacité à évoluer dans un environnement international et multidisciplinaire
Benefits & conditions
Environnement technique
- Cloud
- AWS (S3, ECS, Fargate...)
- Data Platform
- Databricks
- Delta Lake
- Lakehouse Architecture
- Data Engineering
- Apache Spark
- PySpark
- SQL
- Analytics & Machine Learning
- MLflow
- scikit-learn
- TensorFlow
- PyTorch
- Orchestration
- Apache Airflow
- DevOps
- GitLab
- CI/CD
- Infrastructure as Code
- Terraform
- Terragrunt
- Conteneurisation
- Docker, * Lieu de la mission : Paris
- Expérience professionnelle : minimum 8 ans
- Télétravail : 2 jours par semaine
Spécialités technologiques
- Intelligence artificielle