Senior Data Engineer - Énergie - CDI H/F

Collective
Paris, France
2 days ago

Role details

Contract type
Permanent contract
Employment type
Full-time (> 32 hours)
Working hours
Regular working hours
Languages
French
Experience level
Senior

Job location

Remote
Paris, France

Tech stack

Airflow
Amazon Web Services (AWS)
Amazon Web Services (AWS)
Data analysis
Automation of Tests
Cloud Computing
Software Quality
Code Review
Continuous Integration
Information Engineering
Data Infrastructure
DevOps
Python
Machine Learning
Scrum
TensorFlow
Standard Sql
Software Engineering
SQL Databases
Spark
Gitlab
Data Lake
PySpark
Amazon Web Services (AWS)
Machine Learning Operations
Terraform
Databricks

Job description

En tant que Senior Data Engineer, vous jouerez un rôle clé dans la structuration et l'industrialisation de la plateforme Analytics. À ce titre, vous serez notamment amené à :

  • Industrialiser les cas d'usage Analytics et Machine Learning développés sous Databricks.
  • Concevoir, développer et maintenir des pipelines de données distribués à grande échelle.
  • Définir et promouvoir les bonnes pratiques de développement, d'architecture et de qualité logicielle.
  • Mettre en place des frameworks, templates et composants réutilisables afin d'accélérer les nouveaux développements.
  • Réaliser des revues de code et accompagner les équipes dans l'amélioration continue de la qualité des développements.
  • Optimiser les pipelines existants afin d'améliorer leurs performances, leur fiabilité et leur maintenabilité.
  • Participer au déploiement en production des produits Analytics et IA.
  • Administrer et faire évoluer l'environnement Databricks.
  • Renforcer les mécanismes de gouvernance, de sécurité et de gestion des accès.
  • Optimiser les coûts d'infrastructure et l'utilisation des ressources Cloud.
  • Accompagner les utilisateurs de la plateforme et contribuer aux actions de formation et d'onboarding.
  • Participer aux choix d'architecture et aux orientations techniques de la plateforme.

Les atouts du poste

Ce poste dépasse le périmètre traditionnel du Data Engineering. Vous contribuerez directement à l'évolution d'une plateforme Analytics stratégique en participant à :

  • l'industrialisation des solutions Data et IA ;
  • la définition des standards de développement ;
  • l'amélioration continue de la qualité logicielle ;
  • la gouvernance de la plateforme ;
  • l'accompagnement des équipes dans l'adoption des bonnes pratiques.

Vous interviendrez sur des problématiques à forte dimension technique, mêlant Data Engineering, Cloud, DevOps et architecture, avec un impact direct sur la performance et la pérennité des solutions déployées., * Gouvernance

  • Unity Catalog
  • Gestion des accès
  • Monitoring
  • Optimisation des coûts Cloud
  • Méthodologie
  • Agile Scrum, * Monitoring
  • Tests automatisés
  • Machine learning
  • DevOps

Requirements

  • Apache (7 ans)

  • Docker (7 ans)

  • Databricks (7 ans)

  • TensorFlow (7 ans)

  • GitLab (7 ans)

  • SQL (7 ans)

  • Airflow (7 ans)

  • Fargate (7 ans)

  • Python (7 ans)

  • Spark (7 ans), * Minimum 7 ans d'expérience en Data Engineering

  • Expérience significative sur Databricks (5 ans minimum souhaités)

  • Expérience confirmée dans l'industrialisation de solutions Analytics ou Machine Learning

  • Solide expérience dans la conception et l'exploitation de pipelines distribués basés sur Apache Spark

  • Expérience des environnements Cloud AWS

  • Excellente maîtrise de Python, PySpark et SQL

  • Forte expertise Databricks (administration, gouvernance, optimisation et industrialisation)

  • Bonne maîtrise des architectures Lakehouse et de Delta Lake

  • Expérience des bonnes pratiques de développement logiciel (tests automatisés, revue de code, CI/CD, gestion de versions)

  • Bonne maîtrise de Terraform et de l'Infrastructure as Code

  • Connaissance d'Airflow

  • Compréhension du cycle de vie des modèles de Machine Learning (MLflow)

  • Capacité à concevoir des architectures robustes, évolutives et maintenables

  • Esprit d'analyse et capacité à challenger les solutions existantes

  • Excellentes capacités de communication

  • Goût pour le partage de connaissances et l'accompagnement des équipes

  • Autonomie, rigueur et sens du détail

  • Capacité à évoluer dans un environnement international et multidisciplinaire

Benefits & conditions

Environnement technique

  • Cloud
  • AWS (S3, ECS, Fargate...)
  • Data Platform
  • Databricks
  • Delta Lake
  • Lakehouse Architecture
  • Data Engineering
  • Apache Spark
  • PySpark
  • SQL
  • Analytics & Machine Learning
  • MLflow
  • scikit-learn
  • TensorFlow
  • PyTorch
  • Orchestration
  • Apache Airflow
  • DevOps
  • GitLab
  • CI/CD
  • Infrastructure as Code
  • Terraform
  • Terragrunt
  • Conteneurisation
  • Docker, * Lieu de la mission : Paris
  • Expérience professionnelle : minimum 8 ans
  • Télétravail : 2 jours par semaine

Spécialités technologiques

  • Intelligence artificielle

About the company

Dans le cadre de l'évolution de sa plateforme Analytics, un acteur majeur du secteur de l'énergie recherche un Senior Data Engineer afin d'accompagner l'industrialisation des cas d'usage Data et Intelligence Artificielle. La plateforme, construite sur Databricks et AWS, permet aux équipes Data, Analytics et Métiers de développer, tester et déployer des solutions à forte valeur ajoutée. L'objectif principal du poste est d'accélérer la transformation des prototypes Analytics et Machine Learning en solutions robustes, maintenables et industrialisées, tout en renforçant les standards de développement, la gouvernance des données et l'expérience utilisateur de la plateforme. Le poste s'inscrit dans un environnement Agile et nécessite une collaboration étroite avec les équipes Data Engineering, Data Science, Analytics, Cloud et Produit.

Apply for this position