Tech Lead Databricks

KOMEET TECHNOLOGIES
Paris, France
5 days ago

Role details

Contract type
Permanent contract
Employment type
Full-time (> 32 hours)
Working hours
Regular working hours
Languages
French
Experience level
Senior

Job location

Paris, France

Tech stack

Code Review
Continuous Integration
DevOps
Python
Performance Tuning
Software Engineering
SQL Databases
Strategies of Testing
Spark
Caching
Pytest
Data Lake
Terraform
Databricks

Job description

En tant que Tech Lead, vous êtes l'expert Data Engineering et le référent technique dans vos missions. Vous intervenez principalement sur les problématiques d?ingestion, de traitement et d?industrialisation des données sur la data plateforme. Sans être responsable de l?architecture Data globale, vous avez un rôle clé dans la qualité des livrables, la standardisation des pratiques et la montée en compétence des Data Engineers.

Expérience attendue : 7 à 12+ ans en Data Engineering avec une expérience dans un rôle de référent technique, Vous portez une attention particulière à la qualité des données, à la testabilité et à l?observabilité des pipelines en production

Vous pratiquez régulièrement les revues de code, le mentoring et l?accompagnement technique des Data Engineers

Vous êtes en mesure de concevoir des frameworks internes et des briques techniques réutilisables afin d?industrialiser et standardiser les développements

Vous comprenez les enjeux de performance, de scalabilité et de maîtrise des coûts, et savez les intégrer dans vos choix techniques, Expertise avancée de la plateforme Databricks et de ses usages en contexte Data Engineering

Maîtrise approfondie d?Apache Spark via PySpark et Spark SQL, incluant la compréhension et l?optimisation des mécanismes internes (partitionnement, shuffles, caching, plans d?exécution)

Maîtrise approfondie de Delta Lake et de ses mécanismes clés (Delta log, ACID, schema evolution, time travel...)

Structuration et standardisation des projets Databricks

Définition de l?environnement de travail des Data Engineers et des outils associés (outillage, conventions, frameworks internes)

Maîtrise du framework Spark Declarative Pipelines

Mise en place de stratégies de tests automatisés pour les pipelines Databricks incluant : (pytest, DQX, SDP Expectations)

Optimisation des performances Spark et de la maîtrise des coûts d?exécution sur la plateforme

Définition et maintien de standards de développement et de gestion des environnements sur Databricks

Bonne connaissance des mécanismes de sécurité Databricks, incluant la gestion des secrets, des permissions et de la gouvernance via Unity Catalog

Responsabilité de la stratégie de déploiement CI/CD de la plateforme , s?appuyant sur Databricks Asset Bundles et/ou Terraform

Support technique sur la plateforme

Requirements

Vous disposez d?un leadership technique, reconnu et légitime auprès des équipes

Vous savez animer, encadrer et fédérer une équipe autour de bonnes pratiques techniques et d?objectifs communs

Vous faites preuve d?une excellente communication, associée à une forte capacité pédagogique

Vous adoptez un esprit critique constructif et savez challenger les choix techniques dans une logique d?amélioration continue

Vous êtes capable de prendre du recul sur des problématiques techniques afin de proposer des solutions pertinentes et durables

Vous êtes autonome, proactif et doté d?un fort sens des responsabilités

Vous favorisez le partage de connaissances et la montée en compétence collective

Vous savez collaborer efficacement avec des rôles transverses (Architectes, Product Owners, DevOps, ML Engineers)

Vous maîtrisez Python et SQL à un niveau avancé, avec une forte sensibilité aux bonnes pratiques de software engineering (qualité, maintenabilité, testabilité)

Vous êtes capable de définir, documenter et faire appliquer des standards de développement, incluant la structuration des projets, les conventions de code et les stratégies de tests

Vous avez une expérience significative dans la mise en place et la maintenance de chaînes CI/CD appliquées aux pipelines Data, Certifications recommandées : Databricks Certified Data Engineer Professional (ou équivalent)

Apply for this position