Data Engineer Databricks

KOMEET TECHNOLOGIES
Paris, France
5 days ago

Role details

Contract type
Permanent contract
Employment type
Full-time (> 32 hours)
Working hours
Regular working hours
Languages
French
Experience level
Intermediate

Job location

Paris, France

Tech stack

Unit Testing
Big Data
Cloud Computing
Software Quality
Code Review
Hive
Python
Software Engineering
SQL Databases
Strategies of Testing
Management of Software Versions
Data Ingestion
Spark
GIT
Pytest
Data Lake
PySpark
Databricks

Job description

En tant que Data Engineer, vous intervenez sur la conception, le développement et l?optimisation de pipelines de données robustes et scalables. Vous travaillez au c?ur des plateformes Data afin de garantir la qualité, la disponibilité et la performance des données utilisées par les équipes métiers, BI et Data Science.

Expérience attendue : 3 à 8+ ans en ingénierie Data.

Vous correspondez au/à la Data Engineer que nous recherchons si :

Vous évoluez efficacement au sein d?équipes agiles et pluridisciplinaires, en collaboration étroite avec les équipes Data, IT et métiers, Vous disposez d?un bagage en software engineering, vous permettant d?écrire un code robuste, lisible, maintenable et testable, notamment en Python

Vous appliquez les bonnes pratiques de développement : structuration du code, modularité, gestion des dépendances, conventions de nommage

Vous êtes sensibilisé aux principes de qualité logicielle (tests unitaires, tests d?intégration, revue de code)

Vous êtes à l?aise avec les outils de versioning (Git) et les workflows collaboratifs associés

Vous savez concevoir des pipelines Data comme de véritables produits logiciels, en tenant compte de la maintenabilité, de l?évolutivité et de l?observabilité

Requirements

Do you have experience in Spark?, Vous faites preuve d?un fort esprit analytique et d?une grande rigueur

Vous êtes autonome, proactif et doté d?un solide sens des responsabilités

Vous êtes capable de communiquer clairement avec des interlocuteurs techniques comme non techniques

Vous savez prioriser vos tâches, gérer les contraintes et respecter vos engagements

Vous disposez d?un bon esprit de synthèse et êtes orienté résultats et valeur métier

Vous avez une bonne connaissance des environnements Business Intelligence, Big Data et des architectures Lakehouse

Vous avez déjà travaillé sur des plateformes Data modernes (Cloud)

Vous maîtrisez SQL comme langage d?interrogation des données et avez des notions de modélisation de données (architecture médaillon, modèle en étoile ?), Compétences techniques attendues autour de la plateforme Databricks :

Bonne maîtrise de la plateforme Databricks dans un contexte Data Engineering

Utilisation avancée d?Apache Spark via PySpark et Spark SQL pour le développement de pipelines Data

Connaissance de Delta Lake et de ses mécanismes clés (Delta log, ACID, schema evolution, time travel...)

Maîtrise des différentes méthodes d'ingestion de données de la plateforme

Connaissance et implémentation du framework Spark Declarative Pipelines

Mise en place de stratégies de tests automatisés pour les pipelines incluant :

Tests unitaires (ex. pytest),

Contrôles de qualité des données (DQX, SDP Expectations)

Certifications recommandées : Databricks Certified Data Engineer Associate (ou équivalent)

Apply for this position