Data Engineer confirmé - CDI H/F

Collective

Canton of Montrouge, France

1 month ago

Role details

Contract type

Permanent contract

Employment type

Full-time (> 32 hours)

Working hours

Regular working hours

Languages

French

Experience level

Intermediate

Job location

Canton of Montrouge, France

Tech stack

API

Airflow

Software as a Service

Cloud Computing

Databases

Continuous Integration

Data Dictionary

Python

PostgreSQL

Open Source Technology

Oracle Applications

Role-Based Access Control

Power BI

Salesforce

SAP Applications

SAP Business Suiteing

Data Server Interface

Snowflake

GIT

Streamlit Framework

Workday

ServiceNow

Job description

Le présent cahier des charges fait état des attentes concernant une prestation de Data Engineering dans le cadre de la construction de sa plateforme data. On a engagé une transformation data en profondeur, avec pour objectif de disposer d'une plateforme data moderne, fiable et évolutive, capable de couvrir des besoins allant du reporting standard à l'exploration analytique avancée. L'architecture retenue est hybride, combinant une infrastructure on-premise et une plateforme cloud (Snowflake). Nous sommes en train de la mettre en place, en s'appuyant sur de l'expertise. La chaîne technique est basée sur des outils modernes et open source : DLT pour l'ingestion, DBT Core pour les transformations, Dagster pour l'orchestration, PostgreSQL comme destination on-premise et Snowflake pour le cloud. La restitution s'appuie sur Power BI. La plateforme est en cours de construction. Le prestataire vient renforcer la capacité de delivery technique.

Afin de répondre aux enjeux dans des délais raisonnables, la DSI souhaite renforcer l'équipe data avec un Data Engineer confirmé, maîtrisant la stack technique retenue (Python et DBT au minimum, DBT et Dagster si possible). En complément, une connaissance minimale de Snowflake serait appréciée, pour contribuer à son administration courante., * Conception et implémentation des modèles DBT en couches : staging, intermédiaire, datamarts

Application des conventions de nommage et d'organisation des couches
Rédaction des tests de qualité, technique, et avancés fonctionnellement
Maintenance de la documentation DBT : descriptions, lineage, dictionnaire de données
Gestion des évolutions de schéma et compatibilité ascendante
Développement et maintenance des pipelines d'ingestion avec DLT
Connexion aux sources : APIs, bases de données on-prem (Oracle, PostgreSQL), fichiers
Sources principales : applications SaaS (Servicenow, Salesforce, Workday…) et SI internes (SI des ventes, Référentiel technique…)
Mise en place des mécanismes de chargement incrémental et de gestion des doublons
Gestion des schémas déclaratifs et des évolutions de schéma
Conception des assets et jobs Dagster pour orchestrer les pipelines de bout en bout
Mise en place du monitoring des exécutions : alertes, logs, stratégies de retry
Définition des dépendances entre assets et des stratégies de scheduling
Gestion des warehouses Snowflake : sizing, suspension automatique, allocation par type d'usage
Sécurité et gestion des accès : modèle RBAC, gestion des rôles et des droits
Supervision des coûts et de la consommation (crédits Snowflake), * Snowflake, dbt project, Streamlit
Starburst (Trino), PostgreSQL
Power BI, Git, CI/CD
Stockage S3, Apache Iceberg
Stack historique (SAP Business Object, SAP BODS), * Application des conventions de nommage et d'organisation des couches
Rédaction des tests de qualité, techniques et fonctionnels avancés
Maintenance de la documentation DBT : descriptions, lineage, dictionnaire de données
Gestion des évolutions de schéma et compatibilité ascendante
Développement et maintenance des pipelines d'ingestion avec DLT
Connexion aux sources : APIs, bases de données on-prem (Oracle, PostgreSQL), fichiers
Mise en place des mécanismes de chargement incrémental et gestion des doublons
Gestion des schémas déclaratifs et des évolutions de schéma
Maîtrise obligatoire de Python
Conception des assets et jobs Dagster pour orchestrer les pipelines
Mise en place du monitoring des exécutions : alertes, logs, stratégies de retry
Définition des dépendances entre assets et stratégies de scheduling

Requirements

3 à 6 ans d'expérience minimum en Data Engineering sur des projets en production
Maîtrise de la stack technique retenue : Python et DBT au minimum, Dagster si possible
Connaissance minimale de Snowflake appréciée pour son administration courante
Expérience en conception et implémentation des modèles DBT en couches (staging, intermédiaire, datamarts), * Connaissance d'une solution similaire à Dagster (ex : Airflow) appréciée
Gestion des warehouses Snowflake : sizing, suspension automatique, allocation par type d'usage
Sécurité et gestion des accès : modèle RBAC, gestion des rôles et droits
Supervision des coûts et de la consommation (crédits Snowflake)
Profil rigoureux, autonome et pédagogue
Capacité à travailler en lien direct avec l'équipe interne et à documenter son travail de manière structurée

Role details

Job location

Tech stack

Job description

Requirements

Apply for this position

Good distractions

Moments

Videos View all