Data Engineer confirmé - CDI H/F

Collective
Canton of Montrouge, France
2 days ago

Role details

Contract type
Permanent contract
Employment type
Full-time (> 32 hours)
Working hours
Regular working hours
Languages
French
Experience level
Intermediate

Job location

Canton of Montrouge, France

Tech stack

API
Airflow
Software as a Service
Cloud Computing
Databases
Continuous Integration
Data Dictionary
Python
PostgreSQL
Open Source Technology
Oracle Applications
Role-Based Access Control
Power BI
Salesforce
SAP Applications
SAP Business Suiteing
Data Server Interface
Snowflake
GIT
Streamlit Framework
Workday
ServiceNow

Job description

Le présent cahier des charges fait état des attentes concernant une prestation de Data Engineering dans le cadre de la construction de sa plateforme data. On a engagé une transformation data en profondeur, avec pour objectif de disposer d'une plateforme data moderne, fiable et évolutive, capable de couvrir des besoins allant du reporting standard à l'exploration analytique avancée. L'architecture retenue est hybride, combinant une infrastructure on-premise et une plateforme cloud (Snowflake). Nous sommes en train de la mettre en place, en s'appuyant sur de l'expertise. La chaîne technique est basée sur des outils modernes et open source : DLT pour l'ingestion, DBT Core pour les transformations, Dagster pour l'orchestration, PostgreSQL comme destination on-premise et Snowflake pour le cloud. La restitution s'appuie sur Power BI. La plateforme est en cours de construction. Le prestataire vient renforcer la capacité de delivery technique.

Afin de répondre aux enjeux dans des délais raisonnables, la DSI souhaite renforcer l'équipe data avec un Data Engineer confirmé, maîtrisant la stack technique retenue (Python et DBT au minimum, DBT et Dagster si possible). En complément, une connaissance minimale de Snowflake serait appréciée, pour contribuer à son administration courante., * Conception et implémentation des modèles DBT en couches : staging, intermédiaire, datamarts

  • Application des conventions de nommage et d'organisation des couches

  • Rédaction des tests de qualité, technique, et avancés fonctionnellement

  • Maintenance de la documentation DBT : descriptions, lineage, dictionnaire de données

  • Gestion des évolutions de schéma et compatibilité ascendante

  • Développement et maintenance des pipelines d'ingestion avec DLT

  • Connexion aux sources : APIs, bases de données on-prem (Oracle, PostgreSQL), fichiers

  • Sources principales : applications SaaS (Servicenow, Salesforce, Workday…) et SI internes (SI des ventes, Référentiel technique…)

  • Mise en place des mécanismes de chargement incrémental et de gestion des doublons

  • Gestion des schémas déclaratifs et des évolutions de schéma

  • Conception des assets et jobs Dagster pour orchestrer les pipelines de bout en bout

  • Mise en place du monitoring des exécutions : alertes, logs, stratégies de retry

  • Définition des dépendances entre assets et des stratégies de scheduling

  • Gestion des warehouses Snowflake : sizing, suspension automatique, allocation par type d'usage

  • Sécurité et gestion des accès : modèle RBAC, gestion des rôles et des droits

  • Supervision des coûts et de la consommation (crédits Snowflake), * Snowflake, dbt project, Streamlit

  • Starburst (Trino), PostgreSQL

  • Power BI, Git, CI/CD

  • Stockage S3, Apache Iceberg

  • Stack historique (SAP Business Object, SAP BODS), * Application des conventions de nommage et d'organisation des couches

  • Rédaction des tests de qualité, techniques et fonctionnels avancés

  • Maintenance de la documentation DBT : descriptions, lineage, dictionnaire de données

  • Gestion des évolutions de schéma et compatibilité ascendante

  • Développement et maintenance des pipelines d'ingestion avec DLT

  • Connexion aux sources : APIs, bases de données on-prem (Oracle, PostgreSQL), fichiers

  • Mise en place des mécanismes de chargement incrémental et gestion des doublons

  • Gestion des schémas déclaratifs et des évolutions de schéma

  • Maîtrise obligatoire de Python

  • Conception des assets et jobs Dagster pour orchestrer les pipelines

  • Mise en place du monitoring des exécutions : alertes, logs, stratégies de retry

  • Définition des dépendances entre assets et stratégies de scheduling

Requirements

  • 3 à 6 ans d'expérience minimum en Data Engineering sur des projets en production

  • Maîtrise de la stack technique retenue : Python et DBT au minimum, Dagster si possible

  • Connaissance minimale de Snowflake appréciée pour son administration courante

  • Expérience en conception et implémentation des modèles DBT en couches (staging, intermédiaire, datamarts), * Connaissance d'une solution similaire à Dagster (ex : Airflow) appréciée

  • Gestion des warehouses Snowflake : sizing, suspension automatique, allocation par type d'usage

  • Sécurité et gestion des accès : modèle RBAC, gestion des rôles et droits

  • Supervision des coûts et de la consommation (crédits Snowflake)

  • Profil rigoureux, autonome et pédagogue

  • Capacité à travailler en lien direct avec l'équipe interne et à documenter son travail de manière structurée

Apply for this position