Data Engineer expérimenté - CDI H/F
Role details
Job location
Tech stack
Job description
La Team Plateforme Data & Analytics constituée de l'équipe Data Platform et l'équipe produit Analytics œuvre pour tous les métiers dans une organisation Datamesh afin de :
- Mettre à disposition la donnée aux utilisateurs
- Modéliser les solutions applicatives selon les besoins métiers de l'entreprise
- Développer avec les métiers des reporting et datasets à haute valeur ajoutée
- Déployer les modèles d'IA/IA Gen/ML développés par l'équipe Datascience
- Assurer le cycle de vie de ses produits Data depuis cadrage du besoin jusqu'au run
- Maintenir le cadre régalien Analytics et appuyer les métiers dans la conduite du changement
- Promouvoir l'usage des outils de reporting et accompagner les métiers dans l'appropriation de leurs données
Toutes ces activités sont à assurer dans le respect du cadre technologique et cybersécurité de l'entreprise et dans un cadre d'agilité à l'échelle (SAFE) ou en SCRUM/KANBAN.
Missions
- Gouvernance, coordination et documentation :
- Appui au pilotage des produits : conseil, expertise, accompagnement au changement, suivi stratégique et opérationnel des projets
- Rédaction, mise à jour et maintien de l'ensemble des spécifications fonctionnelles et techniques de la plateforme
- Animation de la communauté développeurs : diffusion des bonnes pratiques, partage de connaissances, alignement sur les standards
- Analyse avancée et modélisation statistique :
- Capacité à effectuer des analyses complexes sur les données
- Utilisation de méthodologies statistiques pour générer des insights exploitables
- Compétences en modélisation de données pour créer des schémas et des structures
- Posture "Conseil" :
- Compétences en communication et en pédagogie pour travailler conjointement avec des équipes techniques, interfonctionnelles et métier
- Développement & intégration : Ingestion & traitements de données
-
Maîtrise des processus d'ingestion batch et streaming, quel que soit le type de source (API, fichiers structurés/semi-structurés/non structurés, bases de données) ou le cloud provider en entrée (AWS / Azure)
-
Développement, optimisation et industrialisation des pipelines de données CI/CD & DevOps
-
Construction et maintenance des pipelines CI/CD, gestion des artefacts, des dépôts et des tasks automatisées
-
Création et administration d'applications, notebooks et environnements associés (Pandas, NumPy, etc.) Qualité, performance et bonnes pratiques
-
Optimisation de requêtes, performance applicative et factorisation du code
-
Analyse avancée d'incidents techniques ou fonctionnels, réalisation de tests unitaires et contrôle de la qualité du code
-
Revue et amélioration de code (SQL, C#, PowerShell) Développement applicatif & frameworks internes
-
Contribuer à l'évolution continue et l'optimisation du framework d'alimentation et de supervision de la plateforme PDA (.NET / PowerShell / JavaScript)
-
Développement de scripts d'administration, outils d'automatisation et alertes de sécurité
-
Développement de modèles tabulaires Power BI (langages M et DAX)
- Support & Monitoring
- Support technique Niveau 3 sur les socles applicatifs et les reporting associés
- Monitoring de l'infrastructure et supervision des flux de données
- Administration & Performance des Bases de Données (DBA) DBA Études
-
Revue de code, audit et validation des Pull Requests
-
Optimisation des requêtes, amélioration des performances généralisées, respect des bonnes pratiques
-
Ajustement et contrôle des performances des bases SQL Server, Snowflake et Azure SQL DBA Système
-
Conception et gestion des modèles de sécurité des bases de données
-
Monitoring, gestion de la performance et résolution d'incidents critiques
- Expertise Technique & Référentiels Expertise Snowflake
-
Expertise avancée sur Snowflake (> 3 ans) : SQL, rôles, virtual warehouses, data modeling et optimisation Référent métier & gouvernance
-
Maîtrise approfondie des modèles de données et rôle de référent technico-fonctionnel sur 2 à 3 domaines métiers Standards & bonnes pratiques
-
Mise en place, maintien et contrôle du respect des bonnes pratiques techniques, fonctionnelles et documentaires
Outils & Environnement
-
Ingestions de données paramétrées en mode « delta-lake » (tables de streaming)
-
Transformations et règles de gestion réalisées via procédures stockées (SQL et JavaScript) et Python avec Snowpark (pour projets Datascience/IA/ML, Features Store, Model Registry)
-
Orchestration des transformations principalement via Azure Automation (à terme Snow Tasks), supervision via Log Analytics et suivi dans Power BI
-
Patterns de déploiement CI/CD basés sur un framework (.net) développé en interne
-
Acquisition des données via scripts Powershell/C# utilisant des services Azure managés (Blob storage, Key Vault, Log Analytics)
-
Stockage des données dans une architecture en médaillon dans Snowflake (zones Bronze > Argent > Or) hébergée dans le Cloud Azure
-
Zones de publication par domaine fonctionnel (ex : RH, Finance) en mode DataMesh
-
Exploitation des données via modèles sémantiques Power BI, cubes multidimensionnels et apps Streamlit conteneurisées
-
Déploiements gérés par la chaîne complète CI/CD d'Azure DevOps (repository GIT, méthode GITflow / GITHubflow pour Analytics) et GitLab pour applications conteneurisées et Datascience, * Maîtrise des processus d'ingestion batch et streaming pour différents types de sources et cloud providers (AWS / Azure)
-
Développement, optimisation et industrialisation des pipelines de données
-
Construction et maintenance des pipelines CI/CD, gestion des artefacts, dépôts et tâches automatisées
-
Création et administration d'applications, notebooks et environnements associés (ex : Pandas, NumPy)
-
Optimisation de requêtes, performance applicative et factorisation du code
-
Analyse avancée d'incidents techniques ou fonctionnels, réalisation de tests unitaires et contrôle de la qualité du code
-
Revue et amélioration de code (SQL, C#, PowerShell)
-
Contribution à l'évolution et optimisation du framework d'alimentation et de supervision (.NET / PowerShell / JavaScript)
-
Développement de scripts d'administration, outils d'automatisation et alertes de sécurité
-
Développement de modèles tabulaires Power BI (langages M et DAX)
-
Support technique Niveau 3 sur socles applicatifs et reporting associés
-
Monitoring de l'infrastructure et supervision des flux de données
-
Revue de code, audit et validation des Pull Requests
-
Optimisation des requêtes et amélioration des performances sur bases SQL Server, Snowflake et Azure SQL
-
Conception et gestion des modèles de sécurité des bases de données
-
Monitoring, gestion de la performance et résolution d'incidents critiques
Requirements
-
Posture « Conseil » avec niveau d'expertise, force de proposition, capacité à challenger et autonomie
-
Capacité à effectuer des analyses complexes sur les données
-
Utilisation de méthodologies statistiques pour générer des insights exploitables
-
Compétences en modélisation de données pour créer des schémas et des structures
-
Compétences en communication et en pédagogie pour travailler avec des équipes techniques, interfonctionnelles et métier, * Expertise avancée Snowflake (> 3 ans) : SQL, rôles, virtual warehouses, data modeling et optimisation
-
Maîtrise approfondie des modèles de données et rôle de référent technico-fonctionnel sur 2 à 3 domaines métiers
-
Mise en place, maintien et contrôle du respect des bonnes pratiques techniques, fonctionnelles et documentaires