Tech Lead Data H/F
Role details
Job location
Tech stack
Job description
Nous opérons sur des infrastructures bare metal sous Linux, avec des problématiques techniques complexes et modernes. Notre entreprise est certifiée ISO 27001 et HDS, garantissant un haut niveau de sécurité, de conformité et de fiabilité dans la gestion des données sensibles.
Ton rôle : Rattaché(e) à l'équipe Technique, tu seras le moteur de notre transformation Data. Ta mission principale consistera à structurer et valoriser nos volumes importants de données opérationnelles brutes (actuellement stockées sur MongoDB et Ceph) pour les rendre pleinement exploitables par les équipes métiers et la direction.
Tes missions :
- Auditer et consolider la collecte existante : auditer les flux de données actuels, identifier les lacunes, consolider et fiabiliser les pipelines d'ingestion existants, documenter l'architecture des données actuelle et produire la cartographie complète des flux.
- Concevoir une architecture cible adaptée à nos besoins : analyser les besoins métiers et cas d'usage, définir l'architecture cible, concevoir les schémas de données et règles de transformation, sélectionner les outils et technologies complémentaires à intégrer à la stack existante.
- Implémenter et mettre en production : développer et orchestrer les pipelines de transformation, mettre en place les environnements Data Warehouse et garantir leur fiabilité, performance et maintenabilité, intégrer les pipelines de données dans les processus CI/CD existants pour assurer des déploiements maîtrisés et reproductibles, déployer et configurer Apache Superset (ou équivalent) comme couche de visualisation accessible aux profils non techniques, mettre en place les politiques de rétention, de qualité et de gouvernance des données.
- Effectuer une analyse métier et valoriser les données : analyser les logiques d'usage client sur l'infrastructure Ceph, travailler avec la direction et les équipes métier pour identifier les indicateurs stratégiques à exposer en priorité, construire les tableaux de bord et rapports permettant un pilotage data-driven de l'activité, accompagner les équipes dans la prise en main des outils de visualisation et la lecture des données produites.
Requirements
Compétences Techniques (Hard Skills)
- Architecture Data : Expérience confirmée en conception et implémentation de Data Lake et/ou Data Warehouse (modélisation dimensionnelle, schémas en étoile/flocon, couches raw/curated).
- Stack Apache : Maîtrise d'Apache Spark pour le traitement distribué, Apache Airflow pour l'orchestration de pipelines, Apache Superset pour la visualisation.
- Bases de données : Bonne connaissance de MongoDB (existant en production) et des bases de données analytiques (ClickHouse, BigQuery, Redshift ou équivalent).
- Stockage objet : Compréhension de Ceph et du stockage objet compatible S3 - la connaissance de notre usage spécifique est un atout majeur.
- CI/CD Data : Expérience de l'intégration des pipelines de données dans des workflows CI/CD (tests de données, versioning des schémas, déploiements automatisés).
- Qualité des données : Connaissance des pratiques de data quality, data lineage et gouvernance des données.
Qualités Humaines (Soft Skills)
- Vision systémique : Capacité à prendre du recul sur un système existant complexe, à identifier les priorités et à proposer une trajectoire claire.
- Pragmatisme : Savoir distinguer la solution idéale de la solution faisable, et livrer de la valeur par itérations successives.
- Pédagogie : Capacité à traduire des concepts data complexes pour des interlocuteurs métier ou direction non techniques.
- Autonomie : À l'aise pour cadrer son propre périmètre et avancer sans supervision rapprochée, tout en maintenant une communication régulière.
Benefits & conditions
- Un emploi en CDI 35h
- Des avantages :
- 100% télétravail
- Titre-restaurant
Date de démarrage souhaitée : dès que possible, mais nous sommes prêts à attendre si un bon profil se présente ;