Data Engineer H/F
Role details
Job location
Tech stack
Job description
Rejoindre Ma Boussole Aidants, c'est contribuer à une mission d'intérêt général au service des aidants en France., Rattaché(e) au Responsable Produit, en lien étroit avec les équipes techniques et data, vous intervenez au sein d'une équipe pluridisciplinaire composée de Data Manager, Data Analysts et gestionnaires de données. Vous évoluez dans un environnement en structuration, au cœur des enjeux de fiabilisation, d'industrialisation et de valorisation de la donnée. Vous travaillez en étroite collaboration avec les équipes Produit, Technique et Déploiement, dans une logique de construction progressive de notre Data Platform et d'amélioration continue de nos usages data.
Vos principales missions
- Contribuer à la fiabilisation d'une base de données territoriale à fort enjeu d'usage (orientation des aidants)
- Intégrer et structurer des données issues de sources hétérogènes (open data, partenaires, scraping, référentiels nationaux type FINESS, etc.)
- Concevoir, développer et maintenir des pipelines de données robustes et scalables.
- Mettre en place des architectures Data Lakehouse sur les plateformes cloud (AWS, GCP, Azure).
- Développer des transformations de données avec Spark, dbt et les outils modernes de la stack data.
- Orchestrer les workflows de données avec Airflow, Dagster ou Prefect.
- Garantir la qualité, la fiabilité et la traçabilité des données (data quality, lineage).
- Participer à la définition des standards et bonnes pratiques data de l'équipe.
- Optimiser les performances des traitements et les coûts d'infrastructure.
- Collaborer avec les Data Analysts et DBA pour comprendre leurs besoins.
Les enjeux du poste
- Structurer une Data Platform en forte croissance (volumétrie, diversité des sources)
- Industrialiser des flux
- Améliorer la qualité et la fraîcheur de données critiques pour les parcours utilisateurs
- Préparer l'exploitation avancée de la donnée, * Intégration et fiabilisation de données issues de sources externes (API, open data, fichiers métiers).
- Conception et maintenance de pipelines de traitement et de standardisation des données.
- Consolidation et rapprochement de référentiels multi-sources.
- Automatisation des contrôles qualité et du suivi des anomalies de données.
- Structuration et évolution des modèles de données pour des usages opérationnels et analytiques.
- Mise en place et amélioration des outils et pratiques data dans un environnement en structuration.
- Optimisation des traitements et des flux de données dans un contexte cloud., * Un projet à fort impact social, au croisement de la data et des politiques publiques
- Une plateforme en construction, avec de vrais choix structurants à faire
- Une équipe à taille humaine, en lien direct avec les décideurs
- Des sujets data variés : ingestion, qualité, structuration, diffusion, APIs
Requirements
- Diplômé(e) en informatique ou data engineering, vous disposez d'au moins 3 ans d'expérience en ingénierie des données.
- Expérience dans l'intégration, la standardisation et la fiabilisation de données externes (API, open data, fichiers CSV/Excel/JSON/XML, référentiels publics).
- Expérience avec la gestion et la consolidation de référentiels de données multi-sources.
- Excellente maîtrise de Python et SQL pour le traitement de données.
- Expérience avec des frameworks de traitement de données en Python (pandas, PySpark, DuckDB ou équivalent
- Maîtrise d'au moins un orchestrateur (Airflow, Dagster, Prefect).
- Bonne connaissance d'au moins une plateforme cloud (AWS, GCP, Azure) et de ses services data.
- Capacité à évoluer dans un environnement en structuration et à faire évoluer les pratiques
- Sensibilité aux enjeux produit et à l'impact utilisateur de la donnée
- Rigueur, autonomie et capacité à prioriser dans un contexte agile
Apprécié
- Certification cloud data (AWS Data Analytics, GCP Data Engineer, Azure Data Engineer).
- Expérience avec Kafka, Kinesis ou autres technologies de streaming.
- Connaissance des outils de data quality (Great Expectations, Soda)
- Expérience avec les outils de transformation (dbt) et les formats modernes (Parquet, Delta Lake, Iceberg).
Types d'activité
Benefits & conditions
Rémunération : 45 000,00€ à 55 000,00€ par an
Avantages :
- RTT
Lieu du poste : Télétravail hybride (75017 Paris)