Data Engineer H/F

Ma Boussole Aidants
Paris, France
2 days ago

Role details

Contract type
Permanent contract
Employment type
Full-time (> 32 hours)
Working hours
Regular working hours
Languages
French
Experience level
Intermediate
Compensation
€ 55K

Job location

Remote
Paris, France

Tech stack

Microsoft Excel
API
Airflow
Amazon Web Services (AWS)
Azure
Databases
Data Infrastructure
JSON
Python
Open Data Protocol
SQL Databases
Data Streaming
XML
Parquet
Simple Object Database Access
Google Cloud Platform
Azure
Spark
Data Lake
PySpark
Amazon Web Services (AWS)
Kafka
Data Lakehouse

Job description

Rejoindre Ma Boussole Aidants, c'est contribuer à une mission d'intérêt général au service des aidants en France., Rattaché(e) au Responsable Produit, en lien étroit avec les équipes techniques et data, vous intervenez au sein d'une équipe pluridisciplinaire composée de Data Manager, Data Analysts et gestionnaires de données. Vous évoluez dans un environnement en structuration, au cœur des enjeux de fiabilisation, d'industrialisation et de valorisation de la donnée. Vous travaillez en étroite collaboration avec les équipes Produit, Technique et Déploiement, dans une logique de construction progressive de notre Data Platform et d'amélioration continue de nos usages data.

Vos principales missions

  • Contribuer à la fiabilisation d'une base de données territoriale à fort enjeu d'usage (orientation des aidants)
  • Intégrer et structurer des données issues de sources hétérogènes (open data, partenaires, scraping, référentiels nationaux type FINESS, etc.)
  • Concevoir, développer et maintenir des pipelines de données robustes et scalables.
  • Mettre en place des architectures Data Lakehouse sur les plateformes cloud (AWS, GCP, Azure).
  • Développer des transformations de données avec Spark, dbt et les outils modernes de la stack data.
  • Orchestrer les workflows de données avec Airflow, Dagster ou Prefect.
  • Garantir la qualité, la fiabilité et la traçabilité des données (data quality, lineage).
  • Participer à la définition des standards et bonnes pratiques data de l'équipe.
  • Optimiser les performances des traitements et les coûts d'infrastructure.
  • Collaborer avec les Data Analysts et DBA pour comprendre leurs besoins.

Les enjeux du poste

  • Structurer une Data Platform en forte croissance (volumétrie, diversité des sources)
  • Industrialiser des flux
  • Améliorer la qualité et la fraîcheur de données critiques pour les parcours utilisateurs
  • Préparer l'exploitation avancée de la donnée, * Intégration et fiabilisation de données issues de sources externes (API, open data, fichiers métiers).
  • Conception et maintenance de pipelines de traitement et de standardisation des données.
  • Consolidation et rapprochement de référentiels multi-sources.
  • Automatisation des contrôles qualité et du suivi des anomalies de données.
  • Structuration et évolution des modèles de données pour des usages opérationnels et analytiques.
  • Mise en place et amélioration des outils et pratiques data dans un environnement en structuration.
  • Optimisation des traitements et des flux de données dans un contexte cloud., * Un projet à fort impact social, au croisement de la data et des politiques publiques
  • Une plateforme en construction, avec de vrais choix structurants à faire
  • Une équipe à taille humaine, en lien direct avec les décideurs
  • Des sujets data variés : ingestion, qualité, structuration, diffusion, APIs

Requirements

  • Diplômé(e) en informatique ou data engineering, vous disposez d'au moins 3 ans d'expérience en ingénierie des données.
  • Expérience dans l'intégration, la standardisation et la fiabilisation de données externes (API, open data, fichiers CSV/Excel/JSON/XML, référentiels publics).
  • Expérience avec la gestion et la consolidation de référentiels de données multi-sources.
  • Excellente maîtrise de Python et SQL pour le traitement de données.
  • Expérience avec des frameworks de traitement de données en Python (pandas, PySpark, DuckDB ou équivalent
  • Maîtrise d'au moins un orchestrateur (Airflow, Dagster, Prefect).
  • Bonne connaissance d'au moins une plateforme cloud (AWS, GCP, Azure) et de ses services data.
  • Capacité à évoluer dans un environnement en structuration et à faire évoluer les pratiques
  • Sensibilité aux enjeux produit et à l'impact utilisateur de la donnée
  • Rigueur, autonomie et capacité à prioriser dans un contexte agile

Apprécié

  • Certification cloud data (AWS Data Analytics, GCP Data Engineer, Azure Data Engineer).
  • Expérience avec Kafka, Kinesis ou autres technologies de streaming.
  • Connaissance des outils de data quality (Great Expectations, Soda)
  • Expérience avec les outils de transformation (dbt) et les formats modernes (Parquet, Delta Lake, Iceberg).

Types d'activité

Benefits & conditions

Rémunération : 45 000,00€ à 55 000,00€ par an

Avantages :

  • RTT

Lieu du poste : Télétravail hybride (75017 Paris)

About the company

Chaque jour, des millions d'aidants font face à des parcours complexes pour accéder à une information fiable et à des solutions adaptées. Ma Boussole Aidants a pour ambition d'être un tiers de confiance national de l'information et de l'orientation des aidants, en structurant une réponse lisible, accessible et coordonnée à l'échelle des territoires. En tant que Société Coopérative d'Intérêt Collectif, nous développons, aux côtés des acteurs publics, associatifs et privés, une infrastructure d'information d'intérêt général, au service des politiques publiques et des parcours d'information et d'orientation des aidants. Notre Data Platform alimente aujourd'hui des services utilisés par des millions d'aidants et des partenaires publics et privés, notamment via notre annuaire de solutions, nos APIs et nos outils d'aide à la décision. Elle est au cœur de notre capacité à structurer, fiabiliser et diffuser une information territoriale complexe à grande échelle.

Apply for this position