Alternance - Data Engineer Spark & Cloud F/H

Groupe BPCE

Paris, France

4 days ago

Role details

Contract type

Apprenticeship

Employment type

Full-time (> 32 hours)

Working hours

Regular working hours

Languages

French

Experience level

Junior

Job location

Paris, France

Tech stack

Airflow

Unit Testing

Google BigQuery

Cloud Computing

Cloud Storage

Cloudera Impala

Continuous Integration

ETL

Data Security

Hadoop

Hadoop Distributed File System

MapReduce

HBase

Hive

Identity and Access Management

Python

Meta-Data Management

Online Analytical Processing

Online Transaction Processing

Prometheus

SQL Databases

Data Streaming

Google Cloud Platform

Apache Yarn

Grafana

Spark

GIT

PySpark

Integration Tests

Jenkins

Job description

Rejoignez BPCE en tant que Data Engineer Spark & Cloud pour une alternance à partir de Septembre 2026 !

Vous intégrez la Direction Technologies & Opérations et plus particulièrement l'équipe D&R/Assets et projets data : une équipe data dynamique en croissance, responsable de la collecte, du traitement et de l'analyse de grandes volumes de données.

Vous aurez pour rôle de :

Participer à la conception et à la mise en œuvre de solutions data cloud-native et on-premise, en collaboration avec les Data Engineers et les équipes IT.

Vous aurez à prendre en charge une partie des développements sur des projets Data de l'équipe.

Concrètement votre quotidien ?

En collaboration avec votre tuteur (profil tech lead), vous évoluerez sur les missions suivantes :

Concevoir, développer et maintenir des flux de données (ETL/ELT) utilisant Spark (PySpark/Scala) pour le traitement de données en batch et en streaming.
Travailler avec Hadoop (HDFS, MapReduce, YARN) et les écosystèmes associés (Hive, HBase, Pig) pour l'ingestion, le stockage et l'interrogation des données.
Intégrer et orchestrer les pipelines de données sur Google Cloud Platform (GCP): BigQuery, Dataflow, Dataproc, Cloud Storage, Pub/Sub, IAM/Security.
Participer à la modélisation et à l'optimisation du schéma de données (OLAP/OLTP) et à la gestion des métadonnées (catalogue, lineage).
Garantir la qualité des données et la traçabilité (tests unitaires, tests d'intégration, monitoring des pipelines, gestion des exceptions)
Assurer les aspects sécurité et conformité des données (accès, chiffrement, logs, audit)., Restez informé(e) de nos dernières actualités, évènements de recrutement et conseils pour organiser votre recherche d'emploi. Une dose d'inspiration tous les mois dans votre boîte mail !

Requirements

Vous préparez un Master sur 1/2 ans ou êtes en 2ème/ 3ème année de cycle Ingénieur avec une spécialisation Développement / Data.

Idéalement, vous avez déjà acquis une 1ère expérience dans ce domaine en stage / alternance.

Pour réussir votre mission, vous avez acquis ou évoluez sur un environnement technique comme :

Spark: PySpark ou Spark SQL; notions de performance et tuning.
Langages : Python (indispensable), Scala serait un plus ; SQL avancé (indispensable).
Hadoop: HDFS, MapReduce, YARN; expérience avec Hive/Impala est un plus.
GCP : expérience pratique avec Dataflow/Dataproc, BigQuery, Cloud Storage;
connaissance des pipelines Ingest/ETL sur GCP.
Outils : Airflow (ou autre orchestrateur), Git, Jenkins ou équivalent CI/CD, outils de monitoring (Prometheus, Grafana) souhaités.

Vous êtes par ailleurs reconnu pour vos capacités d'analyse et esprit critique.

Enfin, vous possédez un excellent relationnel qui vous permettra de travailler en transverse et d'instaurer des relations de qualité.

Idéalement, vous avez également des notions de sécurité des données, confidentialité et gouvernance., Vous acceptez les CGU ainsi que notre politique de confidentialité décrivant la finalité des traitements de vos données personnelles.

About the company

Rejoignez une entreprise au cœur des activités du Groupe BPCE, de ses évolutions et de son développement. Organe central du groupe, BPCE SA définit la politique et les orientations stratégiques du groupe et de chacun des deux réseaux Banque Populaire et Caisse d'Epargne, en cohérence avec son projet « Vision 2030 ». Les missions confiées à nos collaborateurs offrent une vision transversale des enjeux économiques et stratégiques du groupe.