Architecte Big Data - Spark Performance H/F

Maestris

Canton de Valbonne, France

2 days ago

Role details

Contract type

Permanent contract

Employment type

Part-time (≤ 32 hours)

Working hours

Regular working hours

Languages

French

Experience level

Senior

Job location

Remote

Canton de Valbonne, France

Tech stack

Java

Agile Methodologies

Airflow

Big Data

Cloud Engineering

Continuous Integration

Data Infrastructure

Hadoop

Hadoop Distributed File System

Hive

Python

Apache Oozie

Cloudera

Spark

Archimate

PySpark

Kafka

Spring Batch

Job description

Un cadre de travail stimulant avec des projets variés à fort impact

Un accompagnement de proximité et des formations continues

Une culture d'entreprise centrée sur la collaboration, l'innovation et le bien-être

Télétravail partiel possible, paniers repas, mutuelle premium

Envie de rejoindre une entreprise où il fait bon vivre ? Postulez dès maintenant et devenez acteur de votre avenir avec MAESTRIA.

Dans le cadre d'un programme stratégique de transformation Data à très grande échelle, nous recherchons un(e) Architecte Big Data orienté Spark & Performance afin d'accompagner l'évolution et l'optimisation d'une plateforme de traitement de données massives.

Vous interviendrez dans un environnement critique à forte volumétrie, au sein d'un programme Agile à l'échelle regroupant plusieurs centaines de collaborateurs., La plateforme traite chaque mois plusieurs milliards de lignes de données issues de flux massifs et critiques pour l'activité métier.

Les enjeux principaux :

performance des traitements distribués,
optimisation des pipelines batch,
maîtrise des temps d'exécution,
qualité et exploitabilité opérationnelle des données,
conservation longue durée des historiques.

L'environnement technique repose sur :

une plateforme Big Data Hadoop / Cloudera,
des traitements Spark distribués,
un écosystème Java / Spring Batch,
des infrastructures conteneurisées et cloud-native.

La volumétrie et les contraintes de performance imposent une forte maîtrise des problématiques liées :

au partitionnement,
aux traitements distribués,
à la mémoire,
aux shuffles,
à l'optimisation des transformations Spark., En tant qu'Architecte Big Data, vous serez amené(e) à :
Concevoir et faire évoluer les architectures de traitement de données massives
Accompagner les équipes sur les problématiques de performance Spark
Optimiser les traitements batch distribués à très grande échelle
Définir les bonnes pratiques de développement et d'industrialisation Data
Participer aux choix d'architecture autour des plateformes Data et des flux événementiels
Accompagner les équipes de développement dans l'optimisation des traitements
Contribuer aux travaux d'urbanisation et de gouvernance technique
Participer aux comités d'architecture et à la définition des standards techniques
Superviser la bonne application des pratiques d'architecture et de performance

Environnement technique

Big Data & Data Engineering

Spark / PySpark
Hadoop
Cloudera
HDFS
Hive
Traitements DataFrame
Traitements batch distribués

Développement & Frameworks

Python
Java
Spring Batch

Orchestration & Industrialisation

Airflow / Oozie
CI/CD & industrialisation Data

Streaming & Messaging

Kafka
Architectures événementielles, Volumétries rares et problématiques techniques stimulantes
Programme stratégique à très forte visibilité
Environnement Big Data mature et industrialisé
Equipes expertes et culture forte de l'ingénierie
Sujets mêlant architecture, performance et optimisation à grande échelle, * optimisation des traitements Spark,

gestion du partitionnement,
réduction des coûts de shuffle,
optimisation des joins et windowing,
persistance/caching des DataFrames,
tuning mémoire et parallélisation,
optimisation des DAG Spark

Requirements

Expérience significative en architecture Big Data ou Data PlatformTrès bonne maîtrise de Spark en environnement de production critiqueExpérience sur plateformes Hadoop / ClouderaCapacité à intervenir à la fois sur :l'architecture,la performance,l'industrialisation,l'accompagnement des équipesExpérience dans des environnements Agile à grande échelle appréciée Nous recherchons un profil capable d'intervenir sur des problématiques avancées autour de Spark et des traitements distribués.Une expertise est attendue sur des sujets tels que :optimisation des traitements Spark,gestion du partitionnement,réduction des coûts de shuffle,optimisation des joins et windowing,persistance/caching des DataFrames,tuning mémoire et parallélisation,optimisation des DAG Spark,compréhension du moteur d'exécution Spark.Une bonne maîtrise des problématiques liées aux traitements massifs et aux architectures distribuées est indispensable. Les plusExpérience Kafka / architectures événementiellesParticipation à des comités d'architectureMaîtrise des problématiques d'observabilité et supervision DataConnaissance des outils de modélisation d'architecture (Archimate ou équivalent), * Expérience significative en architecture Big Data ou Data Platform

Très bonne maîtrise de Spark en environnement de production critique
Expérience sur plateformes Hadoop / Cloudera
Capacité à intervenir à la fois sur :

l'architecture,
la performance,
l'industrialisation,
l'accompagnement des équipes

Expérience dans des environnements Agile à grande échelle appréciée

Nous recherchons un profil capable d'intervenir sur des problématiques avancées autour de Spark et des traitements distribués.

Une expertise est attendue sur des sujets tels que, * compréhension du moteur d'exécution Spark.

Une bonne maîtrise des problématiques liées aux traitements massifs et aux architectures distribuées est indispensable.

Les plus

Expérience Kafka / architectures événementielles
Participation à des comités d'architecture
Maîtrise des problématiques d'observabilité et supervision Data
Connaissance des outils de modélisation d'architecture (Archimate ou équivalent)

Role details

Job location

Tech stack

Job description

Requirements

Apply for this position

Good distractions

Moments

Videos View all