Data GovernanceData CoreData ScienceAnalytics PROCESSUS DE RECRUTEMENT
Role details
Job location
Tech stack
Job description
L'équipe Data Factory est responsable de la plateforme d'ingestion de données (Agate) permettant d'alimenter le Data Lake et le Data Warehouse de Veepee.
- Dans un contexte de transformation stratégique (migration vers une architecture basée sur Trino / Iceberg / S3 on-prem), l'équipe renforce la fiabilité, la qualité et l'industrialisation des pipelines d'ingestion.
- L'alternant(e) interviendra dans un environnement :
--> Kubernetes / VPCloud--> Python / Java / Beam / Dataflow--> BigQuery & nouvelle stack Trino / Iceberg--> CI/CD (GitLab, tests automatisés)--> Observabilité & monitoring MISSIONS
-
L'alternant contribuera à la fiabilisation et à l'industrialisation de la plateforme d'ingestion de données, afin de garantir une base solide pour l'ensemble des usages Data chez Veepee.
-
Activité 1 : Stabilisation de la stack d'ingestion
Ajout de tests unitaires sur les pipelines existantsAmélioration de la couverture de testsDétection des zones de fragilité
- Activité 2 : Amélioration continue de la plateforme Agate
Refactoring de composants techniquesParticipation à l'optimisation des performancesContribution à la gestion des erreurs et retry
- Activité 3 : Qualité & fiabilité des données
Mise en place de contrôles automatiquesContribution aux métriques de qualitéParticipation au monitoring technique
- Activité 4 : Documentation & industrialisation
Rédaction de README techniquesFormalisation des bonnes pratiquesAide à la standardisation des nouveaux pipelines
- Activité 5 : Participation aux projets stratégiques
Contribution au double run (BigQuery nouvelle stack)Support aux équipes Data Governance / Science / Analytics, Accès à une restauration d'entreprise et des frigos connectés
- Accès à la Salle de sport
EN SAVOIR PLUS SUR L'ÉQUIPE
- L'équipe Data Factory fait partie de la Data Platform.
- Elle travaille en étroite collaboration avec :
Data GovernanceData CoreData ScienceAnalytics PROCESSUS DE RECRUTEMENT
- 1 Entretien RH
- 2 Entretien technique (Data Factory)
- 3 Cas pratique léger (optionnel)
- 4 Entretien manager
Requirements
Bac +3 à Bac +5 en informatique / data / école d'ingénieur
- Compétences techniques
Bases solides en Python & JavaCompréhension des APIs et pipelines de donnéesNotions SQLIntérêt pour les architectures data modernes
- Langues
Anglais technique
- Compétences comportementales
RigueurCuriosité techniqueEnvie d'apprendreEsprit collaboratif LE PETIT PLUS
- Connaissance de Kubernetes
- Notions de CI/CD
- Expérience avec Airflow / Beam / Spark
- Sensibilité à la qualité logicielle
Benefits & conditions
Prime variable
- Participation & intéressement
- Télétravail possible jusqu'à 2 jours/semaine
- Plate-forme d'apprentissage des langues en ligne
- CSE et ses avantages
- Chèques CESU et chèques vacances