[PROPULSE BY CA] Data Engineer / Analyst orienté IA
Role details
Job location
Tech stack
Job description
Nous recherchons un Data Engineer / Analyst (fullstack) orienté IA avec au minimum 3 ans d'expérience dans un poste de Data Engineer ou fonction équivalente.
Contexte & Objectifs
Nous disposons aujourd'hui de nombreuses sources de données éparpillées (compte pro, business plan, analytics, marketing, etc.).
Ces données doivent être centralisées dans un datalake aujoud'hui basique hébergé sur AWS Redshift.
L'objectif est de :
-
Structurer et enrichir ce datalake en intégrant un maximum d'informations pertinentes,
-
Optimiser la base pour qu'elle soit facilement exploitable (tables, schémas, performances des requêtes),
-
Analyser les données pour faire émerger des tendances et insights utiles au business,
-
Préparer les datasets nécessaires à des cas d'usage IA et machine learning (détection de comportements, prédiction, scoring, etc.)
Nous recherchons un Data Engineer / Analyst (fullstack) orienté IA avec au minimum 3 ans d'expérience dans un poste de Data Engineer ou fonction équivalente pour accompagner cette transition. Rejoignez une équipe où l'innovation guide les choix techniques.
Vos missions
-
Administrer et optimiser la base de données Redshift (gestion des tables, indexes, performances).
-
Créer et améliorer la structure des tables pour répondre aux besoins des équipes internes.
-
Développer des pipelines d'ingestion de données (collecte multi-sources vers le datalake).
-
Préparer et mettre en forme les données pour des cas d'usage IA/ML.
-
Construire des dashboards, rapports et analyses pour mettre en évidence des tendances.
-
Collaborer avec les équipes Produit, Tech et Marketing pour transformer les données en leviers concrets.
Requirements
Stack Technique
-
AWS (Redshift, Step Functions, S3, Lambda, …)
-
SQL avancé, modélisation de données
-
Python (pandas, scikit-learn, PyTorch/TensorFlow si appétence ML)
-
Outils BI (Metabase, Tableau, PowerBI ou équivalents), * Excellente maîtrise de SQL et des bases de données analytiques (idéalement Redshift).
-
Expérience en modélisation et optimisation de schémas de données.
-
Bonne pratique de Python pour la data (pandas, ETL, APIs).
-
Connaissances en pipelines de données (ETL, orchestration).
-
Familiarité avec les concepts de machine learning (préparation des datasets, compréhension des modèles).
-
Une expérience cloud (AWS de préférence) est un plus.
Qualités recherchées
- Curiosité et en veille technologique permanente.
- Capacité à travailler en équipe et à communiquer efficacement.
- Autonomie et sens de l'initiative.
- Tendance à privilégier l'optimisation et le clean code.
Benefits & conditions
Type de contrat : CDI Localisation : Paris (Miromesnil) avec 4 jours de télétravail/semaine Salaire : entre 55 000 € et 65 000 € brut/an, selon profil et expérience.