APPRENTISSAGE - Data Scientist / ML Engineer (F/H) - Caisse Des Dépôts Et Consignations
Role details
Job location
Tech stack
Job description
Avec ses filiales et ses partenaires stratégiques, la Caisse des Dépôts constitue le premier pôle financier public. Investisseur de long terme au service de l'intérêt général et du développement économique du pays, la Caisse des Dépôts se charge de plusieurs missions, dont la protection de l'épargne populaire, le financement et soutien du logement social, la gestion des mandats publics, l'accompagnement des Français dans leurs parcours de vie et la contribution au développement économique., La Direction de la Formation Professionnelle de la Caisse des Dépôts recherche un(e) alternant(e) Data Scientist / ML Engineer pour contribuer à la conception, au développement et au déploiement de solutions innovantes basées sur l'intelligence artificielle et le machine learning. Vous serez intégré(e) à une équipe pluridisciplinaire et participerez à des projets à fort impact, notamment dans les domaines de la détection de fraude, du graph mining, de la classification automatique et du NLP.
- Missions principales Développement et industrialisation de modèles de ML :
- Mise en place de pipelines de machine learning de bout en bout : De la collecte de données à l'évaluation des modèles.
- Veille technologique et animation de points techniques : Participation aux réunions d'équipe pour présenter les avancées, discuter des choix techniques et proposer des solutions optimisées.
- Refactoring et packaging de code : Amélioration de la qualité, de la maintenabilité et de la performance du code développé (Python, PySpark).
- Déploiement de modèles et MLOps : Mise en production de modèles de machine learning via Dataiku, en respectant les bonnes pratiques DevOps et MLops.
Développement d'interfaces utilisateur :
- Création d'IHM pour visualiser les résultats des modèles et faciliter leur utilisation par les métiers, à l'aide d'outils comme Streamlit ou Dash.
- Présentation aux experts métier et aux utilisateurs., * Exploration de nouvelles méthodes en apprentissage statistique (classification, clustering, deep learning) et en NLP pour répondre aux besoins métiers.
- Contribution à l'amélioration continue des pipelines de données et des modèles existants.
- Cas d'usage Vous contribuerez à des projets variés, notamment :
- Lutte contre la fraude : Détection d'anomalies et de comportements suspects via des modèles de classification et d'analyse de graphes simples et graphes attribués.
- Automatisation de processus métiers : OCRisation et classification de documents pour l'aide à la décision.
Requirements
- Git, versionning et packaging de code.
- Langages de programmation : Maîtrise de Python (librairies : Pandas, NumPy, Scikit-learn, TensorFlow/PyTorch, etc.) et de PySpark.
- Machine Learning : Expérience en apprentissage supervisé/non supervisé, deep learning, NLP, IA générative.
- Outils et frameworks :
- MLflow pour le suivi des expériences et le déploiement de modèles.
- Dataiku pour l'industrialisation des pipelines ML.
- Streamlit ou Dash pour le développement d'IHM.
- Data Engineering : Connaissance des bonnes pratiques en nettoyage, transformation et analyse de données.
Compétences transverses :
- Capacité à travailler en équipe.
- Curiosité intellectuelle.
- Sens de l'initiative.
- Capacités de rédaction et de vulgarisation.
FORMATION ET PROFIL RECHERCHE
- Formation : Étudiant en école d'ingénieur, master en data science, statistiques, informatique ou équivalent, avec une spécialisation en machine learning ou data engineering.
- Niveau : Bac+4/5.
- Expérience : Une première expérience (stage, projet personnel, etc.) en data science ou développement logiciel serait un plus.
AVANTAGES DE L'OFFRE
- Intégration dans un environnement stimulant et innovant, au service de l'intérêt général.
- Accès à de larges volumes de données et à des outils de pointe.
Benefits & conditions
- Possibilité de télétravail partiel.