APPRENTISSAGE - Data Scientist / ML Engineer (F/H) - Caisse Des Dépôts Et Consignations

La Cdc
Paris, France
yesterday

Role details

Contract type
Apprenticeship
Employment type
Full-time (> 32 hours)
Working hours
Regular working hours
Languages
French
Experience level
Junior

Job location

Remote
Paris, France

Tech stack

Artificial Intelligence
Data analysis
DevOps
Fraud Prevention and Detection
Human-Computer Interaction
Python
Machine Learning
Natural Language Processing
NumPy
TensorFlow
Software Engineering
Solution Deployment Descriptor
PyTorch
Deep Learning
Generative AI
GIT
Pandas
PySpark
Scikit Learn
Machine Learning Operations
Dataiku
Streamlit Framework
Code Restructuring

Job description

Avec ses filiales et ses partenaires stratégiques, la Caisse des Dépôts constitue le premier pôle financier public. Investisseur de long terme au service de l'intérêt général et du développement économique du pays, la Caisse des Dépôts se charge de plusieurs missions, dont la protection de l'épargne populaire, le financement et soutien du logement social, la gestion des mandats publics, l'accompagnement des Français dans leurs parcours de vie et la contribution au développement économique., La Direction de la Formation Professionnelle de la Caisse des Dépôts recherche un(e) alternant(e) Data Scientist / ML Engineer pour contribuer à la conception, au développement et au déploiement de solutions innovantes basées sur l'intelligence artificielle et le machine learning. Vous serez intégré(e) à une équipe pluridisciplinaire et participerez à des projets à fort impact, notamment dans les domaines de la détection de fraude, du graph mining, de la classification automatique et du NLP.

  1. Missions principales Développement et industrialisation de modèles de ML :
  • Mise en place de pipelines de machine learning de bout en bout : De la collecte de données à l'évaluation des modèles.
  • Veille technologique et animation de points techniques : Participation aux réunions d'équipe pour présenter les avancées, discuter des choix techniques et proposer des solutions optimisées.
  • Refactoring et packaging de code : Amélioration de la qualité, de la maintenabilité et de la performance du code développé (Python, PySpark).
  • Déploiement de modèles et MLOps : Mise en production de modèles de machine learning via Dataiku, en respectant les bonnes pratiques DevOps et MLops.

Développement d'interfaces utilisateur :

  • Création d'IHM pour visualiser les résultats des modèles et faciliter leur utilisation par les métiers, à l'aide d'outils comme Streamlit ou Dash.
  • Présentation aux experts métier et aux utilisateurs., * Exploration de nouvelles méthodes en apprentissage statistique (classification, clustering, deep learning) et en NLP pour répondre aux besoins métiers.
  • Contribution à l'amélioration continue des pipelines de données et des modèles existants.
  1. Cas d'usage Vous contribuerez à des projets variés, notamment :
  • Lutte contre la fraude : Détection d'anomalies et de comportements suspects via des modèles de classification et d'analyse de graphes simples et graphes attribués.
  • Automatisation de processus métiers : OCRisation et classification de documents pour l'aide à la décision.

Requirements

  • Git, versionning et packaging de code.
  • Langages de programmation : Maîtrise de Python (librairies : Pandas, NumPy, Scikit-learn, TensorFlow/PyTorch, etc.) et de PySpark.
  • Machine Learning : Expérience en apprentissage supervisé/non supervisé, deep learning, NLP, IA générative.
  • Outils et frameworks :
  • MLflow pour le suivi des expériences et le déploiement de modèles.
  • Dataiku pour l'industrialisation des pipelines ML.
  • Streamlit ou Dash pour le développement d'IHM.
  • Data Engineering : Connaissance des bonnes pratiques en nettoyage, transformation et analyse de données.

Compétences transverses :

  • Capacité à travailler en équipe.
  • Curiosité intellectuelle.
  • Sens de l'initiative.
  • Capacités de rédaction et de vulgarisation.

FORMATION ET PROFIL RECHERCHE

  • Formation : Étudiant en école d'ingénieur, master en data science, statistiques, informatique ou équivalent, avec une spécialisation en machine learning ou data engineering.
  • Niveau : Bac+4/5.
  • Expérience : Une première expérience (stage, projet personnel, etc.) en data science ou développement logiciel serait un plus.

AVANTAGES DE L'OFFRE

  • Intégration dans un environnement stimulant et innovant, au service de l'intérêt général.
  • Accès à de larges volumes de données et à des outils de pointe.

Benefits & conditions

  • Possibilité de télétravail partiel.

About the company

La CDC fonde le recrutement sur les compétences en excluant tout critère de discrimination. Tous nos postes sont ouverts aux personnes en situation de handicap.

Apply for this position