APPRENTISSAGE - Data Scientist / ML Engineer (F/H) - Caisse Des Dépôts Et Consignations

La Cdc

Paris, France

yesterday

Role details

Contract type

Apprenticeship

Employment type

Full-time (> 32 hours)

Working hours

Regular working hours

Languages

French

Experience level

Junior

Job location

Remote

Paris, France

Tech stack

Artificial Intelligence

Data analysis

DevOps

Fraud Prevention and Detection

Human-Computer Interaction

Python

Machine Learning

Natural Language Processing

NumPy

TensorFlow

Software Engineering

Solution Deployment Descriptor

PyTorch

Deep Learning

Generative AI

GIT

Pandas

PySpark

Scikit Learn

Machine Learning Operations

Dataiku

Streamlit Framework

Code Restructuring

Job description

Avec ses filiales et ses partenaires stratégiques, la Caisse des Dépôts constitue le premier pôle financier public. Investisseur de long terme au service de l'intérêt général et du développement économique du pays, la Caisse des Dépôts se charge de plusieurs missions, dont la protection de l'épargne populaire, le financement et soutien du logement social, la gestion des mandats publics, l'accompagnement des Français dans leurs parcours de vie et la contribution au développement économique., La Direction de la Formation Professionnelle de la Caisse des Dépôts recherche un(e) alternant(e) Data Scientist / ML Engineer pour contribuer à la conception, au développement et au déploiement de solutions innovantes basées sur l'intelligence artificielle et le machine learning. Vous serez intégré(e) à une équipe pluridisciplinaire et participerez à des projets à fort impact, notamment dans les domaines de la détection de fraude, du graph mining, de la classification automatique et du NLP.

Missions principales Développement et industrialisation de modèles de ML :

Mise en place de pipelines de machine learning de bout en bout : De la collecte de données à l'évaluation des modèles.
Veille technologique et animation de points techniques : Participation aux réunions d'équipe pour présenter les avancées, discuter des choix techniques et proposer des solutions optimisées.
Refactoring et packaging de code : Amélioration de la qualité, de la maintenabilité et de la performance du code développé (Python, PySpark).
Déploiement de modèles et MLOps : Mise en production de modèles de machine learning via Dataiku, en respectant les bonnes pratiques DevOps et MLops.

Développement d'interfaces utilisateur :

Création d'IHM pour visualiser les résultats des modèles et faciliter leur utilisation par les métiers, à l'aide d'outils comme Streamlit ou Dash.
Présentation aux experts métier et aux utilisateurs., * Exploration de nouvelles méthodes en apprentissage statistique (classification, clustering, deep learning) et en NLP pour répondre aux besoins métiers.
Contribution à l'amélioration continue des pipelines de données et des modèles existants.

Cas d'usage Vous contribuerez à des projets variés, notamment :

Lutte contre la fraude : Détection d'anomalies et de comportements suspects via des modèles de classification et d'analyse de graphes simples et graphes attribués.
Automatisation de processus métiers : OCRisation et classification de documents pour l'aide à la décision.

Requirements

Git, versionning et packaging de code.
Langages de programmation : Maîtrise de Python (librairies : Pandas, NumPy, Scikit-learn, TensorFlow/PyTorch, etc.) et de PySpark.
Machine Learning : Expérience en apprentissage supervisé/non supervisé, deep learning, NLP, IA générative.
Outils et frameworks :

MLflow pour le suivi des expériences et le déploiement de modèles.
Dataiku pour l'industrialisation des pipelines ML.
Streamlit ou Dash pour le développement d'IHM.

Data Engineering : Connaissance des bonnes pratiques en nettoyage, transformation et analyse de données.

Compétences transverses :

Capacité à travailler en équipe.
Curiosité intellectuelle.
Sens de l'initiative.
Capacités de rédaction et de vulgarisation.

FORMATION ET PROFIL RECHERCHE

Formation : Étudiant en école d'ingénieur, master en data science, statistiques, informatique ou équivalent, avec une spécialisation en machine learning ou data engineering.
Niveau : Bac+4/5.
Expérience : Une première expérience (stage, projet personnel, etc.) en data science ou développement logiciel serait un plus.

AVANTAGES DE L'OFFRE

Intégration dans un environnement stimulant et innovant, au service de l'intérêt général.
Accès à de larges volumes de données et à des outils de pointe.

Benefits & conditions

Possibilité de télétravail partiel.

About the company

La CDC fonde le recrutement sur les compétences en excluant tout critère de discrimination. Tous nos postes sont ouverts aux personnes en situation de handicap.

Role details

Job location

Tech stack

Job description

Requirements

Benefits & conditions

About the company

Apply for this position

Good distractions

Moments

Videos View all