Lead Data Scientist

CODRA
Canton de Massy, France
19 days ago

Role details

Contract type
Permanent contract
Employment type
Full-time (> 32 hours)
Working hours
Regular working hours
Languages
French
Experience level
Senior
Compensation
€ 50K

Job location

Remote
Canton de Massy, France

Tech stack

Airflow
Amazon Web Services (AWS)
Azure
Cloud Computing
Continuous Integration
Python
Machine Learning
NumPy
TensorFlow
Scientific Computating
Management of Software Versions
Google Cloud Platform
PyTorch
Large Language Models
Random Forest
Generative AI
GIT
Pandas
Scikit Learn
Kubernetes
Information Technology
XGBoost
Machine Learning Operations
Recurrent Neural Networks
Docker

Job description

Vous êtes passionné par l'intelligence artificielle et souhaitez contribuer à l'industrialisation de solutions IA à fort impact ?

Rejoignez CODRA en tant que Lead Data Scientist et participez à la conception, au déploiement et à la mise en production de systèmes d'IA et d'IA générative (LLM / RAG) à l'échelle de l'entreprise.

En collaboration étroite avec le Responsable du pôle Data & IA, vous jouerez un rôle clé dans la structuration et la montée en puissance de l'équipe Data & IA de CODRA., En tant que Lead Data Scientist, vous serez au cœur de la conception, du déploiement et de l'industrialisation de systèmes d'IA et d'IA générative à fort impact pour CODRA.

Conception & Développement

  • Concevoir, entraîner et optimiser des modèles de machine learning (classification, régression, prévision, détection d'anomalies).
  • Sélectionner les algorithmes et frameworks adaptés (XGBoost, Random Forest, CNN, LSTM…).
  • Concevoir et mettre en production des architectures RAG / LLM robustes et scalables (FAISS, Weaviate, Pinecone, Chroma…).
  • Intégrer et orchestrer les LLMs pour produire des réponses contextuelles et factuelles.
  • Développer des mécanismes d'évaluation continue de la factualité et de la pertinence.

Préparation & Structuration des données

  • Collecter, nettoyer et enrichir des jeux de données structurées ou semi-structurées.
  • Construire des pipelines de data engineering robustes et reproductibles.
  • Ingestion, vectorisation et indexation de corpus textuels internes ou externes.
  • Définir les stratégies d'embedding et de mise à jour des bases de connaissances.

Évaluation, Industrialisation & Monitoring

  • Évaluer les performances via des métriques quantitatives (AUC, RMSE, F1-score…).
  • Industrialiser les modèles via des pipelines MLOps (MLflow, Airflow, Docker…).
  • Mettre en place un suivi de la performance et du comportement des LLMs (LangSmith, Traceloop, W&B).

Diffusion de la culture IA

  • Participer à la définition les bonnes pratiques en conception, expérimentation et documentation.
  • Accompagner les équipes métiers dans la transformation des besoins en modèles exploitables.
  • Contribuer à la diffusion d'une culture data-driven et IA responsable au sein de l'entreprise.
  • Assurer une veille active sur les nouvelles approches et technologies IA générative émergentes.

Requirements

  • Vous avez un Bac+5 à Bac+8 en informatique, mathématiques, data science ou IA.
  • Vous possédez 5 à 8 ans d'expérience minimum en data science.
  • Vous disposez d'une expérience avérée dans la mise en production de modèles LLM à fort impact.
  • Vous savez faire preuve d'esprit d'innovation, de rigueur et de curiosité.

Compétences techniques :

  • Python (Pandas, NumPy, Scikit-learn, PyTorch, TensorFlow).
  • Compétences en statistiques et modélisation prédictive.
  • Environnements cloud / MLOps (AWS, GCP, Azure, MLflow, Docker, Kubernetes).
  • Connaissances des architectures RAG / LLM, des bases vectorielles et outils de versioning (Git, CI/CD)., * Une passion communicative : nos collaborateurs sont tous passionnés par l'informatique scientifique et technique ; ils sont curieux de découvrir et partager de nouvelles technologies.
  • La qualité et la rigueur : nous apportons une attention toute particulière à la qualité de ce que nous livrons y compris au service RH. C'est une garantie pour nos collaborateurs d'être fiers de ce qu'ils produisent et le meilleur moyen de gagner leur confiance.
  • Du collectif : pour créer du lien nous aimons partager des moments ensemble : run du midi, challenge sportif, soirée jeux et les fameux Codrapéro ! Notre CSE est aussi très actif et propose très régulièrement des activités : cinéma, escape game, activités sportives, il y en a pour tous les goûts !
  • Un accompagnement : des équipes disponibles pour les nouveaux arrivants, c'est le point fort qui revient le plus dans nos rapports d'étonnement.

Benefits & conditions

  • Intéressement et participation
  • Restaurant d'entreprise
  • RTT
  • Travail à domicile occasionnel

Lieu du poste : En présentiel

Apply for this position