Lead Data Scientist
Role details
Job location
Tech stack
Job description
Vous êtes passionné par l'intelligence artificielle et souhaitez contribuer à l'industrialisation de solutions IA à fort impact ?
Rejoignez CODRA en tant que Lead Data Scientist et participez à la conception, au déploiement et à la mise en production de systèmes d'IA et d'IA générative (LLM / RAG) à l'échelle de l'entreprise.
En collaboration étroite avec le Responsable du pôle Data & IA, vous jouerez un rôle clé dans la structuration et la montée en puissance de l'équipe Data & IA de CODRA., En tant que Lead Data Scientist, vous serez au cœur de la conception, du déploiement et de l'industrialisation de systèmes d'IA et d'IA générative à fort impact pour CODRA.
Conception & Développement
- Concevoir, entraîner et optimiser des modèles de machine learning (classification, régression, prévision, détection d'anomalies).
- Sélectionner les algorithmes et frameworks adaptés (XGBoost, Random Forest, CNN, LSTM…).
- Concevoir et mettre en production des architectures RAG / LLM robustes et scalables (FAISS, Weaviate, Pinecone, Chroma…).
- Intégrer et orchestrer les LLMs pour produire des réponses contextuelles et factuelles.
- Développer des mécanismes d'évaluation continue de la factualité et de la pertinence.
Préparation & Structuration des données
- Collecter, nettoyer et enrichir des jeux de données structurées ou semi-structurées.
- Construire des pipelines de data engineering robustes et reproductibles.
- Ingestion, vectorisation et indexation de corpus textuels internes ou externes.
- Définir les stratégies d'embedding et de mise à jour des bases de connaissances.
Évaluation, Industrialisation & Monitoring
- Évaluer les performances via des métriques quantitatives (AUC, RMSE, F1-score…).
- Industrialiser les modèles via des pipelines MLOps (MLflow, Airflow, Docker…).
- Mettre en place un suivi de la performance et du comportement des LLMs (LangSmith, Traceloop, W&B).
Diffusion de la culture IA
- Participer à la définition les bonnes pratiques en conception, expérimentation et documentation.
- Accompagner les équipes métiers dans la transformation des besoins en modèles exploitables.
- Contribuer à la diffusion d'une culture data-driven et IA responsable au sein de l'entreprise.
- Assurer une veille active sur les nouvelles approches et technologies IA générative émergentes.
Requirements
- Vous avez un Bac+5 à Bac+8 en informatique, mathématiques, data science ou IA.
- Vous possédez 5 à 8 ans d'expérience minimum en data science.
- Vous disposez d'une expérience avérée dans la mise en production de modèles LLM à fort impact.
- Vous savez faire preuve d'esprit d'innovation, de rigueur et de curiosité.
Compétences techniques :
- Python (Pandas, NumPy, Scikit-learn, PyTorch, TensorFlow).
- Compétences en statistiques et modélisation prédictive.
- Environnements cloud / MLOps (AWS, GCP, Azure, MLflow, Docker, Kubernetes).
- Connaissances des architectures RAG / LLM, des bases vectorielles et outils de versioning (Git, CI/CD)., * Une passion communicative : nos collaborateurs sont tous passionnés par l'informatique scientifique et technique ; ils sont curieux de découvrir et partager de nouvelles technologies.
- La qualité et la rigueur : nous apportons une attention toute particulière à la qualité de ce que nous livrons y compris au service RH. C'est une garantie pour nos collaborateurs d'être fiers de ce qu'ils produisent et le meilleur moyen de gagner leur confiance.
- Du collectif : pour créer du lien nous aimons partager des moments ensemble : run du midi, challenge sportif, soirée jeux et les fameux Codrapéro ! Notre CSE est aussi très actif et propose très régulièrement des activités : cinéma, escape game, activités sportives, il y en a pour tous les goûts !
- Un accompagnement : des équipes disponibles pour les nouveaux arrivants, c'est le point fort qui revient le plus dans nos rapports d'étonnement.
Benefits & conditions
- Intéressement et participation
- Restaurant d'entreprise
- RTT
- Travail à domicile occasionnel
Lieu du poste : En présentiel