Data Scientist NLP F/H

Aday
Paris, France
3 days ago

Role details

Contract type
Permanent contract
Employment type
Full-time (> 32 hours)
Working hours
Regular working hours
Languages
French
Experience level
Intermediate
Compensation
€ 60K

Job location

Remote
Paris, France

Tech stack

API
Linux
Python
Natural Language Processing
Open Source Technology
Management of Software Versions
PyTorch
Large Language Models
GIT
Containerization
Scikit Learn
Information Technology
HuggingFace
Machine Learning Operations

Job description

  • Recherche & expérimentation : Explorer des approches, implémenter et évaluer des architectures NLP (modèles état de l'art, transformers, LLMs, etc) pour répondre à des besoins produits concrets. Structuration des bonnes pratiques R&D : Participer à la définition des standards d'expérimentation, de curation des données, de documentation technique et de gouvernance des modèles.

  • Optimisation & Frugalité : Concevoir des systèmes adaptés aux contraintes de déploiement on-premise : sélection de modèles proposant un équilibre performance/ressource optimisé, quantisation, distillation, etc

  • Évaluation & Benchmarking : Mettre en place des pipelines d'évaluation rigoureux pour quantifier la robustesse, le coût d'inférence et l'impact métier.

  • Transfert Recherche vers Production (MLOPS) : Collaborer avec les Data Engineers pour industrialiser les prototypes (conteneurisation, APIs, versioning, reproductibilité).

  • Visibilité & Partage : Restituer vos travaux aux équipes technique et produit, rédiger des notes de recherche, et contribuer à notre rayonnement externe (publications scientifiques, participation à des conférences).

Requirements

En plus d'une équipe dynamique et d'un cadre de travail sympa, vous bénéficierez, Pour réussir dans ce rôle, vous devez posséder idéalement :

  • Master ou Doctorat en Informatique, NLP, Mathématiques Appliquées ou domaine connexe,

  • Auteur-Autrice sur des publications, articles techniques de référence, ou contributions open-source structurées,

  • Première expérience de minimum 2 ans dans un poste similaire, ou une thèse CIFRE, avec une exposition aux contraintes du déploiement on-premise.

  • Stack Technique :

  • Expertise Python et lib NLP (PyTorch, Hugging Face, scikit-learn, vLLM/Ollama)
  • Solides fondamentaux en NLP et maîtrise des architectures transformers et approches impliquant les LLMs
  • À l'aise avec Linux, Git et les bonnes pratiques de reproductibilité
  • Soft Skills :
  • Bon relationnel : Vous aimez travailler en équipe et savez collaborer avec des profils techniques et métier.
  • Rigueur : Vous documentez vos expérimentations, assurez la reproductibilité de vos travaux et maintenez une exigence scientifique dans vos livrables.
  • Curiosité intellectuelle : Vous suivez l'état de l'art en NLP/IA et aimez explorer de nouvelles approches pour résoudre des problèmes concrets.
  • Autonomie : Vous savez avancer sur des sujets ouverts, prioriser vos travaux et rendre compte de vos résultats.

Benefits & conditions

  • Un salaire attractif selon profil,
  • D'une carte Swile (11 € / jour - dont 60% pris en charge)
  • 10 RTT / an
  • Accord de participation et d'intéressement,
  • Un environnement de travail flexible (2 à 3 jours de télétravail par semaine).

Aday s'engage à respecter l'égalité des chances. Cette offre est ouverte à tous les candidats, sans distinction d'origine, de sexe, d'âge, de handicap ou autre caractéristique protégée par la loi.

About the company

Etre Data Scientist chez Aday, c'est partager les connaissances et contribuer à la stratégie data et NLP/IA de l'entreprise en concevant et développant les approches, modèles et traitements nécessaires à sa réalisation en s'appuyant sur une démarche scientifique. C'est également rejoindre une équipe Innovations en pleine croissance composée de 5 personnes (data scientists et data ingénieurs)

Apply for this position