Ingénieur en intelligence artificielle / apprentissage automatique (H / F)

Inria
Canton of Le Chesnay-Rocquencourt, France
10 days ago

Role details

Contract type
Apprenticeship
Employment type
Full-time (> 32 hours)
Working hours
Regular working hours
Languages
English, French

Job location

Remote
Canton of Le Chesnay-Rocquencourt, France

Tech stack

Artificial Intelligence
Nvidia CUDA
Continuous Integration
Python
Open Source Technology
TensorFlow
PyTorch
GIT
HuggingFace
Machine Learning Operations
Software Version Control
Docker

Job description

Dans le cadre de NeuroKnowAI, un projet de start-up deep tech issu de la recherche. Ce projet fait actuellement partie du programme d'accélération Inria Startup Studio. NeuroknowAI est une plateforme de traitement intelligent de documents axée sur la confidentialité et dotée de connaissances spécialisées dans divers secteurs.

L'objectif est de développer et d'intégrer des modèles d'IA et des pipelines de traitement de documents plus spécifiquement dédiés au traitement intelligent de documents multi-secteurs (assurance, santé, juridique, finance, médias, RH, marketing, immobilier) avec une architecture axée sur la confidentialité.

Aucun déplacement régulier n'est prévu pour ce poste. Le travail s'effectue principalement sur site (quelques jours de télétravail sont possibles)., Avec l'aide de l'équipe technique de NeuroKnowAI, la personne recrutée concevra, développera et optimisera des modèles d'apprentissage automatique pour le traitement intelligent de documents, notamment des modèles Transformer, la reconnaissance d'entités nommées (NER) et des algorithmes de confidentialité différentielle.

Collaboration :

La personne recrutée sera en contact avec l'équipe de R&D qui développe les produits NeuroDoc, NeuroShield et NeuroGuard afin d'assurer l'intégration des modèles d'apprentissage automatique dans l'infrastructure de production.

Responsabilités :

La personne recrutée sera chargée de concevoir et de mettre en œuvre des modèles d'apprentissage automatique spécifiques à l'industrie et prendra des initiatives pour améliorer les performances, la précision et l'efficacité des pipelines de traitement des documents.

Pilotage / gestion :

La personne recrutée sera chargée de documenter les développements techniques et de contribuer aux décisions architecturales en matière d'apprentissage automatique., 1. Développer et former des modèles Transformer pour le traitement multimodal de documents (OCR, reconnaissance vocale, analyse de texte)

  1. Concevoir des modèles NER spécifiques à certains secteurs (santé, droit, finance, assurance, etc.)

  2. Mettre en œuvre des algorithmes de confidentialité différentielle pour NeuroShield

  3. Optimiser les pipelines ML pour un traitement haute performance (multi-GPU, calcul à précision mixte)

  4. Intégrer les modèles dans l'infrastructure de recherche sémantique

Activités complémentaires :

  1. Rédiger la documentation technique et les rapports de performance

  2. Tester, modifier et valider les modèles avant leur déploiement en production

  3. Présenter l'avancement des travaux aux partenaires et à l'équipe

Requirements

Compétences techniques et niveau requis :

  • Python : expert
  • PyTorch ou TensorFlow : avancé
  • Hugging Face Transformers : avancé
  • NLP et traitement de documents : avancé
  • OCR et traitement multimodal : intermédiaire à avancé
  • Optimisation GPU (CUDA, précision mixte) : intermédiaire
  • MLOps (Docker, CI / CD, déploiement de modèles) : intermédiaire
  • Git et contrôle de version : avancé

Langues :

  • Anglais : courant (documentation technique, communication au sein de l'équipe)

  • Français : apprécié mais pas obligatoire Compétences relationnelles :

  • Capacité à communiquer clairement des concepts techniques complexes

  • Esprit d'équipe et collaboration

  • Autonomie et initiative

  • Adaptabilité dans un environnement en évolution rapide Autres valeurs appréciées :

  • Expérience des techniques de confidentialité différentielle

  • Connaissance des réglementations en matière de protection des données (RGPD, HIPAA)

  • Expérience dans le traitement de documents spécifiques à un secteur (santé, juridique, finance)

  • Contributions open source ou publications scientifiques

Benefits & conditions

  • Restauration subventionnée
  • Transports publics remboursés partiellement
  • Congés : 7 semaines de congés annuels + 10 jours de RTT (base temps plein) + possibilité d'autorisations d'absence exceptionnelle (ex : enfants malades, déménagement)
  • Possibilité de télétravail et aménagement du temps de travail
  • Équipements professionnels à disposition (visioconférence, prêts de matériels informatiques, etc.)
  • Prestations sociales, culturelles et sportives (Association de gestion des œuvres sociales d'Inria)
  • Accès à la formation professionnelle
  • Sécurité sociale Rémunération Selon le profil

Apply for this position