Ingénieur déploiement d'applications IA (H/F)

CNRS
Canton de Palaiseau, France
12 days ago

Role details

Contract type
Temporary contract
Employment type
Full-time (> 32 hours)
Working hours
Regular working hours
Languages
French
Experience level
Junior
Compensation
€ 33K

Job location

Remote
Canton de Palaiseau, France

Tech stack

API
Unit Testing
Bash
Cloud Computing
Computer Security
Continuous Integration
Relational Databases
Linux
DevOps
Web Development
Distributed Systems
Python
Machine Learning
NoSQL
Cloud Services
Ansible
Software Engineering
Systems Architecture
Scripting (Bash/Python/Go/Ruby)
Autoscaling
Flask
Deep Learning
Idris
FastAPI
Gitlab-ci
Kubernetes
Information Technology
Slurm
Terraform
Marketplace
Docker
Jenkins

Job description

Assurer le déploiement, l'intégration et l'exploitation d'applications d'intelligence artificielle reposant sur des modèles pré-entraînés issus de l'écosystème CRD

  • Mise en place d'un Marketplace d'applications sur étagère type « Hugging Face ».
  • Garantir la robustesse, la sécurité, la reproductibilité et l'efficacité des environnements logiciels mis à disposition des équipes de recherche., Activité 1 : Conception et maintenance de l'infrastructure de déploiement
  • Concevoir, développer et maintenir l'architecture technique permettant le déploiement automatisé d'applications et de modèles d'IA sur une infrastructure cloud
  • Mettre en œuvre des solutions de conteneurisation (Docker, Singularity) et d'orchestration (Kubernetes) adaptées aux environnements de calcul scientifique
  • Mettre en place et maintenir les tests unitaires, fonctionnels et d'intégration pour garantir la qualité des applications
  • Garantir la haute disponibilité, la sécurité et la conformité RGPD des services déployés
  • Mettre en place et superviser les systèmes de monitoring, d'observation et de performance des services déployés

Activité 2 : Optimisation et performance des déploiements

  • Optimiser les pipelines d'inférence pour différentes architectures de modèles (transformers, diffusion, multimodaux)
  • Développer des solutions d'accélération matérielle et de parallélisation
  • Implémenter des stratégies d'auto-scaling et de gestion dynamique des ressources
  • Conduire des études de performance et établir des benchmarks de référence
  • Participer à l'évaluation et à l'adoption de nouvelles technologies de déploiement

Activité 3 : Support utilisateurs et formation

  • Accompagner la communauté des utilisateurs du CRD dans le déploiement de leurs modèles
  • Rédiger la documentation technique et les guides d'utilisation
  • Concevoir et animer des formations sur les bonnes pratiques de déploiement d'applications IA
  • Organiser des ateliers techniques et des journées thématiques
  • Assurer une veille technologique et scientifique sur les infrastructures Machine Learning et Deep Learning IA.

Activité spécifique

  • Collaborer avec les équipes de recherche du CRD et les partenaires académiques
  • Assurer une veille technologique continue autour des technologies utiles aux projets du service (développement, déploiement, data science)

Requirements

Savoirs / connaissances

  • Maîtriser les technologies de conteneurisation et d'orchestration (Docker, Kubernetes, gestion d'images, sécurité des conteneurs).
  • Connaissance approfondie des systèmes Linux et de l'administration système
  • Maîtrise des architectures cloud et des environnements de calcul haute performance
  • Développement Python avancé et scripting système (Bash, Python)
  • Maîtrise des outils DevOps et CI/CD (GitLab CI, Jenkins, Ansible)
  • Connaissance des bases de données relationnelles et NoSQL
  • Compétences en développement web (APIs REST, FastAPI, Flask)
  • Expérience avec les infrastructures HPC (Slurm,...)
  • Connaissance des frameworks d'applications ML
  • Maîtrise de Terraform ou outils d'infrastructure as code
  • Expérience en sécurité informatique et en conformité RGPD

Savoir-faire

  • Capacité à concevoir des architectures système complexes
  • Aptitude à rédiger une documentation technique de qualité
  • Capacité à transmettre des connaissances techniques (formation, tutorat)
  • Méthodologie de gestion de projet et de conduite de développements logiciels
  • Conception et mise en œuvre de systèmes distribués scalables
  • Optimisation de code et de systèmes pour la performance
  • Analyse de traces et profilage d'applications
  • Gestion d'incidents et résolution de problèmes complexes
  • Benchmark et évaluation comparative de solutions techniques

Savoir-être

  • Autonomie et capacité d'initiative dans la conduite des projets
  • Rigueur et sens de l'organisation
  • Aptitude au travail en équipe et à la collaboration interdisciplinaire
  • Qualités pédagogiques et de communication
  • Curiosité scientifique et technique
  • Sens du service public et engagement pour la science ouverte
  • Capacité d'adaptation face aux évolutions technologiques rapides

Contexte de travail

Ce poste s'intègre dans le projet national CRD (Cloud Recherche Données), dont l'objectif est de proposer un service cloud fédéré de la communauté Enseignement-Recherche, impliquant une migration progressive vers le cloud et une sécurisation renforcée des accès et des services. L'ingénieur(e) de recherche est rattaché(e) à la Direction Technique Informatique de l'IDRIS.

Le poste se situe dans un secteur relevant de la protection du potentiel scientifique et technique (PPST), et nécessite donc, conformément à la réglementation, que votre arrivée soit autorisée par l'autorité compétente du MESR.

Benefits & conditions

Poste à plein temps localisé à l'IDRIS (Orsay), travail en visioconférence plusieurs heures par jour, déplacements ponctuels sur les sites partenaires du CRD. Télétravail possible jusqu'à 2 jours par semaine.

Apply for this position