L'administrateur systèmes HPC est en charge de l'exploitation

L'unistra
Canton de Strasbourg-1, France
3 days ago

Role details

Contract type
Temporary contract
Employment type
Full-time (> 32 hours)
Working hours
Regular working hours
Languages
French

Job location

Canton de Strasbourg-1, France

Tech stack

Bash
Configuration Management
Nvidia CUDA
Software Debugging
Linux
DevOps
InfiniBand
Python
Lightweight Directory Access Protocols (LDAP)
OpenMP
Open Source Technology
Openshift
OpenStack
Package Management Systems
Remote Direct Memory Access
Red Hat Enterprise Linux - RHEL
Ansible
Prometheus
Grafana
GIT
Kubernetes
Slurm
Terraform
VMware

Job description

Relation hiérarchique

Placé sous l'autorité du responsable du pôle Calcul et Services Avancée à la Recherche

Relations fonctionnelles

· Avec les autres pôles du département Services Métiers et particulièrement les équipes IA

· Avec les autres pôles du département Infrastructures

· Avec les autres départements de la Direction du Numérique

· Avec les utilisateurs du centre de calcul (chercheurs, doctorants, étudiants de niveau M1/M2)

· Avec les équipes du projet ENACT, Face à l'essor des besoins de recherche en IA (inférence, entraînement, calcul GPU...), notamment liés au projet ENACT, la Direction du Numérique cherche à renforcer ses équipes. Elle recrute un administrateur systèmes HPC pour le pôle Calcul et Services Avancés à la Recherche, opérateur du centre de calcul de l'Unistra.

L'administrateur systèmes HPC est en charge de l'exploitation, de la supervision et de l'évolution d'un cluster de calcul. Il intervient sur l'ensemble de la pile technique : noeuds de calcul, stockage, services d'authentification, réseau et environnements logiciels.

Il est responsable de la disponibilité, de la fiabilité et des performances de l'infrastructure. À ce titre, il participe à son automatisation, à son maintien en conditions opérationnelles et à ses évolutions, en coordination étroite avec les équipes de la Direction du Numérique et la communauté d'utilisateurs., Dans ce cadre, il assure notamment les activités suivantes :

·Accompagner les utilisateurs dans leurs demandes liées aux besoins en IA ·Prendre en charge l'exploitation quotidienne de l'infrastructure HPC ·Déployer, administrer et exploiter l'ordonnanceur Slurm ·Maintenir en conditions opérationnelles les systèmes de stockage ·Assurer la supervision et le monitoring de l'infrastructure ·Administrer les services d'authentification ·Gérer les incidents, les mises à jour et les opérations de maintenance ·Automatiser les tâches d'exploitation dans une logique DevOps ·Participer à l'intégration de nouvelles briques matérielles (rackage) et logicielles ·Accompagner les utilisateurs sur les usages HPC et les environnements logiciels liés au calcul scientifique ·Rédiger et maintenir une documentation à jour

Activités complémentaires

L'administrateur HPC contribue aux réflexions sur l'évolution de la plateforme et assure une veille technologique sur les sujets suivants :

·Montée en charge des usages GPU notamment liés à l'IA ·Environnements conteneurisés pour le HPC typiquement pour des cas d'usage IA ·Articulation avec des orchestrateurs tels que Kubernetes ·Mécanismes avancés de scheduling et de partage des ressources (Slinky)

Ces évolutions visent à adapter la plateforme aux nouveaux besoins scientifiques., ·Administration avancée Linux/RHEL ·Exploitation de l'ordonnanceur Slurm ·Administration de clusters HPC (architecture, exploitation, stockage, réseau) ·Stockage distribué et parallèle (BeeGFS, CephFS) ·Outils de monitoring (Prometheus, Grafana) ·Gestion des identités (LDAP, FreeIPA) ·Scripting (Bash, Python) ·Automatisation et gestion de configuration (Ansible, Git, Terraform) ·Virtualisation (VMware, OpenStack) ·Notions en réseaux HPC (InfiniBand, OPA, RDMA) ·Sensibilité aux enjeux de sécurité, de fiabilité et de continuité de service

Requirements

Compétences principalesL'exercice de ce poste s'appuie sur les compétences techniques suivantes :·Administration avancée Linux/RHEL·Exploitation de l'ordonnanceur Slurm·Administration de clusters HPC (architecture, exploitation, stockage, réseau)·Stockage distribué et parallèle (BeeGFS, CephFS)·Outils de monitoring (Prometheus, Grafana)·Gestion des identités (LDAP, FreeIPA)·Scripting (Bash, Python)·Automatisation et gestion de configuration (Ansible, Git, Terraform)·Virtualisation (VMware, OpenStack)·Notions en réseaux HPC (InfiniBand, OPA, RDMA)·Sensibilité aux enjeux de sécurité, de fiabilité et de continuité de serviceCompétences complémentairesDes compétences complémentaires dans les domaines suivants seront appréciées :·Environnements scientifiques et parallélisation (MPI, OpenMP)·Écosystèmes GPU (CUDA, ROCm) et usages IA·Conteneurisation pour le HPC (Apptainer/Singularity, Slinky)·Gestion d'environnements logiciels scientifiques (Spack, Lmod, environment-modules)·Outils de debug, de benchmark et d'analyse de performance·Connaissance d'environnements orchestrés (Kubernetes, OpenShift)·Connaissance générale des outils open source en IAQualité attendues·Rigueur, autonomie et sens des responsabilités·Capacité d'analyse, de diagnostic et de résolution de problèmes·Esprit d'initiative, proactivité et force de proposition·Capacité à travailler en équipe et avec des communautés scientifiques·Qualités rédactionnelles

Bienvenue chez Université de Strasbourg

Nom du service : Direction du NumériqueNombre d'agents du service : 155Nombre d'agents à encadrer (éventuellement) : 0Lieu d'exercice : Université de Strasbourg - Campus Esplanade Relation hiérarchiquePlacé sous l'autorité du responsable du pôle Calcul et Services Avancée à la Recherche Relations fonctionnelles· Avec les autres pôles du département Services Métiers et particulièrement les équipes IA· Avec les autres pôles du département Infrastructures· Avec les autres départements de la Direction du Numérique· Avec les utilisateurs du centre de calcul (chercheurs, doctorants, étudiants de niveau M1/M2)· Avec les équipes du projet ENACT, Des compétences complémentaires dans les domaines suivants seront appréciées :

·Environnements scientifiques et parallélisation (MPI, OpenMP) ·Écosystèmes GPU (CUDA, ROCm) et usages IA ·Conteneurisation pour le HPC (Apptainer/Singularity, Slinky) ·Gestion d'environnements logiciels scientifiques (Spack, Lmod, environment-modules) ·Outils de debug, de benchmark et d'analyse de performance ·Connaissance d'environnements orchestrés (Kubernetes, OpenShift) ·Connaissance générale des outils open source en IA

Qualité attendues

·Rigueur, autonomie et sens des responsabilités ·Capacité d'analyse, de diagnostic et de résolution de problèmes ·Esprit d'initiative, proactivité et force de proposition ·Capacité à travailler en équipe et avec des communautés scientifiques ·Qualités rédactionnelles, Esprit d'analyse

Benefits & conditions

CDD de projet 1 an

Démarrage à compter du 01/06/2026

Catégorie : A Corps : Ingénieur d'études

Emploi ouvert aux agents contractuels uniquement

Rémunération selon grille de la Fonction Publique

About the company

L'Université de Strasbourg déploie actuellement son plan « Intelligence Artificielle » (IA), s'appuyant sur des infrastructures souveraines hébergées dans son datacenter.

Apply for this position