Architecte Système F/H
Role details
Job location
Tech stack
Job description
L'équipe Infrastructure Engineering au sein du département Infrastructure & Data Centers de 3DS Outscale est responsable du développement et de l'amélioration des solutions matérielles et réseau.
Vous travaillez en étroite collaboration avec les équipes d'infrastructure et d'exploitation du département pour concevoir de nouvelles solutions autour du calcul par le GPU:
- Vous gérez les applications GPU, de calcul et de réseau sur des plateformes convergentes x86/arm64, et vous soutenez les opérations de production
- Vous avez des connaissances en matière d'entraînement à l'IA à moyenne et grande échelle et vous comprenez les principales bibliothèques utilisées pour l'entraînement NLP/LLM/VLA (NeMo Framework, DeepSpeed, etc.).
- Vous êtes familier avec les serveurs multi-GPU (NVLink).
- Vous collaborez avec les équipes internes pour comprendre les besoins spécifiques d'Outscale.
- Vous optimisez l'environnement GPU et assurez la résilience de l'infrastructure.
- Vous travaillez avec les équipes d'ingénierie et de produits pour répondre aux besoins de production d'Outscale.
- Vous résolvez les problèmes complexes de GPU et de calcul à l'aide d'outils spécialisés.
Stack technique
- GPU, CUDA, ROCm,DGX, serveurs multi-GPU
- VMWare, KVM, Hyper-V
- AWS, Azure, GCP...
- Slurm, PBS
- C
- Python/Bash
- HPC
Requirements
- Diplômé·e d'un master en informatique, science des données, génie électrique ou équivalent, vous possédez au minimum 8 ans d'expérience professionnelle post-diplôme dans les fondamentaux des réseaux, la pile TCP/IP et l'architecture des centres de données.
- Vous bénéficiez d'une solide expérience dans la configuration, le test, la validation et la résolution de problèmes liés aux GPU (NVIDIA, AMD), y compris l'utilisation d'outils de validation pour surveiller les performances d'environnements AI/HPC de taille moyenne à grande.
- Vous êtes capable de résoudre des problèmes complexes et de collaborer dans des environnements dynamiques et en évolution rapide.
- Vous possédez une expertise en administration de système Linux/DevOps : gestion des processus, gestion des paquets, optimisation des performances, gestion des journaux et optimisation du réseau.
Benefits & conditions
Principaux avantages et bénéfices :
- Environnement multiculturel
- Cadre de travail convivial axé sur le bien-être et la santé
- Engagement en faveur de la diversité et de l'inclusion
- Politique dynamique de développement de carrière : plan de formation, mobilités internes, etc.
Inclusion statement
As a game-changer in sustainable technology and innovation, Dassault Systèmes is striving to build more inclusive and diverse teams across the globe. We believe that our people are our number one asset and we want all employees to feel empowered to bring their whole selves to work every day. It is our goal that our people feel a sense of pride and a passion for belonging. As a company leading change, it's our responsibility to foster opportunities for all people to participate in a harmonized Workforce of the Future.