AI DevOps / Infrastructure / Optimisation
Infomaniak
Geneva, Switzerland
3 days ago
Role details
Contract type
Permanent contract Employment type
Full-time (> 32 hours) Working hours
Regular working hours Languages
FrenchJob location
Remote
Geneva, Switzerland
Tech stack
Artificial Intelligence
Nvidia CUDA
Continuous Integration
DevOps
Open Source Technology
Prometheus
Large Language Models
Grafana
Gitlab
FastAPI
Gitlab-ci
Kubernetes
Job description
- Déploiement & Orchestration : Déployer, maintenir et optimiser des LLM sur Kubernetes en maximisant l'efficacité des ressources GPU / Compute.
- CI/CD & Automatisation Améliorer et industrialiser nos pipelines Gitlab CI pour les modèles IA (build, test, déploiement, rollback). Piloter les déploiements via Flux CD (GitOps).
- Monitoring & Observabilité : Renforcer notre stack Prometheus / Grafana / Victoria Metrics pour une visibilité fine sur les performances, la consommation GPU, la latence, la disponibilité et de manière générale la santé des services IA.
- Optimisation des ressources : Travailler sur l'efficacité des coûts et des performances (autoscaling, scheduling, gestion des quotas, optimisation des images...)
- Qualité & Fiabilité : Garantir la robustesse, la sécurité et la reproductibilité des déploiements dans un environnement critique, Les étapes du processus de recrutement :
- Un premier entretien technique pour valider tes compétences.
- Un second entretien dans nos bureaux, Salle de pause et terrasse
Viennoiseries
Billets de concerts et de festivals
Requirements
- Maîtrise des frameworks modernes de serving (ex : vLLM, TGI, TensorRT-LLM...)
- Maîtrise de GitLab CI (pipelines, runners, variables, intégration avec Kubernetes).
- Expérience confirmée en Kubernetes (operators, Helm, CRDs, networking, autoscaling).
- Expérience avec Flux CD (GitOps, HelmReleases, Kustomize, automatisation des déploiements).
- Expérience avec Prometheus / Grafana (dashboards, alerting, exporters).
- Connaissance des infrastructures GPU (NVIDIA, CUDA, GPU scheduling, monitoring).
- Appétence pour la qualité, la fiabilité et la performance.
- Capacité à travailler en environnement critique (SLA élevé, haute disponibilité).
- Bonne capacité à collaborer avec des équipes ML et Dev.
Un si tu as des connaissances en :
- Curiosité technique, goût pour les challenges innovants et l'optimisatio n.
- Les contributions open source ou les side projects sont appréciés
- Tu aimes travailler en équipe, et fais preuve d'une communication positive
- Ton humour, ta flexibilité et ton esprit d'équipe sont des atouts indispensables pour travailler dans le fun
La stack technique que l'on utilise
- LangChain
- Pydantic-ai
- vLLM
- FastAPI
- Gitlab
Benefits & conditions
Allocation formation CHF 1'500.- par an
Assurance LAAC et salaire maintenu
LPP Déplafonnée et risque selon salaire assuré
Boissons offertes
Frigo FELFEL
Fruits bio
About the company
Infomaniak, c'est 30 ans de savoir-faire et plus de 290 passionné·e·s, avec une ambition commune : créer un cloud éthique sans compromis sur l'écologie, la vie privée et l'humain.
Nous créons des data centers qui sont à la pointe de l'innovation écologique et nous développons des services IaaS, PaaS et SaaS entièrement hébergés et développés en Suisse pour le B2B et le B2C. Nos solutions comprennent une suite d'applications collaboratives en ligne et des solutions d'hébergement cloud, de streaming, de marketing et d'événementiel.
Avec des millions d'utilisateurs et la confiance d'organisations publiques et privées dans toute l'Europe - telles que la RTBF, les Nations Unies, des banques centrales, plus de 3'000 radios et TV, et de nombreuses métropoles et organismes de sécurité - Infomaniak est une entreprise indépendante, engagée pour l'indépendance technologique en Europe, l'économie locale et un numérique plus soutenable pour la planète.
Es-tu prêt.e à rejoindre une entreprise en pleine croissance, à donner le meilleur de toi-même et à grandir avec nous afin de contribuer au développement d'une alternative éthique aux géants du Web ? Alors, nous avons hâte de te rencontrer !, Infomaniak développe une plateforme IA open source hébergée sur ses propres datacenters suisses. Nous déployons des modèles de langage à grande échelle et construisons des agents intelligents pour nos produits (kChat, kMeet, kDrive). Nous recherchons un·e AI Engineer pour concevoir, implémenter et optimiser nos agents IA, avec un focus sur la qualité, la fiabilité et l'expérience utilisateur.