AI DevOps / Infrastructure / Optimisation

Infomaniak Network Sa
Geneva, Switzerland
yesterday

Role details

Contract type
Permanent contract
Employment type
Full-time (> 32 hours)
Working hours
Regular working hours
Languages
French

Job location

Remote
Geneva, Switzerland

Tech stack

Artificial Intelligence
Nvidia CUDA
Continuous Integration
DevOps
Open Source Technology
Prometheus
Large Language Models
Grafana
Gitlab
FastAPI
Gitlab-ci
Kubernetes

Job description

  • Déploiement & Orchestration : Déployer, maintenir et optimiser des LLM sur Kubernetes en maximisant l'efficacité des ressources GPU / Compute.
  • CI/CD & Automatisation Améliorer et industrialiser nos pipelines Gitlab CI pour les modèles IA (build, test, déploiement, rollback). Piloter les déploiements via Flux CD (GitOps).
  • Monitoring & Observabilité : Renforcer notre stack Prometheus / Grafana / Victoria Metrics pour une visibilité fine sur les performances, la consommation GPU, la latence, la disponibilité et de manière générale la santé des services IA.
  • Optimisation des ressources : Travailler sur l'efficacité des coûts et des performances (autoscaling, scheduling, gestion des quotas, optimisation des images...)
  • Qualité & Fiabilité : Garantir la robustesse, la sécurité et la reproductibilité des déploiements dans un environnement critique, Les étapes du processus de recrutement :
  • Un premier entretien technique pour valider tes compétences.
  • Un second entretien dans nos bureaux, Boissons offertes

Frigo FELFEL

Fruits bio

Salle de pause et terrasse

Viennoiseries

Billets de concerts et de festivals

Requirements

  • Maîtrise des frameworks modernes de serving (ex : vLLM, TGI, TensorRT-LLM...)
  • Maîtrise de GitLab CI (pipelines, runners, variables, intégration avec Kubernetes).
  • Expérience confirmée en Kubernetes (operators, Helm, CRDs, networking, autoscaling).
  • Expérience avec Flux CD (GitOps, HelmReleases, Kustomize, automatisation des déploiements).
  • Expérience avec Prometheus / Grafana (dashboards, alerting, exporters).
  • Connaissance des infrastructures GPU (NVIDIA, CUDA, GPU scheduling, monitoring).
  • Appétence pour la qualité, la fiabilité et la performance.
  • Capacité à travailler en environnement critique (SLA élevé, haute disponibilité).
  • Bonne capacité à collaborer avec des équipes ML et Dev.

Un si tu as des connaissances en :

  • Curiosité technique, goût pour les challenges innovants et l'optimisation.
  • Les contributions open source ou les side projects sont appréciés
  • Tu aimes travailler en équipe, et fais preuve d'une communication positive
  • Ton humour, ta flexibilité et ton esprit d'équipe sont des atouts indispensables pour travailler dans le fun

La stack technique que l'on utilise

  • LangChain
  • Pydantic-ai
  • vLLM
  • FastAPI
  • Gitlab

About the company

Fais de ta passion un travail qui a du sens Rejoindre Infomaniak, c'est intégrer un fleuron technologique où tu seras entouré·e des meilleurs talents pour créer des solutions cloud et de productivité éthiques et souveraines. Infomaniak, c'est l'entreprise derrière SwissTransfer et un partenaire de confiance pour des organisations de premier plan : des institutions internationales comme les Nations Unies, des médias tels que France Télévisions, des événements iconiques comme le Montreux Jazz Festival et le Festival d'Annecy, ainsi que des banques centrales, de grandes métropoles et des organismes de sécurité à travers l'Europe. Entreprise indépendante, certifiée B Corp et primée pour ses data centers qui repoussent les limites de l'efficacité et de la revalorisation énergétique, Infomaniak est la preuve vivante qu'il est possible de construire un numérique différent : souverain, durable et bénéfique pour l'économie locale. Ici, ta passion deviendra un travail qui a du sens : tu évolueras avec autonomie, tu porteras de vraies responsabilités et tu contribueras à des projets qui touchent des millions de personnes., Infomaniak développe une plateforme IA open source hébergée sur ses propres datacenters suisses. Nous déployons des modèles de langage à grande échelle et construisons des agents intelligents pour nos produits (kChat, kMeet, kDrive). Nous recherchons un·e AI Engineer pour concevoir, implémenter et optimiser nos agents IA, avec un focus sur la qualité, la fiabilité et l'expérience utilisateur., Pourquoi Infomaniak : * Fais partie d'une entreprise qui façonne un cloud éthique qui respecte la vie privée, l'humain et l'environnement. * Travaille chaque jour dans un cadre bienveillant, équilibré avec ta vie personnelle et extrêmement stimulant avec des personnes à la pointe de leur domaine qui sont engagées, à l'écoute et passionnées par ce qu'elles font. * Fais une véritable différence dans la vie de millions d'utilisateurs à travers le monde. Chez Infomaniak, nous sommes tous réunis par la sensation d'avoir de réelles responsabilités et de contribuer à quelque chose de plus grand. * Rencontre des personnes diversifiées dans un climat convivial lors de sorties d'entreprise très régulières (Afterwork, ski, sortie vélo, théâtre, etc.). * Évolue dans un climat très agréable et dans un cadre de travail original, où les salles de réunion sont décorées avec soin et qui favorisent l'inspiration ainsi que la collaboration. * Profite de nombreux autres avantages comme une prime annuelle incitant à la mobilité douce, une salle de fitness pour te maintenir en forme, la mise à disposition de vélos et trottinettes électriques, des espaces de détente conviviaux (salle de repos, jeux vidéos et d'arcade, flipper, babyfoot, etc.), une excellente couverture accident et perte de gain, et d'autres surprises encore. Chez Infomaniak, nous nous engageons en faveur de la diversité, de l'équité et de l'inclusion des collaborateurs·trices sur le lieu de travail. Nos offres d'emploi sont ouvertes à tous·tes et tous les dossiers de candidatures sont évalués sur un pied d'égalité, qu'importe le genre, l'origine, la religion, l'orientation sexuelle ou le handicap des candidat·e·s.

Apply for this position