Site Reliability Engineer VMware - F/H
Role details
Job location
Tech stack
Job description
Au sein de votre équipe #OneTeam
- Vous rejoindrez l'équipe SRE en charge des solutions VMware au sein d'OVHcloud.
- Vous intégrerez plus précisément la squad qui répond aux activités journalières d'incidentologie sur les produits VMware (Managed VMware vSphere, Public VCFaaS, Private VCFaaS) et backup (Veeam) existants et à venir.
- Au sein d'OVHcloud, nous adoptons une approche de développement augmentée par l'IA, où l'IA générative est intégrée aux pratiques quotidiennes : conception, développement, tests, revue de code et documentation.
Vos principales responsabilités Gérer les incidents complexes du périmètre et assurer un support client de niveau 3. Analyser les causes racines des incidents pour proposer des résolutions durables. Développer des correctifs de code (Go/Perl) pour réduire la récurrence des incidents et améliorer les produits existants. Participer activement à la rotation d'astreinte pour garantir une qualité de service 24/7/365. Contribuer aux projets de migration et de mise à jour des infrastructures. Appliquer des pratiques de Prompt Engineering pour automatiser et optimiser les tâches opérationnelles. Collaborer au sein d'une équipe Agile pour fluidifier les processus d'intégration et de déploiement (CI/CD). Proposer des améliorations continues basées sur les méthodologies SRE. Votre futur impact Dans 6 mois
- Vous aurez pris en main le périmètre technique et les rituels d'équipe, et vous serez opérationnel sur la gestion des incidents de niveau 3.
- Vous aurez commencé à contribuer au développement de correctifs sur nos produits VMware et Veeam, tout en intégrant des solutions basées sur le Prompt Engineering pour assister vos missions quotidiennes.
Et dans 1 an
- Vous serez autonome sur la résolution de problématiques complexes et aurez joué un rôle moteur dans l'optimisation des services managés.
- Vous aurez une compréhension fine de l'écosystème VCF, capable d'anticiper les besoins d'évolution et de proposer des solutions techniques robustes pour améliorer durablement la stabilité de nos plateformes.
- Contribué à la montée en maturité des pratiques de développement augmenté par l'IA (prompt engineering et intégration d'agents IA) au sein de l'équipe, notamment par la mise en place de chaînes agentiques opérationnelles., Vous connaissez les technologies de backup Veeam. * Contributions à des projets open source liés à l'IA générative ou aux agents. NOTRE PARCOURS DE RECRUTEMENT
- Échange avec notre Talent Acquisition Specialist: Lucie
- Entretien avec le Manager: Thomas
- Cas pratique (si pertinent)
- Rencontre avec un pair, un membre de l'équipe ou de la direction
- Débriefing ensemble NOS AVANTAGES ET BÉNÉFICES ︎ Une politique de télétravail hybride ︎ Un plan d'actionnariat salarié ︎ Un programme de reconnaissance de l'ancienneté ︎ Des subventions vacances et sport ︎ Berceau et crèche d'entreprise (selon site) Mais aussi : ︎ Des équipes multiculturelles ︎ Des locaux bien équipés, Vous voulez contribuer à des projets uniques pour construire ensemble le cloud libre ? Allons-y ! Chez OVHcloud, nous sommes animés par la même volonté, celle de construire l'avenir ensemble pour défendre la liberté d'innover. VOTRE MISSION Site Reliability Engineer VMware - F/H/N Au sein de votre équipe #OneTeam
- Vous rejoindrez l'équipe SRE en charge des solutions VMware au sein d'OVHcloud.
- Vous intégrerez plus précisément la squad qui répond aux activités journalières d'incidentologie sur les produits VMware (Managed VMware vSphere, Public VCFaaS, Private VCFaaS) et backup (Veeam) existants et à venir.
- Au sein d'OVHcloud, nous adoptons une approche de développement augmentée par l'IA, où l'IA générative est intégrée aux pratiques quotidiennes : conception, développement, tests, revue de code et documentation.
Vos principales responsabilités Gérer les incidents complexes du périmètre et assurer un support client de niveau 3. Analyser les causes racines des incidents pour proposer des résolutions durables. Développer des correctifs de code (Go/Perl) pour réduire la récurrence des incidents et améliorer les produits existants. Participer activement à la rotation d'astreinte pour garantir une qualité de service 24/7/365. Contribuer aux projets de migration et de mise à jour des infrastructures. Appliquer des pratiques de Prompt Engineering pour automatiser et optimiser les tâches opérationnelles. Collaborer au sein d'une équipe Agile pour fluidifier les processus d'intégration et de déploiement (CI/CD). Proposer des améliorations continues basées sur les méthodologies SRE. Votre futur impact Dans 6 mois
- Vous aurez pris en main le périmètre technique et les rituels d'équipe, et vous serez opérationnel sur la gestion des incidents de niveau 3.
- Vous aurez commencé à contribuer au développement de correctifs sur nos produits VMware et Veeam, tout en intégrant des solutions basées sur le Prompt Engineering pour assister vos missions quotidiennes.
Et dans 1 an
- Vous serez autonome sur la résolution de problématiques complexes et aurez joué un rôle moteur dans l'optimisation des services managés.
- Vous aurez une compréhension fine de l'écosystème VCF, capable d'anticiper les besoins d'évolution et de proposer des solutions techniques robustes pour améliorer durablement la stabilité de nos plateformes.
- Contribué à la montée en maturité des pratiques de développement augmenté par l'IA (prompt engineering et intégration d'agents IA) au sein de l'équipe, notamment par la mise en place de chaînes agentiques opérationnelles.
Requirements
Vous maîtrisez les méthodologies SRE et les outils CI/CD. Vous possédez une compréhension solide des langages Go et Perl. Vous êtes à l'aise dans un environnement rythmé par l'incidentologie. Vous savez travailler efficacement en équipe et selon les méthodes Agiles. * Vous maitrisez le prompt engineering et avez une compréhension des principes des chaînes agentiques / des workflows autonomes (orchestration d'agents, gestion d'outils/fonctions, boucles de rétroaction). Vous avez un bon niveau d'anglais, écrit comme oral. C'est un + Vous avez une expérience significative sur les produits VMware (suite VCF) ou des technologies de virtualisation équivalentes., Vous maîtrisez les méthodologies SRE et les outils CI/CD. Vous possédez une compréhension solide des langages Go et Perl. Vous êtes à l'aise dans un environnement rythmé par l'incidentologie. Vous savez travailler efficacement en équipe et selon les méthodes Agiles. * Vous maitrisez le prompt engineering et avez une compréhension des principes des chaînes agentiques / des workflows autonomes (orchestration d'agents, gestion d'outils/fonctions, boucles de rétroaction). Vous avez un bon niveau d'anglais, écrit comme oral. C'est un + Vous avez une expérience significative sur les produits VMware (suite VCF) ou des technologies de virtualisation équivalentes. Vous connaissez les technologies de backup Veeam. * Contributions à des projets open source liés à l'IA générative ou aux agents.