Site Reliability Engineer H/F
OVHCloud
Canton of Roubaix-1, France
22 days ago
Role details
Contract type
Permanent contract Employment type
Full-time (> 32 hours) Working hours
Regular working hours Languages
FrenchJob location
Canton of Roubaix-1, France
Tech stack
Continuous Integration
Perl
Zabbix
Backend
VMware
Job description
Au sein de votre équipe #OneTeam
- Vous rejoindrez l'équipe SRE en charge des solutions VMware au sein d'OVHcloud.
- Vous intégrerez plus précisément la squad ISO, une squad transverse axée sur l'administration et les outils internes, à destination des autres squads de l'équipe.
Vos principales responsabilités
- Devenir le référent sur la partie monitoring pour assurer une visibilité maximale sur nos infrastructures.
- Gérer les alertes, les tickets et les incidents liés au périmètre de la squad (BAU).
- Apporter une vision opérationnelle à l'équipe d'ingénierie au quotidien.
- Améliorer et ajouter des outils ainsi que des fonctionnalités dans les ateliers internes.
- Améliorer ou créer des outils pour faciliter la gestion de la production,comme des outils de monitoring.
- Optimiser l'observabilité et affiner l'extraction des KPIs pour atteindre les standards d'excellence de l'équipe VMware.
- Contribuer à l'amélioration continue des pipelines CI/CD et des processus de mise en production.
- Participer à la définition et à la conception des projets.
Votre futur impact
Dans 6 mois
- Vous aurez pris en main les outils de monitoring existants et identifié les premiers axes d'amélioration pour l'observabilité.
- Vous contribuerez déjà au développement de nouvelles features dans les ateliers internes (VCD/PCC)
- Vous maîtriserez les bases de notre code base en Go.
Et dans 1 an
- Vous serez reconnu comme l'expert référent sur le monitoring et l'observabilité.
- Grâce à votre action, les KPIs extraits permettront un pilotage précis de l'activité, et vous aurez automatisé une part significative des opérations récurrentes.
Requirements
- Vous maîtrisez le langage de développement Go.
- Vous appliquez quotidiennement les méthodologies SRE pour garantir la stabilité des systèmes.
- Vous pratiquez les solutions de CI/CD et les méthodes de travail Agiles en équipe.
- Vous possédez une solide expérience dans l'utilisation et la configuration d'outils de monitoring, comme Zabbix.
- Vous avez une bonne connaissance des produits de l'écosystème VMware (VCD, PCC, VCF).
C'est un +
- Vous avez des connaissances en Perl (backend historique).