Site Reliability Engineer (SRE) - Network Products
Role details
Job location
Tech stack
Job description
garantir la fiabilité, la performance et la scalabilité de nos plateformes de stockage. Votre mission sera d'automatiser, de superviser et d'améliorer les systèmes et infrastructures de stockage distribués pour maximiser leur disponibilité et leur efficacité tout en réduisant la charge opérationnelle.
VOTRE FUTUR ÉQUIPE : Nous travaillons dans un environnement collaboratif et international où la diversité des Scalers, alliée à un esprit de partage, permet de donner vie à de nouveaux projets chaque jour et de faire progresser nos ambitions collectives. Vous rejoindrez une équipe de Site Reliability Engineers rattachée à un Lead SRE et intégrée à la SRE Guild, un collectif dédié à la promotion des meilleures pratiques au sein de l'ingénierie. L'équipe collabore quotidiennement avec les équipes Dev, Product et Ops pour renforcer la résilience, soutenir la scalabilité des services et garantir une expérience client fluide sur nos solutions réseau
VOTRE QUOTIDIEN :
-
Développer des outils et frameworks d'automatisation pour simplifier la gestion des infrastructures
-
Construire et maintenir des pipelines CI/CD en appliquant les bonnes pratiques d'Infrastructure as Code
-
Mettre en œuvre et affiner les systèmes de supervision et d'alerte (OpenMetrics, OpenTelemetry)
-
Garantir la fiabilité des systèmes grâce à la gestion des incidents et à l'analyse des causes profondes
-
Collaborer avec les développeurs et les équipes produit pour intégrer la résilience dès la conception des systèmes réseau
-
Participer aux revues d'architecture et apporter la perspective SRE dès les phases de design
-
Appliquer les principes de tolérance aux pannes, d'équilibrage de charge et d'optimisation énergétique
-
Partager vos connaissances au sein de l'équipe et de la communauté d'ingénierie via la SRE Guild
-
Contribuer à la fiabilité et à la performance des services
Requirements
HARDSKILLS
-
Solide expérience en Infrastructure as Code (IaC) et en pipelines CI/CD
-
Excellente maîtrise des systèmes Linux et du diagnostic en production
-
Compétence confirmée avec les outils de supervision / logging (OpenMetrics, OpenTelemetry)
-
Compétences en programmation Python, Go ou Rust
-
Bonne compréhension des systèmes réseau (un atout) : BGP, BGP EVPN, VXLAN
SOFTSKILLS
- Esprit collaboratif et approche orientée équipe
- Curieux, en apprentissage continu et animé par l'excellence opérationnelle
- Communicateur clair et efficace, à l'écrit comme à l'oral
- À l'aise pour travailler en anglais et en français, dans des équipes pluridisciplinaires