Site Reliability Engineer - Network Observability
OVHCloud
Canton de Betton, France
23 days ago
Role details
Contract type
Permanent contract Employment type
Full-time (> 32 hours) Working hours
Regular working hours Languages
FrenchJob location
Remote
Canton de Betton, France
Tech stack
Systems Engineering
Cloud Computing
Continuous Integration
DevOps
Python
Ansible
Prometheus
Scripting (Bash/Python/Go/Ruby)
Grafana
Kubernetes
Puppet
Terraform
Docker
Go
Job description
Au sein de votre équipe #OneTeam
- Vous rejoindrez l'équipe Network Observability, en charge de la conception des produits d'observability pour une infrastructure composée de plus de 500 000 serveurs, 5 millions d'adresses IP publiques et 40 000 équipements réseau ; le maintien en condition opérationnel et l'amélioration continue de ces produits est central.
- En tant que Site Reliability Engineer chez Network Observability, votre rôle est de maintenir, améliorer et concevoir les solutions logicielles qui permettent de suivre et d'analyser les performances de l'infrastructure réseau OVHcloud. Vous serez moteur dans la modernisation des outils internes de monitoring et la création de nouveaux produits innovants répondant aux besoins des équipes réseau.
Vos principales responsabilités
- Moderniser les outils internes de supervision et de monitoring.
- Participer aux rotations d'astreintes.
- Assurer la haute disponibilité, la fiabilité et la sécurité de nos outils d'observabilité réseaux.
- Contribuer à la culture DevOps au sein de l'équipe et partager les bonnes pratiques.
- Gérer les projets LEAN (amélioration continue) pour améliorer la qualité de service et l'efficacité/résilience de l'infrastructure.
Votre futur impact Participé à l'amélioration de la qualité de service (QoS) des infrastructures réseau OVHcloud.
- Découvert et maitrisé les outils internes et les différentes stacks techniques utilisés dans le périmètre de l'équipe
- Participé à des améliorations concrètes sur la résilience et la haute disponibilité des produits
Dans 1 ans vous aurez :
- Une maitrise totale du périmètre Network Observability
- Contribué à définir la feuille de route de l'amélioration continue des années futures
- Amélioré concrètement la qualité de service et l'automatisation des produits
Requirements
- Vous avez une précédent expérience en administration ou ingénierie système.
- Vous maitrisez les outils comme : Kubernetes / Docker et la philosophie Cloud Native.
- Vous avez une expérience sur des sujets de CI/CD.
- Vous connaissez au moins un de ces outils de déploiements: Ansible, Terraform, Puppet, Chef...
- Vous maitrisez un ou plusieurs langages de scripting (Python, Golang...).
- Vous avez de solides connaissances des outils de supervision et d'observabilité (Prometheus / Grafana).
C'est un +
- Vous avez déjà occupé un rôle d'ingénieur réseaux.
- Appétence pour l'IA.
About the company
︎ Une politique de télétravail hybride
︎ Un plan d'actionnariat salarié
︎ Un programme de reconnaissance de l'ancienneté
︎ Des subventions vacances et sport
︎ Berceau et crèche d'entreprise (selon site)
Mais aussi :
︎ Des équipes multiculturelles
︎ Des locaux bien équipés
︎ Une plateforme de formation et de certification en ligne
︎ Une offre d'accompagnement médical et social digitalisée pour vous et votre famille
REJOINDRE L'AVENTURE OVHCLOUD
OVHcloud valorise la diversité des personnes qu'elle embauche et accompagne.
La diversité pour nous, c'est favoriser un milieu de travail où les différences individuelles sont reconnues, appréciées et respectées de façon à développer le plein potentiel et les forces de chacune et chacun.
Soyez libre d'être vous-même !
L'IA DANS L'ADN
L'intelligence artificielle réinvente nos métiers au quotidien.
Rejoignez-nous pour explorer ses immenses possibilités et coconstruire l'avenir !
LE DÉVELOPPEMENT DURABLE CHEZ OVHCLOUD, UN ENGAGEMENT PROFOND
Vous voulez contribuer à des projets uniques pour construire ensemble le cloud libre ? Allons-y ! Chez OVHcloud, nous sommes animés par la même volonté, celle de construire l'avenir ensemble pour défendre la liberté d'innover.
Découvrez l'acteur majeur du cloud libre et responsable
Site Reliability Engineer - Network Observability H/F/N