Ingénieur DevOps F/H
Role details
Job location
Tech stack
Job description
Piloter, opérer et faire évoluer notre infrastructure, tout en accompagnant les équipes de développement vers une autonomie maximale sur la plateforme.
- Responsabilités
-
Exploitation et maintien en condition opérationnelle (MCO)
-
Superviser la disponibilité et les performances des clusters Docker Swarm et des services hébergés
-
Gérer les incidents et problèmes : diagnostic, résolution, post-mortem, actions correctives
-
Maintenir les stacks Swarm à jour (images Docker, dépendances, OS Flatcar)
-
Opérer les bases de données OVH managées (PostgreSQL, MySQL, MongoDB) : surveillance, optimisation des performances, gestion des accès
-
Administrer les sauvegardes multi-tier (S3, scripts PostgreSQL/MySQL/MongoDB) et tester les restaurations
-
Surveiller les métriques et alertes Grafana/VictoriaMetrics ; ajuster les seuils et dashboards
-
Gérer les certificats TLS (Let's Encrypt DNS-01, rotation, surveillance des expirations)
-
Opérer le réseau OVH (VRack, VLANs, load balancers, IPs flottantes)
- Évolution de l'infrastructure
-
Faire évoluer l'infrastructure Terraform (nouvelles ressources, refactoring, mise à jour des providers)
-
Déployer et intégrer de nouveaux services dans la plateforme (Traefik, WAF, monitoring, secrets)
-
Améliorer la résilience et la haute disponibilité des clusters
-
Optimiser les coûts OVH (rightsizing, analyse des ressources inutilisées)
-
Assurer la veille technologique et proposer des évolutions pertinentes (outillage, sécurité, observabilité)
-
Contribuer à la mise en place d'une CI/CD pour l'infrastructure elle-même (pipeline Terraform, tests de configuration)
- Accompagnement des équipes de développement
Objectif clé : donner aux développeurs un maximum d'autonomie sur la plateforme, sans les surcharger de complexité opérationnelle.
-
Définir et documenter les patterns de déploiement (docker-compose, labels Traefik, health checks, stratégies de mise à jour)
-
Créer et maintenir des templates de stacks Swarm réutilisables pour les nouvelles applications
-
Accompagner les équipes dans l'intégration de leurs applications à l'infrastructure (exposition Traefik, monitoring, logging, backups)
-
Former les développeurs aux pratiques DevOps : GitOps, observabilité, gestion des secrets, bonnes pratiques de conteneurisation
-
Définir des runbooks et procédures d'exploitation clairs pour que les équipes puissent intervenir de façon autonome sur les opérations courantes
-
Mettre en place des environnements de développement et de test proches de la production
- -Sécurité opérationnelle
-
Appliquer et maintenir la politique de sécurité sur l'infrastructure (réseau, accès, secrets)
-
Gérer les identités et accès (Docker secrets, Passbolt, clés SSH, comptes OVH)
-
Maintenir et affiner les règles WAF (CrowdSec, ModSecurity)
-
Suivre les CVE et appliquer les correctifs de sécurité (OS, images Docker, dépendances)
-
Participer aux audits de sécurité et implémenter les recommandations
-
Documenter les procédures de réponse aux incidents de sécurité
Requirements
- Compétences techniques requises ----------------------------------------------------------------------------
Infrastructure & Cloud
- Maîtrise de Terraform (IaC, gestion du state, modules, providers OpenStack/OVH)
- Expérience avec la conteneurisation en production
- Bonne connaissance des concepts réseau (VLANs, load balancing, BGP/VRRP, DNS)
- Pratique des environnements Linux (idéalement CoreOS/Flatcar) en production
Conteneurisation & Déploiement
- Maîtrise de Docker et Docker Compose / Swarm
- Expérience avec un reverse proxy (Traefik, Nginx ou équivalent)
- Compréhension des stratégies de déploiement (rolling update, blue/green, health checks)
Observabilité
- Expérience avec une stack de monitoring (Prometheus/VictoriaMetrics + Grafana ou équivalent)
- Expérience avec la centralisation de logs (Loki, ELK, VictoriaLogs ou équivalent)
Scripting & Automatisation
- Scripting Bash (niveau intermédiaire à avancé)
- Connaissance des outils CI/CD (GitLab CI, GitHub Actions ou équivalent)
Stockage & Bases de données
-
Notions d'administration de PostgreSQL, MySQL et/ou MongoDB
-
Compétences appréciées -----------------------------------------------------------------------------------------
Connaissance d'OVH Public Cloud (OpenStack, OVH API)
Expérience avec WAF/sécurité applicative (ModSecurity, CrowdSec, OWASP CRS)
Expérience avec des pratiques GitOps
Connaissance de Flatcar Linux / Ignition / Butane
- Savoir-être ---------------------------------------------------------------------------------------------------------------
Pédagogie et sens du service : capacité à rendre la plateforme accessible aux développeurs, à documenter clairement, à former
Autonomie et proactivité : capacité à identifier les problèmes avant qu'ils impactent la production, à proposer des améliorations
Rigueur : soin apporté à la documentation, aux procédures, à la reproductibilité des changements
Communication : à l'aise aussi bien avec des équipes techniques que pour rendre compte à la direction
Esprit d'équipe : goût du travail collaboratif avec les équipes de développement et du partage de connaissance