Ops Engineer / Ingénieur SRE (H/F)
Role details
Job location
Tech stack
Job description
Notre client souhaite renforcer son équipe Accompagnement Résilience. L?objectif : maintenir un équilibre optimal entre performance, fiabilité et maîtrise budgétaire au sein de ses plateformes Cloud.
Nous recherchons un Ops Engineer / SRE confirmé (H/F), capable d?intervenir sur des environnements AWS complexes et orientés résilience.
MissionsPilotage et ingénierie de la résilience
Participer à la définition, au suivi et au pilotage des SLO / SLI / SLA
Réaliser des audits de résilience et présenter les recommandations
Contribuer aux analyses d?incidents et aux post-mortems
Industrialisation & automatisation
Industrialiser les processus de déploiement, exploitation et tests de résilience
Concevoir et maintenir des scripts d?automatisation (Bash, Python)
Administrer et optimiser les outils de résilience : Gatling, Gremlin, tableaux de bord SLO?
AWS & performance
Exploiter, optimiser et sécuriser les environnements AWS dans une démarche SRE
Challenger les équipes sur les choix techniques / architecturaux
Être force de proposition pour l?optimisation performance / coût
Livrables attendusLivrables techniques
Plateformes et outils de résilience opérationnels
Scripts d?automatisation / industrialisation
Tableaux de bord SLO, métriques & KPIs Cloud
Scénarios de tests de charge et de chaos engineering
Documentation
Documentation d?exploitation
Procédures de résilience
Guides d?usage des outils
Rapports d?audit & comptes-rendus d?incidents
Plans d?amélioration continue
Requirements
Do you have experience in UNIX?, Maîtrise avancée Linux / Unix
Expertise AWS, dont : EC2, ECS/EKS, Lambda, IAM, VPC, RDS, S3, CloudWatch
Architectures Cloud natives & distribuées
Haute disponibilité & résilience Cloud
Outils de test de charge : Gatling (ou équivalent)
Chaos Engineering : Gremlin (ou équivalent)
Observabilité & monitoring : Datadog, Prometheus, Grafana
Automatisation & CI/CD
IaC : Terraform, CloudFormation
Scripts Bash / Python
Git & gestion de configuration
Méthodologies
Approche SRE & DevOps
Définition / pilotage SLO, SLI, SLA
Pratique d?analyses d?incidents
Expérience en environnement agile