Ops Engineer / Ingénieur SRE (H/F)

Winside Technology
Canton de Lille-5, France
3 days ago

Role details

Contract type
Permanent contract
Employment type
Full-time (> 32 hours)
Working hours
Regular working hours
Languages
French

Job location

Canton de Lille-5, France

Tech stack

Amazon Web Services (AWS)
Amazon Web Services (AWS)
Amazon Web Services (AWS)
Bash
Unix
Cloud Computing
Configuration Management
Continuous Integration
Linux
DevOps
Identity and Access Management
Python
Load Testing
Prometheus
Datadog
Grafana
Gatling
Amazon Web Services (AWS)
GIT
Cloudformation
Amazon Web Services (AWS)
Functional Programming
Cloudwatch
Terraform

Job description

Notre client souhaite renforcer son équipe Accompagnement Résilience. L?objectif : maintenir un équilibre optimal entre performance, fiabilité et maîtrise budgétaire au sein de ses plateformes Cloud.

Nous recherchons un Ops Engineer / SRE confirmé (H/F), capable d?intervenir sur des environnements AWS complexes et orientés résilience.

MissionsPilotage et ingénierie de la résilience

Participer à la définition, au suivi et au pilotage des SLO / SLI / SLA

Réaliser des audits de résilience et présenter les recommandations

Contribuer aux analyses d?incidents et aux post-mortems

Industrialisation & automatisation

Industrialiser les processus de déploiement, exploitation et tests de résilience

Concevoir et maintenir des scripts d?automatisation (Bash, Python)

Administrer et optimiser les outils de résilience : Gatling, Gremlin, tableaux de bord SLO?

AWS & performance

Exploiter, optimiser et sécuriser les environnements AWS dans une démarche SRE

Challenger les équipes sur les choix techniques / architecturaux

Être force de proposition pour l?optimisation performance / coût

Livrables attendusLivrables techniques

Plateformes et outils de résilience opérationnels

Scripts d?automatisation / industrialisation

Tableaux de bord SLO, métriques & KPIs Cloud

Scénarios de tests de charge et de chaos engineering

Documentation

Documentation d?exploitation

Procédures de résilience

Guides d?usage des outils

Rapports d?audit & comptes-rendus d?incidents

Plans d?amélioration continue

Requirements

Do you have experience in UNIX?, Maîtrise avancée Linux / Unix

Expertise AWS, dont : EC2, ECS/EKS, Lambda, IAM, VPC, RDS, S3, CloudWatch

Architectures Cloud natives & distribuées

Haute disponibilité & résilience Cloud

Outils de test de charge : Gatling (ou équivalent)

Chaos Engineering : Gremlin (ou équivalent)

Observabilité & monitoring : Datadog, Prometheus, Grafana

Automatisation & CI/CD

IaC : Terraform, CloudFormation

Scripts Bash / Python

Git & gestion de configuration

Méthodologies

Approche SRE & DevOps

Définition / pilotage SLO, SLI, SLA

Pratique d?analyses d?incidents

Expérience en environnement agile

Apply for this position