Platform Engineer AWS/Kubernetes - Secteur e-commerce [CDI only] (H/F)
Role details
Job location
Tech stack
Job description
Vous intervenez à la fois sur la construction (build) et l'optimisation continue de l'infrastructure, tout en accompagnant les équipes de développement dans l'amélioration de la résilience et des bonnes pratiques.
Vos responsabilités principales :
- Piloter les sujets d'infrastructure au sein des backlogs des feature teams (priorisation, gestion de la capacité, coordination avec PO et Technical Leaders).
- Concevoir, déployer et faire évoluer l'infrastructure cloud (AWS) via Infrastructure as Code (Terraform, Ansible, Helm, Kustomize).
- Garantir la qualité, la stabilité, la sécurité et la conformité des infrastructures mises en production.
- Mettre en place et maintenir les dispositifs d'observabilité (Prometheus, Grafana, Thanos, Loki, Tempo) et assurer un monitoring efficace des systèmes.
- Gérer les incidents de production (analyse, debugging, remédiation, amélioration continue) dans un contexte à forts enjeux de disponibilité.
- Contribuer à l'automatisation des tâches récurrentes et à l'industrialisation des déploiements (CI/CD : GitLab CI, Jenkins, ArgoCD).
- Participer à la planification de capacité, à l'optimisation des coûts cloud et à la mise en œuvre des plans de reprise d'activité (Disaster Recovery).
- Accompagner les développeur·se·s : validation des Merge Requests d'IaC, peer programming, diffusion des bonnes pratiques SRE et DevOps.
- Collaborer étroitement avec l'équipe Platform Engineering pour améliorer les outils, les processus et l'expérience développeur.
Environnement technique :
- Cloud : AWS (maîtrise complète indispensable), Alibaba Cloud
- Conteneurisation & orchestration : Docker, Kubernetes (EKS)
- Infrastructure as Code : Terraform, Ansible, Helm, Kustomize
- CI/CD : GitLab CI, Jenkins, ArgoCD
- Observabilité : Prometheus, Thanos, Grafana, Loki, Tempo
- Messaging & event : SQS, SNS, Kafka
- Sécurité : HashiCorp Vault, OKTA
- Stack applicative : PHP 8, Symfony, Node.js, React, REST
- Bases de données : PostgreSQL, MySQL, MongoDB
- Cache : Redis / Memcache
- Recherche : Elasticsearch
Vous évoluez dans un environnement non siloté, où les équipes sont autonomes sur l'ensemble de la chaîne de production. Votre impact est direct : chaque amélioration de fiabilité ou d'optimisation contribue à l'excellence de l'expérience digitale proposée.
Requirements
Vous justifiez d'au moins 7 ans d'expérience en tant que SRE, DevOps ou Ingénieur·e Infrastructure dans un environnement de production exigeant et à forte criticité.
Indispensable :
- Expérience avérée en gestion de production (monitoring, gestion d'incidents, debugging).
- Maîtrise approfondie d'AWS (environnement full AWS).
- Expérience avec Kubernetes (EKS).
- Excellente pratique de Terraform et des principes d'Infrastructure as Code.
- Solide expérience en observabilité (Prometheus, Grafana).
- Expérience des environnements CI/CD (GitLab CI, Jenkins, ArgoCD).
- Capacité à évoluer dans un contexte non siloté, en proximité directe avec les équipes de développement.
- Expérience d'accompagnement des développeur·se·s sur les sujets d'infrastructure et de fiabilité.
- Bonne maîtrise de l'anglais, à l'écrit comme à l'oral.
Apprécié :
- Connaissance d'outils tels que Loki, Kafka ou Vault.
- Mise en place de services transverses (authorization server, event bus, secrets management).
Au-delà des compétences techniques, vous êtes :
- Rigoureux·se et orienté·e qualité.
- À l'aise dans la communication avec des interlocuteurs variés.
- Capable de prioriser dans un contexte multi-backlogs.
- Animé·e par une logique d'amélioration continue et d'excellence opérationnelle.
- Autonome, tout en cultivant un fort esprit d'équipe.