Expert Supervision AWS (H/F)
Role details
Job location
Tech stack
Job description
Le prestataire devra assurer la mise en place, l?optimisation et l?exploitation des outils de supervision / métrologie / observabilité / centralisation / analyse / visualisation de données dans un environnement AWS hybride. Les prestations attendues incluent :
- Déploiement et configuration des outils de supervision
Mise en ?uvre de solutions supervision natives AWS (telles que AWS CloudWatch) et tierces (Dynatrace, Centreon) pour la supervision des infrastructures, des applications et des services métiers. Compléter la suite de solution actuelle pour améliorer les capacités d?observabilité et de prévention / résolution d?incidents.
-
Déploiement ou optimisation des solutions de centralisation / analyse / visualisation de données (ELK Stack),
-
Définition des indicateurs clés de performance (KPI)
Identification des métriques pertinentes (techniques et métiers), configuration des seuils d?alerte et des templates et standards correspondants, création de tableaux de bord dynamiques pour le pilotage opérationnel.
- Gestion des alertes et des incidents
Mise en place de mécanismes d?alerte multi-canaux, intégration avec les outils ITSM, automatisation des réponses aux incidents courants.
- Documentation et transfert de compétences
Documenter les choix d?architecture et rédiger des procédures d?exploitation, d?utilisation et de maintien en condition opérationnelle des outils. Formation des équipes internes à l?utilisation des outils et à l?interprétation des alertes.
Requirements
Expertises techniques et compétences attendues
-
Expert supervision AWS (4 ans d?expérience minimum sur le Cloud AWS) : maîtrise des outils de monitoring natifs et tiers dans AWS. Expertise sur CloudWatch, Dynatrace, Centreon, et leurs interactions pour former une solution d?observabilité complète
-
Définition et pilotage des KPI : capacité à identifier les indicateurs techniques et métiers pertinents, à configurer les seuils d?alerte, et à concevoir des tableaux de bord dynamiques pour le pilotage opérationnel.
-
Gestion des alertes et des incidents : mise en place de mécanismes d?alerte efficaces, intégration avec les outils ITSM, automatisation des réponses aux incidents et amélioration continue des processus de supervision.
-
Compétences transverses : anglais courant, rigueur documentaire, capacité à former les équipes internes et à produire des supports pédagogiques adaptés.