Experte Availability Engineering
Role details
Job location
Tech stack
Job description
Als erfahrener Experte (m/w/d) im Availability-Engineering übernimmst Du eine zentrale Rolle beim Aufbau, der Skalierung und dem sicheren Betrieb unserer Cloud-nativen Plattform, da Stabilität, Verfügbarkeit und Qualität unser Leistungsversprechen sind.
Du arbeitest eng mit unseren DevOps-, Sicherheits- und Entwicklerteams sowie mit den Bereichen Incident-, Problem-, Change-, Capacity und Continuity-Management zusammen und bringst Deine Erfahrung aktiv in die strategische Weiterentwicklung unserer Infrastruktur ein., * Du berätst unsere Architekt:innen und Product Owner bei der Weiterentwicklung unserer hochverfügbaren und skalierbaren Systeme wie Cloud Foundry, Kubernetes, Terraform und Ansible.
- Du hast die Verantwortung für die Definition und Einhaltung von SLOs, SLAs sowie für unsere Incident-Response-Prozesse gemäß dem Availability Plan.
- Du bringst Dein Know-how in unseren unternehmensweiten Observability-Stack ein - mit Tools wie Grafana, OpenTelemetry, Icinga, Zabbix und Splunk.
- Du begleitest andere Dev-Ops Engineers durch Mentoring, Code- und Architektur-Reviews sowie Pairing-Sessions und förderst so aktiv den Wissensaustausch.
- Du führst Root Cause Analysen durch und gestaltest blameless Postmortems.
Requirements
- Du verfügst über ein abgeschlossenes Studium im Bereich Informatik, Wirtschaftsinformatik oder eine vergleichbare Qualifikation.
- Du hast mehrjährige Berufserfahrung im Site Reliability Engineering, DevOps, Availability Engineering oder in einer vergleichbaren Rolle.
- Du verfügst über ein tiefes Verständnis verteilter Systeme sowie Erfahrung mit Container-Orchestrierung - insbesondere mit Cloud Foundry und Kubernetes - und der Entwicklung von Cloud-Software.
- Du kennst Dich mit skalierbarem Monitoring, Logging und Tracing aus, hast bereits mit Tools wie Splunk, Grafana und weiteren gearbeitet und hast fundiertes Know-how im Bereich CI/CD-Pipelines wie z. B. mit Jenkins, GitHub Actions, Artifactory, Build-Prozessen oder Azure DevOps (ADOS).
- Du trittst souverän gegenüber internen und externen Stakeholdern auf und kannst komplexe technische Zusammenhänge klar und verständlich kommunizieren.