Site Reliability Engineer / SRE - Cloud Storage - STACKIT

YoungCapital
Bad Friedrichshall, Germany
2 days ago

Role details

Contract type
Permanent contract
Employment type
Full-time (> 32 hours)
Working hours
Regular working hours
Languages
English, German

Job location

Bad Friedrichshall, Germany

Tech stack

API
Artificial Intelligence
Bash
Cloud Computing
Cloud Storage
Computer Security
Elasticsearch
Monitoring of Systems
Python
NetApp Applications
Ansible
Prometheus
Ceph
Data Logging
Grafana
Kubernetes
Information Technology
REST
Go

Requirements

Du hast Lust, etwas Großes zu bewegen und dabei die Lösung mit modernsten Cloud-Technologien maßgeblich mitzugestalten * Du hast ausgeprägte Erfahrung im Marktumfeld mit verschiedenen Storageprodukten (z.B. NetApp, Cohesity, Pure, Ceph) im Bereich Block-, Objekt-, Backup- oder File Storage und verfügst über gute Kenntnisse mit Cloud Umgebungen und deren Architekturen * Du bist Experte im Betrieb von Storageinfrastruktur (z.B. Lösungsszenarien, Bereitstellung, Skalierung, Migration, Incident response) und deren Automatisierung (z.B. Mittels Golang/Python, Bash, Ansible) * Du kennst Dich gut in containerisierten Systemlandschaften des Storageumfelds aus (z.B. K8s) * Du hast Erfahrung im Monitoring, Alerting und Logging zur Sicherstellung einer lückenlosen Systemüberwachung (z.B. Prometheus, Grafana, Elasticsearch) * Du arbeitest bereits mit APIs und entwickelst diese weiter (z.B. REST API mit Golang und Python) * Du hast Spaß an den Herausforderungen beim Betrieb von Storage-Systemen (z.B. Protokolle, Troubleshooting, Performanceanalysen, Hochverfügbarkeit, Lifecycle) * Du bringst Leidenschaft und Begeisterung für neue Technologien und Themen rund um verschiedene Speichersysteme mit * Du bist gerne Teil eines motivierten Teams, das immer nach Verbesserungen strebt und sich selbst (und die Produkte) kontinuierlich weiterentwickelt * Deine ausgezeichnete Kommunikationsfähigkeit in Deutsch und Englisch bildet die Basis für eine erfolgreiche Zusammenarbeit in internationalen, agilen Teams Einleitungstext Schwarz Digits schafft das technologische Fundament für digitale Entscheidungsfreiheit in Europa. Als IT- und Digitalsparte der Schwarz Gruppe entwickeln und verantworten wir einerseits die IT-Infrastrukturen für die Handelssparten Lidl und Kaufland sowie die Schwarz Produktion und PreZero. Unsere Kernleistungen bündeln wir in den Bereichen Cloud, Cyber Security, Data & AI, Communication und Workspace. Bei uns arbeitest du an der Schnittstelle zwischen Agilität und Sicherheit: Du profitierst von den schnellen Entscheidungswegen, genießt echte Gestaltungsspielräume in deinen Projekten und baust dabei auf das stabile Fundament der Schwarz Gruppe. Daher leben wir aktiv eine Ende-zu-Ende-Verantwortung und bekommen hierbei Unterstützung aus vielen internen STACKIT Service Teams zur Veredelung unserer Services * Performance- und Kapazitätsplanung: Du analysierst und optimierst die Performance unserer Bestandssysteme im Hinblick auf zukünftige Skalierung der Landschaft. Dies beinhaltet auch eine vorausschauende Kapazitätsplanung * Incident- und Postmortem-Analyse: Dir obliegt die Aufarbeitung von (Major) Incidents mit Storage-Beteiligung im Rahmen des Incident & Problem Management Prozesses der STACKIT mit dem Ziel, mitigierende Maßnahmen für die Zukunft abzuleiten und anschließend erfolgreich umzusetzen

Apply for this position