Senior Site Reliability Engineer (SRE)

moveoX Recruiting

1 month ago

Role details

Contract type

Permanent contract

Employment type

Full-time (> 32 hours)

Working hours

Regular working hours

Languages

German

Experience level

Senior

Compensation

€ 70K

Job location

Tech stack

API

Amazon Web Services (AWS)

Azure

Cloud Computing

Computer Security

Continuous Integration

Data Centers

DevOps

Firmware

Cloud Services

Prometheus

Software Engineering

Data Logging

Google Cloud Platform

Cloud Platform System

React

Grafana

Openwrt

Kubernetes

GraphQL

Terraform

Job description

Wir suchen eine:n erfahrene:n Senior Site Reliability Engineer (SRE) zur Verstärkung unseres Teams. In dieser Rolle verbesserst du die Zuverlässigkeit, Skalierbarkeit und Performance unseres Unwired Edge Cloud-Dienstes - sowohl in unseren Rechenzentrums-Clustern (GKE und On-Prem) als auch in unserer Edge-Computing-Lösung für Züge (Kubernetes/K8s auf Edge-Geräten). JOB ANSEHEN

Diese Position ist ideal für Kubernetes-Expert:innen, die Erfahrung mit komplexen Cluster-Setups haben und sich sicher in Golang-Code bewegen - sowohl zur Fehleranalyse als auch zur Entwicklung neuer Lösungen. Du arbeitest eng mit einem interdisziplinären Team zusammen, um innovative Lösungen für den öffentlichen Verkehr zu gestalten. Deine Aufgaben:

Cloud-Services weiterentwickeln: Entwurf und Implementierung neuer Funktionen für unsere Kubernetes-basierte Cloud-Infrastruktur.
Kubernetes-Expertise einbringen: Architektur, Bereitstellung und Wartung von Kubernetes-Clustern, inklusive Entwicklung eigener Kubernetes-Operatoren mit Golang.
Automatisierung und CI/CD: Aufbau und Pflege robuster CI/CD-Pipelines nach GitOps-Prinzipien.
Incident-Management: Analyse und Behebung von Störungen, Durchführung von Root-Cause-Analysen und Implementierung präventiver Maßnahmen.
Teamübergreifende Zusammenarbeit: Enge Kooperation mit Softwareentwicklung, DevOps und Firmware-Teams zur Entwicklung von Cloud-Backends, APIs und containerisierten Services.
Monitoring und Observability: Implementierung moderner Monitoring-, Logging- und Alerting-Lösungen.
Technische Beratung: Förderung einer Kultur des Lernens und der kontinuierlichen Verbesserung im Team.