Senior Site Reliability Engineer (SRE)

moveoX Recruiting
1 month ago

Role details

Contract type
Permanent contract
Employment type
Full-time (> 32 hours)
Working hours
Regular working hours
Languages
German
Experience level
Senior
Compensation
€ 70K

Job location

Tech stack

API
Amazon Web Services (AWS)
Azure
Cloud Computing
Computer Security
Continuous Integration
Data Centers
DevOps
Firmware
Cloud Services
Prometheus
Software Engineering
Data Logging
Google Cloud Platform
Cloud Platform System
React
Grafana
Openwrt
Kubernetes
GraphQL
Terraform
Go

Job description

Wir suchen eine:n erfahrene:n Senior Site Reliability Engineer (SRE) zur Verstärkung unseres Teams. In dieser Rolle verbesserst du die Zuverlässigkeit, Skalierbarkeit und Performance unseres Unwired Edge Cloud-Dienstes - sowohl in unseren Rechenzentrums-Clustern (GKE und On-Prem) als auch in unserer Edge-Computing-Lösung für Züge (Kubernetes/K8s auf Edge-Geräten). JOB ANSEHEN

Diese Position ist ideal für Kubernetes-Expert:innen, die Erfahrung mit komplexen Cluster-Setups haben und sich sicher in Golang-Code bewegen - sowohl zur Fehleranalyse als auch zur Entwicklung neuer Lösungen. Du arbeitest eng mit einem interdisziplinären Team zusammen, um innovative Lösungen für den öffentlichen Verkehr zu gestalten. Deine Aufgaben:

  • Cloud-Services weiterentwickeln: Entwurf und Implementierung neuer Funktionen für unsere Kubernetes-basierte Cloud-Infrastruktur.
  • Kubernetes-Expertise einbringen: Architektur, Bereitstellung und Wartung von Kubernetes-Clustern, inklusive Entwicklung eigener Kubernetes-Operatoren mit Golang.
  • Automatisierung und CI/CD: Aufbau und Pflege robuster CI/CD-Pipelines nach GitOps-Prinzipien.
  • Incident-Management: Analyse und Behebung von Störungen, Durchführung von Root-Cause-Analysen und Implementierung präventiver Maßnahmen.
  • Teamübergreifende Zusammenarbeit: Enge Kooperation mit Softwareentwicklung, DevOps und Firmware-Teams zur Entwicklung von Cloud-Backends, APIs und containerisierten Services.
  • Monitoring und Observability: Implementierung moderner Monitoring-, Logging- und Alerting-Lösungen.
  • Technische Beratung: Förderung einer Kultur des Lernens und der kontinuierlichen Verbesserung im Team.

Requirements

  • Fundierte Erfahrung mit Kubernetes (z. B. GKE, EKS oder ähnliche Plattformen).
  • Sehr gute Kenntnisse in Golang (z. B. Entwicklung von Kubernetes-Operatoren).
  • Erfahrung mit Cloud-Plattformen (GCP, AWS oder Azure).
  • Sicherer Umgang mit Infrastructure-as-Code-Tools wie Terraform oder Helm.
  • Expertise in CI/CD-Pipelines mit GitOps.
  • Erfahrung im Incident-Management und in der Fehlerprävention.

Von Vorteil:

  • Softwareentwicklungskenntnisse und Erfahrung mit Cloud-nativen Architekturen.
  • Erfahrung mit Observability-Tools wie Prometheus oder Grafana.
  • Kenntnisse in IT-Security für Cloud-Umgebungen.
  • Erfahrung mit React, GraphQL oder OpenWRT.

Soft Skills:

  • Analytische Problemlösungsfähigkeiten.
  • Klare und präzise Kommunikation.
  • Interesse an neuen Technologien und Trends.
  • Teamgeist und Zusammenarbeit auf hohem Niveau.

Apply for this position