Site Reliability Engineer
Role details
Job location
Tech stack
Job description
Wir öffnen dir die Tür zu einer Welt voller Möglichkeiten und bieten dir die Chance, mit uns gemeinsam den Ton anzugeben. Wir suchen Menschen mit Begeisterung für Innovation. Menschen, die brennen für das, was sie tun. Wir suchen Möglichmacher:innen, Weiterdenker:innen und Umsetzer:innen. Das bist du? Dann steht unsere Tür für dich offen.Als Site Reliability Engineer (m/w/d) bei Nuki liegt dein Fokus auf dem Betrieb und der Stabilisierung unserer Produktionsumgebung, der Weiterentwicklung unserer CI/CD-Pipelines, der Analyse von Traffic-Mustern zur Skalierung unserer Infrastruktur sowie der Erstellung und Pflege von System- und Architekturdokumentationen. Du entwickelst unsere etablierten SRE-Praktiken kontinuierlich weiter und stellst die Zuverlässigkeit, Skalierbarkeit und Effizienz unserer Anwendungen sicher. Dabei hast du die Möglichkeit, die Zukunft von Nuki aktiv mitzugestalten., * Du implementierst und betreibst robuste Monitoring-Systeme (Metriken, Logs, Dashboards), um aussagekräftige Einblicke in die Performance und den Zustand unserer Anwendungen zu erhalten.
- Du entwickelst Skripte und Software zur Automatisierung wiederkehrender Aufgaben und Prozesse.
- Du verbesserst unsere CI/CD-Pipelines, um häufige und vollständig automatisierte Releases zu ermöglichen.
- Du stellst durch PR-Reviews eine hohe Code-Zuverlässigkeit sowie performante und resiliente Services sicher.
- Du verbesserst die Observability unserer Anwendungen (Alerts, Metriken, Logging), um Performance-Engpässe oder Ausfälle frühzeitig zu erkennen.
- Du arbeitest eng mit unserem IT-Operations-Team zusammen, um unsere Internal Developer Platform weiterzuentwickeln, die unter anderem zentrales Logging, Metriken und Code-Analysen bereitstellt.
- Du analysierst Traffic-Muster, um die Infrastruktur gezielt zu skalieren und sicherzustellen, dass unsere Systeme der erwarteten Last standhalten.
- Du entwickelst automatisierte Playbooks und pflegst Architekturdokumentationen, um die MTTR zu reduzieren.
- Du leitest Incident-Responses und führst strukturierte Postmortems (Major Incident Reports) durch, um Ursachen zu identifizieren und Wiederholungen zu vermeiden.
Requirements
- Du bringst mindestens fünf Jahre Erfahrung im Bereich Site Reliability Engineering (SRE) mit.
- Du verfügst über sehr gute Kenntnisse in mindestens einer Programmiersprache wie Python, Java oder Go sowie in Bash-Scripting.
- Du hast fundierte Erfahrung mit Cloud-Plattformen und Container-Orchestrierung (z. B. Kubernetes, Docker).
- Du bist sehr sicher im Umgang mit Linux-Systemen.
- Du hast Erfahrung mit Infrastructure as Code- und GitOps-Tools wie Terraform, Ansible und Flux.
- Du besitzt ein gutes Verständnis von Datenbanktechnologien (SQL, NoSQL) sowie Netzwerkgrundlagen (TCP/IP, HTTP, DNS).
- Du verfügst über sehr gute Englischkenntnisse in Wort und Schrift; Deutschkenntnisse sind ein Plus.
- Du zeichnest dich durch ausgeprägte analytische und problemlösungsorientierte Fähigkeiten, gute Kommunikationsstärke und Freude an der Arbeit in einem dynamischen Umfeld aus.
Benefits & conditions
Für die ausgeschriebene Position gilt ein KV-Mindestgrundgehalt von monatlich € 3.843,- brutto auf Vollzeitbasis. Bereitschaft zur deutlichen Überzahlung bei entsprechender Qualifikation und Berufserfahrung vorhanden. Die Ausschreibung ist offen für Bewerbungen am Dienstort Graz.
About the company
We at Nuki are breaking new ground and are working on a completely keyless future. As one of the fastest growing companies in Austria, we offer high-quality products, a dynamic team of 140 employees and more than 450,000 satisfied customers. We are pioneers in the Smart Home sector and are looking for people like you who are not satisfied with the status quo and are willing to take on responsibility quickly. We look forward to getting to know you!