Platform Operations Engineer - SRE & Infrastructure Automation
Rocken AG
yesterday
Role details
Contract type
Permanent contract Employment type
Full-time (> 32 hours) Working hours
Regular working hours Languages
GermanJob location
Tech stack
Java
Cloud Computing
Configuration Management
Databases
Database Analysis
Linux
DNS
Python
Routing
Ansible
Shell Script
SQL Databases
Systems Architecture
Firewalls (Computer Science)
Kotlin
Kubernetes
Terraform
Docker
Job description
Unsere Arbeit stellt technologisch und organisch die Menschen im Mittelpunkt. Rocken® bietet Executive- Search und Talent Management Beratung an, um die persönlichen und individuellen Ansprüche jedes Einzelnen abzuholen und diese in der Personalbeschaffung und Karriereplanung optimal umzusetzen., * Design und Betrieb von Multi-Infrastruktur-Deployments über On-Prem-, Private-Cloud- und Public-Cloud-Umgebungen hinweg
- Entwicklung und Pflege von IaC-Lösungen zur vollständigen Automatisierung von Provisionierung, Updates und Kunden-Onboardings
- Aktive Rolle im Incident Management: Ursachenanalyse, Eskalationshandling und nachhaltige Problemlösung durch gezielte Log- und Datenbankanalysen
- Aufbau eines umfassenden Observability-Systems inkl. SLI/SLO-Framework, Alerting-Logik, Runbooks und automatisierter Incident-Reaktion
- Technische Verantwortung für den Onboarding-Prozess neuer Kunden - von der Infrastrukturbereitstellung bis zur betrieblichen Übergabe
- Enge Zusammenarbeit mit Entwicklungsteams zur Verbesserung von Systemarchitektur, Resilienz und Deploymentgeschwindigkeit
- Erarbeitung verbindlicher Betriebsrichtlinien und technischer Standards für externe Dienstleister und Partner
Requirements
- Solide Entwicklungserfahrung in Kotlin, Java oder Python - du verstehst Code und kannst ihn lesen, anpassen und debuggen
- Tiefes Linux-Know-how und sicherer Umgang mit der Kommandozeile inkl. komplexem Shell-Scripting
- Praktische Erfahrung mit Container-basierten Architekturen (Docker, idealerweise auch Kubernetes)
- SQL-Kenntnisse für die eigenständige Analyse produktiver Datenbanken im Incident-Kontext
- Fundiertes Verständnis von Netzwerkkonzepten: TLS-Zertifikate, DNS-Architektur, Firewall-Regeln, Routing
- Erfahrung mit Konfigurationsmanagement und Automatisierung (Ansible, Terraform o. ä.)
- Ausgeprägtes SRE-Mindset: Fehlerbudgets, Toil-Reduktion, Reliability als Engineering-Disziplin
- Präzise, strukturierte Dokumentationskultur - du hältst fest, was du tust und warum
About the company
Rocken® ist ein Schweizer Unternehmen mit dem Sitz in Zürich.
Wir haben eine webbasierte Online- Plattform zur Jobsuche und Talentgewinnung entwickelt, die den