Senior Site Reliability Engineer
Avaloq Group Ag
12 days ago
Role details
Contract type
Permanent contract Employment type
Full-time (> 32 hours) Working hours
Regular working hours Languages
German Experience level
SeniorJob location
Tech stack
Amazon Web Services (AWS)
Azure
Bash
Cloud Computing
Continuous Integration
DevOps
Disaster Recovery
Python
PCI Data Security Standards
Google Cloud Platform
Script Language
Kubernetes
Terraform
Go
Job description
- Entwurf, Implementierung und Verwaltung von Observability-Stacks (Metriken, Logs, Traces) mit Tools wie Prometheus, Grafana und OpenTelemetry
- Entwicklung von Zuverlässigkeitsautomatisierung und selbstheilenden Systemen zur proaktiven Erkennung und Behebung von Problemen
- Einrichtung und Überwachung von SLIs, SLOs und Fehlerbudgets zur datenbasierten Verbesserung der Zuverlässigkeit
- Zusammenarbeit mit Engineering-Teams zur Gestaltung resilienter Architekturen, Lastverteilung und Kapazitätsmanagement-Strategien
- Optimierung von CI/CD-Pipelines und Deployment-Automatisierung zur Reduzierung von Betriebsaufwand und Risiken
- Leitung von Incident-Response- und Post-Mortem-Praktiken zur Förderung kontinuierlichen Lernens und Systemhärtung
- Definition cloud-agnostischer Zuverlässigkeitsstandards zur Unterstützung von Multi-Cloud-Operationen über AWS, Azure und GCP
- Entwurf und Implementierung robuster Disaster-Recovery-Lösungen zur Gewährleistung eines nahtlosen 24x7-Betriebs
- Zusammenarbeit mit Sicherheits- und Compliance-Teams zur Sicherstellung, dass betriebliche Prozesse den regulatorischen Anforderungen (PCI DSS, SOC2, GDPR) entsprechen
- Beitrag zu einer Kultur geteilter Verantwortung, Mentoring von Ingenieuren in Zuverlässigkeits-, Skalierbarkeits- und Observability-Praktiken
Requirements
- Mehr als 5 Jahre Erfahrung in Site Reliability oder DevOps-Rollen für verteilte, cloud-native Systeme
- Fundierte Kenntnisse in Infrastruktur- und Automatisierungstechnologien (Terraform, Helm, Ansible, Kubernetes)
- Tiefes Verständnis von Monitoring-, Alerting- und Incident-Management-Frameworks
- Erfahrung im Betrieb bei mindestens zwei großen Cloud-Anbietern (AWS, Azure, GCP)
- Kenntnisse in Skriptsprachen wie Python, Go oder Bash für Automatisierung und Tools
- Nachgewiesene Fähigkeit, hochverfügbare, fehlertolerante Architekturen zu entwerfen und zu verwalten
- Kenntnisse zu Sicherheits- und Compliance-Anforderungen in Finanz- oder regulierten Umgebungen
- Ausgezeichnete Zusammenarbeit und Kommunikationsfähigkeiten mit pragmatischem Ansatz zur Balance zwischen Geschwindigkeit und Stabilität
About the company
Gegründet und mit Hauptsitz in der Schweiz, baut Avaloq kontinuierlich seine globale Präsenz mit rund 2.500 Mitarbeitenden in 12 Ländern und mehr als 170 Kunden in 35 Ländern aus. Wir sind ein branchenführender Anbieter von Wealth-Management-Technologie und -Dienstleistungen für Finanzinstitute weltweit, darunter Privatbanken und Vermögensverwalter, Investmentmanager sowie Retail- und Neobanken. Unser forschungsorientierter Ansatz und kontinuierliche Innovation werden durch die Leidenschaft und Kreativität unserer Mitarbeitenden angetrieben.
Wir suchen stets talentierte Menschen, die uns auf unserer Mission begleiten, das Finanzökosystem zu orchestrieren und den Zugang zum Wealth Management zu demokratisieren. Avaloq bietet die Möglichkeit, eng mit einigen der weltweit führenden Finanzinstitute zusammenzuarbeiten, während wir gemeinsam Karrieren entwickeln und gestalten. Ein kollaboratives, unterstützendes und flexibles Arbeitsumfeld befähigt unsere Mitarbeitenden, ihr volles Potenzial zu entfalten.
Stellenbeschreibung
Werden Sie Teil unseres Technology R&D Labs als Senior Site Reliability Engineer und gestalten Sie die operative Grundlage einer neuen Generation cloud-nativer, zusammensetzbarer Banking-Plattformen mit. Sie entwerfen und entwickeln die Systeme, Automatisierungen und Praktiken, die unsere SaaS-Produkte zuverlässig, beobachtbar und sicher halten, während wir global skalieren.
Sie arbeiten eng mit den Plattform-, Sicherheits- und Produktteams zusammen, um Zuverlässigkeit und Leistung in jede Ebene des Stacks zu integrieren und so unsere Fähigkeit sicherzustellen, schnell und wiederholt zu deployen, damit Innovation, Leistung und Stabilität Hand in Hand gehen., Wir wissen, dass die Vereinbarkeit von Beruf und Privatleben eine Herausforderung ist, der wir alle täglich begegnen. Um dies zu unterstützen, bieten wir den meisten Avaloq-Mitarbeitenden hybride und flexible Arbeitsmodelle an, um die Work-Life-Balance zu erhalten und gleichzeitig unsere fantastische Avaloq-Kultur in unseren globalen Büros fortzuführen.
Bei Avaloq sind wir stolz darauf, Vielfalt zu leben und verstehen, dass der Erfolg unseres Unternehmens auf der Kraft unterschiedlicher Meinungen basiert. Wir engagieren uns voll und ganz für ein gleichberechtigtes Umfeld und eine inklusive Kultur, in der Sie Ihr wahres authentisches Selbst sein können.
Wir stellen ein, vergüten und fördern unabhängig von Herkunft, Alter, Geschlechtsidentität, sexueller Orientierung oder anderen fantastischen Eigenschaften, die uns alle einzigartig machen. Wir haben unser Bestes getan, diese Anzeige inklusiv und neutral zu formulieren.