Monitoring & Alerting Engineer - Zabbix / Rechenzentrum
Role details
Job location
Tech stack
Job description
Zur Verstärkung eines Infrastruktur-Teams suchen wir einen erfahrenen Monitoring & Alerting Engineer (m/w/d) mit Fokus auf den Aufbau eines nachhaltigen und praxistauglichen Monitorings für ein Rechenzentrumsumfeld. In diesem Mandat übernimmst du die Konzeption und Umsetzung eines ganzheitlichen Monitoring- und Alerting-Ansatzes für zentrale Infrastrukturkomponenten - von Netzwerk und Firewall bis hin zu Server- und Storage-Systemen., Zur Verstärkung eines Infrastruktur-Teams suchen wir einen erfahrenen Monitoring & Alerting Engineer (m/w/d) mit Fokus auf den Aufbau eines nachhaltigen und praxistauglichen Monitorings für ein Rechenzentrumsumfeld. In diesem Mandat übernimmst du die Konzeption und Umsetzung eines ganzheitlichen Monitoring- und Alerting-Ansatzes für zentrale Infrastrukturkomponenten - von Netzwerk und Firewall bis hin zu Server- und Storage-Systemen. Neben der technischen Implementierung steht insbesondere der Aufbau eines belastbaren Betriebs- und Eskalationsmodells für den 7x24-Betrieb im Fokus., * Entwicklung eines ganzheitlichen Monitoring- und Alerting-Konzepts für die Rechenzentrumsinfrastruktur
- Konzeption und Umsetzung von: Event Management, Availability Management, Capacity Management
- Implementierung und Konfiguration der Monitoring-Lösung auf Basis von Zabbix
- Evaluation, ob ergänzende Tools oder Erweiterungen im Rahmen der Konzeption sinnvoll bzw. notwendig sind
- Definition von Schwellenwerten, Alarmierungslogiken und Eskalationsprozessen
- Aufbau eines First-Level-Support-Monitorings für den 7x24-Betrieb
- Dokumentation von Architektur, Prozessen und Betriebsmodellen
- Übergabe in den Betrieb inklusive Know-how-Transfer an das Betriebsteam
Requirements
- Mehrjährige Erfahrung im Aufbau und Betrieb von Monitoring- und Alerting-Lösungen im Rechenzentrumsumfeld
- Fundierte Kenntnisse in Zabbix (Design, Dashboards, Templates, Trigger, Alerting)
- Erfahrung im Monitoring von: Netzwerk, Firewall, Server & Storage
- Gute Kenntnisse in ITSM-Prozessen, insbesondere mit Event Management, Availability Management & Capacity Management
- Erfahrung im Aufbau von 7x24-Betriebs- und Eskalationsmodellen
- Analytische und konzeptionelle Stärke kombiniert mit einer ausgeprägten Hands-on-Mentalität
- Sehr gute Deutschkenntnisse in Wort und Schrift
- Englischkenntnisse von Vorteil