Systemadministrator*in HPC
Zuse-Institut Berlin
Berlin, Germany
yesterday
Role details
Contract type
Permanent contract Employment type
Full-time (> 32 hours) Working hours
Shift work Languages
English, GermanJob location
Berlin, Germany
Tech stack
Artificial Intelligence
Bash
C++
Data Centers
Fortran
Icinga
Python
Ansible
Prometheus
Systems Integration
Grafana
Slurm
Job description
Als Teamplayer im NHR-Zentrum des ZIB tragen Sie mit Ihrer Arbeit zur Weiterentwicklung eines effizienten Betriebs der HPC-Systeme bei. Zu Ihren Aufgaben zählen u. a.:
- Administration komplexer HPC-Architekturen mit Spezialisierung(en) in Teilgebieten wie parallelen Dateisystemen, Management von heterogenen Ressourcen mit Slurm, System Deployment und automatisierter Systemüberwachung
- Planung, Umsetzung und Controlling der konzeptionellen Arbeit für einen energieeffizienten und gesicherten Betrieb mit heterogenen Rechnerarchitekturen (GPU, FPGA, AI) und leistungsstarken Speichersystemen (Spectrum Scale, DAOS) sowie deren Überführung in die Produktion
- Evaluation innovativer neuer Technologien im HPC-Umfeld, insbesondere auch unter Berücksichtigung der Anforderungen für KI-Workloads
- Planung, Umsetzung bzw. Gestaltung von NHR-Zukunftsprojekten zu obigen Themenbereichen und Controlling der Projektergebnisse,
- Konfiguration von komplexen Software-Stacks für das System-Monitoring (Icinga, check-mk, Grafana, Prometheus, ELK)
- Automatisierung von wiederkehrenden Tasks und Mitwirkung bei der Dokumentation von Code und Prozessen
- Entwicklung von Nutzerschnittstellen für die Umsetzung eines optimierten Betriebs
- Mitarbeit an der Evaluierung von Pre-Release- und Early-Shipment-Systemen
- Bereitschaft zur Veröffentlichung von Projektergebnissen sowie Beiträgen zu NHR-Trainingsaktivitäten
- Optionale Durchführung von Tätigkeiten direkt im Datacenter
Requirements
- Erfolgreich abgeschlossenes Hochschulstudium in einem MINT-Fach mit Berufserfahrung oder erfolgreich abgeschlossene einschlägige Berufsausbildung, z. B. als Fachinformatiker*in für Systemintegration mit mehrjähriger einschlägiger Berufserfahrung oder alternativ langjährige Berufserfahrung in dem o. g. Tätigkeitsbereich
- Gute Kenntnisse von modernen heterogenen Rechnerarchitekturen und Speichersystemen im HPC-Umfeld
- Erfahrungen in der Administration von HPC-Systemen und SLURM
- Sehr gute Kenntnisse in Bash, Python, Ansible; Erfahrungen mit im HPC-Bereich gängigen Programmiersprachen (C/C++/Fortran) wünschenswert
- Fähigkeit zur Kommunikation in Deutsch und Englisch
- Selbstständiges und zielorientiertes Arbeiten
Benefits & conditions
Wir bieten Ihnen eine familienfreundliche Arbeitsumgebung mit flexiblen Arbeits- und Besprechungszeiten, eine exzellente Ausstattung und eine anspruchsvolle, professionelle Umgebung sowie
- ein abwechslungsreiches, zukunftsorientiertes und verantwortungsvolles Aufgabengebiet,
- eine umfassende Einarbeitung in einem kompetenten und kooperativen Team,
- berufliche Fortbildungsmöglichkeiten und Unterstützung in der fachlichen Weiterentwicklung,
- ergänzende Altersvorsorge (VBL),
- 30 Tage Jahresurlaub, flexible Arbeitszeiten (Gleitzeit),
- eine Vergütung auf Basis des TV-L (Tarifvertrag für den öffentlichen Dienst der Länder) entsprechend der Qualifikation und Berufserfahrung mit Jahressonderzahlung,
- Hauptstadtzulage von bis zu 150 € monatlich, alternativ BVG-Jobticket + Differenzbetrag,
- die vergünstigte Nutzung der Mensen und des Sportprogramms der FU durch die enge Zusammenarbeit mit der Freien Universität Berlin.
About the company
Das ZIB blickt auf mehr als 40 Jahre Erfahrung als HPC-Zentrum zurück und ist seit Januar 2021 eines der neun Zentren der bundesweiten HPC-Allianz "NHR" (Nationales Hochleistungsrechnen, www.nhr-verein.de), die von Bund und Ländern gefördert werden. Wir betreiben Rechen- und Speicherressourcen auf höchstem Leistungsniveau und unterstützen Wissenschaftlern bei ihren rechenintensiven Projekten. Derzeit bietet unser HPC-System "Lise" mit einer Spitzenleistung von 8 PFlop/s eine Plattform zur Realisierung anspruchsvoller Rechenaufgaben und Datenanalyse-Workflows zur Lösung komplexer wissenschaftlicher Fragestellungen. Das "Lise"-System umfasst 130.000 Rechenkerne, 20 PB persistenten Online-Speicher und 256 GPUs.
Im NHR-Zentrum am ZIB wird die fachliche Expertise für den effizienten Betrieb der HPC-Ressourcen und die systemnahe Beratung der NutzerInnen gebündelt. Die künftigen vielfältigen und anspruchsvollen Aufgaben für den zuverlässigen Betrieb der HPC-Systeme erfordern konzeptionelle Arbeiten in den Themenbereichen Energieeffizienz, heterogene Rechnerarchitekturen mit GPUs und Speichersysteme sowie deren Umsetzung in den Produktionsbetrieb mit den MitarbeiterInnen der Gruppe Supercomputing Systems. Dazu erwarten wir Interesse für innovative IT-Technologien, deren Einsatz im wissenschaftlichen Umfeld sowie für die Administration der künftigen komplexen HPC-Rechnerarchitekturen mit Beschleunigern (GPU, FPGA), Hochgeschwindigkeitsnetzwerken und modernen Speichersystemen., Die Demo Daten GmbH ist ein von Personio geschaffenes, fiktives Unternehmen, welches Ihnen dabei helfen soll die Funktionen von Personio kennenzulernen.