Systemmanager/-in für KI-, Kubernetes- und HPC-Cluster 28/2026
Universität Potsdam
Potsdam, Germany
4 days ago
Role details
Contract type
Permanent contract Employment type
Full-time (> 32 hours) Working hours
Regular working hours Languages
English, GermanJob location
Potsdam, Germany
Tech stack
Java
Artificial Intelligence
Bash
C++
Profiling
Perl
General Parallel File Systems
Python
Linux Servers
Ansible
Scientific Computating
Software Engineering
Subversion
High Performance Computing
Okta
Large Language Models
GIT
Kubernetes
Information Technology
Slurm
Puppet
Job description
- Aufbau, Betrieb und Weiterentwicklung eines KI-Clusters zur Bereitstellung von lokalen Large Language Modellen (LLM) für wissenschaftliche Projekte mit besonderem Fokus auf Open Science und Open Data
- Weiterentwicklung der High-Performance-Computing-Cluster
- Installation, Anpassung und ggf. Entwicklung von Anwendungen für wissenschaftliches Rechnen auf dem HPC-Cluster
- Unterstützung verschiedener Forschungsbereiche bei der Nutzung des HPC-Clusters und Profiling sowie Optimierung von HPC-Jobs
- Betrieb und Weiterentwicklung der Keycloak Installation und der Kubernetes Cluster
- Durchführung von Tutorien, Nutzendenschulungen; Erweiterung von Dokumentation
Requirements
- abgeschlossenes (Fach-)Hochschulstudium im Bereich der Informatik oder einem vergleichbaren Studiengang mit mehrjähriger Berufserfahrung; alternativ gleichwertige Fähigkeiten und Berufserfahrung in entsprechender Position
- sehr gute Kenntnisse und praktische Erfahrung in der Administration von Linux-Servern
- nachgewiesene Kenntnisse in Konzeption und Aufbau von Hochleistungsrechnern sowie Schedulern (idealerweise Slurm)
- fundierte Kenntnisse und Erfahrungen mit parallelen Filesystemen wie BeeGFS, GlusterFS oder Lustre, GPFS
- gute bis sehr gute Kenntnisse und Erfahrung in der Skript-Programmierung mit BASH und Software-Entwicklung wie Python, Perl, C/C++, Java
- gute Kenntnisse von Sicherheitskonzepten, Datensicherungsverfahren und Methoden zur Überwachung des IT-Betriebs, sowie Monitoringsystemen
- praktische Erfahrung in der Arbeit mit Versionsmanagementsystemen wie Git, SVN etc. sowie Orchestrierungstools wie Ansible, Puppet oder SALT
- ausgeprägte Teamfähigkeit und ein gutes Zeit- und Selbstmanagement
- sicherer Umgang mit wissenschaftlichen Communities, um vermittelnd zwischen Forschenden und den Lösungen der IT auftreten zu können
- Deutschkenntnisse auf Niveau B2 gemäß GER; Englischkenntnisse B2