Systemmanager/-in für KI-, Kubernetes- und HPC-Cluster 28/2026

Universität Potsdam
Potsdam, Germany
4 days ago

Role details

Contract type
Permanent contract
Employment type
Full-time (> 32 hours)
Working hours
Regular working hours
Languages
English, German

Job location

Potsdam, Germany

Tech stack

Java
Artificial Intelligence
Bash
C++
Profiling
Perl
General Parallel File Systems
Python
Linux Servers
Ansible
Scientific Computating
Software Engineering
Subversion
High Performance Computing
Okta
Large Language Models
GIT
Kubernetes
Information Technology
Slurm
Puppet

Job description

  • Aufbau, Betrieb und Weiterentwicklung eines KI-Clusters zur Bereitstellung von lokalen Large Language Modellen (LLM) für wissenschaftliche Projekte mit besonderem Fokus auf Open Science und Open Data
  • Weiterentwicklung der High-Performance-Computing-Cluster
  • Installation, Anpassung und ggf. Entwicklung von Anwendungen für wissenschaftliches Rechnen auf dem HPC-Cluster
  • Unterstützung verschiedener Forschungsbereiche bei der Nutzung des HPC-Clusters und Profiling sowie Optimierung von HPC-Jobs
  • Betrieb und Weiterentwicklung der Keycloak Installation und der Kubernetes Cluster
  • Durchführung von Tutorien, Nutzendenschulungen; Erweiterung von Dokumentation

Requirements

  • abgeschlossenes (Fach-)Hochschulstudium im Bereich der Informatik oder einem vergleichbaren Studiengang mit mehrjähriger Berufserfahrung; alternativ gleichwertige Fähigkeiten und Berufserfahrung in entsprechender Position
  • sehr gute Kenntnisse und praktische Erfahrung in der Administration von Linux-Servern
  • nachgewiesene Kenntnisse in Konzeption und Aufbau von Hochleistungsrechnern sowie Schedulern (idealerweise Slurm)
  • fundierte Kenntnisse und Erfahrungen mit parallelen Filesystemen wie BeeGFS, GlusterFS oder Lustre, GPFS
  • gute bis sehr gute Kenntnisse und Erfahrung in der Skript-Programmierung mit BASH und Software-Entwicklung wie Python, Perl, C/C++, Java
  • gute Kenntnisse von Sicherheitskonzepten, Datensicherungsverfahren und Methoden zur Überwachung des IT-Betriebs, sowie Monitoringsystemen
  • praktische Erfahrung in der Arbeit mit Versionsmanagementsystemen wie Git, SVN etc. sowie Orchestrierungstools wie Ansible, Puppet oder SALT
  • ausgeprägte Teamfähigkeit und ein gutes Zeit- und Selbstmanagement
  • sicherer Umgang mit wissenschaftlichen Communities, um vermittelnd zwischen Forschenden und den Lösungen der IT auftreten zu können
  • Deutschkenntnisse auf Niveau B2 gemäß GER; Englischkenntnisse B2

Apply for this position