Platform Engineer Kubernetes Cloud Infrastructure

Lorenz Personal GmbH & Co. KG
Nürnberg, Germany
11 days ago

Role details

Contract type
Permanent contract
Employment type
Full-time (> 32 hours)
Working hours
Regular working hours
Languages
German
Experience level
Senior

Job location

Nürnberg, Germany

Tech stack

API
Artificial Intelligence
Amazon Web Services (AWS)
Azure
Communications as a Service (CaaS)
Command-Line Interface
Cloud Computing
Continuous Integration
Disaster Recovery
Github
Infrastructure as a Service (IaaS)
Identity and Access Management
Prometheus
Data Logging
Google Cloud Platform
Grafana
Kubernetes
Information Technology

Job description

Unser Kunde betreibt eine hochverfügbare und skalierbare Cloud-Infrastruktur zur Bereitstellung zentraler Plattformservices. Im Fokus stehen moderne Self-Service-Angebote, die Entwicklungsteams eine effiziente Nutzung leistungsfähiger Technologien ermöglichen. Die Plattformen werden in selbstorganisierten Teams kontinuierlich weiterentwickelt und bilden die Grundlage für geschäftskritische Anwendungen.

Die Rolle verbindet Platform Engineering, Cloud-Infrastruktur und Automatisierung. Im Mittelpunkt stehen der Aufbau und Betrieb moderner Container-Plattformen sowie die Bereitstellung sicherer und leistungsfähiger Services für interne Nutzer., * Aufbau, Betrieb und kontinuierliche Weiterentwicklung von Container-Plattformen auf Basis von Kubernetes und Virtualisierungstechnologien

  • Integration von Security-, Governance- sowie Lifecycle-Management-Komponenten einschließlich Backup-, Restore- und Disaster-Recovery-Konzepten
  • Konzeption, Implementierung und Betrieb einer leistungsfähigen GPU-Infrastruktur für datenintensive Anwendungen und AI-/ML-Szenarien
  • Umsetzung von Automatisierungs-, Bereitstellungs- und Skalierungsprozessen nach dem Prinzip Everything as Code (IaC, Configuration as Code, Policy as Code, GitOps)
  • Entwicklung und Bereitstellung von APIs, CLI-Tools und Service-Katalogen zur Self-Service-Nutzung durch Entwicklungsteams
  • Analyse und Behebung technischer Störungen im Rahmen des Last-Level-Supports
  • Beratung interner Stakeholder zu Architektur-, Integrations- und Nutzungskonzepten sowie Begleitung beim Onboarding neuer Plattformnutzer
  • Sicherstellung eines stabilen, sicheren und wirtschaftlichen Plattformbetriebs, * 40-Stunden-Woche in einem modernen Cloud- und Plattformumfeld
  • Mitarbeit an hochautomatisierten und hochverfügbaren Infrastrukturplattformen
  • Einsatz moderner Technologien im Kubernetes-, Cloud- und Automatisierungsumfeld
  • Zusammenarbeit in selbstorganisierten und interdisziplinären Teams
  • Anspruchsvolle Aufgaben mit hoher technologischer Relevanz und Gestaltungsspielraum
  • Möglichkeit zur fachlichen Weiterentwicklung in den Bereichen Cloud, Platform Engineering und AI-Infrastruktur

Requirements

  • Abgeschlossenes Studium der Informatik oder vergleichbare Qualifikation mit mehrjähriger Berufserfahrung
  • Alternativ abgeschlossene Berufsausbildung im IT-Umfeld mit entsprechender Praxiserfahrung
  • Mehrjährige Erfahrung im Platform Engineering sowie im Aufbau und Betrieb von CaaS- und IaaS-Plattformen
  • Fundierte Kenntnisse im Betrieb und der Integration von Kubernetes- und Virtualisierungsplattformen
  • Erfahrung im Bereich Security und Compliance im Plattformumfeld
  • Praktische Erfahrung mit Automatisierung und Everything as Code, beispielsweise IaC und GitOps
  • Strukturierte und lösungsorientierte Arbeitsweise
  • Fähigkeit, komplexe technische Sachverhalte verständlich zu vermitteln und Plattformnutzer zu beraten
  • Sehr gute Deutschkenntnisse in Wort und Schrift

Wünschenswerte Kenntnisse:

  • Verständnis für GPU-Technologien wie vGPU, MIG oder Time-Slicing im Umfeld von AI- und ML-Anwendungen
  • Erfahrung mit CI/CD-Pipelines, z. B. GitHub Actions
  • Kenntnisse im Betrieb und der Absicherung von Cloud-Umgebungen (AWS, Azure oder GCP)
  • Erfahrung mit IAM, Netzwerk-Security sowie Monitoring- und Logging-Lösungen wie Prometheus, Grafana, ELK oder Loki
  • Kenntnisse in der Entwicklung Cloud-nativer Anwendungen oder Operatoren, z. B. mit Go
  • Erfahrung mit Observability-, Availability-, Backup- und Disaster-Recovery-Konzepten

Apply for this position