DevOps/Platform Engineer
Comma Soft AG
Bonn, Germany
5 days ago
Role details
Contract type
Permanent contract Employment type
Full-time (> 32 hours) Working hours
Shift work Languages
German, English Experience level
IntermediateJob location
Bonn, Germany
Tech stack
Artificial Intelligence
Software as a Service
Cloud Computing
Databases
Continuous Integration
DevOps
Network Security
Reliability Engineering
Autoscaling
Multi-Cloud
GIT
Kubernetes
Terraform
Job description
- Du übernimmst Ownership für zentrale Plattform-/Serving-Komponenten
- Du betreibst K8s-Cluster, Networking (Ingress), Storage (Datenbanken, Snapshots) und OS/Kernel-Patching und stellst deren sicheren und stabilen Betrieb sicher
- Du modellierst Multi-Cloud-Ressourcen (insb. Open Telekom Cloud) per Konsole und IaC (Terraform)
- Du baust CI/CD-Pipelines und Release-/Versionierungs-/Rollback-Strategien auf
- Im Bereich Observability & Site Reliability Engineering implementierst du OpenTelemetry-basiertes Tracing, Metrics und Logs, definierst SLIs/SLOs, Alerting und Error Budgets
- Gemeinsam mit unseren AI Engineers stellst du die Plattform für Model Serving bereit: GPU-Scheduling, Autoscaling, Inference-Gateways, Observability (Latency/QPS/Token-Kosten)
Requirements
- Du hast dein Masterstudium oder deine Promotion in einem der MINT-Fächer oder einem geisteswissenschaftlichen Fach mit MINT-Vertiefung erfolgreich abgeschlossen
- Du verfügst über mindestens 2 Jahre relevante Berufserfahrung in den Bereichen DevOps, Site Reliability Engineering oder Platform Engineering und hast nachweisliche Verantwortung für Kubernetes, IaC, CI/CD, Observability sowie den produktiven Betrieb übernommen - idealerweise im SaaS-Umfeld
- Du besitzt Praxis-Know-how in Git-basierten Deployments, modularer IaC, Secret-/Config-Management sowie Incident-Erfahrung
- Du hast Security-Fachwissen in Netzwerksicherheit, Secrets, Härtung (CIS), Software-Supply-Chain und Zugriffsprinzipien (Least Privilege)
- Idealerweise bringst du erste Praxiserfahrung im Betrieb von Inferenz-Workloads (vLLM o. ä.), GPU-Capacity-Management, Autoscaling und Observability, mit
- Dich zeichnen Neugier und Wissbegierde sowie eine ausgeprägte Problemlösungs- und Kommunikationsfähigkeit aus
- Du kommunizierst überzeugend und effizient in deutscher und englischer Sprache
Benefits & conditions
- Du arbeitest an einer hochmodernen, skalierbaren AI-Plattform mit viel Gestaltungsspielraum und übernimmst früh Verantwortung für zentrale Infrastruktur- und Architekturentscheidungen
- Mit deinen zukünftigen Kolleg:innen tauschst du dich fachlich auf Augenhöhe aus und erhältst Budget und Zeit für eure eigenen Innovationsprojekte
- Du wächst bei uns fachlich und persönlich durch speziell auf dich abgestimmte Weiterbildungen, Zertifizierungen und Laufbahnprogramme
- In deinen Spezialgebieten kannst du deinen Schwerpunkt setzen und ausbauen
- Neben einem attraktiven Fixgehalt zzgl. Umsatz- und Ergebnisbeteiligung kannst du Überstunden ausgleichen und Reisezeiten als Arbeitszeit buchen
- Durch freie Wahl des Arbeitsorts und flexible Arbeitszeit gestaltest du deinen Arbeitsalltag passend zu deinem Lebensstil
- Dich erwarten außerdem ein top ausgestatteter Arbeitsplatz, JobRad, Body & Mind Workout, GamesNights, Grillen auf unserer Dachterrasse, Team-Aktionen mit unternehmungslustigen Kolleg:innen, Sommerfeste mit deinen Familienmitgliedern und viele weitere Benefits