DevOps / Platform Engineer
Role details
Job location
Tech stack
Job description
Du übernimmst Verantwortung für den stabilen Betrieb, die Weiterentwicklung der Infrastruktur und die Automatisierung rund um Segmente, Kundenumgebungen und Plattformdienste (Opensearch, Media CDN, S3/MinIO, RabbitMQ, Monitoring).
Das Team ist klein und hochtechnisch - entsprechend ist die Rolle geprägt von hoher Eigenverantwortung, direktem Impact und kurzen Wegen zu Produkt- und Dev-Teams.
Deine Aufgaben
Betrieb & Reliability Du betreibst und erweiterst die Hubble-Segmente (Loadbalancer, Web-, MySQL-, Opensearch-, MinIO-, Redis-Server), inklusive Kapazitätsplanung, Patch-Management und Incident Response. Du arbeitest an der Weiterentwicklung unseres Monitoring-Stacks (Grafana, UptimeRobot, Sitespeed Dashboard) und sorgst für belastbare SLOs.
Automatisierung & Provisionierung Du baust Ansible-Playbooks, Inventories und Tooling weiter aus, sodass neue Kundenumgebungen, Service Groups und Segmente möglichst reibungslos und reproduzierbar ausgerollt werden können. Ziel: die aktuell 2h-Bereitstellungszeit für ein Segment und die Minuten-Bereitstellung einzelner Service Groups konsequent weiter reduzieren.
Plattform-Services Du verantwortest und weiterentwickelst die Plattform-Dienste - Opensearch-Cluster, Media CDN v2 (IMGProxy), RabbitMQ, S3-Storage (MinIO), Elasticsearch-Hosting V2 (inkl. LXD-VMs, WireGuard, eslb) - inklusive Upgrade-Pfaden und Migrationsstrategien.
Sicherheit Du pflegst und erweiterst unser Sicherheitskonzept (AppArmor-Profile, sgexec, Service-Group-Isolation, TLS inkl. Post-Quantum-Kex, HSTS, Let's Encrypt Short Lifetimes) und bewertest neue Mitigations und Hardening-Maßnahmen.
CI/CD & Developer Experience Du unterstützt Dev-Teams bei GitLab-CI/CD-Deployments auf die Plattform, verbesserst die Entwicklererfahrung (Logs, Debugging, Limits-Transparenz) und stellst sicher, dass moderne DevOps-Workflows sauber mit den Legacy-Deployment-Mechanismen (FTP, eigener Mechanismus) koexistieren.
Projektarbeit Du bringst dich in Themen wie Node.js-Hosting, Containerisierung, Traffic-/Kostenmodellierung und produktnahe Roadmap-Entscheidungen ein - z. B. im Rahmen des Hubble-Cloud-Meetings., * Ein klar umrissener, eigener Hosting-Stack (kein "noch ein generisches Kubernetes-Setup") mit viel Raum, ihn mitzugestalten
- über 20 Kolleg:innen in der Entwicklung mit hochtechnische Foku
- sehr kurze Entscheidungswegen
- Moderne Sicherheits- und TLS-Themen (Post-Quantum, kurze Zertifikatslaufzeiten) sind Alltag, nicht Sonntagsthema
- Transparente Kommunikation über Confluence, wiederkehrendes Hubble-Cloud-Meeting mit DauerprotokollRemote-freundliches Arbeiten
- strukturierte Einarbeitung mit einem Buddy an deiner Seite
- Verantwortung für eigene Projekte sowie zusätzliche strukturelle und konzeptionelle Aufgaben im Rahmen der technologischen Entwicklung
- Budget für individuelle Fortbildungen, Konferenzen etc.
- durch den Arbeitgeber finanzierte betriebliche Altersversorgung
- Zuschuss zum Job-Ticket
- Einkaufsvorteile durch Corporate Benefits, * gute Work-Life-Balance - alle Kolleg:innen haben eine gewisse Freiheit zu entscheiden, ob sie im Büro, im Home Office oder im Mix arbeiten und wie sie sich die Arbeitszeit einteilen
- Freitag finden unsere Sessions statt - hier nehmen wir uns Zeit zum Lernen und für Wissenstransfer
- wir feiern unsere Projekterfolge gemeinsam im Team
- regelmäßige Team-Events
- Teamfrühstück, Getränke-Flatrate, frisches Obst und immer was Leckeres zum Snacken
Wie arbeiten wir?
- 40 Stunden Woche
- flexible Arbeitszeiten - mit einer Kernarbeitszeit zur Sicherstellung der Abstimmung mit Kolleg:innen & Kund:innen
- mobiles Arbeiten ist möglich, regelmäßiger Kontakt mit den Kolleg:innen im Office muss sichergestellt sein
- 30 Tage Urlaub
Requirements
- Linux-Administration auf Senior-Niveau (Ubuntu LTS), inklusive Systemd, Netzwerk-Stack, Kernel-/Performance-Troubleshooting (strace, perf, sysstat)
- Erfahrung mit Configuration Management, vorzugsweise Ansible (Rollen, Inventories, idempotente Playbooks)
- Web-Stack-Betrieb: nginx, Apache2, PHP-FPM (mehrere PHP-Versionen parallel), TLS/Let's Encrypt
- Datenbanken: MySQL/MariaDB inkl. Replikation und HA, Redis
- Search: Elasticsearch oder Opensearch - Betrieb von Clustern, Index-/Shard-Management
- Cloud-Infrastruktur, idealerweise Hetzner Cloud (oder vergleichbar: AWS/GCP/Hetzner Robot), inklusive VPC-/Netzwerksetup
- Sicherheit: Linux-Hardening, AppArmor oder SELinux, TLS-Hygiene, Umgang mit Multi-Tenant-Isolationsanforderungen
- Monitoring & Observability: Grafana, Prometheus oder vergleichbar, Logaggregation
- Shell-Skripting und mindestens eine höhere Sprache (Python, Go oder PHP) zum Schreiben von Tooling
- CI/CD, insbesondere GitLab CI/CD
- Arbeitsweise: strukturiert, dokumentationsfreudig (Confluence/Markdown), kommunikationsstark auf Deutsch; Bereitschaft, Verantwortung für Produktivsysteme zu übernehmen
- Bereitschaft und Verantwortung übernehmen in unseren Monitoring- und On-Call-Prozessen
Nice-to-Have
- Erfahrung mit Shopware 6 oder anderen großen PHP-Plattformen (Magento, Akeneo) im Betrieb
- LXD / LXC, Docker, optional Kubernetes
- Messaging: RabbitMQ-Betrieb inkl. Clustering
- Object Storage: MinIO, Garage oder S3-Kompatibles
- WireGuard / VPN-Architekturen
- Image-Processing-Pipelines: IMGProxy, AVIF/WEBP, CDN-Konzepte
- Erfahrung mit PWA-/Node.js-Hosting und headless-Commerce-Stacks
- Beiträge zu Open Source oder internen Tools (eigene Deployment-/Orchestrierungs-Werkzeuge)
- Kenntnisse moderner TLS-Themen (PQ-Kex, Certificate Automation)
Benefits & conditions
Gehalt: 50.000,00€ - 75.000,00€ pro Jahr, * Betriebliche Altersvorsorge
- Betriebliche Weiterbildung
- Flexible Arbeitszeiten
- Kostenlose Getränke