Senior Kafka Architect in the Product Cluster Grid Asset

Westhouse Consulting GmbH
Berlin, Germany
14 days ago

Role details

Contract type
Permanent contract
Employment type
Full-time (> 32 hours)
Working hours
Regular working hours
Languages
English, German
Experience level
Senior

Job location

Berlin, Germany

Tech stack

User Authentication
Disaster Recovery
Failover
Metadata
Performance Tuning
Quorum
Role-Based Access Control
Data Logging
Kubernetes
Kafka
Confluent
Microservices

Job description

  • Optimierung der Kafka-Architektur
  • Analyse der bestehenden Kafka-Cluster-Architektur, einschließlich Topologie, Broker-Konfiguration, Replikationsfaktoren und Netzwerkdesign
  • Identifikation von Architektur- und Performance-Schwachstellen
  • Erarbeitung von Optimierungsvorschlägen hinsichtlich Skalierbarkeit, Sicherheit, Ausfallsicherheit, Resiliency, Latenz, Durchsatz und Betriebssicherheit
  • Ableitung konkreter Architektur- und Konfigurationsempfehlungen
  • Dokumentation der Zielarchitektur und Migrationspfade
  • Definition von Verfügbarkeitsanforderungen (SLA, SLO)
  • Konzeption einer hochverfügbaren Kafka-Architektur unter Berücksichtigung von:
  • Multi-Broker- und Multi-Zonen-Setups
  • Replikations- und Partitionierungsstrategien
  • Controller- und Quorum-Design (z. B. KRaft)
  • Bewertung von Failure-Szenarien und deren Auswirkungen
  • Erstellung eines dokumentierten HA-Konzepts inkl. Failover-Strategien
  • Erstellung und Umsetzung eines Konzepts für das Nutzer- und Rechte-Management in Kafka
  • Behandlung von Security Aspekten auf Kubernetes Ebene im Zusammenspiel der Kafka Ressourcen-Verwaltung
  • Migration der Schema-Verwaltung nach ApiCurio
  • Umsetzung und Implementierung der ermittelten Maßnahmen mit dem internen Projektteam
  • Erstellung und Implementierung eines Backup-, Restore- und Disaster-Recovery-Konzepts
  • Analyse der bestehenden Backup- und Wiederherstellungsmechanismen.
  • Definition von RTO- und RPO-Zielen.
  • Konzeption eines Backup- und Restore-Verfahrens für:
  • Kafka-Daten (Topics, Partitionen, Offsets)
  • Konfigurations- und Metadaten
  • Entwicklung eines Disaster-Recovery-Konzepts (z. B. Cross-Cluster-Replikation, MirrorMaker 2)
  • Technische Begleitung bzw. Umsetzung der Implementierung
  • Durchführung und Dokumentation von Wiederherstellungs- und DR-Tests
  • Erstellung eines Betriebskonzepts
  • Definition von Betriebs- und Supportprozessen (Incident-, Change- und Problem-Management)
  • Konzeption von Monitoring-, Logging- und Alerting-Strategien
  • Festlegung von Wartungs-, Update- und Patch-Prozessen
  • Erstellung von Runbooks für Standard- und Störfälle
  • Definition von Rollen, Verantwortlichkeiten und Eskalationswegen

Requirements

  • mind. 5 Jahre Erfahrung als DevOps Engineer UND 3 Jahre als Kafka-Architekt
  • Kafka - Backup-, Restore- und Disaster-Recovery-Verfahren (z. B. MirrorMaker 2, Cluster Replication)
  • sehr gute Kenntnisse in Kafka Hochverfügbarkeitsumgebungen
  • Operationalisierung von Apache Kafka als Kerntechnologie
  • umfangreiches Know-How in Deployments mit ArgoCD und Helm
  • sehr gute Erfahrungen mit Microservices und Containerorchestration
  • sehr gute Deutschkenntnisse und English C1
  • Nice to have:
  • Tiefgehende Kenntnisse in der Architektur von Apache Kafka (Broker, Controller/KRaft, Topics, Partitionen, Replikation)
  • Kenntnisse in Performance-Tuning, Kapazitätsplanung und Troubleshooting
  • Erfahrung mit Sicherheitskonzepten (TLS, Authentifizierung, Autorisierung, ACLs/RBAC)
  • Nachweisliche Erfahrung im Betrieb von Apache Kafka auf Kubernetes
  • Kenntnisse gängiger Kafka-Operatoren (z. B. Strimzi, Confluent Operator)
  • Erfahrung mit StatefulSets, Persistent Volumes, Storage-Klassen und Netzwerk-Policies
  • Fundierte Kenntnisse von Kubernetes-Architektur und -Betrieb (Pods, Nodes, Scheduling, Networking)
  • Erfahrung mit Hochverfügbarkeits- und Multi-Zonen-Setups
  • Erfahrung in der Erstellung von Betriebskonzepten und Runbooks
  • Erfahrung in technischer Beratung und Architekturdesign
  • Fähigkeit zur Analyse bestehender Umgebungen und zur Entwicklung tragfähiger Zielarchitekturen

Apply for this position