MLOps Engineer für den Bereich Künstliche Intelligenz (Artificial Intelligence)
Role details
Job location
Tech stack
Job description
-
Verantwortung für die Weiterentwicklung und den stabilen Betrieb von unternehmensweiten KI-basierten Anwendungen und Services bei Rohde & Schwarz - darunter beispielsweise Self-hosted Large Language Models (LLMs) und Retrieval-Augmented Generation (RAG) in On-Premise- sowie Off-Premise-Umgebungen
-
Erstellung und Weiterentwicklung technischer Architekturen für KI-Anwendungen und -Infrastrukturen mit besonderem Fokus auf Skalierbarkeit, Sicherheit und Integration in die bestehende IT-Landschaft
-
Automatisierung des ML-Lebenszyklus (MLOps): Entwicklung von Strategien zur Automatisierung der Datenvorbereitung, des Modelltrainings, der Modellvalidierung, der Bereitstellung und der Überwachung der Modelqualität im Betrieb
-
Zusammenarbeit mit Data Scientists, DevOps Engineers und Data Engineers zur Integration von ML-Modellen in bestehende Anwendungen und Systeme, sowie die Validierung der Modelle
-
Überwachung und Analyse der Systemlandschaft mithilfe moderner Monitoring-Tools wie Prometheus und Grafana, insbesondere im Kubernetes-Umfeld mit Fokus auf Performanceoptimierung und frühzeitige Problemidentifikation
-
Innovationsfreude und Neugier beim Aufbau neuer Ansätze für den Betrieb von AI-Agent-Systemen - basierend auf Best Practices aus MLOps und LLMOps - sowie beim Erkunden neuer Anforderungen entlang des Lebenszyklus von AI Agents
-
Aufbau und Pflege von CI/CD-Pipelines für ML-Projekte, um eine effiziente Bereitstellung von Modellen zu gewährleisten
-
Optimierung von Data Pipelines auf Basis von Dagster in Kubernetes zur effizienten und automatisierten Verarbeitung großer Datenmengen in den Modellen
-
Anwendung moderner GitOps-Workflows zur automatisierten Verwaltung der K8s-Infrastruktur, Rohde & Schwarz ist ein globaler Technologiekonzern mit aktuell ca. 14.000 Mitarbeitern und drei Divisionen: Test & Measurement, Technology Systems und Networks & Cybersecurity. Seit 90 Jahren entwickelt das Unternehmen Spitzentechnologie, verschiebt die Grenzen des technisch Machbaren und ermöglicht Kunden aus Wirtschaft, Behörden und hoheitlichem Umfeld ihre technologische Souveränität. Die Aufgabe des Rohde & Schwarz-Werkes Teisnach im Bayerischen Wald ist die Fertigung von mechanischen und elektronischen Baugruppen vom Einzelteil bis zum kompletten System für die Investitionsgüterindustrie.
-
Erstellung und Weiterentwicklung technischer Architekturen für KI-Anwendungen und -Infrastrukturen mit besonderem Fokus auf Skalierbarkeit, Sicherheit und Integration in die bestehende IT-Landschaft
-
Automatisierung des ML-Lebenszyklus (MLOps): Entwicklung von Strategien zur Automatisierung der Datenvorbereitung, des Modelltrainings, der Modellvalidierung, der Bereitstellung und der Überwachung der Modelqualität im Betrieb
-
Zusammenarbeit mit Data Scientists, DevOps Engineers und Data Engineers zur Integration von ML-Modellen in bestehende Anwendungen und Systeme, sowie die Validierung der Modelle
-
Überwachung und Analyse der Systemlandschaft mithilfe moderner Monitoring-Tools wie Prometheus und Grafana, insbesondere im Kubernetes-Umfeld mit Fokus auf Performanceoptimierung und frühzeitige Problemidentifikation
-
Innovationsfreude und Neugier beim Aufbau neuer Ansätze für den Betrieb von AI-Agent-Systemen - basierend auf Best Practices aus MLOps und LLMOps - sowie beim Erkunden neuer Anforderungen entlang des Lebenszyklus von AI Agents
-
Aufbau und Pflege von CI/CD-Pipelines für ML-Projekte, um eine effiziente Bereitstellung von Modellen zu gewährleisten
-
Optimierung von Data Pipelines auf Basis von Dagster in Kubernetes zur effizienten und automatisierten Verarbeitung großer Datenmengen in den Modellen
-
Anwendung moderner GitOps-Workflows zur automatisierten Verwaltung der K8s-Infrastruktur
Requirements
- Abgeschlossenes Masterstudium bzw. Diplom im Bereich der Informatik, KI oder vergleichbar
- Mehrjährige Berufserfahrung in der Entwicklung und dem Betrieb von Web-Anwendungen, sowie Containerisierung und Cloud-Technologien wie Kubernetes
- Fundierte Kenntnisse in der Programmiersprache Python
- Erfahrung in der Erstellung von Software-Architekturen
- Gutes Verständnis für das Umfeld KI, gängigen KI Modellen wie LLMs und in der Praxis wichtigen technologischen Ansätzen wie RAG. Verständnis für die Risiken von KI und insb. GenAI im Betrieb (e.g. Robustheit, Data Drift, Halluzination von LLMs) sind definitiv ein Plus
- Erste Erfahrungen im Bereich Operationalisierung und Betrieb von LLM-basierten Anwendungen und Services (LLMOps) ideal
- Gutes Verständnis von KI-relevanten Technologien wie Data Pipelines und DataOps
- Fähigkeit, komplexe technische Probleme zu analysieren und kreative Lösungen zu entwickeln
- Teamfähigkeit, Kommunikationsstärke und eine proaktive Arbeitsweise
- Sehr gute Deutsch- und Englischkenntnisse in Wort und Schrift