Cloud Engineer MLOps
GuideCom AG
Münster, Germany
yesterday
Role details
Contract type
Permanent contract Employment type
Full-time (> 32 hours) Working hours
Regular working hours Languages
GermanJob location
Münster, Germany
Tech stack
Artificial Intelligence
Cloud Computing
Cloud Engineering
Machine Learning
Data Logging
Large Language Models
Containerization
Kubernetes
Machine Learning Operations
Job description
- Du gestaltest den Ausbau unserer AI/ML-Plattform aktiv mit und sorgst dafür, dass unsere LLM-basierten Machine-Learning-Systeme stabil, skalierbar und effizient betrieben werden können.
- Du verantwortest zentrale Bausteine für den produktiven Einsatz moderner AI-Workloads und entwickelst die technische Basis für einen zuverlässigen Betrieb konsequent weiter.
- Du arbeitest an hochperformanten GPU-Clustern für Training und Inferenz und orchestrierst anspruchsvolle Workloads auf Kubernetes.
- Du entwickelst unsere Deployments mit GitOps-Methoden weiter und schaffst die Voraussetzungen für verlässliche, sichere und wirtschaftliche Betriebsprozesse.
- Du arbeitest eng mit dem AI & Innovation Team, Entwicklern sowie weiteren internen Schnittstellen zusammen und bringst Anforderungen in eine tragfähige technische Umsetzung.
- Du trägst dazu bei, dass aus neuen Ideen belastbare produktive Lösungen werden und unsere Plattform die User im Alltag wirksam unterstützt.
Requirements
- Du bringst mehrere Jahre Erfahrung in MLOps, Cloud- oder Plattformengineering mit und kennst den produktiven Betrieb von ML- oder LLM-Workloads aus eigener Praxis.
- Du verfügst über sehr gute Kenntnisse in Kubernetes und Containerisierung und hast idealerweise bereits GPU-basierte Workloads in produktiven Umgebungen betrieben.
- Du arbeitest sicher mit GitOps, ArgoCD und Infrastructure as Code und setzt Deployments nachvollziehbar, stabil und wartbar auf.
- Du denkst Betrieb ganzheitlich und nutzt Monitoring, Logging und Observability gezielt, um Qualität, Transparenz und Verlässlichkeit sicherzustellen.
- Du bewegst Dich souverän zwischen Infrastruktur, Plattform und Anwendungsnähe und findest Lösungen, die technisch tragfähig und im Alltag gut nutzbar sind.
- Du arbeitest strukturiert, übernimmst Verantwortung und bringst technische Themen gemeinsam mit unterschiedlichen Schnittstellen in eine wirksame Umsetzung.