AI Infrastructure Engineer

Jobriver Hr Service
München, Germany
2 days ago

Role details

Contract type
Permanent contract
Employment type
Full-time (> 32 hours)
Working hours
Regular working hours
Languages
English, German
Compensation
€ 99K

Job location

München, Germany

Tech stack

API
Artificial Intelligence
Amazon Web Services (AWS)
Systems Engineering
Azure
Cloud Computing
Nvidia CUDA
Continuous Integration
InfiniBand
Python
Open Source Technology
PyTorch
Information Technology
Slurm

Job description

  • Full-timeEmployment type: Full-time
  • €56,000 - €81,500 (XING estimate)
  • On-site
  • Be an early applicant

Requirements

Der ideale Kandidat bringt einen Bachelor- oder Masterabschluss in Informatik, Systemtechnik oder eine vergleichbare praktische Erfahrung mit. Sie sollten praktische Erfahrungen mit öffentlichen Cloud-Anbietern wie AWS und Azure sowie mit der Verwaltung von Hochleistungs-GPU-Clustern haben, einschließlich der Konfiguration von NVIDIA-Treibern, CUDA-Versionen und Interconnects wie InfiniBand/NCCL. Starke Programmierkenntnisse in Python sind erforderlich, insbesondere im Hinblick auf den Aufbau von Infrastruktur-als-Code-Umgebungen, APIs, CI/CD-Pipelines und Überwachungstools. Sie sollten auch über Kenntnisse in ML-Frameworks verfügen, insbesondere über PyTorch und dessen Optimierung für verteiltes Training, unter Verwendung von Tools wie Ray und Slurm. Beiträge zu Open-Source-Projekten oder relevante Zertifizierungen sind von Vorteil. Persönliche Eigenschaften wie Teamfähigkeit, analytisches Denken und eine hohe Motivation zur kontinuierlichen Verbesserung runden Ihr Profil ab.

Technologien

Python AWS Azure PyTorch

Soft Skills

Teamfähigkeit Analytisches Denken Kommunikation

Erforderliche Sprachen

Deutsch Englisch

Benefits & conditions

Vor Ort Vollzeit Mid-Level vor 20 Tagen 76.000 € - 99.000 € / Jahr

About the company

Das Unternehmen sucht einen engagierten AI Infrastructure Engineer, der Teil eines innovativen Teams wird, das sich der Entwicklung und dem Betrieb von domänenspezifischen KI-Systemen widmet. In dieser Rolle sind Sie verantwortlich für die Architektur von Cloud- und Hardwarelösungen, um KI-Workloads über GPUs und Beschleuniger zu skalieren. Zu Ihren Aufgaben gehört die Optimierung von Speicher und Netzwerken für maximale Durchsatzraten und Kostenkontrolle. Sie werden End-to-End-KI-Systeme entwickeln und betreiben, wobei der Fokus auf der Feinabstimmung und dem skalierbaren Einsatz moderner KI-Modelle liegt. Darüber hinaus unterstützen Sie die MLOps-Schicht, indem Sie Werkzeuge für den zuverlässigen Einsatz, die Echtzeitüberwachung und die kontinuierliche Verbesserung von Modellen im gesamten Lebenszyklus erstellen. Sie gestalten und bauen skalierbare Datenpipelines, die eine hohe Datenverfügbarkeit gewährleisten und effiziente Feedbackschleifen für kontinuierliches Lernen ermöglichen. Zudem entwerfen Sie robuste KI-Dienste und leiten deren Integration in produktionsbereite Plattformen, um Stabilität und Leistung sicherzustellen. Das Arbeitsumfeld ist geprägt von Teamarbeit, Wertschätzung und einer Leidenschaft für innovative Lösungen, die die Mobilität von morgen gestalten. Entwicklungsmöglichkeiten und ein hohes Maß an Arbeitsplatzsicherheit sind ebenfalls Teil des Angebots.

Apply for this position