AI Infrastructure Engineer

Jobriver Hr Service

München, Germany

2 days ago

Role details

Contract type

Permanent contract

Employment type

Full-time (> 32 hours)

Working hours

Regular working hours

Languages

English, German

Compensation

€ 99K

Job location

München, Germany

Tech stack

API

Artificial Intelligence

Amazon Web Services (AWS)

Systems Engineering

Azure

Cloud Computing

Nvidia CUDA

Continuous Integration

InfiniBand

Python

Open Source Technology

PyTorch

Information Technology

Slurm

Job description

Full-timeEmployment type: Full-time
€56,000 - €81,500 (XING estimate)
On-site
Be an early applicant

Requirements

Der ideale Kandidat bringt einen Bachelor- oder Masterabschluss in Informatik, Systemtechnik oder eine vergleichbare praktische Erfahrung mit. Sie sollten praktische Erfahrungen mit öffentlichen Cloud-Anbietern wie AWS und Azure sowie mit der Verwaltung von Hochleistungs-GPU-Clustern haben, einschließlich der Konfiguration von NVIDIA-Treibern, CUDA-Versionen und Interconnects wie InfiniBand/NCCL. Starke Programmierkenntnisse in Python sind erforderlich, insbesondere im Hinblick auf den Aufbau von Infrastruktur-als-Code-Umgebungen, APIs, CI/CD-Pipelines und Überwachungstools. Sie sollten auch über Kenntnisse in ML-Frameworks verfügen, insbesondere über PyTorch und dessen Optimierung für verteiltes Training, unter Verwendung von Tools wie Ray und Slurm. Beiträge zu Open-Source-Projekten oder relevante Zertifizierungen sind von Vorteil. Persönliche Eigenschaften wie Teamfähigkeit, analytisches Denken und eine hohe Motivation zur kontinuierlichen Verbesserung runden Ihr Profil ab.

Technologien

Python AWS Azure PyTorch

Soft Skills

Teamfähigkeit Analytisches Denken Kommunikation

Erforderliche Sprachen

Deutsch Englisch

Benefits & conditions

Vor Ort Vollzeit Mid-Level vor 20 Tagen 76.000 € - 99.000 € / Jahr

About the company

Das Unternehmen sucht einen engagierten AI Infrastructure Engineer, der Teil eines innovativen Teams wird, das sich der Entwicklung und dem Betrieb von domänenspezifischen KI-Systemen widmet. In dieser Rolle sind Sie verantwortlich für die Architektur von Cloud- und Hardwarelösungen, um KI-Workloads über GPUs und Beschleuniger zu skalieren. Zu Ihren Aufgaben gehört die Optimierung von Speicher und Netzwerken für maximale Durchsatzraten und Kostenkontrolle. Sie werden End-to-End-KI-Systeme entwickeln und betreiben, wobei der Fokus auf der Feinabstimmung und dem skalierbaren Einsatz moderner KI-Modelle liegt. Darüber hinaus unterstützen Sie die MLOps-Schicht, indem Sie Werkzeuge für den zuverlässigen Einsatz, die Echtzeitüberwachung und die kontinuierliche Verbesserung von Modellen im gesamten Lebenszyklus erstellen. Sie gestalten und bauen skalierbare Datenpipelines, die eine hohe Datenverfügbarkeit gewährleisten und effiziente Feedbackschleifen für kontinuierliches Lernen ermöglichen. Zudem entwerfen Sie robuste KI-Dienste und leiten deren Integration in produktionsbereite Plattformen, um Stabilität und Leistung sicherzustellen. Das Arbeitsumfeld ist geprägt von Teamarbeit, Wertschätzung und einer Leidenschaft für innovative Lösungen, die die Mobilität von morgen gestalten. Entwicklungsmöglichkeiten und ein hohes Maß an Arbeitsplatzsicherheit sind ebenfalls Teil des Angebots.

Role details

Job location

Tech stack

Job description

Requirements

Benefits & conditions

About the company

Apply for this position

Good distractions

Moments

Videos View all