Tech stack
API
Artificial Intelligence
Amazon Web Services (AWS)
Systems Engineering
Azure
Cloud Computing
Nvidia CUDA
Continuous Integration
InfiniBand
Python
Open Source Technology
PyTorch
Information Technology
Slurm
Job description
- Full-timeEmployment type: Full-time
- €56,000 - €81,500 (XING estimate)
- On-site
- Be an early applicant
Requirements
Der ideale Kandidat bringt einen Bachelor- oder Masterabschluss in Informatik, Systemtechnik oder eine vergleichbare praktische Erfahrung mit. Sie sollten praktische Erfahrungen mit öffentlichen Cloud-Anbietern wie AWS und Azure sowie mit der Verwaltung von Hochleistungs-GPU-Clustern haben, einschließlich der Konfiguration von NVIDIA-Treibern, CUDA-Versionen und Interconnects wie InfiniBand/NCCL. Starke Programmierkenntnisse in Python sind erforderlich, insbesondere im Hinblick auf den Aufbau von Infrastruktur-als-Code-Umgebungen, APIs, CI/CD-Pipelines und Überwachungstools. Sie sollten auch über Kenntnisse in ML-Frameworks verfügen, insbesondere über PyTorch und dessen Optimierung für verteiltes Training, unter Verwendung von Tools wie Ray und Slurm. Beiträge zu Open-Source-Projekten oder relevante Zertifizierungen sind von Vorteil. Persönliche Eigenschaften wie Teamfähigkeit, analytisches Denken und eine hohe Motivation zur kontinuierlichen Verbesserung runden Ihr Profil ab.
Technologien
Python AWS Azure PyTorch
Soft Skills
Teamfähigkeit Analytisches Denken Kommunikation
Erforderliche Sprachen
Deutsch Englisch
Benefits & conditions
Vor Ort
Vollzeit
Mid-Level
vor 20 Tagen
76.000 € - 99.000 € / Jahr
About the company
Das Unternehmen sucht einen engagierten AI Infrastructure Engineer, der Teil eines innovativen Teams wird, das sich der Entwicklung und dem Betrieb von domänenspezifischen KI-Systemen widmet. In dieser Rolle sind Sie verantwortlich für die Architektur von Cloud- und Hardwarelösungen, um KI-Workloads über GPUs und Beschleuniger zu skalieren. Zu Ihren Aufgaben gehört die Optimierung von Speicher und Netzwerken für maximale Durchsatzraten und Kostenkontrolle. Sie werden End-to-End-KI-Systeme entwickeln und betreiben, wobei der Fokus auf der Feinabstimmung und dem skalierbaren Einsatz moderner KI-Modelle liegt. Darüber hinaus unterstützen Sie die MLOps-Schicht, indem Sie Werkzeuge für den zuverlässigen Einsatz, die Echtzeitüberwachung und die kontinuierliche Verbesserung von Modellen im gesamten Lebenszyklus erstellen. Sie gestalten und bauen skalierbare Datenpipelines, die eine hohe Datenverfügbarkeit gewährleisten und effiziente Feedbackschleifen für kontinuierliches Lernen ermöglichen. Zudem
entwerfen Sie robuste KI-Dienste und leiten deren Integration in produktionsbereite Plattformen, um Stabilität und Leistung sicherzustellen. Das Arbeitsumfeld ist geprägt von Teamarbeit, Wertschätzung und einer Leidenschaft für innovative Lösungen, die die Mobilität von morgen gestalten. Entwicklungsmöglichkeiten und ein hohes Maß an Arbeitsplatzsicherheit sind ebenfalls Teil des Angebots.