Machine Learning Infrastructure and Data Engineer
Role details
Job location
Tech stack
Job description
Wollen Sie die Zukunft des Gesundheitswesens mitgestalten? Wir bei Siemens Healthineers setzen auf Menschen, die ihre Energie und Leidenschaft diesem Ziel widmen - das sagt schon unser Unternehmensname. Siemens Healthineers steht für Pioniergeist unserer Mitarbeitenden, gepaart mit unserer langen Tradition als weltweit führender Technologiekonzern in der stets dynamischen Gesundheitsbranche. Wir bieten ein flexibles und dynamisches Umfeld voller Gelegenheiten, über sich hinaus zu wachsen, um sich persönlich und beruflich weiterzuentwickeln. Klingt das interessant für Sie?
Dann werden Sie Teil unseres globalen Teams als Machine Learning Infrastructure Engineer (w/m/d), um unsere ML-Infrastruktur weiterzuentwickeln.
Wählen Sie den besten Ort für Ihre Arbeit - im Rahmen dieser Stelle ist es in Abstimmung mit Ihrer Führungskraft möglich, bis zu einem durchschnittlichen Volumen von 60% der jeweiligen Arbeitszeit mobil (innerhalb Deutschlands) zu arbeiten.
Noch mehr Flexibilität? Mobiles Arbeiten aus dem Ausland ist unter bestimmten Voraussetzungen und in ausgewählten Ländern für bis zu 30 Tage im Jahr möglich., * Sie koordinieren und warten einen GPU-Cluster für maschinelles Lernen (NVIDIA DGX) sowie die cloudbasierte Trainingsinfrastruktur und führen regelmäßige Systemupdates und Wartungsaufgaben durch.
- Sie verwalten Kubernetes-Cluster zur Orchestrierung von Workloads über mehrere Knoten hinweg und übernehmen die Optimierung des Clusters gemeinsam mit Datenwissenschaftlerinnen und Ingenieurinnen für ML-Workloads.
- Sie sind für die Überwachung der Systemleistung zuständig, beheben auftretende Probleme und unterstützen Benutzer*innen bei der Optimierung von Trainingsleistung und Effizienz.
- Sie treiben die Implementierung und Pflege von Sicherheitsprotokolle und Best Practices und sorgen für nahtlose Konnektivität zu Speicher-Servern (lokal und Cloud).
- Sie verwalten Datenspeicherprozesse, einschließlich Sicherung, Versionierung, Wiederherstellung und überwachen kontinuierlich die Datenabläufe.
Mehr über dieses Geschäftsfeld erfahren Sie unter Magnetresonanztomographie
Requirements
- Sie verfügen über einen Hochschulabschluss in Informatik, Mathematik, Ingenieurwesen oder einem vergleichbaren Fachgebiet und verfügen über mehrere Jahre Erfahrung in der Machine-Learning-Administration, idealerweise in der medizinischen Bildgebung oder im Healthcare-Bereich.
- Sie verwalten GPU-Cluster (insbesondere NVIDIA DGX), Storage-Server und Cloud-Infrastrukturen und haben fundierte Kenntnisse in Netzwerkkonfigurationen sowie im Troubleshooting.
- Sie verfügen über fundierte praktische Erfahrung mit Kubernetes, Linux-Systemadministration, Shell-Scripting sowie Skriptsprachen wie Python, Bash oder PowerShell zur Automatisierung von Aufgaben.
- Sie sind vertraut mit Monitoring-Tools (z. B. Prometheus, Grafana) und Logging-Systemen und besitzen grundlegende Kenntnisse in der Windows-Systemadministration.
- Sie haben bereits Erfahrung in der Implementierung und der Pflege von Sicherheitsmaßnahmen für IT-Infrastrukturen und sorgen für die reibungslose Konnektivität und den stabilen Betrieb von IT-Systemen., * Sie kommunizieren sicher auf Englisch, da die Entwicklungsteams des Application Release Train international an drei Standorten verteilt sind.
- Sie engagieren sich proaktiv dafür, unseren Kund*innen die bestmöglichen Lösungen zu liefern, denn wir gewinnen gemeinsam.
- Sie präsentieren Ihre Ideen und Ergebnisse selbstbewusst und überzeugend in funktionsübergreifenden Entwicklungsteams.
- Sie zeichnen sich durch ausgeprägte Team- und Kooperationsfähigkeiten sowie Durchsetzungsstärke aus.
- Sie stellen höchste Qualitätsstandards in der Produktentwicklung selbstverständlich sicher.