AI Platform / Aiops Engineer

SURF
2 days ago

Role details

Contract type
Temporary to permanent
Employment type
Full-time (> 32 hours)
Working hours
Regular working hours
Languages
Dutch, English
Compensation
€ 7.8K

Job location

Remote

Tech stack

Artificial Intelligence
Amazon Web Services (AWS)
Bash
Cloud Engineering
Nvidia CUDA
Continuous Integration
Linux
Graphical User Interface
Identity and Access Management
Python
Lightweight Directory Access Protocols (LDAP)
Open Source Technology
Role-Based Access Control
Ansible
Prometheus
Software Engineering
AI Infrastructure
Data Logging
Saltstack
Large Language Models
Grafana
Jupyter
Git Flow
Kubernetes
ONNX (Open Neural Network Exchange) Format
Slurm
Machine Learning Operations
TensorRT
Terraform
Docker

Job description

Ben je klaar om de ruggengraat van de Nederlandse AI Factory te bouwen en te beheren, waar high-performance computing, cloud-native technologieën en AI samenkomen? Bij SURF speel je een sleutelrol bij het ontwerpen en opschalen van een AI-platform van de volgende generatie dat baanbrekend onderzoek en innovatie in heel Nederland mogelijk maakt. Klinkt het opzetten van de infrastructuur achter de Europese AI-ambities als een uitdaging die bij je past? Solliciteer dan nu. Hier ga je werken SURF is de ict-coöperatie van Nederlandse onderwijs- en onderzoeksinstellingen. Samen met hen werken we aan digitale diensten en complexe innovatievraagstukken om de kwaliteit van onderwijs en onderzoek te verhogen.

Als AI Platform / AIOps Engineer bij SURF bouw en beheer je de diensten en de orchestration-laag van de Dutch AI Factory. Je werkt aan de integratie van Slurm en Kubernetes, implementeert MLOps-tools en infrastructuur voor het aanbieden van modellen, en zorgt ervoor dat onderzoekers, bedrijven en overheidsorganisaties AI-workloads betrouwbaar en op schaal kunnen uitvoeren. Je werkt op het snijvlak van high-performance computing, cloud-native technologieën en AI-infrastructuur.

  • Het ontwerpen en implementeren van sandbox-omgevingen op gecontaineriseerde HPC/Kubernetes-infrastructuur
  • Het bouwen van de Slurm * Kubernetes-integratie, inclusief IAM, accounting/quotas, logging, monitoring en gebruikersinterfaces.
  • Het implementeren en beheren van MLOps- en runtime-services, zoals het bijhouden van experimenten, CI/CD-pijplijnen en model serving (Triton, vLLM, TensorRT-LLM, ONNX Runtime)
  • Het ontwikkelen van portabiliteitstools om workflows te verplaatsen tussen AI Factory-omgevingen, institutionele systemen en cloudplatforms
  • Implementeren van LLM/GPAI-sandboxes met veiligheidsfilters, logboekregistratie, rate limiting en monitoring
  • Implementeren van energiebewuste planning en duurzaamheidsdashboards
  • Ondersteunen van de EuroHPC-federatie en interoperabiliteit met andere AI Factories
  • Verstrekken van infrastructuur voor co-creatie en toegang (bijv. Jupyter, VS Code, projectruimtes) Dit breng je mee Je bent een ervaren engineer met een sterke technische basis en een duidelijke focus op schaalbare, toekomstbestendige oplossingen. Je brengt structuur in complexe situaties, communiceert helder en werkt zelfverzekerd in hoogwaardige, gedistribueerde infrastructuuromgevingen.

Requirements

  • BSc/MSc-niveau in informatica, software engineering of gelijkwaardig

  • Ruime ervaring met Kubernetes (operators, Helm, namespaces, RBAC, netwerken)

  • Ervaring met containertechnologieën (Docker/Podman, containerregisters, CI/CD)

  • Kennis van of ervaring met HPC-schedulers (Slurm) en Linux-systeembeheer

  • Ervaring met monitoring en observability (Prometheus, Grafana, ELK/Loki)

  • Een Infrastructure-as-Code-mentaliteit (Terraform, Ansible, SaltStack, GitOps)

  • Goede beheersing van Python en/of Go; Bash-scripting

  • Uitstekende beheersing van het Engels; Nederlands is een pluspunt Sterke pluspunten

  • Ervaring met GPU-scheduling en NVIDIA-tools (CUDA, MIG, MPS, GPU Operator)

  • Kennis van model-serving frameworks (Triton, vLLM, TGI, Ray Serve)

  • Ervaring met MLOps-platforms (MLflow, Kubeflow, Weights & Biases)

  • Kennis van identiteitsfederatie (SRAM, eduGAIN, OIDC, LDAP)

  • Ervaring met high-performance opslag (parallelle bestandssystemen, S3/objectopslag)

  • Bijdragen aan open source

Benefits & conditions

We nodigen je uit op ons kantoor, want we willen je leren kennen. Tweede gesprek We nodigen je nogmaals uit voor een gesprek met anderen die jou ook willen leren kennen. Assessment Eventueel vragen we je om een opdracht (assessment) te doen. Ben je de juiste persoon? Dan ontvang je een salarisaanbod van één van onze HR-adviseurs. Welkom bij SURF! Je sluit aan bij onboardingactiviteiten met andere nieuwe collega's. Locatie Science Park, 140, 1098 XG, Amsterdam, Netherlands Opleidingsniveau WO Dienstverband Bepaalde tijd met intentie tot onbepaalde tijd Salaris €5450 - €7786 Uren per week 32-40 uur Deadline 24 juni 2026 Inhoudelijke vragen Vragen over procedure SURF Recruitment Dit krijg je van ons:

  • Uitgebreide opleidingsmogelijkheden
  • 8,33 procent vakantiegeld
  • 8,33 procent eindejaarsuitkering
  • 36 vakantiedagen per jaar (op basis van een 40-urige werkweek)
  • Een goede pensioenregeling
  • Een NS-Business Card 1e klas
  • Stoelmassages
  • Thuiswerkvergoeding Tot slot nog dit...

About the company

Werken bij SURF betekent deel uitmaken van een unieke en open organisatie. Dat merk je aan alles: de organisatiestructuur, de samenstelling van de projectteams, de cultuur op onze kantoren en de sfeer onder collega's. SURF biedt uitstekende arbeidsvoorwaarden en hanteert een flexibele benadering van de balans tussen werk en privé. Medewerkers werken graag zelfstandig en iedereen krijgt de ruimte en vrijheid om zijn of haar talenten zo effectief en breed mogelijk in te zetten en te ontwikkelen. In dit team kom je terecht Je komt terecht in het AI Systems-team binnen de afdeling Advanced Solutions for Research. Je collega's houden zich bezig met het trainen van taalmodellen zoals OpenEuroLLM en GPT-NL, en adviseren onderzoekers over het optimale gebruik van de Snellius-supercomputer voor AI-taken. Je werkt met Python aan een snelgroeiend AI-platform. Het team kenmerkt zich door een open en samenwerkingsgerichte cultuur, met een sterke focus op kennisdeling en onderlinge ondersteuning.

Apply for this position