Data Engineer MLT

Mlt

Rosmalen, Netherlands

2 days ago

Role details

Contract type

Permanent contract

Employment type

Part-time (≤ 32 hours)

Working hours

Regular working hours

Languages

Dutch

Experience level

Senior

Job location

Rosmalen, Netherlands

Tech stack

API

Artificial Intelligence

Data analysis

Azure

Continuous Integration

Information Engineering

Python

Machine Learning

Snowflake

GIT

Pytest

PySpark

Information Technology

Machine Learning Operations

Docker

Databricks

Job description

Voor Nederlandse Spoorwegen zoeken wij een Data Engineer MLT. Je bouwt aan een nieuw prognoseproduct dat directe invloed heeft op strategische beslissingen, zoals materieelplanning en investeringskeuzes. Je werkt in een nieuw multidisciplinair team met data engineers en vervoerskundigen, waar jouw ideeën en technische standaard het verschil maken. Je combineert puzzelen, modelleren en codekwaliteit met maatschappelijke impact: zo draag je bij aan het duurzaam bereikbaar houden van Nederland. Je bouwt iets dat nog niet bestaat in een nieuw team. Je duikt in de materie, puzzelt met data en werkt samen met verschillende disciplines aan een model dat jarenlang impact zal hebben op de opdrachtgever. Binnen de opdrachtgever ontwikkelt Cluster Reizigersstromen prognoses om reizigersstromen te begrijpen, voorspellen en te vertalen naar strategische keuzes. Deze inzichten zijn essentieel voor lange termijncapaciteitsplanning, de dienstregeling, investeringen in materieel en toekomstige dienstverlening. Jij werkt mee in het nieuw te vormen team dat het middellangetermijn (MLT) prognoseproduct opnieuw intern ontwikkelt-een product met grote impact op de toekomst van de opdrachtgever. Als data engineer bouw je aan het nieuwe MLT prognosemodel, inclusief de noodzakelijke datapipelines, modellogica en kwaliteitscontroles voor robuuste, betrouwbare en uitlegbare prognoses. Met jouw sterke Python engineeringvaardigheden en focus op codekwaliteit en modellogica lever je een belangrijke bijdrage aan een toekomstvast product dat breed wordt ingezet. Je borgt de codekwaliteit door tests te schrijven, uitzonderingssituaties af te dekken en je keuzes helder vast te leggen, zodat anderen hiermee verder kunnen. Je werkt samen met een nieuw team aan innovatieve oplossingen, neemt initiatief en blijft puzzelen tot je een solide uitkomst hebt-ook wanneer nog niet alles is uitgedacht. Je schakelt veel met specialisten uit andere vakgebieden, stelt slimme vragen en maakt technische besluiten begrijpelijk voor iedereen. Je denkt kritisch, onderzoekt grondig en durft aannames te bevragen om het model en de kwaliteit continu te verbeteren. Nieuwe tools en technieken pak je snel en zelfstandig op, waardoor je zelf verbeteringen doorvoert. Met jouw bouwkracht en kwaliteitsgerichtheid ben jij van onschatbare waarde bij het:

Ontwikkelen van het nieuwe MLT prognoseproduct dat strategische beslissingen voor de komende 20 jaar ondersteunt.
Ontwerpen en bouwen van schaalbare datapipelines (Python, PySpark/Polars, Databricks).
Schrijven van schone, onderhoudbare en goed geteste code, inclusief testautomatisering en CI/CD structuur.
Uitwerken en automatiseren van scenario analyses samen met vervoerskundigen en domeinexperts.
Samenwerken met team Proteus om het product te laten aansluiten op het clusterbrede prognoseplatform.
Vertalen van complexe modelbehoeften naar robuuste, duurzaam implementeerbare technische oplossingen.

Requirements

Je hebt een relevante afgeronde hbo-/wo-opleiding, bijvoorbeeld in (toegepaste) wiskunde, data science, AI of informatica.
Je hebt minimaal 5 jaar recente ervaring op het gebied van data engineering of ML engineering, in een Advanced Analytics of data science team, waarbij je dataproducten hebt gebouwd, getest, gereleased en beheerd. Je kunt helder uitleggen hoe je een product van idee tot livegang brengt.
Je hebt recente ervaring met het toepassen van (data/software) engineering skills in het data domein.
Je hebt recente ervaring met het ontwerpen van dataproducten en het beschikbaar stellen hiervan voor afnemers.
Je hebt recente ervaring met het ontwikkelen van data pipelines en schaalbare Python API's in de (Azure) cloud. Je schrijft gestructureerde code, werkt met packages, API's en CI/CD-processen en houdt rekening met onderhoudbaarheid en overdraagbaarheid.
Je hebt ervaring en kennis van (een deel van) de volgende tooling en technieken (of equivalenten) in productie: Python, PySpark, Polars, Databricks, Git, MLFlow, Docker, Snowflake.
Je richt een volwassen Dev-/MLOps-omgeving in, maakt snel nieuwe tooling en technieken eigen, neemt verantwoordelijkheid voor de kwaliteit en stabiliteit van dataproducten, schrijft schone, goed geteste code (Python, Pytest), bent kritisch op details en edge cases, en bent communicatief en flexibel.
Lef, samenwerking en resultaatgerichtheid zijn belangrijk om samen doelen te behalen en elkaar aan te spreken en open te staan voor verandering.

Je hebt passie voor data engineering en levert graag een bijdrage aan duurzame mobiliteit. Jouw ambitie en visie maken het verschil en je voelt je thuis in een dynamische, multidisciplinaire omgeving.

Je bent in loondienst en er worden loonbelasting en premies volks- en werknemersverzekeringen (WW, WAO, WIA en ZW) voor je afgedragen. Je bent geen zelfstandig ondernemer, zzp'er of directeur-grootaandeelhouder zonder werknemersverzekeringen.
Je beschikt over een relevante afgeronde hbo- of wo-opleiding, bijvoorbeeld in (toegepaste) wiskunde, data science, AI of informatica.
Je hebt minimaal 5 jaar recente ervaring met data engineering of ML engineering binnen een Advanced Analytics- of data science-team, waarbij je dataproducten hebt gebouwd, getest, gereleased en beheerd. Je kunt helder uitleggen hoe je een product van idee tot livegang brengt.
Je hebt recente ervaring met het toepassen van (data/software) engineering skills in het datadomein.
Je beheerst de Nederlandse taal uitstekend, zowel mondeling als schriftelijk.
Je hebt recente ervaring met het ontwerpen van dataproducten en het beschikbaar stellen hiervan aan afnemers.
Je hebt ervaring met het ontwikkelen van data pipelines en schaalbare Python API's in de (Azure) cloud.
Je schrijft gestructureerde code, werkt met packages, API's en CI/CD-processen, en houdt daarbij rekening met onderhoudbaarheid en overdraagbaarheid.
Je hebt ervaring en kennis van (een deel van) de volgende tooling en technieken (of equivalenten) in productie: Python, PySpark, Polars, Databricks, Git, MLFlow, Docker en Snowflake.
Je hebt een relevante afgeronde hbo-/wo-opleiding, bijvoorbeeld in de richting (toegepaste) wiskunde, data science, AI of informatica
Je hebt minimaal 5 jaar recente ervaring op het gebied van data engineering of ML engineering, in een Advanced Analytics of data science team, waarbij je dataproducten hebt gebouwd, getest, gereleased en beheerd
Je hebt recente ervaring met het toepassen van (data/software) engineering skills in het data domein
Je hebt recente ervaring met het ontwerpen van dataproducten en het beschikbaar stellen hiervan voor afnemers
Je hebt recente ervaring met het ontwikkelen van data pipelines en schaalbare Python API's in de (Azure) cloud
Je hebt ervaring en kennis van (een deel van) de volgende tooling en technieken (of equivalenten) in productie: Python, PySpark, Polars, Databricks, Git, MLFlow, Docker, Snowflake
Het is een pre als je een volwassen Dev-/MLOps-omgeving kunt inrichten, snel nieuwe tooling en technieken eigen maakt, verantwoordelijkheid neemt voor de kwaliteit en stabiliteit van dataproducten, schone en goed geteste code schrijft (Python, Pytest), kritisch bent op details en edge cases, en communicatief en flexibel bent

About the company

Je werkt op een locatie waar ruim 300 collega's van de afdeling Data, Innovatie & Analyse samenwerken. Hier vind je een mix van ervaringen en persoonlijkheden, en is er ruimte om te sparren en kennis te delen. De afdeling biedt gebruikers snel en betrouwbaar inzicht om tot juiste acties te komen, door informatie te verzamelen, combineren, analyseren en presenteren. Vanuit Data, Innovatie & Analyse werk je samen met collega's uit IT en de business in multidisciplinaire clusters. Jouw team valt binnen het Cluster Reizigersstromen, dat bestaat uit ongeveer 25 collega's die samen verantwoordelijk zijn voor het leveren en verbeteren van data, inzichten en advies over reizigersstromen, zowel gerealiseerd als prognoses voor de toekomst. Je werkt aan uitdagende projecten, hebt afwisselende overleggen met collega's uit data, IT en de business en krijgt ruimte voor eigen ontwikkeling en kennisdeling. Diversiteit en inclusie zijn belangrijk voor de opdrachtgever. Wat jouw achtergrond of levensovertuiging ook is, zij zijn vooral benieuwd naar jouw visie op data engineering en innovatieve ideeën.