Data Engineer MLT
Role details
Job location
Tech stack
Job description
Voor Nederlandse Spoorwegen zoeken wij een Data Engineer MLT. Je bouwt aan een nieuw prognoseproduct dat directe invloed heeft op strategische beslissingen, zoals materieelplanning en investeringskeuzes. Je werkt in een nieuw multidisciplinair team met data engineers en vervoerskundigen, waar jouw ideeën en technische standaard het verschil maken. Je combineert puzzelen, modelleren en codekwaliteit met maatschappelijke impact: zo draag je bij aan het duurzaam bereikbaar houden van Nederland. Je bouwt iets dat nog niet bestaat in een nieuw team. Je duikt in de materie, puzzelt met data en werkt samen met verschillende disciplines aan een model dat jarenlang impact zal hebben op de opdrachtgever. Binnen de opdrachtgever ontwikkelt Cluster Reizigersstromen prognoses om reizigersstromen te begrijpen, voorspellen en te vertalen naar strategische keuzes. Deze inzichten zijn essentieel voor lange termijncapaciteitsplanning, de dienstregeling, investeringen in materieel en toekomstige dienstverlening. Jij werkt mee in het nieuw te vormen team dat het middellangetermijn (MLT) prognoseproduct opnieuw intern ontwikkelt-een product met grote impact op de toekomst van de opdrachtgever. Als data engineer bouw je aan het nieuwe MLT prognosemodel, inclusief de noodzakelijke datapipelines, modellogica en kwaliteitscontroles voor robuuste, betrouwbare en uitlegbare prognoses. Met jouw sterke Python engineeringvaardigheden en focus op codekwaliteit en modellogica lever je een belangrijke bijdrage aan een toekomstvast product dat breed wordt ingezet. Je borgt de codekwaliteit door tests te schrijven, uitzonderingssituaties af te dekken en je keuzes helder vast te leggen, zodat anderen hiermee verder kunnen. Je werkt samen met een nieuw team aan innovatieve oplossingen, neemt initiatief en blijft puzzelen tot je een solide uitkomst hebt-ook wanneer nog niet alles is uitgedacht. Je schakelt veel met specialisten uit andere vakgebieden, stelt slimme vragen en maakt technische besluiten begrijpelijk voor iedereen. Je denkt kritisch, onderzoekt grondig en durft aannames te bevragen om het model en de kwaliteit continu te verbeteren. Nieuwe tools en technieken pak je snel en zelfstandig op, waardoor je zelf verbeteringen doorvoert. Met jouw bouwkracht en kwaliteitsgerichtheid ben jij van onschatbare waarde bij het:
- Ontwikkelen van het nieuwe MLT prognoseproduct dat strategische beslissingen voor de komende 20 jaar ondersteunt.
- Ontwerpen en bouwen van schaalbare datapipelines (Python, PySpark/Polars, Databricks).
- Schrijven van schone, onderhoudbare en goed geteste code, inclusief testautomatisering en CI/CD structuur.
- Uitwerken en automatiseren van scenario analyses samen met vervoerskundigen en domeinexperts.
- Samenwerken met team Proteus om het product te laten aansluiten op het clusterbrede prognoseplatform.
- Vertalen van complexe modelbehoeften naar robuuste, duurzaam implementeerbare technische oplossingen.
Requirements
- Je hebt een relevante afgeronde hbo-/wo-opleiding, bijvoorbeeld in (toegepaste) wiskunde, data science, AI of informatica.
- Je hebt minimaal 5 jaar recente ervaring op het gebied van data engineering of ML engineering, in een Advanced Analytics of data science team, waarbij je dataproducten hebt gebouwd, getest, gereleased en beheerd. Je kunt helder uitleggen hoe je een product van idee tot livegang brengt.
- Je hebt recente ervaring met het toepassen van (data/software) engineering skills in het data domein.
- Je hebt recente ervaring met het ontwerpen van dataproducten en het beschikbaar stellen hiervan voor afnemers.
- Je hebt recente ervaring met het ontwikkelen van data pipelines en schaalbare Python API's in de (Azure) cloud. Je schrijft gestructureerde code, werkt met packages, API's en CI/CD-processen en houdt rekening met onderhoudbaarheid en overdraagbaarheid.
- Je hebt ervaring en kennis van (een deel van) de volgende tooling en technieken (of equivalenten) in productie: Python, PySpark, Polars, Databricks, Git, MLFlow, Docker, Snowflake.
- Je richt een volwassen Dev-/MLOps-omgeving in, maakt snel nieuwe tooling en technieken eigen, neemt verantwoordelijkheid voor de kwaliteit en stabiliteit van dataproducten, schrijft schone, goed geteste code (Python, Pytest), bent kritisch op details en edge cases, en bent communicatief en flexibel.
- Lef, samenwerking en resultaatgerichtheid zijn belangrijk om samen doelen te behalen en elkaar aan te spreken en open te staan voor verandering.
Je hebt passie voor data engineering en levert graag een bijdrage aan duurzame mobiliteit. Jouw ambitie en visie maken het verschil en je voelt je thuis in een dynamische, multidisciplinaire omgeving.
-
Je bent in loondienst en er worden loonbelasting en premies volks- en werknemersverzekeringen (WW, WAO, WIA en ZW) voor je afgedragen. Je bent geen zelfstandig ondernemer, zzp'er of directeur-grootaandeelhouder zonder werknemersverzekeringen.
-
Je beschikt over een relevante afgeronde hbo- of wo-opleiding, bijvoorbeeld in (toegepaste) wiskunde, data science, AI of informatica.
-
Je hebt minimaal 5 jaar recente ervaring met data engineering of ML engineering binnen een Advanced Analytics- of data science-team, waarbij je dataproducten hebt gebouwd, getest, gereleased en beheerd. Je kunt helder uitleggen hoe je een product van idee tot livegang brengt.
-
Je hebt recente ervaring met het toepassen van (data/software) engineering skills in het datadomein.
-
Je beheerst de Nederlandse taal uitstekend, zowel mondeling als schriftelijk.
-
Je hebt recente ervaring met het ontwerpen van dataproducten en het beschikbaar stellen hiervan aan afnemers.
-
Je hebt ervaring met het ontwikkelen van data pipelines en schaalbare Python API's in de (Azure) cloud.
-
Je schrijft gestructureerde code, werkt met packages, API's en CI/CD-processen, en houdt daarbij rekening met onderhoudbaarheid en overdraagbaarheid.
-
Je hebt ervaring en kennis van (een deel van) de volgende tooling en technieken (of equivalenten) in productie: Python, PySpark, Polars, Databricks, Git, MLFlow, Docker en Snowflake.
-
Je hebt een relevante afgeronde hbo-/wo-opleiding, bijvoorbeeld in de richting (toegepaste) wiskunde, data science, AI of informatica
-
Je hebt minimaal 5 jaar recente ervaring op het gebied van data engineering of ML engineering, in een Advanced Analytics of data science team, waarbij je dataproducten hebt gebouwd, getest, gereleased en beheerd
-
Je hebt recente ervaring met het toepassen van (data/software) engineering skills in het data domein
-
Je hebt recente ervaring met het ontwerpen van dataproducten en het beschikbaar stellen hiervan voor afnemers
-
Je hebt recente ervaring met het ontwikkelen van data pipelines en schaalbare Python API's in de (Azure) cloud
-
Je hebt ervaring en kennis van (een deel van) de volgende tooling en technieken (of equivalenten) in productie: Python, PySpark, Polars, Databricks, Git, MLFlow, Docker, Snowflake
-
Het is een pre als je een volwassen Dev-/MLOps-omgeving kunt inrichten, snel nieuwe tooling en technieken eigen maakt, verantwoordelijkheid neemt voor de kwaliteit en stabiliteit van dataproducten, schone en goed geteste code schrijft (Python, Pytest), kritisch bent op details en edge cases, en communicatief en flexibel bent