Senior Data Engineer
Role details
Job location
Tech stack
Job description
Werken bij de Immigratie en Naturalisatiedienst (IND) betekent werken in een multidisciplinair en complex beleidsterrein dat voortdurend in de politieke belangstelling staat. Als Data Engineer behandel je thema's die ertoe doen! Met jouw inzet lever je een belangrijke bijdrage aan de toepassing van data science en AI binnen de IND en daarmee een waardevolle bijdrage aan onze samenleving.
Als Data Engineer werk je nauw samen met Data Engineers, Data Analisten en Data Scientists binnen team Data Expertise Centrum (14 fte) en collega's vanuit alle directies van de IND. Je zorgt dat de data beschikbaar is in de ontwikkelomgeving voor de data scientists en data analisten.
Als Data Engineer kun jij alle ontwikkelingen goed overzien en duiden. Je werkt je effectief samen met een team om de vele vraagstukken op het gebied van data science om te zetten in pragmatische oplossingen. Hierdoor kan de organisatie er optimaal gebruik van maken. Hierbij is het belangrijk dat je proactief werkt.
Bij de IND zijn we volop bezig met de nieuwste ontwikkelingen op het gebied van generatieve AI. We beschikken over een intern GPU-cluster waarmee we geavanceerde modellen kunnen ontwikkelen. Deze technologie willen we inzetten voor diverse toepassingen zoals vertalingen, samenvattingen en nog veel meer. Als Data Engineer werk je mee aan het ontwikkelen van AI toepassingen op ons cluster en zorg je ervoor dat deze toepassingen geïmplementeerd kunnen worden in de productieomgeving. Aangezien deze techniek nieuw is zal er ook veel uitgezocht moeten worden en is het van belang dat je goed kan samenwerken met verschillende IT teams. Dit jaar willen we de waarde van het GPU-cluster aantonen door meerdere AI-toepassingen op te leveren en de AI-behoefte concreter in kaart te brengen. Je speelt een cruciale rol bij het bewijzen van deze nieuwe technieken.
Ook gaan er dit jaar meerdere innovatieve projecten in productie die direct impact hebben op de dienstverlening binnen de migratieketen.
Zo werken we aan een nieuw aanmeldproces voor asielzoekers in Ter Apel. Waar de registratie voorheen handmatig verliep, kunnen asielzoekers zich straks via een tablet aanmelden in hun eigen taal. Dankzij onze vertaaldienst wordt de ingevoerde informatie direct vertaald naar het Nederlands, zodat IND-medewerkers de gegevens snel en efficiënt kunnen controleren en verwerken.
Daarnaast hebben we voor Juridische Zaken (JZ) een slimme samenvattingstool ontwikkeld. Onze collega Procesvertegenwoordigers ontvangen voorafgaand aan een zaak vaak grote hoeveelheden documentatie om zich voor te bereiden. Met behulp van deze tool worden automatisch compacte en overzichtelijke samenvattingen gegenereerd, waardoor medewerkers zich sneller kunnen inlezen en beter voorbereid aan een zaak kunnen beginnen.
De voornaamste elementen in jouw rol zijn:
- Beheren, door ontwikkelen en optimaliseren van datawarehouses en databases voor efficiënte opslag en toegang tot gegevens en oplossen van issues als deze zich voordoen.
- Extract, Transform, Load (ETL) processen bouwen en onderhouden om gegevens uit verschillende bronnen te verzamelen, om te zetten en op te slaan.
- Het ontwerpen van robuuste data-infrastructuren en -pipelines.
- Nauwkeurigheid, volledigheid en consistentie van data door middel van validatie- en schoonmaakprocessen.
- Verantwoordelijk voor het deployen en beheren van Python-gebaseerde data science- en AI-toepassingen, inclusief het opzetten van kwaliteitsborging (QA).
- Professionaliseren en onderhouden van onze MLOps tooling, zoals GitLab CI/CD-pipelines, Docker-containers en het UbiOps-platform.
- Intensief samenwerken met Data Scientists en Data Analisten om modellen efficiënt en gestroomlijnd naar productie te brengen.
- Onderhouden van contact met collega's van de infrastructuurteams om technische afhankelijkheden en requirements goed te coördineren.
- Proactief bijdragen aan databeveiligingsvraagstukken, in nauwe samenwerking met het team Informatiebeveiliging en software development.
- Aansluiten bij architectuur overleggen, zodat alle AI- en dataoplossingen voldoen aan de architectuureisen en -richtlijnen van de organisatie.
-
Wat spreekt jou aan in de rol van Senior Data Engineer binnen de IND en in het werken aan AI- en dataoplossingen binnen een maatschappelijke organisatie?
-
In AI is reproduceerbaarheid cruciaal: we moeten precies weten met welke versie van de data een specifiek model is getraind. Hoe implementeer je data-versioning en data-lineage in een on-premise omgeving zonder gebruik te maken van cloud-native tools?
-
Beschrijf jouw ervaring met CI/CD en containerisatie.
-
De IND werkt in een omgeving waar ontwikkelingen snel gaan en maatschappelijke impact groot is. Hoe ga jij om met verandering, prioriteiten en werken in een dynamische omgeving? Noem hierbij een voorbeeld uit de praktijk.
-
Het beheren van het IND-gegevensmodel en het opstellen van domeinspecifieke gegevensmodellen.
-
Het opstellen van kennismodellen en regels.
-
Het voeren van regie over de inrichting van de registers.
-
Het realiseren van interne dataontsluiting.
-
Het adviseren over gegevensmodellering, registers en koppelvlakken.
-
Het leveren van producten en diensten op basis van LLM's.
-
Het leveren van geavanceerde data-analysediensten, zoals risicomodellen, prognosemodellen en tekstmining.
-
Het beheren en leveren van de modellen en data.
In deze functie behoort hybride werken tot de mogelijkheden. Daarbij wordt verwacht dat je op locatie in Den Haag aanwezig bent op momenten dat het voor de uitvoering van je functie of om organisatorische redenen gewenst is. Dit is in overleg met je leidinggevende. Voor deze functie wordt verwacht dat je minimaal twee werkdagen per week op locatie in Den Haag aanwezig bent. Woensdag is de vaste teamdag op kantoor, terwijl de tweede dag flexibel gekozen kan worden op basis van afspraken en werkzaamheden. Daarnaast kunnen de werktijden flexibel worden ingericht, afhankelijk van je agenda.
Door het Functiegebouw Rijk worden medewerkers en leidinggevenden geholpen bij het maken van resultaat- en ontwikkelafspraken in functioneringsgesprekken en krijgt men inzicht in de loopbaanmogelijkheden binnen de Rijksoverheid.
Requirements
- Wo werk- en denkniveau en minimaal een afgeronde hbo-opleiding in een relevante richting.
- Ervaring met Python en het deployen van modellen of toepassingen in productieomgevingen.
- Kennis van SQL, SSMS en SSIS.
- Ervaring met CI/CD tooling zoals GitLab of vergelijkbare platforms.
- Kennis van containerisatie (bijv. Docker) en ervaring met modelserving-oplossingen.
- Ervaring met het werken in een complexe IT-omgeving en het schakelen met verschillende stakeholders.
Competenties
-
Analyseren
-
Creativiteit
-
Netwerken
-
Omgevingsbewustzijn
-
Organisatiesensitiviteit
-
Overtuigingskracht
-
Plannen en organiseren
-
Om een nog beter (of aanvullend) beeld van ervaring, kennis en competenties te verkrijgen in de wervingsprocedure kan het zijn dat we openbare informatie van je op LinkedIn raadplegen. Desgewenst kun je het profiel afschermen voor personen die geen connectie van je zijn op LinkedIn.
-
De IND zet zich in om medewerkers met een arbeidsbeperking in te laten stromen. Kandidaten die geregistreerd zijn in het doelgroepregister worden uitgenodigd om te reageren en de verklaring uit het doelgroepregister bij te voegen.
-
Diversiteit en inclusie zijn belangrijke thema's bij het Rijk en de IND. De overheid wil dat iedereen zich thuis voelt bij het Rijk en dat medewerkers bewuster nadenken over een inclusieve werkomgeving.
-
Je hebt ook bij jouw indiensttreding een Verklaring Omtrent het Gedrag (VOG) nodig, tenzij je al een arbeidsovereenkomst hebt bij de Rijksoverheid.
Benefits & conditions
-
Schaal 12 €4.691 - €6.907 (bruto)
-
Arbeidsovereenkomst voor onbepaalde tijd
-
Onbepaalde tijd
-
36 uur
-
Het salaris is gebaseerd op een werkweek van 36 uur.