Data Engineer

Xwift

De Pinte, Belgium

4 days ago

Role details

Contract type

Permanent contract

Employment type

Full-time (> 32 hours)

Working hours

Regular working hours

Languages

Dutch

Experience level

Intermediate

Job location

Remote

De Pinte, Belgium

Tech stack

Artificial Intelligence

Airflow

Data analysis

Big Data

Continuous Integration

Information Engineering

ETL

Hive

Python

Machine Learning

Raw Data

Kusto Query Language

SQL Databases

Data Processing

Azure

Snowflake

GIT

Microsoft Fabric

Data Lake

PySpark

Information Technology

Azure

Databricks

Job description

Bij Xwift zoeken we een Data Engineer die zowel analytisch als technisch uit de voeten kan en energie haalt uit het ontwikkelen van schaalbare datapipelines, het structureren van datasets en het ondersteunen van besluitvorming met betrouwbare data. Je komt terecht in een moderne dataomgeving die volop in ontwikkeling is, waarin data een steeds belangrijkere rol speelt binnen zowel operationele als strategische processen.

De ruwe data uit onze bronsystemen wordt door onze developers aangeleverd in de bronzen laag van ons data lake. Vanaf dat punt neem jij de regie: je ontwikkelt de pipelines die ruwe data omzetten naar gestructureerde datasets (zilver) en vervolgens naar business-klare, geaggregeerde data (goud). Daarnaast denk je actief mee over welke data-oplossingen waarde toevoegen voor de organisatie en leg je het fundament voor de advanced analytics en machine learning toepassingen van morgen.

Je werkt met technologieën zoals Python, PySpark, SQL en Microsoft Fabric. Ervaring met Medallion-architectuur (zilver/goud) of gelijkaardige data lake patronen is een sterke troef.

Ontwikkelen en onderhouden van transformatiepipelines van de bronzen laag naar zilver en goud
Omzetten van ruwe brondata naar gecleande, gestructureerde datasets via validatie, deduplicatie en standaardisatie
Samenstellen van business-klare, geaggregeerde datasets die direct bruikbaar zijn voor analyse, rapportering en voorspellende toepassingen
Bewaken van datakwaliteit, consistentie en traceerbaarheid doorheen de transformatielagen
Opzetten van monitoring en alerting, en proactief verbeteren van de pipelines

Werken binnen een modern data platform

Werken binnen Microsoft Fabric als primair platform voor opslag, verwerking en orkestratie
Gebruiken van Python en PySpark voor data-verwerking en transformatie van grotere datasets
Schrijven van performante querytalen (zoals SQL, Spark SQL, KQL,...) voor transformaties en datamanipulatie
Bijdragen aan het ontwerp van de datamodel- en opslagarchitectuur
Documenteren van pipelines, datastromen en transformatielogica

Requirements

Minstens 2 jaar ervaring

Je combineert technische diepgang met een hands-on mentaliteit en een oprechte interesse in de businesscontext waarin data gebruikt wordt. Je voelt je thuis in een omgeving die nog in opbouw is en pakt vraagstukken pragmatisch aan.

Je hebt 2 tot 5 jaar relevante ervaring in data engineering, ETL/ELT-ontwikkeling of een gelijkaardige technische datarol
Je beschikt over een masterdiploma in een kwantitatieve of technische richting, zoals computerwetenschappen, data engineering, informatica, wiskunde, engineering of gelijkaardig - of gelijkwaardig niveau door relevante ervaring
Je hebt sterke praktische kennis van Python voor data-verwerking en pipeline-ontwikkeling
Je hebt ervaring met PySpark of gelijkaardige frameworks voor grootschalige dataverwerking
Je schrijft vlot SQL voor transformaties en datamanipulatie
Je bent vertrouwd met Medallion-architectuur of data lake transformatieconcepten (zilver/goud of vergelijkbaar)
Ervaring met Microsoft Fabric, Databricks, Snowflake, Azure Synapse of een gelijkaardig modern data platform."
Je hebt affiniteit met datakwaliteitsbeheer en datamodellering
Je bent in staat om complexe businessvragen te vertalen naar heldere data-oplossingen, en denkt graag mee over de aanpak in plaats van enkel de uitvoering
Je communiceert vlot met zowel technische als niet-technische stakeholders
Je hebt een sterke interesse in advanced analytics, machine learning en AI - als richting waar je mee in wil groeien naarmate onze datawerking matuur wordt
Ervaring met orchestration tools (Azure Data Factory, Airflow, Fabric Data Pipelines of gelijkaardig) is een plus"
Vertrouwd met Git en CI/CD-praktijken voor data pipelines
Een interesse of passie in transport? Dat is mooi meegenomen.

Big data analyseren

Benefits & conditions

Bij Xwift kom je terecht in één van de snelst groeiende logistieke spelers in België, in een dynamische omgeving waar ondernemerschap, autonomie en innovatie centraal staan. Onze datawerking is volop in opbouw, wat betekent dat je mee de fundamenten legt en met jouw expertise zichtbare impact maakt op de business.

Je mag ook nog rekenen op:

Een intensieve opleiding
Een omgeving met sterke autonomie en veel verantwoordelijkheid
Een mooie leercurve die je carrière versnelt - met groeiperspectief richting advanced analytics, machine learning en AI
Een mooie verloning met aanvullende extralegale voordelen
Flexibele uren en de mogelijkheid tot telewerk na opleidingsperiode

About the company

* Vertalen van businessnoden naar concrete data-oplossingen: welke datasets, welke structuur, welke logica? * Samenwerken met stakeholders om opportuniteiten en vraagstukken scherp te definiëren * Inzichten en technische keuzes helder toelichten aan technische en niet-technische collega's * Meedenken over hoe de goud-laag optimaal ingericht wordt als fundament voor machine learning en AI-toepassingen * Samenwerken met data scientists en analisten naarmate analytische en AI-gedreven use cases vorm krijgen

Role details

Job location

Tech stack

Job description

Requirements

Benefits & conditions

About the company

Apply for this position

Good distractions

Moments

Videos View all