Data Engineer

Xwift
De Pinte, Belgium
4 days ago

Role details

Contract type
Permanent contract
Employment type
Full-time (> 32 hours)
Working hours
Regular working hours
Languages
Dutch
Experience level
Intermediate

Job location

Remote
De Pinte, Belgium

Tech stack

Artificial Intelligence
Airflow
Data analysis
Big Data
Continuous Integration
Information Engineering
ETL
Hive
Python
Machine Learning
Raw Data
Kusto Query Language
SQL Databases
Data Processing
Azure
Snowflake
GIT
Microsoft Fabric
Data Lake
PySpark
Information Technology
Azure
Databricks

Job description

Bij Xwift zoeken we een Data Engineer die zowel analytisch als technisch uit de voeten kan en energie haalt uit het ontwikkelen van schaalbare datapipelines, het structureren van datasets en het ondersteunen van besluitvorming met betrouwbare data. Je komt terecht in een moderne dataomgeving die volop in ontwikkeling is, waarin data een steeds belangrijkere rol speelt binnen zowel operationele als strategische processen.

De ruwe data uit onze bronsystemen wordt door onze developers aangeleverd in de bronzen laag van ons data lake. Vanaf dat punt neem jij de regie: je ontwikkelt de pipelines die ruwe data omzetten naar gestructureerde datasets (zilver) en vervolgens naar business-klare, geaggregeerde data (goud). Daarnaast denk je actief mee over welke data-oplossingen waarde toevoegen voor de organisatie en leg je het fundament voor de advanced analytics en machine learning toepassingen van morgen.

Je werkt met technologieën zoals Python, PySpark, SQL en Microsoft Fabric. Ervaring met Medallion-architectuur (zilver/goud) of gelijkaardige data lake patronen is een sterke troef.

  • Ontwikkelen en onderhouden van transformatiepipelines van de bronzen laag naar zilver en goud
  • Omzetten van ruwe brondata naar gecleande, gestructureerde datasets via validatie, deduplicatie en standaardisatie
  • Samenstellen van business-klare, geaggregeerde datasets die direct bruikbaar zijn voor analyse, rapportering en voorspellende toepassingen
  • Bewaken van datakwaliteit, consistentie en traceerbaarheid doorheen de transformatielagen
  • Opzetten van monitoring en alerting, en proactief verbeteren van de pipelines

Werken binnen een modern data platform

  • Werken binnen Microsoft Fabric als primair platform voor opslag, verwerking en orkestratie
  • Gebruiken van Python en PySpark voor data-verwerking en transformatie van grotere datasets
  • Schrijven van performante querytalen (zoals SQL, Spark SQL, KQL,...) voor transformaties en datamanipulatie
  • Bijdragen aan het ontwerp van de datamodel- en opslagarchitectuur
  • Documenteren van pipelines, datastromen en transformatielogica

Requirements

Minstens 2 jaar ervaring

Minstens 2 jaar ervaring

Je combineert technische diepgang met een hands-on mentaliteit en een oprechte interesse in de businesscontext waarin data gebruikt wordt. Je voelt je thuis in een omgeving die nog in opbouw is en pakt vraagstukken pragmatisch aan.

  • Je hebt 2 tot 5 jaar relevante ervaring in data engineering, ETL/ELT-ontwikkeling of een gelijkaardige technische datarol
  • Je beschikt over een masterdiploma in een kwantitatieve of technische richting, zoals computerwetenschappen, data engineering, informatica, wiskunde, engineering of gelijkaardig - of gelijkwaardig niveau door relevante ervaring
  • Je hebt sterke praktische kennis van Python voor data-verwerking en pipeline-ontwikkeling
  • Je hebt ervaring met PySpark of gelijkaardige frameworks voor grootschalige dataverwerking
  • Je schrijft vlot SQL voor transformaties en datamanipulatie
  • Je bent vertrouwd met Medallion-architectuur of data lake transformatieconcepten (zilver/goud of vergelijkbaar)
  • Ervaring met Microsoft Fabric, Databricks, Snowflake, Azure Synapse of een gelijkaardig modern data platform."
  • Je hebt affiniteit met datakwaliteitsbeheer en datamodellering
  • Je bent in staat om complexe businessvragen te vertalen naar heldere data-oplossingen, en denkt graag mee over de aanpak in plaats van enkel de uitvoering
  • Je communiceert vlot met zowel technische als niet-technische stakeholders
  • Je hebt een sterke interesse in advanced analytics, machine learning en AI - als richting waar je mee in wil groeien naarmate onze datawerking matuur wordt
  • Ervaring met orchestration tools (Azure Data Factory, Airflow, Fabric Data Pipelines of gelijkaardig) is een plus"
  • Vertrouwd met Git en CI/CD-praktijken voor data pipelines
  • Een interesse of passie in transport? Dat is mooi meegenomen.

Big data analyseren

Benefits & conditions

Bij Xwift kom je terecht in één van de snelst groeiende logistieke spelers in België, in een dynamische omgeving waar ondernemerschap, autonomie en innovatie centraal staan. Onze datawerking is volop in opbouw, wat betekent dat je mee de fundamenten legt en met jouw expertise zichtbare impact maakt op de business.

Je mag ook nog rekenen op:

  • Een intensieve opleiding
  • Een omgeving met sterke autonomie en veel verantwoordelijkheid
  • Een mooie leercurve die je carrière versnelt - met groeiperspectief richting advanced analytics, machine learning en AI
  • Een mooie verloning met aanvullende extralegale voordelen
  • Flexibele uren en de mogelijkheid tot telewerk na opleidingsperiode

About the company

* Vertalen van businessnoden naar concrete data-oplossingen: welke datasets, welke structuur, welke logica? * Samenwerken met stakeholders om opportuniteiten en vraagstukken scherp te definiëren * Inzichten en technische keuzes helder toelichten aan technische en niet-technische collega's * Meedenken over hoe de goud-laag optimaal ingericht wordt als fundament voor machine learning en AI-toepassingen * Samenwerken met data scientists en analisten naarmate analytische en AI-gedreven use cases vorm krijgen

Apply for this position