Senior Data Engineer / Data Architect
Role details
Job location
Tech stack
Job description
Deine Aufgabe ist nicht, etwas von Grund auf neu zu bauen - sondern das Vorhandene auf ein professionelles Niveau zu heben und die Datenbasis für die nächste Generation unserer ML- und AI-Produkte vorzubereiten. Parallel begleitest du den schrittweisen Aufbau unserer Datenplattform auf GCP., Du übernimmst die technische Verantwortung in vier Kernbereichen:
- Performance & MSSQL-Optimierung: Du analysierst unsere teuersten Queries, bereinigst redundante und ungenutzte Indizes, löst Trigger-Logik in saubere Domänen auf und eliminierst systematisch die größten Performance-Killer.
- ML/AI Datenvorbereitung: Du schaffst die Grundlage, auf der unser ML Engineer und AI Engineer arbeiten können - saubere Feature-Strukturen, konsistente Historisierung, erklärbare Datenherkunft.
- Governance & Datenqualität: Du setzt Konventionen, die halten. Zeitlogik, Soft Deletes, Naming, Data Contracts - du schaffst Struktur, wo heute Wildwuchs ist.
- Datenmodell-Refactoring: Altlasten identifizieren, Domänen sauber schneiden, Dead Columns und Dead Tables systematisch abbauen - du machst die Daten lesbar und wartbar.
- Hybrid-Datenplattform: Du hilfst dabei, relevante Datenströme von MSSQL Richtung GCP (BigQuery & Co.) aufzubauen - ohne das Produktivsystem zu gefährden. Analytics, Feature Stores und AI-Anwendungsfälle sollen dort performant laufen, wo sie hingehören.
Requirements
- Tiefes MSSQL-Know-how - Execution Plans lesen, Index-Strategien verstehen, Wait Stats interpretieren ist für dich Handwerk, kein Aufwand.
- Solides Verständnis von .NET / C# - du musst kein Fullstack-Entwickler sein, aber du kannst EF-generierte Queries lesen, nachvollziehen wie unsere Applikationen auf die DB zugreifen und im Zweifel auch einen kleinen Konsolenjob oder ein Script bauen. Unser Stack ist durchgängig .NET - ein Data Engineer, der die Anwendungsseite nicht liest, optimiert ins Blaue.
- Nachweisbare Erfahrung mit Data Warehousing - Star Schema, SCD, Staging Layer sind keine Buzzwords für dich.
- Solide ETL/ELT-Erfahrung - du hast Datenpipelines gebaut, die auch nach einem Jahr noch laufen.
- Verständnis für ML-Datenanforderungen - du weißt was Feature Engineering braucht, auch wenn du kein Data Scientist bist.
- Erfahrung mit Datenmodell-Refactoring in laufenden Produktivsystemen - du kennst den Unterschied zwischen Greenfield und Realität.
- Eigenverantwortliches Arbeiten: Du analysierst, priorisierst und machst einen Vorschlag - du wartest nicht auf ein Ticket.
Nice to have
- Kenntnisse in Columnstore Indexes und Partitionierungsstrategien für große Tabellen.
- Erfahrung mit Data Contracts oder schema-getriebenen Pipelines.
- Erfahrung mit GCP-Datendiensten (BigQuery, Dataflow, Pub/Sub, Cloud SQL) - gerne als primäre Cloud-Erfahrung.
- Erfahrung mit modernen Pipeline-Tools wie dbt, Airflow, Azure Data Factory oder Synapse Analytics.
- Kenntnisse in Azure-Diensten rund um Daten (Azure SQL, Synapse, Fabric, Data Lake).
- Erfahrung mit CDC (Change Data Capture) oder Event-Driven-Architekturen.
Benefits & conditions
Beschäftigung vollzeit jobs Art der Stellenanzeige: intern
About the company
DOUGLAS is a company known for selling cosmetics and beauty products through retail and dotcom.
But we are also a digital company that focuses on e-commerce, data and innovation. We have an amazing team of diverse and talented people working hard everyday.
Our digital talents master top-notch technologies, push innovations and accelarate performance. They build all the cutting-edge digital features to make the beautiful possible for our customers. This is where our successful digital business is emerging from. That's why for us, the most valuable asset are our people. For us, these people are, THE CODE BEHIND BEAUTY.