Full Stack Data Engineer
Role details
Job location
Tech stack
Job description
- Als Data Engineer bist du für die Erhebung buchrelevanter Online-Shop-Daten verantwortlich, wobei du neben dem Zugriff über APIs vor allem unser eigenentwickeltes Scraping-Framework betreust, kontinuierlich modernisierst und technologisch weiterentwickelst.
- Du konzipierst und baust skalierbare Datenpipelines und ETL-Prozesse, die Daten aus verschiedenen Quellsystemen (VMI, Buchhandel, interne Verlags-Systeme) in unser Data Warehouse überführen.
- Du entwirfst und pflegst Datenmodelle (dimensional & relational), die als verlässliche Grundlage für Analytics und Reporting dienen.
- Du entwickelst und betreust Dashboards und Self-Service-BI-Lösungen für unsere Verlagsmarken.
- Du unterstützt uns bei der Entwicklung, Anpassung und Betreuung von datenzentrierten Webanwendungen und Dashboards.
- Unsere - und in Zukunft auch Deine - Anwendungen laufen containerisiert via Docker und Kubernetes in Linux-Umgebungen sowie in der Azure und Google Cloud.
- Prototyping, Konzeption und Entwicklung innovativer Daten-Tools sowie moderner KI-Anwendungen sind uns extrem wichtig - und hier bauen wir voll auf deine Expertise.
- Du sorgst für Datenqualität und -konsistenz entlang der gesamten Pipeline.
Unser Tech Stack:
Python · SQL · Google BigQuery · Google und Azure Cloud · Azure · Docker · Kubernetes · Google Data Studio · Oracle · Java/Groovy (Bestandssysteme) · Git · Node.js· Linux · Ansible · CI/CD · Pentaho BI Server / PDI · Spring Boot · AngularJS Ein Background, der überzeugt
- Du bist als Engineer breit aufgestellt und bringst gleichzeitig tiefe Expertise in mindestens einem dieser Bereiche mit:
Data Engineering: Erfahrung mit Datenpipelines, dbt, ELT/ETL, Datenmodellierung und modernen Data-Stack-Technologien
Backend / Application: Skalierbare, cloud-native Systeme in Python oder Java, API-Design, containerisierte Deployments
Analytics / BI: Entwicklung von Dashboards und Self-Service-Lösungen, SQL-Expertise, semantische Datenmodelle
Requirements
- Du verfügst über ein abgeschlossenes IT-nahes Studium oder eine thematisch ähnliche Ausbildung.
- Du hast fundierte Kenntnisse in Java; Erfahrung mit Groovy und/oder dem Spring Boot Framework ist ein großes Plus.
- Du bist sicher im Umgang mit Webtechnologien wie HTML und JavaScript. Idealerweise hast du bereits Erfahrung im Bereich Browser Automation durch Playwright oder Selenium. Python ist sehr gern gesehen.
- Du bringst sehr gute SQL- und Datenbank-Kenntnisse mit, idealerweise mit ORACLE und Google BigQuery.
- Du fühlst dich im Linux-Umfeld zu Hause. Build- und Deployment-Prozesse sind dir vertraut, und du hast bereits praktische Erfahrung mit Container-Technologien (Docker, Kubernetes) gesammelt.
- Du hast praktische Erfahrung mit dem Einsatz von KI-Tools in der Entwicklung (z.B. LLM-basierte Datenextraktion, Code-Assistenten) und bringst ein grundlegendes Verständnis für den pragmatischen Einsatz von KI in Datenprozessen mit.
- Du kommunizierst souverän auf Deutsch (C1-Niveau) und bewegst dich auch im englischen Fachvokabular absolut sicher.
Benefits & conditions
Bei der HGV leben wir Vielfalt! Wir stehen für Chancengleichheit und pflegen einen respektvollen Umgang miteinander. Unser stetiges Ziel ist es, ein wertschätzendes und anerkennendes Arbeitsumfeld für alle Beschäftigten zu schaffen.