Data Engineer

Otto GmbH & Co KG
Hamburg, Germany
2 days ago

Role details

Contract type
Permanent contract
Employment type
Full-time (> 32 hours)
Working hours
Shift work
Languages
English, German

Job location

Remote
Hamburg, Germany

Tech stack

Java
Amazon Web Services (AWS)
Amazon Web Services (AWS)
Data analysis
Confluence
JIRA
Google BigQuery
Cloud Computing
ETL
Data Warehousing
Payment Systems
Github
JSON
Python
Monte Carlo Methods
SQL Databases
Data Streaming
Google Cloud Platform
File Transfer Protocol (FTP)
GIT
Amazon Web Services (AWS)
Terraform
Looker Analytics
Docker
Microservices

Job description

Das Team Blue Whale befähigt OTTO Payments, fundierte Erkenntnisse aus analytischen Daten zu gewinnen. Diese Insights dienen dazu,

  • den aktuellen Geschäftsstatus intern und extern transparent zu berichten,
  • das operative Geschäft tagesaktuell zu steuern und
  • datenbasierte Entscheidungen für die Zukunft zu treffen.

Ein zentraler Bestandteil ist der Aufbau und Betrieb einer skalierbaren Analytics- & BI-Plattform auf der Google Cloud Platform, die es Produktteams ermöglicht, operative Daten gemäß dem Data-Mesh-Ansatz in eigenverantwortliche Datenprodukte zu überführen. In der aktuellen Phase stellt Blue Whale zudem selbst geschäftskritische Datenprodukte für zentrale Use-Cases bereit; Während zunehmend die Plattform und Guardrails von Blue Whale definiert werden, gehen Datenprodukte zunehmend in die Verantwortung der Produktteams über.

Unser Tech Stack:

  • Platterform: Terraform, GitHub, GitHub Actions, GCP, AWS

  • Datenquellen: AWS-basierte Microservices (JSON-Events über SNS/SQS) und vereinzelt Dateibasiert über S3/SFTP

  • Ingestion & ETL: Eigene ETL-Tools (Python / Java), DSGVO-konforme Verschlüsselung & Crypt-Shredding

  • Streaming & Verarbeitung: Google Pub/Sub, BigQuery

  • Transformation & Modellierung: SQL, ELT/ETL

  • DWH-Architektur: Medallion-Ansatz (Bronze, Silver, Gold) mit domänenspezifischen Datenprodukten

  • Reporting & Analytics: Google Looker

  • Erweiterte Use-Cases: CESOP-Reporting, datenbasierte Simulationen für Bonitäts-Limitsteuerung, GenAI-basierte Klassifikation und Beantwortung von Kunden- und Partner-E-Mails, Deine Arbeitszeit kannst du zu bis zu 60 % im Monat flexibel aus dem Homeoffice oder einem anderen Ort gestalten. Die passende Balance zwischen Anwesenheit im Büro und mobilem Arbeiten wird im Team und mit deiner Führungskraft abgestimmt. Dein Impact

  • Entwicklung, Erweiterung und Betrieb von Datenpipelines und Datenprodukten auf der zentralen BI- & Analytics-Plattform

  • Implementierung von ETL- und Ingestion-Strecken (Python/Java) für Event- und dateibasierte Datenquellen unter Einhaltung von Security- und DSGVO-Vorgaben

  • Du transformatierst, modellierst und aggregierst Daten in BigQuery und gestaltest robuste Datenmodelle englang unserer Medallion-DWH-Architektur

  • Du arbeitest an domänenspezifischen Datenprodukten, die fachliche Use Cases wie Reporting, Steuerung, Simulation oder regulatorische Anfoirderungen unterstützen

  • Du stellst sicher, dass Datenmodelle performant, wartbar, nachvollziehbar und für Self-Service-Analytics und Looker-Reports geeignet sind

  • Du unterstützt bei der Weiterentwicklung von Standards für Datenqualität, Tests, Dokumentation, Monitoring und produktionsnahe Betriebsprozese

  • Du analysierst Fehler in produktiven Datenstrecken, behebst Incidents und hilfst dabei, unsere Plattform Schritt für Schritt stabiler und skalierbarer zu machen

  • Du arbeitest eng mit Product Ownern, Fachbereichen, Data Analysts und EntwicklerInnen zusammen und bringst deiner technische Perspektive aktiv ein, Das Team Blue Whale befähigt OTTO Payments, fundierte Erkenntnisse aus analytischen Daten zu gewinnen. Diese Insights dienen dazu,

  • den aktuellen Geschäftsstatus intern und extern transparent zu berichten,

  • das operative Geschäft tagesaktuell zu steuern und

  • datenbasierte Entscheidungen für die Zukunft zu treffen.

Ein zentraler Bestandteil ist der Aufbau und Betrieb einer skalierbaren Analytics- & BI-Plattform auf der Google Cloud Platform, die es Produktteams ermöglicht, operative Daten gemäß dem Data-Mesh-Ansatz in eigenverantwortliche Datenprodukte zu überführen. In der aktuellen Phase stellt Blue Whale zudem selbst geschäftskritische Datenprodukte für zentrale Use-Cases bereit; Während zunehmend die Plattform und Guardrails von Blue Whale definiert werden, gehen Datenprodukte zunehmend in die Verantwortung der Produktteams über.

Unser Tech Stack:

  • Platterform: Terraform, GitHub, GitHub Actions, GCP, AWS
  • Datenquellen: AWS-basierte Microservices (JSON-Events über SNS/SQS) und vereinzelt Dateibasiert über S3/SFTP
  • Ingestion & ETL: Eigene ETL-Tools (Python / Java), DSGVO-konforme Verschlüsselung & Crypt-Shredding
  • Streaming & Verarbeitung: Google Pub/Sub, BigQuery
  • Transformation & Modellierung: SQL, ELT/ETL
  • DWH-Architektur: Medallion-Ansatz (Bronze, Silver, Gold) mit domänenspezifischen Datenprodukten
  • Reporting & Analytics: Google Looker
  • Erweiterte Use-Cases: CESOP-Reporting, datenbasierte Simulationen für Bonitäts-Limitsteuerung, GenAI-basierte Klassifikation und Beantwortung von Kunden- und Partner-E-Mails

Deine Arbeitszeit kannst du zu bis zu 60 % im Monat flexibel aus dem Homeoffice oder einem anderen Ort gestalten. Die passende Balance zwischen Anwesenheit im Büro und mobilem Arbeiten wird im Team und mit deiner Führungskraft abgestimmt.

Requirements

  • Du hast Berufserfahrung in der Entwicklung von Datenpipelines, Datenmodellen oder analytischen Anwendungen - idealerweise im Cloud-, DWH- oder Analytics-Umfeld
  • Sehr gute SQL-Kenntnisse bringst du mit und kannst Datenmodelle nicht nur technisch, sondern auch fachlich nachvollziehbar strukturieren
  • Mit Python hast du bereits produktiv gearbeitet, zum Beispiel für ETL-/ELT-Prozesse, Automatisierung, Datenintegration oder Backend-nahe Datenverarbeitung
  • Erste bis gute Erfahrung mit Cloud-Datenplattformen ist vorhanden; Kenntnisse in Google Cloud Platform und BigQuery sind besonders hilfreich
  • Begriffe wie Data Warehouse, Medallion Architecture, Datenmodellierung, Datenqualität und Self-Service Analytics sind dir nicht fremd
  • Mit Tools wie Git, Terraform, Docker, dbt, Jira oder Confluence hast du bereits gearbeitet oder kannst dich schnell in vergleichbare Werkzeuge einarbeiten
  • Du denkst lösungsorientiert, arbeitest strukturiert und hast Freude daran, komplexe fachliche Anforderungen in robuste technische Lösungen zu übersetzen
  • Du besitzt spezifisches KnowHow in der Domäne B2C (insbesondere Bonitäts u. Limitsteuerung) und bis vertraut mit multivariaten statistischen Ansätzen (z.b. Monte Carlo Simulationen)
  • Du kommunizierst sicher auf Deutsch und Englisch und arbeitest gerne in einem Team, das technische Exzellenz mit pragmatischer Umsetzung verbindet

Benefits & conditions

  • Ein wertschätzendes Arbeitsumfeld, Expert*innen-Know-how sowie zahlreiche Möglichkeiten für deine fachliche und persönliche Entwicklung - all das zeichnet uns aus!
  • Flexible Arbeitszeiten, Arbeitszeiterfassung sowie die Möglichkeiten zum mobilen Arbeiten und Gleitzeit - du gestaltest deinen Arbeitstag.
  • Werde Teil unserer Kultur, entdecke jeden Tag Neues und lerne eine Arbeitswelt kennen, in der noch mehr Benefits für dich stecken!

About the company

Otto.de, eine der größten E-Commerce-Plattformen Europas, hat einen vertikalen Systemschnitt mit fachlicher Abgrenzung (z.B. User, Order oder Recommendations). Unsere crossfunktionalen Teams sind verantwortlich für die vertikalen Teilprodukte - fachlich, technisch und auch für den Betrieb der Microservices in der AWS. Technische Entscheidungen werden von uns und nicht durch Manager getroffen. Ebenso gestalten wir die Art unserer agilen Zusammenarbeit selbst und finden gemeinsam neue Wege.

Apply for this position