Senior Data Architect / Data Engineer - Fokus NLP
STATWORX GmbH
6 days ago
Role details
Contract type
Permanent contract Employment type
Full-time (> 32 hours) Working hours
Regular working hours Languages
German, English Experience level
SeniorJob location
Tech stack
Artificial Intelligence
Amazon Web Services (AWS)
Azure
Bash
Cloud Computing
Databases
Continuous Integration
Data Architecture
Information Engineering
Data Governance
ETL
Data Warehousing
Github
Python
Machine Learning
SQL Databases
Unstructured Data
Pulumi
Google Cloud Platform
Cloud Platform System
Large Language Models
Snowflake
Data Lake
Gitlab-ci
Information Technology
Terraform
Databricks
Job description
Unser AI Strategy-Team unterstützt unsere Kunden bei der Konzeption und Implementierung ihrer Daten- & KI-Strategie. Dabei verfolgen wir stets das Ziel, die volle Ausschöpfung des Potenzials von Daten, Data Science und KI zu ermöglichen. In enger Zusammenarbeit mit unseren Kunden nehmen wir unterschiedlichste Arten von strategischen Herausforderungen an, von der initialen Bestimmung des AI-Reifegrades, über die Formulierung der Daten- & KI-Strategie, bis zur Entwicklung und Implementierung neuer Betriebsmodelle.
- Du verbindest klassisches Data Engineering mit modernen NLP-Ansätzen - insbesondere im Umfeld von Large Language Models (LLMs), Embeddings, Knowledge Graphs, Retrieval-Augmented Generation (RAG) und Text-to-SQL-Anwendungen
- Du konzipierst, entwickelst und betreibst moderne Datenarchitekturen, die die Basis für fortschrittliche NLP-Anwendungen bilden - von Knowledge-Management-Systemen über semantische Suchlösungen bis hin zu RAG-Use-Cases
- Du arbeitest eng mit unseren Kund:innen zusammen, verstehst ihre fachlichen Anforderungen und Datenprozesse und entwickelst daraus maßgeschneiderte, skalierbare Daten- und KI-Lösungen
- Du implementierst skalierbare Datenpipelines und -infrastrukturen, um große Mengen strukturierter und unstrukturierter Daten effizient bereitzustellen, zu transformieren und zu versionieren
- Du stellst Datenqualität, -sicherheit und -governance über die gesamte Wertschöpfungskette sicher und etablierst Best Practices im Umgang mit sensiblen Daten in KI-Projekten
- Du verantwortest den Aufbau und Betrieb skalierbarer Dateninfrastrukturen in Cloud-Umgebungen und automatisierst Deployments sowie Monitoring-Systeme, um Zuverlässigkeit und Verfügbarkeit sicherzustellen
- Du berätst unsere Kund:innen und internen Teams strategisch zu Datenarchitekturen, Technologien, Tools und Best Practices und agierst als verlässliche:r Sparringspartner:in
- Du unterstützt jüngere Kolleg:innen, teilst dein Wissen aktiv im Team und trägst durch Workshops, Blogbeiträge oder interne Talks zur Weiterentwicklung der Data-Engineering-Community bei statworx bei
Requirements
- Du hast ein erfolgreich abgeschlossenes Masterstudium - z. B. in (Wirtschafts-)Informatik oder einem vergleichbaren Studiengang
- Du bringst mindestens fünf Jahre einschlägige Berufserfahrung im Bereich Data Engineering oder Data Architecture mit
- Du verfügst über ein tiefes Verständnis moderner Datenarchitekturen (Data Lakes, Lakehouses, Data Warehouses) und bist mit ETL-/ELT-Prozessen sowie Datenmodellierung bestens vertraut
- Idealerweise hast du Erfahrung im Aufbau von Dateninfrastrukturen für NLP-Anwendungen - insbesondere im Umfeld von LLMs, Retrieval-Augmented Generation (RAG), Semantic Layern und Knowledge Graphs
- Praktische Erfahrung mit Text-to-SQL-Systemen oder der Entwicklung von Schnittstellen zwischen natürlicher Sprache und Datenbanken ist ein Plus
- Du hast Erfahrung mit Cloud-Plattformen (Azure, AWS oder GCP) und modernen Datenplattformen wie Databricks oder Snowflake
- Du kennst dich mit Infrastructure-as-Code (z. B. Terraform, Pulumi) und CI/CD-Workflows (z. B. GitHub Actions, GitLab CI, Azure DevOps) aus
- Du besitzt sehr gute Kenntnisse in Python, SQL und Bash/Shell und legst Wert auf sauberen, effizienten und wartbaren Code
- Du verstehst die Bedeutung von Data Governance, Sicherheit und Datenschutz (z. B. DSGVO) und berücksichtigst diese Aspekte konsequent bei der Architekturplanung
- Du kombinierst analytisches Denkvermögen mit der Fähigkeit, fachliche Anforderungen in technische Lösungen zu übersetzen, und kommunizierst sicher mit Stakeholdern auf allen Ebenen
- Du sprichst fließend Englisch (in Wort und Schrift) und verfügst über fortgeschrittene Deutschkenntnisse - oder bist bereit, diese aktiv auszubauen
Benefits & conditions
- Data Science- und KI-Beratung als Kerngeschäft: Dich erwarten spannende Projekte mit namhaften Kund:innen - von innovativen NLP-Use Cases bis hin zu anspruchsvollen Data-Science- und Machine-Learning-Anwendungen
- Fachliche Tiefe und Vielfalt: Du arbeitest an komplexen, vielseitigen Fragestellungen und erweiterst dabei kontinuierlich deine Expertise in Data Science, Machine Learning und Künstlicher Intelligenz
- Weiterentwicklung auf allen Ebenen: Wir fördern deine methodische, fachliche und persönliche Entwicklung - durch regelmäßiges Feedback, individuelle Förderung und unser Mentoring-Programm
- Kultur und Zusammenarbeit: Dich erwartet ein offenes, diverses und wertschätzendes Arbeitsumfeld mit flachen Hierarchien, kurzen Entscheidungswegen und einem starken Teamgeist
- Agile Arbeitsweise: Wir leben eine moderne, iterative Arbeitskultur mit klarer Kommunikation, Eigenverantwortung und Raum für neue Ideen
- Transparente Vergütung: Wir bieten faire, nachvollziehbare Gehaltsstufen, die regelmäßig an Markt- und Leistungsentwicklungen angepasst werden
- Flexibles Arbeiten: Unser modernes Office in Frankfurt ist dein zentraler Arbeitsort - gleichzeitig hast du die Möglichkeit, regelmäßig remote zu arbeiten und bis zu vier Wochen pro Jahr aus dem EU-Ausland zu arbeiten.
- Mobilität & Gesundheit: Profitiere von einem ermäßigten Deutschlandticket und vergünstigtem Zugang zu Sport- und Wellnessangeboten über Wellpass
- Ausstattung & Extras: Hochwertiges IT-Equipment (z. B. MacBook Pro), regelmäßige Team-Events und zusätzliche Leistungen wie Kinderbetreuungszuschüsse und attraktive Mitarbeiterrabatte runden dein Gesamtpaket ab
About the company
statworx ist ein führendes Beratungs- und Entwicklungsunternehmen für Daten und KI mit Sitz in Frankfurt am Main. Wir bieten strategische Beratung für mittelständische Unternehmen und globale Konzerne. Wir entwickeln innovative Daten- & KI-Lösungen für alle Unternehmensbereiche und Tätigkeitsfelder. Wir befähigen Menschen auf allen Kompetenzniveaus mit unseren Daten- & KI-Bildungsformaten. Kurz gesagt: Wir unterstützen Unternehmen bei allen Aspekten der digitalen Transformation - seit mehr als 10 Jahren, in über 500 Daten- & KI-Projekten und für über 100 Kunden aus fast allen Industrien.