Wissenschaftliche Mitarbeiterin / Wissenschaftlicher Mitarbeiter - Data Pipeline Engineer
Robert Koch-Institut
Berlin, Germany
7 days ago
Role details
Contract type
Temporary contract Employment type
Full-time (> 32 hours) Working hours
Shift work Languages
English, GermanJob location
Berlin, Germany
Tech stack
Microsoft Windows
Airflow
Bioinformatics
Code Review
Databases
Continuous Integration
Data Infrastructure
Data Integration
ETL
Data Structures
Relational Databases
Linux
Python
PostgreSQL
Software Engineering
SQL Databases
SQLAlchemy
Systems Architecture
Strategies of Testing
Data Processing
Fast Healthcare Interoperability Resources
GIT
Pandas
Containerization
Gitlab-ci
Kubernetes
Information Technology
Data Management
Code Restructuring
Software Version Control
Docker
Jenkins
Job description
- Konzeption, Aufbau und Weiterentwicklung von Datenpipelines
- Entwicklung und Betrieb einer zentralen Surveillance-Dateninfrastruktur für die bundesweite Lagebewertung; Analyse datenmethodischer Risiken; Sicherstellung von Stabilität, Performance und wissenschaftlicher Belastbarkeit im Produktivbetrieb
- Wissenschaftliche Konzeption von Datenbanken und Systemarchitekturen
- Entwicklung und Optimierung relationaler Datenmodelle für komplexe epidemiologische Fragestellungen; Überführung wissenschaftlicher Konzepte in konsistente Datenstrukturen; strategische Weiterentwicklung und Migration bestehender Systeme
- Methodenentwicklung für nachhaltige Forschungssoftware
- Konzeption von Teststrategien zur Sicherstellung der Reproduzierbarkeit; technische Dokumentation; Etablierung von Best Practices nachhaltiger Softwareentwicklung
- Koordination und Qualitätssicherung
- Steuerung der Zusammenarbeit mit Fachbereichen und Stakeholdern; teamübergreifende Abstimmung und Qualitätssicherung; Mitgestaltung und Harmonisierung von Standards für datengetriebene Public-Health-Systeme
Requirements
- abgeschlossenes wissenschaftliches Hochschulstudium (Master oder Diplom) in Informatik, Bioinformatik, Wirtschaftsinformatik, Data Science, Mathematik, Statistik, oder verwandten Bereichen
Bei ausländischen Bildungsqualifikationen benötigen wir einen Nachweis über die Gleichwertigkeit mit einem deutschen Abschluss.
Kenntnisse und Erfahrungen
- mehrjährige einschlägige Berufserfahrung
- sehr gut, in SQL mit relationalen Datenbanken (idealerweise PostgreSQL)
- in Python mit datenverarbeitenden Bibliotheken (pandas, sqlalchemy o.ä.)
- in kollaborativen Softwareentwicklungsprozessen (Code Reviews, Versionskontrolle mit Git, agile Arbeitsweisen)
- in ETL/ELT-Prozessen und Datenintegration (Grundkenntnisse)
- in Best Practices in der Softwareentwicklung (Testing, Code-Qualität, Dokumentation)
- Sprachkenntnisse (CEFR-Niveau): Deutsch mind. C1, Englisch mind. B1
Wünschenswert
- Erfahrung mit SQL-basierten Transformationsframeworks (z. B. DBT), Workflow-Orchestrierung (z. B. Dagster, Airflow) sowie Datenqualitätsmanagement und Validierungsprozessen
- Sichere Kenntnisse in Linux- und Windows-Umgebungen sowie Erfahrung mit Containerisierung und Orchestrierung (Docker, Kubernetes) für stabile, produktionsnahe Datenverarbeitung
- Erfahrung mit CI/CD-Prozessen (z. B. Jenkins, GitLab CI), nachhaltiger Softwareentwicklung, Refactoring größerer Codebasen und Modernisierung von Legacy-Systemen
- Kenntnisse in FHIR-Standards oder vergleichbaren Gesundheitsdatenformaten sowie Erfahrung im Umgang mit sensiblen, domänenspezifischen Datenstrukturen
- Interesse an Public-Health- und epidemiologischen Fragestellungen sowie Bereitschaft, fachliche Anforderungen in technische Lösungen zu übersetzen
Persönliche Kompetenzen
- Selbstständigkeit und eigenverantwortliches Arbeiten nach Zielvorgaben
- Organisationsfähigkeit mit sinnvoll strukturierter Arbeitsweise und Überblick über die eigenen Aufgaben
- Flexibilität und positive Einstellung gegenüber Veränderungen und Neuerung
- Kommunikationsfähigkeit mit verbindlichem Auftreten und der Schaffung einer positiven Gesprächsatmosphäre
- Kooperations- und Teamfähigkeit und Erarbeitung von Lösungen zusammen mit anderen Teammitgliedern
Weitere Voraussetzungen
- Bereitschaft zur Teilnahme an einer erweiterten Sicherheitsüberprüfung nach § 9 Sicherheitsüberprüfungsgesetz (SÜG) sowie deren positiver Abschluss
Benefits & conditions
- 30 Tage Urlaub und dienstfreie Tage an Heiligabend und Silvester
- bis zu 50 % mobile Arbeit möglich
- transparente Bezahlung gemäß Tarifvertrag inkl. Jahressonderzahlung und regelmäßigen Entgelterhöhungen
- flexible Arbeitszeiten mit Gleitzeit und Teilzeitmöglichkeiten
- individuellen Fortbildungsmöglichkeiten und ein breiter Trainingskatalog für die persönliche Weiterentwicklung
- Sportangebote, wie Yoga, Laufveranstaltungen, Kooperationen mit Fitness Studios u.v.m.
- Eltern-Kind-Büros in allen Liegenschaften für Notfallbetreuung
- Deutschlandticket-Job mit Zuschuss
About the company
MF 2 "Fachdaten-Kompetenzzentrum" entwickelt technische Lösungen für die Public-Health-Surveillance und unterstützt datenbasierte Analysen und Berichte. Im Team CaSyMo entstehen Datenpipelines und Anwendungen zur zeitnahen Auswertung von Notaufnahme-, Krankenhaus- und Primärversorgungsdaten. Zudem modernisieren wir bestehende Systeme und bauen eine modulare, FHIR-kompatible Dateninfrastruktur auf.
Aus befristungsrechtlichen Gründen richtet sich die konkrete Vertragsdauer nach der individuellen Verfügbarkeit von Zeiten im Sinne des § 2 (1) des Wissenschaftszeitvertragsgesetzes (WissZeitVG).