Pre-Announcement Data Scientist/Astronomer, Survey Science A-005

Firmenprofil Deutsches
Görlitz, Germany
4 days ago

Role details

Contract type
Permanent contract
Employment type
Full-time (> 32 hours)
Working hours
Regular working hours
Languages
German

Job location

Görlitz, Germany

Tech stack

Airflow
File Systems
Machine Learning
Supercomputing
Dask
Slurm

Job description

  • Development and optimization of data orchestration technologies for processing and storage pipelines over multiple computing infrastructure, e.g., large datasets obtained with MeerKAT and its extension, DSA2000, etc.
  • Exploitation of novel data science techniques, e.g., Bayesian methods, machine learning, data provenance, etc.
  • Implementation of efficient avenues of computation, e.g., through DASK/xarrays, casacore, GPU-based imaging of visibilities, etc.

Core Requirements:

  • A PhD in Data Science, Mathematics, Astrophysics or equivalent field of research
  • Familiarity with workflow managers, e.g., CWL, AirFlow, REANA, Stimela, or experience with (semi)automated handling of large-datasets, networking and authentication protocols
  • Experience with utilization of high performance/super computing infrastructure that uses distributed filesystem. Familiarity with Slurm, HTCondor, etc., * Entwicklung und Optimierung von Technologien zur Datenorchestrierung für Verarbeitungs- und Speicherpiplines über verschiedene Recheninfrastrukturen hinweg, z.B. für große Datensätze, die mit MeerKat und dessen Erweiterung, DSA2000 usw. gewonnen wurden
  • Nutzung neuartiger datenwissenschaftlicher Methoden z.B. Bayessche Verfahren/Bayessche Statistik, maschinellen Lernens, Data Provenance usw.
  • Implementierung effizienter Rechenlösungen, z.B. mittels DASK/xarray, casacore, GPU-basierter Abbildung von Visibilitäten usw.

Requirements

  • Promotion in Datenwissenschaften, Mathematik, Astrophysik oder einem gleichwertigen Forschungsgebiet
  • Vertrautheit mit workflow managers wie CWL, AirFlow, REANA, Stimela oder Erfahrung im (halb-)automatisierten Umgang mit großen Datensätzen sowie mit Netzwerk- und Authentifizierungsprotokollen
  • Erfahrung in der Nutzung von Hochleistungs- bzw. Supercomputing-Infrastrukturen mit verteilten Dateisystemen. Kenntnisse in Slurm, HTCondor usw. sind wünschenswert

Apply for this position