Pre-Announcement Data Scientist/Astronomer, Survey Science A-005
Firmenprofil Deutsches
Görlitz, Germany
4 days ago
Role details
Contract type
Permanent contract Employment type
Full-time (> 32 hours) Working hours
Regular working hours Languages
GermanJob location
Görlitz, Germany
Tech stack
Airflow
File Systems
Machine Learning
Supercomputing
Dask
Slurm
Job description
- Development and optimization of data orchestration technologies for processing and storage pipelines over multiple computing infrastructure, e.g., large datasets obtained with MeerKAT and its extension, DSA2000, etc.
- Exploitation of novel data science techniques, e.g., Bayesian methods, machine learning, data provenance, etc.
- Implementation of efficient avenues of computation, e.g., through DASK/xarrays, casacore, GPU-based imaging of visibilities, etc.
Core Requirements:
- A PhD in Data Science, Mathematics, Astrophysics or equivalent field of research
- Familiarity with workflow managers, e.g., CWL, AirFlow, REANA, Stimela, or experience with (semi)automated handling of large-datasets, networking and authentication protocols
- Experience with utilization of high performance/super computing infrastructure that uses distributed filesystem. Familiarity with Slurm, HTCondor, etc., * Entwicklung und Optimierung von Technologien zur Datenorchestrierung für Verarbeitungs- und Speicherpiplines über verschiedene Recheninfrastrukturen hinweg, z.B. für große Datensätze, die mit MeerKat und dessen Erweiterung, DSA2000 usw. gewonnen wurden
- Nutzung neuartiger datenwissenschaftlicher Methoden z.B. Bayessche Verfahren/Bayessche Statistik, maschinellen Lernens, Data Provenance usw.
- Implementierung effizienter Rechenlösungen, z.B. mittels DASK/xarray, casacore, GPU-basierter Abbildung von Visibilitäten usw.
Requirements
- Promotion in Datenwissenschaften, Mathematik, Astrophysik oder einem gleichwertigen Forschungsgebiet
- Vertrautheit mit workflow managers wie CWL, AirFlow, REANA, Stimela oder Erfahrung im (halb-)automatisierten Umgang mit großen Datensätzen sowie mit Netzwerk- und Authentifizierungsprotokollen
- Erfahrung in der Nutzung von Hochleistungs- bzw. Supercomputing-Infrastrukturen mit verteilten Dateisystemen. Kenntnisse in Slurm, HTCondor usw. sind wünschenswert