Datenwissenschaftler
Role details
Job location
Tech stack
Job description
- Konzeption und Aufbau einer zentralen Storage-Lösung für große Forschungsdatenbestände (u. a. Sequenzierdaten/FASTQ, scRNA-/ATAC-seq, Bilddaten) im Umfeld der Uni-Cloud inkl. nachhaltiger Datenhaltung und definierter Aufbewahrungsfristen
- Implementierung und Betrieb von Mechanismen zur kontrollierten Datenbereitstellung und -freigabe für CRC-interne und -externe Kollaboration
- Integration/Anbindung der Datenspeicherung an Forschungs- und Metadatensysteme sowie Unterstützung von Datenimporten
- Bereitstellung nutzerfreundlicher Analysezugänge auf HPC- und Cloud-Ressourcen, insbesondere über JupyterHub und Virtual Desktop/Remote-Desktop-Lösungen
- Weiterentwicklung und Betrieb containerbasierter Analyseumgebungen für JupyterHub: Erstellung/ Pflege spezialisierter Container-Images, Integration wissenschaftlicher Software, Lifecycle Management
- Aufbau/Weiterentwicklung von CI- und GitOps-Workflows zur automatisierten Image-Erstellung, Tests, Security-Updates und kontrolliertem Rollout
- Betrieb, Monitoring, Incident-/Problem-Management und Dokumentation der bereitgestellten Services
- Enge Abstimmung mit Datenschutz/IT-Sicherheit sowie klinischen Partnern; Mitwirkung an Betriebskonzepten für sensible Patient*innendaten, * Wertschätzung, Verbindlichkeit, Offenheit und Respekt - das sind Werte, die uns wichtig sind.
- Mit einer großen Anzahl an unterschiedlichsten Arbeitszeitmodellen ermöglichen wir Ihnen flexibles Arbeiten - auch von Zuhause aus.
- Ob Pflege oder Kinderbetreuung - unser bietet Ihnen konkrete Unterstützungsangebote, damit Sie Privates und Berufliches unter einen Hut bekommen.
- Ihre individuelle, passgenaue ist uns als Bildungseinrichtung nicht nur wichtig, sondern eine Herzensangelegenheit.
- Von Aikido bis Zumba - unsere von A - Z sorgen für Ihre Work-Life-Balance.
- Sie profitieren von zahlreichen Benefits des öffentlichen Dienstes wie z. B. einer attraktiven betrieblichen Altersvorsorge (), einer und einem Arbeitsplatz, der kaum von wirtschaftlichen Schwankungen abhängig ist.
Requirements
- Abgeschlossenes wissenschaftliches Hochschulstudium (Diplom oder Master) in einem der MINT Fächer oder Wirtschaftsinformatik
- Gute Linux-Kenntnisse (Administration, Troubleshooting, Automatisierung, insb. Installation von Anwendungen) werden vorausgesetzt
- Gute Kenntnisse in Shell-Scripting und der Programmiersprache Python, sowie sichere Anwendung von Git werden erwartet
- Gute Kenntnisse in Containerisierung und Build-Prozessen, sowie Erfahrung mit CI/CD Pipelines sind notwendig
- Sehr gute Deutschkenntnisse in Wort und Schrift (mindestens Niveau C1) zur Kommunikation mit Mitarbeitenden und zur Erstellung von Dokumentationen sowie gute Englischkenntnisse (mindes tens Niveau B2) zur fachlichen Abstimmung und zum Umgang mit englischsprachigen Unterlagen werden erwartet
- Fähigkeit, Anforderungen mit wissenschaftlichen Nutzergruppen strukturiert aufzunehmen und in stabile, wartbare Services zu überführen
- Teamorientierte, service- und lösungsorientierte Arbeitsweise
Darüber hinaus sind folgende Kenntnisse sind wünschenswert:
- Erfahrung in Nutzung oder Betrieb von JupyterHub-Umgebungen
- Kenntnisse in der Nutzung von Kubernetes
- Kenntnisse zu Storage- und Zugriffskonzepten für große Datenmengen (z. B. POSIX Berechtigungen)
- Verständnis von IT-Sicherheits- und Datenschutzanforderungen in Forschungskontexten, insbesondere bei sensitiven/klinischen Daten
Benefits & conditions
**zu besetzen. Angeboten wird eine bis zum 31.12.2029 befristete Vollzeitstelle. Die wöchentliche Arbeits zeit beträgt zurzeit 39 Stunden und 50 Minuten.
Die Stelle ist angesiedelt und eingebettet in den vom DGF geförderten Sonderforschungsbereich 1748 "Grundlagen der Reproduktion". Am SFB 1748 sind Wissenschaftler der Universität, des Universitätsklini kums (UKM) und des Max-Planck-Instituts (MPI) Münster sowie der RWTH Aachen beteiligt.
Unser zentrales Ziel ist es, die genetischen, molekularen und zellulären Mechanismen aufzuklären, die die Bildung und Funktion der Hoden, die Produktion und Funktion der Spermien, die Befruchtung sowie die frühe Embryonalentwicklung - sowohl bei Gesundheit als auch bei Krankheit - steuern. Zu diesem Zweck kombinieren wir interdisziplinäre Forschung in den Bereichen Molekular-, Struktur- und Zellbiologie sowie Physiologie, Biophysik, Epi-/Genetik, (Bio-)Informatik und multimodale Datenanalyse.
Die Stelle ist in der Gruppe "Cloud-Infrastruktur" innerhalb der Abteilung 6 - Systeme am CIT zugeordnet. Dort werden die zentrale Uni Cloud (/) auf Basis von OpenStack und Kuber netes sowie cloudnahe Dienste betrieben. Zudem verantwortet die Gruppe das landesweite Projekt Jupy terHub.nrw (), das Forschenden in ganz Nordrhein-Westfalen eine JupyterHub-Um gebung bereitstellt. Unter Nutzung dieser und weiterer Dienste des CIT und der Universitäts- und Landes bibliothek (ULB) unterstützt die Gruppe bestmöglich diverse Sonderforschungsbereiche und NFDI-Projekte.**