Data Manager / Biostatisticien(-ne)
Role details
Job location
Tech stack
Job description
Mission Le projet ELDORA vise à développer des approches d'intelligence artificielle efficaces, rapides principale et interprétables pour la détection et la prédiction d'arythmies malignes et de myocardites liées aux immunothérapies (ICI) à partir de signaux ECG. Sous la responsabilité des 2 encadrants, Dr Edi PRIFTI (L'UMMISCO / IRD) et Pr Joe-Elie SALEM (CIC Paris-Est), vous jouerez un rôle central dans la gestion, la structuration et l'exploitation statistique de données cliniques et ECG issues de cohortes multi-sources nationales et internationales (France, États-Unis, etc.), en garantissant leur qualité, leur harmonisation et leur conformité réglementaire. Le poste est situé à l'interface entre l'équipe IA de recherche (IRD-UMMISCO) et l'équipe clinique AP-HP/INSERM Pitié-Salpêtrière, au sein d'un écosystème international très collaboratif.
Activités Gestion et gouvernance des données principales * Cartographier les sources de données et concevoir les modèles de données, dictionnaires et métadonnées.
-
Mettre en œuvre les principes FAIR et les exigences RGPD au sein des plans de gestion des données (DMP).
-
Assurer la traçabilité, la documentation et la gestion des accès aux données.
Qualité et curation des données
-
Superviser les flux d'ingestion, les contrôles qualité automatiques et les audit trails.
-
Effectuer l'harmonisation des données (formats ECG, unités, cohérence temporelle, pseudonymisation).
-
Mettre en place des workflows de transformation reproductibles (ETL, versioning, intégration continue).
Capture et intégration des données
-
Configurer et administrer des systèmes de capture électronique (EDC, ex. REDCap ou équivalent).
-
Concevoir les CRFs, gérer les droits d'accès et assurer la conformité avec les équipes cliniques et DPO.
Préparation des jeux analytiques
- Construire les jeux d'entraînement et de validation pour les modèles IA.
- Documenter et versionner les pipelines de transformation (Git, CI/CD, containers).
- Contribuer à la reproductibilité et à la transparence des jeux de données utilisés pour l'analyse.
Analyses statistiques et reporting
-
Réaliser les analyses descriptives et inférentielles (imputation, régressions, ROC/PR, calibration, survie).
-
Contribuer à l'évaluation des performances des modèles IA et aux réanalyses par sousgroupes.
-
Produire des rapports dynamiques et tableaux de bord (R Markdown, Quarto, notebooks).
-
Participer à la rédaction de publications et à la valorisation scientifique.
Coordination et collaboration transverses
-
Assurer l'interface entre les équipes UMMISCO/IRD, CIC-APHP et les partenaires internationaux (VUMC, UCSF).
-
Participer aux réunions du consortium, aux audits qualité et à la production des livrables.
Institut national de la santé et de la recherche médicale 2, Connaissances * Connaissances des modèles de données cliniques (OMOP, CDISC, HL7 FHIR) et des systèmes EDC (REDCap ou équivalent).
- Connaissance des bases de données SQL et des outils de visualisation (ggplot2, Plotly, Matplotlib).
Requirements
Savoir-faire * Maîtrise de R et/ou Python (tidymodels, scikit-learn, Pandas, NumPy).
- Bonnes pratiques de versioning et reproductibilité (Git/GitLab, Docker, CI/CD).
- Familiarité avec les signaux ECG ou données biomédicales ; environnement HPC/SLURM apprécié
Aptitudes * Rigueur, sens de l'organisation et esprit analytique.
- Excellentes capacités de communication avec cliniciens, ingénieurs et chercheurs.
- Aisance rédactionnelle en français et anglais.
Expérience(s) * Expérience confirmée dans la gestion et l'analyse de données cliniques ou biomédicales. souhaité(s) * Bonne connaissance des projets collaboratifs multi-acteurs et des standards qualité (SOPs, audit trail).
Niveau de * Master, diplôme d'ingénieur ou doctorat en data management, biostatistique, data science, diplôme et santé publique ou domaine connexe. formation(s)
Benefits & conditions
CDD 12 mois Début : dès que possible PARIS 13 Pas de télétravail Master / Doctorat, Spécificité(s) et Environnement scientifique environnement Le poste s'inscrit au sein du consortium international ELDORA, réunissant : du poste - UMMISCO / IRD (coordination IA), Date de prise de Dès que possible fonction
Durée (CDD et 12 mois détachements) Renouvelable : OUI NON
Temps de travail * Temps plein
- 38h30 hebdomadaires
- 45 jours de Congés Annuels et RTT par année civile (journée de solidarité à déduire)
Activités OUI NON télétravaillables
Rémunération * Contractuels : à partir de 2 985,82 € brut mensuel en fonction de l'expérience professionnelle sur des postes de niveau équivalent.