Ingénieur informatique en bases de données linguistiques
Role details
Job location
Tech stack
Job description
La mission consistera à développer et maintenir des ressources numériques dédiées à la comparaison des langues et cultures, dans le cadre du projet HéLiCéO, en collaboration avec l'ingénieur du projet. Ces ressources incluent des bases de données existantes (EvoSem et EvoLex, sur le changement sémantique), des bases qui restent à créer (ex. sur le changement phonétique, les structures grammaticales, la mythologie comparée), ainsi que des sites de consultation destinés au public. Par ailleurs, l'ingénieur assistera les chercheurs, postdoctorants et doctorants du projet HéLiCéO dans la gestion de leurs données numériques : corpus de textes, données lexicographiques, données grammaticales. Enfin, la personne recrutée sera chargée d'élaborer le Plan de gestion des données (PGD) du projet HéLiCéO dans son ensemble, consistant à en sécuriser les données numériques sur le long terme. ACTIVITES PRINCIPALES
- Aide à la conception, à la création et à la maintenance de bases de données, sur des thèmes linguistiques (phonétique, grammaire, sémantique) et culturels (mythologies du Pacifique), en collaboration avec les responsables scientifiques
- Maintenance et expansion de bases de données existantes (ex. EvoSem, EvoLex)
- Aide à la préparation des données pour intégration aux bases et outils numériques
- Création et maintenance de scripts de conversion ( pipelines ) entre datasets, tableaux, et graphes
- Création et maintenance d'interfaces utilisateur ergonomiques : aide à l'entrée de données, moteurs de recherche, sites de consultation, sites de diffusion grand public
- Intégration continue, gestion de versions ; veille sur la pérennisation des contenus et des formats
- Accompagnement des membres d'HéLiCéO dans la gestion, l'archivage, et la valorisation de leurs données numériques.
- Élaboration (en coopération avec les responsables scientifiques) et suivi technique du plan de gestion des données (PGD) du projet HéLiCéO dans son ensemble, visant à sécuriser et pérenniser les données de la recherche., CHAMPS DES RELATIONS : Internes : collègues du projet HéLiCéO ; collègues du laboratoire Lattice ; services de l'ENS (Pôle Ressources Lettres) Externes : partenaires externes du projet HéLiCéO : pôles de Paris (ENS, Paris Cité) et de Tahiti (Univ. Polynésie française, MSH Pacifique)
Requirements
Diplôme : Bac+3 en informatique, ou en Traitement automatisé du langage ;
Connaissances :
- Connaissance des bases de données (notamment BD relationnelles), moteurs de recherches
- Connaissance des bases de la linguistique
- Familiarité avec la gestion de données multilingues (problématiques de traduction, d'encodage, etc.)
- Anglais : lu, écrit, parlé (au moins C1) ; connaissance du français (au moins B1) ;
- Savoirs souhaitables mais optionnels : Connaissance d'une langue autre que le français et l'anglais.
Compétences techniques :
- Programmation en Python ; Git ; Javascript ; Html/Css
- Technologies full stack web
- Requêtes http et API "REST" ; Outils XML : XSLT, XQuery, Xpath
- Théorie des graphes & détection de communautés.
Compétences comportementales :
- Capacité à travailler en équipe
- Capacité à travailler en autonomie, prise d'initiative
- Capacité à respecter les délais
- Curiosité scientifique, notamment dans le domaine de la diversité des langues et des cultures.
Benefits & conditions
Poste à pourvoir le : 1 février 2026 Durée du contrat : 1 2 mois Lieu de travail : Lattice - ENS Montrouge - 1 rue Maurice Arnoux, 92120 Montrouge Quotité de travail : 100% = 37h30 / semaine Poste ouvert uniquement aux contractuels Rémunération : selon grille et expérience (Salaire brut minimum : 2400 €/mois) L'ENS-PSL est un établissement handi-accueillant et attaché à la mixité et à la diversité.