Ingénieur informatique en bases de données linguistiques

ECOLE NORMALE SUPERIEURE
Paris, France
5 days ago

Role details

Contract type
Temporary contract
Employment type
Full-time (> 32 hours)
Working hours
Regular working hours
Languages
English, French
Compensation
€ 40K

Job location

Paris, France

Tech stack

JavaScript
API
Databases
Continuous Integration
Digital Data
Graph Theory
Human-Computer Interaction
Python
XML
XPath
XQuery
Extensible Stylesheet Language Transformations (XSLT)
Data Processing
GIT
Search Engines
Data Management

Job description

La mission consistera à développer et maintenir des ressources numériques dédiées à la comparaison des langues et cultures, dans le cadre du projet HéLiCéO, en collaboration avec l'ingénieur du projet. Ces ressources incluent des bases de données existantes (EvoSem et EvoLex, sur le changement sémantique), des bases qui restent à créer (ex. sur le changement phonétique, les structures grammaticales, la mythologie comparée), ainsi que des sites de consultation destinés au public. Par ailleurs, l'ingénieur assistera les chercheurs, postdoctorants et doctorants du projet HéLiCéO dans la gestion de leurs données numériques : corpus de textes, données lexicographiques, données grammaticales. Enfin, la personne recrutée sera chargée d'élaborer le Plan de gestion des données (PGD) du projet HéLiCéO dans son ensemble, consistant à en sécuriser les données numériques sur le long terme. ACTIVITES PRINCIPALES

  • Aide à la conception, à la création et à la maintenance de bases de données, sur des thèmes linguistiques (phonétique, grammaire, sémantique) et culturels (mythologies du Pacifique), en collaboration avec les responsables scientifiques
  • Maintenance et expansion de bases de données existantes (ex. EvoSem, EvoLex)
  • Aide à la préparation des données pour intégration aux bases et outils numériques
  • Création et maintenance de scripts de conversion ( pipelines ) entre datasets, tableaux, et graphes
  • Création et maintenance d'interfaces utilisateur ergonomiques : aide à l'entrée de données, moteurs de recherche, sites de consultation, sites de diffusion grand public
  • Intégration continue, gestion de versions ; veille sur la pérennisation des contenus et des formats
  • Accompagnement des membres d'HéLiCéO dans la gestion, l'archivage, et la valorisation de leurs données numériques.
  • Élaboration (en coopération avec les responsables scientifiques) et suivi technique du plan de gestion des données (PGD) du projet HéLiCéO dans son ensemble, visant à sécuriser et pérenniser les données de la recherche., CHAMPS DES RELATIONS : Internes : collègues du projet HéLiCéO ; collègues du laboratoire Lattice ; services de l'ENS (Pôle Ressources Lettres) Externes : partenaires externes du projet HéLiCéO : pôles de Paris (ENS, Paris Cité) et de Tahiti (Univ. Polynésie française, MSH Pacifique)

Requirements

Diplôme : Bac+3 en informatique, ou en Traitement automatisé du langage ;

Connaissances :

  • Connaissance des bases de données (notamment BD relationnelles), moteurs de recherches
  • Connaissance des bases de la linguistique
  • Familiarité avec la gestion de données multilingues (problématiques de traduction, d'encodage, etc.)
  • Anglais : lu, écrit, parlé (au moins C1) ; connaissance du français (au moins B1) ;
  • Savoirs souhaitables mais optionnels : Connaissance d'une langue autre que le français et l'anglais.

Compétences techniques :

  • Programmation en Python ; Git ; Javascript ; Html/Css
  • Technologies full stack web
  • Requêtes http et API "REST" ; Outils XML : XSLT, XQuery, Xpath
  • Théorie des graphes & détection de communautés.

Compétences comportementales :

  • Capacité à travailler en équipe
  • Capacité à travailler en autonomie, prise d'initiative
  • Capacité à respecter les délais
  • Curiosité scientifique, notamment dans le domaine de la diversité des langues et des cultures.

Benefits & conditions

Poste à pourvoir le : 1 février 2026 Durée du contrat : 1 2 mois Lieu de travail : Lattice - ENS Montrouge - 1 rue Maurice Arnoux, 92120 Montrouge Quotité de travail : 100% = 37h30 / semaine Poste ouvert uniquement aux contractuels Rémunération : selon grille et expérience (Salaire brut minimum : 2400 €/mois) L'ENS-PSL est un établissement handi-accueillant et attaché à la mixité et à la diversité.

About the company

HéLiCéO " Héritages Linguistiques, Cultures orales, Éducation en Océanie " est un consortium scientifique du CNRS, prévu sur plusieurs années (2025-2030), et pour l'instant financé pour les 12 premiers mois. Il vise la documentation et la description des langues d'Océanie, leur analyse dans le cadre de la linguistique générale, et leur promotion dans l'éducation. Il prévoit la création de plusieurs bases de données scientifiques et ressources en ligne, destinées à différents publics. Dans ce cadre, HéLiCéO recrute un ingénieur d'études pour un contrat d'1 an. Ce poste sera rattaché à deux des axes du projet HéLiCéO : axe 2 " Linguistique historique et comparative ", et axe 3 " Patrimoine oral et mythologique ". Le projet HéLiCéO comporte trois pôles : Tahiti, Paris et Montrouge ; le présent poste sera ancré à Montrouge près de Paris. Le pôle de Montrouge comptera entre 4 et 9 personnes selon les périodes. Cette équipe fait partie du lattice ( Langues, Textes, Traitements informatiques, Cognition ), un laboratoire Cnrs-ENS dynamique, consacré aux recherches en linguistique (lexique, grammaire, discours), modélisation du langage, TAL et intelligence artificielle. Le pôle HéLiCéO de Montrouge est coordonné par Alexandre François, linguiste, spécialiste de la typologie du changement linguistique, et de l'analyse des langues du Pacifique. Outre la supervision de ce dernier, l'ingénieur d'études travaillera également en collaboration avec Konstantin Henke (l'ingénieur informaticien du projet HéLiCéO) et avec Mathieu Dehouck (linguiste spécialisé en TAL) - ainsi qu'avec les autres partenaires du projet HéLiCéO.

Apply for this position