Job offer

ECOLE NORMALE SUPERIEURE
Canton of Montrouge, France
9 days ago

Role details

Contract type
Temporary contract
Employment type
Full-time (> 32 hours)
Working hours
Regular working hours
Languages
English, French
Compensation
€ 29K

Job location

Canton of Montrouge, France

Tech stack

JavaScript
API
Computer Programming
Databases
Continuous Integration
Relational Databases
Digital Data
Graph Theory
Hypertext Transfer Protocols (HTTP)
Human-Computer Interaction
Python
Natural Language Processing
XML
XPath
XQuery
Extensible Stylesheet Language Transformations (XSLT)
Data Processing
GIT
Information Technology
Search Engines
Data Management
REST

Job description

La mission consistera à développer et maintenir des ressources numériques dédiées à la comparaison des langues et cultures, dans le cadre du projet HéLiCéO, en collaboration avec l'ingénieur du projet. Ces ressources incluent des bases de données existantes (EvoSem et EvoLex, sur le changement sémantique), des bases qui restent à créer (ex. sur le changement phonétique, les structures grammaticales, la mythologie comparée), ainsi que des sites de consultation destinés au public.

Par ailleurs, l'ingénieur·e assistera les chercheur·e·s, postdoctorant·e·s et doctorant·e·s du projet HéLiCéO dans la gestion de leurs données numériques : corpus de textes, données lexicographiques, données grammaticales.

Enfin, l'IE recruté·esera chargé·e d'élaborer le Plan de gestion des données (PGD) du projet HéLiCéO dans son ensemble, consistant à en sécuriser les données numériques sur le long terme.

ACTIVITES PRINCIPALES

  • Aide à la conception, à la création et à la maintenance de bases de données, sur des thèmes linguistiques (phonétique, grammaire, sémantique) et culturels (mythologies du Pacifique), en collaboration avec les responsables scientifiques
  • Maintenance et expansion de bases de données existantes (ex. EvoSem, EvoLex)
  • Aide à la préparation des données pour intégration aux bases et outils numériques
  • Création et maintenance de scripts de conversion (pipelines) entre datasets, tableaux, et graphes
  • Création et maintenance d'interfaces utilisateur ergonomiques : aide à l'entrée de données, moteurs de recherche, sites de consultation, sites de diffusion grand public
  • Intégration continue, gestion de versions ; veille sur la pérennisation des contenus et des formats
  • Accompagnement des membres d'HéLiCéO dans la gestion, l'archivage, et la valorisation de leurs données numériques.
  • Élaboration (en coopération avec les responsables scientifiques) et suivi technique du plan de gestion des données (PGD) du projet HéLiCéO dans son ensemble, visant à sécuriser et pérenniser les données de la recherche., The engineer's mission will be to develop and maintain digital resources dedicated to language and cultural comparison, within the HéLiCéO project, in cooperation with the existing engineer. These resources include existing databases (EvoSem and EvoLex, on semantic change), databases yet to be created (e.g., on grammatical structures, comparative mythology), as well as public sites for a broader audience.

Additionally, the engineer will assist researchers, postdoctoral fellows, and PhD students of the HéLiCéO project in managing their digital data: text corpora, lexical data, grammatical data.

Finally, the recruited Engineer will be responsible for developing the Data Management Plan (Plan de gestion des données, PGD) for the entire HéLiCéO project, aiming to secure digital data over the long term, and ensure their sustainability.

MAIN ACTIVITIES

  • Assist in the design, creation, and maintenance of databases on linguistic (phonetics, grammar, semantics) and cultural topics (Pacific narratives), in collaboration with the HéLiCéO engineer, and with scientific supervisors.
  • Maintain and expand existing databases (e.g., EvoSem, EvoLex).
  • Prepare data for integration into databases and digital tools; create and maintain scripts for converting datasets into tables and graphs.
  • Carry out Continuous integration and version management; monitor the sustainability of content and formats.
  • Create and maintain user-friendly interfaces: tools for data entry, search engines, creation of public websites.
  • Assist HéLiCéO members in managing, archiving, and sustaining their digital data.
  • Develop (in cooperation with scientific supervisors) and provide technical follow-up for the Data Management Plan (DMP) of the entire HéLiCéO project, aiming to secure and sustain digital research data.

Requirements

Diplôme : Bac+3 en informatique, ou en Traitement automatisé du langage ;

Expérience professionnelle : (sans restriction)

Connaissances :

  • Connaissance des bases de données (notamment BD relationnelles), moteurs de recherches
  • Connaissance des bases de la linguistique
  • Familiarité avec la gestion de données multilingues (problématiques de traduction, d'encodage, etc.)
  • Anglais : lu, écrit, parlé (au moins C1) ; connaissance du français (au moins B1) ;
  • Savoirs souhaitables mais optionnels : Connaissance d'une langue autre que le français et l'anglais.

Compétences techniques :

  • Programmation en Python ; Git ; Javascript ; Html/Css
  • Technologies full stack web
  • Requêtes http et API "REST" ; Outils XML : XSLT, XQuery, Xpath
  • Théorie des graphes & détection de communautés.

Compétences comportementales :

  • Capacité à travailler en équipe
  • Capacité à travailler en autonomie, prise d'initiative
  • Capacité à respecter les délais
  • Curiosité scientifique, notamment dans le domaine de la diversité des langues et des cultures., REQUIRED SKILLS

Degree : Bachelor's degree in Computer Science, or Natural Language Processing;

Work experience : (no restriction)

Knowledge :

  • Knowledge of databases (especially relational databases), search engines
  • Basic knowledge of linguistics
  • Familiarity with issues of multilingual data (issues of translation, encoding, etc.)
  • English: reading, writing, speaking (at least C1 level); knowledge of French (at least B1 level);
  • Optional skills: knowledge of a language other than French and English.

Technical Skills :

  • Programming in Python; Git; JavaScript; HTML/CSS
  • Simple full stack web technologies
  • HTTP requests and REST APIs; XML tools: XSLT, XQuery, Xpath
  • Graph theory & community detection

Behavioral Skills :

  • Ability to work in a team
  • Ability to work independently, take initiative
  • Ability to meet deadlines
  • Scientific curiosity, particularly in the field of linguistic and cultural diversity., Ce poste requiert autonomie et prise d'initiative.

POSITION SPECIFICS

This work requires some degree of independence and the ability to take initiative.

About the company

Dans ce cadre, HéLiCéO recrute un·e ingénieur·e d'études (IE) pour un contrat d'1 an. Si le financement du projet est confirmé au-delà de la 1re année, le contrat d'IE pourra être renouvelé d'année en année. Ce poste sera rattaché à deux des axes du projet HéLiCéO : axe 2 "Linguistique historique et comparative", et axe 3 "Patrimoine oral et mythologique". Le projet HéLiCéO comporte trois pôles : Tahiti, Paris et Montrouge ; le présent poste sera ancré à Montrouge près de Paris. Le pôle de Montrouge comptera entre 4 et 9 personnes selon les périodes. Cette équipe fait partie du lattice (Langues, Textes, Traitements informatiques, Cognition), un laboratoire Cnrs-ENS dynamique, consacré aux recherches en linguistique (lexique, grammaire, discours), modélisation du langage, TAL et intelligence artificielle. Le pôle HéLiCéO de Montrouge est coordonné par Alexandre François, linguiste, spécialiste de la typologie du changement linguistique, et de l'analyse des langues du Pacifique. Outre la supervision de ce dernier, l'ingénieur·e d'études travaillera également en collaboration avec Konstantin Henke (l'ingénieur informaticien du projet HéLiCéO) et avec Mathieu Dehouck (linguiste spécialisé en TAL) - ainsi qu'avec les autres partenaires du projet HéLiCéO. Seules seront retenues les candidatures incluant un CV et une lettre de motivation argumentée.

Apply for this position