Job offer
Role details
Job location
Tech stack
Job description
La mission consistera à développer et maintenir des ressources numériques dédiées à la comparaison des langues et cultures, dans le cadre du projet HéLiCéO, en collaboration avec l'ingénieur du projet. Ces ressources incluent des bases de données existantes (EvoSem et EvoLex, sur le changement sémantique), des bases qui restent à créer (ex. sur le changement phonétique, les structures grammaticales, la mythologie comparée), ainsi que des sites de consultation destinés au public.
Par ailleurs, l'ingénieur·e assistera les chercheur·e·s, postdoctorant·e·s et doctorant·e·s du projet HéLiCéO dans la gestion de leurs données numériques : corpus de textes, données lexicographiques, données grammaticales.
Enfin, l'IE recruté·esera chargé·e d'élaborer le Plan de gestion des données (PGD) du projet HéLiCéO dans son ensemble, consistant à en sécuriser les données numériques sur le long terme.
ACTIVITES PRINCIPALES
- Aide à la conception, à la création et à la maintenance de bases de données, sur des thèmes linguistiques (phonétique, grammaire, sémantique) et culturels (mythologies du Pacifique), en collaboration avec les responsables scientifiques
- Maintenance et expansion de bases de données existantes (ex. EvoSem, EvoLex)
- Aide à la préparation des données pour intégration aux bases et outils numériques
- Création et maintenance de scripts de conversion (pipelines) entre datasets, tableaux, et graphes
- Création et maintenance d'interfaces utilisateur ergonomiques : aide à l'entrée de données, moteurs de recherche, sites de consultation, sites de diffusion grand public
- Intégration continue, gestion de versions ; veille sur la pérennisation des contenus et des formats
- Accompagnement des membres d'HéLiCéO dans la gestion, l'archivage, et la valorisation de leurs données numériques.
- Élaboration (en coopération avec les responsables scientifiques) et suivi technique du plan de gestion des données (PGD) du projet HéLiCéO dans son ensemble, visant à sécuriser et pérenniser les données de la recherche., The engineer's mission will be to develop and maintain digital resources dedicated to language and cultural comparison, within the HéLiCéO project, in cooperation with the existing engineer. These resources include existing databases (EvoSem and EvoLex, on semantic change), databases yet to be created (e.g., on grammatical structures, comparative mythology), as well as public sites for a broader audience.
Additionally, the engineer will assist researchers, postdoctoral fellows, and PhD students of the HéLiCéO project in managing their digital data: text corpora, lexical data, grammatical data.
Finally, the recruited Engineer will be responsible for developing the Data Management Plan (Plan de gestion des données, PGD) for the entire HéLiCéO project, aiming to secure digital data over the long term, and ensure their sustainability.
MAIN ACTIVITIES
- Assist in the design, creation, and maintenance of databases on linguistic (phonetics, grammar, semantics) and cultural topics (Pacific narratives), in collaboration with the HéLiCéO engineer, and with scientific supervisors.
- Maintain and expand existing databases (e.g., EvoSem, EvoLex).
- Prepare data for integration into databases and digital tools; create and maintain scripts for converting datasets into tables and graphs.
- Carry out Continuous integration and version management; monitor the sustainability of content and formats.
- Create and maintain user-friendly interfaces: tools for data entry, search engines, creation of public websites.
- Assist HéLiCéO members in managing, archiving, and sustaining their digital data.
- Develop (in cooperation with scientific supervisors) and provide technical follow-up for the Data Management Plan (DMP) of the entire HéLiCéO project, aiming to secure and sustain digital research data.
Requirements
Diplôme : Bac+3 en informatique, ou en Traitement automatisé du langage ;
Expérience professionnelle : (sans restriction)
Connaissances :
- Connaissance des bases de données (notamment BD relationnelles), moteurs de recherches
- Connaissance des bases de la linguistique
- Familiarité avec la gestion de données multilingues (problématiques de traduction, d'encodage, etc.)
- Anglais : lu, écrit, parlé (au moins C1) ; connaissance du français (au moins B1) ;
- Savoirs souhaitables mais optionnels : Connaissance d'une langue autre que le français et l'anglais.
Compétences techniques :
- Programmation en Python ; Git ; Javascript ; Html/Css
- Technologies full stack web
- Requêtes http et API "REST" ; Outils XML : XSLT, XQuery, Xpath
- Théorie des graphes & détection de communautés.
Compétences comportementales :
- Capacité à travailler en équipe
- Capacité à travailler en autonomie, prise d'initiative
- Capacité à respecter les délais
- Curiosité scientifique, notamment dans le domaine de la diversité des langues et des cultures., REQUIRED SKILLS
Degree : Bachelor's degree in Computer Science, or Natural Language Processing;
Work experience : (no restriction)
Knowledge :
- Knowledge of databases (especially relational databases), search engines
- Basic knowledge of linguistics
- Familiarity with issues of multilingual data (issues of translation, encoding, etc.)
- English: reading, writing, speaking (at least C1 level); knowledge of French (at least B1 level);
- Optional skills: knowledge of a language other than French and English.
Technical Skills :
- Programming in Python; Git; JavaScript; HTML/CSS
- Simple full stack web technologies
- HTTP requests and REST APIs; XML tools: XSLT, XQuery, Xpath
- Graph theory & community detection
Behavioral Skills :
- Ability to work in a team
- Ability to work independently, take initiative
- Ability to meet deadlines
- Scientific curiosity, particularly in the field of linguistic and cultural diversity., Ce poste requiert autonomie et prise d'initiative.
POSITION SPECIFICS
This work requires some degree of independence and the ability to take initiative.