ingénieure ou un ingénieur données (data engineer) junior
Role details
Job location
Tech stack
Job description
- Développement d'applications web avec Typescript / Angular, Python / Django et PostgreSQL
- Développement de solutions data et IA avec Python / Streamlit et une plateforme data
- Intégration et déploiement continus avec Gitlab-CI, Ansible et Docker.
Le département collabore étroitement avec le département de l'exploitation et de l'infrastructure sur les aspects DevSecOps, et avec les départements projets et d'assistance à la maîtrise d'ouvrage dans des démarches projet classiques ou agiles.
Dans un souci d'amélioration continue, le département impulse et participe à des innovations internes pour accroitre son efficience technique : intégration d'OpenTelemetry, acculturation à Kubernetes, élaboration d'un assistant IA spécialisé dans le code, etc.
Vous développerez des solutions data dans un écosystème technologique s'appuyant sur le langage Python, une plateforme de traitement de données permettant de collecter, transformer, mettre en qualité et analyser des données, et une plateforme d'IA générative interne.
Vos missions sont les suivantes :
- Conception, développement et documentation d'applications de collecte, de traitement et de visualisation de données
- Conception, maintenance et optimisation de pipelines d'entraînement et de déploiement de modèle d'IA, en assurant l'automatisation, la traçabilité, la sécurité, la conformité et la collaboration avec les Data Scientists pour transformer les prototypes en produits utilisables
- Indexation du corpus documentaire interne selon une approche RAG (Retrieval Augmented Generation) en s'appuyant sur des modèles de langages ouverts et hébergés en interne ou sur la plateforme Albert de la DINUM, selon les exigences de confidentialité
- Collaboration étroite avec les développeurs, les exploitants ainsi que les data scientists et les experts métier utilisateurs de la plateforme de données
- Innovation : étudier et prototyper des usages d'IA prédictive et générative dans un but d'amélioration de l'efficacité et de la productivité des équipes de contrôle.
Vos missions sont supervisées un ingénieur data senior, en charge de la plateforme de données de la Cour.
Environnement technologique
- Python / Streamlit / LangChain (ou équivalent) : développement web et pipelines data et IA
- MLFlow : plateforme de gestion de cycle de vie des projets de machine learning, C'est le fondement de notre mission : s'assurer du bon emploi de l'argent public et informer les citoyens. Juridiction financière indépendante créée en 1807, la Cour des comptes est aussi une institution moderne, ouverte sur l'extérieur, qui ne cesse d'évoluer et de se transformer dans une logique d'efficacité et d'exemplarité.
La Cour des comptes a quatre missions principales : elle contrôle tous les organismes et institutions recevant de l'argent public, juge les gestionnaires publics, certifie les comptes de l'État et du régime général de sécurité sociale, et évalue les politiques publiques.
Chaque année, la Cour des comptes et ses sept chambres s'assurent de la bonne utilisation de l'argent public par les services de l'État, les établissements publics nationaux, les entreprises publiques, la sécurité sociale et par tout autre organisme en bénéficiant ou faisant appel à la générosité publique. Le contrôle est confié à un ou plusieurs « rapporteurs » assistés de « vérificateurs ».
Ces contrôles donnent lieu à des rapports qui peuvent être rendus publics. Ils consistent à apprécier de manière indépendante, objective et documentée, la régularité et la performance de la gestion d'une entité ou d'une activité. La Cour y présente les éventuels dysfonctionnements constatés et émet des recommandations pour en améliorer la gestion.
Par déclinaison, les Chambres Régionales et Territoriales des Comptes sont compétentes dans le jugement des comptes des comptables publics, le contrôle des comptes et de la gestion, le contrôle des actes budgétaires, et l'évaluation des politiques publiques mises en œuvre localement.
La Cour des comptes et les Chambres Régionales et Territoriales des Comptes constituent les Juridictions Financières.
Descriptif du service
La direction du numérique et des données, est une direction du Centre d'Appui Métiers dont la vocation est d'accompagner les agents dans leur quotidien numérique, de leur apporter l'expertise nécessaire aux contrôles, d'assurer la sécurité de leur patrimoine informationnel et de diffuser l'innovation à travers les Juridictions financière de manière optimisée.
Elle a pour missions de :
- Simplifier le quotidien numérique des utilisateurs ;
- Communiquer de façon continue sur son offre de service ;
- Renforcer les équipes de contrôle avec des experts ou des utilisateurs avancés de leurs solutions métiers ;
- Éclairer les prises de décisions et accompagner les porteurs de projets dans la qualification et l'expression du besoin ;
- Accueillir l'innovation et de faire des preuves de concept, de tester de nouveaux outils, de nouveaux usages et de les diffuser à travers de nouveaux projets ;
- Garantir un environnement numérique fonctionnel, évolutif et opérationnel de la façon la plus proactive et invisible possible.
Elle est structurée en 7 départements permettant d'assurer la réalisation des missions qui lui sont confiées.
Le département du développement logiciel est composé de moins d'une dizaine de développeurs chargés de la conception, du développement et de la maintenance des applications de gestion et d'appui au contrôle, à destination des personnels des différentes directions métiers des juridictions financières., une lettre de motivation adressée à M. le Directeur des Ressources Humaines, -un curriculum vitae, -les trois derniers comptes-rendus d'entretiens professionnels, -le dernier arrêté indiquant le grade et l'échelon (pour les fonctionnaires), -les copies des 3 dernières fiches de paye et, le cas échéant, des fiches de paye mentionnant tout élément indemnitaire non mensualisé (complément indemnitaire, bonus…) ou une fiche de rémunération annuelle fournie par l'administration d'origine.
Requirements
- Apache Superset : plateforme de dataviz
- Apache Airflow : orchestration des tâches
- Apache Spark : traitements de données distribuées
- Apache Nifi : acheminement et traitement de données
- Trino : moteur de requête
- ElasticSearch : indexation des données
- PostgreSQL : base de données relationnelle
- Stockage objet S3 / CephFS
- JupyterHub : notebooks Python et R
- Gitlab : chaines CI/CD
- Docker et Kubernetes, Expérience antérieure souhaitée : Une expérience antérieure de 2 ans sur un poste similaire serait appréciée ainsi qu'un profil d'ingénieur data de niveau bac+5.
Compétences requises :
- Maîtrise du langage de programmation Python
- Maîtrise de bases de données SQL (PostgreSQL) et d'ElasticSearch
- Connaissances en RAG (chunking, calcul d'embeddings, reranking, etc.)
- Connaissances en Machine Learning (apprentissage et inférence)
- Aisance avec des environnements Linux et Docker
- Expérience avec Apache Airflow et Apache Superset
Qualités nécessaires :
- Autonomie et aptitude au travail en équipe
- Capacité à analyser et résoudre efficacement
- Bonnes capacités de communication
- Apprentissage continu et curiosité intellectuelle
Benefits & conditions
Localisation
Localisation : 13 Rue Cambon, 75001 Paris, France, Emploi permanent de l'Etat à pourvoir prioritairement par une ou un fonctionnaire titulaire de catégorie A, par voie d'affectation CIGEM ou de détachement dans le corps des attachés d'administration de l'Etat ou des Ingénieurs en système d'information et communication pour une durée initiale d'un an renouvelable. Dans le cas où l'autorité de recrutement ne serait pas en mesure de pourvoir l'emploi par un ou une fonctionnaire titulaire présentant l'expertise ou l'expérience professionnelle adaptée aux missions à accomplir, cet emploi pourra être pourvu par voie contractuelle dans le cadre d'un CDD, d'une durée initiale de trois ans renouvelable, conclu au titre d'article L. 322-2 2° b).