Architecte Cloud H/F

DGSE - Direction Générale de la Sécurité Extérieure
Canton de Saint-Malo-1, France
8 days ago

Role details

Contract type
Permanent contract
Employment type
Full-time (> 32 hours)
Working hours
Regular working hours
Languages
French

Job location

Canton de Saint-Malo-1, France

Tech stack

Artificial Intelligence
Big Data
Cloud Computing
Continuous Integration
Datasheets
DevOps
Python
PostgreSQL
Machine Learning
NumPy
Octopus Deploy
Open Source Technology
TensorFlow
SQL Databases
Management of Software Versions
Feature Engineering
PyTorch
Large Language Models
Spark
Deep Learning
Kaggle
Generative AI
Keras
Vue.js
Pandas
Matplotlib
Pytest
Containerization
Scikit Learn
Kubernetes
Information Technology
HuggingFace
Machine Learning Operations
Vertica
Api Design
REST
Docker
Databricks
Microservices

Job description

L'ingénieur Data Scientist, spécialisé dans l'IA, est le/la référent(e) technique sur les sujets de machine learning, deep learning et IA générative. Il/elle traduit des problématiques métiers complexes en modèles prédictifs et systèmes intelligents, tout en veillant à leur robustesse, leur explicabilité et leur conformité éthique. Au sein de l'équipe Innovation et data, vos missions principales seront : Concevoir, entraîner et optimiser des modèles de machine learning et deep learning (supervisé, non supervisé, par renforcement) Développer des solutions d'IA générative : LLM, RAG (Retrieval-Augmented Generation), fine-tuning de modèles de fondation Réaliser des études de faisabilité et des preuves de concept (POC) sur de nouveaux cas d'usage IA Piloter les travaux IA confiés à des prestataires Effectuer une veille technologique active et intégrer les dernières avancées de la recherche en IA Collecter, nettoyer et préparer des jeux de données massifs et hétérogènes pour l'entraînement des modèles Concevoir des pipelines de feature engineering robustes et reproductibles Gérer les problématiques de données déséquilibrées, de bruit et de données manquantes Travailler sur des données multi-modales : texte, image, audio, séries temporelles, données tabulaires Packager et déployer les modèles en production via des API REST ou des microservices Mettre en place et maintenir des pipelines MLOps (CI/CD, versioning des modèles, monitoring des performances) Surveiller la dérive des données (data drift) et des modèles (model drift) en production Collaborer avec les équipes Data Engineering et DevOps pour l'intégration dans les systèmes existants Automatiser les workflows d'entraînement, d'évaluation et de réentraînement des modèles Assurer la conformité des solutions IA avec le règlement en vigueur Documenter les modèles (model cards, data sheets) et maintenir une traçabilité complète des expériences Travailler en étroite collaboration avec les équipes métiers pour cadrer les besoins et restituer les résultats

Positionnement dans la structure : Poste rattaché à la cheffe du pôle Innovation et Data et au Chef du Bureau Services d'Infrastructure de l'Innovation et la Data (BSIID), Relations internes (à la DGAMPA) : avec les maîtrises d'oeuvre des applications (architectures applicatives, expertise technique) avec les maîtrises d'ouvrage des applications avec les autorités de sécurité (RSSI, ASSI) avec les agents SDTNUM Relations externes : avec les services déconcentrés avec les partenaires institutionnels de la DGAMPA avec les prestataires en charge de la réalisation de solutions numériques Data

Requirements

Vous êtes un Data scientist confirmé, spécialisé dans le domaine de l'Intelligence Artificielle, avec un diplôme scientifique de spécialité informatique de niveau 7 RNCP. Bac +5 ou doctorat en data science, mathématiques appliquées, informatique, statistiques, physique ou domaine équivalent Expérience sur des projets LLM / IA générative, contributions open source, publications ou participations à des compétitions (Kaggle, NeurIPS, ICML) serait un plus. Votre expérience en analyse et traitement de données dans un contexte Big Data sera très appréciée. Compétences techniques requises : Python expert (scikit-learn, pandas, numpy, matplotlib) Frameworks : PyTorch, TensorFlow / Keras, JAX, Vue.js, riff,PyTest LLM & IA générative : Albert IA, RAG, N2SQL, LangChain, LlamaIndex, HuggingFace, OpenAI API, QDrant MLOps : MLflow, Kubeflow, DVC, Weights & Biases Plateformes cloud AI : Kubernetes, MinIO, microservices, Postgres, ArgoCD SQL avancé + outils big data (Spark, Databricks), Clickhouse Conteneurisation : Docker, Kubernetes Statistiques avancées & mathématiques (algèbre linéaire, probabilités, optimisation) XAI & IA éthique (SHAP, LIME, fairness metrics) Compétences comportementales requises : Curiosité intellectuelle et goût prononcé pour la recherche Rigueur scientifique et pensée critique sur les résultats Capacité à vulgariser des concepts complexes auprès de non-experts Autonomie et force de proposition Esprit collaboratif et ouverture au feedback Gestion de l'incertitude et résilience face aux échecs expérimentaux Sens éthique et responsabilité dans l'usage de l'IA A l'aise avec les méthodologies de conduite de projets agiles, vous saurez vous intégrer dans un travail en équipe., Vous êtes un Data scientist confirmé, spécialisé dans le domaine de l'Intelligence Artificielle, avec un diplôme scientifique de spécialité informatique de niveau 7 RNCP. Bac +5 ou doctorat en data science, mathématiques appliquées, informatique, statistiques, physique ou domaine équivalent Expérience sur des projets LLM / IA générative, contributions open source, publications ou participations à des compétitions (Kaggle, NeurIPS, ICML) serait un plus.

Votre expérience en analyse et traitement de données dans un contexte Big Data sera très appréciée. Compétences techniques requises : Python expert (scikit-learn, pandas, numpy, matplotlib) Frameworks : PyTorch, TensorFlow / Keras, JAX, Vue.js, riff,PyTest LLM & IA générative : Albert IA, RAG, N2SQL, LangChain, LlamaIndex, HuggingFace, OpenAI API, QDrant MLOps : MLflow, Kubeflow, DVC, Weights & Biases Plateformes cloud AI : Kubernetes, MinIO, microservices, Postgres, ArgoCD SQL avancé + outils big data (Spark, Databricks), Clickhouse Conteneurisation : Docker, Kubernetes Statistiques avancées & mathématiques (algèbre linéaire, probabilités, optimisation) XAI & IA éthique (SHAP, LIME, fairness metrics), Curiosité intellectuelle et goût prononcé pour la recherche Rigueur scientifique et pensée critique sur les résultats Capacité à vulgariser des concepts complexes auprès de non-experts Autonomie et force de proposition Esprit collaboratif et ouverture au feedback Gestion de l'incertitude et résilience face aux échecs expérimentaux Sens éthique et responsabilité dans l'usage de l'IA A l'aise avec les méthodologies de conduite de projets agiles, vous saurez vous intégrer dans un travail en équipe.

Benefits & conditions

EducationalOccupationalCredential postgraduate degree

FULL_TIME

OccupationalExperienceRequirements 12

Organization Direction Générale Des Affaires Maritimes, de la Pêche et de l'Aquaculture (DGAMPA)

PropertyValue Direction Générale Des Affaires Maritimes, de la Pêche et de l'Aquaculture (DGAMPA)

Apply for this position