AI / GenAI Engineer - CDI - CDI H/F
Role details
Job location
Tech stack
Job description
Vous interviendrez au cœur des équipes Data, Produit, DSI et métiers pour transformer des cas d'usage IA en solutions concrètes et à forte valeur ajoutée : automatisation de processus, knowledge assistants, aide à la décision, structuration de données non structurées et conception d'agents métier., * Concevoir, développer et déployer des pipelines RAG « production-grade » (ingestion, nettoyage, chunking, embeddings, vector DB, retrieval, génération) sur des corpus variés : documentation interne, bases de connaissances, données structurées et non structurées.
- Mettre en place des stratégies de retrieval robustes : multimodal search, hybrid search, filtres métadonnées, semantic ranking, gestion multilingue, optimisation des performances.
- Construire des agents LLM capables d'orchestrer des outils hétérogènes (ERP, CRM, bases documentaires, APIs métier, outils BI) avec des garanties de sécurité, de traçabilité et de conformité.
- Participer à la définition et à la mise en œuvre de Model Context Protocol (MCP) pour exposer les services et données métier des clients à des agents LLM.
- Industrialiser les solutions : APIs, services backend, intégration SI, monitoring, alerting, A/B testing, gestion des coûts et de la latence.
- Collaborer avec les équipes Produit, Data et DSI ainsi qu'avec les directions métier pour cadrer les cas d'usage, prioriser les features et mesurer la valeur délivrée.
- Assurer une veille active sur les LLMs, frameworks d'agents, pratiques RAG/LLMOps et proposer des améliorations continues.
- Selon vos envies d'évolution, contribuer au sein du cabinet au développement de l'offre (avant-vente, veille technologique, suivi de projet, mise en situation de jeunes consultant(e)s…).
Outils & Environnement
- Python en environnement de production (tests, packaging, bonnes pratiques de code review)
- LLMs (OpenAI, Anthropic, Mistral, etc.), embeddings, bases vectorielles
- Architectures RAG (production), gestion du grounding, hallucinations, citations, multilingue
- Frameworks d'agents et d'orchestration (LangChain, LlamaIndex ou équivalent)
- Approches MCP / agentic AI
- Développement d'APIs et services backend (FastAPI ou équivalent)
- Intégration avec systèmes existants (ERP, CRM, bases documentaires)
- Cloud platforms (GCP, Azure)
- MLOps / LLMOps : monitoring, évaluation, logs détaillés, A/B testing, rollouts / rollbacks
Requirements
Diplômé(e) d'une école d'ingénieur ou d'un Master en informatique, data science ou domaine connexe
4 ans d'expérience minimum (Data-Scientiste, ML engineer…), dont une expérience récente sur les LLM / GenAI, * Maîtrise solide de Python en environnement de production (tests, packaging, bonnes pratiques de code review)
-
Expérience concrète avec les LLMs (OpenAI, Anthropic, Mistral, etc.), les embeddings et au moins une base vectorielle
-
Pratique avérée des architectures RAG (idéalement en production) et bonne compréhension des enjeux de grounding, hallucinations, citations, multilingue
-
Connaissance des frameworks d'agents et d'orchestration (LangChain, LlamaIndex ou équivalent) et intérêt fort pour les approches MCP / agentic AI
-
Compétences en développement d'APIs et services backend (FastAPI / équivalent), intégration avec des systèmes existants (ERP, CRM, bases documentaires)
-
Maîtrise d'un des principales cloud-platform (GCP, Azure)
-
Notions de MLOps / LLMOps : monitoring, évaluation, logs détaillés, A/B testing, rollouts / rollbacks Soft skills
-
Autonomie, rigueur, goût pour le travail en équipe pluridisciplinaire
-
Capacité à comprendre les enjeux métier de secteurs variés et à vulgariser des sujets techniques auprès d'interlocuteurs non techniques
-
Français courant, anglais professionnel (clients internationaux)