Generative ai Engineer H/F
Role details
Job location
Tech stack
Job description
Implémenter des solutions RAG, agents IA et assistants métiers.
- Intégrer des LLM dans les systèmes existants et orchestrer leurs interactions.
- Optimiser les prompts, embeddings et chaînes d'orchestration pour améliorer la pertinence et la performance.
- Gérer les problématiques de coûts, latence et sécurité des solutions GenAI.
- Mettre en place les bonnes pratiques de gouvernance et de conformité pour l'IA générative.
- Collaborer étroitement avec les équipes Data, IT et métiers pour assurer la cohérence des solutions.
Vos challenges au quotidien :
Vous intervenez sur tout le cycle de vie du projet, du conseil au code :
- Cadrer et architecturer : analyser le besoin métier pour définir la meilleure stratégie (RAG, agents, fine-tuning) et la stack adaptée à l'environnement client.
- Industrialiser : développer du code robuste et modulaire (Python) pour intégrer les LLM aux SI existants (API, Data Lakes) et sortir de la logique de POC.
- Optimiser et sécuriser : garantir la viabilité des solutions en maîtrisant les coûts/latences (LLMOps) et en implémentant les barrières de sécurité (guardrails).
- Accompagner : vulgariser les concepts techniques et guider les équipes métiers et IT du client dans l'adoption de ces nouvelles technologies.
Votre palette technique :
Nous ne cherchons pas un expert d'un seul outil, mais un ingénieur capable de naviguer dans des écosystèmes variés. Voici les technologies sur lesquelles vous serez amené(e) à intervenir et conseiller :
- Le socle : maîtrise indispensable de Python et des bonnes pratiques de Software Engineering (Clean Code, Git, CI/CD) pour garantir la robustesse des livrables chez nos clients.
- LLM et orchestration : capacité à orchestrer des chaînes complexes (LangChain, LlamaIndex, Semantic Kernel) et à choisir le bon modèle pour le bon usage (OpenAI, Azure AI, Bedrock, Vertex AI, ou solutions open source type Mistral/Llama).
- Data et bases vectorielles : savoir intégrer la solution dans l'écosystème data du client, que ce soit sur Pinecone, Qdrant, Weaviate ou directement via pgvector/Elasticsearch.
- Architecture et cloud : aisance à déployer aussi bien sur AWS, Azure que GCP, ou dans des environnements on-premise contraints.
- LLMOps : mettre en place les outils de monitoring et d'évaluation adaptés au client (LangSmith, MLflow, Ragas, etc.)., Une organisation résolument tournée vers l'IA : nous sommes notre propre client et nous menons une transformation agentique ambitieuse pour notre métier coeur et pour nos métiers transverses.
- L'impact : vous intervenez sur les projets les plus stratégiques de nos clients, là où l'IA transforme réellement les business models.
- La communauté : échangez avec 450 pairs, contribuez à notre veille, nos publications et participez à nos événements
- Le cadre : des bureaux inspirants et une culture d'entreprise qui valorise l'audace et l'expertise., Notre ecosystème permet de pratiquer de nombreuses activités loisirs et sportives (musique, photo, e-sport, yoga...) avec un cadre de travail flexible grâce à une charte de télétravail, et de prendre soin de tous (cabinet médical en libre accès, groupes de travail dédiés aux enjeux « égalité et pluralité » ...).
Processus de Recrutement :
Un de ces entretiens sera forcément en présentiel :
- 1er échange RH : échange sur vos souhaits et motivation, présentation de l'entreprise (30 min).
- Test technique sur HackerRank (30 min).
- 2e échange technique avec un de vos futurs pairs (1 h).
- 3e échange avec un Leader (45 min).
- 4e échange avec un Partner : projection sur votre rôle au sein de Onepoint (30 min)., Contribuez aux grandes transformations des entreprises et des acteurs publics en alliant innovation technologique et expertise métier, au service de nos clients et de la société pour les faire avancer durablement.
Requirements
Expérience : vous avez un background solide en Data Science, Data Engineering ou Software Engineering (min. 2 ans) et avez pivoté vers l'IA générative avec des premières réalisations concrètes (projets pros ou personnels avancés).
- Polyvalence : vous ne bloquez pas si le client utilise Azure au lieu d'AWS. Vous apprenez vite et savez vous adapter aux contraintes (legacy, sécurité bancaire, etc.).
- Posture conseil : vous savez vulgariser des concepts techniques complexes. Vous êtes capable d'expliquer pourquoi un RAG est nécessaire (ou non) à un directeur métier.
- Mindset « Prod-Ready » : vous codez proprement. Vous savez que la valeur d'un consultant se mesure à la pérennité de ce qu'il laisse derrière lui.