Lead Tech IA - Genai
Maestris
Canton de Valbonne, France
1 month ago
Role details
Contract type
Permanent contract Employment type
Part-time (≤ 32 hours) Working hours
Regular working hours Languages
French Experience level
SeniorJob location
Remote
Canton de Valbonne, France
Tech stack
API
Azure
Linux
Python
Open Source Technology
Management of Software Versions
Large Language Models
Generative AI
Containerization
Kubernetes
Machine Learning Operations
REST
Docker
Job description
Dans ce cadre, nous recherchons un Lead Tech IA expérimenté, capable de travailler en étroite collaboration avec un Architecte IA déjà en place, et de prendre le relais opérationnel pour faire avancer les projets.
Le poste est résolument hands-on, orienté delivery, avec une forte culture open source et des enjeux de mise en production à grande échelle., Delivery & Lead technique
- Accompagner l'Architecte IA dans la mise en oeuvre des solutions
- Prendre en charge les sujets techniques en autonomie en son absence
- Faire avancer concrètement les projets (POC industrialisation production)
- Encadrer techniquement les développeurs / data engineers
Conception & orchestration de workflows IA
- Designer et implémenter des workflows LLM et GenAI avec :
- LangFlow
- LangFuse
- Structurer les chaînes de traitement (RAG, agents, pipelines multi-étapes)
- Optimiser les performances et la robustesse des workflows
Observabilité & MLOps
- Mettre en place l'observabilité des modèles et pipelines avec :
- MLflow
- Suivre les performances, dérives, logs et métriques
- Industrialiser les pratiques MLOps (versioning, tracking, reproductibilité)
Architecture & environnements
- Concevoir les environnements :
- Développement
- Validation / staging
- Production
- Définir les bonnes pratiques de déploiement en contexte hybride
- Garantir la reproductibilité et la scalabilité des environnements
Intégration LLM & API
- Concevoir et implémenter des APIs d'accès aux modèles LLM
- Intégrer des services via :
- Microsoft Azure (Azure OpenAI, etc.)
- Gérer les problématiques de sécurité, latence et volumétrie
Infrastructure & hybridation
- Travailler dans un contexte on-premise + cloud
- Déployer et opérer des composants open source en production
- Gérer les contraintes d'infrastructure (compute, GPU, stockage, réseau)
Coûts & performance
- Analyser et optimiser les coûts liés aux LLM et à l'infrastructure
- Arbitrer entre solutions cloud et on-premise
- Anticiper les contraintes de passage à l'échelle
Stack technique
Requirements
Langage : Python (principal), API REST
- GenAI / LLM : LangChain ecosystem, LangFlow, LangFuse
- MLOps : MLflow
- Cloud : Azure (OpenAI, services associés)
- Infra : Linux, environnements on-premise, conteneurisation (Docker/K8s apprécié)
- Data : pipelines data, stockage structuré / non structuré
- Approche : open source first (hors dépendance cloud forte), Profil recherché6+ ans d'expérience en développement / data / IAExpérience concrète en projets GenAI / LLMTrès forte capacité à livrer en production (pas uniquement du POC)Excellente maîtrise de Python et des architectures APIExpérience avec des outils open source (déployés et opérés soi-même) Ce que nous recherchons avant toutDes profils ayant déjà mis en production des systèmes IAUne expérience en environnements contraints (on-premise, hybride)Une capacité à gérer à la fois :le développementl'infrastructurele MCO (maintien en conditions opérationnelles) BonusExpérience avec LangFlow / LangFuse / MLflowConnaissance fine des problématiques de coût LLMExpérience Kubernetes / GPU / infra distribuéeCulture SRE / production, * 6+ ans d'expérience en développement / data / IA
- Expérience concrète en projets GenAI / LLM
- Très forte capacité à livrer en production (pas uniquement du POC)
- Excellente maîtrise de Python et des architectures API
- Expérience avec des outils open source (déployés et opérés soi-même)
Ce que nous recherchons avant tout
- Des profils ayant déjà mis en production des systèmes IA
- Une expérience en environnements contraints (on-premise, hybride)
- Une capacité à gérer à la fois :
- le développement
- l'infrastructure
- le MCO (maintien en conditions opérationnelles)
Bonus
- Expérience avec LangFlow / LangFuse / MLflow
- Connaissance fine des problématiques de coût LLM
- Expérience Kubernetes / GPU / infra distribuée
- Culture SRE / production