Lead Tech IA - Genai

Maestris
Canton de Valbonne, France
1 month ago

Role details

Contract type
Permanent contract
Employment type
Part-time (≤ 32 hours)
Working hours
Regular working hours
Languages
French
Experience level
Senior

Job location

Remote
Canton de Valbonne, France

Tech stack

API
Azure
Linux
Python
Open Source Technology
Management of Software Versions
Large Language Models
Generative AI
Containerization
Kubernetes
Machine Learning Operations
REST
Docker

Job description

Dans ce cadre, nous recherchons un Lead Tech IA expérimenté, capable de travailler en étroite collaboration avec un Architecte IA déjà en place, et de prendre le relais opérationnel pour faire avancer les projets.

Le poste est résolument hands-on, orienté delivery, avec une forte culture open source et des enjeux de mise en production à grande échelle., Delivery & Lead technique

  • Accompagner l'Architecte IA dans la mise en oeuvre des solutions
  • Prendre en charge les sujets techniques en autonomie en son absence
  • Faire avancer concrètement les projets (POC industrialisation production)
  • Encadrer techniquement les développeurs / data engineers

Conception & orchestration de workflows IA

  • Designer et implémenter des workflows LLM et GenAI avec :
  • LangFlow
  • LangFuse
  • Structurer les chaînes de traitement (RAG, agents, pipelines multi-étapes)
  • Optimiser les performances et la robustesse des workflows

Observabilité & MLOps

  • Mettre en place l'observabilité des modèles et pipelines avec :
  • MLflow
  • Suivre les performances, dérives, logs et métriques
  • Industrialiser les pratiques MLOps (versioning, tracking, reproductibilité)

Architecture & environnements

  • Concevoir les environnements :
  • Développement
  • Validation / staging
  • Production
  • Définir les bonnes pratiques de déploiement en contexte hybride
  • Garantir la reproductibilité et la scalabilité des environnements

Intégration LLM & API

  • Concevoir et implémenter des APIs d'accès aux modèles LLM
  • Intégrer des services via :
  • Microsoft Azure (Azure OpenAI, etc.)
  • Gérer les problématiques de sécurité, latence et volumétrie

Infrastructure & hybridation

  • Travailler dans un contexte on-premise + cloud
  • Déployer et opérer des composants open source en production
  • Gérer les contraintes d'infrastructure (compute, GPU, stockage, réseau)

Coûts & performance

  • Analyser et optimiser les coûts liés aux LLM et à l'infrastructure
  • Arbitrer entre solutions cloud et on-premise
  • Anticiper les contraintes de passage à l'échelle

Stack technique

Requirements

Langage : Python (principal), API REST

  • GenAI / LLM : LangChain ecosystem, LangFlow, LangFuse
  • MLOps : MLflow
  • Cloud : Azure (OpenAI, services associés)
  • Infra : Linux, environnements on-premise, conteneurisation (Docker/K8s apprécié)
  • Data : pipelines data, stockage structuré / non structuré
  • Approche : open source first (hors dépendance cloud forte), Profil recherché6+ ans d'expérience en développement / data / IAExpérience concrète en projets GenAI / LLMTrès forte capacité à livrer en production (pas uniquement du POC)Excellente maîtrise de Python et des architectures APIExpérience avec des outils open source (déployés et opérés soi-même) Ce que nous recherchons avant toutDes profils ayant déjà mis en production des systèmes IAUne expérience en environnements contraints (on-premise, hybride)Une capacité à gérer à la fois :le développementl'infrastructurele MCO (maintien en conditions opérationnelles) BonusExpérience avec LangFlow / LangFuse / MLflowConnaissance fine des problématiques de coût LLMExpérience Kubernetes / GPU / infra distribuéeCulture SRE / production, * 6+ ans d'expérience en développement / data / IA
  • Expérience concrète en projets GenAI / LLM
  • Très forte capacité à livrer en production (pas uniquement du POC)
  • Excellente maîtrise de Python et des architectures API
  • Expérience avec des outils open source (déployés et opérés soi-même)

Ce que nous recherchons avant tout

  • Des profils ayant déjà mis en production des systèmes IA
  • Une expérience en environnements contraints (on-premise, hybride)
  • Une capacité à gérer à la fois :
  • le développement
  • l'infrastructure
  • le MCO (maintien en conditions opérationnelles)

Bonus

  • Expérience avec LangFlow / LangFuse / MLflow
  • Connaissance fine des problématiques de coût LLM
  • Expérience Kubernetes / GPU / infra distribuée
  • Culture SRE / production

Apply for this position