Lead Tech IA - Genai

Maestris

Canton de Valbonne, France

1 month ago

Role details

Contract type

Permanent contract

Employment type

Part-time (≤ 32 hours)

Working hours

Regular working hours

Languages

French

Experience level

Senior

Job location

Remote

Canton de Valbonne, France

Tech stack

API

Azure

Linux

Python

Open Source Technology

Management of Software Versions

Large Language Models

Generative AI

Containerization

Kubernetes

Machine Learning Operations

REST

Docker

Job description

Dans ce cadre, nous recherchons un Lead Tech IA expérimenté, capable de travailler en étroite collaboration avec un Architecte IA déjà en place, et de prendre le relais opérationnel pour faire avancer les projets.

Le poste est résolument hands-on, orienté delivery, avec une forte culture open source et des enjeux de mise en production à grande échelle., Delivery & Lead technique

Accompagner l'Architecte IA dans la mise en oeuvre des solutions
Prendre en charge les sujets techniques en autonomie en son absence
Faire avancer concrètement les projets (POC industrialisation production)
Encadrer techniquement les développeurs / data engineers

Conception & orchestration de workflows IA

Designer et implémenter des workflows LLM et GenAI avec :
LangFlow
LangFuse
Structurer les chaînes de traitement (RAG, agents, pipelines multi-étapes)
Optimiser les performances et la robustesse des workflows

Observabilité & MLOps

Mettre en place l'observabilité des modèles et pipelines avec :
MLflow
Suivre les performances, dérives, logs et métriques
Industrialiser les pratiques MLOps (versioning, tracking, reproductibilité)

Architecture & environnements

Concevoir les environnements :
Développement
Validation / staging
Production
Définir les bonnes pratiques de déploiement en contexte hybride
Garantir la reproductibilité et la scalabilité des environnements

Intégration LLM & API

Concevoir et implémenter des APIs d'accès aux modèles LLM
Intégrer des services via :
Microsoft Azure (Azure OpenAI, etc.)
Gérer les problématiques de sécurité, latence et volumétrie

Infrastructure & hybridation

Travailler dans un contexte on-premise + cloud
Déployer et opérer des composants open source en production
Gérer les contraintes d'infrastructure (compute, GPU, stockage, réseau)

Coûts & performance

Analyser et optimiser les coûts liés aux LLM et à l'infrastructure
Arbitrer entre solutions cloud et on-premise
Anticiper les contraintes de passage à l'échelle

Stack technique

Requirements

Langage : Python (principal), API REST

GenAI / LLM : LangChain ecosystem, LangFlow, LangFuse
MLOps : MLflow
Cloud : Azure (OpenAI, services associés)
Infra : Linux, environnements on-premise, conteneurisation (Docker/K8s apprécié)
Data : pipelines data, stockage structuré / non structuré
Approche : open source first (hors dépendance cloud forte), Profil recherché6+ ans d'expérience en développement / data / IAExpérience concrète en projets GenAI / LLMTrès forte capacité à livrer en production (pas uniquement du POC)Excellente maîtrise de Python et des architectures APIExpérience avec des outils open source (déployés et opérés soi-même) Ce que nous recherchons avant toutDes profils ayant déjà mis en production des systèmes IAUne expérience en environnements contraints (on-premise, hybride)Une capacité à gérer à la fois :le développementl'infrastructurele MCO (maintien en conditions opérationnelles) BonusExpérience avec LangFlow / LangFuse / MLflowConnaissance fine des problématiques de coût LLMExpérience Kubernetes / GPU / infra distribuéeCulture SRE / production, * 6+ ans d'expérience en développement / data / IA

Expérience concrète en projets GenAI / LLM
Très forte capacité à livrer en production (pas uniquement du POC)
Excellente maîtrise de Python et des architectures API
Expérience avec des outils open source (déployés et opérés soi-même)

Ce que nous recherchons avant tout

Des profils ayant déjà mis en production des systèmes IA
Une expérience en environnements contraints (on-premise, hybride)
Une capacité à gérer à la fois :

le développement
l'infrastructure
le MCO (maintien en conditions opérationnelles)

Bonus

Expérience avec LangFlow / LangFuse / MLflow
Connaissance fine des problématiques de coût LLM
Expérience Kubernetes / GPU / infra distribuée
Culture SRE / production

Role details

Job location

Tech stack

Job description

Requirements

Apply for this position

Good distractions

Moments

Videos View all