Tech Lead IA
Role details
Job location
Tech stack
Job description
Vous rejoindrez une équipe dynamique dédiée à la création d'un callbot IA francophone de nouvelle génération, capable de comprendre et de répondre aux utilisateurs en temps réel avec une voix humaine naturelle.
En tant que Tech Lead, vous serez le chef d'orchestre technique du projet : vous superviserez la conception, l'intégration et la performance de l'ensemble du pipeline IA - du traitement audio jusqu'à la compréhension et la réponse vocale. Votre mission : garantir la stabilité, la scalabilité et la rapidité d'exécution de notre infrastructure IA pour des milliers d'appels simultanés.
Responsabilités
- Concevoir et piloter l'architecture globale du callbot IA (STT * NLP * TTS * téléphonie).
- Superviser les équipes techniques : Data Scientists, Data Engineers, MLOps, VoIP Engineers et Développeurs Full Stack.
- Garantir la cohérence et l'intégration des différentes briques techniques (modèles IA, API, pipelines, serveurs).
- Optimiser les performances temps réel : latence d'inférence, stabilité réseau, charge GPU/CPU.
- Définir et maintenir les standards techniques (sécurité, scalabilité, CI/CD, versioning, tests).
- Piloter le déploiement et le monitoring des modèles IA (Whisper, CamemBERT, Mistral, LLaMA, Coqui, etc.).
- Mettre en place les tableaux de bord et outils de supervision (Grafana, Prometheus, MLflow).
- Collaborer avec la direction pour définir la roadmap technique et traduire les objectifs business en choix d'architecture.
- Veiller à la qualité, la fiabilité et la documentation du code et des processus de déploiement.
- Anticiper les besoins de scalabilité et de montée en charge à grande échelle (plusieurs milliers d'appels simultanés).
Requirements
- Vous possédez une solide expérience en architecture logicielle ou en ingénierie IA (5 ans minimum).
- Vous avez déjà dirigé ou encadré une équipe technique pluridisciplinaire (data, infra, backend, IA).
- Vous maîtrisez les technologies MLOps / DevOps : Docker, Kubernetes, MLflow, CI/CD, Airflow, GitHub Actions.
- Vous comprenez les modèles de Speech-to-Text (Whisper, Vosk), de NLP francophone (CamemBERT, Mistral, LLaMA) et de Text-to-Speech (Coqui, XTTS).
- Vous savez concevoir et monitorer des systèmes temps réel avec contraintes de latence (<300 ms).
- Vous êtes à l'aise avec les environnements Cloud et serveurs GPU (AWS, OVH, GCP).
- Vous possédez un excellent sens de l'organisation, de la priorisation et de la communication technique.
- Vous aimez résoudre des problèmes complexes et piloter des projets à fort impact.
Environnement technique
- Langages : Python, Bash, SQL
- IA : Whisper, Vosk, CamemBERT, Mistral, LLaMA, Coqui, XTTS
- Infra : Docker, Kubernetes, MLflow, FastAPI, Airflow, Jenkins
- Cloud : AWS, GCP, OVH, Azure
- Bases : PostgreSQL, Redis, ChromaDB, FAISS
- Monitoring : Grafana, Prometheus, ELK Stack
- Téléphonie : Asterisk, FreeSWITCH, Drachtio, WebRTC