Data Scientist IA H/F
Role details
Job location
Tech stack
Job description
Alimenter et dépiler un backlog relatif aux questions à se poser et aux prochaines étapes à mettre en oeuvre pour améliorer le moteur d'estimation actuel.
- Proposer de nouveaux cas d'usage à nos jeux de données, indépendamment de l'estimation.
- Définir de nouvelles sources de données exploitables, analyser la donnée, c'est-à-dire évaluer sa pertinence, la nettoyer (gestion de la donnée manquante, des outliers, etc.), pour enfin l'intégrer aux modèles utilisés directement en production.
- Proposer et implémenter de nouvelles pistes d'un point de vue algorithmique (feature engineering, optimisation des hyperparamètres, choix judicieux de modèles de machine learning (forêts aléatoires avec scikit-learn, deep learning avec pytorch ou tensorflow, etc.).
- Développer des représentations de ces données exploitables pour le commun des mortels (graphiques et cartographiques)
- Participer à la mise en place des outils IA facilitant la tâche de nos consultants immobiliers, des équipes du siège ou des acheteurs et vendeurs particuliers
Requirements
Vous justifiez d'une expérience solide (3 ans minimum en CDI, pas d'alternance) en Data Science, Statistiques ou IA. Véritable passionné(e), votre curiosité technique vous pousse à explorer sans cesse de nouvelles approches. Hard skillsSolide compréhension des techniques de machine learning classique (classification, régression, clustering...)Expérience concrète sur au moins un projet data mené de bout en bout : cadrage du besoin, exploration et préparation des données, modélisation, évaluation, industrialisation et suivi en production.Très bonne maîtrise des sujets de GenAI (LLMs, embeddings, RAG) avec réelle expérience pratique.Bonne compréhension du concept et des usages des embeddingsTrès bonne maîtrise de Python et des bibliothèques associées : scikit-learn, pandas, numpy, matplotlib Expérience avec PyTorch, TensorFlowDéveloppement de pipelines ML avec Apache Airflow, dbt, Docker, MLflow et PostgreSQLMonitoring avec Grafana et CI/CD avec GitHub ActionsExpérience de la mise en place d'architecture cloud-native sur GCP ou AWS, avec Terraform, Cloud Composer, Dataflow, Kubeflow, Vertex AI, Cloud Run et BigQuerySoft skillsEsprit analytique : interpréter des données et en extraire des insights utiles.Rigueur : capacité à travailler avec précision et méthodeAutonomie : organiser et mener son travail de manière responsable et efficaceLes plusUne expérience en frameworks Python Django, Fastapi voire Flask.AWS SageMaker, lambda, AWS Gluelangchain, langraphConnaissances théoriques des modèles Transformers et des LLMs, une expérience des outils de la librairie Hugging Face Transformers est un grand plusUn intérêt pour les problématiques DevOps, d'infrastructure cloud (AWS), et pour Docker. Nous estimons en effet qu'un(e) Data Scientist se doit d'être sensibilisé et aussi autonome que possible sur les problématiques de mise en production de ses travaux. Ce que nous offrons Un environnement de travail, Vous justifiez d'une expérience solide (3 ans minimum en CDI, pas d'alternance) en Data Science, Statistiques ou IA. Véritable passionné(e), votre curiosité technique vous pousse à explorer sans cesse de nouvelles approches. Hard skills
- Solide compréhension des techniques de machine learning classique (classification, régression, clustering...)
- Expérience concrète sur au moins un projet data mené de bout en bout : cadrage du besoin, exploration et préparation des données, modélisation, évaluation, industrialisation et suivi en production.
- Très bonne maîtrise des sujets de GenAI (LLMs, embeddings, RAG) avec réelle expérience pratique.
- Bonne compréhension du concept et des usages des embeddings
- Très bonne maîtrise de Python et des bibliothèques associées : scikit-learn, pandas, numpy, matplotlib
- Expérience avec PyTorch, TensorFlow
- Développement de pipelines ML avec Apache Airflow, dbt, Docker, MLflow et PostgreSQL
- Monitoring avec Grafana et CI/CD avec GitHub Actions
- Expérience de la mise en place d'architecture cloud-native sur GCP ou AWS, avec Terraform, Cloud Composer, Dataflow, Kubeflow, Vertex AI, Cloud Run et BigQuery
Soft skills
- Esprit analytique : interpréter des données et en extraire des insights utiles.
- Rigueur : capacité à travailler avec précision et méthode
- Autonomie : organiser et mener son travail de manière responsable et efficace
Les plus
- Une expérience en frameworks Python Django, Fastapi voire Flask.
- AWS SageMaker, lambda, AWS Glue
- langchain, langraph
- Connaissances théoriques des modèles Transformers et des LLMs, une expérience des outils de la librairie Hugging Face Transformers est un grand plus
- Un intérêt pour les problématiques DevOps, d'infrastructure cloud (AWS), et pour Docker. Nous estimons en effet qu'un(e) Data Scientist se doit d'être sensibilisé et aussi autonome que possible sur les problématiques de mise en production de ses travaux.
Ce que nous offrons
- Un environnement de travail convivial où l'esprit d'équipe s'allie à une réelle exigence intellectuelle, Python Esprit d'analyse
Benefits & conditions
convivial où l'esprit d'équipe s'allie à une réelle exigence intellectuelleRTT et 13ème moisTickets restau (Swile)2 jours en télétravail par semaineUn budget de 2 000 € pour choisir le matériel qui vous ressemble, * RTT et 13ème mois
- Tickets restau (Swile)
- 2 jours en télétravail par semaine
- Un budget de 2 000 € pour choisir le matériel qui vous ressemble