Ai-Native - Techlead Sre - n H/F
OVHCloud
Canton de Clermont-l’Hérault, France
3 days ago
Role details
Contract type
Temporary contract Employment type
Full-time (> 32 hours) Working hours
Regular working hours Languages
FrenchJob location
Canton de Clermont-l’Hérault, France
Tech stack
Java
Artificial Intelligence
Linux
Python
RabbitMQ
Ansible
Kubernetes
Kafka
Puppet
Terraform
Go
VMware
Job description
Chez OVHcloud, Kafka constitue une brique partagée centrale : sa disponibilité, ses performances et sa bonne utilisation impactent l'entierté du SI.
- Prendre des décisions d'architecture, de capacité et de gouvernance ayant un impact important chez nos utilisateurs, notamment pour anticiper les évolutions ou migrations.
- Garantir la qualité de la plateforme qui influence directement la capacité d'OVHcloud à intégrer ses systèmes, partager des données en temps quasi réel et accélérer la livraison de projets internes.
- Endosser un rôle de Tech Lead impliquant des prises de décisions et de la communication avec les différents acteurs lors d'incidents à la gravité variable. Porter une part de responsabilité budgétaire et de durabilité au regard des objectifs de fiabilité et de coût.
Vos principales responsabilités
- Assurer la QoS et les SLO de la plateforme Kafka
- Garantir l'application des bonnes pratiques SRE
- Maintenir en condition opérationnelle (MCO) l'offre actuelle
- Définir la roadmap technique du périmètre
- Planifier les tâches au sein des sprints et les prioriser
- Conseiller les clients dans leurs choix architecturaux relatifs à Kafka ou RabbitMQ
Votre futur impact
Dans 6 mois
- Vous aurez acquis une vue d'ensemble de l'infrastructure et pris en main le RUN.
- Vous maîtriserez votre périmètre en ayant instauré des standards de déploiement, d'observabilité et de sécurité.
- Vous aurez commencé à orienter les choix techniques pour améliorer la résilience globale.
Et dans 1 an
- Vous serez devenu le référent reconnu par l'entreprise sur les sujets Kafka/RabbitMQ.
- Vous aurez généralisé l'automatisation pour que chaque tâche récurrente soit optimisée.
- Vous aurez permis au périmètre de grandir sereinement sans impacter la charge de run.
Requirements
Vous possédez une expertise Linux (système et réseau).
- Vous maîtrisez la gestion de serveurs Bare Metal ainsi que l'administration de VMs sous VMware.
- Vous avez une expérience confirmée avec Kubernetes.
- Vous maîtrisez les outils "as code" et les gestionnaires de configuration (Terraform, Puppet, Ansible).
- Vous développez dans l'un des langages suivants : Golang, Python ou Java.
- Vous faites preuve de leadership, de capacité à déléguer et à prendre des décisions stratégiques rapidement (planification, vision roadmap, ouverture au changement)., Vous disposez d'une expertise sur Apache Kafka et/ou RabbitMQ., Ansible Management d'équipe Qualité de service (QoS) Linux Kubernetes Python KAFKA Terraform VMWare Java