Architecte Data Platform H/F

Seenovate
4 days ago

Role details

Contract type
Permanent contract
Employment type
Full-time (> 32 hours)
Working hours
Regular working hours
Languages
French
Experience level
Senior

Job location

Tech stack

API
Amazon Web Services (AWS)
Cloud Computing
Software Quality
Code Review
Databases
Continuous Integration
Data Infrastructure
ETL
Elasticsearch
Python
PostgreSQL
Role-Based Access Control
Ansible
Prometheus
Single Sign-On
Strategies of Testing
Okta
Grafana
Spark
Reliability of Systems
Backend
Gitlab
GIT
Pandas
Gitlab-ci
Kubernetes
InfluxDB
Dask
Machine Learning Operations
Terraform
Docker
Microservices

Job description

Intégré(e) à nos équipes Delivery, vous interviendrez sur plusieurs projets internes et clients.

Votre rôle en qualité d'Architecte Data Platform sera de mener à bien les missions suivantes :

Architecture & Conception technique

  • Définir les architectures Data, IA et applicatives cibles répondant aux enjeux métiers et techniques des clients (cadrage, choix technologiques, dossiers d'architecture, urbanisation)
  • Concevoir des plateformes Data & MLOps cloud-native robustes, sécurisées et évolutives
  • Participer aux choix d'architecture autour des environnements distribués, microservices et Kubernetes
  • Définir les standards d'industrialisation, de sécurité et d'exploitation des plateformes

Développement, Data & MLOps

  • Développer et maintenir des applications backend et des services distribués en Python
  • Concevoir des API et microservices conteneurisés avec Docker et Kubernetes
  • Concevoir et industrialiser les pipelines MLOps de bout en bout
  • Garantir la robustesse, la sécurité et la fiabilité des pipelines de données (Spark, Dask, Python)
  • Optimiser les performances des traitements distribués et des architectures Data
  • Produire une documentation technique claire et exploitable

Infrastructure & Fiabilité

  • Déployer et administrer des infrastructures cloud via Infrastructure as Code (Terraform, Ansible)
  • Industrialiser les chaînes CI/CD avec GitLab CI/CD et les pratiques GitOps (ArgoCD)
  • Automatiser les déploiements applicatifs et infrastructures
  • Participer à la stratégie de tests, validation et qualité logicielle
  • Mettre en oeuvre des mécanismes OIDC, SSO, Keycloak, RBAC
  • Déployer des solutions d'observabilité et monitoring (Prometheus, Grafana, Elasticsearch, OpenTelemetry, Loki)
  • Participer à la gestion des incidents et à l'amélioration continue de la fiabilité des systèmes

Requirements

Titulaire d'un Bac +5 dans le domaine des Statistiques ou Sciences des données, vous justifiez d'une première expérience probante d'au moins cinq ans sur un poste similaire. Vous maîtrisez le langage d'une ou plusieurs bases de données (PostgreSQL, InfluxDB) : optimisation de requêtes, bonnes pratiques...Vous possédez une bonne connaissance d'un ou plusieurs outils ETL et de stockage objet (S3/MinIO),Vous justifiez d'une expérience :Sur GCP et/ou sur Kubernetes (déploiement, orchestration), En Python et sur des frameworks de traitement de données comme Spark, Pandas, Polars ou Dask,Sur Git et GitLab (gestion de versions, revue de code, workflows collaboratifs)., Titulaire d'un Bac +5 dans le domaine des Statistiques ou Sciences des données, vous justifiez d'une première expérience probante d'au moins cinq ans sur un poste similaire.

  • Vous maîtrisez le langage d'une ou plusieurs bases de données (PostgreSQL, InfluxDB) : optimisation de requêtes, bonnes pratiques...
  • Vous possédez une bonne connaissance d'un ou plusieurs outils ETL et de stockage objet (S3/MinIO),
  • Vous justifiez d'une expérience :
  • Sur GCP et/ou sur Kubernetes (déploiement, orchestration),
  • En Python et sur des frameworks de traitement de données comme Spark, Pandas, Polars ou Dask,
  • Sur Git et GitLab (gestion de versions, revue de code, workflows collaboratifs).

About the company

Spécialisée dans la Data Intelligence, Seenovate accompagne ses clients dans la valorisation de leurs données. Pour accompagner les grands comptes et les PME, nous nous appuyons sur nos 8 agences et sur 200 collaborateurs basés dans toute la France. Intégrateurs de solutions Business Intelligence et experts en Data Science, nous sommes un important partenaire de SAP sur le monde des solutions analytiques de l'éditeur. De plus, notre écosystème varié de partenaires stratégiques nous permet de garantir le plus haut niveau d'expertise à nos clients. Éditeurs de solutions basées sur l'IA frugale et souveraine, nous concevons et déployons nos propres solutions de logicielles, via notre marque SeensIO. Nous segmentons également notre expertise à travers 3 autres marques : - SeeSports, la valorisation de la donnée dans le monde du sport, - SeeAcademy, le centre de formations Data Intelligence, certifié Qualiopi, - SeeGreen, la data au service du numérique responsable.

Apply for this position