Data Engineer PySpark confirmé - H/F

Thales
Canton de Castanet-Tolosan, France
9 days ago

Role details

Contract type
Permanent contract
Employment type
Full-time (> 32 hours)
Working hours
Regular working hours
Languages
French, English
Experience level
Intermediate

Job location

Canton de Castanet-Tolosan, France

Tech stack

Java
Amazon Web Services (AWS)
Amazon Web Services (AWS)
Azure
Big Data
Information Systems
Information Engineering
Hadoop
Hadoop Distributed File System
HBase
Hive
PostgreSQL
Microsoft SQL Server
MongoDB
NoSQL
Apache Oozie
Oracle Applications
Software Engineering
SQL Databases
Parquet
Google Cloud Platform
Spark
PySpark
Information Technology
Apache Flink
Cassandra
Kafka
Spark Streaming

Job description

QUI SOMMES-NOUS ?

Face à la montée en puissance de la cybercriminalité, favorisée par la complexité croissante des systèmes et des réseaux, la Direction de la Sécurité des Technologies de l'Information développe et soutient des solutions de sécurité de haut niveau pour les systèmes d'information et de communication des organisations internationales, des gouvernements, des opérateurs d'infrastructures critiques. En collaboration étroite avec des agences européennes ou d'autres entités Thales, les équipes de Toulouse fournissent les solutions de cybersécurité de programmes spatiaux via ses activités d'ingénierie de sécurité, de conception d'architecture, d'intégration et qualification de solution (SOC), et assurent le support à l'accréditation sécurité avant déploiement, mais aussi la maintenance et le maintien en condition de sécurité.

Le Centre de Compétence Augmented Data recherche un Data Engineer PySpark confirmé - H/F en CDI à Toulouse (Site de Labège - 31).

Nous recherchons actuellement un Data Engineer expérimenté dans les solutions basées sur PySpark, adossées à des stockages de types HDFS ou Parquet, pour participer à l'un de nos projets mettant en œuvre plusieurs composants software et impliquant plusieurs collaborateurs sur des missions de Data Engineering similaires.

Vous intégrez le Centre de Compétence Augmented Data, dont le cœur de métier est la conception et la mise en œuvre de solutions techniques innovantes et performantes autour de la gestion et du traitement massif de données dans un contexte mêlant Big Data et développements d'applicatifs exploitant ces données, le tout correspondant aux exigences de nos clients dans les domaines du spatial, de l'aéronautique, de l'énergie, du secteur public ou encore de l'e-santé.

QUI ETES-VOUS ?

Issu d'une formation universitaire ou ingénieur en informatique, vous justifiez d'une expérience solide dans le domaine de la donnée (Data Science, Data Engineering, Stockage), en ingénierie logicielle globalement.

Une connaissance cloud serait un réel atout, qu'il soit public (AWS, GCP, AZURE) ou privé.

Vous avez de bonnes expériences en développement logiciel et/ou scripting (principalement Scala & Java).

Vous êtes à l'aise en anglais.

Vous êtes curieux et rigoureux.

Vous aimez travailler en équipe au quotidien.

Pour vous le succès n'est que collectif.

CE QUE NOUS POUVONS FAIRE ENSEMBLE :

En nous rejoignant, vous vous verrez confier les missions suivantes :

La conception et architecture de solutions logicielles dans des contextes cloud ou assimilés, pouvant inclure des composants de calculs utilisant PySpark,

La rédaction de dossiers d'architecture technique répondant au besoin client,

La participation aux développements et à la maintenance opérationnelle des composants logiciels mis en œuvre,

L'estimation des charges techniques liées aux activités de conception, de développement, d'intégration et de validation,

La participation aux réponses à appel d'offre émises par nos clients et qui impliquerait l'utilisation de technologies de calculs distribuées,

La veille technologique dans votre domaine d'expertise et réalisation en avance de phase de prototypes innovants.

Techniquement vous serez donc amené à réaliser les activités suivantes :

  • Mise en place de pipelines de traitement de données

  • Utilisation de l'état de l'art des technologies actuelles dédiées à ces activités : Spark / Spark Streaming / Flink / Storm / Kafka

  • Développement sur des stacks Hadoop (HDFS / Hive / Pig / HBase / Oozie)

  • Utilisation de tous les types de stockage actuels :

  • SQL : Oracle, SQLServer, PostgreSQL

  • NoSQL : Cassandra / MongoDB / HBase

  • Objet : S3 / MinIO

Innovation, passion, ambition : rejoignez Thales et créez le monde de demain, dès aujourd'hui.

Requirements

Engineering, Architecture, Innovation, Maintenance, Science, MongoDB, SQL, Oracle, Oracle, PostgreSQL, Validation, Site, Support

About the company

Face à la montée en puissance de la cybercriminalité, favorisée par la complexité croissante des systèmes et des réseaux, la Direction de la Sécurité des Technologies de l'Information développe et soutient des solutions de sécurité de haut niveau pour les systèmes d'information et de communication des organisations internationales, des gouvernements, des opérateurs d'infrastructures critiques. En collaboration étroite avec des agences européennes ou d'autres entités Thales, les équipes de Toulouse fournissent les solutions de cybersécurité de programmes spatiaux via ses activités d'ingénierie de sécurité, de conception d'architecture, d'intégration et qualification de solution (SOC), et assurent le support à l'accréditation sécurité avant déploiement, mais aussi la maintenance et le maintien en condition de sécurité., Innovation, passion, ambition : rejoignez Thales et créez le monde de demain, dès aujourd'hui.

Apply for this position