You're seeing this page as if you were . The main menu is still yours, though. Exit from immersion
Alex B.AB

Alex B.

Senior Data Engineer

ÂŁ432/day
Paris, FR
8-15 years

Average response time: 2 hours

About Alex


Data Engineer, spĂ©cialisĂ© dans les solutions Big Data et le dĂ©veloppement de pipelines de donnĂ©es. Avec plus de 8 ans d’expĂ©rience, j’ai conçu et optimisĂ© des architectures de donnĂ©es complexes, en intĂ©grant des outils tels que Hadoop, Spark, Scala, et Apache Hive. Mon expertise couvre la crĂ©ation et l’industrialisation de processus d’ingestion, de transformation et de chargement de donnĂ©es, ainsi que l’automatisation des workflows. Je maĂźtrise Ă©galement le dĂ©ploiement continu via des outils comme GitLab CI/CD et Ă©volue dans des environnements cloud et des clusters Big Data. Mon approche est centrĂ©e sur l’optimisation des performances et l’adaptation aux besoins mĂ©tiers grĂące Ă  des mĂ©thodologies Agile.

  • French

    Native or bilingual

  • English

    Conversational

Can work on-site
Paris (up to 50km)

Experience

  • Ville de Paris
    Senior Big Data Consultant / Data Engineer
    PUBLIC SECTOR
    February 2024 - June 2025 (1 year and 4 months)
    Paris, France
    🔧 Maintenance et amĂ©lioration d’un systĂšme d’ingestion de donnĂ©es avec Apache NiFi, Python & Spark 🌐

    Dans le cadre d’un projet de centralisation et de traitement de donnĂ©es urbaines variĂ©es (gĂ©ospatiales, stationnement, vĂ©los, espaces verts, qualitĂ© de l’eau de la Seine, etc.), j’ai mis en place un systĂšme d’ingestion de donnĂ©es basĂ© sur Apache NiFi, d’abord en mode standalone, puis Ă©voluĂ© vers un cluster NiFi exploitant la puissance de calcul distribuĂ© du cluster Spark.

    🔍 Contexte :
    -Sources de données: Intégration de données provenant de sources multiples (API, fichiers locaux, S3, ELS, etc.).
    -Stockage: Centralisation des données dans MinIO, une solution de stockage compatible S3, permettant une gestion efficace et sécurisée.
    -Traitement:
    - Python & Spark : Utilisation de Pandas pour le traitement des donnĂ©es et de PySpark pour l’analyse Ă  grande Ă©chelle. Le calcul distribuĂ© et parallĂšle de Spark optimise les performances en traitant efficacement de gros volumes de donnĂ©es.
    -Infrastructure: Déploiement sur machines Linux avec gestion des conteneurs via des images Docker pour garantir une scalabilité et une portabilité optimales.
    -Exposition: Les données traitées sont accessibles via Trino, facilitant leur exploration et leur utilisation par les parties prenantes.

    📈 Maintenance :
    - Mise en place d’un suivi des flux de donnĂ©es et d’une gestion des incidents pour rĂ©agir rapidement aux anomalies.
    - Optimisation continue des performances afin de garantir la fiabilité et la scalabilité du systÚme.
    Apache Nifi Spark Scala PySpark DBT
  • URSSAF
    Senior Big Data Consultant / Data Engineer
    PUBLIC SECTOR
    June 2022 - June 2023 (1 year and 1 month)
    Paris, France
    🌟 Principales rĂ©alisations :
    đŸ› ïž DĂ©veloppement de scripts d’ingestion de donnĂ©es pour le data lake avec HDFS et Hive, en utilisant Scala et SparkSQL au format Parquet.
    🔄 Transformation et normalisation des donnĂ©es avec Scala et SparkSQL pour garantir leur cohĂ©rence et leur exactitude.
    ⚙ Industrialisation des traitements en concevant des pipelines de donnĂ©es robustes avec Scala.
    đŸ§č RĂ©alisation d’un nettoyage approfondi des donnĂ©es, amĂ©liorant significativement leur qualitĂ© grĂące Ă  des techniques efficaces de recherche et de correction.
    ✔ Mise en place de tests unitaires pour garantir la fiabilitĂ© et le bon fonctionnement des scripts.
    🚀 Optimisation des performances des scripts de traitement distribuĂ© sur Spark, amĂ©liorant l’efficacitĂ© et la rapiditĂ© d’exĂ©cution.
    🔄 Gestion du dĂ©ploiement continu des scripts via GitLab et Jenkins, fluidifiant le workflow de dĂ©veloppement.
    🐞 RĂ©solution de bugs et optimisation des scripts pour une meilleure performance et maintenabilitĂ©.
    📈 Automatisation des workflows avec Oozie, augmentant l’efficacitĂ© des processus.
    Oozie Spark Scala PySpark Gitlab CI/CD
  • ORANGE
    Senior Big Data Consultant / Data Engineer
    TELECOMMUNICATIONS
    June 2018 - April 2022 (3 years and 11 months)
    Douala, Cameroon
    đŸ› ïž Optimisation du systĂšme : Collaboration Ă  l'optimisation de l'entrepĂŽt de donnĂ©es Oracle, rĂ©duction significative des erreurs et amĂ©lioration notable des performances globales.
    🌐 Architecture Data Lake : Participation Ă  la mise en place d'une architecture moderne de Data Lake en utilisant les technologies HDFS, NiFi (en mode cluster), MapReduce, Hive, Sqoop et YARN pour un traitement et une gestion efficace des donnĂ©es.
    📊 Solutions de supervision : Mise en place d'Ambari pour une supervision complĂšte du cluster et de Grafana pour le suivi en temps rĂ©el des indicateurs de performance clĂ©s et la gestion des incidents.
    ⚠ Gestion des erreurs et incidents : Mise en Ɠuvre de processus de dĂ©tection proactive des erreurs et de rĂ©solution des incidents, garantissant une perturbation minimale des opĂ©rations donnĂ©es.
    🏆 MĂ©thodologies Agile : Travail en environnement Agile avec application de la mĂ©thodologie Scrum pour renforcer la collaboration d'Ă©quipe et accĂ©lĂ©rer la livraison des projets.
    📈 Visualisation des donnĂ©es : CrĂ©ation de tableaux de bord percutants sous Power BI pour visualiser les mĂ©triques clĂ©s et fournir aux parties prenantes des insights actionnables.
    đŸ‘©â€đŸ« Encadrement d'Ă©quipe : Management de collaborateurs juniors et encadrement de stagiaires, en favorisant une atmosphĂšre collaborative et propice au dĂ©veloppement professionnel.
    🎓 Formation des jeunes professionnels : Conception et animation de sessions de formation destinĂ©es aux jeunes professionnels pour leur permettre d'acquĂ©rir des compĂ©tences en Big Data et technologies associĂ©es.
    đŸ€ Collaboration client : Accompagnement des clients dans la rĂ©daction des spĂ©cifications fonctionnelles et des cahiers des charges, afin de garantir l'alignement des projets avec les besoins mĂ©tier.=
    Talend Apache Nifi Nifi Hive HDFS

Recommendations

Be the first to recommend Alex

Help this freelancer shine by sharing your experience working together.

These freelancer profiles also match your criteria

AgathaA

Agatha Frydrych

Backend Java Software Engineer

4.7

(3)

2

BaptisteB

Baptiste Duhen

Fullstack developer

4.6

(4)

5

AmedA

Amed Hamou

Senior Lead Developer

4

(2)

7

AudreyA

Audrey Champion

Web developer

4.3

(3)

4

Education

  • Engineering degree
    National Advanced School of Engineering Yaounde Cameroon
    2017

Certifications

Skill set (19)

Categories