You're seeing this page as if you were . The main menu is still yours, though. Exit from immersion
Abdessamad AouissiAA

Abdessamad Aouissi

Data Engineer | ETL/ELT | Apache Airflow | GCP

€300/day
Lyon, FR
0-2 years

Average response time: 1 hour

About Abdessamad

  • French

    Native or bilingual

Can work on-site
Lyon (up to 50km)

Experience

  • CGI
    Stage en Data Engineer
    March 2025 - September 2025 (6 months)
    Strasbourg, France
    📊 PROJET 1 — Monitoring des flux SAP (Power BI)

    Conception et déploiement d'un tableau de bord Power BI pour le monitoring temps réel des flux de données SAP : indicateurs de performance, alertes sur anomalies, suivi des SLA, KPIs métier et techniques (volumes traités, taux d'erreur, latence des interfaces, traçabilité des transactions).

    Recueil des besoins auprès des équipes métier, modélisation des données, développement de mesures DAX avancées et mise en place de filtres dynamiques pour une exploration fine par flux, période et application source.

    ➜ Réduction de 40 % du temps de détection des anomalies et meilleure visibilité opérationnelle auprès des équipes métier et IT.

    🛠️ Power BI · SQL · DAX · SAP · SSIS · Gitlab

    🐍 PROJET 2 — Framework de tests de non-régression sur pipelines de données

    Conception et développement Python (en remplacement d'un legacy Talend) d'une application qui détecte automatiquement les régressions après chaque montée de version ou maintenance d'un pipeline.

    🔹 Principe : on fournit un fichier source + un fichier de sortie de référence ("golden output"). Le pipeline est rejoué et la sortie produite est comparée à la référence — tout écart est listé dans un rapport d'anomalies exploitable par les analystes.

    🔹 Comparaison intelligente : exclusion automatique des champs volatils (timestamps d'exécution, IDs techniques, numéros de batch, hash de session) via une configuration externe maintenue avec les métiers → suppression des faux positifs et focalisation sur les vraies régressions fonctionnelles.

    🔹 Industrialisation : orchestration via Rundeck (planification, retries, alerting), rapports automatiques (HTML), historisation des runs et intégration dans la chaîne CI/CD des équipes pipeline.

    ➜ Pipelines fiabilisés, suppression des contrôles manuels chronophages, accélération massive des phases de recette après maintenance.
    🛠️ Python · PySpark · SQL · Rundeck · Git · CI/CD · Java.
  • LASPI UJM
    Stage en Data Science
    March 2022 - September 2022 (6 months)
    Stage de recherche au Laboratoire LASPI (Université Jean Monnet), en collaboration avec les médecins du CHU de Saint-Étienne, sur un projet appliqué à la santé : la prédiction des chutes chez les personnes âgées par analyse des signaux de marche.

    🎯 Objectif scientifique
    Identifier les sujets à risque et anticiper la chute AVANT qu'elle ne se produise, à partir de données collectées sur cohorte réelle de patients (chuteurs et non-chuteurs).

    🔹 Données médicales réelles
    Acquisitions réalisées par le CHU de Saint-Étienne via des semelles instrumentées (capteurs talon + pointe pour chaque pied) — recueil de signaux temporels sur deux profils de patients.

    🔹 Pipeline de traitement du signal
    Segmentation des cycles de marche, filtrage du bruit, normalisation inter-patient, gestion des valeurs manquantes.

    🔹 Feature Engineering
    Extraction de descripteurs temporels (vitesse, cadence, durée de cycle, asymétrie pied gauche / pied droit) et fréquentiels (transformée de Fourier, énergie spectrale) caractérisant la dynamique de marche.

    🔹 Étude comparative — statistiques vs Machine Learning vs Deep Learning
    Mise en compétition de plusieurs approches : régression logistique, Random Forest, SVM et réseaux de neurones profonds (TensorFlow / Keras). Validation croisée stratifiée et tuning d'hyperparamètres sur dataset médical de taille modérée.

    🔹 Évaluation clinique
    Métriques cliniquement pertinentes (sensibilité, spécificité, AUC, matrice de confusion) et visualisations Seaborn / Matplotlib pour les chercheurs et l'équipe médicale.

    🔹 Documentation scientifique (notebooks, rapport de stage, article) pour reproductibilité et passation.

    ➜ Pipeline ML reproductible et étude comparative stats / ML / DL exploitable par l'équipe médicale.

    🛠️ Python · scikit-learn · TensorFlow / Keras · pandas · NumPy · Signal Processing · Feature Engineering · Seaborn · Matplotlib · Jupyter

Recommendations

Be the first to recommend Abdessamad

Help this freelancer shine by sharing your experience working together.

These freelancer profiles also match your criteria

AgathaA

Agatha Frydrych

Backend Java Software Engineer

4.7

(3)

2

BaptisteB

Baptiste Duhen

Fullstack developer

4.6

(4)

5

AmedA

Amed Hamou

Senior Lead Developer

4

(2)

7

AudreyA

Audrey Champion

Web developer

4.3

(3)

4

Education

  • Back it up with data Big
    Back it up with data Big

Categories