You're seeing this page as if you were . The main menu is still yours, though. Exit from immersion
Taha E.TE

Taha E.

Data scientist / IA Engineer

€600/day
Paris, FR
3-7 years

Average response time: 1 hour

About Taha

Hello! I am Taha EL BERMAKI, a passionate data scientist with a strong background in data analysis, predictive modeling, and problem-solving. Armed with a solid academic foundation in statistics, machine learning, and programming, I am eager to tackle challenges and add value to your projects.

My key skills include:

Programming languages: Python, R, SQL
Data science libraries: Pandas, NumPy, Scikit-learn, TensorFlow, Keras
Data visualization: Matplotlib, Seaborn, ggplot2, Plotly, Tableau
Statistical and predictive modeling: Linear regression, logistic regression, decision trees, random forests, neural networks, clustering, time series analysis
Data management and manipulation: Preprocessing, cleaning, imputation, exploration

Throughout my data science career, I have successfully worked on multiple projects across industries such as e-commerce, finance, and telecommunications. I quickly adapt to new areas of expertise and am always keen to learn and improve my skills.

I am an excellent communicator, capable of presenting the results of my analyses in a clear and concise manner to both technical and non-technical audiences. My primary goal is to help clients make the most of their data by providing actionable insights and innovative solutions.

Feel free to reach out to discuss your data science needs and see how I can contribute to the success of your project.
  • French

    Native or bilingual

  • English

    Native or bilingual

Remote only
Primarily works remotely

Experience

  • CNP Assurances
    Data / IA Engineer
    BANKING AND INSURANCE
    May 2024 - Today (2 years and 1 month)
    Issy-les-Moulineaux, France
    Analyses data & automatisation pour les équipes d’audit interne

    - Conception d’outils et d’analyses pour fiabiliser les audits (Python, SQL).
    - Construction de pipelines automatisés : génération de rapports, contrôles récurrents, suivi d’indicateurs clés.
    - Structuration et industrialisation de traitements permettant de réduire le temps d’analyse des auditeurs.

    Datalab Audit Interne

    - Création d’outils data prêts à l’emploi (scoring, analyses avancées, dashboards).
    Mise en place de contrôles Data Quality : détection d’anomalies, règles de cohérence, suivi de la complétude.

    Mise en place de cas d’usage IA pour l’audit

    - Analyses NLP (textes de réclamations, notes d’audit, historiques d’incidents).
    - Détection automatisée de signaux faibles et d’incohérences dans les données métiers.
    - Appui aux auditeurs pour transformer leurs besoins opérationnels en solutions IA concrètes et exploitables.

    Développement d’un RAG interne (projet en cours)

    - Conception d’un assistant IA permettant de rechercher automatiquement dans les documents internes d’audit (politiques, référentiels, procédures).
    - Structuration de la base documentaire, vectorisation, création du pipeline RAG.
    Objectif : accélérer et fiabiliser le travail de préparation des missions d’audit.
    assurance Python Data science intelligence artificielle SQL
  • Alteca
    Data Scientist / IA Engineer
    CONSULTING AND AUDITS
    April 2022 - April 2024 (2 years)
    Île-de-France, France
    BPCE– Projet EcoScore (évaluation de l’impact écologique du code informatique)
    Conception d’un pipeline complet de scoring basé sur deux approches IA :


    Lot 1 – Prédiction via données statiques

    - Analyse de plus de 30 métriques de code (nombre de lignes, complexité cyclomatique, boucles, fichiers, imports, etc.).
    - Construction d’un dataset propre, normalisé et enrichi (feature engineering).
    - Développement de modèles supervisés pour prédire l’Eco-Score à partir des variables statiques (régression, modèles d’arbres, tests comparatifs).



    Lot 2 – Modèle supervisé basé sur exécution réelle du code

    - Scraping GitHub pour collecter plusieurs milliers de scripts Python.
    - Exécution contrôlée des scripts sur une infrastructure interne pour mesurer la consommation réelle (CPU, mémoire, durée, énergie estimée).
    - Préparation et nettoyage des données (gestion des erreurs d’exécution, normalisation, création de labels).
    - Entraînement d’un modèle ML permettant de prédire la consommation future d’un code inédit.

    Pipeline, industrialisation & restitution

    - Automatisation complète du pipeline (collecte → traitement → scoring → export).
    - Déploiement des modèles et mise à disposition des résultats (APIs, dashboards Power BI).


    GALIAN Assurance

    - Identification et cadrage des cas d’usage IA

    Ateliers avec équipes métiers (marketing, gestion, relation client).
    Sélection des cas d’usage prioritaires : classification d’e‑mails, amélioration qualité données, automatisation documentaire.

    - Création d’un service IA pour la catégorisation automatique des e‑mails

    - Pipeline NLP (préparation du texte, vectorisation, modèles supervisés).
    - Exposition du modèle via des APIs Python consommées par les équipes internes.
    - Amélioration de la qualité des données (normalisation, détection d’anomalies).

    Développement d’un outil interne basé sur LLM

    Application Streamlit + LangChain pour documenter automatiquement du code.
    Objectif : faciliter la maintenance.
    Python NLP intelligence artificielle
  • Alteca
    Data Scientist
    April 2022 - October 2022 (6 months)
    91300 Massy, France

Recommendations

Be the first to recommend Taha

Help this freelancer shine by sharing your experience working together.

These freelancer profiles also match your criteria

AgathaA

Agatha Frydrych

Backend Java Software Engineer

4.7

(3)

2

BaptisteB

Baptiste Duhen

Fullstack developer

4.6

(4)

5

AmedA

Amed Hamou

Senior Lead Developer

4

(2)

7

AudreyA

Audrey Champion

Web developer

4.3

(3)

4

Education

  • Master's degree, Ingénierie Mathématique pour la Science des Données (IMSD)
    UNIVERSITE DE LORRAINE
    2022
    Master's degree, Ingénierie Mathématique pour la Science des Données (IMSD)
  • Engineer's degree, statistics and economics
    Institut National de Statistique et d'Economie Appliquée (INSEA)
    2021
    Engineer's degree, statistics and economics

Skill set

Categories