You're seeing this page as if you were . The main menu is still yours, though. Exit from immersion
Farouk AliFA

Farouk Ali

Data scientist/Data analyst

€550/day
Paris, FR
8-15 years

Average response time: 1 hour

About Farouk

As a data scientist at French Tech Factory, I apply my years of experience in data science and my passion for artificial intelligence to deliver innovative solutions for various clients and industries. I work independently and collaboratively to accomplish tasks and go beyond the basic requirements. I learn quickly and continuously improve my technical skills, using tools such as Amazon Web Services (AWS) and Looker.

I hold a Diplôme d'ingénieur in Informatique from Ecole Supérieure Privée d'Ingénierie et de Technologies - ESPRIT, where I acquired a solid foundation in various fields of computer science, ranging from web development to business intelligence. I also completed certificates from Coursera in data science and data engineering, big data, and machine learning on Google Cloud Platform (GCP) before landing a job at Coursera. I am rigorous, autonomous, self-taught, and motivated by my work.
  • Arabic

    Native or bilingual

  • English

    Fluent

  • French

    Fluent

Can work on-site
Paris (up to 50km)

Experience

  • Coursera
    Data scientist
    EDUCATION AND E-LEARNING
    June 2021 - March 2025 (3 years and 9 months)

    Conception d’un système de balisage automatique (auto-tagging) des contenus pédagogiques via une architecture Retrieval-Augmented Generation (RAG), combinant OpenSearch et LLMs, avec vectorisation avancée des contenus, réduction des hallucinations, et prompts dynamiques.
    Développement d’un système d’évaluation automatique des réponses utilisateurs, basé sur un LLM fine-tuné avec LoRA (Low-Rank Adaptation), pour un scoring précis du ton, de la pertinence et de l’exactitude.
    Intégration d’un LLM spécialisé dans la génération de synthèses analytiques de dashboards (Looker Studio), avec contextualisation dynamique pour les équipes produit et marketing.
    Fine-tuning de GPT-3 pour la génération automatique de rapports marketing, avec recommandations sur l’amélioration des programmes via un système RAG.
    Conception et optimisation de tableaux de bord dans Looker Studio pour le suivi des performances des intégrations externes, de l’engagement des utilisateurs et de l’activité des administrateurs.
    Fourniture d’insights en temps réel grâce à des pipelines temps réel intégrés à des outils de visualisation (Looker Studio, Amplitude).
    Modélisation Prédictive & Parcours Utilisateurs
    Développement de modèles prédictifs de l’engagement utilisateur et du nombre d’utilisateurs actifs à partir de données de sessions, d’interactions et d'engagement
    Construction de funnels utilisateurs pour l’optimisation des parcours et workflows.
    Réalisation de tests A/B pour la validation d’hypothèses UX.

    Migration, Industrialisation & Performance Data
    Migration de Redshift vers Databricks, intégrant DBT avec Unity Catalog pour une architecture scalable et gouvernée.
    Automatisation de pipelines de traitement de données avec DBT et orchestration via Airflow, réduction des temps d’exécution jusqu’à 70 %.
    Développement de pipelines ETL pour fournir des insights exploitables sur l’engagement en contexte A/B testing.
    Looker Python SQL Airflow Data analysis
  • inkylab
    Data scientist
    RESEARCH
    January 2018 - June 2021 (3 years and 5 months)
    Tunis, Tunisia
    IA Générative & NLP appliqués au journalisme
    Développement d’un système de résumé automatisé d’articles via fine-tuning du modèle T5, déployé sur AWS avec Docker & FastAPI.
    Conception d’un système RAG (Retrieval-Augmented Generation) combinant OpenSearch et Gemini, permettant aux journalistes de générer des synthèses contextuelles à partir de données scrappées.



    Reconnaissance d’Entités Nommées (NER) & Classification multilingue
    Création d’une plateforme de NER et de classification par genre à partir de contenus en anglais et arabe.
    Fine-tuning de modèles BERT et T5, atteignant des scores F1 de >90 % (anglais) et >80 % (arabe).


    Engagement Utilisateur & Systèmes de Recommandation
    Conception d’un pipeline ETL pour analyser en temps réel l’engagement des lecteurs.
    Mise en place d’un système de recommandation personnalisé basé sur l’historique utilisateur et la similarité des contenus via embeddings vectoriels (stockage FAISS).
    Déploiement d’un système de fidélité gamifié, doublant le temps moyen d’interaction des lecteurs.


    Analyse territoriale & prédiction COVID
    Réalisation d’une analyse géographique des zones pauvres en Tunisie, identification des causes structurelles de la pauvreté et formulation de recommandations politiques.
    Prédiction de l’état des hôpitaux tunisiens pendant la pandémie de COVID-19 grâce à des modèles de séries temporelles.
    Réalisations clés :
    Mise en production d’une IA générative robuste utilisée dans les workflows éditoriaux.
    Mise en place d’un système de suivi de performance des articles et des journalistes.
    Impact direct sur la stratégie éditoriale basée sur des indicateurs d’engagement.
    Stack technique :
    IA & NLP : T5, BERT, GPT, Transformers, Hugging Face, Langchain, LlamaIndex, FAISS, OpenSearch
    Data & Dev : Python, SQL, Postgres, MongoDB, DynamoDB
    ETL & Cloud : GCP, BigQuery, AWS (Bedrock, EC2), Docker, FastAPI
    Visualisation & Reporting : Power BI
    python Machine learning LLM RAG SQL
  • federys degital
    Data scientist stagaire
    HEALTH AND WELLNESS
    January 2017 - December 2017 (11 months)
    Tunis, Tunisia
    • Innover, rechercher et développer des solutions IA.

    une solution d'apprentissage en profondeur pour l'extraction d'entités nommées à partir de l'audio qui fonctionne principalement sur la langue française. mes tâches sont

    • recherche et analyse des solutions existantes
    • modélisation et développement d'un modèle IA basé sur ELMO (modèle de langage créé par mozella)
    *test et évaluation pour le projet



    TensorFlow keras Pandas NLP

Recommendations

Be the first to recommend Farouk

Help this freelancer shine by sharing your experience working together.

These freelancer profiles also match your criteria

AgathaA

Agatha Frydrych

Backend Java Software Engineer

4.7

(3)

2

BaptisteB

Baptiste Duhen

Fullstack developer

4.6

(4)

5

AmedA

Amed Hamou

Senior Lead Developer

4

(2)

7

AudreyA

Audrey Champion

Web developer

4.3

(3)

4

Education

  • Diplôme National Tunisien d'Ingénieur en Informatique
    École supérieure privée d’ingénierie et de technologies.
    2019

Certifications

Skill set

Categories