About Farouk
Arabic
Native or bilingual
English
Fluent
French
Fluent
Experience
- CourseraData scientistEDUCATION AND E-LEARNINGJune 2021 - March 2025 (3 years and 9 months)Conception d’un système de balisage automatique (auto-tagging) des contenus pédagogiques via une architecture Retrieval-Augmented Generation (RAG), combinant OpenSearch et LLMs, avec vectorisation avancée des contenus, réduction des hallucinations, et prompts dynamiques.Développement d’un système d’évaluation automatique des réponses utilisateurs, basé sur un LLM fine-tuné avec LoRA (Low-Rank Adaptation), pour un scoring précis du ton, de la pertinence et de l’exactitude.Intégration d’un LLM spécialisé dans la génération de synthèses analytiques de dashboards (Looker Studio), avec contextualisation dynamique pour les équipes produit et marketing.Fine-tuning de GPT-3 pour la génération automatique de rapports marketing, avec recommandations sur l’amélioration des programmes via un système RAG.Conception et optimisation de tableaux de bord dans Looker Studio pour le suivi des performances des intégrations externes, de l’engagement des utilisateurs et de l’activité des administrateurs.Fourniture d’insights en temps réel grâce à des pipelines temps réel intégrés à des outils de visualisation (Looker Studio, Amplitude).Modélisation Prédictive & Parcours UtilisateursDéveloppement de modèles prédictifs de l’engagement utilisateur et du nombre d’utilisateurs actifs à partir de données de sessions, d’interactions et d'engagementConstruction de funnels utilisateurs pour l’optimisation des parcours et workflows.Réalisation de tests A/B pour la validation d’hypothèses UX.Migration, Industrialisation & Performance DataMigration de Redshift vers Databricks, intégrant DBT avec Unity Catalog pour une architecture scalable et gouvernée.Automatisation de pipelines de traitement de données avec DBT et orchestration via Airflow, réduction des temps d’exécution jusqu’à 70 %.Développement de pipelines ETL pour fournir des insights exploitables sur l’engagement en contexte A/B testing.
- inkylabData scientistRESEARCHJanuary 2018 - June 2021 (3 years and 5 months)Tunis, TunisiaIA Générative & NLP appliqués au journalismeDéveloppement d’un système de résumé automatisé d’articles via fine-tuning du modèle T5, déployé sur AWS avec Docker & FastAPI.Conception d’un système RAG (Retrieval-Augmented Generation) combinant OpenSearch et Gemini, permettant aux journalistes de générer des synthèses contextuelles à partir de données scrappées.Reconnaissance d’Entités Nommées (NER) & Classification multilingueCréation d’une plateforme de NER et de classification par genre à partir de contenus en anglais et arabe.Fine-tuning de modèles BERT et T5, atteignant des scores F1 de >90 % (anglais) et >80 % (arabe).Engagement Utilisateur & Systèmes de RecommandationConception d’un pipeline ETL pour analyser en temps réel l’engagement des lecteurs.Mise en place d’un système de recommandation personnalisé basé sur l’historique utilisateur et la similarité des contenus via embeddings vectoriels (stockage FAISS).Déploiement d’un système de fidélité gamifié, doublant le temps moyen d’interaction des lecteurs.Analyse territoriale & prédiction COVIDRéalisation d’une analyse géographique des zones pauvres en Tunisie, identification des causes structurelles de la pauvreté et formulation de recommandations politiques.Prédiction de l’état des hôpitaux tunisiens pendant la pandémie de COVID-19 grâce à des modèles de séries temporelles.Réalisations clés :Mise en production d’une IA générative robuste utilisée dans les workflows éditoriaux.Mise en place d’un système de suivi de performance des articles et des journalistes.Impact direct sur la stratégie éditoriale basée sur des indicateurs d’engagement.Stack technique :IA & NLP : T5, BERT, GPT, Transformers, Hugging Face, Langchain, LlamaIndex, FAISS, OpenSearchData & Dev : Python, SQL, Postgres, MongoDB, DynamoDBETL & Cloud : GCP, BigQuery, AWS (Bedrock, EC2), Docker, FastAPIVisualisation & Reporting : Power BI
- federys degitalData scientist stagaireHEALTH AND WELLNESSJanuary 2017 - December 2017 (11 months)Tunis, Tunisia• Innover, rechercher et développer des solutions IA.une solution d'apprentissage en profondeur pour l'extraction d'entités nommées à partir de l'audio qui fonctionne principalement sur la langue française. mes tâches sont
- recherche et analyse des solutions existantes
- modélisation et développement d'un modèle IA basé sur ELMO (modèle de langage créé par mozella)
Recommendations
Be the first to recommend Farouk
Help this freelancer shine by sharing your experience working together.
These freelancer profiles also match your criteria
Agatha Frydrych
Backend Java Software Engineer
4.7
(3)
2
Baptiste Duhen
Fullstack developer
4.6
(4)
5
Amed Hamou
Senior Lead Developer
4
(2)
7
Audrey Champion
Web developer
4.3
(3)
4
Education
- Diplôme National Tunisien d'Ingénieur en InformatiqueÉcole supérieure privée d’ingénierie et de technologies.2019
Certifications
- Data Engineering, Big Data, and Machine Learning on GCPcoursera , google cloud2022