Geoffrey Scoutheeten
Ingénieur, chercheur en NLP publié, entrepreneur. J'ai passé vingt ans là où les mathématiques rencontrent le logiciel — valorisation de produits dérivés, moteurs de recherche, recherche sur les modèles de langue — et j'apprends aujourd'hui aux entreprises comment l'IA fonctionne vraiment, pour qu'elles l'utilisent avec méthode et confiance.
Ce que cela change pour votre formation
Beaucoup de formateurs IA ont découvert le domaine en 2023. J'ai co-signé des travaux de recherche évalués par les pairs sur le contrôle des hallucinations dans la génération de texte à l'époque où « hallucination » était un terme de recherche, pas un titre de presse. Quand vos équipes demandent pourquoi le modèle invente des faits — et jusqu'où lui faire confiance — la réponse vient de quelqu'un qui a étudié le problème à la source.
Parcours
- Aujourd'hui — Fondateur : développe PanPerfect, un assistant de cuisson piloté par IA. Au quotidien dans les LLM, les agents et le développement assisté par IA.
- 2022 — Alma (startup fintech) : senior staff engineer chez le spécialiste français du paiement fractionné.
- 2016 – 2022 — BNP Paribas CIB, Senior Data Scientist : conseil interne en analytics pour toute la banque de financement et d'investissement. Conception et réalisation d'un moteur de recherche plein texte interne, classant des résultats issus de sources hétérogènes en respectant leurs droits d'accès. Co-encadrement de trois thèses CIFRE en traitement automatique des langues.
- 2008 – 2016 — BNP Paribas CIB, analyste quantitatif : moteur de valorisation des dérivés actions — performance, parallélisation, ordonnancement sur cluster.
- 2006 – 2008 — Ingénieur logiciel (Altran) : C++ sur un system-on-chip WiMAX chez SEQUANS Communications, puis outillage Java pour les dérivés actions de BNP Paribas.
Recherche & publications
Dans le cadre des thèses CIFRE co-encadrées chez BNP Paribas, j'ai co-signé des travaux de recherche en traitement automatique des langues, publiés à EMNLP et dans des revues à comité de lecture :
- Controlling hallucinations at word level in data-to-text generation — Data Mining and Knowledge Discovery, 2021
- Data-QuestEval: A Referenceless Metric for Data-to-Text Semantic Evaluation — EMNLP 2021
- PARENTing via Model-Agnostic Reinforcement Learning to Correct Pathological Behaviors in Data-to-Text Generation — INLG 2020
- Let's Stop Incorrect Comparisons in End-to-end Relation Extraction! — EMNLP 2020
- Separating Retention from Extraction in the Evaluation of End-to-end Relation Extraction — EMNLP 2021
- A Hierarchical Model for Data-to-Text Generation — ECIR 2020
Liste complète sur ACL Anthology et Semantic Scholar.
Enseignement
- Conception et animation de formations à l'IA générative pour des publics professionnels non techniques — démonstrations en direct, repérage d'hallucinations, panorama d'outils, enjeux de société.
- Co-encadrement de trois doctorants (CIFRE) sur des sujets de recherche en NLP.
- Colleur de mathématiques en classes préparatoires MP* — l'enseignement fait partie du parcours depuis le début.
Formation initiale
- École Polytechnique (X2001), cursus mathématiques
- Master M2 MVA, ENS Cachan — Mathématiques, Vision, Apprentissage
- École Nationale Supérieure des Télécommunications, Paris
Langues
Français (langue maternelle), anglais (courant), allemand (intermédiaire).