LABORATOIRE INTERACTIF · LES 3 FAMILLES

Comment une machine apprend

Tout le machine learning tient dans trois grandes façons d'apprendre. Avant de plonger dans les méthodes, on pose la carte : qui apprend avec les réponses, qui apprend sans, et qui apprend par essai-erreur. Chacune répond à une question bancaire différente.

Vue d'ensemble

Les trois familles

La différence ne vient pas de l'algorithme, mais de ce qu'on donne à manger au modèle. A-t-il les bonnes réponses pour apprendre ? Cherche-t-il seul une structure ? Ou apprend-il en agissant et en récoltant des récompenses ?

🎯

Supervisé

On connaît les réponses

On montre au modèle des exemples étiquetés : « voici 10 000 clients, et qui a fait défaut ». Il apprend à reproduire la réponse sur de nouveaux cas.

« Prédis une réponse connue »

En banque : scoring de crédit, détection de fraude, prévision de revenu.

Explorer les méthodes →

🔍

Non-supervisé

Pas de réponses, on cherche

Aucune étiquette. Le modèle cherche seul des structures cachées : des groupes, des anomalies, des axes principaux dans les données.

« Trouve une structure »

En banque : segmentation clientèle, détection d'anomalies AML, analyse de risque.

Explorer les méthodes →

🎲

Renforcement

On apprend par essai-erreur

Un agent agit, reçoit une récompense ou une pénalité, et ajuste sa stratégie. Personne ne lui donne la bonne réponse : il la découvre en jouant.

« Apprends la meilleure stratégie »

En banque : trading algorithmique, exécution d'ordres, gestion de portefeuille dynamique.

Explorer les méthodes →

LE MÉCANISME

La frontière entre les familles, c'est le signal d'apprentissage disponible :

Supervisé : on possède la vérité (le « label »). Le modèle minimise l'écart entre sa prédiction et la vraie réponse. Le signal est direct et immédiat.
Non-supervisé : aucune vérité. Le modèle optimise un critère interne (compacité des groupes, variance expliquée…). Le signal est structurel.
Renforcement : pas de réponse immédiate, mais une récompense différée. L'agent doit relier ses actions d'aujourd'hui à un gain futur.

Question clé : « Ai-je les bonnes réponses ? Une structure à trouver ? Ou une stratégie à découvrir ? »

LA DÉDUCTION BANCAIRE

Choisir la bonne famille, c'est la première décision de tout projet data dans une banque — avant tout code.

Vous avez un historique de défauts annotés ? → supervisé. C'est 80 % des cas bancaires concrets.
Vous voulez comprendre votre base clients sans idée préconçue ? → non-supervisé.
Vous optimisez une suite de décisions dans le temps (acheter/vendre) ? → renforcement.
Se tromper de famille = projet voué à l'échec. On ne « score » pas avec du clustering, on ne « segmente » pas avec une régression.

Retenez ce réflexe : avant de demander quel algorithme, demandez de quelle famille relève le problème.

Aller plus loin — les trois familles d'apprentissage

Un panorama clair des trois familles — supervisé, non-supervisé et par renforcement — avec des exemples concrets pour chacune.

Google ML Crash Course — parcours complet et gratuit, de la classification au deep learning (developers.google.com)

Le déclic

Une même donnée, trois regards

Voici les mêmes clients d'une banque (revenu × ancienneté). Changez de famille et voyez comment chacune voit et traite exactement les mêmes points de façon radicalement différente.

LE MÉCANISME

Sur les mêmes points :

Supervisé : on connaît déjà la couleur (bon/mauvais client). Le modèle trace une frontière pour prédire la couleur des futurs.
Non-supervisé : on ignore les couleurs. Le modèle regroupe les points qui se ressemblent → des segments émergent (que la banque interprète ensuite).
Renforcement : un agent se déplace de décision en décision, accumulant des récompenses → il apprend un chemin optimal.

LA DÉDUCTION BANCAIRE

Une même base de données clients peut alimenter trois projets totalement différents selon la famille choisie :

Supervisé → un moteur de décision crédit qui dit oui/non.
Non-supervisé → une segmentation marketing pour cibler les offres.
Renforcement → un moteur d'optimisation (tarification dynamique, allocation).

La donnée est un actif ; la famille d'apprentissage décide quel actif vous en tirez. C'est tout l'enjeu de la séance d'aujourd'hui.

Aller plus loin — comment un réseau de neurones apprend

3Blue1Brown · Comment un réseau de neurones ajuste ses paramètres par descente de gradient — le mécanisme fondamental derrière l'apprentissage supervisé.

Famille 1

Apprentissage supervisé

Trois méthodes phares, chacune avec un exemple finance, une carte interactive et la double explication : régression linéaire (prévoir un montant), régression logistique (prédire oui/non), forêt aléatoire (la détection de fraude moderne).

→ Ouvrir le laboratoire supervisé

Famille 2

Apprentissage non-supervisé

Trois méthodes : K-means (segmenter la clientèle), détection d'anomalies (AML / fraude), PCA (réduire et visualiser le risque d'un portefeuille).

→ Ouvrir le laboratoire non-supervisé

Famille 3

Apprentissage par renforcement

Le Q-learning : un agent de trading qui apprend, par essai-erreur, quand acheter, vendre ou attendre — sans qu'on ne lui dise jamais la « bonne » action.

→ Ouvrir le laboratoire renforcement