LABO ML · SÉANCE 3 · LES FAMILLES D'APPRENTISSAGE
LABORATOIRE INTERACTIF · LES 3 FAMILLES

Comment une machine apprend

Tout le machine learning tient dans trois grandes façons d'apprendre. Avant de plonger dans les méthodes, on pose la carte : qui apprend avec les réponses, qui apprend sans, et qui apprend par essai-erreur. Chacune répond à une question bancaire différente.

Vue d'ensemble
1

Les trois familles

La différence ne vient pas de l'algorithme, mais de ce qu'on donne à manger au modèle. A-t-il les bonnes réponses pour apprendre ? Cherche-t-il seul une structure ? Ou apprend-il en agissant et en récoltant des récompenses ?

🎯

Supervisé

On connaît les réponses
On montre au modèle des exemples étiquetés : « voici 10 000 clients, et qui a fait défaut ». Il apprend à reproduire la réponse sur de nouveaux cas.
« Prédis une réponse connue »
En banque : scoring de crédit, détection de fraude, prévision de revenu.
Explorer les méthodes →
🔍

Non-supervisé

Pas de réponses, on cherche
Aucune étiquette. Le modèle cherche seul des structures cachées : des groupes, des anomalies, des axes principaux dans les données.
« Trouve une structure »
En banque : segmentation clientèle, détection d'anomalies AML, analyse de risque.
Explorer les méthodes →
🎲

Renforcement

On apprend par essai-erreur
Un agent agit, reçoit une récompense ou une pénalité, et ajuste sa stratégie. Personne ne lui donne la bonne réponse : il la découvre en jouant.
« Apprends la meilleure stratégie »
En banque : trading algorithmique, exécution d'ordres, gestion de portefeuille dynamique.
Explorer les méthodes →
LE MÉCANISME

La frontière entre les familles, c'est le signal d'apprentissage disponible :

  • Supervisé : on possède la vérité (le « label »). Le modèle minimise l'écart entre sa prédiction et la vraie réponse. Le signal est direct et immédiat.
  • Non-supervisé : aucune vérité. Le modèle optimise un critère interne (compacité des groupes, variance expliquée…). Le signal est structurel.
  • Renforcement : pas de réponse immédiate, mais une récompense différée. L'agent doit relier ses actions d'aujourd'hui à un gain futur.
Question clé : « Ai-je les bonnes réponses ? Une structure à trouver ? Ou une stratégie à découvrir ? »
LA DÉDUCTION BANCAIRE

Choisir la bonne famille, c'est la première décision de tout projet data dans une banque — avant tout code.

  • Vous avez un historique de défauts annotés ? → supervisé. C'est 80 % des cas bancaires concrets.
  • Vous voulez comprendre votre base clients sans idée préconçue ? → non-supervisé.
  • Vous optimisez une suite de décisions dans le temps (acheter/vendre) ? → renforcement.
  • Se tromper de famille = projet voué à l'échec. On ne « score » pas avec du clustering, on ne « segmente » pas avec une régression.

Retenez ce réflexe : avant de demander quel algorithme, demandez de quelle famille relève le problème.

Aller plus loin — les trois familles d'apprentissage
Un panorama clair des trois familles — supervisé, non-supervisé et par renforcement — avec des exemples concrets pour chacune.
Le déclic
2

Une même donnée, trois regards

Voici les mêmes clients d'une banque (revenu × ancienneté). Changez de famille et voyez comment chacune voit et traite exactement les mêmes points de façon radicalement différente.

LE MÉCANISME

Sur les mêmes points :

  • Supervisé : on connaît déjà la couleur (bon/mauvais client). Le modèle trace une frontière pour prédire la couleur des futurs.
  • Non-supervisé : on ignore les couleurs. Le modèle regroupe les points qui se ressemblent → des segments émergent (que la banque interprète ensuite).
  • Renforcement : un agent se déplace de décision en décision, accumulant des récompenses → il apprend un chemin optimal.
LA DÉDUCTION BANCAIRE

Une même base de données clients peut alimenter trois projets totalement différents selon la famille choisie :

  • Supervisé → un moteur de décision crédit qui dit oui/non.
  • Non-supervisé → une segmentation marketing pour cibler les offres.
  • Renforcement → un moteur d'optimisation (tarification dynamique, allocation).

La donnée est un actif ; la famille d'apprentissage décide quel actif vous en tirez. C'est tout l'enjeu de la séance d'aujourd'hui.

Aller plus loin — comment un réseau de neurones apprend
3Blue1Brown · Comment un réseau de neurones ajuste ses paramètres par descente de gradient — le mécanisme fondamental derrière l'apprentissage supervisé.
Famille 1
A

Apprentissage supervisé

Trois méthodes phares, chacune avec un exemple finance, une carte interactive et la double explication : régression linéaire (prévoir un montant), régression logistique (prédire oui/non), forêt aléatoire (la détection de fraude moderne).

→ Ouvrir le laboratoire supervisé
Famille 2
B

Apprentissage non-supervisé

Trois méthodes : K-means (segmenter la clientèle), détection d'anomalies (AML / fraude), PCA (réduire et visualiser le risque d'un portefeuille).

→ Ouvrir le laboratoire non-supervisé
Famille 3
C

Apprentissage par renforcement

Le Q-learning : un agent de trading qui apprend, par essai-erreur, quand acheter, vendre ou attendre — sans qu'on ne lui dise jamais la « bonne » action.

→ Ouvrir le laboratoire renforcement
← Retour à la série de cours

© 2026 Jan Erik Meidell · Digitalisation bancaire · Laboratoire interactif · Séance 3