Tout le machine learning tient dans trois grandes façons d'apprendre. Avant de plonger dans les méthodes, on pose la carte : qui apprend avec les réponses, qui apprend sans, et qui apprend par essai-erreur. Chacune répond à une question bancaire différente.
La différence ne vient pas de l'algorithme, mais de ce qu'on donne à manger au modèle. A-t-il les bonnes réponses pour apprendre ? Cherche-t-il seul une structure ? Ou apprend-il en agissant et en récoltant des récompenses ?
La frontière entre les familles, c'est le signal d'apprentissage disponible :
Choisir la bonne famille, c'est la première décision de tout projet data dans une banque — avant tout code.
Retenez ce réflexe : avant de demander quel algorithme, demandez de quelle famille relève le problème.
Voici les mêmes clients d'une banque (revenu × ancienneté). Changez de famille et voyez comment chacune voit et traite exactement les mêmes points de façon radicalement différente.
Sur les mêmes points :
Une même base de données clients peut alimenter trois projets totalement différents selon la famille choisie :
La donnée est un actif ; la famille d'apprentissage décide quel actif vous en tirez. C'est tout l'enjeu de la séance d'aujourd'hui.
Trois méthodes phares, chacune avec un exemple finance, une carte interactive et la double explication : régression linéaire (prévoir un montant), régression logistique (prédire oui/non), forêt aléatoire (la détection de fraude moderne).
→ Ouvrir le laboratoire superviséTrois méthodes : K-means (segmenter la clientèle), détection d'anomalies (AML / fraude), PCA (réduire et visualiser le risque d'un portefeuille).
→ Ouvrir le laboratoire non-superviséLe Q-learning : un agent de trading qui apprend, par essai-erreur, quand acheter, vendre ou attendre — sans qu'on ne lui dise jamais la « bonne » action.
→ Ouvrir le laboratoire renforcement