CommencerCommencer gratuitement

Mesures pour classes déséquilibrées

Le déséquilibre des classes peut nuire aux performances de votre modèle dans tout contexte de Machine Learning. C’est particulièrement pertinent en entretien de Machine Learning si l’on vous demande quoi faire avec un jeu de données présentant des classes déséquilibrées, car certains jeux sont déséquilibrés par nature, comme les données de fraude à l’assurance.

Dans cet exercice, vous allez utiliser sklearn pour créer un modèle de régression logistique et afficher la matrice de confusion ainsi que plusieurs mesures d’évaluation, afin de mieux comprendre comment interpréter des modèles de Machine Learning entraînés sur des jeux de données aux classes déséquilibrées.

Rappelez-vous le déséquilibre de classes observé précédemment dans loan_data. Le nombre d’observations avec un statut de prêt Fully Paid est bien supérieur à celui des prêts Charged Off :

Class imbalance

Cet exercice fait partie du cours

S’entraîner aux questions d’entretien en Machine Learning avec Python

Afficher le cours

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Import
from sklearn.____ import ____
from sklearn.____ import ____, ____, ____, ____, _____
Modifier et exécuter le code